尋找神奇數字
幾年前,時任紐約市學校建設管理局檢察長的彼得·波普(Peter Pope)給我打電話尋求幫助。在一項十年計劃中,建設管理局每年花費大約10億美元,用于改造紐約市的學校。許多學校嚴重失修,許多資金被用于“外層”工作——即屋頂和外部維修,以維持建筑物外表的完整性。紐約市曾長期被建筑腐敗和競標操縱的丑聞困擾,因此紐約州議會設置了檢察長這一新職位,以終結過高的成本和浪費。
彼得剛剛從法律系畢業,希望制定一種完全不同的公共利益法律。確保建筑拍賣和合同變更通知公開透明并不像接手死刑案件或在最高法院進行辯論那樣光鮮,但彼得希望確保數千名學生擁有像樣的讀書環境。他和他的團隊幾乎是在冒著生命危險工作。有組織的犯罪者并不希望有人插手進來,干涉他們的事情。當彼得到來時,一切都不同了。
彼得之所以給我打電話,是因為他發現,他的一些改造項目競標存在一種特別的欺詐。他稱之為“神奇數字”欺詐。
1992年夏,梅里斯建筑公司主要所有人埃利亞斯·梅里斯(Elias Meris)遭到國稅局調查。在國稅局從寬處理的承諾下,梅里斯同意戴上竊聽器,提供關于競標操縱欺詐的信息,這些信息涉及學校建設管理局員工和其他承包商。梅里斯暗中為檢察官錄下了他與高級項目官員約翰·德朗斯菲爾德(John Dransfield)和合同專員馬克·帕克(Mark Parker)的對話。
合同專員負責在項目競標會上依次打開承包商的密封標書,宣讀承包商的報價。
在“神奇數字”欺詐中,行賄承包商提交的密封標書中寫有他對于這個項目能夠接受的最低價格。在標書公開儀式上,帕克會把不法承包商的標書放到最后。他知道當前最低競標價格,因此會讀出只比這個價格低一點的虛假競標價。這樣一來,行賄者就會獲勝,但他獲得的報酬只比本應獲勝的競標者少一點點。接著,德朗斯菲爾德會用修正液篡改行賄者的標書——寫上帕克宣讀的數字。(如果最低真實競標價低于不法行賄者能夠接受的最低價格,合同專員就不會使用修正液,他會宣讀不法行賄者寫下的競標價格。)在這種“神奇數字”欺詐中,只要不法行賄者能夠接受的價格低于最低真實競標價,他就可以贏得合同,而且會獲得盡可能多的報酬。
經過調查,波普最終發現了7家存在欺詐的承包公司,涉及11個人。當你下次考慮改造位于紐約的住所時,你應該不會選擇克里斯特加佐尼斯電力承包公司、GTS承包公司、巴泰克斯承包公司、美國建設管理公司、沃爾夫穆尼爾公司、西明斯法洛蒂科集團以及CZK建設公司。這7家公司通過“神奇數字”欺詐方法贏得了至少53次競標項目,標的總額超過2,300萬美元。
波普發現了這些壞蛋,但他還是給我打了電話,以了解能否通過統計分析追查其他“神奇數字”欺詐現象。我們與拍賣大師彼得·克拉姆頓(Peter Cramton)以及年輕的天才研究生艾倫·英格拉姆(Alan Ingraham)合作,進行了回歸運算,以考察特定合同專員是否存在欺詐。
這簡直是大海撈針。我們不知道某個專員是否會對他的所有拍賣進行操縱。事情的關鍵是尋找最低和次低競標價差距很小的拍賣。我們控制了其他一組變量,包括競標人數、工程師拍賣前的成本估計以及拍賣中第三低的競標價,然后進行了統計回歸。艾倫·英格拉姆發現了另外兩個合同專員。在他們主持的所有拍賣中,獲勝競標價和次低競標價的差距極小。在不知道合同專員姓名的情況下(檢察長的數據僅用編號來表示他們),我們就為檢察長的工作指明了新的方向。艾倫將這項工作轉化成了博士論文的兩個章節。檢察長的調查結果是保密的,但彼得很欣賞我們的工作。他在今年早些時候向我道謝,說我幫助他們抓到了另外兩個騙子。
這個“神奇數字”的故事展示了超級數據分析是如何揭示過去的。超級數據分析還可以預測你未來的需要和行動。eHarmony、哈拉斯、神奇數字和Farecast的故事共同表明,回歸已經跨越了學術邊界,正在被用于預測各種事情。
回歸公式具有“即插即用”的特點——只要插入指定參數,就會得到預測結果。當然,不是所有預測都具有同等價值。河流不會高于源頭,回歸預測也不可能克服數據不足的問題。如果你的數據集合太小,任何回歸都不會給出非常準確的預測。不過,不同于直覺主義者,回歸知道自己的局限,可以回答郭德華(Ed Koch)很久以前的競選問題“我做得怎么樣”。