官术网_书友最值得收藏!

回歸方程幫你找到靈魂伴侶

有一波新的預測潮流,它對群體智慧的利用超越了有意識的偏好。eHarmony的興起意味著人們通過超級數據分析發現了新的群體智慧。傳統約會服務根據人們清晰表述的有意識偏好對他們進行拉攏和配對,eHarmony則試圖弄清你是哪種人,然后根據數據將你和最適合你的人相匹配。eHarmony考察巨大的信息數據庫,以查看哪些性格類型的人可以成為幸福的夫妻。

eHarmony創始人和推動者尼爾·克拉克·沃倫(Neil Clark Warren)在20世紀90年代后期研究了超過5000名已婚人士。他申請了一項兼容預測統計模型專利,該模型基于與性情、社交風格、認知模式和交往技能相關的29個不同變量。

eHarmony的策略依賴于超級數據分析技術之母——回歸。回歸是一種統計程序,它根據原始歷史數據估計各種因素對于單一相關變量的影響。在eHarmony的案例中,相關變量是一對夫婦可能具有的兼容性,各種因素則是夫婦每個人的29個情緒、社交和認知特點。

回歸方法是查爾斯·達爾文(Charles Darwin)的親戚弗朗西斯·高爾頓(Francis Galton)100多年前提出的。早在1877年,高爾頓給出了第一個回歸估計公式。還記得奧利·阿森費爾特預測葡萄酒品質的簡單公式嗎?這個公式就是通過回歸得到的。高爾頓的第一個回歸估計同樣與農業有關。他得出了一個公式,用于根據親代甜豌豆的種子大小預測子代甜豌豆的種子大小。高爾頓發現,大種子的后代往往比普通種子或小種子的后代大,但是沒有它們的親代那么大。

通過計算,高爾頓得出了另一個回歸公式,發現了父親和兒子身高的類似趨勢。高個子父親的兒子比一般人高,但是沒有父親那么高。在回歸方程中,這意味著兒子身高的預測值是父親的身高與某個小于1的因數的乘積。實際上,在高爾頓的估計中,兒子身高與平均身高的差值對應于父親身高與平均身高差值的2/3。

在計算父母和孩子智商關系的回歸估計等式時,高爾頓再次發現了這種模式。聰明父母的孩子比一般人聰明,但是不像父母那么聰明。“回歸”一詞與回歸方法本身沒有任何關系。高爾頓之所以將這種方法稱為回歸,是因為他估計的第一個事物剛好表現出了這種趨勢——即高爾頓所說的“向平庸回歸”——我們現在稱之為“向均值回歸”。

回歸可以得到與數據最為匹配的方程。雖然回歸方程是用歷史數據估計出來的,但它可以用于預測未來發生的事情。高爾頓最初的方程將種子和孩子的尺寸(身高)預測為親代尺寸(身高)的函數。奧利·阿森費爾特的葡萄酒方程預測了溫度和降水對于葡萄酒品質的影響。

eHarmony得出了預測偏好的公式。與網飛和亞馬遜的偏好引擎不同,eHarmony回歸試圖用人們可能不知道或者無法表述的個性和性格特點將兼容的人匹配在一起。實際上,eHarmony可能將你與你從未想過可能喜歡的人相匹配。這是超越個體成員有意識選擇的群體智慧,它可以看到在無意識的隱性層面發揮作用的事物。

eHarmony不是唯一試圖使用數據驅動型匹配的網站。Perfectmatch也在根據邁爾斯—布里格斯性格測試的修正版本進行用戶匹配。20世紀40年代,伊莎貝爾·布里格斯·邁爾斯(Isabel Briggs Myers)和她的母親凱瑟琳·布里格斯(Katharine Briggs)根據卡爾·榮格(Carl Jung)的性格類型理論設計了一種測試。邁爾斯—布里格斯測試將人們分成16個不同的基本類型。Perfectmatch用這種分類尋找之前結成持久關系概率最高的性格,將擁有這些性格的人相匹配。

True.com也不甘示弱,該網站收集客戶的99個關系因子數據,將結果反饋到回歸公式中,以計算任何兩個成員之間的兼容指數得分。從本質上說,True.com可以讓你知道你和其他任何人和諧相處的可能性。

這三項服務都在利用數據進行兼容性預測,但它們的結果存在顯著區別。eHarmony堅持尋找與你非常類似的人。沃倫表示:“我們一直在研究如何尋找在智力、抱負、精力、精神、興趣方面與你非常類似的人。這是一種相似性模型。”

相比之下,Perfectmatch和True.com則是在尋找互補性格。“不管是通過經驗還是出于真心,我們所有人都知道,我們有時會被和我們不同的某人吸引,甚至可以更好地和他們相處,”執掌Perfectmatch的實證主義者佩珀·施瓦茨(Pepper Schwartz)說,“所以,邁爾斯—布里格斯測試的優點不僅在于性格,而且在于匹配方式。”

這種關于結果的分歧不是數據驅動型決策應該有的現象。數據應該可以判斷更加匹配的人具有相似還是互補的特點。我們很難說清誰對誰錯,因為這種分析及其依據的數據是嚴格保守的行業機密。任何人都可以從互聯網上下載我的研究數據(關于出租車小費、反歧視行動和槍支管制的研究),但互聯網約會服務匹配規則背后的數據則是有專屬權的。

雅虎Personals的開發者馬克·湯普森(Mark Thompson)指出,將社會科學標準應用于市場是不切實際的。“同行評議制度在這里是行不通的,”湯普森說,“我們用兩個月時間為雅虎開發了這個系統。我們幾乎夜以繼日地工作。我們對5萬人進行了研究。”

另一方面,匹配網站開始爭相證明自己的說法。True.com強調,它是唯一由獨立審計機構認證過方法的網站。曾是True.com首席心理學家的詹姆斯·胡蘭(James Houran)對于eHarmony的數據聲明尤其不屑一顧。“我甚至沒有看到他們曾為測試進行研究的證據,”胡蘭說,“如果你宣稱你在做一些科學的事情……你需要通知學術圈。”

作為回應,eHarmony提供了一些證據,以表明其匹配系統的有效性。該網站贊助了一項哈里斯民調,證明eHarmony目前每天可以促成大約90場婚禮(每年超過3萬場)。這當然比沒有要好,但它并不是很大的成功,因為該網站有500多萬會員,這意味著你所支付的50美元會員費使你走上紅毯的概率只有大約1%。其他競爭者很快指出了這個婚姻數據的不足之處。雅虎的湯普森表示,即使你“去西夫韋商店轉一轉”,你找到未來配偶的概率也會更高。

eHarmony還表示,它有證據表明,它所促成的已婚伴侶生活更加和諧。該網站的研究人員2006年向美國心理協會展示了他們的結論,稱在相似的時間長度里,通過eHarmony認識的已婚伴侶明顯比通過其他途徑認識的伴侶更加幸福。這項研究存在一些嚴重缺陷,但令我吃驚的是,大型匹配網站不僅在用數據開發算法,而且在用數據證明算法的合理性。

不過,這些服務的匹配算法不完全是由數據驅動的。所有服務至少部分依賴于客戶的有意識偏好(不管這些偏好是不是兼容性的有效預測指標)。eHarmony允許客戶區別對待潛在伴侶的種族。雖然它只是在迎合客戶的愿望,但是這種存在種族歧視的匹配服務可能違反了南北戰爭以來禁止合同中存在種族歧視的法律。想一想吧,eHarmony是一家營利公司,它向黑人客戶收取50美元費用,但卻拒絕像對待一些白人客戶那樣對待他們(將他們與相同的人匹配)。如果一些顧客希望將餐廳里的一個區域作為“盎格魯裔專屬區”,餐廳因此拒絕讓西裔顧客坐在這個區域,這家餐廳就會遇到很大的麻煩。

eHarmony拒絕匹配同性伴侶的做法惹出了更大的麻煩。創始人的妻子兼高級副總裁瑪麗蓮·沃倫(Marylyn Warren)宣稱:“eHarmony是面向所有人的,我們不存在任何歧視。”這顯然不是事實。即使計算機算法根據用戶對436個問題的回答認定兩位男士是最兼容的,該網站也不會將他們匹配在一起。這是一個可悲的諷刺。不同于其他網站,eHarmony堅持認為相似的人是最好的匹配。不過,在性別上,它卻認為異性相吸。在排名前十的匹配網站中,eHarmony是唯一不提供同性匹配的網站。

eHarmony為何如此與眾不同?即使在同性婚姻合法的馬薩諸塞州,該公司也拒絕對男女同性戀客戶進行匹配,這似乎與它所承認的幫助人們尋找持久滿意婚姻伴侶的目標不符。沃倫自詡為“熱情的基督徒”,多年來一直與詹姆斯·多布森(James Dobson)的專注家庭項目合作。不管統計算法結果如何,eHarmony只愿意促成某些特定類型的合法婚姻。實際上,由于算法沒有公開,因此eHarmony有可能在標準規則之上做了手腳,以支持特定客戶。

不過,這些匹配服務背后有一個共同的重要思想,那就是基于數據的決策不需要局限于大眾的有意識偏好。相反,我們可以研究決策結果,從數據中梳理出導致成功的因素。本章談論的就是簡單的回歸是如何通過改進預測改變決策的。回歸方法可以分析數據集,揭示就連專業觀察也無法發現的誘因。有時,專家感覺某項因素對于某個結果具有重要的決定作用,但回歸方法會發現這項因素作用不大。

舉一個有趣的例子。加特·桑德姆(Garth Sundem)在《極客邏輯》一書中通過回歸創建了一個公式,用于預測名人婚姻的持續時間。(結果表明,谷歌搜索條目越多,婚姻的持續性就越差——尤其是當前幾項谷歌搜索條目包含挑逗性照片時!)eHarmony、Perfectmatch和True.com也在做同樣的事情,但他們的目的是盈利。這些服務正在參與一種新的超級數據分析競爭。這是一種正在進行的完全不同的游戲。

主站蜘蛛池模板: 隆子县| 墨玉县| 晋中市| 井冈山市| 无极县| 社旗县| 周至县| 崇信县| 松潘县| 辉县市| 台南市| 洪江市| 兴国县| 东丰县| 山东省| 灵宝市| 吐鲁番市| 邹平县| 蒲城县| 临西县| 盘锦市| 临沂市| 金川县| 南投市| 博爱县| 古交市| 玉龙| 曲靖市| 新乡市| 封丘县| 荆州市| 遂昌县| 珲春市| 陵水| 孟津县| 稷山县| 郑州市| 西和县| 正定县| 祁阳县| 西昌市|