- 顛覆的金融
- 魏本華
- 2467字
- 2019-10-25 19:16:36
看透你的沃爾瑪和賭場
美國一家大型連鎖商店里,有一個專柜賣嬰幼兒產品。因為客戶信息很多,商店發現當人懷孕之后,行為會出現改變。更多的孕婦們會選擇沒有香味的洗發水,在選擇營養品口味上也和懷孕前不同。因此商店便根據客人購買行為的變化,預測其是否可能懷孕了,然后給潛在懷孕的客人寄去嬰幼兒產品傳單。一天,一個父親很憤怒地找上門說:“我女兒才上高中,你們現在天天給她寄嬰兒尿布、奶粉的廣告是什么意思?鼓勵未婚懷孕嗎?”商場很快回應:“對不起,我們搞錯了!”過了一個星期,這個爸爸又回來,說:“是我搞錯了,我女兒已經向我坦白,她真懷孕了。”
大數據中還有一個沃爾瑪的經典故事。這家超市最早發現了尿布和啤酒的銷售是呈相關性的。一開始誰也不明白這兩個東西怎么會相關?后來研究發現當家里有了小孩之后,買尿布的任務往往是讓新爸爸去干的。雖然爸爸對孩子的出生貢獻并不大,但他自己覺得很有成就感,所以買完尿布后會順便買一瓶啤酒犒勞自己。因此沃爾瑪索性把啤酒和尿布放在一塊兒,啤酒的銷售量一下子增加了。當然這個經典案例也很有爭議,因為統計學里最基本的概念就是,相關關系不一定是因果關系。所以即使是很強的相關關系也很有可能是偽相關。但在大數據時代,起碼原來找不到的相關關系現在能找到了。
為什么會有這些相關關系?怎么憑借這些相關性就能知道行為規律?一個更深層的概念是人和人是一樣的。當把一個人特列出來,可能很有個性,但當人口樣本數量足夠大時,就會發現其實每個人都一樣。
以賭場為例,去賭博前要在門口先辦一張電子磁卡,而在辦這張電子磁卡時,相關的個人信息已經被賭場獲取了。例如第幾次來、年齡、種族、職業等。賭場就此建立了一個龐大的數據庫,拿到數據后開始建立相關性。
人跟人的確是不一樣的,有的人到賭場輸了10元就心疼得睡不著覺;有的人輸幾百萬也面不改色心不跳。但不管是誰,都會有一個痛苦點。例如王大錘去賭場玩,在踏入賭場、辦理好電子磁卡的那一刻起,他的個人信息已經被賭場收集:中國人、男性、35歲、土豪。賭場會通過數據庫預測此人的痛苦點將在1萬美元左右。當他輸到9800美元的時候,奇跡發生了,旁邊會突然出現一位年輕貌美的公關經理說:“先生玩得很累了吧?我們的賭場剛請了一位名廚,會做世界一流的法國大餐。恭喜您,您被選為幸運顧客。要不要帶著家人去享受法國大餐,休息一下呢?”為什么服務這么好?因為他的最后一分錢已經被賭場榨完了。
為什么賭場能夠精準預測客人的行為?因為不管是誰,當在同一家賭場里輸的錢超過了痛苦點之后,都會覺得這個地方太背,從此再也不想踏進這家賭場一步,因為已經輸得惡心了。從賭場的角度來看,最好的選擇自然是當賭客快要達到痛苦點時,讓他們住手。
這徹底顛覆了原來經濟學教科書告訴我們的道理:因為消費者之間的信息會互相溝通,所以沒有辦法進行價格歧視。比如一件衣服到底賣什么價格,不同人的心里底價是不一樣的,特別喜歡這件衣服的人花1萬元也愿意買,不太喜歡的人5000元可能是他的價格極限。但是商家必須要統一標價,不能來一個顧客換一個價錢。盡管有很多消費者是懶惰的,不管多少錢,過去拿了就走。但是也有精明的消費者,為了買一把椅子,會把城市里的所有家私商城都跑個遍,最后找到最便宜的那把椅子。一個懶惰的消費者只要跟著精明的消費者,就能知道哪里的價格最低。商家是沒有辦法進行價格歧視的,更沒有辦法壟斷信息。不過在互聯網大數據的時代,一切都不一樣了,商家很可能可以針對每一個顧客進行精準的價格歧視。
現在我們的很多行為都比較粗放,航空公司給我們辦理里程卡,根據飛行公里數來累計里程,但其實不同顧客所飛行的不同里程對航空公司的利潤貢獻是不一樣的。所以有一天某位顧客可能會收到一封信:“恭喜先生,您已經被我們選為幸運顧客,我們提前給您升級為白金卡顧客。”這說明這個顧客對航空公司的貢獻已經夠多了。有一天銀行說:“恭喜您,您的額度又被提高了”,說明錢已經花得太多。
正因為在大數據規律面前,每個人的行為都跟別人一樣,沒有本質變化,所以商家會比消費者更了解消費者的行為。也許你正在想,工作了一年很辛苦,要不要去哪里度假?打開郵箱,航空公司、旅行社早已發來郵件。或者在你還不自覺的情況下,體檢公司、醫院已經開始建議你趕緊去做檢查,并指出你可能患有的疾病。商家比你更了解你,以及你這樣的人在特定情況下會出現的可能變化。
再談一個循證醫學的案例,我們熟悉的美劇《豪斯醫生》,它的醫學顧問就是有名的循證醫學顧問。最初的醫學按照病理學尋找治療辦法,但其實很多時候是瞎蒙。比如在某一發展中國家,醫生因為不滿報酬罷工,但人口死亡率卻明顯下降了,說明大部分人可能是被誤診治死的。循證醫學很早就存在,但一直屬于異端。在細菌還沒有被發現的時候,就有一個醫生發現,當主刀醫生從停尸房回來后直接做接生手術,產婦的死亡率會明顯提高。因此他建議醫生從停尸房回來后用肥皂洗手。雖然這在我們現在看來是很正常的事情,但當時的人們沒有細菌的概念,洗手跟死亡率有什么關系呢?那位醫生就說:“我也不知道有什么關系,反正聽我的就行,洗完手之后再去接生。”為什么現在醫院里又開始推動循證醫學,因為雖然不知道是怎么回事,但按照大數據顯示的關系去做,效果很明顯。
某種程度上,這是模仿航空公司的經驗。飛行員的違規操作會引起事故從而導致整架飛機墜毀,因此一切都要嚴格按照操作手冊行事。但醫生在過去并沒有執行得這么嚴格。按照循證醫學,治病的第一件事不是去研究病理,而應該用過去的數據研究,在相同情況下該如何治療。這導致專家和普通人之間的信息優勢沒有了。原來人們相信醫生,因為醫生知道的多,但現在每個人都可以到谷歌上查一下,了解自己得了什么病。其實在上文的品酒案例里頭,我們就可以看到,品酒專家和門外漢之間的信息優勢也沒有了。谷歌有一個機器翻譯團隊,最開始翻譯之后的文字根本看不懂,但是現在60%的內容都是通順的。谷歌機器翻譯團隊里頭有一個笑話,說只要團隊里每離開一個語言學家,翻譯質量就會提高。越是專家越搞不明白,但打破常規讓數據說話,得到真理的速度反而更快。