- 升維:不確定時代的決策博弈
- (澳)王珞
- 1943字
- 2022-01-07 14:40:47
2.4 有限理性并不否定理性
沙漠生存游戲[1]是我在課堂上給學生做的一個互動決策游戲。這個實驗涉及信息收集、情緒控制、討論過程、決策流程等很多關于決策的知識點。最有趣也最有價值的發現是,多次實驗結果表明,大約有80%的集體決策比個人決策更接近專家的決策,即最優決策,僅20%左右的個人決策會比集體決策更接近最優決策。
這個心理實驗說明了決策討論的意義。有限理性決策之間的互動會抵消非理性部分的影響,當所有的有限理性在一起互動的時候,最后的決策效果與基于完全理性計算出來的最優結果更接近。所以,經過不受限制的討論之后獲得的集體決策抵消了決策過程中個人的非理性部分。
所以,決策不必要求每一個獨立的決策者都做到完全理性,最重要的是要有這樣一個互動過程。談判、辯論、議會都是不同意見碰撞的過程,都具有對決策進行討論以讓決策更接近理性的功能。諾貝爾經濟學獎得主羅納德·科斯(Ronald Coase)認為,談判可以幫助達到帕累托最優(Pareto optimality)[2],因為談判是不同意見充分互動碰撞的過程。實驗表明,決策前先對不同意見進行集體討論是有利的。談判中,也可以鼓勵團隊內部先談判,以讓決策更加理性。
如果信息選擇的自由不存在,群體互動所能帶來的客觀理性就不存在。真正包容不同意見的公平討論的過程,架起了理性和有限理性思維之間的橋梁。
真正能時刻提醒自己避免落入心理陷阱的高人很少。大部分人即使在某段時間內、某件事情上是高人,也不能保證在下一段時間內和下一件事情上還是高人。所以,高人不可靠,要靠流程和制度來保證決策的理想程度。
沙漠生存游戲決策邏輯的解釋
我們無法改變每個決策個體都是有限理性人這一事實。但當每個有限理性個體都進行了充分、平等的爭論或討論后,每個人的非理性部分都會在一定程度上被抵消,最后沉淀下來的決策會更接近理性決策的結果。
每個有限理性個體之間的充分互動,不僅會在最終結果上抵消局部輸贏,而且在過程中也會極大地抵消每個人的非理性部分。所以,完全理性作為對個體行為的假定是錯的,但作為對群體的假定,倒可能更接近正確。
經濟均衡是指經濟總量應該是均衡的。有人賺有人賠,有人買貴有人賣低,這些偏離理性均衡的個體行為并不影響經濟總量均衡。因為稟賦效應[3],人都對自己出售或出讓的產品抱有較高的預期,往往會開出高價,但購買者卻往往懷著占便宜的心理,這兩種力量都不符合經濟理性,但雙方彼此博弈的結果卻能抵消個體非理性部分的影響。所以,以理性經濟人為初始假定的古典經濟學,在預測推理出均衡結果上并沒有錯,只是實現過程可能和古典經濟學家最初的解釋并不一致。
對于辯證法的反思
有人會說:“我看問題是很客觀的,我可以從正反兩面看問題。”然而,一個人可能在某些事情上能做到冷靜客觀,卻很難在所有事情上都保持理性客觀,特別是在面臨巨大利益的時候。我們更容易理性客觀地看待與自己切身利益關系不大的事情,正應了那句“旁觀者清”的箴言。所以,“我看問題是很客觀的”這種感覺恰恰是一種幸存者偏差,人們往往很容易記住自己保持理性的幾個例子,這正是有限理性的行為表現。
大多數時候,人的行為不受理性控制。腦科學研究發現,大腦中主導人類決策的部分是前額葉皮層,它同時能調節情緒。有案例發現,前額葉皮層受損的大腦,其他一切如故,但不能正常做出任何選擇,連今天穿什么衣服都不能做出決定。可以說,是情緒驅動著我們的認知偏好和決策行為。
了解有限理性,敦促我們要認識包括自己在內的每個人的認知局限,以及認知對我們行為的影響,從而避免落入心理陷阱。
我強調重視人的有限理性并不是否定理性的意義,只是為了指出我們做不到真正理性的原因,或者更明確地說,是為了指出靠一個人自己是無法做到理性的。對我們的有限理性產生沖擊從而擴大我們的視野的,只能是來自外部的信息,這些信息可能來自人,也可能來自閱讀,但都是與我們的認知不同的意見和信息。
我非常欣賞二戰期間的英國首相溫斯頓·丘吉爾(Winston Churchill)。我去英國授課的時候,特地去參觀了丘吉爾紀念館,就在唐寧街后面一條街道的地下室。
丘吉爾當選首相后,第一件事就是提出戰爭中的英國必須組建聯合內閣,即保守黨要邀請反對黨——工黨一起組閣,因為他認為這樣可以保證他第一時間聽到反對的聲音。英國電影《至暗時刻》里就有這個橋段。丘吉爾對反對意見的重視幫助英國、幫助正義的力量戰勝了邪惡的納粹。
一位企業家也曾這樣總結自己的決策經驗:在沒有聽到反對意見以前,他不會做任何決策。
丘吉爾、張作霖和這位企業家就是因為了解自己在認知決策上存在有限理性局限,所以用“第一時間聽到反對意見”來避免自己落入心理陷阱。
[1] 詳見本章游戲卡。
[2] 帕累托最優即雙方都無改進的空間了。
[3] 稟賦效應是指一個人一旦擁有某件物品,那么他對該物品價值的評價要比未擁有之前大大提高。這個效應是由理查德·塞勒(Richard Thaler)于1980年提出的。