第三章 囚徒博弈
第1節(jié) 陷入兩難的囚徒
“囚徒困境”模式在本書的一開始就提到過,我們?cè)賮砗?jiǎn)單復(fù)述一下。杰克和亞當(dāng)被懷疑入室盜竊和謀殺,被警方拘留。兩人都不承認(rèn)自己殺人,只承認(rèn)順手偷了點(diǎn)東西。警察將兩人隔離審訊,每人給出了兩種選擇:坦白和不坦白。這樣,每人兩種選擇便會(huì)導(dǎo)致四種結(jié)果,如表所示:

表中的數(shù)字代表坐牢的年數(shù),從表中可以看出同時(shí)選擇不坦白對(duì)于兩人來說是最優(yōu)策略,同時(shí)選擇坦白對(duì)兩人來說是最差策略。但結(jié)果卻恰恰是兩人都選擇了坦白。原因是每個(gè)人都不知道對(duì)方會(huì)不會(huì)供出自己,于是供出對(duì)方對(duì)自己來說便成了一種最優(yōu)策略。此時(shí)兩人都選擇供出對(duì)方,結(jié)果便是每人坐8年牢。
這便是著名的“囚徒博弈”模式,它是數(shù)學(xué)家圖克在1950年提出的。這個(gè)模式中的故事簡(jiǎn)單而且有意思,很快便被人們研究和傳播。這個(gè)簡(jiǎn)單的故事中給我們的啟示也被廣為發(fā)掘。杰克和亞當(dāng)每個(gè)人都選擇了對(duì)自己最有利的策略,為什么最后得到的卻是最差的結(jié)果呢?太過聰明有時(shí)候并不是一件好事情。以己度人,“己所不欲,勿施于人”。我們要學(xué)會(huì)從對(duì)方的立場(chǎng)來分析問題。為什么“人多力量大”這句話常常失效?對(duì)手之間也可以合作,等等。這些都是“囚徒困境”帶給我們的啟示,也是我們?cè)谶@一章中要討論的問題。
其實(shí),我們?cè)诂F(xiàn)實(shí)生活中經(jīng)常與“囚徒困境”打交道,有時(shí)候是自己陷入了這種困境,有時(shí)候是想讓對(duì)方陷入這種困境。
有這樣一個(gè)笑話,斯大林時(shí)期的蘇聯(lián)政治氛圍特別緊張,有一次一位演奏家坐火車到另一個(gè)地方準(zhǔn)備參加一場(chǎng)演出。在車上百無聊賴,他便拿出需要演奏的樂譜,提前預(yù)習(xí)一下。但是火車上有兩個(gè)便衣警察,他們看到這個(gè)人手中拿著一本書,上面還有一些橫線和看不懂的“蝌蚪文”,便以為他是一位間諜,手中的樂譜是情報(bào)密碼。兩位便衣上前將這位演奏家逮捕了,說他有間諜嫌疑,手中的東西就是證據(jù)。演奏家非常無奈,一個(gè)勁兒地辯解那只是柴可夫斯基樂譜而已。
在牢房里待了一夜之后,兩個(gè)警察來審訊這位演奏家,他們信心滿滿地對(duì)這位演奏家說:“你還是快點(diǎn)招吧,你那位老朋友柴可夫斯基我們正在審訊呢,他要是先交待了,你就慘了,可能要被槍斃;你現(xiàn)在要是交待了,頂多判你3年。”演奏家哭笑不得:“你們抓住了柴可夫斯基?這是不可能的,因?yàn)樗呀?jīng)死了好多年了。”
這是一個(gè)諷刺當(dāng)局政府昏庸無知的笑話,但是其中警察運(yùn)用的不正是“囚徒困境”嗎?他們想把這位演奏家陷入一種困境:若是不坦白,可能會(huì)被槍斃,若是坦白,頂多坐3年牢。他們想用這種手段逼迫演奏家選擇坦白,只可惜他們太無知。這些人不懂博弈論,但是他們都會(huì)不自覺地應(yīng)用。
我們?cè)谇懊嬷v過“納什均衡”曾經(jīng)推翻了亞當(dāng)·斯密的一個(gè)理論,那便是:每個(gè)人追求自己利益最大化的時(shí)候,同時(shí)為社會(huì)帶來最大的公共利益。“囚徒困境”便是一個(gè)很好的例子,其中的杰克和亞當(dāng)每個(gè)人都為自己選擇了最優(yōu)策略,但是就兩人最后的結(jié)局來看,他們兩個(gè)人的最優(yōu)策略相加,得到的卻是一個(gè)最差的結(jié)果。如果兩人都選擇不坦白,則每人各判刑1年,兩人加起來共兩年。但是兩人都選擇坦白之后,每人各判刑8年,加起來共16年。
集體中每個(gè)人的選擇都是理性的,但是得到的卻可能不是理性的結(jié)果。這種“集體悲劇”也是“囚徒困境”反映出來的一個(gè)重要問題。
亞當(dāng)·斯密曾經(jīng)認(rèn)為個(gè)體利益最大化的結(jié)局是集體利益最大化,在這里,這個(gè)認(rèn)識(shí)再次被推翻。每個(gè)煙草企業(yè)為了自己的利益最大化,不得不去投放大量廣告,其他企業(yè)同樣如此,但是導(dǎo)致的結(jié)局是每個(gè)企業(yè)都要承擔(dān)巨額的成本開支,利潤(rùn)不升反降,并沒有得到最大的集體化效益。
那么亞當(dāng)·斯密的理論真的錯(cuò)了嗎?西方經(jīng)濟(jì)學(xué)之父為什么會(huì)犯這種基本錯(cuò)誤呢?人們?cè)诳创@個(gè)問題的時(shí)候往往會(huì)將當(dāng)時(shí)的背景忽略。
在資本主義早期,主要的經(jīng)濟(jì)模式是手工作坊和投資者建立的私人小工場(chǎng),當(dāng)時(shí)的工商業(yè)主要是以這種形式存在。亞當(dāng)·斯密正是在這種環(huán)境下做出了上述結(jié)論,即每個(gè)個(gè)體都追求利益最大化,便會(huì)使集體得到最大化的利益。這種單純的將個(gè)體利益相加得到集體利益的結(jié)論有一個(gè)前提,那就是個(gè)體利益之間沒有交集,互不影響。這個(gè)前提也正是資本主義在當(dāng)時(shí)階段的真實(shí)狀況。但是亞當(dāng)·斯密沒有想到的是,后來資本日益集中,使得企業(yè)脫離了最初的原始狀態(tài),一些企業(yè)甚至脫離了生產(chǎn),比如貿(mào)易公司、咨詢公司之類的。這個(gè)時(shí)候,企業(yè)之間不再是單純的獨(dú)立個(gè)體,而是形成了一種既有合作又有競(jìng)爭(zhēng)的復(fù)雜關(guān)系。這個(gè)時(shí)候,亞當(dāng)·斯密的結(jié)論便不成立了,因?yàn)榇藭r(shí)個(gè)體之間的利益是相互影響的,集體利益也不再單純地等于個(gè)體利益相加之和。此時(shí),處理這種復(fù)雜的個(gè)體和集體之間的利益關(guān)系時(shí),亞當(dāng)·斯密的理論已經(jīng)有些力不從心了。更強(qiáng)大、更合適的理論應(yīng)運(yùn)而生,那就是經(jīng)濟(jì)博弈論。博弈論在經(jīng)濟(jì)領(lǐng)域的應(yīng)用主要是處理個(gè)體利益同集體利益之間的相互影響和相互作用。
由此我們可以得知,亞當(dāng)·斯密關(guān)于個(gè)體利益和集體利益之間關(guān)系的結(jié)論沒有錯(cuò),只不過是過時(shí)了而已。因?yàn)闀r(shí)代在發(fā)展,資本主義的經(jīng)濟(jì)模式在變化。
“囚徒困境”是證明亞當(dāng)·斯密的理論過時(shí)最好的證據(jù)。同時(shí)作為一種經(jīng)濟(jì)模型也揭示了個(gè)體利益同集體利益之間的矛盾:個(gè)體利益若是追求最大化往往不能得到最大化的集體利益,甚至有時(shí)候會(huì)得到最差的結(jié)局,比如囚徒博弈中兩個(gè)罪犯的結(jié)局。
我們從中得到了這樣的啟示:一是,人際交往的博弈中,單純的利己主義者并不是總會(huì)成功,有時(shí)候也會(huì)失敗,并且重復(fù)博弈次數(shù)越多,失敗的可能性就越大。二是,當(dāng)今的社會(huì)環(huán)境下,遵循規(guī)則和合作比單純的利己主義更能獲得成功。