- 博弈論
- 翟文明
- 2192字
- 2019-08-28 15:45:27
第三章 囚徒博弈
第1節(jié) 陷入兩難的囚徒
“囚徒困境”模式在本書的一開始就提到過,我們再來簡單復(fù)述一下。杰克和亞當(dāng)被懷疑入室盜竊和謀殺,被警方拘留。兩人都不承認(rèn)自己殺人,只承認(rèn)順手偷了點(diǎn)東西。警察將兩人隔離審訊,每人給出了兩種選擇:坦白和不坦白。這樣,每人兩種選擇便會導(dǎo)致四種結(jié)果,如表所示:

表中的數(shù)字代表坐牢的年數(shù),從表中可以看出同時選擇不坦白對于兩人來說是最優(yōu)策略,同時選擇坦白對兩人來說是最差策略。但結(jié)果卻恰恰是兩人都選擇了坦白。原因是每個人都不知道對方會不會供出自己,于是供出對方對自己來說便成了一種最優(yōu)策略。此時兩人都選擇供出對方,結(jié)果便是每人坐8年牢。
這便是著名的“囚徒博弈”模式,它是數(shù)學(xué)家圖克在1950年提出的。這個模式中的故事簡單而且有意思,很快便被人們研究和傳播。這個簡單的故事中給我們的啟示也被廣為發(fā)掘。杰克和亞當(dāng)每個人都選擇了對自己最有利的策略,為什么最后得到的卻是最差的結(jié)果呢?太過聰明有時候并不是一件好事情。以己度人,“己所不欲,勿施于人”。我們要學(xué)會從對方的立場來分析問題。為什么“人多力量大”這句話常常失效?對手之間也可以合作,等等。這些都是“囚徒困境”帶給我們的啟示,也是我們在這一章中要討論的問題。
其實(shí),我們在現(xiàn)實(shí)生活中經(jīng)常與“囚徒困境”打交道,有時候是自己陷入了這種困境,有時候是想讓對方陷入這種困境。
有這樣一個笑話,斯大林時期的蘇聯(lián)政治氛圍特別緊張,有一次一位演奏家坐火車到另一個地方準(zhǔn)備參加一場演出。在車上百無聊賴,他便拿出需要演奏的樂譜,提前預(yù)習(xí)一下。但是火車上有兩個便衣警察,他們看到這個人手中拿著一本書,上面還有一些橫線和看不懂的“蝌蚪文”,便以為他是一位間諜,手中的樂譜是情報密碼。兩位便衣上前將這位演奏家逮捕了,說他有間諜嫌疑,手中的東西就是證據(jù)。演奏家非常無奈,一個勁兒地辯解那只是柴可夫斯基樂譜而已。
在牢房里待了一夜之后,兩個警察來審訊這位演奏家,他們信心滿滿地對這位演奏家說:“你還是快點(diǎn)招吧,你那位老朋友柴可夫斯基我們正在審訊呢,他要是先交待了,你就慘了,可能要被槍斃;你現(xiàn)在要是交待了,頂多判你3年。”演奏家哭笑不得:“你們抓住了柴可夫斯基?這是不可能的,因?yàn)樗呀?jīng)死了好多年了。”
這是一個諷刺當(dāng)局政府昏庸無知的笑話,但是其中警察運(yùn)用的不正是“囚徒困境”嗎?他們想把這位演奏家陷入一種困境:若是不坦白,可能會被槍斃,若是坦白,頂多坐3年牢。他們想用這種手段逼迫演奏家選擇坦白,只可惜他們太無知。這些人不懂博弈論,但是他們都會不自覺地應(yīng)用。
我們在前面講過“納什均衡”曾經(jīng)推翻了亞當(dāng)·斯密的一個理論,那便是:每個人追求自己利益最大化的時候,同時為社會帶來最大的公共利益。“囚徒困境”便是一個很好的例子,其中的杰克和亞當(dāng)每個人都為自己選擇了最優(yōu)策略,但是就兩人最后的結(jié)局來看,他們兩個人的最優(yōu)策略相加,得到的卻是一個最差的結(jié)果。如果兩人都選擇不坦白,則每人各判刑1年,兩人加起來共兩年。但是兩人都選擇坦白之后,每人各判刑8年,加起來共16年。
集體中每個人的選擇都是理性的,但是得到的卻可能不是理性的結(jié)果。這種“集體悲劇”也是“囚徒困境”反映出來的一個重要問題。
亞當(dāng)·斯密曾經(jīng)認(rèn)為個體利益最大化的結(jié)局是集體利益最大化,在這里,這個認(rèn)識再次被推翻。每個煙草企業(yè)為了自己的利益最大化,不得不去投放大量廣告,其他企業(yè)同樣如此,但是導(dǎo)致的結(jié)局是每個企業(yè)都要承擔(dān)巨額的成本開支,利潤不升反降,并沒有得到最大的集體化效益。
那么亞當(dāng)·斯密的理論真的錯了嗎?西方經(jīng)濟(jì)學(xué)之父為什么會犯這種基本錯誤呢?人們在看待這個問題的時候往往會將當(dāng)時的背景忽略。
在資本主義早期,主要的經(jīng)濟(jì)模式是手工作坊和投資者建立的私人小工場,當(dāng)時的工商業(yè)主要是以這種形式存在。亞當(dāng)·斯密正是在這種環(huán)境下做出了上述結(jié)論,即每個個體都追求利益最大化,便會使集體得到最大化的利益。這種單純的將個體利益相加得到集體利益的結(jié)論有一個前提,那就是個體利益之間沒有交集,互不影響。這個前提也正是資本主義在當(dāng)時階段的真實(shí)狀況。但是亞當(dāng)·斯密沒有想到的是,后來資本日益集中,使得企業(yè)脫離了最初的原始狀態(tài),一些企業(yè)甚至脫離了生產(chǎn),比如貿(mào)易公司、咨詢公司之類的。這個時候,企業(yè)之間不再是單純的獨(dú)立個體,而是形成了一種既有合作又有競爭的復(fù)雜關(guān)系。這個時候,亞當(dāng)·斯密的結(jié)論便不成立了,因?yàn)榇藭r個體之間的利益是相互影響的,集體利益也不再單純地等于個體利益相加之和。此時,處理這種復(fù)雜的個體和集體之間的利益關(guān)系時,亞當(dāng)·斯密的理論已經(jīng)有些力不從心了。更強(qiáng)大、更合適的理論應(yīng)運(yùn)而生,那就是經(jīng)濟(jì)博弈論。博弈論在經(jīng)濟(jì)領(lǐng)域的應(yīng)用主要是處理個體利益同集體利益之間的相互影響和相互作用。
由此我們可以得知,亞當(dāng)·斯密關(guān)于個體利益和集體利益之間關(guān)系的結(jié)論沒有錯,只不過是過時了而已。因?yàn)闀r代在發(fā)展,資本主義的經(jīng)濟(jì)模式在變化。
“囚徒困境”是證明亞當(dāng)·斯密的理論過時最好的證據(jù)。同時作為一種經(jīng)濟(jì)模型也揭示了個體利益同集體利益之間的矛盾:個體利益若是追求最大化往往不能得到最大化的集體利益,甚至有時候會得到最差的結(jié)局,比如囚徒博弈中兩個罪犯的結(jié)局。
我們從中得到了這樣的啟示:一是,人際交往的博弈中,單純的利己主義者并不是總會成功,有時候也會失敗,并且重復(fù)博弈次數(shù)越多,失敗的可能性就越大。二是,當(dāng)今的社會環(huán)境下,遵循規(guī)則和合作比單純的利己主義更能獲得成功。