官术网_书友最值得收藏!

  • 博弈論
  • 翟文明
  • 8字
  • 2019-08-28 15:45:23

第一章 博弈論入門

第1節 什么是博弈論:從“囚徒困境”說起

一天,警局接到報案,一位富翁被殺死在自己的別墅中,家中的財物也被洗劫一空。經過多方調查,警方最終將嫌疑人鎖定在杰克和亞當身上,因為事發當晚有人看到他們兩個神色慌張地從被害人的家中跑出來。警方到兩人的家中進行搜查,結果發現了一部分被害人家中失竊的財物,于是將二人作為謀殺和盜竊嫌疑人拘留。

但是到了拘留所里面,兩人都矢口否認自己殺過人,他們辯稱自己只是路過那里,想進去偷點東西,結果進去的時候發現主人已經被人殺死了,于是他們便隨便拿了點東西就走了。這樣的解釋不能讓人信服,再說,誰都知道在判刑方面殺人要比盜竊嚴重得多。警察決定將兩人隔離審訊。

隔離審訊的時候,警察告訴杰克:“盡管你們不承認,但是我知道人就是你們兩個殺的,事情早晚會水落石出的。現在我給你一個坦白的機會,如果你坦白了,亞當拒不承認,那你就是主動自首,同時協助警方破案,你將被立即釋放,亞當則要坐10年牢;如果你們都坦白了,每人坐8年牢;都不坦白的話,可能以入室盜竊罪判你們每人1年,如何選擇你自己想一想吧。”同樣的話,警察也說給了亞當。

一般人可能認為杰克和亞當都會選擇不坦白,這樣他們只能以入室盜竊的罪名被判刑,每人只需坐1年牢。這對于兩人來說是最好的一種結局。可結果會是這樣的嗎?答案是否定的,兩人都選擇了招供,結果各被判了8年。

事情為什么會這樣呢?杰克和亞當為什么會做出這樣“不理智”的選擇呢?其實這種結果正是兩人的理智造成的。我們先看一下兩人坦白與否及其結局的矩陣圖:

當警察把坦白與否的后果告訴杰克的時候,杰克心中就會開始盤算坦白對自己有利,還是不坦白對自己有利。杰克會想,如果選擇坦白,要么當即釋放,要么同亞當一起坐8年牢;要是選擇不坦白,雖然可能只坐1年牢,但也可能坐10年牢。雖然(1,1)對兩人而言是最好的一種結局,但是由于是被分開審訊,信息不通,所以誰也沒法保證對方是否會選擇坦白。選擇坦白的結局是8年或者0年,選擇不坦白的結局是10年或者1年,在不知道對方選擇的情況下,選擇坦白對自己來說是一種優勢策略。于是,杰克會選擇坦白。同時,亞當也會這樣想。最終的結局便是兩個人都選擇坦白,每人都要坐8年牢。

上面這個案例就是著名的“囚徒困境”模式,是博弈論中最出名的一個模式。為什么杰克和亞當都選擇了對自己最有利的策略,最后得到的卻是最差的結果呢?這其中便蘊涵著博弈論的道理。

博弈論是指雙方或者多方在競爭、合作、沖突等情況下,充分了解各方信息,并依此選擇一種能為本方爭取最大利益的最優決策的理論。

“囚徒困境”中杰克和亞當便是參與博弈的雙方,也稱為博弈參與者。兩人之所以陷入困境,是因為他們沒有選擇對兩人來說最優的決策,也就是同時不坦白。而根本原因則是兩人被隔離審訊,無法掌握對方的信息。所以,看似每個人都做出了對自己最有利的策略,結果卻是兩敗俱傷。

我們身邊的很多事情和典故中也有博弈論的應用,我們就用大家比較熟悉的“田忌賽馬”這個故事來解釋一下什么是博弈論。

齊國大將田忌,平日里喜歡與貴族賽馬賭錢。當時賽馬的規矩是每一方出上等馬、中等馬、下等馬各一匹,共賽三場,三局兩勝制。由于田忌的馬比貴族們的馬略遜一籌,所以十賭九輸。當時孫臏在田忌的府中做客,經常見田忌同貴族們賽馬,對賽馬的比賽規則和雙方馬的實力差距都比較了解。這天田忌賽馬又輸了,非常沮喪地回到府中。孫臏見狀,便對田忌說:“明天你盡管同那些貴族們下大賭注,我保證讓你把以前輸的全贏回來。”田忌相信了孫臏,第二天約貴族賽馬,并下了千金賭注。

孫臏為什么敢打保證呢?因為他對這場賽馬的博弈做了分析:雙方都派上等、中等、下等馬各一匹,田忌每一等級的馬都比對方同一等級的馬慢一點,因為沒有規定出場順序,所以比賽的對陣形式可能有六種,每一種對陣形式的結局是很容易猜測的:

第一種情況:上等馬對上等馬,中等馬對中等馬,下等馬對下等馬。結局:三局零勝。

第二種情況:上等馬對上等馬,下等馬對中等馬,中等馬對下等馬。結局:三局一勝。

第三種情況:中等馬對上等馬,上等馬對中等馬,下等馬對下等馬。結局:三局一勝。

第四種情況:中等馬對上等馬,下等馬對中等馬,上等馬對下等馬。結局:三局一勝。

第五種情況:下等馬對上等馬,上等馬對中等馬,中等馬對下等馬。結局:三局兩勝。

第六種情況:下等馬對上等馬,中等馬對中等馬,上等馬對下等馬。結局:三局一勝。

六種對陣形式中,只有一種能使田忌取勝,孫臏采取的正是這一種。賽前孫臏對田忌說:“你用自己的下等馬去對陣他的上等馬,然后用上等馬去對陣他的中等馬,最后用中等馬去對陣他的下等馬。”比賽結束之后,田忌三局兩勝,贏得了比賽。田忌從此對孫臏刮目相看,并將他推薦給了齊威王。同樣的馬,只是調整了出場順序,便取得截然相反的結果。這里邊蘊涵著博弈論的道理。

在田忌賽馬這個故事中,田忌同齊國的貴族便是博弈的雙方,也稱為博弈的參與者。孫臏充分了解了各方的信息,也就是比賽的規則與各匹馬之間的實力差距,并在六種可以選擇的策略中幫田忌選擇了一個能爭取最大利益的策略,也就是最優策略。所以說,這是一個很典型的博弈論在實際中應用的例子。

在這里還要區分一下博弈與博弈論的概念,以免搞混。它們既有共同點,又有很大的差別。

“博弈”的字面意思是指賭博和下圍棋,用來比喻為了利益進行競爭。自從人類存在的那一天開始,博弈便存在,我們身邊也無時無刻不在上演著一場場博弈。而博弈論則是一種系統的理論,屬于應用數學的一個分支。可以說博弈中體現著博弈論的思想,是博弈論在現實中的體現。

博弈作為一種爭取利益的競爭,始終伴隨著人類的發展。但是博弈論作為一門科學理論,是1928年由美籍匈牙利數學家約翰·馮·諾依曼建立起來的。他同時也是計算機的發明者,計算機在發明最初不過是龐大、笨重的算數器,但是今天已經深深影響到了我們生活、工作的各個方面。博弈論也是如此,最初馮·諾依曼證明了博弈論基本原理的時候,它只不過是一個數學理論,對現實生活影響甚微,所以沒有引起人們的注意。

直到1944年,馮·諾依曼與摩根斯坦合著的《博弈論與經濟行為》發行出版。這本書的面世意義重大,先前馮·諾依曼的博弈理論主要研究二人博弈,這本書將研究范圍推廣到多人博弈;同時,還將博弈論從一種單純的理論應用于經濟領域。在經濟領域的應用,奠定了博弈論發展為一門學科的基礎和理論體系。

談到博弈論的發展,就不能不提到約翰·福布斯·納什。這是一位傳奇的人物,他于1950年寫出了論文《n人博弈中的均衡點》,當時年僅22歲。第二年他又發表了另外一篇論文《非合作博弈》。這兩篇論文將博弈論的研究范圍和應用領域大大推廣。論文中提出的“納什均衡”已經成為博弈論中最重要和最基礎的理論。他也因此成為一代大師,并于1994年獲得諾貝爾經濟學獎。后面我們還會詳細介紹納什其人與“納什均衡”理論。

經濟學史上有三次偉大的革命,它們是“邊際分析革命”“凱恩斯革命”和“博弈論革命”。博弈論為人們提供了一種解決問題的新方法。

博弈論發展到今天,已經成了一門比較完善的學科,應用范圍也涉及各個領域。研究博弈論的經濟學家獲得諾貝爾經濟學獎的比例是最高的,由此也可以看出博弈論的重要性和影響力。2005年的諾貝爾經濟學獎又一次頒發給了研究博弈論的經濟學家,瑞典皇家科學院給出的授獎理由是“他們對博弈論的分析,加深了我們對合作和沖突的理解”。

那么博弈論對我們個人的生活有什么影響呢?這種影響可以說是無處不在的。

假設,你去酒店參加一個同學的生日聚會,當天晚上他的親人、朋友、同學、同事去了很多人,大家都玩得很高興。可就在這時,外面突然失火,并且火勢很大,無法撲滅,只能逃生。酒店里面人很多,但是安全出口只有兩個。一個安全出口距離較近,但是人特別多,大家都在擁擠;另外一個安全出口人很少,但是距離相對遠。如果拋開道德因素來考慮,這時你該如何選擇?

這便是一個博弈論的問題。我們知道,博弈論就是在一定情況下,充分了解各方面信息,并做出最優決策的一種理論。在這個例子里,你身處火災之中,了解到的信息就是遠近共有兩個安全門,以及這兩個門的擁擠程度。在這里,你需要做出最優決策,也就是最有可能逃生的選擇。那應該如何選擇呢?

你現在要做的事情是盡快從酒店的安全門出去,也就是說,走哪個門出去花費的時間最短,就應該走哪個門。這個時候,你要迅速地估算一下到兩個門之間的距離,以及人流通過的速度,算出走哪個門逃生會用更短的時間。估算的這個結果便是你的最優策略。

這樣的案例在我們身邊有很多。2003年2月2日,哈爾濱天潭酒店發生火災,共造成33人死亡,10人受傷。當時,偌大一個酒店就只有兩個安全通道。2008年9月22日,深圳一家舞廳發生火災,當時舞廳里面有三四百人,大家都搶著從狹窄的出口逃生,最終導致踩踏事件的發生,事故中共死亡43人,受傷59人。令人痛心的是,舞廳雖設有消防通道,但是只有幾十個人選擇從消防通道逃生。

不僅僅是火災中,我們身邊無時無刻不上演著一場場博弈,有博弈的地方就用得到博弈論。

主站蜘蛛池模板: 宜丰县| 永定县| 双流县| 林口县| 年辖:市辖区| 马鞍山市| 满城县| 祁阳县| 河南省| 琼结县| 德昌县| 兴义市| 静宁县| 白水县| 新丰县| 全州县| 大冶市| 汕头市| 广丰县| 贵溪市| 平乡县| 甘南县| 南开区| 叶城县| 茌平县| 塔城市| 光泽县| 车险| 宜都市| 高雄市| 丹江口市| 中超| 江门市| 澎湖县| 容城县| 措美县| 富蕴县| 屯留县| 淮北市| 云龙县| 泰兴市|