官术网_书友最值得收藏!

  • 博弈論
  • 翟文明
  • 4476字
  • 2019-08-28 15:45:24

第4節 博弈的分類

依據不同的基準,博弈有不同的分類方式。下面就結合實例,一一介紹一下這些分類。

根據博弈的參與者之間是否有一個具有約束力的協議,博弈分為合作博弈和非合作博弈。

合作博弈并不是指參與者之間有合作的意向,或者合作態度,而是參與者之間有具有約束力的協議、約定或者契約,參與者必須在這些協議的范圍內進行博弈。非合作博弈是指參與者在博弈的時候,無法達成一個對各方都有約束力的協議。

合作博弈是研究合作中如何分配利益的問題,目的是使得協議框架內所有參與者都滿意。而非合作博弈的目的是如何為自己爭取最大化的利益,并不考慮其他參與者的利益。

一方面來講,合作博弈讓我們認識到了合作的力量和團隊的效率。但是,從另一方面來看,正是一些行業的寡頭之間進行合作博弈,簽訂協議,強強聯合,達到了對一些行業壟斷的目的。壟斷之后他們便協議商定產量和價格,以獲取最大利益。

非合作博弈強調的是對自己利益最大化地爭取,不考慮其他參與者的利益,與其他參與者之間沒有共同遵守的協議。非合作博弈遠比合作博弈復雜,因此人們的主要研究方向還是在非合作博弈身上。非合作博弈是博弈的常態,生活中的博弈大多是非合作博弈,沒有特別說明的情況下,一般人們說的博弈都是指非合作博弈。

我們前面提到的大多數例子是非合作博弈,比如“囚徒困境”博弈中,兩個犯人之間沒有任何協議,沒有串供,每個人都在為自己爭取最大利益;空城計的博弈中諸葛亮與司馬懿之間更不可能是合作博弈;還有夫妻搶各自喜歡的電視頻道的博弈也是非合作博弈。

總之,合作博弈是關于合作中如何分配利益的博弈,使得參與各方之間的利益達到一種均衡;非合作博弈是為自己爭取最大利益的博弈,不考慮他人的利益。

前面我們舉了一個火場中逃生的例子:你在參加一個同學生日聚會的時候突然遇到了火災,酒店只有兩個安全出口。如果不考慮道德因素,你在估算兩個出口離你的距離遠近,以及每個出口的人流量之后,選擇一個能最快逃生的出口,這便是一個非合作博弈。博弈的參與者是你與其他逃生的人,利益是最快時間逃出火災。估算出通過哪個門逃生用時最短,并選擇從這個門逃生,便是這場博弈的最優策略。

但是,如果你考慮了道德因素,沒有自己逃走,而是組織大家逃生,并且讓老人、孩子先走,自己最后才離開。這樣的話,就不存在博弈,因為你沒有考慮自己的利益,缺少博弈的要素。

如果你既沒有自己逃走,也沒有把機會讓給別人,而是同其他逃生的人商定了一個策略,保證大家能同時逃生。這樣的話,就成了一個如何在合作中分配利益的問題。這便是合作性博弈。

按照參與者選擇策略、做出決定的先后順序,博弈可以分為靜態博弈與動態博弈。

如果參與者們同時選擇策略,或者雖然有先后,但是后做出策略的參與者并不知道其他參與者的策略,那便是靜態博弈。比如“剪子、包袱、錘”就屬于靜態博弈;如果參與者的行動有先后順序,并且后者是在了解前者策略的前提下制定自己的策略,這種情況就是動態博弈,比如下象棋、打撲克。

下面我們舉兩個例子來說明一下靜態博弈與動態博弈。

某地區要建一個大型污水處理廠,面向社會招標。幾個大型的建筑公司都想承建這項工程,都向招標處發去了自己的投標意向書,其中包括各自公司對這項工程的設計和報價。競標的截止日期是10月1號,有的公司8月就投標了,也有的9月下旬才投標。

在這場博弈中,每個投標公司之間拼的主要還是對工程的設計以及工程報價,這也是每個公司的策略。在這里,每個公司投標的時候不知道其他公司的策略,盡管有的8月份就投標了,也就是做出策略了,但是因為他的內容是對外保密的,并沒有影響到后來者做出策略。盡管投標時間有先后,但是取得的效果與大家同時競標是一樣的。所以這是一場靜態博弈。

說完了靜態博弈,再說一下動態博弈。動態博弈的關鍵詞是,行動有先后,后者的決策受前者的影響。下面例子中就包含著一個動態博弈:

一個年輕人在一家酒吧喝酒,中途他起身去廁所。剛進廁所,廁所的門就被一個尾隨而入的女人關上了。這個女人對年輕人說:“把錢和手機拿出來給我,不然的話我就大喊,說你非禮我。”

年輕人想,此時沒有第三人在場,如果她喊非禮的話,自己肯定是說不清的。但是又不能讓壞人得逞,這樣她就會去敲詐更多的人。年輕人急中生智,指指自己的嘴巴,又指指自己的耳朵,嘴里還“嗚嗚哇哇”個不停,裝作是聾啞人。

這個女人發現他是個聾啞人,便準備放棄,雖然敲詐不成也不會被抓住任何把柄。但是年輕人卻不滿足于把她擺脫,而是想抓住證據,讓她以后再也不能作案。于是,他便掏出一支筆,在手掌中寫道:“你說什么?”這個女人不想放棄這次敲詐的機會,便在男人伸出的手上寫道:“把錢和手機給我,不然我就喊非禮。”

年輕人一看自己抓住了對方敲詐的證據,便一把抓住女子,大聲喊道:“我要送你去派出所!”女子這才發現自己上當了。

在這場博弈中,女子率先行動,使出策略,不拿出錢和手機來就喊非禮。年輕人根據當時的情形急中生智,選擇了裝聾作啞的策略,讓對方放棄敲詐。女子見占不到便宜便選擇了三十六計走為上,想要逃脫。年輕人為了抓住她的把柄,又使出策略,誘導女子留下證據。女子以為還有機會獲利,便將威脅的話寫到年輕人的手上,沒想到中了年輕人的計。這場博弈最后的策略是年輕人使出來的,那就是掌握了證據之后,將該女子送到派出所。至此,這場博弈結束。

這其中,年輕人與女子之間使出的策略都是根據對方的策略做出的。這是一場典型的動態博弈。

信息是博弈的四大要素之一,是參與者做出準確判斷的依據。但是在有的博弈中,我們能完全掌握對方的信息,還有很多時候我們并不知道,或者不完全了解對方的信息。比如在下象棋的博弈中,一方的排兵布陣都體現在對方面前,一目了然;但是打撲克的博弈中,你只知道自己手里的牌,不知道其他人手中的牌。基于對其他參與者的信息掌握程度,博弈可以分為完全信息博弈和不完全信息博弈。

完全信息博弈是指博弈中對其他參與者特征、利益、可能選擇的策略等信息都有一個準確的了解。如果對其他參與者特征、利益、可能選擇的策略等信息沒有一個準確的了解,或者有多個參與者的情況下,只對個別參與者的信息了解,這兩種情況的博弈便是不完全信息博弈。

博弈論模式中有一個“警察與小偷”模式,便是一個很經典的完全信息博弈。這個模式的大意是這樣的:鎮上有兩處地方需要巡邏,A處有價值兩萬元的物品,B處有價值1萬元的物品,但是鎮上只有一個警察,只能選擇一處巡邏。同時,鎮上還有一個賊,他也只能選擇去A處或者B處一處偷盜。如果警察在一處巡邏,小偷去另一處偷盜,小偷就能得逞;如果警察在一處巡邏,小偷去同一處作案,他就失敗了。警察與小偷事先都不知道對方將會去哪里作案或者巡邏。試問,這種情況下,警察應該選擇如何巡邏?

用我們前面介紹的博弈分類來看,這屬于靜態博弈,參與者雙方事先都不知道對方的選擇,自己策略的制定也與對方的策略無關。同時,這還是一個完全信息博弈。在這場博弈中,鎮上有A、B兩處地方有值錢的物品,警察只能選擇一處巡邏,小偷只能選擇一處下手作案,以及鎮上的交通路況等等,都是雙方的共同認知,這些信息對警察和小偷是公開的,因此這是一場完全信息博弈。

我們將上面這個模式改造一下,假設有一天警察想出了一個捉住小偷的好主意:傳出虛假消息,聲稱自己晚上將去A處巡邏,但是暗中去B處蹲守。不過這一切小偷并不知道,他不知道這是警察設下的一個圈套,結果他去B處偷盜,最終被警察抓到。在這場博弈中,警察使用了聲東擊西的策略,但是小偷對此并不知情。此時,這場博弈便變成了不完全信息博弈。

一方獲益,另一方損失,這只是博弈的一種結果。除此之外,博弈的結果還可能是兩敗俱傷,或者雙方共贏。按照博弈的結果來分,博弈分為負和博弈、零和博弈與正和博弈。

負和博弈是指博弈的參與者最后得到的收獲都小于付出,都沒有占到便宜,是一種兩敗俱傷的博弈。

網絡上流傳著這樣一個笑話,甲、乙兩個經濟學家走在路上,突然發現了路邊有一坨狗屎,甲便對乙說:“你要是把它吃了,我給你5000萬元。”乙一想,盡管臭了點,不過5000萬元也不是個小數目啊,猶豫了半天之后還是把它吃了。

二人繼續往前走,心中都有些不平衡。甲想,5000萬元也不是一筆小數目,我本想開開玩笑,現在倒好,白白花了5000萬元,什么也沒得到。乙想,雖然得了5000萬元,可吃狗屎的滋味太難受了,說不定這件事情傳出去還會被人恥笑。就在這時,兩人又發現了一坨狗屎。乙便提議說,你要是把它吃了,我也給你5000萬元。甲本來就有點心疼自己的錢,再說乙都吃了,自己為什么不能吃?于是他便吃了。按理說,兩個人又找回了心理和金錢上的平衡,但是兩個人怎么想都覺得不對,誰也沒有得到什么,平白無故每人吃了一坨狗屎。他們把這件事告訴了自己的導師,導師聽完之后大吃一驚,說道:“你們知道自己做了什么嗎?一轉眼你們就創造了一個億的GDP啊!”

雖然只是一個笑話,但是其中蘊涵著一場博弈,就結果來看是一場典型的負和博弈,也就是雙方的收獲都小于付出,兩敗俱傷。

零和博弈是指參與者中一方獲益,另一方損失,并且參與者之間獲得的利益與損失之和為零。賭博便是零和博弈最好的體現,只要有贏家就會有輸家,贏家贏的錢與輸家輸的錢肯定是一樣多。這與物理上的能量守恒定律是一個道理,不管能量怎樣變動,總量是不變的。

我們用一個撲克牌游戲來解釋一下零和博弈。甲、乙兩個人玩猜撲克游戲,游戲規則是每個人隨便抽一張牌,然后一起打開,若是顏色相同,甲給乙1元錢,若是顏色不同,乙給甲1元錢。為了保證沒有歧義,先將牌中的“大王”和“小王”拿出來。我們假定贏了1元錢用1來表示,輸了1元錢用-1來表示。我們知道,這個游戲可能出現的情形共有4種:

第一種情形:甲是紅牌,乙是紅牌,甲乙的得失為(-1,1)。

第二種情形:甲是紅牌,乙是黑牌,甲乙的得失為(1,-1)。

第一種情形:甲是黑牌,乙是紅牌,甲乙的得失為(1,-1)。

第一種情形:甲是黑牌,乙是黑牌,甲乙的得失為(-1,1)。

可以看出,無論是哪種情況,結局不外乎是一方贏1元錢,另一方輸1元錢,兩人之間的得失總和永遠為零。這種博弈我們便稱為“零和博弈”。

正和博弈又被稱為雙贏博弈、合作博弈,是指參與者都能獲益,或者一方的收益增加并不影響其他參與者的利益,這種博弈被認為是結局最好的一種博弈,也就是雙贏。

曾經有一個人想了解一下天堂和地獄到底有什么區別,他便去問傳教士。傳教士把他帶到了一間兩層樓的房子里面,一樓上有一張大餐桌,桌上擺放著各種美食,但是坐在桌子周邊的人個個愁容滿面。原來他們的手臂受到了詛咒,不能彎曲,每個人都無法把食物送進自己嘴里;他們又來到了二樓,二樓上同樣有一張餐桌,桌上擺滿了美食,桌邊人的手臂同樣不能彎曲,但是他們卻是歡聲笑語不斷,吃得津津有味,原來他們既然靠自己的手吃不到自己嘴里,就與對面坐的人相互喂食。傳教士便對這個人說:“你不是想知道天堂和地獄的區別嗎?剛才在一樓看到的就是地獄,二樓這里便是天堂。”

這是一個很典型的雙贏的例子,二樓的人們相互合作,結果每個人都得到了自己想要的,是正和博弈;而一樓的人自私自利,最后誰也沒有吃到東西,是負和博弈。

主站蜘蛛池模板: 淅川县| 会理县| 定襄县| 永清县| 朝阳区| 莎车县| 偏关县| 阳高县| 江川县| 房山区| 鄱阳县| 辉县市| 罗城| 江西省| 武山县| 伊金霍洛旗| 南华县| 辽阳市| 农安县| 曲周县| 调兵山市| 濮阳市| 洪泽县| 棋牌| 余庆县| 烟台市| 新河县| 池州市| 页游| 江安县| 青州市| 信宜市| 冕宁县| 靖江市| 新蔡县| 沧州市| 古丈县| 麻栗坡县| 彰武县| 宁河县| 农安县|