- 行為供應鏈博弈模型及其復雜性研究
- 李秋香
- 6012字
- 2020-04-07 10:38:19
2.2 博弈理論
2.2.1 基本理論
字面意思上博弈論可以理解為來自游戲的理論,是應用數學的一個分支。博弈論最初起源于牌、賭博等游戲,主要研究棋牌類游戲中的勝負問題。從定義上看,博弈是在特定的條件和游戲規則下,博弈中的人或者組織從允許的策略中同時或者先后進行選擇并加以實施的過程。1944年,《對策論及其在經濟領域中的應用》一書發表代表了博弈論真正作為理論發展起來,這本著作當時在經濟、數學、社會領域引起了很大反響。后來博弈理論被廣泛應用到多門學科中,作為一種有效的方法經常用于復雜網絡系統和供應鏈系統的分析。
用博弈論研究復雜系統,主要是研究各主體或組成部分之間的相互影響。一方的條件和選擇發生變化都會影響到其他主體和組成部分的選擇,博弈方之間是有利益沖突的。在考慮對方選擇的影響下,為了自身利益最大化參與者各自做出理智的決策。
1. 博弈的基本要素
一般博弈問題包括以下幾個要素:
博弈的參與者(Players):指在一場博弈或者競賽中,能夠獨立進行決策并能獨立承擔博弈結果的博弈方。一次博弈至少有兩個博弈方,如果有n個博弈方,則成為n人博弈。
博弈方的策略空間:每個博弈參與者可選擇的策略集合。
博弈的順序:博弈的參與者要做多次次序不同的博弈,所以博弈方要確定行動的次序。這樣即使博弈的其他要素是相同的,也是不同的博弈,產生的結果往往有本質的不同。
博弈方的得失(Payoffs):博弈結束時,每個博弈方通過收益函數或者贏利函數計算自己的得失,是博弈方所選定的策略的博弈效果。
博弈的信息(Information):是指博弈參與者在決策時所獲取的信息。
理性:理性人在博弈中會對所有的策略結果進行排序。在博弈過程中,根據其他博弈方的策略,選擇能帶來最高收益的策略。理性又分為完全理性和不完全理性,現實中,人不可能是完全理性的,大多處于完全理性和不完全理性之間。管理學家西蒙提出了“有限理性”的概念。他認為決策者會受到自身能力、外部環境和認知能力的影響,因而決策人表現出有限理性的機制。
均衡:表示系統中各決策方處于一種穩定狀態。
目標:局中人所期望實現的結果,通常用局中人的目標函數表示,局中人通過策略選擇來實現。
2. 博弈的類型
按照不同角度,博弈可以分成不同類別:根據博弈參加者是否合作,可將博弈分為合作博弈和非合作博弈;根據參加者決策是否具有先后順序,可將博弈分為靜態博弈和動態博弈。根據參加者對其他參與者的信息是否完全了解,可將博弈分為完全信息博弈和不完全信息博弈;同時還可以根據博弈次數、博弈時間等對博弈進行分類。表2-1歸納了博弈的主要類型,下面的這些分類都有其特定的意義。博弈結構差異對博弈的分析方法、分析過程和分析結果都有重要影響。
表2-1 博弈類型

任何一個完整的博弈均包括四個要素:①局中人,即博弈的參加者,在博弈過程中獨立決策、獨立承擔后果的個人和組織。局中人可能是自然人也可能是團體,如國家、企業,甚至是若干個國家組成的集團,如歐盟,北約。一般來說,博弈方的數量越多,博弈過程就會越復雜,博弈結果就越難預測。②博弈方的策略空間,策略空間是博弈方可選擇策略的集合,每個策略都對應著一個博弈結果。③博弈順序,博弈順序是指博弈方進行博弈行動的次序,在相同博弈方、策略空間下,同時決策行動和先后決策行動,其結果往往有本質的變化,博弈次序對于博弈結果影響巨大。④博弈方的收益,收益是博弈結束后,各博弈方的“得失”。收益一般通過收益函數計算得出,收益函數通常又稱為贏利函數(或支付函數),是全體局中人所取定的一組策略的函數。
博弈按照不同角度可以分為合作博弈和非合作博弈;靜態博弈和動態博弈;完全信息博弈和不完全信息博弈;完全信息靜態博弈和不完全信息靜態博弈;零和博弈、常和博弈和變和博弈、序貫博弈和重復博弈等類型。
(1)合作博弈、非合作博弈
按照博弈方之間是否進行合作,博弈可劃分為合作博弈和非合作博弈。合作博弈是研究人們達成合作時如何分配共享收益。一般方法是參與人之間制定一個對各方具有約束力的協議,各參與人在協議范圍內進行博弈,合作博弈強調的是收益分配問題。非合作博弈是研究各博弈方在利益相互影響的局勢中以自己收益最大化進行決策的博弈,強調的是策略選擇問題。本書中合作博弈的決策依據是各個節點企業均以風險規避型的供應鏈總收益最大化,非合作博弈的決策依據是各個節點企業以自己收益最大化。
(2)完全信息博弈、不完全信息博弈
按照博弈方對其他參與人的特征、策略空間、支付函數等方面的了解程度進行分類,博弈可劃分為完全信息博弈和不完全信息博弈。完全信息博弈指在博弈過程中,每個參與人掌握所有其他參與人的特征、策略空間及支付函數的準確信息;反之,就是不完全信息博弈。
(3)靜態博弈、動態博弈
按照博弈方的行動先后順序進行分類,博弈可劃分為靜態博弈和動態博弈。靜態博弈是在博弈過程中,博弈方同時選擇行動,或者不同時但后行動者并不知道先行動者采取的具體行動。動態博弈指在博弈過程中,博弈方有主導者和跟隨者,博弈方的行動有先后順序。一般主導者先行動,跟隨者后行為,且跟隨者能夠觀察到主導者選擇的行動,如Stackelberg博弈。
(4)零和博弈、常和博弈、變和博弈
按照收益情況劃分,可劃分為零和博弈、常和博弈、變和博弈。零和博弈指一方收益必然來自另一方的損失。因此,零和博弈的博弈方始終是對立關系。常和博弈指博弈各方都會有收益,但收益總和是一個固定的常數。變和博弈指各方博弈方的策略組合不同會有不同收益。
(5)序貫博弈、重復博弈
在動態博弈中,參與人前一個階段的行動選擇決定其后的博弈結構,即后一個博弈決策不同于前一個博弈決策。重復博弈是同樣結構的博弈重復多次,其中,每次博弈稱為階段博弈。重復博弈的基本特征主要有三個:①前一階段博弈不改變后一個階段博弈的結構;②所有博弈參與方都能觀測到過去博弈的歷史;③參與方的總支付是所有階段博弈支付的貼現值之和或者加權平均值。影響重復博弈均衡解的主要因素是信息的完備性和重復次數。
3. 納什(Nash)均衡
在完全信息靜態博弈中,在給定其他人策略的條件下,每個參與方選擇自己的最優策略;當其他人不改變策略時,此時的策略是最好的,這種策略組合就是納什均衡。此時如果改變策略將會導致收益降低。所以,在納什均衡點,每一個理性的參與方都不會有單獨改變策略的沖動。任何有限純策略的二人博弈至少有一個均衡偶,即納什均衡點。尋找均衡點的存在性相當于找到博弈模型的不動點。納什均衡點是一種非常重要的分析手段,可以在一個博弈結構里尋找比較有意義的結果。但納什均衡點局限于任何參與方不想單方面改變策略,而忽視了其他參與人改變策略的可能性。因此,納什均衡點的結論在很多情況下缺乏說服力。納什均衡是博弈論中最重要的一個概念。經濟學中,博弈均衡是指使博弈的參與者都實現自身的最大利益,這意味著博弈各參與者對已有的市場平衡滿意。所有參與者都不想也沒有動力改變自己策略的狀態。
下面給出納什均衡的數學定義:
設G={S1,…,Sn;u1,…,un}表示一個對策,其中,包括n個局中人,S1,…,Sn表示每個局中人可以選擇的策略,u1,…,un是各局中人的收益函數,如果存在一個策略組合,…,
,?
,使
,…
,
,…
為最佳策略組合,稱
,…,
為G的一個納什均衡。
總之,博弈論的本質是通過數學和邏輯學的辦法來分析日常生活中的競爭和矛盾。因此我們要深入研究這些規則和規律,從而使競爭最終按照預期運作。
2.2.2 經典的博弈模型
寡頭壟斷(Oligopoly)是現實經濟運行中最常見的市場結構。其主要理論模型有古諾博弈、斯坦克爾伯格博弈和伯川德博弈。
1. 古諾模型(Cournot Model)
法國經濟學家安東尼·奧古斯丁·庫爾諾(又譯為古諾)1938年提出了古諾模型,也稱為古諾雙寡頭模型(Cournot Duopoly Model)。在古諾研究的基礎上,很多學者對市場中存在三個或三個以上的寡頭廠商競爭的情況進行了研究。
古諾模型是在一定條件下進行研究的,主要包括以下幾個方面:
(1)古諾模型考慮的是市場上只有兩家生產廠商,且都是為了實現自身利潤最大化,生產的產品是同質的。
(2)寡頭生產商以決策變量進行博弈。每家廠商的產量都是對另外一方產量預期的函數,同一時期內,兩個寡頭同時決策,產量決策相互之間不會影響。
(3)生產商依據競爭者的上期決策信息確定自身的產量。
(4)生產成本均為零,每個寡頭都能夠準確地了解市場的需求曲線。
(5)需求函數是線性形式的。
古諾模型有一定的使用范圍,但現實中的供應鏈博弈不能用古諾博弈進行分析,如現實中供應鏈的企業主體不能完全掌握對方信息,競爭者提供的產品不是同質的,這些影響因素導致古諾博弈的結果與現實情況大相徑庭。現實中多數企業之間通過價格進行博弈,而古諾模型是針對產量進行博弈。為了使博弈更加貼近于現實情況,很多學者對古諾模型進行了改進。
2. 斯坦克爾伯格均衡(Stackelberg Equilibrium)
1934年,德國經濟學家Stackelberg提出了斯坦克爾伯格模型。模型假設市場中存在兩大類參與方,一類處于主導地位,另一類處于順從地位。處于領導地位的參與方先做出決策,處于跟隨地位的參與者馬上根據領導者的決策信息確定自己的策略。因此,領導參與者做決策時,也會考慮跟隨參與者的決策結果。與古諾模型相比,斯坦克爾伯格模型有以下兩點不同:
(1)古諾模型假設寡頭廠商具有同等地位,斯坦克爾伯格模型假定廠商處于主從地位。
(2)古諾模型中寡頭廠商具有同等規模,斯坦克爾伯格模型中跟隨廠商的規模一般比較小。
斯坦克爾伯格模型正是針對如下市場現狀提出的:跟隨廠商規模比較小,他們的決策成本高。在這種情況下不具備決策優勢,跟隨領導廠商可以降低它的決策成本和風險。斯坦克爾伯格模型決策過程為:首先,為了實現自身利潤最大化,領導者根據市場的情況和跟隨者的情況制定自己的決策。其次,跟隨者根據領導者的決策制定自己的決策。下面解釋斯坦科爾伯格模型的博弈過程。
假設市場需求函數為:

其中,Q=q1+q2,則可以得到生產商1的利潤:

跟隨生產商2的利潤為:

可以得到:

由于生產商1預料到生產商2根據q1來確定自身的產量,可以計算出生產商1的最優產量:

假設c1=c2,均衡使雙方的利潤為:

在以制造商為主導的風險規避型供應鏈中,零售商為跟隨者。零售商根據觀察到的先動制造商的信息進行決策。
3. 伯川德模型
1883年,法國經濟學家約瑟夫·貝特蘭德(又譯伯川德)提出了伯川德模型(Bertrand)。與古諾模型不同,伯川德模型以產品價格為決策變量,而不是產品產量。因此伯川德模型是關于價格競爭的模型。分析伯川德模型時作如下假設:
(1)寡頭制造商生產同質產品,生產能力無限,并同時決策進行市場競爭;
(2)寡頭制造商的生產成本是相同的;
(3)寡頭制造商之間沒有正式或非正式的串謀行為。
下面來分析伯川德模型均衡的形成過程。假定兩個制造商A和B,若A制定產品價格為pa并能獲得一個正的利潤,這時B制定產品的價格pb低于pa,消費者只會選擇購買B的產品,而廠商A的利潤為零;同理,若B制定產品價格為pb并能獲得一個正的利潤,這時A制定產品的價格pa低于pb,消費者只會選擇購買A的產品,廠商B的利潤為零。A和B的產品價格最終確定為邊際成本,這時如果制造商提價,沒有利潤;降價,定價會低于生產成本,同樣無法盈利。通過分析得到一個結論,對于伯川德模型,定價低的制造商將會贏得市場的全部利潤;經過長期博弈,產品的定價最終等于產品的邊際成本,制造商的利潤為零。這顯然與現實中寡頭競爭的情況不一致,這就是著名的“伯川德悖論”。出現這種情況與伯川德模型的假設條件有關:
(1)模型中對制造商的生產能力是沒有限制的。如果制造商生產能力有限,市場需求部分不能得到滿足,產品價格就會高于邊際成本。
(2)制造商的產品是完全替代的。如果制造商生產的產品有差異,制造商之間就會避免直接價格競爭。
解開“伯川德悖論”的辦法之一是引入產品的差異性。在產品存在差異的情況下,均衡價格就不會等于邊際成本。下面考慮一種具有特殊的差異(空間上的差異)模型—經典的Hotelling模型。
4. Hotelling模型
在經典的Hotelling中,產品是同質的,主要考慮產品在空間上的差異。決定顧客是否購買產品的主要原因是價格與運輸成本。假定兩個零售商A和B位于一個長度為1的線性城市的兩端,即A位于x=0處,B位于x=1處,所有的顧客都均勻地分布在[0,1]區間內。假定每個產品的邊際成本和單位成本固定不變且為零,如果有零售商進入市場參與競爭,每個產品的邊際成本和單位成本固定不變且為零。c為每個顧客購買產品的距離成本,顧客購買產品的運輸成本與廠商的距離成比例。顯然,處于x位置的消費者在A處購買時的運輸成本為cx,如果該消費者在B處購買,則運輸成本為c(1-x)。
假定兩個銷售商同時確定自己的銷售價格(p1,p2)。當處于x位置的消費者購買兩種產品無差異時,則處在x左側的消費者將在A處購買,x右側的消費者將在B處購買,則x處滿足:p1+cx=p2+c(1-x)。通過計算可以得到需求函數:

根據公式(2-26)可以得到兩個銷售商的利潤函數。對利潤函數求一階導數,同時判斷二階導數滿足的條件即可得到兩個銷售商的價格。
由于Hotelling模型廣泛應用于產品差異化競爭的分析,本書將Hotelling模型應用于供應鏈中,研究概率銷售情況下的制造商和零售商的行為特征。
5. 博弈論在供應鏈中的應用
供應鏈中各節點企業間天然的博弈關系表現在:各企業以個人理性為研究出發點,符合博弈各方經濟理性的假設;供應鏈中各節點企業間存在相互影響和相互依賴的關系,每個節點企業的決策行為會影響其他企業的決策,說明各企業間的關系具有博弈行為;博弈論的很多結論與供應鏈中企業之間的合作關系和管理方式等理念極為相似,如“縱向一體化”概念。應用博弈論的思想找出供應鏈的主要問題和約束條件,建立供應鏈博弈模型已成為應用最為廣泛的工具和手段。
本書中主要涉及的博弈問題是競爭的零售商之間的博弈,制造商與零售商之間的博弈。一般情況下,供應鏈中各節點企業間的博弈問題通過三步來進行描述:
(1)將供應鏈問題用博弈模型表達出來。供應鏈中涉及的企業比較多,與企業利益相關的因素很多且相互制約。對供應鏈問題進行假設或簡化,找出與企業利益相關的主要問題,并用博弈模型將供應鏈的主要問題描述出來。
(2)找出博弈模型的博弈結果。結合實際條件,用博弈論思想或者數學工具對供應鏈博弈模型進行求解,得出供應鏈模型的均衡解(博弈結果),結合實際情況對博弈結果進行分析。
(3)將博弈結果與第一步中所描述的供應鏈主要問題等信息結合起來進行分析。如果博弈結果與所描述的供應鏈主要問題發生沖突,說明第一步中建立的模型不合適,需要重新審視第一步所建立的博弈模型并做出修改。
很多學者將經典的博弈模型進行了擴展并運用到供應鏈建模中。Li和Li(同一姓氏)研究了一個關于零售服務和公平關切下雙渠道供應鏈均衡問題。Snyder等研究了連續時間動態古諾調整模型。Ahmed等研究了一個動態伯川德寡頭模型,有限理性公司沒有采用梯度調整機制對價格進行調整。Wu和Gorder研究了動態多主體多階層離散主從博弈。Yu和Yu(同一姓氏)主要研究了貝葉斯博弈的動態行為。這些學者從不同角度、不同領域對博弈模型進行了擴展,豐富了博弈模型的內容。