書名: 基于信號博弈和MAS的交易行為研究作者名: 尹秋菊本章字數: 4876字更新時間: 2021-03-10 14:19:22
2.1 博弈論
2.1.1 博弈論概述
1.概念
“博弈論”譯自英文“Game Theory”,又稱為對策論,它是一門研究相互影響著的局中人在進行策略選擇時的行為規律的科學。著名博弈論專家海薩尼認為:博弈論是關于相互作用的理論,即它是關于社會形勢中理性行為的理論,其中,每個局中人對行動的選擇必須以他對其他局中人將如何反應的判斷為基礎。
博弈論試圖將研究內容數學化、理論化,以便更確切地理解其中的邏輯關系,為清晰地描述與解決現實問題提供理論工具。它研究的重點是決策主體的諸多策略集中使局勢均衡的策略,研究其存在性和性質、解法,其分析的目的是使參與者在給定的戰略集中進行選擇,從而獲得最大的效用。
博弈論包括以下幾方面內容:
1)參與人
參與人是博弈中選擇行動以最大化自己效用的決策主體。
2)行動
行動是參與人的決策變量。
3)戰略
戰略是參與人選擇行動的規則,它規定參與人在什么時候選擇什么行動。
4)信息
信息是參與人在博弈中的知識,特別是有關其他參與人的特征和行動的知識。
5)支付函數
支付函數是參與人從博弈中獲得的效用水平,它是所有參與人戰略或行動的函數。
6)結果
結果是博弈分析者感興趣的要素的集合。
7)均衡
均衡是所有參與人的最優戰略或行動的組合。
2.博弈論的發展過程
1994年的諾貝爾經濟學獎授予納什、海薩尼和澤爾滕三位博弈論專家,1996年的諾貝爾經濟學獎授予在博弈論研究方面做出突出貢獻的維克里和莫里斯,2001年的諾貝爾經濟學獎由信號博弈方面的專家斯賓塞、阿克洛夫和斯蒂格利茨獲得,這意味著博弈論的重要性已得到了學術界的公認。
博弈論的思想最早可以追溯到中國古代。我國春秋時期孫武所著《孫子兵法》一書中的軍事思想,以及“田忌賽馬”事例是最早的博弈論思想和應用案例。
現代博弈論大致分為以下幾個發展階段:
1)萌芽階段
20世紀初期,博弈論的研究對象主要是從競賽與游戲中引申出來的嚴格競爭博弈,即二人零和博弈。在這類博弈中,不存在合作或聯合行為,對弈雙方的利益嚴格對立,一方有所得必定意味著另一方有等量損失。在這一階段,最重要的成就有澤梅羅定理、逆推歸納法與馮·諾依曼的最小最大定理,以及博弈擴展型策略、混合策略等概念。
2)建立階段
20世紀30年代至40年代,博弈論作為一門學科而確立,其形成標志就是美國數學家馮·諾依曼與奧斯卡·摩根斯頓在1944年合著的《博弈論與經濟行為》一書。他們在該書中建立了一些基本的博弈模型,研究了博弈解的概念和分析方法,構建起了博弈論的基本理論框架。在這一時期,合作博弈的研究有了長足的進步,并提出了聯盟博弈、穩定集、解概念、可轉移效用、核心等概念和思想。
3)成長階段
20世紀50年代,非合作博弈理論發展起來,納什為非合作博弈的一般理論奠定了基礎,提出了博弈論中最為重要的概念——納什均衡,阿爾伯克·塔克提出了囚徒困境、重復博弈概念。同時,合作博弈理論也得到了進一步發展,如沙普利值概念、核概念等。博弈論的研究隊伍開始擴大,蘭德公司在盛基尼卡開業,在隨后的許多年里,這里成為博弈論的研究中心。在本階段初期,博弈論的重要應用領域是軍事戰術問題及冷戰策略。此后,經濟學逐漸成為博弈論最重要的應用領域。
4)成熟階段
20世紀60年代,不完全信息與非轉移效用聯盟博弈的擴充使博弈論更具廣泛應用性。針對納什均衡假設博弈雙方的信息是完全的這一與大多數情況不符的問題,海薩尼提出了不完全信息理論。
1965年,澤爾滕將納什均衡的概念引入動態問題研究,提出了精煉納什均衡、子博弈精煉納什均衡、顫抖手均衡等概念。海薩尼在1967年提出了不完全信息動態博弈和貝葉斯均衡等概念。
5)壯大階段
20世紀70年代至今,博弈論在很多領域的研究都取得了重大突破,在理論上,博弈論從基本概念到理論推演均形成了完整的、內容豐富的體系。非合作博弈論應用到了大批特殊的經濟模型、生物學、計算機科學等領域。
3.博弈論的經濟學應用
博弈論在經濟學中的成功應用概括起來有以下幾個方面:
1)產業組織理論
博弈分析改寫了整個產業組織理論的基本內容,主要有寡頭競爭理論、價格歧視理論、壟斷理論等。
2)一般均衡理論
博弈論為探索一般均衡存在性的問題找到了一條比較簡單明了的解決途徑。
3)不完全信息條件下的委托代理理論或經濟機制設計理論
該理論對現實經濟生活具有強有力的解釋能力和實踐指導能力,其實質是不完全信息動態博弈的求解問題。
縱觀學者們將博弈理論與方法應用在市場行為上時,都是將市場看成一個整體或者一個單一的消費者,并將消費者的信息作為共同知識、將企業的知識作為私有信息。這在消費者偏好一致的情況下是可行的。
2.1.2 不完全信息動態博弈及海薩尼轉換
1.不完全信息動態博弈
不完全信息動態博弈是博弈的類型之一。參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動;每個參與人對其他所有參與人的特征、策略空間及支付函數并沒有準確的認識。
在不完全信息動態博弈中,參與人可以在有限信息的條件下,通過前面的博弈結果來修正自己關于其他參與人類型的信息,從而更好地把握博弈局勢。參與人的行動選擇與其私人信息有關,選擇的也是與其類型有關的行動,在他之后行動的參與人就可以通過對歷史行動的觀察來推斷他的類型,即使不能完全消除不確定性,也可以得到概率分布上的改進。
具體來講,不完全信息動態博弈中的信息不完全性指的是:各博弈方都有關于自己收益的完全信息;至少有一個博弈方不完全清楚其他某些博弈方在某些情況(策略組合)下的收益;當博弈方屬于沒有完全信息時,他至少有其他博弈方收益分布的可能范圍和分布概率的知識。
不完全信息動態博弈中的動態性指的是:在博弈過程中,參與人的行動有先后順序,且后行動者在自己行動之前能觀測到先行動者的行動。
通常用擴展式表述來描述和分析動態博弈。博弈的擴展式表述包括以下要素:
(1)參與人集合:i=1, …, n。此外,用N代表虛擬參與人——“自然”。
(2)參與人的行動順序:各參與人行動的先后順序。
(3)參與人的行動空間:每次行動時,參與人的可選擇范圍。
(4)參與人的信息集:每次行動時,參與人所知道的信息。
(5)參與人的支付函數:行動結束后,每個參與人所得到的收益。
(6)外生事件(即自然的選擇)的概率分布。
具有上述特征的博弈過程稱為不完全信息動態博弈。
2.海薩尼轉換
海薩尼轉換是指這樣一種處理方法:將博弈方具有幾種不同的收益可能,理解為博弈方有不同的類型,并引進一個為博弈方選擇類型的虛擬博弈方——“自然”,從而把不完全信息博弈轉化成完全但不完美信息動態博弈。其具體過程是:
(1)引進一個虛擬的博弈方——“自然”,其作用是在博弈中進行實際博弈的博弈方選擇之前,為每個實際博弈方按隨機方式選擇(或者說抽取)他們各自的類型。抽取的這些類型構成類型組合T={t1, …, tn},其中,ti∈T。
(2)這個“自然”博弈方讓每個實際博弈方知道自己的類型,但不讓(全部或部分)博弈方知道其他博弈方的類型。
(3)在前述基礎上,再進行原來的博弈,即各個實際博弈方根據順序從
各自的行為空間選擇行動組合{a1, …, an}。
除了虛擬博弈方“自然”外,其余博弈方各自的收益為ui=ui(a1, …, an, ti),其中,i=1, …, n。
2.1.3 信號博弈及貝葉斯均衡
1.信號博弈
信號博弈是不完全信息動態博弈中的一種,它是深入研究具有信息傳遞作用的信號機制的一般博弈模型,其中,信號是具有信息傳遞作用的行為,通過信號傳遞信息的過程則稱為信號機制。信號博弈中有兩個(或兩類,每類有數個)博弈方,分別為信號發出者和信號接收者。他們先后各選擇一次行為,其中信號接收者具有不完全信息,但它們都可以從信號發出者的行為中獲取部分關于信息發出者的信息,并把這種部分信息作為自己選擇下一步行為的依據。
信號傳遞是現代企業經營過程中常見的現象。例如,作為生產率信號的昂貴廣告和全面擔保;作為市場力量信號的主動降價;作為個人能力信號的各種資格證書;作為質量信號的激光防偽標志;作為經營業績信號的股票價格;等等。
信號博弈中有兩個參與者,具有信息優勢的一方稱為信號發出者S,另一個稱為信號接收者R,博弈順序為:
(1)“自然”從可行的類型集Θ={1,2, …, n}中賦予信號發出者S類型θi的先驗概率為p(θi)>0,并將p(θi)告知信號接收者R,將θi告知信號發出者S,信號接收者R不知道發出者的類型θi, 。
(2)信號發出者S從信號集M={m1, …, mJ}中選擇信號mj(j=1, …, J)發送。
(3)信號接收者R觀察到mj后,從可行行動集A={a1, …, aK}中選擇行動ak(k=1, …, K)。
信號發出者S的效用函數為uS(θi, mj, ak),信號接收者R的效用函數為uR(θi, mj, ak),兩者為共同知識。
后驗概率μ(θimj)表示觀察到信號mj后,信號接收者R相信是類型θi的信號發出者S發出信號的概率。
2.完美貝葉斯均衡
信號博弈的完美貝葉斯均衡是策略組合[m?(θ), a?(m)]和后驗概率μ(θ m)的結合,它滿足以下要求。
(1)信號接收者R在觀察到信號發出者S的信號mj后,必須有對于S的類型判斷,即S屬于類型θi的概率分布為p(θimj),其和為。
(2)給定R的判斷和S的信號,R的行為必使R的期望收益最大,即a?(mj)是最大化問題的解。
(3)給定R的策略a?(mj)時,S的選擇必須使S收益最大,即m?(θi)是最大化問題的解。
(4)對于每個mj∈M,無論是否存在θi∈Θ,使得m?(θi)=mj, R在對應于mj的信息集處的判斷都必須符合S的策略和貝葉斯法則。
上述完美貝葉斯均衡可以分成以下3類:
1)分離均衡
不同類型的信號發出者以概率1選擇不同的信號,或者說,沒有兩種類型選擇同一信號。在分離均衡中,信號準確的表現類型。
2)混同均衡
不同類型的信號發出者選擇相同的信號,或者說,沒有任何類型選擇與其他類型不同的信號。
3)準分離均衡
有些類型的信號發出者隨機選擇信號,另一些類型的信號發出者則選擇特定的信號。
3.逆推歸納法
在動態博弈的分析過程中,大多采用一種分析方法,即“逆推歸納法”。
這種方法的邏輯基礎如下:動態博弈中先行動的、理性的博弈方,在前面階段選擇行為時,必然會先考慮后行動博弈方在后面階段中將會怎樣選擇行為,只有在博弈的最后一個階段選擇的、不再有后續階段牽制的博弈方,才能直接做出明確選擇。而當后續階段博弈方的選擇確定以后,前一階段博弈方的行為也就容易確定了。
其分析方法如下:從動態博弈的最后一個階段開始分析,每一次確定出所分析階段博弈方的選擇和路徑,然后確定前一個階段博弈方的選擇和路徑。由于利用逆推歸納法確定的各個博弈方在各階段的選擇,都建立在后續階段各個博弈方理性選擇基礎上,因此就排除了包含不可信威脅或承諾的可能性。但是,這種方法對博弈方理性的要求很高,要求各博弈方了解博弈的結構,包括次序、規則和各方的收益情況。
4.信號博弈在經濟管理領域中的具體應用
作為博弈理論中的一個重要組成部分,信號博弈被廣泛應用到經濟領域,許多學者對這一具有特殊形式的博弈方式進行了諸多研究。
例如,對信號博弈的研究始于Spence M.[61]提出的利用教育水平傳遞工作能力的勞動力市場模型;肖條軍等人[62]建立了一個縱向型企業集團兩階段R&D決策的信號博弈模型,該模型基于創造性毀滅過程,并采用三重逆推歸納法和二重前推法進行求解;同濟大學的李宇宏等人[63]建立了一個二維信號博弈模型,將企業是否進行多元化及進行多元化選擇的金融方式作為二維信號,傳遞企業成本狀況及市場需求的二維私人信息。受企業經營中的利潤最大化目標的制約,信號博弈的均衡需要考慮信號傳遞的成本與博弈一方數目變化的影響。例如,梁建英等人[64]利用信號博弈建立了信號成本與外包供應商信號傳遞關系的博弈模型,提出雖然較強的信號傳遞能夠使供應商市場出現分離均衡,有利于外包商的選擇,但同時需要考慮高能力供應商與低能力供應商的信號成本問題。Kübler D.等人[65]通過實驗分析了Spence的教育信號博弈,得出雇傭者數目的增加將影響信號博弈的分離均衡。
綜上所述,對信號博弈均衡的研究需要考慮信號傳遞的成本、是否進行重復博弈等問題,對信號均衡解的算法研究有助于討論均衡結果的唯一性。同時,均衡結果的類型起到對所研究領域的決策支持的作用。