摘要:本文分析了2×2矩陣博弈中的混合策略均衡,討論了此類博弈的嚴(yán)格優(yōu)勢(shì)策略和純策略均衡,得到了在沒有嚴(yán)格優(yōu)勢(shì)策略且存在唯一均衡的2×2矩陣博弈中,均衡必為混合策略均衡。
關(guān)鍵詞:矩陣博弈; 嚴(yán)格優(yōu)勢(shì)策略; 均衡
博弈論是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論主要研究公式化了的激勵(lì)結(jié)構(gòu)間的相互作用。如今,博弈論在金融學(xué)、證券學(xué)、生物學(xué)、經(jīng)濟(jì)學(xué)、國(guó)際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。
均衡是博弈論一個(gè)重要研究對(duì)象。均衡是一種策略組合,使得同一時(shí)間內(nèi)每個(gè)參與人的策略是對(duì)其他參與人策略的最優(yōu)反應(yīng)。1951年納什提出著名的納什定理,即在矩陣博弈中一定存在均衡。這里的均衡可能是純策略均衡,也可能是混合策略均衡。
2×2矩陣博弈是一類最基本且被廣泛應(yīng)用的重要博弈類型,它是指在博弈過程中只有兩個(gè)參與人(參與人1和參與人2),且每個(gè)參與人只有兩個(gè)可選策略。經(jīng)典博弈諸如囚徒困境、性別戰(zhàn)爭(zhēng)、古諾雙寡頭壟斷、貝特蘭德雙寡頭壟斷等博弈都可以歸為此類博弈。
本文分析了2×2矩陣博弈中的混合策略均衡,討論了此類博弈的嚴(yán)格優(yōu)勢(shì)策略和純策略均衡,得到了在沒有嚴(yán)格優(yōu)勢(shì)策略且存在唯一均衡的2×2矩陣博弈中,均衡必為混合策略均衡。
考慮2×2矩陣博弈。對(duì)于參與人1和參與人2,參與人1的可選策略為U和D,參與人2的可選策略為L(zhǎng)和R。他們的收益情況如下:
(1)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和;
(2)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和;
(3)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和;
(4)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和。
我們可以用如下的矩陣表示:
其中第一列表示參與人1的可選策略,第一行表示參與人2的可選策略,收益中前者為參與人1的收益,后者為參與人2的收益。
設(shè)參與人1選取策略的概率為,參與人2選取策略的概率為。這樣,參與人1選取策略的概率為,參與人2選取策略的概率為。
可見,對(duì)參與人1而言,選取策略的期望收益為,選取策略的期望收益為,于是參與人1選取策略和策略無差異當(dāng)且僅當(dāng)。令表示參與人1對(duì)參與人2隨機(jī)化概率的反應(yīng)函數(shù)。則
類似地,對(duì)參與人2而言,選取策略的期望收益為,選取策略的期望收益為,于是參與人2選取策略和策略無差異當(dāng)且僅當(dāng)。令表示參與人2對(duì)參與人1隨機(jī)化概率的反應(yīng)函數(shù)。則
在博弈中,參與人的嚴(yán)格優(yōu)勢(shì)策略是使得參與人選取該策略所獲收益嚴(yán)格大于選取其他策略所獲收益。在2×2矩陣博弈中,嚴(yán)格優(yōu)勢(shì)策略具有如下特征:
對(duì)參與人1而言,策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng);策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng)。
對(duì)參與人2而言,策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng);策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng)。
由于均衡是每個(gè)參與人對(duì)其對(duì)手策略選擇的最優(yōu)反應(yīng),則在2×2矩陣博弈中,純策略均衡具有如下特征:
是均衡當(dāng)且僅當(dāng)且;是均衡當(dāng)且僅當(dāng)且;是均衡當(dāng)且僅當(dāng)且;是均衡當(dāng)且僅當(dāng)且。
定理 在2×2矩陣博弈中,如果不存在嚴(yán)格優(yōu)勢(shì)策略,且存在唯一的均衡,則此均衡必為混合策略均衡。
證明 (反證法)假設(shè)此博弈中唯一的均衡是純策略組合,設(shè)為,不失一般性,取,對(duì)策略組合,和可類似地討論。由于是均衡當(dāng)且僅當(dāng)且。對(duì)此分情況進(jìn)行討論。
(1)且。由于對(duì)參與人1而言,策略不嚴(yán)格優(yōu)于策略,則,于是;對(duì)參與人2而言,策略不嚴(yán)格優(yōu)于策略,則。于是策略組合是博弈中的一個(gè)均衡,這與是唯一的均衡矛盾。
(2)且。此時(shí),則,于是存在使得,即,從而令參與人1選取策略的概率為,可見混合策略組合是博弈的一個(gè)均衡,其中表示參與人1以概率選取策略,以概率選取策略,表示參與人2選取策略。這與是唯一的均衡矛盾。
(3)且。此時(shí),則,于是存在使得,即,從而令參與人2選取策略的概率為,可見混合策略組合是博弈的一個(gè)均衡,其中表示參與人1選取策略,表示參與人2以概率選取策略,以概率選取策略。這與是唯一的均衡矛盾。
(4)且。此時(shí)若策略組合不是均衡,則;若策略組合不是均衡,則。這樣策略組合是博弈的一個(gè)均衡,與是唯一的均衡矛盾。
綜上可知,策略組合不是此博弈的均衡,從而此2×2矩陣博弈的均衡必為混合策略組合。
參考文獻(xiàn):
[1]車競(jìng),錢煒祺,和爭(zhēng)春.基于矩陣博弈的兩機(jī)攻防對(duì)抗空戰(zhàn)仿真[J].飛行力學(xué),2015,33(2): 173-177.
[2]馬國(guó)勇,石春生.基于博弈矩陣模型的企業(yè)研發(fā)策略[J].統(tǒng)計(jì)與決策,2012,1: 54-55.
[3]R.Gibbons.A Primer in Game Theory[M].Prentice Hall,1994.
[4]D.Fudenberg,J.Tirole.Game Theory[M].MIT Press,1991.
[5]張維迎.博弈與社會(huì)[M].北京大學(xué)出版社,2013.
作者簡(jiǎn)介:
史艷維(1980- ), 女, 陜西西安人, 講師, 主要從事博弈論與應(yīng)用非標(biāo)準(zhǔn)分析方向的研究。