2×2矩陣博弈中的混合策略均衡

2017-01-19 13:27:36史艷維

現(xiàn)代營(yíng)銷·學(xué)苑版 2016年11期

關(guān)鍵詞：均衡

摘要：本文分析了2×2矩陣博弈中的混合策略均衡，討論了此類博弈的嚴(yán)格優(yōu)勢(shì)策略和純策略均衡，得到了在沒有嚴(yán)格優(yōu)勢(shì)策略且存在唯一均衡的2×2矩陣博弈中，均衡必為混合策略均衡。

關(guān)鍵詞：矩陣博弈；嚴(yán)格優(yōu)勢(shì)策略；均衡

博弈論是現(xiàn)代數(shù)學(xué)的一個(gè)新分支，也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論主要研究公式化了的激勵(lì)結(jié)構(gòu)間的相互作用。如今，博弈論在金融學(xué)、證券學(xué)、生物學(xué)、經(jīng)濟(jì)學(xué)、國(guó)際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。

均衡是博弈論一個(gè)重要研究對(duì)象。均衡是一種策略組合，使得同一時(shí)間內(nèi)每個(gè)參與人的策略是對(duì)其他參與人策略的最優(yōu)反應(yīng)。1951年納什提出著名的納什定理，即在矩陣博弈中一定存在均衡。這里的均衡可能是純策略均衡，也可能是混合策略均衡。

2×2矩陣博弈是一類最基本且被廣泛應(yīng)用的重要博弈類型，它是指在博弈過程中只有兩個(gè)參與人（參與人1和參與人2），且每個(gè)參與人只有兩個(gè)可選策略。經(jīng)典博弈諸如囚徒困境、性別戰(zhàn)爭(zhēng)、古諾雙寡頭壟斷、貝特蘭德雙寡頭壟斷等博弈都可以歸為此類博弈。

本文分析了2×2矩陣博弈中的混合策略均衡，討論了此類博弈的嚴(yán)格優(yōu)勢(shì)策略和純策略均衡，得到了在沒有嚴(yán)格優(yōu)勢(shì)策略且存在唯一均衡的2×2矩陣博弈中，均衡必為混合策略均衡。

考慮2×2矩陣博弈。對(duì)于參與人1和參與人2，參與人1的可選策略為U和D，參與人2的可選策略為L(zhǎng)和R。他們的收益情況如下：

（1）當(dāng)參與人1選擇策略且參與人2選則策略時(shí)，他們的收益分別為和；

（2）當(dāng)參與人1選擇策略且參與人2選則策略時(shí)，他們的收益分別為和；

（3）當(dāng)參與人1選擇策略且參與人2選則策略時(shí)，他們的收益分別為和；

（4）當(dāng)參與人1選擇策略且參與人2選則策略時(shí)，他們的收益分別為和。

我們可以用如下的矩陣表示：

其中第一列表示參與人1的可選策略，第一行表示參與人2的可選策略，收益中前者為參與人1的收益，后者為參與人2的收益。

設(shè)參與人1選取策略的概率為，參與人2選取策略的概率為。這樣，參與人1選取策略的概率為，參與人2選取策略的概率為。

可見，對(duì)參與人1而言，選取策略的期望收益為，選取策略的期望收益為，于是參與人1選取策略和策略無差異當(dāng)且僅當(dāng)。令表示參與人1對(duì)參與人2隨機(jī)化概率的反應(yīng)函數(shù)。則

類似地，對(duì)參與人2而言，選取策略的期望收益為，選取策略的期望收益為，于是參與人2選取策略和策略無差異當(dāng)且僅當(dāng)。令表示參與人2對(duì)參與人1隨機(jī)化概率的反應(yīng)函數(shù)。則

在博弈中，參與人的嚴(yán)格優(yōu)勢(shì)策略是使得參與人選取該策略所獲收益嚴(yán)格大于選取其他策略所獲收益。在2×2矩陣博弈中，嚴(yán)格優(yōu)勢(shì)策略具有如下特征：

對(duì)參與人1而言，策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng)；策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng)。

對(duì)參與人2而言，策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng)；策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng)。

由于均衡是每個(gè)參與人對(duì)其對(duì)手策略選擇的最優(yōu)反應(yīng)，則在2×2矩陣博弈中，純策略均衡具有如下特征：

是均衡當(dāng)且僅當(dāng)且；是均衡當(dāng)且僅當(dāng)且；是均衡當(dāng)且僅當(dāng)且；是均衡當(dāng)且僅當(dāng)且。

定理在2×2矩陣博弈中，如果不存在嚴(yán)格優(yōu)勢(shì)策略，且存在唯一的均衡，則此均衡必為混合策略均衡。

證明（反證法）假設(shè)此博弈中唯一的均衡是純策略組合，設(shè)為，不失一般性，取，對(duì)策略組合，和可類似地討論。由于是均衡當(dāng)且僅當(dāng)且。對(duì)此分情況進(jìn)行討論。

（1）且。由于對(duì)參與人1而言，策略不嚴(yán)格優(yōu)于策略，則，于是；對(duì)參與人2而言，策略不嚴(yán)格優(yōu)于策略，則。于是策略組合是博弈中的一個(gè)均衡，這與是唯一的均衡矛盾。

（2）且。此時(shí)，則，于是存在使得，即，從而令參與人1選取策略的概率為，可見混合策略組合是博弈的一個(gè)均衡，其中表示參與人1以概率選取策略，以概率選取策略，表示參與人2選取策略。這與是唯一的均衡矛盾。

（3）且。此時(shí)，則，于是存在使得，即，從而令參與人2選取策略的概率為，可見混合策略組合是博弈的一個(gè)均衡，其中表示參與人1選取策略，表示參與人2以概率選取策略，以概率選取策略。這與是唯一的均衡矛盾。

（4）且。此時(shí)若策略組合不是均衡，則；若策略組合不是均衡，則。這樣策略組合是博弈的一個(gè)均衡，與是唯一的均衡矛盾。

綜上可知，策略組合不是此博弈的均衡，從而此2×2矩陣博弈的均衡必為混合策略組合。

參考文獻(xiàn)：

[1]車競(jìng)，錢煒祺，和爭(zhēng)春.基于矩陣博弈的兩機(jī)攻防對(duì)抗空戰(zhàn)仿真[J].飛行力學(xué)，2015，33（2）： 173-177.

[2]馬國(guó)勇，石春生.基于博弈矩陣模型的企業(yè)研發(fā)策略[J].統(tǒng)計(jì)與決策，2012，1： 54-55.

[3]R.Gibbons.A Primer in Game Theory[M].Prentice Hall，1994.

[4]D.Fudenberg，J.Tirole.Game Theory[M].MIT Press，1991.

[5]張維迎.博弈與社會(huì)[M].北京大學(xué)出版社，2013.

作者簡(jiǎn)介：

史艷維（1980- ），女，陜西西安人，講師，主要從事博弈論與應(yīng)用非標(biāo)準(zhǔn)分析方向的研究。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

2×2矩陣博弈中的混合策略均衡