国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

2×2矩陣博弈中的混合策略均衡

2017-01-19 13:27:36史艷維
關(guān)鍵詞:均衡

摘要:本文分析了2×2矩陣博弈中的混合策略均衡,討論了此類博弈的嚴(yán)格優(yōu)勢(shì)策略和純策略均衡,得到了在沒有嚴(yán)格優(yōu)勢(shì)策略且存在唯一均衡的2×2矩陣博弈中,均衡必為混合策略均衡。

關(guān)鍵詞:矩陣博弈; 嚴(yán)格優(yōu)勢(shì)策略; 均衡

博弈論是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論主要研究公式化了的激勵(lì)結(jié)構(gòu)間的相互作用。如今,博弈論在金融學(xué)、證券學(xué)、生物學(xué)、經(jīng)濟(jì)學(xué)、國(guó)際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。

均衡是博弈論一個(gè)重要研究對(duì)象。均衡是一種策略組合,使得同一時(shí)間內(nèi)每個(gè)參與人的策略是對(duì)其他參與人策略的最優(yōu)反應(yīng)。1951年納什提出著名的納什定理,即在矩陣博弈中一定存在均衡。這里的均衡可能是純策略均衡,也可能是混合策略均衡。

2×2矩陣博弈是一類最基本且被廣泛應(yīng)用的重要博弈類型,它是指在博弈過程中只有兩個(gè)參與人(參與人1和參與人2),且每個(gè)參與人只有兩個(gè)可選策略。經(jīng)典博弈諸如囚徒困境、性別戰(zhàn)爭(zhēng)、古諾雙寡頭壟斷、貝特蘭德雙寡頭壟斷等博弈都可以歸為此類博弈。

本文分析了2×2矩陣博弈中的混合策略均衡,討論了此類博弈的嚴(yán)格優(yōu)勢(shì)策略和純策略均衡,得到了在沒有嚴(yán)格優(yōu)勢(shì)策略且存在唯一均衡的2×2矩陣博弈中,均衡必為混合策略均衡。

考慮2×2矩陣博弈。對(duì)于參與人1和參與人2,參與人1的可選策略為U和D,參與人2的可選策略為L(zhǎng)和R。他們的收益情況如下:

(1)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和;

(2)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和;

(3)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和;

(4)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和。

我們可以用如下的矩陣表示:

其中第一列表示參與人1的可選策略,第一行表示參與人2的可選策略,收益中前者為參與人1的收益,后者為參與人2的收益。

設(shè)參與人1選取策略的概率為,參與人2選取策略的概率為。這樣,參與人1選取策略的概率為,參與人2選取策略的概率為。

可見,對(duì)參與人1而言,選取策略的期望收益為,選取策略的期望收益為,于是參與人1選取策略和策略無差異當(dāng)且僅當(dāng)。令表示參與人1對(duì)參與人2隨機(jī)化概率的反應(yīng)函數(shù)。則

類似地,對(duì)參與人2而言,選取策略的期望收益為,選取策略的期望收益為,于是參與人2選取策略和策略無差異當(dāng)且僅當(dāng)。令表示參與人2對(duì)參與人1隨機(jī)化概率的反應(yīng)函數(shù)。則

在博弈中,參與人的嚴(yán)格優(yōu)勢(shì)策略是使得參與人選取該策略所獲收益嚴(yán)格大于選取其他策略所獲收益。在2×2矩陣博弈中,嚴(yán)格優(yōu)勢(shì)策略具有如下特征:

對(duì)參與人1而言,策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng);策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng)。

對(duì)參與人2而言,策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng);策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng)。

由于均衡是每個(gè)參與人對(duì)其對(duì)手策略選擇的最優(yōu)反應(yīng),則在2×2矩陣博弈中,純策略均衡具有如下特征:

是均衡當(dāng)且僅當(dāng)且;是均衡當(dāng)且僅當(dāng)且;是均衡當(dāng)且僅當(dāng)且;是均衡當(dāng)且僅當(dāng)且。

定理 在2×2矩陣博弈中,如果不存在嚴(yán)格優(yōu)勢(shì)策略,且存在唯一的均衡,則此均衡必為混合策略均衡。

證明 (反證法)假設(shè)此博弈中唯一的均衡是純策略組合,設(shè)為,不失一般性,取,對(duì)策略組合,和可類似地討論。由于是均衡當(dāng)且僅當(dāng)且。對(duì)此分情況進(jìn)行討論。

(1)且。由于對(duì)參與人1而言,策略不嚴(yán)格優(yōu)于策略,則,于是;對(duì)參與人2而言,策略不嚴(yán)格優(yōu)于策略,則。于是策略組合是博弈中的一個(gè)均衡,這與是唯一的均衡矛盾。

(2)且。此時(shí),則,于是存在使得,即,從而令參與人1選取策略的概率為,可見混合策略組合是博弈的一個(gè)均衡,其中表示參與人1以概率選取策略,以概率選取策略,表示參與人2選取策略。這與是唯一的均衡矛盾。

(3)且。此時(shí),則,于是存在使得,即,從而令參與人2選取策略的概率為,可見混合策略組合是博弈的一個(gè)均衡,其中表示參與人1選取策略,表示參與人2以概率選取策略,以概率選取策略。這與是唯一的均衡矛盾。

(4)且。此時(shí)若策略組合不是均衡,則;若策略組合不是均衡,則。這樣策略組合是博弈的一個(gè)均衡,與是唯一的均衡矛盾。

綜上可知,策略組合不是此博弈的均衡,從而此2×2矩陣博弈的均衡必為混合策略組合。

參考文獻(xiàn):

[1]車競(jìng),錢煒祺,和爭(zhēng)春.基于矩陣博弈的兩機(jī)攻防對(duì)抗空戰(zhàn)仿真[J].飛行力學(xué),2015,33(2): 173-177.

[2]馬國(guó)勇,石春生.基于博弈矩陣模型的企業(yè)研發(fā)策略[J].統(tǒng)計(jì)與決策,2012,1: 54-55.

[3]R.Gibbons.A Primer in Game Theory[M].Prentice Hall,1994.

[4]D.Fudenberg,J.Tirole.Game Theory[M].MIT Press,1991.

[5]張維迎.博弈與社會(huì)[M].北京大學(xué)出版社,2013.

作者簡(jiǎn)介:

史艷維(1980- ), 女, 陜西西安人, 講師, 主要從事博弈論與應(yīng)用非標(biāo)準(zhǔn)分析方向的研究。

猜你喜歡
均衡
少數(shù)民族習(xí)慣法與國(guó)家法的均衡路徑探析
淺析國(guó)外基礎(chǔ)教育均衡發(fā)展對(duì)我國(guó)創(chuàng)新型人才培養(yǎng)的啟示
東方教育(2016年9期)2017-01-17 21:22:13
淺析靜物在安格爾繪畫中的作用
新古典主義建筑的形式法則
淺析均衡與非均衡的證券市場(chǎng)
高中與高考離“均衡”還有多遠(yuǎn)?
教育(2016年41期)2016-11-15 19:25:44
高校體育專業(yè)學(xué)生膳食營(yíng)養(yǎng)合理性分析
學(xué)生各科學(xué)習(xí)成績(jī)指標(biāo)的模糊識(shí)別
經(jīng)濟(jì)因素視角下延遲退休最優(yōu)年限實(shí)證研究
基于服務(wù)主導(dǎo)邏輯的顧客購(gòu)買意愿分析
绵阳市| 内乡县| 饶阳县| 建平县| 巴彦淖尔市| 洪江市| 鄄城县| 河北省| 桐梓县| 连云港市| 堆龙德庆县| 来凤县| 包头市| 桑日县| 吴桥县| 石城县| 武城县| 古浪县| 包头市| 佳木斯市| 绥阳县| 福泉市| 白朗县| 宁津县| 睢宁县| 泊头市| 会理县| 博爱县| 镇江市| 高雄县| 林芝县| 依安县| 黄平县| 翼城县| 思茅市| 平陆县| 简阳市| 汉沽区| 图们市| 乳山市| 会东县|