国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于連續(xù)混合策略對(duì)長(zhǎng)期蜈蚣博弈的分析①

2017-07-19 10:39韓庭軒
科技資訊 2017年18期

韓庭軒

摘 要:蜈蚣博弈給逆向歸納法帶來(lái)巨大沖擊,因?yàn)閰⑴c人在整體環(huán)節(jié)的最優(yōu)選擇,而非每一子環(huán)節(jié)最優(yōu)選擇的集合。該文從理論角度出發(fā),基于理性人假設(shè),利用連續(xù)混合策略,通過(guò)正向順序計(jì)算收益期望,對(duì)長(zhǎng)期蜈蚣博弈進(jìn)行分析,并對(duì)其中的可能情況進(jìn)行解釋。

關(guān)鍵詞:蜈蚣博弈 逆向歸納法 理性人假設(shè) 混合策略

中圖分類號(hào):F32 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2017)06(c)-0214-02

蜈蚣博弈于1981年由Rosenthal提出。博弈中有兩個(gè)參與人,策略包括“合作”與“終止”。博弈雙方分先手與后手,輪流進(jìn)行決策,當(dāng)一方選擇“終止”時(shí),博弈即停止,否則雙方將持續(xù)合作直到最終環(huán)節(jié)。博弈的總收益會(huì)隨著過(guò)程的持續(xù)而不斷增大,但是每一參與者在自己本回合選擇“終止”時(shí)的自身收益,要小于對(duì)方在下一回合選擇“終止”時(shí)自己的收益。根據(jù)持續(xù)的回合數(shù),蜈蚣博弈可以被分為短期蜈蚣博弈、長(zhǎng)期蜈蚣博弈和無(wú)限期蜈蚣博弈。

在“蜈蚣博弈”出現(xiàn)之前,逆向歸納法一直是博弈論中的一個(gè)重要分析方法。逆向歸納法有兩個(gè)基本假設(shè):一是理性人假設(shè),博弈的參與者都是理性的,會(huì)做出使自己收益最大的決策;二是共同知識(shí),博弈方對(duì)其他人行為的判斷都是正確的,并且相互知道其他人了解自己的判斷。“蜈蚣博弈悖論”是關(guān)于逆向歸納法的一個(gè)重要悖論。根據(jù)逆向歸納法的推理,由于雙方在每個(gè)環(huán)節(jié)都會(huì)選擇讓自己利益最大化的選擇,最終導(dǎo)致先手方拒絕合作,但這與實(shí)際中的選擇明顯不符。

1 文獻(xiàn)綜述

理論探究方面,孫洪罡等[1]基于風(fēng)險(xiǎn)偏好分析參與者的支付滿意率。潘天群[2]在逆向歸納法的內(nèi)涵中加入交流理性的概念。何偉等[3]著眼于預(yù)期心理,認(rèn)為參與者一旦在主動(dòng)選擇時(shí)能獲得與被動(dòng)選擇最大利益相同的收益,就會(huì)產(chǎn)生終止的動(dòng)機(jī)。方志耕等[4]將“灰數(shù)規(guī)整”與順推歸納法結(jié)合,通過(guò)計(jì)算期望值探究博弈終止時(shí)的納什均衡。胡曉娟[5]等利用“顫抖手”方法,詳細(xì)論證選擇波動(dòng)時(shí),參與人合作的條件。

在實(shí)踐中,McKelvey和Palfrey[6]讓參與者分別在四階段低收益蜈蚣博弈、四階段高收益蜈蚣博弈和六階段蜈蚣博弈中做出選擇,發(fā)現(xiàn)參與者很少選擇第一輪終止,更多選擇倒數(shù)第二、三輪終止。

2 基于連續(xù)混合策略對(duì)長(zhǎng)期蜈蚣博弈的分析

2.1 模型構(gòu)架

博弈在時(shí)刻t1開(kāi)始,在時(shí)刻t100結(jié)束,時(shí)刻用tn表示(1≤n≤100)。參與人1在時(shí)刻t1開(kāi)始做選擇,之后雙方輪流做選擇。參與人1、2都做完一次決策記為一輪,輪次用i表示(1≤i≤50)。若博弈持續(xù)進(jìn)行,達(dá)到最終時(shí)刻t100,且選擇人仍選擇C,則雙方收益都為51。若在tn時(shí),某一參與人選擇策略S,則其得到的收益為W(1,n),對(duì)方收益為W(2,n)。

蜈蚣博弈模型如圖1所示。

在蜈蚣博弈中,會(huì)存在下列假設(shè),以保證各子博弈中,參與者在進(jìn)行純策略選擇時(shí),總會(huì)選擇S。

2.2 連續(xù)混合策略的應(yīng)用

我們基于理性人假設(shè)和共同知識(shí),采用混合策略的方法分析問(wèn)題。為便于計(jì)算,我們按照輪次對(duì)參與人的選擇概率及收益期望進(jìn)行研究,并作出以下假設(shè)。

假設(shè)2:參與人1、2在第i輪做選擇時(shí),合作的概率分別為、。在tn時(shí)刻,參與人1、2的收益期望分別為E(1,n)、E(2,n)。收益期望函數(shù)如下:

在混合策略中,若要參與人選擇合作,則需其合作的預(yù)期收益不小于終止的預(yù)期收益,并且其下次決策時(shí)的收益期望不小于本次決策時(shí)的收益期望。以參與人1為例,若其選擇合作,需滿足以下條件:

根據(jù)以上分析結(jié)果,我們可以得到如下推論。

推論1:作為理性經(jīng)濟(jì)人,參與人雙方為了使自身在整個(gè)系統(tǒng)內(nèi)獲得最大利益,不僅需要在每個(gè)子環(huán)節(jié)考慮到預(yù)期收益,同時(shí)還要預(yù)測(cè)到對(duì)方合作的可能性。

逆向歸納法只考慮收益層面,忽略決策概率,并且獨(dú)立分析各子環(huán)節(jié),未充分考慮各環(huán)節(jié)間的聯(lián)系,僅單純認(rèn)為整體的最優(yōu)選擇是各子環(huán)節(jié)最優(yōu)選擇的集合。

推論2:當(dāng)一方認(rèn)為另一方在下一輪行動(dòng)中更具有合作傾向時(shí),他在本輪就會(huì)合作;否則則會(huì)停止。

另需說(shuō)明,當(dāng)達(dá)到合作概率臨界值時(shí),決策人會(huì)概率性地停止合作。這一臨界值又和下一輪的收益期望相關(guān),即收益期望與合作期望是相互影響的。

依據(jù)以上闡釋理論,我們可以進(jìn)一步得到如下推論。

推論3:雙方的共同合作,是基于共同知識(shí)下對(duì)對(duì)方的信任;而雙方停止合作,是因?yàn)闆Q策方認(rèn)為對(duì)方在下一輪的合作概率將等于或低于臨界值,即個(gè)人行為受對(duì)客體主觀判斷的影響。

推論4:在達(dá)到臨界值之前,博弈一方愿意在自己決策的tn時(shí)合作,那么他在之前都會(huì)合作,這是基于他對(duì)對(duì)方的信任;在臨界值之后,博弈一方在自己決策的tn時(shí)終止,那么他在之后都會(huì)選擇終止,這是基于他認(rèn)為對(duì)方會(huì)選擇終止。

推論5:個(gè)人的收益期望與對(duì)方合作期望是相互影響的,而逆向歸納法在逆向分析對(duì)方合作期望時(shí)更有實(shí)際意義。

雙方的合作期望在整體上會(huì)呈現(xiàn)遞減的趨勢(shì),在博弈后期,提升空間有限,決策方會(huì)選擇終止攫取最后的利益,這一方式尤其體現(xiàn)于最后四期。

3 結(jié)語(yǔ)

根據(jù)理性人假設(shè),參與人應(yīng)追求個(gè)人在博弈整體的最大利益,而非各子系統(tǒng)最優(yōu)方案的集合;根據(jù)收益情況,繼續(xù)博弈的潛在收益要大于過(guò)早結(jié)束的風(fēng)險(xiǎn);根據(jù)共同知識(shí),雙方在知道對(duì)方愿意合作的前提下,在一定期間內(nèi)會(huì)形成穩(wěn)定的合作關(guān)系。因此,筆者提出,利用連續(xù)混合策略,正向順序計(jì)算收益期望,進(jìn)而分析參與者選擇合作或終止的影響因素。該方法從整體角度對(duì)博弈系統(tǒng)進(jìn)行剖析,將合作意愿這一與收益期望相互影響的要素獨(dú)立分析,重新解讀了動(dòng)態(tài)博弈中對(duì)理性人假設(shè)的認(rèn)識(shí),較好地解釋了蜈蚣博弈悖論。

參考文獻(xiàn)

[1] 孫洪罡,劉亞相,王麗波.支付滿意率——對(duì)博弈論理性假設(shè)的新思考[J].青島大學(xué)學(xué)報(bào):自然科學(xué)版,2004(9):78-80.

[2] 潘天群.交流理性與逆向歸納法悖論的消解[J].自然辯證法研究,2005(12):25-28.

[3] 何偉,徐飛,陳潔.蜈蚣博弈新視角——預(yù)期心理的應(yīng)用[J].上海管理科學(xué),2006(3):1-5.

[4] 方志耕,劉思峰,施紅星,等.破解“蜈蚣博弈”悖論:“灰數(shù)規(guī)整”順推歸納法研究[J].中國(guó)管理科學(xué),2008(2):180-186.

[5] 胡曉娟,秦承忠,Perry Shapiro.“顫抖”蜈蚣博弈[J].產(chǎn)業(yè)經(jīng)濟(jì)評(píng)論,2011(6):29-39.

[6] McKelvey,Palfrey.An Experimental Study of the Centipede Game[J].Econometrica,1992,60(4):803-836.