龔智強 +謝政 +戴麗
摘 要 研究了三方相互威懾討價還價問題,從合作博弈的角度建立了三方相互威懾討價還價模型.并且通過對均衡存在性和沖突可能性的分析,給出了三方相互威懾問題沖突發(fā)生的條件以及存在均衡狀態(tài)時的均衡解.最后通過實驗驗證了本文分析的正確性.
關(guān)鍵詞 博弈論;折損因子;討價還價;相互威懾;Nash均衡
中圖分類號 O225 文獻(xiàn)標(biāo)識碼 A
A Bargaining Model of Mutual Deterrence
Between Three Players
GONG Zhiqiang,XIE Zheng,DAI Li
(College of Science, National University of Defense Technology, Changsha, Hunan 410073, China)
Abstract In this paper we study the problem of mutual deterrence and build a bargaining model of mutual deterrence between three players through cooperation game and the bargaining model built by Rubinstein. And through the analysis of the credibility of deterrence and the probability of conflict, the conditions which cause the occurrence of the conflict between the players and the equilibrium of the problem if it exists have been given in the paper. Finally, the validity of the analysis is verified by experiment.
Key words game theory; discount factor ; bargaining; mutual deterrence; Nash equilibrium
1 引 言
威懾是指一方采取有效方式影響對方?jīng)Q策,并期望借此影響對方對自身行為預(yù)期判斷的行為模式.在相互威懾問題中每個局中人既能通過威懾影響其他局中人的決策,又受到其他局中人威懾的影響.已有的研究一般是雙方相互威懾的情形,例如冷戰(zhàn)時期的美蘇核威懾以及延續(xù)至今的印巴核威懾.然而隨著國際形勢的日趨復(fù)雜,三方威懾問題逐漸增多.在克里米亞事件中,沖突實際上最終演變?yōu)槎碇忻廊齻€大國之間的博弈,而在該博弈中,美俄都傾向與同中國達(dá)到一致以便對另一方施壓,中國究竟選擇何種策略以便獲取更大的利益.而在中日釣魚島事件中,牽扯到中國、美國和日本,美國是選擇和日本同盟還是選擇和中國保持一致,而中國又會選擇什么策略.本文將給出一種解決上述三方?jīng)_突問題的方法.因此研究三方相互威懾問題對解決這些區(qū)域性沖突有著重要的實用價值.
早在20世紀(jì)60年代, Thomas Schelling將威懾視為一個討價還價過程,并把相互威懾討價還價能力定義為一種能夠?qū)Ψ皆斐蓚Φ哪芰1].雙方討價還價模型較為簡單,Rubinstein對此提出了雙方無限期討價還價模型[3].而在三方相互威懾討價還價問題中,每個局中人都需要考慮另外兩個局中人威懾的影響,如何處理這兩者之間的關(guān)系將是模型建立的難點.Arsenyan等對于討價還價中合作發(fā)生的條件進(jìn)行了系統(tǒng)分析[8].Kalandrakis討論了多數(shù)同意的三方討價還價模型并提出了馬爾可夫精煉Nash均衡[9].Calvó-Armengol 從非合作博弈的角度建立了三個局中人地位非對稱的三方討價還價模型[10].
經(jīng) 濟 數(shù) 學(xué)第 32卷第2期
龔智強等:三方相互威懾討價還價模型
不同于以往的模型,本文將從合作博弈的角度建立各個局中人地位對稱的三方相互威懾討價還價模型.在本文中,合作博弈是指為了獲取更大的利益,其中兩個局中人會形成同盟,即成為一個利益集團(tuán),兩個局中人的威懾疊加對其他局中人的決策產(chǎn)生影響.首先,本文進(jìn)行了一些準(zhǔn)備工作并且建立了三方相互威懾討價還價模型;然后,分析了三方討價還價模型均衡的存在性和沖突發(fā)生的可能性并對均衡進(jìn)行了分析;最后,通過仿真算例說明本文建立的三方相互威懾討價還價模型,并總結(jié)全文并提出了有待進(jìn)一步研究的問題.
2 模型建立
2.1 均衡與分配
局中人是指博弈的參與者.本文的博弈是各個局中人針對某個固定利益的分配,不失一般性我們假定為單位利益的分配.
分配是指各個局中人得到的利益的份額,其中各個分量依次指各局中人的份額,用v表示.均衡是指利益的分配得到了所有局中人一致同意,即每個局中人都不會從拒絕該分配得到更大的利益.
合作博弈是指局中人為了取得更大的利益,以同盟、合作的方式進(jìn)行博弈,使博弈變?yōu)椴煌婕瘓F(tuán)之間的對抗.假定各個局中人都是理性的,即每個局中人都追求自身利益的最大化.
2.2 折損因子的定義
威懾能力是對其他局中人造成傷害的能力,而受懾能力是抵抗其他局中人威懾的能力.折損因子指因為對方的威懾對己方分配造成的損失的系數(shù).威懾能力越大對其他局中人造成傷害的能力越強,即其他局中人的折損因子越?。皇軕啬芰υ酱?,抵抗其他局中人威懾的能力的越強,即己方的折損因子越大.用δab是由于局中人甲的威懾,使局中人乙產(chǎn)生的折損因子;δab,c是由于局中人甲和局中人乙的同盟作為整體對局中人丙的威懾,使局中人丙產(chǎn)生的折損因子.顯然折損因子是介于0和1之間的數(shù).
下面給出折損因子的量化計算公式.
定義1 在雙方相互威懾討價還價模型中折損因子計算公式如下:
折損因子=己方受攝能力己方受攝能力+對方威懾能力.
通過上述的量化,將沖突中的威懾轉(zhuǎn)化為對對方的傷害能力,進(jìn)而通過博弈論建立相應(yīng)的討價還價模型.
本文研究完全信息下的討價還價模型,即已知各個局中人之間的折損因子.
2.3 無限期Rubinstein討價還價模型
設(shè)兩個局中人甲和乙通過輪流出價方式分配一項單位利益.
在第一階段,局中人甲選擇v1,即甲欲占有的利益份額.局中人乙如接受v1,則產(chǎn)生分配(v1,1-v1);否則進(jìn)入下一階段.
第二階段,局中人乙選擇v2,即甲占有的利益份額.局中人甲若接受v2,則產(chǎn)生分配(δbav2,δab(1-v2)).如果仍未達(dá)到均衡,繼續(xù)如上輪流出價.
在輪流出價的討價還價模型中,當(dāng)局中人事先不能確定期限時,就可按無限期的討價還價問題處理.Rubinstein在1982年提出如下的無限期討價還價模型.
引理1 在無限期輪流出價條件下的討價還價博弈中,唯一的子博弈精煉Nash均衡是甲在1,3,5,7,…階段出價[11]
v*a=1-δab1-δbaδab,
乙在2,4,6,8,…階段出價
v*b=δba(1-δab)1-δbaδab,
此處v*a是甲索取的均衡利益份額,v*b是乙索取的均衡利益份額.
2.4 三方相互威懾討價還價模型
考慮三方相互威懾討價還價問題.因為三個局中人都是理性的局中人,故在討價還價過程中各個局中人為了得到更高的利益往往會自發(fā)選擇暫時的“同盟”.這是因為形成同盟后會使得對于其他局中人的威懾能力更強,進(jìn)而使得其他局中人的折損因子更小,即其他局中人得到的分配減少從而使得同盟總的分配增加,即同盟的利益增加.
假定局中人甲先出價,局中人乙隨后出價,然后局中人丙出價,再輪到局中人甲出價,如上類似Rubinstein模型進(jìn)行輪流出價,直到達(dá)到均衡.
各個局中人之間的威懾模型如圖1所示.
圖1 三方相互威懾模型圖
如圖1所示,每個局中人既對其他兩個局中人產(chǎn)生威懾,又分別受到其他兩個局中人威懾的影響.因為在三方討價還價中為了得到更大利益,每個局中人都會尋求同盟.本文建立如下的三方相互威懾討價還價模型:首先某兩個局中人為了共同利益形成同盟,同另一個局中人分配利益,然后同盟的兩個局中人之間再分配利益.若某個同盟能夠形成,則該同盟首先作為一個整體對其他局中人進(jìn)行威懾以獲取更大的利益.例如,如果在三方討價還價中乙丙自發(fā)的形成同盟,則乙丙同盟首先作為一個整體同甲討價還價,然后乙、丙對同盟得到的份額進(jìn)行分配.
乙丙同盟對甲的折損因子如下.
定理1 乙丙同盟對局中人甲的折損因子
δbc,a=δcaδbaδca+δba-δbaδca;
局中人甲對乙丙同盟的折損因子
δa,bc=δac+δab-2δabδac1-δabδac.
證明 假定甲、乙、丙的威懾能力分別為xa,xb,xc,受懾能力分別為x′a,x′b,x′c,則
x′ax′a+xc=δca, x′ax′a+xb=δba.(1)
由式(1)可得
xc=(1δca-1)x′a,xb=(1δba-1)x′a.
由定義1知,乙丙同盟對甲的折損因子為
δbc,a=x′ax′a+xc+xb
=x′ax′a+(1δca-1)x′a+(1δba-1)x′a
=δcaδbaδca+δba-δbaδca.
同理得到甲對乙丙同盟的折損因子δa,bc=δac+δab-2δabδac1-δabδac.證畢.
同理,可以求得甲丙同盟或甲乙同盟時相應(yīng)的折損因子.
由上述方法計算的同盟同另外局中人折損因子的方法,滿足同盟對其他局中人的折損因子小于同盟中單個局中人對其的折損因子.故建立的折損因子模型是有效的.
3 均衡的存在性和沖突分析
第2節(jié)建立了三方討價還價模型,本節(jié)將對三方討價還價博弈均衡的存在性和沖突發(fā)生的可能性進(jìn)行分析,首先給出一個引理.
引理2 假定在三方討價還價模型中,乙、丙已經(jīng)同盟,則會產(chǎn)生分配:
v*1a=1-δa,bc1-δa,bcδbc,a ,
v*1b=(1-δbc)(δa,bc-δa,bcδbc,a)(1-δbcδcb)(1-δa,bcδbc,a),
v*1c=(δbc-δbcδcb)(δa,bc-δa,bcδbc,a)(1-δbcδcb)(1-δa,bcδbc,a).
其中δa,bc和δbc,a見定理1,v*1av*1bv*1c分別是在乙丙同盟下各個局中人的分配份額.
證明 由定理1知
δbc,a=δcaδbaδca+δba-δbaδca,
δa,bc=δac+δab-2δabδac1-δabδac.
將乙丙同盟視為一個局中人與甲采用Rubinstein式討價還價可以得到分配方案:
(v*1a,1-v*1a),其中v*1a=1-δa,bc1-δa,bcδbc,a.
然后考慮局中人乙和丙的分配,對乙、丙按照Rubinstein式討價還價得到如下分配方案:
(z1(1-v*1a),(1-z1)(1-v*1a)),
其中z1=1-δbc1-δbcδcb.
即甲得到v*1a=1-δa,bc1-δa,bcδbc,a,局中人乙得到v*1b=z1*(1-x),局中人丙得到v*1c=(1-z1)*(1-x).證畢.
從引理2,可以得到三方討價還價博弈中乙丙同盟時三方的分配.同理,可以得到甲丙同盟時三方的分配,分別記為v*2a,v*2b,v*2c;甲乙同盟時三方的分配,記為v*3a,v*3b,v*3c.
在三方討價還價模型中,理性的局中人會選擇與得到的分配份額更多的局中人同盟.為此,給出偏向函數(shù)的概念.
定義2 定義偏向函數(shù)
f1(δab,δba,δac,δca,δbc,δcb)=v*3av*2a,
f2(δab,δba,δac,δca,δbc,δcb)=v*3bv*1b,
f3(δab,δba,δac,δca,δbc,δcb)=v*1cv*2c.
其中v*1av*1bv*1c,v*2av*2bv*2c,v*3av*3bv*3c分別是不同同盟下各個局中人的分配份額.
顯然f1決定局中人甲的同盟關(guān)系的選擇;f2決定局中人乙的同盟關(guān)系的選擇;f3決定局中人丙的同盟關(guān)系的選擇.
有了上述引理的準(zhǔn)備,下面我們給出三方討價還價模型均衡的存在性定理.
定理2 上述三方討價還價模型中,當(dāng)f1>1且f2>1時,在討價還價過程中局中人甲和局中人乙會形成同盟;當(dāng)f2<1且f3>1時,乙和丙會形成同盟;當(dāng)f1<1且f3<1時,甲和丙會形成同盟.出現(xiàn)上述三種情況時在三方討價還價博弈中各個局中人能達(dá)到均衡狀態(tài),此時不會發(fā)生沖突.其中各個局中人的分配如上述引理所述.
證明 當(dāng)f1>1且f2>1時.
v*3a>v*2a, v*3b>v*1b.
因為各個局中人都追求自身利益的最大化,所以局中人甲和乙都會選擇與對方合作.局中人丙如果拒絕該分配,則隨著討價還價的進(jìn)行因為折損因子的存在使得局中人丙得到的份額更少,因此,局中人甲和乙同盟得到的分配方案是三方討價還價的均衡分配.
同理當(dāng)f2<1且f3>1時,乙和丙會形成同盟,該分配方案是三方討價還價的均衡分配;當(dāng)f1<1且f3<1時,甲和丙會形成同盟,該分配方案是三方討價還價的均衡分配.證畢.
定理2給出了三方相互威懾討價還價博弈均衡出現(xiàn)的條件以及均衡出現(xiàn)時的分配.如果博弈出現(xiàn)定理2中的三種情況,理性的局中人之間會自發(fā)的形成同盟從而達(dá)到均衡狀態(tài),沖突不會發(fā)生;反之,如果未出現(xiàn)上述三種情況,因為各個局中人之間無法提出讓每個局中人都能接受的方案,此時會發(fā)生沖突.
4 均衡分析
由第3節(jié)可知在三方討價還價模型中,f1決定局中人甲的同盟關(guān)系的選擇;f2決定乙的同盟關(guān)系的選擇;f3決定丙的同盟關(guān)系的選擇.下面考慮偏向函數(shù)與各個局中人之間折損因子的關(guān)系,亦即考慮威懾能力的強弱對于同盟關(guān)系選擇的影響.
定理3給出了各個局中人之間折損因子對局中人甲同盟關(guān)系選擇的影響.
);若甲、丙合作則分配方案為(0.610 7, 0.363 2, 0.026 2);若甲、乙合作則分配方案為(0.493 2, 0.493 2, 0.013 6).由定理2可知在三方威懾討價還價中乙、丙會合作.即在兩強一弱的三方博弈中弱國偏向與兩強中更強者合作.
6 結(jié) 論
本文首先針對三方相互威懾問題建立了折損因子與威懾、受懾能力之間關(guān)系的有效模型.繼而根據(jù)不同局中人之間形成同盟的條件給出了在三方討價還價模型中均衡存在的條件,以及沖突發(fā)生的條件.最后通過對偏向函數(shù)的分析,給出了折損因子對于三方討價還價模型中同盟關(guān)系選擇的影響.
本文對于不完全信息的三方相互威懾問題、離散的討價還價問題尚未建立有效的模型.同時對于多人的相互威懾討價還價模型本文也沒有做相應(yīng)研究.這是值得進(jìn)一步研究的內(nèi)容.
參考文獻(xiàn)
[1] SCHELLING. Arms and influence[M]. New Haven: Yale University Press, 1966:120-123.
[2] J F NASH. The bargaining problem[J]. Econometrica, 1950,18(1): 155-162.
[3] A RUBINSTEIN. Perfect equilibrium in a bargaining model[J]. Econometrica, 1982,50(1): 97-109.
[4] A KALANDRAKIS. A threeplayer dynamic majoritarian bargaining game[J]. Journal of Economic Theory, 2004, 116(2): 294-322.
[5] D ABREU, D PEARCE. Bargaining, reputation, and equilibrium selection in re-peated games with contracts[J]. Econometrica, 2007, 75(3): 653-710.
[6] W GTH, H G SEIFERT. Equilibrium selection for bargaining games with unb-iased threats[J]. Methods of Operations Research, 1984, 51(1):315-346.
[7] J LIU,X LIU. Fuzzy extensions of bargaining sets and their existence in c-ooperative fuzzy games[J]. Fuzzy sets and systems, 2012, 188(1): 88-101.
[8] J ARSENYAN, G BYKZKAN, L O FEYZIO. Modeling collaboration formation with a game theory approach[J]. Expert Systems with Applications, 2015, 42(4): 2073-2085.
[9] A KALANDRAKIS. A threeplayer dynamic majoritarian bargaining game[J]. Journal of Economic Theory, 2004, 116(2): 294-322.
[10]A A CALV. A note on threeplayer noncooperative bargaining with restricted pairwise meetings[J]. Economics Letters, 1999, 65(1): 47-54.
[11]于維生. 博弈論與經(jīng)濟[M]. 北京:高等教育出版社, 2007,115-127.
[12]謝政. 對策論導(dǎo)論[M]. 北京:科學(xué)出版社, 2010.