基于N維非合作博弈

2015-07-05 14:15:27盧豐周會紅

商 2015年27期

關(guān)鍵詞：大圓均衡點效用

盧豐周會紅

一、緒論

1.目的

本文從二維非合作博弈①出發(fā)，推廣至N維，人為地改變影響博弈的量，改變原博弈均衡②，使結(jié)果朝著有利于資源利用的方向變化，解決社會中存在的資源在眾人中合理分配問題。

二、理論基礎(chǔ)

1.n維非合作博弈均衡點存在性

由角谷靜夫定理可推斷有均衡點存在?；诮枪褥o夫不動點定理而對存在性定理給出的證明（發(fā)表在：Proc.Nat.Acad.Sci.U.S.A.pp.48-49），該方法直接由布勞維爾不動點定理得出。證明的是在n維空間里構(gòu)建一個連續(xù)變換的T，使得T的不動點就是博弈的均衡點。由于n維混合策略空間是一個胞腔，且由布勞維爾不動點定理可知映射T至少有一個不動點ε，該點一定是一個均衡點。③

三、乘車博弈

1.乘車問題

AB兩理性人住在兩個房間（信息不對稱④），居住處僅有1輛車僅能容納1人（資源稀缺性⑤），明天為假日，AB都想出行，由于無法交流，他們只能在有限的時間里，進行博弈。假定效用⑥最大值為1，最小值為0，中間值為0.5。

第一種情況：AB都選擇明天去，車無法滿足需求，資源配置不足。效用和為1.5（最大值為2）。

第二種情況：A認為B選擇明天去，所以A不準備明天前往，而B沒有考慮到這種情況，從而選擇了明天前往，AB中一人明天前往，一人后天前往，資源合理配置⑦，此時效用和為1+1=2，為最大效用和。

第三種情況：AB都認為彼此明天前往會給對方帶來威脅，于是都選擇了后天前往，這種情況就造成了明天空車現(xiàn)象與后天超載現(xiàn)象，帶來的效用和為1.5。

第四種情況：A若考慮到“B若認為A明天前往從而B選擇后天前往”的情況，也許A就選擇明天前往，但同時，若B也考慮到“A若認為B明天前往從而A選擇后天前往”的情況下，B就會選擇明天前往，這樣，明天又會造成超載的情況，此時的效用和為1.5。

第五種情況：考慮到彼此的三步潛在決定從而做出的決定。

第n中情況：考慮到彼此的N步潛在決定從而做出的決定。

雙方會陷于無盡的博弈循環(huán)中。不交流則不了解，只有靠判斷做出決定?？紤]的潛在決定步數(shù)決定了是否能達到效用和最大的情況。雙方出現(xiàn)相差為奇數(shù)的情況，如A考慮一步，B考慮了兩步，就會出現(xiàn)效用和最大的情況，但出現(xiàn)偶數(shù)的情況，如A考慮一步，B考慮三步，那么，資源仍然分配不均，不能帶來效用最大化的情況。所以，只要他們分開前往，所得到的總效用為最大2。

四、二維博弈模型分析

1.總效用的模型表示

將以上效用表達如下：

任何有限的非合作博弈至少存在有一個均衡點，而且非合作博弈均有可解性與強可解性⑧，證明來自John F. Nash，Jr論文。

2.博弈斗爭性模型

基于以上的分析，可以得出以下結(jié)果：

（1）A考慮1+X步，B考慮2+X步，那么所得的博弈結(jié)果是一個明日前往，一個明日不前往，這時候所得的效用是最大的。

（2）A考慮1+X步，B考慮3+X步，那么所得的博弈結(jié)果是一個明日前往（不前往），一個明日前往（不前往），這時候所得的效用是最小的。

另外：無論X為多少，它不影響博弈的結(jié)果，“A考慮1+X步，B考慮2+X步”這種情況與“A考慮1步，B考慮2步”的結(jié)果是一樣的?！癆考慮1+X步，B考慮3+X步”與“A考慮1步，B考慮3步”所得的結(jié)果也是一樣的。

X在這里只不過是一個循環(huán)數(shù)，本研究將其稱為“循環(huán)因子”。

把A的博弈動態(tài)轉(zhuǎn)化在圓上，把B的博弈過程轉(zhuǎn)化在另一平面的圓上。相切于a、b兩點。

假定前提：

（1）兩個圓都只是AB各自的博弈過程，AB兩人是兩個質(zhì)點。

（2）A循著大圓作博弈結(jié)果，而B則循著“橢圓”作博弈結(jié)果，他們在環(huán)上所做的半個循環(huán)步數(shù)（每半圓）即為前面說過的考慮潛在決定的步數(shù)。

（3）a、b都只能容納下一個質(zhì)點，a表示明天不前往，b表示明天前往。同時，橢圓可圍繞a、b轉(zhuǎn)動，即a、b是“橢圓”的軸。我們以θ來表示“橢圓”的偏轉(zhuǎn)角度，0≤θ≤π2，θ受理性人的心理偏好與外界因素的影響，θ越大，表示對“前往”的心理偏好越大，反之亦然。

（4）A、B只有a、b兩個?？奎c，也就是博弈的決定點。

（5）心理偏好是相對的，我們固定大圓固定不變，“橢圓”進行旋轉(zhuǎn)。

描述AB博弈過程：

（1）AB同時停留在a點，這就導(dǎo)致資源未達到合理分配，表示A、B兩人都做出了明日不前往的決定。

（2）AB同時停留在b點，這也導(dǎo)致資源未達到合理分配，表示AB都做出了明日前往的決定。

（3）A停留在a點，B停留在b點，或者A停留在b點，B停留在a點，資源都能達到合理的分配，表示一個明日前往，一個明日不前往（后天前往）。

（4）該模型也符合循環(huán)因子X的假設(shè)，即只要A選擇其中一個?？奎c，那么B是經(jīng)過幾個循環(huán)才選擇到?？奎c都跟X無關(guān)。

θ的意義：

1、

θ取值為π2，“橢圓”已經(jīng)圍繞ab兩點旋轉(zhuǎn)至與大圓重合，極端情況，表示AB兩人都具有極強的明天前往的心理偏好，只會做出前往的決定，陰影面積為圓面積，它為大圓面積的100%，即表示，AB明日同往的概率為100%。

2、

θ取值為0，“橢圓”已經(jīng)圍繞a、b兩點旋轉(zhuǎn)與大圓垂直，極端情況，表示AB兩人是互相完全排斥的，他們都做出不前往的決定，而且一直不前往。陰影面積為0，也就表示AB明日同去的可能性為0。

3、

AB對明天“前往”具有不同心理偏好，θ取值在0與π2之間。將θ作為常量處理，即不受其他因素影響，考慮AB共同前往的可能性。“橢圓”偏轉(zhuǎn)角度θ越大，AB的心理偏好越強，同去的可能性越高。

陰影部分占大圓面積比例m：

m=陰影面積大圓面積=πr2sinθπrr=sinθ

陰影占大圓面積的比例m僅僅與θ有關(guān)。

3.假設(shè)前提

m=sinθ，反映的是AB兩人在非合作博弈中最終一同前往的可能性，這也間接地反映了AB兩人的心理偏好與預(yù)期效用⑨。

效用函數(shù)，就是賦予個體的每一預(yù)期一個實數(shù)。效用函數(shù)并不唯一，如果U是這樣一個函數(shù)，那么a>0時，au+b也是這樣一個函數(shù)。如果用大寫字母表示預(yù)期，小寫字母表示實數(shù)，這樣的效用函數(shù)滿足下列性質(zhì)：

（1）uA>uB等價于A優(yōu)于B，以此類推。

（2）若0≤p≤1，則u[pA+（1-p）B]=pu（A）+（1-p）u（B）⑩

對一人單獨分析，引入“潛在前往因子”和“非排斥因子”。

用m=sinθ來間接表示這種預(yù)期效用與偏好的動態(tài)過程。θ增大，AB兩人共同前往可能性越大。用sinθ曲線間接表示預(yù)期效用，則沿著sinθ所作的切線即為預(yù)期邊際效用MU，切點處與原點所圍成的圖形面積即為預(yù)期效用。隨著所作決定時考慮的潛在決定的步數(shù)的不斷增加，預(yù)期邊際效用MU逐漸遞減，符合邊際效用遞減規(guī)律。等同于 “非排斥因子”的概念，即隨著A前往的概率越來越大。同時，A也總會考慮B的前往決定從而對自己的決定產(chǎn)生猶豫，而對B的猶豫又會與自己想得到最大的預(yù)期效用相違背，于是產(chǎn)生了這種博弈。這時候兩人相互的排斥力也越來越大，即“非排斥因子”越來越小。我們可以用sin′θθ = t 來表示“非排斥因子”。

另一方面，由于理性人都想讓自己的滿足程度達到最大，所以A前往的潛在決定越來越大，即A前往的可能性也越來越高，∫t0sinθdθ 在0≤θ≤π2時它的值在0-1之間呈概率分布。θ偏轉(zhuǎn)角度越大，∫t0sinθdθ 的值也就越大，前往的可能性也就越高，把它看做“潛在前往因子”。

4.博弈均衡

（1）非排斥因子>潛在前往因子，A的預(yù)期效用很大，因為他覺得B與他之間的“排斥力”很小，所以A前往的可能性極高，在原點時達到最大，他會有很強的心理偏好來引導(dǎo)他做出“前往”的這一決定，直到他的非排斥因子不能承擔(dān)為止。

（2）非排斥因子”<“潛在前往因子”時，A的預(yù)期總效用已經(jīng)很大，同時，由于他的非排斥因子已經(jīng)小于潛在前往因子，那么，由于對B的決策的猶豫，他們之間的“排斥力”很大，A作為一個理性人不會再產(chǎn)生“前往”的心理偏好，這時候，A的決定就會停留在一個自己能接受的點上。

（3）所以，理性人會把決策均衡點放在非排斥因子=潛在前往因子的時候，只有在這個時候，沒有任何其他的“排斥力”會使得決定人的心理偏好發(fā)生改變從而做出重新選擇前往的決定，這時候，決定人的心理趨向于一種既安全又滿足的狀態(tài)。

假設(shè)存在t，使得“潛在前往因子”=“非排斥因子”成立。

∫t0sinθdθ =sinθ′θ = t

∵∫t0sinθdθ =sinθ′θ = t

∴ -cost-1=cost

∴ cost=12

得t=π3，均衡點的角度為θ=π3，m=sinπ3=32

在AB博弈過程中，最終有cosπ3=12的預(yù)期邊際效用，使得AB在明天共同前往的可能性為sinπ3=32≈0.866。在二維非合作博弈中，如果兩人都將對方的潛在決定作為自己下決定的依據(jù)，想得到最大效用，則做出共同“前往”的可能性約為0.866。但均衡解未必是最優(yōu)解。

五、二維到N維非合作博弈

1.N維非合作博弈模型

多維博弈的模型圖表示的是不同人的彼此之間的非合作博弈過程。此時，均衡角度依然是θ=π3，事件之間相互獨立，但他們要一同做出“前往”的可能性就被影響因子縮小了，小于0.866。當維數(shù)趨于非常多的時候，陰影部分共同區(qū)域的圖形就越可測量。

2.模型討論

θ對實驗的影響：

當θ=π2 時，所有平面的圓都旋轉(zhuǎn)與大圓重合，這時候n = 1，表明在所有人都具有相同的極端強烈的心理偏好的情況下，N人都將會選擇第二天“前往”。這是一種極端情況。

2、

維數(shù)等于圓個數(shù)，它們彼此相切相互影響。維數(shù)越趨向于正無窮，其結(jié)果越接近真實值。強調(diào)兩個前提：（1）凡是在一個模型中，所有參與非合作博弈的人具有相同的心理偏好B11；（2）旋轉(zhuǎn)角度θ是基于對某特定事件的心理偏好B12。

3、

如果每個人都具有相同的“不前往”的心理偏好，那么此時，旋轉(zhuǎn)角度θ=0，同時n = 0，即明天將不會有任何人前往。

3.N維非合作博弈模型的總結(jié)

表述：

（1）宏觀上，同心理偏好群體（N維）一定前往的話，他們同去的可能性為sin2θ=1。微觀層面上，兩個人的博弈，一同前往的可能性也為100%。此時旋轉(zhuǎn)角度θ=π2。

（2）宏觀上，同心理偏好群體非常想去的話，他們同去的可能性為sin2θ=34。微觀層面上，兩個人的博弈，一同前往的可能性為sinθ=32，此時旋轉(zhuǎn)角度θ=π3。

（3）宏觀上，同心理偏好群體都可能前往的話，他們同去的可能性為sin2θ=12。微觀層面上，兩個人的博弈，一同前往的可能性為sinθ=22。此時旋轉(zhuǎn)角度為θ=π4。

（4）宏觀上，同心理偏好群體都無所謂前往不前往的話，他們同去的可能性為sin2θ==14。微觀層面上，兩個人的博弈，一同前往的可能性為sinθ=12。此時旋轉(zhuǎn)角度為θ=π6。

（5）宏觀上，同心理偏好的群體都不前往的話，他們同去的可能性為sin2θ=0。微觀層面上，兩個人的博弈，一同前往的可能性為sin2θ=0。此時旋轉(zhuǎn)角度為θ=0。

六、應(yīng)用

1.二維博弈

AB分別為此次假設(shè)中的乘客，他們彼此將對方的想法作為自己做出決策的基礎(chǔ)，由第四章可知，若AB一定前往，則兩人有100%的概率相撞；若AB可能去，則會有22的概率相撞；若AB都無所謂，則有0.5的概率相撞。若事先得知二人的偏好程度，可以調(diào)整公交車數(shù)量。

2.多維應(yīng)用

國慶前，抽樣得知，國慶節(jié)將有4000人去華山，他們彼此間都擔(dān)心對方的前往會不會給自己造成不便，且他們只對具有相同心理偏好的人產(chǎn)生博弈。抽樣顯示，一定前往1000人，非常想去1000人，可能去1000人，無所謂1000人，那么，國慶那天，預(yù)計會去的人數(shù)為：

1000+1000×34+1000×12+1000×14=2500

若華山承載上限為2000人，則應(yīng)及時考慮降低群體的偏好即θ，如提高票價，或者安排部分去泰山游玩等來降低他們的預(yù)期效用，使資源達到最佳配置；若華山的承載上限為3000人，則應(yīng)及時考慮提高群體的偏好即θ，如降低票價，提供更多的宣傳和服務(wù)以及開放華山其他游玩項目等，從而使資源達到最佳配置狀態(tài)。

注解：

① 該詞摘自：Robert S.Pindyck，Daniel L.Rubinfeld. 微觀經(jīng)濟學(xué)[M].北京：中國人民大學(xué)出版社，2009：467

② 博弈均衡指n個參與人的一組策略（純策略或者混合策略）選擇，在其他人策略選擇不變的情況下，任何人都不能通過改變策略來使其期望支付得到改善。

③ 引自：John F.Nash，JR.納什博弈論論文集[C].北京：首都經(jīng)濟貿(mào)易大學(xué)出版社，2012：33-34

④ 信息不對稱：不同經(jīng)濟主體缺乏信息的程度往往是不一樣的。

⑤ 資源的稀缺性：一些資源的數(shù)量是有限的，具有排他性或競爭性。

⑥ 引自：Robert S.Pindyck，Daniel L.Rubinfeld.微觀經(jīng)濟學(xué)[M].北京：中國人民大學(xué)出版社，2009：76

⑦ 合理配置：即帕累托最優(yōu)狀態(tài)。

⑧ 強可解性：具有特殊性質(zhì)的解。

⑨ 預(yù)期效用：心理上所認為會得到的效用，是一種計劃效用，非實際效用。

⑩ 引自：John F.Nash，JR.納什博弈論論文集[C].北京：首都經(jīng)濟貿(mào)易大學(xué)出版社，2012：4

B11 前提（1）來源于阿羅不可能定理。該定理是這樣表述的：如果眾多的社會成員具有不同的偏好，而社會又有多種備選方案，那么在民主的制度下不可能得到令所有的人都滿意的結(jié)果，即博弈無解。所以必須要有這樣的假設(shè)前提。

B12 為了方便計算所給出的一種標準，也可以以“事件的反面”來進行計算。

參考文獻：

[1] John F.Nash，JR.納什博弈論論文集[C].北京：首都經(jīng)濟貿(mào)易大學(xué)出版社，2012

[2] Robert S.Pindyck，Daniel L.Rubinfeld. 微觀經(jīng)濟學(xué)[M].北京：中國人民大學(xué)出版社，2009：467

[3] Kakutani S.Duke Math.[J].8，457-459（1941）

[4] Von Neumann J，Morgenstern O.The Theory of Games and Economic Behavior.Chap.3.Princeton：Princeton University Press，1941

[5] Nash J F.，Shapley L S.A Simple Three-Person Poker Games.Annals of Mathematics Study No.24.Princeton University Press，1950

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于N維非合作博弈