盧豐 周會紅
一、緒論
1.目的
本文從二維非合作博弈①出發(fā),推廣至N維,人為地改變影響博弈的量,改變原博弈均衡②,使結(jié)果朝著有利于資源利用的方向變化,解決社會中存在的資源在眾人中合理分配問題。
二、理論基礎(chǔ)
1.n維非合作博弈均衡點存在性
由角谷靜夫定理可推斷有均衡點存在?;诮枪褥o夫不動點定理而對存在性定理給出的證明(發(fā)表在:Proc.Nat.Acad.Sci.U.S.A.pp.48-49),該方法直接由布勞維爾不動點定理得出。證明的是在n維空間里構(gòu)建一個連續(xù)變換的T,使得T的不動點就是博弈的均衡點。由于n維混合策略空間是一個胞腔,且由布勞維爾不動點定理可知映射T至少有一個不動點ε,該點一定是一個均衡點。③
三、乘車博弈
1.乘車問題
AB兩理性人住在兩個房間(信息不對稱④),居住處僅有1輛車僅能容納1人(資源稀缺性⑤),明天為假日,AB都想出行,由于無法交流,他們只能在有限的時間里,進行博弈。假定效用⑥最大值為1,最小值為0,中間值為0.5。
第一種情況:AB都選擇明天去,車無法滿足需求,資源配置不足。效用和為1.5(最大值為2)。
第二種情況:A認為B選擇明天去,所以A不準備明天前往,而B沒有考慮到這種情況,從而選擇了明天前往,AB中一人明天前往,一人后天前往,資源合理配置⑦,此時效用和為1+1=2,為最大效用和。
第三種情況:AB都認為彼此明天前往會給對方帶來威脅,于是都選擇了后天前往,這種情況就造成了明天空車現(xiàn)象與后天超載現(xiàn)象,帶來的效用和為1.5。
第四種情況:A若考慮到“B若認為A明天前往從而B選擇后天前往”的情況,也許A就選擇明天前往,但同時,若B也考慮到“A若認為B明天前往從而A選擇后天前往”的情況下,B就會選擇明天前往,這樣,明天又會造成超載的情況,此時的效用和為1.5。
第五種情況:考慮到彼此的三步潛在決定從而做出的決定。
第n中情況:考慮到彼此的N步潛在決定從而做出的決定。
雙方會陷于無盡的博弈循環(huán)中。不交流則不了解,只有靠判斷做出決定??紤]的潛在決定步數(shù)決定了是否能達到效用和最大的情況。雙方出現(xiàn)相差為奇數(shù)的情況,如A考慮一步,B考慮了兩步,就會出現(xiàn)效用和最大的情況,但出現(xiàn)偶數(shù)的情況,如A考慮一步,B考慮三步,那么,資源仍然分配不均,不能帶來效用最大化的情況。所以,只要他們分開前往,所得到的總效用為最大2。
四、二維博弈模型分析
1.總效用的模型表示
將以上效用表達如下:
任何有限的非合作博弈至少存在有一個均衡點,而且非合作博弈均有可解性與強可解性⑧,證明來自John F. Nash,Jr論文。
2.博弈斗爭性模型
基于以上的分析,可以得出以下結(jié)果:
(1)A考慮1+X步,B考慮2+X步,那么所得的博弈結(jié)果是一個明日前往,一個明日不前往,這時候所得的效用是最大的。
(2)A考慮1+X步,B考慮3+X步,那么所得的博弈結(jié)果是一個明日前往(不前往),一個明日前往(不前往),這時候所得的效用是最小的。
另外:無論X為多少,它不影響博弈的結(jié)果,“A考慮1+X步,B考慮2+X步”這種情況與“A考慮1步,B考慮2步”的結(jié)果是一樣的?!癆考慮1+X步,B考慮3+X步”與“A考慮1步,B考慮3步”所得的結(jié)果也是一樣的。
X在這里只不過是一個循環(huán)數(shù),本研究將其稱為“循環(huán)因子”。
把A的博弈動態(tài)轉(zhuǎn)化在圓上,把B的博弈過程轉(zhuǎn)化在另一平面的圓上。相切于a、b兩點。
假定前提:
(1)兩個圓都只是AB各自的博弈過程,AB兩人是兩個質(zhì)點。
(2)A循著大圓作博弈結(jié)果,而B則循著“橢圓”作博弈結(jié)果,他們在環(huán)上所做的半個循環(huán)步數(shù)(每半圓)即為前面說過的考慮潛在決定的步數(shù)。
(3)a、b都只能容納下一個質(zhì)點,a表示明天不前往,b表示明天前往。同時,橢圓可圍繞a、b轉(zhuǎn)動,即a、b是“橢圓”的軸。我們以θ來表示“橢圓”的偏轉(zhuǎn)角度,0≤θ≤π2,θ受理性人的心理偏好與外界因素的影響,θ越大,表示對“前往”的心理偏好越大,反之亦然。
(4)A、B只有a、b兩個??奎c,也就是博弈的決定點。
(5)心理偏好是相對的,我們固定大圓固定不變,“橢圓”進行旋轉(zhuǎn)。
描述AB博弈過程:
(1)AB同時停留在a點,這就導(dǎo)致資源未達到合理分配,表示A、B兩人都做出了明日不前往的決定。
(2)AB同時停留在b點,這也導(dǎo)致資源未達到合理分配,表示AB都做出了明日前往的決定。
(3)A停留在a點,B停留在b點,或者A停留在b點,B停留在a點,資源都能達到合理的分配,表示一個明日前往,一個明日不前往(后天前往)。
(4)該模型也符合循環(huán)因子X的假設(shè),即只要A選擇其中一個??奎c,那么B是經(jīng)過幾個循環(huán)才選擇到??奎c都跟X無關(guān)。
θ的意義:
1、
θ取值為π2,“橢圓”已經(jīng)圍繞ab兩點旋轉(zhuǎn)至與大圓重合,極端情況,表示AB兩人都具有極強的明天前往的心理偏好,只會做出前往的決定,陰影面積為圓面積,它為大圓面積的100%,即表示,AB明日同往的概率為100%。
2、
θ取值為0,“橢圓”已經(jīng)圍繞a、b兩點旋轉(zhuǎn)與大圓垂直,極端情況,表示AB兩人是互相完全排斥的,他們都做出不前往的決定,而且一直不前往。陰影面積為0,也就表示AB明日同去的可能性為0。
3、
AB對明天“前往”具有不同心理偏好,θ取值在0與π2之間。將θ作為常量處理,即不受其他因素影響,考慮AB共同前往的可能性。“橢圓”偏轉(zhuǎn)角度θ越大,AB的心理偏好越強,同去的可能性越高。
陰影部分占大圓面積比例m:
m=陰影面積大圓面積=πr2sinθπrr=sinθ
陰影占大圓面積的比例m僅僅與θ有關(guān)。
3.假設(shè)前提
m=sinθ,反映的是AB兩人在非合作博弈中最終一同前往的可能性,這也間接地反映了AB兩人的心理偏好與預(yù)期效用⑨。
效用函數(shù),就是賦予個體的每一預(yù)期一個實數(shù)。效用函數(shù)并不唯一,如果U是這樣一個函數(shù),那么a>0時,au+b也是這樣一個函數(shù)。如果用大寫字母表示預(yù)期,小寫字母表示實數(shù),這樣的效用函數(shù)滿足下列性質(zhì):
(1)uA>uB等價于A優(yōu)于B,以此類推。
(2)若0≤p≤1,則u[pA+(1-p)B]=pu(A)+(1-p)u(B)⑩
對一人單獨分析,引入“潛在前往因子”和“非排斥因子”。
用m=sinθ來間接表示這種預(yù)期效用與偏好的動態(tài)過程。θ增大,AB兩人共同前往可能性越大。用sinθ曲線間接表示預(yù)期效用,則沿著sinθ所作的切線即為預(yù)期邊際效用MU,切點處與原點所圍成的圖形面積即為預(yù)期效用。隨著所作決定時考慮的潛在決定的步數(shù)的不斷增加,預(yù)期邊際效用MU逐漸遞減,符合邊際效用遞減規(guī)律。等同于 “非排斥因子”的概念,即隨著A前往的概率越來越大。同時,A也總會考慮B的前往決定從而對自己的決定產(chǎn)生猶豫,而對B的猶豫又會與自己想得到最大的預(yù)期效用相違背,于是產(chǎn)生了這種博弈。這時候兩人相互的排斥力也越來越大,即“非排斥因子”越來越小。我們可以用sin′θθ = t 來表示“非排斥因子”。
另一方面,由于理性人都想讓自己的滿足程度達到最大,所以A前往的潛在決定越來越大,即A前往的可能性也越來越高,∫t0sinθdθ 在0≤θ≤π2時它的值在0-1之間呈概率分布。θ偏轉(zhuǎn)角度越大,∫t0sinθdθ 的值也就越大,前往的可能性也就越高,把它看做“潛在前往因子”。
4.博弈均衡
(1)非排斥因子>潛在前往因子,A的預(yù)期效用很大,因為他覺得B與他之間的“排斥力”很小,所以A前往的可能性極高,在原點時達到最大,他會有很強的心理偏好來引導(dǎo)他做出“前往”的這一決定,直到他的非排斥因子不能承擔(dān)為止。
(2)非排斥因子”<“潛在前往因子”時,A的預(yù)期總效用已經(jīng)很大,同時,由于他的非排斥因子已經(jīng)小于潛在前往因子,那么,由于對B的決策的猶豫,他們之間的“排斥力”很大,A作為一個理性人不會再產(chǎn)生“前往”的心理偏好,這時候,A的決定就會停留在一個自己能接受的點上。
(3)所以,理性人會把決策均衡點放在非排斥因子=潛在前往因子的時候,只有在這個時候,沒有任何其他的“排斥力”會使得決定人的心理偏好發(fā)生改變從而做出重新選擇前往的決定,這時候,決定人的心理趨向于一種既安全又滿足的狀態(tài)。
假設(shè)存在t,使得“潛在前往因子”=“非排斥因子”成立。
∫t0sinθdθ =sinθ′θ = t
∵∫t0sinθdθ =sinθ′θ = t
∴ -cost-1=cost
∴ cost=12
得t=π3,均衡點的角度為θ=π3,m=sinπ3=32
在AB博弈過程中,最終有cosπ3=12的預(yù)期邊際效用,使得AB在明天共同前往的可能性為sinπ3=32≈0.866。在二維非合作博弈中,如果兩人都將對方的潛在決定作為自己下決定的依據(jù),想得到最大效用,則做出共同“前往”的可能性約為0.866。但均衡解未必是最優(yōu)解。
五、二維到N維非合作博弈
1.N維非合作博弈模型
多維博弈的模型圖表示的是不同人的彼此之間的非合作博弈過程。此時,均衡角度依然是θ=π3,事件之間相互獨立,但他們要一同做出“前往”的可能性就被影響因子縮小了,小于0.866。當維數(shù)趨于非常多的時候,陰影部分共同區(qū)域的圖形就越可測量。
2.模型討論
θ對實驗的影響:
當θ=π2 時,所有平面的圓都旋轉(zhuǎn)與大圓重合,這時候n = 1,表明在所有人都具有相同的極端強烈的心理偏好的情況下,N人都將會選擇第二天“前往”。這是一種極端情況。
2、
維數(shù)等于圓個數(shù),它們彼此相切相互影響。維數(shù)越趨向于正無窮,其結(jié)果越接近真實值。強調(diào)兩個前提:(1)凡是在一個模型中,所有參與非合作博弈的人具有相同的心理偏好B11;(2)旋轉(zhuǎn)角度θ是基于對某特定事件的心理偏好B12。
3、
如果每個人都具有相同的“不前往”的心理偏好,那么此時,旋轉(zhuǎn)角度θ=0,同時n = 0,即明天將不會有任何人前往。
3.N維非合作博弈模型的總結(jié)
表述:
(1)宏觀上,同心理偏好群體(N維)一定前往的話,他們同去的可能性為sin2θ=1。微觀層面上,兩個人的博弈,一同前往的可能性也為100%。此時旋轉(zhuǎn)角度θ=π2。
(2)宏觀上,同心理偏好群體非常想去的話,他們同去的可能性為sin2θ=34。微觀層面上,兩個人的博弈,一同前往的可能性為sinθ=32,此時旋轉(zhuǎn)角度θ=π3。
(3)宏觀上,同心理偏好群體都可能前往的話,他們同去的可能性為sin2θ=12。微觀層面上,兩個人的博弈,一同前往的可能性為sinθ=22。此時旋轉(zhuǎn)角度為θ=π4。
(4)宏觀上,同心理偏好群體都無所謂前往不前往的話,他們同去的可能性為sin2θ==14。微觀層面上,兩個人的博弈,一同前往的可能性為sinθ=12。此時旋轉(zhuǎn)角度為θ=π6。
(5)宏觀上,同心理偏好的群體都不前往的話,他們同去的可能性為sin2θ=0。微觀層面上,兩個人的博弈,一同前往的可能性為sin2θ=0。此時旋轉(zhuǎn)角度為θ=0。
六、應(yīng)用
1.二維博弈
AB分別為此次假設(shè)中的乘客,他們彼此將對方的想法作為自己做出決策的基礎(chǔ),由第四章可知,若AB一定前往,則兩人有100%的概率相撞;若AB可能去,則會有22的概率相撞;若AB都無所謂,則有0.5的概率相撞。若事先得知二人的偏好程度,可以調(diào)整公交車數(shù)量。
2.多維應(yīng)用
國慶前,抽樣得知,國慶節(jié)將有4000人去華山,他們彼此間都擔(dān)心對方的前往會不會給自己造成不便,且他們只對具有相同心理偏好的人產(chǎn)生博弈。抽樣顯示,一定前往1000人,非常想去1000人,可能去1000人,無所謂1000人,那么,國慶那天,預(yù)計會去的人數(shù)為:
1000+1000×34+1000×12+1000×14=2500
若華山承載上限為2000人,則應(yīng)及時考慮降低群體的偏好即θ,如提高票價,或者安排部分去泰山游玩等來降低他們的預(yù)期效用,使資源達到最佳配置;若華山的承載上限為3000人,則應(yīng)及時考慮提高群體的偏好即θ,如降低票價,提供更多的宣傳和服務(wù)以及開放華山其他游玩項目等,從而使資源達到最佳配置狀態(tài)。
注解:
① 該詞摘自:Robert S.Pindyck,Daniel L.Rubinfeld. 微觀經(jīng)濟學(xué)[M].北京:中國人民大學(xué)出版社,2009:467
② 博弈均衡指n個參與人的一組策略(純策略或者混合策略)選擇,在其他人策略選擇不變的情況下,任何人都不能通過改變策略來使其期望支付得到改善。
③ 引自:John F.Nash,JR.納什博弈論論文集[C].北京:首都經(jīng)濟貿(mào)易大學(xué)出版社,2012:33-34
④ 信息不對稱:不同經(jīng)濟主體缺乏信息的程度往往是不一樣的。
⑤ 資源的稀缺性:一些資源的數(shù)量是有限的,具有排他性或競爭性。
⑥ 引自:Robert S.Pindyck,Daniel L.Rubinfeld.微觀經(jīng)濟學(xué)[M].北京:中國人民大學(xué)出版社,2009:76
⑦ 合理配置:即帕累托最優(yōu)狀態(tài)。
⑧ 強可解性:具有特殊性質(zhì)的解。
⑨ 預(yù)期效用:心理上所認為會得到的效用,是一種計劃效用,非實際效用。
⑩ 引自:John F.Nash,JR.納什博弈論論文集[C].北京:首都經(jīng)濟貿(mào)易大學(xué)出版社,2012:4
B11 前提(1)來源于阿羅不可能定理。該定理是這樣表述的:如果眾多的社會成員具有不同的偏好,而社會又有多種備選方案,那么在民主的制度下不可能得到令所有的人都滿意的結(jié)果,即博弈無解。所以必須要有這樣的假設(shè)前提。
B12 為了方便計算所給出的一種標準,也可以以“事件的反面”來進行計算。
參考文獻:
[1] John F.Nash,JR.納什博弈論論文集[C].北京:首都經(jīng)濟貿(mào)易大學(xué)出版社,2012
[2] Robert S.Pindyck,Daniel L.Rubinfeld. 微觀經(jīng)濟學(xué)[M].北京:中國人民大學(xué)出版社,2009:467
[3] Kakutani S.Duke Math.[J].8,457-459(1941)
[4] Von Neumann J,Morgenstern O.The Theory of Games and Economic Behavior.Chap.3.Princeton:Princeton University Press,1941
[5] Nash J F.,Shapley L S.A Simple Three-Person Poker Games.Annals of Mathematics Study No.24.Princeton University Press,1950