孫 銳,王源昌,李 超
(云南師范大學(xué) 數(shù)學(xué)學(xué)院,云南 昆明 650500)
20世紀(jì)80年代起,伴隨著工業(yè)化進(jìn)程的不斷加速,我國(guó)的城市化進(jìn)程也進(jìn)入了快速發(fā)展期.進(jìn)入21世紀(jì),我國(guó)城市化進(jìn)程進(jìn)一步加快,城市圈大規(guī)模建設(shè)階段也已經(jīng)到來(lái).與此同時(shí),伴隨著這場(chǎng)劇烈的變革,城市圈建設(shè)中不可避免的地出現(xiàn)了大量的經(jīng)濟(jì)社會(huì)矛盾需要予以解決.而在新的城市群建設(shè)中,如何解決城市圈中城市之間錯(cuò)綜復(fù)雜的關(guān)系與聯(lián)系,減少城市之間互斥,引導(dǎo)城市走向合作共生,成為重中之重的關(guān)鍵.
城市圈中城市的互斥與共生是一場(chǎng)長(zhǎng)期的動(dòng)態(tài)的博弈,而且最終達(dá)到的平衡也是一種動(dòng)態(tài)的均衡.這就需要我們運(yùn)用演化博弈這一新的理論去研究城市圈中的互斥共生.
文獻(xiàn)[1]中定義,如果I是一個(gè)穩(wěn)定策略(ESS, evolutionary stable strategy),它必須具有下列性質(zhì):如果群體中幾乎所有個(gè)體都采取了I策略,那么采用這種策略的適應(yīng)度必然將高于任何可能出現(xiàn)的其它策略的適應(yīng)度,否則其它策略將會(huì)改變整個(gè)種群,I也就不可能穩(wěn)定.假設(shè)這樣一個(gè)群體,它主要由采取I策略的個(gè)體組成,并且伴隨存在著極小比例p的采取不同策略J的個(gè)體,W0表示個(gè)體起始的適應(yīng)度,W(I)和W(J)分別表示I策略和J策略所帶來(lái)的適應(yīng)度;E(I,J)表示個(gè)體選擇I策略而對(duì)手選擇J策略所帶來(lái)的回報(bào).因而有:
W(I)=W0+(1-p)E(I,I)+pE(I,J),
(1)
W(J)=W0+(1-p)E(J,I)+pE(J,J).
(2)
由于I是ESS,那么W(I)>W(J).又因?yàn)閜<<1,這就要求對(duì)所有的J≠I有:
E(I,I)>E(J,I)
或者
E(I,I)=E(J,I),且E(I,J)=E(J,J).
(3)
這就是策略I演化穩(wěn)定策略的定義.
演化博弈中博弈方策略類型的比例一直處于動(dòng)態(tài)變化,博弈方通過(guò)學(xué)習(xí)模仿來(lái)調(diào)整自身的策略,通常情況下,博弈方學(xué)習(xí)模仿的速度取決于2個(gè)因素:一是模仿對(duì)象的數(shù)量大小(可用相應(yīng)類型博弈方的比例來(lái)表示),因?yàn)檫@關(guān)系到觀察和模仿的難易程度;二是模仿對(duì)像的成功程度(可用模仿對(duì)象策略得益超過(guò)平均得益的幅度表示),因?yàn)檫@關(guān)系到判斷差異的難易程度和對(duì)模仿激勵(lì)的大小.而復(fù)制動(dòng)態(tài)正是表示了某種確定策略在某群體中被采用的頻率或某個(gè)個(gè)體采用的概率變化的動(dòng)態(tài)微分方程.下面給出一種復(fù)制動(dòng)態(tài)微分方程的推導(dǎo)過(guò)程:
(4)
將總體平均收益表示為E(x,x)是因?yàn)檫@個(gè)收益與混合策略x針對(duì)自身采用時(shí)得到的收益是相同的.
假設(shè)收益代表的是博弈對(duì)個(gè)體適應(yīng)性影響的增量效應(yīng),該適應(yīng)性是用單位時(shí)間的后代數(shù)量來(lái)度量的.還假設(shè),每個(gè)后代繼承了他父母的單一策略.如果生育是連續(xù)不斷的,那么按規(guī)定選擇純策略i的人們?cè)谌魏螘r(shí)候t的出生率為β+E(i,x),這里的β≥0是總體中人們的背景適應(yīng)性(與博弈的結(jié)果無(wú)關(guān)).假設(shè)所有個(gè)體的死亡率δ是相同的.用點(diǎn)表示時(shí)間導(dǎo)數(shù),并去掉時(shí)間自變量,就能產(chǎn)生如下的動(dòng)態(tài)方程:
對(duì)恒等式p(t)xi(t)=pi(t)兩邊取時(shí)間的導(dǎo)數(shù),得到
[β+E(i,x)-δ]pi-[β+E(x,x)-δ]pxi,
兩邊同除以p就得到
因此,對(duì)應(yīng)的復(fù)制動(dòng)態(tài)方程為
(5)
這就是動(dòng)態(tài)復(fù)制微分方程的 “穩(wěn)定性定理”.
接下來(lái)以演化博弈理論中的這2個(gè)基本概念為理論基礎(chǔ),來(lái)進(jìn)一步研究城市圈中城市間互斥共生演化博弈模型.
隨著我國(guó)城市化的不斷加深,城市經(jīng)濟(jì)圈的形成已經(jīng)成為城市化加深的重要標(biāo)志,而且在同一城市圈中的城市之間的聯(lián)系與影響也逐漸增加.由于城市圈中城市之間存在著眾多的利益沖突,每個(gè)城市為了自身利益的最大化而進(jìn)行著激烈的競(jìng)爭(zhēng),使得城市間往往處于互斥的狀態(tài).同時(shí),由于存在進(jìn)行分工與協(xié)作產(chǎn)生規(guī)模效應(yīng)使合作雙方“共贏”的情況,城市圈中城市也存在合作共生的可能.在博弈的過(guò)程中,可以把城市作為一個(gè)存在有限理性的博弈方,它會(huì)根據(jù)自己以前的策略與圈內(nèi)其它城市的策略來(lái)進(jìn)行學(xué)習(xí)進(jìn)化,從而不斷調(diào)整自己的策略.所以其選擇策略行為的過(guò)程可以視為生物學(xué)意義上的演化博弈過(guò)程,每次策略的選擇都是在考慮其他成員的策略與自身策略的適應(yīng)性下做出的.因此可以用一個(gè)演化博弈模型來(lái)分析城市圈中城市互斥共生行為及其進(jìn)行的動(dòng)態(tài)調(diào)整.
為了方便研究,考慮兩城市之間的演化博弈模型,假設(shè)在某城市圈中存在城市A與城市B,他們之間具有一定的聯(lián)系,假設(shè)它們的策略選擇空間為互斥、共生.當(dāng)城市A與城市B都采用互斥策略時(shí)(例如各自為政帶來(lái)的引資大戰(zhàn)、重復(fù)建設(shè)、市場(chǎng)分割與貿(mào)易壁壘,使城市間出現(xiàn)激烈競(jìng)爭(zhēng)),則根據(jù)各自的經(jīng)濟(jì)實(shí)力與行政能力分別可以得到支付VA和VB;當(dāng)城市A與城市B都采用共生策略(例如產(chǎn)業(yè)合作與城際分工,資源與環(huán)境合作,信息與技術(shù)的共享),從而使兩城市達(dá)到共贏,雙方都得到在原來(lái)基礎(chǔ)上得到額外的收益增量W;當(dāng)城市A與城市B采用的策略不同時(shí),即一方選擇共生策略而另一方選擇互斥策略(在現(xiàn)實(shí)中出現(xiàn)這種情況往往是兩城市達(dá)成合作協(xié)議但其中一方暗中違約),則采用互斥策略的城市能夠得到更多的收益增量Fi(i=A,B),而采用共生策略的城市則會(huì)造成Fi(i=A,B)的損失,并假設(shè)FA 表1 不同策略下參與主體雙方的支付函數(shù) 根據(jù)上文分析,可以構(gòu)建博弈雙方的收益期望函數(shù),其中城市A采用互斥策略的期望收益為: EA1=yVA+(1-y)(VA+FA). 而城市A采取共生策略的期望收益為: EA2=y(VA-FA)+(1-y)(VA+W). 則城市A的平均收益為: EA=xEA1+(1-x)EA2. 這樣根據(jù)復(fù)制動(dòng)態(tài)方程,經(jīng)過(guò)運(yùn)算后得到城市A采取互斥策略的復(fù)制動(dòng)態(tài)微分方程為: F(x)=dx/dt=x(EA1-EA)= x(1-x)(FA-W+Wy). (6) 由上式對(duì)x求導(dǎo)得: F′(x)=(1-2x)(FA-W+Wy). 令F(x)=dx/dt=0,解得x1=0,x2=1,y=1-FA/W. 由復(fù)制動(dòng)態(tài)微分方程穩(wěn)定性定理及演化穩(wěn)定策略性質(zhì)知,當(dāng)F(x*)=0,F(xiàn)′(x*)<0時(shí),x*為演化穩(wěn)定策略.以下對(duì)y值進(jìn)行討論: 1) 若y=1-FA/W,則F(x)=dx/dt=0,F(xiàn)′(x)=0,即所有y軸水平都是穩(wěn)定狀態(tài),當(dāng)B城市互斥的概率達(dá)到y(tǒng)=1-FA/W時(shí),城市A采取任何策略的可能性都是穩(wěn)定的. 2) 若y<1-FA/W,對(duì)x1=0,x2=1,有F′(0)<0,F(xiàn)′(1)>0,此時(shí)x1=0為全局唯一的演化穩(wěn)定策略;即當(dāng)城市B采取互斥策略概率達(dá)不到一定程度并呈下降趨勢(shì)時(shí),城市A采取互斥策略的可能性逐步減小,選擇共生策略將是城市A的最優(yōu)選擇. 3) 若y>1-FA/W,對(duì)x1=0,x2=1,有F′(0)>0,F(xiàn)′(1)<0,此時(shí)x2=1為全局唯一的演化穩(wěn)定策略;即當(dāng)城市B采取互斥策略概率達(dá)到一定程度并呈增大趨勢(shì)時(shí),城市A采取互斥策略的可能性逐步加大,最終確定為互斥策略. 城市A的復(fù)制動(dòng)態(tài)相位圖如圖1所示. 同理,可以得出城市B采用互斥策略的復(fù)制動(dòng)態(tài)微分方程為: F(y)=dy/dt=x(EB1-EB)= (7) 由于城市B與城市A是對(duì)稱的,類似上文分析可以利用復(fù)制動(dòng)態(tài)微分方程穩(wěn)定性定理及演化穩(wěn)定策略性質(zhì)來(lái)得到類似的結(jié)果.其城市B的復(fù)制動(dòng)態(tài)相位圖如圖2所示. 綜合上文城市A與城市B的復(fù)制動(dòng)態(tài)相位圖,把二者結(jié)合起來(lái),將博弈雙方的復(fù)制動(dòng)態(tài)關(guān)系用一個(gè)二維的平面坐標(biāo)來(lái)表示,最終得到圖3. 從圖3的二城市互斥共生演化博弈復(fù)制動(dòng)態(tài)相位圖中,可以看出城市的動(dòng)態(tài)演化過(guò)程.在圖3中,由點(diǎn)A和點(diǎn)C以及臨界點(diǎn)D構(gòu)成的兩端折線,它們是使城市動(dòng)態(tài)演化博弈形成兩個(gè)完全不同狀態(tài)的分界線.其中OADC區(qū)域演化博弈將收斂于O點(diǎn),即相互共生;而ABCD區(qū)域的演化博弈將最終收斂于B點(diǎn),即相互排斥. 從以上的演化博弈模型與復(fù)制動(dòng)態(tài)相位圖可以知道,城市圈中城市的博弈可以向2個(gè)方向進(jìn)行演化,既可以采取互斥策略,也可以采取共生策略,而這2種策略都是進(jìn)化穩(wěn)定的策略.這一結(jié)論正好可以用來(lái)解釋在現(xiàn)實(shí)世界中城市圈的行為.在沒(méi)有內(nèi)部信任與外部約束的情況下,城市與城市政府就會(huì)傾向于考慮個(gè)體利益而不考慮集體利益,只考慮短期利益而不考慮長(zhǎng)期利益,則必然導(dǎo)致城際惡性競(jìng)爭(zhēng)并且城市間互斥的結(jié)果.而在雙方都有足夠的誠(chéng)意進(jìn)行合作共生,即便存在一些擾動(dòng),在多次博弈后,共生的策略也會(huì)成為唯一的穩(wěn)定策略. 在城市圈城市間互斥共生演化博弈策略的穩(wěn)定性探討中,模型的參數(shù)變化對(duì)最終城市策略的選擇有重要的影響.在二維復(fù)制動(dòng)態(tài)相位圖中可以看出,城市演化博弈過(guò)程與結(jié)果受到城市雙方初始狀態(tài)的影響.當(dāng)初始狀態(tài)在OADC區(qū)域,演化博弈系統(tǒng)將最終收斂于O(0,0)點(diǎn),即城市間將會(huì)采取相互共生策略;當(dāng)初始狀態(tài)在ABCD區(qū)域時(shí),城市雙方的演化博弈將收斂于B(1,1)點(diǎn),即城市間將會(huì)采取相互排斥策略.而相同的初始狀態(tài)會(huì)因?yàn)榕R界點(diǎn)D的變化而向不同的均衡點(diǎn)收斂,這是因?yàn)辄c(diǎn)D的變化會(huì)帶來(lái)上文提到的2個(gè)區(qū)域的變化,因而使得初始狀態(tài)向著不同的均衡點(diǎn)收斂,形成路徑不同的進(jìn)化穩(wěn)定狀態(tài). 因此,可以從點(diǎn)D的表達(dá)式x=1-FB/W,y=1-FA/W來(lái)討論各參數(shù)變化對(duì)系統(tǒng)進(jìn)化行為的影響和采取相應(yīng)的控制措施.由于只有通過(guò)合作共生,城市圈的發(fā)展才能節(jié)能高效,長(zhǎng)遠(yuǎn)地可持續(xù)發(fā)展,其中的每個(gè)城市才能達(dá)到雙贏的結(jié)果.所以為了使城市間博弈最終收斂于合作共生,應(yīng)該使區(qū)域OADC盡量大,即使得D點(diǎn)盡量接近B點(diǎn).為了達(dá)到這一目的可以從兩方面入手. 參數(shù)W表示為城市圈中兩城市都采取共生策略時(shí),給企業(yè)雙方帶來(lái)的利益的增加.當(dāng)W增加時(shí),D點(diǎn)坐標(biāo)會(huì)向B點(diǎn)移動(dòng),那么區(qū)域OADC的面積隨之增大,區(qū)域ABCD的面積隨之減少,這將導(dǎo)致城市演化博弈以很大概率向共生穩(wěn)定策略收斂.這在現(xiàn)實(shí)世界中表現(xiàn)為:當(dāng)城市間采取共生合作策略所帶來(lái)的利益越大,城市間也就更趨向于合作共生.為了提高W,必須加強(qiáng)城市間的聯(lián)系,建立起城市間差異化產(chǎn)業(yè)分工、互補(bǔ)與合作的體系,就能夠節(jié)約生產(chǎn)和運(yùn)輸成本,共享最新的信息與技術(shù),從而有效利用城市圈聚集經(jīng)濟(jì)和規(guī)模經(jīng)濟(jì),使得共生取得的收益達(dá)到最大.需要注意的是,在產(chǎn)業(yè)分工中,由于單個(gè)城市從自身利益出發(fā),難免會(huì)有些困難與抵觸,這就需要上一級(jí)政府從戰(zhàn)略高度出發(fā),統(tǒng)籌全局,使得各城市間職能分工明確,主導(dǎo)產(chǎn)業(yè)定位合理,實(shí)現(xiàn)資源優(yōu)勢(shì)互補(bǔ),共同提高協(xié)作共生帶來(lái)的利益. 參數(shù)FA與FB表示當(dāng)城市圈中城市采取不同的策略時(shí),采取互斥策略的城市獲得收益增加,而采取共生策略的城市的收益將減少.從表1支付可以看出同一城市采取不同策略對(duì)該城市帶來(lái)的收益增加和減少是相同的.例如當(dāng)城市A采取互斥策略,而城市B采取共生策略時(shí),F(xiàn)A表示城市A收益的增加,F(xiàn)B表示城市B收益的減少;反之,F(xiàn)A表示城市A收益的減少,F(xiàn)B表示城市B收益的增加.隨之FA與FB的增加,D點(diǎn)坐標(biāo)會(huì)向原點(diǎn)O點(diǎn)移動(dòng),那么區(qū)域OADC的面積隨之減小,區(qū)域ABCD的面積隨之增加,那么城市雙方將極大可能采取互斥策略為進(jìn)化穩(wěn)定策略,這在現(xiàn)實(shí)世界中表現(xiàn)為:在城市達(dá)成共生合作的合約后,如果違約一方將能得到足夠大的利益,而守約一方將因?yàn)閷?duì)方違約遭到巨大損失,那么違約方將極大可能鋌而走險(xiǎn)繼續(xù)違約,而守約方也終將放棄合約.而隨著FA與FB的減小,D點(diǎn)坐標(biāo)會(huì)向原點(diǎn)B點(diǎn)移動(dòng),那么區(qū)域OADC的面積隨之增大,區(qū)域ABCD的面積隨之減小,那么極大可能城市雙方將采取共生策略為進(jìn)化穩(wěn)定策略.即為了使城市圈中的城市能夠長(zhǎng)期穩(wěn)定的共生合作,城市雙方應(yīng)該簽訂有約束的協(xié)議,并由上一級(jí)政府進(jìn)行監(jiān)督執(zhí)行,即對(duì)違約一方進(jìn)行嚴(yán)厲懲罰,盡量減少其通過(guò)違約帶來(lái)的收益;而對(duì)守約一方進(jìn)行物質(zhì)激勵(lì),減小其損失,這樣就同時(shí)減小參數(shù)FA與FB的值,從而使得城市雙方達(dá)到合作共生的穩(wěn)定結(jié)果. 在圖3中,由點(diǎn)A和點(diǎn)C以及臨界點(diǎn)D構(gòu)成的兩端折線是使城市動(dòng)態(tài)演化博弈指向2個(gè)不同結(jié)果的分界線.當(dāng)已知A城市的采取互斥策略的概率x,可以根據(jù)分界線推出B城市采取互斥策略的y的范圍,使得最終城市走向合作共生. 用“兩點(diǎn)式”求出線段方程為 (8) 當(dāng)城市A采取互斥策略的概率確定為PA,如何確定城市B采取互斥策略的概率PB取值的范圍,使雙方最終收斂于合作共生的結(jié)果.下面進(jìn)行討論: 1) 當(dāng)0≤PA<1-FA/W時(shí),B城市互斥策略的概率為PB∈[0,-PAFA/(W-FB)+1),最終可以在經(jīng)過(guò)一段時(shí)間博弈后最終達(dá)成城市間的共生. 2) 當(dāng)1-FA/W 我國(guó)經(jīng)濟(jì)發(fā)展與城市化建設(shè)的長(zhǎng)期性與艱巨性決定了建設(shè)城市圈合作共生機(jī)制的重要性.運(yùn)用演化博弈的基本理論對(duì)城市的策略行為進(jìn)行分析,得出了影響城市進(jìn)行互斥還是共生的關(guān)鍵是合作共生產(chǎn)生的額外收益的大小,和違反合作協(xié)約時(shí)的收益與損失的大小.這要求上級(jí)政府和城市圈中的城市統(tǒng)籌安排,擴(kuò)大合作收益,建立良好的信用機(jī)制,對(duì)違約行為進(jìn)行有效懲罰制止.并且通過(guò)了解博弈對(duì)方的合作意圖,來(lái)調(diào)整自身的策略也是達(dá)到合作共生的關(guān)鍵,這就要求城市間加強(qiáng)聯(lián)系,減少誤判,基于此構(gòu)建的演化穩(wěn)定策略也終將實(shí)現(xiàn)區(qū)域城市圈間的合作與共生. 參考文獻(xiàn): [1] SMITH J M, PRICE G R. The logic of animal conflicts[J].Nature,1973, 246: 15-18. [2] SMITH J M. Evolution and the theory of games[M].Cambridge:Cambridge University Press, 1982. [3] MAYNARD SMITH J. The theory of games and the evolution of animal conflicts[J]. Journal of Theoretical Biology, 1974, 47(1): 209-221. [4] WEIBULL J W. Evolutionary game theory[M].Cambridge:Massachusetts Institute of Technology Press, 1997. [5] 郭本海, 方志耕, 劉卿. 基于演化博弈的區(qū)域高耗能產(chǎn)業(yè)退出機(jī)制研究[J].中國(guó)管理科學(xué), 2012, 20(004): 79-85. [6] 劉偉兵, 王先甲. 進(jìn)化博弈中多代理人強(qiáng)化學(xué)習(xí)模型[J].系統(tǒng)工程理論與實(shí)踐, 2009 (3):28-33. [7] 達(dá)慶利,張騏驥. 有限理性條件下進(jìn)化博弈均衡的穩(wěn)定性分析[J].系統(tǒng)工程理論方法應(yīng)用, 2006 (6): 279-284. [8] FOSTER D, YOUNG P. Stochastic evolutionary game dynamics [J].Theoretical Population Biology, 1990, 38(2): 219-232. [9] 黃敏鎂. 基于演化博弈的供應(yīng)鏈協(xié)同產(chǎn)品開(kāi)發(fā)合作機(jī)制研究[J].中國(guó)管理科學(xué),2010(12): 163-170. [10] 邁克爾 波特.競(jìng)爭(zhēng)戰(zhàn)略[M].陳小悅,譯. 北京:華夏出版社,1997.3 演化穩(wěn)定策略求解
y(1-y)(FB-W+Wx).4 模型的參數(shù)分析與控制措施
4.1 參數(shù)W
4.2 參數(shù)FA與FB
4.3 博弈雙方的控制
5 結(jié)語(yǔ)