国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

不同類型復(fù)雜網(wǎng)絡(luò)中個體合作行為互動的演化博弈模擬

2019-11-05 08:23:14黃傲霜羅宏維
關(guān)鍵詞:合作者收益概率

章 平,黃傲霜,羅宏維

(深圳大學(xué)中國經(jīng)濟特區(qū)研究中心,廣東 深圳 518060)

0 引言

人類社會和生物界中普遍存在著合作行為,合作被視為人類社會的基本問題之一?!昂献餍袨槭侨绾窝莼摹笔敲绹犊茖W(xué)》雜志提出的125個重大科學(xué)前沿問題之一。這一問題,也始終是經(jīng)濟學(xué)及相關(guān)學(xué)科關(guān)注的根本問題之一。

第二,社會偏好與自利偏好同時存在。經(jīng)典博弈論假設(shè)參與者嚴(yán)格按照利益最大化原則進(jìn)行決策,而行為博弈論的發(fā)展表明人們并非會嚴(yán)格的計算利益得失,而是普遍存在著互惠、利他、公平等社會偏好。在看到人的自利、機會主義的搭便車行為的同時,大量的實驗室實驗和田野調(diào)查表明,人們并非完全自利者,關(guān)注他人、追求公平的社會偏好普遍存在。在Guth開始的最后通牒博弈實驗中,提議者會平均分配給響應(yīng)者30%到50%之間的初始稟賦,當(dāng)分配額小于20%時,大約一半的響應(yīng)者會拒絕[6]。Forsythe等首先主持的獨裁者博弈實驗[7]、Gerald Marwell等開創(chuàng)的公共品博弈實驗都說明人們對利他、互惠和公平的關(guān)注[8]。

第三,如何從內(nèi)在動機激發(fā)合作行為。在承認(rèn)人的自利和利他兩種偏好共存的前提下,研究開始更全面地考慮如何才能促進(jìn)合作行為的發(fā)生[9]。人的行為不僅僅受到物質(zhì)激勵的驅(qū)動,還會受到?jīng)Q策環(huán)境因素、倫理道德規(guī)范、實驗設(shè)計、個體異質(zhì)性(如職業(yè)、性別、年齡等)、初始稟賦等因素的影響。這使得人們對實驗室結(jié)果產(chǎn)生了質(zhì)疑,并進(jìn)而推動了田野實驗的發(fā)展——利用更接近現(xiàn)實狀態(tài)的決策環(huán)境研究如何激發(fā)合作行為[10]。

首先,開展基于行為設(shè)計的田野實驗研究如何激發(fā)合作。Akerlof和Yellen所研究的“禮物饋贈行為”體現(xiàn)了人們互惠的行為模型[11]。Fehr在此基礎(chǔ)上設(shè)計了禮物交換實驗并得到了同樣的結(jié)論[12]。同樣運用禮物交換實驗框架,研究者在中國南方的一家工廠設(shè)計并進(jìn)行了一項田野實驗,實驗結(jié)果再次印證了“禮物交換”中互惠的社會偏好[13]。相反,當(dāng)人們感受到不公平時,會表現(xiàn)出不合作的情況:美國新澤西州的警官們的待遇在20年內(nèi)沒有得到應(yīng)有的增加時,勞動仲裁結(jié)束后,犯罪報告增加、而逮捕率降低了[14]。

本文思路取材于Nowak的空間博弈理論。Nowak率先將演化博弈理論與規(guī)則網(wǎng)格網(wǎng)絡(luò)結(jié)構(gòu)結(jié)合,研究了空間中的群體演化博弈行為[22],使得空間博弈得到了廣泛的關(guān)注。Nowak提出了合作的五大機制:親緣選擇、直接互惠、間接互惠、空間博弈和群體選擇[23]。

人類生存的社會是個巨型社會網(wǎng)絡(luò),由于社會網(wǎng)絡(luò)的復(fù)雜性、人群的異質(zhì)性、交互規(guī)則的多樣性,研究合作行為的傳統(tǒng)方法面臨著巨大的考驗。而基于場景和人群分析的基于行動主體的建模(ABM,Agent Based Model)方法突破了傳統(tǒng)研究方法在此方面的窠臼,通過科學(xué)的建模技術(shù)以及嚴(yán)謹(jǐn)?shù)臋z驗,為研究合作的產(chǎn)生提供新的研究思路。

充分考慮到上述研究進(jìn)展和改善空間,在本文余下部分,將在NetLogo仿真平臺上采用ABM方法設(shè)計仿真實驗,研究規(guī)則格子網(wǎng)絡(luò)、無標(biāo)度網(wǎng)絡(luò)和小世界網(wǎng)絡(luò)3種典型社會網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)下合作的演化,比較何種網(wǎng)絡(luò)更有利于合作的發(fā)生,并探討如何設(shè)計有效的激勵機制以維持和促進(jìn)合作。

1 演化博弈模型與互動規(guī)則

1.1 基礎(chǔ)模型構(gòu)建

研究不同網(wǎng)絡(luò)結(jié)構(gòu)中的合作演化,假設(shè)每個個體在每個時鐘周期都和其鄰居進(jìn)行一輪公共品博弈,這里的鄰居就是個體博弈的對象,與搭載博弈群體的社會網(wǎng)絡(luò)結(jié)構(gòu)相關(guān)。模型中搭載博弈群體的拓?fù)浣Y(jié)構(gòu)有3種:規(guī)則格子網(wǎng)絡(luò)、BA無標(biāo)度網(wǎng)絡(luò)以及WS小世界網(wǎng)絡(luò)。

每輪博弈中,都沒有一個中央領(lǐng)導(dǎo)者控制,個體都有兩個選擇:合作或背叛。個體具體會選擇哪種策略,和一系列因素相關(guān),這也是實驗會考察的方面。而其策略都會對鄰近的主體產(chǎn)生影響,采取合作策略會產(chǎn)生正外部性,其他主體會因此獲益。外部性體現(xiàn)了主體與相鄰主體互動的社會能力。

我們希望通過實驗,尋找合作發(fā)生的機理——具體和哪些因素相關(guān),多輪博弈后最終能否得到穩(wěn)定的演化結(jié)果?實驗中還會因地制宜地引入激勵機制,以推動原本的演化結(jié)果由背叛轉(zhuǎn)向合作。模型中的每個主體都由4個要素描述:1)本輪的策略是合作還是背叛;2)上一輪的策略是合作還是背叛;3)本輪得分;4)為了便于在仿真過程中觀察結(jié)果,主體還被賦予不同的顏色以作區(qū)分。在鄰居的選取方面,在小世界網(wǎng)絡(luò)和無標(biāo)度網(wǎng)絡(luò)中,選擇其鄰居節(jié)點為其博弈對象;對規(guī)則格子網(wǎng)絡(luò),采用了馮·諾依曼型(4個鄰居)及摩爾型(8個鄰居)兩種鄰居選擇方式。

表1 顏色及其代表的含義Tab.1 Colors and representative meanings

1.2 交互與策略轉(zhuǎn)換規(guī)則

演化博弈中最重要的部分是個體之間的交互(interact)和下一輪策略的選取(strategy select)階段。假設(shè)所有的個體都是同質(zhì)的,有相同的策略集。

當(dāng)個體采取合作策略時,其獲得的凈收益為合作收益R減去合作成本C,為了研究問題的方便,令收益R為其所有鄰居節(jié)點的總數(shù)加上1(也就是它自身),合作成本為1,也就是每個節(jié)點的凈收益就是total-num-of-cooperation-neighbors,即其鄰居節(jié)點的總數(shù)。

當(dāng)節(jié)點選擇背叛策略時,背叛者會得到一定的收益,同時由于鄰居節(jié)點的合作,背叛者會搭便車,享受到鄰居節(jié)點的正外部收益,所以其收益是背叛激勵乘以其鄰居節(jié)點中合作者的總數(shù),即defection-award * total-num-of-cooperation-neighbors。

因此,對于每個個體,都去統(tǒng)計其鄰居節(jié)點中合作者的數(shù)量,而如果個體是合作者,其分?jǐn)?shù)就是其鄰居節(jié)點中合作者的總數(shù);如果個體是背叛者,其分?jǐn)?shù)是背叛收益與合作者鄰居總數(shù)之積。本文中,我們主要采取選擇鄰居節(jié)點中得分最高者的策略作為自身下一輪的策略,刻畫演化博弈中向強者學(xué)習(xí)的特征。

激勵政策在此被細(xì)化為獎勵(或補貼)r(reward)和懲罰p(punishment)。激勵政策將對合作者給予獎勵為唯一策略,或?qū)Ρ撑颜呓o予懲罰為唯一策略。主體會對外界的刺激作出反應(yīng),即會考量中央給予的獎勵或處罰再做決策。模型會比較無政策、獎勵政策、懲罰政策3種情況下,哪種會取得最優(yōu)的結(jié)果(最優(yōu)結(jié)果由合作者的個數(shù)來決定),以確定最優(yōu)方案。當(dāng)模型中引入獎勵機制時,對應(yīng)于現(xiàn)實中對合作者的獎勵,此時引入了獎勵reward,合作者的效用函數(shù)中會增加獎勵,即total-num-of-cooperation-neighbors+reward,采取背叛策略的主體的效用函數(shù)不變。當(dāng)模型中引入懲罰機制時,對應(yīng)于現(xiàn)實中對背叛者的懲罰此時引入了懲罰punishment,背叛者的效用函數(shù)中會減少一個值p,即defection-award * total-num-of-cooperation-neighbors-punishment,采取合作策略的主體效用函數(shù)不變。

預(yù)期結(jié)果與初始合作者的個數(shù)、群體規(guī)模,背叛收益大小、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)相關(guān)。然后有針對性地改進(jìn)參數(shù)設(shè)置,施加激勵、預(yù)期獎勵的大小、懲罰的大小也會影響最終演化結(jié)果。

1.3 網(wǎng)絡(luò)規(guī)模、初始合作概率、背叛收益和激勵機制參數(shù)設(shè)置

模型中的參數(shù)有4個。1)num-nodes:表示網(wǎng)絡(luò)中節(jié)點總數(shù),也就是博弈群體的規(guī)模,取值范圍根據(jù)不同的網(wǎng)絡(luò)略有不同;2)initial-cooperation:表示初始合作概率,取值范圍在0~100%之間;3)defection-award:表示背叛收益,取值范圍為0~10之間;4)施加激勵機制的模型中還會有reward和punishment參數(shù)。表2展示了實驗的參數(shù)和其取值范圍。

表2 實驗參數(shù)及取值范圍Tab.2 Experimental parameters and value ranges

1.4 仿真模擬分析

依據(jù)上一部分模型的構(gòu)建進(jìn)行仿真模擬。模型采用模塊化設(shè)計,包含兩個模塊:網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建模塊和演化博弈模塊。原理如下:首先,建立特定拓?fù)浣Y(jié)構(gòu)的網(wǎng)絡(luò);然后進(jìn)行初始化,即按照初始合作概率initial-cooperation令群體中一部分行為主體(在網(wǎng)絡(luò)中用節(jié)點表示)初始化為合作策略,用藍(lán)色標(biāo)記;另一部分行為主體采取背叛策略,用紅色標(biāo)記。需要注意的是,我們的初始化過程采用生成隨機數(shù)的方式,random-float 1.0<(initial-cooperation/100),即隨機產(chǎn)生一個小于1的正浮點數(shù),如果該浮點數(shù)小于初始合作概率,就令個體采用合作策略,所以并不是絕對意義上的initial-cooperation比率的合作者?;旧鲜欠恼龖B(tài)分布的,所以并不影響我們的實驗結(jié)果。接下來的演化中,根據(jù)行為主體選擇的策略改變其顏色。

圖1 實驗流程示意Fig.1 Experimental flow diagram

當(dāng)所有的主體都變成背叛者或者合作者時,或者所有主體的策略都不再變化時,停止演化程序的進(jìn)行。當(dāng)實驗設(shè)定原始節(jié)點都是合作或者都是背叛的時候,顯然,只需0步就達(dá)到演化穩(wěn)定狀態(tài),因為個體無法學(xué)習(xí)新策略,其鄰居節(jié)點是相同的。圖1是實驗流程示意圖。

2 規(guī)則網(wǎng)絡(luò)下的合作行為演化

2.1 背叛收益對演化結(jié)果的影響

實驗使用了NetLogo自帶的行為空間,參數(shù)為:網(wǎng)絡(luò)規(guī)模大小25^2=625個節(jié)點,背叛收益從0.1增加到0.9,增加量0.1,初始合作概率從1增加到100,每輪增加1。每個實驗都進(jìn)行5次,仿真時間為500個時鐘停止。實驗進(jìn)行了4 500次,結(jié)果是無一例外的個體全部演化為合作。

圖2 仿真狀態(tài)的初始化、中間狀態(tài)和結(jié)果狀態(tài)

實驗發(fā)現(xiàn),不管如何去改變初始合作概率,哪怕其值非常小,合作仍可入侵這個群體,因為背叛的收益小于合作收益,所以這個群體最終會演化為合作群體。

當(dāng)增加背叛收益值:令其取值為1.1、1.2、1.3三個數(shù)時,演化會出現(xiàn)有2個點為背叛的情況。進(jìn)行1 485輪,得到的結(jié)果有兩種:全部合作或有少量背叛點的穩(wěn)定狀態(tài)。

出現(xiàn)這種演化結(jié)果要從設(shè)定的效用函數(shù)出發(fā)。每一輪節(jié)點都從表現(xiàn)最好的鄰居狀態(tài)中選擇自己下一輪的策略,而每個個體的得分來自于周圍鄰居節(jié)點的合作者的個數(shù)。圖2中紅色節(jié)點的得分為3*(1.1,1.2,1.3)=(3.3,3.6,3.9),與其相鄰的藍(lán)色節(jié)點的得分均為3,但是不與紅色節(jié)點連接的點的得分為4,所以無論是紅色節(jié)點還是藍(lán)色節(jié)點都沒有動力去改變現(xiàn)狀。由于實驗中背叛收益參數(shù)的設(shè)置按照0.1遞增,可以推測如果設(shè)置為按照0.01遞增,則只要defection-award取值在(1,4/3)之間,都會有這種情況出現(xiàn),總之這是效用函數(shù)的設(shè)置引發(fā)的結(jié)果。繼續(xù)增加背叛收益值,令其取值為[1.4,2.9]時,會出現(xiàn)演化無法達(dá)到均衡的情況(超過40萬輪)。圖3分別是演化的初始狀況和不同的階段。而當(dāng)背叛收益大于等于3時,不管其他參數(shù)的設(shè)置,背叛策略都有絕對的優(yōu)勢。

表3中,[1 1 99]的表達(dá)方法沿襲了NetLogo中行為空間的表示方法,左右分別表示初值和終值,中間的1是遞增量,也就是取值從1每次遞增1到99為止,即取值范圍是1,2,3,…98,99。

圖3 背叛收益取值在初始狀況及演化的不同階段

表3 不同背叛收益下的演化結(jié)果

2.2 初始合作概率對演化結(jié)果的影響

接下來的實驗,我們在不同的背叛收益下不斷改變初始合作概率,觀察結(jié)果。當(dāng)背叛收益較高的情況下(defection-award≥3),無論初始合作概率多高,最終的結(jié)果都是背叛。初始合作概率從1遞增至99,背叛收益從3遞增至10,每個實驗進(jìn)行5次,共進(jìn)行3 960次實驗,都得到背叛的結(jié)果。

當(dāng)把背叛收益設(shè)置在(1.3,3)之間時,無論如何去改變合作率,都很難達(dá)到演化均衡狀態(tài),雙方的博弈勢均力敵,任何一方?jīng)]有誰會絕對占據(jù)優(yōu)勢。實驗中令初始合作概率從1遞增至99,背叛收益從1.4遞增至2.9,實驗進(jìn)行7 920次。兩者都勢均力敵,但是誰最終都難占據(jù)絕對優(yōu)勢。

當(dāng)固定背叛收益為1.9時,令初始合作概率從1遞增至99,隨著初始合作概率的增加,最終群體中合作者的比率并沒有明顯變化。所以我們認(rèn)為,在當(dāng)前效用函數(shù)設(shè)置下,初始合作概率的大小并不會影響演化結(jié)果及演化速度。

2.3 擴大鄰居數(shù)量對演化結(jié)果的影響

本輪實驗為每個個體擴展了鄰居的個數(shù),從馮·諾伊曼型鄰居擴展到摩爾型鄰居,此時增加了博弈鄰居的個數(shù)。

表4 參數(shù)設(shè)置及結(jié)果

背叛收益取值1.1或1.2時,演化結(jié)果可能是合作、背叛、少數(shù)背叛者的穩(wěn)定狀態(tài),都有可能發(fā)生。當(dāng)背叛收益為1.3時,合作、背叛或者少量背叛者的穩(wěn)定以及混合狀態(tài)都會出現(xiàn),初始合作概率較大時,容易演化為以合作者為主的群體;初始合作概率較小時,容易演化為以背叛者為主的群體。這幾種情形下,演化結(jié)果都與初始合作率相關(guān)。

當(dāng)背叛收益在[1.4,1.6]范圍時,若初始合作概率小于25%,容易出現(xiàn)演化穩(wěn)定的結(jié)果,不容易出現(xiàn)勢均力敵的混合狀態(tài)。

實驗發(fā)現(xiàn),當(dāng)擴大了博弈的鄰居范圍時,更容易演化為背叛,此時只需要較小的背叛收益,就可能演化為背叛群體。這是因為行為主體博弈得分和鄰居節(jié)點的個數(shù)相關(guān)。

2.4 改變策略對演化結(jié)果的影響

最后在實驗中改變演化策略,把自身的策略加入與鄰居策略對比,發(fā)現(xiàn)這種情況下演化的速度大大提升,很快就會達(dá)到均衡,而且很容易導(dǎo)致背叛的結(jié)果,在背叛收益為2時,所有個體都演化為了背叛。因為這種策略選擇方法是更有效率的方法。不光模仿鄰居,也將鄰居的策略與自身比較,如果自身的策略好,就保持自身策略不變。

表5 參數(shù)設(shè)置及結(jié)果

另外,當(dāng)背叛收益取值在0.8和1.3之間時,實驗中還出現(xiàn)了如圖4所示的穩(wěn)定狀態(tài),背叛和合作共存且都無改變自身狀態(tài)的動力,在實驗三中已經(jīng)分析了其緣由。圖4從左到右依次反映了隨著背叛收益的增加,穩(wěn)定狀態(tài)中背叛者的比率也不斷升高。

圖4 穩(wěn)定狀態(tài)

2.5 規(guī)則網(wǎng)絡(luò)仿真模擬結(jié)果

1)當(dāng)背叛收益小于合作收益時,不管如何去改變初始合作概率,哪怕初始合作概率非常小,合作仍可入侵,所以這個群體最終會演化為一個合作的群體。當(dāng)背叛收益較高的情況下(defection-award≥3),無論初始合作概率多高,最終的結(jié)果都是背叛。在當(dāng)前效用函數(shù)設(shè)置下,初始合作概率的大小既不會影響演化結(jié)果也沒有影響演化速度。背叛收益在1.4至2.9之間時,會出現(xiàn)勢均力敵的情形,兩種策略都無法達(dá)到演化均衡狀態(tài);背叛收益取值在[1.1,1.3]時,會出現(xiàn)有少量背叛點的穩(wěn)定狀態(tài)。

2)當(dāng)前設(shè)置下,初始合作概率不會影響演化結(jié)果。

3)當(dāng)擴大博弈的鄰居范圍時,更容易演化為背叛,此時只需要較小的背叛收益,就可能演化為背叛群體。背叛收益取值1.7以上便會演化為背叛,當(dāng)背叛收益取值1.1、1.2、1.3時,各種演化結(jié)果都可能出現(xiàn),這是與馮·諾伊曼型鄰居的不同點。

4)改變演化策略,把自身的策略加入與鄰居對比的情況下,演化的速度大大提升,很快就會達(dá)到均衡,而且很容易導(dǎo)致背叛的結(jié)果,也降低了背叛收益會演化為背叛的值,在其取值為2時就會演化為背叛群體。

表6 參數(shù)設(shè)置

3 無標(biāo)度網(wǎng)絡(luò)中的合作行為演化

3.1 背叛收益對演化結(jié)果的影響

當(dāng)固定網(wǎng)絡(luò)規(guī)模、初始合作概率,改變背叛收益時,發(fā)現(xiàn)隨著背叛收益的提高,群體會更容易演化為背叛群體。我們的參數(shù)設(shè)置和結(jié)果如表6所示。然后設(shè)定較小的初始合作概率為2%,背叛收益設(shè)置較高為10,初始節(jié)點數(shù)為200,進(jìn)行20次實驗,結(jié)果如表7。

結(jié)果顯示,即使背叛收益很大(10倍),初始合作概率較小(2%),BA無標(biāo)度網(wǎng)絡(luò)結(jié)構(gòu)下,合作還是可能入侵,并最終使得所有個體都演化為合作,只是需要較長的時間,演化為合作狀態(tài)需要的平均輪數(shù)為31.375輪。而演化為背叛狀態(tài)需要的平均輪數(shù)為5.417輪。因此,相對于規(guī)則格子網(wǎng)絡(luò),BA無標(biāo)度網(wǎng)絡(luò)有利于合作的進(jìn)化。

表7 原始數(shù)據(jù)

表8 參數(shù)設(shè)置

3.2 初始合作概率對演化結(jié)果的影響

初始合作概率會影響演化結(jié)果。如表8所示的參數(shù)和結(jié)果,當(dāng)背叛收益較小時,初始合作概率要較大才能保證群體全部演化為合作群體;隨著背叛收益的增大,初始合作概率同時也要增大,群體才會全部演化為合作群體。

3.3 個體空間分布對演化結(jié)果的影響

無標(biāo)度網(wǎng)絡(luò)的一個突出特點是“強者愈強,弱者愈弱”。少數(shù)節(jié)點的度很大,多數(shù)節(jié)點的度很小。改變最初隨機分配合作點和背叛點,而是指定節(jié)點為合作,觀察其現(xiàn)象。比較了隨機選中19個點以及給定的度數(shù)大于5的19個點,發(fā)現(xiàn)演化的結(jié)果并無較大差異。

圖5 500個節(jié)點、10%合作率的博弈結(jié)果

當(dāng)設(shè)定總節(jié)點數(shù)為300時,分別考察指定度數(shù)大于3的節(jié)點、大于10的節(jié)點、大于5的節(jié)點為合作者,與隨機分配相同數(shù)目的節(jié)點為合作者,發(fā)現(xiàn)在現(xiàn)有的效用函數(shù)設(shè)定下,指定節(jié)點與隨機分配幾乎不影響最終的演化結(jié)果。

3.4 改變策略對演化結(jié)果的影響

在本輪實驗中,我們設(shè)計為:個體不再選擇鄰近節(jié)點中收益最高的策略作為自己下一輪的策略選擇,而是將鄰近節(jié)點的策略收益與自己的策略收益作比較,采用第二種方案與第一種方案進(jìn)行對比。若自己策略收益高于所有鄰近節(jié)點,則采取自己的策略;反之,則選擇鄰近節(jié)點中收益最高的策略作為自己下一輪的策略。這一點是和規(guī)則網(wǎng)格不同的,規(guī)則網(wǎng)格里鄰近節(jié)點數(shù)只有2、3、4三種(或摩爾型的3、5、8),而BA無標(biāo)度網(wǎng)絡(luò)中節(jié)點的度數(shù)差異很大。當(dāng)背叛收益小于1時,每輪演化都會到達(dá)合作狀態(tài)。當(dāng)背叛收益大于1時,最終的演化結(jié)果卻大不一樣。

表9 原始數(shù)據(jù)

注:原始參數(shù):節(jié)點數(shù)500,初始合作概率20%,背叛收益為2.77

實驗進(jìn)行20次,除了會快速演化為背叛狀態(tài)——平均5輪博弈,還會出現(xiàn)圖6所示的一些穩(wěn)定狀態(tài)。達(dá)到均衡狀態(tài)速度的加快是由于每個個體會跟自己現(xiàn)有的狀態(tài)比較,兩種策略的權(quán)衡會加快演化速度,最終很快都會到達(dá)全部背叛的狀態(tài)。

而有時由于初始節(jié)點狀態(tài)分布,會導(dǎo)致合作者和背叛者都不再去改變自己的狀態(tài),此時自己當(dāng)前的分?jǐn)?shù)高于所有鄰居節(jié)點的分?jǐn)?shù),因此所有的節(jié)點都沒有動力改變現(xiàn)狀,此時合作者會形成一個簇,而如何打破這種穩(wěn)定狀態(tài)是個有意思的研究點。

3.5 無標(biāo)度網(wǎng)絡(luò)中的合作行為演化模擬結(jié)果

與規(guī)則格子不同,背叛收益和初始合作概率都會影響演化結(jié)果。

1)隨著背叛收益的提高,群體會更容易演化為背叛群體。但是即使背叛收益很大(10倍),初始合作人數(shù)較少(2%),BA無標(biāo)度網(wǎng)絡(luò)結(jié)構(gòu)下,合作還是可能入侵,并最終使得所有個體都演化為合作,只是需要較長的時間。

圖6 穩(wěn)定狀態(tài)

2)同等背叛收益下,當(dāng)初始合作概率較高時,群體更容易演化為合作群體。

3)在背叛收益較小(如不超過3)的情況下,指定度數(shù)較高的節(jié)點為合作初始節(jié)點,與隨機分配相同合作節(jié)點進(jìn)行比較,進(jìn)行多次實驗,指定節(jié)點與隨機分配并無區(qū)別。

4)當(dāng)改變演化策略時,會出現(xiàn)一些合作者與背叛者共存的穩(wěn)定狀態(tài),此時合作者會形成簇,所有個體都無動力改變現(xiàn)狀。

表10 參數(shù)設(shè)置

4 小世界網(wǎng)絡(luò)中的合作行為演化

4.1 背叛收益對演化結(jié)果的影響

為了便于觀察,實驗設(shè)置節(jié)點數(shù)為125個。當(dāng)背叛收益小于1時,只要合作者在一定比率以上,如10%,實驗的結(jié)果只有一個——全部演化為合作,原因是背叛收益還不如合作收益高,個體自然會選擇合作。使用行為空間工具,將初始合作概率從5遞增至99,背叛收益從0.1遞增至0.9,每個實驗進(jìn)行5次,運行4 275次,有20余次背叛,其余都是合作,且背叛多分布在初始合作概率較小的區(qū)間。

由于實驗設(shè)置節(jié)點數(shù)較少,當(dāng)初始合作概率較小時,只有少數(shù)的點是合作節(jié)點,如只有三五個,群體很可能會演化為背叛群體。因為演化策略的選擇僅從鄰居節(jié)點中的最高得分者中選取,而當(dāng)合作者太少,合作者無法從合作中獲益,不利于群體中其他個體的學(xué)習(xí)。當(dāng)初始合作概率取值大于10后,排除偶然因素,全部會演化為合作。圖7描繪了演化的三個狀態(tài),初始、全背叛、全合作。

圖7 演化的3種狀態(tài)

為了剔除不合理的數(shù)據(jù),實驗中把初始合作概率從10依次遞增至90,改變背叛收益后的結(jié)果如表11所示。此時實驗設(shè)置的參數(shù)如下,節(jié)點數(shù)125,小世界網(wǎng)絡(luò)隨機重連接的概率為0.36。當(dāng)背叛收益超過2.5時,無論初始合作概率如何增加,都不會影響背叛的結(jié)果。

表11 參數(shù)設(shè)置

實驗發(fā)現(xiàn),背叛收益為2左右時,博弈兩方相持不下,會進(jìn)行數(shù)萬代仿真才能達(dá)到背叛的演化均衡(多數(shù)結(jié)果是背叛),有時候還未必達(dá)到均衡。可以與規(guī)則網(wǎng)格中演化無法達(dá)到穩(wěn)定的狀態(tài)進(jìn)行比較。雙方出現(xiàn)了勢均力敵的現(xiàn)象,每一方都很難占據(jù)絕對優(yōu)勢。圖8展示了博弈模擬進(jìn)行10 000輪時的狀態(tài)。

圖8 博弈模擬進(jìn)行10 000輪呈現(xiàn)的狀態(tài)

當(dāng)固定節(jié)點數(shù)為125、初始合作概率為10%時,將背叛收益從4提升至8時,在不斷增加背叛收益的過程中,演化穩(wěn)定所需步數(shù)呈現(xiàn)出逐步下降的趨勢。

4.2 初始合作概率對演化結(jié)果的影響

實驗發(fā)現(xiàn),當(dāng)背叛收益為4時,穩(wěn)步提升初始合作概率并不能改變結(jié)果總是背叛的狀態(tài),當(dāng)繼續(xù)增加初始合作概率至98%,背叛仍舊可以入侵這個團體。因此,小世界網(wǎng)絡(luò)和規(guī)則格子網(wǎng)絡(luò)是比較類似的,只要背叛收益高于一定的值,群體就不可能演化為合作群體。

經(jīng)過不斷的實驗,得到臨界的背叛收益是2.5,即當(dāng)節(jié)點數(shù)為125,背叛收益取值大于等于2.5,隨機重連接的概率為0.36。此時只能演化為背叛。

表12 參數(shù)設(shè)置

表12通過對比發(fā)現(xiàn),當(dāng)背叛收益較小時,提高初始合作概率可以使得結(jié)果向著合作方向演化。

4.3 改變平均路徑長度對演化結(jié)果的影響

小世界網(wǎng)絡(luò)的一個特征是平均路徑長度較短,本次實驗通過改變隨機重連接的概率以改變平均路徑長度。

實驗在初始合作概率為50,背叛收益為3,節(jié)點數(shù)為125,隨機重連接概率從0.2遞增至0.6的情形下,進(jìn)行60次實驗。雖然最終演化結(jié)果沒有變化,然而隨著隨機重連接概率的增加,演化穩(wěn)定所需要的步數(shù)卻不斷增加。

表13 改變平均路徑

表13比較了其他參數(shù)一致,平均路徑長度不一致的演化穩(wěn)定步數(shù)。

4.4 改變演化策略對演化結(jié)果的影響

本次實驗個體會將自己的分?jǐn)?shù)與鄰居節(jié)點進(jìn)行比較,若高于所有鄰居節(jié)點就采取自己的方案,否則,就選擇鄰居節(jié)點中得分最高的策略作為自己下一輪的策略。

把自身的策略加入與鄰居策略對比,這種情況下演化的速度大大提升,很快就會達(dá)到均衡,而且很容易導(dǎo)致背叛的結(jié)果,在背叛收益為2時,所有個體都演化為了背叛。

4.5 小世界網(wǎng)絡(luò)中的合作行為演化模擬結(jié)果

1)當(dāng)背叛收益小于合作收益時,即使很少的合作者也可能入侵背叛群體,并占據(jù)絕對優(yōu)勢;背叛收益的提高,會使得演化速度加快,更快到達(dá)均衡點。有時會出現(xiàn)合作和背叛勢均力敵的情況,會演化上萬步都不能達(dá)到均衡;背叛收益超過一定值時,結(jié)果只能是背叛。

2)在背叛收益相對較小的情況下,提升初始合作概率,會使得群體朝合作演化。但是當(dāng)背叛收益超過一定的數(shù)值,提升初始合作概率并不會改變演化為背叛的結(jié)果。

3)當(dāng)改變平均路徑長度時,演化穩(wěn)定所需要的步數(shù)不斷增加。

4)和規(guī)則網(wǎng)格結(jié)構(gòu)一致,將自身策略加入對比,會加快演化的速度,較小的背叛收益都會導(dǎo)致背叛。

5 結(jié)語

論文主要研究復(fù)雜網(wǎng)絡(luò)上的演化博弈,分析了3種典型的網(wǎng)絡(luò)結(jié)構(gòu)(規(guī)則網(wǎng)絡(luò)、無標(biāo)度網(wǎng)絡(luò)、小世界網(wǎng)絡(luò))中的群體博弈,選取群體間博弈經(jīng)典模型——公共品博弈,通過仿真研究網(wǎng)絡(luò)規(guī)模、初始合作概率、背叛收益以及鄰居節(jié)點選擇方式對博弈結(jié)果的影響,探討如何設(shè)計有效的激勵機制以維持和促進(jìn)合作。

根據(jù)實驗結(jié)果可以判斷:規(guī)則格子網(wǎng)絡(luò)和小世界網(wǎng)絡(luò)的共性更多,而無標(biāo)度網(wǎng)絡(luò)更有利于合作的進(jìn)化。在規(guī)則網(wǎng)絡(luò)中,初始合作概率不會影響演化結(jié)果。與規(guī)則網(wǎng)格相比,BA無標(biāo)度網(wǎng)絡(luò)更加有利于合作演化,初始合作概率和背叛收益都會影響最終的演化結(jié)果。與BA無標(biāo)度網(wǎng)絡(luò)對比,小世界網(wǎng)絡(luò)更不利于合作的演化,即便初始合作概率較高,背叛收益不高的情況下,也很容易出現(xiàn)為全部背叛的狀況。這對于我們在設(shè)計有效的激勵機制以維持和促進(jìn)合作中具有啟發(fā)性,即激勵和懲罰對個體在博弈中收益大小產(chǎn)生影響,以此促進(jìn)合作行為的涌現(xiàn)。

此外,論文中尚存有待改善的探索,比如博弈群體規(guī)模偏小,博弈輪數(shù)也較少,在較少的博弈次數(shù)下達(dá)成的策略均衡是否具有穩(wěn)定性等一系列問題都是今后工作需要解決的難點。特別是在未來研究中我們將考慮納入隨機沖擊的影響,“隨機沖擊”在理論和現(xiàn)實中對社會經(jīng)濟系統(tǒng)演化的歷史路徑和未來預(yù)測具有重要影響,尤其是在模型設(shè)計和沖擊的特征刻畫上,我們將在已有文獻(xiàn)的基礎(chǔ)上進(jìn)行拓展細(xì)化。

猜你喜歡
合作者收益概率
第6講 “統(tǒng)計與概率”復(fù)習(xí)精講
第6講 “統(tǒng)計與概率”復(fù)習(xí)精講
有“德”的人
中外文摘(2021年8期)2021-11-11 16:10:08
有“德”的人
概率與統(tǒng)計(二)
概率與統(tǒng)計(一)
螃蟹爬上“網(wǎng)” 收益落進(jìn)兜
怎樣是最好的合作者
今日文摘(2018年23期)2018-12-17 05:21:20
怎樣是最好的合作者
意林(2018年20期)2018-10-31 14:50:42
2015年理財“6宗最”誰能給你穩(wěn)穩(wěn)的收益
金色年華(2016年1期)2016-02-28 01:38:19
龙游县| 嘉黎县| 庆云县| 彭州市| 若羌县| 东丰县| 彝良县| 信宜市| 萝北县| 嘉峪关市| 华亭县| 紫金县| 怀安县| 邢台县| 兴山县| 二手房| 郧西县| 大姚县| 图们市| 开平市| 剑川县| 嘉义市| 抚顺市| 肥东县| 上虞市| 新宁县| 宁化县| 沭阳县| 无极县| 皋兰县| 南漳县| 鄂尔多斯市| 太和县| 陈巴尔虎旗| 太仆寺旗| 多伦县| 惠来县| 东城区| 锡林郭勒盟| 靖西县| 绵阳市|