国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

時(shí)間尺度與選擇傾向性協(xié)同作用下的演化博弈模型

2019-08-27 02:26王西龍王繼成羅成田秀霞
計(jì)算機(jī)應(yīng)用 2019年6期
關(guān)鍵詞:囚徒困境復(fù)雜網(wǎng)絡(luò)演化博弈

王西龍 王繼成 羅成 田秀霞

摘 要:針對(duì)合作行為的涌現(xiàn)與維持問(wèn)題,基于演化博弈理論和網(wǎng)絡(luò)理論,提出了一種促進(jìn)合作的演化博弈模型。該模型同時(shí)將時(shí)間尺度、選擇傾向性引入到演化博弈中。在初始化階段,根據(jù)持有策略的時(shí)間尺度將個(gè)體分為兩種類(lèi)型:一種個(gè)體在每個(gè)時(shí)間步都進(jìn)行策略更新;另一種個(gè)體在每一輪博弈后,以某種概率來(lái)決定是否進(jìn)行策略更新。在策略更新階段,模型用個(gè)體對(duì)周?chē)従拥呢暙I(xiàn)來(lái)表征他的聲譽(yù),并假設(shè)參與博弈的個(gè)體傾向于學(xué)習(xí)具有較好聲譽(yù)鄰居的策略。仿真實(shí)驗(yàn)結(jié)果表明,所提出的時(shí)間尺度與選擇傾向性協(xié)同作用下的演化博弈模型中,合作行為能夠在群體中維持;惰性個(gè)體的存在不利于合作的涌現(xiàn),但是個(gè)體的非理性行為反而能夠促進(jìn)合作。

關(guān)鍵詞:演化博弈;時(shí)間尺度;選擇傾向性;囚徒困境;復(fù)雜網(wǎng)絡(luò)

中圖分類(lèi)號(hào): TP391.9

文獻(xiàn)標(biāo)志碼:A

Abstract: Considering emergence and maintenance of cooperative behavior, based on evolutionary game theory and network theory, an evolutionary game model which can promote cooperation was proposed. In the proposed model, time scale and selection preference were introduced simultaneously into evolutionary game. In initialization phase, players were segmented into two categories according to their time scales of the strategies. Players in one category updated their strategies in each round, while players in the other category determined wether to update their strategies according to certain probability after every round of game. In strategy updating phase, the reputation of a player was determined by his distribution to his neighbors, and all players perfered to learn the strategies of neighbors with good reputation. The simulation experimental results show that, in the proposed evolutionary game model under synergistic effect of time scale and selection preference, cooperative behavior can be maintained in the group, the players with inertia hinders the emergence of cooperation, but the irrational behavior of players can promote cooperation.

Key words: evolutionary game; time scale; selection preference; prisoners dilemma; complex network

0 引言

合作行為在自然界和人類(lèi)社會(huì)中廣泛存在。合作會(huì)犧牲個(gè)人利益給對(duì)方帶來(lái)益處,背叛行為會(huì)不勞而獲。然而,在由自私個(gè)體組成的群體中,合作是怎樣涌現(xiàn)與維持的呢? 研究合作的本質(zhì),有助于認(rèn)識(shí)從生命的起源到人類(lèi)社會(huì)的組織等一系列重要的課題,為以后對(duì)網(wǎng)絡(luò)上的動(dòng)力學(xué)過(guò)程進(jìn)行定性調(diào)控乃至精確控制打下堅(jiān)實(shí)的基礎(chǔ)。因此,合作動(dòng)力學(xué)研究已經(jīng)成為復(fù)雜網(wǎng)絡(luò)的一個(gè)熱門(mén)研究方向。

演化博弈理論為研究合作的動(dòng)力學(xué)提供了有力的理論基礎(chǔ)。學(xué)者們基于演化博弈理論對(duì)合作行為進(jìn)行了大量的研究,促進(jìn)了該學(xué)科的發(fā)展[1]。Nowak等[2-3]率先在方格網(wǎng)絡(luò)上進(jìn)行重復(fù)囚徒困境研究,發(fā)現(xiàn)背叛行為會(huì)逐漸蔓延開(kāi)來(lái),網(wǎng)絡(luò)會(huì)進(jìn)化成優(yōu)美的斑圖,合作者會(huì)抱團(tuán),結(jié)成緊密的合作簇來(lái)抵御背叛行為的入侵。

近年來(lái),將某些社會(huì)現(xiàn)象引入到演化博弈模型中研究合作的涌現(xiàn)機(jī)理成為一個(gè)研究熱點(diǎn)。人類(lèi)的決策行為具有惰性,不一定在每次博弈后及時(shí)更新策略。文獻(xiàn)[4]發(fā)現(xiàn),過(guò)快或過(guò)慢的策略更新時(shí)間尺度都不利于合作行為的涌現(xiàn),而是有一個(gè)適中值使得合作水平最高。文獻(xiàn)[5]發(fā)現(xiàn),當(dāng)個(gè)體的策略更新時(shí)間尺度根據(jù)歷史信息改變的話會(huì)促進(jìn)合作。文獻(xiàn)[6]研究了有孤立個(gè)體存在的演化模型中惰性行為對(duì)合作的影響,發(fā)現(xiàn)個(gè)體的惰性會(huì)阻礙合作的涌現(xiàn)。

考慮到個(gè)體間相互影響的差異性,文獻(xiàn)[7]在模型中引入了偏好選擇,個(gè)體被學(xué)習(xí)的次數(shù)越多則該個(gè)體的影響力越大,研究發(fā)現(xiàn)該機(jī)制能夠促進(jìn)合作。文獻(xiàn)[8]發(fā)現(xiàn),當(dāng)個(gè)體傾向于學(xué)習(xí)收益高的鄰居策略時(shí)候會(huì)促進(jìn)合作;反之會(huì)降低合作水平,甚至合作湮滅。文獻(xiàn)[9]發(fā)現(xiàn),在系統(tǒng)演化的過(guò)程中,個(gè)體的聲譽(yù)明顯地降低了個(gè)體被剝削的風(fēng)險(xiǎn),從而使得合作在演化過(guò)程中占主導(dǎo)地位。文獻(xiàn)[10]在策略更新時(shí)同時(shí)考慮個(gè)體的聲譽(yù)和行為的多樣性,發(fā)現(xiàn)自調(diào)節(jié)的聲譽(yù)分類(lèi)能夠明顯促進(jìn)合作。文獻(xiàn)[11]提出的演化博弈模型中,聲譽(yù)好的人可以獲得獎(jiǎng)勵(lì),聲譽(yù)低的人會(huì)受到懲罰,研究發(fā)現(xiàn)該機(jī)制能夠促進(jìn)合作。

考慮到人們獲取信息會(huì)有局限性,文獻(xiàn)[12]在適應(yīng)度評(píng)價(jià)中引入噪聲,研究發(fā)現(xiàn)該機(jī)制能夠促進(jìn)合作,并且有一個(gè)適中的噪聲值,使得合作的水平最高。文獻(xiàn)[13]在有敲詐個(gè)體存在的結(jié)構(gòu)化系統(tǒng)中研究個(gè)體的理性程度對(duì)合作行為的影響,發(fā)現(xiàn):當(dāng)個(gè)體是完全理性時(shí),合作者難以抵御背叛行為的入侵;當(dāng)個(gè)體非常不理性時(shí),會(huì)導(dǎo)致合作湮滅;而當(dāng)個(gè)體是有限理性時(shí),能夠明顯促進(jìn)合作。文獻(xiàn)[14]在模型中假設(shè)收益高的個(gè)體對(duì)收益低的鄰居產(chǎn)生同情心,引入了收益的重新分配機(jī)制,研究發(fā)現(xiàn)該機(jī)制能夠促進(jìn)合作。

現(xiàn)有研究提出的演化博弈模型中,雖然很多研究引入了偏好選擇、聲譽(yù)等因素,但是都沒(méi)有考慮以個(gè)體對(duì)周?chē)従拥呢暙I(xiàn)水平作為衡量聲譽(yù)的指標(biāo),沒(méi)有研究學(xué)習(xí)貢獻(xiàn)型鄰居對(duì)合作動(dòng)力學(xué)的影響;而在現(xiàn)實(shí)社會(huì)中人們往往更傾向于學(xué)習(xí)對(duì)群體有貢獻(xiàn)的個(gè)體的行為,因此,研究偏好學(xué)習(xí)貢獻(xiàn)型鄰居策略對(duì)合作的影響具有重要的現(xiàn)實(shí)意義。雖然很多研究涉及了策略更新時(shí)間尺度、噪聲等對(duì)合作行為的影響,但是有關(guān)兩種或多種因素協(xié)同作用下合作行為的動(dòng)力學(xué)特點(diǎn)的研究卻極少;而現(xiàn)實(shí)社會(huì)中人們的行為具有多樣性,個(gè)體的決策會(huì)受到多種行為特征的影響,因此,研究多種因素協(xié)同作用下的合作動(dòng)力學(xué)特點(diǎn)非常有意義。

針對(duì)上述問(wèn)題,基于演化博弈理論,本文提出了一種引入了策略更新時(shí)間尺度與選擇傾向性的演化博弈模型。該模型在方格網(wǎng)絡(luò)上進(jìn)行重復(fù)囚徒困境博弈,研究當(dāng)相互作用網(wǎng)絡(luò)與策略學(xué)習(xí)網(wǎng)絡(luò)存在時(shí)間尺度差異性、個(gè)體具有偏好選擇的情況下合作行為的動(dòng)力學(xué)特征,并考察了噪聲對(duì)合作的影響。

1 本文模型與動(dòng)力學(xué)

本文模型在L×L 的具有無(wú)流邊界的方格網(wǎng)絡(luò)上進(jìn)行空間囚徒困境博弈。收益矩陣根據(jù)Nowak等[2]提出的弱囚徒困境進(jìn)行取值,將囚徒困境的收益矩陣修改為:令P=S=0,R = 1,并且1

在模型初始化時(shí)候,將個(gè)體屬性分為兩種:第一種個(gè)體的相互作用網(wǎng)絡(luò)與策略學(xué)習(xí)網(wǎng)絡(luò)時(shí)間尺度相同,個(gè)體在每一輪博弈之后就進(jìn)行策略更新,為了表示方便,將其命名為“普通”個(gè)體。第二種個(gè)體的相互作用網(wǎng)絡(luò)與策略學(xué)習(xí)網(wǎng)絡(luò)存在時(shí)間尺度差異,將其命名為“惰性”個(gè)體,這類(lèi)個(gè)體在每輪博弈之后,并不一定立即進(jìn)行策略更新,而是以一定的概率來(lái)決定是否進(jìn)行策略更新。在博弈的初始狀態(tài),每個(gè)個(gè)體以50%的概率被隨機(jī)地賦予合作或背叛策略。在每一個(gè)時(shí)間步中,每個(gè)個(gè)體分別與他最近鄰的四個(gè)鄰居進(jìn)行囚徒困境博弈,取得累積收益,然后進(jìn)行策略更新。

在策略更新階段,為了表征現(xiàn)實(shí)社會(huì)中人們不一定很快改變?cè)胁呗缘亩栊?,將個(gè)體分為“惰性個(gè)體”與“普通個(gè)體”兩種類(lèi)型:將比例為 prop的個(gè)體設(shè)定成具有惰性的個(gè)體,他們?cè)诿看尾┺闹笠砸欢ǖ母怕蕘?lái)決定是否更新策略,這里用變量scale表示更新策略的概率。另一部分個(gè)體在每次博弈后都進(jìn)行策略更新,這部分普通個(gè)體的比例為1-prop。這里prop與scale是兩個(gè)可以調(diào)節(jié)的參數(shù),prop表征了群體中具有惰性個(gè)體的規(guī)模;scale表征了個(gè)體持有當(dāng)前策略的時(shí)間尺度,其倒數(shù)為個(gè)體持有當(dāng)前策略的周期。因?yàn)椴荒苤饔^地假定惰性個(gè)體在人群中的分布具有某種規(guī)律,本文認(rèn)為惰性個(gè)體應(yīng)完全無(wú)規(guī)律地分布在全體參與博弈的群體中。為了表征這種無(wú)規(guī)律,采用了泊松過(guò)程來(lái)隨機(jī)抽樣惰性個(gè)體。關(guān)于泊松過(guò)程及其對(duì)無(wú)規(guī)律分布的論述見(jiàn)文獻(xiàn)[15]。惰性個(gè)體更新策略的速度用變量scale表示。scale的值越大,則更新策略的速度越快:當(dāng)scale越接近1,該惰性個(gè)體越接近普通個(gè)體;反之,若scale=0,則該個(gè)體永遠(yuǎn)不更新策略。

在進(jìn)行策略更新的時(shí)候,考慮到現(xiàn)實(shí)社會(huì)中人們會(huì)自發(fā)地學(xué)習(xí)榜樣的行為,為了模擬這種現(xiàn)象,本模型中個(gè)體傾向于模仿對(duì)群體有貢獻(xiàn)的鄰居的策略。如果鄰居的四個(gè)鄰居收益總和越高,那么他對(duì)群體的貢獻(xiàn)越大。具體來(lái)說(shuō),如圖1所示。

在選擇模仿對(duì)象時(shí)候,設(shè)A是一個(gè)參與者,他的四個(gè)鄰居為B1、B2、B3、B4,并設(shè)Bi的鄰居為Ci,1、Ci,2、Ci,3、Ci,4,則模型將Bi推薦給A的概率正比于exp{K1[P(Ci,1)+P(Ci,2)+P(Ci,3)+P(Ci,4)]},其中,K1是一個(gè)可以調(diào)節(jié)的參數(shù),P(Ci,j)表示參與者Ci,j的收益。當(dāng)Bi被推薦給A后,如果A是非惰性個(gè)體,則采用費(fèi)米動(dòng)力學(xué)(式(2))的計(jì)算方法來(lái)確定A是否采用Bi的策略。如果A是惰性個(gè)體,則A以概率scale決定是否進(jìn)行策略更新,如果不進(jìn)行策略更新就保持原有的策略不變;如果決定進(jìn)行策略更新,則采用費(fèi)米動(dòng)力學(xué)的計(jì)算方法來(lái)確定A是否采用Bi的策略。

3 結(jié)語(yǔ)

合作行為的涌現(xiàn)與維持機(jī)制是近年來(lái)的研究熱點(diǎn)。本文提出了一種模型,將策略更新時(shí)間尺度引入到偏好選擇的演化博弈模型中,研究了時(shí)間尺度與偏好選擇共同作用下合作行為的動(dòng)力學(xué)特點(diǎn)。策略更新的時(shí)間尺度用惰性個(gè)體的比例、惰性程度的大小來(lái)表征;個(gè)體在學(xué)習(xí)鄰居策略時(shí)候偏好學(xué)習(xí)聲譽(yù)高的個(gè)體策略。實(shí)驗(yàn)結(jié)果表明,該模型能夠維持系統(tǒng)中的合作行為;而惰性個(gè)體的存在,能夠在一定程度上阻礙合作行為的涌現(xiàn);噪聲的引入,即個(gè)體由完全理性轉(zhuǎn)變?yōu)橛邢蘩硇缘那闆r下,反而能夠促進(jìn)合作。本文的研究工作有助于進(jìn)一步了解合作的動(dòng)力學(xué)特點(diǎn)。

參考文獻(xiàn) (References)

[1] 榮智海,吳枝喜,王文旭.共演博弈下網(wǎng)絡(luò)合作動(dòng)力學(xué)研究進(jìn)展[J].電子科技大學(xué)學(xué)報(bào),2013,42(1):10-22.(RONG Z H, WU Z X, WANG W X. Research on the networked cooperative dynamics of coevolutionary games [J]. Journal of University of Electronic Science and Technology of China, 2013, 42(1): 10-22.)

[2] NOWAK M A, MAY R M. Evolutionary games and spatial chaos [J]. Nature, 1992, 359(6398): 826-829.

[3] NOWAK M A, MAY R M. The spatial dilemmas of evolution [J]. International Journal of Bifurcation and Chaos, 1993, 3(1): 35-78.

[4] WU Z X, RONG Z H, HOLME P. Diversity of reproduction time scale promotes cooperation in spatial prisoners dilemma games [J]. Physical Review E: Statistical, Nonlinear, and Soft Matter Physics, 2009, 80(3 Pt 2): 036106.

[5] RONG Z H, WU Z X, CHEN G R. Coevolution of strategy-selection time scale and cooperation in spatial prisoners dilemma game [J]. Europhysics Letters, 2013, 102(6): 68005.

[6] JIA D Y, JIN J H, DU C P, et al. Effects of inertia on the evolution of cooperation in the voluntary prisoners dilemma game [J]. Physica A: Statistical Mechanics and its Applications, 2018, 509: 817-826.

[7] WU Z X, XU X J, HUANG Z G, et al. Evolutionary prisoners dilemma game with dynamic preferential selection [J]. Physical Review E: Statistical, Nonlinear, and Soft Matter Physics, 2006, 74(2): 021107.

[8] WANG Z, PERC M. Aspiring to the fittest and promotion of cooperation in the prisoners dilemma game [J]. Physical Review E: Statistical, Nonlinear, and Soft Matter Physics, 2010, 82(2 Pt 1): 021115.

[9] XIA C Y, DING S, WANG C J, et al. Risk analysis and enhancement of cooperation yielded by the individual reputation in the spatial public goods game [J]. IEEE Systems Journal, 2017, 11(3): 1516-1525.

[10] CHEN M H, WANG L, SUN S W, et al. Evolution of cooperation in the spatial public goods game with adaptive reputation assortment [J]. Physics Letters A, 2016, 380(1/2): 40-47.

[11] GUO H, CHU C, SHEN C, et al. Reputation-based coevolution of link weights promotes cooperation in spatial prisoners dilemma game [J]. Chaos, Solitons & Fractals, 2018, 109: 265-268.

[12] ZHANG G Q, HU T P, YU Z. An improved fitness evaluation mechanism with noise in prisoners dilemma game [J]. Applied Mathematics & Computation, 2016, 276: 31-36.

[13] XU X, RONG Z, TSE C K. Bounded rationality optimizes the performance of networked systems in prisoners dilemma game [C] // ISCAS 2018: Proceedings of the 2018 IEEE International Symposium on Circuits and Systems. Piscataway, NJ: IEEE, 2018: 1-5.

[14] LI Y M, ZHANG J, PERC M. Effects of compassion on the evolution of cooperation in spatial social dilemmas [J]. Applied Mathematics and Computation, 2018, 320: 437-443.

[15] GERARDI A, TARDELLI P. Stochastic control methods: hedging in a market described by pure jump processes [J]. Acta Applicandae Mathematicae, 2010, 111(3): 233-255.

[16] SZABG, TKE C. Evolutionary prisoners dilemma game on a square lattice [J]. Physical Review E: Statistical, Nonlinear, and Soft Matter Physics, 1998, 58(1): 69-73.

猜你喜歡
囚徒困境復(fù)雜網(wǎng)絡(luò)演化博弈
基于圖熵聚類(lèi)的重疊社區(qū)發(fā)現(xiàn)算法
公平關(guān)切下處理商與回收商博弈模型研究
地方政府不當(dāng)干預(yù)對(duì)產(chǎn)能過(guò)剩的影響分析
關(guān)于資產(chǎn)證券化中信用評(píng)級(jí)行為的分析
“囚徒困境”在賄賂犯罪審訊中的運(yùn)用
關(guān)于公共品博弈的文獻(xiàn)綜述
基于復(fù)雜網(wǎng)絡(luò)理論的通用機(jī)場(chǎng)保障網(wǎng)絡(luò)研究
重復(fù)博弈現(xiàn)象分析
城市群復(fù)合交通網(wǎng)絡(luò)復(fù)雜性實(shí)證研究
黄梅县| 孟村| 温宿县| 建水县| 阳新县| 邳州市| 双桥区| 海安县| 固始县| 巫山县| 务川| 玉屏| 延边| 张北县| 调兵山市| 上犹县| 平昌县| 黄平县| 松滋市| 黄浦区| 辽阳市| 无极县| 旺苍县| 怀宁县| 柏乡县| 仁怀市| 南陵县| 读书| 佛坪县| 儋州市| 太仓市| 青海省| 彭州市| 新竹市| 黔江区| 高尔夫| 肇东市| 临海市| 中阳县| 本溪市| 晋城|