国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于博弈和多智能體的汽車共享服務(wù)聯(lián)盟協(xié)同策略研究

2021-01-04 06:23:28危小超范玉瑤
關(guān)鍵詞:服務(wù)商懲罰收益

危小超,范玉瑤

武漢理工大學(xué)經(jīng)濟(jì)學(xué)院,湖北武漢430070

汽車共享對于緩解交通擁堵、降低溫室氣體排放具有重要意義[1].近年來,國家相繼出臺了很多相關(guān)監(jiān)管要求及鼓勵(lì)政策以推動(dòng)汽車共享服務(wù)的可持續(xù)發(fā)展.當(dāng)前汽車共享的運(yùn)營主要以自營模式為主,即車企或服務(wù)商獨(dú)自構(gòu)建服務(wù)運(yùn)營體系,投入自有汽車,運(yùn)用自有資金進(jìn)行服務(wù)網(wǎng)點(diǎn)、充電設(shè)施、停車位等服務(wù)資源的建設(shè).但自營模式資金投入高、服務(wù)資源不足導(dǎo)致用戶滿意度低、短期盈利困難等問題.

服務(wù)聯(lián)盟的運(yùn)營模式給汽車共享服務(wù)商帶來轉(zhuǎn)機(jī).通過構(gòu)建汽車共享服務(wù)聯(lián)盟實(shí)現(xiàn)加盟服務(wù)商車輛、車位、充電樁等資源共享,能夠極大提高用戶滿意度,同時(shí)為聯(lián)盟汽車服務(wù)商短期內(nèi)收回運(yùn)營成本、實(shí)現(xiàn)盈利提供可能.目前國內(nèi)汽車共享服務(wù)聯(lián)盟的建設(shè)仍處于探索初期,存在部分加盟服務(wù)商拒不執(zhí)行聯(lián)盟決定、拒絕與聯(lián)盟內(nèi)其他服務(wù)商合作的情況.因此,研究汽車共享服務(wù)聯(lián)盟協(xié)同策略對于加強(qiáng)聯(lián)盟管理、提升聯(lián)盟凝聚力具有重要理論和現(xiàn)實(shí)意義.

汽車共享服務(wù)聯(lián)盟能夠帶來顯著的經(jīng)濟(jì)效益和社會效益,因此關(guān)于汽車共享服務(wù)聯(lián)盟的研究和探討逐漸引起了行業(yè)和學(xué)術(shù)工作者的關(guān)注.文獻(xiàn)[2]從服務(wù)商選擇、利益分配、協(xié)作機(jī)制3方面研究汽車共享服務(wù)聯(lián)盟,設(shè)計(jì)了一種服務(wù)聯(lián)盟運(yùn)行管理體系;文獻(xiàn)[3]提出了一種基于區(qū)塊鏈和車聯(lián)網(wǎng)的汽車共享租賃服務(wù)聯(lián)盟模式,通過區(qū)塊鏈系統(tǒng)加快了可信數(shù)據(jù)的流通;文獻(xiàn)[4]研究了創(chuàng)新網(wǎng)絡(luò)動(dòng)態(tài)演化過程中企業(yè)的結(jié)盟行為,對企業(yè)的網(wǎng)絡(luò)位置與聯(lián)盟伙伴的選擇進(jìn)行了討論;文獻(xiàn)[5]提出一種汽車共享服務(wù)聯(lián)盟的平臺模式,以實(shí)現(xiàn)聯(lián)盟內(nèi)部客戶數(shù)據(jù)、技術(shù)和車位的共享;文獻(xiàn)[6-8]研究了汽車共享企業(yè)與政府、社會組織合作和結(jié)盟的可能性,并提出公私合作的商業(yè)模式;文獻(xiàn)[9]提出了分散決策、集中決策、收益共享與成本共擔(dān)等多個(gè)場景下的汽車共享企業(yè)和政府之間的博弈模型,研究了汽車共享企業(yè)與政府的合作協(xié)調(diào)機(jī)制.

上述文獻(xiàn)從宏觀層面探討了聯(lián)盟的發(fā)展趨勢,但鮮少涉及聯(lián)盟管理水平不斷完善下聯(lián)盟成員的各類動(dòng)態(tài)和復(fù)雜決策問題.如聯(lián)盟內(nèi)成員數(shù)量對聯(lián)盟收益的影響,合作成本與懲罰力度對聯(lián)盟內(nèi)服務(wù)商群體的作用效果.博弈論具有簡潔高效、分析能力強(qiáng)等特點(diǎn),已成為行為決策分析的主要框架[10].多Agent 仿真常用于復(fù)雜系統(tǒng)建模,是一種自下而上的建模方法,擅長研究個(gè)體微觀互動(dòng)產(chǎn)生的宏觀涌現(xiàn)現(xiàn)象,在個(gè)體博弈研究領(lǐng)域得到了廣泛應(yīng)用[11].

綜上所述,本文將演化博弈理論引入多Agent 仿真模型,以Agent 代表汽車共享服務(wù)聯(lián)盟中的加盟服務(wù)商,從演化博弈視角構(gòu)建服務(wù)聯(lián)盟仿真模型,設(shè)計(jì)綜合考慮服務(wù)商自身與鄰居歷史信息的學(xué)習(xí)規(guī)則,研究不同Agent 之間的演化博弈收益互動(dòng)決策問題.

1 問題描述

汽車共享服務(wù)聯(lián)盟的初衷是希望通過資源共享實(shí)現(xiàn)合作互贏,合作本質(zhì)上是聯(lián)盟服務(wù)商相互牽制的過程,強(qiáng)調(diào)了對共同利益的追求[12].服務(wù)商單方面將合作或競爭放大都是危險(xiǎn)的,過分合作會導(dǎo)致自身優(yōu)勢的喪失、造成對聯(lián)盟的依賴、忽視核心能力的培養(yǎng)等一系列負(fù)面效應(yīng),因此聯(lián)盟內(nèi)存在服務(wù)商在加入聯(lián)盟之后對聯(lián)盟事務(wù)拒絕合作的問題.

在汽車共享服務(wù)聯(lián)盟的運(yùn)行過程中,加盟服務(wù)商可能對聯(lián)盟事務(wù)持“合作”或“拒絕”兩種態(tài)度,分別表示汽車共享服務(wù)商合作或拒絕合作,例如服務(wù)商是否參與平臺為推廣用戶所發(fā)起的折扣優(yōu)惠活動(dòng)等.可用對稱博弈描述競爭場景,其博弈收益矩陣如表1所示.

由表1可知,該博弈存在兩個(gè)純策略納什均衡,即(合作,合作)和(拒絕,拒絕),在這兩個(gè)均衡中前者明顯優(yōu)于后者,對于動(dòng)態(tài)變化的汽車共享服務(wù)聯(lián)盟來說,這也是最希望看到的結(jié)果.但在實(shí)際場景中有可能達(dá)不到這種均衡.事實(shí)上,在聯(lián)盟互動(dòng)協(xié)作的過程中,部分服務(wù)商認(rèn)為合作風(fēng)險(xiǎn)過高,持拒絕合作態(tài)度,并期望其他服務(wù)商持合作態(tài)度,從而自身能夠獲得最大收益b.但如果其他服務(wù)商也采取此種拒絕策略,則雙方獲得的收益均為0.

表1 服務(wù)商交互行為博弈矩陣Table 1 Game matrix of service provider interaction behavior

為避免部分服務(wù)商此種投機(jī)行為,同時(shí)調(diào)動(dòng)聯(lián)盟內(nèi)成員積極性,服務(wù)聯(lián)盟可以采取懲罰措施.構(gòu)建含懲罰參數(shù)的服務(wù)商交互行為的收益博弈矩陣,如表2所示.

表2 含懲罰參數(shù)的交互行為博弈矩陣Table 2 Interactive behavior game matrix with penalty parameters

結(jié)合現(xiàn)實(shí)背景,汽車加盟服務(wù)商對聯(lián)盟事務(wù)持合作時(shí)的收益一定是大于合作所需要的成本,即b > c;汽車加盟服務(wù)商對聯(lián)盟事務(wù)持合作時(shí)的收益也一定是大于拒絕合作所付出的懲罰,即b > d.具體地,下文將對含懲罰參數(shù)的交互行為矩陣進(jìn)行演化博弈分析,研究競合策略的演化平衡點(diǎn)及其穩(wěn)定性,為進(jìn)一步研究汽車共享服務(wù)聯(lián)盟協(xié)同策略提供理論支撐.首先令p為合作概率,表示鄰居中狀態(tài)為合作的服務(wù)商數(shù)與鄰居總數(shù)之比,p伴隨著服務(wù)商以及其鄰居狀態(tài)變化而變化,則服務(wù)商采取合作策略時(shí)的期望收益E1為

服務(wù)商采取拒絕合作策略時(shí)的期望收益E2為

群體平均收益E為

分別把復(fù)制動(dòng)態(tài)方程用于兩個(gè)位置博弈方群體,得到合作方比例的復(fù)制動(dòng)態(tài)方程為

同上推導(dǎo),拒絕方的比例復(fù)制動(dòng)態(tài)方程為

由此可得該復(fù)制動(dòng)態(tài)的博弈均衡點(diǎn)為

根據(jù)進(jìn)化穩(wěn)定策略的性質(zhì),一個(gè)穩(wěn)定狀態(tài)必須對微小擾動(dòng)具有穩(wěn)健性.即作為進(jìn)化穩(wěn)定策略的均衡點(diǎn)x?,當(dāng)博弈方因偶然錯(cuò)誤偏離均衡點(diǎn)時(shí),復(fù)制動(dòng)態(tài)仍然會使x回到x?.也即為當(dāng)擾動(dòng)x出現(xiàn)低于x?時(shí),dp/dt=F(x)必須大于0;當(dāng)擾動(dòng)x出現(xiàn)高于x?時(shí),dp/dt=F(x)必須小于0.

將汽車共享聯(lián)盟抽象成一個(gè)信息不完全對稱的網(wǎng)絡(luò),聯(lián)盟是為互利共贏而存在,聯(lián)盟內(nèi)的服務(wù)商可以看作網(wǎng)絡(luò)中的節(jié)點(diǎn),服務(wù)商之間的聯(lián)系可看作網(wǎng)絡(luò)的邊.網(wǎng)絡(luò)中的服務(wù)商個(gè)體能夠了解鄰居服務(wù)商的行為,但是不能完全了解全局的網(wǎng)絡(luò)信息.因此,汽車共享聯(lián)盟的動(dòng)態(tài)演化不能簡單地用式(1)~(6)描述.

因此,本文在演化博弈的基礎(chǔ)上,構(gòu)建汽車共享服務(wù)聯(lián)盟的多智能體仿真模型.基于演化博弈簡潔高效、分析能力強(qiáng)的特點(diǎn),對汽車共享服務(wù)聯(lián)盟這一復(fù)雜系統(tǒng)中的多個(gè)服務(wù)商及其交互行為進(jìn)行建模,提高了仿真模型與真實(shí)聯(lián)盟環(huán)境的相似度.同時(shí),多智能體仿真擅長研究個(gè)體微觀互動(dòng)產(chǎn)生的宏觀涌現(xiàn)現(xiàn)象,在演化博弈中聯(lián)盟的服務(wù)商數(shù)量眾多且行為動(dòng)態(tài)變化、傳統(tǒng)解析方法難以適用,可以利用多智能體進(jìn)行仿真與建模,量化和求解演化博弈的結(jié)果.

2 系統(tǒng)建模

2.1 智能體設(shè)計(jì)

用Agent 表示具有獨(dú)立決策能力的服務(wù)商,用網(wǎng)絡(luò)表示Agent 決策環(huán)境.單個(gè)服務(wù)商協(xié)同策略受個(gè)體偏好和歷史策略(鄰居和自身)的影響,網(wǎng)絡(luò)中單個(gè)Agent 根據(jù)個(gè)體偏好以及周圍鄰居交互可以建立信息傳播關(guān)系.

定義1 Agent={?,S,Y,F,T}其中

1)?為服務(wù)商群體,為Agent 集合,有?={Agent1,Agent2,···,Agentn}.一個(gè)Agent對應(yīng)1個(gè)聯(lián)盟服務(wù)商.

2)S為狀態(tài)空間,S={Co,De},Co為合作狀態(tài),De為拒絕狀態(tài).本系統(tǒng)中用Agent 上的顏色區(qū)分其工作狀態(tài).

3)Y為Agent 鄰居集合,有Y={Y1,Y2,···,Yn},其中,Yi={Agenti →Agentj},即Y由與該Agent 相連的智能體組成.

4)F為狀態(tài)轉(zhuǎn)移函數(shù),即個(gè)體當(dāng)前狀態(tài)與上一時(shí)刻的自身狀態(tài)和鄰居狀態(tài)有關(guān).

5)T為系統(tǒng)時(shí)鐘,有T={1,2,3,···},是模擬系統(tǒng)的基礎(chǔ).

2.2 規(guī)則設(shè)定

1)網(wǎng)絡(luò)構(gòu)建規(guī)則

在隨機(jī)網(wǎng)絡(luò)模型下,每個(gè)個(gè)體以一定的概率連接網(wǎng)絡(luò)節(jié)點(diǎn).

2)聯(lián)盟服務(wù)商收益分配規(guī)則

現(xiàn)令p為合作概率,表示鄰居中狀態(tài)為合作的服務(wù)商數(shù)與鄰居總數(shù)之比,則持拒絕合作的服務(wù)商比例為1?p.當(dāng)合作數(shù)大于0 時(shí),合作收益為b ?c(1?p/2),而拒絕合作的收益為p(b ?d),若所有服務(wù)商均選擇拒絕合作,則每個(gè)服務(wù)商的收益都為0.

3)演化規(guī)則

與傳統(tǒng)網(wǎng)絡(luò)中擴(kuò)散行為不同,本系統(tǒng)考慮網(wǎng)絡(luò)中所有服務(wù)商在某時(shí)刻受自身和鄰居行為的影響,為下一時(shí)刻是否合作提供決策依據(jù).由于服務(wù)商只能了解自身和周圍鄰居的行為,而不能獲知聯(lián)盟內(nèi)所有服務(wù)商的行為,因此,系統(tǒng)中加盟服務(wù)商表現(xiàn)出一種學(xué)習(xí)行為.關(guān)于學(xué)習(xí)算法的研究較多,本文借鑒文獻(xiàn)[13]提出了模仿概率,公式為

式中,Ui為服務(wù)商自身效用值;Ujmax為該服務(wù)商最大鄰居收益值;k為信息噪聲,其值越大,模仿概率P越小.當(dāng)k取值趨于∞時(shí),p趨近于1/2,此時(shí)式(7)是一種拋硬幣模仿方式,而當(dāng)k取值趨于0 時(shí),p趨近于1,此時(shí)式(7)是高概率模仿方式.在該服務(wù)商的個(gè)體鄰域中,以概率方法選出最大收益的鄰居為模仿對象.

4)狀態(tài)轉(zhuǎn)變規(guī)則

初始時(shí)刻,通過隨機(jī)方式選取等比例的合作者與拒絕者;在演化過程中,個(gè)體狀態(tài)選擇取決于自身決策和鄰居策略,即由自身效用值Ui和最大鄰居收益值Ujmax決定,其狀態(tài)轉(zhuǎn)變規(guī)則如下:

3 多智能體仿真系統(tǒng)開發(fā)

本文利用Anylogic 6.4.1 軟件開發(fā)多Agent 仿真系統(tǒng),設(shè)計(jì)并運(yùn)行多組仿真實(shí)驗(yàn),通過調(diào)整服務(wù)商效用參數(shù),觀察汽車共享服務(wù)聯(lián)盟中服務(wù)商協(xié)同策略演化規(guī)律.由于仿真數(shù)據(jù)較多,受篇幅限制,本文將采用典型圖示和數(shù)據(jù)進(jìn)行說明.服務(wù)商規(guī)模對平均收益影響較小的結(jié)論可見文獻(xiàn)[14],此處不再贅述.為了便于計(jì)算和分析,實(shí)驗(yàn)設(shè)定Agent 數(shù)目為100.其他仿真初始參數(shù)設(shè)置如表3所示.

表3 系統(tǒng)初始參數(shù)設(shè)置Table 3 System initial parameter setting

3.1 單一參數(shù)變化對協(xié)同策略的影響

1)合作收益b對服務(wù)商協(xié)同策略的影響

研究采取合作策略所帶來的收益對汽車共享聯(lián)盟服務(wù)商采取協(xié)同策略的影響.分別設(shè)置不同收益參數(shù)b,觀察聯(lián)盟協(xié)同策略演化過程.如圖1所示,控制成本c和懲罰d恒定,當(dāng)b分別為37、40 和43 時(shí),合作者比率呈上升趨勢.

圖1 b 對合作者比率的影響Figure 1 b impact on partner ratio

表4更清晰地說明了收益參數(shù)b變化時(shí)兩類服務(wù)商的平均收益和方差的變化.可以看出,b增大,服務(wù)商的平均收益增加,方差減小.即隨著收益的增大,服務(wù)聯(lián)盟協(xié)同策略合作概率增加,服務(wù)商合作意愿加強(qiáng),且服務(wù)商合作行為更穩(wěn)定.說明在有利可圖的情形下,聯(lián)盟內(nèi)多數(shù)服務(wù)商會選擇合作.

表4 不同環(huán)境參數(shù)下服務(wù)商的收益Table 4 Revenue of service providers under different environmental parameters

2)聯(lián)盟懲罰d對服務(wù)商協(xié)同策略的影響

研究聯(lián)盟懲罰對汽車共享聯(lián)盟服務(wù)商采取協(xié)同策略的影響.分別設(shè)置不同懲罰參數(shù)d,觀察聯(lián)盟協(xié)同策略演化過程.如圖2所示,控制收益b和成本c恒定,當(dāng)d分別為12、15 和18 時(shí),合作者概率上升趨勢明顯,聯(lián)盟趨于合作占優(yōu).可見,在汽車共享服務(wù)聯(lián)盟的管理中,管理者通過加大懲罰力度可以在一定程度上加強(qiáng)服務(wù)商的合作意愿.

3)合作成本c對服務(wù)商協(xié)同策略的影響

研究合作策略所付出的成本對汽車共享聯(lián)盟服務(wù)商采取協(xié)同策略的影響.分別設(shè)置不同成本參數(shù)c,觀察聯(lián)盟協(xié)同策略演化過程.如圖3所示,控制收益d和懲罰d恒定,當(dāng)c分別為37、40 和43 時(shí),合作者概率先呈現(xiàn)增長趨勢后出現(xiàn)下降.可見,在汽車共享服務(wù)聯(lián)盟的管理中,管理者可以通過合理控制成本,提高行業(yè)壁壘,一定程度上能夠加強(qiáng)服務(wù)商合作意愿,但是合作成本一旦超過多數(shù)服務(wù)商的承受水平,就會出現(xiàn)全部服務(wù)商拒絕合作,那么聯(lián)盟就沒有了意義.

從宏觀趨勢來看,收益b和懲罰d的合作和拒絕合作趨勢一致,隨著b或d的增加,群體合作概率占優(yōu),說明在汽車共享服務(wù)聯(lián)盟中,提升加盟服務(wù)商的收益水平和加大對不合作服務(wù)商的懲罰力度均有助于提升聯(lián)盟的合作水平.相反,隨著成本c的增加,合作概率下降,拒絕合作概率增加,這種現(xiàn)象與現(xiàn)實(shí)博弈場景一致.因而為提升聯(lián)盟合作水平,聯(lián)盟的管理者應(yīng)采取措施,盡可能地降低加盟服務(wù)商執(zhí)行聯(lián)盟政策決定的合作成本.

圖2 d 對合作者比率的影響Figure 2 d impact on partner ratio

圖3 c 對合作者比率的影響Figure 3 c impact on partner ratio

3.2 不同參數(shù)等幅度變化對協(xié)同策略的影響

大量實(shí)驗(yàn)表明,當(dāng)合作收益b=40,合作成本c=40 和聯(lián)盟懲罰d=15 時(shí),合作與拒絕合作的收益處于均衡狀態(tài),如圖4所示,后續(xù)實(shí)驗(yàn)均在此基礎(chǔ)上進(jìn)行參數(shù)調(diào)整.

1)b和d等幅度變化對協(xié)同策略的影響

圖4 參數(shù)b=40, c=40, d=15 時(shí)策略者比率變化圖Figure 4 Change chart of the ratio of strategists with parameters b=40, c=40, d=15

研究等幅度的合作收益與聯(lián)盟懲罰的變化對汽車共享聯(lián)盟服務(wù)商采取協(xié)同策略的影響程度.分別減小3 個(gè)單位參數(shù)b和d,如圖5(a)~(b)所示,觀察聯(lián)盟協(xié)同策略演化過程.當(dāng)b=37 時(shí),聯(lián)盟內(nèi)的平均合作概率約為0.36;當(dāng)d=12 時(shí),聯(lián)盟內(nèi)的平均合作概率約為0.42.可見,合作收益減小,拒絕合作概率增加更顯著.說明相比于降低懲罰,降低收益對聯(lián)盟內(nèi)服務(wù)商的效用更加明顯,在期望收益降低的情況下,服務(wù)商更容易趨于拒絕合作.汽車共享服務(wù)屬于重資產(chǎn)型運(yùn)營模式,服務(wù)商前期投入成本高,因此汽車服務(wù)商在很長一段時(shí)間內(nèi)都會更加看重合作收益.

圖5 b 和d 等幅度減小的協(xié)同影響Figure 5 Synergistic effect of equal amplitude reduction of b and d

但是增大等幅度的合作收益與聯(lián)盟懲罰,如圖6(a)~(b)所示,聯(lián)盟內(nèi)的平均合作概率約為0.52∶0.76.可見聯(lián)盟懲罰增加,合作概率短時(shí)間內(nèi)增加,呈現(xiàn)合作占優(yōu).說明相比于增加收益,增加懲罰對聯(lián)盟內(nèi)供應(yīng)商的效用更加明顯,服務(wù)商為避免承擔(dān)更高的懲罰,使得自己的預(yù)期收益受到更大的損失,短時(shí)間內(nèi)更趨于合作.說明在汽車共享服務(wù)聯(lián)盟的管理中,相比“胡蘿卜”政策,“大棒”政策的效果更好,聯(lián)盟管理者應(yīng)該更多利用懲罰手段,來規(guī)范聯(lián)盟的發(fā)展.

圖6 b 和d 等幅度增大的協(xié)同影響Figure 6 Synergistic effect of equal amplitude increase of b and d

2)c和b等幅度變化對協(xié)同策略的影響

研究等幅度的合作成本與合作收益的變化對汽車共享聯(lián)盟服務(wù)商采取協(xié)同策略的影響程度.分別減小3 個(gè)單位的b和增加3 個(gè)單位的c,如圖7(a)~(b)所示,觀察聯(lián)盟協(xié)同策略演化過程.當(dāng)b=37 時(shí),聯(lián)盟內(nèi)的平均合作概率約為0.01;當(dāng)c=43 時(shí),聯(lián)盟內(nèi)的平均合作概率約為0.36.可見,合作成本對服務(wù)商的決策影響更顯著.增加等幅度合作成本后,汽車共享聯(lián)盟內(nèi)服務(wù)商在極短時(shí)間內(nèi)全部選擇拒絕合作.因此,等幅度下成本增大對群體選擇拒絕合作的決策影響更大.對于汽車共享服務(wù)聯(lián)盟內(nèi)的服務(wù)商而言,控制成本能夠獲得更大的盈利空間,而選擇合作的成本是先期發(fā)生的,合作后能夠獲得的收益則存在不確定性,因而更傾向于拒絕合作.說明在聯(lián)盟的管理過程中,相比于提升服務(wù)商的預(yù)期收益水平,聯(lián)盟的管理者更應(yīng)著眼于做好平臺的服務(wù)工作,降低加盟服務(wù)商的合作成本,以更顯著地提升服務(wù)商的合作意愿.GoFun 出行采取的“降本增效”策略即是較好的例證,通過車源平臺化、集采及分時(shí)保險(xiǎn)的方式,降低了加盟服務(wù)商的合作成本,從而筑建了專業(yè)化網(wǎng)格管理體系,提升了加盟服務(wù)商的合作意愿.

圖7 c 與b 等幅度變化對協(xié)同策略的影響Figure 7 Influence of c and b equal amplitude changes on cooperative strategy

3)c和d等幅度變化對協(xié)同策略的影響

研究等幅度的合作成本與聯(lián)盟懲罰的變化對汽車共享聯(lián)盟服務(wù)商采取協(xié)同策略的影響程度.分別增加3 個(gè)單位的d和減小3 個(gè)單位的c,如圖8(a)~(b)所示,觀察聯(lián)盟協(xié)同策略演化過程.當(dāng)d=18 時(shí),聯(lián)盟內(nèi)的平均合作概率約為0.81;當(dāng)c=43 時(shí),聯(lián)盟內(nèi)的平均合作概率約為0.65.因此,等幅度下加大懲罰有利于群體選擇合作.說明相比于減少合作成本,增加懲罰對聯(lián)盟內(nèi)服務(wù)商的決策效果更加明顯,服務(wù)商為避免承擔(dān)更高的懲罰,短時(shí)間內(nèi)更趨于合作.因而為在短期內(nèi)迅速提升聯(lián)盟合作水平,聯(lián)盟的管理者應(yīng)采取更強(qiáng)硬的態(tài)度,加大對聯(lián)盟內(nèi)不合作行為的懲罰力度.

3.3 結(jié)果與建議

綜合上述實(shí)驗(yàn)可知:1)在汽車共享服務(wù)聯(lián)盟中,收益b和懲罰d的合作和拒絕合作趨勢一致,隨著b或d的增加,群體合作概率占優(yōu).相反,隨著成本c的增加,合作概率下降,拒絕合作概率增加.2)同等程度地減小合作收益或聯(lián)盟懲罰,仿真結(jié)果顯示合作收益的減小能夠更直接地對聯(lián)盟協(xié)同策略產(chǎn)生影響,拒絕合作概率會顯著增加;相反,同等程度地增大合作收益或聯(lián)盟懲罰,聯(lián)盟服務(wù)商對聯(lián)盟懲罰的增加更加敏感,為避免遭受更高懲罰,聯(lián)盟服務(wù)商會傾向于合作.3)同等程度地增加合作成本與同等程度地減小合作收益相比,高成本比低收益對汽車服務(wù)聯(lián)盟協(xié)同策略的影響更顯著,合作成本越高,聯(lián)盟服務(wù)商會在越短的時(shí)間內(nèi)達(dá)到拒絕合作占優(yōu);4)同等程度地減小合作成本與同等程度地加大聯(lián)盟懲罰相比,等幅度加大懲罰有利于群體選擇合作.

基于上述實(shí)驗(yàn)結(jié)果,針對汽車共享服務(wù)聯(lián)盟的管理提出如下對策與建議.

圖8 c 與d 等幅度變化對協(xié)同策略的影響Figure 8 Influence of c and d equal amplitude changes on cooperative strategy

1)“胡蘿卜+大棒”調(diào)控機(jī)制提升合作意愿:為提升聯(lián)盟內(nèi)服務(wù)商的合作意愿,聯(lián)盟的管理者應(yīng)采取措施提升服務(wù)商的收益水平,降低服務(wù)商之間合作的成本,加大對聯(lián)盟內(nèi)服務(wù)商采取不合作態(tài)度時(shí)的懲罰力度;

2)可優(yōu)先采用降低成本提升合作意愿:相比于提升聯(lián)盟內(nèi)服務(wù)商的預(yù)期收益,聯(lián)盟服務(wù)商的管理者更應(yīng)采取措施降低合作成本,從而提升服務(wù)商合作意愿;

3)長短期合作目標(biāo)下采用不同策略:聯(lián)盟的管理者在采取多種措施提升服務(wù)商合作意愿時(shí),相對比于增加預(yù)期收益水平和降低合作成本,采取加大懲罰力度的措施在短期內(nèi)更容易使聯(lián)盟內(nèi)服務(wù)商趨于合作,但為實(shí)現(xiàn)長期穩(wěn)定合作,聯(lián)盟的管理者仍應(yīng)致力于提升預(yù)期收益、降低合作成本.

4 結(jié) 語

本文從演化博弈視角構(gòu)建汽車共享服務(wù)聯(lián)盟多智能體仿真模型.通過集成演化博弈,設(shè)計(jì)綜合考慮自身與鄰居歷史信息的學(xué)習(xí)規(guī)則,實(shí)現(xiàn)不同參數(shù)下汽車共享服務(wù)聯(lián)盟的多Agent 仿真模型,從而研究不同參數(shù)對聯(lián)盟協(xié)同策略的影響.

研究發(fā)現(xiàn),為加強(qiáng)汽車共享服務(wù)聯(lián)盟管理,推動(dòng)加盟服務(wù)商參與聯(lián)盟合作,聯(lián)盟應(yīng)降低加盟服務(wù)商參與合作的成本,提升服務(wù)商采取合作策略的收益,增加服務(wù)商拒絕合作的懲罰.而在面臨雙因素影響的復(fù)雜場景時(shí),聯(lián)盟可采取以下措施:1)同等程度地增大合作收益或聯(lián)盟懲罰時(shí),選擇增大聯(lián)盟懲罰更能使聯(lián)盟服務(wù)商傾向于合作;2)同等程度地降低合作成本或同等程度地增加合作收益時(shí),選擇降低合作成本更能夠使聯(lián)盟服務(wù)商傾向于合作;3)同等程度地減小合作成本或同等程度地加大聯(lián)盟懲罰時(shí),選擇等幅度加大懲罰有利于群體選擇合作.

本文模擬實(shí)驗(yàn)和研究成果能夠?yàn)槠嚬蚕矸?wù)聯(lián)盟的管理者進(jìn)行合作收益、合作成本以及聯(lián)盟懲罰等重要參數(shù)的設(shè)置提供理論基礎(chǔ)與決策依據(jù).后續(xù)研究工作將主要聚焦于對不同類型的汽車共享聯(lián)盟服務(wù)商進(jìn)行討論,研究不同參數(shù)對具有個(gè)性特征的服務(wù)商協(xié)同策略的影響,從而提高該模型的普適性.

猜你喜歡
服務(wù)商懲罰收益
航天衛(wèi)星領(lǐng)域?qū)I(yè)服務(wù)商
論IaaS云服務(wù)商的著作權(quán)侵權(quán)責(zé)任
螃蟹爬上“網(wǎng)” 收益落進(jìn)兜
神的懲罰
小讀者(2020年2期)2020-03-12 10:34:06
Jokes笑話
懲罰
趣味(語文)(2018年1期)2018-05-25 03:09:58
2015年理財(cái)“6宗最”誰能給你穩(wěn)穩(wěn)的收益
金色年華(2016年1期)2016-02-28 01:38:19
東芝驚爆會計(jì)丑聞 憑空捏造1518億日元收益
真正的懲罰等
期刊展示宣傳服務(wù)商
巩留县| 阳泉市| 铁力市| 平潭县| 乌苏市| 阳春市| 临安市| 荣昌县| 灵山县| 景谷| 合山市| 绥江县| 都兰县| 侯马市| 淮南市| 资兴市| 那坡县| 华容县| 韶山市| 双峰县| 龙川县| 揭东县| 祁阳县| 滁州市| 体育| 自治县| 林州市| 宝清县| 元谋县| 遂昌县| 都安| 金华市| 聂荣县| 桦南县| 醴陵市| 伊通| 大城县| 博野县| 石嘴山市| 延川县| 南华县|