印桂生,王姝音,劉杰,董宇欣
(哈爾濱工程大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,黑龍江哈爾濱150001)
為了解決動態(tài)的Internet環(huán)境下分散的軟件實(shí)體的共享、集成和復(fù)用[1-2],網(wǎng)構(gòu)軟件這種具有新特征的軟件應(yīng)運(yùn)而生,它是一種具有自底向上的自主性、協(xié)同性、演化性[3]等特征的軟件新形態(tài),其運(yùn)行依賴于開放、動態(tài)的網(wǎng)絡(luò)環(huán)境[4],當(dāng)前,如何在開放、動態(tài)環(huán)境下保障網(wǎng)構(gòu)軟件的可靠性與可信性已經(jīng)成為信息化社會的重大需求.
網(wǎng)構(gòu)軟件系統(tǒng)屬于開放網(wǎng)絡(luò)環(huán)境下的分布式系統(tǒng),目前,對于分布式系統(tǒng)可信性的研究主要集中在可信管理與可信評估兩方面.可信管理[5]的本質(zhì)是一種基于認(rèn)證和授權(quán)的訪問控制模型與方法.信任評估模型[6]則是以實(shí)體間的推薦信任關(guān)系為基礎(chǔ),結(jié)合自身經(jīng)驗(yàn)對實(shí)體可信度做出評價(jià),然后依據(jù)可信度進(jìn)行決策.信任評估模型主要可分為基于全局信任度模型與基于局部信任度模型.在基于全局信任度的信任模型中[7-9],節(jié)點(diǎn)通過相鄰節(jié)點(diǎn)間相互滿意度的迭代獲取其他節(jié)點(diǎn)全局的信任度.此類模型往往比較復(fù)雜、通信代價(jià)高.現(xiàn)有的分布式系統(tǒng)的信任模型大多是局部信任度模型[10-11],這類模型通過采取局部廣播手段,詢問有限的其他節(jié)點(diǎn)以獲取某個(gè)節(jié)點(diǎn)的可信度.此類模型的典型如PeerTrust模型[12-13]、DyTrust模型[14]等.上述分布式系統(tǒng)中的可信模型在解決網(wǎng)構(gòu)軟件系統(tǒng)中信任問題時(shí)稍顯不足,其原因在于:網(wǎng)構(gòu)軟件系統(tǒng)中的實(shí)體可以根據(jù)網(wǎng)絡(luò)環(huán)境的變化而發(fā)生動態(tài)演化,具有自組織演化特性.以上模型對于軟件實(shí)體的演化性考慮較少.文獻(xiàn)[15]對網(wǎng)構(gòu)軟件中實(shí)體的信任關(guān)系進(jìn)行了形式化建模.文獻(xiàn)[16]則提出了一種面向網(wǎng)構(gòu)軟件的信任驅(qū)動模型,使信任管理和信任關(guān)系的在線演化得以實(shí)現(xiàn).以上模型的不足在于在演化過程中不能支持實(shí)體間信任關(guān)系的自主形成.實(shí)際上,網(wǎng)構(gòu)軟件系統(tǒng)中軟件實(shí)體在協(xié)作過程中所具有的理性思維使其協(xié)作行為呈現(xiàn)出博弈特性.基于此思想,本文提出一種網(wǎng)構(gòu)軟件系統(tǒng)中實(shí)體間的協(xié)作博弈模型,利用博弈理論對網(wǎng)構(gòu)軟件系統(tǒng)中實(shí)體節(jié)點(diǎn)的協(xié)作過程進(jìn)行分析,建立節(jié)點(diǎn)間協(xié)作的博弈模型,并在模型中引入實(shí)體節(jié)點(diǎn)的信譽(yù)值,用以建立實(shí)體間有效的激勵(lì)合作機(jī)制,促進(jìn)實(shí)體節(jié)點(diǎn)自主進(jìn)行協(xié)作.
網(wǎng)構(gòu)軟件的概念最早由我國北京大學(xué)的楊芙清教授、梅宏教授所提出.它指的是一種具有柔性、多目標(biāo)、連續(xù)反應(yīng)式的新系統(tǒng)形態(tài)[3],它能夠根據(jù)外部環(huán)境變化來動態(tài)調(diào)節(jié)自身參數(shù)與指標(biāo)進(jìn)而進(jìn)行演化.網(wǎng)構(gòu)軟件的基本元素是具有主體化特征的軟件實(shí)體,這種軟件實(shí)體可以是構(gòu)件實(shí)體、Web服務(wù)、軟件Agent等,這種軟件實(shí)體以開放、自主的方式存在于Internet的各個(gè)節(jié)點(diǎn)之上,任何一個(gè)軟件實(shí)體可在開放的環(huán)境下通過某種方式加以發(fā)布,并以各種協(xié)同方式與其他軟件實(shí)體進(jìn)行跨網(wǎng)絡(luò)的互連、互通、協(xié)作和聯(lián)盟,從而形成一種與當(dāng)前的信息Web相類似的Software Web.在交互過程中,軟件實(shí)體需考慮自身與他人的損失與得益,使得整個(gè)交互過程成為一種博弈過程,因此可以用博弈論對網(wǎng)構(gòu)軟件系統(tǒng)中實(shí)體的協(xié)作過程進(jìn)行建模.
在利用博弈理論分析網(wǎng)構(gòu)軟件系統(tǒng)時(shí),將網(wǎng)絡(luò)中的實(shí)體看成具有有限理性的博弈參與者,將演化過程中實(shí)體協(xié)作策略的選擇看成一個(gè)復(fù)雜的博弈過程,博弈者的策略就是實(shí)體節(jié)點(diǎn)采取的行動,而參與者的收益函數(shù)則是實(shí)體節(jié)點(diǎn)根據(jù)所采取行動而能獲得的收益.根據(jù)此思想,首先給出網(wǎng)構(gòu)軟件系統(tǒng)中實(shí)體節(jié)點(diǎn)單階段協(xié)作博弈的基本式.
定義1 在每個(gè)博弈階段,實(shí)體節(jié)點(diǎn)間的單階段信任博弈可定義為三元組D=(G,S,u).G表示系統(tǒng)中的實(shí)體節(jié)點(diǎn)集合,也是博弈的參與者:Gi={i,N-i}.其中N-i表示除實(shí)體節(jié)點(diǎn)i外的其他博弈參與者.S表示參與博弈的實(shí)體節(jié)點(diǎn)的策略集合S={Si,S-i},Si={協(xié)作,不協(xié)作}為實(shí)體節(jié)點(diǎn) i所有策略的集合,s={si,s-i}為博弈者的策略組合;u為參與者的收益函數(shù),為在某一時(shí)隙t內(nèi),博弈者在策略組合下所獲得的收益.
定義2 在某一時(shí)隙t內(nèi),實(shí)體節(jié)點(diǎn)i所采取的一系列行動策略表示為表示除i外的其他博弈者的行動策略組合.這種策略的組合關(guān)系如表1所示.
表1 博弈實(shí)體策略組合關(guān)系表Table 1 The strategy combination relation of the game players
在表1中,a、b、c、d等用來表示除節(jié)點(diǎn) i以外的其他實(shí)體節(jié)點(diǎn)(統(tǒng)一定義為N-i),在每個(gè)時(shí)隙t中,節(jié)點(diǎn)i與其他節(jié)點(diǎn)分別進(jìn)行交互,co表示協(xié)作(cooperate),dis表示不協(xié)作(dis-cooperate).表1中可以看出,在時(shí)隙t1內(nèi),節(jié)點(diǎn)i的策略組合為{協(xié)作,協(xié)作,不協(xié)作,協(xié)作},與i進(jìn)行協(xié)作的其他節(jié)點(diǎn)的策略組合為{不協(xié)作,協(xié)作,協(xié)作,協(xié)作}.這里用sti表示由節(jié)點(diǎn)i的行動策略組合到實(shí)數(shù)集的一個(gè)映射,即→R,它可以反映出節(jié)點(diǎn)i在某一時(shí)間段t內(nèi)采取協(xié)作策略的幾率,的取值范圍為[0,1].值越大,代表實(shí)體節(jié)點(diǎn)選擇合作的幾率越大.
網(wǎng)構(gòu)軟件系統(tǒng)中實(shí)體節(jié)點(diǎn)協(xié)作的博弈過程可以描述如下:實(shí)體節(jié)點(diǎn)在協(xié)作的過程中,既可以是協(xié)作的發(fā)起者,也可以是協(xié)作的響應(yīng)者,例如,實(shí)體節(jié)點(diǎn)i需要實(shí)體節(jié)點(diǎn)a提供a的某種服務(wù)以完成協(xié)作時(shí),i就為協(xié)作的發(fā)起者,而a為協(xié)作的響應(yīng)者.同時(shí),實(shí)體節(jié)點(diǎn)a需要節(jié)點(diǎn)i的數(shù)據(jù)以完成該次協(xié)作,實(shí)體節(jié)點(diǎn)a變成協(xié)作的發(fā)起者,而i變?yōu)閰f(xié)作的響應(yīng)者.這種協(xié)作關(guān)系類似于P2P關(guān)系,即實(shí)體節(jié)點(diǎn)同時(shí)作為客戶端和服務(wù)器端進(jìn)行協(xié)作.當(dāng)實(shí)體節(jié)點(diǎn)i作為協(xié)作的發(fā)起者提出協(xié)作請求,并得到節(jié)點(diǎn)a的協(xié)作響應(yīng)后,由于成功完成一次協(xié)作,實(shí)體節(jié)點(diǎn)i可獲得一定的收益λ,而節(jié)點(diǎn)a由于響應(yīng)實(shí)體i的請求,犧牲了一定的資源,并且承擔(dān)了i是惡意節(jié)點(diǎn)的風(fēng)險(xiǎn),因此要用掉開銷 ,這里λ>ρ>0,λ和ρ均為常量參數(shù).可以看出,如果實(shí)體節(jié)點(diǎn)i和a在對方提出協(xié)作請求時(shí)能互相響應(yīng)對方,則均可獲得收益λ-ρ,如果節(jié)點(diǎn)i只獲得其他節(jié)點(diǎn)的協(xié)作響應(yīng),而不去響應(yīng)其他節(jié)點(diǎn)的協(xié)作請求時(shí),可以獲得收益λ.同理,如果節(jié)點(diǎn)i只響應(yīng)其他節(jié)點(diǎn)的協(xié)作請求,而不能獲得其他節(jié)點(diǎn)的協(xié)作響應(yīng)時(shí),要付出收益ρ,如果實(shí)體節(jié)點(diǎn)間互不響應(yīng)時(shí),其收益均為0.因此,網(wǎng)構(gòu)軟件系統(tǒng)中實(shí)體節(jié)點(diǎn)間博弈的收益矩陣可以表示為圖1.
圖1 協(xié)作博弈模型的收益矩陣Fig.1 The payoffmatrix of the cooperative game
由定義2可知,在時(shí)隙t內(nèi),除i以外的實(shí)體節(jié)點(diǎn)選擇協(xié)作策略的概率為st-i,選擇不協(xié)作策略的概率為1-st-i,因此節(jié)點(diǎn)i選擇協(xié)作策略的收益為
節(jié)點(diǎn)i選擇不協(xié)作策略的收益為
節(jié)點(diǎn)i選擇協(xié)作策略的概率sti,節(jié)點(diǎn) i選擇不協(xié)作策略的概率1-sti,因此實(shí)體節(jié)點(diǎn)i的期望效用函數(shù)可表示為
博弈D的Nash均衡為:在給定其他參與者的最優(yōu)策略st*-i下,能最大化其效用函數(shù)的協(xié)作博弈策略st*i,即
由式(2)可以看出,在博弈的過程中,實(shí)體節(jié)點(diǎn)的策略選擇可以相互影響和制約.由于實(shí)體節(jié)點(diǎn)具有自私特性,為追求自身收益最大化,每個(gè)節(jié)點(diǎn)都會選取較小的sti值,使 ρst
i盡量小,即節(jié)點(diǎn)在被請求協(xié)作的情況下趨向于選擇“不協(xié)作”策略,這時(shí)采取“不協(xié)作”策略將成為系統(tǒng)中節(jié)點(diǎn)的納什均衡策略,而此時(shí)系統(tǒng)的整體收益卻接近于零,網(wǎng)構(gòu)軟件系統(tǒng)的整體性能會受到嚴(yán)重的影響,這是一個(gè)典型的囚徒困境博弈模型,為了解決該問題,需要通過建立有效的激勵(lì)機(jī)制來刺激實(shí)體節(jié)點(diǎn)采取合作行為.
為了在網(wǎng)構(gòu)軟件系統(tǒng)中運(yùn)用博弈理論建立節(jié)點(diǎn)間的激勵(lì)機(jī)制,需要找到一種對所有實(shí)體節(jié)點(diǎn)都有利的策略,以使實(shí)體節(jié)點(diǎn)在博弈的過程中最終達(dá)成共識,都能獲得較高的收益,從而使整個(gè)網(wǎng)絡(luò)能夠達(dá)到一種Nash均衡狀態(tài)[17],而且保證帕累托有效.
實(shí)際上,網(wǎng)構(gòu)軟件系統(tǒng)還具有下述性質(zhì):1)節(jié)點(diǎn)的協(xié)作行為在時(shí)間上具有隨機(jī)性及不確定性,即節(jié)點(diǎn)可能在任意時(shí)刻向其他節(jié)點(diǎn)發(fā)起或接受到其他節(jié)點(diǎn)的協(xié)作請求.實(shí)體節(jié)點(diǎn)之間將重復(fù)進(jìn)行博弈,但各節(jié)點(diǎn)并不能確定博弈將在哪一階段結(jié)束;2)實(shí)體節(jié)點(diǎn)對每次協(xié)作的結(jié)果都有記錄,即實(shí)體節(jié)點(diǎn)可以掌握博弈的歷史信息.因此,網(wǎng)構(gòu)軟件系統(tǒng)中實(shí)體節(jié)點(diǎn)的協(xié)作博弈可用進(jìn)化博弈的思想進(jìn)行建模.
進(jìn)化博弈理論中,具有有限理性的參與者在重復(fù)博弈的過程中,可以不斷的進(jìn)行學(xué)習(xí)并調(diào)整策略,以使博弈中參與者最終達(dá)成共識,使系統(tǒng)整體的效用最大化.進(jìn)化博弈的學(xué)習(xí)過程[18]可以做如下描述:在每一階段的博弈g中,每一個(gè)參與者i=1,2,…,N選擇行動ai∈A,每階段博弈產(chǎn)生該階段的收益xi,參與者i可以觀察到一些信息ω∈Ω,而這些信息并沒有被完全預(yù)期到,于是參與者通過更新信念規(guī)則β:B←Ω來修正自己的信念β°i∈B,最后按照更新后的決策規(guī)則f:A←B根據(jù)目前的信念再次選擇行動.
為了建立網(wǎng)構(gòu)軟件系統(tǒng)中實(shí)體節(jié)點(diǎn)的激勵(lì)合作機(jī)制,需借鑒進(jìn)化博弈的思想,即:使參與博弈的實(shí)體節(jié)點(diǎn)在不斷的重復(fù)博弈中總結(jié)經(jīng)驗(yàn),動態(tài)的學(xué)習(xí)并調(diào)整策略.為了實(shí)現(xiàn)實(shí)體節(jié)點(diǎn)這種動態(tài)學(xué)習(xí)改變策略的博弈過程,并且對實(shí)體節(jié)點(diǎn)的策略選擇進(jìn)行激勵(lì),使不合作的節(jié)點(diǎn)只能在短期獲得較高的收益值,長期的不合作行為會導(dǎo)致節(jié)點(diǎn)收益值減少,這里在原有的網(wǎng)構(gòu)軟件博弈模型中加入新的要素T,即實(shí)體節(jié)點(diǎn)綜合信譽(yù)值Tt-ii,將該信譽(yù)值作為決策者在時(shí)刻t觀察到的信息,反饋給博弈實(shí)體的收益函數(shù).博弈者在每進(jìn)行一次博弈后,其綜合信譽(yù)值都在發(fā)生變化,收益函數(shù)受該信譽(yù)值影響而改變,因此決定了博弈者行動策略的動態(tài)調(diào)整.而策略的調(diào)整又會使博弈者的信譽(yù)值發(fā)生變化,該變化作為博弈者新觀察到的信息,來決定下一次的行動.這種通過觀察信譽(yù)值變化動態(tài)學(xué)習(xí)調(diào)整策略的過程如圖2所示.
圖2 基于信譽(yù)激勵(lì)的進(jìn)化博弈過程Fig.2 The process of evolutionary game based on trust
定義4 在每個(gè)博弈階段,基于信譽(yù)激勵(lì)的進(jìn)化博弈可定義為四元組 D=(G,S,u,q(·)).G 表示系統(tǒng)中的實(shí)體節(jié)點(diǎn)集合,也是博弈的參與者:Gi={i,N-i}.其中 N-i表示除實(shí)體節(jié)點(diǎn) i外的其他博弈參與者.S表示參與博弈的實(shí)體節(jié)點(diǎn)的策略集合S={Si,S-i},Si={sij}為實(shí)體節(jié)點(diǎn) i所有策略的集合.s={si,s-i}為博弈者的策略組合;u為參與者的收益函數(shù),ui(si,s-i為博弈者策略組合下所獲得的收益.q(·)為激勵(lì)懲罰因子,T為實(shí)體節(jié)點(diǎn)i的信譽(yù)值,T值越大,表示節(jié)點(diǎn)i的信譽(yù)度越高,T∈[0,1].
在引入信譽(yù)值作為激勵(lì)懲罰因子后,網(wǎng)構(gòu)軟件系統(tǒng)中實(shí)體節(jié)點(diǎn)協(xié)作時(shí)的博弈過程可以重新描述為:當(dāng)實(shí)體節(jié)點(diǎn)i提出協(xié)作請求并得到實(shí)體節(jié)點(diǎn)a的協(xié)作響應(yīng)后,實(shí)體節(jié)點(diǎn)i可獲得一定的收益 ,而節(jié)點(diǎn)i響應(yīng)實(shí)體節(jié)點(diǎn)a的請求,要用掉開銷ρ,同時(shí),實(shí)體節(jié)點(diǎn)i具有信譽(yù)值T,該信譽(yù)值作為激勵(lì)懲罰因子可動態(tài)調(diào)節(jié)響應(yīng)協(xié)作請求所用的開銷ρ.信譽(yù)值高的實(shí)體節(jié)點(diǎn)更容易獲得其他實(shí)體節(jié)點(diǎn)提供的服務(wù),因此使其開銷減小,這可以看作是對行為良好的實(shí)體節(jié)點(diǎn)的獎(jiǎng)勵(lì).而信譽(yù)值低的節(jié)點(diǎn)由于難以獲得其他節(jié)點(diǎn)的協(xié)作而使其開銷增大,作為對具有不良行為節(jié)點(diǎn)的懲罰.因此,網(wǎng)構(gòu)軟件系統(tǒng)中實(shí)體節(jié)點(diǎn)間基于信譽(yù)激勵(lì)的收益矩陣可以表示為圖3.
圖3 基于信譽(yù)激勵(lì)的協(xié)作博弈模型的收益矩陣Fig.3 The payoffmatrix of the trust-based cooperative game
定義5 博弈者i在某時(shí)隙t內(nèi)的期望效用函數(shù)的修正表達(dá)式為
用實(shí)體節(jié)點(diǎn)的信譽(yù)值對節(jié)點(diǎn)的收益函數(shù)進(jìn)行修正,可以有效限制節(jié)點(diǎn)的自私行為.假若節(jié)點(diǎn)i減小選擇協(xié)作策略的概率,節(jié)點(diǎn)的信譽(yù)會降低,反而會增大,根據(jù)不同的信譽(yù)值評估模型來選定合適的ε值后,節(jié)點(diǎn)i單方面減小時(shí),節(jié)點(diǎn) i的最終收益值u也會減小.這樣通過運(yùn)用信譽(yù)值來修正博弈過程中的收益函數(shù),可以有效的激勵(lì)實(shí)體節(jié)點(diǎn)合作.收益函數(shù)修正后,如果節(jié)點(diǎn)信譽(yù)值增加,收益值也會隨之增加,而信譽(yù)值較低的節(jié)點(diǎn)隨著時(shí)間的推移,收益函數(shù)值將會不斷降低.
引入激勵(lì)懲罰機(jī)制對效用函數(shù)進(jìn)行修正后,博弈D的Nash均衡可表示為
采用激勵(lì)機(jī)制后,大多數(shù)實(shí)體節(jié)點(diǎn)最終將趨于選擇策略“合作”,網(wǎng)絡(luò)將會達(dá)到Nash均衡狀態(tài),形成一種節(jié)點(diǎn)之間互相合作的網(wǎng)絡(luò)系統(tǒng).
本文的進(jìn)化博弈模型中采用DyTrust模型作為信譽(yù)值的評估模型,該模型中運(yùn)用近期信任、長期信任、反饋信任等信任度量的相關(guān)參數(shù),增強(qiáng)了節(jié)點(diǎn)行為改變的動態(tài)適應(yīng)能力以及對反饋信息的聚合能力.
在時(shí)間幀t內(nèi),節(jié)點(diǎn)j對節(jié)點(diǎn)i的信任度量可分為直接信任和間接信任2部分,節(jié)點(diǎn)j對節(jié)點(diǎn)i的信任度量記為Rtji;則Rt
ji可表示為式中:Dtji表示在時(shí)間幀t中,節(jié)點(diǎn)j對節(jié)點(diǎn)i的直接信任;Crjr表示節(jié)點(diǎn)j對提供間接信任值的節(jié)點(diǎn)r的反饋可信度;I(i)表示時(shí)間幀t中,所有和節(jié)點(diǎn)i進(jìn)行過交互的節(jié)點(diǎn)集合(不包括節(jié)點(diǎn)j);α表示信任評價(jià)的信心因子,取值滿足0≤α≤1.
直接信任值可定義為式中:eji為節(jié)點(diǎn)j對節(jié)點(diǎn)i的交互滿意度的評價(jià),0≤eji≤1;m表示在時(shí)間幀t中,節(jié)點(diǎn)i和節(jié)點(diǎn)j之間交互的總次數(shù).
在經(jīng)過連續(xù)多個(gè)時(shí)間幀后,節(jié)點(diǎn)j對節(jié)點(diǎn)i的信任度量可以用節(jié)點(diǎn)j對節(jié)點(diǎn)i的2個(gè)信任度量參數(shù):近期信任、長期信任來表示.
設(shè)節(jié)點(diǎn)j對節(jié)點(diǎn)i的近期信任值STji,該值可定義為
式中:β為信任學(xué)習(xí)因子,β越大,先前的經(jīng)驗(yàn)就越容易被遺忘.
設(shè)節(jié)點(diǎn)j對節(jié)點(diǎn)i的長期信任值LTji,可以利用式(8)進(jìn)行計(jì)算:
設(shè)在時(shí)間幀t,節(jié)點(diǎn)j和節(jié)點(diǎn)r的公共交互節(jié)點(diǎn)集合用Cset(j,r)表示,節(jié)點(diǎn)j和節(jié)點(diǎn)r對公共節(jié)點(diǎn)度量的差異dt
ji可以定義為
設(shè)節(jié)點(diǎn)j所能容忍節(jié)點(diǎn)r的最大偏差為θ,則反饋可信度的計(jì)算公式為
節(jié)點(diǎn)r如果提供誠實(shí)反饋,會提高其反饋可信度;提供不誠實(shí)反饋,則會降低其反饋可信度.
節(jié)點(diǎn)j對節(jié)點(diǎn)i的信任值Ttji取近期信任值與長期信任值中的較小值,即
最終,節(jié)點(diǎn)i的綜合信譽(yù)值是在某一時(shí)間段里,與i有過交互歷史的節(jié)點(diǎn)對節(jié)點(diǎn)i做出的綜合評價(jià).可表示為式中:Cset(-i)表示時(shí)間幀t內(nèi),與節(jié)點(diǎn)i有過交互的節(jié)點(diǎn)的集合.
利用DyTrust信任評估模型得出節(jié)點(diǎn)i的綜合信譽(yù)值T,作為進(jìn)化博弈模型中的參數(shù),有效的將DyTrust信任模型的反饋控制機(jī)制與進(jìn)化博弈論中的節(jié)點(diǎn)激勵(lì)機(jī)制相結(jié)合,不但可以增強(qiáng)信任模型的動態(tài)適應(yīng)能力,還可以促進(jìn)網(wǎng)構(gòu)系統(tǒng)中的構(gòu)件節(jié)點(diǎn)自主的進(jìn)行協(xié)作.這是單純使用DyTrust信任模型所不能解決的.
本文對上述GBDTM模型進(jìn)行了試驗(yàn)仿真.模擬實(shí)驗(yàn)初步驗(yàn)證了該修正模型的合理性.模擬實(shí)驗(yàn)初始場景中,在局域網(wǎng)上,設(shè)置了500個(gè)節(jié)點(diǎn),要求每一個(gè)節(jié)點(diǎn)都分別通過無激勵(lì)的博弈方法、基于DyTrust信任評估方法、以及GBDTM方法進(jìn)行協(xié)作交互.
設(shè)效用函數(shù)中參數(shù) ε=3,λ=120,ρ=80,α=0.5,β =0.5,博弈交互重復(fù)100 次.圖4 為3 種方法成功交互次數(shù)數(shù)目對比圖,其中,DyTrust表示用無激勵(lì)的博弈方法進(jìn)行交互;GBDTM表示用GBDTM方法進(jìn)行交互.從圖中可以看出,利用無激勵(lì)博弈方式進(jìn)行交互時(shí),隨著交互總次數(shù)的增加,成功交互次數(shù)反而下降,這充分證明了非合作博弈中節(jié)點(diǎn)存在“自私”行為.在利用DyTrust模型進(jìn)行交互時(shí),隨著交互次數(shù)的增加,節(jié)點(diǎn)的交互成功次數(shù)不斷波動,DyTrust模型能有效反應(yīng)網(wǎng)絡(luò)節(jié)點(diǎn)的信任值,使網(wǎng)絡(luò)節(jié)點(diǎn)在進(jìn)行交互前對潛合作對象做出有效判斷,但是,并不能促進(jìn)網(wǎng)絡(luò)中各節(jié)點(diǎn)進(jìn)行成功交互.在利用GBDTM方法進(jìn)行交互時(shí),隨著交互次數(shù)的增加,成功交互次數(shù)呈現(xiàn)出上升態(tài)勢,并最終趨于穩(wěn)定.可見,建立節(jié)點(diǎn)間激勵(lì)機(jī)制,能夠促使節(jié)點(diǎn)選擇信任策略來進(jìn)行博弈,從而達(dá)到節(jié)點(diǎn)間的有效合作,使網(wǎng)絡(luò)趨向穩(wěn)定,提高網(wǎng)絡(luò)的安全性.
圖4 成功交互次數(shù)數(shù)目對比Fig.4 The comparison diagramof successful interaction times
圖5反映了隨著博弈次數(shù)的增加,在無激勵(lì)博弈模型與GBDTM模型中,選擇合作策略的節(jié)點(diǎn)在數(shù)量上的變化.從圖中可以看出采用不同的信任模型,實(shí)體節(jié)點(diǎn)策略的調(diào)整有著明顯的變化,GBDTM模型中選擇合作策略的節(jié)點(diǎn)數(shù)目不斷增長,并在博弈的后期趨于一個(gè)穩(wěn)定的數(shù)目,達(dá)到Nash均衡狀態(tài).而無激勵(lì)博弈模型卻使選擇合作策略的實(shí)體節(jié)點(diǎn)數(shù)目不斷減少,最終下降到一個(gè)很低的水平.
圖5 成功交互節(jié)點(diǎn)數(shù)目對比Fig.5 The comparison diagramof successful interaction nodes
圖6可以看出隨著成功交互次數(shù)的增加,在無激勵(lì)博弈模型與GBDTM模型中,實(shí)體節(jié)點(diǎn)分別得到的收益值的變化.實(shí)體節(jié)點(diǎn)在無激勵(lì)的博弈過程中,能成功交互的次數(shù)很少,即使成功交互,也不能獲得很好的收益值.GBDTM模型中,隨著成功交互次數(shù)的增多,節(jié)點(diǎn)的信譽(yù)值不斷提高,因此節(jié)點(diǎn)收益值也隨之上升.同時(shí)促使實(shí)體節(jié)點(diǎn)在下一次策略選擇時(shí)更容易選擇合作行為,在這種信譽(yù)值與效用值互相促進(jìn)的情況下,形成一種“良性循環(huán)”.
圖6 收益值對比Fig.6 The comparison diagramof utility
在實(shí)體節(jié)點(diǎn)交互過程中建立激勵(lì)合作機(jī)制,可防止及克服節(jié)點(diǎn)自私行為的不斷發(fā)生,以保證網(wǎng)構(gòu)軟件系統(tǒng)基本功能的正常運(yùn)行.本文結(jié)合當(dāng)前對于博弈論中激勵(lì)合作機(jī)制的研究,提出了一種新的博弈理論與DyTrust信任模型相結(jié)合的GBDTM模型,該模型通過對效用函數(shù)的修正,可有效的促進(jìn)實(shí)體節(jié)點(diǎn)之間通過博弈自主的形成協(xié)作關(guān)系,經(jīng)理論分析證明以及實(shí)驗(yàn)驗(yàn)證,得出函數(shù)修正后的有效性,說明了該方法性能的優(yōu)劣,為提高網(wǎng)構(gòu)軟件系統(tǒng)的整體安全性奠定了基礎(chǔ).
[1]SHAwM.Self-healing:softening precision to avoid brittleness[C]//Proceeding of the 1st ACmSIGSOFTWorkshopon Self-Healing Systems.Charleston,USA,2002:111-113.
[2]MEIH,HUANG K,ZHAO H Y,et al.A software architecture centric engineering approach for internetware[J].Science in China:Series E,2006,36(10):1100-1126.
[3]楊芙清.軟件工程技術(shù)發(fā)展思索[J].軟件學(xué)報(bào),2005,16(1):1-7.YANG Fuqing.The speculation of software technology de-velopment[J].Journal of Software,2005,16(1):1-7.
[4]呂建,馬曉星,陶先平,等.網(wǎng)構(gòu)軟件的研究與進(jìn)展[J].中國科學(xué):E輯,2006,36(10):1037-1080.Lü Jian,MA Xiaoxing,TAO Xianping,et al.The research and development of Internetware[J].Science in China:Series E,2006,36(10):1037-1080.
[5]BLAZE M,F(xiàn)EIGENBAUmJ,LACY J.Decentralized trust management[C]//Proceedings of the 1996 IEEE Sympon Security and Privacy. Washington DC, USA, 1996:164-173.
[6]ABDUL-RAHMAN A,HAILESS.A distributed trustmodel[C]//Proceedings of the 1997 NewSecurity Paradigms Workshop.Cambria,United kingdom,1998:48-60.
[7]KAMVAR SD,SCHLOSSER mT,GARCIA-MOLINA H.The eigen trust algorithmfor reputation management in P2pnetworks[C]//Proceedings of the 12th International Conference on World Wide Web.Budapest,Hungary,2003:640-651.
[8]竇文,王懷民,賈焰,等.構(gòu)造基于推薦的peer-to-peer環(huán)境下的 Trust模型[J].軟件學(xué)報(bào),2004,15(4):571-583.DOUWen,WANG Huaimin,JIA Yan,etal.A Trustmodel based on reputation in P2pnetworks[J].Journal of Software,2004,15(4):571-583.
[9]YAMAMOTO A,ASAHARA D,ITAO T.Distributed pagerank:a distributed reputationmodel for open P2pnetworks[C]//Proceedings of International Symposiumon Applications and the Internet Workshops.Tokyo,Japan,2004:389-396.
[10]MARTIS,GARCIA-MOLINA H.Limited reputation sharing in P2psystems[C]//Proceedings of the 5th ACmConference Electronic Commerce. NewYork, USA,2004:91.
[11]LEE S,SHERWOOD R,BHATTACHARJEE B.Cooperative peer groups in NICE[J].Computing Networks,2006,50(4):523.
[12]XIONG L,LIU L.PeerTrust:supporting reputation based trust for peer to peer electronic communities[J].IEEE Transactions on Data and Knowledge Engineering,Special Issue on Peer to Peer based Data Management,2004,16(7):843-857.
[13]SRIVATSA M,XIONG L,LIU L.TrustGuard:countering vulnerabilitles in reputation management for decentralized overlay networks[C]//Proceedings of the 14th World Wide Web Conference(WWw2005).Chiba,Japan,2005:422-431.
[14]常俊勝,王懷民,尹剛.Dytrust:一種P2P系統(tǒng)中基于時(shí)間幀的動態(tài)信任模型[J].計(jì)算機(jī)學(xué)報(bào),2006,8(29):1301-1307.CHANG Junsheng,WANG Huaiming,YIN Gang.DyTrust:a time-frame based dynamic trust model for P2psystems[J].Journal of Computers,2006,8(29):1301-1307.
[15]董宇欣,印桂生,謝新強(qiáng).網(wǎng)構(gòu)軟件信任機(jī)制的形式化研究[J].哈爾濱工程大學(xué)學(xué)報(bào),2011,6(32):800-806.DONG Yuxin,YIN Guisheng,XIE Xinqiang.Study on formalization of trustmechanismfor Internetware[J].Journal of Harbin Engineering University,2011,6(32):800-806.
[16]馬志強(qiáng),印桂生.面向網(wǎng)構(gòu)軟件的信任驅(qū)動及演化模型[J].哈爾濱工程大學(xué)學(xué)報(bào),2010,8(31):1054-1060.MA Zhiqiang,YIN Guisheng.A trust-driven evolutionary model for Internetware[J].Journal of Harbin Engineering University,2010,8(31):1054-1060.
[17]VON NEUMANN J,MORGENSTERN O.Theory of games and economic behavior[M].Princeton:Princeton University Press,1994,328:36-39.
[18]FUDENBERG D,LEVINE D K.The theory of learning in games[M].[S.l.]:MIT Press,1998,78:167-169.