馮景瑜,時翌飛
(西安郵電大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,陜西 西安 710121)
隨著第五代移動通信技術(shù)(5th Generation Mobile Communication Technology,5G)和第六代移動通信技術(shù)(6th Generation Mobile Communication Technology,6G)的快速推廣應(yīng)用,微型傳感器和驅(qū)動器廣泛接入到傳統(tǒng)電網(wǎng)中構(gòu)建智能網(wǎng)絡(luò),有助于電力系統(tǒng)加速轉(zhuǎn)型,突破地域邊界[1-3]。電力物聯(lián)網(wǎng)(Power Internet of Things,PIoT)中擁有數(shù)量龐大的終端設(shè)備,這些終端設(shè)備由于時常處于模糊的安全邊界上而無法得到有效的保護,使其成為備受攻擊者關(guān)注的攻擊跳板[4-5]。未披露漏洞作為一種嚴(yán)重的系統(tǒng)漏洞,由于缺乏有效的緩解措施被攻擊者視為一種極具利用價值的攻擊工具。利用未披露漏洞發(fā)起的攻擊往往呈現(xiàn)出多角度、高持續(xù)和致命性的特點,比如APT攻擊、釣魚攻擊、勒索攻擊和供應(yīng)鏈攻擊等,未披露漏洞的利用使本就嚴(yán)峻的PIoT安全問題更為明顯。
盡快加固未披露漏洞是從源頭上阻斷攻擊鏈的最佳手段,但一個完整的漏洞生命周期一般涉及復(fù)雜的流程,諸如漏洞發(fā)現(xiàn)、上報、驗證、補丁開發(fā)、補丁驗證和補丁分發(fā)等[6]。此外,由于電力系統(tǒng)是閉環(huán)的生態(tài),單靠電力系統(tǒng)自身的應(yīng)急響應(yīng)能力無法應(yīng)對未披露漏洞引發(fā)的威脅。為改善這一問題,將協(xié)同工作者的領(lǐng)域知識引入響應(yīng)流程,使協(xié)作加快緩解進度成為更為普遍的方式。群智協(xié)同計算通過將協(xié)同任務(wù)以自由的形式發(fā)布給協(xié)同工作者,將群智資源協(xié)同匯集起來以實現(xiàn)資源的最大化利用[7]。目前,已有許多研究者將群智協(xié)同計算融入到其工作中,采用眾包策略有效提升了其工作準(zhǔn)確性和運行效率[8-9]。但是,由于這些方案通?;诓煌谋姲呗?,使得群智協(xié)同計算仍缺乏統(tǒng)一的泛化模型,無法將其有效應(yīng)用到其他領(lǐng)域中。
為規(guī)范協(xié)作緩解流程,標(biāo)準(zhǔn)化組織和機構(gòu)提出了協(xié)同漏洞披露(Coordinated Vulnerability Disclosure,CVD)的概念[10]。然而,CVD作為一組不具備強制措施的指導(dǎo)原則,缺乏對協(xié)同者的可信性保障,為自私性協(xié)同者提供了擾亂協(xié)同緩解的機會。信任機制和激勵機制的出現(xiàn)可以有效緩解群智協(xié)同工作場景中的自私性問題。其中,文獻[11]通過引入頻譜貢獻度以激勵自私的授權(quán)用戶積極貢獻其空閑頻譜,從而有效緩解了頻譜資源緊缺的問題。文獻[12]提出了一種基于聲譽的激勵方案(Proof-of-Reputation-X,PoRX)鼓勵區(qū)塊鏈中的節(jié)點積極參與協(xié)作。節(jié)點參與協(xié)作前會被授予初始聲譽值,并根據(jù)創(chuàng)建區(qū)塊的數(shù)量給予聲譽和代幣的獎勵或懲罰。文獻[13]提出的協(xié)同排序任務(wù)推薦方法(Task Recommendation with User-Hybrid Model and Collaborative Ranking,TR-UMCR)中,其根據(jù)參與者的歷史行為評估信譽值以此過濾掉一些劣質(zhì)用戶,從而提高協(xié)作任務(wù)的執(zhí)行效率。但是,CVD涉及復(fù)雜的緩解流程,上述基于聲譽激勵機制的工作難以有效界定CVD流程中協(xié)同者的工作量,因而無法有效抑制自私協(xié)同者。
針對CVD中難以應(yīng)對的自私性問題,擬提出黑板積分激勵方案。該方案利用黑板作為CVD流程的實施模板,并在黑板中構(gòu)建以協(xié)同貢獻度作為指標(biāo)的積分系統(tǒng)。對于較高協(xié)同貢獻度的協(xié)同者給予獎勵,對于較低協(xié)同貢獻度的協(xié)同者施加懲罰,促使自私協(xié)同者改變行為策略積極緩解未披露漏洞。設(shè)計基于信任機制的協(xié)同組劃分規(guī)則動態(tài)選取協(xié)同者,抵御共謀團體形成。結(jié)合多智能體協(xié)調(diào)器分散協(xié)同角色責(zé)任,避免單點失效,從而提升系統(tǒng)并行協(xié)作效率。同時,為驗證黑板積分激勵方案有效性,設(shè)計仿真實驗與不同評估標(biāo)準(zhǔn)的激勵方案進行對比。
黑板作為對專家系統(tǒng)的擴展,融合多知識源解決特定的復(fù)雜問題,使復(fù)雜問題被劃分為多個子問題分散給知識源,由協(xié)調(diào)器負(fù)責(zé)協(xié)調(diào)知識源間的協(xié)作。黑板作為群智協(xié)同的典型模型被廣泛應(yīng)用在復(fù)雜協(xié)同知識共享領(lǐng)域[14-16]。盡管在群智協(xié)同場景中黑板模型具有以上優(yōu)勢,但發(fā)揮這些優(yōu)勢的前提是假設(shè)所有的協(xié)同者均是誠實的??紤]缺少對協(xié)同者工作量的界定,黑板無法應(yīng)對可能存在的自私性問題。一旦自私協(xié)同開始發(fā)生,并逐漸演化成合謀小組,協(xié)同緩解流程將受到阻礙,間接地為未披露漏洞持續(xù)利用創(chuàng)造了機會。
為盡快緩解PIoT中的未披露漏洞,在群智協(xié)同緩解的模式下提出了黑板積分激勵方案。黑板積分激勵方案的總體架構(gòu)如圖1所示。
圖1 黑板積分激勵方案總體架構(gòu)
黑板積分激勵方案包含協(xié)同者、多智能體和緩解方案等3種實體類型。
1)協(xié)同者。參與群智協(xié)同緩解的安全工作者,該安全工作者可進一步細化為3種類型。一是提交者Pi熱衷于對緩解任務(wù)做出積極響應(yīng),提出緩解方案,并獲得相應(yīng)的獎勵,ΨP表示由提交者組成的協(xié)同組。貢獻度較高的提交者有機會轉(zhuǎn)化為驗證者。二是驗證者Vi在協(xié)同者中享有較高聲譽的安全工作者,并負(fù)責(zé)驗證提交者提交的緩解方案,在驗證和評估階段都擁有裁決權(quán),Ψv表示由驗證者組成的協(xié)同組。三是候選者Ci在候選池Ω中等待被選中參與到緩解任務(wù)中。
2)多智能體(Multi-Agent,MA)協(xié)調(diào)器。充當(dāng)系統(tǒng)中的可信協(xié)調(diào)機構(gòu),負(fù)責(zé)監(jiān)控協(xié)同者同黑板積分系統(tǒng)之間的交互行為,優(yōu)化系統(tǒng)內(nèi)群智資源利用,并負(fù)責(zé)量化協(xié)同者的信任值和協(xié)同貢獻度。
3)緩解方案。由提交者發(fā)布的緩解未披露漏洞的方案,被接受的當(dāng)前緩解方案Si將被快速分發(fā)給失陷設(shè)備,并替代歷史緩解方案Sj。
為規(guī)范協(xié)同緩解流程,依據(jù)安全漏洞處理標(biāo)準(zhǔn)中對漏洞生命周期的描述[6],將協(xié)同緩解流程抽象為5個連續(xù)的階段。
1)提出階段。提交者在該階段積極提交緩解方案,黑板在該階段廣泛收集提交的緩解方案。
2)驗證階段。當(dāng)緩解方案被提交后,多智能體協(xié)調(diào)器將秘密地向驗證組廣播所收集到的緩解方案,驗證組負(fù)責(zé)對所提出的緩解方案進行正確性驗證。
3)評估階段。該階段驗證組負(fù)責(zé)對收集來的緩解方案進行投票,并結(jié)合多智能體協(xié)調(diào)器計算出緩解方案質(zhì)量,評估出提交者的協(xié)同貢獻度和信任值。
4)接受階段。當(dāng)一個緩解方案被接受時,該緩解方案將被廣泛地分發(fā)給脆弱的失陷設(shè)備,進行漏洞加固。
5)撤銷階段。當(dāng)緩解方案被廣泛地分發(fā)給脆弱設(shè)備后,漏洞生命周期將結(jié)束,群智資源將被釋放。
在協(xié)同緩解PIoT未披露漏洞過程中,協(xié)同者需要對系統(tǒng)下發(fā)的緩解任務(wù)做出積極響應(yīng),使得緩解流程盡快流轉(zhuǎn)。對于消極應(yīng)對緩解任務(wù)的協(xié)同者,應(yīng)盡早檢測并施以懲罰,對于積極響應(yīng)緩解任務(wù)的協(xié)同者,依據(jù)其協(xié)同貢獻給予相應(yīng)的激勵,使協(xié)同緩解形成一個良性的循環(huán)?;谶@一思路,在黑板模型的基礎(chǔ)上設(shè)計了黑板積分激勵以構(gòu)建具備激勵效果的未披露漏洞協(xié)同緩解流程。
為使協(xié)同貢獻度和協(xié)同者實際工作量具有較強的關(guān)聯(lián)性,引入一種緩解方案質(zhì)量評估方法得到緩解質(zhì)量(Quality of Mitigation,QoM),便于對協(xié)同者的貢獻度進行評價。
2.1.1 通用緩解對象屬性描述
根據(jù)信息安全技術(shù)網(wǎng)絡(luò)威脅信息格式規(guī)范[17]中定義的緩解措施格式,將提交的緩解方案拆解為多個結(jié)構(gòu)化組件,其涉及的常見對象屬性及描述如表1所示。
表1 緩解措施通用對象屬性描述
為方便后續(xù)對緩解方案質(zhì)量的評估,對提交的緩解方案Si按照該標(biāo)準(zhǔn)進行文本格式化,定義為
Si=
(1)
式中:Tstage表示緩解實施階段;Ttype表示緩解實施類型;Tobj表示緩解目標(biāo);Tdesc表示描述性文本;Timp表示緩解影響;Tcost表示緩解實施成本;Teff表示實施效益。
2.1.2 緩解方案質(zhì)量評估方法
隨著協(xié)同緩解過程的持續(xù),所提交的緩解方案數(shù)量逐漸增多,系統(tǒng)所維護的緩解方案庫將過于龐大。協(xié)同緩解過程中發(fā)現(xiàn)具有相似性威脅的可能性逐漸增大,一旦發(fā)現(xiàn)有類似的威脅事件出現(xiàn),其相應(yīng)的緩解方案可被直接使用,從而使相似性威脅被盡快阻止。
由于緩解方案以結(jié)構(gòu)化文本的形成存在,利用詞頻-逆向文件頻率[18](Term Frequency-Inverse Document Frequency,TF-IDF)對每個屬性字段進行關(guān)鍵詞提取,由各屬性關(guān)鍵詞組成緩解方案的文本向量,通過衡量兩個關(guān)鍵詞向量之間的距離,從而快速判決兩個緩解方案的相似性。詞頻Ft的計算表達式為
(2)
式中:ni,j表示第i個詞條在文本dj中出現(xiàn)的次數(shù);nk,j表示dj文本的總詞數(shù)。
IDF常被用來統(tǒng)計某個詞條在文檔中出現(xiàn)的次數(shù),其表達式為
(3)
式中:|D|表示語料庫中的文件總數(shù);{j:ti∈dj}表示包含詞ti的文件數(shù)目。最終得到詞ti在文本dj中的TF-IDF值,表達式為
Ft-Fid=FtFid
(4)
通過對每個緩解方案中通用屬性文本的關(guān)鍵詞進行提取,過濾掉停用詞,并根據(jù)詞頻進行排序,生成關(guān)鍵詞集合。最終,由緩解方案通用屬性關(guān)鍵詞集合組成的緩解方案文本向量可被進一步表示為
Γm=
(5)
式中:wstage表示緩解方案實施階段的關(guān)鍵詞集合;wtype表示緩解類型的關(guān)鍵詞集合;wobj表示對緩解目標(biāo)的關(guān)鍵詞集合;wdesc表示對緩解方案具體描述的關(guān)鍵詞集合;wimp表示緩解方案可能造成影響的關(guān)鍵詞集合;wcost表示緩解方案可能產(chǎn)生成本的關(guān)鍵詞集合;weff表示緩解方案實施效率的關(guān)鍵詞集合。
以對緩解方案描述的描述屬性為例,其關(guān)鍵詞集合可被定義為wdesc=
(6)
通過比較當(dāng)前Γm和Γn之間的距離φmn,可有效計算出兩者文本相似度,其中l(wèi)表示提取出的關(guān)鍵詞數(shù)量。同時,設(shè)置相似度閾值為ε,如果φmn>ε,則認(rèn)為當(dāng)前緩解方案與歷史緩解方案一致,將當(dāng)前緩解方案Si與歷史緩解方案Sj合并;如果φmn≤ε,則認(rèn)為當(dāng)前的緩解方案同歷史緩解方案的相似度較低,具有一定的創(chuàng)新性,其可能在后續(xù)流程中被接受。
緩解方案質(zhì)量評估算法描述了緩解方案質(zhì)量評估的完整過程,驗證組每個成員的投票次數(shù)定義為vvotei∈{0,1},通過綜合這兩個指標(biāo)得到目標(biāo)緩解措施的緩解質(zhì)量Qi。此外,考慮到緩解方案質(zhì)量可能超過1,利用歸一化方法[19]對其進行處理,以方便后續(xù)協(xié)同貢獻度的評估,具體的步驟如下。
步驟1將最大緩解質(zhì)量Qimax初始化為1,最小緩解質(zhì)量Qimin初始化為0。
步驟4對于每個得到的緩解質(zhì)量Qi,進行歸一化處理。如果Qi>Qimax,則將緩解質(zhì)量賦值給最大值Qimax=Qi。如果Qi 一旦協(xié)同者參與到協(xié)同緩解中,系統(tǒng)將分配必要資源給協(xié)同者,以協(xié)助其完成緩解任務(wù)。然而,自私的協(xié)同者會消極應(yīng)對緩解任務(wù),并故意占用系統(tǒng)資源。因此,需要設(shè)置一些獎罰規(guī)則,依據(jù)協(xié)同者的實際工作量,對其協(xié)同表現(xiàn)予以評價,通過引入?yún)f(xié)同貢獻度評估完成這一目標(biāo)。 在系統(tǒng)初始化時,每個候選池Ω中的候選協(xié)同者將被授予一個初始貢獻度C0,確保每一個候選協(xié)同者均擁有在首輪緩解任務(wù)開始前被選中的公平的機會。然后,在次輪協(xié)同緩解中,協(xié)同貢獻度將根據(jù)協(xié)同者的歷史行為開始動態(tài)更新。 目標(biāo)漏洞的協(xié)同緩解難度直接決定了協(xié)同者緩解該漏洞所需付出的工作量,較為嚴(yán)重的漏洞威脅需要利用大量的群智資源緩解。此外,每個協(xié)同者的實際工作情況應(yīng)與其提交的緩解方案質(zhì)量相關(guān)聯(lián)。根據(jù)目標(biāo)漏洞的緩解難度、所提交緩解方案的質(zhì)量及協(xié)同者在協(xié)同緩解中的參與度,將協(xié)同貢獻度定義為由威脅等級評分Icvss、緩解質(zhì)量Qi以及協(xié)同度Ai決定的評估指標(biāo)。通過這個三元參數(shù)的共同作用,綜合得到協(xié)同貢獻度,有效地刻畫協(xié)同者在協(xié)同緩解過程中的表現(xiàn),為黑板積分激勵的實施提供評估依據(jù)。協(xié)同貢獻度的計算函數(shù)可定義為 Coni=f(Ai,Icvss,Qi) (7) 威脅等級評分是由通用漏洞評分系統(tǒng)[20](Common Vulnerability Scoring System,CVSS)評價得到,用于量化一個漏洞的威脅程度。根據(jù)漏洞產(chǎn)生的危害影響,其威脅等級評分表達式為 Icvss=λVL[1-(1-Vcon)(1-Vinv)(1-Vava)] (8) 式中:λ為修正因子,通常設(shè)置為λ=10.41;VL是脆弱性利用程度;(Vcon,Vinv,Vava)三元組描繪了該漏洞可能對目標(biāo)造成的機密性、完整性、可用性危害程度。 此外,協(xié)同度Ai表示協(xié)同者對緩解任務(wù)響應(yīng)的積極程度,其表示式為 (9) 式中,ri,pi分別表示協(xié)同者拒絕或參與協(xié)同緩解任務(wù)的次數(shù)。由于每個協(xié)同者可能擁有提交者或驗證者兩種身份,對于式(9)將參與次數(shù)pi進一步定義為 pi=ci+fi+vi (10) 式中:ci表示提交正確緩解方案的次數(shù);fi表示提交錯誤緩解方案的次數(shù)。 對于獲得較高協(xié)同貢獻度的協(xié)同者,會以較大概率在下一輪中被選中,而較低協(xié)同貢獻度的協(xié)同者可能仍存在于候選池中。此外,考慮到惡意協(xié)同者會通過提交錯誤的或無效的緩解方案以擾亂協(xié)同緩解流程。通過對協(xié)同者的信任評估可有效抵御這類威脅。根據(jù)協(xié)同者的歷史行為評估的信任值會在每輪協(xié)同緩解結(jié)束時動態(tài)更新,對于較低信任值的協(xié)同者將會從候選組中移除。考慮到信任值應(yīng)該被限制在區(qū)間[0,1]內(nèi),協(xié)同者信任值Ti可以被定義為 (11) 式中,δ為信任門限。當(dāng)協(xié)同者總是提交正確的緩解方案時,即fi=0,Ti將始終等于1。一旦協(xié)同者開始提交錯誤的緩解方案后,fi>0,Ti將在信任門限的作用下開始快速衰減。 由于Vi和Pi均由候選池中Ω根據(jù)協(xié)同貢獻度選取產(chǎn)生,一旦惡意Vi和Pi結(jié)成合謀團體,即使Pi提交錯誤的緩解方案也會由于Vi的投票被通過。同時,使得Pi獲得較高的貢獻度,從而繼續(xù)維持這個合謀團體存在。 考慮到這種情況,可以在每輪協(xié)同開始前,設(shè)計一種協(xié)同組劃分規(guī)則動態(tài)地從候選池中選取協(xié)同者。當(dāng)協(xié)同緩解任務(wù)下發(fā)時,所有的協(xié)同者對組內(nèi)其他協(xié)同者的信息一無所知??紤]無法得知他人身份,合謀者無法根據(jù)此前協(xié)商的共謀策略實施共謀攻擊。由于首輪的協(xié)同組劃分沒有可供參考的歷史行為信息,需要在候選池中隨機選取產(chǎn)生Vi和Pi。首輪協(xié)同者的協(xié)同貢獻度初始化為一個統(tǒng)一的初始貢獻度C0,以使協(xié)同者具備公平的機會被選中。Vi和Pi在每輪協(xié)同緩解的提交組、驗證組和候選組中輪換產(chǎn)生,具體的協(xié)同組劃分遵循以下規(guī)則。 規(guī)則1Ω必須不斷更新,當(dāng)組內(nèi)協(xié)同者的信任值Ti小于信任門限δ時,這些協(xié)同者將被從Ω中移除,并無法參與到后續(xù)的協(xié)同緩解流程中。 規(guī)則2在每一輪協(xié)同開始前,必須從候選組Ω中隨機選擇一些Vi和Pi,任何一個被選中的協(xié)同者只能具有一個身份,且Vi和Pi互相不知道對方的身份信息。 規(guī)則3在每一輪協(xié)同緩解開始前,被選中的Vi和Pi的數(shù)量應(yīng)該保持在至少1個以上。 規(guī)則4在每一輪協(xié)同結(jié)束后,對于ΨP和Ψv中的協(xié)同者,如果Vi或Pi的協(xié)同貢獻度Coni低于Vi的協(xié)同貢獻度閾值σv或Pi的協(xié)同貢獻度閾值σP,則該協(xié)同者將被從ΨP或Ψv中移除,且滿足σv>σP。協(xié)同組劃分的步驟如下。 步驟1首先將提交組ΨP和驗證組Ψv置為空,并從候選池Ω中隨機劃分Ω1和Ω2兩個協(xié)同組。其中兩個協(xié)同組Ω1和Ω2受到Ω1∩Ω2=?和Ω1∪Ω2=Ω約束。 步驟2對于第一個協(xié)同組Ω1中的每一個候選者Ci,如果每一個候選者的信任值Ti≥δ,且候選者的協(xié)同貢獻度Coni≥σP,則將候選者Ci置入提交組ΨP中ΨP={Ci}∪ΨP。 步驟3對于第二個協(xié)同組Ω2中的每一個候選者Ci,如果每一個候選者的信任值Ti≥δ,且候選者的協(xié)同貢獻度Coni≥σv,則將候選者Ci置入驗證組Ψv中Ψv={Ci}∪Ψv。 步驟4不斷的重復(fù)上述步驟,直到所有候選池中的候選者被成功劃分。 考慮未披露漏洞的群智協(xié)同緩解中由于涉及復(fù)雜的通信和協(xié)商流程,因此合理地分配群智協(xié)同者、分散協(xié)同者責(zé)任及避免單點失效成為協(xié)同緩解中需要考慮的問題。多智能體作為人工智能領(lǐng)域中的一個重要研究分支,相較于傳統(tǒng)系統(tǒng)具有更廣泛的任務(wù)領(lǐng)域、更高的容錯率和更好的魯棒性[21]。目前,已有許多工作將多智能體和黑板相結(jié)合,以分散復(fù)雜系統(tǒng)中的角色責(zé)任,協(xié)調(diào)群智資源[22-24]。在此基礎(chǔ)上設(shè)計了一種多智能體協(xié)調(diào)器,各智能體模擬實體間的行為,由多智能體協(xié)調(diào)器代理協(xié)同實體間的交互行為,使協(xié)作者沒有權(quán)限直接同黑板進行交互。此外,系統(tǒng)中的各智能體以并行方式運行,消除了單點失效造成系統(tǒng)崩潰的可能。多智能體協(xié)調(diào)器過程如圖2所示。 圖2 多智能體協(xié)調(diào)器 由圖2可以看出,設(shè)計的多智能體協(xié)調(diào)器包含以下6個智能體。 1)協(xié)同智能體。為參與協(xié)同緩解的每個協(xié)同者分配一個智能體,所有來自協(xié)同者的訪問請求都需要經(jīng)過認(rèn)證智能體的授權(quán)和驗證。 2)交互智能體。負(fù)責(zé)轉(zhuǎn)發(fā)系統(tǒng)中的請求,協(xié)同者對黑板積分系統(tǒng)的所有操作都需要由交互智能體負(fù)責(zé)轉(zhuǎn)發(fā)。 3)評估智能體。負(fù)責(zé)量化協(xié)同貢獻度和協(xié)同者信任值。 4)反饋智能體。在每輪結(jié)束時,反饋智能體將向協(xié)同者分配獎勵。 5)分配和撤銷智能體。負(fù)責(zé)協(xié)同者訪問憑證的管理,當(dāng)協(xié)同者的生命周期結(jié)束時,訪問憑證將被撤銷。 6)授權(quán)智能體。負(fù)責(zé)協(xié)同者身份識別、訪問控制等,避免協(xié)同者訪問憑證偽造。 使用Python 3.7搭建實驗平臺,對所提方案進行仿真實驗,驗證黑板積分激勵方案的性能。仿真環(huán)境參數(shù)的默認(rèn)值設(shè)置如表2所示。 表2 仿真環(huán)境參數(shù)默認(rèn)值 采用基于循環(huán)的方式,仿真所提方案在每一輪群智協(xié)同緩解中隨機設(shè)置一定比例的自私協(xié)同者。在實驗中假設(shè)自私協(xié)同者總是對下發(fā)的緩解任務(wù)做出消極響應(yīng),而積極協(xié)同者則總是對下發(fā)的緩解任務(wù)做出積極響應(yīng)。在不同的環(huán)境參數(shù)設(shè)置下模擬黑板積分激勵方案,評估該方案的性能。 仿真實驗從抑制惡意提交、抑制自私協(xié)同者和協(xié)同貢獻度變化等方面,對黑板積分激勵方案進行了評估。黑板積分激勵方案與基于聲譽的區(qū)塊鏈礦工激勵方案[12](Proof of Reputation-X,PoRX)、基于歷史行為的群智感知激勵方案[13](Task Recommendation with User-Hybrid Model and Collaborative Ranking,TR-UMCR)以及未引入激勵方案對自私協(xié)同者的抑制效果進行對比,具體結(jié)果如圖3所示。其中,PoRX方案對自私協(xié)同者的抑制效果呈現(xiàn)出一定的周期性,黑板積分激勵方案相較于TR-UMCR方案對于自私行為的反應(yīng)較為敏感。 圖3 黑板積分對自私協(xié)同者的抑制效果 由圖3可以看出,在仿真開始時,首先將自私協(xié)同者的比例設(shè)置為50%。在實驗中也仿真了其他激勵方案,隨著循環(huán)輪數(shù)的增多,黑板積分激勵方案對自私協(xié)同者的抑制效果要好于其他的對比方案,可對自私行為做出快速反應(yīng)。通過黑板積分激勵方案,一些自私的協(xié)同者為獲得更多獎勵,將改變自己行為模式,積極參與協(xié)同緩解。 此外,不誠實的協(xié)同者在協(xié)同緩解過程中會提出大量的虛假緩解方案,造成系統(tǒng)資源浪費,擾亂漏洞協(xié)同緩解流程。因此,黑板積分激勵的另一個關(guān)鍵指標(biāo)是抑制惡意提交,惡意提交的抑制效果具體如圖4所示。 圖4 惡意提交的抑制效果 由圖4可以看出,沒有引入信任機制的傳統(tǒng)方案產(chǎn)生的惡意提交數(shù)量總是高于黑板積分激勵方案。在仿真中,信任門限δ分別設(shè)置為0.2、0.5、0.8。其中,當(dāng)δ=0.8時,表明當(dāng)以較高門限作為信任指標(biāo)時,惡意提交的數(shù)量將顯著減少。 利用仿真實驗衡量所提方案能否有效追蹤協(xié)同貢獻度變化。分別在積極和消極條件下進行了實驗,積極模式下協(xié)同貢獻度變化追蹤和消極模式下協(xié)同貢獻度變化追蹤分別如圖5和圖6所示。 圖5 積極模式下協(xié)同貢獻度變化追蹤 圖6 消極模式下協(xié)同貢獻度變化追蹤 由圖5和圖6可以看出,在積極模式下,當(dāng)自私協(xié)同者的貢獻被黑板積分激勵方案抑制后,將開始積極參與協(xié)同緩解。此后,協(xié)同貢獻將重新回到較高水平。在消極模式下,當(dāng)自私的協(xié)同者貢獻度超過初始C0時,將停止參與協(xié)同緩解任務(wù),這將導(dǎo)致隨后協(xié)同貢獻度進一步降低。因此,所提出的黑板積分激勵方案能夠有效地匹配協(xié)同者貢獻度的變化趨勢。 針對CVD流程中存在的協(xié)同者自私性問題,提出了群智協(xié)同緩解PIoT未披露漏洞的黑板積分激勵方案,以在抑制自私協(xié)同者和抵御共謀團體的條件下加快未披露漏洞加固流程。引入緩解方案質(zhì)量評估方法輔助量化協(xié)同貢獻度以界定各階段協(xié)同者的實際工作量。此外,在協(xié)同組劃分規(guī)則的幫助下,每輪動態(tài)選取群智協(xié)同者,以抵御共謀團體的形成。最后,將多智能體協(xié)調(diào)器集成到黑板積分激勵方案中,劃分協(xié)同緩解中的各實體責(zé)任,由各智能體代理實體的交互行為。仿真結(jié)果表明,與基于聲譽和歷史行為的激勵方案相比,所提方案在抑制自私協(xié)同者效果上具有更顯著的優(yōu)勢,可以積極鼓勵協(xié)同者參與緩解未披露漏洞。在未來的工作中,考慮構(gòu)建一個具有匿名性和隱私保護的未披露漏洞協(xié)同緩解環(huán)境。2.2 協(xié)同貢獻度激勵方法
2.3 協(xié)同組劃分規(guī)則
2.4 基于多智能體的協(xié)調(diào)器
3 性能分析與討論
3.1 仿真設(shè)置
3.2 仿真結(jié)果與討論
4 結(jié)語