国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于激勵(lì)機(jī)制的網(wǎng)絡(luò)攻防演化博弈模型研究

2020-01-08 01:58:56徐曉桐王高才胡錦天
關(guān)鍵詞:激勵(lì)機(jī)制群體環(huán)境

徐曉桐,王高才,胡錦天

(廣西大學(xué) 計(jì)算機(jī)與電子信息學(xué)院,南寧 530004)

1 引 言

隨著互聯(lián)網(wǎng)規(guī)模的擴(kuò)大,網(wǎng)絡(luò)的安全性和用戶隱私性受到了極大地干擾,網(wǎng)絡(luò)安全問題在現(xiàn)代社會(huì)中也引起了人們的高度注視,網(wǎng)絡(luò)的安全性已經(jīng)變成阻礙信息技術(shù)發(fā)展的重要因素之一.針對(duì)網(wǎng)絡(luò)環(huán)境以及攻擊手段的日趨復(fù)雜化,僅僅依靠一些被動(dòng)的防御措施已無法保障網(wǎng)絡(luò)空間的安全.因此,尋找能夠?qū)W(wǎng)絡(luò)環(huán)境進(jìn)行檢測,并能及時(shí)預(yù)判是否安全進(jìn)而積極采取防御手段的新技術(shù)尤為必要.

博弈論的研究最早出現(xiàn)于經(jīng)濟(jì)學(xué)研究領(lǐng)域,1944年馮·諾依曼(von Neumann)和摩根斯坦(Morgenstern)提出了“博弈論與經(jīng)濟(jì)學(xué)”,受到了人們的廣泛關(guān)注[1].演化博弈理論是一種將博弈理論與動(dòng)態(tài)演化過程相結(jié)合的理論,它是在傳統(tǒng)博弈論的基礎(chǔ)之上引進(jìn)了生物學(xué)的進(jìn)化理論.演化博弈論能夠在各個(gè)不同的領(lǐng)域獲得極大的發(fā)展應(yīng)歸功于史密斯(Smith,1973)與普瑞斯(Price,1974)[2],他們提出了演化博弈理論中的基本概念:演化穩(wěn)定策略(Evolutionary Stable Strategy ESS).其中,參與者將不再是完全理性的個(gè)體,而是介于完全理性和非完全理性之間的、在一定限制條件下的有限理性.群體之間的局中人在演化過程中不斷地糾錯(cuò)、模仿和改進(jìn),一步步趨向于某種穩(wěn)定策略,最終達(dá)到一種博弈的平衡狀態(tài),從而獲得最優(yōu)策略以最大化自身利益的問題.

在網(wǎng)絡(luò)攻防中,入侵者做出某些行為來實(shí)施入侵以及一個(gè)計(jì)算機(jī)網(wǎng)絡(luò)做出某些行為來防止或抵抗攻擊的過程與演化博弈的過程具有相似之處,因此,相當(dāng)多的研究通過建立網(wǎng)絡(luò)攻防博弈模型,來更加直觀的選取最優(yōu)策略[3-6].在網(wǎng)絡(luò)安全領(lǐng)域,典型的演化博弈模型包括兩個(gè)對(duì)抗的參與者:攻擊者和防御者.攻擊者會(huì)試圖在防御者的控制下破壞或摧毀網(wǎng)絡(luò)環(huán)境,防御者可以通過增加自身的安全投資來增強(qiáng)網(wǎng)絡(luò)環(huán)境的防御能力.基于局中人的有限理性原則,攻防雙方通過結(jié)合歷史經(jīng)驗(yàn)來改進(jìn)各自的策略選擇.通過不斷地學(xué)習(xí)和改進(jìn)體制,攻防雙方逐漸演變?yōu)榉€(wěn)定狀態(tài),有效提高了防御方選取最優(yōu)策略的可靠性和準(zhǔn)確性,保障了網(wǎng)絡(luò)空間的安全.

本文的組織結(jié)構(gòu)如下:第2節(jié)介紹相關(guān)研究工作;第3節(jié)介紹網(wǎng)絡(luò)攻防演化博弈模型及相應(yīng)概念;第4節(jié)討論演化博弈最優(yōu)策略算法的描述;第5節(jié)進(jìn)行仿真實(shí)驗(yàn)并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析;最后第6節(jié)對(duì)全文進(jìn)行了總結(jié).

2 相關(guān)研究工作

博弈論在網(wǎng)絡(luò)安全方面的應(yīng)用已經(jīng)成為最近幾年的一個(gè)研究熱潮,由于傳統(tǒng)的博弈理論需要滿足太多的前提條件,比如完全信息條件等等,這與實(shí)際網(wǎng)絡(luò)環(huán)境有較大的出入,從而削弱了博弈模型的實(shí)際應(yīng)用范圍.因此,研究人員開始將演化博弈理論引入網(wǎng)絡(luò)安全的研究中.關(guān)注方向主要有以下三個(gè)方面:一是關(guān)于網(wǎng)絡(luò)環(huán)境脆弱性的分析;二是信息安全的防御投資策略;三是關(guān)于網(wǎng)絡(luò)群體行為的研究.

在對(duì)網(wǎng)絡(luò)環(huán)境的脆弱性分析時(shí),王元卓等人建立了基于隨機(jī)Petri網(wǎng)的攻防博弈模型[7],可以對(duì)目標(biāo)網(wǎng)絡(luò)的攻擊成功率、平均攻擊時(shí)間、脆弱節(jié)點(diǎn)以及潛在攻擊路徑等方面進(jìn)行安全分析與評(píng)價(jià).J Liu等人提出了一種博弈理論方法制定了涉及多個(gè)檢測和防御決策的問題[8],以此來優(yōu)化入侵檢測策略、降低能耗以及減少了報(bào)警信息,提高了傳感器云中數(shù)據(jù)的安全性.Alabdel Abass等人使用演化博弈理論分析了云存儲(chǔ)的APT(Advanced Persistent Threat 高級(jí)持續(xù)性威脅)攻擊/防御策略[9],利用復(fù)制動(dòng)態(tài)方程來研究云存儲(chǔ)系統(tǒng)的動(dòng)態(tài)穩(wěn)定性,以表征局部漸近穩(wěn)定的均衡策略,并顯示其間的關(guān)系漸近穩(wěn)定性和演化穩(wěn)定性.Yezekael Hayel等人構(gòu)建了演化泊松博弈模型[10],并設(shè)計(jì)了控制軟件用戶行為以實(shí)現(xiàn)系統(tǒng)目標(biāo)的機(jī)制.為了尋求最優(yōu)策略集,Liu等認(rèn)為在研究基本協(xié)同演化方法上,魯棒性是一個(gè)重要指標(biāo),并且他們研究了群體協(xié)同攻擊規(guī)則對(duì)合作博弈攻擊的魯棒性[11].然而該模型仍局限于需要完全信息.事實(shí)上,由于不同的參與者具有不同的認(rèn)知能力以及非對(duì)稱的信息,策略演化的過程將不可避免地缺乏遠(yuǎn)見.因此,探索非確定性策略演化分析具有重要意義.Hu等人利用復(fù)制動(dòng)態(tài)方程來描述攻防行為[12],總結(jié)了不同類型參與者采取不同策略的演化過程,并通過計(jì)算演化穩(wěn)定均衡給出了最優(yōu)的防御策略.張?jiān)频热颂岢鲆环N基于不完全信息的攻防博弈模型[13],使用證據(jù)理論來描述信息的模糊性,更加全面的尋求最優(yōu)防御策略.文獻(xiàn)[14]在博弈論的基礎(chǔ)上,優(yōu)化了網(wǎng)絡(luò)安全評(píng)估機(jī)制.文獻(xiàn)[15]在非合作演化博弈的基礎(chǔ)上,提出了具有不對(duì)稱信息的演化博弈模型,并利用系統(tǒng)動(dòng)力學(xué)對(duì)模型進(jìn)行演化分析,通過引入第三方懲罰機(jī)制來進(jìn)一步解決網(wǎng)絡(luò)安全問題.

由于演化博弈研究的范圍和應(yīng)用范圍正在不斷擴(kuò)大,Wang等人在研究信息安全時(shí)使用演化博弈論來尋求長期最優(yōu)安全投資策略,分別考慮了針對(duì)性和機(jī)會(huì)性兩種類型的攻擊的最優(yōu)信息安全投資問題[16].Zhang等人利用演化博弈理論[17],解決網(wǎng)絡(luò)安全攻防交互中的決策問題,并為防御者提供量化的方法來計(jì)算安全收益.通過這種量化方式,可以為網(wǎng)絡(luò)制定合適的安全策略.Pan等人提出了一種動(dòng)態(tài)的非對(duì)稱信息演化博弈模型[18],從微觀角度分析了參與者的決策動(dòng)機(jī),提出了最優(yōu)投資策略.

另外,在研究網(wǎng)絡(luò)群體行為時(shí),文獻(xiàn)[19]探討了網(wǎng)絡(luò)群體中用于隱私保護(hù)的群體結(jié)構(gòu)演化博弈,它可以改進(jìn)網(wǎng)絡(luò)群體用戶之間的隱私保護(hù)行為,并促進(jìn)整個(gè)網(wǎng)絡(luò)中隱私保護(hù)行為的傳播;王元卓等人在介紹網(wǎng)絡(luò)群體行為評(píng)估標(biāo)準(zhǔn)時(shí)[20],利用演化博弈模型討論其群體行為的可行性.文獻(xiàn)[21]利用系統(tǒng)動(dòng)力學(xué)對(duì)多個(gè)網(wǎng)絡(luò)群體系統(tǒng)進(jìn)行實(shí)驗(yàn),評(píng)估了群體演化狀態(tài)的穩(wěn)定性,為特定策略的演化穩(wěn)定性提供了相應(yīng)的條件.

針對(duì)已有的研究結(jié)果,本文研究并提出了一種引入第三方激勵(lì)機(jī)制的網(wǎng)絡(luò)攻防演化博弈模型,將激勵(lì)機(jī)制與懲罰機(jī)制相結(jié)合,并根據(jù)網(wǎng)絡(luò)攻防場景對(duì)網(wǎng)絡(luò)攻防群體的行為策略演化趨勢進(jìn)行分析,在此基礎(chǔ)上尋求最優(yōu)防御策略.有效的提高了防御者的收益,抑制了攻擊者的攻擊行為.

3 基于激勵(lì)機(jī)制的演化博弈模型

在網(wǎng)絡(luò)攻防中,由于攻擊者和防御者的有限理性致使攻防群體會(huì)選擇不同的策略進(jìn)行博弈.雙方在攻防過程中通過不斷地試錯(cuò)、調(diào)整和改進(jìn)自己的決策手段,從而形成新的攻防博弈局面.

3.1 模型定義

由于實(shí)際網(wǎng)絡(luò)環(huán)境較為復(fù)雜,且攻防群體策略選擇是有限理性行為,因此,本文在不完全信息的條件下定義了網(wǎng)絡(luò)攻防演化博弈模型NADEGM(Network Attack-Defense Evolution Game Model).

定義1.將網(wǎng)絡(luò)攻防演化博弈模型定義為一個(gè)三元組NADEGM=(N,S,U),其中:

①N=(NA,ND)代表攻防演化博弈的局中人,即在博弈過程中采取某種策略的參與者.參與者在不同的環(huán)境下具有不同的意義,它能夠代表個(gè)體,也能夠代表一個(gè)團(tuán)隊(duì),個(gè)體或者團(tuán)隊(duì)組成的群體叫做局中人策略集.這里NA是攻擊者,ND是防御系統(tǒng).

②S=(SA,SD)表示局中人的策略集合,是局中人進(jìn)行博弈的工具和手段.其中SA=(SA1,SA2,…,SAm)代表攻擊策略集合,SD=(SD1,SD2, …,SDn)代表防御策略集合.

3.2 參數(shù)量化

在分析攻防演化博弈時(shí),我們首先需要給出一些相關(guān)定義,便于量化攻防雙方收益.

定義2.攻擊成本CA(Attack Cost):表示攻擊方實(shí)施攻擊所需要損耗的財(cái)力、物力等.

定義3.激勵(lì)機(jī)制酬勞R(Incentive Mechanism Reward):表示第三方監(jiān)管部門給予防御方的獎(jiǎng)勵(lì).

在如今的信息時(shí)代,信息資源的占有程度和壟斷程度決定了自身的收益.由于目標(biāo)網(wǎng)絡(luò)被攻擊的原因大多是因?yàn)樾畔⒌牟还_、不透明,導(dǎo)致攻擊方想要通過攻擊獲取一定的信息.因此,社會(huì)想要通過激勵(lì)機(jī)制來激勵(lì)防御方,在不傷害自身利益的前提下適當(dāng)?shù)墓_信息,實(shí)現(xiàn)信息共享,為此而受益的社會(huì)將會(huì)給予防御方一定的獎(jiǎng)勵(lì),也降低了攻擊方攻擊所帶來的損失.為了降低防御系統(tǒng)被攻擊的可能性,防御方選擇適當(dāng)?shù)墓_信息得到社會(huì)的獎(jiǎng)勵(lì),公開的信息越有利于社會(huì),激勵(lì)機(jī)制所產(chǎn)生的獎(jiǎng)勵(lì)就會(huì)越豐厚.用R表示激勵(lì)機(jī)制酬勞,設(shè)R=αI(I表示公開的信息量,α表示社會(huì)受益度).因此,當(dāng)防御方?jīng)]有進(jìn)行防御投資時(shí),設(shè)此時(shí)防御方公開的信息量為I0,則R0=αI0;當(dāng)防御方進(jìn)行防御投資時(shí),設(shè)此時(shí)防御方公開的信息量為I1,則R1=αI1.

定義4.懲罰成本G(Penalty Cost):表示第三方監(jiān)管部門對(duì)攻擊方實(shí)施攻擊的懲罰.

互聯(lián)網(wǎng)攻擊會(huì)引發(fā)一系列的網(wǎng)絡(luò)安全問題,用戶數(shù)據(jù)遭遇泄露,網(wǎng)絡(luò)服務(wù)被迫中斷,影響了人們的日常工作生活,嚴(yán)重時(shí)甚至影響國家安危.因此,第三方監(jiān)管部門有責(zé)任對(duì)攻擊方違反網(wǎng)絡(luò)安全的不法行為進(jìn)行懲治.用G表示監(jiān)管部門對(duì)攻擊方的懲罰,設(shè)懲罰力度系數(shù)為β.因此,當(dāng)防御方未采取防御投資策略時(shí),攻擊方受到的懲罰為G0=βP0;當(dāng)防御方采取防御投資策略時(shí),攻擊方受到的懲罰為G1=βP1.

定義5.總回報(bào)E(Total Earning)表示攻擊方從一次成功攻擊中可獲得的總回報(bào).

防御方作為目標(biāo)網(wǎng)絡(luò)本身也具有一定的防御能力,但為了更好的抵抗外來攻擊以及保護(hù)自身網(wǎng)絡(luò)環(huán)境的穩(wěn)定狀態(tài),防御方可選擇增加自身的防御投資來抵抗網(wǎng)絡(luò)攻擊,設(shè)防御方增加的投資成本為Vadd.設(shè)防御方原有的防御能力為V0,攻擊方攻擊成功所帶來的損失為L.所以,當(dāng)防御方采取防御投資策略時(shí),防御方的損失為P1L;防御方未采取防御投資策略時(shí)的損失為P0L.由公開信息帶來的社會(huì)獎(jiǎng)勵(lì)分別為R0和R1.當(dāng)攻擊方采取攻擊策略并攻擊成功時(shí),防御方采取防御投資策略的期望收益為V0-Vadd-P1L+R1;當(dāng)攻擊方采取攻擊策略并攻擊成功時(shí),防御方未采取防御投資策略的期望收益為V0-P0L+R0.當(dāng)攻擊方?jīng)]有采取任何攻擊行為時(shí),攻擊方的期望收益為0,防御方采取防御投資策略前后的期望收益為V0+R0,V0-Vadd+R1.

整理上述涉及的主要參數(shù)及意義如表1所示.

表1 主要參數(shù)及意義
Table 1 Main parameters and meaning

變量意義變量意義C0A防御方防御投資前,攻擊方所需攻擊成本R社會(huì)對(duì)防御方公開信息行為的獎(jiǎng)勵(lì)C1A防御方防御投資后,攻擊方所需攻擊成本G攻擊方由攻擊行為所受到的懲罰P0防御方防御投資前,攻擊方攻擊成功的概率L防御方被攻擊后遭受的損失P1防御方防御投資后,攻擊方攻擊成功的概率E攻擊方一次成功攻擊帶來的總回報(bào)I0防御方防御投資前,防御方公開的信息量V0防御方原有的防御能力(原有資產(chǎn))I1防御方防御投資前,防御方公開的信息量Vadd防御方增加的防御能力(防御投資)t0防御方防御投資前,攻擊方攻擊成功的時(shí)長α公開信息對(duì)社會(huì)的受益程度系數(shù)t1防御方防御投資后,攻擊方攻擊成功的時(shí)長β懲罰力度系數(shù)

3.3 復(fù)制動(dòng)態(tài)方程

假設(shè)在攻防博弈過程中,攻擊方群體中采取攻擊策略的比例為x,采取不攻擊策略的比例為1-x;防御方群體中采取防御策略和不采取防御投資策略的比例分別為y,1-y.利用上述參數(shù)設(shè)定,得出網(wǎng)絡(luò)攻防演化博弈模型的收益矩陣如表2所示.

表2 演化博弈期望收益矩陣
Table 2 Evolutionary game expectation return matrix

防御方/攻擊方攻擊不攻擊投資V0-Vadd-P1L+R1,P1E-C1A-G1V0-Vadd+R1,0不投資V0-P0L+R0,P0E-C0A-G0V0+R0,0

(1)

=-xP0L+V0+αI0

(2)

α(I1-I0)-Vadd]-xP0L+V0+αI0

(3)

-y[(P0-P1)(E-β)+t1P1-t0P0]+P0(E-t0-β)

(4)

(5)

-xy[(P0-P1)(E-β)+t1P1-t0P0]+xP0(E-t0-β)

(6)

根據(jù)以上分析得到攻防演化博弈模型的復(fù)制動(dòng)態(tài)方程.

由公式(4)和公式(6)可得攻擊方復(fù)制動(dòng)態(tài)方程為.

x(1-x){-y[(P0-P1)(E-β)+t1P1-t0P0]P0(E-t0-β)}

(7)

由公式(1)和公式(3)可得防御方復(fù)制動(dòng)態(tài)方程為.

α(I1-I0)-Vadd]

(8)

4 攻防演化博弈最優(yōu)策略選取

在網(wǎng)絡(luò)攻防博弈過程中,攻擊方與防御方對(duì)立的進(jìn)行博弈,每一個(gè)局中人都是通過在博弈中不斷地試錯(cuò)、調(diào)整和改進(jìn)來促使自己的期望收益最大化.在這種原則的指導(dǎo)下,無論是攻擊方的攻擊策略還是防御方的防守策略,均會(huì)逐漸趨向于一種平衡.未趨向平衡的一方所換來的代價(jià)就是減少收益,所以任何一方都不會(huì)去嘗試改變這種策略,即此時(shí)達(dá)到平衡的策略為最優(yōu)策略.具體算法描述如下:

算法.最優(yōu)防御策略選取算法

輸入:參與攻防博弈的局中人NA,ND及主機(jī)節(jié)點(diǎn)信息

Begin

1.初始化ADEGM=(N,S,U) /*初始化攻防演化博弈模型*/

2.構(gòu)建x,y/*構(gòu)建攻防雙方所選策略集的群體概率*/

3.構(gòu)建基于激勵(lì)機(jī)制的不完全信息博弈樹

4.構(gòu)建攻防雙方演化博弈矩陣

5.計(jì)算攻擊方的復(fù)制動(dòng)態(tài)方程{

}

6.計(jì)算防御方的復(fù)制動(dòng)態(tài)方程

{

}

End

分析以上算法步驟可知,第1步-第6步的時(shí)間復(fù)雜度為O(m+n),第7步-第8步的時(shí)間復(fù)雜度為O((m+n)2).綜上所述,求解最優(yōu)防御策略的選取的時(shí)間復(fù)雜度不超過O((m+n)2).

圖1 基于激勵(lì)機(jī)制的不完全信息樹Fig.1 Incomplete information tree based on incentive mechanism

針對(duì)上述建立的網(wǎng)絡(luò)攻防演化博弈模型、參數(shù)設(shè)定及算法描述,構(gòu)建了基于激勵(lì)機(jī)制的不完全信息博弈樹,利用博弈樹我們可以更直觀的分析演化博弈模型的所有信息.在本文提出的模型中,第三方監(jiān)管部門是演化博弈中自然的身份,并不是參與者,在激勵(lì)因子的作用下,防御方群體有(SD1,SD2,…,SDn)種防御策略,攻擊方群體有(SA1,SA2,…,SAm)種攻擊策略,攻防雙方群體均以不同的概率選取不同的策略并產(chǎn)生不同的收益,如圖1所示.

5 應(yīng)用實(shí)例與分析

在本節(jié)中,我們部署了網(wǎng)絡(luò)拓?fù)洵h(huán)境對(duì)本文所提出的網(wǎng)絡(luò)攻防演化博弈模型進(jìn)行仿真實(shí)驗(yàn).通過分析演化穩(wěn)定策略,證明模型的有效性;通過分析攻擊時(shí)間對(duì)攻擊群體策略選取的影響,證明攻擊具有時(shí)效性;通過激勵(lì)機(jī)制對(duì)攻防群體策略選取的影響以及引入防御投資回報(bào)方程,證明激勵(lì)機(jī)制的適用性.

在網(wǎng)絡(luò)拓?fù)洵h(huán)境中,攻擊主機(jī)A位于外部網(wǎng)絡(luò),內(nèi)網(wǎng)中包含三臺(tái)服務(wù)器,分別為MySQL服務(wù)器B、web服務(wù)器C和FTP服務(wù)器D;由防火墻將內(nèi)部網(wǎng)絡(luò)與外部網(wǎng)絡(luò)隔離開.如圖2所示.

其中,防火墻用于將內(nèi)網(wǎng)和外網(wǎng)隔開,是維護(hù)網(wǎng)絡(luò)環(huán)境安全的一道屏障.外部主機(jī)只能通過網(wǎng)絡(luò)訪問web服務(wù)器C和FTP服務(wù)器D.在內(nèi)網(wǎng)中,MySQL服務(wù)器B、web服務(wù)器C和FTP服務(wù)器D之間可以利用user權(quán)限互相訪問.利用Nessus

圖2 網(wǎng)絡(luò)拓?fù)洵h(huán)境Fig.2 Network topology environment

脆弱點(diǎn)掃描器對(duì)網(wǎng)絡(luò)中三臺(tái)服務(wù)器節(jié)點(diǎn)進(jìn)行弱點(diǎn)掃描,其服務(wù)器節(jié)點(diǎn)信息如表3所示.

表3 服務(wù)器節(jié)點(diǎn)信息
Table 3 Server node information

Host/IPOS服務(wù)脆弱點(diǎn)IDB172.16.3.2LinuxMySQLCVE-2018-10757C172.16.3.3LinuxsshCVE-2016-10012D172.16.3.4LinuxftpCVE-2016-9499

通過對(duì)網(wǎng)絡(luò)中各主機(jī)節(jié)點(diǎn)脆弱性和攻擊行為的分析,并結(jié)合國家信息安全漏洞庫(CNNVD)信息,在實(shí)驗(yàn)中設(shè)計(jì)網(wǎng)絡(luò)攻擊策略SA1、SA2(SA1策略成本高,攻擊有效性高,針對(duì)性強(qiáng);SA2策略成本低,攻擊有效性低,可看作不采取攻擊).對(duì)抗外來攻擊時(shí),防御方可增加成本采取防御投資,也可依靠現(xiàn)有防御能力被動(dòng)防守,設(shè)計(jì)防御策略為SD1、SD2.如表4和表5所示.

表4 原子攻擊信息
Table 4 Atomic attack information

編號(hào)及名稱網(wǎng)絡(luò)攻擊策略SA1SA21Remotebufferoverflow2Buffererror√3installWebLinstenerprogram√4installdeleteTrojan√5Tryingtostealaccount√6FTPserverinformationdisclosure√7Homepageattack√8CheckPointZoneAlarm9LPCtoLSASSprocess√10SQLinjectionvulnerability√

根據(jù)上述網(wǎng)絡(luò)環(huán)境,構(gòu)建基于激勵(lì)機(jī)制的不完全信息博弈樹,在社會(huì)第三方監(jiān)管部門的激勵(lì)下,攻防群體選擇不同的攻防策略,形成攻防收益集合,如圖3所示.

5.1 演化穩(wěn)定策略

下面根據(jù)x和y的問題情境不同,對(duì)構(gòu)建的網(wǎng)絡(luò)環(huán)境進(jìn)行多次模擬實(shí)驗(yàn).利用仿真實(shí)驗(yàn),可以直觀的分析攻擊方x和防御方y(tǒng)的群體演化規(guī)律,實(shí)現(xiàn)對(duì)攻擊策略的預(yù)測,并最終尋求到演化穩(wěn)定策略,即此狀態(tài)下的最優(yōu)防御策略.

表5 防御策略信息
Table 5 Defense strategy information

圖3 基于激勵(lì)機(jī)制的不完全信息樹Fig.3 Incomplete information tree based on incentive mechanism

當(dāng)問題情境為x=0.2,y=0.6時(shí),即群體中攻擊方以{0.2,0.8}的概率選取混合策略{SA1,SA2},防御方以{0.6,0.4}的概率選取混合策略{SD1,SD2}.通過不斷演化,攻擊方選取策略SA1的幾率逐步趨向于0,防御方選取防御策略SD1的幾率逐步趨向于1,二者均達(dá)到演化穩(wěn)定狀態(tài),此時(shí)的最優(yōu)防御策略為SD1.如圖4所示.

圖4 x=0.2,y=0.6時(shí)群體演化趨勢Fig.4 Group evolution trend when x=0.2,y=0.6

分析可知,在此時(shí)的情境下,防御方屬于較為積極的防備狀態(tài),并且愿意針對(duì)自身脆弱點(diǎn)采取投資防御策略的防御群體呈逐步增加趨勢,攻擊方群體逐漸轉(zhuǎn)向不采取攻擊的被動(dòng)狀態(tài),此時(shí)網(wǎng)絡(luò)環(huán)境較為安全.

當(dāng)問題情境為x=0.7,y=0.3時(shí),即群體中攻擊方以{0.7,0.3}的概率選取混合策略{SA1,SA2},防御方以{0.3,0.7}的概率選取混合策略{SD1,SD2},經(jīng)過不斷演化,攻擊方最終選取攻擊策略SA1的概率逐步趨向于1,防御方選取防御策略SD1的概率逐步趨向于0,二者均達(dá)到演化穩(wěn)定狀態(tài),此時(shí)的最優(yōu)防御策略為SD2.如圖5所示.

圖5 x=0.7,y=0.3時(shí)群體演化趨勢Fig.5 Group evolution trend when x=0.7,y=0.3

分析此時(shí)的情景可知,由于防御方選擇投資防御策略的群體概率較小,在攻防對(duì)抗中較為被動(dòng),攻擊方群體逐漸采取有效的攻擊策略進(jìn)行攻擊,整體網(wǎng)絡(luò)環(huán)境癱瘓.

5.2 激勵(lì)機(jī)制對(duì)攻防群體策略的影響

當(dāng)防御方采取防御策略后,攻擊方想要攻擊成功的時(shí)間就會(huì)延長.我們可以發(fā)現(xiàn),本文所構(gòu)建的模型在仿真實(shí)驗(yàn)環(huán)境下,在第1min至第3min時(shí),攻擊群體逐漸趨向于選擇高成本的攻擊策略,在第4min時(shí)攻擊群體中選擇高成本攻擊策略者基本保持原有概率不變,如圖6(a)所示.當(dāng)超過4min之后,由于攻防雙方長時(shí)間僵持導(dǎo)致攻擊成本過高,攻擊方逐漸趨向于消極狀態(tài),最終演化為不采取攻擊,如圖6(b)所示.因此,當(dāng)防御方以較為積極的狀態(tài)采取防御策略致使攻擊時(shí)間過長時(shí),可以有效遏制攻擊方的攻擊積極性.

圖6 攻擊時(shí)長對(duì)攻擊群體的影響趨勢Fig.6 Impact of attack duration on attack groups

圖7 激勵(lì)機(jī)制對(duì)防御群體的影響趨勢Fig.7 Influence of incentive mechanism on defense groups

為了分析增加激勵(lì)機(jī)制對(duì)防御群體的影響,我們將R分別取不同值觀測防御群體的演化規(guī)律.將圖7(a)、圖7(b)結(jié)合分析可知,無論選擇投資防御策略的初始群體的概率是多少,當(dāng)社會(huì)不給予防御方激勵(lì)或者激勵(lì)程度較小時(shí),防御群體逐漸趨向于被動(dòng)防御的消極狀態(tài),這樣對(duì)于整個(gè)網(wǎng)絡(luò)環(huán)境是十分不利的;當(dāng)社會(huì)給予防御方足夠豐厚的激勵(lì)時(shí),防御群體逐漸趨向于采取投資防御策略的積極狀態(tài),更有利于建設(shè)和諧文明的互聯(lián)網(wǎng)空間.

5.3 激勵(lì)機(jī)制對(duì)防御收益的影響

此外,為了更直觀的看出增加激勵(lì)機(jī)制的優(yōu)勢,我們引入投資回報(bào)(Return on Security Investment)的概念[16].可得到防御投資回報(bào)ROSI:

通過對(duì)比我們可以看出增加激勵(lì)機(jī)制可以明顯提高防御方的收益,有效降低了攻擊方攻擊對(duì)網(wǎng)絡(luò)環(huán)境所造成的損失.如圖8所示.

圖8 激勵(lì)機(jī)制對(duì)防御方收益的影響Fig.8 Impact of incentives on the benefits of defenders

6 總 結(jié)

如今,網(wǎng)絡(luò)攻防對(duì)抗正朝著快速、實(shí)時(shí)、多元化的方向迅猛發(fā)展,基于傳統(tǒng)動(dòng)態(tài)博弈的分析方法已經(jīng)不能滿足現(xiàn)實(shí)需求.本文構(gòu)建了基于激勵(lì)機(jī)制的網(wǎng)絡(luò)攻防演化博弈模型,在不同的問題情境下,系統(tǒng)通過不斷演化,最終將會(huì)趨向于某個(gè)穩(wěn)定狀態(tài),防御方經(jīng)過不斷的修正和改進(jìn)自己的行為,最終獲得此情境下的最優(yōu)防御策略.此外,本文在懲罰機(jī)制的基礎(chǔ)上引入激勵(lì)機(jī)制,通過第三方監(jiān)管部門對(duì)局中人進(jìn)行管理,可以有效提高防御方的總體收益,促進(jìn)防御方投資防御策略的積極性.通過分析攻擊時(shí)長可以發(fā)現(xiàn),增加防御策略投資會(huì)導(dǎo)致攻擊時(shí)間變長、攻擊成本過高,從而遏制了攻擊者的攻擊積極性,便于構(gòu)建更加安全穩(wěn)定的網(wǎng)絡(luò)環(huán)境.通過對(duì)比可以很直觀的發(fā)現(xiàn)本文演算得出的理論分析與仿真實(shí)驗(yàn)得出結(jié)論保持一致,證明了本文提出的攻防演化博弈模型的實(shí)際意義.將其應(yīng)用在實(shí)際網(wǎng)絡(luò)環(huán)境下,可以對(duì)外來攻擊者及時(shí)進(jìn)行預(yù)判和檢測,并為自身最優(yōu)防御策略的選取提供一定的依據(jù),對(duì)網(wǎng)絡(luò)環(huán)境的維護(hù)有一定的積極作用.

猜你喜歡
激勵(lì)機(jī)制群體環(huán)境
長期鍛煉創(chuàng)造體內(nèi)抑癌環(huán)境
一種用于自主學(xué)習(xí)的虛擬仿真環(huán)境
通過自然感染獲得群體免疫有多可怕
孕期遠(yuǎn)離容易致畸的環(huán)境
“群體失語”需要警惕——“為官不言”也是腐敗
環(huán)境
濕地恢復(fù)激勵(lì)機(jī)制的國際立法及啟示
激勵(lì)機(jī)制助推節(jié)能減排
中國公路(2017年11期)2017-07-31 17:56:31
山西票號(hào)的激勵(lì)機(jī)制及其現(xiàn)代啟示
中國商論(2016年33期)2016-03-01 01:59:29
淺議中小企業(yè)激勵(lì)機(jī)制
喀什市| 泽库县| 古浪县| 石嘴山市| 麻栗坡县| 平泉县| 宁乡县| 邓州市| 昔阳县| 赞皇县| 怀宁县| 盘山县| 陇西县| 平江县| 九寨沟县| 和林格尔县| 靖边县| 灵丘县| 镇江市| 赣州市| 济阳县| 清丰县| 上虞市| 秦皇岛市| 高清| 耿马| 苍溪县| 万宁市| 吉安县| 革吉县| 永春县| 丽江市| 沂水县| 宿迁市| 泰来县| 祥云县| 乌兰浩特市| 通许县| 新蔡县| 蒙山县| 云安县|