王建國
(陽泉師范高等??茖W(xué)校 信息技術(shù)系,山西 陽泉 045200)
隨著網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,網(wǎng)絡(luò)異常識別得到了日益廣泛的應(yīng)用[1],通過在源程序中添加自主識別功能可以使得該設(shè)計(jì)可追蹤性變強(qiáng)[2-3]。為了能夠在復(fù)雜網(wǎng)絡(luò)中實(shí)現(xiàn)對這些網(wǎng)絡(luò)的有效識別,要求能夠?qū)?fù)雜網(wǎng)絡(luò)關(guān)系的本質(zhì)進(jìn)行準(zhǔn)確的判別[4]。但是,依靠神經(jīng)網(wǎng)絡(luò)進(jìn)行復(fù)雜網(wǎng)絡(luò)異常的識別是十分復(fù)雜的[5],傳統(tǒng)的設(shè)計(jì)網(wǎng)絡(luò)識別工作多數(shù)都是通過分析網(wǎng)絡(luò)結(jié)構(gòu)來實(shí)現(xiàn)的[6],而對于復(fù)雜網(wǎng)絡(luò)環(huán)境的考慮并不周全[7]。
針對當(dāng)前研究中存在的不足,本文提出利用多源神經(jīng)網(wǎng)絡(luò)進(jìn)行復(fù)雜網(wǎng)絡(luò)異常識別。通過對備忘錄網(wǎng)絡(luò)中的實(shí)例進(jìn)行研究,詳細(xì)地描述識別流程。在對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行研究時(shí),形態(tài)分析屬于較為常見的分析方法,主要是對網(wǎng)絡(luò)進(jìn)行分析。本文依據(jù)網(wǎng)絡(luò)特征來進(jìn)行歸類,使得具有相同網(wǎng)絡(luò)特征的能夠歸為一類,得到一個(gè)抽象個(gè)體,以此將網(wǎng)絡(luò)結(jié)構(gòu)通過有限抽象個(gè)體進(jìn)行描述。本文利用形態(tài)分析技術(shù),就網(wǎng)絡(luò)結(jié)構(gòu)是否具有某種異常特征進(jìn)行識別。為了實(shí)現(xiàn)這一目標(biāo),對當(dāng)前已有的三值邏輯結(jié)構(gòu)進(jìn)行擴(kuò)充,對具有網(wǎng)絡(luò)特征的結(jié)構(gòu)進(jìn)行有效識別,隨后結(jié)合網(wǎng)絡(luò)形態(tài)結(jié)構(gòu)及其變化方式設(shè)計(jì)識別網(wǎng)絡(luò)異常的方法。最后,借助Stuttgart Neural Network Simulator(SNNS)模擬器就本文方法的有效性進(jìn)行展示和驗(yàn)證。
利用這種三值邏輯結(jié)構(gòu)對網(wǎng)絡(luò)成員之間存在的引用結(jié)構(gòu)進(jìn)行表示與說明。其中,U代表論域,其主要組成成分為個(gè)體individual,而且還可將個(gè)體進(jìn)行具體劃分,得到確定個(gè)體與不確定個(gè)體兩類。確定個(gè)體與運(yùn)行對象是具有一一對應(yīng)關(guān)系,不確定個(gè)體,則對應(yīng)的運(yùn)行對象不止一個(gè)。在確保網(wǎng)絡(luò)不被遺漏的基礎(chǔ)上,對該結(jié)構(gòu)進(jìn)行嚴(yán)格識別。P(網(wǎng)絡(luò)P)代表的是能夠?qū)φ撚騻€(gè)體間具有的引用關(guān)系進(jìn)行合理描述,ι代表的則是在將P中網(wǎng)絡(luò)表達(dá)式在各個(gè)體上應(yīng)用之后對應(yīng)的取值,在該結(jié)構(gòu)中利用的邏輯結(jié)構(gòu)為Cleane,對于確定值用0或者1來進(jìn)行表示,而如果不是確定真值,則是利用1/2來進(jìn)行表達(dá)。一般情況下,對于具體的三值邏輯結(jié)構(gòu)利用符號σ來表示,或者可將其稱之為異常網(wǎng)絡(luò)。而且還可將異常網(wǎng)絡(luò)以一種更加直觀的方式進(jìn)行表達(dá),也就是形態(tài)圖。在該圖中,各節(jié)點(diǎn)與個(gè)體之間是具有對應(yīng)關(guān)系的,而且是以實(shí)線對應(yīng)表示普通的節(jié)點(diǎn),而對于縮略節(jié)點(diǎn)則是以虛線來表示,并且這些虛線與實(shí)線反映了在個(gè)體中存在的各種確定與不確定性關(guān)系。假如個(gè)體u能夠被變量x所直接引用,那么此時(shí)將會存在一條線是由x指向u的。如圖1所示的四種異常網(wǎng)絡(luò),在σ(s1)結(jié)構(gòu)中,u1和u2代表的是確定個(gè)體,各自都與一個(gè)對象相對應(yīng),其中的u2代表的是不確定個(gè)體,與之相對應(yīng)的對象超過一個(gè)。
對于三值邏輯結(jié)構(gòu)而言,可以將其中的網(wǎng)絡(luò)進(jìn)行細(xì)分,得到輔助網(wǎng)絡(luò)以及核心網(wǎng)絡(luò)等,網(wǎng)絡(luò)之間的差異可以作為對復(fù)雜網(wǎng)絡(luò)異常識別的依據(jù)。核心網(wǎng)絡(luò)(core predicate)代表的是在對象引用方面程序設(shè)計(jì)語言所具有的網(wǎng)絡(luò),具體來講,對于圖1中的σ(s1)結(jié)構(gòu),是滿足條件x(u1)=1,p(u1,u2)=1/2,p(u2,u2)=1/2的,此時(shí),他能夠反映出u1代表的對象確定被x引用,而p對u2所代表的對象應(yīng)用是否存在是無法確定的。而且還可借助p使得u2所代表的對象之間發(fā)生反應(yīng)或者相互作用。此外,輔助網(wǎng)絡(luò)(instrument ation predicate)是基于核心網(wǎng)絡(luò)進(jìn)行的界定,能夠反映特定分析對應(yīng)的網(wǎng)絡(luò)信息。而基于前兩種網(wǎng)絡(luò)能夠界定宏網(wǎng)絡(luò)(macro predicate),該網(wǎng)絡(luò)的設(shè)置主要是為了更加方便地進(jìn)行表述,因此不需要對其進(jìn)行設(shè)置。此外,還可以基于自由變量數(shù)量進(jìn)行網(wǎng)絡(luò)設(shè)置,得到一元以及多元網(wǎng)絡(luò),其中前者主要就個(gè)體屬性進(jìn)行描述,而后者主要是對個(gè)體之間存在的引用關(guān)系進(jìn)行描述,而且在全部的一元網(wǎng)絡(luò)中,將具有相同取值的對象經(jīng)過合并后得到一個(gè)縮略個(gè)體。
圖1 互換兩個(gè)對象位置的操作
如果正在執(zhí)行程序中的某些語句,那么將使得網(wǎng)絡(luò)結(jié)構(gòu)產(chǎn)生改變。所以,如果要對形態(tài)進(jìn)行詳細(xì)研究時(shí),需要調(diào)用一些基本賦值,找到網(wǎng)絡(luò)相對應(yīng)的時(shí)變函數(shù),然后,需要對整個(gè)控制流程圖從頭到尾進(jìn)行搜索,同時(shí)參照相應(yīng)的程序進(jìn)行初始化設(shè)置和查詢實(shí)變函數(shù),只有這樣,才能夠更加準(zhǔn)確地找到每個(gè)子程序相應(yīng)的異常網(wǎng)絡(luò)。伴隨著結(jié)構(gòu)的改變,許多模糊的單個(gè)網(wǎng)絡(luò)也將會改變,最終可以獲得相應(yīng)的個(gè)體。因?yàn)橐辉W(wǎng)絡(luò)的取值相同,這些個(gè)體還可能被顧及,進(jìn)而得到新的個(gè)體。為了能夠?qū)Σ煌Y(jié)構(gòu)中同一對象具有的可追蹤性進(jìn)行分析,在文章中還提出了分化網(wǎng)絡(luò)FocusTo(s1,s2,s3)、合并網(wǎng)絡(luò)MergeTo(s1,u1,s2,u2)和流入網(wǎng)絡(luò)InFlow(s1,u1,s2,u2)作為表達(dá)不同結(jié)構(gòu)中對象間的可達(dá)關(guān)系。本文設(shè)計(jì)了網(wǎng)絡(luò)R[p](s1,u1,s2,u2),并將上述四種網(wǎng)絡(luò)都?xì)w入到結(jié)構(gòu)間網(wǎng)絡(luò)中,其中的輔助網(wǎng)絡(luò)分為分化與合并兩種,其余兩種則為宏網(wǎng)絡(luò)。其中的變元中的s1、s2與程序控制流圖的節(jié)點(diǎn)是對應(yīng)的,表示了在執(zhí)行語句前后,程序所具有的狀態(tài),將其以4表示,而且如果是在狀態(tài)σ(s)下,對應(yīng)的φ的取值為φ@σ(s)。
以具有對象可追蹤性特征的網(wǎng)絡(luò)為例,對追蹤過程進(jìn)行闡述。
(1) 假如在控制流圖上有兩個(gè)點(diǎn)s1,s2,s1∈prev+(s2)(表示在控制流圖中,s1是s2的直接或間接前驅(qū)),σ(s1)中的個(gè)體u被分化為σ(s2)中的個(gè)體{u1,u2,…,un},則FocusTo(s1,u,s2,ui)=1,其中,1≤i≤n。
(2) 如果有控制流圖上的兩個(gè)點(diǎn)s1,s2,s1∈prev+(s2),σ(s1)中的個(gè)體{u1,u2,…,un}在σ(s2)中被合并為個(gè)體u,則MergeTo(s1,ui,s2,u)=1,其中,1≤i≤n。
圖1所示的是對象位置交換的實(shí)現(xiàn)過程,其中的s1~s4代表的是在執(zhí)行過程中,對應(yīng)的程序點(diǎn),σ(s1)-σ(s4)代表的則是與之相對的異常網(wǎng)絡(luò),σ(s1)中的u2在σ(s2)中被分化成u4~u8這5個(gè)個(gè)體,在σ(s3)中,u5和u7交換位置。在σ(s4)中,u4~u8這5個(gè)個(gè)體由于在x(u),y(u)和z(u)這3個(gè)一元網(wǎng)絡(luò)上的取值均為0,因此被合并為不確定個(gè)體在此過程中,有
FocusTo(s1,u2,s2,ui)=1,
MergeTo(s3,ui,s4,u9)=1
其中,4≤i≤8。
FocusTo和MergeTo關(guān)系可以通過分化操作以及合并操作獲得。就如何得到異常網(wǎng)絡(luò)變遷進(jìn)行了方法上的闡述。在進(jìn)行網(wǎng)絡(luò)公式推導(dǎo)的階段,就會執(zhí)行分化程序,在后期改變的清除階段,將會對以上操作實(shí)施。FocusTo和MergeTo顯然滿足傳遞性,即
FocusTo(s1,u1,s2,u2)∧FocusTo(s2,u2,
s3,u3)?FocusTo(s1,u1,s3,u3)
MergeTo(s1,u1,s2,u2)∧MergeTo(s2,u2,
s3,u3)?MergeTo(s1,u1,s3,u3)
為了進(jìn)一步使各過程中個(gè)體具有更強(qiáng)的可追蹤性,在本文中還進(jìn)行了如下界定:
InFlow(s1,u1,s2,u2)?FocusTo(s1,u1,s2,u2)∨
MergeTo(s1,u1,s2,u2)
綜合上述分析能夠得出,InFlow關(guān)系是具有可傳遞性的。還應(yīng)當(dāng)明確的是,這種InFlow關(guān)系和FlowTo關(guān)系不是一樣的,是存在區(qū)別的,在后者中主要是對兩個(gè)棧變量關(guān)聯(lián)網(wǎng)絡(luò)交集問題進(jìn)行描述。
本文主要就如何在開源程序SNNS中實(shí)現(xiàn)對復(fù)雜網(wǎng)絡(luò)異常的有效識別進(jìn)行了說明,所使用的LER內(nèi)大約有1 000個(gè)節(jié)點(diǎn),節(jié)點(diǎn)的平均度數(shù)值為20,其中,最大的節(jié)點(diǎn)度數(shù)高達(dá)50,節(jié)點(diǎn)度數(shù)分布采用-2的冪指數(shù)函數(shù),除此之外,參數(shù)一般取值為0.3,最終組成一個(gè)數(shù)據(jù)庫,此數(shù)據(jù)庫僅僅有一個(gè)節(jié)點(diǎn)數(shù)度數(shù)最大可以為20。文章首先可以對網(wǎng)絡(luò)異常結(jié)構(gòu)從網(wǎng)絡(luò)角度進(jìn)行分析,從中進(jìn)行變量查找,以獲得類Edit,其中將會含有兩個(gè)成員變量,即prew、next,因此是可能形成Edit類域?qū)ο缶W(wǎng)絡(luò)的。通過網(wǎng)絡(luò)分析,可以獲得全部通過成員變量應(yīng)用Edit類的類,并且從中能夠得到在UndoManager中具有的成員變量,即undosFirst,undoslast,redosFirst和redosLast,為了使描述更加簡單,本文對于存在的UndoManager對CompundEdit的引用并沒有納入考慮范疇。
為了進(jìn)一步識別復(fù)雜網(wǎng)絡(luò)中的異常情況,文章通過5個(gè)時(shí)間點(diǎn)劃分,任意挑選10%的多源神經(jīng)網(wǎng)絡(luò),反復(fù)進(jìn)行復(fù)雜網(wǎng)絡(luò)的分裂和合并實(shí)驗(yàn)。圖2(a)(b)展示了算法ARMCN和算法DYNMOGA,F(xiàn)acetNet算法中的NMI和Error實(shí)驗(yàn)結(jié)果。從實(shí)驗(yàn)結(jié)果可以看出:在第1個(gè)時(shí)間點(diǎn),ARMCN 算法相比于DYNMOGA算法和FacetNet算法更有優(yōu)勢。但ARMCN算法和FacetNet算法中的NMI實(shí)驗(yàn)結(jié)果幾乎一樣,ARMCN算法在復(fù)雜神經(jīng)網(wǎng)絡(luò)識別過程中可以有效地識別網(wǎng)絡(luò),除此之外NMI的數(shù)值保持在0.98以上。盡管DYNMOGA算法是從第2個(gè)時(shí)間點(diǎn)開始,NMI測試結(jié)果一直保持在0.96,但是ARMCN算法的錯(cuò)誤率明顯低于DYNMOGA算法和FaceNet算法,此項(xiàng)實(shí)驗(yàn)進(jìn)一步驗(yàn)證了ARMCN算法可以高效、無誤地識別復(fù)雜網(wǎng)絡(luò)。
(a) 標(biāo)準(zhǔn)化互信息
(b) 錯(cuò)誤率圖2 復(fù)雜網(wǎng)絡(luò)
借用多源神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化問題時(shí),存在的主要弊端是運(yùn)算時(shí)間比較長,另一個(gè)突出問題是需要反復(fù)進(jìn)行適應(yīng)度函數(shù)的運(yùn)算。如果神經(jīng)網(wǎng)絡(luò)的數(shù)量增加到比較大的時(shí)候,此弊端將會進(jìn)一步擴(kuò)大,特別是在優(yōu)化多源神經(jīng)網(wǎng)絡(luò)方面,此前的算法則更為復(fù)雜。本文提出的方法計(jì)算比較快,比較適合網(wǎng)絡(luò)結(jié)構(gòu)較大的神經(jīng)網(wǎng)絡(luò),具體的計(jì)算如表1,表2所示。
表1 算法運(yùn)行時(shí)間(g=50) s
表2 算法運(yùn)行時(shí)間(g=100) s
多源神經(jīng)網(wǎng)絡(luò)可以分為4個(gè)不同的神經(jīng)網(wǎng)絡(luò),節(jié)點(diǎn)平均度數(shù)avgDegree=16,z=5,每個(gè)時(shí)間點(diǎn)上有10%的節(jié)點(diǎn)被選擇進(jìn)入其他神經(jīng)網(wǎng)絡(luò),除此之外,節(jié)點(diǎn)數(shù)目n取值范圍是{128,256,512,1 024,2 048,4 096,8 192,16 384},對應(yīng)的邊m的改變范圍是{1 938,4 018,8 184,16 158,33 026,65 256,131 388,285 782}。網(wǎng)絡(luò)數(shù)量p的變化范圍是{50,100,200},迭代次數(shù)g的變化范圍是{50,100}。從表1和表2實(shí)驗(yàn)結(jié)果可以看出:在一個(gè)時(shí)間點(diǎn)上,對應(yīng)不一樣的p,g組合,ARMCN算法和DYNMOGA算法的實(shí)驗(yàn)驗(yàn)證時(shí)間。特別是目前點(diǎn)數(shù)量成倍增長,ARMCN算法的內(nèi)部使用明顯低于DYNMOGA算法,DYNMOGA算法通常就是ARMCN算法運(yùn)行時(shí)間的6倍左右。ARMCN算法的時(shí)間復(fù)雜度為O(gplogp×(n+m)),當(dāng)在神經(jīng)網(wǎng)絡(luò)數(shù)量以及迭代次數(shù)確定的情況下,ARMCN算法執(zhí)行時(shí)間呈線性增長。
當(dāng)前有關(guān)復(fù)雜網(wǎng)絡(luò)關(guān)系的研究文獻(xiàn)中,并沒有將多源神經(jīng)網(wǎng)絡(luò)運(yùn)用其中,因此,如果復(fù)雜網(wǎng)絡(luò)運(yùn)用當(dāng)前的研究方法則無法進(jìn)行有效分析。構(gòu)建網(wǎng)絡(luò)識別方法,基于該方法對復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)具有的一般特征進(jìn)行描述,開展集中管理,針對實(shí)際中較為常見的一維無環(huán)網(wǎng)絡(luò)進(jìn)行分析,基于多源神經(jīng)網(wǎng)絡(luò)對網(wǎng)絡(luò)進(jìn)行擴(kuò)展檢測,以實(shí)現(xiàn)對不同尋常網(wǎng)絡(luò)的有效追蹤,進(jìn)而分析在不同的異常網(wǎng)絡(luò)下,對應(yīng)情況進(jìn)行及時(shí)處理。本研究還進(jìn)一步剖析了為何將多源神經(jīng)與異常識別視為復(fù)雜網(wǎng)絡(luò)關(guān)系。本研究使用的多源神經(jīng)網(wǎng)絡(luò)算法,基于靜態(tài)網(wǎng)絡(luò)視角,使得識別設(shè)計(jì)網(wǎng)絡(luò)具有更好的能力,也提高了識別結(jié)果的細(xì)致性以及準(zhǔn)確性。