魏 丹,楊春琴,李國元,賈文龍,于興忠
(1.中國石油化工股份有限公司西北油田分公司,新疆烏魯木齊 830011;2.南京天技通信技術(shù)實(shí)業(yè)有限公司,江蘇南京 210019)
遺傳算法不具備直接處理問題空間參數(shù)的能力,因此,在求解過程中,需要轉(zhuǎn)化待求解問題為既定遺傳空間內(nèi)的獨(dú)立個(gè)體,而該轉(zhuǎn)換操作常被稱為數(shù)據(jù)信息編碼。與其他執(zhí)行算法不同,遺傳算法具備完備性、健全性與非冗余性。完備性是問題空間可以將所有候選解完全包含在內(nèi)[1];健全性是每一個(gè)候選解能在原問題空間中找到與之相關(guān)的編碼節(jié)點(diǎn)的關(guān)鍵;非冗余性是任何一個(gè)編碼節(jié)點(diǎn)只能與一個(gè)候選解保持對應(yīng)關(guān)系。為準(zhǔn)確編碼問題空間內(nèi)的信息節(jié)點(diǎn),在執(zhí)行遺傳算法時(shí),建立完整的適應(yīng)度函數(shù),一方面判斷編碼個(gè)體與候選解之間的數(shù)值對應(yīng)關(guān)系,另一方面按需評(píng)估求取目標(biāo)函數(shù)[2]。
在互聯(lián)網(wǎng)環(huán)境中,由初始節(jié)點(diǎn)指向目標(biāo)節(jié)點(diǎn)的數(shù)據(jù)反饋行為可稱為數(shù)據(jù)傳輸,而隨著網(wǎng)絡(luò)運(yùn)行時(shí)間的延長,會(huì)出現(xiàn)一些表現(xiàn)行為明顯異于標(biāo)準(zhǔn)數(shù)據(jù)的異常信息參量[3]。網(wǎng)絡(luò)傳輸異常數(shù)據(jù)與標(biāo)準(zhǔn)數(shù)據(jù)之間存在一定的相對誤差,該誤差影響網(wǎng)絡(luò)主機(jī)對于傳輸異常數(shù)據(jù)的精準(zhǔn)檢測能力,并且導(dǎo)致數(shù)據(jù)信息的傳輸完整性下降。
為避免上述情況的發(fā)生,基于改進(jìn)生成式對抗網(wǎng)絡(luò)的識(shí)別方法在分析異常數(shù)據(jù)與標(biāo)準(zhǔn)數(shù)據(jù)之間差異性的同時(shí),分別統(tǒng)計(jì)兩種不同信息參量的目標(biāo)傳輸節(jié)點(diǎn),并通過實(shí)時(shí)對比的方式,突出兩者之間的相對誤差水平[4]。但是該方法的實(shí)用能力有限,并不能完全滿足精準(zhǔn)檢測網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的實(shí)際應(yīng)用需求。
為解決上述問題,以遺傳算法為基礎(chǔ),結(jié)合相關(guān)性檢測閾值等,設(shè)計(jì)一種新型的網(wǎng)絡(luò)傳輸異常數(shù)據(jù)檢測方法。以期提高網(wǎng)絡(luò)傳輸?shù)男阅?,為網(wǎng)絡(luò)的發(fā)展做出貢獻(xiàn)。
網(wǎng)絡(luò)傳輸異常數(shù)據(jù)處理始終以遺傳網(wǎng)絡(luò)為基礎(chǔ),在遺傳適應(yīng)度函數(shù)條件的支持下,定義數(shù)據(jù)編碼標(biāo)簽,具體操作流程如下。
遺傳網(wǎng)絡(luò)負(fù)責(zé)處理傳輸異常信息參量,并通過過渡節(jié)點(diǎn)將數(shù)據(jù)信息整合成滿足網(wǎng)絡(luò)應(yīng)用需求的輸出形式。為準(zhǔn)確檢測傳輸異常數(shù)據(jù)信息,在布置遺傳網(wǎng)絡(luò)時(shí),選取過渡節(jié)點(diǎn)、輸出節(jié)點(diǎn)[5-6]。完整的遺傳網(wǎng)絡(luò)布局形式如圖1 所示。
為避免其他傳輸節(jié)點(diǎn)消耗網(wǎng)絡(luò)傳輸異常數(shù)據(jù),在部署遺傳網(wǎng)絡(luò)時(shí),將過渡節(jié)點(diǎn)直接連接到輸出節(jié)點(diǎn)。
遺傳適應(yīng)度函數(shù)決定了遺傳算法的應(yīng)用進(jìn)化方向,主要作用是評(píng)估網(wǎng)絡(luò)環(huán)境中數(shù)據(jù)信息個(gè)體的優(yōu)劣程度。在遺傳網(wǎng)絡(luò)中,適應(yīng)度函數(shù)的選取影響網(wǎng)絡(luò)主機(jī)檢測和判別傳輸異常信息參量的能力[7-8]。
設(shè)計(jì)遺傳適應(yīng)度函數(shù),計(jì)算遺傳算法中網(wǎng)絡(luò)傳輸各個(gè)個(gè)體的概率:
式中,fi表示網(wǎng)絡(luò)傳輸數(shù)據(jù)個(gè)體i的適應(yīng)度;N表示網(wǎng)絡(luò)傳輸數(shù)據(jù)種群的規(guī)模;計(jì)算各個(gè)體的累計(jì)概率為:
選擇操作后網(wǎng)絡(luò)數(shù)據(jù)群體中的最差個(gè)體,交叉操作其與最優(yōu)個(gè)體的副本,從而加速尋優(yōu)的速度,保證了設(shè)計(jì)算法的收斂性。設(shè)Q1和Q2為準(zhǔn)備交叉的兩個(gè)網(wǎng)絡(luò)傳輸數(shù)據(jù)個(gè)體,在Q1和Q2的第i位進(jìn)行交叉,則兩個(gè)體交叉運(yùn)算后所產(chǎn)生的新個(gè)體的第i位分別為:
式中,λ表示[0,1]之間的隨機(jī)數(shù)。
設(shè)J1、J2表示兩個(gè)隨機(jī)選取的網(wǎng)絡(luò)傳輸異常數(shù)據(jù)定標(biāo)值,且J1≠J2的不等式條件恒成立。a表示遺傳適應(yīng)系數(shù)的初始值,ΔS表示遺傳應(yīng)用網(wǎng)絡(luò)在單位時(shí)間內(nèi)承載的數(shù)據(jù)信息傳輸總量,β表示遺傳算法的數(shù)據(jù)判別系數(shù)。聯(lián)立上述物理量,可將遺傳網(wǎng)絡(luò)的適應(yīng)度函數(shù)定義為:
在遺傳網(wǎng)絡(luò)中,以遺傳適應(yīng)度函數(shù)為基礎(chǔ)判別條件,定義傳輸異常數(shù)據(jù)編碼標(biāo)簽。
對于網(wǎng)絡(luò)傳輸異常數(shù)據(jù)而言,數(shù)據(jù)編碼標(biāo)簽的定義需要同時(shí)具備信息編碼特征、數(shù)據(jù)篩選系數(shù)兩項(xiàng)物理?xiàng)l件[9-10]。信息編碼特征常表示為f,該項(xiàng)物理量的實(shí)際取值越大,表示定義標(biāo)簽的延伸能力越強(qiáng)。數(shù)據(jù)篩選系數(shù)表示為χ,該項(xiàng)物理量的最小取值始終大于自然數(shù)“1”。在上述物理量的支持下,聯(lián)立上述公式,定義遺傳算法的傳輸異常數(shù)據(jù)編碼標(biāo)簽為:
式中,δ表示網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的編碼常值;dδ表示與δ相關(guān)的標(biāo)簽項(xiàng)目指標(biāo);d0表示標(biāo)簽項(xiàng)目指標(biāo)的初始值表示待編碼的網(wǎng)絡(luò)異常數(shù)據(jù)傳輸均值。為實(shí)現(xiàn)對于網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的精準(zhǔn)檢測,在提取傳輸異常數(shù)據(jù)參量時(shí),需要遵循編碼標(biāo)簽定義原則。
在遺傳算法的支持下,按照異常簇點(diǎn)定義、數(shù)據(jù)傳輸密度確定、相關(guān)性檢測閾值計(jì)算的處理流程,完成網(wǎng)絡(luò)傳輸異常數(shù)據(jù)檢測方法的設(shè)計(jì)與應(yīng)用。
異常簇點(diǎn)定義了傳輸異常數(shù)據(jù)在遺傳網(wǎng)絡(luò)所處的存儲(chǔ)位置。遺傳網(wǎng)絡(luò)異常簇點(diǎn)的分布密度水平越小,消耗的時(shí)間越長[11-12]。設(shè)l1、l2表示兩個(gè)不相等的網(wǎng)絡(luò)傳輸異常數(shù)據(jù)遺傳特征向量,?表示遺傳網(wǎng)絡(luò)的異常數(shù)據(jù)信息參量差值,表示網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的檢測校正系數(shù),g表示網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的實(shí)時(shí)排列系數(shù)。在上述物理量的支持下,聯(lián)立公式(5),可定義遺傳算法的異常簇點(diǎn)的表達(dá)式為:
規(guī)定在遺傳網(wǎng)絡(luò)中,異常簇點(diǎn)定義的表達(dá)式直接影響異常數(shù)據(jù)信息參量的實(shí)時(shí)傳輸密度水平。
待執(zhí)行檢測指令與信息參量一一對應(yīng),因此,控制數(shù)據(jù)傳輸密度指標(biāo)的數(shù)值水平在既定標(biāo)準(zhǔn)區(qū)間內(nèi)[13-14]。設(shè)φ表示檢測指令的初始執(zhí)行頻率,w表示網(wǎng)絡(luò)異常數(shù)據(jù)的傳輸定義系數(shù),uw表示w條件下的數(shù)據(jù)信息檢測標(biāo)量,umax表示數(shù)據(jù)信息檢測標(biāo)量最大值,η表示網(wǎng)絡(luò)主機(jī)對于傳輸異常數(shù)據(jù)的感應(yīng)系數(shù)。聯(lián)立上述物理量,可定義網(wǎng)絡(luò)異常數(shù)據(jù)的傳輸密度表達(dá)式為:
在遺傳算法的作用下,數(shù)據(jù)傳輸密度指標(biāo)的取值始終處于(0,1] 的物理區(qū)間。
式中,R表示既定檢測向量;表示遺傳應(yīng)用網(wǎng)絡(luò)對于傳輸異常數(shù)據(jù)的干預(yù)向量;表示遺傳應(yīng)用網(wǎng)絡(luò)對于傳輸異常數(shù)據(jù)的檢測向量。在遺傳應(yīng)用網(wǎng)絡(luò)中,相關(guān)性檢測閾值將異常數(shù)據(jù)與標(biāo)準(zhǔn)數(shù)據(jù)間的相對誤差控制在既定數(shù)值標(biāo)準(zhǔn)之內(nèi),以此保障網(wǎng)絡(luò)主機(jī)檢測傳輸異常數(shù)據(jù)的精準(zhǔn)度。
在Windows 10 系統(tǒng)中,利用Linux 虛擬機(jī)分流處理網(wǎng)絡(luò)傳輸數(shù)據(jù)。首先,輸入混合信息參量至網(wǎng)絡(luò)應(yīng)用主機(jī);其次,分別分流處理異常傳輸數(shù)據(jù)、常規(guī)傳輸數(shù)據(jù);然后,分別存儲(chǔ)異常傳輸數(shù)據(jù)、常規(guī)傳輸數(shù)據(jù)于不同的數(shù)據(jù)庫主機(jī);最后,屏蔽常規(guī)傳輸信息存儲(chǔ)數(shù)據(jù)庫,將異常數(shù)據(jù)庫主機(jī)中存儲(chǔ)的傳輸信息參量作為該次實(shí)驗(yàn)的研究對象。
表1 記錄了該次實(shí)驗(yàn)過程中采用主機(jī)元件的設(shè)備名稱。
表1 實(shí)驗(yàn)用主機(jī)元件
為保證實(shí)驗(yàn)結(jié)果的公平性,除采用檢測方法不同外,實(shí)驗(yàn)組(基于遺傳算法的網(wǎng)絡(luò)傳輸異常數(shù)據(jù)檢測方法)、對照組(改進(jìn)生成式對抗網(wǎng)絡(luò)的識(shí)別方法)其他參數(shù)配置情況始終保持一致。具體實(shí)驗(yàn)流程如下:
步驟一:按需連接網(wǎng)絡(luò)主機(jī)、CPU 設(shè)備、外存設(shè)備、內(nèi)存設(shè)備等多個(gè)實(shí)驗(yàn)元件;
步驟二:提取存儲(chǔ)于數(shù)據(jù)庫主機(jī)的網(wǎng)絡(luò)傳輸異常數(shù)據(jù),作為實(shí)驗(yàn)待檢信息參量;
步驟三:將遺傳算法指令輸入實(shí)驗(yàn)主機(jī)中,并定義實(shí)驗(yàn)數(shù)據(jù)為實(shí)驗(yàn)組變量;
步驟四:輸入改進(jìn)生成式對抗網(wǎng)絡(luò)識(shí)別算法至實(shí)驗(yàn)主機(jī),并定義實(shí)驗(yàn)數(shù)據(jù)為對照組變量。
異常數(shù)據(jù)校正誤差指標(biāo)的數(shù)值水平,能夠反映網(wǎng)絡(luò)主機(jī)檢測異常性傳輸數(shù)據(jù)的能力。異常數(shù)據(jù)校正誤差與標(biāo)準(zhǔn)數(shù)據(jù)校正誤差之間的物理差值越小,表示網(wǎng)絡(luò)主機(jī)對于異常性傳輸數(shù)據(jù)的檢測準(zhǔn)確性越強(qiáng)。
幾個(gè)周末過去后,一個(gè)中午,阿花在車上甩給我一個(gè)紅包,一千塊。我明白她的意思,卻裝著不懂,問什么意思。阿花說有付出就有回報(bào),你每次來作指導(dǎo),這是你的勞動(dòng)所得。我開廠也是賺錢的,不能讓你白幫。我把紅包放在車上,我說我只做你的朋友,收了錢,我就成你的員工了。她佯裝生了氣,說你不收錢,以后就別來幫我了。她的眸子里流露幽怨的光。
圖2 反映了實(shí)驗(yàn)組、對照組異常數(shù)據(jù)校正誤差指標(biāo)的數(shù)值變化情況。
圖2 異常數(shù)據(jù)校正誤差
實(shí)驗(yàn)組:對于實(shí)驗(yàn)組異常數(shù)據(jù)信息參量而言,校正誤差指標(biāo)數(shù)值呈現(xiàn)出先增大,再減小,最后來回波動(dòng)的變化情況。在數(shù)據(jù)傳輸量等于3.0 MB 時(shí),實(shí)驗(yàn)組校正誤差指標(biāo)達(dá)到最大值1.87×10-3MB。整個(gè)實(shí)驗(yàn)過程,實(shí)驗(yàn)組異常數(shù)據(jù)校正誤差與標(biāo)準(zhǔn)數(shù)據(jù)校正誤差之間的物理數(shù)值差的最大值達(dá)到了0.25×10-3MB。
對照組:對于對照組異常數(shù)據(jù)信息參量而言,校正誤差指標(biāo)數(shù)值呈現(xiàn)先上升再下降,然后連續(xù)上升,最后呈現(xiàn)小幅下降的變化狀態(tài)。在數(shù)據(jù)傳輸量等于7.0 MB 時(shí),對照組校正誤差指標(biāo)達(dá)到其最大值2.42×10-3MB。整個(gè)實(shí)驗(yàn)過程中,對照組異常數(shù)據(jù)校正誤差與標(biāo)準(zhǔn)數(shù)據(jù)校正誤差之間的物理數(shù)值差的最大值為0.80×10-3MB,與實(shí)驗(yàn)組極值差相比,上升了0.55×10-3MB。
綜合上述實(shí)驗(yàn)研究結(jié)果,可知該次實(shí)驗(yàn)結(jié)論如下:
1)標(biāo)準(zhǔn)數(shù)據(jù)校正誤差指標(biāo)呈現(xiàn)出明顯波動(dòng)的數(shù)值變化狀態(tài);
2)在基于改進(jìn)生成式對抗網(wǎng)絡(luò)的識(shí)別方法的作用下,異常數(shù)據(jù)校正誤差指標(biāo)數(shù)值的變化趨勢并不能與標(biāo)準(zhǔn)數(shù)據(jù)校正誤差指標(biāo)數(shù)值的變化趨勢保持一致,且前者的均值水平明顯更高,不符合精準(zhǔn)檢測網(wǎng)絡(luò)傳輸異常數(shù)據(jù)的實(shí)際應(yīng)用需求;
3)在基于遺傳算法的網(wǎng)絡(luò)傳輸異常數(shù)據(jù)檢測方法的作用下,異常數(shù)據(jù)校正誤差指標(biāo)數(shù)值的變化趨勢大體上與標(biāo)準(zhǔn)數(shù)據(jù)校正誤差指標(biāo)數(shù)值的變化趨勢保持一致,且二者均值水平相差較小,提高了網(wǎng)絡(luò)主機(jī)對異常性傳輸數(shù)據(jù)的檢測精度。
新型網(wǎng)絡(luò)傳輸異常數(shù)據(jù)檢測方法,在基于改進(jìn)生成式對抗網(wǎng)絡(luò)的識(shí)別方法的基礎(chǔ)上,聯(lián)合遺傳算法理論,建立完整的適應(yīng)度函數(shù)條件,通過數(shù)據(jù)編碼標(biāo)簽結(jié)構(gòu),計(jì)算數(shù)據(jù)傳輸密度指標(biāo)的具體數(shù)值。驗(yàn)證可知,該方法有效控制了異常數(shù)據(jù)校正誤差指標(biāo)的數(shù)值水平,并且對于網(wǎng)絡(luò)主機(jī)而言,有效提高了異常性傳輸數(shù)據(jù)的精準(zhǔn)檢測能力。