高衛(wèi)斌
(寧德職業(yè)技術(shù)學(xué)院 信息技術(shù)與工程學(xué)院,福建 寧德 355000)
隨著無(wú)線傳感網(wǎng)絡(luò)(WSNs,Wireless Sensor Networks)應(yīng)用范圍逐漸擴(kuò)大,其在更多領(lǐng)域起到了重要的數(shù)據(jù)監(jiān)測(cè)和過程監(jiān)控作用。例如,環(huán)境監(jiān)測(cè)方面,將傳感器布設(shè)到環(huán)境中,就能收取所覆蓋區(qū)域內(nèi)的溫度、濕度、風(fēng)力、光照、氣壓等眾多環(huán)境信息;將其應(yīng)用在工業(yè)生產(chǎn)領(lǐng)域,將其安置在工作環(huán)境中,就能實(shí)時(shí)監(jiān)測(cè)生產(chǎn)狀態(tài)[1]。然而,無(wú)線傳感器網(wǎng)絡(luò)最終還是需要接入互聯(lián)網(wǎng)才能夠發(fā)揮其作用,布設(shè)在現(xiàn)場(chǎng)的傳感器節(jié)點(diǎn)在完成信息感知之后需要將信息遠(yuǎn)程傳輸?shù)浇K端服務(wù)器當(dāng)中,以進(jìn)一步處理和分析。在這種情況,無(wú)線傳感器的安全性就會(huì)大大降低,因此互聯(lián)網(wǎng)安全問題日漸嚴(yán)重,隨著入侵手段、入侵方式的多樣化,入侵現(xiàn)象更加頻繁發(fā)生,入侵行為變得更加隱蔽,一般安全防御技術(shù)逐漸無(wú)法滿足無(wú)線傳感器網(wǎng)絡(luò)的安全需要[2]。
面對(duì)這種情況,很多專家和學(xué)者都進(jìn)行了研究,提出了很多的入侵檢測(cè)方法,以期提高無(wú)線傳感器網(wǎng)絡(luò)的安全。例如,劉廣睿等在其研究中將惡意節(jié)點(diǎn)與正常節(jié)點(diǎn)之間描述為一種演化博弈并以此建立了一種攻防博弈模型,然后基于強(qiáng)化學(xué)習(xí)算法計(jì)算節(jié)點(diǎn)收益值,最后以此為基礎(chǔ)進(jìn)行惡意節(jié)點(diǎn)判斷[3]。郭衛(wèi)霞等在研究中首先通過基站采集流量數(shù)據(jù)包,然后對(duì)其進(jìn)行數(shù)值化和歸一化處理,最后基于Bi Cir GAN算法構(gòu)建入侵檢測(cè)模型,實(shí)現(xiàn)入侵檢測(cè)[4]。
雖然前人研究都取得了一定的成效,但是隨著入侵類型的增多,尤其是多種入侵方式同時(shí)進(jìn)行時(shí),以往的入侵檢測(cè)方法檢測(cè)準(zhǔn)確性會(huì)直線下降。面對(duì)這種情況,提出一種基于混合特征學(xué)習(xí)數(shù)學(xué)模型的WSNs入侵檢測(cè)方法。該方法主要分為三部分,即無(wú)線傳感器網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)采集、無(wú)線傳感器網(wǎng)絡(luò)混合特征選取以及基于混合特征學(xué)習(xí)的入侵檢測(cè)數(shù)學(xué)模型構(gòu)建。通過本研究以期提高混合入侵的高質(zhì)量檢測(cè),確保無(wú)線傳感網(wǎng)絡(luò)的安全。
無(wú)線傳感器網(wǎng)絡(luò),簡(jiǎn)稱WSNs,由三類節(jié)點(diǎn)組成,當(dāng)傳感器節(jié)點(diǎn)完成感知任務(wù)后,會(huì)通過多跳的方式將感知信息發(fā)送給匯聚節(jié)點(diǎn),匯聚節(jié)點(diǎn)又與Intel網(wǎng)或其它骨干網(wǎng)絡(luò)連接,以此為紐帶將信息遠(yuǎn)程傳輸給管理節(jié)點(diǎn)[5]。在整個(gè)無(wú)線傳感器網(wǎng)絡(luò)工作中,非法攻擊者會(huì)通過各種手段入侵傳感器節(jié)點(diǎn),以獲得傳感器感知到的信息,由此就形成了WSNs入侵。面對(duì)這種情況,及時(shí)檢測(cè)出被入侵的節(jié)點(diǎn),就能保證無(wú)線傳感網(wǎng)絡(luò)的安全。隨著傳感器節(jié)點(diǎn)的工作,其運(yùn)行參數(shù)會(huì)不斷發(fā)生變化,但是工作參數(shù)變化一般是有規(guī)律的,不會(huì)發(fā)生較大波動(dòng),但是一旦發(fā)生入侵,節(jié)點(diǎn)工作參數(shù)就會(huì)發(fā)生較大的波動(dòng)和改變,因此節(jié)點(diǎn)運(yùn)行參數(shù)在一定程度上反映了節(jié)點(diǎn)的狀態(tài)[6]。由此可知,獲取傳感器節(jié)點(diǎn)運(yùn)行參數(shù)是必要的,在這里通過嗅探器定時(shí)獲取傳感器節(jié)點(diǎn)運(yùn)行參數(shù),具體過程如圖1所示。
通過上述獲取的傳感器節(jié)點(diǎn)運(yùn)行參數(shù)可以獲得很多種傳感器節(jié)點(diǎn)運(yùn)行特征。只選取其中一種雖然可以很大程度降低后續(xù)入侵檢測(cè)難度,但是由于單一特征所反應(yīng)的信息量較少,且具有片面性,因此在本研究中選取多個(gè)特征混合在一起,以保證后續(xù)入侵檢測(cè)的準(zhǔn)確性。然而,傳感器節(jié)點(diǎn)運(yùn)行參數(shù)中隱含的特征有很多,選出哪幾個(gè)則成為重點(diǎn)[7]。特征的合理選取至關(guān)重要,對(duì)入侵檢測(cè)具有較高的貢獻(xiàn)。針對(duì)這一點(diǎn),利用熵權(quán)法進(jìn)行選取,原理是通過計(jì)算特征的重要性來(lái)選擇,具體過程如下。
步驟1:盡可能全面列舉所有特征因子,作為候選特征,記為pj,J=1,2,…,n,n代表特征因子數(shù)量。
步驟2:假設(shè)無(wú)線傳感器網(wǎng)絡(luò)中有m個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)有n個(gè)特征因子。由此構(gòu)建特征評(píng)價(jià)矩陣P,如式(1)所示。
(1)
式(1)中,pij代表第i個(gè)節(jié)點(diǎn)的第j個(gè)特征因子。
步驟3:對(duì)P中的各個(gè)數(shù)據(jù)進(jìn)行歸一化處理,去除不同特征因子的量綱問題,如式(2)所示。
(2)
(3)
(4)
步驟4:計(jì)算在第j個(gè)特征因子下第i個(gè)節(jié)點(diǎn)的比重Aij,如式(5)所示。
(5)
式(5)中,Q代表所有傳感器節(jié)點(diǎn)的第j個(gè)特征因子總和,如式(6)所示。
(6)
步驟5:計(jì)算第j個(gè)特征因子的信息熵Bj,如式(7)所示。
(7)
步驟6:計(jì)算差異系數(shù)Cj,如式(8)所示。
Cj=1-Bj
(8)
步驟7:計(jì)算第j個(gè)特征因子的權(quán)重Dj,如式(9)所示。
(9)
對(duì)Dj進(jìn)行排序,最后選取排名前4個(gè)的特征因子作為無(wú)線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)特征,這4個(gè)特征分別如表1所示。
將表1所得特征進(jìn)行標(biāo)準(zhǔn)化處理,讓其數(shù)值映射到0~1之間,組成無(wú)線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)混合特征集合,記為S={s1,s2,s3,s4}[8]。
基于上述研究成果,本章節(jié)利用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建入侵檢測(cè)數(shù)學(xué)模型,如圖2所示。
由圖2可知,入侵檢測(cè)數(shù)學(xué)模型需要進(jìn)行學(xué)習(xí),才能保證權(quán)值和閾值達(dá)到最優(yōu),使得模型發(fā)展“成熟”[9]。具體學(xué)習(xí)過程如下。
步驟1:設(shè)置入侵檢測(cè)數(shù)學(xué)模型初始參數(shù)。
步驟2:確定學(xué)習(xí)樣本[10],該樣本輸入量為標(biāo)準(zhǔn)化后的4個(gè)的特征因子[11],輸出量為對(duì)應(yīng)入侵類型的發(fā)生概率,概率最接近1的類型就是入侵檢測(cè)的結(jié)果[12]。學(xué)習(xí)樣本的輸入量和輸出量都是已知,且這里的輸出量為預(yù)期輸出量。
步驟3:輸入學(xué)習(xí)樣本4個(gè)的特征因子到模型的輸入層。
步驟4:進(jìn)入隱含層,進(jìn)行隱含層運(yùn)算,如式(10)所示。
(10)
式(10)中,Gj為隱含層輸出;si為輸入向量,即混合特征因子;vij為輸入層和隱含層間的連接權(quán)值;ξ為激勵(lì)函數(shù);hij為輸入層和隱含層間的連接閾值。
步驟5:隱含層運(yùn)算結(jié)果進(jìn)入輸出層輸出結(jié)果,如式(11)所示。
(11)
步驟6:將Ok與學(xué)習(xí)樣本的預(yù)期輸出量相減,得出的差值要是大于設(shè)置限值時(shí),就需要進(jìn)行反向誤差傳播,調(diào)節(jié)三層之間的連接權(quán)值和閾值;否則,代表模型學(xué)習(xí)結(jié)果,通過不同重復(fù)的正向運(yùn)算,反向誤差傳播,直至誤差滿足要求,入侵檢測(cè),模型經(jīng)過學(xué)習(xí),達(dá)到成熟[13]。
輸入測(cè)試樣本,這里的測(cè)試樣本的4個(gè)的特征因子經(jīng)過計(jì)算已知,輸入到學(xué)習(xí)好的入侵檢測(cè)模型當(dāng)中,就可以得出入侵檢測(cè)結(jié)果[14]。
以某200km×200km的監(jiān)測(cè)區(qū)域?yàn)槔?在區(qū)域內(nèi)部署傳感器節(jié)點(diǎn),匯聚節(jié)點(diǎn)、嗅探器、基站以及監(jiān)控站,搭建形成WSNs測(cè)試環(huán)境,如圖3所示。
圖3 WSNs測(cè)試環(huán)境
WSNs測(cè)試的硬件環(huán)境包括:CPU Intel corei7 12700H,最高主頻2.7GHz,RAM16GB,硬盤存儲(chǔ)為2TB,其他的相關(guān)參數(shù)如表2所示。
表2 WSNs測(cè)試環(huán)境基礎(chǔ)參數(shù)
WSNs入侵方式有多種,在這里選取3種方式,設(shè)置6種入侵工況,對(duì)圖3中的傳感器節(jié)點(diǎn)入侵模擬,設(shè)置的入侵模擬工況如表3所示。
表3 WSNs入侵工況設(shè)置
由表3可知,6種工況模擬下利用嗅探器采集一段時(shí)間內(nèi)的500個(gè)傳感器節(jié)點(diǎn)運(yùn)行參數(shù),作為初始測(cè)試樣本的來(lái)源數(shù)據(jù)集,所采集到的6種供給數(shù)據(jù)的數(shù)量,如表4所示。
表4 6種攻擊數(shù)據(jù)的數(shù)量分布
具體的測(cè)試過程如下。
(1)在檢測(cè)區(qū)域內(nèi)布置傳感器節(jié)點(diǎn)、匯聚節(jié)點(diǎn)和嗅探器。
(2)調(diào)整測(cè)試環(huán)境和各種網(wǎng)絡(luò)基礎(chǔ)參數(shù),在不同的工況下采集用于入侵檢測(cè)的基礎(chǔ)數(shù)據(jù)。
(3)對(duì)系統(tǒng)參數(shù)和數(shù)據(jù)作標(biāo)準(zhǔn)化處理和一致性檢驗(yàn)。
(4)提取數(shù)據(jù)的混合特征因子,并篩選用于入侵檢測(cè)評(píng)價(jià)的各個(gè)指標(biāo)。
(5)獲取到不同算法下的指標(biāo)值,并與最終的結(jié)果進(jìn)行分析和討論。
基于章節(jié)1.2研究,針對(duì)熵權(quán)法選出的4個(gè)的特征因子,從采集到的傳感器節(jié)點(diǎn)運(yùn)行參數(shù)中提取對(duì)應(yīng)的數(shù)值并進(jìn)行標(biāo)準(zhǔn)化處理。隨機(jī)選取其中10個(gè)傳感器節(jié)點(diǎn)作為示例,數(shù)值提取結(jié)果如表5所示。
以提取到的混合特征因子數(shù)值為輸入,利用學(xué)習(xí)好的入侵檢測(cè)數(shù)學(xué)模型對(duì)500個(gè)傳感器節(jié)點(diǎn)進(jìn)行檢測(cè)。根據(jù)檢測(cè)結(jié)果,計(jì)算入侵檢測(cè)準(zhǔn)確性。選擇的準(zhǔn)確性評(píng)價(jià)指標(biāo)為F1-measure,該值越大代表入侵檢測(cè)越全面,檢測(cè)結(jié)果越準(zhǔn)確,模型的整體性能越好,如公式(12)所示。
(12)
式(12)中,η和μ如公式(13)所示。
(13)
式(13)中,η代表精確率;μ代表召回率;a代表實(shí)際為入侵的惡意節(jié)點(diǎn),模型檢測(cè)結(jié)果也為惡意節(jié)點(diǎn);b代表實(shí)際為正常節(jié)點(diǎn),但是模型檢測(cè)結(jié)果為惡意節(jié)點(diǎn);c代表實(shí)際為入侵的惡意節(jié)點(diǎn),但是模型檢測(cè)結(jié)果為正常節(jié)點(diǎn)。
相同測(cè)試環(huán)境下,應(yīng)用基于強(qiáng)化學(xué)習(xí)的入侵檢測(cè)模型,基于雙向循環(huán)生成對(duì)抗網(wǎng)絡(luò)的入侵檢測(cè)模型,得出檢測(cè)結(jié)果,統(tǒng)計(jì)F1-measure(傳統(tǒng)算法也采用表4中的原始數(shù)據(jù)進(jìn)行驗(yàn)證,具體對(duì)比結(jié)果如圖4所示)。
圖4 F1-measure對(duì)比圖
由圖4可知,與基于強(qiáng)化學(xué)習(xí)的入侵檢測(cè)模型,基于雙向循環(huán)生成對(duì)抗網(wǎng)絡(luò)的入侵檢測(cè)模型相比,所研究模型應(yīng)用下,F1-measure數(shù)值更大,由此說明該模型入侵檢測(cè)更全面,檢測(cè)結(jié)果更準(zhǔn)確,模型的整體性能好。
無(wú)線傳感器網(wǎng)絡(luò)的監(jiān)控范圍越來(lái)越廣泛,在很多領(lǐng)域都得到了廣泛應(yīng)用,但是面對(duì)層出不窮的入侵手段,無(wú)線傳感器網(wǎng)絡(luò)安全問題日趨嚴(yán)重。面對(duì)這種情況,為保證無(wú)線傳感器網(wǎng)絡(luò)安全,研究一種基于混合特征學(xué)習(xí)數(shù)學(xué)模型的WSNs入侵檢測(cè)模型。該模型最大的特點(diǎn)是即使多種攻擊手段同時(shí)入侵,通過混合特征,也能很好地檢測(cè)出來(lái)。最后對(duì)該模型進(jìn)行了應(yīng)用測(cè)試,通過對(duì)比檢測(cè)結(jié)果的F1-measure數(shù)值,證明了所研究入侵檢測(cè)模型整體性能更好。