田銀磊,劉書倫
(1.濟(jì)源市網(wǎng)絡(luò)智能創(chuàng)新集成應(yīng)用技術(shù)研究中心,河南 濟(jì)源 459000;2.濟(jì)源職業(yè)技術(shù)學(xué)院,河南 濟(jì)源 459000)
通信網(wǎng)絡(luò)是船舶進(jìn)行信息傳輸、數(shù)據(jù)交換的主要工具,其不僅能夠保證內(nèi)部數(shù)據(jù)交換,還能夠與外界交互。當(dāng)前的船舶通信網(wǎng)絡(luò)的通信模式呈現(xiàn)多設(shè)備、多區(qū)域以及多模式的物聯(lián)網(wǎng)通信模式,該種模式的數(shù)據(jù)變化量較大,并且通信網(wǎng)絡(luò)節(jié)點(diǎn)間的認(rèn)證協(xié)議多樣化,使得網(wǎng)絡(luò)數(shù)據(jù)流傳輸過程中容易出現(xiàn)異常。該情況不僅會影響船舶與外界的實(shí)時通信質(zhì)量,還會影響船舶通信網(wǎng)絡(luò)的快速、安全工作。因此,如何提升船舶通信網(wǎng)絡(luò)質(zhì)量是當(dāng)前亟待解決的問題。
為此,佟冬等將孿生神經(jīng)網(wǎng)絡(luò)用于識別網(wǎng)絡(luò)通信異常數(shù)據(jù)這一問題中,此方法考慮到通信網(wǎng)絡(luò)數(shù)據(jù)維度差異所潛在的問題,引入數(shù)據(jù)降維這一環(huán)節(jié),可有效提升數(shù)據(jù)質(zhì)量,從而保證孿生神經(jīng)網(wǎng)絡(luò)在識別通信異常數(shù)據(jù)時,識別結(jié)果具有可靠性,但其未曾重視權(quán)重對孿生神經(jīng)網(wǎng)絡(luò)穩(wěn)定性存在的影響,如果權(quán)重設(shè)置不合理,包括孿生神經(jīng)網(wǎng)絡(luò)在內(nèi),大部分的神經(jīng)網(wǎng)絡(luò)模型均會出現(xiàn)震蕩問題,此時的通信異常數(shù)據(jù)捕獲結(jié)果,便存在一定誤差,無法滿足當(dāng)前船舶通信網(wǎng)絡(luò)需求。
趙英等將聯(lián)邦學(xué)習(xí)技術(shù)與卷積神經(jīng)網(wǎng)絡(luò)相融,設(shè)計網(wǎng)絡(luò)入侵檢測分類模型,此模型在簡單的訓(xùn)練處理下,便可用于網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)識別的二分類應(yīng)用中,并取得了較好的應(yīng)用效果,但該模型沒有考慮通信網(wǎng)絡(luò)數(shù)據(jù)中,除了通信數(shù)據(jù),還存在大量冗余數(shù)據(jù),在不對此類數(shù)據(jù)進(jìn)行預(yù)處理的條件下直接用于異常檢測,會導(dǎo)致檢測精度受到負(fù)面影響。
結(jié)合存在的問題,本文研究基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)識別方法。此方法不僅在識別之前對船舶通信網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行預(yù)處理,保證數(shù)據(jù)質(zhì)量,還使用粒子群算法調(diào)節(jié)模糊神經(jīng)網(wǎng)絡(luò)的連接權(quán)重,從而在保證模糊神經(jīng)網(wǎng)絡(luò)模型穩(wěn)定可靠的前提下,有效識別船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)。
由于船舶通信網(wǎng)絡(luò)數(shù)據(jù)在采集過程中會受通信設(shè)備本身以及外部環(huán)境條件的干擾,導(dǎo)致數(shù)據(jù)出現(xiàn)冗余情況,此時數(shù)據(jù)的平滑性受到影響,數(shù)據(jù)維度特征便會存在差異,所以需要將船舶通信網(wǎng)絡(luò)數(shù)據(jù)執(zhí)行預(yù)處理,保證數(shù)據(jù)平滑且維度一致,以此提高數(shù)據(jù)質(zhì)量。設(shè)置船舶通信網(wǎng)絡(luò)數(shù)據(jù)為x,選用統(tǒng)計極限值方法完成通信網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理,主要將通信網(wǎng)絡(luò)數(shù)據(jù)映射至統(tǒng)一數(shù)據(jù)區(qū)間[0 1],即
表示多模態(tài)通信網(wǎng)絡(luò)數(shù)據(jù)的超參數(shù)。
設(shè)預(yù)處理后的通信網(wǎng)絡(luò)數(shù)據(jù)集合中,共存在種特征屬性:
其中:()是多模態(tài)通信網(wǎng)絡(luò)數(shù)據(jù)特征屬性參數(shù),屬于混合特征參數(shù);()為離散系數(shù)。
分解船舶通信網(wǎng)絡(luò)數(shù)據(jù)集合的混合特征(),使用聯(lián)合關(guān)聯(lián)規(guī)則,設(shè)計船舶通信網(wǎng)絡(luò)數(shù)據(jù)的自相關(guān)特征分塊函數(shù),提取船舶通信數(shù)據(jù)混合特征S:
其中:(ω)為聯(lián)合關(guān)聯(lián)規(guī)則中,離散范圍的規(guī)則向量集;為離散范圍數(shù);S,依次為混合特征()中第類、第 ω 類特征屬性;s ,依次為第個通信網(wǎng)絡(luò)數(shù)據(jù)的特征值向量、多模態(tài)通信網(wǎng)絡(luò)數(shù)據(jù)重心;ω為權(quán)重。
針對船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征S,構(gòu)建基于粒子群優(yōu)化模糊神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)異常數(shù)據(jù)識別模型,用于識別船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)。因船舶通信網(wǎng)絡(luò)異常狀態(tài)不固定,如多種入侵行為下,通信網(wǎng)絡(luò)會出現(xiàn)多種異常數(shù)據(jù),數(shù)據(jù)類型的多樣化特征導(dǎo)致數(shù)據(jù)類型存在模糊性,不可以直接使用二分類模型。為此,使用模糊神經(jīng)網(wǎng)絡(luò)模型,此模型的自學(xué)習(xí)能力顯著,適用于船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)識別問題中。模糊神經(jīng)網(wǎng)絡(luò)包括輸入、模糊化、推理、歸一化、反模糊化及輸出6 層,不同之間通過神經(jīng)元節(jié)點(diǎn)連接。其中,輸入層輸出的神經(jīng)元就是模糊層的輸入神經(jīng)元,此神經(jīng)元即為提取的通信網(wǎng)絡(luò)數(shù)據(jù)特征S,層層相連,上一層的輸出結(jié)果即為下一層的輸入樣本。輸入層:此層輸入的樣本即為提取的船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征S。模糊層:劃分船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征樣本,將各個特征樣本以隸屬度函數(shù)為標(biāo)準(zhǔn),歸類至模糊子空間。將輸入的維船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征劃分成類,劃分后的網(wǎng)絡(luò)數(shù)據(jù)特征聚類中心數(shù)量是×個,此時船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征聚類結(jié)果為:
其中:S,n和c分別為第維船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征、數(shù)據(jù)特征數(shù)量以及第維第類數(shù)據(jù)特征的聚類中心。
推理層:結(jié)合模糊層輸出的數(shù)據(jù)特征模糊隸屬度,構(gòu)建模糊規(guī)則u,以此將網(wǎng)絡(luò)數(shù)據(jù)特征變換為模糊矢量,降低后續(xù)數(shù)據(jù)識別難度。
計算歸一化層:將推理層設(shè)計的模糊規(guī)則實(shí)施歸一化處理,以此保證模糊神經(jīng)網(wǎng)絡(luò)在識別船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)特征時可快速收斂,歸一化輸出為:
反模糊化層:以反模糊化的方式調(diào)整數(shù)據(jù)特征隸屬度值,以此降低船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征分類難度,并將調(diào)整后隸屬度值傳輸至輸出層,此時設(shè)置反模糊化層與輸出層的連接權(quán)矩陣是。
輸出層:輸出層使用Softmax 分類器,輸出船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)識別結(jié)果。Softmax 分類器能夠解決通信網(wǎng)絡(luò)多種異常數(shù)據(jù)識別問題:
神經(jīng)網(wǎng)絡(luò)對反模糊化層與輸出層的連接權(quán)矩陣存在高度敏感性,微弱的變化也會導(dǎo)致網(wǎng)絡(luò)出現(xiàn)震蕩問題.為此,使用粒子群算法調(diào)節(jié)連接權(quán)重,以此保證模糊神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性。將提取的數(shù)據(jù)特征中某部分?jǐn)?shù)據(jù)特征設(shè)成第個訓(xùn)練樣本,構(gòu)建連接權(quán)矩陣和粒子維度之間映射,各個粒子的維度信息即為連接權(quán)矩陣的可行解。運(yùn)算模糊神經(jīng)網(wǎng)絡(luò)輸出的均方誤差,將其設(shè)成粒子群算法的適應(yīng)度函數(shù):
一般情況下,船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)和其上一時間的異常數(shù)據(jù)具有一定相關(guān)性,為簡化船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)識別建模過程,將前個時間的船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)當(dāng)作影響因素,第和-1時間的船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征分別設(shè)成S()和S(-1),則第+1時間的船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征輸入樣本表示為S={S(),S(-1),···,S(-+1)}。將其設(shè)成基于粒子群優(yōu)化模糊神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)異常數(shù)據(jù)識別模型的識別樣本。
首先訓(xùn)練模糊神經(jīng)網(wǎng)絡(luò),依據(jù)模糊神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差,使用粒子群算法調(diào)整模糊神經(jīng)網(wǎng)絡(luò)的連接權(quán)矩陣,最后在訓(xùn)練誤差滿足異常數(shù)據(jù)識別需求后,建立基于粒子群優(yōu)化模糊神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)異常數(shù)據(jù)識別模型,識別船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)類型。
以某船舶通信網(wǎng)絡(luò)為實(shí)驗(yàn)對象,該船舶通信網(wǎng)絡(luò)由綜合導(dǎo)航控制臺、服務(wù)器、氣象儀、磁羅經(jīng)、電羅經(jīng)、導(dǎo)航雷達(dá)以及RS485 通信總線構(gòu)成,利用服務(wù)器和RS485 通信總線連接地面站數(shù)據(jù)中臺,該數(shù)據(jù)中臺與短波通信系統(tǒng)、衛(wèi)星通信系統(tǒng)以及自組網(wǎng)通信系統(tǒng)相連,實(shí)現(xiàn)船舶與地面之間的通信。設(shè)置RBF 神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)率為0.5,動量因子數(shù)值為0.05,高斯函數(shù)中心值區(qū)間為-1~10 之間。在上述實(shí)驗(yàn)環(huán)境下,對本文方法展開驗(yàn)證。
船舶通信網(wǎng)絡(luò)數(shù)據(jù)的預(yù)處理是識別其異常類型的基礎(chǔ)。以某一條船舶通信網(wǎng)絡(luò)數(shù)據(jù)為實(shí)驗(yàn)對象,使用本文方法對其進(jìn)行冗余預(yù)處理,結(jié)果如圖1 所示。分析圖1 可知,該條通信網(wǎng)絡(luò)數(shù)據(jù)在預(yù)處理前,其響應(yīng)幅值曲線上存在干擾點(diǎn)數(shù)據(jù)點(diǎn),響應(yīng)幅值曲線不夠平滑。而經(jīng)過本文方法對其進(jìn)行預(yù)處理后,該條通信網(wǎng)絡(luò)數(shù)據(jù)的響應(yīng)幅值曲線呈現(xiàn)平滑狀態(tài),曲線上的干擾數(shù)據(jù)點(diǎn)均被去除。上述結(jié)果說明:本文方法可有效去除船舶通信網(wǎng)絡(luò)數(shù)據(jù)內(nèi)存在的冗余數(shù)據(jù),具備較好的預(yù)處理效果。
圖1 船舶通信網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理測試結(jié)果Fig.1 Pretreatment test results of abnormal data of ship communication network
以預(yù)處理后的該條船舶通信網(wǎng)絡(luò)數(shù)據(jù)為實(shí)驗(yàn)對象,使用本文方法提取數(shù)據(jù)特征。測試一段時間內(nèi),本文方法提取船舶通信網(wǎng)絡(luò)數(shù)據(jù)的響應(yīng)幅值,將其作為網(wǎng)絡(luò)數(shù)據(jù)的特征,測試本文方法的數(shù)據(jù)特征提取效果,結(jié)果如圖2 所示。分析圖2 可知,該條船舶通信網(wǎng)絡(luò)數(shù)據(jù)在時間為2.6 min 左右之前時,其響應(yīng)幅值在0.5 db 左右呈現(xiàn)輕微波動趨勢,當(dāng)時間超過2.6 min 后,該條艦通信網(wǎng)絡(luò)數(shù)據(jù)的響應(yīng)幅值呈現(xiàn)驟降趨勢,說明在該時刻后,該條數(shù)據(jù)出現(xiàn)異常情況,隨著時間的持續(xù)增加,該條數(shù)據(jù)的響應(yīng)幅值又恢復(fù)到0.5 db 左右。使用本文方法提取該船通信網(wǎng)絡(luò)數(shù)據(jù)特征時,其響應(yīng)幅值的數(shù)值在曲線波谷處與其實(shí)際值存在偏差,但偏差數(shù)值極小。結(jié)果說明,本文方法可有效提取船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征,且提取結(jié)果較為精準(zhǔn)。
圖2 船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征提取結(jié)果Fig.2 Abnormal data feature extraction results of ship communication network
利用本文方法識別出實(shí)驗(yàn)船舶通信網(wǎng)絡(luò)的異常數(shù)據(jù)結(jié)果,用表1 描述。通過表1 可以看出,本文方法能夠有效識別不同類型船舶通信網(wǎng)絡(luò)數(shù)據(jù)中的異常數(shù)據(jù),并能夠精準(zhǔn)識別出異常數(shù)據(jù)所屬類型,識別效果較好。
表1 本文方法的識別結(jié)果Tab.1 Identification results of the proposed method
為驗(yàn)證本文方法的性能,以DA(Detec-tion Accuracy),TPR(True Positive Rate),PRE(Precision)為指標(biāo)評價船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)的識別結(jié)果,結(jié)果如圖3 所示。其中DA 表示全部實(shí)驗(yàn)船舶通信網(wǎng)絡(luò)樣本數(shù)據(jù)內(nèi)被正確識別的樣本數(shù)占總樣本數(shù)的比例;TPR 表示實(shí)驗(yàn)樣本數(shù)據(jù)內(nèi)被識別為船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)的樣本量占總樣本數(shù)的比例;PRE 為識別精度。通過圖3 可以看出,在船舶通信網(wǎng)絡(luò)數(shù)據(jù)異常量不斷提升的情況下,本文方法各項(xiàng)指標(biāo)均呈緩慢上升態(tài)勢,表示數(shù)據(jù)異常量在一定區(qū)域內(nèi)的提升能夠有效提升船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)的識別效果,各項(xiàng)指標(biāo)的數(shù)值均高于0.95,表示本文方法具有較好的船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)識別效果。
圖3 船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)的識別結(jié)果Fig.3 Identification results of abnormal data of ship communication network
本文研究基于神經(jīng)網(wǎng)絡(luò)的船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)識別方法,通過船舶通信網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)預(yù)處理、提取船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征、異常數(shù)據(jù)識別。在異常數(shù)據(jù)識別這一步驟,使用粒子群算法調(diào)節(jié)模糊神經(jīng)網(wǎng)絡(luò)的連接權(quán)重,保證模糊神經(jīng)網(wǎng)絡(luò)模型穩(wěn)定后,將船舶通信網(wǎng)絡(luò)數(shù)據(jù)特征集,輸入訓(xùn)練好的模糊神經(jīng)網(wǎng)絡(luò)模型,就能夠獲取船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)識別結(jié)果。實(shí)驗(yàn)驗(yàn)證該方法所識別船舶通信網(wǎng)絡(luò)異常數(shù)據(jù)的精度高,可有效應(yīng)用于實(shí)際船舶通信網(wǎng)絡(luò)安全防護(hù)。