陳鵬崗, 方健軍, 王科
(1.西安交通大學第二附屬醫(yī)院,陜西,西安 710000;2.煙臺市中醫(yī)醫(yī)院,山東,煙臺 264000;3.山東理工大學,計算機科學與技術(shù)學院,山東,淄博 255000)
伴隨著網(wǎng)絡(luò)基礎(chǔ)設(shè)施的建設(shè)與通信行業(yè)的快速發(fā)展,信息化在各行各業(yè)得到了廣泛的應(yīng)用,促進了社會的進步與經(jīng)濟的快速發(fā)展。與此同時,網(wǎng)絡(luò)安全問題也成為了各行各業(yè)都必須面對的問題,木馬病毒、黑客攻擊使得網(wǎng)絡(luò)安全面臨新的挑戰(zhàn)[1]。醫(yī)院網(wǎng)絡(luò)化建設(shè)對提升醫(yī)院的就診效率、患者滿意度發(fā)揮著至關(guān)重要的作用,確保醫(yī)院網(wǎng)絡(luò)安全對維護醫(yī)院正常運轉(zhuǎn)具有至關(guān)重要的意義。
傳統(tǒng)的網(wǎng)絡(luò)安全評估可以分為定量評估和定性評估2類,伴隨著人工智能技術(shù)的快速發(fā)展,出現(xiàn)了智能化的網(wǎng)絡(luò)安全評估方法。模糊法、德爾菲法、歷史比較法是最為常見的定性評估方法,回歸分析法、聚類算法、決策樹模型、因子分析法是最為常見的定量評估方法。不論是定量評估法還是定性評估法,在對網(wǎng)絡(luò)安全的評估中受到主觀因素影響比較大,這導(dǎo)致網(wǎng)絡(luò)安全評估的科學性與嚴謹性不足?;谌斯ぶ悄芗夹g(shù)的智能化網(wǎng)絡(luò)安全評估方法,能有效地解決網(wǎng)絡(luò)安全評估科學性與嚴謹性不足的問題,使得網(wǎng)絡(luò)安全評估結(jié)果更加客觀、合理[2]。相關(guān)向量機(Relevance Vector Machine,RVM)是一種新的監(jiān)督學習算法,在網(wǎng)絡(luò)安全評估中具有廣泛的應(yīng)用,但核函數(shù)的寬度對網(wǎng)絡(luò)安全評估的性能影響比較大[3]。本文采用蝙蝠算法(Bat Algorithm,BA)優(yōu)化RVM模型,并將其應(yīng)用于醫(yī)院網(wǎng)絡(luò)安全量化評估中。將醫(yī)院網(wǎng)絡(luò)安全量化評估結(jié)果和傳統(tǒng)RVM模型對比,驗證所提出BA-RVM網(wǎng)絡(luò)安全量化評估的有效性,這為醫(yī)院開展網(wǎng)絡(luò)安全量化評估提供了新的思路。
為了更好地維護網(wǎng)絡(luò)安全,國家制定了相關(guān)的標準與技術(shù)要求,有效地確保網(wǎng)絡(luò)傳輸信息的準確性、完整性、可用性,同時避免非法訪問。建立網(wǎng)絡(luò)安全評估模型就是要在此基礎(chǔ)上,按照科學、公開、合理的原則開展網(wǎng)絡(luò)安全評價。對網(wǎng)絡(luò)安全評估的重點是網(wǎng)絡(luò)安全事件的影響范圍與危害程度,包含系統(tǒng)風險、資金風險、設(shè)備風險等多個方面的內(nèi)容,具體計算式為
網(wǎng)絡(luò)安全級別=R(L(T,V),R(Ia,Va))
(1)
式中,R為網(wǎng)絡(luò)安全風險計算函數(shù),L為網(wǎng)絡(luò)安全出現(xiàn)的預(yù)測值,T為網(wǎng)絡(luò)安全威脅,V為網(wǎng)絡(luò)安全可靠度,Ia為網(wǎng)絡(luò)安全出現(xiàn)風險后業(yè)務(wù)應(yīng)用情況,Va為網(wǎng)絡(luò)安全出現(xiàn)風險后設(shè)備資產(chǎn)本身的可抵抗程度。
文獻[4]從資產(chǎn)、脆弱性、威脅等3個角度建立醫(yī)院網(wǎng)絡(luò)安全評估模型,具體如圖1所示。
圖1 網(wǎng)絡(luò)安全評估模型
醫(yī)院網(wǎng)絡(luò)安全水平的量化評估預(yù)測和評價指標的選擇之間具有十分密切的關(guān)系,科學選擇評價指標有助于提高醫(yī)院網(wǎng)絡(luò)安全水平量化評估的準確度。如果評價指標選擇比較多,那么信息就會產(chǎn)生冗余和干擾,同時量化評估的效率也比較低;如果評價指標選擇比較少,那么就會導(dǎo)致不能獲取足夠的信息,影響量化評估的精度。本文采用層次分析法建立醫(yī)院網(wǎng)絡(luò)安全量化評估的評價指標,具體如圖2所示。
圖2 醫(yī)院網(wǎng)絡(luò)安全評價指標體系
(2)
式中,N為樣本數(shù)據(jù)個數(shù),wi為設(shè)置權(quán)重值,w0為偏置,K(x,xi)為核函數(shù)。
建立RVM模型要求目標函數(shù)必須是相對獨立的,同時目標函數(shù)本身包含噪聲,即
yn=f(xn,w)+εn
(3)
式中,εn為噪聲。
對應(yīng)似然函數(shù)計算式為
(4)
式中,y=[y1,y2,…,yN]T,w=[w1,w2,…,wN]T,φ=[φ(x1),φ(x2),…,φ(xN)]T,φ(xN)=[1,K(xn,x1),K(xn,x2),…,K(xn,xN)]T。
傳統(tǒng)方法是采用最大似然法來求解最優(yōu)權(quán)值,但是往往會出現(xiàn)過度擬合的情況。為了避免在求解最優(yōu)權(quán)值的過程中過度擬合,本文采用稀疏貝葉斯(Spare Bayesian)公式計算權(quán)重w所對應(yīng)的先驗概率的條件分布,即
(5)
利用貝葉斯公式來計算未知參數(shù)對應(yīng)的后驗概率,即
(6)
聯(lián)合以上各式,權(quán)重w所對應(yīng)的后驗概率計算式為
(7)
其中,Σ=(δ-2φTφ+A)-1,A=diag(α0,α1,…,αN),μ=δ-2ΣφTy。
利用delta函數(shù)計算樣本數(shù)據(jù)的相似性,通過樣本數(shù)據(jù)的相似計算來有效解決相關(guān)聯(lián)向量向超參數(shù)進行學習轉(zhuǎn)化和后驗概率存在的模式化問題,確保參數(shù)α取得最大值的計算式為
(8)
進行循環(huán)迭代估計,得到
(9)
式中,μi為第i個平均后驗權(quán)重,Σij為第i個相對角的具體元素。
采用RVM模型對醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測的性能與核函數(shù)寬度g之間具有密切的關(guān)系,為了更好地提高RVM模型對醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測的性能,采用BA算法對核函數(shù)寬度g進行優(yōu)化。定義目標函數(shù)為
s.t.g∈[gmin,gmax]
(10)
BA是依據(jù)蝙蝠借助回聲實施定位的生物學原理提出的群體智能優(yōu)化算法,提出BA群體智能優(yōu)化算法基于以下3個方面的假設(shè)[6]。
假設(shè)1:蝙蝠群體內(nèi)所有的個體均通過回聲定位來進行距離的感知。
假設(shè)2:蝙蝠群體內(nèi)個體的行動軌跡過程為個體在Xi位置,以Vi速度進行隨機無目的的飛行,在整個飛行過程中采用固定頻率fmin、可變波長λ和響應(yīng)A0進行獵物的搜索,同時蝙蝠個體在飛行的過程中會自動地發(fā)射出脈沖頻率以及進行波長調(diào)整。脈沖波長的調(diào)整依賴于蝙蝠個體和獵物之間的距離,頻度r在區(qū)間[0,1]范圍內(nèi)調(diào)整。
假設(shè)3:在使用BA智能優(yōu)化算法之前預(yù)先設(shè)定獵物回聲的上限值A(chǔ)max和下限值A(chǔ)min。
設(shè)定目標函數(shù)minf(X),X=(x1,x2,…,xd)T,采用BA求解的步驟[7]如下。
步驟1:參數(shù)初始化
初始化蝙蝠種群規(guī)模NP,標識蝙蝠種群每一個個體的初始位置Xi(i=1,2,…,NP),設(shè)置搜索脈沖對應(yīng)頻率范圍[fmin,fmax],脈沖速率r0,最大聲音值A(chǔ)0,脈沖速率增強系數(shù)γ和聲音響應(yīng)衰減系數(shù)α。
步驟2:脈沖頻率、速度以及蝙蝠位置更新
對脈沖頻率、速度以及蝙蝠位置進行實時動態(tài)更新,即
(11)
式中,t為循環(huán)迭代次數(shù),β為區(qū)間[0,1]上的隨機向量,X*為當前全局最優(yōu)解的坐標位置。
步驟3:獲得最新解
由隨機函數(shù)生成隨機數(shù)rand,如果隨機數(shù)rand>ri,那么選擇最優(yōu)解集中的任意值,同時在最優(yōu)解附近生產(chǎn)局部最優(yōu)解,同時結(jié)合隨機擾動方程獲得最新解,即
Xnew=Xold+εAt
(12)
式中,Xnew為最新解,Xold為原始解,ε為區(qū)間(-1,1)上的隨機數(shù),At為完成t次迭代運算相應(yīng)結(jié)果的平均值,即平均響應(yīng)值。
步驟4:脈沖響應(yīng)與頻率更新
如果滿足rand (13) 步驟5:算法終止條件判斷 判斷是否滿足BA的終止條件:如果滿足算法終止條件,那么輸出解即為最優(yōu)解;如果不滿足算法終止條件,那么返回步驟2。 采用BA智能優(yōu)化算法對RVM參數(shù)進行優(yōu)化,得到用于醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測的BA-RVM模型。具體流程如下。 (1)對BA智能優(yōu)化算法初始化,同時將醫(yī)院網(wǎng)絡(luò)安全量化數(shù)據(jù)樣本按照4∶1的比例分為訓練樣本和測試樣本,采用訓練樣本對BA-RVM模型進行訓練,采用測試樣本求證BA-RVM模型的有效性。 (2)計算目標函數(shù)適應(yīng)參數(shù)值,采用式(10)計算蝙蝠種群每一個蝙蝠個體的個體適應(yīng)度值。 (3)判斷是否滿足BA設(shè)定的終止條件。如果滿足BA設(shè)定的終止條件,那么輸出的解作為核函數(shù)的最優(yōu)寬度g*,得到優(yōu)化后的RVM模型,采用訓練樣本完成對醫(yī)院網(wǎng)絡(luò)安全的量化評估;如果不滿足BA算法設(shè)定的終止條件,那么跳轉(zhuǎn)到第(4)步。 (4)采用頻率調(diào)整公式獲得最新解以及所對應(yīng)的蝙蝠速度與位置坐標。 (5)對接受新解與否進行邏輯判斷。如果接受新解,則執(zhí)行步驟(6);如果不接受新解,則執(zhí)行步驟(4)。 (6)更新蝙蝠響應(yīng)和發(fā)射頻率,跳轉(zhuǎn)到步驟(2)。 基于BA-RVM模型的醫(yī)院網(wǎng)絡(luò)安全量化評估流程[8-9]如圖3所示。 圖3 基于BA-RVM的醫(yī)院網(wǎng)絡(luò)安全量化評估算法流程圖 實驗數(shù)據(jù)來源于某三甲醫(yī)院2011—2020年網(wǎng)絡(luò)安全量化評價數(shù)據(jù),對數(shù)據(jù)進行歸一化處理,同時過濾噪聲,網(wǎng)絡(luò)安全評價指標得分如表1所示,網(wǎng)絡(luò)安全最終得分如表2所示。 表1 2011—2020年網(wǎng)絡(luò)安全評價指標得分 表2 2011—2020年網(wǎng)絡(luò)安全最終得分 為了更好地評價算法的性能,采用均方根誤差(Root Mean Square Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE)作為衡量指標,RMSE和MAE計算式為 (14) (15) RMSE反映了模型預(yù)測值和實際值的離散程度,MAE反映了模型的誤差。RMSE和MAE值越小,那么模型的預(yù)測精度越高、性能越穩(wěn)定。 當滿足醫(yī)院網(wǎng)絡(luò)安全評價指標的實際值和預(yù)測值相等時,將醫(yī)院網(wǎng)絡(luò)安全評價結(jié)果設(shè)置為1,該結(jié)果值是識別醫(yī)院網(wǎng)絡(luò)安全是否在高風險區(qū)的極限值之內(nèi)。本文設(shè)定的醫(yī)院網(wǎng)絡(luò)安全級別評價標準如表3所示。 表3 網(wǎng)絡(luò)安全評判標準 將由網(wǎng)絡(luò)安全專家打分獲得的11組數(shù)據(jù)樣本進行劃分,前7組數(shù)據(jù)樣本為訓練樣本,后4組數(shù)據(jù)樣本為測試樣本。設(shè)定BA的種群規(guī)律為10,最大迭代次數(shù)為100,脈沖速率為0.5,搜索脈沖范圍為0-2,聲音最大響應(yīng)值為0.25,響應(yīng)衰減系數(shù)值為0.9,所對應(yīng)的脈沖速率增強系數(shù)為0.05。分別采用RVM模型和BA-RVM進行醫(yī)院安全量化評估預(yù)測,評價結(jié)果如圖4所示,評價相對誤差如圖5所示,同時給出2種模型的RMSE和MAE,如表4所示。 表4 不同算法結(jié)果對比 (a)RVM 由圖4可知:不論是采用RVM模型還是BA-RVM模型,第1組和第2組的實際得分和預(yù)測得分相差均比較小,而第3組和第4組的實際得分和預(yù)測得分相差均比較大;采用BA-RVM模型的預(yù)測得分和實際得分相差比較小,而采用BA-RVM模型的預(yù)測得分和實際得分相差比較大。 由圖5可知,通過得分相對誤差可以非常直觀地看出采用BA-RVM模型的預(yù)測得分和實際得分相對誤差明顯小于采用RVM模型的預(yù)測得分和實際得分相對誤差。 (a)RVM 由表4可知,BA-RVM算法的RMSE和MAE值均小于RVM算法,即BA-RVM模型相對于RVM模型,其預(yù)測精度更高、性能更穩(wěn)定,即基于BA-RVM模型的醫(yī)院網(wǎng)絡(luò)安全量化評價預(yù)測具有更高的精度和穩(wěn)定性,為醫(yī)院網(wǎng)絡(luò)安全量化評估提供了新的方法。 醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測對提升網(wǎng)絡(luò)安全性具有至關(guān)重要的意義,本文提出了一種基于BA-RVM模型的醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測方法,從資產(chǎn)、脆弱性、威脅等3個角度建立了醫(yī)院網(wǎng)絡(luò)安全量化評價指標體系,同時采用BA對RVM模型核函數(shù)寬度進行優(yōu)化,并將優(yōu)化后的RVM模型應(yīng)用于山東省某三甲醫(yī)院的網(wǎng)絡(luò)安全量化評估預(yù)測中。將預(yù)測結(jié)果和傳統(tǒng)RVM模型的預(yù)測結(jié)果進行對比,指出BA-RVM模型對醫(yī)院網(wǎng)絡(luò)安全量化評估預(yù)測精度更高,模型性能更穩(wěn)定,是醫(yī)院網(wǎng)絡(luò)安全量化評價的一種新方法。3.3 BA-RVM流程
4 實證分析
4.1 數(shù)據(jù)來源
4.2 評價指標
4.3 結(jié)果分析
5 總結(jié)