王 瑞李芯蕊馬雙斌
1(甘肅省公安廳網(wǎng)絡(luò)安全保衛(wèi)總隊(duì) 蘭州 730030)2(蘭州大學(xué)甘肅省信息安全等級(jí)保護(hù)測(cè)評(píng)中心 蘭州 730030)3(蘭州大學(xué)應(yīng)用技術(shù)研究院有限責(zé)任公司 蘭州 730030)(313916914@qq.com)
隨著網(wǎng)絡(luò)的發(fā)展,各行業(yè)經(jīng)營(yíng)模式的互聯(lián)網(wǎng)化,使得網(wǎng)絡(luò)成為我們生活中不可或缺的一部分.同時(shí),網(wǎng)絡(luò)安全問(wèn)題也日益嚴(yán)峻,最近的勒索病毒更是對(duì)我們的一個(gè)嚴(yán)重警告,時(shí)時(shí)刻刻提醒著我們生活的網(wǎng)絡(luò)環(huán)境仍然存在著很大的不安全性以及不確定性.網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)(network situation prediction)是指在一定環(huán)境下,基于當(dāng)前的網(wǎng)絡(luò)安全態(tài)勢(shì)的評(píng)估值和以前的一段時(shí)間周期內(nèi)的歷史評(píng)估數(shù)據(jù),通過(guò)具有有效規(guī)則的網(wǎng)絡(luò)安全態(tài)勢(shì)值來(lái)表達(dá)網(wǎng)絡(luò)運(yùn)行的安全狀況,模擬相同條件下下一時(shí)間周期的安全態(tài)勢(shì)宏觀變化情況,給網(wǎng)絡(luò)管理員提供必要的安全防范策略決策支持.網(wǎng)絡(luò)安全態(tài)勢(shì)的概念于1999 年由Bass[1]正式提出,并構(gòu)建了基于多傳感器數(shù)據(jù)融合的網(wǎng)絡(luò)安全態(tài)勢(shì)感知模型.隨后,國(guó)內(nèi)外許多研究者投入大量精力對(duì)網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)的相關(guān)理論及實(shí)踐進(jìn)行研究:Lai等人[2]提出附加權(quán)重的GM(1,1)預(yù)測(cè)模型對(duì)網(wǎng)絡(luò)態(tài)勢(shì)進(jìn)行預(yù)測(cè)的方法;在Bao等人[3]提出的入侵意圖的基礎(chǔ)上,針對(duì)多步攻擊的預(yù)測(cè)算法,謝麗霞等人[4]通過(guò)自適應(yīng)遺傳算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的參數(shù),并建立預(yù)測(cè)模型對(duì)網(wǎng)絡(luò)態(tài)勢(shì)進(jìn)行感知;唐成華等人[5]針對(duì)態(tài)勢(shì)評(píng)估性能所存在的問(wèn)題,提出了DS融合知識(shí)的評(píng)估方法.
目前網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)模型主要有灰色理論預(yù)測(cè)模型、回歸分析預(yù)測(cè)模型和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型.灰色理論預(yù)測(cè)模型具有很強(qiáng)的適用性,同時(shí)其算法簡(jiǎn)單且易于實(shí)現(xiàn).灰色模型計(jì)算工作量小,并且可以通過(guò)對(duì)少量樣本的分析來(lái)體現(xiàn)網(wǎng)絡(luò)的安全態(tài)勢(shì)[6].但是,灰色理論模型預(yù)測(cè)的精度不高,具有較大誤差,僅能反映基本的網(wǎng)絡(luò)安全的未來(lái)走勢(shì),導(dǎo)致其應(yīng)用范圍狹窄,具有很大的局限性和不科學(xué)性.回歸分析預(yù)測(cè)模型在時(shí)間上表現(xiàn)了很好的相關(guān)性,它能根據(jù)歷史自變量值來(lái)估計(jì)因變量的總體平均值.同時(shí),在預(yù)測(cè)結(jié)果方面,回歸分析預(yù)測(cè)模型也體現(xiàn)了因變量的隨機(jī)性及周期性.但是,回歸分析預(yù)測(cè)模型也有一定的不足之處,它需要繁多的人工操作,對(duì)于中長(zhǎng)期的情況,該方法效果并不理想.神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)科學(xué)的基礎(chǔ)上提出和發(fā)展起來(lái)的,它是由神經(jīng)元作為基本單位,大量的微處理單元連接而成的復(fù)雜的、能夠進(jìn)行任務(wù)并行處理的系統(tǒng).它通過(guò)非線(xiàn)性的方式將復(fù)雜的問(wèn)題進(jìn)行轉(zhuǎn)換,隨后通過(guò)超強(qiáng)的自組織、自學(xué)習(xí)能力,建立模型來(lái)處理不精確、模糊或海量的信息.但是神經(jīng)網(wǎng)路方法需要較長(zhǎng)的訓(xùn)練時(shí)間,消耗比較大,容易受到主觀因素的影響,陷入局部極小值[7],影響結(jié)果的客觀性.
支持向量機(jī)是由Corinna Cortes和Vladimir Vapnik在1995年提出,它是一種監(jiān)督學(xué)習(xí)模型,可用來(lái)進(jìn)行數(shù)據(jù)分類(lèi)、回歸分析以及孤立點(diǎn)檢測(cè)等應(yīng)用.其優(yōu)勢(shì)在于它在高維空間中有效,且通過(guò)核機(jī)制的引入,能有效執(zhí)行非線(xiàn)性分類(lèi)的情況,針對(duì)線(xiàn)性不可分情況,引入核函數(shù)有效克服維數(shù)災(zāi)難[7].支持向量機(jī)的另一個(gè)特點(diǎn)在于它是把結(jié)構(gòu)風(fēng)險(xiǎn)最小化,可以有效解決易陷入局部最小和過(guò)學(xué)習(xí)的問(wèn)題.
支持向量機(jī)的結(jié)構(gòu)示意圖如圖1所示:
圖1 支持向量機(jī)的結(jié)構(gòu)示意圖
在圖1所示支持向量機(jī)的結(jié)構(gòu)中,要選擇滿(mǎn)足下述定理1的特征的核函數(shù),將非線(xiàn)性的輸入隱式映射到高維的特征空間中.
定理1[8]. 若對(duì)稱(chēng)函數(shù)K(μ,υ)能以正系數(shù)αk>0展開(kāi)成
(1)
其充要條件為K(μ,υ)是某個(gè)特征空間中的內(nèi)積,在使g≠0條件下:
(2)
?K(μ,υ)g(μ)dμdμ>0
(3)
成立.
1.4.2 現(xiàn)有居家養(yǎng)老服務(wù)難以滿(mǎn)足農(nóng)村老人醫(yī)療護(hù)理服務(wù)需求 隨著經(jīng)濟(jì)社會(huì)發(fā)展以及醫(yī)療技術(shù)水平的提高,在帶來(lái)老年人壽命延長(zhǎng)的同時(shí),也導(dǎo)致了老年人群的殘障比增加。據(jù)第六次人口普查資料顯示(圖3),隨著年齡的增長(zhǎng),農(nóng)村自評(píng)為健康的老年人下降明顯,失能、失智的老年人數(shù)目不斷增加。同時(shí),由于長(zhǎng)時(shí)間從事重體力勞動(dòng)、又缺乏體檢等預(yù)防性觀念,農(nóng)村老年人的健康狀況與城市相比較差,農(nóng)村老人存在“潛在的”醫(yī)療服務(wù)需求,但是農(nóng)村醫(yī)療資源相對(duì)缺乏、供給缺位,不利于農(nóng)村居家養(yǎng)老服務(wù)項(xiàng)目和服務(wù)內(nèi)容的拓展。
核函數(shù)和懲罰函數(shù)都具有可調(diào)節(jié)性,對(duì)支持向量機(jī)模型的建立起著至關(guān)重要的作用.選擇合適的核函數(shù)將數(shù)據(jù)投影到比較合適的特征空間后才能使用支持向量機(jī)進(jìn)行分類(lèi)和預(yù)測(cè)[9].根據(jù)數(shù)據(jù)樣本的規(guī)模和特點(diǎn),并針對(duì)本文的網(wǎng)絡(luò)態(tài)勢(shì)預(yù)測(cè)問(wèn)題,可以選擇粒子群算法來(lái)優(yōu)化支持向量機(jī)的參數(shù).在解決網(wǎng)絡(luò)搜索算法受限的問(wèn)題上,粒子群算法和遺傳算法都可以作為優(yōu)化算法,但粒子群算法未使用交叉和變異操作,簡(jiǎn)化了操作步驟,提高了效率.
每個(gè)優(yōu)化問(wèn)題的潛在解其實(shí)就是粒子群算法的“粒子”,可以把它當(dāng)作一個(gè)D維搜索空間上的點(diǎn).
粒子群算法(particle swarm optimization)的基本原理可以描述為:假設(shè)在D維搜索空間中共有n個(gè)粒子以一定的速度在飛行,選取種群X=(X1,X2,…,Xn),第i個(gè)粒子的位置為Xi=(xi 1,xi 2,…,xi n),第i個(gè)粒子的速度為Vi=(vi 1,vi 2,…,vi D).根據(jù)目標(biāo)函數(shù)計(jì)算出Xi對(duì)應(yīng)的適應(yīng)度值,其中Pi=(pi 1,pi 2,…,pi D)為其個(gè)體極值,種群的全局極值為Pg=(pg 1,pg 2,…,pg D).粒子的速度和位置的更新公式為
vi j(t+1)=wvi j(t)+c1r1(pi j(t)-
xi j(t))+c2r2,
(4)
xi j(t+1)=xi j(t)+vi j(t+1),
(5)
其中,w為慣性權(quán)重,i=1,2,…,n,j=1,2,…,d.
可以得到粒子群優(yōu)化參數(shù)選優(yōu)的具體過(guò)程為[10]:
Step1. 根據(jù)適應(yīng)度函數(shù)評(píng)價(jià)粒子,直到滿(mǎn)足停止迭代條件,其中適應(yīng)度函數(shù)是根據(jù)交叉驗(yàn)證意義下的誤差確定;
Step2. 初始化具有n個(gè)粒子數(shù)目的種群,設(shè)定空間位置和速度、最大迭代次數(shù)kmax、慣性權(quán)重w、學(xué)習(xí)因子c1,c2以及終止條件;
Step3. 求種群中每個(gè)粒子的適應(yīng)度值;
Step4. 比較每個(gè)粒子的適應(yīng)值和經(jīng)過(guò)位置pbesti;效果好,作為當(dāng)前最優(yōu)位置pbesti;否則,保持原位置;
Step5. 比較每個(gè)粒子適應(yīng)值和全局所經(jīng)歷的最優(yōu)位置gbest,效果好,則將其作為種群經(jīng)歷的最優(yōu)位置gbest;
Step6. 按照式(4)(5)對(duì)粒子速度和位置進(jìn)行更新;
Step7.判斷是否符合終止條件,若滿(mǎn)足則輸出,否則轉(zhuǎn)Step3;我們把循環(huán)終止條件設(shè)為達(dá)到最大迭代次數(shù)genmax.
本文取絕對(duì)誤差、平均絕對(duì)誤差、平均相對(duì)誤差和平均平方根誤差作為實(shí)驗(yàn)的評(píng)價(jià)指標(biāo);這些值越小,說(shuō)明預(yù)測(cè)得越準(zhǔn)確.
本文采用的實(shí)驗(yàn)數(shù)據(jù)來(lái)自國(guó)家互聯(lián)網(wǎng)應(yīng)急中心網(wǎng)站上公布的態(tài)勢(shì)報(bào)告,我們分別選取5個(gè)影響安全態(tài)勢(shì)的因素:主機(jī)數(shù)量-感染病毒、網(wǎng)站數(shù)量-被篡改、網(wǎng)站總數(shù)-被植入后門(mén)、網(wǎng)站數(shù)量-仿冒頁(yè)面和信息安全漏洞數(shù)量-新增.安全級(jí)別可分為:優(yōu)、良、中、差、危.將安全態(tài)勢(shì)轉(zhuǎn)換為數(shù)字表示,如表1所示:
表1 安全態(tài)勢(shì)與數(shù)字對(duì)應(yīng)表
本文提出了基于PSO-SVR的網(wǎng)絡(luò)態(tài)勢(shì)預(yù)測(cè)模型,將過(guò)去和現(xiàn)在的統(tǒng)計(jì)指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理,形成歷史網(wǎng)絡(luò)態(tài)勢(shì)值,將該值經(jīng)過(guò)模型訓(xùn)練和測(cè)試后,可以達(dá)到預(yù)測(cè)未來(lái)的網(wǎng)絡(luò)態(tài)勢(shì)值的目的.在本文中我們?nèi)?00周的態(tài)勢(shì)報(bào)告,形成100組數(shù)據(jù).取前90周作為訓(xùn)練,后10周作為模型預(yù)測(cè).數(shù)據(jù)集中包含5個(gè)特征和1個(gè)標(biāo)簽.
網(wǎng)絡(luò)態(tài)勢(shì)實(shí)際值和預(yù)測(cè)值的對(duì)比如表2所示:
表2 網(wǎng)絡(luò)態(tài)勢(shì)實(shí)際值和預(yù)測(cè)值的對(duì)比
使用PSO-SVR模型測(cè)試樣本的網(wǎng)絡(luò)態(tài)勢(shì)預(yù)測(cè)曲線(xiàn)圖如圖2所示:
圖2 網(wǎng)絡(luò)態(tài)勢(shì)預(yù)測(cè)曲線(xiàn)圖
預(yù)測(cè)結(jié)果的絕對(duì)誤差曲線(xiàn)圖如圖3所示:
圖3 絕對(duì)誤差曲線(xiàn)圖
用評(píng)價(jià)指標(biāo)對(duì)預(yù)測(cè)的結(jié)果進(jìn)行定性的評(píng)判,得到各評(píng)價(jià)指標(biāo)的值如表3所示:
表3 網(wǎng)絡(luò)態(tài)勢(shì)實(shí)際值和預(yù)測(cè)值的對(duì)比
從表2、圖2和圖3可得:本文提出的模型對(duì)實(shí)驗(yàn)過(guò)程中所取的測(cè)試樣本的預(yù)測(cè)值與實(shí)際態(tài)勢(shì)值的基本相符,通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的分析,可以得出本文所提出的模型有較好的預(yù)測(cè)準(zhǔn)確度,能夠符合網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)技術(shù)的要求.
本文使用PSO優(yōu)化SVR參數(shù)對(duì)網(wǎng)絡(luò)安全態(tài)勢(shì)進(jìn)行預(yù)測(cè).該預(yù)測(cè)模型能得到與真實(shí)值誤差較小的預(yù)測(cè)值,擬合性較好.實(shí)驗(yàn)表明,PSO-SVR預(yù)測(cè)模型可以較好地預(yù)測(cè)網(wǎng)絡(luò)態(tài)勢(shì),取得了較好的效果,增強(qiáng)網(wǎng)絡(luò)安全防御的主動(dòng)性,降低網(wǎng)絡(luò)攻擊給人們帶來(lái)的損失,實(shí)用范圍廣泛.