丁 俊
(安徽工業(yè)經(jīng)濟(jì)職業(yè)技術(shù)學(xué)院,安徽 合肥 230051)
隨著軟件的廣泛應(yīng)用,對(duì)軟件的安全性要求越來(lái)越高,在復(fù)雜網(wǎng)絡(luò)環(huán)境下,在網(wǎng)絡(luò)攻擊等因素的影響下或是軟件設(shè)計(jì)本身的缺陷,導(dǎo)致軟件極容易出現(xiàn)安全漏洞,因此需要構(gòu)建優(yōu)化的軟件安全漏洞檢測(cè)模型,結(jié)合軟件安全漏洞大數(shù)據(jù)分布和挖掘結(jié)果,實(shí)現(xiàn)對(duì)軟件安全漏洞自動(dòng)挖掘,以提高軟件安全性,所以相關(guān)的軟件安全漏洞自動(dòng)挖掘方法研究在軟件開(kāi)發(fā)和維護(hù)中具有重要意義[1].
對(duì)軟件安全漏洞進(jìn)行自動(dòng)挖掘是保證軟件安全運(yùn)行的基礎(chǔ),當(dāng)前,對(duì)軟件安全漏洞檢測(cè)的方法有很多,相關(guān)研究也受到了很多學(xué)者的廣泛關(guān)注.文獻(xiàn)[2]中提出基于關(guān)聯(lián)規(guī)則的軟件安全漏洞挖掘方法,該方法采用RDARF規(guī)則篩選器來(lái)獲取強(qiáng)規(guī)則,提取安卓驅(qū)動(dòng)的申請(qǐng)權(quán)限信息,從而建立權(quán)限特征集合,依據(jù)權(quán)限關(guān)系特征庫(kù)實(shí)現(xiàn)軟件漏洞的挖掘.文獻(xiàn)[3]中提出基于模糊測(cè)試技術(shù)的軟件安全漏洞挖掘方法,該方法首先進(jìn)行軟件安全漏洞信息的采集,根據(jù)采集信息結(jié)果構(gòu)建分布特征量模型,對(duì)其進(jìn)行融合處理從而實(shí)現(xiàn)關(guān)聯(lián)信息提取,并采用模糊測(cè)試技術(shù)實(shí)現(xiàn)信息自適應(yīng)聚類(lèi)和挖掘.文獻(xiàn)[4]中提出基于隨機(jī)探測(cè)算法和信息聚合的漏洞挖掘方法,采用隨機(jī)探測(cè)算法進(jìn)行靜態(tài)特征的提取,同時(shí)對(duì)參數(shù)進(jìn)行信息聚合處理,運(yùn)用隨機(jī)森林算法構(gòu)建訓(xùn)練模型以有效進(jìn)行軟件安全漏洞信息的挖掘.盡管上述方法具有有效性,但是由于上述方法的特征提取能力不高,導(dǎo)致軟件安全漏洞挖掘的效果較差.針對(duì)上述問(wèn)題,本文提出基于大數(shù)據(jù)技術(shù)的軟件安全漏洞自動(dòng)挖掘方法.
為了實(shí)現(xiàn)基于大數(shù)據(jù)技術(shù)的軟件安全漏洞自動(dòng)挖掘,首先構(gòu)建軟件安全漏洞檢測(cè)的原始信息采集模型,采用自相關(guān)匹配檢測(cè)方法進(jìn)行軟件安全維數(shù)的信息分解[5],得到軟件安全漏洞信息的指向性增益為:
(1)
建立軟件安全漏洞信道容量參數(shù)估計(jì)模型,結(jié)合改進(jìn)的空間信息聚類(lèi)方法[6],得到軟件安全漏洞的信息分解結(jié)果為:
(2)
在上述基礎(chǔ)上,提取軟件安全漏洞信息的統(tǒng)計(jì)參數(shù)量,結(jié)合模糊信息散射簇聚類(lèi)方法,得到軟件安全漏洞參數(shù)的采集模型,在t時(shí)刻得到參數(shù)分解函數(shù)為:
(3)
構(gòu)建軟件的多徑傳輸信道模型,結(jié)合模糊參數(shù)融合,得到安全漏洞的傳輸信息采樣分量:
(4)
其中,A(t)為軟件安全漏洞融合的幅度.
提取軟件安全信息的譜信息,通過(guò)隨機(jī)泛函分析[7],得到軟件的信道載波分量:
(5)
其中,N(z)是軟件消息傳遞的分子多項(xiàng)式,它的零點(diǎn)在z=e±jω0處,D(z)為軟件安全漏洞的大數(shù)據(jù)挖掘的統(tǒng)計(jì)特征量.分析軟件安全漏洞信息輸出的模糊信息匹配集,得到安全漏洞分布的殘差分量[8],確定軟件態(tài)勢(shì)感知的幅頻響應(yīng),得到軟件安全漏洞信息采集的基準(zhǔn)頻率為:
(6)
在得到安全漏洞信息采集基準(zhǔn)頻率的基礎(chǔ)上對(duì)軟件安全漏洞大數(shù)據(jù)信息參量進(jìn)行自適應(yīng)調(diào)整[9],得到軟件安全漏洞信息的采集模型為:
(7)
其中,ejπ表示軟件安全漏洞的模糊貼近度.綜上所述分析,實(shí)現(xiàn)了對(duì)軟件安全漏洞的信息采集,下一步通過(guò)動(dòng)態(tài)信息融合以實(shí)現(xiàn)軟件安全漏洞信息的融合處理.
(8)
其中,μ1,μ2分別表示耦合參數(shù)集P中的耦合參數(shù).采用擴(kuò)頻序列分析的方法進(jìn)行軟件安全漏洞信息的分布式重組,得到軟件安全漏洞信息感知傳遞函數(shù)為:
(9)
其中,θ1,θ2分別表示不同匹配濾波的特征參數(shù)和帶寬參數(shù).假設(shè)軟件安全漏洞信息的諧振分量為v=rωr,阻抗因素為r=rr+lg,軟件安全漏洞信息的動(dòng)態(tài)抑制系數(shù)為B=kβk1Bg,安全漏洞信息的低頻調(diào)制系數(shù)為l=lskfkcAw/Ac,構(gòu)建自適應(yīng)反演控制模型,得到軟件安全漏洞信息融合函數(shù):
(10)
通過(guò)級(jí)聯(lián)特征匹配[11],建立軟件安全漏洞的梯度空間模型,其表示為:
(11)
其中,wp,wv,wc為軟件安全漏洞信息檢測(cè)的輸出權(quán)重,P1=Pcu+Ph+Pe+Pb+Pw為適應(yīng)度函數(shù),Vt為耦合系數(shù),C為軟件安全漏洞信息檢測(cè)的阻尼系數(shù).
在固定頻率段內(nèi),得到軟件安全漏洞挖掘的多普勒頻移,記做ωd,采用動(dòng)態(tài)信息融合的方法,結(jié)合融合函數(shù)與梯度空間模型,構(gòu)建軟件安全漏洞的信息融合模型為:
(12)
基于信息融合結(jié)果的基礎(chǔ)上,結(jié)合統(tǒng)計(jì)特征分析方法,確定軟件安全漏洞的交叉信息分布集,以提高安全漏洞的自適應(yīng)挖掘能力[12].
采用基函數(shù)集穩(wěn)定分析的方法,得到軟件安全漏洞信息的遞歸特征量為:
(13)
其中,〈g1,g2〉表示軟件的安全漏洞檢測(cè)的頻譜特征量.
采用極限挖掘的方法,得到軟件的安全漏洞的擾動(dòng)特征分解結(jié)果為:
(14)
其中*G表示軟件安全漏洞檢測(cè)的卷積系數(shù),統(tǒng)計(jì)特征分析方法,對(duì)軟件安全漏洞信息的定位進(jìn)行分析,得到漏洞信息定位分析方程:
(15)
采用大數(shù)據(jù)挖掘方法進(jìn)行軟件的傳輸信息采集和節(jié)點(diǎn)部署[13],軟件安全漏洞挖掘的擴(kuò)頻帶寬為:
(16)
結(jié)合頻譜分布特性,來(lái)確定安全漏洞的交叉信息分布集,得到軟件安全漏洞挖掘的信道切換控制函數(shù)為:
(17)
基于信道切換控制結(jié)果,根據(jù)模糊決策模型,構(gòu)建軟件安全漏洞評(píng)價(jià)指標(biāo)集為Ek∈E(k=1,2,…,t),得到自適應(yīng)切換控制函數(shù)定義為vm,m∈[1,n].利用頻譜分布特征分析,得到軟件安全漏洞信息的時(shí)域分布信息,表示為:
(18)
其中,τ為模糊度擴(kuò)展的時(shí)延,φ為軟件的多徑特征分量.
經(jīng)過(guò)“篩分”過(guò)程,獲取軟件的模糊概率密度函數(shù),并結(jié)合大數(shù)據(jù)技術(shù)構(gòu)建軟件安全漏洞信息的特征提取模型,表達(dá)為:
(19)
其中,σV表示軟件的信道差異度函數(shù).綜上所述分析,得到軟件安全漏洞信息的特征提取結(jié)果,下一步需要采用大數(shù)據(jù)技術(shù)進(jìn)行軟件安全漏洞信息的大數(shù)據(jù)挖掘優(yōu)化設(shè)計(jì).
基于特征提取結(jié)果,利用信息調(diào)度和大數(shù)據(jù)技術(shù)實(shí)現(xiàn)軟件安全漏洞信息的數(shù)據(jù)挖掘優(yōu)化設(shè)計(jì).假設(shè)軟件安全漏洞信息傳輸?shù)哪:齽?dòng)態(tài)約束參數(shù)模型描述為:xj={x1j,x2j,...,xmj}T,設(shè)計(jì)大數(shù)據(jù)挖掘模型,得到軟件安全漏洞挖掘的收斂性約束條件為:
(20)
式(20)中,|v|表示軟件安全漏洞分布的復(fù)包絡(luò).假設(shè)Sk(t)為軟件信息傳輸信道e上的傳輸數(shù)據(jù)量,采用異構(gòu)有向圖分析方法進(jìn)行軟件安全漏洞信息結(jié)構(gòu)重組,軟件安全漏洞挖掘的自適應(yīng)分配模糊度矩陣R=(rij,aij)m×n,利用大數(shù)據(jù)信息調(diào)度,得到軟件安全漏洞檢測(cè)的目標(biāo)函數(shù)為:
(21)
其中,區(qū)間[xmin,j,xmax,j]構(gòu)成軟件安全漏洞挖掘的大數(shù)據(jù)分布時(shí)間窗口,ρ為軟件安全漏洞挖掘的自適應(yīng)調(diào)節(jié)系數(shù),其定義為:
(22)
結(jié)合多元交叉分布式辨識(shí)和大數(shù)據(jù)技術(shù),得到軟件安全漏洞挖掘輸出的融合特征解,表示為:
(23)
利用軟件安全漏洞挖掘的信息聚類(lèi)模型,進(jìn)行軟件安全漏洞自動(dòng)挖掘,輸出的檢測(cè)統(tǒng)計(jì)量為:
(24)
其中,?t表示軟件安全漏洞挖掘的時(shí)間間隔.采用大數(shù)據(jù)信息調(diào)度和多元交叉分布式辨識(shí)的方法,構(gòu)建大數(shù)據(jù)挖掘的優(yōu)化模型,以實(shí)現(xiàn)安全漏洞的自動(dòng)挖掘優(yōu)化設(shè)計(jì),大數(shù)據(jù)挖掘的優(yōu)化模型如圖1所示.
圖1 漏洞信息大數(shù)據(jù)挖掘的優(yōu)化模型
在軟件安全漏洞挖掘的仿真實(shí)驗(yàn)中,設(shè)定軟件安全漏洞信息測(cè)試的最大負(fù)載為240 Kbps,安全漏洞信息采樣的數(shù)據(jù)樣本規(guī)模為2 000,測(cè)試集的模板數(shù)據(jù)匹配度為0.35,訓(xùn)練樣本數(shù)據(jù)規(guī)模為240個(gè),軟件安全漏洞信息挖掘的階數(shù)為5,空間分布維數(shù)為14,根據(jù)上述參數(shù)設(shè)定,在仿真平臺(tái)中構(gòu)建軟件安全漏洞信息大數(shù)據(jù)采集模型,得到漏洞信息數(shù)據(jù)分布如圖2所示.
圖2 軟件安全漏洞信息數(shù)據(jù)分布
以圖2的數(shù)據(jù)為測(cè)試對(duì)象,為進(jìn)一步驗(yàn)證本文方法的優(yōu)越性能,將文獻(xiàn)[2]方法、文獻(xiàn)[3]方法、文獻(xiàn)[4]方法設(shè)置為對(duì)照組,將本文方法設(shè)置為實(shí)驗(yàn)組,分別對(duì)這四種方法軟件安全漏洞自動(dòng)挖掘的特征提取能力和精度進(jìn)行分析.
為分析四種方法的特征提取能力,測(cè)試軟件安全漏洞挖掘的特征點(diǎn)分布情況,得到三種方法進(jìn)行漏洞信息自動(dòng)挖掘的特征點(diǎn)分布情況對(duì)比如圖3所示.
圖3 漏洞信息特征點(diǎn)分布情況對(duì)比
分析圖3得知,本文方法能夠有效進(jìn)行漏洞挖掘的特征點(diǎn)提取,與漏洞信息實(shí)際特征點(diǎn)的分布情況最為相近,由圖中可以看出,本文方法的特征點(diǎn)提取能力要優(yōu)于傳統(tǒng)的三種方法,表明本文方法能有效實(shí)現(xiàn)對(duì)軟件安全漏洞挖掘和檢測(cè),有效提高了軟件安全漏洞信息挖掘的特征聚類(lèi)性.
測(cè)試軟件安全漏洞挖掘的精度,得到對(duì)比結(jié)果見(jiàn)表1.
表1 軟件安全漏洞挖掘的精度對(duì)比測(cè)試
分析表1得知,本文方法的軟件安全漏洞挖掘的精度較高,在樣本數(shù)達(dá)到240個(gè)時(shí),本文方法的精度達(dá)到1,明顯高于其他三種方法的精度,由此可見(jiàn)本文方法能夠有效實(shí)現(xiàn)軟件安全漏洞的挖掘.
為了實(shí)現(xiàn)軟件安全漏洞自動(dòng)挖掘,本文提出基于大數(shù)據(jù)技術(shù)的軟件安全漏洞自動(dòng)挖掘方法.采用擴(kuò)頻序列分析的方法進(jìn)行軟件安全漏洞信息的分布式結(jié)構(gòu)重組,挖掘軟件安全信息大數(shù)據(jù)特征量,通過(guò)級(jí)聯(lián)特征匹配進(jìn)行軟件安全漏洞分析,采用基函數(shù)集穩(wěn)定分析的方法得到軟件的安全漏洞檢測(cè)的頻譜特征量,通過(guò)大數(shù)據(jù)信息調(diào)度和多元交叉分布式辨識(shí)的方法,實(shí)現(xiàn)安全漏洞的自動(dòng)挖掘.研究得知,本文方法的軟件安全漏洞挖掘的特征提取能力較強(qiáng),且準(zhǔn)確度較高.