楊迎 韋立蓉
(北京信息職業(yè)技術(shù)學(xué)院,北京 100018)
Python是一種可實(shí)現(xiàn)跨平臺(tái)交互的計(jì)算機(jī)編程語言,也是面向?qū)ο蟮慕忉屝耘c互動(dòng)性腳本類語言,此技術(shù)在提出的初期階段,通常被用于編譯自動(dòng)化腳本程序,但隨著計(jì)算機(jī)技術(shù)的不斷更新,技術(shù)可執(zhí)行的語言功能也越來越多。目前,Python技術(shù)已被廣泛地應(yīng)用到計(jì)算機(jī)網(wǎng)站開發(fā)、人工智能、平臺(tái)后端管理等領(lǐng)域中[1]。DHCP是當(dāng)前網(wǎng)絡(luò)應(yīng)用層python語句中常見的局域網(wǎng)網(wǎng)絡(luò)協(xié)議,其主要應(yīng)用原理是通過計(jì)算機(jī)服務(wù)器對(duì)一段IP地址范圍內(nèi)的各類子網(wǎng)掩碼、IP地址等進(jìn)行分配。通常情況下,DHCP會(huì)看作為Windows Server當(dāng)中的一個(gè)重要組件,并不會(huì)直接安裝在系統(tǒng)當(dāng)中,需要通過管理人員以及技術(shù)人員通過引入必要的配置完成手動(dòng)安裝[2]。因此由于人為因素以及其運(yùn)行因素的雙方面影響,DHCP的異?,F(xiàn)象十分常見。并且,當(dāng)DHCP發(fā)生異常問題時(shí),若沒有有效的檢測技術(shù),沒有及時(shí)地找出異常問題的發(fā)生原因,未及時(shí)進(jìn)行處理,則將會(huì)嚴(yán)重影響網(wǎng)絡(luò)運(yùn)行環(huán)境,甚至造成更加嚴(yán)重的危害。基于此,本文開展網(wǎng)絡(luò)應(yīng)用層python語句的DHCP異常檢測技術(shù)研究。
當(dāng)計(jì)算機(jī)按照DHCP動(dòng)態(tài)主機(jī)配置協(xié)議中的相應(yīng)指令進(jìn)行對(duì)網(wǎng)絡(luò)應(yīng)用層python語句中敏感數(shù)據(jù)抓取時(shí),可將敏感數(shù)據(jù)作為判斷DHCP異常的重要依據(jù)。在此過程應(yīng)按照標(biāo)準(zhǔn)的數(shù)據(jù)統(tǒng)計(jì)方法,采用隨機(jī)指定計(jì)算機(jī)網(wǎng)絡(luò)文本信息域名的方式,對(duì)網(wǎng)絡(luò)應(yīng)用層python語句中的敏感數(shù)據(jù)進(jìn)行抓取。
為保證抓取敏感數(shù)據(jù)的準(zhǔn)確性,Markov技術(shù)對(duì)網(wǎng)絡(luò)應(yīng)用層python語句中的DHCP協(xié)議文本信息進(jìn)行處理。在這一過程中,將語句中的文本信息劃分為多個(gè)計(jì)算機(jī)字符,同步處理中的字符串匹配分詞[3]。假設(shè)抓取的文本信息中一串完整的字符串最長詞條包含字符數(shù)量為i個(gè),便可直接使用Markov模型進(jìn)行正向最大匹配。結(jié)合Markov模型中的語言技術(shù)實(shí)現(xiàn)對(duì)文本的自動(dòng)分詞,按照編程瀏覽順序依次輸出j個(gè)字符。將這j個(gè)字符看作是一個(gè)字符串,與對(duì)應(yīng)的程序抓取信息進(jìn)行比較,若該字符串當(dāng)中所有字符均與相應(yīng)的文本匹配,則說明通過將網(wǎng)絡(luò)應(yīng)用層python語句詞條分離處理后的詞條為正常運(yùn)行結(jié)果。若存在與語句詞條信息不匹配的字符或字符串,可認(rèn)為該語句當(dāng)中含有易造成DHCP出現(xiàn)異常的敏感數(shù)據(jù)。將上述論述的抓取流程以公式(1)表示:
公式(1)中:ip表示為抓取過程中網(wǎng)絡(luò)應(yīng)用層python語句所在的網(wǎng)絡(luò)頁面域名位置;if表示為Python語句敏感數(shù)據(jù)判別條件;n表示為敏感數(shù)據(jù)抓取次數(shù);T表示為網(wǎng)絡(luò)應(yīng)用層頁面更新時(shí)間;λ表示為DHCP動(dòng)態(tài)主機(jī)配置協(xié)議中的數(shù)據(jù)量。結(jié)合上述公式(1)按照一定的抓取順序進(jìn)行匹配[4]。若匹配成功,則說明該組python語句當(dāng)中不存在引發(fā)DHCP協(xié)議異常的敏感數(shù)據(jù),進(jìn)行對(duì)下一組python語句中敏感數(shù)據(jù)的抓取。若匹配失敗,則說明該組python語句當(dāng)中存在引發(fā)DHCP協(xié)議異常的敏感數(shù)據(jù),將數(shù)據(jù)導(dǎo)出。最后按照網(wǎng)絡(luò)應(yīng)用層Python語句對(duì)內(nèi)容的編譯順序,重復(fù)上述操作,直到完成對(duì)所有語句中敏感數(shù)據(jù)的抓取。
表1 兩種異常檢測技術(shù)實(shí)驗(yàn)結(jié)果對(duì)比表Tab.1 Comparison of experimental results of two anomaly detection technologies
在完成對(duì)網(wǎng)絡(luò)應(yīng)用層python語句敏感數(shù)據(jù)抓取后,針對(duì)存在敏感數(shù)據(jù)的python語句,進(jìn)行針對(duì)性的漏洞異常問題檢測。
首先,選用標(biāo)準(zhǔn)DHCP動(dòng)態(tài)主機(jī)配置協(xié)議作為檢測依據(jù),構(gòu)建目標(biāo)函數(shù),將抓取到的敏感數(shù)據(jù)帶入到函數(shù)當(dāng)中,利用函數(shù)對(duì)DHCP協(xié)議是否存在異常問題進(jìn)行檢測。將最高運(yùn)行效率作為函數(shù)建立的目標(biāo),持續(xù)解析敏感數(shù)據(jù)源,并按照數(shù)據(jù)的發(fā)生節(jié)點(diǎn)與所屬域名,進(jìn)行節(jié)點(diǎn)關(guān)系的匹配。
其次,在候選的網(wǎng)絡(luò)應(yīng)用層python語句當(dāng)中進(jìn)行糾錯(cuò),按照數(shù)據(jù)分類標(biāo)準(zhǔn),在整體DHCP協(xié)議當(dāng)中抓取敏感數(shù)據(jù)的基礎(chǔ)上,評(píng)估此語句與抓取信息的關(guān)聯(lián)度[5]。在此基礎(chǔ)上,同步進(jìn)行目標(biāo)序列的標(biāo)準(zhǔn),假定δ表示為DHCP協(xié)議中的一個(gè)隨機(jī)變量,對(duì)此變量進(jìn)行判斷的過程可用如公式(2)表示。
公式(2)中:s表示為面向DHCP協(xié)議的隨機(jī)場景模型;c表示為敏感數(shù)據(jù)發(fā)生改變引發(fā)漏洞異常的隨機(jī)概率;o表示為機(jī)器學(xué)習(xí)算法函數(shù);z表示為識(shí)別信息的有效性參數(shù);p表示為敏感數(shù)據(jù)在網(wǎng)絡(luò)應(yīng)用層中的所屬域名。根據(jù)公式(2)計(jì)算,得出敏感數(shù)據(jù)在網(wǎng)絡(luò)應(yīng)用層當(dāng)中的所屬域名。再在DHCP協(xié)議中建立空間場景,采用隨機(jī)指定語句中信息域名的方式,檢驗(yàn)識(shí)別信息的有效性[6]。在此過程中,輸入給定節(jié)點(diǎn)數(shù)據(jù)作為維護(hù)條件,在網(wǎng)絡(luò)應(yīng)用層的觀測序列上進(jìn)行概率節(jié)點(diǎn)輸出。
同時(shí),再使用文檔對(duì)象模型技術(shù)網(wǎng)絡(luò)應(yīng)用層中敏感性數(shù)據(jù)的采集,根據(jù)網(wǎng)絡(luò)應(yīng)用層域名的識(shí)別,進(jìn)行敏感數(shù)據(jù)有效性的校驗(yàn)。假設(shè)這一過程中的目標(biāo)函數(shù)為:
公式(3)中:K表示為定位的敏感數(shù)據(jù)目標(biāo);l表示為python語句字段長度;L表示為敏感數(shù)據(jù)字段長度;γ表示為造成DHCP協(xié)議出現(xiàn)異常漏洞字節(jié);θ表示為網(wǎng)絡(luò)應(yīng)用層的空間維度。根據(jù)公式(3)計(jì)算,得出造成DHCP協(xié)議出現(xiàn)異常漏洞時(shí)的敏感數(shù)據(jù),從檢測合理性角度出發(fā),參照網(wǎng)絡(luò)應(yīng)用層域名地址,進(jìn)行詞匯的空間描述[7]。將描述結(jié)果作為DHCP協(xié)議是否存在異常的結(jié)論,以此完成對(duì)DHCP協(xié)議的異常檢測。
為驗(yàn)證本文異常檢測技術(shù)在實(shí)際應(yīng)用中的有效性,提出如下對(duì)比實(shí)驗(yàn),選擇某運(yùn)行網(wǎng)站作為實(shí)驗(yàn)環(huán)境,建立相應(yīng)的網(wǎng)絡(luò)引擎檢索,分別利用本文提出的異常檢測技術(shù)和傳統(tǒng)檢測技術(shù)對(duì)網(wǎng)絡(luò)應(yīng)用層python語句中的DHCP異常情況進(jìn)行檢測。設(shè)置該實(shí)驗(yàn)環(huán)境以24h作為一個(gè)運(yùn)行周期,該網(wǎng)站當(dāng)中共包含350個(gè)有效數(shù)據(jù),其中規(guī)定敏感數(shù)據(jù)為125個(gè),引發(fā)DHCP異常的敏感數(shù)據(jù)為100個(gè),將引起異常的敏感數(shù)據(jù)命名為異常數(shù)據(jù),對(duì)比兩種檢測方法檢測到的異常數(shù)據(jù)個(gè)數(shù)。將上述實(shí)驗(yàn)結(jié)果進(jìn)行記錄,并繪制成如表1所示的實(shí)驗(yàn)結(jié)果對(duì)比表。
根據(jù)表1中的數(shù)據(jù)得出,本文技術(shù)檢測到異常數(shù)據(jù)個(gè)數(shù)明顯高于傳統(tǒng)技術(shù)檢測到異常數(shù)據(jù)個(gè)數(shù),并且本文技術(shù)可將網(wǎng)絡(luò)應(yīng)用層python語句中全部引起DHCP異常的異常數(shù)據(jù)找出,檢測到的異常數(shù)據(jù)越多證明檢測精度越高,檢測結(jié)果越準(zhǔn)確。因此,通過實(shí)驗(yàn)證明,本文提出的DHCP異常檢測技術(shù)具有更高的檢測精度,能夠及時(shí)發(fā)現(xiàn)DHCP異常現(xiàn)象,為后續(xù)DHCP協(xié)議維護(hù)提供充足條件。
針對(duì)當(dāng)前網(wǎng)絡(luò)應(yīng)用層安全問題,開展DHCP異常檢測技術(shù)研究,通過本文上述論述提出一種全新的檢測方法,并將其應(yīng)用到實(shí)際具有良好的檢測效果,為網(wǎng)絡(luò)應(yīng)用層安全提供保障。