黃凱
摘要:在信息化環(huán)境下,隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)信息安全已成為社會(huì)各界普遍關(guān)注的重點(diǎn)問題。如何提高網(wǎng)絡(luò)信息安全,已成為現(xiàn)代網(wǎng)絡(luò)信息技術(shù)發(fā)展所需重點(diǎn)考慮的問題。在網(wǎng)絡(luò)安全風(fēng)險(xiǎn)防范中,大數(shù)據(jù)挖掘技術(shù)是一種較為常見的技術(shù)手段。在實(shí)際應(yīng)用中,該技術(shù)能夠及時(shí)挖掘出網(wǎng)絡(luò)中存在的安全風(fēng)險(xiǎn),從而提升網(wǎng)絡(luò)安全性?;诖耍疚膶?duì)大數(shù)據(jù)挖掘技術(shù)的內(nèi)容與主要方式進(jìn)行分析,闡述網(wǎng)絡(luò)安全風(fēng)險(xiǎn)挖掘中大數(shù)據(jù)技術(shù)的應(yīng)用,并提出網(wǎng)絡(luò)安全風(fēng)險(xiǎn)挖掘中大數(shù)據(jù)技術(shù)的實(shí)施策略,以供參考。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);網(wǎng)絡(luò)安全;風(fēng)險(xiǎn)挖掘
中圖分類號(hào):TP311? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2024)08-0077-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID)
0 引言
隨著信息技術(shù)應(yīng)用范圍的不斷擴(kuò)大,數(shù)據(jù)的重要性日漸提升。如何保證網(wǎng)絡(luò)數(shù)據(jù)安全,避免受到不良風(fēng)險(xiǎn)因素威脅,應(yīng)作為信息社會(huì)重點(diǎn)關(guān)注的問題[1]。若未能科學(xué)處理網(wǎng)絡(luò)安全問題,則會(huì)發(fā)生數(shù)據(jù)泄露情況,進(jìn)而使網(wǎng)絡(luò)環(huán)境面臨嚴(yán)重威脅?,F(xiàn)階段,網(wǎng)絡(luò)結(jié)構(gòu)更加復(fù)雜,針對(duì)網(wǎng)絡(luò)安全風(fēng)險(xiǎn),技術(shù)人員需要積極采取大數(shù)據(jù)挖掘技術(shù)加以應(yīng)對(duì),以保證網(wǎng)絡(luò)安全。
1 大數(shù)據(jù)挖掘技術(shù)內(nèi)容與主要方式
1.1 大數(shù)據(jù)挖掘技術(shù)內(nèi)容
借助大數(shù)據(jù)挖掘技術(shù)的科學(xué)應(yīng)用,從海量數(shù)據(jù)中獲得有價(jià)值的信息,是各行業(yè)發(fā)展中的一項(xiàng)重要工作。大數(shù)據(jù)挖掘技術(shù),其主要技術(shù)內(nèi)容是進(jìn)行有價(jià)值信息的深入挖掘,而不局限于軟件的簡單堆砌。在新時(shí)期環(huán)境下,信息增長速度逐漸加快,以往應(yīng)用的觀察式信息分析方式已逐漸落后,無法滿足實(shí)際需求。而大數(shù)據(jù)挖掘技術(shù)更加科學(xué),實(shí)際應(yīng)用中,能夠從大量模糊、不確定性的數(shù)據(jù)中挖掘出有價(jià)值的信息。
1.2 大數(shù)據(jù)挖掘技術(shù)主要方式
大數(shù)據(jù)挖掘技術(shù)主要包括內(nèi)容挖掘與使用記錄挖掘。其中,內(nèi)容挖掘表示的是相關(guān)人員在大數(shù)據(jù)挖掘技術(shù)的應(yīng)用下,從大量網(wǎng)絡(luò)資源中獲取有價(jià)值的信息資源。并且,計(jì)算機(jī)后臺(tái)應(yīng)進(jìn)行監(jiān)控程序設(shè)置,從而對(duì)尋找內(nèi)容的安全加以保護(hù),防止數(shù)據(jù)挖掘環(huán)節(jié)出現(xiàn)重要數(shù)據(jù)信息丟失的情況。此外,企業(yè)可通過大數(shù)據(jù)挖掘技術(shù)的應(yīng)用,對(duì)客戶操作記錄進(jìn)行查詢,檢查審核企業(yè)網(wǎng)絡(luò)信息安全情況,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)信息安全的嚴(yán)格監(jiān)控,避免受到網(wǎng)絡(luò)黑客的攻擊[2]。現(xiàn)階段,大數(shù)據(jù)挖掘技術(shù)在各個(gè)行業(yè)均得到了廣泛應(yīng)用。因此,企業(yè)運(yùn)營中,可利用大數(shù)據(jù)挖掘技術(shù),對(duì)同行業(yè)企業(yè)信息資源進(jìn)行分析,從而了解行業(yè)發(fā)展趨勢,進(jìn)行發(fā)展策略的科學(xué)制定。
2 網(wǎng)絡(luò)安全風(fēng)險(xiǎn)挖掘中大數(shù)據(jù)技術(shù)的應(yīng)用
網(wǎng)絡(luò)安全風(fēng)險(xiǎn)挖掘,主要是利用大數(shù)據(jù)挖掘技術(shù)對(duì)網(wǎng)絡(luò)安全風(fēng)險(xiǎn)進(jìn)行分析。該技術(shù)手段在數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)庫、模型構(gòu)建、入侵檢測等方面得到了廣泛應(yīng)用,具體如下:
2.1 數(shù)據(jù)采集中大數(shù)據(jù)挖掘技術(shù)的應(yīng)用
為實(shí)現(xiàn)數(shù)據(jù)的安全采集,相關(guān)技術(shù)人員可應(yīng)用大數(shù)據(jù)挖掘技術(shù),通過對(duì)大量數(shù)據(jù)的全面分析,找出潛在的網(wǎng)絡(luò)安全隱患,及時(shí)發(fā)現(xiàn)風(fēng)險(xiǎn)問題,嚴(yán)格監(jiān)控惡意攻擊、異常入侵等情況。通常情況下,病毒的入侵與攻擊主要是將代碼作為載體。為有效應(yīng)對(duì)這一問題,需要在相應(yīng)程序應(yīng)用下,及時(shí)發(fā)現(xiàn)并予以防范[3]。大數(shù)據(jù)挖掘技術(shù)應(yīng)用環(huán)節(jié),可有效分析各類代碼,進(jìn)而及時(shí)發(fā)現(xiàn)潛在問題,結(jié)合實(shí)際問題制定有效的應(yīng)對(duì)方案。因此,將該技術(shù)手段應(yīng)用于數(shù)據(jù)采集過程中,可及時(shí)找出隱藏病毒,使軟件、程序、數(shù)據(jù)更加安全。技術(shù)人員開展數(shù)據(jù)收集工作時(shí),應(yīng)重點(diǎn)開展初期病毒掃描工作,并且還應(yīng)進(jìn)行數(shù)據(jù)信息的科學(xué)分類,防止不同數(shù)據(jù)混合在一起導(dǎo)致后期無法有效區(qū)分,從而有效處理收集的數(shù)據(jù),為后期工作開展奠定良好基礎(chǔ)。
2.2 數(shù)據(jù)處理中大數(shù)據(jù)挖掘技術(shù)的應(yīng)用
在大數(shù)據(jù)挖掘技術(shù)的應(yīng)用過程中,首先需要開展網(wǎng)絡(luò)程序代碼的轉(zhuǎn)換與破解工作,以降低內(nèi)容識(shí)別的難度,使大數(shù)據(jù)挖掘技術(shù)更具時(shí)效性。借助大數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)處理模塊,能夠有效識(shí)別網(wǎng)絡(luò)安全問題,實(shí)現(xiàn)IP的精準(zhǔn)定位,封鎖傳播通道,防止問題的進(jìn)一步傳播和擴(kuò)散。通過應(yīng)用大數(shù)據(jù)挖掘技術(shù),可以處理數(shù)據(jù)信息終端,科學(xué)整理和分析數(shù)據(jù)信息,從而提高網(wǎng)絡(luò)安全分析的效率,確保網(wǎng)絡(luò)數(shù)據(jù)的安全。此外,大數(shù)據(jù)挖掘技術(shù)還可應(yīng)用于數(shù)據(jù)預(yù)處理中,針對(duì)網(wǎng)絡(luò)安全問題進(jìn)行信息驗(yàn)證,獲取重要的數(shù)據(jù)參數(shù),掌握數(shù)據(jù)驗(yàn)證指標(biāo),進(jìn)而構(gòu)建出網(wǎng)絡(luò)安全預(yù)防系統(tǒng)。利用大數(shù)據(jù)挖掘技術(shù)深入分析病毒類型,制定有效的防護(hù)方法,并精準(zhǔn)判斷系統(tǒng)漏洞,針對(duì)性地進(jìn)行完善,以確保系統(tǒng)網(wǎng)絡(luò)的安全。
2.3 數(shù)據(jù)庫中大數(shù)據(jù)挖掘技術(shù)的應(yīng)用
在數(shù)據(jù)庫的支持下,大數(shù)據(jù)挖掘技術(shù)展現(xiàn)出強(qiáng)大的聚類分析功能,能夠結(jié)合網(wǎng)絡(luò)安全問題的特征,對(duì)各種安全隱患進(jìn)行深入分析。例如,當(dāng)計(jì)算機(jī)受到惡意攻擊時(shí),借助大數(shù)據(jù)挖掘技術(shù),可以從攻擊行為的基本特征和運(yùn)動(dòng)軌跡入手,利用關(guān)聯(lián)數(shù)據(jù)庫記錄相關(guān)信息,并匯總其他數(shù)據(jù)。在實(shí)際應(yīng)用中,聚類分析算法能夠幫助我們利用大數(shù)據(jù)挖掘技術(shù)更準(zhǔn)確地識(shí)別網(wǎng)絡(luò)安全問題的規(guī)律,從而提高網(wǎng)絡(luò)安全識(shí)別的準(zhǔn)確性和效率,進(jìn)一步提升網(wǎng)絡(luò)安全水平。
2.4 模型構(gòu)建中大數(shù)據(jù)挖掘技術(shù)的應(yīng)用
在大數(shù)據(jù)環(huán)境下,為確保網(wǎng)絡(luò)安全,應(yīng)注重控制系統(tǒng)的建設(shè),并借助挖掘算法運(yùn)行模型開展實(shí)際工作。在構(gòu)建數(shù)據(jù)信息追溯模型時(shí),應(yīng)針對(duì)網(wǎng)絡(luò)環(huán)境中的潛在風(fēng)險(xiǎn)進(jìn)行風(fēng)險(xiǎn)預(yù)判[4]。例如,針對(duì)計(jì)算機(jī)程序感染病毒的風(fēng)險(xiǎn)安全問題,應(yīng)在框架構(gòu)建階段提前制定應(yīng)對(duì)措施,以最大限度地降低安全風(fēng)險(xiǎn)的不良影響。在構(gòu)建計(jì)算機(jī)安全控制系統(tǒng)時(shí),應(yīng)在基礎(chǔ)框架構(gòu)建階段體現(xiàn)程序的分層運(yùn)行情況,并在數(shù)據(jù)庫中科學(xué)拆分獲得各個(gè)子數(shù)據(jù)集合,以確保在程序框架的支持下高效完成各項(xiàng)控制任務(wù)。在功能建設(shè)過程中,可借助數(shù)學(xué)建模原理來預(yù)判網(wǎng)絡(luò)中的各項(xiàng)風(fēng)險(xiǎn)問題,分析網(wǎng)絡(luò)風(fēng)險(xiǎn)等級(jí)和特征。隨后,通過應(yīng)用數(shù)據(jù)庫的交換功能創(chuàng)新數(shù)據(jù)庫構(gòu)建,根據(jù)當(dāng)前環(huán)境全面考量風(fēng)險(xiǎn),從整體上提升程序的安全性。
2.5 入侵檢測中大數(shù)據(jù)挖掘技術(shù)的應(yīng)用
網(wǎng)絡(luò)安全防護(hù)中主要有兩種入侵檢測形式:正常入侵檢測和異常入侵檢測,實(shí)踐中常將兩者聯(lián)合應(yīng)用。在正常入侵檢測方面,主要是根據(jù)正常網(wǎng)絡(luò)行為進(jìn)行系統(tǒng)分析和建模,篩選出正常模型特征并與用戶行為特征進(jìn)行對(duì)比,以判斷用戶行為的正常性。若不匹配,則視為異常入侵行為[5]。然而,這種判斷模式可能存在一定的技術(shù)誤差。在異常入侵檢測方面,主要是收集異常數(shù)據(jù)并構(gòu)建分析模型,對(duì)入侵行為特征進(jìn)行分析匯總,以豐富異常數(shù)據(jù)模型。通過利用數(shù)據(jù)關(guān)聯(lián)技術(shù)提取和分析歷史入侵行為數(shù)據(jù),可以深度挖掘攻擊路徑并明確數(shù)據(jù)分類參數(shù)設(shè)定標(biāo)準(zhǔn),進(jìn)而通過相應(yīng)算法進(jìn)行科學(xué)預(yù)測。在兩種技術(shù)的有效結(jié)合下,可以充分發(fā)揮大數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)分析預(yù)測功能的作用,實(shí)現(xiàn)對(duì)未知入侵行為的有效預(yù)測和檢測,提高入侵行為檢測的準(zhǔn)確性,降低入侵行為的發(fā)生概率[6]。
3 大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全風(fēng)險(xiǎn)挖掘中的實(shí)施
對(duì)海量網(wǎng)絡(luò)數(shù)據(jù)中的安全事件進(jìn)行采集時(shí),由于事件格式差異較大,應(yīng)對(duì)安全事件進(jìn)行歸一化處理,以便挖掘其中存在的關(guān)聯(lián)規(guī)則。通過挖掘出的關(guān)聯(lián)規(guī)則,我們能夠精準(zhǔn)評(píng)估各種攻擊行為所帶來的網(wǎng)絡(luò)安全風(fēng)險(xiǎn)。借助大數(shù)據(jù)分析技術(shù)中的數(shù)據(jù)挖掘方法,可以有效地提取網(wǎng)絡(luò)安全事件的關(guān)聯(lián)規(guī)則。
[W=W1,W2,…,Wn]代表安全事件的元素集合,[R=R1,R2,…,Rn]代表數(shù)據(jù)集,R中存在的元素[ri]均為W建立的集合,因此[ri?W]。利用集合R中的元素進(jìn)行結(jié)合C的構(gòu)建,有[l]各元素滿足[C?ri]時(shí),能夠獲得集合C的支出度,即:
[supC=l/n]
當(dāng)集合C與集合D滿足[A?W∩ID?W]時(shí),通過[supC∪D/supC],代表[C→D]的置信度。對(duì)于挖掘的數(shù)據(jù)集合,若滿足做小支持度以及置信度時(shí),則屬于需要進(jìn)行挖掘的關(guān)聯(lián)規(guī)則。
規(guī)模巨大是網(wǎng)絡(luò)安全事件的主要特點(diǎn)之一。我們可以借助Hadoop平臺(tái)來挖掘這些規(guī)模巨大的網(wǎng)絡(luò)安全事件。對(duì)于大數(shù)據(jù)分析技術(shù)而言,挖掘這些關(guān)聯(lián)規(guī)則主要分為兩個(gè)部分:第一部分是頻繁項(xiàng)集的挖掘,挖掘出的頻繁項(xiàng)集需要滿足最小支持度的要求;第二部分則是通過數(shù)據(jù)挖掘得到符合最小置信度要求的關(guān)聯(lián)規(guī)則。當(dāng)使用Hadoop平臺(tái)開展關(guān)聯(lián)規(guī)則挖掘工作時(shí),主要會(huì)經(jīng)歷以下過程:1) 在Hadoop平臺(tái)中輸入數(shù)據(jù)集R和最小支持度β,然后在此基礎(chǔ)上進(jìn)行運(yùn)算。2) 經(jīng)過平臺(tái)運(yùn)算后,輸出能夠滿足最小支持度的頻繁項(xiàng)集。
1) Map任務(wù)。第一,結(jié)合輸入文件路徑,利用最小支持度頻繁項(xiàng)集對(duì)原始網(wǎng)絡(luò)安全數(shù)據(jù)集進(jìn)行分割,從而獲取大小為n的相應(yīng)數(shù)據(jù)子集。分割后獲得的數(shù)據(jù)子集需要進(jìn)行格式化處理,轉(zhuǎn)化為
2) Reduce任務(wù)。第一,對(duì)Combin函數(shù)發(fā)送的鍵值對(duì)進(jìn)行科學(xué)排序,將具有相同key值的鍵值對(duì)進(jìn)行合并,得到
借助以上步驟,我們可以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)安全事件關(guān)聯(lián)規(guī)則的深入挖掘。進(jìn)而,通過應(yīng)用支持向量機(jī)方法,結(jié)合所挖掘的關(guān)聯(lián)規(guī)則,對(duì)網(wǎng)絡(luò)安全風(fēng)險(xiǎn)進(jìn)行精準(zhǔn)評(píng)估。
4 結(jié)束語
綜上所述,在大數(shù)據(jù)環(huán)境下,應(yīng)用大數(shù)據(jù)挖掘技術(shù)于網(wǎng)絡(luò)安全領(lǐng)域,能夠有效挖掘網(wǎng)絡(luò)中的潛在風(fēng)險(xiǎn),增強(qiáng)網(wǎng)絡(luò)的病毒防御能力,從而防止病毒程序入侵網(wǎng)絡(luò),避免系統(tǒng)受損。當(dāng)前,隨著大數(shù)據(jù)挖掘技術(shù)與網(wǎng)絡(luò)信息技術(shù)的不斷完善,相關(guān)人員應(yīng)加大探索力度,明確大數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全中的應(yīng)用價(jià)值,并將其應(yīng)用于數(shù)據(jù)采集、處理、數(shù)據(jù)庫管理以及模型構(gòu)建等領(lǐng)域,以充分發(fā)揮大數(shù)據(jù)挖掘技術(shù)的實(shí)際應(yīng)用價(jià)值,促進(jìn)網(wǎng)絡(luò)系統(tǒng)的健康發(fā)展。
參考文獻(xiàn):
[1] 張玲玲.大數(shù)據(jù)在網(wǎng)絡(luò)安全防御中的應(yīng)用與研究[J].信息系統(tǒng)工程,2019(8):87-88.
[2] 韋建發(fā).大數(shù)據(jù)在網(wǎng)絡(luò)安全領(lǐng)域中的應(yīng)用分析[J].消費(fèi)導(dǎo)刊,2021(49):37-38.
[3] 王彬.大數(shù)據(jù)背景下計(jì)算機(jī)信息技術(shù)在網(wǎng)絡(luò)安全中的運(yùn)用[J].中國新通信,2023,25(12):119-121,223.
[4] 劉洋.“大數(shù)據(jù)” 背景下計(jì)算機(jī)信息技術(shù)在網(wǎng)絡(luò)安全中的運(yùn)用[J].信息記錄材料,2023,24(4):113-115.
[5] 趙漢卿,段京豐,羅嘉倫.人工智能技術(shù)在大數(shù)據(jù)網(wǎng)絡(luò)安全防御中的運(yùn)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2023(3):19-20.
[6] 李媛,魯春燕.大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全分析中的應(yīng)用[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2023(4):71-73.
【通聯(lián)編輯:代影】