高波 黃敏
摘要:入侵檢測技術作為一種主動的網(wǎng)絡安全防護技術越來越引起研究者的關注,該文以 k-means 算法為基礎,對基于k-means算法的入侵檢測系統(tǒng)進行了研究和分析,指出了傳統(tǒng) k-means 算法的不足,提出了相應的改進策略,在此基礎上完成基于k-means改進算法的入侵檢測系統(tǒng)的研究。
關鍵詞:入侵檢測;數(shù)據(jù)挖掘;k-means算法
中圖分類號:TP311 文獻標志碼:A 文章編號:1009-3044(2014)31-7425-03
Abstract: Intrusion detection technology as a proactive network security technology has drawn increasing attention from researchers. This paper based on k-means algorithm, intrusion detection system based on k-means algorithm were studied and analyzed, pointed out the shortcomings of traditional k-means algorithm, put forward the corresponding improvement strategies. On the basis completed the study An intrusion detection system based on k-means algorithm improved.
Key words: intrusion detection; data mining; k-means algorithm
1 概述
入侵檢測技術作為一種積極主動的安全防護技術,提供了對內(nèi)部攻擊、外部攻擊和誤操作的實時保護,在網(wǎng)絡系統(tǒng)受到危害之前攔截和響應入侵[1]。它被認為是防火墻之后的第二道安全閘門,在不影響網(wǎng)絡性能的情況下能對網(wǎng)絡進行監(jiān)測。隨著網(wǎng)絡環(huán)境的日益復雜和網(wǎng)絡數(shù)據(jù)的日益龐大,入侵檢測系統(tǒng)往往需要處理海量的數(shù)據(jù),來發(fā)現(xiàn)其中可能存在的入侵行為,這是對入侵檢測系統(tǒng)的一個很大挑戰(zhàn)。
數(shù)據(jù)挖掘指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘技術最先是在1999年由哥倫比亞大學Wenke lee[2]等人應用到入侵檢測中。將數(shù)據(jù)挖掘引入到入侵檢測系統(tǒng)中,可以幫助系統(tǒng)從大量的數(shù)據(jù)中挖掘有效的特征數(shù)據(jù),對網(wǎng)絡數(shù)據(jù)進行分析,實現(xiàn)有效的實時入侵檢測,不但能夠?qū)σ阎娜肭诌M行檢測,也能夠?qū)ξ粗墓暨M行檢測,極大地提高了入侵檢測系統(tǒng)的實時性與有效性,同時數(shù)據(jù)挖掘算法可以幫助系統(tǒng)學習新的攻擊模式,對特征進行動態(tài)的檢測。
本文主要介紹了一種經(jīng)典算法k-means算法,它是一種簡單高效非監(jiān)督學習方法,但是傳統(tǒng)k-means 算法還有一定的缺陷,因此本文在研究和分析了k-means算法的優(yōu)缺點的基礎上,提出了對基于k-means改進算法的入侵檢測系統(tǒng)的研究,改進的k-means算法會在一定程度上彌補傳統(tǒng)k-means帶來的缺陷。
4 結(jié)論
本文通過研究和分析傳統(tǒng)k-means算法,在一定程度上了解傳統(tǒng)k-means算法的優(yōu)點和缺點。由于傳統(tǒng)k-means算法在實際應用中受初始k值選擇,初始中心點選擇以及孤立點的影響極大。因此,該文提出了數(shù)據(jù)對象的密度和聚類半徑的概念,確定了第一個聚類中心值的選擇方法,從而解決了孤立點,k值得選擇以及初始中心選擇的影響,避免了出現(xiàn)提前收斂于局部最優(yōu)解現(xiàn)象。經(jīng)過多次仿真實驗的結(jié)果得以證明,改進后的算法能夠有效的提高入侵檢測系統(tǒng)的檢測率,降低誤測率。
參考文獻:
[1] 朱廣彬.基于數(shù)據(jù)挖掘的入侵檢測技術研究[D].北京:北京交通大學,2010:4-6.
[2] Wenke Lee.A Framework for Constructing Feature and Modle for Intrusion DetectionSystem[J].ACM Transacations on Information and System Security,2002,3(4):227-216.
[3] Wang W,Yang J,Muntz R.STRIN:A Statistical Information Grid Approach to Spatial Data Mining[C]//Proc.of 1997 Intl. Conf.on Very Large Data-bases, Athens,Greece. 1997-08:186-195.
[4] 倪鈺.基于數(shù)據(jù)挖掘的入侵檢測算法研究[D].南京:南京信息工程大學,2011:49-50.
[5] 劉鳳芹.k-means聚類算法改進研究[D].濟南:山東師范大學.2013:21-22.
[6] Hettich S,Bay S D.KDD cup 1999 data [EB/OL]. http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html,1999.
[7] 肖卓磊.基于k-means優(yōu)化算法的入侵檢測系統(tǒng)[J].阜陽師范學院學報:自然科學版,2013,30(4):82-83.
[8] 趙輝,張鵬.網(wǎng)絡異常的主動檢測與特征分析[J].計算機技術與發(fā)展,2009,19(8):159-161,165.