陳曉純
摘要:隨著網(wǎng)絡(luò)攻擊技術(shù)層出不窮,網(wǎng)絡(luò)攻擊方式呈現(xiàn)出多樣性和隱蔽性的特征,網(wǎng)絡(luò)入侵檢測的漏報(bào)和誤報(bào)頻發(fā)。為了提高入侵檢測的檢測率、降低漏報(bào)率和誤報(bào)率,利用變精度粗糙集挖掘數(shù)據(jù)之間潛在規(guī)律的特性,對(duì)測試數(shù)據(jù)集進(jìn)行特征提取和屬性約簡,除去冗余信息降低屬性維度,然后通過遺傳算法進(jìn)行分類和檢測。實(shí)驗(yàn)測試表明該方法不僅可以提高檢測率,并能較實(shí)時(shí)地檢測其他類型的攻擊。
關(guān)鍵詞:入侵檢測;變精度粗糙集;屬性約簡
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)12-0171-05
Abstract: As the network attack technology after another, showing a diversity of network attacks and covert features, network intrusion detection of false negatives and false alarm frequently. In order to improve the detection rate of intrusion detection, reducing the false negative rate and false alarm rate, the use of variable precision rough set of potential characteristics between data mining law, the test data set for feature extraction and attribute reduction, removing redundant information to reduce the dimension attributes and then classify and detect genetic algorithm, test results obtained. Experimental results show that this method can improve the accuracy of a denial of service attack detection type, and can be detected more complete other types of attacks.
Key words: intrusion detection; variable rough set; attribute reduction
入侵檢測系統(tǒng)能夠識(shí)別網(wǎng)絡(luò)中發(fā)生的入侵行為并進(jìn)行實(shí)時(shí)報(bào)警,具有實(shí)時(shí)性、動(dòng)態(tài)檢測等特點(diǎn),可以彌補(bǔ)防火墻的不足。隨著網(wǎng)絡(luò)攻擊技術(shù)和手段的廣泛散布與不斷更新,現(xiàn)有的入侵檢測技術(shù)和系統(tǒng)已不能滿足網(wǎng)絡(luò)安全的需求,漏報(bào)和誤報(bào)率越來越高,檢測準(zhǔn)確率越來越低。近年來涌現(xiàn)了很多入侵檢測技術(shù),F(xiàn)ORREST[1]提出了將人工免疫理論應(yīng)用于入侵檢測領(lǐng)域,將計(jì)算機(jī)系統(tǒng)的保護(hù)問題與免疫系統(tǒng)中學(xué)習(xí)區(qū)分自體-非自體相比較,提出了陰性選擇算法。Lee等人采用Ripper軟件包[2]挖掘出正常和異常的模式,以規(guī)則的形式描述系統(tǒng)的運(yùn)行狀態(tài)。Asaka等提出了一種基于Discriminant method的入侵檢測方法,通過預(yù)先標(biāo)定的正常和異常系統(tǒng)的調(diào)用序列樣本進(jìn)行不斷地學(xué)習(xí),最終確定一個(gè)最優(yōu)分類平面,以這個(gè)最優(yōu)分類面為依據(jù),來判斷進(jìn)程的系統(tǒng)調(diào)用是正常調(diào)用的還是異常入侵[3]。以上的研究表明,大部分的入侵檢測技術(shù)需要大量的先驗(yàn)知識(shí)和攻擊特征來構(gòu)建攻擊行為模型,Ripper要求有大量的訓(xùn)練數(shù)據(jù),產(chǎn)生的規(guī)則才能有較高的檢測率。
本文將變精度粗糙集理論應(yīng)用于入侵檢測,通過建立正常行為模型來區(qū)分正常行為和異常行為。在保持分類能力不變的前提下,對(duì)原始數(shù)據(jù)進(jìn)行離散化等預(yù)處理,刪除冗余信息,挖掘剩余屬性間的關(guān)系,生產(chǎn)IF-THEN規(guī)則。該方法不需要大量數(shù)據(jù)和先驗(yàn)知識(shí)即可構(gòu)建模型,作為初始種群。實(shí)驗(yàn)證明本文的方法在檢測率和檢測時(shí)間上優(yōu)于其他檢測方法。
1 相關(guān)理論基礎(chǔ)
粗糙集(Rough Set)理論是由Z.Pawlak提出[4]的一種處理不精確、不確定、不完備的數(shù)據(jù)信息的數(shù)學(xué)工具,可以對(duì)大量數(shù)據(jù)進(jìn)行知識(shí)約簡和屬性分類,尤其是在缺乏先驗(yàn)知識(shí)時(shí),對(duì)模糊或不確定的數(shù)據(jù)進(jìn)行相應(yīng)的分析和處理,快速地獲取區(qū)分和識(shí)別知識(shí)的規(guī)則。變精度粗糙集是粗糙集的擴(kuò)展模型,它被成功地應(yīng)用到了模式識(shí)別、機(jī)器學(xué)習(xí)、知識(shí)獲取、數(shù)據(jù)挖掘等許多領(lǐng)域[5,6,7]。有很多的研究成果,文獻(xiàn)[17]深入研究了變精度粗糙集的屬性約簡問題,給出了3種屬性約簡的概念,提出通過構(gòu)造容差矩陣的屬性核的最小約簡算法,該算法可以減小屬性約簡的搜索空間,提高約簡的效率。文獻(xiàn)[18]分析了變精度粗糙集模型屬性約簡過程出現(xiàn)跳躍的原因,并給出消除跳躍現(xiàn)象的方法。文獻(xiàn)[19]提出了一種將變精度粗糙集理論與概率神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立變精度粗糙集模型,將信息系統(tǒng)中的冗余屬性剔除,求出最小的知識(shí)表示,作為神經(jīng)網(wǎng)絡(luò)的輸入,再用概率神經(jīng)網(wǎng)絡(luò)建立的模型進(jìn)行分類和預(yù)測,其分類能力和預(yù)測精度都達(dá)到比較高的水平。變精度粗糙集理論研究[12,14,15]和實(shí)踐研究兩個(gè)方面都很成功,例如把變精度粗糙集理論應(yīng)用于工作搜索[13],醫(yī)療診斷[16]。
經(jīng)典的粗糙集理論對(duì)于邊界的刻畫過于簡單,所處理的對(duì)象是已知的,但是在現(xiàn)實(shí)中,集合的關(guān)系不單單是包含于不包含的關(guān)系,還有屬于關(guān)系,這個(gè)不足之處限制了粗糙集的適用對(duì)象。因此,有許多研究者對(duì)粗糙集理論進(jìn)行擴(kuò)展,其中Ziarko提出的變精度粗糙集模型[8]克服了粗糙集的局限性。通過引入閾值參數(shù)[β](0[≤β]<0.5),允許一定的錯(cuò)誤分類率的存在,具有更好的抗噪聲能力和魯棒性。
它表示條件屬性集[C]所劃分的等價(jià)類能夠以[β]分類誤差分類于決策屬性集[D]的等價(jià)類中元素個(gè)數(shù)占所有元數(shù)個(gè)數(shù)的比例,體現(xiàn)了在[β]分類誤差下的分類能力。
在保持分類能力不變的前提下,將條件屬性集[C]中的不必要的屬性刪除,求條件屬性集的最小子集的過程就是屬性約簡。約簡算法是入侵檢測中的核心,通過約簡可以減少冗余信息,減少計(jì)算量,提高識(shí)別速度,但是也要防止約簡過度。約簡有很多種算法,例如基于屬性重要性的屬性約簡算法,基于條件信息熵的屬性約簡,[β]下分布約簡等等。本文將采用改進(jìn)的基于遺傳算法的屬性約簡算法進(jìn)行計(jì)算。
2 基于變精度粗糙集模型和算法
2.1 入侵檢測信息系統(tǒng)和模型
本文用變精度粗糙集理論建立入侵檢測信息系統(tǒng),信息系統(tǒng)四元組[IS=U,C?D,V,f],其中[U]是入侵檢測數(shù)據(jù)集的對(duì)象,[C]是數(shù)據(jù)的條件屬性集合,有41個(gè)連接屬性字段組成,[D]是決策集合,[V]是屬性字段值的集合,[f]是每個(gè)連接屬性對(duì)應(yīng)值所構(gòu)成的函數(shù)。
利用變精度粗糙集對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,通過調(diào)節(jié)分類誤差[β]來求得網(wǎng)絡(luò)狀況的參數(shù)值,可以提供判斷網(wǎng)絡(luò)安全的依據(jù),所提出的變精度粗糙集的模型如下:
如圖1所示,采用的數(shù)據(jù)集分為兩個(gè)部分,一部分作為訓(xùn)練數(shù)據(jù),另一部分作為測試數(shù)據(jù),剛開始構(gòu)建入侵檢測信息系統(tǒng),對(duì)數(shù)據(jù)集預(yù)處理,訓(xùn)練數(shù)據(jù)要進(jìn)行屬性約簡,具體約簡算法在下面將會(huì)詳細(xì)介紹,約簡后得到規(guī)則庫,最后用測試數(shù)據(jù)驗(yàn)證規(guī)則庫的完備性,得出正常行為和異常行為。
2.2 基于改進(jìn)的遺傳算法的屬性約簡算法
本文采用遺傳算法對(duì)多維屬性進(jìn)行屬性約簡,遺傳算法在進(jìn)化搜索的過程中使用是適應(yīng)度函數(shù)作為進(jìn)化的依據(jù),[Fr=l-lrl+γC,D,β],[lr]表示染色體[r]中基因?yàn)?的個(gè)數(shù)。[γC,D,β]是決策屬性[D]對(duì)條件屬性[C]的[β]依賴度;對(duì)種群的個(gè)體計(jì)算適應(yīng)值,根據(jù)適應(yīng)值作為啟發(fā)信息進(jìn)行搜索,因此,在遺傳算法中對(duì)適應(yīng)度函數(shù)的設(shè)計(jì)是關(guān)鍵部分,非常重要。然而,基于粗糙集的屬性約簡遺傳算法使用正區(qū)域作為適應(yīng)度函數(shù),因?yàn)樽兙却植诩恼蚴歉鶕?jù)所選取的閾值參數(shù)[β]來確定,所以本文設(shè)計(jì)的適應(yīng)度函數(shù)選取的是決策屬性對(duì)條件屬性的[β]依賴度;屬性編碼所采用的是二進(jìn)制編碼方式,例如,在決策表中有屬性集{[C1,C2,C3,C4,C5]},如果求解一個(gè)屬性約簡是[C1,C3,C5],則相應(yīng)的染色體表示為10101。
屬性約簡遺傳算[9]步驟如下:
1.屬性編碼。采用二進(jìn)制的方式進(jìn)行編碼,存在記為1,否則為0;染色體的長度是條件屬性的個(gè)數(shù)。
2.選擇算子。采用輪盤賭選擇方式[10],并且選擇一個(gè)最優(yōu)策略方式,如果得到新一代個(gè)體之后,如果其中最壞的個(gè)體適應(yīng)值小于上一代最好的個(gè)體的適應(yīng)值,那么舍棄新一代,用上一代的最好的個(gè)體代替新一代最壞的個(gè)體,來確保算法收斂[11]。
3.交叉因子。采用部分匹配交叉策略。
4.變異算子。采用單點(diǎn)變異方法。
3 實(shí)驗(yàn)與分析
實(shí)驗(yàn)的基本指標(biāo)有檢測率,漏報(bào)率和誤報(bào)率,下面有相關(guān)的具體定義:
檢測率=正確檢測出的入侵事件個(gè)數(shù)/總的入侵事件個(gè)數(shù);
漏報(bào)率=未檢測出的入侵事件個(gè)數(shù)/總的入侵事件個(gè)數(shù);
誤報(bào)率=錯(cuò)誤判別事件的總個(gè)數(shù)/(正確檢出的入侵事件個(gè)數(shù)+漏報(bào)的入侵事件個(gè)數(shù)+錯(cuò)誤判斷的事件個(gè)數(shù))。
3.1 實(shí)驗(yàn)環(huán)境
實(shí)驗(yàn)所用是Win7操作系統(tǒng)下的WEKA實(shí)驗(yàn)平臺(tái),用到的軟件包括:UltraEdit,ROSETTA,JDK等。
WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for knowledge Analysis),它是基于JAVA環(huán)境下開發(fā)的機(jī)器學(xué)習(xí)以及數(shù)據(jù)挖掘的軟件。本文主要是利用此軟件進(jìn)行分類,區(qū)分正常行為和異常行為。
ROSETTA軟件是挪威科技大學(xué)的計(jì)算機(jī)與信息科學(xué)系和波蘭華沙大學(xué)數(shù)學(xué)研究所合作開發(fā)的一個(gè)基于Rough理論框架的表格邏輯數(shù)據(jù)分析工具包。
3.2 實(shí)驗(yàn)數(shù)據(jù)集
實(shí)驗(yàn)數(shù)據(jù)選取KDDCUP99數(shù)據(jù)集,它是林肯實(shí)驗(yàn)室通過模擬各種攻擊收集了9周的數(shù)據(jù),很多入侵檢測競賽都選用此數(shù)據(jù),它和真實(shí)的網(wǎng)絡(luò)環(huán)境相差無幾,具有權(quán)威性。KDDCUP99數(shù)據(jù)集具有42個(gè)屬性字段,,其中條件屬性有41個(gè),1個(gè)決策屬性是一個(gè)高維數(shù)據(jù)集合。
3.3 數(shù)據(jù)的離散化
變精度粗糙集中所定義的規(guī)則是用決策表的形式,決策表要求屬性值一定是離散值,進(jìn)而對(duì)原始數(shù)據(jù)集進(jìn)行離散化處理。下面對(duì)數(shù)據(jù)集進(jìn)行等頻離散,ROSETTA的使用界面如圖2所示。
經(jīng)過離散化后的數(shù)據(jù)格式如圖3所示:
3.4 實(shí)驗(yàn)數(shù)據(jù)的預(yù)處理
數(shù)據(jù)集經(jīng)過離散化處理,很多屬性值為0,所以刪除無用信息和冗余信息是非常有必要的。實(shí)驗(yàn)數(shù)據(jù)的預(yù)處理有如下幾個(gè)步驟:
1)從獲得的原始數(shù)據(jù)集分離出實(shí)驗(yàn)所用的數(shù)據(jù)集;
2)選好的數(shù)據(jù)集隨機(jī)分為兩個(gè)部分,一部分用于訓(xùn)練數(shù)據(jù),另一部分作為測試數(shù)據(jù);
3)分別構(gòu)建信息系統(tǒng)備用于數(shù)據(jù)離散化、屬性約簡。
實(shí)驗(yàn)數(shù)據(jù)經(jīng)過預(yù)處理之后是比較規(guī)范的數(shù)據(jù)集合,采用不同的檢測方法進(jìn)行實(shí)驗(yàn)測試。
3.5 VPRS屬性約簡
對(duì)于數(shù)據(jù)集的屬性約簡在2.2已經(jīng)詳細(xì)介紹過了,該部分就采用如上的辦法進(jìn)行對(duì)訓(xùn)練數(shù)據(jù)集合進(jìn)行屬性約簡,約簡的結(jié)果如圖4:
3.6 實(shí)驗(yàn)比較與分析
為了驗(yàn)證所提出方法的有效性,根據(jù)不同的比較參數(shù)進(jìn)行比較,比較全面的判斷方法的性能。首先是測試參數(shù)[β]對(duì)檢測率的影響,由于實(shí)驗(yàn)數(shù)據(jù)非常的精細(xì),選取了五種類型分別進(jìn)行測試,每一種測試十次,去掉最高值和最低值,求平均值作為一個(gè)參考值,原因是避免偶然誤差,使實(shí)驗(yàn)更加準(zhǔn)確。下面的圖5是不同的[β]值對(duì)應(yīng)的檢測率:
實(shí)驗(yàn)一是基于貝葉斯的入侵檢測,使用WEKA內(nèi)部自帶的貝葉斯分類器來進(jìn)行訓(xùn)練和分類。首先把未經(jīng)過任何預(yù)處理的數(shù)據(jù)導(dǎo)入WEKA,再選擇貝葉斯分類器對(duì)訓(xùn)練數(shù)據(jù)樣本進(jìn)行訓(xùn)練,可以得出訓(xùn)練時(shí)間,等訓(xùn)練結(jié)束后,把測試數(shù)據(jù)導(dǎo)入分類器進(jìn)行測試。最后輸出分類器處理結(jié)果的混淆矩陣。
從上面的表2可以得出,使用實(shí)驗(yàn)平臺(tái)自帶的分類器的檢測率很低,遠(yuǎn)遠(yuǎn)不能達(dá)到入侵檢測的要求。主要原因有選擇的測試數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)集的樣本量比較大,增加了系統(tǒng)額外的開銷,降低了訓(xùn)練和檢測的效率;貝葉斯分類器假設(shè)變量之間是條件獨(dú)立的,對(duì)于費(fèi)變量的處理有較大的誤差,因此導(dǎo)致檢測率低。
實(shí)驗(yàn)二是基于粗糙集的入侵檢測,不同的是數(shù)據(jù)集是經(jīng)過離散化的,用粗糙集理論對(duì)數(shù)據(jù)進(jìn)行離散化,對(duì)數(shù)據(jù)的訓(xùn)練使用簡單遺傳算法,實(shí)驗(yàn)選擇80條作為初始種群,為了實(shí)驗(yàn)的合理性,保證U2R和R2L不為空集,然后在WEKA平臺(tái)進(jìn)行實(shí)驗(yàn),后續(xù)步驟如上。
根據(jù)上表3的結(jié)果顯示,實(shí)驗(yàn)二的檢測率和誤報(bào)率較實(shí)驗(yàn)一有所提高,對(duì)于相同的測試集,說明實(shí)驗(yàn)二的檢測效果優(yōu)于實(shí)驗(yàn)一。
主要原因是選擇的80個(gè)樣本進(jìn)行遺傳算法的訓(xùn)練,減少了訓(xùn)練時(shí)間而且提高了檢測率,說明簡單遺傳算法的分類能力比貝葉斯分類器強(qiáng)。使用的數(shù)據(jù)依然是未經(jīng)過屬性約簡的數(shù)據(jù),檢測效果還有待提高。
實(shí)驗(yàn)三是基于變精度粗糙集的入侵檢測,把數(shù)據(jù)集預(yù)處理即利用變精度粗糙集對(duì)屬性約簡,采用ROSETTA軟件中的Johnson Reducer算法進(jìn)行屬性約簡,如圖6所示:
為了簡潔描述,把41個(gè)條件屬性從1到41進(jìn)行編號(hào),使用Johnson Reducer算法進(jìn)行屬性約簡后得到結(jié)果如表4:
約簡后進(jìn)行規(guī)則的提取,產(chǎn)生“IF(條件屬性)THEN(決策屬性)”的規(guī)則,對(duì)這些規(guī)則用改進(jìn)的遺傳算法進(jìn)行訓(xùn)練和分類,得出混淆矩陣。實(shí)驗(yàn)結(jié)果如表2所示:
從上表5可以看出,此實(shí)驗(yàn)的前三種攻擊的檢測率明顯高于以上兩個(gè)實(shí)驗(yàn),誤報(bào)率也降低不少。實(shí)驗(yàn)3的檢測結(jié)果表明,使用變精度粗糙集對(duì)數(shù)據(jù)進(jìn)行屬性約簡和采用改進(jìn)的遺傳算法分類和檢測是有效的。對(duì)于U2R和R2L的檢測率不是特別高的原因是這兩種攻擊樣本所占比例非常少。但是對(duì)于Probe攻擊和DoS攻擊的檢測率都達(dá)到了95%以上。
三種定性的實(shí)驗(yàn)測試數(shù)據(jù)的結(jié)果得出了入侵攻擊檢測率對(duì)比圖,如圖7所示:
三種定性測量實(shí)驗(yàn)的入侵攻擊誤報(bào)率對(duì)比結(jié)果如下如圖8所示:
以上的實(shí)驗(yàn)數(shù)據(jù)結(jié)果表明,通過比較三種實(shí)驗(yàn)的檢測率和誤報(bào)率兩個(gè)指標(biāo)進(jìn)行分析,可以直觀地看出:對(duì)于所有四種攻擊,實(shí)驗(yàn)三的基于變精度粗糙集的入侵檢測的檢測率是最高的,誤報(bào)率是最低的。證明了用變精度粗糙集對(duì)數(shù)據(jù)進(jìn)行屬性約簡和采用改進(jìn)的遺傳算法訓(xùn)練和分類是效果較好的。
對(duì)于DOS和Probe這兩種攻擊的檢測結(jié)果來看,實(shí)驗(yàn)三的預(yù)測性能比較好,都達(dá)到了97%的檢測率。對(duì)于U2R和R2L兩類攻擊,其檢測的正確率只有72.8%和80.4%,究其原因是:這兩種攻擊的獲取樣本非常少,只含有少量的格式化網(wǎng)絡(luò)信息,網(wǎng)絡(luò)數(shù)據(jù)報(bào)文段的非格式化信息又不容易提取出特征,因此對(duì)U2R和R2L的檢測率不太高,同時(shí)由于KDDCUP99數(shù)據(jù)集本身收集的特征屬性不足又有一定關(guān)系。
通過在測試數(shù)據(jù)集中添加訓(xùn)練集中沒有的攻擊種類即未知攻擊的種類的數(shù)據(jù),依照上面的實(shí)驗(yàn)步驟重做著三個(gè)實(shí)驗(yàn),結(jié)果也會(huì)得到混淆矩陣,計(jì)算出檢測率和誤報(bào)率等指標(biāo),下面就對(duì)得出的結(jié)果做出詳細(xì)的比較圖。
本文分別對(duì)三個(gè)實(shí)驗(yàn)分別進(jìn)行已知攻擊和未知攻擊的測試,為了驗(yàn)證所提出的入侵檢測技術(shù)的普遍性,實(shí)驗(yàn)結(jié)果比較已經(jīng)如上面所示的圖7、圖8、圖9和圖10,從上面可以直觀的看出來,對(duì)于添加到測試集中的,而在訓(xùn)練集中沒有的攻擊種類,基于變精度粗糙集的入侵檢測技術(shù)依然能夠有較好的檢測率,說明變精度粗糙集的挖掘數(shù)據(jù)之間潛在規(guī)律的能力是非常強(qiáng)的,適合應(yīng)用于入侵檢測領(lǐng)域。
4 結(jié)論
本文主要解決了當(dāng)前入侵檢測中的檢測率低、誤報(bào)率高的問題。通過將變精度粗糙集理論應(yīng)用在入侵檢測領(lǐng)域中,對(duì)其捕捉的數(shù)據(jù)進(jìn)行分析,對(duì)數(shù)據(jù)集合進(jìn)行屬性約簡來降低數(shù)據(jù)的維數(shù)和刪除冗余屬性,提高了實(shí)時(shí)性和效率。然后在結(jié)合改進(jìn)的遺傳算法,對(duì)約簡的數(shù)據(jù)建立模型,最后進(jìn)行測試分類。實(shí)驗(yàn)結(jié)果表明,采用變精度粗糙集對(duì)數(shù)據(jù)預(yù)處理確實(shí)提高了檢測率和實(shí)時(shí)性,證明方法的有效性。在以后的研究中,還要致力于如何把它用在真實(shí)的網(wǎng)絡(luò)環(huán)境中,對(duì)于屬性約簡的算法如何更加有效和快速的屬性約簡也是一個(gè)重要的研究方向。
參考文獻(xiàn):
[1] Forrest S, Perelson A S, Allen L, Cherukuri R. Self-nonself discrimination in a computer[C]// IEEE Symposium on Security and Privacy. IEEE Computer Society, 1994:202.
[2] Cohen W W. Fast Effective Rule Induction[J]. American Journal of Kidney Diseases the Official Journal of the National Kidney Foundation, 2000, 46(2):115-123.
[3] Asaka M. A New Intrusion Detection Method Based on Discriminant Analysis[J]. IEICE Transactions on Information & Systems, 2001, E84D(5):570-577.
[4] Pawlak Z. Rough Sets: Theoretical Aspects of Reasoning about Data[M]. Kluwer Academic Publishers, 2015:26-49.
[5] Yang X, Song X, Chen Z, et al. Multi-granulation Rough Sets in Incomplete Information System[J]. International Journal of Machine Learning & Cybernetics,2012,3(3):223-232.
[6] Tian H, Kang X Y, Zhang J N, et al. Application of fuzzy rough sets in patterns recognition of bearing[C]. Quality, Reliability, Risk, Maintenance, and Safety Engineering (ICQR2MSE), 2012 International Conference on. IEEE, 2012:731-734.
[7] Zhang X, Guo J, Zou Q, et al.Vibrant fault diagnosis for hydroelectric generator units with a new combination of rough sets and support vector machine[J].Expert Systems with Applications,2012, 39(3):2621-2628.
[8] Ziarko W. Variable precision rough set model[J].Journal of Computer & System Sciences,1993,46(1):39-59.
[9] 易哲,李偉生. 基于粗糙集和遺傳約簡算法的入侵檢測方法[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(21):116-118.
[10] 周明. 遺傳算法原理及應(yīng)用[M]. 國防工業(yè)出版社,1999:127-134.
[11] 任永功,王楊,閆德勤.基于遺傳算法的粗糙集屬性約簡算法[J].小型微型計(jì)算機(jī)系統(tǒng),2006,27(5):862-865.
[12] Liu J N K, Hu Y, He Y. A set covering based approach to find the reduct of variable precision rough set[J]. Information Sciences, 2014, 275(3):83-100.
[13] Park I K, Choi G S. A variable-precision information-entropy rough set approach for job searching[J]. Information Systems, 2015, 48:279-288.
[14] Yang Y, Chen D, Dong Z. Novel algorithms of attribute reduction with variable precision rough set model[J]. Neurocomputing, 2014, 139:336-344.
[15] Kang X, Miao D. A variable precision rough set model based on the granularity of tolerance relation[J]. Knowledge-Based Systems, 2016, 102:103-115.
[16] Roy S S, Gupta A, Sinha A, et al. Cancer data investigation using variable precision Rough set with flexible classification[C]// International Conference on Computational Science, Engineering and Information Technology. 2012:472-475.
[17] 陳昊,楊俊安,莊鎮(zhèn)泉.變精度粗糙集的屬性核和最小屬性約簡算法[J].計(jì)算機(jī)學(xué)報(bào),2012,35(5):1011-1017.
[18] 李健,常太華,楊婷婷.變精度粗糙集模型屬性約簡分析[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(3):132-143.
[19] 營利榮,劉思峰.雜合VPRS與PNN的知識(shí)發(fā)現(xiàn)方法[J].情報(bào)學(xué)報(bào),2005,24(4):426-432.