何鎏一 楊國為
摘要:針對(duì)正常與異常樣本分布不平衡的異常點(diǎn)檢測(cè)問題,本文以小球大距離(small sphere large margin,SSLM)超球支持向量機(jī)為基礎(chǔ),提出一種高正確率識(shí)別的包裹學(xué)習(xí)算法?;舅枷霝榻⒄颖镜耐愄卣骷系木o密包裹集,在特征空間內(nèi)構(gòu)造一個(gè)半徑最小的超球,使超球內(nèi)盡可能地包含大多數(shù)的正常樣本,并使超球邊界與包裹集及異常樣本間隔最大化,所構(gòu)造的超球邊界會(huì)近似與正常樣本邊界擬合,同時(shí)將該方法與支持向量機(jī)方法和超球支持向量方法進(jìn)行實(shí)驗(yàn)對(duì)比,并在uci數(shù)據(jù)集中的醫(yī)學(xué)診斷數(shù)據(jù)及USPS數(shù)字集上進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,與同類經(jīng)典算法相比,包裹學(xué)習(xí)算法在不同的異常檢測(cè)數(shù)據(jù)上分別達(dá)到了最高準(zhǔn)確率。該研究可應(yīng)用于樣本分布不均的異常行為檢測(cè)中。
關(guān)鍵詞:異常點(diǎn)檢測(cè); 支持向量機(jī); 包裹學(xué)習(xí)
異常點(diǎn)檢測(cè)問題又稱一類分類問題(oneclass classification),用于解決異常點(diǎn)檢測(cè)問題的方法有基于密度估計(jì)法[1]和基于神經(jīng)網(wǎng)絡(luò)法[2],而支持向量機(jī)(support vector machines,SVM)[3]不但在分類問題上被大量利用,而且在異常檢測(cè)問題[4-7]上也得到了廣泛應(yīng)用,其思想為將所有特征向量映射到一個(gè)高維空間,在此空間建立一個(gè)最大間隔超平面,該超平面對(duì)應(yīng)的原始空間曲面就是分類決策面。在分開兩類特征向量(數(shù)據(jù))的超平面兩邊,建有兩個(gè)互相平行的超平面,分隔超平面使兩個(gè)平行超平面的距離最大化。在針對(duì)異常點(diǎn)檢測(cè)問題時(shí),SVM分類面會(huì)向樣本數(shù)據(jù)少的一側(cè)偏移,其分類效果表現(xiàn)不佳。D.M.J. Tax等人[8]通過改進(jìn)SVM模型,提出支持向量數(shù)據(jù)描述(support vector data description,SVDD)的方法,解決異常點(diǎn)檢測(cè)問題[9-11],但是SVDD在訓(xùn)練中僅使用一類樣本,訓(xùn)練時(shí)會(huì)導(dǎo)致核參數(shù)選取困難,不能保證獲得的描述邊界一定非常緊湊,從而造成識(shí)別率偏低;B.Schlkopf等人[12]提出一類支持向量機(jī)(one class support vector machine,OCSVM),通過在特征空間求解一個(gè)最優(yōu)超平面,實(shí)現(xiàn)正常樣本和異常樣本的最大分離;Wang J等人[13]提出分割超球模型(separating hypersphere,SH),其綜合了SVM和SVDD的建模思想,構(gòu)造一個(gè)超球?qū)⒄?fù)兩類樣本分割;Wen C等人[14]提出最大間隔最小體積的思想,構(gòu)造兩個(gè)同心超球,小超球包裹正常樣本,大超球?qū)惓颖九懦庠谕?Wu M等人[15]運(yùn)用小球大間隔(small sphere large margin,SSLM)的思想,將包含正常樣本的超球半徑最小化,同時(shí)最大化其邊界與異常樣本點(diǎn)的距離。在實(shí)際應(yīng)用方面,Zhao Y等人[17]將SVDD應(yīng)用于冷水機(jī)組的故障檢測(cè);楊金鴻等人[18]針對(duì)支持向量數(shù)據(jù)描述的訓(xùn)練集中同時(shí)含有正常點(diǎn)和離群點(diǎn)的問題,為降低離群點(diǎn)對(duì)SVDD訓(xùn)練偶像的不利影響,提出了一種基于單簇核可能性C-均值的SVDD離群點(diǎn)檢測(cè)算法;V.Mygdalis等人[19]提出一種半監(jiān)督子類支持向量描述方法,通過引入兩個(gè)附加項(xiàng),實(shí)現(xiàn)了對(duì)SVDD的優(yōu)化。基于此,本文提出同類特征集合的緊密包裹學(xué)習(xí)算法,構(gòu)造出正常樣本的同類特征集合的緊密包裹集,用小球大間隔(small sphere large margin,SSLM)模型,將包裹集樣本與異常樣本歸為一類進(jìn)行訓(xùn)練,使超球邊界與正常樣本更加擬合,從而實(shí)現(xiàn)有效的異常點(diǎn)檢測(cè)效果。該研究為樣本分布不均的異常行為檢測(cè)提供了理論依據(jù)。
1 同類特征集合的緊密包裹集
4 結(jié)束語
本文首先指出了SVM分類器、超球SVDD等分類器在解決異常點(diǎn)檢測(cè)問題上出現(xiàn)的弊端,提出了用于解決異常點(diǎn)檢測(cè)問題的包裹學(xué)習(xí)算法。該算法包括緊密包裹集存在性證明及構(gòu)造算法和包裹曲面的求解算法。實(shí)驗(yàn)證明,包裹學(xué)習(xí)算法求解的分類曲面能夠較為貼合的描述原樣本區(qū)域,通過uci數(shù)據(jù)庫和USPS手寫數(shù)字庫中的數(shù)據(jù)進(jìn)行對(duì)比實(shí)驗(yàn),說明本文提出的分類器設(shè)計(jì)算法在異常點(diǎn)檢測(cè)問題上具有較高的準(zhǔn)確率。然而該分類設(shè)計(jì)算法仍不夠完善,從理論上來說,包裹學(xué)習(xí)算法要求原樣本空間為致密凸集,但在實(shí)際工作中,大部分訓(xùn)練樣本并不能達(dá)到該要求;由于構(gòu)造高維數(shù)據(jù)致密包裹集的計(jì)算復(fù)雜度較高,因此還有較大的優(yōu)化空間。
參考文獻(xiàn):
[1] Roberts S, Tarassenko L. A Probabilistic resource allocating network for novelty detection[J]. Neural Computation, 1994, 6(2): 270-284.
[2] Towell G G. Local expert autoassociators for anomaly detection[C]∥Seventeenth International Conference on Machine Learning. San Francisco, USA: Morgan Kaufmann Publishers Inc, 2000.
[3] Vapnik N V. The nature of statistical learning theory[M]. NewYork: Springer, 1995.
[4] 吳銳, 陳靜. 基于SVM的電信網(wǎng)絡(luò)異常點(diǎn)檢測(cè)技術(shù)的研究[J]. 赤峰學(xué)院學(xué)報(bào): 自然科學(xué)版, 2017, 33(21): 46-47.
[5] 徐兵, 郭淵博, 葉子維, 等. 基于圖分析和支持向量機(jī)的企業(yè)網(wǎng)異常用戶檢測(cè)[J]. 計(jì)算機(jī)應(yīng)用, 2018, 38(2): 357-362.
[6] 陳志全, 楊駿, 喬樹山. 基于單類支持向量機(jī)的異常聲音檢測(cè)[J]. 電子設(shè)計(jì)工程, 2016, 24(23): 19-22.
[7] 劉敬, 谷利澤, 鈕心忻, 等. 基于單分類支持向量機(jī)和主動(dòng)學(xué)習(xí)的網(wǎng)絡(luò)異常檢測(cè)研究[J]. 通信學(xué)報(bào), 2015, 36(11): 136-146.
[8] Tax D M J, Duin R P W. Support vector data description[J]. Machine Learning, 2004, 54(1): 45-66.
[9] 馬詠雪. 基于SVDD的模擬電路異常檢測(cè)方法研究及應(yīng)用[D]. 哈爾濱: 哈爾濱工業(yè)大學(xué), 2016.
[10] 周勝明, 王小飛, 高峰, 等. 基于在線SVDD的航空發(fā)動(dòng)機(jī)異常檢測(cè)方法[J]. 計(jì)測(cè)技術(shù), 2015, 35(5): 20-22, 56.
[11] 曾現(xiàn)靈, 張立燕, 胡榮華. 基于主成分建模的 SVDD 高光譜圖像異常檢測(cè)[J]. 智能系統(tǒng)學(xué)報(bào), 2014, 9(3): 343-348.
[12] Bernhard S, Williamson R C, Smola A J, et al. Support vector method for novelty detection[C]∥Advances in Neural Information Processing Systems 12. Denver, Colorado, USA: DBLP, 1999: 582-588.
[13] Wang J G, Neskovic P, Cooper L N. Pattern classification via single spheres[M]. 8th International Conference on Discovery Science. Singapore: Springer, 2005.
[14] Wen C J, Zhan Y Z, Chen C J. Maximalmargin minimalvolume hypersphere support vector machine[J]. Control & Decision, 2010, 25(1): 79-83.
[15] Wu M, Ye J. A small sphere and large margin approach for novelty detection using training data with outliers[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2009, 31(11): 2088-2092.
[16] Chang C C, Lin C J. Training vsupport vector classifiers: theory and algorithms[J]. Neural Computation, 2001, 13(9): 2119-2147.
[17] Zhao Y, Wang S W, Xiao F. Pattern recognitionbased chillers fault detection method using support vector data description (SVDD)[J]. Applied Energy, 2013, 112: 1041-1048.
[18] 楊金鴻, 鄧廷權(quán). 一種基于單簇核PCM的SVDD離群點(diǎn)檢測(cè)方法[J]. 電子學(xué)報(bào), 2017, 45(4): 813-819.
[19] MygdalisV, Iosifidis A, Tefas A, et al. Corrigendum to “Semisupervised subclass support vector data description for image and video classification” [Neurocomputing, 278 (2018), 51-61][J]. Neurocomputing, 2018, 291: 237-241.
[20] Dua D, Graff C. UCI machine learning repository [M/OL]. Irvine, CA: University of California, School of Information and Computer Science, 2019.[http: ∥archive. ics. uci. edu/ml]