国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

模糊多核一類支持向量機(jī)

2020-05-12 06:33:30張慶朔張長(zhǎng)倫王恒友
關(guān)鍵詞:集上噪音向量

張慶朔, 何 強(qiáng), 張長(zhǎng)倫,2, 王恒友

(1.北京建筑大學(xué) 理學(xué)院, 北京 100044; 2.北京建筑大學(xué) 北京未來(lái)城市設(shè)計(jì)高精尖創(chuàng)新中心, 北京 100044)

支持向量機(jī)(SVM)[1-2]是一種按監(jiān)督學(xué)習(xí)的方式對(duì)數(shù)據(jù)進(jìn)行有效分類的算法,它更適合處理兩類分類問(wèn)題. 但是現(xiàn)實(shí)中存在許多一類分類問(wèn)題,或者類別極不平衡的數(shù)據(jù)的分類問(wèn)題,比如異常檢測(cè)問(wèn)題[3],只有一個(gè)類的數(shù)據(jù)構(gòu)成輸入空間,異常點(diǎn)極少或不容易獲得. 使用經(jīng)典支持向量機(jī)算法處理這種問(wèn)題時(shí),往往效果不理想. 但是支持向量機(jī)因其可實(shí)現(xiàn)結(jié)構(gòu)風(fēng)險(xiǎn)最小化[4],找到全局最優(yōu)以及泛化能力強(qiáng)受到學(xué)者的廣泛關(guān)注,展開(kāi)了基于支持向量機(jī)的一分類問(wèn)題的研究——對(duì)給定的訓(xùn)練數(shù)據(jù)設(shè)計(jì)一個(gè)邊界,使目標(biāo)類數(shù)據(jù)落在邊界內(nèi). 基于這種思想,提出了兩種基于支持向量機(jī)的一分類學(xué)習(xí)算法,即支持向量數(shù)據(jù)描述(SVDD)[5]和一類支持向量機(jī)(OCSVM)[6]. 支持向量數(shù)據(jù)描述的主要思想是找到一個(gè)半徑最小的超球,可以包含所有的目標(biāo)數(shù)據(jù),處于超球外的數(shù)據(jù)即為異常數(shù)據(jù). OCSVM的主要思想在特征空間中找到一個(gè)超平面,將目標(biāo)數(shù)據(jù)與特征空間的原點(diǎn)以最大間隔分開(kāi),與原點(diǎn)在同一側(cè)的數(shù)據(jù)即可判斷為異常數(shù)據(jù). 本文主要研究用OCSVM處理類別不平衡數(shù)據(jù)的分類問(wèn)題.

一類支持向量機(jī)繼承了支持向量機(jī)的優(yōu)點(diǎn),但是也保留了其缺點(diǎn),需要使用核函數(shù)將數(shù)據(jù)映射到特征空間中,將原始空間中的非線性分類問(wèn)題轉(zhuǎn)化為特征空間的線性可分問(wèn)題,面臨核函數(shù)核參數(shù)的選擇難題. 不同的核函數(shù)刻畫數(shù)據(jù)間信息的側(cè)重點(diǎn)不同,決定著分類器性能的優(yōu)劣. 常用的核函數(shù)有:線性核函數(shù);多項(xiàng)式核函數(shù);高斯核函數(shù). 目前,多核學(xué)習(xí)[7-11]是核方法方面的研究熱點(diǎn),用多個(gè)核函數(shù)的組合代替單一核核函數(shù),在分類算法中取得了不錯(cuò)的效果. 多個(gè)核函數(shù)形成的組合核比單一核刻畫數(shù)據(jù)間相似性的能力更好,更能保留原始數(shù)據(jù)的特征,尤其是對(duì)復(fù)雜數(shù)據(jù)的刻畫能力更好,克服了核選擇的難題.

SVM訓(xùn)練過(guò)程中易受噪音的影響,OCSVM也有同樣的問(wèn)題. 當(dāng)前OCSVM解決這一問(wèn)題主要是對(duì)訓(xùn)練樣本進(jìn)行加權(quán)處理,樣本權(quán)重的計(jì)算方法結(jié)合了樣本的幾何信息. 2014年,CHA M等[12]提出一種基于原始空間中樣本的局部密度加權(quán)的方法,權(quán)重的計(jì)算依賴于該樣本與其第k個(gè)近鄰的距離與所有樣本與其第k個(gè)近鄰的距離的最大值的比值,當(dāng)比值越小時(shí),權(quán)重越大,即位于密度大的區(qū)域的樣本點(diǎn)具有較大的權(quán)重. 2016年,YANG J等[13]提出了一種類似的權(quán)重計(jì)算方法,樣本的權(quán)重大小依賴于該樣本到數(shù)據(jù)中心的距離與所有樣本到數(shù)據(jù)中心的距離的最大值的比值,當(dāng)比值越接近1時(shí),分配的權(quán)重越小,即距離樣本中心越遠(yuǎn),權(quán)重越小. 2016年,HOU T等[14]提出一種結(jié)合樣本的局部密度和樣本點(diǎn)到樣本中心的距離計(jì)算權(quán)重的方法. 同年,ZHU F等[15]提出了一種用樣本k近鄰的余弦和描述樣本的幾何分布,從而構(gòu)造樣本權(quán)重的方法,主要思想是使分布在數(shù)據(jù)集邊界處的樣本具有較小的權(quán)重. 上述方法都是依據(jù)樣本的重要程度,對(duì)樣本分配權(quán)重,使其對(duì)分類邊界產(chǎn)生不同的貢獻(xiàn). 模糊粗糙集[16]是一種處理不確定性的數(shù)學(xué)工具,可以更好地發(fā)現(xiàn)隱藏在數(shù)據(jù)間的信息. 通過(guò)模糊粗糙集,依據(jù)特征與類別的一致性程度,能夠?yàn)槊總€(gè)訓(xùn)練樣本賦予一個(gè)模糊隸屬度,可以有效表示其隸屬于目標(biāo)類的程度. 受加權(quán)和模糊粗糙集思想的啟發(fā),為同時(shí)解決OCSVM中核選擇難題和對(duì)噪音數(shù)據(jù)敏感問(wèn)題,將模糊隸屬度引入到多核一類支持向量機(jī)(MKOCSVM)中,使重要的樣本在訓(xùn)練過(guò)程中發(fā)揮更大的作用,淡化不重要的樣本點(diǎn)或噪音的影響,以克服MKOCSVM對(duì)噪音敏感問(wèn)題.

本文的主要工作如下:

1) 將模糊隸屬度引入到多核一類支持向量機(jī),提出模糊多核一類支持向量機(jī)(FMKOCSVM),同時(shí)解決一類支持向量機(jī)的核選擇難題和魯棒性差的問(wèn)題.

2) 基于模糊粗糙集理論,用CHEN D等[17]提出的模糊隸屬度函數(shù)為每個(gè)訓(xùn)練樣本確定模糊隸屬度,更有效地減小噪音數(shù)據(jù)對(duì)分類邊界的影響.

3) 多核學(xué)習(xí)中組合核采用線性加權(quán)的方式構(gòu)造,核權(quán)重通過(guò)最大化組合核和理想核的相似性計(jì)算獲得[18],獲得的組合核更充分地利用了數(shù)據(jù)的信息.

4) 在人工數(shù)據(jù)集和標(biāo)準(zhǔn)數(shù)據(jù)集上,對(duì)比OCSVM、MKOCSVM、FMKOCSVM三種算法的在噪音環(huán)境下的性能,本文提出的FMKOCSVM算法均獲得最佳的結(jié)果.

1 相關(guān)知識(shí)

1.1 一類支持向量機(jī)

相較于經(jīng)典SVM,OCSVM適用于處理數(shù)據(jù)類別不平衡或單類分類問(wèn)題,其主要思想是首先通過(guò)非線性映射將數(shù)據(jù)從原始空間映射到特征空間,并將特征空間的原點(diǎn)作為異常點(diǎn)的代表,在特征空間中尋找一個(gè)最優(yōu)分類超平面——可以將正常數(shù)據(jù)的像與原點(diǎn)以最大間隔分開(kāi).

設(shè)有樣本數(shù)據(jù){x1,x2,…,xl}∈Rn,l是樣本數(shù)量,φ(x)是將樣本映射到特征空間的函數(shù),ω、ρ表示特征空間中分離超平面的法向量和偏移量,分離超平面的表達(dá)式為ωTφ(x)-ρ=0. 目標(biāo)是最大化分離超平面與原點(diǎn)之間的距離,則OCSVM需要求解以下優(yōu)化問(wèn)題[5]:

(1)

式中ξi是松弛變量,表示允許離群點(diǎn)存在,v是控制離群點(diǎn)數(shù)量上限和全部支持向量數(shù)量下限的參數(shù).

利用Lagrange乘子法,可得上述優(yōu)化問(wèn)題的對(duì)偶問(wèn)題,即:

(2)

其中αi是樣本xi對(duì)應(yīng)的拉格朗日系數(shù), 核函數(shù)k(xi,xj)=〈φ(xi),φ(xj)〉,代替了特征空間中的內(nèi)積.

(3)

對(duì)于給定的一個(gè)測(cè)試樣本,代入式(3)后,當(dāng)決策值為+1時(shí),該樣本被判別為正常點(diǎn);當(dāng)決策值為-1時(shí),該樣本被判別為異常點(diǎn).

1.2 多核學(xué)習(xí)

分類算法中的核函數(shù)核參數(shù)的選取,對(duì)分類器的性能有著至關(guān)重要的影響,目前普遍是靠經(jīng)驗(yàn)試算或者交叉驗(yàn)證. 交叉驗(yàn)證的本質(zhì)就是一種枚舉法并受選定的參數(shù)定義域的影響,與經(jīng)驗(yàn)試算一樣需要消耗大量的時(shí)間,且不一定能獲得最佳的分類性能.

對(duì)于解決SVM中核函數(shù)核參數(shù)的選擇問(wèn)題,用組合核代替單一核的思想取得了不錯(cuò)的進(jìn)展. 近幾年有許多關(guān)于核組合方法的研究,現(xiàn)已形成一個(gè)新的研究領(lǐng)域,即多核學(xué)習(xí). 在多核學(xué)習(xí)的研究中,關(guān)于組合核的構(gòu)成方法,常用的有:

1) 線性組合的方法[19]. 將多個(gè)基本核線性組合的結(jié)果作為組合核. 其中有:

a)直接求和方式:

(4)

b)加權(quán)求和方式:

(5)

c)多項(xiàng)式加權(quán)擴(kuò)展方式:

(6)

其中,kp(x,z)是k(x,z)的多項(xiàng)式擴(kuò)展.

2) 非線性組合的方法[20]. 如乘積:

(7)

2 模糊多核OCSVM

OCSVM普遍面臨核選擇難題與噪音數(shù)據(jù)敏感問(wèn)題,為同時(shí)解決這兩個(gè)問(wèn)題,本文將模糊隸屬度引入到MKOCSVM模型中,期望提高M(jìn)KOCSVM的魯棒性, MKOCSVM模型如下式:

(8)

與式(1)相比,特征空間中的內(nèi)積由組合核函數(shù)計(jì)算,即kη(xi,xj)=〈φη(xi),φη(xj)〉,映射函數(shù)φη(x)發(fā)生改變. 本文中采用的組合核是線性加權(quán)的組合方式,即式(5),核權(quán)重是通過(guò)最大化組合核和理想核之間的相似性優(yōu)化[18]獲得.D為訓(xùn)練集,理想核的定義是yyT,y=(y1,y2,…,yl)T,yi∈{1},i=1,2,…,l,表示訓(xùn)練集的標(biāo)簽. 求核權(quán)重的優(yōu)化問(wèn)題如下式:

∑Pm=1ηmKm,yyTF∑Pm=1ηmKm,∑Pm=1ηmKmF〈yyT,yyT〉F=

(9)

(10)

根據(jù)式(9)的性質(zhì). 可選擇λ=1,為避免過(guò)擬合,對(duì)η添加約束,式(9)最終等價(jià)于:

(11)

模糊多核一類支持向量機(jī)的優(yōu)化問(wèn)題為:

(12)

對(duì)于類別確定性高,即模糊隸屬度si大的訓(xùn)練樣本,對(duì)其分類錯(cuò)誤的懲罰加大;對(duì)于模糊隸屬度小,即不重要的訓(xùn)練樣本或噪聲數(shù)據(jù),減小其分類錯(cuò)誤的懲罰,淡化其對(duì)決策邊界的影響. 使用模糊粗糙集下近似算子作為某目標(biāo)類A樣本的模糊隸屬度. 對(duì)于目標(biāo)樣本xi,其屬于目標(biāo)類A的隸屬度為:

(13)

引入Lagrange乘子αi,γi后,上述優(yōu)化問(wèn)題(12)對(duì)應(yīng)的Lagrange函數(shù)為:

(14)

L(ωη,ξ,ρ,α,γ)對(duì)ωη,ξ,ρ求偏導(dǎo)并令其為零,可以得到:

(15)

將式(15)代入式(12),可以得到FMKOCSVM的對(duì)偶問(wèn)題為:

(16)

與OCSVM模型的對(duì)偶問(wèn)題相比,只有αi的上界不同. 得到的決策函數(shù)為:

(17)

本文提出的模糊多核一類支持向量機(jī)算法主要過(guò)程見(jiàn)表1.

表1 模糊多核一類支持向量機(jī)Tab.1 Fuzzy multiple kernel one-class support vector machine

3 實(shí)驗(yàn)仿真

本節(jié)中,在MATLAB2015b平臺(tái)上進(jìn)行仿真實(shí)驗(yàn),對(duì)比FMKOCSVM與MKOCSVM、OCSVM三種算法在噪音環(huán)境中的分類性能. 所有實(shí)驗(yàn)均在一臺(tái)配置為Core i5- 3230+8G RAM的計(jì)算機(jī)進(jìn)行,操作系統(tǒng)為Windows 10.

為了驗(yàn)證所提出模型的可行性,首先在人工數(shù)據(jù)集上對(duì)三種算法的分類性能進(jìn)行了可視化. 然后在16個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上對(duì)三種算法進(jìn)行了實(shí)驗(yàn)比較,進(jìn)一步驗(yàn)證所提出模型的有效性. 所用的性能評(píng)價(jià)指標(biāo)為訓(xùn)練時(shí)間和AUC值、幾何均值(g-mean),其中:

(18)

(19)

TPR和FPR分別表示正類數(shù)據(jù)的分類精度和負(fù)類數(shù)據(jù)錯(cuò)分的比率.

3.1 人工數(shù)據(jù)集

本節(jié)中使用的人工數(shù)據(jù)集banana如圖1所示,將其中一類作為正常數(shù)據(jù),另一類作為異常數(shù)據(jù),然后在異常數(shù)據(jù)中選取了10個(gè)樣本點(diǎn)改變類別,成為噪音數(shù)據(jù). 在無(wú)噪音、有噪音的情況下OCSVM、MKOCSVM、FMKOCSVM三種算法的分類表現(xiàn)分別如圖2、圖3所示,其中OCSVM的參數(shù)v=0.07,σ=2,MKOCSVM、FMKOCSVM的基礎(chǔ)核均為7個(gè)高斯核,核參數(shù)均為{2-5,2-4,2-3,2-2,2-1,20,21}. 上述參數(shù)都是經(jīng)過(guò)多次試驗(yàn)的最優(yōu)參數(shù).

從圖2中可以看到,在沒(méi)有噪音的情況下,三種算法的分類效果幾乎沒(méi)有差別. 有噪音時(shí),如圖3(a)、3(b)所示, OCSVM、MKOCSVM分類邊界受到噪音影響,分類性能顯著降低,但是圖3(c)中FMKOCSVM的分類效果要優(yōu)于OCSVM、MKOCSVM,與無(wú)噪音下的圖2(c)無(wú)明顯差異,幾乎不受噪音影響,這表明在MKOCSVM中引入模糊隸屬度后具有抗噪音能力,對(duì)提高算法的魯棒性是有效的.

3.2 標(biāo)準(zhǔn)數(shù)據(jù)集

為了進(jìn)一步評(píng)估所提出方法的有效性,在16個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上對(duì)比了FMKOCSVM與MKOCSVM、OCSVM算法的性能. 數(shù)據(jù)集的相關(guān)信息見(jiàn)表2. 其中數(shù)據(jù)集creditcard_cut來(lái)自kaggle上的信用卡欺詐檢測(cè)數(shù)據(jù)集,由于原始數(shù)據(jù)集數(shù)量過(guò)于龐大,只隨機(jī)選取729條交易信息(483條正常交易,249條欺詐交易). 其余15個(gè)數(shù)據(jù)集來(lái)自加州大學(xué)歐文分校提出的用于機(jī)器學(xué)習(xí)的數(shù)據(jù)庫(kù),每種數(shù)據(jù)集的類別為兩類或者多類,為了適用于本文一類分類器的評(píng)估任務(wù),對(duì)數(shù)據(jù)進(jìn)行了重新組織. 對(duì)于每個(gè)數(shù)據(jù)集,將其中一個(gè)類別作為正類數(shù)據(jù),其他類別的數(shù)據(jù)都作為負(fù)類數(shù)據(jù). 在正類數(shù)據(jù)中隨機(jī)選取70%的部分作為訓(xùn)練集,又隨機(jī)選擇負(fù)類數(shù)據(jù)的20%與訓(xùn)練集一起計(jì)算訓(xùn)練樣本的模糊隸屬度. 剩余的數(shù)據(jù)都作為測(cè)試集. 本次實(shí)驗(yàn)主要為了評(píng)估FMKOCSVM的抗噪能力,故所有實(shí)驗(yàn)都隨機(jī)選取一定數(shù)量的負(fù)類樣本改變其類標(biāo)簽作為噪音加入訓(xùn)練集中. 噪音比例為訓(xùn)練集的10%. 訓(xùn)練模型之前所有訓(xùn)練集都將屬性值放縮到[0,1],測(cè)試集按訓(xùn)練集的標(biāo)準(zhǔn)進(jìn)行相應(yīng)的調(diào)整.

在OCSVM中,所有數(shù)據(jù)集使用的核函數(shù)均為高斯核函數(shù)[1-2]:

(20)

參數(shù)v和σ采用十折交叉驗(yàn)證的方式選取,其中v的取值范圍為{0.01,0.04,0.07,0.10,0.13,0.16,0.19},σ的取值范圍為{2-5,2-4,2-3,2-2,2-1,20,21,22,23}. 在MKOCSVM、FMKOCSVM中,參數(shù)v同樣通過(guò)十折交叉驗(yàn)證選取,取值范圍與OCSVM的相同. 所有數(shù)據(jù)集的組合核均由7個(gè)高斯核作為基礎(chǔ)核加權(quán)求和構(gòu)成,其中每個(gè)組合核的7個(gè)高斯核參數(shù)統(tǒng)一設(shè)置為{2-6,2-5,2-4,2-3,2-2,2-1,20}. 求核權(quán)重的優(yōu)化問(wèn)題時(shí)參數(shù)δ設(shè)置為100. 表3中列出了經(jīng)過(guò)十折交叉驗(yàn)證后選取的OCSVM、MKOCSVM和FMKOCSVM的最優(yōu)參數(shù)值.

表2 實(shí)驗(yàn)數(shù)據(jù)集信息Tab.2 Data information

為了減小訓(xùn)練集的隨機(jī)選取對(duì)實(shí)驗(yàn)結(jié)果造成的偶然性,OCSVM與MKOCSVM、FMKOCSVM都做了20次實(shí)驗(yàn),將這20次實(shí)驗(yàn)的平均值作為最終的結(jié)果. 其中訓(xùn)練時(shí)間包含十折交叉驗(yàn)證選參時(shí)間. 三種算法的AUC值、g-mean值、訓(xùn)練時(shí)間的比較結(jié)果分別見(jiàn)表4~表6.

從表4幾何均值的對(duì)比結(jié)果上看,本文提出的FMKOCSVM的性能是最好的. 在13個(gè)數(shù)據(jù)集上,FMKOCSVM具有最高的幾何均值. 尤其是數(shù)據(jù)集australia、glass、japan、vowel(1)、creditcard_cut上,FMKOCSVM的分類表現(xiàn)更好,比OCSVM的幾何均值高10%~27%. 在數(shù)據(jù)集balancescaleleft、heart、waveform上,FMKOCSVM比OCSVM的幾何均值高4%左右. 在australia、balancescaleleft、japan、vowel(1)、waveform、creditcard_cut、biomed、breast、park9個(gè)數(shù)據(jù)集上,F(xiàn)MKOCSVM與MKOCSVM具有相同的核函數(shù)核參數(shù)設(shè)置,但是FMKOCSVM比MKOCSVM的幾何均值高6%~20%. 其余7個(gè)數(shù)據(jù)集上FMKOCSVM的幾何均值都要高于MKOCSVM. 這表明本文提出的FMKOCSVM模型可以有效增強(qiáng)MKOCSVM的魯棒性,并且可以同時(shí)解決OCSVM的核選擇難題和噪音敏感問(wèn)題.

從表5三種算法的AUC值結(jié)果比較來(lái)看,FMKOCSVM在12個(gè)數(shù)據(jù)集上具有最高的AUC值.australia、glass、heart、japan、vowel(1)、creditcard_cut6個(gè)數(shù)據(jù)集上,FMKOCSVM比OCSVM的AUC值高5%~17%. 在australia、balancescaleleft、heart、japan、vowel、waveform、creditcard_cut、biomed、breast、park10個(gè)數(shù)據(jù)集上,F(xiàn)MKOCSVM比MKOCSVM的AUC值高3%~15%. 該結(jié)果進(jìn)一步驗(yàn)證了所提出的FMKOCSVM算法具有抗噪音能力.

由表6可知,在同一個(gè)運(yùn)行設(shè)備的前提下,FMKOCSVM雖然增加了計(jì)算模糊隸屬度的過(guò)程,但是其訓(xùn)練時(shí)間并沒(méi)有明顯比MKOCSVM增加,所增加的時(shí)間可以忽略不計(jì). 但是交叉驗(yàn)證選參的

表4 幾何均值對(duì)比Tab. 4 Comparison of g-mean

表5 AUC值對(duì)比Tab.5 Comparison of AUC value

表6 訓(xùn)練時(shí)間對(duì)比Tab.6 Comparison of training time

OCSVM算法的訓(xùn)練時(shí)間明顯高于MKOCSVM與FMKOCSVM,尤其是在樣本數(shù)目大且屬性多的數(shù)據(jù)集上,時(shí)間增加更加明顯. 這是因?yàn)镺CSVM算法在用十折交叉驗(yàn)證方法選核參數(shù)時(shí)需要重復(fù)訓(xùn)練多次分類器,每訓(xùn)練一次OCSVM模型的時(shí)間的復(fù)雜度約是O(N3), 故其在交叉驗(yàn)證選核參數(shù)的過(guò)程中消耗了大量的時(shí)間且時(shí)間與訓(xùn)練樣本的數(shù)量有關(guān),而MKOCSVM與FMKOCSVM算法不需要選核參數(shù),當(dāng)樣本規(guī)模越大時(shí),兩種算法的時(shí)間差異越大, MKOCSVM與FMKOCSVM會(huì)更節(jié)約時(shí)間. 圖4是三種算法在所有數(shù)據(jù)集上的平均訓(xùn)練時(shí)間,可以更加直觀發(fā)現(xiàn)FMKOCSVM在訓(xùn)練時(shí)間上的優(yōu)勢(shì),FMKOCSVM的平均訓(xùn)練時(shí)間僅占OCSVM的3.7%.

綜上所述,與MKOCSVM、OCSVM相比,雖然FMKOCSVM并沒(méi)有在所有數(shù)據(jù)集上的都具有明顯優(yōu)勢(shì),但是仍在所有數(shù)據(jù)集上取得了較優(yōu)的結(jié)果,并且FMKOCSVM中組合核的核參數(shù)是任意選取的,所有數(shù)據(jù)集設(shè)置相同,OCSVM的核參數(shù)卻是在一組核參數(shù)中選取的最優(yōu)的. 上述仿真實(shí)驗(yàn)進(jìn)一步驗(yàn)證了,本文提出的FMKOCSVM模型不僅避免了的核選擇的難題,并且具有較強(qiáng)的抗噪音能力,應(yīng)用范圍廣泛.

4 結(jié)論

本文針對(duì)OCSVM核選擇難題和對(duì)噪聲數(shù)據(jù)敏感問(wèn)題,提出了模糊多核一類支持向量機(jī)算法,該算法在同時(shí)解決這兩方面的問(wèn)題上取得良好的效果.

1)多核學(xué)習(xí)方法可以同時(shí)使用多種核函數(shù),避免核選擇的問(wèn)題,且刻畫數(shù)據(jù)特征的能力更強(qiáng),極大地提高了訓(xùn)練效率. 對(duì)目標(biāo)數(shù)據(jù)引入模糊隸屬度可以有效確定不同樣本的重要程度,從而減弱噪音數(shù)據(jù)或孤立點(diǎn)的影響,提升多核OCSVM的魯棒性.

2)該算法在標(biāo)準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)仿真結(jié)果表現(xiàn)最優(yōu),進(jìn)一步證實(shí)了噪音環(huán)境下模糊多核一類支持向量機(jī)算法的可行性和有效性.

3)與現(xiàn)有的算法相比,以多核代替單核,對(duì)樣本引入模糊隸屬度,使其在核參數(shù)選取上極大地節(jié)約了時(shí)間,且同時(shí)提高了魯棒性.

猜你喜歡
集上噪音向量
向量的分解
聚焦“向量與三角”創(chuàng)新題
噪音,總是有噪音!
Cookie-Cutter集上的Gibbs測(cè)度
鏈完備偏序集上廣義向量均衡問(wèn)題解映射的保序性
無(wú)法逃避的噪音
復(fù)扇形指標(biāo)集上的分布混沌
噪音的小把戲
白噪音的三種用法
Coco薇(2017年9期)2017-09-07 22:09:28
向量垂直在解析幾何中的應(yīng)用
湘潭县| 延庆县| 江陵县| 和田县| 蒙自县| 岑巩县| 吴川市| 泊头市| 南部县| 连云港市| 防城港市| 盱眙县| 彭山县| 云林县| 榆社县| 绍兴市| 南宁市| 瑞丽市| 福海县| 龙游县| 寻甸| 西安市| 凤凰县| 法库县| 昭苏县| 大邑县| 丰城市| 额敏县| 海丰县| 长治县| 翁源县| 深泽县| 无棣县| 伊金霍洛旗| SHOW| 阜南县| 龙山县| 错那县| 聂荣县| 平凉市| 杂多县|