国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

稀疏樣本自表達子空間聚類算法

2016-12-24 08:47:36林大華楊利鋒鄧振云李永鋼
智能系統(tǒng)學(xué)報 2016年5期
關(guān)鍵詞:離群錯誤率聚類

林大華,楊利鋒,鄧振云,李永鋼,羅

(1.廣西電化教育館,廣西 南寧 530022; 2.廣西師范大學(xué) 廣西多源信息挖掘與安全重點實驗室,廣西 桂林 541004)

?

稀疏樣本自表達子空間聚類算法

林大華1,楊利鋒2,鄧振云2,李永鋼2,羅2

(1.廣西電化教育館,廣西 南寧 530022; 2.廣西師范大學(xué) 廣西多源信息挖掘與安全重點實驗室,廣西 桂林 541004)

針對現(xiàn)有子空間聚類算法在構(gòu)造相似度矩陣時,沒有同時利用樣本自表達和稀疏相似度矩陣以及去除噪音、離群點的干擾相結(jié)合,提出了一種新的稀疏樣本自表達子空間聚類方法。該方法通過樣本自表達而充分利用樣本間固有相關(guān)性的本質(zhì),創(chuàng)新性地同時使用L1-范數(shù)和L2,1-范數(shù)正則化項懲罰相似度矩陣,即對所有測試樣本進行稀疏樣本自表達,從而確保每個測試樣本由與其相關(guān)性強的樣本表示,并使所獲得的相似度矩陣具有良好的子空間結(jié)構(gòu)和魯棒性。通過Hopkins155和人臉圖像等大量數(shù)據(jù)集的實驗結(jié)果表明,本文方法在實際數(shù)據(jù)的子空間聚類中能夠獲得非常好的效果。

子空間聚類; 譜聚類; 子空間結(jié)構(gòu); 相似度矩陣; 樣本自表達

近幾年來,子空間聚類[1]方法作為一種實現(xiàn)高維數(shù)據(jù)聚類的有效途徑,在機器學(xué)習(xí)、圖像處理和計算機視覺等領(lǐng)域已得到廣泛應(yīng)用。其中基于稀疏表示(sparse representation)和低秩表示(low-rank representation)的子空間聚類方法,通過與圖劃分的譜聚類方法相結(jié)合,在運動圖像分割、人臉識別等高維數(shù)據(jù)的聚類方面得到了較好的效果。

子空間聚類又稱子空間分割是指把數(shù)據(jù)的原始特征空間分割為不同的特征子集,從不同的子空間角度考察各個樣本聚類劃分的意義,同時在聚類過程中為每個樣本尋找相應(yīng)的特征子空間。目前實現(xiàn)子空間聚類的方法主要歸為以下4類:基于代數(shù)的,如GPCA算法[2];基于迭代的,如K-subspaces[3];基于統(tǒng)計的,如PCA和RANSAC算法[4];以及基于譜聚類的,如SSC(sparse subspace clustering)[5],LRR(low-rank representation)[6]和LSR(least squares regression)[7]算法等。其中,基于譜聚類的子空間聚類算法利用樣本的局部或全局信息去構(gòu)建一個相似度矩陣,然后通過譜聚類算法對樣本進行聚類。該類方法能較好地處理具有噪音和離群點的數(shù)據(jù),不需要事先知道子空間的個數(shù)以及維數(shù),因此在手寫體識別、人臉識別以及運動分割等多個應(yīng)用領(lǐng)域獲得非常好的效果。

目前比較流行的算法有基于譜聚類的SSC和LRR算法,它們主要是對每個樣本都找到一組稀疏或低秩的線性表示去構(gòu)建相似度矩陣,然后利用譜聚類得到最終的結(jié)果。其中,SSC算法能夠很好地結(jié)合樣本自表達和稀疏相似度矩陣,通過稀疏相似度矩陣可使每個樣本由與其相似性很強的一些樣本表示,這些具有強相似性的樣本往往在同一個子空間里,所以具有一定稀疏性的相似度矩陣往往可以提高子空間聚類的效果。但是,在數(shù)據(jù)的信噪比小、子空間不相互獨立的情況時,該方法的聚類效果就不是很好。而LRR算法可以很好地使樣本自表達和去除噪音、離群點相結(jié)合,但是其通過低秩表示構(gòu)造的相似度矩陣往往不稀疏,沒有很好地利用樣本間的強相關(guān)性,這會影響子空間聚類的效果。

因此,合理地結(jié)合利用樣本自表達和稀疏相似度矩陣以及去除噪音、離群點的干擾,能夠?qū)崿F(xiàn)構(gòu)造一個良好的相似度矩陣而獲得更好的子空間聚類效果的目的。所以,本文提出的方法首先從樣本之間的相關(guān)性出發(fā),對所有測試樣本進行樣本自表達,并同時通過L1-norm和L2,1-norm正則化項懲罰相似度矩陣,進行稀疏約束得到全局最優(yōu)的相似度矩陣。然后,利用譜聚類得到最終的子空間聚類結(jié)果。在樣本自表達過程中,L1-norm正則化項用來實現(xiàn)相似度矩陣的稀疏,確保每個測試樣本都由與之相關(guān)性強的樣本表示,能很好地解決樣本自表達和稀疏相似度矩陣相結(jié)合的問題;而L2,1-norm通過控制相似度矩陣的行稀疏解決噪音和離群點的干擾,使其具有更好的魯棒性,最終可以實現(xiàn)樣本自表達和稀疏相似度矩陣以及去除噪音、離群點的干擾相結(jié)合,提高子空間聚類的效果。本文將所提出的方法稱為稀疏樣本自表達子空間聚類算法,簡稱為SSR_SC(sparse sample self-representation for subspace clustering)。

1 相關(guān)理論

高維數(shù)據(jù)一般可由多個低維結(jié)構(gòu)表示,且具有很強相似度的樣本往往在同一低維結(jié)構(gòu)里,否則在不同的結(jié)構(gòu)。每個低維結(jié)構(gòu)對應(yīng)為一個子空間,所以對數(shù)據(jù)的聚類可以通過對子空間的劃分來聚類,即子空間聚類。

目前基于譜聚類的子空間聚類算法的主要步驟是:1)根據(jù)子空間策略構(gòu)造樣本集的相似度矩陣S;2)通過計算相似度矩陣或拉普拉斯矩陣的前k個特征值與特征向量,構(gòu)建特征向量空間;3)利用K-means算法對特征向量空間中的特征向量進行聚類,從而實現(xiàn)子空間的聚類。由上述的過程可知,該類方法的主要挑戰(zhàn)就是構(gòu)造一個良好的相似度矩陣S。而通過一個良好矩陣S得到的子空間的特征表現(xiàn)為:子空間內(nèi)的樣本具有高度的相似性,不同子空間的樣本不相似或差異性大,且所有子空間呈塊對角化結(jié)構(gòu)[8]。

因此,本文提出了SSR_SC算法,充分利用樣本間的相關(guān)性進行樣本自表達,并通過L1-norm和L2,1-norm正則化項對相似度矩陣進行稀疏約束,從而能很好地實現(xiàn)構(gòu)造一個良好的相似度矩陣的目的。

2 SSR_SC算法

對于樣本空間X中的一個樣本x,用同一空間中的其他樣本對x進行線性表示的過程稱為樣本自表達。同一子空間中的樣本之間往往具有很強的相關(guān)性,不同子空間的樣本之間為無相關(guān)性或弱相關(guān)性,所以通過樣本自表達能很好地利用樣本之間的相關(guān)性來提高子空間聚類的效果。假設(shè)樣本空間為X=[x1x2…xn]∈Rd×n,其中n為樣本數(shù),xi(i=1,2,…,n)為具有d維屬性的樣本點。根據(jù)上述樣本自表達的定義,即找出這樣一個列向量zi∈Rn×1,使得xi可以通過Xzi表示。

但是樣本空間X中往往存在噪音和離群點等干擾,其用e表示,則xi=Xzi+e,而這些干擾通常會影響子空間聚類的效果。因此本文算法希望找到這樣一個相似度矩陣Z=[z1z2…zn]∈Rn×n,使得X與XZ的誤差盡可能小。這通常可采用嶺回歸(ridge regression)實現(xiàn):

假定通過目標(biāo)函數(shù)(2)得到如下矩陣Z,其中diag(Z)=0,表明樣本不能將自身作為相關(guān)性樣本進行線性表示。

本文提出的SSR_SC算法的具體步驟如下:

算法1SSR_SC算法

輸入?yún)?shù)λ1和λ2,以及樣本空間:

X=[x1x2…xn]∈Rd×n。

輸出聚類結(jié)果C∈Rn×1。

3)利用譜聚類算法得到最終的聚類結(jié)果C∈Rn×1。

3 目標(biāo)函數(shù)優(yōu)化

目標(biāo)函數(shù)(2)是一個凸函數(shù),但是L1-norm和L2,1-norm是非光滑的,無法直接求得解析解。為此,本文提出了一種有效的優(yōu)化算法來解決這個問題,最后解出目標(biāo)函數(shù)的最優(yōu)化結(jié)果。

對目標(biāo)函數(shù)(2)中的Z的每一行Zi求導(dǎo),然后令其為0,得到式(3)

算法2目標(biāo)函數(shù)優(yōu)化算法

輸入數(shù)據(jù)集X;

輸出Z(t)∈Rn×n;

初始化Z(1)∈Rn×n,t=1;

do{

2)For每個i(1≤i≤n),計算

3)t=t+1;

}until收斂。

由式(5),可得

Tr(X-XZ(t+1))T(X-XZ(t+1))+

Tr(X-XZ(t))T(X-XZ(t))+

于是,可推導(dǎo)出

Tr(X-XZ(t+1))T(X-XZ(t+1))+

Tr(X-XZ(t))T(X-XZ(t))

4 實驗分析與討論

4.1 實驗數(shù)據(jù)集及評價指標(biāo)

本文算法通過MATLAB語言編程,且所有實驗都是在win7系統(tǒng)下的MATLAB 2014軟件上運行測試。實驗用到的數(shù)據(jù)集介紹如下。

Hopkins155[15]數(shù)據(jù)集被廣泛用來測試各種子空間聚類算法。該數(shù)據(jù)集由156個視頻序列組成,一個序列對應(yīng)一個數(shù)據(jù)集,所以其共有156個數(shù)據(jù)集,并且每個序列中包含2或3個運動物體目標(biāo)。

Jaffe[16]數(shù)據(jù)集由日本ATR表情識別研究協(xié)會提供,該數(shù)據(jù)集包含10個人的213張表情圖像,每張表情圖像經(jīng)過預(yù)處理被裁剪為32像素×32像素大小的尺度。

USPS[17]數(shù)據(jù)集是由美國國家郵政局提供,數(shù)據(jù)集含有9 298個0~10的手寫數(shù)字數(shù)據(jù)集,每個手寫數(shù)字數(shù)據(jù)經(jīng)預(yù)處理都被裁剪為16像素×16像素大小的尺度。用每個數(shù)字的前100個圖像進行實驗。

ORL[18]數(shù)據(jù)集是由劍橋Olivetti實驗室提供,數(shù)據(jù)集包含40人的共400張面部圖像,每張人臉數(shù)據(jù)經(jīng)預(yù)處理被裁剪為16像素×16像素大小的尺度。

為了驗證算法的性能,將目前較好的子空間聚類算法LSR、LRR和SSC與本文算法進行對比實驗。為了保證算法的公平性,所有算法都沒有對數(shù)據(jù)進行后期處理。

子空間聚類的重要挑戰(zhàn)是處理存在于數(shù)據(jù)中的錯誤。因此,本文將子空間聚類錯誤率作為衡量各個算法性能的評價標(biāo)準(zhǔn)。其中,錯誤率越小,子空間聚類效果越好;反之,則越差。其定義為

4.2 實驗結(jié)果與分析

4.2.1 Hopkins155數(shù)據(jù)集上的實驗

由于Hopkins155數(shù)據(jù)集包含156個不同的數(shù)據(jù)集,根據(jù)文獻[19],本文將156個數(shù)據(jù)集中的子空間聚類錯誤率的最大值(Max)、均值(Mean)和中值(Median)以及標(biāo)準(zhǔn)差(Std)作為評價指標(biāo)。對LSR,LRR,SSC以及本文算法SSR_SC在該數(shù)據(jù)集進行了對比,實驗結(jié)果如表1所示。

通過分析表1可知,在Hopkins155數(shù)據(jù)集上,本文提出的SSR_SC比LSR、LRR和SSC獲得了更好的子空間聚類效果。具體地,SSR_SC與LSR算法對比,錯誤率均值小2.38%,標(biāo)準(zhǔn)差小3.12%。LSR中使用L2-norm正則化項約束相似度矩陣Z,能使Z具有很好的塊對角化結(jié)構(gòu),但是其并沒有對Z稀疏而影響其最終的聚類效果。SSR_SC與LRR算法對比,最大錯誤率小7.16%,均值小3.30%,標(biāo)準(zhǔn)差小4.53%。其中LRR利用L2,1-norm項懲罰相似度矩陣Z而可以去除噪音和離群點的影響,但是,其沒有對Z稀疏。而本文提出的SSR_SC算法通過L2,1-norm正則化項懲罰相似度矩陣而使其具有魯棒性,且還對Z進行稀疏,所以能獲得更好的子空間聚類效果。與SSC算法比較,本文算法SSR_SC也取得了更好的效果,最大錯誤率小0.96%,均值錯誤率小1.19%,標(biāo)準(zhǔn)差錯誤率小2.14%。Hopkins155數(shù)據(jù)集的大部分數(shù)據(jù)都是比較干凈的,只有很小部分數(shù)據(jù)受到污染,這樣的條件下SSC稀疏Z而更充分地利用了樣本間的強相關(guān)性,從表1中可以看到SSC比LRR的子空間聚類效果更好。

表1 LSR、LRR、SSC和SSR_SC在Hopkins155數(shù)據(jù)集上實驗的子空間聚類錯誤率

4.2.2 數(shù)字圖像和人臉圖像上的實驗

為了證明本文算法SSR_SC在實際數(shù)據(jù)集中也具有適用性,本文還在USPS、ORL以及Jaffe等數(shù)字圖像和人臉圖像數(shù)據(jù)集也進行了對比實驗。實驗結(jié)果如表2所示。

表2 LSR、LRR、SSC和SSR_SC分別在Jaffe和ORL 以及USPS數(shù)據(jù)集實驗的子空間聚類錯誤率

從表2數(shù)據(jù)可知,SSR_SC算法在Jaffe數(shù)據(jù)集上取得了最優(yōu)的效果,其子空間聚類錯誤率為1.41%,遠遠低于LSR,LRR和SSC 算法的錯誤率,效果與LRR和SSC相比提升了10倍,甚至比LSR算法提高了接近40倍。而在USPS和ORL數(shù)據(jù)集上同樣也取得了較低的子空間聚類錯誤率,其中在USPS數(shù)據(jù)集上,相比LSR、LRR和SSC分別提高了13.70%、24.30%、35.10%;在ORL數(shù)據(jù)集上分別提高了1.50%、34.25%、1.75%。因此,可以認為本文提出的SSR_SC算法是一種高效的子空間聚類算法。

為了更加直觀地對比LRR、SSC和SSR_SC算法的子空間聚類效果,選取ORL數(shù)據(jù)集里100張圖片(10人,每人10張)進行實驗,得到的實驗結(jié)果如圖1所示。

(a)SSC

(b)LRR

(c)SSR_SC

圖1中,每行都代表一個子空間,短劃線方框區(qū)域表示錯誤聚類的圖片。從圖1可以直觀的看出,本文提出的SSR_SC算法取得的子空間聚類效果明顯好于LRR算法和SSC算法。其中,SSR_SC只將該數(shù)據(jù)集的2個人錯誤地聚類到其他子空間,而LRR和SSC算法聚類錯誤的圖片數(shù)量分別為17張和19張,其中還存在將同一個人的圖像平均的聚類為2個子空間的情況,如圖1(a)方點線方框所示,甚至出現(xiàn)將不同2組人聚類到同一個子空間的情況。綜上分析,SSR_SC算法比現(xiàn)有的子空間聚類方法有更好的子空間聚類效果。

5 結(jié)束語

提出一種綜合稀疏學(xué)習(xí)和樣本自表達的子空間聚類方法稱為稀疏樣本自表達算法。該算法通過充分考慮樣本之間的相關(guān)性而進行樣本自表達,并且通過稀疏學(xué)習(xí)理論進行優(yōu)化,即通過L1-norm使相似度矩陣得到適當(dāng)稀疏而讓每個樣本由與其相似性高的樣本進行表達,通過L2,1-norm解決樣本自表達過程中噪音和離群點的干擾。與SSC算法和LRR算法比較,SSR_SC算法具有更好的魯棒性和實現(xiàn)構(gòu)造一個良好相似度矩陣的目的。此外,在Hopkinss155、USPS、ORL和Jaffe等數(shù)據(jù)集上實驗的結(jié)果表明,SSR_SC算法在實際數(shù)據(jù)集,如運動目標(biāo)分割和圖像聚類等方面,能獲得更好的子空間聚類效果。此后工作將提出的方法應(yīng)用于更廣泛的領(lǐng)域,如醫(yī)學(xué)數(shù)據(jù)、文本數(shù)據(jù)以及金融數(shù)據(jù)等高維數(shù)據(jù)的聚類分析。

[1]王衛(wèi)衛(wèi), 李小平, 馮象初, 等. 稀疏子空間聚類綜述[J]. 自動化學(xué)報, 2015, 41(8): 1373-1384. WANG Weiwei, LI Xiaoping, FENG Xiangchu, et al. A survey on sparse subspace clustering[J]. Acta automatica sinica, 2015, 41(8): 1373-1384.

[2]VIDAL R, MA Yi, SASTRY S. Generalized principal component analysis (GPCA)[J]. IEEE transactions on pattern analysis and machine intelligence, 2005, 27(12): 1945-1959.

[3]TSENG P. Nearest q-flat to m points[J]. Journal of optimization theory and applications, 2000, 105(1): 249-252.

[4]FISCHLER M A, BOLLES R C. Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography[J]. Communications of the ACM, 1981, 24(6): 381-395.

[5]ELHAMIFAR E, VIDAL R. Sparse subspace clustering: algorithm, theory, and applications[J]. IEEE transactions on pattern analysis and machine intelligence, 2013, 35(11): 2765-2781.

[6]LIU Guangcan, LIN Zhouchen, YAN Shuicheng, et al. Robust recovery of subspace structures by low-rank representation[J]. IEEE transactions on pattern analysis and machine intelligence, 2013, 35(1): 171-184.

[7]LU Canyi, MIN Hai, ZHAO Zhongqiu, et al. Robust and efficient subspace segmentation via least squares regression[C]//Proceedings of the 12th European Conference on Computer Vision. Berlin Heidelberg, 2012: 347-360.

[8]FENG Jiashi, LIN Zhouchen, XU Huan, et al. Robust subspace segmentation with block-diagonal prior[C]//Proceedings of Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA, 2014: 3818-3825.

[9]歐陽佩佩, 趙志剛, 劉桂峰. 一種改進的稀疏子空間聚類算法[J]. 青島大學(xué)學(xué)報: 自然科學(xué)版, 2014, 27(3): 44-48. OUYANG Peipei, ZHAO Zhigang, LIU Guifeng. An improved sparse subspace clustering algorithm[J]. Journal of Qingdao university: natural science edition, 2014, 27(3): 44-48.

[10]楊國亮, 羅璐, 豐義琴, 等. 基于低秩稀疏圖的結(jié)構(gòu)保持投影算法[J]. 計算機工程與科學(xué), 2015, 37(8): 1584-1590. YANG Guoliang, LUO Lu, FENG Yiqin, et al. Structure preserving projection algorithm based on low rank and sparse graph[J]. Computer engineering and science, 2015, 37(8): 1584-1590.

[11]ZHU Xiaofeng, HUANG Zi, YANG Yang, et al. Self-taught dimensionality reduction on the high-dimensional small-sized data[J]. Pattern recognition, 2013, 46(1): 215-229.

[12]ZHANG Shichao, QIN Zhenxing, LING C X, et al. “Missing is useful”: missing values in cost-sensitive decision trees[J]. IEEE transactions on knowledge and data engineering, 2005, 17(12): 1689-1693.

[13]ZHU Xiaofeng, HUANG Zi, CUI Jiangtao, et al. Video-to-shot tag propagation by graph sparse group lasso[J]. IEEE transactions on multimedia, 2013, 15(3): 633-646.

[14]ZHU Xiaofeng, ZHANG Lei, HUANG Zi. A sparse embedding and least variance encoding approach to hashing[J]. IEEE transactions on image processing, 2014, 23(9): 3737-3750.

[15]TRON R, VIDAL R. A benchmark for the comparison of 3-D motion segmentation algorithms[C]//Proceedings of Conference on Computer Vision and Pattern Recognition. Minneapolis, MN, USA, 2007: 1-8.

[16]LYONS M, AKAMATSU S, KAMACHI M, et al. Coding facial expressions with gabor wavelets[C]//Proceedings of the 3rd IEEE International Conference on Automatic Face and Gesture Recognition. Nara, 1998: 200-205.

[17]HULL J J. A database for handwritten text recognition research[J]. IEEE transactions on pattern analysis and machine intelligence, 1994, 16(5): 550-554.

[18]SAMARIA F S, HARTERT A C. Parameterisation of a stochastic model for human face identification[C]//Proceedings of the 2nd IEEE Workshop on Applications of Computer Vision. Sarasota, FL, USA, 1994: 138-142.

[19]FENG Jiashi, LIN Zhouchen, XU Huan, et al. Robust subspace segmentation with block-diagonal prior[C]//Proceedings of Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA, 2014: 3818-3825.

林大華,男,1979年生,主要研究方向為機器學(xué)習(xí)、數(shù)據(jù)挖掘。

楊利鋒,男,1989年生,碩士研究生,主要研究方向為數(shù)據(jù)挖掘和機器學(xué)習(xí)。

鄧振云,男,1991年生,碩士研究生,主要研究方向為機器學(xué)習(xí)、數(shù)據(jù)挖掘。發(fā)表學(xué)術(shù)論文8篇,其中被SCI、EI檢索4篇。

2017國際群體智能會議

The Eighth International Conference on Swarmb Intelligence (ICSI’2017)

July 27-August 01, 2017, Fukuoka, Japan

The Eighth International Conference on Swarm Intelligence (ICSI’2017) serves as an important forum for researchers and practitioners to exchange latest advantages in theories, technologies, and applications of swarm intelligence and related areas. The ICSI’2017 is the eighth annual event in this high-reputation ICSI series after Bali event (ICSI’2016), Beijing joint event (ICSI-CCI’2015), Hefei event (ICSI’2014), Harbin event (ICSI’2013), Shenzhen event (ICSI’2012), Chongqing event (ICSI’2011) and Beijing event (ICSI’2010). Papers presented at the ICSI’2017 will be published in Springer’s Lecture Notes in Computer Science (indexed by EI Compendex, ISTP, DBLP, SCOPUS, Web of Science ISI Thomson, etc.), some high-quality papers will be selected for SCI-indexed Transaction and Journal (including IEEE/ACM Transactions on CBB, NC, CC, IJSIR, IJCIPR, etc.).

The ICSI’2017 will be held in the center of the Fukuoka City. Historical city, Fukuoka, is the 5th largest city in Japan with 1.55 million populations and is the 7th most liveable city in the world according to the 2016 Quality of Life Survey by Monocle. Fukuoka locates at the northern end of the Kyushu Island and is the economic and cultural center of whole Kyushu Island. Because of its closeness to the Asian mainland, Fukuoka has been an important harbor city for many centuries. Today's Fukuoka is the product of the fusion of two cities in the year 1889, when the port city of Hakata and the former castle town of Fukuoka were united into one city called Fukuoka.

Website: http://www.ic-si.org/

Sparse sample self-representation for subspace clustering

LIN Dahua1, YANG Lifeng2, DENG Zhenyun2, LI Yonggang2, LUO Yan2

(1.Guangxi Center for Educational Technology, Nanning 530022, China; 2. Guangxi Key Lab of Multi-source Information Mining & Security, Guilin 541004, China)

Existing subspace clustering methods do not combine sample self-representation well with affinity matrix sparsity, for example, by removing disturbances from noise, outliers, etc., when constructing the affinity matrix. This paper proposes a novel subspace clustering method called sparse sample self-representation for subspace clustering. This method fully considers the correlation between the samples, and also takes advantage ofL1-norm andL2,1-norm terms to “penalize” the affinity matrix; that is, it conducts sparse sample self-representation for all test samples, to guarantee every sample can be expressed by any other samples with strong similarity and make it more robust. The experimental results of the Hopkins155 dataset and some facial image datasets show that the proposed method outperforms the LSR, SSC, and LRR methods in terms of the subspace clustering error.

subspace clustering; spectral clustering; subspace structure; similarity matrix; sample self-representation

2016-01-04.

日期:2016-07-18.

國家自然科學(xué)基金項目(61263035, 61573270, 61450001);國家973計劃項目(2013CB329404);中國博士后科學(xué)基金項目(2015M570837);廣西自然科學(xué)基金項目(2015GX NSFCB139011);廣西研究生教育創(chuàng)新計劃項目(YCSZ2016046, YCSZ2016045).

楊利鋒. E-mail:517567113@qq.com.

TP181

A

1673-4785(2016)05-0696-07

10.11992/tis.201601005

http://www.cnki.net/kcms/detail/23.1538.TP.20160718.1521.006.html

林大華,楊利鋒,鄧振云,等.稀疏樣本自表達子空間聚類算法[J]. 智能系統(tǒng)學(xué)報, 2016, 11(5):696-702.

英文引用格式:LIN Dahua, YANG Lifeng, DENG Zhenyun, et al. Sparse sample self-representation for subspace clustering[J]. CAAI transactions on intelligent systems, 2016,11(5):696-702.

猜你喜歡
離群錯誤率聚類
限制性隨機試驗中選擇偏倚導(dǎo)致的一類錯誤率膨脹*
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
正視錯誤,尋求策略
教師·中(2017年3期)2017-04-20 21:49:49
解析小學(xué)高段學(xué)生英語單詞抄寫作業(yè)錯誤原因
離群數(shù)據(jù)挖掘在發(fā)現(xiàn)房產(chǎn)銷售潛在客戶中的應(yīng)用
基于改進的遺傳算法的模糊聚類算法
離群的小雞
一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
降低學(xué)生計算錯誤率的有效策略
應(yīng)用相似度測量的圖離群點檢測方法
金沙县| 延长县| 山阴县| 方山县| 大理市| 禹城市| 赞皇县| 绥棱县| 灌阳县| 镇坪县| 武安市| 定陶县| 慈利县| 无棣县| 绩溪县| 修水县| 巴彦淖尔市| 海阳市| 双牌县| 岳西县| 西乌珠穆沁旗| 通渭县| 卫辉市| 高雄县| 丰顺县| 彩票| 揭西县| 灵丘县| 辰溪县| 安泽县| 吴川市| 铜川市| 阿拉善左旗| 察哈| 松江区| 桂阳县| 九龙坡区| 三穗县| 茶陵县| 大洼县| 柞水县|