国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

稀疏表示一致性引導(dǎo)的多視圖降維算法

2023-08-29 02:02楊在春
關(guān)鍵詞:降維集上視圖

楊在春,魏 巍,2,岳 琴,王 鋒,2

1(山西大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,太原 030006)

2(山西大學(xué) 計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室,太原 030006)

1 引 言

在現(xiàn)實(shí)世界中,通常可以從不同的視角去描述一件事物[1,2],比如一個(gè)網(wǎng)頁(yè)可以由網(wǎng)頁(yè)文本信息和指向網(wǎng)頁(yè)的超鏈接信息來(lái)表示;不同的語(yǔ)義可以用不同國(guó)家的語(yǔ)言來(lái)表示;一張圖像可以用不同的視覺(jué)特征來(lái)描述,如局部二進(jìn)制模式[3](LBP),位置約束線性編碼[4](LLC),定向梯度直方圖[5](HOG)等[6].由于多視圖數(shù)據(jù)的每個(gè)視圖從不同的方面表征同一對(duì)象,這些視圖共享共同的潛在子空間,因此如何有效挖掘視圖之間的關(guān)系成為多視圖學(xué)習(xí)的關(guān)鍵.

在圖像檢索[7]、文本分類(lèi)[8]、行為識(shí)別[9]等許多應(yīng)用領(lǐng)域中,提取的特征大多位于高維空間,對(duì)這些特征的直接操作是比較耗時(shí)的.為了解決這一問(wèn)題,研究者們提出了許多降維方法,通過(guò)保留樣本的某些性質(zhì)來(lái)尋找合適的低維子空間.主成分分析[10](PCA)、局部保持投影[11](LPP)、稀疏保持投影[12](SPP)等是經(jīng)典的單視圖降維方法.PCA是一種無(wú)監(jiān)督方法,它通過(guò)最大化數(shù)據(jù)的全局方差來(lái)獲得低維子空間.LPP是一種經(jīng)典的考慮局部信息的方法,該方法的目標(biāo)是尋找盡可能保持相鄰樣本間相關(guān)性的最優(yōu)子空間.SPP是一種經(jīng)典的稀疏子空間學(xué)習(xí)的方法,它使降維后的樣本保持原始空間中的稀疏表示關(guān)系.Gao等人[13]提出一種自適應(yīng)鄰域值選取的LLE算法.這些單視圖方法面對(duì)多視圖數(shù)據(jù)時(shí),一種簡(jiǎn)單的方式是將所有的視圖拼接起來(lái),但是會(huì)急劇增加數(shù)據(jù)的維數(shù),遭受“維數(shù)災(zāi)難”問(wèn)題,而且忽略了視圖之間的關(guān)系.

典型相關(guān)分析[14](CCA)是經(jīng)典的多視圖降維算法,它是最著名的多視圖子空間學(xué)習(xí)方法,其主要思想是將兩個(gè)視圖線性投影到一個(gè)潛在的子空間,以最大化視圖之間的相關(guān)性.但CCA是針對(duì)兩個(gè)視圖提出的,不能直接擴(kuò)展到多視圖的情況.Xia等人[15]提出了一種多視圖譜嵌入(MSE)方法,該方法針對(duì)每個(gè)視圖構(gòu)建鄰接矩陣,基于保持每個(gè)視圖上數(shù)據(jù)的平滑性原則,找到一個(gè)公共的低維嵌入.另外,該方法需要預(yù)定義圖,所以圖的質(zhì)量直接決定了降維的性能,但是如何構(gòu)建高質(zhì)量的圖是一個(gè)開(kāi)放性問(wèn)題.針對(duì)上述問(wèn)題,多視圖稀疏保持投影[16](MvSPP)被提出.MvSPP是對(duì)SPP的擴(kuò)展,首先基于稀疏表示在每個(gè)視圖上學(xué)習(xí)稀疏重構(gòu)矩陣,然后基于稀疏重構(gòu)矩陣進(jìn)行降維,同時(shí)使每個(gè)視圖都與公共子空間保持一致.該方法將稀疏表示和降維過(guò)程獨(dú)立進(jìn)行,雖然緩解了上述預(yù)定義圖的困難,但是不能保證稀疏表示挖掘到的信息對(duì)于降維過(guò)程是最優(yōu)的.Nie等人[17]提出一種自適應(yīng)加權(quán)圖的多視圖降維方法,首先為每個(gè)視圖構(gòu)造一個(gè)拉普拉斯圖,然后學(xué)習(xí)一個(gè)與每個(gè)視圖都近似的公共圖,基于學(xué)到的圖利用一個(gè)簡(jiǎn)單而有效的線性回歸函數(shù)將數(shù)據(jù)投影到低維空間.然而該方法依賴(lài)最初預(yù)定義圖的質(zhì)量.Wang等人[18]提出一種協(xié)同正則化多視圖稀疏重構(gòu)嵌入(CMSRE)算法,該方法首先給每個(gè)視圖學(xué)習(xí)一個(gè)K近鄰稀疏圖,然后基于學(xué)到的圖進(jìn)行降維,同時(shí)保持兩兩視圖下樣本間的相似性一致.但是稀疏構(gòu)圖與降維過(guò)程是分開(kāi)進(jìn)行的,不能保證稀疏表示挖掘到的信息對(duì)于降維過(guò)程是最優(yōu)的.類(lèi)似地,Meng等人[19]提出一種相似一致正則化的多視圖降維方法,該方法與CMSRE的不同之處在于利用了局部線性嵌入進(jìn)行構(gòu)圖,Feng等人[20]提出一種局部低秩嵌入的多視圖降維算法,該方法采用低秩表示構(gòu)造近鄰圖.

此外,還有一些多視圖方法基于深度學(xué)習(xí)展開(kāi)研究.Andrew等人[21]提出了深度典型相關(guān)分析,該方法使不同視圖下數(shù)據(jù)的特征之間線性相關(guān),共同學(xué)習(xí)兩個(gè)轉(zhuǎn)換的參數(shù).它可以看作是CCA的非線性擴(kuò)展.在深度典型相關(guān)分析框架和基于重構(gòu)的方法基礎(chǔ)上,Wang等人[22]提出了一種深度典型相關(guān)自編碼器(DCCAE),它是深度典型相關(guān)分析的擴(kuò)展.DCCAE由兩個(gè)自編碼器組成,同時(shí)優(yōu)化具有典型相關(guān)關(guān)系的低維特征與自編碼器的重構(gòu)誤差.

在上述多視圖降維方法中,作者都是將構(gòu)圖與降維作為兩個(gè)獨(dú)立的過(guò)程,并且基于數(shù)據(jù)進(jìn)行一次性構(gòu)圖,在此基礎(chǔ)上進(jìn)行數(shù)據(jù)降維.顯然,這類(lèi)算法的性能?chē)?yán)重依賴(lài)于所構(gòu)圖的優(yōu)劣.為此,本文提出一種稀疏表示一致性引導(dǎo)的多視圖降維(Sparse Representation Consensus for Multi-view Dimensionality Reduction,MDR_SRC)算法,該算法通過(guò)將基于稀疏表示的構(gòu)圖與基于圖的降維整合為一個(gè)優(yōu)化問(wèn)題,讓構(gòu)圖與降維相互指導(dǎo),從而實(shí)現(xiàn)圖質(zhì)量的動(dòng)態(tài)提升,可以有效緩解高維空間一次性構(gòu)圖對(duì)基于圖降維的不利影響.本文主要貢獻(xiàn)概括如下:

1)提出了一種稀疏表示一致性引導(dǎo)的多視圖降維算法.該方法通過(guò)稀疏表示保持了多視圖之間的一致性關(guān)系,根據(jù)樣本對(duì)的稀疏表示系數(shù)的差異性構(gòu)圖,并基于構(gòu)建的圖進(jìn)行降維.

2)將基于稀疏表示的構(gòu)圖與基于圖的降維整合到同一個(gè)優(yōu)化問(wèn)題中,實(shí)現(xiàn)了二者的相互指導(dǎo).

3)采用迭代交替策略求解優(yōu)化問(wèn)題.在4個(gè)公開(kāi)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,所提方法的性能優(yōu)于現(xiàn)有的代表性多視圖降維方法.

2 相關(guān)工作

2.1 符號(hào)描述

表1 符號(hào)表

2.2 稀疏表示

稀疏表示指任意樣本可以由除自己外的所有樣本的線性組合重構(gòu),在重構(gòu)系數(shù)si上加l0范數(shù)正則項(xiàng)約束,并且約束重構(gòu)系數(shù)是稀疏的.在線性子空間中,si中的非零元素表示與樣本xi在同一子空間的樣本對(duì)該樣本的重構(gòu)貢獻(xiàn),表達(dá)式為:

(1)

公式(1)的求解是一個(gè)非確定性多項(xiàng)式困難(Nondeterministic Polynomially hard ,NP-hard)問(wèn)題,一般用l1范數(shù)近似l0范數(shù),則可寫(xiě)為:

(2)

2.3 多視圖譜嵌入

多視圖譜嵌入[15](MSE)是一種對(duì)多視圖的不同特征進(jìn)行編碼以實(shí)現(xiàn)有物理意義的譜嵌入方法.它的目標(biāo)是同時(shí)在所有視圖上找到一個(gè)公共的低維且足夠平滑的嵌入,如公式(3)所示:

(3)

其中L(v)是第v個(gè)視圖的一個(gè)非標(biāo)準(zhǔn)化圖的拉普拉斯矩陣.它反映了第v個(gè)視圖中樣本之間的鄰域關(guān)系.α=[α1,α2,…,αV]是一組非負(fù)權(quán)值,αv反映了視圖X(v)在學(xué)習(xí)獲取低維嵌入中所起的重要程度,tr(·)是跡運(yùn)算.MSE實(shí)現(xiàn)了不同視圖的低維嵌入在全局上一致.

2.4 協(xié)同正則化的多視圖稀疏重構(gòu)嵌入

協(xié)同正則化的多視圖稀疏重構(gòu)嵌入[18](CMSRE)是從多視圖學(xué)習(xí)非線性流形的局部稀疏結(jié)構(gòu),并為其構(gòu)造有意義的低維表示的方法.首先利用單個(gè)視圖特征之間的稀疏重建相關(guān)性S(v),獲得初始的低維表示.然后,利用一個(gè)協(xié)同正則化方案來(lái)更新所有視圖的低維表示,目標(biāo)函數(shù)為:

(4)

其中D(Y(v),Y(u))=-tr((Y(v))TY(v)(Y(u))TY(u))表示樣本在任意兩個(gè)不同視圖下的相似性保持一致,M(v)=(I-S(v))(I-S(v))T,λ>0為平衡參數(shù).CMSRE在更新每個(gè)單一視圖的低維表示時(shí),考慮了所有視圖稀疏重建的相關(guān)性.

3 稀疏表示一致性引導(dǎo)的多視圖降維算法

本節(jié)具體闡述了所提出的稀疏表示一致性引導(dǎo)的多視圖降維模型的構(gòu)建過(guò)程,然后采用迭代交替策略進(jìn)行求解,算法1描述了整個(gè)算法的求解流程.

3.1 模型構(gòu)建

基于保持多視圖下樣本稀疏表示一致性的原則,最小化不同視圖下樣本的公共稀疏表示si在各個(gè)視圖下的重構(gòu)損失,對(duì)于所有樣本,目標(biāo)函數(shù)可以寫(xiě)為:

(5)

其中,α為平衡參數(shù),si表示不同視圖下所有樣本對(duì)樣本xi的稀疏重構(gòu)系數(shù),它對(duì)自身重構(gòu)貢獻(xiàn)為0,因此sii為0.該目標(biāo)函數(shù)可使得同一個(gè)樣本在不同視圖下的重構(gòu)系數(shù)保持一致.

利用稀疏表示得到的重構(gòu)系數(shù)矩陣指導(dǎo)自適應(yīng)構(gòu)圖,即如果任意兩個(gè)樣本xi,xj的重構(gòu)系數(shù)si,sj差異大,則說(shuō)明它們的相似性aij小.并使降維后的數(shù)據(jù)保持圖上的平滑性,若兩個(gè)樣本在圖上的相似性大,那么這兩個(gè)樣本的低維表示差異就小,目標(biāo)函數(shù)可寫(xiě)為:

(6)

將稀疏表示挖掘多個(gè)視圖一致性信息的過(guò)程與基于稀疏表示系數(shù)構(gòu)圖的多視圖降維整合到同一個(gè)優(yōu)化問(wèn)題中,則可以得到最終目標(biāo)函數(shù):

(7)

其中,α,β,γ,λ為平衡參數(shù).該算法利用稀疏重構(gòu)的思想,通過(guò)使不同視圖保持一個(gè)公共的稀疏表示,保持了視圖之間的一致性關(guān)系,得到樣本在不同視圖下的公共重構(gòu)系數(shù)矩陣;然后將稀疏重構(gòu)系數(shù)矩陣用來(lái)指導(dǎo)構(gòu)圖,若任意兩個(gè)樣本之間的重構(gòu)系數(shù)差異大,則這兩個(gè)樣本之間的相似性小,得到樣本之間的相似性矩陣;最后實(shí)現(xiàn)基于圖的多視圖降維,若任意兩個(gè)樣本在圖上的相似性小,則這兩個(gè)樣本的低維表示之間的差異性也小,保持了圖上的平滑性.

3.2 模型求解

該模型需要求解的變量有3個(gè),即P,A,S.采用迭代交替優(yōu)化策略進(jìn)行求解.

首先,固定P、A,優(yōu)化S,去掉無(wú)關(guān)項(xiàng),則優(yōu)化目標(biāo)為:

(8)

(9)

(10)

其次,固定P、S,優(yōu)化A,去掉無(wú)關(guān)項(xiàng),則優(yōu)化問(wèn)題可寫(xiě)為式(11):

(11)

(12)

其中,Vec(·)表示將矩陣列向量依次一個(gè)向量接一個(gè)向量地組成一個(gè)長(zhǎng)向量.對(duì)矩陣A的每列除了第i個(gè)位置進(jìn)行逐列優(yōu)化,進(jìn)而轉(zhuǎn)為凸二次規(guī)劃問(wèn)題,用二次規(guī)劃算法[24]進(jìn)行求解.

最后,固定A、S,優(yōu)化P,去掉無(wú)關(guān)項(xiàng),則優(yōu)化問(wèn)題可寫(xiě)為:

(13)

對(duì)于任意的P(v)則有:

(14)

以上問(wèn)題可用廣義特征值分解方法求解,即:

X(v)L(X(v))TP(v)=φX(v)H(X(v))TP(v)

(15)

對(duì)(X(v)L(X(v))T)-1X(v)H(X(v))T特征分解,最終P(v)由最小的dv個(gè)特征值對(duì)應(yīng)的特征向量組成.

綜上介紹,可以對(duì)稀疏表示一致性引導(dǎo)的多視圖降維算法進(jìn)行以下描述,如算法1所示.

算法1.稀疏表示一致性引導(dǎo)的多視圖降維算法

輸入:X={X(1),X(2),…,X(V)},α,β,λ,γ

輸出:Y={Y(1),Y(2),…,Y(V)}

1.初始化S,A

2.while 不滿足收斂條件

3. 根據(jù)公式(10)更新稀疏重構(gòu)系數(shù)矩陣S;

4. 根據(jù)公式(12)更新相似性矩陣A;

5. forv= 1 :V

6. 根據(jù)公式(15)更新投影矩陣P(v);

7. end

8.end while

9.forv= 1 :V

10.計(jì)算Y(v)=(P(v))TX(v)

11.end

3.3 算法復(fù)雜度分析

根據(jù)3.2節(jié)算法描述可知,所提算法MDR_SRC主要可以分為3步:第1步為初始化S,A(第1行),第2步為迭代更新變量P,A,S(第2~第8行),第3步計(jì)算最終的低維數(shù)據(jù)樣本矩陣(第9~第11行).

第1步初始化稀疏重構(gòu)系數(shù)矩陣S,對(duì)于S的第i行使用基追蹤算法進(jìn)行求解,基追蹤算法可以轉(zhuǎn)化為線性規(guī)劃問(wèn)題,以?xún)?nèi)點(diǎn)法為例,其計(jì)算復(fù)雜度為O(p(m)),其中p(·)是一個(gè)多項(xiàng)式函數(shù).所以初始化稀疏重構(gòu)系數(shù)矩陣S的復(fù)雜度為O(Np(m)),其中N為樣本數(shù).初始化相似性矩陣A的計(jì)算復(fù)雜度為O(1),因此第1步的計(jì)算復(fù)雜度為O(Np(m)+1)≈O(Np(m)).

第3步計(jì)算低維數(shù)據(jù)矩陣的計(jì)算復(fù)雜度為O(NDd),其中Dd=D1d1+D2d2+…+DVdV.

綜上所述,算法MDR_SRC的計(jì)算復(fù)雜度為O(Np(m))+O(T(Np(m)+D3))+O(NDd),最終化簡(jiǎn)為:O(T(Np(m)+D3))+O(NDd).

4 實(shí) 驗(yàn)

為了驗(yàn)證所提方法的有效性,本節(jié)系統(tǒng)地與單視圖降維方法LPP_BSV、LPP_FC、SPP_BSV、SPP_FC和多視圖降維方法MSE、CMSRE、MvL2E在4個(gè)公開(kāi)數(shù)據(jù)集上進(jìn)行了比較.

4.1 數(shù)據(jù)集

實(shí)驗(yàn)使用了4個(gè)數(shù)據(jù)集,包括BBC、NUS_WIDE、Caltech101-7和Handwritten,其中BBC為文本數(shù)據(jù)集,包含從2004~2005年5個(gè)主題領(lǐng)域的體育新聞文章對(duì)應(yīng)的BBC體育網(wǎng)站上的544個(gè)文檔;NUS_WIDE為圖像數(shù)據(jù)集,實(shí)驗(yàn)對(duì)NUS_WIDE數(shù)據(jù)集隨機(jī)取樣了615個(gè)樣本,包含31個(gè)類(lèi)別,用5種不同的視覺(jué)特征描述;Caltech101-7是廣泛使用的圖像數(shù)據(jù)集,是Caltech101的一個(gè)子集,Caltech101包含101個(gè)類(lèi)別,Caltech101-7從中選擇了7個(gè)廣泛使用的類(lèi),得到1474張圖片,每張圖用6種視覺(jué)特征來(lái)描述;Handwritten為0-9的手寫(xiě)數(shù)字圖片,每個(gè)數(shù)字有200幅圖片,共2000幅圖片,每張圖片用6種視覺(jué)特征來(lái)描述.數(shù)據(jù)詳細(xì)信息見(jiàn)表2.

表2 數(shù)據(jù)集基本信息

4.2 實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)對(duì)比算法包括經(jīng)典單視圖降維算法LPP_BSV、LPP_FC、SPP_BSV、SPP_FC(其中LPP_BSV、LPP_FC分別表示基于單個(gè)視圖的最優(yōu)情況和視圖拼接的情況,SPP同樣)以及多視圖算法MSE、CMSRE、MvL2E.

LPP[11]算法思想是原始高維空間中相似的樣本點(diǎn)降維后也相似.具體做法是首先構(gòu)造近鄰圖,使用KNN方法,這里的參數(shù)k取值為20,然后根據(jù)所構(gòu)圖指導(dǎo)降維.

SPP[12]利用稀疏表示構(gòu)造樣本間的稀疏重構(gòu)權(quán)值,并將其保留在低維子空間中.具體地,任意樣本都可以由所有樣本稀疏重構(gòu)而來(lái),由此可以得到全局稀疏表示,并將這種稀疏關(guān)系在降維后得以保持.

MSE[15]算法思想是找一個(gè)低維嵌入使得每個(gè)視圖的分布都是充分光滑的,并且考慮了不同視圖在獲得最終低維嵌入方面的貢獻(xiàn)是不同的,因此,為不同的視圖賦予不同的權(quán)重,表征該視圖在獲得低維嵌入的重要程度.該方法使用KNN算法構(gòu)造鄰接圖,這里的參數(shù)k與LPP算法設(shè)置相同,取值為20.

CMSRE[18]算法思想是通過(guò)利用多個(gè)視圖稀疏重構(gòu)的相關(guān)性,從多個(gè)視圖學(xué)習(xí)非線性流形的局部稀疏結(jié)構(gòu),并為它們構(gòu)造有意義的低維表示.該方法使用KNN算法構(gòu)造鄰接圖,這里的參數(shù)k與LPP算法設(shè)置相同,取值為20.其中的正則項(xiàng)參數(shù)λ設(shè)置與原文一致,取值范圍為{0,0.5,0.6,0.7,0.8,0.9}.

MvL2E[20]算法是通過(guò)采用低秩表示,充分利用了多視圖特征之間的相關(guān)性,從而捕獲多個(gè)不同視圖之間的共同低維嵌入.該方法使用KNN算法構(gòu)造鄰接圖,這里的參數(shù)k與LPP算法設(shè)置相同,取值為20.其中的正則項(xiàng)參數(shù)γ設(shè)置與原文一致,取值為0.8.

本文所提算法MDR_SRC中的參數(shù)α,λ取值范圍均為{10-3,10-2,10-1,100,101,102,103},參數(shù)β,γ默認(rèn)取值均為1.根據(jù)數(shù)據(jù)集的規(guī)模不同,最終降維維數(shù)設(shè)置不同的數(shù)值.

降維后的數(shù)據(jù)使用k-means聚類(lèi)方法進(jìn)行聚類(lèi),聚類(lèi)個(gè)數(shù)為真實(shí)類(lèi)別的個(gè)數(shù).然后使用聚類(lèi)精度(Accuracy,ACC)、歸一化互信息(Normalized Mutual Information,NMI)和調(diào)整蘭德指數(shù)(Adjusted Rand Index,ARI)作為評(píng)價(jià)指標(biāo).最后分析了所提算法在4個(gè)數(shù)據(jù)集上的參數(shù)敏感性.

4.3 實(shí)驗(yàn)結(jié)果分析

表3~表5展示了所提算法MDR_SRC與7個(gè)對(duì)比算法在4個(gè)數(shù)據(jù)集BBC、NUS_WIDE、Caltech101-7和Handwritten上的降維結(jié)果使用k-means聚類(lèi)的ACC、NMI和ARI值.

表3 不同算法在4個(gè)數(shù)據(jù)集上的ACC值

表4 不同算法在4個(gè)數(shù)據(jù)集上的NMI值

表5 不同算法在4個(gè)數(shù)據(jù)集上的ARI值

通過(guò)分析表3~表5可得知,所提算法在大多數(shù)情況下能得到最優(yōu)結(jié)果,可以得到以下具體結(jié)論:1)單視圖最優(yōu)的算法LPP_BSV、SPP_BSV在4個(gè)數(shù)據(jù)集上的ACC值、NMI值、ARI值分別優(yōu)于視圖拼接的算法LPP_FC、SPP_FC,這是由于直接拼接視圖可能會(huì)失去多視圖數(shù)據(jù)原本的物理意義,拼接也會(huì)導(dǎo)致數(shù)據(jù)維數(shù)變高,降維性能下降;2)多視圖降維算法MSE、CMSRE、MDR_SRC在4個(gè)數(shù)據(jù)集上的ACC值、NMI值、ARI值均優(yōu)于單視圖最優(yōu)算法LPP_BSV、SPP_BSV,這是由于多視圖降維算法考慮了視圖之間的關(guān)系,將多視圖數(shù)據(jù)之間的信息進(jìn)行了很好地融合;3)所提算法MDR_SRC在4個(gè)數(shù)據(jù)集上的ACC值、NMI值、ARI值相比其它多視圖降維算法MSE、CMSRE、MvL2E在大多數(shù)情況取得最優(yōu)結(jié)果,這是由于MSE算法需要預(yù)定義圖,降維的性能依賴(lài)圖的質(zhì)量,CMSRE算法將稀疏表示和降維過(guò)程獨(dú)立進(jìn)行,不能保證稀疏表示挖掘到的信息對(duì)于降維過(guò)程是最優(yōu)的,MvL2E算法將低秩表示和降維過(guò)程獨(dú)立進(jìn)行,低秩表示挖掘到的信息沒(méi)有充分利用到降維過(guò)程中.而所提算法MDR_SRC通過(guò)稀疏表示保持了多視圖之間的一致性,根據(jù)樣本對(duì)稀疏表示系數(shù)的差異指導(dǎo)構(gòu)圖,再根據(jù)圖指導(dǎo)降維,將基于稀疏表示的構(gòu)圖與基于圖的降維過(guò)程統(tǒng)一到一個(gè)優(yōu)化問(wèn)題中,實(shí)現(xiàn)了二者的相互指導(dǎo).

4.4 參數(shù)敏感性分析

對(duì)所提算法MDR_SRC在4個(gè)數(shù)據(jù)集上不同參數(shù)下的ACC、NMI、ARI值進(jìn)行了可視化展示,分析了參數(shù)敏感性,所得實(shí)驗(yàn)結(jié)果如圖1~圖3所示,可以看出所提算法可以在較小的范圍內(nèi)搜索到最優(yōu)值.分析圖1、圖2可以得知,所提算法MDR_SRC的聚類(lèi)ACC、NMI指標(biāo)在Caltech101-7數(shù)據(jù)集、Handwritten數(shù)據(jù)集上對(duì)參數(shù)α,λ不太敏感,在NUS_WIDE數(shù)據(jù)集、BBC數(shù)據(jù)集上對(duì)參數(shù)α,λ比較敏感,并且往往是在同一個(gè)λ且不同的α情況下該算法的聚類(lèi)ACC值、NMI值比較敏感.分析圖3可以得知,所提算法MDR_SRC的聚類(lèi)ARI指標(biāo)在Handwritten數(shù)據(jù)集、NUS_WIDE數(shù)據(jù)集上對(duì)參數(shù)α,λ不太敏感,在BBC數(shù)據(jù)集、Caltech101-7數(shù)據(jù)集上對(duì)參數(shù)α,λ比較敏感,同樣也是在同一個(gè)λ且不同的α情況下該算法的聚類(lèi)ARI值比較敏感.這是由于BBC數(shù)據(jù)集是分類(lèi)型文本數(shù)據(jù)集,因此所提算法對(duì)參數(shù)比較敏感.

圖1 所提方法在不同參數(shù)下的ACC值

圖2 所提方法在不同參數(shù)下的NMI值

圖3 所提方法在不同參數(shù)下的ARI值

5 結(jié)束語(yǔ)

本文提出了一種稀疏表示一致性引導(dǎo)的多視圖降維算法.該算法利用樣本對(duì)稀疏表示系數(shù)的差異指導(dǎo)構(gòu)圖,根據(jù)構(gòu)建的圖指導(dǎo)降維,降維后樣本之間能夠保持圖上的平滑性;將基于稀疏表示的構(gòu)圖與基于圖的降維整合為一個(gè)優(yōu)化問(wèn)題,實(shí)現(xiàn)了構(gòu)圖與降維的相互指導(dǎo),緩解了預(yù)定義圖影響降維算法性能的問(wèn)題.實(shí)驗(yàn)分析驗(yàn)證了所提算法的性能優(yōu)于現(xiàn)有的代表性多視圖降維方法.然而,在許多實(shí)際應(yīng)用中可能存在視圖缺失的數(shù)據(jù),因此如何把稀疏表示一致性的思想擴(kuò)展到不完備多視圖降維背景下將是一個(gè)值得研究的問(wèn)題.

猜你喜歡
降維集上視圖
混動(dòng)成為降維打擊的實(shí)力 東風(fēng)風(fēng)神皓極
Cookie-Cutter集上的Gibbs測(cè)度
降維打擊
鏈完備偏序集上廣義向量均衡問(wèn)題解映射的保序性
復(fù)扇形指標(biāo)集上的分布混沌
5.3 視圖與投影
視圖
Y—20重型運(yùn)輸機(jī)多視圖
SA2型76毫米車(chē)載高炮多視圖
拋物化Navier-Stokes方程的降維仿真模型