国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種新的標(biāo)簽散布相關(guān)分析方法

2019-09-24 06:03周渝皓張玉趙東生
電腦知識(shí)與技術(shù) 2019年21期
關(guān)鍵詞:相關(guān)分析圖像識(shí)別

周渝皓 張玉 趙東生

摘要:典型相關(guān)分析是多視圖特征學(xué)習(xí)領(lǐng)域的研究熱點(diǎn),然而監(jiān)督信息的缺失使其難以學(xué)習(xí)強(qiáng)鑒別力的相關(guān)特征,為此本文提出了一種新的鑒別相關(guān)特征學(xué)習(xí)方法,即標(biāo)簽散布相關(guān)分析(Label Scatter Correlation Analysis,LSCA)。該方法借助類標(biāo)簽信息,最大化了視圖間類內(nèi)相關(guān)性,并且最小化了視圖間類間相關(guān)性和視圖內(nèi)類內(nèi)散布,進(jìn)而學(xué)習(xí)的相關(guān)特征在最大化相關(guān)性同時(shí),盡可能的保留了類標(biāo)簽的鑒別力和散布結(jié)構(gòu)。良好的實(shí)驗(yàn)結(jié)果已經(jīng)顯示該方法在圖像識(shí)別中的有效性。

關(guān)鍵詞:特征學(xué)習(xí);相關(guān)分析;多視圖數(shù)據(jù)處理;圖像識(shí)別

中圖分類號(hào):TP311? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2019)21-0200-04

開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

Abstract: Canonical correlation analysis (CCA) is a hot research in multi-view feature learning. However, due to the lack of supervised information, CCA is difficult to obtain correlation features with well discrimination power. To solve this issue, we propose a novel discriminant correlation feature learning method, i.e. label scatter correlation analysis (LSCA). By means of class label information, the method maximizes intra-class correlations between different views, and minimizes between-view inter-class correlations and within-view intra-class scatters. Thus correlation features learned by our method not only consider the maximum of between-view correlations but also further preserve the discrimination power of class labels and the scatter structures. Encouraging experimental results has showed the effectiveness of the method.

Keywords: Feature Learning; Correlation analysis; multi-view data processing; image recognition

1 引言

多視圖特征學(xué)習(xí)是模式識(shí)別和機(jī)器視覺(jué)的熱門(mén)研究課題,其中最具代表性的是典型相關(guān)分析(Canonical Correlation Analysis,CCA)[1]。CCA是用來(lái)解決兩個(gè)隨機(jī)變量之間相關(guān)性的統(tǒng)計(jì)學(xué)方法,目前已經(jīng)廣泛應(yīng)用于過(guò)程控制[2]、多特征融合[3]、圖像檢索[4]、文本分析與檢索[5]、信號(hào)處理[6]等多個(gè)領(lǐng)域。

CCA通過(guò)最大化相關(guān)準(zhǔn)則能夠求解出多視圖數(shù)據(jù)的相關(guān)投影方向,進(jìn)而獲得低維一致子空間中的相關(guān)特征。Sun等人[7]首次將CCA用于模式識(shí)別,并在多視圖圖像識(shí)別任務(wù)中獲得了良好的實(shí)驗(yàn)結(jié)果。CCA本身是一種線性特征學(xué)習(xí)方法,因此難以很好地揭示原始數(shù)據(jù)間的非線性關(guān)系。為了掌握原始高維數(shù)據(jù)的非線性信息,相關(guān)特征學(xué)習(xí)經(jīng)常借助圖理論的優(yōu)勢(shì)來(lái)探索數(shù)據(jù)的局部幾何結(jié)構(gòu)。局部保持CCA(LPCCA)[8]將原始高維數(shù)據(jù)的局部鄰域關(guān)系嵌入到相關(guān)分析理論,進(jìn)而獲得盡量保留局部幾何信息的非線性相關(guān)特征。為了進(jìn)一步增強(qiáng)非線性相關(guān)特征的鑒別力,Wang等人[9]提出了一種替代LPCCA(ALPCCA)的方法,并在人臉識(shí)別和多特征分類中驗(yàn)證了該方法的有效性。借助正則化技術(shù),異構(gòu)結(jié)構(gòu)融合(HSF)方法[10]自然地將CCA和局部保持投影(LPP)[11]結(jié)合在一起,并試圖從原始數(shù)據(jù)中捕獲和保存非線性的局部幾何結(jié)構(gòu)。這些方法在數(shù)據(jù)可視化、姿態(tài)估計(jì)、形狀分析、紅外目標(biāo)分析等方面都取得了成功。然而,缺乏監(jiān)督信息限制了它在識(shí)別分類任務(wù)中的鑒別力。

監(jiān)督信息也是一種非常重要的鑒別信息,利用它可以對(duì)信息進(jìn)行更好的分類和分析。鑒別CCA(DCCA)[12]是一種典型的監(jiān)督特征學(xué)習(xí)方法,通過(guò)約束視圖間鑒別相關(guān)性來(lái)學(xué)習(xí)鑒別相關(guān)特征?;诒O(jiān)督信息的相關(guān)特征學(xué)習(xí)方法一般僅考慮了視圖間的相關(guān)監(jiān)督信息,而忽略了視圖內(nèi)的鑒別散布結(jié)構(gòu)。為此,本文提出了一種新的鑒別相關(guān)特征學(xué)習(xí)方法,即標(biāo)簽散布相關(guān)分析(Label Scatter Correlation Analysis,LSCA)。該方法在類標(biāo)簽信息的指導(dǎo)下,最大化了視圖間類內(nèi)相關(guān)性,同時(shí)最小化了視圖間類間相關(guān)性和視圖內(nèi)類內(nèi)散布結(jié)構(gòu),從而獲得了類分離性更高、鑒別性更強(qiáng)的相關(guān)特征。為了評(píng)估LSCA方法,在兩個(gè)常用的圖像數(shù)據(jù)集上設(shè)計(jì)一些針對(duì)性實(shí)驗(yàn),大量的實(shí)驗(yàn)結(jié)果能夠給出一個(gè)合理的觀察:提出的方法是一種有效的特征學(xué)習(xí)方法。

其余部分組織如下,第二節(jié)簡(jiǎn)要回顧了CCA,第三節(jié)詳細(xì)描述了LSCA方法,在第四節(jié)中給出實(shí)驗(yàn)結(jié)果和相應(yīng)的分析,第五節(jié)討論了LSCA的本質(zhì)以及對(duì)本文的總結(jié)。

2 典型相關(guān)分析

假設(shè)[X=x1,x2,...,xN∈Rdx × N]和[Y=y1,y2,...,yN∈Rdy × N]是同一目標(biāo)的兩個(gè)視圖的數(shù)據(jù)集, 其中[dx],[dy]是樣本[x]和[y]的維數(shù),[N]為樣本數(shù),同時(shí)[xi,yii=1,2,...,N]是對(duì)應(yīng)同一目標(biāo)的樣本對(duì)。CCA旨在優(yōu)化相關(guān)準(zhǔn)則來(lái)求解相關(guān)投影方向[α∈Rdx × 1]和[β∈Rdy × 1],進(jìn)而使得相關(guān)特征[αTX]和[βTY]擁有最大的相關(guān)性,其中CCA的相關(guān)準(zhǔn)則能夠表示為

其中[Sxy=1Ni=1Nxi-xyi-yT]為數(shù)據(jù)集[X]和[Y]的協(xié)方差矩陣,[Sxx=1Ni=1Nxi-xxi-xT](or[Syy=1Ni=1Nyi-yyi-yT])是數(shù)據(jù)集[X](或[Y])的方差。正如文獻(xiàn)[13]指出,[Sxy]揭示了視圖間的相關(guān)性,而[Sxx]和[Syy]反映了視圖內(nèi)數(shù)據(jù)的總體散布信息,然而該相關(guān)性和總散布結(jié)構(gòu)沒(méi)有監(jiān)督信息的指導(dǎo),難以借助類標(biāo)簽的信息有效增強(qiáng)相關(guān)的鑒別力。

3 標(biāo)簽散布相關(guān)分析方法

由于CCA僅僅只利用了成對(duì)的樣本信息,無(wú)法使用監(jiān)督信息來(lái)增強(qiáng)鑒別力,為此本文提出了LSCA方法,該方法能借助類標(biāo)簽信息,構(gòu)建有效的鑒別相關(guān)分析理論,進(jìn)而獲得強(qiáng)鑒別力的相關(guān)特征。

首先,利用類標(biāo)簽信息指導(dǎo)了視圖間類內(nèi)和類間相關(guān)性的構(gòu)建。具體而言,視圖間類內(nèi)相關(guān)性[αTRβ]能夠構(gòu)建為

同樣視圖間類間相關(guān)性[αTHβ]可以表述為:

為了增強(qiáng)視圖內(nèi)的類聚集性,進(jìn)一步構(gòu)建了基于類標(biāo)簽的視圖內(nèi)類內(nèi)散布。以數(shù)據(jù)集[X]為例,視圖內(nèi)類內(nèi)散布可以構(gòu)建為

則數(shù)據(jù)集[Y]的視圖內(nèi)類內(nèi)散布為:

LSCA方法在最大化視圖間類內(nèi)相關(guān)性的同時(shí),最小化了視圖間類間相關(guān)性和視圖內(nèi)類內(nèi)散布,因此LSCA方法的相關(guān)準(zhǔn)則可以構(gòu)建為

其中[η]為平衡參數(shù),用于平衡[cw]和[cb]的相對(duì)重要性。為了便于模型的分析和優(yōu)化求解,進(jìn)一步對(duì)公式(6)進(jìn)行推導(dǎo)。視圖間類內(nèi)相關(guān)性能夠進(jìn)一步等價(jià)推導(dǎo)為

其中帶有類標(biāo)簽的數(shù)據(jù)集X能夠重新表述為[X=x11,…,x1n1,…,xc1,…,xcnc],對(duì)應(yīng)的類指示向量為,[Ini×ni∈Rni×ni]的矩陣元素全為1,[Λ=In1×n1...Ini×ni...Inc×nc∈Rn×n]是一個(gè)對(duì)角的對(duì)稱半正定矩陣,且秩為[c]。

類似公式(7),視圖間類間相關(guān)性同樣能夠進(jìn)一步推導(dǎo)為:

視圖內(nèi)的類內(nèi)相關(guān)關(guān)系定義如下:

通過(guò)求解上述的廣義特征值問(wèn)題,可以獲得前[d]個(gè)最大特征值對(duì)應(yīng)的特征向量[{α1,α2,...,αd}]和[{β1,β2,...,βd}],進(jìn)而可以構(gòu)建數(shù)據(jù)集[X]和[Y]對(duì)應(yīng)的相關(guān)投影矩陣,即[A=α1,α2,...,αdT∈Rdx×d]和[B=β1,β2,...,βdT∈Rdy×d],并獲得數(shù)據(jù)集[X]和[Y]對(duì)應(yīng)相關(guān)特征[ATX]和[BTY]。

4 實(shí)驗(yàn)的結(jié)果和分析

為了驗(yàn)證提出方法的有效性,在AR圖像數(shù)據(jù)集和XM2VTS圖像數(shù)據(jù)集設(shè)計(jì)了針對(duì)性實(shí)驗(yàn)。AR圖像數(shù)據(jù)集包含126人的正面圖像,這些圖像具有不同表情、照明條件和遮擋等。在該實(shí)驗(yàn)部分,我們選擇AR圖像的一個(gè)常用子集,該子集由120人的每人14幅無(wú)遮擋圖像組成。XM2VTS數(shù)據(jù)庫(kù)中包含295人的2360幅面部圖像,圖像中人臉的角度、表情和眼鏡等各不相同。從本質(zhì)上而言,這兩個(gè)數(shù)據(jù)集屬于單模態(tài)數(shù)據(jù)集。為此借助模態(tài)策略[13]獲取了每幅圖像兩個(gè)視圖數(shù)據(jù)。具體而言,利用Coiflets和Daubechies小波變換方法來(lái)獲取每幅圖像的兩個(gè)視圖數(shù)據(jù),隨后使用主成分分析將視圖數(shù)據(jù)的維數(shù)約減到100維,以減少小樣本問(wèn)題。在實(shí)驗(yàn)部分,LSCA方法和CCA、DCCA進(jìn)行了對(duì)比分析。對(duì)于所有方法,在這兩個(gè)數(shù)據(jù)集上都是每類隨機(jī)選擇q (q=3, 4, 5, 6)幅圖像用于訓(xùn)練,剩余圖像作為測(cè)試圖像,并且獨(dú)立運(yùn)行10次樣本隨機(jī)試驗(yàn),在表1和表2中展示了平均識(shí)別率。此外,所有方法都是使用了基于歐式距離的最近鄰分離器[13]來(lái)獲得而最終的實(shí)驗(yàn)結(jié)果,并且展示的是所有可能維數(shù)下的最優(yōu)識(shí)別率。

CCA僅僅利用了成對(duì)的樣本信息,且無(wú)法有效地利用監(jiān)督信息,進(jìn)而難以獲得強(qiáng)鑒別力的相關(guān)特征,然而LSCA和DCCA都屬于監(jiān)督相關(guān)學(xué)習(xí)方法,借助監(jiān)督信息進(jìn)一步增強(qiáng)了相關(guān)特征的類分離性,并且CCA在表1和表2中也顯示出了最低識(shí)別率。當(dāng)實(shí)驗(yàn)采用少量訓(xùn)練圖像進(jìn)行實(shí)驗(yàn)時(shí),使用LSCA獲得的平均識(shí)別率與DCCA和CCA獲得平均識(shí)別率相差不大。隨著訓(xùn)練圖像的增加,LSCA,DCCA,CCA的識(shí)別率都呈現(xiàn)增加的趨勢(shì)。與DCCA相比,LSCA不僅考慮了視圖間的監(jiān)督相關(guān)信息,而且進(jìn)一步約束了視圖內(nèi)類內(nèi)散布結(jié)構(gòu),這是LSCA表1和表2上擁有更好識(shí)別性能的重要原因。

5 結(jié)束語(yǔ)

多視圖特征學(xué)習(xí)的核心任務(wù)是為多視圖數(shù)據(jù)學(xué)習(xí)線性或非線性的投影方向,將原始高維數(shù)據(jù)投影到低維空間,并且低維特征能夠盡量保留原來(lái)數(shù)據(jù)的有效信息,進(jìn)而更利于數(shù)據(jù)的進(jìn)一步處理。CCA是基于相關(guān)分析理論的多視圖特征學(xué)習(xí)方法,該方法本身是一種無(wú)監(jiān)督的方法,難以有效利用類標(biāo)簽的優(yōu)勢(shì)來(lái)增強(qiáng)相關(guān)特征的鑒別力,為此,本文提出了一種新的LSCA方法。LSCA在類標(biāo)簽的指導(dǎo)下構(gòu)建了視圖間類內(nèi)相關(guān)性、視圖間類間相關(guān)性以及視圖內(nèi)類內(nèi)散布,進(jìn)而形成了LSCA的相關(guān)優(yōu)化模型,并在理論上進(jìn)一步推導(dǎo)出了該模型的解析解,獲得了強(qiáng)鑒別力的相關(guān)特征。為了驗(yàn)證提出方法的有效性,在兩個(gè)常用的圖像數(shù)據(jù)集上設(shè)計(jì)了針對(duì)性實(shí)驗(yàn),良好的實(shí)驗(yàn)結(jié)果已經(jīng)揭示了LSCA的有效性。

參考文獻(xiàn):

[1] Hardoon D R, Szedmak S, Shawe-Taylor J. Canonical correlation analysis: An overview with application to learning methods[J]. Neural computation, 2004, 16(12): 2639-2664.

[2] Liu Y, Liu B, Zhao X, et al. A mixture of variational canonical correlation analysis for nonlinear and quality-relevant process monitoring[J]. IEEE Transactions on Industrial Electronics, 2018, 65(8): 6478-6486.

[3] Chen J, Wang G, Giannakis G B. Graph multiview canonical correlation analysis[J]. IEEE Transactions on Signal Processing, 2019.

[4] X.Y. Wang, L.L. Liang, W.Y. Li, et al., A new SVM-based relevance feedback image retrieval using probabilistic feature and weighted kernel function, J. Vis.Commun[J]. Image Represent,2016,38:256–275.

[5] X.Z. Gao, Q.S. Sun, H.T. Xu, Multiple instance learning via semi-supervised Laplacian TSVM, Neural Process. Lett. 46 (2017) 219–232.

[6] M. Borga, Learning multidimensional signal processing,Link?ping studies in science and technology, Dissertations, vol.531, Department of Electrical Engineering, Link?ping University, Link?ping, Sweden, 1998.

[7] Q.-S. Sun, S.-G. Zeng, Y. Liu, P.-A. Heng, and D.-S. Xia, “A new method of feature fusion and its application in image recognition,”P(pán)attern Recognit., vol. 36, no. 12, pp. 2437–2448, Dec. 2005.

[8] T. Sun, S. Chen, Locality preserving CCA with applications to data visualization and pose estimation, Image Vis. Comput. 25 (5) (2007) 531–543.

[9] F. Wang, D. Zhang, A new locality-preserving canonical correlation analysis algorithm for multi-view dimensionality reduction, Neural Process. Lett. 37 (2)(2013) 135–146.

[10] G. Lin, G. Fan, X. Kang, et al., Heterogeneous feature structure fusion for classifification, Pattern Recogn. 53 (1) (2016) 1–11.

[11] X. He, S. Yan, Y. Hu, et al., Face recognition using Laplacianfaces, IEEE Trans.Pattern Anal. Mach. Intell. 27 (2005) 328–340.

[12] T. Sun, S. Chen, J. Yang, et al., A supervised combined feature extraction method for recognition, in: Proceedings of the IEEE International Conference on Data Mining, 2008, pp. 1043–1048.

[13] Su S, Ge H, Tong Y. Multi-graph embedding discriminative correlation feature learning for image recognition[J]. Signal Processing: Image Communication, 2018, 60: 173-182.

【通聯(lián)編輯:梁書(shū)】

猜你喜歡
相關(guān)分析圖像識(shí)別
基于Resnet-50的貓狗圖像識(shí)別
高速公路圖像識(shí)別技術(shù)應(yīng)用探討
圖像識(shí)別在物聯(lián)網(wǎng)上的應(yīng)用
圖像識(shí)別在水質(zhì)檢測(cè)中的應(yīng)用
淺談模式識(shí)別在圖像識(shí)別中的應(yīng)用
海南紅毛丹栽培品系果實(shí)礦質(zhì)元素和品質(zhì)指標(biāo)的測(cè)定與相關(guān)性分析
城鄉(xiāng)居民醫(yī)療費(fèi)用的相關(guān)性與回歸分析
基于多組合內(nèi)容的圖像識(shí)別機(jī)制