韋仙,康睿丹
太原工業(yè)學(xué)院理學(xué)系,山西 太原 030008
基于降維壓縮法的圖像重構(gòu)
韋仙,康睿丹
太原工業(yè)學(xué)院理學(xué)系,山西 太原 030008
針對人臉圖像易受環(huán)境因素的影響造成缺失或者受噪聲污染,提出了從有限的信息中重構(gòu)完整的圖像矩陣的方法.首先利用奇異值壓縮降維的方法提取人臉圖像的特征值,并運(yùn)用基于凸優(yōu)化的矩陣填充技術(shù)對缺失的圖像矩陣進(jìn)行有效重構(gòu),然后采用固定點(diǎn)迭代算法,通過Matlab語言編程,進(jìn)行分裂法迭代,在選取合適參數(shù)的情況下使運(yùn)行程序快速收斂至目標(biāo)矩陣,減小了運(yùn)行時(shí)間.分析峰值信噪比隨奇異值個(gè)數(shù)的變化關(guān)系,對人臉圖像的保真度進(jìn)行評(píng)估,通過對不同采樣率下人臉圖像重構(gòu)效果的對比,運(yùn)行時(shí)間的分析,得出降維壓縮技術(shù)能夠有效實(shí)現(xiàn)圖像矩陣填充的結(jié)論.
矩陣填充;人臉識(shí)別;低秩;奇異值分解
近年來,矩陣填充(Matrix completion,MC)理論逐漸受到越來越多學(xué)者的關(guān)注,它是一種高效的信號(hào)數(shù)據(jù)處理技術(shù).在實(shí)際研究中,圖像、信號(hào)、數(shù)據(jù)等都可以利用矩陣的形式表示,但由于受到實(shí)驗(yàn)條件限制,獲得的矩陣元素往往是缺失、受噪聲污染的.如何通過有效算法計(jì)算得到干凈、完整的矩陣?這便是矩陣填充研究的問題,其核心思想是通過采集部分元素重構(gòu)出目標(biāo)矩陣,在重構(gòu)精度上體現(xiàn)出優(yōu)越性.
基于矩陣填充技術(shù)重構(gòu)圖像矩陣,應(yīng)用于人臉識(shí)別,在保證較高保真度基礎(chǔ)上對人臉圖像矩陣進(jìn)行壓縮降維處理,利用矩陣填充算法有效實(shí)現(xiàn)重構(gòu).對研究人臉識(shí)別與追蹤問題具有積極意義.
1.1 圖像降維處理
將數(shù)值元素寫成低秩矩陣的形式稱之為矩陣的降維過程.矩陣降維技術(shù)作為獲取相關(guān)性和去噪的基本工具,廣泛應(yīng)用于圖像壓縮、計(jì)算機(jī)視圖、機(jī)器學(xué)習(xí)等領(lǐng)域.降維的目的在于從有限缺失的信息中獲得更簡潔的數(shù)據(jù)表示,一種經(jīng)典的降維技術(shù)是基于奇異值分解實(shí)現(xiàn)低秩逼近.與其他低秩逼近方法比較,奇異值分解的重建誤差較?。?].
由于圖像矩陣的奇異值是人臉識(shí)別的代數(shù)特征量,能夠反映人臉圖像的內(nèi)在屬性和本質(zhì)特征[2-3],利用奇異值分解的方法能夠?qū)Λ@得的人臉圖像矩陣進(jìn)行合理的降維處理,在不影響估計(jì)性能的前提下,有效地降低計(jì)算量,節(jié)約時(shí)間和成本[4].
將人臉圖像寫成矩陣的形式,設(shè)M∈Rm×n是原始圖像,X∈Ω是重建的近似圖像,整數(shù)r滿足1≤r<rank(M),Ω為矩陣集合,|?|為矩陣范數(shù),擬合秩為r的矩陣X,使其有
由此能夠?qū)υ紙D像矩陣進(jìn)行降維處理,并利用矩陣填充技術(shù)在已知部分?jǐn)?shù)據(jù)的前提下實(shí)現(xiàn)人臉圖像的重構(gòu).人臉圖像重構(gòu)流程圖如圖1所示.
圖1 人臉圖像重構(gòu)流程圖Fig.1 Flow diagram of face image reconstruction
1.2 矩陣填充原理
由于重構(gòu)的近似圖像矩陣X是秩為r的低秩矩陣,其獨(dú)立元的個(gè)數(shù)df=(2mn-r)r遠(yuǎn)小于維數(shù)m×n.這說明只要采樣數(shù)目大于df,是有可能從采集的有限元素中重構(gòu)矩陣X,該問題能夠通過解決如下凸優(yōu)化問題實(shí)現(xiàn):
其中X為重構(gòu)矩陣,rank(X)表示矩陣X的秩.這是一種根據(jù)觀測數(shù)據(jù)擬合矩陣的普遍方法,如果存在唯一的低秩擬合數(shù)值,那么能夠?qū)崿F(xiàn)重構(gòu),但這是個(gè)NP-hard問題,在理論和數(shù)值實(shí)驗(yàn)中需要大量時(shí)間,不具有應(yīng)用價(jià)值.
如果秩為r的矩陣能夠進(jìn)行奇異值分解,那么在限制集合內(nèi)能夠用奇異值之和最小化來替代(1)式中秩最小化問題,有
由于核范數(shù)是凸函數(shù),能夠通過半正定程序有效優(yōu)化.則式(1)的NP-hard問題成功轉(zhuǎn)化為凸優(yōu)化問題,只需要選擇合適的算法程序就能夠?qū)崿F(xiàn)矩陣的重構(gòu).
如果矩陣的某一行或者列的所有元素都沒有被采樣得到,那么無論采用何種理論和方法都不可能填充出這一行或者列的數(shù)值.因此,當(dāng)采樣方式滿足一定條件時(shí),才有可能實(shí)現(xiàn)矩陣重構(gòu).矩陣填充的采樣方式一般是隨機(jī)等分采樣.
如果矩陣的行和列幾乎都由零值組成,那么無論使用何種采樣方式都不可能實(shí)現(xiàn)重構(gòu),原因是對于大部分的采樣集合,得到的都是零值以至于沒有辦法計(jì)算出非零數(shù)據(jù).比如矩陣:
對于這樣的矩陣只有右上角一個(gè)數(shù)值,其余均為0,雖然是低秩矩陣卻無法利用矩陣填充原理實(shí)現(xiàn)重構(gòu)[6].這就要求想要重構(gòu)的目標(biāo)矩陣M的奇異向量高度集中,能夠在非零空間中進(jìn)行采樣操作.即,奇異向量在標(biāo)準(zhǔn)基內(nèi)具有不相關(guān)性,為了使觀測值數(shù)目最小化,有如下定義:
假設(shè)U為Rn的子空間,PU為在U上的正交投影,則U的相關(guān)性表示為
其中i為子空間U的維度,ei為標(biāo)準(zhǔn)基.對于任意子空間,μ(U)的最小值為1,如果U由元素值為倍數(shù)的向量測量得到,那么μ(U)的值為對于低相關(guān)性的矩陣,對應(yīng)于子空間中的行列值均具有低相關(guān)性,則不能在零空間進(jìn)行采樣.對矩陣X進(jìn)行奇異值分解,有
其中U和V分別代表行列矢量空間.
1.3 基本算法
核范數(shù)最小化過程是一個(gè)凸優(yōu)化線性約束問題.雖然能夠轉(zhuǎn)換為一個(gè)半正定程序解決,但是這種方法在計(jì)算大矩陣上是耗時(shí)耗資的.固定點(diǎn)迭代算法[7](FPC),在求解核范數(shù)最小化問題上體現(xiàn)了用時(shí)短,重構(gòu)誤差小的優(yōu)越性.
核范數(shù)被稱為Schatten-1范數(shù)或Ky-Fan范數(shù),式(2)的核范數(shù)問題亦可寫成
若b受噪聲污染,則約束條件改寫成其拉格朗日形式為
其中θ和τ均為中間參數(shù).
利用FPC算法解決式(5)的問題如下:
其中Γ(?)表示矩陣的收斂操作.該算法的核心是算子分裂技術(shù),設(shè)X*為式(5)的最優(yōu)解,當(dāng)且僅當(dāng)
由此得出X*的優(yōu)化解滿足.
利用固定點(diǎn)迭代法解決式(5)的具體步驟:
(1)初始化:給定X0,τˉ>0.選取τ1>τ2>…>τL=τˉ>0.設(shè)置X=X0.
(2)以τ=τ1,τ2,…,τL,開始,ε>0數(shù)列收斂時(shí),計(jì)算Y=X-εA*(A(X)-b),且對Y作SVD分解,Y=U Diag(σ)VT,計(jì)算X=U Diag(Γετ(σ))VT.
(3)逐次迭代至數(shù)列不收斂時(shí)結(jié)束.
采用2.2 GHz CPU,4 GB yte內(nèi)存的計(jì)算機(jī)進(jìn)行模擬仿真實(shí)驗(yàn),使用MATLAB編碼運(yùn)行算法程序.
將降維技術(shù)應(yīng)用于人臉圖像矩陣中,用ORL國際標(biāo)準(zhǔn)人臉數(shù)據(jù)庫中S40的圖像作為研究對象,其圖像維數(shù)為112×552,對圖像矩陣進(jìn)行奇異值分解,分析奇異值大小與維數(shù)的關(guān)系(見圖2)可知,并非所有的奇異值均對圖像信息有較大貢獻(xiàn),只需要提取出具有決定因素的奇異值就能夠充分反映圖像特征,從而實(shí)現(xiàn)圖像的壓縮降秩,在保證圖像質(zhì)量的前提下,盡可能地降低矩陣的秩,而評(píng)估圖像質(zhì)量的常用函數(shù)有:均方根誤差SRMSE,信噪比QSNR,峰值信噪比QPSNR等.下面給出峰值信噪比QPSNR的計(jì)算公式,分析重建圖像質(zhì)量
圖2 奇異值與矩陣維數(shù)的關(guān)系曲線Fig.2 Relation curve between singular value and matrix dimension
從圖2可知,隨著維數(shù)的增大,奇異值逐漸減小,較大的奇異值數(shù)量級(jí)在104,較小的奇異值為50左右,由于奇異值越小,對圖像保真度的影響越低,那么能夠?qū)?shù)值較小的,對圖像特征貢獻(xiàn)少的奇異值合理舍去,并結(jié)合奇異值個(gè)數(shù)與峰值信噪比的關(guān)系(見圖3),確定降維后的人臉圖像矩陣.圖3中秩為35對應(yīng)的QPSNR值等于35時(shí),重建的人臉圖像輪廓清晰,與原圖基本無差別,保證了圖像的質(zhì)量.這說明能夠?qū)⒕S數(shù)為112×552的人臉圖像壓縮成秩為35的圖像輸出.
圖3 奇異值個(gè)數(shù)與1/QPSNR關(guān)系曲線Fig.3 Relation curve between singular values and 1/QPSNR
圖4 降秩處理后不同采樣率下圖像矩陣填充效果Fig.4 Reduced-rank matrix completion with different sample rates
人臉識(shí)別廣泛應(yīng)用于公安檢查、監(jiān)控等方面,但由于實(shí)際條件的限制,獲得的圖像矩陣往往是缺失的,為了獲得較高清晰度的人臉圖像,除了利用奇異值分解提取特征信息外,還要求將目標(biāo)矩陣從獲得的部分?jǐn)?shù)據(jù)中重構(gòu)出來.
利用矩陣填充算法,分析不同采樣率下對人臉圖像的重構(gòu)效果(見圖4).其中第一行是原始圖像,第二行是秩為35時(shí)的重建圖像,第三、四、五行分別是采樣率為10%、30%、50%的效果圖.將未經(jīng)降秩處理直接進(jìn)行采樣的圖像進(jìn)行重構(gòu),效果如圖5所示,其中第一、二、三行分別對應(yīng)采樣率為10%、30%、50%的效果圖.對于圖4,秩為35時(shí)重建圖像清晰可辨,說明壓縮降維處理合理有效.當(dāng)采樣率為10%時(shí),由于采樣數(shù)目m=6 182小于獨(dú)立元個(gè)數(shù)df=22 015,不符合矩陣填充重構(gòu)條件,圖像模糊失真;采樣率為30%時(shí),能夠識(shí)別出人臉輪廓;采樣率為50%時(shí),圖像整體清晰,雖有模糊,但人臉的識(shí)別度較高,與圖5進(jìn)行對比,容易看出,通過降維處理后,重構(gòu)的人臉圖像比較清晰.
圖5 未經(jīng)降秩處理不同采樣率下圖像重夠效果Fig.5 Images of reconstruction results of different sample rateswithout reducing rank
圖6給出運(yùn)行時(shí)間和采樣率的關(guān)系圖,隨著采樣率逐漸增大,程序運(yùn)行時(shí)間變長,當(dāng)采樣率為70%時(shí),運(yùn)行時(shí)間為25 s,均不超過1min,這說明通過降維處理的矩陣填充技術(shù)能夠有效地實(shí)現(xiàn)人臉圖像的重構(gòu).
圖6 運(yùn)行時(shí)間與采樣率關(guān)系圖Fig.6 Relation curve between run-time and sample rate s
利用奇異值分解法提取人臉圖像特征,并進(jìn)行降維分析,在不影響圖像質(zhì)量前提下,運(yùn)用矩陣填充技術(shù)重構(gòu)人臉圖像,利用計(jì)算機(jī)模擬,分析實(shí)驗(yàn)數(shù)值結(jié)果表明,重構(gòu)效果較好,運(yùn)行時(shí)間較短.對人臉識(shí)別的研究工作具有一定的指導(dǎo)意義和參考價(jià)值.
[1]楊濟(jì)美,向世明,劉榮,等.矩陣低秩逼近的快速增量算法及其在人臉圖像中的應(yīng)用[J].中國科學(xué)技術(shù)大學(xué)學(xué)報(bào),2009,39(9):970-979.
YANG Ji-mei,XIANG Shi-m ing,LIU Rong,et al.A fast incremental algorithm for low rank approximations of matrices and its applications in facial images[J]. Journal of University of Science and Technology of China,2009,39(9):970-979.(in Chinese)
[2]HONG Z Q.A lgebraic feature extraction of image for recognition[J].Pattern Recognition,1991,24(3):211-219.
[3]BEGHDADIA,PESQUET PB.A new image distortion measure based on wavelet decomposition[J].Proc ofIEEE ISSPA,2003(1):485-488.
[4]夏平平,呂太之.動(dòng)態(tài)人臉識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].武漢工程大學(xué)學(xué)報(bào),2011,33(10):107-110.
XIA Ping-ping,L YU Tai-zhi.Design and implementation of a dynamic faces recognition system[J].Journal ofWuhan Institute of Technology,2011,33(10):107-110.(in Chinese)
[5]韋仙.基于矩陣填充技術(shù)重構(gòu)哦低秩密度矩陣[J].武漢工程大學(xué)學(xué)報(bào),2015,37(2):72-76.
WEI Xian.Reconstructing low-rank density matrix via matrix completion[J].Journal of Wuhan Institute of Technology,2015,37(2):72-76.(in Chinese)
[6]EMMANUEL JC,BENJAMIN R.Exact low-rank matrix completion via convex optimization[J].IEEE,2008(23-26):806-812.
[7]MA Shi-qian,DONALD G,CHEN Li-feng.Fixed point and Bregman iterative methods for matrix rank m inim ization[J].Mathematical Programm ing,2011,128(1-2):321-353.
Image reconstruction based on dimension reduction and com pression technology
WEIXian,KANG Rui-dan
Faculty of Science,Taiyuan Institute of Technology,Shanxi030008,China
Aimed at that the face image is usuallymissing and corrupted by noise under the impact of environmental factors,we proposed amethod to reconstruct the complete imagematrix from the limited information.Firstly,we applied the matrix completion theory to reconstruct the imagematrix whose eigenvalues are effectively extracted using the method of singular value compression.Then,we used the matrix completion technology based on the convex optimization to study the problem ofmissing matrix reconstruction by running the fixed point iterative algorithm.This algorithm can quickly converge to the targetmatrix in the case of selecting appropriate parameters by conducting splitting iteration with the help of Matlab programming language,which reduces the running time.We evaluated the fidelity of the face image by analyzing the relationship between the peak signal to noise ratio and the number of singular values.The conclusion shows that the image matrix is effectively completed using the technology of dimension compression through analy zing the effectof face image reconstruction under different sampling rates and the run-times.
matrix completion;face recognition;low-rank;singular value decomposition
O411.1
A
10.3969/j.issn.1674-2869.2015.12.015
1674-2869(2015)12-0069-06
本文編輯:陳小平
2015-11-05
太原工業(yè)學(xué)院院級(jí)青年科學(xué)基金(2014LQ05)
韋仙(1988-),女,山西晉城人,助理實(shí)驗(yàn)師,碩士.研究方向:壓縮感知與矩陣填充.