張五一,侯遠(yuǎn)韶,張繼超,楊 揚(yáng)
(中原工學(xué)院,鄭州450007)
基于二維稀疏表示和范數(shù)優(yōu)化的織物疵點(diǎn)分類研究
張五一,侯遠(yuǎn)韶,張繼超,楊 揚(yáng)
(中原工學(xué)院,鄭州450007)
針對(duì)一維壓縮采樣丟失圖像的結(jié)構(gòu)信息,并帶來(lái)識(shí)別精度損失的問(wèn)題,提出了二維壓縮采樣的方法.利用一組稀疏基對(duì)疵點(diǎn)原始數(shù)據(jù)進(jìn)行感知得到稀疏化數(shù)據(jù),將織物疵點(diǎn)數(shù)據(jù)用二維稀疏表示,再利用范數(shù)優(yōu)化的方法實(shí)現(xiàn)壓縮數(shù)據(jù)的準(zhǔn)確重建,根據(jù)稀疏基的不同得到織物疵點(diǎn)的不同分類.該方法解決了采集數(shù)據(jù)的泛濫和傳感器的浪費(fèi),降低了計(jì)算的復(fù)雜度,有利于織物疵點(diǎn)的分類研究,進(jìn)而為機(jī)器視覺(jué)識(shí)別織物疵點(diǎn)打下理論基礎(chǔ).
二維稀疏;織物疵點(diǎn);范數(shù)優(yōu)化;分類
在紡織產(chǎn)品中,織物疵點(diǎn)是影響布匹質(zhì)量的主要因素,也影響著紡織品的價(jià)格.而簾子布作為一種特殊的紡織產(chǎn)品,其生產(chǎn)速度快,幅面大,表面紋理相對(duì)較為復(fù)雜,疵點(diǎn)種類多.所以,如何在復(fù)雜背景下快速檢測(cè)簾子布疵點(diǎn),對(duì)檢測(cè)和識(shí)別技術(shù)提出了較高的要求.隨著圖像獲取技術(shù)的不斷發(fā)展,織物圖像的采集已經(jīng)得到了較好的解決,而找到行之有效的疵點(diǎn)檢測(cè)識(shí)別算法,則成為研究的重點(diǎn).然而,隨著數(shù)據(jù)采集設(shè)備的完善和數(shù)據(jù)傳感器處理能力的不斷增強(qiáng),圖像的分辨率不斷提高,圖像識(shí)別要處理的數(shù)據(jù)維數(shù)也越來(lái)越多,而數(shù)據(jù)維數(shù)的提升使得實(shí)時(shí)完成圖像處理和識(shí)別也越來(lái)越困難.為了解決數(shù)據(jù)維數(shù)提升帶來(lái)的難題,需要為圖像識(shí)別尋找減小數(shù)據(jù)冗余度的有效方法,完成原始數(shù)據(jù)的降維,以提高圖像識(shí)別的速度.此外,圖像的降維過(guò)程不僅要降低數(shù)據(jù)維數(shù),還必須抓住圖像的主要信息而忽略次要信息,因此圖像降維還應(yīng)是一種有效的特征提取手段.本文在一維壓縮采樣的基礎(chǔ)上,提出了二維壓縮采樣的方法.這種方法充分利用了圖像的結(jié)構(gòu)信息,減少了數(shù)據(jù)的冗余和計(jì)算的復(fù)雜度,使機(jī)器視覺(jué)識(shí)別織物疵點(diǎn)的速度得到了提升.
圖像分析的研究表明,基于機(jī)器視覺(jué)的圖像識(shí)別可以歸結(jié)為一個(gè)先提取特征然后再進(jìn)行分類的過(guò)程.因此,織物疵點(diǎn)檢測(cè)和識(shí)別本質(zhì)上是一種將圖像先提取特征然后再分類的問(wèn)題.而近幾年來(lái),基于范數(shù)優(yōu)化的稀疏表示理論的研究進(jìn)展給我們帶來(lái)了新的思路.該理論指出,若向量在某種變換下具有稀疏性(即向量的零元素項(xiàng)占多數(shù)),則可以利用這種稀疏性對(duì)該向量進(jìn)行欠定的隨機(jī)線性映射,而不必?fù)?dān)心丟失任何信息.只要該欠定的映射矩陣滿足一定的條件,就可以利用范數(shù)優(yōu)化技術(shù)由這些“欠采樣值”(采樣頻率低于經(jīng)典的Nyquist頻率)精確地重建原始向量.
對(duì)圖像特征提取和分類算法的研究,傳統(tǒng)上習(xí)慣從向量(一維)的角度出發(fā),這種一維化的處理方法沒(méi)有考慮圖像的矩陣結(jié)構(gòu),因而往往帶來(lái)較高的計(jì)算開(kāi)銷和識(shí)別的不穩(wěn)定.
1.1 二維稀疏表示的意義
我們認(rèn)為,將傳統(tǒng)的一維特征表示和模式分類算法直接用于圖像識(shí)別,將帶來(lái)以下缺點(diǎn):①丟失了圖像的二維結(jié)構(gòu)信息,在同等條件下使識(shí)別精度降低.②傳統(tǒng)算法先將數(shù)據(jù)轉(zhuǎn)化成向量形式,而這種“向量化”的手段將導(dǎo)致采樣和重建過(guò)程中計(jì)算復(fù)雜度的提高.針對(duì)上述缺點(diǎn),利用圖像的矩陣結(jié)構(gòu)(二維),可以完成一維方法向二維方法的擴(kuò)展.?dāng)U展后的二維圖像表示和分類算法在很大程度上解決了上述一維算法的缺點(diǎn),并能夠帶動(dòng)一維圖像識(shí)別算法的升級(jí)和變革,從而對(duì)織物疵點(diǎn)檢測(cè)與識(shí)別產(chǎn)生積極的影響.
1.2 從一維采樣到二維稀疏采樣
在介紹二維壓縮采樣之前,我們先將一維壓縮采樣概念作一下簡(jiǎn)單的介紹.設(shè)圖像x為M×N的矩陣,將該矩陣轉(zhuǎn)換為列向量x(vec)∈RM×N,則圖像一維壓縮采樣形式的向量特征y(vec)∈RM(vec)可以通過(guò)下面的公式得到:其中,?∈RM(vec)×(MN)(M(vec)<MN)為滿足 RIP 條件的欠定隨機(jī)矩陣(隨機(jī)分布可取Gaussian分布).
在本研究中,如果我們不把x向量化,而是保持x∈RM×N的矩陣結(jié)構(gòu)不變,并對(duì)公式(1)做一些改變,可以得到下面的二維壓縮隨機(jī)映射公式:
y=?rx?c(2)其中,?r∈Rm×M,?c∈Rn×N(m<M,n<N)分別為行采樣矩陣(行映射)和列采樣矩陣(列映射),?r和?c均滿足RIP條件.和一維壓縮采樣不同,由公式(2)所得到的y不再是向量,而是一個(gè)矩陣(y∈RM×N).我們將矩陣y稱為二維壓縮采樣測(cè)度.
公式(3)說(shuō)明了矩陣y中的每一個(gè)元素均包含了行映射和列映射從矩陣x中抽取的一部分信息.
從理論上和實(shí)驗(yàn)上可以初步證明,只要x是分段光滑的(可以經(jīng)過(guò)某個(gè)變換進(jìn)行稀疏化),或者x本身就是一個(gè)稀疏矩陣,且矩陣y的行/列數(shù)大于某個(gè)確定的閾值(但小于x的行/列數(shù)),則y中包含的信息量就和x一樣多,這樣就可以使用凸化技術(shù)從y重建x.
在實(shí)際應(yīng)用中,如果待采集的圖像f本身不是稀疏的,但在某個(gè)Ψ基上的變換系數(shù)θ是稀疏的或者是可壓縮的,那么圖像f經(jīng)過(guò)轉(zhuǎn)換是可壓縮的,即f=Ψθ.
稀疏表示理論不僅可用于特征表示,還可用于分類器的設(shè)計(jì).例如,在圖像識(shí)別中,假設(shè)輸入的圖像可以表示為訓(xùn)練集樣本的線性和,且該線性和的系數(shù)向量是稀疏的,則通過(guò)稀疏向量中非零值的位置就可以對(duì)輸入圖像進(jìn)行分類.而該過(guò)程實(shí)際上就是基于l1范數(shù)優(yōu)化的稀疏向量重建過(guò)程[1-3].
1.3 二維稀疏的訓(xùn)練集表示
二維稀疏表示的思想還可以用圖1來(lái)表示.
圖1 基于稀疏表示的模式識(shí)別方法示意圖
圖1中字典A為訓(xùn)練集樣本構(gòu)成的欠定矩陣,其中各列為已知ID的模式向量,y為輸入模式向量.當(dāng)字典A中的樣本足夠充分時(shí),則y可以表示為A中相關(guān)模式的線性和,此時(shí)系數(shù)向量α必為稀疏的,因此α中的非零值可以定位A中的相關(guān)向量,在此基礎(chǔ)上可以確定y的分類,即如果A中的相關(guān)樣本屬于第i類的話,那么該圖像也應(yīng)被劃為第i類.上述思想還可以用如下數(shù)學(xué)式來(lái)表示:
其中,Ai=[μi,1,μi,2,…,μi,n],為第i類訓(xùn)練樣本集合;αi=[αi,1αi,2,…,αi,n]T,為系數(shù)向量[3].對(duì)于全體訓(xùn)練集樣本(共k類)而言,公式(4)還可以寫成如下的形式
其中,A=[A1,A2,…,Ak],為整個(gè)訓(xùn)練集;α=[α1,α1,…,αk]T,為系數(shù)向量.由于α僅與Ai有關(guān),所以α必為稀疏向量,并且稀疏向量的位置和大小與Ai密切相關(guān),通過(guò)對(duì)α的求解可以確定α的ID.
由于矩陣A為欠定矩陣,所以公式(5)中的α有無(wú)窮多組解.通過(guò)l1范數(shù)限制min‖α‖(α的最小l1范數(shù)),可以將上述問(wèn)題轉(zhuǎn)化為一個(gè)凸優(yōu)化問(wèn)題,從而得到α的稀疏解.上述思想被美國(guó)數(shù)學(xué)家Donoho D總結(jié)歸納為:“對(duì)于欠定線性方程組而言,其l1范數(shù)最小化的解通常也是欠定線性方程組的最稀疏解”[2].
通過(guò)香農(nóng)采樣定理可知,只有采樣頻率不小于奈奎斯特頻率即模擬信號(hào)頻譜中最高頻率的2倍時(shí),才能不失真地恢復(fù)原始信號(hào).但是香農(nóng)采樣定理除了利用了信號(hào)是有限帶寬的假設(shè)外,沒(méi)有利用其他任何的先驗(yàn)信息,采集到的數(shù)據(jù)在很大程度上存在冗余性.二維稀疏表示并不是直接對(duì)數(shù)據(jù)進(jìn)行采集,而是通過(guò)一組特定的波形去感知數(shù)據(jù),即為了能夠準(zhǔn)確重建原始數(shù)據(jù),必須用一組特定的波形去感知數(shù)據(jù),并且要衡量特定波形與原始數(shù)據(jù)的相干程度,只有相干程度在可接受范圍內(nèi)時(shí),才能利用范數(shù)優(yōu)化的方法準(zhǔn)確重建數(shù)據(jù);涉及的關(guān)鍵因素在于給定的波形要與可以用來(lái)壓縮原始數(shù)據(jù)的波形均不相干,并且不相干程度越高,感知數(shù)據(jù)包含的信息量就越大,那么準(zhǔn)確獲取重建原始數(shù)據(jù)所需的感知數(shù)據(jù)量就越少[4].國(guó)外提出的受限等距性原理、一致不確定性原理及準(zhǔn)確重構(gòu)原理,進(jìn)一步回答了如何從壓縮數(shù)據(jù)中方便地提取信號(hào)或者圖像的有用信息問(wèn)題[5].圖2所示是采樣過(guò)程的一個(gè)示意圖,其中待采集信號(hào)f只在k個(gè)時(shí)刻非零(即為稀疏程度),并且只有在這k個(gè)非零時(shí)刻才能有效采集到信號(hào)f中的信息,并將其投影到給定的一組感知波形上(也可以說(shuō),用一組給定的波形對(duì)f進(jìn)行感知),得到一組遠(yuǎn)小于數(shù)據(jù)原始長(zhǎng)度的測(cè)量數(shù)據(jù)y[6].
圖2 壓縮感知數(shù)據(jù)采集方式
2.1 相干性和稀疏性
2.1.1 不相干性
基與基之間的相干程度μ定義為:
其中,?k、Ψj分別是正交矩陣?,Ψ的行向量和列向量(k,j分別表示矩陣的行和列).通過(guò)線性代數(shù)的知識(shí)可知,u所以當(dāng)測(cè)度矩陣是單位矩時(shí),相干程度u最大為1.在這種情況下,只有采集到和原始數(shù)據(jù)量相當(dāng)?shù)母兄獢?shù)據(jù),才能估計(jì)出可壓縮數(shù)據(jù)的重要信息.因此,當(dāng)感知矩陣和變換矩陣之間的相干程度為1時(shí),只能使用常規(guī)的采樣方法.實(shí)際上,絕大部分矩陣之間都是不相干的,即相干程度都不為1.
相干程度最小的規(guī)范基是由傅里葉變換矩陣和脈沖函數(shù)?k=δ(t-tk)形成的.脈沖函數(shù) ?k=δ(t-tk)與正弦曲線之間的相干程度為1/■n.
2.1.2 數(shù)據(jù)可壓縮性
數(shù)據(jù)的可壓縮性是指數(shù)據(jù)能夠在較小損失的情況下通過(guò)較少的系數(shù)表達(dá)出來(lái),或者數(shù)據(jù)在某個(gè)變換域的支撐域相對(duì)較小時(shí)是可壓縮的.此外,當(dāng)數(shù)據(jù)在空域或者某個(gè)變換域的系數(shù)屬于lp球(0<p<1)時(shí),數(shù)據(jù)也是可壓縮的[7].此時(shí),數(shù)據(jù)f在給定的Ψ 基下,由f=Ψθ確定的變換系數(shù)θ對(duì)任意給定的某一常數(shù)R(R>0)和p(0<p<1),滿足
當(dāng)系數(shù)θ屬于lp球時(shí),設(shè)θk是取θ中k個(gè)較大項(xiàng),并將θ中的其他項(xiàng)置為零得到的向量,則
其中,ζ2,p是僅取決于p∈(0,2)的常數(shù).因而為了使θk對(duì)θ的估計(jì)誤差不大于ε,只需k≥ε(p-2)/2p,即最大的k個(gè)系數(shù)保留數(shù)據(jù)的大部分信息.
2.2 數(shù)據(jù)壓縮與流形
數(shù)據(jù)的壓縮可以解釋為原始空間中穩(wěn)定的流形嵌入,因此能有效地降低原始數(shù)據(jù)的維數(shù),而不丟失信息.在此基礎(chǔ)上對(duì)壓縮數(shù)據(jù)進(jìn)行學(xué)習(xí)和分類,等價(jià)于傳統(tǒng)的學(xué)習(xí)和分類.例如,近年來(lái)提出的匹配濾波器算法就是對(duì)圖像的壓縮流形進(jìn)行估計(jì)后再對(duì)目標(biāo)進(jìn)行識(shí)別和分類[8].類似的研究包括Davenport M等人對(duì)流形的隨機(jī)映射所進(jìn)行的分析,分析結(jié)果表明圖像的壓縮采樣數(shù)據(jù)可用于檢測(cè)、分類以及參數(shù)估計(jì),其準(zhǔn)確性類似于傳統(tǒng)方法,但計(jì)算的復(fù)雜度卻降低了.這些研究從流形嵌入的角度解釋了圖像壓縮識(shí)別的有效性[9-13].
在本研究中,我們認(rèn)為基于稀疏表示和范數(shù)優(yōu)化的圖像識(shí)別算法還可以繼續(xù)改進(jìn).在稀疏變換和圖像重建過(guò)程中,往往夾雜著噪聲的干擾.如何在不影響圖像重建的情況下最大限度地去除噪聲,并利用圖像的矩陣結(jié)構(gòu)和稀疏基的不同對(duì)織物疵點(diǎn)圖像進(jìn)行準(zhǔn)確重建和分類,還需要做以下改進(jìn)工作:
(1)在數(shù)據(jù)壓縮方面,目前所采用的測(cè)量矩陣大多為非確定性測(cè)量矩陣即隨機(jī)矩陣,雖然它們?cè)诜抡鎸?shí)驗(yàn)中能夠取得較好的效果,但是難以在硬件上實(shí)現(xiàn).因而有必要研究自適應(yīng)壓縮技術(shù),即根據(jù)不同的數(shù)據(jù)類型,采用不同的數(shù)據(jù)采樣和圖像重建策略[14].
(2)在稀疏表示方面,低秩表示和流形結(jié)構(gòu)與數(shù)據(jù)稀疏性有著密切聯(lián)系,如果將低秩表示和流形結(jié)構(gòu)引入圖像的稀疏表示中,將有望得到更好的壓縮結(jié)果[15].
(3)在范數(shù)優(yōu)化方面,如果能結(jié)合圖像自身的稀疏性和先驗(yàn)性,那么圖像的分類重建將會(huì)得到更好的恢復(fù)效果.
二維稀疏表示可以得到較低維數(shù)的數(shù)據(jù),計(jì)算復(fù)雜度低,并且不依賴于訓(xùn)練集的選取,因此可以有效地用于數(shù)據(jù)的特征抽?。稊?shù)優(yōu)化則可以精確地重建圖像,有利于織物疵點(diǎn)的分類研究,進(jìn)而為機(jī)器視覺(jué)識(shí)別織物疵點(diǎn)打下理論基礎(chǔ).
[1] Donoho D,Elad M.Optimal Sparse Representation in General(nonorthogonal)Dictionaries via L1 Minimization[C].New York:In Proceedings of the National Academy of Sciences,2003.
[2] Donoho D.For Most Large Underdetermined Systems of Linear Equations the Minimal 1-norm Solution is also the Sparsest Solution Comm[J].On Pure and Applied Math,2006,59(6):797-829.
[3] Wright J,Yang A,Ganesh A,et al.Robust Face Recognition via Sparse Representation[J].IEEE Transactions on Pattern A-nalysis and Machine Intelligence,2009,31(2):210-227.
[4] 戴瓊海,付長(zhǎng)軍,季向陽(yáng).壓縮感知研究[J].計(jì)算機(jī)學(xué)報(bào),2011,34(3):425-434.
[5] Wright J.Robust Face Recognition via Sparse Representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2):227-229.
[6] 焦李成,楊淑媛,劉芳,等.壓縮感知回顧與展望[J].電子學(xué)報(bào),2011,39(7):1652-1657.
[7] Davenport M A.The Smashed Filter for Compressive Classification and Target Recognition[EB/OL].[2012-03-03].http://dsp.rice.edu/sites/dsp.rice.edu/files/cs/spie07-final.pdf.
[8] Duarte M.Multiscale Random Projections for Compressive Classification[C].Texas:IEEE on Image Processing(ICIP)2007.
[9] Wakin M B.Manifold-based Signal Recovery and Parameter Estimation[J].Compressive Measurements(Preprint),2008,22(3):226-231.
[10] PeyréG.Manifold Models for Signals and Images[J].Computer Vision and Image Understanding,2009,113(2):249-260.
[11] Baraniuk R G,Wakin M B.Random Projections of Smooth Manifolds[R].New York:Foundations of Computational Mathematics,2009:35.
[12] Hegde C M,Wakin R,Baraniuk.Random Projections for Manifold Learning[M].New York:Neural Information Processing Systems NIPS,2007:641-648.
[13] Davenport M.A Theoretical Analysis of Joint Manifolds(Technical Report TREE-0901)[J].Rice University ECE Department,2009,116(24):118-121.
[14] Yang J.Two-Dimensional PCA:A New Approach to Appearance-based Face Representation and Recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2004,26(1):131-137.
[15] 楊平,施克仁.相控陣超聲二維稀疏陣列的優(yōu)化設(shè)計(jì)應(yīng)用研究[J].應(yīng)用聲學(xué),2008,27(2):148-150.
Study on a Fabric Defect Classification Based on Two-dimensional Sparse Representations and a Norm Optimization
ZHANG Wu-yi,HOU Yuan-shao,ZHANG Ji-chao,YANG Yang
(Zhongyuan University of Technology,Zhengzhou 450007,China)
As to sampling loss of the structural information of the image for the one-dimensional compression and the loss of recognition accuracy,a concept of two-dimensional compression samples is proposed.Using a set of sparse-based perception,the sparse data on the raw data of the defect,fabric defect two-dimensional sparse are gotten.Finally,using norm optimization method accurate reconstruction of the compressed data is realized,and different fabric defect classification is gotten.This approach solves the proliferation of data collection and the sensor waste and greatly reduces the computational complexity,fabric defect classification,and thus to lay a theoretical foundation for machine vision to identify fabric defects.
two-dimensional sparse;fabric defects;norm optimization;classification
TP391.4
A
10.3969/j.issn.1671-6906.2012.03.005
1671-6906(2012)03-0024-05
2012-03-08
河南省科技攻關(guān)計(jì)劃項(xiàng)目(0721002210032)
張五一(1955-),男,河南洛陽(yáng)人,教授.