朱 明,孫繼剛,2,郭立強
(1.中國科學院長春光學精密機械與物理研究所,吉林長春130033; 2.中國科學院 研究生院,北京100039)
圖像矩函數(shù)的定義及其不變性的研究始于上個世紀60年代,發(fā)展于80、90年代。從圖像中計算出來的矩不變量集合描述了圖像的全局特征,并提供了該圖像區(qū)別于其它圖像所特有的幾何信息,圖像矩不變量的這種特征描述能力被廣泛地應用于圖像匹配和模式識別領域中。從仿生學角度來講,圖像的矩不變量反映了視覺信息在某些變換下所具有的不變性,即不同模式之間的本質差別。從數(shù)學角度來講,矩不變量是一類代數(shù)不變量。
有關矩不變量的開拓性工作由Hu提出[1],他利用代數(shù)不變量理論推出了7個相似矩不變量并把它們應用于目標識別中。但相似變換只是圖像幾何形變中較小的一類,在實際的工程應用中需要構造仿射變換下的矩不變量。目前,國內外有關仿射不變量的研究論文有百余篇,研究方法也比較多,一些經(jīng)典的方法,如:基于小波的仿射不變量研究[3]、互權重矩方法[4](cross-weighted moments)、多尺度自卷積方法[5]及基于trace變換的仿射不變量構造[6]等。此外還有基于矩技術的仿射不變量研究,如:Flusser和Reiss分別獨立構造了仿射矩不變量[2,7]。文獻[7-8]中討論了仿射矩不變量在目標識別中的應用。文獻[9]把仿射矩不變量用于圖像匹配。文獻[10]構造了模糊條件下的仿射矩不變量。文獻[11]利用仿射矩不變量對發(fā)生仿射形變的圖像進行配準。文獻[12]研究了基于Hu矩構造仿射矩不變量的方法。文獻[13]采用圖論的方法構造了高階仿射矩不變量。文獻[14]在傅里葉變換域中構造了仿射矩不變量并用于對稱圖像的識別。
盡管關于仿射不變量的研究論文很多,但研究的對象都是灰度圖像,有關彩色圖像矩不變量的研究卻很少。這主要是由于矢量信號處理理論尚未完全建立起來,目前針對彩色圖像處理的算法多是以分通道的形式來處理的。
本文以四元數(shù)矩陣來對彩色圖像進行建模,定義了四元數(shù)矩并構造了該矩函數(shù)的仿射不變量。基于四元數(shù)矩的仿射不變量研究為彩色圖像的不變量理論提供了一個新的方法。實驗結果表明,本文所提出的算法要優(yōu)于分通道處理的方法。
這里簡要介紹有關四元數(shù)的基礎知識。
四元數(shù)是復數(shù)的推廣,是由1個實部和3個虛部構成,即:
其中,3個虛部滿足如下乘法規(guī)則:
若四元數(shù)q的實部為零,稱q為純四元數(shù)。
四元數(shù)的共軛為:
四元數(shù)的范數(shù)為:
四元數(shù)的逆為:
若純四元數(shù)q的范數(shù)為1,稱q為單位純四元數(shù)。
設μ為單位純四元數(shù),四元數(shù)的歐拉公式為:
對于一幅彩色圖像f(x,y),把它以純四元數(shù)的形式進行表示:
其中:fR(x,y),fG(x,y)和fB(x,y)分別代表彩色圖像的R、G和B分量,x和y分別代表像素所在圖像矩陣的行號和列號。這樣,一幅彩色圖像就可以用四元數(shù)矩陣來表示?;谒脑獢?shù)的彩色圖像處理就是直接對這個四元數(shù)矩陣來處理的,相對于傳統(tǒng)的分通道或是變換成灰度圖像后再處理的方法而言,四元數(shù)方法更能體現(xiàn)出彩色圖像的整體性,為實際的工程應用提供了一個新的突破點。
從數(shù)學角度來講,矩函數(shù)(嚴格意義上講是泛函)是一個積分變換,把圖像f(x,y)投影到核函數(shù)上,對積分結果進行適當?shù)奶幚韥順嬙煜鄳儞Q下的不變量。本節(jié)給出了基于四元數(shù)的彩色圖像矩函數(shù)表達式。由于四元數(shù)乘法不滿足交換律,因此它有3種表達式。
設彩色圖像為f(x,y),(m+n)階左四元數(shù)矩定義如下:
右四元數(shù)矩定義如下:
雙邊四元數(shù)矩定義如下:
其中,μ為任意單位純四元數(shù),這里μ的取值為:
盡管四元數(shù)矩的表達式有3種,但在描述彩色圖像幾何形變的能力上是一樣的[17]。為了下文論述方便起見,本文中四元數(shù)矩是指左四元數(shù)矩。四元數(shù)矩的離散化形式如下:
仿射變換由旋轉、尺度、剪切和平移變換構成:
其中,α≠β,δ≠0。
接下來研究在上述4個變換下的不變量,最終實現(xiàn)仿射不變量的構造。首先把式(9)變換到極坐標系下:
設f(r,θ+φ)是原始彩色圖像f(r,θ)旋轉 φ角度得到的,把f(r,θ+φ)帶入到式(15)中得到:
對式(16)兩端取范數(shù),得:
式(17)表明,四元數(shù)矩函數(shù)的范數(shù)具有旋轉不變性。接下來利用二項式定理把式(15)的積分核展開:
其中:
Hp,q的形式與傳統(tǒng)的Hu矩一樣,惟一不同的是Hp,q中被積函數(shù)f(x,y)是四元數(shù)值函數(shù),相應地積分值也是四元數(shù)。這里利用文獻[18]中的歸一化方法來構造Hp,q在尺度和剪切變換下的不變量。
對于剪切變換,x'=x+ δx,y'=y:
由上式知:
令H'1,1=0,可得,把它帶入式(19)中,可以得到具有剪切不變性的函數(shù):
對于尺度變換x'= αx,y'=βy,有:
接下來在式(21)和式(22)的基礎上構造具有尺度不變性的矩函數(shù):
由式(23)得到如下方程組:解該方程組得:把式(25)帶入式(23)中得到具有剪切和尺度不變性的矩函數(shù):
平移不變性的獲取是通過把彩色圖像的坐標原點平移到彩色圖像的重心實現(xiàn)的。最終,可以構造出基于四元數(shù)矩的仿射不變量:
圖1 仿射變換前后的8幅圖像Fig.1 Color images and their affine transformed versions
本節(jié)給出了四元數(shù)矩仿射不變量的數(shù)值結果,并與文獻[15]中所提出的彩色矩仿射不變量進行對比。圖1中,第1幅圖像為原始圖像,其余7幅圖像是經(jīng)過仿射變換后的圖像,仿射變換的參數(shù)隨機選定。在圖像的下方有該圖像的尺寸參數(shù)。
利用式(27)計算各幅圖像的低階仿射不變矩,其結果見表1。表2是彩色矩仿射不變量的實驗結果。
F.Mindru等人對Hu矩進行推廣,定義了彩色矩仿射不變量:
這里只列舉了該文獻中的兩個不變量,在表2中,各個不變量的具體表達式以及這方面更詳細的內容可參見文獻[15]。
本文采用標準差與期望之比(σ/u)來對不變量的穩(wěn)定性進行量化。由于標準差刻畫了樣本偏離均值上下波動的程度,σ相對于u越小,則說明樣本越穩(wěn)定。
對比表1和表2,本文所提出的不變量的σ/u值比彩色矩仿射不變量的穩(wěn)定性提高了2個數(shù)量級。文獻[15]中彩色矩的表達式對彩色圖像的RGB通道分別進行了冪運算處理。以彩色矩為基礎的不變量構造還可能只涉及某一個或兩個通道的數(shù)據(jù)。本文所提出的四元數(shù)矩,彩色圖像以純四元數(shù)的形式參與運算,并不涉及通道數(shù)據(jù)的冪運算,數(shù)值穩(wěn)定性會高一些??傊?,本文所提出的四元數(shù)矩仿射不變量可以作為模式識別中彩色目標的特征描述子。
表1 四元數(shù)矩仿射不變量Tab.1 Quaternion moment invariants
表2 彩色矩仿射不變量Tab.2 Color moment invariants
本文把傳統(tǒng)灰度圖像的復數(shù)矩推廣到四元數(shù)層面,提出了四元數(shù)矩的定義,構造了基于四元數(shù)
矩的彩色圖像仿射不變量。實驗結果表明:本文所提出的不變量的穩(wěn)定性要優(yōu)于L.V.Gool等人提出的彩色矩仿射不變量[15],其σ/u值提高了2個數(shù)量級。未來的工作主要是研究利用本文所提出的四元數(shù)矩不變量進行彩色目標識別。
[1]HU M K.Visual pattern recognition by moment invariants[J].IRE Trans.Inf.Theory,1962,8(2):179-187.
[2]REISS T H.The revised fundamental theorem of moment invariants[J].IEEE Trans.PAMI,1991,13(8):830-834.
[3]TIENG Q M,BOLES W W.Wavelet-based affine invariant representation:a tool for recognition planar objects in 3D space[J].IEEE Trans.PAMI.,1997,19(8):846-857.
[4]YANG ZH W,COHEN F S.Cross-weighted moments and affine invariants for image registration and matching[J].IEEE Trans.PAMI.,1999,21(8):804-814.
[5]HEIKKIL? J.Multi-scale autoconvolution for affine invariant pattern recognition[C].Proceedings of the 16th International Conference on Pattern Recognition(ICPR'02),Quebec,Canada,11-15 Aug,2002:119-122.
[6]PETRON M,KADYROV A.Affine invariant features from the trace transform[J].IEEE Trans.PAMI.,2004,26(1):30-44.
[7]FLUSSER J,SUK T.Affine moment invariants:a new tool for character recognition[J].Pattern Recog.Lett.,1994,15(4):433-436.
[8]MEI Y,ANDROUTSOS D.Robust affine invariant region-based shape descriptor:the ICA Zernike moment shape descriptor and the whitening Zernike moment shape descriptor[J].IEEE Trans.Signal Proc.,2009,16(10):877-880.
[9]HEIKKILA J.Pattern matching with affine moment descriptors[J].Pattern Recogn.Lett.,2004,37(9):1825-1834.
[10]SUK T,F(xiàn)LUSSER J.Combined blur and affine moment invariants and their use in pattern recognition[J].Pattern Recogn.Lett.,2003,36(2):2895-2907.
[11]FLUSSER J,SUK T.A moment-based approach to registration of images with affine geometric distortion[J].IEEE Trans.Geoscience and Remote Sensing,1994,32(2):382-387.
[12]LIU J,LI D,TAO W,et al.An automatic method for generating affine moment invariants[J].Pattern Recogn.Lett.,2007,28(16):2295-2304.
[13]SUK T,F(xiàn)LUSSER J.Graph method for generating affine moment invariants[C].Proceedings of the 17th International Conference on Pattern Recognition(ICPR'04),Cambridge,UK,23-26 Aug,2004:192-195.
[14]WEN CH Y,ZHANG Y,ZHANG Y N.Recognition of symmetrical images using affine moment invariants in both frequency and spatial domains[J].Pattern Anal Appl,2002,5(3):316-325.
[15]MINDRU F,TUYTELAARS T,GOOL L V,et al.Moment invariants for recognition under changing viewpoint and illumination[J].Computer Vis.Image Und.,2004,94(1-3):3-27.
[16]KANTOR I L,SOLODOVNIKOV A S.Hypercomplex Number:An Elementary Introduction to Algebras[M].NewYork:Springer-Verlag,1989.
[17]郭立強.基于四元數(shù)的彩色圖像處理算法研究[D].北京:中國科學院研究生院,2011.GUO L Q.The study of color image processing algorithms based on quaternion[D].Beijing:Graduate University of Chinese Academy of Sciences,2011.(in Chinese)
[18]ROTHE I,SUSSE H,VOSS K.The method of normalization to determine invariants[J].IEEE Trans.PAMI,1996,18
(4):366-376.