陳偉
二維旋轉(zhuǎn)不變U 變換及其應(yīng)用
陳偉1
U-系統(tǒng)是一類L2[0,1]上的正交分段多項式函數(shù)系,為了將其推廣到二維情形,傳統(tǒng)的L2[0,1]2上張量積形式的U變換并不具有旋轉(zhuǎn)不變性.本文提出了一類二維旋轉(zhuǎn)不變U變換(Rotation-invariant U transform,RIUT).RIUT將U-系統(tǒng)函數(shù)與調(diào)和函數(shù)相結(jié)合,使得圖像的旋轉(zhuǎn)轉(zhuǎn)化為相位的平移而模保持不變.與經(jīng)典的正交旋轉(zhuǎn)不變矩(如Zernike矩)相比,RIUT具有諸多特別的性質(zhì),從而在圖像特征提取中具有良好的潛力.本文將RIUT應(yīng)用到二值圖像檢索中的實驗結(jié)果表明,RIUT具有更高的檢索精度.
旋轉(zhuǎn)不變,U-系統(tǒng),Zernike矩,二值圖像檢索
引用格式陳偉.二維旋轉(zhuǎn)不變U變換及其應(yīng)用.自動化學(xué)報,2016,42(9):1380-1388
旋轉(zhuǎn)不變性在圖像目標的表達與識別中具有基本的重要性.因此,如何從圖像特征中得到旋轉(zhuǎn)不變量便是一個關(guān)鍵問題.人們已經(jīng)提出了多種旋轉(zhuǎn)不變特征,其中,Zernike矩[1]、偽Zernike矩[2]等旋轉(zhuǎn)不變矩是一類成熟且應(yīng)用十分廣泛的方法.自提出以來,它們已成功應(yīng)用于模式識別[3]、邊緣檢測[4-5]、紋理分類[6]、目標方向估計[7]等多種實際問題.
矩方法是將目標投影到一個多項式函數(shù)支撐的空間中[8].設(shè)f(x,y)是一個分片光滑二元實值函數(shù),其定義域為Ω?R×R.那么,f(x,y)的n+m階矩定義為:
pnm(x,y)為定義域Ω上的n+m階多項式基函數(shù).
一般說來,式(1)中計算得到的矩值Mnm并不具有不變性.為了得到具有旋轉(zhuǎn)不變性的矩函數(shù),一種常見的方法是構(gòu)造極坐標系下的復(fù)數(shù)矩.此時目標圖像的旋轉(zhuǎn)只會導(dǎo)致矩相位的變化,而矩的模值是不變的,它就是一種旋轉(zhuǎn)不變量.這類矩函數(shù)的一般定義形式如下:
其中,cnm為歸一化因子,(r,θ)是極坐標,Rn,m(r)為徑向多項式函數(shù),e-im為角向調(diào)和函數(shù).
不同的徑向多項式集則定義不同形式的矩.其中的Zernike多項式[1]為:
偽Zernike矩中的偽Zernike多項式[2]為:
正交Fourier-Mellin矩中的徑向多項式[9]為:
可以看出,這些多項式的表達式十分復(fù)雜,而且包含階乘項.在實際應(yīng)用中,特別是涉及高階矩的計算時容易導(dǎo)致計算復(fù)雜、數(shù)值不穩(wěn)定等問題[10-11].
在本文中,我們提出一種新的二維圖像變換,稱為旋轉(zhuǎn)不變U變換(Rotation-invariant U transform,RIUT).RIUT具有與傳統(tǒng)旋轉(zhuǎn)不變矩相同的表達形式(式(2)),同樣具有旋轉(zhuǎn)不變性.但由于我們采用了一類正交分段多項式函數(shù)(U-系統(tǒng))代替?zhèn)鹘y(tǒng)矩中的徑向多項式,因此這里并沒有稱之為“旋轉(zhuǎn)不變U矩”.
由于U-系統(tǒng)是一類正交分段多項式函數(shù)系,具有次數(shù)低(本文中的多項式次數(shù)僅1次)、函數(shù)結(jié)構(gòu)簡單的優(yōu)點.U-系統(tǒng)有效避免了高次多項式的計算,降低了計算復(fù)雜度[12-13].更重要的,U-系統(tǒng)具有諸多良好的特性,比如序率性、函數(shù)均勻支撐、連續(xù)/間斷并存等,使得RIUT能夠很好地捕獲圖像目標的特征,從而具有更好的圖像特征表達能力.在本文中,我們將RIUT應(yīng)用到二值圖像檢索中,并與經(jīng)典的正交旋轉(zhuǎn)不變矩,包括Zernike矩(Zernike moment,ZM)、偽Zernike矩(Pseudo-Zernike moment,PZM)及正交Fourier-Mellin矩(Orthogonal Fourier-Mellin moment,OFMM)進行比較.實驗結(jié)果表明,RIUT具有更高的檢索精度.
需要指出的是,雖然U-系統(tǒng)是一類正交函數(shù)系,但是RIUT不再是正交的,而傳統(tǒng)的ZM、PZM及OFMM是正交的.一般說來,同時具備正交性、旋轉(zhuǎn)不變性與分段低次多項式是很困難的.文獻[14]嘗試構(gòu)造了一類同時滿足這三個條件的二維變換方法,但是它的代價是徑向基函數(shù)變成的形式,使得在r=0附近的計算不穩(wěn)定,誤差很大.本文的目的不是圖像的正交重構(gòu),而是構(gòu)造具有旋轉(zhuǎn)不變性的二維變換,從而可以將其應(yīng)用到目標識別、分類等圖像不變描述中.因此,保持正交性并不是必須遵守的原則.更重要的是,U-系統(tǒng)具有傳統(tǒng)正交多項式所沒有的諸多特性,使得它在圖像特征提取中具有一定的優(yōu)勢,而且二值圖像檢索的實驗結(jié)果表明,非正交的RIUT的檢索結(jié)果比傳統(tǒng)的正交矩的結(jié)果更好.
本文的結(jié)構(gòu)安排如下:第1節(jié)簡要介紹U-系統(tǒng)的構(gòu)造過程及性質(zhì);第2節(jié)介紹旋轉(zhuǎn)不變U變換RIUT;第3節(jié)介紹及分析RIUT的若干性質(zhì);第4節(jié)介紹RIUT在二值圖像檢索中的應(yīng)用,并給出實驗結(jié)果;最后總結(jié)全文.
1.1U-系統(tǒng)簡介
k次(k=0,1,2,3,···)U-系統(tǒng)是L2[0,1]中的完備正交函數(shù)系[15-16],它由一系列分段k次多項式組成,其中既有連續(xù)可微的多項式和k次多項式樣條函數(shù),也有函數(shù)本身及其導(dǎo)數(shù)各種層次間斷的基函數(shù).
1.2U-系統(tǒng)的構(gòu)造
k次U-系統(tǒng)的構(gòu)造過程分為3個步驟:
步驟1.取區(qū)間[0,1]上的前k+1個Legendre多項式,作為k次U-系統(tǒng)的前k+1個基函數(shù),記為{φ0(x),φ1(x),···,φk(x)};
1)φi(x)是以x=1/2為結(jié)點的分段k次多項式;
2)〈φi(x),φj(x)〉=δi,j,i,j∈{0,1,2,···,k};
3)〈φi(x),xj〉=0,i,j∈{0,1,2,···,k}.
步驟3.由生成元函數(shù)迭代生成U-系統(tǒng)的后續(xù)函數(shù).
其中,n=0,1,···,(k+1)2j-1-1.在間斷點處,函數(shù)值定義為兩側(cè)極限平均值.那么,函數(shù)集合
即為k次U-系統(tǒng).圖1顯示了1次U-系統(tǒng)前16個基函數(shù)及其生成過程.
圖1 1次U-系統(tǒng)的前16個基函數(shù)生成過程Fig.1The first sixteen basis functions in U-system of degree one
1.3U-系統(tǒng)的性質(zhì)
在k次U-系統(tǒng)中,基函數(shù)按式(8)中的j值從小到大排列.記un(x)是k次U-系統(tǒng)的第n(n=0,1,2,···)個基函數(shù),那么具有如下性質(zhì):
1)正交性
k次U-系統(tǒng)是L2[0,1]上的規(guī)范正交函數(shù)系,即〈un(x),um(x)〉=δnm.
2)收斂性
給定函數(shù)f,相應(yīng)的Fourier-U級數(shù)為
其中,Sf(n)表示Fourier-U級數(shù)的前n項部分和.
3)序率性
按式(8)給出的U-系統(tǒng)基函數(shù)排列次序,記為
那么,當(dāng)x從0到1增大,U-系統(tǒng)基函數(shù)的函數(shù)值符號的改變次數(shù)呈遞增規(guī)律,即un(x)比un-1(x)變號恰恰多一個.
輪廓U描述子只能提取形狀的輪廓信息[17-18],對于具有復(fù)雜結(jié)構(gòu)的目標,為了提取整個區(qū)域的形狀特征,則需要將U-系統(tǒng)推廣到二維情形,得到二維區(qū)域上的U變換.
2.1L2[0,1]2上的U-系統(tǒng)
為了將U-系統(tǒng)推廣到二維情形,一種直接的方法是定義L2[0,1]d(d≥2)上張量積格式的U-系統(tǒng)[13,18].定義
圖2為當(dāng)un(x),um(y)為1次U-系統(tǒng)基函數(shù)時Φnm(x,y)(n,m=0,1,2,···,7)的圖像.由此可建立圖像f(x,y)的二維U變換,如下:
圖2 L2[0,1]2上張量積形式的二維U-系統(tǒng)(k=1)Fig.22D tensor product U-system on L2[0,1]2(k=1)
這種二維U變換可以應(yīng)用于數(shù)字圖像水?。?9]、圖像編碼[20]等領(lǐng)域.但是,由于它不具備旋轉(zhuǎn)不變性,因而很難應(yīng)用于圖像形狀的檢索與識別.
2.2單位圓盤上的U-調(diào)和基函數(shù)
本文中,我們將U-系統(tǒng)函數(shù)與調(diào)和函數(shù)結(jié)合,構(gòu)造了一類定義在單位圓盤上的基函數(shù),稱之為U-調(diào)和基函數(shù).基于這種新型的二元基函數(shù),可以方便地得到關(guān)于圖像的旋轉(zhuǎn)不變量.
因本文利用的是1次U-系統(tǒng),記un(x)是1次U-系統(tǒng)的第n(n=0,1,2,···)個基函數(shù).定義單位圓盤上的U-調(diào)和基函數(shù)為:
可以看出,U-調(diào)和基函數(shù)定義在整個單位圓盤上.根據(jù)式(11),這種基函數(shù)由角向函數(shù)與徑向函數(shù)的乘積組成.角向為三角調(diào)和函數(shù),徑向為傳統(tǒng)1次U-系統(tǒng)函數(shù).圖3顯示了若干U-調(diào)和基函數(shù)的圖像(均為實部).其中,圖3(a)~3(d)對應(yīng)的徑向基函數(shù)為u2(r),如圖4(a)所示;圖3(e)~3(h)對應(yīng)的徑向基函數(shù)為u5(r),如圖4(b)所示;圖3(i)~3(l)對應(yīng)的徑向基函數(shù)為u8(r),如圖4(c)所示;圖3(m)~3(p)對應(yīng)的徑向基函數(shù)為u10(r),如圖4(d)所示.而這四組U-調(diào)和基函數(shù)的角向函數(shù)分別為eimθ,m=0,1,2,3.
圖3 U-調(diào)和基函數(shù)圖像Fig.3U-harmonic basis functions
2.3二維旋轉(zhuǎn)不變U變換
設(shè)定義在單位圓盤上的圖像f(r,θ),則它的二維旋轉(zhuǎn)不變U變換為:
其中,[·]H表示復(fù)共軛,Mnm為圖像f(r,θ)的旋轉(zhuǎn)不變U變換系數(shù),n=0,1,2,···,m= 0,±1,±2,···.
圖4 U-調(diào)和基函數(shù)的徑向基Fig.4The radial kernels of U-harmonic basis functions
這里需要指出的是,式(10)與式(12)分別是平面上的兩種二元U-系統(tǒng)變換,且都是張量積形式.但兩者有本質(zhì)的區(qū)別,前者定義在笛卡爾坐標系下,沒有旋轉(zhuǎn)不變性;而后者定義在極坐標系下,很容易得到圖像的旋轉(zhuǎn)不變量,從而可以應(yīng)用到目標識別、分類等圖像不變描述的應(yīng)用中.
本文提出的旋轉(zhuǎn)不變U變換與傳統(tǒng)的正交旋轉(zhuǎn)不變矩(如Zernike矩)具有相同的表達形式,但我們采用了一類正交分段多項式函數(shù)(1次U-系統(tǒng))代替?zhèn)鹘y(tǒng)的徑向多項式,因而具有諸多特別的性質(zhì).
3.1旋轉(zhuǎn)不變性
定理1(旋轉(zhuǎn)不變性).圖像旋轉(zhuǎn)前后,它的二維旋轉(zhuǎn)不變U變換系數(shù)的模‖Mnm‖不變.
證明.設(shè)圖像f(r,θ)旋轉(zhuǎn)了角度φ,那么旋轉(zhuǎn)后的圖像f'(r,θ)=f(r,θ+φ),則旋轉(zhuǎn)后圖像的U變換系數(shù)為
3.2多分辨率性
從U-系統(tǒng)的構(gòu)造過程可知,每個U-系統(tǒng)基函數(shù)經(jīng)“2倍壓縮”與“正、反復(fù)制”,成為下一組對應(yīng)U-系統(tǒng)基函數(shù)在[0,1/2)與(1/2,1]上的部分.因此下一組基函數(shù)的分辨率比上一組增加一倍,如此迭代下去.因此,U-調(diào)和基函數(shù)Unm(r,θ)在徑向上具有多分辨率特性.另外,隨著m的增大,Unm(r,θ)角向的分辨率也逐漸增加.因此,利用U-調(diào)和基函數(shù)Unm(r,θ),可以同時獲得圖像在徑向和角向上的多分辨率特征.
3.3函數(shù)支撐
同樣通過U-系統(tǒng)構(gòu)造過程可知,每個U-系統(tǒng)基函數(shù)均勻地支撐在整個[0,1]區(qū)間上,幅度平穩(wěn),如圖1所示.因此,當(dāng)利用U-系統(tǒng)進行圖像特征提取時,能夠“均勻地”捕獲圖像各處的特征.
相反地,傳統(tǒng)矩函數(shù)的徑向多項式不具有這樣的特性.圖5(a)所示為Zernike多項式Rn,10(r)系列中的前4個多項式(n=10,12,14,16)的圖像.圖5(b)為局部放大圖.可以看出,它們在定義域[0,1]上的分布非常不均勻,函數(shù)能量集中在區(qū)間的后半部分.需要強調(diào)的是,這不是特例,而是Zernike多項式的普遍現(xiàn)象.文獻[21]將這種零點非均勻分布現(xiàn)象稱為函數(shù)支撐問題.因此,在利用Zernike多項式進行圖像特征提取時,容易導(dǎo)致非必要地刻意強調(diào)圖像特定部分而抑制其他部分.
圖5 Zernike多項式函數(shù)支撐Fig.5The suppression of Zernike polynomials
3.4函數(shù)零點
傳統(tǒng)矩函數(shù)的徑向多項式(比如Zernike多項式、偽Zernike多項式)的零點數(shù)目反映了函數(shù)的震蕩程度.函數(shù)零點越多,震蕩程度越高,越能夠捕獲圖像的高頻成份.對于n階Zernike多項式Rnm(r),r∈[0,1],其零點的數(shù)目為(n-|m|)/2.而對于第n個U-系統(tǒng)基函數(shù)un(r),r∈[0,1],根據(jù)U-系統(tǒng)的序率性可知,un(r)含有n+1個零點,遠多于Zernike多項式的零點.因此,當(dāng)利用相同數(shù)量的變換基函數(shù)條件下,RIUT更能捕獲更多的圖像高頻信息.
3.5間斷性
如上所述,傳統(tǒng)旋轉(zhuǎn)不變矩的徑向基均為多項式,具有高度光滑的特點.而本文的RIUT的徑向基為U-系統(tǒng),它是一類非連續(xù)的正交分段多項式函數(shù)系,其中既包含連續(xù)型的基函數(shù),又含有大量具有各種間斷性的基函數(shù).在實際應(yīng)用中,處理對象(如圖像)通常是連續(xù)與間斷特性并存的復(fù)雜信號,因而RIUT可以更好地表達圖像的特征.
3.6離散實現(xiàn)
定義在單位圓盤上的旋轉(zhuǎn)不變U變換針對的是連續(xù)函數(shù).對于實際應(yīng)用中的數(shù)字圖像,式(12)并不能直接使用,這里給出RIUT的離散格式.
假設(shè)給定尺寸為N×N的數(shù)字圖像F(i,j),1≤i,j≥N.為了計算它的U變換,需要將F(i,j)映射到函數(shù)f(xi,yj).其中,f(xi,yj)=F(i,j),xi=(2i-N-1)/N,yi=(2j-N-1)/N,則定義在離散像素集上圖像f(xi,yj)的U變換系數(shù)Mnm的計算公式為:
3.7RIUT描述子
在實際應(yīng)用中,只有旋轉(zhuǎn)不變性往往是不夠的.一般來說,至少還應(yīng)具有平移不變性與縮放不變性.后兩種不變特征可以通過適當(dāng)?shù)膱D像預(yù)處理得到,從而可得到一類具有旋轉(zhuǎn)(Rotation)、縮放(Scale)及平移(Translation)不變性的RIUT描述子.具體步驟如下:
假設(shè)f(x,y)為笛卡爾坐標系下的二值圖像,為了得到平移不變性,將圖像中形狀目標的質(zhì)心平移到坐標原點,作位置歸一化處理即可,如下:
其中,g(xT,yT)為位置歸一化后的圖像,為原圖像f(x,y)的質(zhì)心,計算公式為:
其中,m00,m10及m01為f(x,y)的幾何矩.
為了得到縮放不變性,需要將圖像中的形狀目標尺寸進行歸一化處理,如下:
而β為預(yù)定義的形狀目標的面積.
因此,圖像的平移與縮放不變性可通過如下的預(yù)處理得到:
最后,對預(yù)處理后的圖像o(x,y)作旋轉(zhuǎn)不變U變換,得到相應(yīng)的RIUT系數(shù).將這些系數(shù)取模后得到的向量即為圖像f(x,y)的RIUT描述子.圖6為計算圖像RIUT描述子的流程.
圖6 圖像的RIUT描述子Fig.6RIUT descriptor
4.1旋轉(zhuǎn)不變性
定理1證明了RIUT具有旋轉(zhuǎn)不變性,這里將通過實驗進行測試及驗證.
實驗1.選擇一張灰度Lena圖像,尺寸為128像素×128像素.因RIUT定義在單位圓盤上,因此只選擇Lena圖像的相應(yīng)部分(即),如圖7(a)所示.假設(shè)旋轉(zhuǎn)了α角度(如圖7(b)和7(c)),圖像旋轉(zhuǎn)前后的RIUT系數(shù)模分別為計算它們之間的平方誤差(Mean square error,MSE),定義如下:
其中,L為RIUT系數(shù)的數(shù)目.本實驗中,我們計算了徑向函數(shù)與角向函數(shù)均為前128項的RIUT系數(shù),共16384個.
圖7 Lena圖像旋轉(zhuǎn)示例Fig.7Rotation examples of Lena image
我們對圖7(a)從0°到90°,每間隔2.25°旋轉(zhuǎn)一次,一共得到41張圖像,分別計算旋轉(zhuǎn)后圖像與原始圖像的MSE,結(jié)果如圖8所示.實驗結(jié)果表明,忽略因圖像旋轉(zhuǎn)而進行重采樣引入的誤差,RIUT系數(shù)模值是不變的,確實是一種旋轉(zhuǎn)不變量.
圖8 旋轉(zhuǎn)圖像的MSEFig.8The MSE of rotated images
4.2二值圖像檢索
構(gòu)造具有旋轉(zhuǎn)不變性的特征在不變模式識別中具有重要的應(yīng)用價值,理論與實驗結(jié)果表明,本文提出的RIUT具有良好的旋轉(zhuǎn)不變性.本節(jié)我們基于RIUT描述子,將RIUT應(yīng)用于二值圖像檢索中,并與經(jīng)典的旋轉(zhuǎn)不變矩方法,包括Zernike矩(ZM)、偽Zernike矩(PZM)及正交Fourier-Mellin矩(OFMM)進行比較.
在下面的實驗中,我們選取標準圖像檢索測試集MPEG-7.該測試集包含若干圖像數(shù)據(jù)庫以針對不同的測試目的.RIUT與傳統(tǒng)的旋轉(zhuǎn)不變矩都是圖像區(qū)域變換,因此我們選擇MPEG-7測試集中的區(qū)域檢索數(shù)據(jù)庫CE2-A2,CE2-A4和CE2-B作為測試數(shù)據(jù)庫,分別在下面的實驗2至實驗4中描述.
實驗2.CE2-A2圖像庫是專門針對旋轉(zhuǎn)魯棒性檢驗的測試數(shù)據(jù)庫.該庫共包含2921張二值圖像,分為21組.其中前20組是已分類圖像,每組包含7張圖像,由一張標準圖像經(jīng)不同的旋轉(zhuǎn)變換得到,如圖9所示.剩余未經(jīng)分類的2781張圖像在第21組中.
圖9 CE2-A2庫中圖像示例Fig.9Images in CE2-A2 data set
檢索精度的指標為“Bull's eye”算法(Bull's eye performance,BEP)(下同),即考慮最接近查詢對象的2m個圖像來計算檢索正確率,這里m為每類圖像中的圖像數(shù)目(如本測試庫中m=7).3種矩方法采用的階數(shù)均為8(即最高為7次多項式),RIUT則采用前8項U-系統(tǒng)基函數(shù).
表1給出了本文方法RIUT及經(jīng)典正交矩方法的檢索精度結(jié)果.雖然這些方法在理論上都具有旋轉(zhuǎn)不變性,但從實驗結(jié)果可以看出,本文的RIUT方法具有更好的旋轉(zhuǎn)不變魯棒性.
表1 各方法檢索精度(CE2-A2圖像庫)(%)Table 1Retrieval precision of different methods(CE2-A2 image data set)(%)
實驗3.CE2-A4圖像庫包含3101張二值圖像,分為31組.其中前30組是已分類圖像,每組包含11張圖像,由一張標準圖像經(jīng)不同的旋轉(zhuǎn)、縮放、平移及透視變換得到,如圖10所示.第31組包含2771張各不相同的未分類圖像.
圖10 CE2-A4庫中圖像示例Fig.10Images in CE2-A4 data set
表2給出了各方法的檢索精度結(jié)果.從實驗結(jié)果明顯看出,RIUT方法優(yōu)于傳統(tǒng)的旋轉(zhuǎn)不變矩方法.
表2 各方法檢索精度(CE2-A4圖像庫)(%)Table 2Retrieval precision of different methods(CE2-A4 image data set)(%)
實驗4.CE2-B圖像庫包含2801張不同的二值商標圖像,分成11組.其中,前10組是已分類商標圖像,每組中包含的相似商標數(shù)目見表3.這些商標以形狀相似為分組準則,比如三角形商標、方形商標、圓形商標等,如圖11所示.
表3 CE2-B庫中前10組相似商標數(shù)目Table 3The similar trademarks number for the first ten groups in CE2-B data set
表4給出了每組商標的檢索精度結(jié)果,其中加粗數(shù)字為每組的最高檢索結(jié)果.可以看出,ZM方法與RIUT分別在4組商標中取得最高檢索結(jié)果,而PZM方法在2組中取得最高結(jié)果.表5為這10組檢索結(jié)果的平均值,可以看出,本文的RIUT仍取得最好結(jié)果.
表4 每組商標的檢索精度(%)Table 4Retrieval precision for each group(%)
圖11 CE2-B庫中商標圖像示例Fig.11Images in CE2-B data set
表5 平均檢索精度(%)Table 5The average retrieval precision(%)
本文基于一類正交分段多項式函數(shù)系U-系統(tǒng),提出了一類新的二維旋轉(zhuǎn)不變U變換RIUT.不同于以往的定義在L2[0,1]2上的二維張量積形式的U-系統(tǒng),RIUT通過將U-系統(tǒng)函數(shù)與調(diào)和函數(shù)相結(jié)合而獲得旋轉(zhuǎn)不變性.RIUT有效避免了傳統(tǒng)矩中高次多項式的計算,有效降低了計算復(fù)雜度.更重要的是,由于U-系統(tǒng)具有諸多良好的特性,比如序率性、函數(shù)均勻支撐、連續(xù)/間斷并存等,使得RIUT在圖像特征提取方面具有更多的優(yōu)勢.最后,在標準圖像庫上進行二值圖像檢索測試,結(jié)果表明RIUT可以得到更好的檢索結(jié)果.在未來的工作中,我們將進一步分析RIUT的性質(zhì),并將其拓展到更多的實際應(yīng)用中.
References
1 Teague M R.Image analysis via the general theory of moments.Journal of the Optical Society of America,1980, 70(8):920-930
2 Teh C H,Chin R T.On image analysis by the methods of moments.IEEE Transactions on Pattern Analysis and Machine Intelligence,1988,10(4):496-513
3 Kan C,Srinath M D.Invariant character recognition with Zernike and orthogonal Fourier-Mellin moments.Pattern Recognition,2002,35(1):143-154
4 Ghosal S,Mehrotra R.Detection of composite edges.IEEE Transactions on Image Processing,1994,3(1):14-25
5 Gao Shi-Yi,Zhao Ming-Yang,Zhang Lei,Zou Yuan-Yuan. Improved algorithm about subpixel edge detection of image based on Zernike orthogonal moments.Acta Automatica Sinica,2008,34(9):1163-1168(高世一,趙明揚,張雷,鄒媛媛.基于Zernike正交矩的圖像亞像素邊緣檢測算法改進.自動化學(xué)報,2008,34(9):1163-1168)
6 Wang L Z,Healey G.Using Zernike moments for the illumination and geometry invariant classification of multispectral texture.IEEE Transactions on Image Processing,1998,7(2):196-203
7 Chen Z,Sun S K.A Zernike moment phase-based descriptor for local image representation and matching.IEEE Transactions on Image Processing,2010,19(1):205-219
8 Flusser J,Suk T,Zitova B.Moments and Moment Invariants in Pattern Recognition.UK:John Wiley&Sons,2009.
9 Sheng Y L,Shen L X.Orthogonal Fourier-Mellin moments for invariant pattern recognition.Journal of the Optical Society of America A,1994,11(6):1748-1757
10 Chong C W,Raveendran P,Mukundan R.A comparative analysis of algorithms for fast computation of Zernike moments.Pattern Recognition,2003,36(3):731-742
11 Shu H Z,Luo L M,Coatrieux J L.Moment-based approaches in imaging part 3:computational considerations. IEEE Engineering in Medicine and Biology Magazine,2008,27(3):89-91
12 Li Z M,Men X P,Li H.3D model retrieval based on U system rotation invariant moments.In:Proceedings of the 2nd International Conference on Pervasive Computing and Applications.Birmingham:IEEE,2007.183-188
13 Liu Yu-Jie,Li Zong-Min,Li Hua,Qi Dong-Xu.3D U system moment and 3D model retrieval.Journal of Computer-Aided Design&Computer Graphics,2006,18(8):1111-1116(劉玉杰,李宗民,李華,齊東旭.三維U系統(tǒng)矩與三維模型檢索.計算機輔助設(shè)計與圖形學(xué)學(xué)報,2006,18(8):1111-1116)
14 Chen Wei,Zhang Xiao-Ting.Orthogonal rotation-invariant V moments and application to image reconstruction.Acta Automatica Sinica,2015,41(2):376-385(陳偉,張曉婷.正交旋轉(zhuǎn)不變V矩及其在圖像重建中的應(yīng)用.自動化學(xué)報,2015,41(2):376-385)
15 Feng Y Y,Qi D X.A sequence of piecewise orthogonal polynomials.SIAM Journal of Mathematical Analysis,1984,15:834-844
16 Qi Dong-Xu,Song Rui-Xia,Li Jian.Discontinuous Orthogonal Functions.Beijing:Scientific Press,2011.(齊東旭,宋瑞霞,李堅.非連續(xù)正交函數(shù).北京:科學(xué)出版社,2011.)
17 Qi Dong-Xu,Tao Chen-Jun,Song Rui-Xia,Ma Hui,Sun Wei,Cai Zhan-Chuan.Representation for a group of parametric curves based on the orthogonal complete U-system. Chinese Journal of Computers,2006,29(5):778-785(齊東旭,陶塵鈞,宋瑞霞,馬輝,孫偉,蔡占川.基于正交完備U-系統(tǒng)的參數(shù)曲線圖組表達.計算機學(xué)報,2006,29(5):778-785)
18 Cai Zhan-Chuan,Sun Wei,Qi Dong-Xu.A classification and recognition method for planar figures based on complete orthogonal U-system.Journal of Software,2006,17(Suppl.):21-27(蔡占川,孫偉,齊東旭.基于正交完備U-系統(tǒng)的圖形分類與識別方法.軟件學(xué)報,2006,17(增刊):21-27)
19 Ding Wei,Yan Wei-Qi,Qi Dong-Xu.Digital image watermarking based on U-system.Journal of Image and Graphics, 2001,6(6):552-557(丁瑋,閆偉齊,齊東旭.基于U系統(tǒng)的數(shù)字圖象水印技術(shù).中國圖象圖形學(xué)報,2001,6(6):552-557)
20 Xiong Gang-Qiang,Yu Jian-De,Xiong Chang-Zhen,Qi Dong-Xu.Reversible factorization of U orthogonal transform and image lossless coding.Journal of Computer Research and Development,2012,49(4):856-863(熊剛強,余建德,熊昌鎮(zhèn),齊東旭.U-正交變換的可逆實現(xiàn)及其圖像無損編碼.計算機研究與發(fā)展,2012,49(4):856-863)
21 Abu-Mostafa Y S,Psaltis D.Recognitive aspects of moment invariants.IEEE Transactions on Pattern Analysis and Machine Intelligence,1984,6(6):698-706
陳偉江南大學(xué)數(shù)字媒體學(xué)院講師. 2013年獲得澳門科技大學(xué)理學(xué)博士學(xué)位.主要研究方向為計算機圖形學(xué)和圖像處理.
E-mail:wchen_jdsm@163.com
(CHEN WeiLecturer at the School of Digital Medial,Jiangnan University.He received his Ph.D.degree from Macau University of Science and Technology in 2013.His research interest covers computer graphics and image processing.)
2D Rotation-invariant U Transform and Its Application
CHEN Wei1
U-system is a class of orthogonal piecewise-polynomial function system in L2[0,1],and its generalized U-system in L2[0,1]2with tensor-product form is not rotation-invariant.In this paper,we present a novel 2D transform named rotation-invariant U transform(RIUT).The construction of RIUT combines U-system functions with harmonic functions so that the object's rotation is transformed into its phase's translation and the modulus keeps unchanged. Compared with the classical rotation-invariant moments,such as Zernike moment,RIUT has many special properties,suggesting an applying potential in image feature extraction.The experiment results for binary image retrieval show that RIUT method has a higher retrieval precision.
Rotation-invariant,U-system,Zernike moment,binary image retrieval
Manuscript October 12,2015;accepted March 10,2016
10.16383/j.aas.2016.c150630
Chen Wei.2D rotation-invariant U transform and its application.Acta Automatica Sinica,2016,42(9):1380-1388
2015-10-12錄用日期2016-03-10
國家自然科學(xué)基金(61602213,61170320,61402201),浙江大學(xué)CAD&CG國家重點實驗室開放課題(A1609),中央高?;究蒲袠I(yè)務(wù)費專項資金(JUSRP11416),國家科技支撐計劃(2015BAH54F00)資助
Supported by National Natural Science Foundation of China(61602213,61170320,61402201),the Open Project Program of the State Key Laboratory of CAD&CG of Zhejiang University(A1609),F(xiàn)undamental Research Funds for the Central Universities of China(JUSRP11416),and National Science and Technology Support Program(2015BAH54F00)
本文責(zé)任編委黃慶明
Recommended by Associate Editor HUANG Qing-Ming
1.江南大學(xué)數(shù)字媒體學(xué)院無錫214122
1.School of Digital Media,Jiangnan University,Wuxi 214122