郭恒光 朱默 趙亮
摘 要:為了有效提取圖像的紋理特征,充分利用紋理的方向性以及紋理在不同方向具有不同頻率成分這兩個(gè)特性,提出了基于多尺度方向分解的紋理特征提取方法。首先根據(jù)Radon變換的方法檢測(cè)紋理方向,Radon變換各角度投影向量方差的二階導(dǎo)數(shù)最小值對(duì)應(yīng)的投影角度即為紋理方向。然后根據(jù)得到的圖像紋理方向信息,利用可控金字塔將圖像沿紋理方向進(jìn)行三個(gè)尺度的分解,得到紋理方向上圖像的多尺度子帶圖像。最后以三個(gè)尺度子帶圖像的Legendre矩和Zernike矩作為圖像的紋理特征。分別在Brodatz和VisTex數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)驗(yàn)證,與其他方法的對(duì)比結(jié)果表明,采用多尺度分解的方法提取紋理,用于紋理圖像識(shí)別時(shí),識(shí)別準(zhǔn)確率高,抗噪聲能力強(qiáng)。
關(guān)鍵詞:方向分解; 可控金字塔變換;紋理特征
中圖分類號(hào):TP391 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
Abstract:In order to extract the texture feature of the image effectively, the texture feature extraction method based on multiscale orientation decomposition was proposed, which can make full use of the texture orientation and the property that the texture has different frequency component at different orientation. Firstly, the texture orientation was detected by the Radon transform, the projection angle corresponding to the minimum second derivative value of the projection vector variance of the Radon transform at different angle is the orientation of the texture. Secondly, according to the texture orientation information of image, the steerable pyramid transform was used to decompose the image multiscale along the texture orientation, and the multiscale subband of the image can be obtained at the texture orientation. At last, the Legendre moment and the Zernike moment of each scale subband image were used as the texture feature of the image. The proposed method was verified in the Brodatz and VisTex datasets. Compared with other methods, the results show that the proposed method can reach the higher correct classification rate, and has stronger anti-noise ability.
Key words:orientation decomposition; steerable pyramid transform; texture feature extraction
紋理是圖像的一個(gè)非常重要的特征,在圖像識(shí)別[1-4]、圖像檢索[5-8]以及圖像匹配[9-12]等領(lǐng)域起著重要的作用。對(duì)圖像紋理進(jìn)行特征描述就是研究紋理的特點(diǎn),描述紋理的本質(zhì)特征,進(jìn)而實(shí)現(xiàn)根據(jù)紋理特征對(duì)圖像進(jìn)行識(shí)別等目的。紋理是有方向性的,紋理的方向性是表達(dá)紋理的一種重要特征[13-14],而且沿不同方向紋理所包含的頻率成分是不同的[15]。文獻(xiàn)[16]的方法是在采用Radon變換檢測(cè)紋理方向的基礎(chǔ)上,將圖像根據(jù)紋理方向進(jìn)行旋轉(zhuǎn),然后對(duì)旋轉(zhuǎn)后的圖像進(jìn)行小波變換,最后以各子帶圖像的能量和不一致性作為紋理特征;文獻(xiàn)[17]的方法是對(duì)紋理圖像進(jìn)行多尺度和多方向的Gabor變換,以Gabor變換后圖像能量的均值和標(biāo)準(zhǔn)差作為紋理特征;文獻(xiàn)[18]的方法對(duì)紋理圖像進(jìn)行多尺度和多方向的Gabor wavelet變換,以變換后圖像的能量的均值和標(biāo)準(zhǔn)差作為紋理特征向量。在此基礎(chǔ)上本文利用可控金字塔變換[19],提出了基于多尺度方向分解的紋理特征提取方法。
可控金字塔變換是由Simoncelli和Freeman在方向可控濾波器理論[20]的基礎(chǔ)上提出的一種圖像的線性多分辨率分析方法,可以將圖像分解為不同尺度和不同方向。與傳統(tǒng)的金字塔分解和小波分解相比較,可控金字塔變換將圖像的尺度信息和局部信息相結(jié)合,不僅保留了緊致集正交小波的特點(diǎn),而且子帶方向具有可調(diào)節(jié)性。通過對(duì)特征空間進(jìn)行一些操縱,可以實(shí)現(xiàn)旋轉(zhuǎn)不變性,這些性質(zhì)是大部分小波變換所不具備的。
本文方法對(duì)圖像進(jìn)行多尺度方向分解時(shí),首先確定圖像紋理方向,然后根據(jù)得到的圖像紋理方向信息,利用可控金字塔將圖像沿紋理方向進(jìn)行多尺度分解,得到圖像在紋理方向上的多尺度子帶圖像。計(jì)算各尺度子帶圖像的Legendre矩和Zernike矩,以矩特征作為圖像的紋理特征。
1 可控金字塔變換
1.1 可控濾波器
由圖1可以看出,可控金字塔分解首先通過高通濾波器H0和低通濾波器L0將圖像分解為高通子帶和低通子帶,采用k個(gè)方向帶通濾波器B0,B1,…,Bk-1和一個(gè)窄帶低通濾波器L1將低通子帶分解為k個(gè)方向的帶通子帶和一個(gè)低通子帶,然后對(duì)低通子帶進(jìn)行下采用操作,下一級(jí)分解通過對(duì)下采樣后的低通子帶應(yīng)用B0,B1,…,Bk-1和L1進(jìn)行遞歸分解。
2 圖像多尺度方向分解
本文對(duì)圖像進(jìn)行多尺度方向分解時(shí),首先根據(jù)Radon變換的方法確定圖像紋理方向,然后根據(jù)得到的圖像方向信息,利用方向可控濾波器組將圖像沿紋理方向進(jìn)行多尺度分解,得到紋理方向上多個(gè)尺度的子帶圖像。
2.1 紋理方向檢測(cè)
本文根據(jù)Radon變換的方法檢測(cè)紋理方向[21],首先在若干角度對(duì)圖像進(jìn)行Radon變換,然后計(jì)算Radon變換各投影角度投影向量的方差,最后根據(jù)各角度投影向量方差的二階導(dǎo)數(shù)確定紋理方向,二階導(dǎo)數(shù)最小值對(duì)應(yīng)的投影角度即為紋理方向。
如圖2(b)所示,檢測(cè)出的圖2(a)所示紋理圖像的紋理方向?yàn)?1度,與圖像紋理的實(shí)際方向比較相符。
4 實(shí)驗(yàn)結(jié)果與分析
4.1 實(shí)驗(yàn)設(shè)計(jì)
為了有效評(píng)價(jià)所提出的紋理特征提取算法的有效性,將本算法與其他文獻(xiàn)的方法進(jìn)行比較,選取的紋理圖像集為在文獻(xiàn)[25]中所使用的兩種紋理數(shù)據(jù)集。
第一個(gè)數(shù)據(jù)集是根據(jù)Brodatz紋理集中所有的112種紋理圖像得到的,將Brodatz紋理集中各紋理圖像以10°為間隔,旋轉(zhuǎn)10°到360°,從旋轉(zhuǎn)后的紋理圖像的中心提取大小為256×256的子圖像作為第一個(gè)數(shù)據(jù)集的樣本,則第一個(gè)數(shù)據(jù)集共包含112×36=4032幅紋理圖像,稱之為Brodatz數(shù)據(jù)集。部分Brodatz數(shù)據(jù)集紋理圖像如圖6(a)所示。
第二個(gè)數(shù)據(jù)集根據(jù)VisTex紋理集中的54種紋理圖像得到的,每幅紋理圖像大小為512×512,將每幅圖像分為四個(gè)不相重疊的,大小為256×256的子圖像,以10°為間隔,旋轉(zhuǎn)10°到160°,然后從旋轉(zhuǎn)后的子圖像中提取大小為128×128的子圖像,共得到54×4×16=3456幅圖像,稱之為VisTex數(shù)據(jù)集。部分VisTex數(shù)據(jù)集紋理圖像如圖6(b)所示。
本文實(shí)驗(yàn)中,參與比較的紋理特征提取方法包括:文獻(xiàn)[16]的方法,文獻(xiàn)[17]的方法和文獻(xiàn)[18]的方法。
4.2 實(shí)驗(yàn)過程
為了綜合評(píng)價(jià)各紋理特征提取算法的性能,本文中進(jìn)行兩組實(shí)驗(yàn),實(shí)驗(yàn)一是在原始數(shù)據(jù)集上進(jìn)行的,實(shí)驗(yàn)二是在添加高斯白噪聲的數(shù)據(jù)集上進(jìn)行的。在實(shí)驗(yàn)二中,為了評(píng)價(jià)各紋理特征提取算法的抗噪聲干擾能力,在Brodatz數(shù)據(jù)集和VisTex數(shù)據(jù)集的每幅紋理圖片上添加均值為0,信噪比(SNR)由20變化到10的高斯白噪聲。為了便于對(duì)各種方法進(jìn)行比較,采用各種紋理特征提取方法進(jìn)行紋理識(shí)別時(shí),分類器采用k近鄰法,用留一法交叉驗(yàn)證各紋理特征提取方法的性能,以識(shí)別準(zhǔn)確率作為評(píng)價(jià)指標(biāo)。
4.3 實(shí)驗(yàn)結(jié)果與分析
實(shí)驗(yàn)一的結(jié)果如表1所示。由表1所示的實(shí)驗(yàn)一的實(shí)驗(yàn)結(jié)果可以看出,本文的方法在兩個(gè)數(shù)據(jù)集上的識(shí)別準(zhǔn)確率要明顯高于其他三種方法,文獻(xiàn)[17]的方法由于只采用Gabor變換后圖像能量的均值和方差作為紋理特征,沒有考慮圖像旋轉(zhuǎn)的問題,因此識(shí)別準(zhǔn)確率較低,文獻(xiàn)[16]的方法和文獻(xiàn)[18]的方法所提取的特征由于都具有旋轉(zhuǎn)不變性,因此識(shí)別率均比文獻(xiàn)[17]的方法要高。
圖7為實(shí)驗(yàn)二的實(shí)驗(yàn)結(jié)果,圖7(a)和(b)分別是在Brodatz數(shù)據(jù)集和VisTex數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果。由圖7(a)和(b)的對(duì)比可以看出,隨噪聲水平的增加,各算法識(shí)別準(zhǔn)確率在Brodatz數(shù)據(jù)集和VisTex數(shù)據(jù)集上的變化趨勢(shì)大致相同,文獻(xiàn)[17]的方法抗噪能力最差,隨著噪聲水平的增加,在兩個(gè)數(shù)據(jù)集上識(shí)別準(zhǔn)確率變化都比較大;文獻(xiàn)[16]的方法、文獻(xiàn)[18]的方法和本文的方法在兩個(gè)數(shù)據(jù)集上隨著噪聲水平的增加,識(shí)別準(zhǔn)確率的變化都比較小,本文的方法抗噪能力稍微優(yōu)于文獻(xiàn)[16]的方法和文獻(xiàn)[18]的方法。
由以上兩個(gè)實(shí)驗(yàn)看出,提出的基于多尺度方向分解的紋理特征提取方法不僅識(shí)別準(zhǔn)確率高,而且抗噪聲能力也強(qiáng)。
5 結(jié) 論
針對(duì)圖像紋理特征提取的問題,提出了基于多尺度方向分解的紋理特征提取方法,能夠充分利用紋理的方向性以及紋理在不同方向具有不同頻率成分這兩個(gè)特性。在確定圖像紋理方向的基礎(chǔ)上,利用可控金字塔變換將圖像沿紋理方向進(jìn)行多尺度分解,可控金字塔變換結(jié)合了圖像的尺度信息和局部信息,而且具有旋轉(zhuǎn)不變性。最后,以各尺度子帶圖像的Legendre矩和Zernike矩作為圖像的紋理特征。在Brodatz數(shù)據(jù)集和VisTex數(shù)據(jù)集上的實(shí)現(xiàn)表明,本方法不僅識(shí)別準(zhǔn)確率高,而且抗噪聲能力也強(qiáng)。
參考文獻(xiàn)
[1]王雷宏, 陳永生, 鄭玉紅. 基于葉片數(shù)字紋理特征自動(dòng)識(shí)別胡頹子屬植物[J]. 中國農(nóng)學(xué)通報(bào),2020,36(11):20-25.
[2]陳雪鑫, 孫玥, 苗圃,等. 基于多級(jí)紋理特征的深度信念網(wǎng)絡(luò)人臉識(shí)別算法[J]. 計(jì)算機(jī)應(yīng)用與軟件,2020,37(4):156-163.
[3]李巨虎, 范睿先 ,陳志泊. 基于顏色和紋理特征的森林火災(zāi)圖像識(shí)別[J]. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,48(1):70-83.
[4]黃興華, 葉軍一, 熊杰. 基于紋理特征融合的道路垃圾圖像識(shí)別及提取[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2019,40(11):3212-3218.
[5]秦智康, 張衡陽. 基于變換域中的自適應(yīng)紋理圖像檢索[J]. 液晶與顯示,2020,35(3):281-286.
[6]彭金喜, 蘇遠(yuǎn)歧, 薛笑榮. 基于深度學(xué)習(xí)和同生矩陣的SAR圖像紋理特征檢索方法[J]. 計(jì)算機(jī)科學(xué),2019,46(S1):196-199.
[7]蘭蓉, 郭思忱, 賈世英. 基于紋理與形狀特征融合的刑偵圖像檢索算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2018,39(4):1106-1110.
[8]蘭蓉, 馬威. 基于改進(jìn)紋理特征的現(xiàn)堪圖像檢索算法[J]. 西安郵電大學(xué)學(xué)報(bào),2019,24(4):36-42.
[9]程詩夢(mèng), 周之平, 李忠民. 結(jié)合多維定標(biāo)和局部紋理特征的改進(jìn)SIFT匹配算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2017,38(11):3087-3092.
[10]朱慶, 陳崇泰, 胡翰,等. 顧及紋理特征的航空影像自適應(yīng)密集匹配方法[J]. 測(cè)繪學(xué)報(bào),2017,46(1):62-72.
[11]陳寧, 楊永全. 基于紋理特征匹配的快速目標(biāo)分割方法[J]. 電子設(shè)計(jì)工程,2017,25(23):39-42.
[12]郭令, 趙博, 刁海南. 一種改進(jìn)的指紋紋理匹配算法[J]. 計(jì)算機(jī)工程與應(yīng)用,2006,42(32):180-182.
[13]余道喜. 紋理方向檢測(cè)的光學(xué)實(shí)現(xiàn)方法研究[D]. 重慶: 重慶大學(xué), 2016.
[14]王震, 王執(zhí)銓, 茅耀斌. 基于紋理方向的描述和對(duì)具有方向性圖象的分類與分割[J]. 中國圖象圖形學(xué)報(bào),2002,7(12):1279-1283.
[15]PAN W M, BUI T D, SUEN C Y. Rotation invariant texture classification by ridgelet transform and frequency-orientation space decomposition[J]. Signal Processing, 2008,88(1):189-199.
[16]JAFARI K, SOLTANIAN Z H. Radon transform orientation estimation for rotation invariant texture analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(6):1004-1008.
[17]BIANCONI F, FERNANDEZ A. Evaluation of the effects of Gabor filter parameters on texture classification[J]. Pattern Recognition, 2007,40(12):3325-3335.
[18]ARIVAZHAGAN S L. GANESAN S P. Texture classification using Gabor wavelets based rotation invariant features[J]. Pattern Recognition Letters, 2006,27(16):1976-1982.
[19]SIMONCELLI E P, FREEMAN W T. The steerable pyramid: a ?flexible architecture for multi-scale derivative computation[C]// Proceedings of 1995 International Conference on Image Processing,1995:444-447.
[20]FREEMAN W T, SIMONCELLI E P, ADELSON E.H. The design and use of steerable filters[J]. IEEE Transactions on Pattern Recognition and Machine Intelligence,1991,13(9):891-906.
[21]JAFARI K K, SOLTANIAN Z H. Radon transform orientation estimation for rotation invariant texture analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005,27(6):1004-1008.
[22]HU M K. Visual pattern recognition by moment invariants[J]. IEEE Transactions Information Theory,1962,8(1):179-187.
[23]TEAGUE M. Image analysis via the general theory of moments[J]. Journal of Optimal Society of America,1980,70(8):920-930.
[24]張輝.矩的快速算法研究和不變量構(gòu)造及應(yīng)用[D]. 南京:東南大學(xué),2006.
[25]WANG X, GUO F X, XIAO B, et al. Rotation invariant analysis and orientation estimation method for texture classification based on radon transform and correlation analysis[J]. Journal of Visual Communication and Image Representation,2010,21(1):29-32.