包勝橋 許恢斌 王浩 劉杰
摘 要:基于Backes Andre Ricardo等人提出的“構(gòu)造伴生動態(tài)演化網(wǎng)絡”、生成“高維解釋向量”的紋理圖片分類法,研究了Kylberg紋理圖像庫的分類問題。通過將數(shù)據(jù)集圖片樣本進行二次分割以減少該算法預處理計算量、提出了構(gòu)建紋理網(wǎng)絡時的“網(wǎng)絡頂點隨機化、抽樣采集”策略,該思路可進一步減少算法的時間開銷。該類紋理圖片數(shù)據(jù)高維幾何數(shù)字特征的提取流程易于實現(xiàn),擴展了原算法的適用范圍。數(shù)值結(jié)果表明算法對旋轉(zhuǎn)操作、噪聲干擾具有一定的魯棒性,具備一定潛在應用前景。
關(guān)鍵詞:紋理分析, 復雜網(wǎng)絡, 紋理簽名, Kylberg紋理數(shù)據(jù)集
中圖分類號:TP391 ? ? ?文獻標識碼:A
Abstract:Based on the newly proposed texture analysis method on shape analysis via constructing explanatory variables with associated dynamic evolutionary complex networks proposed by Backes Andre Ricardo et al, this paper studies the classification problem of Kylberg texture image library. The image samples of the dataset are segmented twice to reduce the computational complexity of the algorithm. An improved strategy of "network vertex randomization and sampling collection" is also proposed for further reducing the calculation time on CPU. The extraction process of highdimensional geometric digital features of this kind of texture image data is easy to be implemented, which extends the scope of application of the original algorithm. Numerical results show that the algorithm is robust to rotation operation and noise interference. It has potential application prospect in related research fields.
Key words:texture analysis; complex network; texture signature; Kylberg texture database
紋理分析是圖像處理和計算機視覺中的一個基本問題。在目標識別、遙感和基于內(nèi)容的圖像檢索等諸多應用領(lǐng)域中,它都是一個關(guān)鍵問題。盡管對于紋理沒有確切的定義,但它是一個很容易被人理解的屬性,并且是一個豐富的視覺新消息來源。圖像紋理通常被定義為像素強度的空間變化函數(shù)。紋理模式通常包含微紋理和宏紋理,前者由若干紋理基本體集合構(gòu)成,后者表征這些基本體的層次空間排列特征。對圖像紋理的感知取決于紋理基本體的空間大?。捍蠡倔w產(chǎn)生宏觀紋理,小基本體產(chǎn)生微觀紋理[1-2]。常見圖像特征包含內(nèi)部特征與外部特征:前者包含灰度特征、紋理特征和形狀特征等;后者則主要包含圖片內(nèi)部特定幾何形狀特征。利用特征提取獲得恰當?shù)慕忉屪兞渴噶考沁M行特征選擇、分類的關(guān)鍵問題之一;而紋理分析則是通過特定的圖像處理技術(shù)抽取出紋理特征、獲得紋理的定量或定性描述的分析過程。目前,各類紋理分析技術(shù),特別是多特征融合分析技術(shù)的應用越來越廣泛[1,2]。最近,Andre Ricardo Backs等人提出了一種運用伴生復雜網(wǎng)絡來表征紋理結(jié)構(gòu)的新方法,將之用于圖形輪廓分類、圖像紋理內(nèi)容分析與解釋等領(lǐng)域,該類基于網(wǎng)絡圖分析的新穎方法能克服傳統(tǒng)輪廓分析、紋理分析的某些不足,開拓了輪廓分析、紋理分析的新視角[3-5]。Andre Ricardo Backs等人將紋理圖像轉(zhuǎn)化為復雜網(wǎng)絡后,給出了一類構(gòu)造輪廓、紋理特征解釋變量的策略,并將之與傳統(tǒng)的解釋變量構(gòu)造方法,如,一階直方圖、傅里葉分析、Gabor濾波分析、灰度共生矩陣分析、離散余弦變換、灰度差分矩陣、小波解釋、局部二進模式變分法、完全局部二進模式分析法以及局部三元模式法等生成的解釋變量的分類有效性進行了比較[3,4]。隨后,Wesley Nunes Goncalves等人則建立了類似的具有旋轉(zhuǎn)不變性的灰度像素復雜網(wǎng)絡用于人臉識別研究,也取得了較好的應用效果[5]。目前,基于復雜網(wǎng)絡建模與分析思路的各類新穎算法及其改進已在紋理分析、形狀分類、圖像檢索、多特征融合等領(lǐng)域得到了廣泛應用[6-9],逐漸引起國內(nèi)外圖形分析、圖像處理、計算機視覺等領(lǐng)域相關(guān)學者的充分關(guān)注[10-22]。
將Backes Andre Ricardo等人提出的、構(gòu)造“伴生動態(tài)演化復雜網(wǎng)絡”、生成高維解釋變量的新穎分類技術(shù)應用到紋理圖像的分類研究之中。在數(shù)據(jù)集預處理方面,為減少算法計算量,增加了將采集數(shù)據(jù)集圖片樣本進行二次分割環(huán)節(jié);進一步,在實際操作中,還改進性地提出了適合實際分類應用的隨機抽樣網(wǎng)絡頂點采集策略。后文將詳細介紹用于分類的“高維特征解釋向量”的生成策略、紋理圖像“幾何數(shù)字特征”的提取過程。通過對Kylberg紋理[23,24]圖像庫的分類研究發(fā)現(xiàn):基于該方法構(gòu)建的紋理圖像“高維解釋向量(又稱指紋向量)”能有效表征織物紋理圖像數(shù)字特征。數(shù)值結(jié)果表明此類方法具備對旋轉(zhuǎn)操作、噪聲干擾的魯棒性,具有較好的快速分類應用前景。下面將分三個部分給出相關(guān)研究方法及結(jié)果。
1 圖像紋理特征的高維幾何化解釋向量生成策略
1.1 灰度圖像的網(wǎng)絡化轉(zhuǎn)化研究主要進展
復雜網(wǎng)絡理論及其應用是新興的重要研究領(lǐng)域之一,它涉及了圖論、非線性動力學、統(tǒng)計力學等眾多科學知識和理論基礎(chǔ),呈現(xiàn)出了多學科交叉快速融合的特點。近年來,伴隨系統(tǒng)科學、統(tǒng)計學、物理學、數(shù)學、計算機與信息科學等學科交叉的進一步深入,復雜網(wǎng)絡科學與技術(shù)手段在模式識別、計算機視覺等領(lǐng)域也展現(xiàn)了廣闊的研究前景。事實上,幾乎所有的實測對象均能表征為復雜網(wǎng)絡對象,從演化視角出發(fā)的動態(tài)演化網(wǎng)絡、時空網(wǎng)絡更是拓展了復雜網(wǎng)絡領(lǐng)域的應用空間。
最近二十年,復雜網(wǎng)絡的應用覆蓋到了幾乎所有科學研究領(lǐng)域,圖像處理、計算機視覺等領(lǐng)域也先后出現(xiàn)了一些對這一科學工具展開應用的有益嘗試。如,Andre Ricardo Backs等人首先提出了圖像形狀輪廓識別的網(wǎng)絡分析方法[3]。通過圖像輪廓提取構(gòu)造伴生復雜網(wǎng)絡的方法給出了一類簡單高效的分類方法,該方法僅考慮輪廓網(wǎng)絡的拓撲結(jié)構(gòu),具有旋轉(zhuǎn)不變性、平移不變性、縮放不變性,且容噪性良好;進一步,他們還提出了一類賦權(quán)的局部像素網(wǎng)絡構(gòu)建方法,給出了灰度圖像紋理分析與分類的一類流程[4]。這些開拓性科學探索給相關(guān)領(lǐng)域的研究者提供了一類全新的紋理圖片分類研究視角。
下面的圖1給出了該類算法兩類進展的主要算法思想示意。
1.2 紋理圖片伴生網(wǎng)絡的構(gòu)造基本算法
紋理灰度圖像中,每個像素由灰度和位置二元信息刻畫,紋理可視為像素間灰度差異關(guān)聯(lián)關(guān)系的反映。
選用的紋理伴生網(wǎng)絡構(gòu)建基礎(chǔ)算法簡述如下[3]:
2 紋理圖像的高維幾何化簽名特征提取流程
上一小節(jié)提到的是基于復雜網(wǎng)絡的靜態(tài)特性,有時有限的靜態(tài)統(tǒng)計量難以反映生成伴生網(wǎng)絡的原始紋理圖片的內(nèi)蘊特征。因此,采用升維方法,對復雜網(wǎng)絡進行特征提取時可考慮動態(tài)變化和靜態(tài)結(jié)構(gòu)之間的相互作用,從演化網(wǎng)絡視角可以獲得更高維的特征向量組合作為進一步分類用解釋變量。
采用的紋理圖像的高維幾何化簽名特征提取流程具體如下:
針對最早獲得的紋理圖片伴生賦權(quán)網(wǎng)絡,可給定一個初始閾值 t0∈T ,對原始賦權(quán)網(wǎng)絡開展動態(tài)“拆解采樣”:
Step0:預處理待分類數(shù)據(jù)集。
建議將數(shù)據(jù)集的圖片樣本進行二次分割,分割成256*256、128*128,甚至更小的規(guī)格樣本,具體大小與圖片特征相關(guān)。一般對于小花型紋理圖片可劃分的更小;而對大花型紋理圖片則不宜劃分的太小。
Step1:構(gòu)造閾值集合 。
按照這樣的方式所提取的“增維”了的解釋向量可以作為一種高維幾何化簽名特征。該簽名特征通常具有針對圖片尺度縮放和旋轉(zhuǎn)的不變性、低信噪比條件下的噪聲抗干擾性和分類識別能力的魯棒性[4]。
3 實驗和分析
本小節(jié)將利用Kylberg紋理數(shù)據(jù)集[23],[24]評估本文改進后方法在工業(yè)用場景下的有效性。本文通過采集Kylberg紋理數(shù)據(jù)集中的全部圖片并進行二次劃分,數(shù)值地計算了樣本圖片集的幾何化高維數(shù)字特征,并將之用于進一步的分類研究。相關(guān)操作流程圖如圖2所示。
3.1 Kylberg紋理圖片集簡介
Kylberg Texture數(shù)據(jù)集是瑞典農(nóng)業(yè)科學大學和瑞典烏普薩拉大學圖像分中心的數(shù)據(jù)集[10,11]。該數(shù)據(jù)集有28個紋理類,每類160個獨特的紋理補?。ㄆ渲?,可選數(shù)據(jù)集則包含了每個原始圖片的12個旋轉(zhuǎn)采樣,每個類含有1920個紋理圖片),每張紋理圖片大小均為576x576像素(在實際使用中,根據(jù)用途,研究者通常會采用分割的方式增加樣本量,本文數(shù)值實驗部分還做了提出的紋理圖片分類方法的抗噪實驗,即對該數(shù)據(jù)庫中的每個圖像,通過添加高斯白噪聲、椒鹽噪聲生成新的樣本用于后續(xù)分類實驗。采用的方法是,對原始圖片約0.05%的像素點添加椒鹽噪聲和值為0,標準差為0.01的高斯噪聲)。
3.2 數(shù)值實驗及討論
數(shù)值實驗過程中,使用半徑r=3和變化閾值策略開展相關(guān)計算。具體設置時,閾值由初始閾值T_initial=0.005,步長T_incr=0.015逐漸增加,直到達到最大閾值T_max=0.530,構(gòu)成的解釋變量集合力圖得到最好分類識別效果。參考相關(guān)文獻[4]的經(jīng)驗研究結(jié)果發(fā)現(xiàn):當“能量”、“熵”和“對比度”這三個特征結(jié)合起來時,效果達到最佳。
數(shù)值實驗共使用了108個解釋量作為測試對象的特征用于分類研究(每個閾值取3個特征值,總共有36組閾值),實驗表明,此種策略下可以得到最好的識別結(jié)果。
3.2.1 采用的幾類分類算法
使用了多種分類算法檢測本文構(gòu)造高維幾何化簽名特征去分析圖片紋理算法的有效性。 具體采用的對比用算法包含:線性判別分析法(Linear Discriminant Analysis, LDA)、K最近鄰算法(KNearest Neighbor, KNN)、決策樹(Decision Tree)方法,以及支持向量機(Support Vector Machine)。
3.2.2 算法分類表現(xiàn)比較
為檢驗不同算法在數(shù)據(jù)集特征提取分類應用中的有效性,表1和表2分別給出了針對原始數(shù)據(jù)集的、應用不同算法對同一解釋變量分類分析的計算時間開銷與分類精度的具體結(jié)果。
研究表明:通過構(gòu)造紋理圖像的高維幾何化簽名特征,采用KNN、SVM、LDA、決策樹均能得到較好的分類效果,樸素貝葉斯算法僅能達到80.6%;因而,推薦開展此類紋理圖片研究時,優(yōu)先選用高效的KNN、SVM、或者LDA方法就能達到一般工業(yè)應用級別的場景需求。需要指出的是,若將得到的特征高維幾何化簽名特征解釋向量進行“歸一化”處理之后,使用同樣的算法開展分類研究,數(shù)值結(jié)果表明,所有算法均一致地得到了更高的識別準確率。采用KNN、SVM、LDA、決策樹均能得到較好的分類效果,樸素貝葉斯算法仍僅能達到84.6%,不推薦使用。
此外,由實驗結(jié)果分析可知,在未歸一化特征向量之前,KNN算法和SVM算法有著比LDA高的分類正確率,但這兩種訓練時間均比LDA所需時間高;解釋變量歸一化之后,KNN算法的識別正確率比LDA方法高,但所需要的訓練時間同樣比LDA高;綜合比較可見,采用LDA針對本數(shù)據(jù)集是最合適的分類方法。
表3和表4分別給出了針對原始數(shù)據(jù)旋轉(zhuǎn)所得數(shù)據(jù)集、應用不同算法對同一解釋變量分類分析的計算時間開銷與分類精度的具體結(jié)果。研究表明:通過構(gòu)造紋理圖像的高維幾何化簽名特征,采用KNN、SVM、LDA、決策樹均能得到較好的分類效果,樸素貝葉斯算法僅能達到85.1%;因而,本文推薦開展此類紋理圖片研究時,優(yōu)先選用高效的KNN、SVM、或者LDA方法就能達到一般工業(yè)應用級別的場景需求。
需要指出的是,若將得到的特征高維幾何化簽名特征解釋向量進行“歸一化”處理之后,使用同樣的算法開展分類研究,數(shù)值結(jié)果表明,所有算法均一致地得到了更高的識別準確率。采用KNN、SVM、LDA、決策樹均能得到較好的分類效果,樸素貝葉斯算法仍僅能達到85.1%,不推薦使用。
此外,由實驗結(jié)果分析可知,針對此類數(shù)據(jù),歸一化特征向量對分類正確率影響不大;比較可見,采用KNN針對該類數(shù)據(jù)集可以達到最佳分類效果。
表5和表6分別給出了針對原始數(shù)據(jù)添加椒鹽噪聲后所得數(shù)據(jù)集、應用不同算法對同一解釋變量分類分析的計算時間開銷與分類精度的具體結(jié)果。
研究表明:通過構(gòu)造紋理圖像的高維幾何化簽名特征,采用KNN、LDA、SVM、決策樹均能得到較好的分類效果,樸素貝葉斯算法僅能達到84.7%;因而,本文推薦開展此類紋理圖片研究時,優(yōu)先選用高效的KNN、LDA、SVM方法就能達到一般工業(yè)應用級別的場景需求。需要指出的是,若將得到的特征高維幾何化簽名特征解釋向量進行“歸一化”處理之后,使用同樣的算法開展分類研究,數(shù)值結(jié)果表明,所有算法總體上均得到了更高的識別準確率。采用KNN、SVM、LDA、決策樹均能得到較好的分類效果,樸素貝葉斯算法仍僅能達到84.7%,不推薦使用。
此外,由實驗結(jié)果分析可知,針對此類數(shù)據(jù),歸一化特征向量對分類正確率影響不大;比較可見,采用KNN針對該類數(shù)據(jù)集可以達到最佳分類效果。
表7和表8分別給出了針對原始數(shù)據(jù)添加高斯白噪聲后所得數(shù)據(jù)集、應用不同算法對同一解釋變量分類分析的計算時間開銷與分類精度的具體結(jié)果。研究表明:通過構(gòu)造紋理圖像的高維幾何化簽名特征,采用KNN、LDA、SVM均能得到較好的分類效果,決策樹、樸素貝葉斯算法分別僅能達到81.5%和68.7%;因而,本文推薦開展此類紋理圖片研究時,優(yōu)先選用高效的KNN、LDA、SVM方法就能達到一般工業(yè)應用級別的場景需求。需要指出的是,若將得到的特征高維幾何化簽名特征解釋向量進行“歸一化”處理之后,使用同樣的算法開展分類研究,數(shù)值結(jié)果表明,所有算法總體上均得到了更高的識別準確率。采用KNN、SVM、LDA、決策樹均能得到較好的分類效果,樸素貝葉斯算法仍僅能達到84.7%,不推薦使用。
此外,由實驗結(jié)果分析可知,針對此類數(shù)據(jù),歸一化特征向量僅對LDA、SVM分類正確率影響略有提升,其它三類反有下降;故認為采用LDA針對該類數(shù)據(jù)集可以達到最佳分類效果。
當然,新近針對同一數(shù)據(jù)集地相關(guān)研究表明,采用特定的充分訓練好的卷積神經(jīng)網(wǎng)絡(CNN)可以將分類的準確率提升至99.2%-99.4%左右,但該方法對重新分割樣本增加訓練樣本數(shù)量、計算開銷等方面的要求則提高了很多[12],[13]。因此,綜合訓練時間與分類精度兩方面表現(xiàn)比較,基于本文算法和本文建議的KNN、SVM、LDA等算法,在小樣本條件下,LDA分類方法的在“分類精度”和“訓練時長”兩方面的綜合表現(xiàn)無疑仍具有一定優(yōu)勢,故而本文建議讀者在類似應用場景下優(yōu)先選用此方法。
4 結(jié) 論
基于新近提出的構(gòu)造伴生動態(tài)演化復雜網(wǎng)絡生成解釋變量的紋理分析法,本文給出了紋理圖像的高維特征解釋向量生成策略與特征提取流程,數(shù)值實驗表明,基于該方法構(gòu)建的紋理圖像指紋向量能有效地表征紋理圖像數(shù)字特征、并成功用于對Kylberg紋理圖像庫的分類;此類方法具備完全的旋轉(zhuǎn)不變性、一定的噪聲抗干擾性,同時我們還指出,盡管基于Imagenet上訓練好的卷積神經(jīng)網(wǎng)絡也能在小樣本集上對紋理圖片試試較好的分類效果,但總體上,相較于文獻提出的一些深度學習分類算法而言(如文獻[12],[13]),本文建議的LDA方法仍具備所需樣本少、時間開銷不大,識別率接近的應用優(yōu)勢;且算法所需硬件配置相對較低,具有較好的工業(yè)應用前景。未來我們還將進一步嘗試降低算法復雜性和存儲占用,使得該類算法能在相關(guān)應用場景下發(fā)揮更大的作用。
參考文獻
[1]TUCERYAN M, JAIN K, Texture analysis,handbook of pattern recognition of computer vision[M].World Scientific Publishing Co., 1998:207-248.
[2]HOSSAIN S, SERIKAWA S. Texture databases—A comprehensive survey[J].Pattern Recognition Letters, 2013, 34(15): 2007-2022.
[3]BACKES R, CASANOVA D, BRUNO M. A complex networkbased approach for boundary shape analysis[J]. Pattern Recognition, 2009, 42(1):54-67.
[4]BACKES R, CASANOVA D, BRUNO M. Texture analysis and classification: A complex networkbased approach[J]. Information Sciences, 2013, 219:168-180.
[5]GONCALVES W N, ANDRADE DE, SILVA J, et al. A rotation invariant face recognition method based on complex network[C].Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications. CIARP 2010. Lecture Notes in Computer Science, Springer, Berlin, Heidelberg, 2010, 6419: 426-433.
[6]COIFMAN R, WICKERHAUSER M. Entropybased algorithms for best basis selection[J]. IEEE Transactions on Information Theory, 1992, 38(2):713-718.
[7]BOCCALETTI S, LATORA V, MORENO Y, et al. Complex networks: Structure and dynamics[J]. Physics Reports, 2006, 424(4-5):175-308.
[8]COSTA L F, RODRIGUES F A, TRAVIESO G, et al. Characterization of complex networks: A survey of measurements[J]. Advances in Physics, 2007, 56:167-242.
[9]COMIN C H, PERON T, SILVA F N, et al., Complex systems: features, similarity and connectivity, Physics Reports, 2020, (861):1-41.
[10]BAILEY I, BACKES A, WALSH P, et al. Image analysis of weaverbird nests reveals signature weave textures[J]. Royal Society Open Science, 2015, 2(6):150074.
[11]TYAGI V. Contentbased image retrieval based on relative locations of multiple regions of interest using selective regions matching[M]. Elsevier Science Inc,2017.
[12]VINCENT A, PAUL F, Using filter banks in convolutional neural networks for texture classification[J].Pattern Recognition Letters, 2016, 84(11): 63-69.
[13]CHRISTODOULIDIS S, ANTHIMOPOULOS M, EBNER L, et al. Multisource transfer learning with convolutional neural networks for lung pattern analysis[J]. IEEE Journal of biomedical and health informatics, 2016, 21(1): 76-84.
[14]阮瑞, 江波, 湯進, 等. 改進復雜網(wǎng)絡模型的形狀特征提取[J]. 中國圖象圖形學報, 2018, 19(9):1332-1337.
[15]洪睿, 康曉東, 李博,等. 一種基于復雜網(wǎng)絡的圖像形狀及紋理描述方法[J]. 計算機科學, 2018, 45(S2): 254-256.
[16]湯進, 陳影, 江波等. 基于復雜網(wǎng)絡的圖像建模與特征提取方法[J]. 計算機工程, 2013,39(5):243-247.
[17]郅大鵬, 湯進, 江波等. 多模復雜網(wǎng)絡模型的形狀特征提取方法[J].計算機科學與探索,2013 (6): 94-100.
[18]湯進, 郅大鵬, 江波等. 基于有向復雜網(wǎng)絡模型的形狀描述與識別[J]. 計算機輔助設計與圖形學學報, 2014 (11):2039-2045.
[19]湯曉, 王銀河. 基于復雜網(wǎng)絡和圖像輪廓的形狀識別方法[J]. 山西師范大學學報(自然科學版), 2013 (3):38-45.
[20]高劑斌, 李裕梅, 張慧娜. 基于復雜網(wǎng)絡的圖像特征提取及多特征融合方案探究[J].圖像與信號處理,2015,4(4):101-110.
[21]何蘇利, 王銀河, 陳作宏. 基于輪廓形狀和復雜網(wǎng)絡的圖像識別新方法[J].工業(yè)控制計算機, 2016 (5):129-131.
[22]王民, 王羽笙, 劉濤, 等. 利用圖像熵和復雜網(wǎng)絡的中國畫分類方法[J]. 激光與光電子學進展, 2017(2): 181-188.
[23]KYLBERG G, The Kylberg texture dataset v. 1.0[M].Sweish, Centre for Image Analysis, Swedish University of Agricultural Sciences and Uppsala University,2011. (Obtained online on 20191118.)
[24]KYLBERG G, SINTORN I. Evaluation of noise robustness for local binary pattern descriptors in texture classification[J]. EURASIP Journal on Image and Video Processing, 2013, 17:1-20.