向+東++陳+宇++陳廣勝
摘要:針對傳統(tǒng)木材紋理分類的準(zhǔn)確率低且難度大的問題,依據(jù)LBP(局部二值)算子和AD-ABOOST(自適應(yīng)增強)算法理論,提出了LBP-ADABOOST模型對木材紋理進(jìn)行識別分類,通過均勻旋轉(zhuǎn)不變特性與原始LBP算子相融合,提取紋理的特征值,結(jié)合自適應(yīng)增強算法,從而訓(xùn)練得到每類紋理所對應(yīng)的分類器模型參數(shù),構(gòu)造分類器,實現(xiàn)對木材紋理準(zhǔn)確高效分類,實驗結(jié)果表明相比于BP神經(jīng)網(wǎng)絡(luò),SVM支持向量機等分類算法,該模型的實驗結(jié)果誤差率為4%左右,準(zhǔn)確率高,實用性強,
關(guān)鍵詞:木材紋理分類;LBP算子;ADABOOST算法;分類器
DOI:IO.15938/j.jhust.2015.02.011
中圖分類號:TP391.4
文獻(xiàn)標(biāo)志碼:A
文章編號:1007-2683(2015)02-0057-06
0 引 言
木材紋理分類是木材優(yōu)化利用過程的重要部分,木材紋理結(jié)構(gòu)精細(xì)復(fù)雜、無規(guī)律的天然屬性,使得紋理分類一直是木材學(xué)的前沿課題.針對不同的研究,國內(nèi)外學(xué)者提出了不同的特征提取及紋理分類算法,非負(fù)矩陣分解,灰度共生矩陣法,馬爾可夫隨機場,尺度不變特征變換法等存特征提取方面取得了一定的突破,而常用的分類算法有BP神經(jīng)網(wǎng)絡(luò),SVM支持向量機,決策樹,極限學(xué)習(xí)機等.大多紋理分類模型基于以上算法的結(jié)合,且取得了一定的成果,此外,我國對于木材紋理分類的研究起步較晚,初期主要是對國外的經(jīng)驗總結(jié),優(yōu)化傳統(tǒng)的分類算法,現(xiàn)階段我國的紋理分類技術(shù)發(fā)展較好,但也存在一定缺陷,主要由于實際應(yīng)用的訓(xùn)練樣本在個體之間存在著差異,導(dǎo)致分類算法對分類結(jié)果的差異性較大.如何提高木材紋理分類的準(zhǔn)確性至關(guān)重要,也將是本文的重點.
近些年,一種簡單高效的紋理特征分析方法——局部二值模式(logical binary pattern,LBP)成為了眾多學(xué)者研究的對象,在描述、提取局部紋理特征方面取得了很好的效果.此外,Adaboost自適應(yīng)增強算法是通過訓(xùn)練樣本特征得到弱分類器,對弱分類器的線性組合得到最終的強分類器,進(jìn)行分類學(xué)習(xí),其在機器學(xué)習(xí)和數(shù)據(jù)挖掘方面應(yīng)用較廣.基于以上表述,本文采用LBP與ADABOOST的融合嘗試進(jìn)行木材紋理分類,且這種分類算法在木材紋理分類方面應(yīng)用極少.經(jīng)實驗,本文提出的基于LBP-ADABOOST模型的木材紋理分類算法達(dá)到預(yù)期目的,并且正確率明顯高于BP神經(jīng)網(wǎng)絡(luò),SVM支持向量機,不失為木材紋理分類提供一種有效方法.
1 特征提取
局部二值模式(logical binary pattern,LBP)最早是由Ojala等在1996年提出,是一種描述圖像局部紋理特征的算子,原始的LBP算子定義為在3×3的窗體內(nèi),以窗體中心像素為閾值,與相鄰的8個像素的灰度值比較,若周圍像素值大于中心像素值,則該像素點的位置被標(biāo)記為1,反之為0.這樣,3×3領(lǐng)域內(nèi)的8個點可產(chǎn)生8bit的無符號數(shù),即得到該窗體的LBP值,并用這個值來反映該區(qū)域的紋理信息,如圖l所示:
隨著LBP算子在圖像中的應(yīng)用,擴展定義一個半徑為R(R>O)的圓形鄰域,B(B>O)個鄰域像素點均勻分布在圓周上面.設(shè)定該鄰域中心像素值是C,則C可用該鄰域內(nèi)的B+1個像素的函數(shù)來定義,即其中:gc為中心像素值;g0,g1,gb-1為B個鄰域像素值.中心像素的坐標(biāo)是(Xc,Yc),則其鄰域坐標(biāo)(Xi,Yi)為:
當(dāng)坐標(biāo)(Xi,Yi)不在中心,通過雙線性內(nèi)插法,將鄰域的像素值減去中心的像素值計算得到局部的紋理特征像素值C:
假定在實際情況中中心像素值與鄰域像素值的差值g0-gc,gb-1-gc獨立于gc,則(3)可表示為:
由于c(g。)代表的是中心點的像素值,與圖像的局部紋理特征無必然聯(lián)系,故可以忽略不計,得到:
上式(5)中的像素差值描述了每個紋理模式,若紋理不受像素值單調(diào)變化,只須考慮差值符號即可:
由此可以得到一個B為二進(jìn)制數(shù),乘以相應(yīng)的權(quán)重2i求和得到LBP特征值:
原始LBP算子是灰度不變的,但不是旋轉(zhuǎn)不變的,圖像經(jīng)過旋轉(zhuǎn)后可得到不同的LBP值.為了便于描述圖像信息,針對圖像旋轉(zhuǎn)之后還可以得到相同的LBP值,Maenpaa等人提出具有旋轉(zhuǎn)不變的LBP算子(rotation invariant LBP),不斷旋轉(zhuǎn)圓形鄰域得到LBP值,取其最小的作為鄰域的LBP值,表述如下式:其中ROI(x,i)是旋轉(zhuǎn)函數(shù),表示將x的二進(jìn)制數(shù)按位循環(huán)右移i次,
但隨著鄰域采點集數(shù)的增加,二進(jìn)制模式的種類急劇增加,達(dá)到2B個,這種數(shù)量無論是對紋理特征的提取,紋理的分類都是不利的.針對二進(jìn)制模式的降維問題,Ojala提出一種均勻模式(uniform pat-tern).均勻模式即根據(jù)編碼模式出現(xiàn)頻率的高低,在圓形二進(jìn)制編碼中,至多有兩個0到1或1到0的變化,表示如下:
上式的結(jié)果滿足U≤2的模式時稱為均勻模式,用LBP表示,通過改進(jìn),二進(jìn)制的模式減少,且不會丟失信息,使得原來2B種減少到B(B-1)+2種,降低了特征矩陣的維數(shù).
基于以上兩種性質(zhì)的優(yōu)越性,可以將LBP的旋轉(zhuǎn)不變性與均勻模式結(jié)合得到更好的效果,稱為旋轉(zhuǎn)不變均勻模式用符號LBPriu2表示,定義如下:其中:U(LBPb,r)的計算方法是(10)的表述,該模式下不儀保留了圖像的紋理特征,而且鄰域二進(jìn)制編碼的種類降到了B+2種,大幅減少了特征總量,本文采用了旋轉(zhuǎn)不變均勻模式LBP算子提取特征值,并對比了幾種模式下不同分布情況,如圖2所示.可以看出LBP算子在均勻旋轉(zhuǎn)不變模式下的特征維數(shù)相對較少,同時保留了圖像信息,效果最佳,
2 算法原理
1995年SChapire和Freund提出的Adaboost算法,相對于Boosting算法,其自適應(yīng)在于:前一個分類器分錯的樣本會被用來訓(xùn)練下一個分類器.Asaboost算法訓(xùn)練弱分類器的錯誤率相對較大,但是只要它的分類效果比隨機猜測效果要好即可接受,通過對弱分類器的線性組合得到最終的強分類器.同時,Adaboost算法也是一種迭代算法,它允許在每一輪的訓(xùn)練中加入一個新的弱分類器,直到達(dá)到某個預(yù)定足夠小的錯誤率.每次訓(xùn)練樣本都被賦予一個權(quán)重,表明它被某個分類器選人訓(xùn)練集的概率,如果某個樣本特征已經(jīng)被準(zhǔn)確的分類,那么存構(gòu)造下一個分類器的時候,它再次被選人訓(xùn)練集的概率會被降低;相反,若沒有準(zhǔn)確的分類,那么他的權(quán)重就會得到提高,選人下一個分類器訓(xùn)練集的慨率增大.通過上述迭代過程,Adaboost算法主要將聚焦那些較“困難”的分類樣本上面.