楊靜嫻 ,任小洪
(1.四川輕化工大學(xué) 人工智能四川省重點實驗室,四川宜賓 644000;2.四川輕化工大學(xué) 自動化與信息工程學(xué)院,四川宜賓 644000)
在傳統(tǒng)摘酒工藝中,工人需要不斷觀測在酒甑蒸餾器出酒口接入酒桶時所形成的表面酒花大小形態(tài)及其分布,適時進(jìn)行白酒的分級摘取,這種“看花摘酒”的方法在現(xiàn)代白酒工藝中仍廣泛應(yīng)用。如何實現(xiàn)“看花摘酒”過程的自動化、智能化已成為智能釀造亟需解決的難題。采用視覺傳感器獲取接酒器(桶)中不斷形成的酒花的視頻圖像,然后通過圖像分析處理技術(shù),實時提取白酒摘酒過程中酒花圖像的各類特征進(jìn)行識別分類的智能方法,具有方便快捷、判斷依據(jù)穩(wěn)定的優(yōu)點,是實現(xiàn)大規(guī)模智能摘酒的關(guān)鍵技術(shù),對白酒工藝智能化發(fā)展有著重要意義[1-3]。
楊靜嫻等[4]通過OTSU與Canny邊緣檢測相結(jié)合,討論了白酒摘酒酒花輪廓提取的方法。這種方法能夠提取酒花的輪廓信息。在白酒摘酒過程中,輪廓信息中包含的酒花的尺寸、數(shù)量信息具有變化不確定性,單一的輪廓信息無法得出確切的酒花分類標(biāo)準(zhǔn)。因此,需要對白酒摘酒酒花圖像提取相對平穩(wěn)的特征值作為摘酒分級的標(biāo)準(zhǔn)。
在白酒摘酒過程中,酒花圖像的變化快速,但酒花圖像中紋理清晰,不同等級酒花在紋理形態(tài)上存在差別。因此,提取酒花的紋理特征能夠細(xì)致的進(jìn)行圖像的特征描述[5-8]。通過對酒花圖像提取不同的紋理特征并定量分析得到分類依據(jù),結(jié)合支持向量機(jī)(Support Vector Machine,SVM)的方法使酒花識別分類的結(jié)果更加準(zhǔn)確且有據(jù)可依[9-10]。
為此,本文提出基于局部二值模式(Local Binary Patterns,LBP)與灰度共生矩陣(Gray-level co-occurrence matrix,GLCM)的白酒摘酒酒花紋理特征提取方法,構(gòu)造不同的SVM分類器實現(xiàn)對不同等級酒花圖像的分類識別,通過視覺圖像方法實現(xiàn)白酒摘酒工藝的智能化轉(zhuǎn)變[11-17]。
LBP算法是一種描述像素點之間灰度關(guān)系的局部特征的非參數(shù)算法。在LBP的傳統(tǒng)算法與改進(jìn)算法中,是通過以定義的窗口中心點像素值為閾值,將相鄰任意領(lǐng)域范圍的多個像素點像素值與之進(jìn)行比較,若領(lǐng)域中點像素值大于中心點像素值,則標(biāo)記為1,反之標(biāo)記為0。不同的領(lǐng)域信息被標(biāo)記成不同的二進(jìn)制數(shù),通常將這些二進(jìn)制數(shù)轉(zhuǎn)換成十進(jìn)制數(shù),這樣便生成了LBP編碼值,這些數(shù)字可以用來反映圖像在這個區(qū)域的紋理特征[18-20]。
傳統(tǒng)的LBP算法是在3*3的正方形領(lǐng)域范圍,中心像素點周圍有8個像素點,可以生成8位二進(jìn)制數(shù),共有256種LBP十進(jìn)制數(shù)碼。
式中 (xc、yc)——中心點像素坐標(biāo);
ip——相鄰點像素灰度值;
ic——中心點像素灰度值;
R——半徑;
P——采樣點數(shù)目。
1.2.1 旋轉(zhuǎn)不變模式LBP
傳統(tǒng)LBP算法的缺點在于只能覆蓋固定的一個小范圍,不能滿足對圖像紋理特征描述的需求。為了適應(yīng)不同程度的紋理特征需求,OJALA等對算法進(jìn)行改進(jìn),將傳統(tǒng)的3*3鄰域擴(kuò)展到任意鄰域,將方形鄰域改進(jìn)為圓形鄰域。改進(jìn)后的LBP圓形算法在允許以半徑為R圓形鄰域內(nèi)有任意多的像素點。一般有以下幾種采樣模式,為LBP(1,8)、LBP(2,16)、LBP(2,8)等。
LBP(1,8)意為在半徑為1的圓形鄰域選擇8個采樣點計算中心像素點的LBP編碼值。
對于選定的采樣點數(shù)目P,傳統(tǒng)的LBP算法能輸出2p個編碼值,在每一個LBP編碼值中選取一個圍繞中心像素點轉(zhuǎn)動,在多次轉(zhuǎn)動的過程中就會產(chǎn)生多種不同的結(jié)果。因此,這些結(jié)果中最小的LBP值就被定義為旋轉(zhuǎn)不變LBP值,用ri表示,ROR(x,i)表示對x編碼值循環(huán)按位右移i次。旋轉(zhuǎn)不變模式LBP一共有36維。
1.2.2 等價模式LBP
為了改進(jìn)LBP紋理提取維數(shù),OJALA等提出了一種等價LBP算法,通過降維的方法,限制二進(jìn)制模式從1到0或從0到1的跳變次數(shù)為2,重新統(tǒng)計灰度數(shù)據(jù)。試驗證明不屬于灰度不變等價LBP特征的占LBP特征的85%~90%,而等價LBP只有58個。所以,等價模式LBP只有58維編碼值,實際應(yīng)用59維編碼值,加上的1維編碼值代表不是等價LBP的特征向量,用u2表示。這樣的特征向量不會丟失任何紋理信息,并且可以減少高頻噪聲帶來的影響。
1.2.3 旋轉(zhuǎn)不變等價模式LBP
LBP算法只是灰度尺度不隨任何單一的變化而變化,光照變化基本不會對特征描述產(chǎn)生影響,但是圖像旋轉(zhuǎn)會對LBP的值產(chǎn)生影響?;谶@一特點,MAENPAA等在旋轉(zhuǎn)不變模式LBP算法基礎(chǔ)上提出了旋轉(zhuǎn)不變等價模式LBP算法,此算法通過不斷旋轉(zhuǎn)圓形領(lǐng)域得到一系列初始定義的LBP值,取其中最小的值作為該像素點的LBP值,LBP模式在此時降為36維,并在此基礎(chǔ)上控制跳變次數(shù)為2,再次重新統(tǒng)計灰度數(shù)據(jù)。此時旋轉(zhuǎn)不變等價模式LBP只有10維LBP參量,用riu2表示。
基于統(tǒng)計的紋理特征方法是利用像素及其周圍空間領(lǐng)域的灰度進(jìn)行紋理特征統(tǒng)計,方法可以統(tǒng)計像素的一階、二階以及更高階的特征。此統(tǒng)計方法中,最為經(jīng)典的便是灰度共生矩陣,是對特定方向、特定距離的量像素具有特定的灰度情況進(jìn)行統(tǒng)計得到。
GLCM 中對方向的取值一般為 0°、45°、90°、135°,d 為中心像元,取值一般為 1、2、3、4 等。通過對4個方向求出不同的特征值再進(jìn)行求均值計算得到灰度共生矩陣各參數(shù)?;叶裙采仃嚨碾A數(shù)與圖像灰度值的階數(shù)相同,當(dāng)灰度圖像灰度階數(shù)為N時,灰度共生矩陣為N*N的矩陣。通過灰度共生矩陣方法可以得到不同的特征參數(shù),其中最有代表性的特征參數(shù)是能量(Angular Second Moment,ASM)、 對 比 度(Contrast,CON)、 熵(Entropy,ENT)、相關(guān)性(Correlation,COR)和逆差 矩(Inverse Different Moment,IDM)[21-25]。 各表達(dá)式分別:
(1)能量是對圖像紋理灰度變化的度量,反映圖像灰度分布均勻程度和紋理粗細(xì)程度。能量值越大,表示圖像紋理變化越均勻和規(guī)則;能量值越小,表示紋理變化越復(fù)雜。
(2)對比度是灰度共生矩陣主對角線附近的慣性矩,能夠體現(xiàn)矩陣中的值的分布特點,反映了圖像中各個部分紋理的清晰度和紋理溝紋的深淺度。
(3)熵反映了圖像紋理的隨機(jī)性,熵值與能量值相反,當(dāng)紋理越均勻和規(guī)則時,熵值越??;紋理越復(fù)雜時,熵值越大,見式(3)。
(4)相關(guān)度反映了圖像局部的灰度相關(guān)性,體現(xiàn)了灰度共生矩陣元素在行或列方向上的相似程度,當(dāng)矩陣中元素分布均勻時,相關(guān)度就越大;元素分布分散時,相關(guān)度越小,見式(4)。
(5)逆差矩反映圖像紋理的同質(zhì)性,對圖像局部紋理變化的大小進(jìn)行度量。不同區(qū)域間紋理變化少,紋理非常均勻時,逆差矩值越大(式5)。
在白酒摘酒過程中,傳統(tǒng)摘酒工藝一般將酒花分為以下3類,見表1。在不同的白酒釀造廠中,對白酒分級為區(qū)間范圍,沒有統(tǒng)一的標(biāo)準(zhǔn)。以下白酒酒花分類以及酒度以進(jìn)行數(shù)據(jù)采集的白酒廠為例。
表1 白酒酒花分類Tab.1 Classification of liquor hops 單位:(%)
通過在宜賓某傳統(tǒng)工藝白酒釀造廠進(jìn)行白酒摘酒圖像采集,經(jīng)過釀酒師傅的指導(dǎo),分別獲取白酒摘酒過程中各段酒花的原始數(shù)據(jù)。通過人工分割視頻的方法,在酒花差別較明顯的3段酒的中間部分分別進(jìn)行數(shù)據(jù)采集,獲取大清花、小清花、油花3種白酒摘酒類別的試驗圖像各74張,共222張酒花圖片,并進(jìn)行圖像預(yù)處理。將可能產(chǎn)生影響的大部分背景通過選取感興趣區(qū)域(Region of Interest,ROI)進(jìn)行試驗預(yù)處理,保存大部分酒花圖像進(jìn)行紋理特征提取以及圖像分類識別。其中3類酒花各60張作為訓(xùn)練樣本,各14張作為測試樣本。選取3類酒花試驗圖像各1張,如圖1所示。
圖1 白酒酒花試驗數(shù)據(jù)Fig.1 Liquor hops experimental data
大清花與小清花階段的白酒出酒量大于油花階段的出酒量,在這部分中產(chǎn)生的圖像差異是普遍現(xiàn)象。對實際摘酒過程中進(jìn)行酒花圖像采集時,當(dāng)固定相機(jī)位置與光照角度不同時,會造成酒花圖像中部分的背景不同。因此在進(jìn)行酒花分析時,將這部分的差異作為酒花圖像分析中的正常差異。
LBP進(jìn)行圖像特征提取具體分為兩步:第一步是圖像灰度化,第二步是對編碼值進(jìn)行統(tǒng)計。在本文中,針對已經(jīng)介紹的3種LBP方法進(jìn)行特征值提取,分別是旋轉(zhuǎn)不變模式LBP、等價模式LBP和旋轉(zhuǎn)不變等價模式LBP。
分別對白酒摘酒過程中的大清花、小清花、油花圖像進(jìn)行3種模式LBP編碼值統(tǒng)計得到以下各類酒花的3種LBP特征圖,如圖2所示。
圖2 LBP特征圖Fig.2 LBP characteristic diagram
在圖2的各LBP特征圖中,x軸為LBP編碼值,y軸表示歸一化后各不同編碼值出現(xiàn)的頻次,次數(shù)的總和是圖像的張數(shù)。通過分別對比在不同LBP模式中大清花、小清花、油花的特征圖可以得出,在等價模式LBP特征圖中,特征編碼進(jìn)行歸一化后的值大多都低于0.2,沒有出現(xiàn)大范圍值偏大。即相比于旋轉(zhuǎn)不變模式LBP與旋轉(zhuǎn)不變等價模式LBP,等價模式LBP的特征提取效率更高。
在使用GLCM進(jìn)行紋理特征提取時,首先將圖像進(jìn)行灰度化處理,然后進(jìn)行灰度級量化,選擇參數(shù)方向分別為 0°、45°、90°、135°,步距均為 1,分別對能量、對比度、熵、相關(guān)性和逆差矩進(jìn)行特征值計算,最后對4個角度的值進(jìn)行均值計算得到分類算法的輸入矩陣。
在試驗中,3類酒花的訓(xùn)練樣本各60個。分別對各個樣本進(jìn)行特征值計算,并將訓(xùn)練類3類酒花樣本在每特征值的數(shù)據(jù)進(jìn)行比較對比,如圖3所示。
圖3 GLCM特征值參數(shù)對比Fig.3 Comparison of GLCM feature value parameters
通過特征值參數(shù)圖像對比可以清晰地看出,3類酒花的能量、對比度、熵、相關(guān)性和逆差矩的特征值、均值存在比較清晰的差別,故灰度共生矩陣的特征值均值適合作為SVM分類標(biāo)準(zhǔn)。
本文采用支持向量機(jī)(SVM)作為酒花分類識別的分類器。酒花分為3類,采用一對多分類,構(gòu)造出兩個分類器,先用分類器1將大清花與小清花、油花進(jìn)行分類,再用分類器2將小清花與油花進(jìn)行分類。分類器核函數(shù)使用了3種進(jìn)行對比,分別是線性核(Linear Kernel)、多項式核(Polynomial Kernel)和徑向基核函數(shù)(Radial Basis Function),并進(jìn)行3種分類結(jié)果的對比。
在試驗中分別通過LBP和GLCM紋理特征進(jìn)行酒花分類。對3類共180張酒花圖片進(jìn)行紋理特征提取后分類訓(xùn)練,再對42張測試圖片進(jìn)行分類并進(jìn)行準(zhǔn)確率的計算。
對LBP(1,8)3種算法提取的紋理特征均進(jìn)行SVM分類得到以下識別結(jié)果,如表2所示。
表2 LBP特征提取分類結(jié)果Tab.2 LBP feature extraction and classification results 單位:(%)
通過對比可得,在對不同LBP模式下所得特征進(jìn)行分類時,采用旋轉(zhuǎn)不變模式LBP與等價模式LBP進(jìn)行分類效果較好,SVM核函數(shù)為線性核與多項式核時對3類酒花的分辨率達(dá)到95%以上,等價模式LBP達(dá)到了100%。這與之前關(guān)于LBP特征圖的分析結(jié)果一致,等價模式LBP對白酒圖像特征描述更加細(xì)致,能夠得到很好的分類準(zhǔn)確率。
對GLCM紋理特征提取出的5個特征值分別采用單個和多個特征作為SVM分類器的輸入進(jìn)行分類,得到以下分類結(jié)果,如表3所示。
表3 GLCM特征提取分類結(jié)果Tab.3 GLCM feature extraction and classification results 單位:(%)
通過不同試驗對比可得,選擇不同的SVM核函數(shù)與特征組合方式對白酒酒花分類準(zhǔn)確率會產(chǎn)生不同程度的影響。在選擇單一的特征值作為分類器輸入時,分類率的準(zhǔn)確率并不穩(wěn)定,且普遍較低。當(dāng)核函數(shù)為線性核函數(shù)時,單一特征分類率均較低,增加特征值數(shù)目進(jìn)行組合,其最高分類率也只能達(dá)到90.5%;當(dāng)核函數(shù)為多項式時,采用兩種及以上特征作為輸入時,分類率均高于95%,在特征數(shù)目變多時,出現(xiàn)部分分類率下降,但基本保持在95%以上;當(dāng)核函數(shù)為徑向基核函數(shù)時,選取除單一相關(guān)性以外的不同的特征組合均能得到95%以上的分類率,特征數(shù)目越多,得到的分類準(zhǔn)確率也越高,試驗中分類率可以達(dá)到100%,但存在不穩(wěn)定性。
將LBP與GLCM紋理特征提取進(jìn)行特征級融合進(jìn)行SVM分類[26-30]。根據(jù)對LBP紋理特征的對比以及分類結(jié)果的分析,在LBP+GLCM特征分類試驗中選取等價模式LBP與GLCM特征值進(jìn)行融合處理,得到不同的矩陣作為SVM分類器的輸入,試驗中對核函數(shù)的選擇也為3種,試驗結(jié)果如表4所示。
表4 LBP+GLCM特征提取分類結(jié)果Tab.4 LBP+GLCM features extraction and classification results 單位:(%)
通過對比 LBP、GLCM、LBP+GLCM 3種方法可得,LBP選擇等價模式,GLCM選擇兩種特征值、SVM核函數(shù)選擇多項式核函數(shù)分類準(zhǔn)確率能夠得到97%以上。LBP+GLCM能改進(jìn)在選取單個或多個GLCM特征值組合時的分類率,準(zhǔn)確率均有上升,在核函數(shù)選取為線性核函數(shù)和多項數(shù)核函數(shù)時,達(dá)到了100%的分類準(zhǔn)確率。因此,對LBP與GLCM紋理特征進(jìn)行特征級融合進(jìn)行分類效果最好,且分類效果穩(wěn)定性最高。
本文提出的白酒摘酒特征提取以及分類算法,利用LBP與GLCM相結(jié)合,提取多個特征值并進(jìn)行特征級融合,采用支持向量機(jī)方法,實現(xiàn)了在白酒摘酒過程中對3類酒花的分類。試驗結(jié)果表明,通過白酒摘酒酒花圖像對白酒摘酒過程進(jìn)行分析的方法是可行的,具有較好的穩(wěn)定性與準(zhǔn)確性,能夠得到較高分類準(zhǔn)確率。在后續(xù)的研究中,可以選取不同的特征提取方法以及不同算法的分類器進(jìn)行分類研究,對比選取出最佳的白酒摘酒酒花的分類方法,利用其實現(xiàn)的特征數(shù)據(jù)分類,設(shè)計出控制系統(tǒng),利用機(jī)器視覺進(jìn)行酒花分類和白酒摘酒分級。從而實現(xiàn)白酒摘酒的自動化和智能化。