張春艷
(沈陽理工大學(xué)信息科學(xué)與工程學(xué)院,遼寧 沈陽 110159)
通過對(duì)番茄葉片圖像進(jìn)行顏色特征的提取,將提取到的數(shù)據(jù)輸入SVM算法,通過訓(xùn)練求得可以對(duì)產(chǎn)生病害的番茄葉片圖像進(jìn)行識(shí)別的模型。
直方圖作為一種特征描述,具有簡單有效的特點(diǎn),用其來統(tǒng)計(jì)特性非常方便,因此,其被廣泛應(yīng)用于計(jì)算機(jī)視覺。在圖像處理領(lǐng)域,對(duì)于圖像直方圖的特征提取十分方便,其對(duì)圖像無任何要求;關(guān)于圖像的多模態(tài)的體現(xiàn),直方圖也有非常良好的表現(xiàn),并且對(duì)于圖像的任意指定區(qū)域的統(tǒng)計(jì)特征也能很好的表示;直方圖還對(duì)旋轉(zhuǎn)不敏感,具有旋轉(zhuǎn)不變性。因此衍生出各種各樣的直方圖,如顏色直方圖、亮度直方圖、局部二值模式直方圖、HOG等。對(duì)于圖像處理領(lǐng)域,顏色直方圖應(yīng)用最為廣泛,但是傳統(tǒng)的顏色直方圖容易受光照變化影響,并且對(duì)于圖像內(nèi)部的具體像素點(diǎn)的分布情況不敏感,對(duì)于像素位置不敏感。
求圖像的顏色矩特征是通過對(duì)線性代數(shù)的中矩的理解,同樣將圖像中的顏色分布抽象提取,用其矩表示出來。分為平均值A(chǔ)verage、方差Variance和偏斜度Skewness,并將其分別起名為顏色一階矩、二階矩以及顏色三階矩,通過這些其矩來對(duì)圖像的空間信息進(jìn)行表示。使用顏色矩的概念來表示圖像與顏色直方圖是有差異的,顏色直方圖需要顏色量化的操作,而顏色矩不需要顏色量化。關(guān)于圖像的像素點(diǎn),通??梢苑譃?個(gè)顏色通道進(jìn)行表述,而對(duì)于顏色矩每個(gè)通道可以抽象出3個(gè)分量來進(jìn)行描述,因此一共可以得到9個(gè)分量的信息。因?yàn)轭伾氐玫降奶卣骶S數(shù)相對(duì)少一些,所以使用顏色矩時(shí)一般還需要提取一些圖像其他的特征,幫助更好地對(duì)圖像進(jìn)行分析處理。3個(gè)低階矩的數(shù)學(xué)模型計(jì)算公式進(jìn)行如下:
(1)
(2)
(3)
其中,pij在以上公式中的下標(biāo)j代表的是第j個(gè)像素點(diǎn),i代表的是像素點(diǎn)的第i個(gè)分量,N代表的是總的像素?cái)?shù)是N。
圖像的顏色變化可以通過取其抽象出的顏色矩進(jìn)行表示,如上所述,可以得到一個(gè)9維的顏色直方圖量化后的向量,以下公式是將顏色分量分別用Y,U,V來表示:
Fcolor=[μY,σY,sY,μU,σU,sU,μV,σV,sV]
(4)
顏色特征與局部特征對(duì)應(yīng),可以很好地將圖像的整體特征描述出來。而顏色特征的本質(zhì)其實(shí)是圖像本身像素點(diǎn)所表現(xiàn)出來的特征,但其只是一種整體上的或者說是一種表面上的特征,而對(duì)于空間以及更加細(xì)致具體的特征無法顯示,因此對(duì)于圖像的局部特征并不能以這個(gè)來體現(xiàn)。鑒于此,當(dāng)只將顏色信息作為一種查詢圖像的標(biāo)準(zhǔn)時(shí),當(dāng)數(shù)據(jù)量小時(shí),可能得到所期望的結(jié)果,但是對(duì)于數(shù)據(jù)量很大的時(shí)候,常會(huì)將許多不需要的圖像也檢索出來??偟膩碚f,利用顏色直方圖的原理簡單并且容易理解分析,因此應(yīng)用很多,雖然其不能很好地表示出圖像的空間信息以及圖像的局部特性,但對(duì)于圖像本身的變化如平移和旋轉(zhuǎn)等不敏感,抗這些因素的干擾性較強(qiáng)。
SVM[4,5]的原理是通過核函數(shù)將特征空間找到,找到之后將特征空間進(jìn)行分析得到軟間隔分離超平面,再用正則化因子對(duì)其進(jìn)行優(yōu)化得到樣本的二分類操作。使用核函數(shù)來將點(diǎn)積運(yùn)算表示出來并且得到最優(yōu)的分類面:
(5)
式中,ai代表Lagrange乘子,ai≥0;xi,yi代表兩類中的支持向量SV;b*代表根據(jù)訓(xùn)練樣本確定的閾值;K(x,xi)代表核函數(shù)。
將圖像在邊界方向上的形狀特征進(jìn)行提取出來,在此基礎(chǔ)上再進(jìn)行顏色直方圖的分提取和分析。該方法簡單有效,在增加了準(zhǔn)確性的基礎(chǔ)上保留了對(duì)圖像自身的旋轉(zhuǎn)平移不敏感的特點(diǎn),另外其對(duì)于圖像的縮放也不敏感。為了將圖像檢索的準(zhǔn)確性進(jìn)行提高,還將反饋機(jī)制結(jié)合起來,可以動(dòng)態(tài)地調(diào)整權(quán)值系數(shù),并將相應(yīng)的算法進(jìn)行抽象出來,通過訓(xùn)練可以將不同數(shù)據(jù)庫的最佳權(quán)值系數(shù)求出來進(jìn)行圖像分析與識(shí)別研究。通過實(shí)驗(yàn)發(fā)現(xiàn),此方法具有很好的識(shí)別效果,準(zhǔn)確性也很高。通過將其與邊緣檢測結(jié)合分析,將邊緣的信息進(jìn)行提取抽象,將小領(lǐng)域內(nèi)的信息抽象并唯一地確定位置,再將求得的各個(gè)小領(lǐng)域內(nèi)的信息點(diǎn)聯(lián)合起來,進(jìn)行總體的抽象與分析,將各個(gè)點(diǎn)進(jìn)行連線,取得連線中點(diǎn)的信息,求得一個(gè)能體現(xiàn)圖像特征的邊緣信息的特征模型,這個(gè)過程通常稱為擬合過程。在這個(gè)過程中,連線之間會(huì)產(chǎn)生一定的角度,從而引發(fā)一些多余的噪聲,因此分析時(shí)需要注意排除噪聲的干擾,提高準(zhǔn)確性。
邊緣方向直方圖是對(duì)圖像輪廓特征的一種描述方法,通過Canny邊緣檢測算子對(duì)病變番茄圖像的輪廓特征進(jìn)行提取,并計(jì)算出每個(gè)邊緣像素點(diǎn)的方向,對(duì)每個(gè)方向上的邊緣點(diǎn)數(shù)目進(jìn)行統(tǒng)計(jì)進(jìn)而形成邊緣方向直方圖。
圖1 邊界方向直方圖
目前基于圖像分類使用較為廣泛的模式識(shí)別算法包括歐式距離法、BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)。針對(duì)本實(shí)驗(yàn)樣本數(shù)量有限的特點(diǎn),最終選擇SVM對(duì)病害番茄圖像進(jìn)行識(shí)別。
SVM(Support Vector Machine)是通過某種事先選擇的映射(核函數(shù))將輸入向量映射到一個(gè)高維特征空間,然后在這個(gè)空間中尋找最優(yōu)分類超平面。
根據(jù)SVM軟件包提取符合條件的向量集;對(duì)數(shù)據(jù)進(jìn)行篩選;考慮選用適當(dāng)?shù)暮撕瘮?shù),主要包括上述的4種核函數(shù);應(yīng)用交叉驗(yàn)證方法獲取最優(yōu)參數(shù)C和g,并使用這2個(gè)參數(shù)處理全部訓(xùn)練集來得到SVM模型;用模型對(duì)樣本圖像進(jìn)行測試,完成識(shí)別。
本實(shí)驗(yàn)針對(duì)樣本顏色特征、邊緣方向特征、混合特征進(jìn)行識(shí)別。將顏色特征與邊界方向直方圖參數(shù)特征合成為一個(gè)向量。每種特征的識(shí)別準(zhǔn)確率如表1。
表1 識(shí)別準(zhǔn)確率匯總
本研究對(duì)病害番茄圖像的顏色特征和邊緣特征進(jìn)行提取,通過SVM對(duì)特征進(jìn)行分類完成對(duì)病害番茄圖像的識(shí)別,在單一顏色特征識(shí)別的基礎(chǔ)上對(duì)顏色特征與邊界方向特征進(jìn)行混合識(shí)別,并且識(shí)別的準(zhǔn)確率好于基于單一特征的識(shí)別。