◎南 楠
(三門(mén)峽職業(yè)技術(shù)學(xué)院信息傳媒學(xué)院,河南三門(mén)峽4 7 20 0 0)
技術(shù)與應(yīng)用
基于圖像識(shí)別的植物葉片分類(lèi)研究
◎南 楠
(三門(mén)峽職業(yè)技術(shù)學(xué)院信息傳媒學(xué)院,河南三門(mén)峽4 7 20 0 0)
針對(duì)植物物種繁多,新物種人工發(fā)現(xiàn)歸類(lèi)難問(wèn)題,提出一種結(jié)合植物葉片紋理和邊緣輪廓特征元素,對(duì)樣本加權(quán)值建立矩陣并改進(jìn)目標(biāo)函數(shù)的新方法,將該方法用于檢測(cè)常見(jiàn)的10種植物的500個(gè)樣本,實(shí)驗(yàn)結(jié)果顯示平均識(shí)別準(zhǔn)確率達(dá)到91.6%,具有較好的魯棒性。
圖像處理;SVM;分類(lèi)概率;植物識(shí)別
隨著計(jì)算機(jī)圖像處理技術(shù)的發(fā)展,模式識(shí)別對(duì)植物種類(lèi)的識(shí)別也應(yīng)運(yùn)而生,各種葉片特性提取技術(shù)和研究成果大量出現(xiàn)。文獻(xiàn)[1]采用Otsu算法對(duì)隨機(jī)提取的6種植物葉片利用暗通道屬性進(jìn)行分割,提取顏色和不變矩特征使用SVM方法對(duì)樣本分類(lèi)。文獻(xiàn)[2]提出一種先采用WLLE算法對(duì)預(yù)處理后樣本圖片進(jìn)行特征提取后,再使用SVM中核函數(shù)建立分類(lèi)的方法。文獻(xiàn)[3]提出一種通過(guò)建立新葉緣特征描述符,并結(jié)合多層分類(lèi)法建立植物語(yǔ)義字典查詢(xún)的方法對(duì)樣本植物進(jìn)行分類(lèi)。各種研究方法都有優(yōu)缺點(diǎn),本文提出的研究?jī)?nèi)容主要是基于葉片紋理和葉片邊緣形狀的分割方法對(duì)樣本進(jìn)行分割,采用分形維數(shù)數(shù)方法進(jìn)行樣本輪廓提取,最后通過(guò)改進(jìn)SVM方法中目標(biāo)函數(shù)對(duì)樣本進(jìn)行分類(lèi),提高植物葉片識(shí)別的精準(zhǔn)度。
圖像識(shí)別技術(shù)在30年前已開(kāi)始研究,國(guó)內(nèi)近十年興起并逐漸有所成果,廣泛的應(yīng)用于工業(yè)、農(nóng)業(yè)生產(chǎn)、植被繁殖、遙感測(cè)控、人臉識(shí)別、指紋識(shí)別等領(lǐng)域。一般的圖像處理默指計(jì)算中存儲(chǔ)的數(shù)字圖像,可以使用計(jì)算機(jī)對(duì)其進(jìn)行分析、處理和合成,來(lái)滿(mǎn)足不同的需求。常用的圖像處理技術(shù)包括灰度化、閾值分割、濾波降噪、邊緣檢測(cè)、形態(tài)學(xué)等,在植物學(xué)方面經(jīng)常用于對(duì)農(nóng)作物種植,新物種發(fā)現(xiàn)進(jìn)行歸類(lèi)。[4]
幾種圖像處理技術(shù)作用各有不同,圖像灰度化作用是將掃描的植物葉片由RGB模式轉(zhuǎn)換為灰度模式,簡(jiǎn)化圖像處理的過(guò)程與計(jì)算量;圖像濾波技術(shù)是將灰度模式圖片中的孤立點(diǎn)、噪點(diǎn)盡量減少,避免對(duì)分類(lèi)結(jié)果造成影響;閾值分割技術(shù)是以最初設(shè)定的閾值為基礎(chǔ),將圖像分割為目標(biāo)區(qū)域和背景區(qū)域兩部分,簡(jiǎn)單易操作;圖像邊緣檢測(cè)技術(shù)是利用算子提取邊緣點(diǎn)集,通過(guò)設(shè)定的閾值結(jié)合邊緣點(diǎn)集修補(bǔ)邊緣獲得連續(xù)的邊界;形態(tài)學(xué)是利用二值膨脹腐蝕、開(kāi)操作、閉操作進(jìn)行邊界提取,孔洞填充,消除細(xì)小齒痕,實(shí)現(xiàn)圖像邊界光滑連續(xù)效果。[5]
植物葉片是每種植物獨(dú)有的組成部分,唯一性確定了其是植物種類(lèi)辨別的重要依據(jù),為植物分類(lèi),建立關(guān)聯(lián)和繁殖培育具有重要意義。基于圖像識(shí)別的植物分類(lèi)技術(shù)實(shí)現(xiàn)時(shí),先對(duì)植物葉片轉(zhuǎn)換模式,通常都是轉(zhuǎn)換為灰度模式,再進(jìn)行濾波降噪處理,然后使用圖像分割法對(duì)其分割,最后邊緣檢測(cè)算法獲取植物葉片輪廓,通過(guò)分類(lèi)器進(jìn)行歸類(lèi)。
2.1 樣本采集
植物葉片樣本數(shù)字圖像采集區(qū)域?yàn)槿T(mén)峽黃河濕地公園、陜州風(fēng)景區(qū)、植物園內(nèi),包括10種植物:冬青、海桐、荷花玉蘭、樂(lè)昌含笑、山茶、深山含笑、石楠、禿瓣杜英、香樟和楊梅,每種植物葉片采集50個(gè),共計(jì)500個(gè)樣本。選擇50%為訓(xùn)練樣本,剩余50%為分類(lèi)測(cè)試樣本。
2.2 樣本預(yù)處理及分割
葉片樣本采集后使用HP8270掃描儀獲取數(shù)字圖像,生成的原始圖像模式是RGB值,其連續(xù)的顏色分布和多像素結(jié)構(gòu)不易于計(jì)算機(jī)識(shí)別和處理,因此樣本預(yù)處理就是將原始圖片顏色模式轉(zhuǎn)變?yōu)榛叶葓D片,并進(jìn)行降噪處理。
根據(jù)人眼對(duì)綠色的敏感程度最高,對(duì)藍(lán)色的敏感程度最低,采用符合人體生理學(xué)的加權(quán)平均值法對(duì)圖像進(jìn)行灰度化處理,原理為根據(jù)重要性對(duì)R、G、B分別賦予不同權(quán)值,計(jì)算三者加權(quán)平均值,公式如下:
使用上述公式變換后植物葉片灰度圖如下所示(見(jiàn)圖1)。
圖像變?yōu)榛叶葓D后會(huì)出現(xiàn)一些噪點(diǎn),這些點(diǎn)在后期邊緣算法時(shí)將會(huì)極大影響結(jié)果,需要進(jìn)行降噪處理,因?yàn)楹笃谛枰獙?duì)葉片邊緣輪廓進(jìn)行提取,選取中值濾波器做為去噪算法,原理是把一點(diǎn)的像素值用周?chē)鄠€(gè)像素點(diǎn)的中間值代替,消除孤立噪聲點(diǎn),該算法可以很好的保留邊緣減少模糊度。算法具體實(shí)現(xiàn)時(shí)設(shè)定一個(gè)滑動(dòng)窗口,按照灰度值由小到大對(duì)像素進(jìn)行排序,求取平均值代替原值,公式如下:
其中,i,j∈N,f(xi,yj)為設(shè)定窗口中二維序列數(shù),實(shí)驗(yàn)中選擇5×5方形窗口,盡可能細(xì)致保留葉邊緣,經(jīng)過(guò)降噪后圖像如下所示(見(jiàn)圖2)。
將降噪后圖像使用邊緣檢測(cè)算法中Canny算子進(jìn)行處理,Canny算子實(shí)現(xiàn)的基本原理是利用一個(gè)非極大值抑制圖像梯度幅值,利用雙閾值計(jì)算檢測(cè)強(qiáng)邊緣與弱邊緣,結(jié)合兩者結(jié)果建立整個(gè)樣本邊緣模型,通過(guò)算子檢測(cè)后圖像如下所示(見(jiàn)圖3)。
圖1 加權(quán)平均法獲取灰度圖像
圖2 降噪后圖像
2.3 樣本特征提取
葉片特征提取是指采用計(jì)算機(jī)對(duì)樣本分割后的二值圖進(jìn)行形狀和輪廓信息提取、分析和處理,明確每個(gè)樣本的獨(dú)有屬性特征作為分類(lèi)依據(jù),筆者提取的特征主要是基于葉片紋理和葉片邊緣形狀二者結(jié)合的方法。
紋理包括葉片表面的脈絡(luò)紋路,根據(jù)葉脈走向和對(duì)稱(chēng)性等判斷植物發(fā)育是否正常,是否具有參考性。本文對(duì)紋理的提取方法采用分形維數(shù)方法提取。
分形維數(shù)表現(xiàn)出葉片紋理的復(fù)雜程度和紋理與整體葉片間的相似度,一般的定義種類(lèi)有盒維、相似維、關(guān)聯(lián)維、信息維等。試驗(yàn)中采用盒維,具體做法為首先構(gòu)建出能覆蓋圖像表面的最小盒子數(shù)Hr,再將整幅圖像分割成N×N的小方塊,每塊的邊長(zhǎng)都為l。小方塊中有些覆蓋了樣本的輪廓和內(nèi)部紋理,有些是空的,取得非空盒子數(shù)量記為Nr,設(shè)定比例因子r縮小盒子尺寸,Nr值自動(dòng)增大,當(dāng)r趨近于0時(shí),盒維公式為:
不斷求取Nr和r的值,在雙對(duì)數(shù)坐標(biāo)中對(duì)(logr,logNr)進(jìn)行直線(xiàn)擬合,得到的直線(xiàn)斜率為分形維數(shù)。
邊緣輪廓的提取是在Canny算子計(jì)算后的基礎(chǔ)上進(jìn)行的,采用關(guān)聯(lián)法,檢測(cè)圖4中像素值,從任意一點(diǎn)像素值為1的點(diǎn)開(kāi)始,掃描周?chē)噜?個(gè)點(diǎn)的像素值,若有大于兩個(gè)以上點(diǎn)的像素值為1的點(diǎn),加入到當(dāng)前集合中,遍歷整幅圖,最后直到為空結(jié)束,生成的即為葉片的輪廓圖形[6]。最終基于紋理和邊緣輪廓提取的結(jié)果如下所示(見(jiàn)圖4)。
圖3 Canny算子檢測(cè)后圖像
圖4 樣本提取輪廓圖
2.4 SVM算法植物葉片分類(lèi)
將提取的紋理及輪廓特征向量融合在一起使用SVM分類(lèi)器分類(lèi),但融合后特征向量的維數(shù)升級(jí),增加了計(jì)算的復(fù)雜度和周期性。本文采用一種改進(jìn)SVM算法中目標(biāo)函數(shù)的方法進(jìn)行分類(lèi),具體的操作步驟如下:
對(duì)樣本(這時(shí)的樣本包括500個(gè)所有植物的訓(xùn)練樣本和測(cè)試樣本)進(jìn)行分割、提取操作,提取樣本紋理特征和輪廓特征,并將兩種特征拼接,對(duì)拼接后樣本圖像分塊,采用張善文等[7]提出的分類(lèi)概率進(jìn)行計(jì)算。
結(jié)合拼接特征向量和分類(lèi)概率定義權(quán)值:
其中,Wij為兩樣本間權(quán)值,pi、pj為樣本正確分類(lèi)的概率,ci、cj為樣本類(lèi)別標(biāo)簽,根據(jù)所得權(quán)值構(gòu)造矩陣W={Wij}。
構(gòu)造目標(biāo)函數(shù):
將樣本Xi根據(jù)公式(4)從低維映射到高維:
根據(jù)構(gòu)造的權(quán)值矩陣W可得出,當(dāng)xi和xj最鄰近時(shí)值非0,其余都為0。當(dāng)Hij>0,使得同類(lèi)樣本xi和xj對(duì)應(yīng)的低維映射yi與yj之間的距離更?。幌喾?,當(dāng)Hij<0,使得不同類(lèi)樣本xi和xj對(duì)應(yīng)的低維映射xj與yj之間的距離更大。最后再使用SVM進(jìn)行訓(xùn)練,生成最終分類(lèi)器。
筆者采用的研究方法主要是將樣本的葉緣特征與內(nèi)部紋理特征相結(jié)合,并引入分類(lèi)概率降低空間維數(shù)以減少計(jì)算復(fù)雜度,提高識(shí)別精確度。首先將10類(lèi)樣本集中測(cè)試樣本轉(zhuǎn)換成灰度圖使用,再利用中值濾波、雙閾值法對(duì)處理后圖像分割,估算出每個(gè)測(cè)試樣本的正確分類(lèi)概率pi,根據(jù)公式(4)構(gòu)造權(quán)值矩陣,根據(jù)公式(5)建立目標(biāo)函數(shù),通過(guò)公式(6)降維后選擇合適SVM分類(lèi)器進(jìn)行分類(lèi)(實(shí)驗(yàn)中選擇徑向基函數(shù)分類(lèi)),得出如下數(shù)據(jù)(見(jiàn)下表)。
實(shí)驗(yàn)結(jié)果表
由上表可知,訓(xùn)練樣本平均正確識(shí)別率為96%,測(cè)試樣本平均識(shí)別正確率為91.6%,其中冬青,禿瓣杜英的識(shí)別率較低,兩種植物葉緣性狀本身近似,測(cè)試樣本中葉片大小差別不大,造成分類(lèi)結(jié)果誤差較大。其余樣本測(cè)試率基本正常,表明該算法辨識(shí)度比較準(zhǔn)確。
對(duì)植物葉片圖像精準(zhǔn)識(shí)別分類(lèi),建立分類(lèi)數(shù)據(jù)庫(kù),建立植物相關(guān)屬性聯(lián)系,對(duì)保護(hù)當(dāng)?shù)刂参?、農(nóng)作物,預(yù)防病蟲(chóng)害都有良好的效果,筆者提出使用SVM算法對(duì)植物葉片圖像提取并歸類(lèi),改善原有SVM中的目標(biāo)函數(shù),使低維向量生成更準(zhǔn)確,同時(shí)考慮了樣本之間的相似度。實(shí)驗(yàn)表明該算法具有較高的準(zhǔn)確性,對(duì)今后的農(nóng)林業(yè)發(fā)展也具有重要意義。
[1]桂媛.基于S VM的植物葉片類(lèi)別識(shí)別研究[J].信息技術(shù)與信息化,20 1 5(0 9):1 4 8-1 5 0.
[2]丁嬌,梁棟,閻慶.基于WLLE和S VM的植物葉片圖像識(shí)別方法[J].安徽大學(xué)學(xué)報(bào)(自然科學(xué)版),2 0 1 3(4):6 2-6 6.
[3]晏藝真,周堅(jiān)華.基于葉緣特征的植物圖像分類(lèi)檢索[J].華東師范大學(xué)學(xué)報(bào),20 1 5(4):1 5 4-1 6 2.
[4]董紅霞.基于圖像的植物葉片分類(lèi)方法研究[D].長(zhǎng)沙:湖南大學(xué),20 1 3:5-1 6.
[5]姚飛,葉康,周堅(jiān)華.植物葉圖像特征分析和分類(lèi)檢索[J].浙江農(nóng)林大學(xué)學(xué)報(bào),2 0 1 5(3):4 2 6-4 3 3.
[6]鄭小東,王曉潔,高潔.面向植物分類(lèi)的被子植物葉形特征自動(dòng)提取[J].中國(guó)農(nóng)學(xué)通報(bào),2 0 1 1(1 5):1 4 9-1 5 3.
[7]張善文,王獻(xiàn)鋒,王震,等.基于概率局部判斷映射的植物分類(lèi)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2 0 1 5(1 1):2 1 5-21 8.
(責(zé)任編輯 卞建寧)
TP391.4
:B
:1671-9123(2016)01-0127-04
2016-01-20
南楠(1981-),女,河南洛陽(yáng)人,三門(mén)峽職業(yè)技術(shù)學(xué)院信息傳媒學(xué)院講師。