楊 濤 楊博雄 尹 萍 熊 純 鄒佳雪
(三亞學院信息與智能工程學院 海南三亞 572022;三亞學院陳國良院士工作站 海南三亞 572022)
基于植物葉片圖像的植物識別方法研究在保護生態(tài)環(huán)境方面具有十分重要的意義[1]。植物葉片的平面基于二維結(jié)構(gòu),特性穩(wěn)定,比花和果實有更長的生存期,容易分析和提取葉片特征,因此在植物分類中將葉片作為研究對象。植物葉片復雜多樣,數(shù)量多,傳統(tǒng)植物葉片分類方法效率低、主觀性強,難以滿足大量植物葉片圖像精確分類需求[2]。因此需要借助機器視覺技術(shù)對植物葉片進行分類。
近年來,隨著計算機視覺和模式識別技術(shù)的發(fā)展,葉片圖像特征提取技術(shù)不斷涌現(xiàn)[3~6],在植物分類中得到廣泛的應用。然而根據(jù)Retinex 理論,植物葉片圖像是由葉片材質(zhì)和光照環(huán)境等多種因素決定的,其中葉片材質(zhì)反應圖像的顏色信息,光照環(huán)境反應圖像的紋理和邊緣信息,因此直接提取特征信息會造成特征之間的干擾,降低分類準確率,所以進行本征信息分解十分必要。本文提出一種基于本征信息分解的植物葉片分類方法。將原始圖像分解后,從反射率本征圖像中提取葉片的顏色特征,光照本征圖像中提取紋理特征和邊緣特征,并將3 種特征按照一定的權(quán)重比例融合后用于植物分類。從而解決了不相關(guān)因素的干擾問題,有利于提高植物葉片分類效果,對維持多元物種,保護植物提供了一定的技術(shù)支持。
本文采用Swedish 葉片數(shù)據(jù)集進行實驗。在該數(shù)據(jù)中隨機選擇10 種植物葉片(歐洲瑞香,臭椿,榛葉,構(gòu)樹葉,海桐葉,桂英葉,紫荊,樸樹,楊木葉,小葉榆),每種葉片包含70 張樣本(共計700 個樣本),其中20 張用來提取不同的特征,形成植物葉片圖像特征庫。另外50 張用來分類測試。
1.2.1 本征圖像分解
本征圖像分解最初由Barrow 和Tenenbaum 提出,核心思想是將原始圖像分解得到反射率本征圖像(Reflectance)和光照本征圖像(Shading)。定義能量函數(shù):
上式中,N(i)是像素點對應的局部鄰域窗格,P是圖像上所有像素點。
在上述能量方程基礎上,得到能量優(yōu)化公式:
利用上述能量優(yōu)化方法將植物葉片圖像分解為反射率本征圖像和亮度本征圖像。為方便程序調(diào)用,本文將植物葉片分解算法進行封裝,其C++/OpenCV 函數(shù)接口如下。
vector
設計意圖: 學生結(jié)合思維導圖概括主要內(nèi)容是進行知識加工并表達的過程,課后作業(yè)是為促進學生科學地認知進行的實踐性指導。
1.2.2 特征提取
植物葉片圖像的特征提取,從反射率本征圖像中提取顏色特征,從光照圖像中提取紋理和邊緣特征。具體分為以下三部分。
(1)顏色特征。將植物葉片的反射率本征圖像從RGB顏色空間轉(zhuǎn)換到HSV 顏色空間,并按照符合人眼視覺顏色感知的標準H∶S∶V=8∶3∶3 量化圖像,最后以9∶3∶1的比例將圖像量化成72 柄一維特征矢量。同時考慮到植物葉片在圖像中的“中心聚集”特性,本文將圖像從水平和豎直兩個方向上進行3∶3 的不均勻分塊(1∶2∶1)。分割后,逐塊進行非等間隔量化,計算72 柄顏色直方圖向量。并分別求取特征矢量,最終生成一個72*9 的顏色特征矩陣。
(2)紋理特征。將植物葉片光照本征圖像由[0,255 ]灰度等級量化成為[0,16],并在00,450,900,1350四個方向上生成圖片的灰度共生矩陣,最后統(tǒng)計灰度共生矩陣能量、熵、對比度和逆差矩獲取16 柄一維特征向量[23~24]。同時,考慮到植物葉片紋理的分布,采取與顏色特征相同的分塊規(guī)則,并分別求取特征矢量,最終得到一個16*9 的紋理特征矩陣。
(3)邊緣特征。采用sobel 水平和豎直檢測算子對植物葉片光照本征圖像進行濾波,得到水平和豎直方向的梯度圖像并取絕對值后整合成為一幅梯度圖像。為統(tǒng)一邊緣特征的維度,本文在計算邊緣特征前將圖像歸一化調(diào)整到16*8。
1.2.3 多特征融合
植物葉片的綜合特征,是將獲取的顏色特征、紋理特征和邊緣特征按一定比例進行整合。多特征的計算公式如下:
其中,F(xiàn)eaturesAll是綜合特征,而FeatureHist、FeatureGLCM和FeatureGradient分別是顏色、紋理和邊緣特征。a、b、c 分別代表顏色、紋理和邊緣特征所占的比例,sum則是三種特征的比例之和。本文通過實驗測試,得到顏色、紋理和邊緣特征按照2∶4∶4(a∶b∶c)比例進行融合,能夠得到最佳的圖像分類效果。
圖1 原始圖像分解為反射率本征圖像和光照本征圖像
本文利用1.2.2(1)的算法在反射率本征圖像中提取顏色特征,利用1.2.2(2)的算法在光照本征圖像中提取紋理特征。按照提及的分塊策略進行特定比例劃分,海桐葉片本征圖像分塊結(jié)果如圖2所示。
圖2 反射率本征圖像和光照本征圖像分塊方式
在植物葉片的光照本征圖像中利用1.2.2(3)中的算法求取邊緣特征,海桐葉片的邊緣圖像如圖3所示。
圖3 水平、垂直和綜合方向的植物葉片邊緣(梯度)
為驗證基于本征信息分解的植物葉片分類方法的有效性,對Swedish 植物葉片數(shù)據(jù)集中隨機選擇的10 種葉片圖像分別采用單一顏色特征、單一紋理特征、多元與植物葉片原始圖像分解后的單一顏色特征、單一紋理特征、綜合特征的葉片分類方法進行分類準確率比較。
2.2.1 單一顏色特征分類
由表1可知,在隨機選擇的10 種植物葉片中,按照分解原始圖像后的單一顏色特征與原始圖像單一顏色特征分類相比,分解后,臭椿葉和楊木葉平均準確率均提高6%;構(gòu)樹、海桐、桂英、瑞香、紫荊、葉榆平均準確率均提高2%,榛葉和樸樹葉平均準確率與分解前相同均為92 %。其中楊木和葉榆的平均準確率為98 %。
2.2.2 單一紋理特征分類
由表1可知,在隨機選擇的10 種植物葉片中,按照分解原始圖像后的單一紋理特征與原始圖像單一紋理特征分類相比,海桐葉分類平均準確率提高22 %;構(gòu)樹葉和紫荊葉分類的平均準確率均提高18 %;樸樹葉分類的平均準確提高14 %;桂英葉分類的平均準確率提高12 %,葉榆提高10 %,剩余的5 種葉子分類的平均準確率提高4~8 %。分解后,樸樹葉的平均準確率最高為94 %。
2.2.3 綜合特征分類
由表1可知,在隨機選在的10 種植物中,按照分解原始圖像后的綜合特征與原始圖像綜合特征分類相比,分解后,臭椿葉分類的平均準確率提高2 %,其余的9 種植物葉片分類準確率均提高4 %。其中葉榆分類的平均準確率高達100 %,臭椿、樸樹和楊木分類的平均準確率為98 %。在10 種植物中,構(gòu)樹葉分類的平均準確率最低為92 %。
表1 不同植物葉片分類方法分類效果
綜上所述,對表1中的10 種植物葉片分類的準確率進行統(tǒng)一分析。當利用原始圖像提取單一顏色特征分類時,分解原始圖像后平均準確率提高3 %達到92 %;利用原始圖像提取單一紋理特征分類時,分解原始圖像后平均準確率提高13 %達到80 %;利用原始圖像提取綜合特征分類時,分解原始圖像后平均準確率提高4 %達到97 %。因此,基于本征信息的植物葉片分類方法對植物葉片分類具有一定的有效性。
本文基于本征圖像分解原理提出了基于本征信息的植物葉片分類方法,將本征信息應用于植物葉片分類,避免了直接在原始圖像中提取顏色、紋理和邊緣特征信息干擾的問題。實驗結(jié)果表明,相對傳統(tǒng)從彩色圖像和灰度圖像中提取顏色、紋理和邊緣特征的方案,本文方法具有較強的理論依據(jù)和較好的分類效果。綜上所述,本文提出的方法對提高植物葉片分類準確率具有一定的作用,對農(nóng)業(yè)領(lǐng)域的圖像分類具有一定的借鑒意義。