基于顏色特征和屬性約簡的黃瓜病害識別方法
謝澤奇,張會敏,張善文,張?jiān)讫?/p>
(鄭州大學(xué)西亞斯國際學(xué)院,河南鄭州451150)
摘要:為了減少黃瓜葉部病害給農(nóng)業(yè)生產(chǎn)帶來的損失,提高病害的識別率和精度,提出了一種基于顏色特征和屬性約簡算法的黃瓜病害葉片分割與識別方法。該方法首先利用最大類間方差(Otsu)閾值法對黃瓜病害葉片圖像進(jìn)行病斑分割;其次提取病斑圖像的36個(gè)分類特征,再利用基于區(qū)分矩陣的屬性約簡算法進(jìn)行特征選擇;最后利用最近鄰分類器進(jìn)行病害識別。該方法在5種常見黃瓜病害葉片圖像數(shù)據(jù)庫上進(jìn)行了病害識別試驗(yàn),結(jié)果表明,識別率高達(dá) 94.8%。說明,該方法對作物病害葉片圖像識別是有效可行的。
關(guān)鍵詞:顏色特征;屬性約簡;病斑分割;病害識別
doi:10.3969/j.issn.1000-4440.2015.03.010
收稿日期:2014-11-19
基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(61272333);河南省科技廳科技攻關(guān)項(xiàng)目(142102310518、142400410853、142300410309);河南省教育廳科學(xué)技術(shù)研究重點(diǎn)項(xiàng)目(14B520064、15A520100);鄭州大學(xué)西亞斯國際學(xué)院校級科研項(xiàng)目(2014KYYB23)
作者簡介:謝澤奇(1981-),男,河南鎮(zhèn)平人,碩士,講師,研究方向?yàn)橛?jì)算機(jī)應(yīng)用、圖像處理。(E-mail)xzq0413@163.com
通訊作者:張會敏,(E-mail)zhm0413@163.com
中圖分類號:TP391
文獻(xiàn)標(biāo)識碼:A
文章編號:1000-4440(2015)03-0526-05
Abstract:To reduce the loss caused by cucumber leaf disease, and improve disease recognition rate and accuracy, a leaf image segmentation and disease recognition method for cucumber was proposed based on color feature and attribute reduction algorithm. Firstly, the Otsu algorithm was applied to segment the cucumber diseased leaf image. Secondly, 36 diagnostic characters of disease lesion were extracted, and selected by using attribute reduction algorithm based on discernibility matrix. Finally, the crop diseases were recognized using the nearest neighbor classifier. As an effective and feasible approach for crop disease recognition, this method could recognize as high as 94.8% of five cucumber diseases.
Cucumber disease recognition based on color feature and attribute reduction
XIE Ze-qi,ZHANG Hui-min,ZHANG Shan-wen,ZHANG Yun-long
(SIASInternationalUniversity,ZhengzhouUniversity,Zhengzhou451150,China)
Key words:color feature;attribute reduction;image segmentation;disease recognition
黃瓜病害對其產(chǎn)量和質(zhì)量帶來了巨大損失,如何利用計(jì)算機(jī)圖像處理技術(shù)在黃瓜種植期間實(shí)現(xiàn)病害及時(shí)檢測識別和自動(dòng)防治在農(nóng)業(yè)物聯(lián)網(wǎng)技術(shù)研究領(lǐng)域具有重要意義。由于實(shí)際病害葉片形狀、紋理和顏色的多樣性,使得葉片圖像中提取的病害分類特征也各種各樣,因此,需要進(jìn)行特征選擇。粗糙集(Rough sets, RS)是一種經(jīng)典特征選擇方法,能直接從給定問題的描述集出發(fā),通過不可分辨關(guān)系和等價(jià)關(guān)系給出問題的近似域,從而得到該問題的內(nèi)在規(guī)律。多年來,RS已成功應(yīng)用于人工智能、模式識別、信息處理以及決策分析等領(lǐng)域[2-3]。屬性約簡是RS的一個(gè)重要應(yīng)用。基于RS的屬性約簡是在保持信息系統(tǒng)分類或決策能力不變的前提下,通過知識化簡導(dǎo)出分類問題的分類規(guī)則和決策?;趨^(qū)分矩陣的屬性約簡策略是建立在兩兩互異目標(biāo)上屬性集合的區(qū)分矩陣。區(qū)分矩陣的元素代表能夠區(qū)分兩個(gè)目標(biāo)的屬性組合。實(shí)際應(yīng)用中可以將區(qū)分矩陣中出現(xiàn)次數(shù)多少作為屬性重要性的判斷依據(jù),即出現(xiàn)次數(shù)多的屬性重要性越大。
近年來,國內(nèi)外專家學(xué)者對基于作物葉片的病害識別進(jìn)行了廣泛研究。耿長興等分析黃瓜病害圖像信息的分布特征,通過線性運(yùn)算實(shí)現(xiàn)病害目標(biāo)與復(fù)雜環(huán)境背景快速有效的分離;田有文等利用黃瓜葉片的紋理特征向量結(jié)合支持向量機(jī)(Support vecter machines, SVM)分類方法對黃瓜的霜霉病、白粉病進(jìn)行識別;張芳等利用顏色、形狀、紋理等典型特征參數(shù)結(jié)合支持向量機(jī)的方法對黃瓜葉部病害進(jìn)行自動(dòng)識別。上述作物病害識別方法和系統(tǒng)都在某一方面取得了較好效果,但由于作物病害種類和病害葉片圖像的多樣性,使得僅利用病害葉片顏色、紋理和形狀等進(jìn)行病害識別的魯棒性不高。本試驗(yàn)在研究作物病害葉片圖像分割的基礎(chǔ)上,將基于區(qū)分矩陣的屬性約簡策略應(yīng)用于黃瓜病害葉片圖像分類特征選擇中,提出了一種有效的黃瓜葉片病害識別算法。該算法首先利用最大類間方差法對黃瓜葉片圖像進(jìn)行病斑分割;然后提取病斑圖像的36個(gè)分類特征;再利用基于區(qū)分矩陣的屬性約簡算法對36個(gè)特征進(jìn)行特征選擇;最后用最近鄰分類器進(jìn)行病害識別,為其他作物病害識別與防治提供參考。
1材料與方法
本試驗(yàn)所使用的病害樣本圖像均是在陜西楊凌農(nóng)業(yè)示范區(qū)科學(xué)園黃瓜溫室中自然光照的非強(qiáng)光條件下采集得到黃瓜病害葉片圖像,黃瓜品種為中農(nóng)26號。
1.2.1作物葉片病斑圖像特征提取黃瓜葉片病斑圖像的有效分割是黃瓜病害識別的前提條件[9-10]。其中,最大類間方差(Otsu)閾值法因其分割精度高、適用范圍廣等優(yōu)點(diǎn)成為目前廣泛采用的一種圖像閾值分割方法[11]。該方法的工作原理是將病斑葉片圖像像素分為病斑和正常兩類,計(jì)算出兩類病害的類間方差值,若類間方差值小于某一給定值,合并初始劃分的兩類;然后計(jì)算此時(shí)所有類的類間方差值和分離因素F值。若F值大于某個(gè)給定值,退出該算法;否則,就按順序在已有類中繼續(xù)圖像分割,最后得到葉片病斑圖像。本試驗(yàn)算法采用Otsu閾值法分別將葉片圖像的H、I、S分量進(jìn)行病斑分割,再轉(zhuǎn)換為二值化圖像,分別提取H、I、S的36個(gè)分類特征,得到一個(gè)特征向量,然后生成包括條件屬性集合和結(jié)論屬性集合、滿足粗糙集數(shù)據(jù)處理要求的二維關(guān)系規(guī)則表。
由于實(shí)際得到的病害葉片圖像為紅綠藍(lán)(RGB)模式,該色彩模式對光照較敏感,而色飽和強(qiáng)度(HIS)顏色模型反映了人的視覺對色彩的感覺[12],能克服采集過程中光照對病害識別率的影響,可將RGB模式轉(zhuǎn)換HIS模式。其轉(zhuǎn)換公式如下:
(1)
為了得到能區(qū)分作物病害的顏色特征值,分別計(jì)算病害葉片圖像R、G、B分量和分割后病斑圖像的H、I、S分量的均值、方差、偏度、峰值、能量、熵共6×6=36個(gè)統(tǒng)計(jì)特征參數(shù)[13]。計(jì)算公式如下:
(2)
1.2.2屬性約簡算法進(jìn)行特征選擇若直接把提取的36個(gè)病害圖像特征參數(shù)用于構(gòu)建病害識別模型,識別效果的穩(wěn)定性較差。因?yàn)楦鱾€(gè)特征對識別結(jié)果的貢獻(xiàn)不同,有些特征甚至影響識別結(jié)果。因此,需要對得到的特征進(jìn)行選擇。其中,基于區(qū)分矩陣的屬性約簡方法可有效對特征屬性進(jìn)行約簡[14],其基本思想是將屬性在區(qū)分矩陣中出現(xiàn)次數(shù)作為目標(biāo)屬性的重要性判斷函數(shù)。計(jì)算各屬性的重要性判斷函數(shù)f,由此可確定第一個(gè)重要屬性,此時(shí)重要屬性的判斷函數(shù)f值最大。在第一個(gè)重要屬性簡單求出后,進(jìn)一步快速簡單地求出后續(xù)重要屬性。設(shè)決策表S的核值集合為Core,其屬性約簡過程如下:
輸入:S的屬性約簡矩陣RM;輸出:S的屬性約簡Redu。
①初始化,令Redu=Core,H=?;
②令Q={RM(aj)|aj∈Redu或AFI(aj)=0},則RM=RM-Q,B=A-Redu-H;
③對aj∈B,計(jì)算f(aj)=max{ak},(k=1,2,…,m),其中f(x)為屬性重要性判斷函數(shù);
④Redu←Redu∪{aj};
⑤對每個(gè)aj∈B,令H2(aj)=RM(aj)∩RM(ak),H3(aj)=|H2(aj)|;
⑥對所有aj∈B,令RM(aj)←RM(aj)-H2(aj),f(aj)←f(aj)-H3(aj);若f(ak)=0,則H1=∪{ak};
⑦重復(fù)步驟②~⑥,直到判斷函數(shù)AFI為零向量;
⑧輸出Redu。Redu為信息表的一個(gè)屬性約簡。
本算法使用基于區(qū)分矩陣的屬性約簡方法對得到的36個(gè)特征進(jìn)行選擇。該方法是先將關(guān)系表中的每類特征屬性進(jìn)行歸一化和離散化處理;然后利用基于區(qū)分矩陣的屬性約簡方法對關(guān)系表進(jìn)行屬性約簡,依次消去可省略的屬性(列)和合并重復(fù)的對象(行),再對每一個(gè)對象進(jìn)行簡化,消去冗余的屬性值;最后根據(jù)一定的評選準(zhǔn)則選取有效識別規(guī)則的屬性簡化表,最終獲得優(yōu)選的最簡單判定規(guī)則。
1.2.3最近鄰分類器進(jìn)行病斑識別最近鄰分類的思想是:若待識別模式與樣本W(wǎng)i之間的距離最小,而且xk∈Wi,則判定x屬于Wi類[15]。將x與Wi類之間的距離定義為:
Di(x)=||x-xk||,xk∈WiIH
(3)
則最近鄰分類方法的決策規(guī)則為:
若Di(x)≤Dj(x),i=1,2,L,C;j=1,2,L,C;i≠j,則x∈Wi。
由于本算法只針對于黃瓜葉片病斑中最常見的5種病斑進(jìn)行識別,因此,定義D1、D2、D3、D4、D5分別表示待識別葉片病斑特征與細(xì)菌性角斑病、炭疽病、霜霉病、白粉病和白粉虱病5類病斑之間的距離。
為了驗(yàn)證本試驗(yàn)方法的有效性,采集溫室黃瓜葉片最常見的細(xì)菌性角斑病、炭疽病、霜霉病、白粉病和白粉虱病的5種病斑葉片各100幅,其中50幅圖像作為訓(xùn)練集,其余50幅圖像作為測試集。然后在Windows XP系統(tǒng)中利用Matlab7.1軟件中自帶的圖像處理工具箱為圖像處理和分析平臺,計(jì)算以上特征參數(shù),數(shù)據(jù)分析采用統(tǒng)計(jì)分析軟件SAS V9.2。
2結(jié)果與分析
采用Otsu閾值法分別將病害葉片進(jìn)行病斑分割,分割定位待識別的黃瓜葉片病害部分病斑,利用式(2)提取病害葉片病斑的36個(gè)分類特征。其中,5種黃瓜病害葉片及對應(yīng)分割病斑圖像的H、I、S分量如圖1所示,最左邊圖像為5種病害葉片病斑原始圖像,右邊二值圖像為5種病斑葉片對應(yīng)的分割結(jié)果,依次為H、I、S分量。5種病斑圖像采用Otsu閾值法自動(dòng)得到二值化圖像的熵值、分割閾值和運(yùn)行時(shí)間如表1所示。
a:細(xì)菌性角斑??;b:霜霉病;c:炭疽??;d:白粉病;e:白粉虱病。 圖1 5種黃瓜病害葉片分割 Fig.1 Leaf image segmentation of five kinds of cucumber diseases
將得到的36個(gè)特征進(jìn)行離散化,即把每個(gè)特征劃分成有限區(qū)域(試驗(yàn)中為5個(gè)區(qū)域),使每個(gè)區(qū)域中對象的決策值相同。利用基于區(qū)分矩陣的屬性約簡方法對36個(gè)特征進(jìn)行屬性約簡,得到6個(gè)重要屬性,分別為病斑分量H的均值、方差、能量,分量I的均值,分量S的方差和能量。再將這6個(gè)屬性組成一個(gè)特征向量來表示這個(gè)樣本。最后利用最近鄰分類器對病害種類進(jìn)行分類,識別結(jié)果見表2,其中,每種病斑50幅圖像用于測試,表2給出了基于全部36個(gè)特征和基于其他2種方法[16-17]的識別結(jié)果??梢钥闯? 若只利用全部36個(gè)特征進(jìn)行病害識別,其識別率僅為79.2%,原因?yàn)?6個(gè)特征中存在的一些冗余特征影響病害的識別率。與文獻(xiàn)中其他算法相比,本研究提出的方法識別率最高,對于黃瓜最常見的病斑識別率可達(dá)到94.8%,其中對白粉虱病的識別率最高可達(dá)98.0%,原因?yàn)榘追凼〉姆指钚Ч^好,特征較明顯,對細(xì)菌性角斑病識別率達(dá)到92.0%,表明該方法用于黃瓜葉部各種常見病害圖像識別是有效可行的。
試驗(yàn)過程還發(fā)現(xiàn),病斑分割與識別方法對于黃瓜病害中等程度的識別率略高于重度病害和輕度病害。
表15種黃瓜病害葉片分割結(jié)果參數(shù)
Table 1Segmentation result of five kinds of cucumber diseased leaves
參 數(shù) 細(xì)菌性角斑病霜霉病炭疽病白粉病白粉虱病二值化圖像熵值0.97570.97570.96520.92400.9642分割閾值148156181131149運(yùn)行時(shí)間(s)1.48451.59402.26501.39571.1720
表2黃瓜病害葉片的識別結(jié)果
Table 2Recognition rates of cucumber diseased leaves
病 害 識別率(%)36特征識別法文獻(xiàn)?方法文獻(xiàn)?方法本研究算法細(xì)菌性角斑病78.090.086.092.0炭疽病82.084.080.094.0霜霉病76.086.084.094.0白粉病76.082.078.096.0白粉虱病84.086.082.098.0總計(jì)79.285.682.094.8
從黃瓜葉片圖像采集和識別中可得出以下結(jié)論:(1)36特征識別率低于本文算法采用的約簡后的6特征識別法,因此,病害識別中并非特征越多越好,應(yīng)對識別特征進(jìn)行優(yōu)化組合或特征選擇;(2)關(guān)于采集的病斑葉片圖像提取特征,同一病害樣本在不同成像環(huán)境下拍攝,圖像特征向量存在一定差異;(3)不同黃瓜品種、不同發(fā)病時(shí)期的病癥表現(xiàn)差異較大。這些差異對病斑識別結(jié)果的影響可以通過制定圖像的采集規(guī)范有效解決。
3討論
本研究在結(jié)合顏色特征和屬性約簡算法的基礎(chǔ)上,提出了一種黃瓜葉片病害識別算法。該算法利用最大類間方差閾值法對作物葉片病斑進(jìn)行圖像分割,然后提取病斑圖像的36個(gè)特征,再利用粗糙集對提取特征進(jìn)行屬性約簡,得到了6個(gè)重要代表特征。最后利用最近鄰分類器對病害進(jìn)行分類。結(jié)果表明該方法具有較好的有效性和可行性。由于病害葉片拍攝狀態(tài)和光照等環(huán)境因素對顏色特征存在影響,發(fā)病程度及病斑的典型性可能對識別準(zhǔn)確率也有影響,所以對拍攝照片中顏色特征的定量關(guān)系有待進(jìn)一步研究。對于某些顏色、形狀特征非常相似的其他黃瓜病癥,還應(yīng)進(jìn)一步提取病斑的顏色、形狀和紋理等特征,以實(shí)現(xiàn)對病害的有效識別。
參考文獻(xiàn):
[1]郭鵬,李乃祥.黃瓜病害圖像自動(dòng)分割方法研究.農(nóng)機(jī)化研究,2014,36(8):10-13,18.
[2]王國胤,姚一豫,于洪.粗糙集理論與應(yīng)用研究綜述.計(jì)算機(jī)學(xué)報(bào),2009,32(7):1229-1246.
[3]陳昊,楊俊安,莊鎮(zhèn)泉.變精度粗糙集的屬性核和最小屬性約簡算法.計(jì)算機(jī)學(xué)報(bào),2012,35(5):1011-1017.
[4]楊傳健,葛浩,汪志圣.基于粗糙集的屬性約簡方法研究綜述.計(jì)算機(jī)應(yīng)用研究,2012,29(1):16-20.
[5]馬翔,張繼福,楊海峰.基于區(qū)分矩陣的啟發(fā)式屬性約簡算法.計(jì)算機(jī)應(yīng)用,2010,30(8):1999-2002,2037.
[6]耿長興,張俊雄,曹崢勇,等.基于色度和紋理的黃瓜霜霉病識別與特征提取.農(nóng)業(yè)機(jī)械學(xué)報(bào),2011,42(3):170-174.
[7]田有文,李天來,張琳,等.高光譜圖像技術(shù)診斷溫室黃瓜病害的方法.農(nóng)業(yè)工程學(xué)報(bào),2010,26(5):202-206.
[8]張芳,王璐,付立思,等.基于支持向量機(jī)的黃瓜葉部病害的識別研究.沈陽農(nóng)業(yè)大學(xué)學(xué)報(bào),2014,45(4):457-462.
[9]袁媛,李淼,陳晟,等.復(fù)雜背景黃瓜葉部病害圖像分割方法.農(nóng)業(yè)機(jī)械學(xué)報(bào),2013,44(10):233-237.
[10]張芳,王璐,付立思,等.復(fù)雜背景下黃瓜病害葉片的分割方法研究.浙江農(nóng)業(yè)學(xué)報(bào),2014,26(5):1346-1355.
[11]鄒小林,馮國燦.融合視覺模型和最大類間方差的閾值分割算法.計(jì)算機(jī)應(yīng)用,2013,33(3):670-673,837.
[12]溫長吉,王生生,于合龍,等.基于改進(jìn)蜂群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的玉米病害圖像分割.農(nóng)業(yè)工程學(xué)報(bào),2013,29(13):142-149.
[13]REVATHI P, REVATHI R. Knowledge discovery in diagnose of crop diseases using machine learning techniques . International Journal of Engineering Science and Technology, 2011, 3(9):7187-7190.
[14]呂躍進(jìn),翁世洲,何朝麗.基于布爾區(qū)分矩陣與關(guān)聯(lián)規(guī)則挖掘的屬性約簡算法.計(jì)算機(jī)應(yīng)用與軟件,2012,29(10):40-43,116.
[15]王衛(wèi)東,鄭宇杰,楊靜宇,等.一種基于預(yù)分類的高效最近鄰分類器算法.計(jì)算機(jī)科學(xué),2007,2(34):198-200.
[16]賈建楠,吉海彥.基于病斑形狀和神經(jīng)網(wǎng)絡(luò)的黃瓜病害識別.農(nóng)業(yè)工程學(xué)報(bào),2013,29(4):115-121.
[17]岑喆鑫,李寶聚,石延霞,等.基于彩色圖像顏色統(tǒng)計(jì)特征的黃瓜炭疽病和褐斑病的識別研究.園藝學(xué)報(bào), 2007,34(6):1425-1430.
(責(zé)任編輯:袁偉)
劉飛,楊春艷,謝建新. 傅里葉變換紅外光譜結(jié)合判別分析法診斷蠶豆病蟲害[J].江蘇農(nóng)業(yè)學(xué)報(bào),2015,31(3):531-537.