劉迦南 朱洋 李藝嘉 韓婧
[摘要]為了實(shí)現(xiàn)對(duì)煙青蟲的有效防治,借助計(jì)算機(jī)對(duì)煙青蟲雌雄成蟲進(jìn)行有效的圖像識(shí)別是非常重要的。在機(jī)器視覺(jué)與圖像識(shí)別技術(shù)的結(jié)合下,通過(guò)支持向量機(jī)對(duì)害蟲進(jìn)行有效識(shí)別。煙青蟲雌雄成蟲圖像屬于典型的二分類問(wèn)題,為此,在自動(dòng)提取其顏色及紋理等36個(gè)特征的基礎(chǔ)上,研究了將LIBSVM工具應(yīng)用于害蟲性別判別的方法。通過(guò)K折交叉驗(yàn)證選取分類機(jī)的最優(yōu)參數(shù)組合并建立模型,對(duì)目標(biāo)害蟲圖像進(jìn)行了自動(dòng)分類,識(shí)別率達(dá)到95%。實(shí)驗(yàn)結(jié)果表明,利用該方法可以對(duì)害蟲性別做出有效判別。
[關(guān)鍵詞]煙青蟲;圖像增強(qiáng);雌雄害蟲;支持向量機(jī)
煙青蟲,Helicoverpa assulla(Guenee),又名煙草夜蛾,鈴夜蛾屬,寄主植物達(dá)70余種,主要危害煙草、辣椒,是世界性的煙草害蟲,國(guó)內(nèi)各煙區(qū)均有分布。其中黃淮煙區(qū)、華中煙區(qū)、西南煙區(qū)的四川、貴州等地分布較多,國(guó)外集中分布在日本、朝鮮、印度等地,每年給種植者、政府造成巨大損失[1]。
在對(duì)煙青蟲的系統(tǒng)探究過(guò)程中,需要進(jìn)行蟲體的雌雄判別。小菜蛾雌雄比例是衡量飼料是否成功的重要指標(biāo)之一[2];在對(duì)害蟲食料進(jìn)行選擇性及適應(yīng)性的研究中,雌蟲的產(chǎn)卵喜好及嗜食性差異是綜合治理的重要依據(jù)[3];在不同光源對(duì)害蟲誘殺效果的評(píng)價(jià)研究中,雌雄上燈比率有明顯差異,表現(xiàn)為雄性上燈率遠(yuǎn)多于或近似于雌性的上燈率[4];在田間預(yù)測(cè)預(yù)報(bào)與誘殺防治的研究中,利用性激素誘導(dǎo)害蟲,可以獲得雌雄蟲比并推算其種群動(dòng)態(tài)變化[5];在夜蛾昆蟲數(shù)學(xué)分類應(yīng)用中,利用翅脈特征可對(duì)棉鈴蟲等六種害蟲做出有效判別[6];對(duì)害蟲在不同寄主植物適應(yīng)度的研究中,通過(guò)比較不同齡期蟲在七種植物上的存活率、體重、產(chǎn)卵率等指標(biāo),發(fā)現(xiàn)在棉花、大豆作物上適應(yīng)度最高[7];在工業(yè)應(yīng)用的研究中發(fā)現(xiàn),成蟲體內(nèi)含有的蛋白酶經(jīng)純化后可與金屬離子氧化還原,在漂白劑、有機(jī)溶劑和商業(yè)洗滌劑中具有很高的穩(wěn)定性和相容性,是一種具有重要工業(yè)特性的生物資源替代品[8]。
目前對(duì)煙青蟲雌雄成蟲的形態(tài)描述多限于專家經(jīng)驗(yàn)及教科書,大多數(shù)是利用手繪或移動(dòng)設(shè)備拍照形成原始圖像再進(jìn)行人工判別,利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)煙青蟲性別做出自動(dòng)判別還未見(jiàn)報(bào)道。
本研究通過(guò)飼養(yǎng)害蟲多代,對(duì)煙青蟲雌雄成蟲進(jìn)行系統(tǒng)觀察,利用圖像處理和模式識(shí)別相結(jié)合的方法描述煙青蟲的識(shí)別分類特征,從而對(duì)雌雄害蟲做出有效的自動(dòng)判別,為其相關(guān)領(lǐng)域的研究及應(yīng)用等工作提供參考。
1 圖像采集與預(yù)處理
本文研究對(duì)象來(lái)自河南農(nóng)業(yè)大學(xué)植物保護(hù)室剛孵化未交尾的煙青蟲雌雄成蟲,連續(xù)培養(yǎng)多代。經(jīng)試驗(yàn),采取活體拍照取樣方法最佳,即通過(guò)蜂蜜水或者蔗糖水將煙青蟲吸引至白色背景板,采用美國(guó)菲力爾公司(FILR)生產(chǎn)工業(yè)相機(jī)(型號(hào)為BFLY-PGE-50S5C-C,25mm工業(yè)鏡頭)進(jìn)行害蟲RGB高清彩色數(shù)字圖像的獲取。所獲取圖像格式為BMP,原始圖像經(jīng)有效區(qū)域裁剪后分辨率為380×380像素。原始圖像可用作顏色特征的提取,對(duì)原始圖像進(jìn)行圖像增強(qiáng),采用直方圖均衡化后,發(fā)現(xiàn)RGJB圖像的B通道灰度圖像紋理效果良好,有利于后續(xù)的紋理特征提取和選擇[9]。本文所用程序算法在MATLAB 2014a環(huán)境中實(shí)現(xiàn),軟件運(yùn)行環(huán)境為L(zhǎng)ENOVO PC兼容(32GRAM, InlelCore i7 CPU,3.6GHz主頻)。圖1為實(shí)驗(yàn)室飼養(yǎng)的煙青蟲雌雄成蟲RGB圖像,按上述方法得到的單通道圖像見(jiàn)圖2。
2 特征提取
人們往往通過(guò)肉眼觀察昆蟲的顏色、紋理、形狀甚至害蟲的外生殖器等特征來(lái)對(duì)害蟲進(jìn)行區(qū)分判別,但借助人工識(shí)別往往容易因?yàn)槠诘纫蛩貙?dǎo)致結(jié)果出現(xiàn)偏差[10]。
(1)顏色特征:顏色信息通常分布在顏色低階矩中,顏色矩方法的思想在于圖像中任何的顏色分布都可以用它的矩來(lái)表示。此外,由于顏色分布信息主要集中在低階矩中,如一階矩描述平均顏色、二階矩捕述顏色方差、三階矩描述顏色的偏移性,利用低階矩就可以近似表示顏色分布的特征[11]。
(2)紋理特征:已有對(duì)紋理特征描述方法進(jìn)行研究,如統(tǒng)計(jì)法、合成法、結(jié)構(gòu)法、邊緣描述法等[9]。在紋理特征統(tǒng)計(jì)方法的描述中,最主要是生成圖像的CLCM(灰度共生矩陣)和GLDS(差分統(tǒng)計(jì)法),并通過(guò)計(jì)算其中的各個(gè)量度值來(lái)捕述圖像。紋理是一種不依賴于顏色或亮度變化的反映圖像中同質(zhì)現(xiàn)象的視覺(jué)特征,刻畫了圖像像素鄰域灰度空間分布的規(guī)律,是所有物體表面都具有的內(nèi)在特性[12]。不同物體具有不同的紋理,比如不同昆蟲圖像所對(duì)應(yīng)的紋理數(shù)值具有差異,基于此可用紋理特征對(duì)害蟲性別進(jìn)行有效區(qū)分判別。
(3)不變矩特征:不變矩是一種比較經(jīng)典的特征提取方法。單純的中心矩或是原點(diǎn)矩盡管可以表征平面物體的幾何形狀但都不具有不變性,然而可以從這些矩構(gòu)造不變量。這種方法最初由Hu提出,他利用中心矩構(gòu)造出7個(gè)不變量,這些不變量已經(jīng)被成功地應(yīng)用于很多領(lǐng)域[13]。其中最多被應(yīng)用于圖像識(shí)別,圖像在平移、鏡像、旋轉(zhuǎn)變換時(shí)具有變量不變性,以此作為7個(gè)特征可供選取特征量時(shí)的參考。
本文對(duì)雌雄害蟲圖像有效區(qū)域進(jìn)行特征提取,最終提取特征包括顏色、紋理與不變矩特征,具體提取方法如下:顏色矩(顏色一階矩、顏色二階矩、顏色三階矩)、灰度共生矩陣(0°、45°、90°、135°)、差分統(tǒng)計(jì)矩陣、七個(gè)不變矩,共計(jì)36個(gè)特征。煙青蟲雌雄蟲體之間各個(gè)特征量綱差異較大,如果直接進(jìn)行分類識(shí)別不僅影響系統(tǒng)性能且對(duì)計(jì)算精度影響較大。因此,對(duì)提取的所有原始特征數(shù)據(jù)進(jìn)行歸一化處理以降低計(jì)算時(shí)間,提高計(jì)算效率及精度。利用MATLAB中自帶函數(shù)MAPMINMAX對(duì)數(shù)據(jù)做歸一化處理,經(jīng)過(guò)歸一化處理后,特征數(shù)據(jù)的范圍為0-1。
3 雌雄煙青蟲的自動(dòng)判別
支持向量機(jī)(Support Vector Machine,SVM)是一種新型的監(jiān)督式機(jī)器學(xué)習(xí)方法,其算法原理是依據(jù)1995年Vapnik創(chuàng)立的統(tǒng)計(jì)學(xué)理論中的風(fēng)險(xiǎn)經(jīng)驗(yàn)最小化準(zhǔn)則(SRM),將樣本點(diǎn)誤差以及結(jié)構(gòu)風(fēng)險(xiǎn)水平降到最低,對(duì)樣本數(shù)量范圍沒(méi)有過(guò)多要求,極大地提高了模型的推廣能力[14]。線性可分時(shí),利用最優(yōu)分類面選取思想,選擇目標(biāo)距離最遠(yuǎn)的折中,使待區(qū)分的目標(biāo)準(zhǔn)確無(wú)誤地分開,并使待檢測(cè)目標(biāo)的分類間隔最大。對(duì)于煙青蟲雌雄體的判別問(wèn)題,可以把它作為一個(gè)二分類問(wèn)題來(lái)解決。利用LIBSVM軟件包在MATLAB環(huán)境下來(lái)實(shí)現(xiàn),LIBSVM作為通用的SVM軟件包,可以解決分類問(wèn)題(c-SVC,v-SVC)、回歸問(wèn)題(ε-SVR,v-SVR)以及分布估計(jì)(one-class-SVM)等,提供了四種核函數(shù)(線性、多項(xiàng)式、徑向基和s形),可以有效地解決多類問(wèn)題、交叉驗(yàn)證參數(shù)優(yōu)化、對(duì)不平衡樣本加權(quán)、多類問(wèn)題的概率估計(jì)等[15]。支持向量機(jī)基本求解公式如下(本文選用c-SVC分類和RBF(徑向基核函數(shù):K(x,xi)= exp(-g‖xi-x‖2)):
其中g(shù)為方差且>0,Yi為符號(hào)函數(shù),ω為權(quán)向量,xi為樣本向量,b為截距,C為懲罰因子,εi島為松弛變量,l為樣本總數(shù)。
LIBSVM軟件包使用的一般步驟如下[6]:(1)根據(jù)LIBSVM軟件包的格式要求準(zhǔn)備數(shù)據(jù)集。(2)對(duì)數(shù)據(jù)集進(jìn)行必要的縮放操作。(3) -般考慮選用RBF核函數(shù)。(4)用交叉驗(yàn)證搜索參數(shù)C與g的最優(yōu)參數(shù)組合。(5)用搜索到的最優(yōu)參數(shù)組合對(duì)整個(gè)訓(xùn)練集進(jìn)行訓(xùn)練,得到支持向量機(jī)模型。(6)利用得到的訓(xùn)練模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè)。
煙青蟲成蟲的雌雄判別屬于二分類問(wèn)題,LIBSVM工具箱采用的是一對(duì)一的SVM算法,在對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練的過(guò)程中,構(gòu)造出所有可能出現(xiàn)的二類別分類器,經(jīng)過(guò)140個(gè)煙青蟲樣本(其中雌雄各為70個(gè))訓(xùn)練后的SVM分類器的nSV(支持向量)共112個(gè)。用SVM分類器對(duì)60個(gè)(雌雄各30個(gè))雌雄害蟲樣本進(jìn)行測(cè)試,正確識(shí)別率為95%。結(jié)果顯示僅有3個(gè)樣本被誤判,其余57只均實(shí)現(xiàn)了自動(dòng)精確分類判別,取得了較好的分類結(jié)果,結(jié)果見(jiàn)圖3。
4 結(jié)論
(1)把K折交叉驗(yàn)證訓(xùn)練模型的識(shí)別率作為分類器性能的一個(gè)主要評(píng)價(jià)因素,訓(xùn)練測(cè)試得到的最優(yōu)C與g,當(dāng)C=19.6983,g=0.0272時(shí),識(shí)別率達(dá)到95%,使得測(cè)試樣本識(shí)別率達(dá)到了最佳。
(2)研究運(yùn)用LIBSVM進(jìn)行煙青蟲雌雄成蟲判別分類的可行性,并采用徑向基核函數(shù)對(duì)雌雄害蟲特征數(shù)據(jù)進(jìn)行SVC數(shù)據(jù)的分類,通過(guò)大量樣本的訓(xùn)練與測(cè)試,識(shí)別率為95%。實(shí)踐證明煙青蟲雌雄成蟲圖像識(shí)別中基于SVM的分類器能夠達(dá)到預(yù)期的效果。因此,支持向量機(jī)分類模型在實(shí)際中可以作為判別害蟲類別的依據(jù)。
(3)所采集煙青蟲均為戶外自然條件下采集且連續(xù)飼養(yǎng)多代,與野生害蟲體型有略微差別,下一步應(yīng)將自然狀態(tài)下害蟲加入分類樣本數(shù)據(jù)集,結(jié)果更加具有意義及廣泛性。
參考文獻(xiàn)
[1]任廣偉.煙蚜和煙青蟲的發(fā)生與防治[J].煙草科技,2002 (5):75-79.
[2]莫美華,龐雄飛.二次正交旋轉(zhuǎn)回歸設(shè)計(jì)在小菜蛾飼料配方篩選中的應(yīng)用[J].生態(tài)學(xué)報(bào),2006 (7):2935-2941.
[3]張勇,王開運(yùn),王剛,等.煙青蟲對(duì)三種食料植物的選擇性及適應(yīng)性[J].應(yīng)用昆蟲學(xué)報(bào),2006 (6):781-784
[4]張玥.20種光源對(duì)蔬菜地主要害蟲的誘殺效果評(píng)價(jià)[D].武漢:華中農(nóng)業(yè)大學(xué),2010.
[5]劉超,邢茂德,邊文波,等.淄博市棉鈴蟲種群動(dòng)態(tài)及其在測(cè)報(bào)中應(yīng)用分析[J].農(nóng)業(yè)科技通訊,2016 (8):123-125.
[6]蔡小娜,黃大莊,沈佐銳,等,蛾翅翅脈特征在夜蛾昆蟲數(shù)學(xué)分類學(xué)中的應(yīng)用,中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào),2015 (5):188-193.
[7] REIGADA C, GUIMARAES K F PARRA J R P Relative fitness ofhelicoverpa armigera (lepidoptera: noctuidae) on seven host plants:8perspective for IPM in Brazil[J].Journal oflnsect Science,2016(1):3
[8] AKBAR S M, SHARMA H C Alkaline serine proteases fromHelicuverpa armigera: potential candidates for industrial applications[J].Archives oflnsect Biochemistry&Physiology,2017(1):21367
[9]劉舒,姜琦剛,邵永社,等應(yīng)用灰度共生矩陣的紋理特征描述的研究[J].科學(xué)技術(shù)與工程,2012 (33):8909-8914.
[10]張紅濤,毛罕平,邱道尹.儲(chǔ)糧害蟲圖像識(shí)別中的特征提取[J].農(nóng)業(yè)工程學(xué)報(bào),2009 (2):126-130.
[11]戴天虹,王克奇,楊少舂.基于顏色特征對(duì)木質(zhì)板材分級(jí)的研究[J].系統(tǒng)仿真學(xué)報(bào),2008 (5):1372-1376.
[12]孫君頂,馬媛媛,紋理特征研究綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010 (6):245-250.
[13]柳林霞,陳杰,竇麗華.不變矩理論及其在目標(biāo)識(shí)別中的應(yīng)用[J].火力與指揮控制,2003 (2):13-15.
[14]張紅濤,胡玉霞,毛罕平.基于SVM的儲(chǔ)糧害蟲圖像識(shí)別分類[J].農(nóng)機(jī)化研究,2008 (8):36-38.
[15]王慧勤,雷剛.基于LIBSVM的風(fēng)速預(yù)測(cè)方法研究[J].科學(xué)技術(shù)與工程,2011 (22):5440-5442+5450.
[16]李坤,劉鵬,呂雅潔,等.基于Spark的L|BSVM參數(shù)優(yōu)選并行化算法[J].南京大學(xué)學(xué)報(bào)(自然科學(xué)),2016 (2):343-352.