萬(wàn) 穎楊紅云王映龍羅建軍梅 夢(mèng)
(1.江西農(nóng)業(yè)大學(xué) 計(jì)算機(jī)信息與工程學(xué)院,南昌 330045;2.江西農(nóng)業(yè)大學(xué) 軟件學(xué)院,南昌 330045;3.江西省商務(wù)學(xué)校 基礎(chǔ)教學(xué)部,南昌 330103)
農(nóng)作物病害是中國(guó)農(nóng)業(yè)災(zāi)害之一,也是制約農(nóng)業(yè)可持續(xù)發(fā)展的主要因素之一,不僅對(duì)農(nóng)作物生產(chǎn)造成損失,還會(huì)對(duì)食品安全產(chǎn)生威脅[1-2]。而識(shí)別病害則要求鑒定人員具有豐富的專(zhuān)業(yè)知識(shí)與實(shí)際經(jīng)驗(yàn),且鑒定分析過(guò)程既費(fèi)時(shí)又費(fèi)力,因此需要借助計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)來(lái)幫助農(nóng)民判斷作物疾病并及時(shí)做出預(yù)防。自20世紀(jì)50年代以來(lái),研究者就利用圖像處理技術(shù)來(lái)開(kāi)展農(nóng)作物病害識(shí)別的研究[3-4]。
水稻作為世界主要糧食作物之一,其病害是影響產(chǎn)量的主要因素之一,所以快速、準(zhǔn)確的識(shí)別與檢測(cè)水稻病害并進(jìn)行有效的防治是非常重要的[5]。在圖像識(shí)別方面,傳統(tǒng)的圖像技術(shù)與機(jī)器學(xué)習(xí)過(guò)程較為繁瑣,高光譜、紅光譜等技術(shù)[6-7]需獲取水稻病害圖像的光譜信息及圖像信息,傳統(tǒng)機(jī)器學(xué)習(xí)方法如判別分析、支持向量機(jī)等,在對(duì)圖像病害進(jìn)行分類(lèi)識(shí)別前需先利用圖像處理技術(shù)提取水稻病害病斑的顏色、紋理、形狀等特征向量,再?gòu)闹泻Y選出有效特征[8-13],才可達(dá)到對(duì)病害較高的識(shí)別準(zhǔn)確率。
圖像分割是常用的圖像處理技術(shù),根據(jù)像素值大小把一副圖像劃分成若干個(gè)相似的區(qū)域,并能用輪廓線區(qū)分,可減少背景等因素的影響[14],常見(jiàn)的分割方法有區(qū)域生長(zhǎng)分割、最大類(lèi)間方差法(OTSU)及分水嶺分割等。
卷積神經(jīng)網(wǎng)絡(luò)是一類(lèi)包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)[15],在農(nóng)作物識(shí)別方面有較好的成果[16-17]。樊湘鵬等[18]引入卷積神經(jīng)網(wǎng)絡(luò)中Faster-CNN 算法并將其進(jìn)行適應(yīng)性改進(jìn),經(jīng)試驗(yàn)對(duì)比可知,以VGG16卷積層結(jié)構(gòu)作為特征提取網(wǎng)絡(luò)的識(shí)別框架,對(duì)9種玉米病害的平均識(shí)別準(zhǔn)確率為97.23%。楊明欣等[19]利用遷移MobileNet V2網(wǎng)絡(luò)模型對(duì)玉米病害小樣本進(jìn)行識(shí)別分類(lèi),結(jié)果表明該模型識(shí)別準(zhǔn)確率達(dá)到97.23%。陳善雄等[20]結(jié)合最大穩(wěn)定極值區(qū)域和卷積神經(jīng)網(wǎng)絡(luò)對(duì)病害區(qū)域和非病害區(qū)域進(jìn)行分離,在傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)框架上加入兩級(jí)inception結(jié)構(gòu),最終對(duì)8種蕎麥病害圖像的平均識(shí)別精準(zhǔn)率達(dá)97.5%。在水稻病害識(shí)別方面,譚云蘭等[21]采用深度卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)8類(lèi)水稻病害的識(shí)別分類(lèi),試驗(yàn)表明網(wǎng)絡(luò)模型得到了較高的識(shí)別精度,其中紋枯病的準(zhǔn)確率為93%。劉成[22]運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)分別對(duì)水稻病害圖像進(jìn)行分類(lèi)識(shí)別,試驗(yàn)結(jié)果表明卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別效果更優(yōu),準(zhǔn)確率達(dá)96.7%。
傳統(tǒng)的圖像技術(shù)和機(jī)器學(xué)習(xí)對(duì)圖像特定特征依賴(lài)性強(qiáng),而卷積神經(jīng)網(wǎng)絡(luò)可通過(guò)大量的訓(xùn)練樣本自動(dòng)提取圖像特征,大大降低了模型的局限性。本文以自然狀態(tài)背景下的白葉枯病、赤枯病、胡麻斑病和紋枯病4類(lèi)水稻病害為對(duì)象,結(jié)合圖像分割與卷積神經(jīng)網(wǎng)絡(luò)建立病害識(shí)別模型,通過(guò)比較、分析模型的訓(xùn)練及測(cè)試識(shí)別效果,計(jì)算評(píng)價(jià)性能指標(biāo),獲得更為有效的模型,為進(jìn)一步研究更智能化地識(shí)別水稻病害提供支持。
以水稻病害為識(shí)別對(duì)象,并對(duì)采集到的圖像進(jìn)行人工處理后構(gòu)建為本次試驗(yàn)的數(shù)據(jù)集。為了提高模型的特征學(xué)習(xí)能力和抗干擾,對(duì)原始圖像進(jìn)行隨機(jī)旋轉(zhuǎn)(逆時(shí)針5°至順時(shí)針5°)、隨機(jī)翻轉(zhuǎn)、隨機(jī)亮度變換及隨機(jī)對(duì)比度等數(shù)據(jù)擴(kuò)充處理,擴(kuò)充后白葉枯病樣本數(shù)量為450張,赤枯病和紋枯病樣本數(shù)量均為400張,胡麻斑病樣本數(shù)量為350張。設(shè)置卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本和測(cè)試樣本的比例為8∶2,則最終訓(xùn)練樣本有1 280張,測(cè)試樣本有320張。
采用區(qū)域生長(zhǎng)、CV 模型和顯著性檢測(cè)3 種算法對(duì)水稻病害圖像進(jìn)行分割。
區(qū)域生長(zhǎng)法:區(qū)域生長(zhǎng)法是將具有相似特征的像素合并為區(qū)域,每個(gè)像素種子點(diǎn)都會(huì)根據(jù)某種相似性準(zhǔn)則將具有相似特征的相鄰像素歸并到種子像素所在的區(qū)域中,當(dāng)沒(méi)有新像素納入?yún)^(qū)域時(shí)停止生長(zhǎng),完成分割[23-24]。為得到較好的分割效果,選擇合理的種子點(diǎn)和生長(zhǎng)準(zhǔn)則,是非常重要的。
CV 模型:CV 模型是由Chan和Vese提出的一種基于區(qū)域的幾何輪廓模型,其引入了水平集函數(shù)來(lái)獲取最優(yōu)輪廓,該模型已被運(yùn)用于多領(lǐng)域的圖像分割,它具有易于處理曲線的拓?fù)浣Y(jié)構(gòu)變化[25-26]。計(jì)算過(guò)程是將圖像分為前景和后景后,預(yù)估它們的平均像素,在定義域Ω 上,封閉曲線將其分為曲線內(nèi)和曲線外,然后初始化水平集函數(shù),最后將每個(gè)像素點(diǎn)進(jìn)行演化。
顯著性檢測(cè):顯著性檢測(cè)是通過(guò)自上而下的目標(biāo)驅(qū)動(dòng)或自下而上的數(shù)據(jù)驅(qū)動(dòng)方式,自動(dòng)地從圖像中提取最突出或最能吸引視覺(jué)注意的局部區(qū)域[27-28]。
卷積神經(jīng)網(wǎng)絡(luò)包含了輸入層、卷積層、池化層(取樣層)、全連接層及輸出層。輸入層也就是整個(gè)神經(jīng)網(wǎng)絡(luò)的輸入,可以是任意尺寸的圖像。試驗(yàn)中SIX_CNN 和EIGHT_CNN 的輸入層圖像像素大小分別與LeNet-5、Alex Net經(jīng)典網(wǎng)絡(luò)的輸入層大小相同,輸入層圖像通道均為3。
卷積層是卷積神經(jīng)網(wǎng)絡(luò)中最為重要的部分,在卷積神經(jīng)網(wǎng)絡(luò)中,卷積層的參數(shù)個(gè)數(shù)和圖片的大小無(wú)關(guān),只和過(guò)濾器的尺寸、深度以及當(dāng)前層節(jié)點(diǎn)矩陣的深度有關(guān)。所以比起全連接網(wǎng)絡(luò)層,它大幅度地減少了參數(shù)個(gè)數(shù),加快計(jì)算深度,所以能夠很好地?cái)U(kuò)展到更大的圖像數(shù)據(jù)上。池化層中進(jìn)行矩陣運(yùn)算時(shí),不會(huì)改變矩陣的深度,并通過(guò)有效縮小矩陣尺寸來(lái)減少后面全連接層的參數(shù)。使用池化層既可以加快速度也可以防止過(guò)擬合,且對(duì)模型效果的影響不大。本試驗(yàn)中神經(jīng)卷積網(wǎng)絡(luò)的池化類(lèi)型均為最大池化。
卷積神經(jīng)網(wǎng)絡(luò)參數(shù):試驗(yàn)中的SIX_CNN 包含兩層卷積層、兩層池化層以及兩層全連接層,EIGHT_CNN 中包含三層卷積層、三層池化層以及兩層全連接層。SIX_CNN 與EIGHT_CNN均使用softmax分類(lèi)器來(lái)得到測(cè)試圖像各個(gè)類(lèi)別的概率。其中的核大小及步長(zhǎng)等參數(shù)如表1所示。
表1 卷積神經(jīng)網(wǎng)絡(luò)參數(shù)Table 1 Parameters of the convolutional neural network
采用3種圖像分割方法對(duì)數(shù)據(jù)集進(jìn)行處理,并將分割后的圖像分別輸入兩個(gè)卷積神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)訓(xùn)練得到6個(gè)網(wǎng)絡(luò)模型,將原始數(shù)據(jù)輸入較深的卷積神經(jīng)網(wǎng)絡(luò)中實(shí)現(xiàn)端到端的卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,得到1個(gè)網(wǎng)絡(luò)模型。識(shí)別具體流程如圖1所示。
圖1 模型訓(xùn)練流程圖Fig.1 Flow chart of model training
輸入圖像I后,就已知圖像中的某個(gè)像素Ik,Ik∈[0,255],將輸入圖像轉(zhuǎn)化為灰度圖后,獲取直方圖D就可知像素值A(chǔ)n的次數(shù)為Fn,An∈[0,255]。元素D(x,y)=|Ax-Ay|表示像素Ax與像素Ay之間的顏色差距,且因?yàn)锳n∈[0,255],D(x,y)∈[0,255]。此時(shí)像素Ik的顯著值Sals(Ik)計(jì)算[29]為公式:
神經(jīng)網(wǎng)絡(luò)輸入為三維圖像,同時(shí)為增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像的學(xué)習(xí),提高識(shí)別率,將Sals(Ik)計(jì)算后的圖片與原圖的像素進(jìn)行減法運(yùn)算,增強(qiáng)對(duì)比度,降低復(fù)雜背景的影響。圖像進(jìn)行減運(yùn)算后的像素值為Zk,范圍為[0,255],計(jì)算公式為Zk=Ik-Sals(Ik)。
圖像經(jīng)顯著性檢測(cè)分割后,輸入EIGHT_CNN 卷積網(wǎng)絡(luò),為了更好地管理和優(yōu)化神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程,采用可視化工具Tensorboard。圖2展示了整個(gè)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),圖中實(shí)線表示了計(jì)算結(jié)點(diǎn)之間的數(shù)據(jù)傳輸,箭頭方向表達(dá)了數(shù)據(jù)傳輸?shù)姆较?且每條邊上標(biāo)注了張量的維度。由圖可知,三層卷積層處理后得到的張量維度分別為57×57×48,28×28×128,13×13×192,最后一層池化層向第一層全連接層傳輸?shù)木S度為6 912,經(jīng)softmax分類(lèi)后的維度為4。
圖2 EIGHT_CNN 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 Structure diagram of EIGHT_CNN neural network
試驗(yàn)中l(wèi)oss_function節(jié)點(diǎn)存放的是計(jì)算損失函數(shù)相關(guān)的計(jì)算,Train_step節(jié)點(diǎn)存放的是學(xué)習(xí)率、優(yōu)化方法以及每一輪訓(xùn)練需要執(zhí)行的操作,該節(jié)點(diǎn)與其他節(jié)點(diǎn)有較多的連接,圖3可較清晰地看出,每一個(gè)卷積層、池化層和全連接層均會(huì)將數(shù)據(jù)輸入該節(jié)點(diǎn)進(jìn)行處理,而該節(jié)點(diǎn)無(wú)數(shù)據(jù)輸出。moving_average節(jié)點(diǎn)存放的則是處理滑動(dòng)平均相關(guān)的計(jì)算,由圖4可看出,網(wǎng)絡(luò)每一層的數(shù)據(jù)都會(huì)經(jīng)過(guò)滑動(dòng)平均計(jì)算。
圖3 train_step節(jié)點(diǎn)連接示意圖Fig.3 Node connection diagram of train_step
圖4 moving_averge節(jié)點(diǎn)連接示意圖Fig.4 Node connection diagram of moving_averge
試驗(yàn)中均通過(guò)Opencv 軟件庫(kù)進(jìn)行圖像處理,平臺(tái)為Visual Studio 2016,神經(jīng)網(wǎng)絡(luò)采用基于python語(yǔ)言的Tersorflow 深度學(xué)習(xí)框架。所用的計(jì)算機(jī)配置為Inter(R)Core(TM)i5-6500 CPU@3.20 GHz 3.19 GHz,RAM 為8.00 GB,系統(tǒng)為64位操作系統(tǒng)。試驗(yàn)中每個(gè)模型的輸入數(shù)據(jù)大小均為1 600 張彩色圖像,其中隨機(jī)的1 280張圖像為訓(xùn)練樣本,320 張圖像為測(cè)試樣本。模型訓(xùn)練采用批量訓(xùn)練的方法,每個(gè)批次訓(xùn)練的樣本數(shù)為64。試驗(yàn)經(jīng)過(guò)多次更改迭代次數(shù)、損失函數(shù)、學(xué)習(xí)率等參數(shù)后,最終卷積神經(jīng)網(wǎng)絡(luò)SIX_CNN 與EIGHT_CNN 均 選 擇 了500 次 迭代,而SIX_CNN 中的學(xué)習(xí)率選擇了0.01,EIGHT_CNN 中的學(xué)習(xí)率選擇了0.001,SIX_CNN 中卷積層和全連接層的激活函數(shù)均為Relu,EIGHT_CNN 中的卷積層激活函數(shù)為Relu,而全連接層的激活函數(shù)為Sigmoid。
試驗(yàn)采用區(qū)域生長(zhǎng)法、顯著性檢測(cè)和CV 模型對(duì)水稻病害圖像進(jìn)行自動(dòng)分割,表2展示了各分割方法下4種水稻病害圖像的分割結(jié)果。將分割后得到的水稻病害圖像分別作為本次試驗(yàn)中兩種卷積神經(jīng)網(wǎng)絡(luò)的輸入圖像,將得到6種病害識(shí)別模型。
交叉熵是判斷一個(gè)輸出向量和期望的向量之間的接近程度常用的評(píng)判方法之一。它刻畫(huà)的是兩個(gè)概率分布之間的距離,也是分類(lèi)問(wèn)題中使用比較廣的一個(gè)種損失函數(shù)。由于交叉熵與softmax回歸一起使用,Tensorflow 對(duì)這兩個(gè)功能進(jìn)行了統(tǒng)一封裝。圖5~圖10分別展示了6個(gè)模型以迭代次數(shù)為橫軸的訓(xùn)練損失值和訓(xùn)練準(zhǔn)確率、測(cè)試損失值和測(cè)試準(zhǔn)確率的曲線波動(dòng)。圖中紅線代表訓(xùn)練損失曲線,藍(lán)線代表測(cè)試損失曲線,紫線代表訓(xùn)練準(zhǔn)確率曲線,黑線代表測(cè)試準(zhǔn)確率曲線。
圖5 Reg_SIX_CNN_model曲線波動(dòng)Fig.5 Curve fluctuation diagram of Reg_SIX_CNN_model
圖6 Cv_SIX_CNN_model曲線波動(dòng)Fig.6 Curve fluctuation diagram of Cv_SIX_CNN_model
圖7 Sal_SIX_CNN_model曲線波動(dòng)Fig.7 Curve fluctuation diagram of Sal_SIX_CNN_model
由圖5~圖10中可看出,SIX_CNN 訓(xùn)練的3個(gè)模型損失值下降得較快,較早開(kāi)始趨于穩(wěn)定,可知該網(wǎng)絡(luò)的收斂速度更快。EIGHT_CNN 網(wǎng)絡(luò)中損失值則下降得比較緩慢,最后逐漸趨于穩(wěn)定。各模型的識(shí)別準(zhǔn)確率見(jiàn)表3。
表3 模型識(shí)別準(zhǔn)確率Table 3 Accuracy of model recognition
由上可知,卷積神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果均為95%以上。當(dāng)網(wǎng)絡(luò)模型不變時(shí),顯著性檢測(cè)處理過(guò)的圖像數(shù)據(jù)的識(shí)別結(jié)果最高,可知本試驗(yàn)中顯著性檢測(cè)對(duì)該數(shù)據(jù)集分割后更有利于圖像的識(shí)別。當(dāng)處理圖像方法不變時(shí),卷積網(wǎng)絡(luò)EIGHT_CNN 的識(shí)別結(jié)果較高,可知EIGHT_CNN 網(wǎng)絡(luò)對(duì)該數(shù)據(jù)集的效果更強(qiáng)。綜合看來(lái),Sal_EIGHT_CNN_model模型的識(shí)別結(jié)果最高,魯棒性更強(qiáng)。
4種水稻病害分類(lèi)中,可劃分為4種兩分類(lèi)情況。當(dāng)以白葉枯病為中心作為正類(lèi)時(shí),赤枯病、胡麻斑病及紋枯病為負(fù)類(lèi)。那么,實(shí)際為白枯病的圖片被判定為白枯病的總數(shù)量為T(mén)P1,實(shí)際為白枯病的圖片被判定為其他3種病害的總數(shù)量為FN1,實(shí)際為其他3種病害的圖片被判定為白枯病的總數(shù)量為FP1。
表4 各模型下4種病害精準(zhǔn)率Table 4 Precision values of four diseases of each model
各模型下4種病害的Recall值見(jiàn)表5,綜合精準(zhǔn)率和召回率,可知神經(jīng)網(wǎng)絡(luò)模型對(duì)4種病害的識(shí)別情況,如在Cv_EIGHT_CNN_model中,赤枯病的召回率為0.99,可知在赤枯病測(cè)試圖像中有99%以上的圖像識(shí)別正確,則該病害圖像被預(yù)測(cè)為其他3種病害的可能性較小,從赤枯病精確率及白葉枯病召回率可看出,其他兩種病害被預(yù)測(cè)為赤枯病的圖像較多,整體觀察可知,該模型對(duì)白葉枯病的識(shí)別效果最好。
表5 各模型下4種病害Recall值Table 5 Recall values of four diseases of each model
通過(guò)上式的計(jì)算,各模型的F1值見(jiàn)表6。結(jié)果可知,當(dāng)分割方法不變時(shí),EIGHT_CNN 網(wǎng)絡(luò)下的模型F1 score較高,當(dāng)卷積神經(jīng)網(wǎng)絡(luò)不變時(shí),顯著性檢測(cè)分割后的圖像輸入卷積網(wǎng)絡(luò)得到的F1 score較高。結(jié)合各模型精確率、召回率與評(píng)價(jià)指標(biāo)F1值,可知Sal_EIGHT_CNN_model該模型在本試驗(yàn)中識(shí)別結(jié)果為最佳。
表6 各模型F 1值Table 6 F 1 score of each model
為進(jìn)一步驗(yàn)證Sal_EIGHT_CNN_model網(wǎng)絡(luò)模型在水稻病害的識(shí)別能力,將數(shù)據(jù)增強(qiáng)后的水稻病害原圖像輸入EIGHT_CNN 網(wǎng)絡(luò)中實(shí)現(xiàn)端到端的網(wǎng)絡(luò)模型訓(xùn)練,圖11 展示EIGHT_CNN 模型的訓(xùn)練損失值和訓(xùn)練準(zhǔn)確率、測(cè)試損失值和測(cè)試準(zhǔn)確率的曲線波動(dòng)。將圖11 與圖10 Sal_EIGHT_CNN_model曲線波動(dòng)圖進(jìn)行對(duì)比,可知數(shù)據(jù)經(jīng)顯著性檢測(cè)分割后得到的網(wǎng)絡(luò)模型比端到端深度學(xué)習(xí)網(wǎng)絡(luò)模型更加穩(wěn)定,較少出現(xiàn)損失曲線或準(zhǔn)確率曲線突升或突降的現(xiàn)象。
圖11 EIGHT_CNN_model曲線波動(dòng)Fig.11 Curve fluctuation diagram of EIGHT_CNN_model
為直觀對(duì)比Sal_EIGHT_CNN_model模型與EIGHT_CNN_model模型對(duì)病害圖像數(shù)據(jù)的識(shí)別結(jié)果,給出了兩個(gè)模型的訓(xùn)練、測(cè)試識(shí)別準(zhǔn)確率和F1值(表7)。
表7 Sal_EIGHT_CNN_model與EIGHT_CNN_model對(duì)比Table 7 Comparison ofn Sal_EIGHT_CNN_model andEIGHT_CNN_model
從表7可知,Sal_EIGHT_CNN_model模型比EIGHT_CNN_model模型的訓(xùn)練準(zhǔn)確率高1.07個(gè)百分點(diǎn),測(cè)試準(zhǔn)確率上提1.30個(gè)百分點(diǎn)。F1值對(duì)比表明,Sal_EIGHT_CNN_model中將一種病害判定為其他3 種病害的概率低于EIGHT_CNN_model,即Sal_EIGHT_CNN_model模型對(duì)4種水稻病害圖像的識(shí)別結(jié)果優(yōu)于EIGHT_CNN_model模型。由此可知,將圖像進(jìn)行顯著性檢測(cè)分割后,更有利于卷積神經(jīng)網(wǎng)絡(luò)對(duì)病斑特征的提取及識(shí)別分類(lèi),得到最佳的網(wǎng)絡(luò)識(shí)別模型。
為提高計(jì)算機(jī)視覺(jué)對(duì)水稻病害的自覺(jué)準(zhǔn)確識(shí)別率,采用不同的圖像處理方法與卷積神經(jīng)網(wǎng)絡(luò),對(duì)水稻的4種病害進(jìn)行識(shí)別分類(lèi)。由試驗(yàn)結(jié)果可知,不同的圖像處理得到不同的分割效果,其中顯著性檢測(cè)算法對(duì)病害圖像的分割效果最好,減少了背景等干擾因素對(duì)卷積神經(jīng)網(wǎng)絡(luò)識(shí)別的影響,表明對(duì)數(shù)據(jù)集進(jìn)行不同的圖像處理會(huì)明顯得影響卷積神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果,圖像數(shù)據(jù)的不同對(duì)比度、亮度及病斑的不同位置可增強(qiáng)模型的泛化能力。從SIX_CNN 和EIGHT_CNN 的試驗(yàn)結(jié)果可知,網(wǎng)絡(luò)層數(shù)更深的卷積神經(jīng)網(wǎng)絡(luò)提取的病斑病理特征更優(yōu),使得softmax 分類(lèi)器識(shí)別的結(jié)果更佳。將圖像分割后得到的網(wǎng)絡(luò)模型與端到端卷積神經(jīng)網(wǎng)絡(luò)識(shí)別模型進(jìn)行對(duì)比后可知,卷積神經(jīng)網(wǎng)絡(luò)對(duì)水稻病斑特征具有較強(qiáng)的自我學(xué)習(xí)能力,而經(jīng)過(guò)顯著性檢測(cè)分割的圖像數(shù)據(jù),降低了背景等噪聲對(duì)卷積神經(jīng)網(wǎng)絡(luò)的影響,提升了網(wǎng)絡(luò)模型的識(shí)別能力。試驗(yàn)對(duì)比可知Sal_EIGHT_CNN_model模型的識(shí)別準(zhǔn)確率最高,測(cè)試識(shí)別準(zhǔn)確率達(dá)到99.88%。
對(duì)試驗(yàn)中常見(jiàn)的過(guò)擬合[30-31]現(xiàn)象,本研究也采取一系列策略:試驗(yàn)中通過(guò)增加圖像的對(duì)比度、亮度及對(duì)圖像進(jìn)行翻轉(zhuǎn)等方法增強(qiáng)數(shù)據(jù),以此來(lái)減少模型的過(guò)擬合;試驗(yàn)中卷積神經(jīng)網(wǎng)絡(luò)的全連接層均采用了Dropout,因Hinton 等[32]提出的Dropout通過(guò)在訓(xùn)練過(guò)程中隨機(jī)地忽略一定比例的節(jié)點(diǎn)響應(yīng),減輕傳統(tǒng)全連接神經(jīng)網(wǎng)絡(luò)的過(guò)擬合問(wèn)題,有效地提高網(wǎng)絡(luò)的泛化性能;通過(guò)使用批次歸一化來(lái)減少過(guò)擬合風(fēng)險(xiǎn)[33]。
馬超等[34]對(duì)水稻病斑與非病斑的樣本塊提取HOG 特征,將這些特征作為輸入向量代入SVM 分類(lèi)器進(jìn)行訓(xùn)練,最后的研究結(jié)果表明,HOG+SVM 對(duì)多種病斑檢測(cè)的綜合識(shí)別率可達(dá)94%以上。牛旭[35]搭建的卷積神經(jīng)網(wǎng)絡(luò)對(duì)水稻病害平均識(shí)別準(zhǔn)確率達(dá)96%。劉婷婷等[36]建立的CNN 網(wǎng)絡(luò)模型對(duì)水稻紋枯病的準(zhǔn)確識(shí)別率達(dá)97%。邱靖等[37]搭建的深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)水稻病害的識(shí)別準(zhǔn)確率最高可達(dá)96.67%。由此可見(jiàn),目前計(jì)算機(jī)技術(shù)在水稻病害識(shí)別中的應(yīng)用已取得較好的成果。經(jīng)比較,Sal_EIGHT_CNN_model模型識(shí)別率較高,模型有效可行,且具有更強(qiáng)的魯棒性,可降低圖像背景、圖像位置、圖像采光等對(duì)識(shí)別的影響。為推進(jìn)推廣運(yùn)用,研究還有一定的提升空間,后續(xù)需要繼續(xù)進(jìn)行的試驗(yàn)方向有以下幾個(gè):增加訓(xùn)練樣本的種類(lèi)和數(shù)量,使得智能分類(lèi)的品種更多;增強(qiáng)對(duì)圖像的處理,降低光照角度等拍攝原因?qū)ψR(shí)別的影響;訓(xùn)練更多更優(yōu)的神經(jīng)網(wǎng)絡(luò),提高對(duì)更多種類(lèi)的識(shí)別準(zhǔn)確率,希望未來(lái)也能運(yùn)用到其他病害的識(shí)別。
采用圖像分割結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的方法對(duì)水稻病害進(jìn)行識(shí)別,減低復(fù)雜背景的影響,提高了模型的計(jì)算準(zhǔn)確率,且本研究提出的7個(gè)網(wǎng)絡(luò)模型,對(duì)白葉枯病、赤枯病、胡麻斑和紋枯病的總識(shí)別率均達(dá)到95% 以上。其中基于顯著性檢測(cè)與EIGHT_CNN 卷積神經(jīng)網(wǎng)絡(luò)的模型測(cè)試識(shí)別率達(dá)到99.88%,相比較于其他模型,識(shí)別精度更高,魯棒性更強(qiáng),也可為后續(xù)的病害葉片智能識(shí)別提供理論依據(jù)。