陳偉文,鄺祝芳,王忠偉
(1.海南省林木種子(苗)總站,海南 ???570203;2.中南林業(yè)科技大學(xué) 智慧物流技術(shù)湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 長(zhǎng)沙 410004)
農(nóng)林產(chǎn)品病害問題是制約我國(guó)農(nóng)業(yè)生產(chǎn)發(fā)展的主要災(zāi)害之一。由于農(nóng)林產(chǎn)品病害的種類繁多,且常伴隨影響范圍廣以及傳染性強(qiáng)等問題,易根據(jù)影響時(shí)長(zhǎng)和范圍而對(duì)農(nóng)林業(yè)生產(chǎn)造成不同程度的損失。因此,農(nóng)林產(chǎn)品病害防治是農(nóng)林業(yè)生產(chǎn)過程中很關(guān)鍵的問題,病害使農(nóng)林產(chǎn)品的產(chǎn)量降低和品質(zhì)變差,雖然人們可以使用農(nóng)藥等化學(xué)物質(zhì)來控制植物病害,但僅僅依靠肉眼的觀察以及人們以往的經(jīng)驗(yàn)很容易出現(xiàn)誤診的情況,這使得農(nóng)林產(chǎn)品病害情況不能被及時(shí)診治,從而導(dǎo)致農(nóng)林產(chǎn)品的產(chǎn)量下降,品質(zhì)也不能得到切實(shí)保證。然而,為解決這種病害的及時(shí)診治問題,能否盡早地并且精確地診斷農(nóng)林產(chǎn)品病害類型,防止錯(cuò)誤使用農(nóng)藥是很關(guān)鍵的。近年來,信息技術(shù)飛速發(fā)展,我國(guó)對(duì)農(nóng)林病害智能識(shí)別技術(shù)的重視以及支持力度日益增大,農(nóng)林產(chǎn)品病害識(shí)別也漸漸成為熱門[1]。同時(shí),卷積神經(jīng)網(wǎng)絡(luò)在這些年里已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域,在圖像分析和處理領(lǐng)域取得了一定的進(jìn)展,在學(xué)術(shù)界常用的標(biāo)準(zhǔn)圖像標(biāo)注集ImageNet 上,基于卷積神經(jīng)網(wǎng)絡(luò)取得了很多成就,包括圖像識(shí)別[2-6]、物體分類和檢測(cè)[7],人臉識(shí)別[8]以及語(yǔ)音識(shí)別[9]等方面。
自1978年我國(guó)實(shí)行改革開放以來,我國(guó)的計(jì)算機(jī)技術(shù)發(fā)展得非常迅速。如今,隨著現(xiàn)代科技的發(fā)展,集計(jì)算機(jī)技術(shù)、精密傳感技術(shù)等于一體的智能化技術(shù)已經(jīng)遍及人們生活的各個(gè)方面。具體到農(nóng)林產(chǎn)品病害的智能識(shí)別領(lǐng)域,當(dāng)前仍然有很多人在使用傳統(tǒng)的分類網(wǎng)絡(luò)依據(jù)圖片的像素等特征進(jìn)行識(shí)別圖像病害種類。如馬雪松等[10]用傳統(tǒng)方法支持向量機(jī)以及圖像處理技術(shù)對(duì)花生褐斑病圖像的識(shí)別進(jìn)行了研究。呂致等[11]使用支持向量機(jī)對(duì)分割后的梨樹病害進(jìn)行識(shí)別。陳悅寧等[12]建立BP 神經(jīng)網(wǎng)絡(luò)模型根據(jù)優(yōu)化后的特征來識(shí)別不同種類的水稻病害。黃雙萍等[13]用一種GoogLeNet模型檢測(cè)水稻穗的瘟病。根據(jù)上面的學(xué)者作出的研究,研究發(fā)現(xiàn)雖然傳統(tǒng)的病害識(shí)別方法識(shí)別的效果也不錯(cuò),但是它有個(gè)最突出的問題就是需要人工對(duì)病害圖片進(jìn)行分析并提取特征,然而受天氣、背景、危害程度等的影響,不同植物的不同病害特征也會(huì)更復(fù)雜,此時(shí)其適用性往往受到抑制,識(shí)別效果一般[14]。然而,卷積神經(jīng)網(wǎng)絡(luò)在大田自然復(fù)雜環(huán)境中進(jìn)行病害識(shí)別卻有較好的優(yōu)勢(shì)[15]。
在使用幾種經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)對(duì)番茄種苗病害進(jìn)行識(shí)別時(shí),發(fā)現(xiàn)原始的AlexNet 模型在訓(xùn)練過程中出現(xiàn)了嚴(yán)重的過擬合現(xiàn)象。因此本文結(jié)合了常用的緩解過擬合的方法如擴(kuò)增數(shù)據(jù)集、隨機(jī)剔除神經(jīng)元等方法,對(duì)原始的AlexNet 模型進(jìn)行改進(jìn),得到一個(gè)對(duì)具體番茄葉片病害識(shí)別有更好預(yù)測(cè)分類性能的AlexNet-Improved 模型。
PlantVillage工程為解決植物病害診斷的問題,面向所有用戶開放數(shù)據(jù)庫(kù),其數(shù)據(jù)庫(kù)中包含多類植物的患病與健康葉片圖像數(shù)據(jù)。這些圖像均來自自然環(huán)境,有著相同的尺寸大小、光照條件、背景和拍攝角度。數(shù)據(jù)集中圖片均以.jpg格式保存。
1.2.1 AlexNet
AlexNet 在2012年被Hinton 和他的學(xué)生Alex Krizhevsky 設(shè)計(jì)并提出[16],成功使用ReLU 作為CNN 的激活函數(shù),使用重疊的最大池化,同時(shí)使用了CUDA 加速深度卷積網(wǎng)絡(luò)的訓(xùn)練,利用GPU的并行計(jì)算能力,在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中處理大量的矩陣運(yùn)算。AlexNet 模型獲得了當(dāng)年競(jìng)賽的冠軍,且準(zhǔn)確率遠(yuǎn)超第二名,引起了很大的轟動(dòng)。自那以后,卷積神經(jīng)網(wǎng)絡(luò)被很多人用在ImageNet 競(jìng)賽中,且層次越做越深,自此卷積神經(jīng)網(wǎng)絡(luò)便成了圖像識(shí)別分類領(lǐng)域的核心算法,為深度學(xué)習(xí)帶來一次大爆發(fā)。AlexNet 與LeNet 的結(jié)構(gòu)非常相似,在LeNet 的基礎(chǔ)上應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的基本原理,但在卷積窗口數(shù)和激活函數(shù)上做出了改進(jìn)。首先,由于之前的網(wǎng)絡(luò)模型在使用Sigmoid 激活函數(shù)時(shí)出現(xiàn)梯度彌散問題,AlexNet 采用Relu 作為激活函數(shù)。其次,用最大池化替換平均池化,以避免特征被過度模糊[17]。最后,它提出了LRN 層(Local Response Normalization,局部響應(yīng)歸一化)以增強(qiáng)模型的泛化能力[18]。在最初設(shè)計(jì)AlexNet 網(wǎng)絡(luò)中,原作者將網(wǎng)絡(luò)模型放到兩個(gè)GPU 上同時(shí)運(yùn)行,使得模型訓(xùn)練的速度更快和識(shí)別圖片的準(zhǔn)確率更高。同時(shí),由于有了計(jì)算速度更快的GPU,在模型輸入數(shù)據(jù)的選擇上,便可以使用更高像素的彩色圖片。不過,如果選擇了彩色圖片作為數(shù)據(jù),由于圖像比之前的單通道灰度圖像更加復(fù)雜,僅僅在硬件設(shè)備上提升計(jì)算速度并不能達(dá)到好的效果,所以還需要有針對(duì)性地對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),使模型可以收斂得更快。
1.2.2 數(shù)據(jù)集擴(kuò)增
隨著網(wǎng)絡(luò)結(jié)構(gòu)的加深加大,容易出現(xiàn)過擬合狀況。產(chǎn)生過擬合問題的根本原因是特征維度過多,模型假設(shè)過于復(fù)雜,參數(shù)過多,訓(xùn)練數(shù)據(jù)過少,以至于擬合的函數(shù)完美地預(yù)測(cè)了訓(xùn)練集,但對(duì)新數(shù)據(jù)的測(cè)試集預(yù)測(cè)結(jié)果卻很差。過度地?cái)M合了訓(xùn)練數(shù)據(jù),而沒有考慮到模型的泛化能力。此時(shí),如果有更多的數(shù)據(jù)樣本輸入到網(wǎng)絡(luò)中,便能彌補(bǔ)訓(xùn)練數(shù)據(jù)過少的問題,有效解決過擬合情況,提升算法準(zhǔn)確率。但訓(xùn)練數(shù)據(jù)樣本有限,尤其是有些大型網(wǎng)絡(luò)一般需要輸入上萬(wàn)張圖片進(jìn)行訓(xùn)練,面對(duì)有限的數(shù)據(jù)集,便需要采取深度學(xué)習(xí)中的數(shù)據(jù)增強(qiáng),它不僅能增強(qiáng)訓(xùn)練的數(shù)據(jù)量,提高模型的泛化能力,還能增加噪聲數(shù)據(jù),提高模型的魯棒性。對(duì)原始圖像進(jìn)行隨機(jī)裁剪、平移變換,顏色、光照變換等操作后,對(duì)于卷積神經(jīng)網(wǎng)絡(luò)模型,經(jīng)過操作處理后的圖片便是一張新的可用的圖片[19-20]。為解決原模型的過擬合問題,本文借助于該技術(shù),通過翻轉(zhuǎn)操作,即在不影響番茄病害圖像語(yǔ)義的情況下對(duì)圖像做水平鏡像翻轉(zhuǎn),在原始數(shù)據(jù)集的基礎(chǔ)上生成翻轉(zhuǎn)數(shù)據(jù)集,將原始數(shù)據(jù)集和翻轉(zhuǎn)數(shù)據(jù)集進(jìn)行組合,建立實(shí)驗(yàn)所需的擴(kuò)增數(shù)據(jù)集。
1.2.3 改進(jìn)的AlexNet 網(wǎng)絡(luò)模型
隨機(jī)剔除神經(jīng)元即在網(wǎng)絡(luò)結(jié)構(gòu)中使用的Dropout 層[21]。具體詳見圖1,該圖展示了使用Dropout 前后的網(wǎng)絡(luò)對(duì)比。每次隨機(jī)將全連接層的一部分神經(jīng)元失活,如圖中使用Dropout 后的全連接層的部分神經(jīng)元與上下層的神經(jīng)元的連接呈現(xiàn)出虛線形式,表明該虛線部分的神經(jīng)元被失活,即全連接層中并不是每個(gè)結(jié)點(diǎn)都會(huì)在本次epoch 中起作用。下次訓(xùn)練時(shí),又隨機(jī)失活另一批神經(jīng)元。經(jīng)過這樣的迭代操作,每次只更新部分神經(jīng)元的參數(shù),經(jīng)過多次的迭代訓(xùn)練,幾乎所有神經(jīng)元的參數(shù)都能不定次數(shù)地更新[22],能很大程度上緩解模型過擬合問題。值得注意的是,Dropout 層一般只用于訓(xùn)練,測(cè)試時(shí)不做使用。在本文中所用的AlexNet 網(wǎng)絡(luò)模型包含了3 層全連接層,分別在兩層1×2 048 的全連接層上融合Dropout 技術(shù),由原來每次隨機(jī)失活20%的神經(jīng)元增加到每次隨機(jī)失活50%的神經(jīng)元,由于每次隨機(jī)將全連接層的更大一部分神經(jīng)元失活,極大地減少了模型的總參數(shù)量,解決了原有的經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)常會(huì)出現(xiàn)的過擬合問題,提高了模型的效率和準(zhǔn)確度。
圖1 使用Dropout 的網(wǎng)絡(luò)前后對(duì)比Fig.1 Before and after using Dropout network
實(shí)驗(yàn)的數(shù)據(jù)集來自于PlantVillage 數(shù)據(jù)庫(kù)(www.plantvillage.org),數(shù)據(jù)集有近十種植物的病害圖片,約4 萬(wàn)張圖片。本文使用其中的番茄葉片圖像作為試驗(yàn)數(shù)據(jù),共18 835 張圖片。該番茄葉片數(shù)據(jù)集由9 種疾病類別和1 種健康類別組成,具體圖片如下圖所示圖2所示:
圖2 10 種類型的番茄圖片F(xiàn)ig.2 10 types of tomato pictures
為了訓(xùn)練好模型,本研究將番茄病蟲害數(shù)據(jù)集中90%作為訓(xùn)練集,其余10%作為測(cè)試集。10種類型訓(xùn)練與測(cè)試數(shù)據(jù)如下表1所示,其中訓(xùn)練集共有16 955 張圖片,測(cè)試集共有1 880 張圖片。訓(xùn)練集中的圖片主要用來對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,測(cè)試集中的圖片則用于檢測(cè)一次訓(xùn)練完的網(wǎng)絡(luò)的驗(yàn)證準(zhǔn)確率,據(jù)此對(duì)模型中的參數(shù)進(jìn)行調(diào)整,以達(dá)到下一次的測(cè)試準(zhǔn)確率更高。
表1 訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)Table 1 Training data and test data
由于卷積神經(jīng)網(wǎng)絡(luò)的全連接層代表網(wǎng)絡(luò)輸入向量的空間維度以及對(duì)應(yīng)的神經(jīng)元的數(shù)目。當(dāng)卷積神經(jīng)網(wǎng)絡(luò)輸入的圖像尺寸不相同時(shí),對(duì)應(yīng)的網(wǎng)絡(luò)的空間維度也不相同,導(dǎo)致全連接層的權(quán)重不固定,網(wǎng)絡(luò)無(wú)法訓(xùn)練。所以本文在將圖片輸入網(wǎng)絡(luò)之前,需要對(duì)圖片進(jìn)行尺寸方面的統(tǒng)一處理。原數(shù)據(jù)集中的圖像尺寸為256×256,本文將番茄圖像以中心點(diǎn)進(jìn)行裁剪,裁剪后的圖像尺寸為224×224。
2.2.1 實(shí)驗(yàn)環(huán)境
本文實(shí)驗(yàn)的硬件環(huán)境為Windows10 系統(tǒng),計(jì)算機(jī)配置為i9-10900K CPU,GPU 為NVIDIA GeForce RTX 3090,專用GPU 內(nèi)存為24GB。軟件環(huán)境則是在Windows10(64 位)上,使用Anaconda3 管理環(huán)境,Python 為編程語(yǔ)言,選用PyCharm 作為Python 解釋器,同時(shí)配置了Tensorflow2.1 版本的深度學(xué)習(xí)框架。
2.2.2 搭建AlexNet-Improved 網(wǎng)絡(luò)
實(shí)驗(yàn)中改進(jìn)的模型AlexNet-Improved 由5 個(gè)卷積模塊和3 個(gè)全連接模塊堆疊而成,最后1 個(gè)全連接層的輸出數(shù)為10,即目標(biāo)分類數(shù)。采用SoftMax 計(jì)算損失,激活函數(shù)為ReLu。同時(shí)根據(jù)常用的緩解過擬合的方法,選用數(shù)據(jù)增強(qiáng),對(duì)訓(xùn)練數(shù)據(jù)集中的圖片進(jìn)行隨機(jī)裁剪,翻轉(zhuǎn)以擴(kuò)大可訓(xùn)練的數(shù)據(jù)集。在全連接層前使用Dropout 層每次隨機(jī)失活50%的神經(jīng)元,這樣雖然會(huì)延長(zhǎng)訓(xùn)練的時(shí)間,但一定程度地避免了過擬合狀況。由于LRN 層在深度網(wǎng)絡(luò)中的作用并不明顯,所以在本文改進(jìn)的AlexNet 模型上去掉了LRN 結(jié)構(gòu)。改進(jìn)的AlexNet 網(wǎng)絡(luò)模型如圖3所示。
圖3 改進(jìn)的模型AlexNet-ImprovedFig.3 AlexNet-Improved network model
2.2.3 訓(xùn)練網(wǎng)絡(luò)模型
具體訓(xùn)練過程如下:
1)從本地讀取建立好的數(shù)據(jù)集;
2)將數(shù)據(jù)集隨機(jī)打亂,將圖片進(jìn)行翻轉(zhuǎn)以擴(kuò)增數(shù)據(jù)集;
3)實(shí)例化模型,設(shè)置圖片高寬信息和種類數(shù);
4)設(shè)置模型優(yōu)化方法為Adam 優(yōu)化算法,學(xué)習(xí)率為0.000 5,使用categorical_crossentropy 損失函數(shù),標(biāo)注網(wǎng)絡(luò)評(píng)價(jià)指標(biāo)為accuracy。
5)使用回調(diào)函數(shù)callbacks 實(shí)現(xiàn)模型斷點(diǎn)續(xù)訓(xùn),保存當(dāng)前模型的所有權(quán)重。
6)將數(shù)據(jù)輸入模型進(jìn)行訓(xùn)練,不斷更新并優(yōu)化模型參數(shù)。
7)保存模型和參數(shù)權(quán)重。
為了體現(xiàn)AlexNet-Improved 模型在病害識(shí)別領(lǐng)域上的優(yōu)勢(shì),本文與LeNet 和VGG16 及原始的AlexNet 網(wǎng)絡(luò)模型進(jìn)行對(duì)比,比較4 種網(wǎng)絡(luò)模型性能上的差異。
首先比較4 種網(wǎng)絡(luò)模型:LeNet、VGG16、原始的AlexNet 和改進(jìn)后的模型AlexNet-Improved在同一訓(xùn)練集上的訓(xùn)練效果差異?,F(xiàn)使用這4 種網(wǎng)絡(luò)模型在番茄數(shù)據(jù)集上訓(xùn)練150 個(gè)epoch,4 種模型訓(xùn)練過程中的訓(xùn)練準(zhǔn)確率、訓(xùn)練損失值和驗(yàn)證準(zhǔn)確率及驗(yàn)證損失值如圖4所示,其中圖4a 為4 個(gè)模型的訓(xùn)練準(zhǔn)確率,圖4b 為4 個(gè)模型的驗(yàn)證準(zhǔn)確率,圖4c 為4 個(gè)模型的訓(xùn)練損失值,圖4d為4個(gè)模型的驗(yàn)證損失值。在圖4a,圖4b和圖4c中,除了LeNet 模型收斂較慢,其他3 個(gè)模型的收斂速度及最高最低值相差不大,在訓(xùn)練20 個(gè)epoch的節(jié)點(diǎn)時(shí)曲線幾乎趨于平緩,且數(shù)值均在90 以上。但是從圖4d 中可以明顯看出原始的AlexNet 的驗(yàn)證損失值從第40 個(gè)epoch 后逐漸增大,最大損失值高達(dá)0.8,且曲線波動(dòng)較大,出現(xiàn)了較為嚴(yán)重的過擬合現(xiàn)象,而改進(jìn)后的AlexNet-Improved 模型的過擬合現(xiàn)象較原模型有了很大的改善。
圖4 準(zhǔn)確率與損失值比較Fig.4 Comparison of accuracy and loss values
然后比較4 種網(wǎng)絡(luò)模型在同一驗(yàn)證集上使用已經(jīng)訓(xùn)練好的權(quán)重文件得到的混淆矩陣,如圖5所示,圖5a 為改進(jìn)后的模型AlexNet-Improved 的混淆矩陣,圖5b 為原始AlexNet 模型的混淆矩陣,圖5c為L(zhǎng)eNet 模型的混淆矩陣,圖5d 為VGG16 模型的混淆矩陣。其中Bs、Eb、He、Lb、Lm、Mv、Sl、St、Ts、Yl 分別代表番茄的細(xì)菌性斑點(diǎn)病、早疫病、健康、晚疫病、葉霉病、花葉病、斑枯病、二斑葉螨病、輪斑病及黃曲病共10 種類型。x 軸為真實(shí)值,y 軸為預(yù)測(cè)值,圖中對(duì)角線上的數(shù)值為識(shí)別正確的樣本數(shù)量,例如圖5a 中第一行的數(shù)值‘211’代表細(xì)菌性斑點(diǎn)病測(cè)試數(shù)據(jù)集中有211 個(gè)樣本被正確識(shí)別為細(xì)菌性斑點(diǎn)病,第二行的數(shù)值‘93’代表早疫病測(cè)試數(shù)據(jù)集中有93 個(gè)樣本被正確識(shí)別為早疫病,其他數(shù)值依此類推。通過分析圖5中4 個(gè)混淆矩陣及表2中4 個(gè)模型在同一測(cè)試集上正確識(shí)別的數(shù)量對(duì)比,可以清楚發(fā)現(xiàn)細(xì)菌性斑點(diǎn)病、早疫病、晚疫病、花葉病、二斑葉螨病、輪斑病及黃曲病七種類型在AlexNet-Improved 模型中準(zhǔn)確識(shí)別的樣本數(shù)量遠(yuǎn)高其它3 個(gè)模型,僅葉霉病、健康、斑枯病這3 種類別在AlexNet-Improved 模型中準(zhǔn)確識(shí)別的樣本數(shù)量比其他3 個(gè)模型少,說明了AlexNet-Improved 模型在病害識(shí)別上的優(yōu)勢(shì)非常明顯。
表2 正確識(shí)別數(shù)量比較Table 2 Comparison of correct identification number
圖5 混淆矩陣比較Fig.5 Comparison of confusion matrix
最后比較4 種模型在準(zhǔn)確性上的差異,以準(zhǔn)確率,精確率,召回率及F1 值即精確率和召回率的調(diào)和平均值為衡量指標(biāo),結(jié)果如表3所示。原始模型AlexNet 的準(zhǔn)確率為0.934,改進(jìn)后的模型AlexNet-Improved 準(zhǔn)確率為0.958,與AlexNet-Improved 模型的準(zhǔn)確率相比,AlexNet 模型提高了2.4%。同時(shí),AlexNet-Improved 模型的準(zhǔn)確率比LeNet 模型高6.1%,比VGG16 模型高2.2%。AlexNet-Improved 模型的F1 值則比AlexNet 模型高3%,比LeNet 模型高7.5%,比VGG16 模型高2.7%。AlexNet-Improved 模型的4 個(gè)準(zhǔn)確性指標(biāo)都比其他3 個(gè)模型高,說明AlexNet-Improved 模型優(yōu)于其余3 個(gè)模型。
表3 準(zhǔn)確率、精確率、召回率和F1 值比較Table 3 Comparison of accuracy,precision,recall and F1 value
為了研究AlexNet-Improved 模型在具體番茄病害圖片識(shí)別中的效果,本節(jié)從網(wǎng)絡(luò)中隨機(jī)選取一些番茄病害圖片為研究對(duì)象如圖6,在圖6a 中可以用肉眼觀察到圓形或不規(guī)則形,有同心輪紋的病斑,很明顯為番茄早疫病的癥狀。圖6b 中,葉片上有圓形或近圓形病斑,邊緣深褐色,中部灰白色,稍凹陷,并散生許多墨色小粒點(diǎn),為番茄斑枯病的癥狀。圖6c 中,葉片葉尖及邊緣處有不規(guī)則的病斑,并呈萎蔫狀,為番茄晚疫病的癥狀。圖6d 中,葉片顯著黃化褪綠,葉脈及其周圍部分葉肉呈濃綠,為番茄黃曲病的癥狀。本節(jié)將這些圖片按照本模型所需要的輸入尺寸大小裁剪成224×224,然后進(jìn)行歸一化處理,使用Keras 中的model.load_weights()方法讀取已經(jīng)訓(xùn)練好的AlexNet-Improved 模型的權(quán)重文件,然后使用model.predict()方法預(yù)測(cè)得出番茄葉片的病害類型。
在圖6中,圖6a 被正確識(shí)別為早疫病的葉片,圖6b 被正確識(shí)別為斑枯病的葉片,圖6c 被正確識(shí)別為晚疫病的葉片,圖6d 被正確識(shí)別為黃曲病的葉片。AlexNet-Improved 模型在4 個(gè)案例中表現(xiàn)出了很高的準(zhǔn)確率,驗(yàn)證此前的實(shí)驗(yàn)結(jié)果。
圖6 AlexNet-Improved 模型的案例研究Fig.6 Case study of AlexNet-Improved model
本文對(duì)基于卷積神經(jīng)網(wǎng)絡(luò)的種苗病蟲害識(shí)別方法進(jìn)行研究。使用近年來被大家廣泛應(yīng)用于圖像識(shí)別領(lǐng)域的卷積神經(jīng)網(wǎng)絡(luò),對(duì)AlexNet 模型進(jìn)行改進(jìn),提出了AlexNet-Improved 模型,選取LeNet、VGG16 及原始AlexNet 模型作為對(duì)比網(wǎng)絡(luò)模型,選擇用9 種常見的番茄種苗病害類別和1 種健康類別數(shù)據(jù)進(jìn)行訓(xùn)練及測(cè)試,得出網(wǎng)絡(luò)模型訓(xùn)練過程中的準(zhǔn)確率及損失值變化,畫出4 個(gè)模型混淆矩陣,并由此計(jì)算出模型的準(zhǔn)確率、精確率、召回率及F1 值。研究的主要過程包括配置網(wǎng)絡(luò)訓(xùn)練所需軟件環(huán)境,從網(wǎng)絡(luò)上尋找合適的數(shù)據(jù)集并整理成適用于網(wǎng)絡(luò)訓(xùn)練的格式,然后搭建網(wǎng)絡(luò)模型,進(jìn)行訓(xùn)練,對(duì)比原始模型的分類性能不斷改進(jìn)新模型。主要研究成果及創(chuàng)新之處為:原始的模型在番茄數(shù)據(jù)集上訓(xùn)練時(shí)出現(xiàn)了嚴(yán)重的過擬合現(xiàn)象,基于此采用數(shù)據(jù)增強(qiáng)將訓(xùn)練集中的圖片隨機(jī)翻轉(zhuǎn)、裁剪,然后用Dropout 方法隨機(jī)失活50%的神經(jīng)元,得到了準(zhǔn)確率為0.958、精確率為0.946、召回率為0.948 及F1 值為0.947 的AlexNet-Improved模型。最后使用AlexNet-Improved 模型對(duì)具體的番茄葉片進(jìn)行識(shí)別,得到了很不錯(cuò)的識(shí)別效果,對(duì)原始的番茄病害識(shí)別模型數(shù)據(jù)集訓(xùn)練的過擬合現(xiàn)象有很大的改進(jìn)。
本文雖然實(shí)現(xiàn)了基于卷積神經(jīng)網(wǎng)絡(luò)的種苗病害識(shí)別方法研究,但還有一些地方需要改進(jìn)。首先在對(duì)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練時(shí),即使使用配置了GPU 的服務(wù)器進(jìn)行訓(xùn)練,訓(xùn)練時(shí)長(zhǎng)仍然是一個(gè)問題,今后應(yīng)在現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)上進(jìn)行改進(jìn)和優(yōu)化,加快其收斂速度,或者使用框架中自帶的方法在模型收斂時(shí)便提早停止迭代,進(jìn)一步提升模型的效率。其次,本模型局限于背景單一、病害單一的番茄病害葉片圖像,在今后的研究中應(yīng)繼續(xù)采集番茄病害葉片圖像,擴(kuò)大數(shù)據(jù)集的數(shù)量與種類,特別是增加不同氣候條件、不同拍攝角度、不同病害的番茄葉片圖像,將復(fù)雜自然條件下的番茄病害葉片圖像用于模型訓(xùn)練,進(jìn)一步提高模型的識(shí)別性能。最后改進(jìn)后模型準(zhǔn)確率只比原始模型高出2.4%,說明改進(jìn)的空間仍然很大,還需要從不同方向入手對(duì)該模型進(jìn)行更深入的改進(jìn)以達(dá)到更高的準(zhǔn)確率。