馬麗 周巧黎 趙麗亞 胡遠(yuǎn)輝
摘要:對番茄病害進(jìn)行及早的診斷與治療有助于提升番茄的產(chǎn)量,將人工智能與農(nóng)業(yè)生產(chǎn)相結(jié)合可以對番茄病害進(jìn)行快速地?zé)o損傷檢測?;诖颂岢鲆环N基于深度學(xué)習(xí)的番茄葉片病害分類識別研究方法,選取番茄葉片的5類常見病害進(jìn)行試驗(yàn),以MobileNetV3為基礎(chǔ)模型進(jìn)行改進(jìn),分析不同學(xué)習(xí)方式、激活函數(shù)及優(yōu)化算法對該模型準(zhǔn)確性的影響。并將該模型與MobileNetV3、VGG16、ResNet50和InceptionV3作對比,同時采用十折交叉驗(yàn)證對模型的魯棒性進(jìn)行評估。研究表明,該模型分類性能良好,對常見的番茄葉片病害圖像的平均識別準(zhǔn)確率可達(dá)97.29%,無論模型大小、運(yùn)行時間還是分類精度上都優(yōu)于其他幾個模型,為番茄葉片常見病害識別提供一定的可參考性。
關(guān)鍵詞:番茄病害;多層感知機(jī);空洞卷積;損失函數(shù);識別分類
中圖分類號:S436.412: TP391.4
文獻(xiàn)標(biāo)識碼:A
文章編號:20955553 (2023) 070187
08
Classification and recognition of tomato leaf diseases based on deep learning
Ma Li, Zhou Qiaoli, Zhao Liya, Hu Yuanhui
(College of Information Technology, Jilin Agricultural University, Changchun, 130118, China)
Abstract: Early diagnosis and treatment of tomato diseases can help to improve the yield of tomatoes. The combination of artificial intelligence and agricultural production can achieve real-time non-destructive detection of tomato diseases. In this study, a research method for tomato leaf disease classification and recognition based on deep learning is proposed. Five kinds of common diseases of tomato leaves are selected for experimentation. Improvements are made to the MobileNetV3 model, and the effects of different learning methods, activation functions, and optimization algorithms on the accuracy of the model are analyzed. The model is compared with MobileNetV3, VGG16, ResNet50, and InceptionV3, and the robustness of the model is evaluated by ten-fold cross-validation. The research shows that the model has good classification performance, achieving an average recognition accuracy of 97.29% for common tomato leaf disease images. The model is superior to other models in terms of model size, running time, and classification accuracy, providing a reference for the recognition of common tomato leaf diseases.
Keywords: tomato diseases; multilayer perceptron; dilated convolution; focal loss; identification and classification
0 引言
作物在生長過程中受各種因素的影響容易發(fā)生病蟲害現(xiàn)象,導(dǎo)致農(nóng)產(chǎn)品產(chǎn)量和質(zhì)量有所降低。通常情況下,農(nóng)業(yè)病害的檢測與治療都是從作物的葉片部位著手,葉片顏色、病斑顏色、病斑形狀和大小等特征信息都可以反映出作物病害的類別和程度。較為常見的病害檢測方法是人工識別,即依據(jù)以往的經(jīng)驗(yàn)對病害種類做出識別,及時地噴灑農(nóng)藥進(jìn)行治療。但是這種識別方法存在一定的弊端,會耗費(fèi)很多的人力、物力資源,且農(nóng)民對病害的識別經(jīng)驗(yàn)有限,因此這種方法只適用于小面積種植區(qū)域內(nèi)的病害檢測。
隨著計(jì)算機(jī)現(xiàn)代化技術(shù)的發(fā)展,作物的生長狀況監(jiān)測和病蟲害檢測技術(shù)也在不斷升級??梢岳糜?jì)算機(jī)圖像處理技術(shù)對病斑圖像做分割處理,然后提取關(guān)鍵的病斑特征信息,通過選擇合適的分類器對類別進(jìn)行輸出,以更加科學(xué)準(zhǔn)確的方法判斷病害類別。張鑠等[1]對植物的四種病害做聚類分割,以對比顏色空間的方式找出最佳的分割方法,提取病害的13維特征,作為分類依據(jù),結(jié)合SVM分類器,識別率為90.67%。楊濤等[2]采取不同的分割方法對川麥冬葉片的病斑進(jìn)行分離,用主成分分析法去掉作用較差的病斑信息,提取表征能力強(qiáng)的特征向量送入設(shè)計(jì)的分類器中,測試識別率達(dá)到90%。譚秦紅[3]應(yīng)用無人機(jī)在距離地面不同高度處分別獲取大豆病斑葉片的圖像,采用SLIC超像素分割法提取梯度和紋理等方面的特征,結(jié)合隨機(jī)森林分類方法對單一特征和融合特征進(jìn)行對比分類,可以達(dá)到90%的最佳準(zhǔn)確率。圖像處理技術(shù)的應(yīng)用是農(nóng)業(yè)領(lǐng)域中病害識別技術(shù)的一個突破性進(jìn)展,但是也存在一定的局限性,在識別前需要對病害做分割處理,單獨(dú)提取特征并制作分類標(biāo)簽,特征的采集和標(biāo)簽的制作流程較為復(fù)雜。
深度學(xué)習(xí)的發(fā)展推動了卷積神經(jīng)網(wǎng)絡(luò)在農(nóng)業(yè)病害識別方面的應(yīng)用,并且已經(jīng)取得一系列的成果。石洪康等[4]對家蠶的五類病害開展研究,收集病害樣本,在特征融合情況下對ResNet50模型進(jìn)行結(jié)構(gòu)改進(jìn),測試準(zhǔn)確率為94.31%,且參數(shù)量比原來下降了三分之二。梅瑩等[5]建立了三種綠色蔬菜的霜霉病數(shù)據(jù)樣本庫,以VGG16模型為基礎(chǔ),減少卷積層和池化層的數(shù)量并調(diào)整訓(xùn)練參數(shù),改進(jìn)模型識別準(zhǔn)確率是95.67%。吳淑琦[6]選用公開數(shù)據(jù)集的三類玉米病害作為試驗(yàn)對象,在LeNet模型基礎(chǔ)上增加了卷積層和池化層,最高識別率達(dá)95%。與圖像處理相比,應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)可以進(jìn)一步提高作物病害識別準(zhǔn)確率,并且卷積神經(jīng)網(wǎng)絡(luò)可以進(jìn)行病害特征的自學(xué)習(xí),不需要進(jìn)行復(fù)雜的病斑分割操作就可以將圖像送入分類器識別。
本文以番茄的五類病害葉片為主要研究對象,包括番茄細(xì)菌斑點(diǎn)病、早疫病、晚疫病、葉霉病、七星葉斑病,在輕量級卷積神經(jīng)網(wǎng)絡(luò)MobileNetV3[7]的基礎(chǔ)上改進(jìn)模型結(jié)構(gòu),從學(xué)習(xí)率、優(yōu)化器算法和激活函數(shù)三方面探究參數(shù)變化對改進(jìn)模型的識別準(zhǔn)確率的影響。
1 數(shù)據(jù)來源及預(yù)處理
1.1 番茄葉片病害數(shù)據(jù)集
本試驗(yàn)的研究對象為番茄葉部病害的圖像,對葉部病害進(jìn)行分類識別,試驗(yàn)數(shù)據(jù)集來自Plant Village[8]公共數(shù)據(jù)集和AI Challenge[9]平臺數(shù)據(jù)集。Plant Village數(shù)據(jù)庫中包含各類常見的植物葉片病害圖像的數(shù)據(jù)集,AI Challenger平臺下的農(nóng)作物病害數(shù)據(jù)集按照“物種—病害—程度”進(jìn)行劃分。平臺中的數(shù)據(jù)以JSON文件的形式進(jìn)行存儲,可通過Python腳本調(diào)用JSON對象的文件名和類別兩個屬性來篩選番茄病害圖像。番茄試驗(yàn)樣本主要包括七星葉斑病、葉霉病、早疫病、晚疫病、細(xì)菌斑5類常見的番茄病害葉片和1類健康葉片。
1.2 圖像預(yù)處理
為了保證試驗(yàn)數(shù)據(jù)的均衡性、樣本的多樣性和訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型所需樣本的充足性,對試驗(yàn)數(shù)據(jù)進(jìn)行了數(shù)據(jù)增強(qiáng)處理[10]。自然環(huán)境下的光照強(qiáng)度、病害圖像拍攝角度以及葉片上可能存在灰塵等都會對圖像中病害的識別分類產(chǎn)生重要的影響,因此本文對病害圖像進(jìn)行了高斯噪聲添加、亮度增強(qiáng)、對比度變換、隨機(jī)裁剪和隨機(jī)旋轉(zhuǎn)的預(yù)處理操作,以此增強(qiáng)樣本的多樣性,盡可能達(dá)到模仿自然環(huán)境下對病害識別的效果,擴(kuò)充后的病害圖像總數(shù)為13652張,并對圖像尺寸進(jìn)行統(tǒng)一調(diào)整,以滿足卷積神經(jīng)網(wǎng)絡(luò)對輸入圖像的規(guī)格要求。樣本數(shù)量中健康葉片數(shù)量為2561幅,早疫病葉片為2739幅,晚疫病葉片為2396幅,葉霉病葉片為1960幅,細(xì)菌斑病葉片為2459幅,七星葉斑病為2031幅。對6個類別的圖像做擴(kuò)充處理,示例圖如圖1所示。
2 模型構(gòu)建
2.1 MobileNetV3模型
MobileNet模型分為三個系列,其中MobileNetV3是由MobileNetV1[11]和MobileNetV2[12]發(fā)展而來,它結(jié)合了兩個模型各自的優(yōu)勢,通過進(jìn)一步簡化結(jié)構(gòu)降低模型參數(shù)的方式提升了網(wǎng)絡(luò)工作效率。MobileNetV3采用深度卷積和逐點(diǎn)卷積代替標(biāo)準(zhǔn)卷積,大大降低了網(wǎng)絡(luò)的計(jì)算量。同時采用線性瓶頸和倒置殘差結(jié)構(gòu),對輸入特征通過先擴(kuò)展通道再進(jìn)行壓縮的方式來提取信息,在不改變特征維度的情況下更加便于向量信息的獲取。相比ReLU函數(shù),在低維空間中采用線性瓶頸結(jié)構(gòu)更有助于特征的采集,因此MobileNetV3在通道數(shù)量較少的卷積層后連接了線性層結(jié)構(gòu)。
MobileNetV3還將基于擠壓和激發(fā)的注意力模塊(Squeeze and Excitation Networks,SE)[13]應(yīng)用到瓶頸結(jié)構(gòu)中,根據(jù)特征通道的重要程度來區(qū)分特征的作用大小,對非重要特征進(jìn)行抑制。對網(wǎng)絡(luò)尾部的1×1卷積層和池化層結(jié)構(gòu)做改進(jìn),采用H-swish非線性函數(shù),簡化網(wǎng)絡(luò)運(yùn)行的工作量。在低配置的終端下就可以達(dá)到較高的分類準(zhǔn)確性。MobileNetV3模型結(jié)構(gòu)見表1。
2.2 MobileNetV3模型的改進(jìn)
2.2.1 感知機(jī)構(gòu)建
多層感知機(jī)(Multi-layer Perceptron,MLP)[14]主要由多個神經(jīng)元層組成,可實(shí)現(xiàn)對非線性數(shù)據(jù)的處理。MLP是前饋神經(jīng)網(wǎng)絡(luò),由輸入層、隱含層和輸出層構(gòu)成,其中隱含層的層數(shù)可以根據(jù)需要調(diào)整數(shù)量,最簡單的MLP只有一個隱含層,輸入層到隱含層相當(dāng)于一個全連接層,隱含層到輸出層相當(dāng)于一個softmax分類器(邏輯回歸Logistic Regression),實(shí)現(xiàn)分類的作用。本文在原模型bottleneck模塊的5×5卷積層后連接一層1×1卷積層,構(gòu)成一個簡單的感知機(jī)結(jié)構(gòu),并引入ReLU非線性函數(shù),增加非線性元素,提升模型的非線性表達(dá)能力,而且感知機(jī)的特征重用原理可以提升模型的擬合能力,在數(shù)據(jù)樣本量較少的情況下,提高分類準(zhǔn)確性,使訓(xùn)練效果和測試效果更加貼近。感知機(jī)構(gòu)建方式見圖2。
2.2.2 空洞卷積添加
空洞卷積[15](Dilated Convolution)是指通過在常規(guī)卷積中注入空洞的形式擴(kuò)大卷積核的尺寸,即擴(kuò)大卷積核對輸入特征圖進(jìn)行卷積操作的區(qū)域,增加提取特征的多樣性。具體擴(kuò)大的規(guī)??梢酝ㄟ^膨脹系數(shù)r和卷積核的尺寸來計(jì)算。番茄病害特征在不同類別之間或同種類別的不同階段都會表現(xiàn)出一定的相似性。其中,番茄細(xì)菌病和七星葉斑病的葉子輪廓非常像,背景信息上容易致使模型判斷失誤;晚疫病和葉霉病葉片形狀均為細(xì)長型,四周邊緣都是卷曲的樣式,個別葉片在病斑上也是非常接近。因此,對番茄葉部病害分類,要全面考慮番茄病害間的相似的背景特征和不易區(qū)分的病斑前景特征[16],加強(qiáng)病害類別的辨別。
擴(kuò)大卷積核的感受野區(qū)域,可以提取更加多樣性、更加全面、更加抽象的深層次特征,幫助網(wǎng)絡(luò)鑒別病害的種類。本文在MobileNetV3的第十個和第十一個瓶頸結(jié)構(gòu)的5×5卷積中,引入了擴(kuò)張系數(shù)分別為2和4的空洞卷積。原始卷積核尺寸為5×5,感受野也是5×5,經(jīng)過擴(kuò)張后感受野大小分別為9×9、17×17。如圖3所示,以擴(kuò)張系數(shù)r為2舉例,說明卷積核擴(kuò)張方式。
以添加空洞的形式膨脹卷積核,不僅不會增加圖像特征提取的計(jì)算量,還可以將感受野區(qū)域擴(kuò)大,加強(qiáng)模型對輸入特征的學(xué)習(xí)。
2.2.3 Focal Loss損失函數(shù)
Focal Loss(焦點(diǎn)損失)損失函數(shù)可以調(diào)整分類識別任務(wù)中模型對難分類樣本的關(guān)注度,增加難分類樣本所占的權(quán)重,提升錯誤分類樣本的正確識別率。本文以番茄葉片病害為試驗(yàn)對象,番茄病害葉片和健康葉片的顏色差異非常小,且不同病斑間的癥狀相似度較大,因此模型需要提升對難分類的番茄葉片病斑的關(guān)注度,根據(jù)訓(xùn)練學(xué)習(xí)減少錯分類樣本的數(shù)量。引入Focal Loss損失函數(shù)可以減少M(fèi)obileNetV3網(wǎng)絡(luò)在訓(xùn)練過程中對易分類樣本的權(quán)重,減少對難分類樣本識別的干擾[17]。
Focal Loss損失函數(shù)是以Cross Entropy Loss損失函數(shù)為基礎(chǔ)進(jìn)行優(yōu)化的,深度學(xué)習(xí)中Cross Entropy Loss損失函數(shù)對于一個樣本有兩個概率分布,即真實(shí)分布和非真實(shí)分布,表達(dá)式為
Loss=-∑ni=1yilogyi′
(1)
式中:
yi——分類樣本的真實(shí)標(biāo)簽;
yi′——分類樣本的預(yù)測標(biāo)簽。
經(jīng)過對該損失函數(shù)優(yōu)化得到了Focal Loss損失函數(shù),表達(dá)式為
FL(pt)=-(1-pt)γlog(pt)
(2)
式中:
pt——
數(shù)據(jù)樣本被預(yù)測為某個類別的概率;
γ——可調(diào)節(jié)聚焦參數(shù);
(1-pt)γ——
簡單或困難樣本的調(diào)節(jié)因子。
調(diào)節(jié)因子可以使易分類樣本的損失值成倍降低,進(jìn)而增加難分類樣本所占的損失值,對糾正錯誤分類樣本起到非常關(guān)鍵的作用。使難分類的番茄病害圖像在訓(xùn)練過程中,獲取更高的關(guān)注度。
2.3 訓(xùn)練策略
改進(jìn)后的番茄病害識別網(wǎng)絡(luò)在原有結(jié)構(gòu)的基礎(chǔ)上引入了空洞卷積,在不同的bottleneck層設(shè)置不同尺寸的卷積核,提取更加接近于目標(biāo)對象的抽象特征,降低了不同病害間的相似性給模型訓(xùn)練帶來的難度。構(gòu)建感知機(jī)結(jié)構(gòu),防止因數(shù)據(jù)量過少導(dǎo)致模型的擬合能力得不到提升,并采用Focal Loss損失函數(shù),以提高模型對難分類樣本的關(guān)注度,從而提高模型的訓(xùn)練效率。圖4是基于改進(jìn)MobileNetV3的模型訓(xùn)練過程,具體流程如下。
1) 將番茄圖像訓(xùn)練數(shù)據(jù)集加載到MobileNetV3模型中進(jìn)行訓(xùn)練,獲得模型訓(xùn)練最初結(jié)果并保存。
2) 對MobileNetV3模型的最后兩個瓶頸模塊結(jié)構(gòu)進(jìn)行改進(jìn),增強(qiáng)CNN的局部感知能力,不斷調(diào)整網(wǎng)絡(luò)超參數(shù)獲得最佳參數(shù)取值。
3) 利用測試數(shù)據(jù)集來驗(yàn)證已訓(xùn)練模型對6類樣本的識別效果。
4) 對番茄病害識別做10折交叉驗(yàn)證,以更準(zhǔn)確的驗(yàn)證方法評估模型。
3 結(jié)果與分析
3.1 試驗(yàn)結(jié)果
3.1.1 基于DM-MobileNetV3的病害識別
本文模型DM-MobileNetV3是在MobileNetV3的基礎(chǔ)上改進(jìn)得到的,由圖5和圖6可知,在同樣訓(xùn)練到60輪的情況下,DM-MobileNetV3模型的識別精度更高,可達(dá)到97.29%,相比改進(jìn)之前的95.16%提升了2.13%,測試的損失值由原來的24.46%下降到6.87%,下降幅度17.59%。DM-MobileNetV3模型的訓(xùn)練曲線震蕩幅度較小,曲線變化相對平穩(wěn)。
3.1.2 不同學(xué)習(xí)方式對模型性能的影響
學(xué)習(xí)率[18]對模型的識別影響較大,學(xué)習(xí)率取值太大,容易導(dǎo)致搜索過程出現(xiàn)震蕩從而跳過最優(yōu)解。學(xué)習(xí)率取值太小,則會增加模型的學(xué)習(xí)次數(shù)和收斂時間。較高的學(xué)習(xí)率或較低的學(xué)習(xí)率都會導(dǎo)致訓(xùn)練與測試的準(zhǔn)確率較低,損失值較大,不利于網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)。在訓(xùn)練模型時,學(xué)習(xí)率(Learning rate)為0.01、0.001和0.0001以及0.00001的測試準(zhǔn)確率和損失值變化,如圖7和圖8所示。當(dāng)學(xué)習(xí)率逐漸增大到0.001時,模型識別率逐漸提高,測試損失值不斷下降。在學(xué)習(xí)率為0.001時網(wǎng)絡(luò)對于番茄葉片病害的識別效果優(yōu)于之前。當(dāng)學(xué)習(xí)率增大到0.01時,準(zhǔn)確率不增反降,損失值也明顯上升,這說明學(xué)習(xí)率的最佳取值會在一個區(qū)間范圍內(nèi),太大和太小都不利于網(wǎng)絡(luò)的訓(xùn)練。因此,學(xué)習(xí)率為0.001時網(wǎng)絡(luò)對于番茄葉片病害的識別效果達(dá)到最優(yōu)。
3.1.3 不同激活函數(shù)對模型性能的影響
圖9和圖10給出了模型使用Sigmoid、ReLU、GLU三種不同激活函數(shù)[19]在訓(xùn)練準(zhǔn)確率和損失值上的曲線變化??梢钥闯觯褂眉せ詈瘮?shù)Sigmoid的模型識別準(zhǔn)確率低且收斂速度慢,在訓(xùn)練過程中有明顯的震蕩現(xiàn)象,缺乏穩(wěn)定性,訓(xùn)練效果較差;使用激活函數(shù)ReLU和GLU的模型相比之下更趨于穩(wěn)定,在10輪之后逐漸達(dá)到收斂狀態(tài),但是使用ReLU函數(shù)的模型識別準(zhǔn)確率較低,使用激活函數(shù)GLU的模型經(jīng)過60輪訓(xùn)練后準(zhǔn)確率可達(dá)到97.29%,準(zhǔn)確率基本維持平穩(wěn),訓(xùn)練后的識別效果也較好。從損失值的對比來看,使用GLU激活函數(shù)可以使模型的損失度更低、使模型的訓(xùn)練更加平穩(wěn),激活函數(shù)GLU能夠有效提升番茄病害識別模型的性能。
3.1.4 不同優(yōu)化算法對模型性能的影響
優(yōu)化器[20]的作用是更新和計(jì)算影響模型訓(xùn)練和模型輸出的網(wǎng)絡(luò)參數(shù),使其逼近或達(dá)到最優(yōu)值,從而使訓(xùn)練誤差降低到最小。本文選取SGD、AdaGrad、Adam三種優(yōu)化器對模型性能進(jìn)行了測試,模型的識別精度和損失曲線如圖11和圖12所示,選擇SGD和AdaGrad作為模型的優(yōu)化器時,模型的識別精度都較低損失值都較高,而且SGD更新得過于頻繁致使網(wǎng)絡(luò)訓(xùn)練時間延長;使用AdaGrad時學(xué)習(xí)越深入,更新的幅度就會越小,訓(xùn)練到后期時學(xué)習(xí)率很可能會接近或退化成0,導(dǎo)致梯度無法更新。而Adam可以根據(jù)模型訓(xùn)練情況自動將學(xué)習(xí)率調(diào)整為合適值,網(wǎng)絡(luò)對番茄葉片病害的識別精度均高于使用SGD和Adam的模型,損失值也明顯更低。經(jīng)過對比,使用Adam作為優(yōu)化器會使得本文模型對于番茄葉片病害的識別效果更好。
3.2 不同識別模型對識別效果的影響
為了進(jìn)一步驗(yàn)證本文識別模型的可靠性,在相同的試驗(yàn)條件下選取不同識別模型進(jìn)行對比試驗(yàn)。根據(jù)參考文獻(xiàn)[21-23]可知,VGG16、ResNet50和InceptionV3是圖像識別領(lǐng)域常用的卷積神經(jīng)網(wǎng)絡(luò)模型,并且都具有較好的識別效果,因此選擇將其作為本試驗(yàn)的對比模型。圖13為不同模型的識別精度對比曲線,表2為各模型試驗(yàn)對比的結(jié)果。其中,卷積層數(shù)僅為13的VGG16模型的測試準(zhǔn)確率僅達(dá)到86.63%,識別效果最差;ResNet50模型和InceptionV3模型識別準(zhǔn)確率非常接近,均達(dá)到93%以上;而DM-MobileNetV3模型達(dá)到97.29%的最高準(zhǔn)確率,數(shù)據(jù)規(guī)模僅有41.55MB,無論識別精度還是存儲規(guī)模都占有優(yōu)勢。
ResNet50對單張圖片檢測的耗時最長,平均檢測時間為1.72s。VGG16與InceptionV3單張檢測時間分別為0.64s和0.60s,而本文模型DM-MobileNetV3的單張圖片檢測平均耗時僅0.31s,更適合番茄病害圖像的快速檢測。
3.3 模型魯棒性分析
采用單一的測試集對模型進(jìn)行訓(xùn)練和評估會存在一定的隨機(jī)性,不利于觀察模型的穩(wěn)定性。因此,為了對模型做出更好的驗(yàn)證,試驗(yàn)采用10折交叉驗(yàn)證[24](10-fold cross-validation)對模型進(jìn)行評價,將番茄葉片病害圖像分為10份,依次選取其中的9份作為訓(xùn)練集來對模型進(jìn)行訓(xùn)練,剩余的1份作為測試集驗(yàn)證模型的識別性能,取10次結(jié)果的平均值作為對模型的評價。10次試驗(yàn)的識別準(zhǔn)確率依次為96.98%、98.11%、97.31%、97.22%、97.37%、96.43%、97.61%、98.03%、96.17%、97.72%;平均測試準(zhǔn)確率為97.29%,根據(jù)試驗(yàn)結(jié)果,該模型準(zhǔn)確率和穩(wěn)定性良好。
4 結(jié)論
1) 本文通過改進(jìn)輕量卷積神經(jīng)網(wǎng)絡(luò)MobileNetV3的bottleneck結(jié)構(gòu),建立了DM-MobileNetV3番茄病害分類模型。針對番茄葉片病斑的不易分類特征,主要從卷積層和損失函數(shù)兩方面來改進(jìn),在bottleneck中引入空洞卷積和感知機(jī)層,并調(diào)整損失函數(shù)為Focal Loss函數(shù),使模型的識別精度提升了2.13%。
2) 試驗(yàn)在設(shè)置其他超參數(shù)相同的情況下,使用不同的學(xué)習(xí)率、激活函數(shù)和優(yōu)化器測試模型的性能。試驗(yàn)結(jié)果得出,當(dāng)采用0.001的學(xué)習(xí)率、GLU激活函數(shù)和Adam優(yōu)化算法時其模型精確度為97.29%,模型性能最佳。同時十折交叉驗(yàn)證結(jié)果表明該模型的魯棒性良好。
3) 本文在模型改進(jìn)后,提升了算法的運(yùn)行效率,平均識別時間為0.31s,低于其他算法。且模型僅有41.55MB,用低內(nèi)存達(dá)到高識別率。與VGG16、ResNet50和InceptionV3相比,DM-MobileNetV3的識別精度和平均檢測時間都占有優(yōu)勢。
參 考 文 獻(xiàn)
[1] 張鑠, 謝裕睿, 董建娥. 基于圖像處理的植物葉片病害識別研究[J]. 現(xiàn)代計(jì)算機(jī), 2021, 27(34): 112-116.
Zhang Shuo, Xie Yurui, Dong Jiane. Research on plant leaf disease recognition based on image processing [J]. Modern Computer, 2021, 27(34): 112-116.
[2] 楊濤, 雷進(jìn), 朱皓睿. 基于圖像特征融合的麥冬葉部病害識別[J]. 湖北農(nóng)業(yè)科學(xué), 2021, 60(7): 135-138, 144.
Yang Tao, Lei Jin, Zhu Haorui. Recognition of ophiopogon japonicus disease based on image feature fusion [J]. Hubei Agricultural Sciences, 2021, 60(7): 135-138, 144.
[3] 譚秦紅. 基于無人機(jī)圖像處理的大豆葉片病害識別準(zhǔn)確率研究[J]. 河南農(nóng)業(yè)科學(xué), 2021, 50(3): 174-180.
Tan Qinhong. Research on identification accurate rate of soybean leaf diseases based on UAV image processing [J]. Journal of Henan Agricultural Sciences, 2021, 50(3): 174-180.
[4] 石洪康, 肖文福, 黃亮. 基于卷積神經(jīng)網(wǎng)絡(luò)的家蠶病害識別研究[J]. 中國農(nóng)機(jī)化學(xué)報, 2022, 43(1): 150-157.
Shi Hongkang, Xiao Wenfu, Huang Liang.Research on recognition of silkworm diseases based on convolutional neural network [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(1): 150-157.
[5] 梅瑩, 尹藝璐, 石稱華. 基于改進(jìn)VGG卷積神經(jīng)網(wǎng)絡(luò)的葉菜霜霉病智能識別算法研究[J]. 上海蔬菜, 2021(6): 76-84.
[6] 吳淑琦. 基于卷積神經(jīng)網(wǎng)絡(luò)的玉米病害識別[J]. 現(xiàn)代信息科技, 2021, 5(9): 6-9.
Wu Shuqi. Corn disease identification based on convolution neural network [J]. Modern Information Technology, 2021, 5(9): 6-9.
[7] 姚燕, 胡立坤, 郭軍. 基于深度遷移網(wǎng)絡(luò)MobileNetV3的地形識別[J]. 廣西大學(xué)學(xué)報(自然科學(xué)版), 2021, 46(4): 996-1007.
Yao Yan, Hu Likun, Guo Jun. Terrain recognition based on deep transfer network MobileNetV3 [J]. Journal of Guangxi University (Natural Science Edition), 2021, 46(4): 996-1007.
[8] Sachin D, Tarun G, Dushyant G. Performance analysis of deep learning architectures for plant leaves disease detection [J]. Measurement: Sensors, 2022, 24.
[9] 樊湘鵬, 周建平, 許燕, 等. 基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的復(fù)雜背景下玉米病害識別[J]. 農(nóng)業(yè)機(jī)械學(xué)報, 2021, 52(3): 210-217.
Fan Xiangpeng, Zhou Jianping, Xu Yan, et al. Corn disease recognition under complex background based on improved convolution neural network [J].Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(3): 210-217.
[10] Yadav D, Banga A, Yadav A K. A novel convolutional neural network based model for recognition and classification of apple leaf diseases [J]. Traitement du Signal, 2020, 37(6): 1093-1101.
[11] Cai Kewei, Miao Xinying, Wang Wei, et al. A modified YOLOv3 model for fish detection based on MobileNetv1 as backbone [J]. Aquacultural Engineering, 2020, 91: 102117.
[12] Indraswari R, Rokhana R, Herulambang W. Melanoma image classification based on MobileNetV2 network [J]. Procedia Computer Science, 2022, 197: 198-207.
[13] 劉強(qiáng), 張道暢. 結(jié)合SENet的密集卷積生成對抗網(wǎng)絡(luò)圖像修復(fù)方法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2022, 43(5): 1056-1060.
Liu Qiang, Zhang Daochang.Dense convolution generate adversarial network image inpainting method with SENet [J]. Journal of Chinese Mini-Micro Computer Systems, 2022, 43(5): 1056-1060.
[14] 劉萬軍, 李琳. 改進(jìn)感知機(jī)多類分類方法在車輛類型識別中的應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2015, 32(9): 152-156, 174.
Liu Wanjun, Li Lin. Application of improved perceptronmulti-class classification method in recognition of automobile models [J]. Computer Applications and Software, 2015, 32(9): 152-156, 174.
[15] 劉萬軍, 李嘉欣, 曲海成. 基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的交通標(biāo)示識別研究[J]. 計(jì)算機(jī)應(yīng)用研究, 2022, 39(5): 1557-1562.
Liu Wanjun, Li Jiaxin, Qu Haicheng. Study on traffic sign recognition based on multi-scale convolutional neural network [J]. Application Research of Computers, 2022, 39(5): 1557-1562.
[16] 于合龍, 沈金夢, 畢春光. 基于知識圖譜的水稻病害關(guān)聯(lián)特征挖掘方法[J]. 吉林農(nóng)業(yè)大學(xué)學(xué)報, 2021, 43(2): 181-188.
Yu Helong, Shen Jinmeng, Bi Chunguang. Associated features mining method of rice diseases based on knowledge graph [J]. Journal of Jilin Agricultural University, 2021, 43(2): 181-188.
[17] 崔子越, 皮家甜, 陳勇, 等. 結(jié)合改進(jìn)VGGNet和Focal Loss的人臉表情識別[J]. 計(jì)算機(jī)工程與應(yīng)用, 2021, 57(19): 171-178.
Cui Ziyue, Pi Jiatian, Chen Yong, et al. Facial expression recognition combined with improved VGGNet and Focal Loss [J]. Computer Engineering and Applications, 2021, 57(19): 171-178.
[18] Zhang Jinjing, Hu Fei, Li Li, et al. An adaptive mechanism to achieve learning rate dynamically [J]. Neural Computing and Applications, 2019, 31(10): 6685-6698.
[19] 徐艷蕾, 何潤, 翟鈺婷. 基于輕量卷積網(wǎng)絡(luò)的田間自然環(huán)境雜草識別方法[J]. 吉林大學(xué)學(xué)報(工學(xué)版), 2021, 51(6): 2304-2312.
Xu Yanlei, He Run, Zhai Yuting.Weed identification method based on deep transfer learning in field natural environment [J]. Journal of Jilin University (Engineering and Technology Edition), 2021, 51(6): 2304-2312.
[20] 畢常遙, 袁曉彤. 基于Adam局部優(yōu)化的分布式近似牛頓深度學(xué)習(xí)模型訓(xùn)練[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2021, 38(10): 278-283.
Bi Changyao, Yuan Xiaotong.Deep learning training via distributed approximate newton-type method based on Adam local optimization [J]. Computer Applications and Software, 2021, 38(10): 278-283.
[21] 王林柏, 張博, 姚竟發(fā), 等. 基于卷積神經(jīng)網(wǎng)絡(luò)馬鈴薯葉片病害識別和病斑檢測[J]. 中國農(nóng)機(jī)化學(xué)報, 2021, 42(11): 122-129.
Wang Linbai, Zhang Bo, Yao Jingfa, et al.Potato leaf disease recognition and potato leaf disease spot detection based on Convolutional Neural Network [J]. Journal of Chinese Agricultural Mechanization, 2021, 42(11): 122-129.
[22] Wang Guowei, Yu Haiye, Sui Yuanyuan. Research on maize disease recognition method based on improved ResNet50 [J]. Mobile Information Systems, 2021.
[23] Methuni N R, Yasmini R, Begumi N, et al. Carrot disease recognition using deep learning approach for sustainable agriculture [J]. International Journal of Advanced Computer Science and Applications (IJACSA), 2021, 12(9).
[24] 梁子超, 李智煒, 賴鏗. 10折交叉驗(yàn)證用于預(yù)測模型泛化能力評價及其R軟件實(shí)現(xiàn)[J]. 中國醫(yī)院統(tǒng)計(jì), 2020, 27(4): 289-292.
Liang Zichao, Li Zhiwei, Lai Keng.Application of 10-fold cross-validation in the evaluation of generalization ability of prediction models and the realization in R [J]. Chinese Journal of Hospital Statistics, 2020, 27(4): 289-292.