張超 李丹
摘 要 大棚水稻種植是我國農(nóng)業(yè)發(fā)展過程中重要的種植形式,大棚中水稻病蟲害的及時發(fā)現(xiàn)和預防能夠顯著提高水稻產(chǎn)量。深度學習模型在圖像識別方面表現(xiàn)出色,可以用于監(jiān)測大棚內(nèi)水稻植株的生長狀況,快速識別病害和蟲害。但數(shù)據(jù)集的采集易受各種環(huán)境因素的影響,導致數(shù)據(jù)集中有用圖像數(shù)目過少,訓練易過擬合并且難以提取有用特征。針對以上問題,提出了一種基于ConvNeXt-T神經(jīng)網(wǎng)絡的水稻病蟲害識別模型。對數(shù)據(jù)集采用鏡像、裁剪等數(shù)據(jù)增強及增加高斯噪聲、隨機亮度、隨機遮掩等數(shù)據(jù)預處理,將獲取的5 932張水稻害蟲圖像擴展到21 340張,在ConvNeXt-T神經(jīng)網(wǎng)絡模型中進行訓練,來識別水稻種植中最常見的4種病害(白葉枯病、水稻細菌性條斑病、褐斑病、水稻東格魯病毒?。?。訓練結果表明,在相同的實驗環(huán)境下,與經(jīng)典的AlexNet、GoogLeNet、ResNet34及VGG16網(wǎng)絡相比,ConvNeXt-T神經(jīng)網(wǎng)絡性能最佳,病害識別準確率最高(99.86%)。其優(yōu)秀的識別精度能夠為大棚水稻病蟲害的預防提供有力的幫助。
關鍵詞 大棚水稻種植;深度學習;ConvNeXt-T;數(shù)據(jù)增強;數(shù)據(jù)預處理
中圖分類號:S435.11 文獻標志碼:A DOI:10.19415/j.cnki.1673-890x.2023.20.013
大棚水稻種植技術代表著農(nóng)業(yè)領域的一項前沿實踐,通過將水稻種植移入大棚這一受控環(huán)境中,實現(xiàn)對光照、病蟲害等因素的精準調(diào)控。這不僅有助于提高水稻的產(chǎn)量和質(zhì)量,同時能夠有效地管理病蟲害,減少對農(nóng)藥的依賴,促進農(nóng)業(yè)的可持續(xù)發(fā)展。
現(xiàn)如今,深度學習的快速發(fā)展為檢測植物病蟲害提供了有效幫助,但依然存在缺陷。目前大部分的病蟲害數(shù)據(jù)集都是利用相機等設備在實驗大棚內(nèi)拍攝處理后獲取的靜態(tài)圖像。然而,處于大棚環(huán)境下的農(nóng)作物常受亮度和搖擺運動等因素影響,降低了模型對病害特征的提取效率[1]。同時,現(xiàn)場拍攝獲取的數(shù)據(jù)集樣本量偏少,容易導致訓練過程中過擬合,導致模型對病蟲害識別的準確度下降[2]。
基于上述問題,本文提出了一種基于ConvNeXt-T神經(jīng)網(wǎng)絡結構的水稻病蟲害識別模型。通過增加高斯噪聲、隨機遮擋和旋轉(zhuǎn)等數(shù)據(jù)預處理方法來增加數(shù)據(jù)集的復雜性以模擬實驗大棚中不同因素對檢測的影響,將獲取的4 268張水稻害蟲圖像擴展到21 340張,使得神經(jīng)網(wǎng)絡模型在訓練過程中增強泛化能力和魯棒性。通過中心裁剪等數(shù)據(jù)增強方法,來解決訓練中易出現(xiàn)的過擬合現(xiàn)象。
1 數(shù)據(jù)集
1.1 實驗數(shù)據(jù)
本次研究所用初始水稻數(shù)據(jù)集拍攝于吉林農(nóng)業(yè)科技學院實驗大棚,含有四種不同類型的病蟲害圖像,其中白葉枯病圖像有1 584張、水稻細菌性條斑病圖像1 440張、褐斑病圖像1 600張和水稻東格魯病毒病圖像1 308張,水稻病蟲害初始數(shù)據(jù)集共5 932張圖像。將圖像尺寸(像素)統(tǒng)一裁剪為224×224大小并以.jpg的格式進行保存[3]。
1.2 數(shù)據(jù)處理
為了模擬實際大棚光照、風吹及葉片之間的相互遮掩等復雜環(huán)境問題,本文利用圖像預處理的方式進行環(huán)境模擬,如圖1所示。通過添加高斯噪聲、隨機亮度、旋轉(zhuǎn)角度和隨即遮掩的數(shù)據(jù)預處理分別模擬環(huán)境中可能發(fā)生的畫面模糊、光照強度變化、大風干擾及葉片之間相互遮掩的情況,并將數(shù)據(jù)集樣本數(shù)量從5 932張擴充到21 340張來防止訓練過程擬合,使得模型獲取更多復雜環(huán)境中的疾病特征,提高模型驗證的準確性[4]。
2 模型建立
2022年1月,F(xiàn)acebook AI Research和UC Berkeley聯(lián)合發(fā)表的一篇文章提出了ConvNeXt純卷積神經(jīng)網(wǎng)絡。對比2021年提出的Swin Transformer模型,ConvNeXt在相同的浮點運算數(shù)(floating point operations,F(xiàn)LOPs)下具有較高的準確率[5]。ConvNeXt網(wǎng)絡根據(jù)不同階段(stage)重復堆疊塊個數(shù)的不同共分為5個版本,分別為ConvNeXt-T、ConvNeXt-S、ConvNeXt-B、ConvNeXt-L和ConvNeXt-XL。每個版本對應的通道數(shù)及網(wǎng)絡塊(Block)個數(shù)如表1所示。
相較于ResNet每個stage中大約1∶1∶2∶1的Block個數(shù)比例,ConvNeXt采用Swin-T的1∶1∶3∶1比例,準確率相比之前有所提升。在結構方面也與ResNet的Block有差異,ConvNeXt網(wǎng)絡將Block中depthwise conv模塊上移,并將其3×3的卷積核改成7×7,用Transformer中常用的激活函數(shù)GELU和歸一化LN(Layer Normalization)替代RELU和BN(Batch Normalization),同時減少激活函數(shù)和歸一化在Block中的使用,這使得準確率再次提升。
ConvNeXt網(wǎng)絡在整體結構的其他方面與以前的經(jīng)典網(wǎng)絡也有所不同。對于一般卷積神經(jīng)網(wǎng)絡,最初的下采樣模塊一般都是由卷積核大小為7×7且步距(stride)為2的卷積層及一個步距為2的最大池化層組成;而ConvNeXt網(wǎng)絡則采用Swin Transformer模型常用的卷積核為4×4、步距為4的卷積層構成模型中最初的下采樣,替換后準確率又有所提升。本文將利用ConvNeXt-T神經(jīng)網(wǎng)絡進行水稻病蟲害識別的研究,其結構圖如圖2所示。
3 結果與分析
3.1 實驗環(huán)境
本次研究所用電腦系統(tǒng)為Windows 10 ×64位,內(nèi)存為80 G,CPU為AMD EPYC 9654,并配備一張RTX 4090的顯卡。采用Python編程語言,pytorch深度學習框架進行建模。
3.2 實驗參數(shù)
在本研究中,模型使用了自適應優(yōu)化算法(Adaptive?Gradient)。輸入圖像的尺寸大小為224×224,批量大小(Batch size)為8,遍歷次數(shù)(epochs)為50,初始學習率(lr)為0.000 5,權重衰減(wd)為0.05,并且將病蟲害識別的平均準確率作為模型評價的指標。
3.3 實驗成果
為了體現(xiàn)ConvNeXt-T網(wǎng)絡模型的準確性和穩(wěn)定性,圖像傳輸?shù)侥P椭?,隨機抽取增強擴充過的數(shù)據(jù)集中每種病蟲害圖像的20%作為測試集,剩余的80%作為訓練集。利用相同的訓練集在AlexNet、VGG16、GoogLeNet、ResNet34及ConvNeXt-T中進行訓練,各網(wǎng)絡在訓練集上的準確率如圖3和表2所示,ConvNeXt-T準確率最高,達到了99.86%,其識別精度曲線也高于其他網(wǎng)絡模型,收斂速度也快于其他模型。在相同的增強擴充數(shù)據(jù)集下,AlexNet、VGG16、GoogLeNet、ResNet34在訓練集上準確率分別為98.64%、99.14%、99.64%、98.96%,分別比ConvNeXt-T網(wǎng)絡低1.22、0.72、0.22、0.90個百分點。因此,可以證明ConvNeXt-T神經(jīng)網(wǎng)絡在水稻病蟲害識別上比其他網(wǎng)絡結構的可行性更高。
4 結語
如今,深度學習為大棚水稻病蟲害的識別提供了有效的方法,神經(jīng)網(wǎng)絡模型的成熟有助于系統(tǒng)準確地對水稻病蟲害進行分類處理,提高糧食產(chǎn)量。研究表明,本文所用基于ConvNeXt-T的水稻病害識別模型對大棚中水稻病蟲害具有較高的識別精度及穩(wěn)定性。該模型能夠通過對不同的病蟲害圖像進行學習,獲取更多的特征信息來適應復雜的環(huán)境干擾,使得模型識別精度大大提高。在水稻病蟲害識別模型訓練過程中,通過數(shù)據(jù)預處理和數(shù)據(jù)增強,使得模型準確率到達99.86%,與AlexNet、VGG16、GoogLeNet、ResNet34相比分別提高了1.22、0.72、0.22、0.9個百分點,基于ConvNeXt-T神經(jīng)網(wǎng)絡的水稻害蟲識別模型具有優(yōu)越的性能。本研究同時為背景復雜、數(shù)據(jù)集過小、有效特征提取困難等關鍵問題提供了一種可行的研究方法和重要參考。
參考文獻:
[1] 樊湘鵬,周建平,許燕,等.基于改進卷積神經(jīng)網(wǎng)絡的復雜背景下玉米病害識別[J].農(nóng)業(yè)機械學報,2021,52(3):210-217.
[2] ZHANG J, HUANG Y, PU R, et al. Monitoring plant diseases and pests through remote sensing technology: a review[J]. Comput Electron Agric,2019,165:104943.
[3] SETHY P, BARPANDA N, RATH A, et al. Deep feature based rice leaf disease identification using support vector machine[J]. Comput Electron Agric,2020,175:105527.
[4] WU H,WIESNER HANKS T,STEWART E L,et al.Autonomously detecting plant disease symptoms directly from aerial images[J].Plant Phenotype J,2019,2(1):1-9.
[5] LIU Z, MAO H, WU C, et al. A ConvNet for the 2020s[C]// 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New Orleans, LA, USA:IEEE, 2022:11966-11976.