摘 要: 準確識別農(nóng)田中常見類型的玉米葉病害并及時治療是提高玉米產(chǎn)量的關(guān)鍵,可以提高效率并降低種植成本。為了解決玉米葉病害識別精度不高、檢測效率低以及在移動端設(shè)備難以部署的難題,本文提出了一種改進的名為GSW-YOLOv7 的目標檢測模型。首先,設(shè)計了GS-ELAN結(jié)構(gòu)優(yōu)化模型頸部,降低模型的參數(shù)量。其次,將簡單且無需參數(shù)的SimAM注意力機制融入網(wǎng)絡(luò)結(jié)構(gòu)中,在不增加額外參數(shù)的情況下提高檢測的精度,獲取更具代表性的玉米葉病害特征。最后,采用高效的Wise-IoU 損失函數(shù)以加快收斂速度,并提高模型的精度。實驗結(jié)果表明,GSWYOLOv7網(wǎng)絡(luò)模型平均精度(mAP)為85.60%,檢測速度為26.79FPS,該模型在檢測任務(wù)中權(quán)衡了模型的檢測精度和檢測速度,與YOLOv5、YOLOX等算法相比,該算法性能最好,能夠快速、準確地檢測常見的玉米葉病害,為農(nóng)業(yè)生產(chǎn)提供了創(chuàng)新的解決方案。
關(guān)鍵詞: 玉米葉病害;YOLOv7;目標檢測;深度學習;注意力機制
中圖法分類號: TP391.4 文獻標識碼: A 文章編號: 1000-2324(2024)04-0566-13
玉米,作為全球三大主要糧食作物之一,在農(nóng)業(yè)生產(chǎn)中扮演著重要角色,是我國重要的糧食作物。然而,在玉米的生長過程中,葉片病害問題是影響產(chǎn)量和質(zhì)量的主要因素之一,葉片病害會直接導致產(chǎn)量減少和質(zhì)量下降[1]。目前,我國對玉米葉病害的識別和分類主要依賴于專業(yè)技術(shù)人員的經(jīng)驗判斷。技術(shù)人員需要具備良好的觀察技巧和豐富的經(jīng)驗,才能進行疾病的識別[2]。然而,這種方法需要投入大量人力物力,且嚴重依賴個人經(jīng)驗,識別準確性低、效率差。因此,為確保玉米的穩(wěn)定增產(chǎn),快速準確地識別常見玉米葉病害至關(guān)重要。
近年來,隨著大數(shù)據(jù)分析技術(shù)和圖形處理單元(GPUs)的迅速進步,計算機的計算能力得到了顯著提升,深度學習技術(shù)廣泛應(yīng)用于多個領(lǐng)域,包括農(nóng)業(yè)病蟲害的識別[3]。在這方面的研究中,Yinglai Huang 等人[4]對傳統(tǒng)的ResNet-50 模型進行了改進,將LeakyReLU 激活函數(shù)替代ReLU激活函數(shù),并調(diào)整了殘差塊中批歸一化層、激活函數(shù)和卷積層的順序,這一改進后的網(wǎng)絡(luò)在玉米葉病圖像分類中取得了98.3%的準確率。Haoyu Wu[5]提出了一種基于VGG 和ResNet 的雙通道卷積神經(jīng)網(wǎng)絡(luò),他們成功將在驗證集上對玉米葉病害類型的識別準確率提高到98.33%。Deng 等人[6]建立并測試了一種基于FPN 的Faster R-CNN高精度谷物檢測模型,其平均準確率達到了99.4%。以上算法具有較高的準確度,但由于模型參數(shù)量大、大存儲空間和計算消耗,這在實際應(yīng)用中導致難以在嵌入式設(shè)備上部署龐大的算法模型的問題。
近年來基于深度學習的深度卷積神經(jīng)網(wǎng)絡(luò)成為研究熱點,深度卷積神經(jīng)網(wǎng)絡(luò)在圖像目標檢測上展現(xiàn)出顯著優(yōu)勢,檢測方法可以歸納為兩類。第一類是基于區(qū)域生成的方法,這類方法先生成一系列候選框,然后對這些候選框中的目標進行分類,代表性的模型包括RCNN[7]、Fast-RCNN[8]和Faster-RCNN[9]。這類方法在識別準確性上表現(xiàn)出色,錯誤率和漏檢率都相對較低,但由于處理過程較為復雜,導致檢測速度較慢,難以滿足實時檢測的需求。第二類是基于回歸的方法,這類方法在目標定位的同時直接預測目標分類,YOLO系列網(wǎng)絡(luò)[10-12]是該類方法的典型代表。這類方法具有識別速度快的特點,能夠滿足實時性的要求,并且在準確性上也接近第一類方法的水平。隨著深度學習的不斷發(fā)展,研究人員發(fā)現(xiàn)目標檢測算法已經(jīng)能夠在高性能計算機上實現(xiàn)實時檢測。然而,將模型部署到嵌入式設(shè)備上時,存儲和計算方面依然存在問題。因此,輕量級網(wǎng)絡(luò)在計算機視覺領(lǐng)域引起了廣泛關(guān)注。以此為背景,Howard 等人[13]提出了MobileNetV1,這是一個輕量級的骨干網(wǎng)絡(luò),通過深度可分離卷積顯著減少了模型參數(shù)量。Zhang 等人[14]通過改進的YOLOv4 模型進行蘋果水果檢測,引入了帶有坐標注意模塊的GhostNet 特征提取網(wǎng)絡(luò),以及深度卷積來重建頸部和YOLO頭部結(jié)構(gòu),實現(xiàn)了高達95.72%的mAP,同時使得模型輕量化。Su 及其團隊[15]在溫室環(huán)境中采用輕量化的YOLOv3 模型,并結(jié)合輕量級網(wǎng)絡(luò),成功用于對番茄成熟度的分類檢測,取得了97.5%的mAP。輕量化的改進往往伴隨著檢測精度的降低,而注意力機制可以提高檢測的精度。在疾病識別領(lǐng)域,Li 等人[16]通過應(yīng)用混合注意力Atrous SpacePyramid Pool (ASPP)對DeepLab V3+進行優(yōu)化,實現(xiàn)了對黃瓜霜霉病和白粉病的精確分割和自動評估。Yang 等人[17]在YOLOv4 中添加了注意力模塊,提高了小麥穗計數(shù)的準確性。Cui 等人[18]通過將CBAM引入到自動編碼器中進行玉米葉病的分類任務(wù),在實驗室環(huán)境中從PlantVillage 識別玉米葉病,取得了99.44%的識別準確度,雖然具有較高的準確度,但是該研究只是在實驗環(huán)境中進行的分類任務(wù),不能精確反應(yīng)在真實農(nóng)田中的情況,相比于該研究,本文應(yīng)用了比較流行的YOLO模型進行玉米葉病害的目標檢測任務(wù),并針對在真實環(huán)境下的玉米葉數(shù)據(jù)集進行實驗,同時對數(shù)據(jù)集進行數(shù)據(jù)增強,而且對YOLOv7 模型采用了無參數(shù)、準確度高的SimAM 注意力,以及采取一系列更加先進的改進措施,具有更高的可靠性。上述研究表明,通過采用不同的策略優(yōu)化神經(jīng)網(wǎng)絡(luò)可以進一步提高識別準確性并減少模型參數(shù)量。常見的玉米葉病主要有玉米銹病、灰斑病、枯萎病,本文主要針對這三種常見的玉米葉病進行研究??紤]到不同玉米葉病害之間微小差異,建立一個在移動終端上實現(xiàn)快速且準確識別常見的玉米葉病害的模型仍然是一個巨大的挑戰(zhàn)。
為了在改進YOLOv7 目標檢測模型的同時減少模型參數(shù)量并提高檢測準確性和速度,本研究提出了一種改進后的YOLOv7 模型,命名為GSW-YOLOv7。該模型在保持較高性能的同時能夠準確識別常見玉米葉病害,彌補了當前研究所面臨的一些局限性。本文的貢獻可以總結(jié)如下:
(1)在本研究中,構(gòu)建了輕量級GS-ELAN結(jié)構(gòu)用于優(yōu)化YOLOv7 模型的頸部,減少模型參數(shù)量,使模型輕量化。
(2)為增強輕量級模型在常見玉米葉病害檢測中的準確性,引入了SimAM 注意力機制到網(wǎng)絡(luò)架構(gòu)中。SimAM注意力機制在不引入額外的參數(shù)的前提下提高模型的精度。
(3)將YOLOv7 算法模型中原始的CIoU 損失函數(shù)替換為WIoU 損失函數(shù)。該方法進一步提高了YOLOv7 的邊界框回歸精度和檢測精度。