王衛(wèi)星 劉澤乾 高 鵬 廖 飛 李 強 謝家興,3
(1.華南農(nóng)業(yè)大學電子工程學院(人工智能學院), 廣州 510642; 2.廣東省農(nóng)業(yè)技術(shù)推廣中心, 廣州 510520;3.廣東省智慧果園科技創(chuàng)新中心, 廣州 510642)
荔枝屬無患子科荔枝屬植物,富含礦物質(zhì)和維生素,味道鮮美,且荔枝果皮和種子具有潛在的藥用價值,在國際鮮果市場發(fā)揮著明顯競爭優(yōu)勢[1-4]。隨經(jīng)濟的快速發(fā)展,荔枝的需求量急速增加,其栽培品種和種植面積不斷擴大[2,4]。由于荔枝果樹栽培于高濕、高溫、多向陽的華南地區(qū),且不同品類的混合種植和栽培面積擴大,為蟲害和病菌的附著提供了絕佳場所,因此荔枝病蟲害也日益嚴重。荔枝病蟲害種類繁多,危害周期長、防治困難,成為影響荔枝產(chǎn)量和品質(zhì)的重要制約因素[5-6]。因此,利用高效準確的檢測技術(shù)對荔枝病蟲害進行防治,是提高荔枝產(chǎn)量和品質(zhì)的關(guān)鍵問題之一。
人工智能等現(xiàn)代信息技術(shù)是發(fā)展農(nóng)業(yè)現(xiàn)代化的必經(jīng)之路,大力推進其在農(nóng)業(yè)中的應(yīng)用有利于智慧農(nóng)業(yè)的發(fā)展[7]。目前計算機視覺是智慧農(nóng)業(yè)發(fā)展的重要組成部分,能夠?qū)Σ∠x害進行高效且精確的診斷防控[8-9]。ZHANG等[10]提出了DCPSNET (Dense channel and position self-attention fusion network) 模型,結(jié)合動力機制融合注意力方法,對6類臍橙病蟲害的識別準確率高達96.90%。李書琴等[11]提出了一種基于輕量級殘差網(wǎng)絡(luò),在Plant Village數(shù)據(jù)集上識別錯誤率為0.32%,并在自建蘋果葉片病害數(shù)據(jù)集上獲得了1.52%的低識別錯誤率。劉曉鋒等[12]提出了一種基于空間殘差收縮網(wǎng)絡(luò)的農(nóng)作物病蟲害識別模型,對Plant Village數(shù)據(jù)庫中4個農(nóng)作物病蟲害的分類精度達到99.41%。以上研究開展了計算機視覺技術(shù)對于農(nóng)作物病蟲害的分類識別研究,證明了基于深度學習的計算機視覺技術(shù)在農(nóng)作物病蟲害上的診斷防控是切實可行的,為深度學習廣泛應(yīng)用于病蟲害的檢測技術(shù)提供了參考。
自然環(huán)境下的識別任務(wù)中,荔枝病蟲害圖像背景往往是復(fù)雜的、非結(jié)構(gòu)的,并且圖像中有時還存在多種病蟲害目標。深度學習的高速發(fā)展,使得其能對病蟲害圖像中的病斑目標檢測定位,且具有準確、實時、無損等特點[13-15]。YUE等[16]提出了MSR-RCNN (Multi-scale super-resolution feature enhancement module) 多類作物害蟲檢測模型,在大規(guī)模燈誘害蟲數(shù)據(jù)集 (含26類共18 585幅圖像)取得準確率達67.4%的最佳性能。李子茂等[17]提出了TSDDP (Two stage detection of diseases and pests) 月季病蟲害檢測模型,最終檢測準確率達82.26%。李就好等[18]提出了基于改進Faster R-CNN的田間苦瓜葉部病害檢測模型,對4類苦瓜葉部病害和健康葉片的檢測準確率達到86.93%。LI等[19]集成了沙鐘特征提取模塊、深沙鐘特征提取模塊和空間金字塔池化模塊3種新模塊,提出了YOLO-JD (YOLO for jute diseases) 網(wǎng)絡(luò)模型,用于黃麻病蟲害圖像的檢測,平均準確率達96.63%。LYU等[20]提出了改進SSD模型,采用自頂向下的特征融合策略,對糧食害蟲小目標的平均準確率達96.89%。以上研究針對不同病蟲害的特點,分析各病蟲害的尺度差異以及各自自然環(huán)境下的復(fù)雜背景,結(jié)合需求提出了不同的深度學習檢測模型。但在自然環(huán)境下對農(nóng)作物病蟲害進行實時地檢測仍然存在局限,如MSR-RCNN害蟲檢測模型的數(shù)據(jù)集為燈誘害蟲圖像,還需進一步探究自然環(huán)境下,背景復(fù)雜的病蟲害檢測效果,以及YOLO-JD的沙鐘特征提取模塊計算成本較大,實時性還需進一步提高。
為了使用兼具速度和精度的檢測算法模型,研究者通常使用一階段的目標檢測方法,YOLO系列在該領(lǐng)域中通常有優(yōu)異的表現(xiàn)[21]。而目前對于復(fù)雜、非結(jié)構(gòu)背景下的荔枝病蟲害檢測研究較少,且荔枝病蟲害目標的尺度差異大,本文以YOLO v4[22]算法為基礎(chǔ),使用輕量化網(wǎng)絡(luò)GhostNet[23]作為主干網(wǎng)絡(luò),并改進模型的頸部結(jié)構(gòu)以使網(wǎng)絡(luò)不失精度的同時更輕量化,最終提出輕量級的荔枝病蟲害檢測模型,以期為林間荔枝病蟲害的快速診斷荔提供精確信息。
1.1.1圖像采集
荔枝病蟲害圖像采集地點為廣東省農(nóng)業(yè)技術(shù)推廣總站,設(shè)備為小米6、realme x、魅族16th、iphone 7plus、iphone 12等5種智能手機,時間為2021年7月11日至11月19日,時段為08:30—11:30和 14:30—17:30。為采集自然環(huán)境下不同尺度和光照強度下的圖像,拍攝時設(shè)備與病斑葉片距離為0.2~0.5 m,并在晴天、陰天和雨后3種不同天氣采集圖像,且包含背陽、向陽等角度,以還原實際場景下的檢測。試驗數(shù)據(jù)集均為自然環(huán)境下非結(jié)構(gòu)背景的荔枝病蟲害圖像,如圖1所示,病害包括煤煙病、炭疽病和藻斑病,蟲害包括毛氈病和葉癭蚊,共5種病蟲害,分辨率包括4 032像素×3 016像素和3 016像素×3 016像素等。最終采集到荔枝病蟲害圖像3 725幅。
圖1 荔枝病蟲害圖像
1.1.2數(shù)據(jù)集構(gòu)建
對上述3 725幅荔枝病蟲害圖像進行目標標注,標注工具為LabelImg。荔枝病蟲害圖像數(shù)據(jù)的訓練集、驗證集和測試集按照比例8∶1∶1劃分,數(shù)據(jù)集具體構(gòu)建方式見表1。
表1 荔枝病蟲害數(shù)據(jù)集
YOLO系列算法作為主流的一階段目標檢測模型,其兼具速度和精度的特點,使得研究者們能夠?qū)ζ浼右哉{(diào)整并部署于工程當中。YOLO v4的主干網(wǎng)絡(luò)Backbone使用了CSPDarknet53[24](Cross stage partial DarkNet) 進行特征提取,以最后3個特征圖作為頸部結(jié)構(gòu)Neck中特征融合網(wǎng)絡(luò)FPN[25](Feature pyramid networks) 和PANet[26](Path aggregation network)的輸入,經(jīng)過FPN和PANet進行特征增強后的3個特征圖將經(jīng)過檢測頭,得到每個特征圖的分類和定位信息,并利用其先驗框解碼進行非極大值抑制,最后獲得檢測結(jié)果。YOLO v4模型結(jié)構(gòu)如圖2所示。
圖2 YOLO v4模型結(jié)構(gòu)圖
以YOLO v4為基礎(chǔ),針對自然環(huán)境下復(fù)雜、非結(jié)構(gòu)背景的多尺度荔枝病蟲害目標,設(shè)計高效的荔枝病蟲害檢測模型,使用輕量化識別網(wǎng)絡(luò)GhostNet作為主干網(wǎng)絡(luò)提取特征,使用SPPF替換SPPP以加快檢測速度,并結(jié)合GhostNet中的核心思想和方法以更低成本的卷積代替?zhèn)鹘y(tǒng)卷積,降低模型計算成本,再對頸部結(jié)構(gòu)使用新的特征融合方法和注意力機制CBAM (Convolutional block attention module),提高模型的檢測準確率。利用上述方法的檢測模型構(gòu)建框架如圖3所示。
圖3 檢測模型框架
1.3.1GhostNet
GhostNet為輕量級的識別網(wǎng)絡(luò),擁有優(yōu)秀的特征提取效果[23],可作為檢測模型的主干網(wǎng)絡(luò),其核心Ghost Module有著對卷積操作進行輕量化的效果。本研究將以GhostNet為主干網(wǎng)絡(luò),并使用Ghost Module對頸部結(jié)構(gòu)做進一步優(yōu)化。
優(yōu)秀的深度卷積網(wǎng)絡(luò)充分收斂后,其信息豐富且冗余的特征圖是成功的關(guān)鍵,這些冗余特征應(yīng)該被提倡產(chǎn)生而不是避免其產(chǎn)生,且以更高效的方式實現(xiàn),即使用Ghost Module實現(xiàn)[23]。相比于普通的卷積,Ghost Module擁有更少的參數(shù)和計算量。Ghost Module將卷積分為2步,第1步對輸入使用1×1、個數(shù)為輸出通道數(shù)1/2的卷積核進行卷積操作,獲得特征圖。第2步對上述特征圖進行逐層卷積,相當于對上述特征圖進行簡單的線性操作以獲得冗余特征,最后將冗余特征圖與第1步的特征圖進行通道上的堆疊,作為Ghost Module的輸出。Ghost Module的結(jié)構(gòu)如圖4所示。
圖4 Ghost Module結(jié)構(gòu)圖
在一般卷積神經(jīng)網(wǎng)絡(luò)模型中,傳統(tǒng)卷積在無偏置下的參數(shù)量Npara可表示為
Npara=CInk2COut
(1)
式中CIn——輸入通道數(shù)
COut——輸出通道數(shù)
k——卷積核尺寸
由式(1)可知,Ghost Module所需參數(shù)量NG可表示為
(2)
若使用Ghost Module代替?zhèn)鹘y(tǒng)的卷積,則參數(shù)量的壓縮率可表示為
(3)
在卷積神經(jīng)網(wǎng)絡(luò)模型中,深層的特征圖往往具有很高的通道數(shù),因此在網(wǎng)絡(luò)模型深層可以認為式(3)中CIn+9≈CIn,則壓縮率可簡單表示為r≈2k2。
因此本文以GhostNet作為改進YOLO v4的主干網(wǎng)絡(luò),以更輕、更快的方式提取更優(yōu)的特征信息。并使用Ghost Module改進模型的頸部結(jié)構(gòu),進一步輕量化模型,加快模型對荔枝病蟲害的檢測速度。
1.3.2SPPF
SPPF模塊 (Spatial pyramid pooling-fast)為SPP模塊 (Spatial pyramid pooling) 的優(yōu)化,與SPP模塊等效但比SPP模塊更快,可以提取不同尺度的敏感信息,優(yōu)化多尺度目標的檢測效果。
SPP模塊[27]在YOLO v4中能一定程度上解決目標多尺度的問題。如圖5a所示為SPP模塊的結(jié)構(gòu)圖,圖中將不同尺度的最大池化分支并行,并Concat堆疊通道。SPPF模塊與SPP模塊等效但更加高效。如圖5b所示,SPPF將3個同樣尺度的最大池化串聯(lián),將每一個最大池化的輸出進行通道堆疊,2個5×5的最大池化串聯(lián)等效于1個9×9的最大池化,3個5×5的最大池化串聯(lián)等效于1個13×13的最大池化。顯然池化尺度越大需要更多的計算成本,將池化進行串聯(lián)能充分利用每個池化的輸出。因此使用SPPF模塊替換SPP模塊以提高模型檢測速度。
圖5 SPP和SPPF結(jié)構(gòu)圖
1.3.3注意力機制
CBAM (Convolutional block attention module)利用特征中通道與空間信息的注意力機制,能夠使模型關(guān)注重要特征,優(yōu)化模型的檢測效果。
CBAM[28]為一種輕量卷積注意力模塊,通過注意力機制模仿人類的視覺系統(tǒng),能夠增強網(wǎng)絡(luò)模型的表征能力,使模型能夠更加關(guān)注重要特征,抑制復(fù)雜背景中不必要的特征。CBAM利用特征間的通道關(guān)系和空間關(guān)系先后獲得通道注意圖和空間注意圖,并且將2個注意圖作用于CBAM的輸入上,實現(xiàn)特征在通道和空間上的增強,如圖6所示。CBAM極少的參數(shù)量和計算成本,使其能夠成為即插即用的模塊集成到網(wǎng)絡(luò)模型當中,因此添加該注意力機制,增強模型對復(fù)雜背景下荔枝病蟲害的檢測效果。
圖6 CBAM結(jié)構(gòu)圖
1.3.4改進YOLO v4的荔枝病蟲害檢測模型
在自然環(huán)境下的荔枝病蟲害檢測任務(wù)中,存在葉片反光等非結(jié)構(gòu)且復(fù)雜背景的影響。因此,為實現(xiàn)實時高效且精準的荔枝病蟲害檢測,以YOLO v4為基礎(chǔ)模型,使用GhostNet作為主干網(wǎng)絡(luò),并引入GhostNet中低計算成本的Ghost Module卷積,以此對YOLO v4的頸部結(jié)構(gòu)進行設(shè)計,以進一步輕量化模型。同時,將空間金字塔模塊SPP替換為SPPF,進一步提高模型的檢測速度。此外使用新特征融合方法 (Fusion of multi features),將主干網(wǎng)絡(luò)最后4層的輸出分別上下采樣至與倒數(shù)第3層輸出特征一致的尺寸,并堆疊通道作為頸部結(jié)構(gòu)的輸入之一,再添加一支下采樣支路堆疊到FPN中向上路徑的倒數(shù)第2層中,添加主干網(wǎng)絡(luò)倒數(shù)第4層的特征是為了利用其高細粒度和細節(jié)信息,提高模型對荔枝病蟲害中小目標的檢測精度。在頸部結(jié)構(gòu)中,添加了注意力機制CBAM進一步提高模型對荔枝病蟲害多尺度目標的檢測精度。最終,改進的YOLO v4-GCF模型結(jié)構(gòu)如圖7所示。
圖7 YOLO v4-GCF檢測模型和ConvSet模塊結(jié)構(gòu)圖
圖7中,G-M表示Ghost Module卷積操作,在ConvSet3和ConvSet5中對卷積核尺寸為3×3的卷積進行了替換,且Ghost Module中前后2個卷積,以及ConvSet3和ConvSet5中每個卷積之后均使用批量歸一化和ReLU6激活函數(shù)。
1.4.1模型訓練環(huán)境與參數(shù)設(shè)置
本文試驗所使用的硬件設(shè)備配置包括Inter(R) Xeon(R) Gold 6240 CPU@2.59 GHz處理器,192 GB運行內(nèi)存,NVIDIA GeForce GTX 3090Ti*2顯卡,24 GB顯存。軟件環(huán)境為Windows 10操作系統(tǒng),Pycharm 2021.3.3,Python 3.8.10,CUDA 11.1,CuDNN 8.0.5,深度學習框架為Pytorch 1.8.0。
為加速模型訓練時的收斂速度,采取遷移學習的方式使用GhostNet主干網(wǎng)絡(luò)的預(yù)訓練權(quán)重對改進YOLO v4的模型進行構(gòu)建。所有輸入圖像分辨率將被統(tǒng)一縮放至416像素×416像素,并以0.5的概率使用Mosaic數(shù)據(jù)增強,為保證圖像不失真,在后30%訓練次數(shù)中不使用數(shù)據(jù)增強。訓練過程中,初始學習率設(shè)置為0.000 1,使用Adam優(yōu)化器調(diào)整學習率,迭代次數(shù)為200,前50次凍結(jié)主干網(wǎng)絡(luò)并將批量大小設(shè)置為64,后150次解凍主干網(wǎng)絡(luò)并將批量大小設(shè)置為32。對完成訓練的模型在測試集進行性能測試時,交并比(IoU)閾值設(shè)置為0.5,預(yù)測結(jié)果采用非極大值抑制 (Non-maximum suppression, NMS),NMS的IoU閾值同樣設(shè)置為0.5。
1.4.2評價指標
以單幅圖像檢測用時 (Detection time per image) 作為模型檢測速度的評價指標,以平均精度 (Average precision, AP) 作為模型檢測各類別荔枝病蟲害精度的評價指標。其中精度與模型檢測時的準確率 (Precision) 和召回率 (Recall) 有關(guān),由某個類別在給定IoU閾值下的準確率和召回率所繪制的曲線面積表示。
為驗證利用GhostNet主干網(wǎng)絡(luò)進行特征提取的有效性,并結(jié)合GhostNet中以更低計算成本的卷積操作獲得特征的方法,利用Ghost Module對YOLO v4的頸部結(jié)構(gòu)中部分傳統(tǒng)卷積進行替換,使模型整體進一步輕量化,加快模型的檢測速度。本研究對模型檢測的用時驗證除了圖像在模型中的推理過程用時,還包括圖像的預(yù)處理以及后處理,以還原真實情況下單幅圖像從初始狀態(tài)下到獲得檢測結(jié)果的實際用時。并在測試集上驗證各模型對荔枝病蟲害的檢測平均精度。以GhostNet作為主干網(wǎng)絡(luò)以及Ghost Module使用情況對比結(jié)果如表2所示。其中YOLO v4-G1為僅使用GhostNet主干網(wǎng)絡(luò),頸部結(jié)構(gòu)不變的模型;YOLO v4-G2為使用GhostNet主干網(wǎng)絡(luò)后,利用Ghost Module替換所有3×3和部分1×1傳統(tǒng)卷積的模型(具體替換情況見圖7);YOLO v4-G3為使用GhostNet主干網(wǎng)絡(luò)后,利用Ghost Module替換所有傳統(tǒng)卷積的模型。
表2 Ghost Module使用情況對比結(jié)果
由表2可知,相比原始YOLO v4,以GhostNet作為主干網(wǎng)絡(luò)的YOLO v4-G1不僅模型內(nèi)存占用量縮小約100 MB,檢測速度提升約25.4%,并且檢測平均精度提升3.63個百分點。利用Ghost Module將頸部結(jié)構(gòu)中的傳統(tǒng)卷積進行替換的YOLO v4-G2和YOLO v4-G3分別將模型內(nèi)存占用量縮小為36.586 MB和31.788 MB,檢測速度也進一步提升約20.4%和22.4%。雖然YOLO v4-G3相對更輕更快,但檢測平均精度與YOLO v4-G1相比降低1.68個百分點,檢測精度降幅過大。而YOLO v4-G2的檢測精度下降0.56個百分點,仍兼具輕和快的優(yōu)點,更適合用于實時地對荔枝病蟲害進行檢測。因此本文以YOLO v4-G2 (以下簡稱YOLO v4-G) 作為荔枝病蟲害檢測所需模型,并作進一步改進。
為驗證所提出改進模型的有效性,在相同平臺和參數(shù)設(shè)置的情況下,分別在訓練集、驗證集和測試集上進行消融試驗,驗證各改進模型的檢測精度。本研究對YOLO v4-G的改進模型包括添加注意力機制CBAM的YOLO v4-GC (YOLO v4-G with CBAM) 、使用新特征融合方法的YOLO v4-GF (YOLO v4-G with fusion of multi features),以及同時添加注意力機制和使用新特征融合方法的YOLO v4-GCF (YOLO v4-G with CBAM and fusion of multi features)。消融試驗對比結(jié)果如表3所示。
表3 消融試驗對比結(jié)果
由表3可知,與YOLO v4-G相比,YOLO v4-GC盡管在測試集中的平均精度沒有優(yōu)異表現(xiàn),但在保證檢測速度和模型內(nèi)存占用量不作犧牲的情況下,對訓練集和驗證集的平均精度分別提升0.65、0.92個百分點;YOLO v4-GF同樣在保證一定程度下的檢測速度和模型內(nèi)存占用量,在訓練集、驗證集和測試集上檢測平均精度均獲得提升,分別為0.65、0.89、0.69個百分點;而YOLO v4-GCF在模型檢測速度和模型內(nèi)存占用量方面僅做微小損失,在訓練集、驗證集和測試集上對荔枝病蟲害的檢測平均精度分別提升1.15、1.16、1.06個百分點。相比于YOLO v4網(wǎng)絡(luò)模型,最終改進模型YOLO v4-GCF不僅在測試集上的平均精度提升4.13個百分點,且檢測速度提升約38%和模型內(nèi)存占用量縮小約84%。
為更直觀比較各改進方法對荔枝病蟲害的檢測效果,在測試集中取不同模型對荔枝病蟲害的檢測圖像進行對比。圖8為各模型對每類荔枝病蟲害的檢測效果,圖9為YOLO v4、YOLO v4-G和YOLO v4-GCF在不同實際場景下對荔枝病蟲害的檢測效果。
圖8 不同模型對每類荔枝病蟲害的檢測效果
圖9 不同實際場景下不同模型的檢測效果
由圖8可知,YOLO v4在每類荔枝病蟲害中均存在漏檢的情況。對于毛氈病,因葉片反光的影響,YOLO v4-G和YOLO v4-GF會對毛氈病斑漏檢,而YOLO v4-GC和YOLO v4-GCF能更準確檢測出其病斑,證實注意力機制CBAM對毛氈病特征檢測的有效性。對于藻斑病,YOLO v4-G存在漏檢,YOLO v4-GC和YOLO v4-GF對葉尖的藻斑病斑誤檢為常表現(xiàn)于葉尖的炭疽病,而YOLO v4-GCF能夠準確檢測出葉尖的藻斑病斑。對于葉癭蚊和煤煙病,YOLO v4-GC和YOLO v4-GF也出現(xiàn)類似漏檢情況,而YOLO v4-GCF能夠準確檢測出葉癭蚊早期病斑和煤煙病斑。對于炭疽病,YOLO v4-G存在漏檢,YOLO v4-GC、YOLO v4-GF和YOLO v4-GCF能夠準確檢測炭疽病斑。以上不同模型對每類荔枝病蟲害的檢測效果對比均說明新特征融合方法和注意力機制CBAM共同作用下的有效性。
由圖9可知,前3列展示了雨后場景下不同模型對毛氈病、藻斑病和葉癭蚊的檢測效果,因葉片上的水易反光,且水珠與葉癭蚊病斑相似,易對模型的檢測造成影響而發(fā)生漏檢、誤檢的現(xiàn)象。而YOLO v4-GCF能夠相對更好地抑制葉片上水的影響,對第1列中的毛氈病、第2列中水珠覆蓋下的藻斑病和第3列中易與水珠混淆的葉癭蚊檢測精準。圖9后3列展示了單幅圖像中存在不同荔枝病蟲害情況下不同模型的檢測效果,第4列中YOLO v4將褐色枝干誤檢為炭疽病且存在漏檢,YOLO v4-G未誤檢但仍存在漏檢,YOLO v4-GCF則能夠準確檢測出圖像中的藻斑病和炭疽病。第5列中不僅葉片反光程度大且存在不易注意到的藻斑病小目標,YOLO v4和YOLO v4-G均出現(xiàn)漏檢,YOLO v4-GCF則能夠準確檢測出圖像中的毛氈病和藻斑病。第6列YOLO v4和YOLO v4-G均出現(xiàn)漏檢且YOLO v4檢測區(qū)域過大,將大量非病斑區(qū)域作為病斑部分檢測為炭疽病,YOLO v4-GCF則能夠更準確檢測出圖像中的炭疽病和藻斑病。
為探究其他不同模型對荔枝病蟲害的檢測性能,以及驗證所提出改進網(wǎng)絡(luò)模型YOLO v4-GCF在復(fù)雜且非結(jié)構(gòu)背景下對荔枝病蟲害檢測的有效性,在相同條件下使用YOLO v4、YOLO v4-tiny、EfficientDet-d2、Faster R-CNN與所提出的YOLO v4-GCF進行比較。不同模型在測試集的檢測平均精度等性能結(jié)果如表4所示。
表4 不同模型性能對比
由表4可知,相比于其他模型,提出的YOLO v4-GCF檢測平均精度比YOLO v4、YOLO v4-tiny、EfficientDet-d2和Faster R-CNN分別高4.13、17.67、12.78、25.94個百分點。由于在自然環(huán)境獲取的荔枝病蟲害圖像背景復(fù)雜,以上常用模型難以提取有效特征,檢測的平均精度相比本研究提出的YOLO v4-GCF要低得多。
提出的YOLO v4-GCF荔枝病蟲害檢測模型相比改進前的YOLO v4,模型內(nèi)存占用量縮小84%,檢測速度提升38%,在測試集中檢測平均精度提升4.13個百分點,且相較于其他常用檢測模型,YOLO v4-GCF在復(fù)雜背景荔枝病蟲害擁有更高的檢測精度和更快的檢測速度,更適用于實際場景下的實時檢測任務(wù)。
(1)提出了一種基于改進YOLO v4的荔枝病蟲害檢測模型YOLO v4-GCF,使用輕量化網(wǎng)絡(luò)GhostNet作為主干網(wǎng)絡(luò)提取荔枝病蟲害特征,并使用Ghost Module替換YOLO v4頸部結(jié)構(gòu)中的傳統(tǒng)卷積,提出更輕更快的檢測模型YOLO v4-G。在此基礎(chǔ)上使用新特征融合方法和注意力機制CBAM對YOLO v4-G模型進行改進,在不失檢測速度的情況下提高荔枝病蟲害的檢測精度,最終提出YOLO v4-GCF模型。
(2)構(gòu)建了自然環(huán)境下復(fù)雜、非結(jié)構(gòu)背景的荔枝病蟲害數(shù)據(jù)集,用于進行模型的對比試驗,所提出的YOLO v4-GCF模型在訓練集、驗證集和測試集的檢測平均精度分別為95.31%、90.42%和89.76%,單幅圖像檢測用時0.167 1 s,模型內(nèi)存占用量為39.574 MB,在檢測精度和檢測速度上優(yōu)于常用的檢測模型,具有較高應(yīng)用價值,能夠為后續(xù)自然環(huán)境下復(fù)雜、非結(jié)構(gòu)背景的農(nóng)作物病蟲害檢測研究提供參考。