国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合多尺度特征的遮擋番茄病害圖像識別研究

2024-12-31 00:00:00黃曉宇張聰陳曉玲
中國農(nóng)機化學(xué)報 2024年7期
關(guān)鍵詞:多尺度

摘要:針對復(fù)雜環(huán)境下因葉片重疊遮擋以及目標(biāo)較小等原因而導(dǎo)致番茄病害識別準(zhǔn)確率較低的問題,提出一種多尺度級聯(lián)模型(IMS-Cascade)。該模型以級聯(lián)神經(jīng)網(wǎng)絡(luò)(Cascade R-CNN)為基礎(chǔ),在主干網(wǎng)絡(luò)中引入融合上下文信息的可切換空洞卷積,使用復(fù)雜的多尺度卷積核提取目標(biāo)特征,解決同種病害因葉片遮擋而形狀差異較大的問題,并在特征融合網(wǎng)絡(luò)中添加反饋連接模塊,使模型可以進行多次的特征提取,提高淺層信息的利用率。最后在損失函數(shù)上增大準(zhǔn)確樣本的梯度,降低異常樣本對模型的影響。將該模型用于Plant Village公開發(fā)表的部分番茄葉病害數(shù)據(jù)集上,mAP達到89.1%,平均準(zhǔn)確率達到99.36%,分別比原始Cascade R-CNN模型提高2.5%和1.84%,具有更高檢測精度,有利于復(fù)雜環(huán)境下的番茄病害檢測。

關(guān)鍵詞:番茄病害檢測;反饋連接;特征金字塔網(wǎng)絡(luò);空洞卷積;多尺度

中圖分類號:S436.412; TP391.4

文獻標(biāo)識碼:A

文章編號:20955553 (2024) 070194 07

Research on image recognition of shaded tomato diseases based on multi-scale feature fusion

Huang Xiaoyu1, Zhang Cong2, Chen Xiaoling1

(1. School of Mathematics and Computer Science, Wuhan Polytechnic University, Wuhan, 430023, China;

2. School of Electrical and Electronic Engineering, Wuhan Polytechnic University, Wuhan, 430023, China)

Abstract:

Aiming at the problems of low accuracy of tomato disease identification due to overlapping leaves and small targets in complex environments, a multi-scale cascade model (IMS-Cascade) is proposed. The model is based on cascade neural network (Cascade R-CNN), the switchable Atrous convolution of fused context information is introduced into the backbone network, and complex multi-scale convolution kernels are used to extract target features to solve the problem that the shape of the same disease is greatly different due to leaf occlusion, and the feedback connection module is added to the feature pyramid networks, so that the model can extract features for many times and improve the utilization of shallow information. Finally, the gradient of accurate samples is increased in the loss function to reduce the influence of abnormal samples on the model. When the model is applied to a portion of the tomato leaf disease dataset published by Plant Village, the mean average precision (mAP) reaches 89.1% and the average precision reaches 99.36%. These results represent improvements of 2.5% and 1.84%, respectively, over the original Cascade R-CNN model. This indicates higher detection accuracy, which is beneficial for tomato disease detection in complex environments.

Keywords:

tomato disease detection; feedback connection; feature pyramid networks; dilated convolution; multi-scale

0 引言

我國是世界最大的番茄生產(chǎn)和消費國家,但是受各種環(huán)境因素的影響,番茄病害頻頻發(fā)生,成為威脅番茄產(chǎn)量的主要因素。由于病害的種類繁多,人工識別耗時又耗力,因此能夠快速準(zhǔn)確地檢測番茄病害變得至關(guān)重要。早期的研究方法主要圍繞傳統(tǒng)的機器學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò),Gulhane等[1]提取了病斑的顏色和形狀特征,將原始特征圖與前饋人工神經(jīng)網(wǎng)絡(luò)相結(jié)合來識別棉花葉片病害。黎振等[2]將K-means分割與遷移學(xué)習(xí)相結(jié)合,對有背景干擾的番茄病害葉片進行識別,通過降噪處理和K-means分割簡化突出圖像特征。而近年來,目標(biāo)檢測技術(shù)取得了顯著的突破,正逐步應(yīng)用于農(nóng)作物病害。Zhang等[3]對目標(biāo)檢測模型中主干網(wǎng)絡(luò)進行了改進,并使用混合增強的數(shù)據(jù)集提高模型的魯棒性。郭小清等[4]針對不同時期同種番茄病害的不同癥狀,以及病害相似的問題,使用不同尺度的卷積核建立基于AlexNet的多感受野識別模型,識別準(zhǔn)確率達到了88.2%。Zhang等[5]將Faster R-CNN主干網(wǎng)絡(luò)替換為深度殘差網(wǎng)絡(luò),并利用K-means算法對anchor進行改進,識別準(zhǔn)確率提高了2.71%。張寧等[6]在InceptionV3網(wǎng)絡(luò)中引入注意力機制和多尺度卷積,提高番茄病害的信息表達,抑制了無效信息的干擾。

但目前已有的目標(biāo)檢測模型,在面臨復(fù)雜環(huán)境下番茄葉片遮擋重疊而導(dǎo)致同類病害形狀差異較大等問題時,容易導(dǎo)致檢測精度下降。同時在特征提取的過程中容易忽略小目標(biāo)特征的重要性以及異常樣本對模型的影響。針對以上情況,本文提出一種IMS-Cascade模型,引入反饋機制和可切換空洞卷積(Switchable Atrous Convolution,SAC),并在損失函數(shù)上進行改進,最后使用該模型對番茄瘡痂病、晚疫病、葉霉病進行識別,驗證模型的有效性。

1 級聯(lián)神經(jīng)網(wǎng)絡(luò)

一般情況下提高目標(biāo)檢測精確度最常見的方式便是增大界定正負(fù)樣本的IOU閾值,但閾值過高可能會出現(xiàn)過擬合的情況,閾值過小會增大誤檢的概率。Cascade R-CNN[7]作為一個二階段目標(biāo)檢測模型,由Faster R-CNN改進而來[8],其核心是使用不同的IOU閾值來訓(xùn)練多個級聯(lián)的檢測器,每個階段的檢測器重點檢測IOU在不同范圍內(nèi)的候選框,可以使前一個階段訓(xùn)練過的候選框樣本,能更好地適應(yīng)后一個有更高閾值要求的檢測器,最終輸出更高精度的候選框,在提高精度的同時也降低過擬合出現(xiàn)的情況[9]。

因其特征金字塔網(wǎng)絡(luò)[10](Feature Pyramid Network,F(xiàn)PN)的構(gòu)造,Cascade R-CNN在特征融合的過程中容易丟失淺層的小目標(biāo)特征,并且所使用的損失函數(shù)Smooth L1 Loss為了防止梯度爆炸而對異常值不敏感。而在遮擋情況下番茄葉病中會有較多小目標(biāo),所以該網(wǎng)絡(luò)仍存在著檢測小目標(biāo)時錯檢和漏檢的問題。

2 多尺度級聯(lián)模型

本文提出的IMS-Cascade模型結(jié)構(gòu)如圖1所示,輸入圖片首先通過特征提取網(wǎng)絡(luò)中的SAC提取圖像特征圖,經(jīng)過改進的級聯(lián)特征金字塔網(wǎng)絡(luò)進行特征增強后,將特征圖送入到區(qū)域生成網(wǎng)絡(luò)(Region Proposal Network,RPN)中區(qū)分前、后景,篩選出建議區(qū)域,并映射到原圖上生成較為準(zhǔn)確的RoI(Region of Interesting),送入到RoI Align層中池化[11],將其轉(zhuǎn)變?yōu)楣潭ňS度的特征后,通過全連接層進行訓(xùn)練和回歸,利用探測分類概率(Softmax Loss)和優(yōu)化后的位置損失函數(shù)進行目標(biāo)物體的類別分類和回歸定位,并使用多個級聯(lián)檢測器進行重采樣,提高分類和回歸的精確度。本文將分別介紹模型中的級聯(lián)特征金字塔網(wǎng)絡(luò)、SAC與損失函數(shù)的優(yōu)化方法。

2.1 可切換的空洞卷積

在FPN中,為將深層與淺層特征融合,需要對深層特征進行上采樣的操作,擴大圖像尺寸,那么在圖像尺寸縮小又?jǐn)U大的過程中,必定會丟失部分信息,降低空間分辨率[12]。空洞卷積可以擴大感受野,但其中部分是由0來填充的,而使用這部分的像素進行卷積會造成稀疏采樣,損失信息的連續(xù)性,并且若使用相同空洞率的空洞卷積進行連續(xù)堆疊時,會出現(xiàn)網(wǎng)格效應(yīng)的情況,若為了檢測大目標(biāo)而使用較大空洞率也不利于提取部分小目標(biāo)特征。

在番茄葉霉病數(shù)據(jù)集中,病區(qū)形狀面積差異較大,為了減少特征丟失,本文對主干網(wǎng)絡(luò)ResNet50中的3×3卷積層進行了修改,對于相同的輸入特征使用多個不同大小的空洞率進行卷積,能更有效地檢測出不同比例的同類目標(biāo)。同時在卷積層的最后還引入了一種注意力機制的切換函數(shù)對多個卷積結(jié)果進行加權(quán)和,計算卷積結(jié)果。主干網(wǎng)絡(luò)中所替換的卷積層具體結(jié)構(gòu)如圖2所示,中間是SAC組件,使用了空洞率分別為1和3的卷積,空洞率為1的卷積相當(dāng)于原始的3×3卷積。卷積后通過切換函數(shù)自適應(yīng)的選擇哪個空洞率下的卷積結(jié)果,保留信息量更大的通道特征。為了使切換函數(shù)可以較為準(zhǔn)確地計算出各個卷積層結(jié)果所占的份額,本文還添加了用來捕捉全局信息的上下文模塊,通過全局平均池化對輸入特征進行處理,得到特征圖的全局壓縮特征量后,再通過1×1卷積進行融合,得到圖像級特征,在SAC組件的前后都添加一個全局上下文模塊,可以使切換函數(shù)和卷積層都能獲取到圖像級特征,做出更穩(wěn)定的選擇,提高檢測性能。

SAC的計算過程可以用式(1)來表示。

Conv(x,w,1)=

S(x)×Conv(x,w,1)+[1-S(x)]×Conv(x,w+Δw,r)

(1)

式中:

Conv(x,w,r)——卷積操作;

r——空洞卷積的空洞率;

x——輸入;

w——權(quán)重;

Δw——可學(xué)習(xí)的權(quán)重參數(shù);

S(x)——切換函數(shù)。

其中S(x)由5×5的平均池化層和1×1卷積層組成,用來計算分別從空洞率為1和3的卷積結(jié)果中融合多少份額的特征。Cascade R-CNN模型使用的是ImageNet模型的預(yù)訓(xùn)練權(quán)重,空洞率為1的卷積使用該權(quán)重,空洞率為3的卷積使用預(yù)訓(xùn)練權(quán)重來初始化缺失的權(quán)重,將空洞率為1的卷積權(quán)重設(shè)置為w,空洞率為3的卷積權(quán)重設(shè)置為w+Δw,Δw初始化為0,通過后續(xù)訓(xùn)練進行權(quán)重更新。

2.2 級聯(lián)特征金字塔網(wǎng)絡(luò)

Cascade R-CNN相較Faster R-CNN模型,添加了FPN,將主干網(wǎng)絡(luò)中的深層強語義低分辨率特征與淺層淺語義高分辨率的特征進行融合,彌補淺層特征語義抽象不足的問題。由于病害初期病區(qū)面積較小,為了能夠充分的利用淺層特征信息,本文在FPN中添加了反饋機制[13],將每一層融合后的特征圖通過連接模塊反饋到同層自底向上的主干網(wǎng)絡(luò)中,同時也融合到最終輸出的特征圖上,在提高訓(xùn)練速度的同時還可以提高目標(biāo)檢測的準(zhǔn)確率。改進的FPN結(jié)構(gòu)如圖3所示。

輸入圖片首先通過主干網(wǎng)絡(luò)卷積得到C1~C6特征圖,C1提取效果較差且占用內(nèi)存過大,因此不參與后續(xù)的操作。C6通過上采樣的方式經(jīng)過1×1卷積進行降維操作,得到處理后的特征圖M6,確保與下一層的淺層特征圖相同。再將M6與經(jīng)過1×1卷積后的C5拼接得到特征圖M5,重復(fù)執(zhí)行上述操作可得到M4、M3、M2,將融合后的M層特征圖經(jīng)過3×3卷積消除上采樣帶來的混疊效應(yīng),得到與C層特征圖大小相同的P2~P6特征圖,最后把P層特征圖組成的特征金字塔使用反饋連接模塊R反饋到同層的主干網(wǎng)絡(luò)中,使主干網(wǎng)絡(luò)再次對融合后的特征圖進行特征提取,以達到多次多尺度查看圖像的效果。最后將兩次特征提取的結(jié)果利用融合模塊連接后輸出到后續(xù)的RPN網(wǎng)絡(luò)中。

該過程可以用式(2)來描述。

fti=Fti(fti+1,xti),xti=Bti(xti-1,Rti(ft-1i))

(2)

式中:

i——階段數(shù),i=[1,6];

t——迭代次數(shù),t=[1,T];

T——迭代總次數(shù);

fti——

第t次迭代第i層輸出的特征;

Bti——第t次迭代主干網(wǎng)絡(luò)的階段數(shù);

Fti——第t次迭代特征融合的階段數(shù);

Rti——

fti經(jīng)過特征變換后得到的特征;

xti——

第t次迭代主干網(wǎng)絡(luò)第i層的輸出特征圖;

x0——輸入圖像。

2.2.1 反饋連接模塊

為實現(xiàn)級聯(lián)操作,將輸入圖片和反饋特征圖進行連接,還需要對主干網(wǎng)絡(luò)的結(jié)構(gòu)進行修改。本文使用空洞空間卷積池化金字塔(Atrous Spatial Pyramid Pooling,ASPP)[14]作為反饋連接模塊R,以不同的比例捕捉不同尺度下圖像的上下文信息。ASPP主要采用不同空洞率的空洞卷積對反饋特征圖進行卷積,獲取全局特征,擴大感受野,并將卷積結(jié)果融合到一張圖像上,達到高效準(zhǔn)確捕捉多尺度信息的目的,在不影響特征圖識別精度的條件下將其轉(zhuǎn)換為主干網(wǎng)絡(luò)可以接收的特征。

反饋連接模塊R共有4個并行分支來接收輸入特征fti,前3個分支由一個卷積層和Relu層構(gòu)成,卷積核大小分別為[1,3,3],空洞率為[1,3,6],填充為[0,3,6],確保每一個分支輸出的特征維度都是輸入特征fti的1/4,輸出通道數(shù)是輸入通道數(shù)的1/4。最后1個分支由1個全局平均池化層、一個1×1卷積層和一個Relu層構(gòu)成,首先通過全局平均池化層壓縮特征,再由1×1卷積層和Relu層將壓縮后的特征變換為原始特征通道大小的1/4。最后將經(jīng)過4個分支處理后的特征沿著通道維度連接,通過1×1卷積降低通道數(shù),得到一個與輸入特征尺寸大小相同的特征,形成最終的輸出R(f)。

2.2.2 融合模塊

FPN輸出特征圖的尺寸是固定的,因此在FPN的最后,還需要添加融合模塊,將fti與t+1次迭代同層得出的ft+1i結(jié)合,作為t+1次迭代第i層的fi值。融合模塊首先通過一個1×1的卷積層和Sigmoid函數(shù)對輸出特征ft+1i進行操作,生成一個數(shù)值位于0~1之間的注意力權(quán)重α,用于對fti和ft+1i進行權(quán)重融合,選擇兩個輸出特征中的哪些部分將更新成為下一個階段的fi,且FPN最終的輸出結(jié)果也是通過融合模塊連接多次特征提取的輸出結(jié)果。

2.3 損失函數(shù)優(yōu)化

目標(biāo)檢測的損失函數(shù)是一個多任務(wù)的損失函數(shù),分為目標(biāo)分類損失和目標(biāo)定位損失。

Lp,u,tu,v=Lcls(p,u)+λ[u≥1]Lloc(tu,v)

(3)

式中:

Lcls——目標(biāo)分類損失;

Lloc——目標(biāo)定位損失;

λ——調(diào)整兩個任務(wù)的權(quán)重參數(shù);

p——預(yù)測值;

u——真實值;

tu——類別u的位置回歸結(jié)果;

v——位置回歸目標(biāo)。

因此平衡損失最常規(guī)的一個方法就是通過調(diào)整λ來調(diào)整兩個損失的權(quán)重。

Cascade R-CNN網(wǎng)絡(luò)中目標(biāo)分類的損失函數(shù)是Smooth L1 Loss,如式(4)所示。

SmoothL1(x)=

0.5x2if xlt;1

x-0.5otherwise

(4)

x=x′-xgt

式中:

x′——模型預(yù)測的物體坐標(biāo);

xgt——物體的真實坐標(biāo)。

兩個坐標(biāo)都是四點向量,表示物體框4個角的坐標(biāo)位置。其核心思想是:當(dāng)預(yù)測框和真實框的差別較大,也就是x≥1時,為使梯度保持穩(wěn)定,便會以恒定的速率進行梯度下降,降低梯度爆炸的可能性;當(dāng)預(yù)測框和真實框的差別較小,也就是xlt;1時,便會自適應(yīng)地進行動態(tài)調(diào)整。因此Smooth L1 Loss在訓(xùn)練時的梯度變化較小,對異常值不敏感,使得訓(xùn)練不容易跑飛。Smooth L1 Loss的梯度如式(5)所示。

SmoothL1x=

xif xlt;1

±1otherwise

(5)

但是在訓(xùn)練過程中發(fā)現(xiàn),由于個別番茄葉霉病的病區(qū)與地面的背景顏色較為相似,部分測試集樣本會把靠近地面的區(qū)域誤判成葉霉病,這一部分異常值會被當(dāng)作困難樣本。在目標(biāo)定位任務(wù)中,如果簡單樣本的權(quán)重過高,則會消除困難樣本產(chǎn)生的較大梯度值,使得訓(xùn)練模型由簡單樣本主導(dǎo),進而導(dǎo)致訓(xùn)練任務(wù)難以收斂。困難樣本雖然有利于提高檢測的性能,但是權(quán)重過高就會產(chǎn)生很大的梯度來阻礙訓(xùn)練[15]。本文為了平衡不同任務(wù)之間的關(guān)系,降低異常值的影響力,因此對梯度公式進行了修改,增大準(zhǔn)確樣本在訓(xùn)練過程中的重要程度,修改后的梯度如式(6)所示。

Llocx=

αln(bx+1)if xlt;1

γotherwise

(6)

式中:

α——增大準(zhǔn)確樣本的梯度;

b——偏置;

γ——調(diào)整目標(biāo)定位任務(wù)誤差的上界。

本文中α默認(rèn)為0.5,γ默認(rèn)為1.5,當(dāng)x=1時,αln(b+1)=γ。修改后的損失函數(shù)如式(7)所示。

Lloc(x)=

αb(bx+1)ln(bx+1)-αxif xlt;1

γx+Cotherwise

(7)

式中: C——常數(shù)。

3 試驗與結(jié)果分析

3.1 評價指標(biāo)

本文選取了多項評價指標(biāo)對模型進行評估,包含各類病害的識別準(zhǔn)確率、損失值、FPS(每秒傳輸幀數(shù)),并將平均精度均值(Mean Average Precision,mAP)作為評估模型性能的重要指標(biāo)[16]。平均精準(zhǔn)度(Average Precision,AP)是由召回率(Recall)為橫坐標(biāo)、精準(zhǔn)率(Precision)為縱坐標(biāo)所繪的某一個類別的P-R曲線下的面積而計算得成,mAP是所有類別AP的平均值,mAP越大則模型的檢測精度越高,精準(zhǔn)率和召回率的計算如式(8)、式(9)所示。

Precision=TPTP+FP

(8)

Recall=TPTP+FN

(9)

式中:

TP——被分對為正樣本;

TN——被分對為負(fù)樣本;

FP——被錯分為正樣本;

FN——被錯分為負(fù)樣本。

其中TP+FP=所有預(yù)測框的數(shù)量[17]。

3.2 試驗數(shù)據(jù)

本文選用美國農(nóng)業(yè)組織Plant Village所公開發(fā)布的番茄病害數(shù)據(jù)集,一共包含了38種類別標(biāo)簽的50 000多張圖片,部分樣本信息如圖4所示。本文從中選取了含有小目標(biāo)以及葉片卷曲而造成陰影遮擋的三類病害圖像:番茄瘡痂病、番茄晚疫病、番茄葉霉病,每類圖片各500張,再經(jīng)過特征增強及旋轉(zhuǎn)處理后擴增到3 480張,圖像大小為256像素×256像素,并采用LabelImg軟件對每一張圖片進行了手工語義增強[18]。選取3 000張圖片作為訓(xùn)練數(shù)據(jù)集,每類各1 000張,480張圖片作為測試數(shù)據(jù)集,每類各160張。

3.3 試驗環(huán)境與試驗設(shè)置

本文試驗使用Pytorch1.7.0框架,Win10操作系統(tǒng),Python3.7版本,處理器為4.2 GHz的Intel Core i7-6700K,GPU為NVIDIA GeForce RTX 1080。

試驗過程中,主干網(wǎng)絡(luò)選用ResNet50,并且采用ImageNet模型的預(yù)訓(xùn)練權(quán)重。參數(shù)優(yōu)化器采用隨機梯度下降(Stochastic Gradient Descent,SGD)[19],動量參數(shù)設(shè)置為0.9,分類損失函數(shù)采用交叉熵?fù)p失函數(shù)。batch size為2,為降低batch size過小而帶來的影響,本文使用分組歸一化(Group Normalization,GN)[20],來加快模型收斂速度。初始學(xué)習(xí)率設(shè)置為0.002,在前500次迭代時學(xué)習(xí)率以1/500的增長率線性增長,迭代500次后學(xué)習(xí)率穩(wěn)定在初始設(shè)定值,并在迭代第111 000次和第120 000次后分別將學(xué)習(xí)率降低90%,共迭代198 000次。

3.4 試驗結(jié)果與分析

為驗證本文提出的IMS-Cascade模型對于復(fù)雜環(huán)境下的番茄病害的識別效果更好,故而選取了目標(biāo)檢測常用基礎(chǔ)模型Faster R-CNN、單階段檢測模型中綜合性能較好的RetinaNet[21]、原始模型Cascade R-CNN與IMS-Cascade模型進行對比試驗。并且采用消融試驗,驗證級聯(lián)特征金字塔網(wǎng)絡(luò)和SAC對于番茄病害檢測的有效性。

3.4.1 消融試驗

本文將原始Cascade R-CNN、采用級聯(lián)特征金字塔網(wǎng)絡(luò)以及同時采用級聯(lián)特征金字塔網(wǎng)絡(luò)和SAC的3種模型進行對比試驗,并確保試驗環(huán)境和其余參數(shù)的一致,對比訓(xùn)練過程中的mAP值、損失值變化以及每一類病害的分類準(zhǔn)確率。

圖5為不同改進的模型在特征融合階段上同層的特征可視化圖,從每類病害葉片中各挑選1張圖片,圖中每一列的第1張為原圖,第2張是同時采用級聯(lián)特征金字塔網(wǎng)絡(luò)和SAC模型的特征可視化圖,可以看出該圖可以較為準(zhǔn)確地劃分出葉片和背景區(qū)域,并且能大致識別到病區(qū)。第3張是采用級聯(lián)特征金字塔網(wǎng)絡(luò)模型的特征可視化圖,因重復(fù)的提取淺層特征信息故而不能很好地將葉片和背景區(qū)域區(qū)分開。第4張是Cascade R-CNN模型的特征可視化圖,可以看出大部分的病區(qū)信息都未能提取。

圖6展示了3種模型的損失變化曲線,采用級聯(lián)特征金字塔網(wǎng)絡(luò)的模型均在約迭代110 000次時損失值開始收斂,最后穩(wěn)定在一個數(shù)值較小的區(qū)域,而原始模型的損失值雖然收斂較快,卻遠遠高于采用了級聯(lián)特征金字塔網(wǎng)絡(luò)的模型。

表1列出測試集在不同改進下各類病害的識別準(zhǔn)確率以及mAP值。由表1可得,同時采用級聯(lián)特征金字塔網(wǎng)絡(luò)和SAC模型的mAP值最高,可以達到88.7%,較原始模型提高2.1%,較僅采用級聯(lián)特征金字塔網(wǎng)絡(luò)的模型提高0.6%,各類病害的平均識別準(zhǔn)確率達到99.44%,均高于其他兩種模型。并且添加SAC的模型在番茄葉霉病類別上的識別準(zhǔn)確率漲幅最高,較原始模型提高2.06%,番茄瘡痂病提高1.89%,番茄晚疫病提高1.81%,說明SAC可以有效地解決易發(fā)生在葉霉病類別上錯檢的情況。

以上試驗表明,對于含有小目標(biāo)的番茄葉片病害數(shù)據(jù)集,級聯(lián)特征金字塔網(wǎng)絡(luò)可以有效地提高對于淺層小目標(biāo)特征的利用率,SAC可以多尺度的提取特征,提高同類病害不同形狀的準(zhǔn)確率,提升模型的檢測性能。

3.4.2 不同模型之間的性能比較

本文改進后的模型與Cascade R-CNN模型試驗得到的每類病害的混淆矩陣[22]如圖7和圖8所示,可以看出,改進后的模型比原始模型的性能更好,晚疫病和葉霉病的錯檢率都有降低。

為驗證Cascade R-CNN模型的檢測性能,本文在作對比試驗前對Faster R-CNN模型也進行了修改,引入了未改進的FPN。不同模型的損失值變化如圖9所示,F(xiàn)aster R-CNN、RetinaNet、Cascade R-CNN模型的損失均在約50 000次迭代后開始收斂,IMS-Cascade R-CNN模型的損失在約120 000次迭代后趨于平穩(wěn),能夠收斂到一個較低的值。

不同模型的mAP值變化如圖10所示,IMS-Cascade R-CNN模型從訓(xùn)練開始就能保持較高的mAP值,最后穩(wěn)定在89.1%,高于其他三種模型。Faster R-CNN和Cascade R-CNN模型略低于本文改進后的模型,但最后的收斂效果與RetinaNet接近。

表2列出了測試集在不同模型下的平均準(zhǔn)確率以及mAP值,其中平均準(zhǔn)確率為每一類病害識別準(zhǔn)確率的均值。

從表2可以看出,Cascade R-CNN模型的mAP值和平均準(zhǔn)確率均略高于Faster R-CNN和RetinaNet模型,而使用本文提出的IMS-Cascade模型進行識別平均準(zhǔn)確率可以達到99.36%,高于原始模型1.84%,mAP值可以達到89.1%,高于原始模型2.5%,因此對于番茄病害識別的檢測性能更好。

4 結(jié)論

1)" 本文提出一種IMS-Cascade模型用于復(fù)雜環(huán)境下的番茄葉病害檢測,該模型針對檢測過程中番茄葉片卷曲遮擋、錯檢漏檢等問題,能夠多尺度地捕捉番茄病害的小目標(biāo)特征,為復(fù)雜環(huán)境下的番茄病害檢測提供一種新的思路。

2) 針對遮擋環(huán)境下病害目標(biāo)較小的問題,本文在FPN中添加反饋機制,充分利用淺層信息,mAP值較Cascade模型提高1.5%,并針對FPN易丟失目標(biāo)信息的問題將主干網(wǎng)絡(luò)中的普通卷積替換為SAC,mAP值提高1.8%,又在損失函數(shù)中提高準(zhǔn)確樣本的梯度,降低錯檢對模型的影響。

3)" 本文提出的IMS-Cascade模型mAP值達到89.1%,平均準(zhǔn)確率達到99.36%,各項指標(biāo)均優(yōu)于對比模型Faster R-CNN、Cascade R-CNN、RetinaNet。但本文在試驗中所使用的數(shù)據(jù)集種類不多,在接下來的研究中,如何在有更多病害種類的情況下仍保持高準(zhǔn)確率是需要挑戰(zhàn)的難點。

參 考 文 獻

[1]Gulhane V A, Gurjar A A. Detection of diseases on cotton leaves and its possible diagnosis [J]. International Journal of Image Processing, 2011, 5(5): 590-598.

[2]黎振, 陸玲, 熊方康. 基于k-means分割和遷移學(xué)習(xí)的番茄病理識別[J]. 江蘇農(nóng)業(yè)科學(xué), 2021, 49(12): 156-161.

Li Zhen, Lu Ling, Xiong Fangkang. Tomato pathological recognition based on K-means segmentation and transfer learning [J]. Jiangsu Agricultural Sciences, 2021, 49(12): 156-161.

[3]Zhang T, Zhu X K, et al. Deep learning based classification for tomato diseases recognition [J]. IOP Conference Series: Earth and Environmental Science, 2010, 474(3): 032014.

[4]郭小清, 范濤杰, 舒欣. 基于改進Multi-Scale AlexNet的番茄葉部病害圖像識別[J]. 農(nóng)業(yè)工程學(xué)報, 2019, 35(13): 162-169.

Guo Xiaoqing, Fan Taojie,Shu Xin. Tomato leaf diseases recognition based on improved Multi-Scale AlexNet [J]. Transactions of the Chinese Society of Agricultural Engineering, 2019, 35(13): 162-169.

[5]Zhang Y, Song C, Zhang D. Deep learning-based object detection improvement for tomato disease [J]. IEEE Access, 2020, 8: 56607-56614.

[6]張寧, 吳華瑞, 韓笑, 等. 基于多尺度和注意力機制的番茄病害識別方法[J]. 浙江農(nóng)業(yè)學(xué)報, 2021, 33(7): 1329-1338.

Zhang Ning, Wu Huarui, Han Xiao, et al. Tomato disease recognition scheme based on multi-scale and attention mechanism [J]. Acta Agriculturae Zhejiangensis, 2021, 33(7): 1329-1338.

[7]Cai Z, Vasconcelos N. Cascade R-CNN: Delving into high quality object detection [C]. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2018.

[8]Ren S, He K, Girshick R, et al. Faster R-CNN towards real-time object detection with region proposal networks [J]. IEEE Transactions on Pattern Analysis amp; Machine Intelligence, 2016, 39(6): 1137-1149.

[9]王振, 張善文, 趙保平. 基于級聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的作物病害葉片分割[J]. 計算機工程與應(yīng)用, 2020, 56(15): 242-250.

Wang Zhen, Zhang Shanwen, Zhao Baoping. Crop diseases leaf segmentation method based on cascade convolutional neural network [J]. Computer Engineering and Applications, 2020, 56(15): 242-250.

[10]Lin T Y, Dollár P, Girshick R, et al. Feature pyramid networks for object detection [C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017.

[11]岳有軍, 田博凱, 王紅君, 等. 基于改進Mask RCNN的復(fù)雜環(huán)境下蘋果檢測研究[J]. 中國農(nóng)機化學(xué)報, 2019,40(10): 128-134.

Yue Youjun, Tian Bokai, Wang Hongjun, et al. Research on apple detection in complex environment based on improved Mask RCNN [J]. Journal of Chinese Agricultural Mechanization, 2019, 40(10): 128-134.

[12]方晨晨, 石繁槐. 基于改進深度殘差網(wǎng)絡(luò)的番茄病害圖像識別[J]. 計算機應(yīng)用, 2020, 40(S1): 203-208.

Fang Chenchen, Shi Fanhuai. Image recognition of tomato diseases based on improved deep residual network [J]. Journal of Computer Applications, 2020, 40(S1): 203-208.

[13]Qiao S, Chen L C, Yuille A. DetectoRS: Detecting objects with recursive feature pyramid and switchable atrous convolution [C]. 2020 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021.

[14]Chen L C, Papandreou G, Schroff F, et al. Rethinking atrous convolution for semantic image segmentation [J]. Computer Vision and Pattern Recognition, ArXiv: 1706.05587, 2017.

[15]Pang J, Chen K, Shi J, et al. Libra R-CNN: Towards balanced learning for object detection [C]. 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2020.

[16]何穎, 陳丁號, 彭琳. 基于改進YOLOv5模型的經(jīng)濟林木蟲害目標(biāo)檢測算法研究[J]. 中國農(nóng)機化學(xué)報, 2022, 43(4): 106-115.

He Ying, Chen Dinghao, Peng Lin. Analysis of research process on mechanized ginger planting technology based on the patent analysis method [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(4): 106-115.

[17]Hassanien A E, Gaber T, Mokhtar U, et al. An improved moth flame optimization algorithm based on rough sets for tomato diseases detection [J]. Computers and Electronics in Agriculture, 2017, 136: 86-96.

[18]蘇斐, 張澤旭, 趙妍平, 等. 基于輕量化YOLO-v3的綠熟期番茄檢測方法[J]. 中國農(nóng)機化學(xué)報, 2022, 43(3): 132-137.

Su Fei, Zhang Zexu, Zhao Yanping, et al. Detection of mature green tomato based on lightweight YOLO-v3 [J].Journal of Chinese Agricultural Mechanization, 2022, 43(3): 132-137.

[19]Ghadimi S, Lan G, Zhang H. Mini-batch stochastic approximation methods for nonconvex stochastic composite optimization [J]. Mathematical Programming, 2014.

[20]Hu J, Shen L, Sun G. Squeeze-and-excitation networks [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 42(8): 2011-2023.

[21]LIN T Y, GOYAL P, Girshick R, et al. Focal loss for dense object detection [J]. IEEE Transactions on Pattern Analysis amp; Machine Intelligence, 2020, 42(2): 318-327.

[22]韓旭, 趙春江, 吳華瑞, 等. 基于注意力機制及多尺度特征融合的番茄葉片缺素圖像分類方法[J]. 農(nóng)業(yè)工程學(xué)報, 2021, 37(17): 177-188.

Han Xu, Zhao Chunjiang, Wu Huarui, et al. Image classification method for tomato leaf deficient nutrient elements based on attention mechanism and multi-scale feature fusion [J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(17): 177-188.

猜你喜歡
多尺度
復(fù)雜環(huán)境下基于相關(guān)濾波的行人跟蹤方法研究
基于地理國情普查中DEM精化技術(shù)方法研究
一種基于SVM的壩面裂縫損傷智能識別方法
價值工程(2017年19期)2017-07-12 19:57:34
基于EEMD的我國入境旅游客源市場多尺度分析及預(yù)測
基于多尺度融合插值算法的風(fēng)資源監(jiān)測方法
海綿城市建設(shè)研究進展與若干問題探討
一種基于多尺度數(shù)學(xué)形態(tài)學(xué)的心電信號去噪方法
多尺度高效用水評價
價值工程(2016年35期)2017-01-23 16:32:49
云環(huán)境下改進的非授權(quán)用戶入侵行為分析及檢測研究
基于SLIC和多尺度顯著性的紅棗圖像分割算法
鄂尔多斯市| 元氏县| 正阳县| 蓝田县| 宝坻区| 汉中市| 平顶山市| 界首市| 仙游县| 绩溪县| 合川市| 广河县| 三门峡市| 土默特左旗| 崇左市| 丰都县| 泸溪县| 绥江县| 阳江市| 九江县| 日照市| 乌兰浩特市| 慈溪市| 孟村| 庄浪县| 商洛市| 汝阳县| 廊坊市| 泾源县| 伊吾县| 长岛县| 顺平县| 青河县| 揭西县| 汉源县| 扎赉特旗| 天全县| 黎平县| 剑阁县| 安仁县| 高陵县|