陳 聰,于 嘯,宮 琪
(山東理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東 淄博 255049)
蘋(píng)果在我國(guó)種植歷史悠久,種植面積居世界首位。我國(guó)已經(jīng)成為世界最大的蘋(píng)果生產(chǎn)國(guó)和消費(fèi)國(guó),同時(shí)蘋(píng)果產(chǎn)業(yè)成為農(nóng)民的重要經(jīng)濟(jì)來(lái)源[1]。但蘋(píng)果在其生長(zhǎng)過(guò)程中受到氣候、細(xì)菌等各種因素的影響會(huì)出現(xiàn)葉部病害問(wèn)題,從而對(duì)樹(shù)體的發(fā)育、產(chǎn)量、質(zhì)量產(chǎn)生重要影響。蘋(píng)果葉片病害頻發(fā)于7 月份,主要病害有斑點(diǎn)落葉病、褐斑病和灰斑病等[2]。這幾種葉片病害表現(xiàn)特征相似,傳統(tǒng)依靠人工和農(nóng)業(yè)專家區(qū)分蘋(píng)果葉片病害效率低下。為此,尋找出精準(zhǔn)識(shí)別蘋(píng)果葉片病害的方法顯得尤為重要。
隨著計(jì)算機(jī)視覺(jué)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks,CNN)在計(jì)算機(jī)視覺(jué)相關(guān)的不同領(lǐng)域得到了廣泛應(yīng)用,其中包括醫(yī)學(xué)圖像、無(wú)人駕駛和人臉識(shí)別等[3?5]。近年來(lái),國(guó)內(nèi)外專家也通過(guò)CNN 解決農(nóng)林方面問(wèn)題。孫鵬等[6]通過(guò)在傳統(tǒng)的CNN 中加入注意力機(jī)制,使得對(duì)大豆蚜蟲(chóng)的識(shí)別準(zhǔn)確率達(dá)到96.85%。張建華等[7]通過(guò)優(yōu)化VGG-16 的全連接層數(shù),并且使用六標(biāo)簽SoftMax 分類器實(shí)現(xiàn)對(duì)6 種棉花病害的準(zhǔn)確識(shí)別。龍滿生等[8]用遷移學(xué)習(xí)方法將ImageNet 預(yù)訓(xùn)練的AlexNet 模型遷移到油茶病害識(shí)別任務(wù)中,使得病害識(shí)別率達(dá)到96.5%。馬宇等[9]在ResNext50殘差網(wǎng)絡(luò)中添加三通道注意力機(jī)制,能夠有效地識(shí)別10種番茄葉部病蟲(chóng)害。黃英來(lái)等[10]針對(duì)玉米葉片病害,通過(guò)替換7×7卷積核,替代激活函數(shù),改變殘差順序?qū)esNet-50進(jìn)行改進(jìn),使玉米病害分類正確率達(dá)到98.3%。王東方等[11]對(duì)SE-ResNeXt-101模型進(jìn)行改進(jìn),并基于遷移學(xué)習(xí)提出了一種農(nóng)作物病害分類模型TL-SEResNeXt-101,該模型在真實(shí)農(nóng)業(yè)環(huán)境中取得不錯(cuò)的識(shí)別效果。ZHAO 等[12]將改進(jìn)的通道和空間注意模塊鑲嵌到ResNet 的殘差塊中,使得模型對(duì)番茄病害的識(shí)別準(zhǔn)確率達(dá)到97.59%。XU 等[13]在ResNet-50中采用聚焦損失函數(shù),使得模型對(duì)草莓病害的平均識(shí)別準(zhǔn)確率達(dá)到98.67%。綜上所述,植物病蟲(chóng)害識(shí)別的方法主要是在基準(zhǔn)CNN 模型基礎(chǔ)上進(jìn)行改進(jìn),從而達(dá)到識(shí)別不同植物病害以及蟲(chóng)害的目的。部分研究采用遷移學(xué)習(xí)的方法訓(xùn)練網(wǎng)絡(luò)模型。
以上研究中,CNN 在葉片病害以及蟲(chóng)害的圖像識(shí)別中取得突破性進(jìn)展,但是上述研究中大多采用試驗(yàn)室環(huán)境數(shù)據(jù)。然而真實(shí)的蘋(píng)果果園環(huán)境背景復(fù)雜多樣,葉片縱橫交錯(cuò),且蘋(píng)果在生長(zhǎng)過(guò)程中受環(huán)境等多方面影響,會(huì)導(dǎo)致蘋(píng)果病斑具有特征相似、病斑分布稀疏、病斑較小等特點(diǎn),采用傳統(tǒng)CNN識(shí)別效果不佳。因此,對(duì)基準(zhǔn)網(wǎng)絡(luò)ResNet-50 進(jìn)行改進(jìn),修改原始網(wǎng)絡(luò)結(jié)構(gòu)的殘差順序,添加通道注意力機(jī)制,采用并行卷積,并且通過(guò)遷移學(xué)習(xí)的方式進(jìn)行權(quán)重初始化,達(dá)到能夠識(shí)別復(fù)雜背景下的蘋(píng)果病害的目的,為蘋(píng)果病害識(shí)別提供方法。
供試蘋(píng)果葉片病害圖像來(lái)自AI Studio,是由西北農(nóng)林科技大學(xué)在各個(gè)試驗(yàn)站采集所得。數(shù)據(jù)主要在天氣晴朗的條件下采集,部分在陰雨天采集,因此,數(shù)據(jù)來(lái)自于復(fù)雜背景下,且光照強(qiáng)度不同,存在一定程度的遮擋問(wèn)題。采集到的蘋(píng)果葉片病害圖像共有2 027 張,其中斑點(diǎn)落葉病409 張、花葉病375 張、灰斑病370 張、褐斑病435 張、銹病438 張。將上述采集的數(shù)據(jù)集與PlantVillage 中的660 張健康葉片、621 張黑腐病、667 張黑星病以及275 張銹病數(shù)據(jù)集圖像進(jìn)行合并,共計(jì)4 250 張?zhí)O果葉片病害圖像,所構(gòu)成的數(shù)據(jù)集結(jié)構(gòu)如表1 所示。原始數(shù)據(jù)集中各類病害數(shù)量存在不均衡問(wèn)題,因此,將斑點(diǎn)落葉病、花葉病、灰斑病、褐斑病4 種病害數(shù)據(jù)集進(jìn)行隨機(jī)0.6 倍水平鏡像數(shù)據(jù)擴(kuò)充。將得到的試驗(yàn)數(shù)據(jù)集按照4∶1的比例隨機(jī)劃分為訓(xùn)練集和測(cè)試集。
表1 試驗(yàn)數(shù)據(jù)集構(gòu)成Tab.1 Composition of experimental dataset
蘋(píng)果葉片病害樣本圖像如圖1 所示,試驗(yàn)數(shù)據(jù)共包含8 種蘋(píng)果葉片病害類別,并且組成該數(shù)據(jù)集的所有試驗(yàn)數(shù)據(jù)全部由相關(guān)專家標(biāo)注。為了增強(qiáng)網(wǎng)絡(luò)模型的魯棒性,降低過(guò)擬合,采用數(shù)據(jù)增強(qiáng)的方式。對(duì)訓(xùn)練集數(shù)據(jù)的增強(qiáng)方式主要為圖像大小調(diào)整成256×256、進(jìn)行224×224 的隨機(jī)裁剪、數(shù)據(jù)歸一化等。
圖1 蘋(píng)果葉片病害樣本圖像Fig.1 Sample images of apple leaf diseases
隨著卷積層數(shù)的疊加,CNN 模型的識(shí)別能力會(huì)相應(yīng)地增加。然而研究表明,模型達(dá)到一定層數(shù)后,模型的識(shí)別能力會(huì)達(dá)到飽和,再增加層數(shù)不僅不能提高識(shí)別能力,反而會(huì)使網(wǎng)絡(luò)收斂速度更慢,難以訓(xùn)練,且易產(chǎn)生梯度消失或梯度爆炸現(xiàn)象。2016 年HE 等[14]提出殘差網(wǎng)絡(luò),殘差網(wǎng)絡(luò)的出現(xiàn)可以確保網(wǎng)絡(luò)加深的同時(shí)模型的識(shí)別能力不會(huì)降低,并且能夠使模型更好地收斂。
傳統(tǒng)的CNN中,將輸入設(shè)為x,有參網(wǎng)絡(luò)層設(shè)為h,則以x為輸入層的輸出為h(x)。一般的如Alexnet[15]、VGG[16]等網(wǎng)絡(luò)可以直接通過(guò)訓(xùn)練學(xué)習(xí)出參數(shù)函數(shù)h的表達(dá)式,從而直接學(xué)習(xí)x到h(x)的映射。殘差網(wǎng)絡(luò)則是通過(guò)捷徑連接(Shortcut conections)的方式,直接把輸入x作為輸出的初始值,進(jìn)而只需要學(xué)習(xí)殘差,轉(zhuǎn)移了卷積網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo)。殘差網(wǎng)絡(luò)解決了恒等映射問(wèn)題,并且隨著網(wǎng)絡(luò)的加深,識(shí)別效果可以有效提高,殘差網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 殘差結(jié)構(gòu)Fig.2 Residual structure
殘差網(wǎng)絡(luò)常見(jiàn)的模型有ResNet-18、ResNet-50、ResNet-151 等,其中數(shù)字部分代表網(wǎng)絡(luò)層數(shù)。本研究選用ResNet-50作為基準(zhǔn)網(wǎng)絡(luò)。由于蘋(píng)果病斑存在特征相似、斑點(diǎn)大小不同等特點(diǎn),對(duì)原始ResNet-50 模型進(jìn)行殘差結(jié)構(gòu)調(diào)整(Residual structure adjustment,RSA),采用高效通道注意力機(jī)制(Efficient channel attention,ECA)和并行卷積(Parallel convolution,PC)的方式進(jìn)行改進(jìn),并將改進(jìn)的模型命名為REP-ResNet。ResNet-50 和REP-ResNet的結(jié)構(gòu)對(duì)比如表2所示。
表2 ResNet-50和REP-ResNet結(jié)構(gòu)對(duì)比Tab.2 Structure comparison of ResNet-50 and REP-ResNet
1.3.1 殘差結(jié)構(gòu)調(diào)整 2015 年SERGEY 等[17]提出批標(biāo)準(zhǔn)化(Batch normalization)方法,通過(guò)批標(biāo)準(zhǔn)化可以將每層神經(jīng)元的特征值重新符合標(biāo)準(zhǔn)正態(tài)分布,使特征值落在激活函數(shù)對(duì)于輸入值較為敏感的區(qū)域。使輸入的微小變化可導(dǎo)致?lián)p失函數(shù)較大的變化,使得梯度變大,避免梯度消失,同時(shí)也可加快收斂。
ResNet-50 中傳統(tǒng)殘差塊的順序?yàn)榫矸e層、批標(biāo)準(zhǔn)化、激活函數(shù)。這樣由于對(duì)輸入特征未進(jìn)行歸一化,弱化了批標(biāo)準(zhǔn)化的作用。因此,本研究把傳統(tǒng)的殘差網(wǎng)絡(luò)結(jié)構(gòu)調(diào)整為批標(biāo)準(zhǔn)化、激活函數(shù)、卷積層的排列順序,這樣不僅可以很好地發(fā)揮批標(biāo)準(zhǔn)化層的作用,還保留了傳統(tǒng)殘差塊結(jié)構(gòu)中的恒等映射部分。原始參數(shù)塊與改進(jìn)殘差塊的結(jié)構(gòu)如圖3所示。1.3.2 通道注意力機(jī)制 蘋(píng)果果園環(huán)境中,不同葉片之間交替重疊,背景復(fù)雜多樣。通過(guò)添加注意力機(jī)制,以提高對(duì)不同病斑的識(shí)別能力。ECA 為一種高效通道注意力機(jī)制,在增加少量參數(shù)的情況下,通過(guò)賦予通道不同權(quán)值,進(jìn)而提高模型的識(shí)別能力。ECA 的模塊示意圖如圖4所示。首先對(duì)卷積得到的特征圖進(jìn)行全局平均池化(Global average pooling,GAP),將池化后的特征圖進(jìn)行填充(Padding,P),再使用卷積核大小為3 的1 維卷積進(jìn)行通道交互,然后使用Sigmoid 激活函數(shù)進(jìn)行激活得到不同通道的特征權(quán)重。最后將得到的通道權(quán)重與輸入特征圖相乘得到最后的特征圖。
圖3 殘差塊結(jié)構(gòu)對(duì)比Fig.3 The comparison of residual block structure
圖4 ECA模塊示意圖Fig.4 Schematic diagram of ECA module
1.3.3 并行卷積 蘋(píng)果葉片病害在不同時(shí)期表現(xiàn)的特征有較大差異,比如斑點(diǎn)落葉病初期的病斑直徑為2~3 mm,隨著病斑擴(kuò)大和增多,直徑為5~6 mm[18]。為了識(shí)別不同時(shí)期葉片病害,提高病害分類效果,將ResNet-50 網(wǎng)絡(luò)的第1 層替換為并行卷積,網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。采用卷積核并行的方法,從左到右依次采用7×7、5×5、3×3 卷積核組成,并且輸出通道數(shù)都為32。將3 條分支所得的卷積結(jié)果,在通道維度進(jìn)行合并,最后通過(guò)1×1 卷積降低通道數(shù),使通道數(shù)與原ResNet-50保持一致。
圖5 并行卷積結(jié)構(gòu)Fig.5 Structure of parallel convolution
遷移學(xué)習(xí)是一種常見(jiàn)的機(jī)器學(xué)習(xí)方法,是指將源領(lǐng)域?qū)W習(xí)到的知識(shí)遷移到目標(biāo)領(lǐng)域。深度學(xué)習(xí)的訓(xùn)練通常需要大量數(shù)據(jù),而對(duì)于小數(shù)據(jù)集,從頭開(kāi)始訓(xùn)練難度大容易導(dǎo)致過(guò)擬合,泛化能力差。將訓(xùn)練好的參數(shù)模型遷移到新模型上訓(xùn)練,不僅可以加快網(wǎng)絡(luò)的收斂速度,還能提高模型的識(shí)別能力,減少小數(shù)據(jù)集上的過(guò)擬合[19?20]。遷移學(xué)習(xí)在深度學(xué)習(xí)中有3種常見(jiàn)的方式:一種是載入預(yù)訓(xùn)練模型后,訓(xùn)練所有參數(shù);一種是只訓(xùn)練CNN 的全連接層;一種是凍結(jié)模型部分卷積層,訓(xùn)練剩下的卷積層和全連接層。本研究采用的遷移學(xué)習(xí)方式是將PlantVillage 上預(yù)訓(xùn)練好的模型權(quán)重遷移至REPResNet上重新訓(xùn)練。
為驗(yàn)證基于改進(jìn)殘差網(wǎng)絡(luò)蘋(píng)果病害識(shí)別的可行性,在以下試驗(yàn)環(huán)境中進(jìn)行試驗(yàn)。軟件環(huán)境為Python3.9.6、pytorch1.9.0,操作系統(tǒng)為linux 操作系統(tǒng)。硬件環(huán)境CPU 為AMD EPYC 7302 16-Core Processor,GPU為T(mén)esla T4。
深度學(xué)習(xí)中超參數(shù)是在訓(xùn)練模型之前自定義的參數(shù)值,而不是通過(guò)訓(xùn)練所獲得的參數(shù)數(shù)值。通常需要通過(guò)不斷優(yōu)化模型的超參數(shù),為模型選擇一組最優(yōu)的超參數(shù),從而提高學(xué)習(xí)性能。本研究在多次試驗(yàn)的基礎(chǔ)上,得到一組最優(yōu)超參數(shù)如下:epoch為100;學(xué)習(xí)率為0.000 1;batch 為64;優(yōu)化器選用Adam優(yōu)化器;損失函數(shù)采用CrossEntropyLoss。
為更好地驗(yàn)證蘋(píng)果病害識(shí)別模型的識(shí)別效果,采用準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1-Score 為模型識(shí)別效果的評(píng)價(jià)指標(biāo)。其計(jì)算公式分別如式(1)、式(2)、式(3)和式(4)所示。
式中:TP代表將正類預(yù)測(cè)為正類數(shù);FN代表將正類預(yù)測(cè)為負(fù)類數(shù);FP代表將負(fù)類預(yù)測(cè)為正類數(shù);TN代表將負(fù)類預(yù)測(cè)為負(fù)類數(shù)。
為驗(yàn)證數(shù)據(jù)擴(kuò)充和改進(jìn)模型REP-ResNet 對(duì)蘋(píng)果葉片病害識(shí)別效果的影響,采用消融試驗(yàn)的方法進(jìn)行試驗(yàn),結(jié)果分別如表3—4所示。
由表3 可知,方案1 是使用基準(zhǔn)網(wǎng)絡(luò)模型ResNet-50,在未擴(kuò)充的數(shù)據(jù)集上進(jìn)行試驗(yàn),在測(cè)試集上準(zhǔn)確率達(dá)到92.69%。方案2 則是在網(wǎng)絡(luò)模型不變的前提下,在擴(kuò)充數(shù)據(jù)集上進(jìn)行試驗(yàn),測(cè)試集準(zhǔn)確率達(dá)到94.41%,較方案1 提高1.72 個(gè)百分點(diǎn)。為進(jìn)一步驗(yàn)證數(shù)據(jù)擴(kuò)充對(duì)模型識(shí)別效果的影響,使用改進(jìn)的模型REP-ResNet 進(jìn)行試驗(yàn),結(jié)果表明,REP-ResNet 未進(jìn)行擴(kuò)充時(shí)測(cè)試集準(zhǔn)確率為95.52%,擴(kuò)充后準(zhǔn)確率達(dá)到96.82%,提高了1.30 個(gè)百分點(diǎn)。由上述試驗(yàn)可知,數(shù)據(jù)擴(kuò)充可以在增強(qiáng)數(shù)據(jù)多樣性的同時(shí)避免數(shù)據(jù)不均衡,進(jìn)而達(dá)到提升模型識(shí)別能力的效果。
表3 數(shù)據(jù)擴(kuò)充對(duì)試驗(yàn)結(jié)果的影響Tab.3 Influence of date expansion on experimental results
表4 是在數(shù)據(jù)擴(kuò)充的前提下,采用不同改進(jìn)方式進(jìn)行試驗(yàn)得到的結(jié)果。對(duì)比方案1 和方案2、3、4可知,在基準(zhǔn)模型ResNet-50 上分別使用RSA、ECA、PC 的改進(jìn)方式,模型的準(zhǔn)確率較基準(zhǔn)模型提升1.64、2.03、1.69 個(gè)百分點(diǎn)。方案5、6、7 驗(yàn)證了不同改進(jìn)方式兩兩組合對(duì)葉片病害識(shí)別效果的影響,結(jié)果表明,不同改進(jìn)方式的組合不但不會(huì)弱化單種改進(jìn)方式的識(shí)別效果,相反可以進(jìn)一步提升網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率。根據(jù)方案8 結(jié)果可知,REP-ResNet 的識(shí)別準(zhǔn)確率可達(dá)96.82%,較基準(zhǔn)網(wǎng)絡(luò)ResNet-50 提高2.41 個(gè)百分點(diǎn)。3 種改進(jìn)方式在不同程度上能夠提高網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率。
表4 改進(jìn)模型對(duì)試驗(yàn)結(jié)果的影響Tab.4 Influence of improved model on experimental results
為驗(yàn)證遷移學(xué)習(xí)對(duì)病害識(shí)別效果的影響,將REP-ResNet 模型在PlantVillage 數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練得到網(wǎng)絡(luò)模型的權(quán)重。然后將訓(xùn)練好的網(wǎng)絡(luò)模型權(quán)重遷移至模型REP-ResNet 上重新在數(shù)據(jù)集上訓(xùn)練。全新學(xué)習(xí)和遷移學(xué)習(xí)在訓(xùn)練集和測(cè)試集上的準(zhǔn)確率和損失圖像如圖6所示。
由圖6可知,模型使用遷移學(xué)習(xí)方法訓(xùn)練時(shí),在第3 個(gè)迭代次數(shù)時(shí)驗(yàn)證集準(zhǔn)確率達(dá)到了95.66%;在第9 個(gè)迭代次數(shù)時(shí),達(dá)到全新學(xué)習(xí)的最高準(zhǔn)確率(96.82%);在第30 個(gè)迭代次數(shù)時(shí),準(zhǔn)確率達(dá)到最高為97.69%,較全新學(xué)習(xí)準(zhǔn)確率提高0.87 個(gè)百分點(diǎn)。采用遷移學(xué)習(xí)方法訓(xùn)練時(shí),模型在10個(gè)迭代次數(shù)后開(kāi)始收斂且趨于穩(wěn)定,而全新學(xué)習(xí)在40個(gè)迭代次數(shù)后模型開(kāi)始收斂。
圖6 全新學(xué)習(xí)和遷移學(xué)習(xí)的準(zhǔn)確率和損失值Fig.6 Accuracy and loss of new learning and transfer learning
綜上所述,模型提前在大數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,已經(jīng)初步具備識(shí)別基本特征的能力,具有更好的特征捕獲能力。通過(guò)遷移學(xué)習(xí)方法,模型在準(zhǔn)確率和收斂速度方面都有相應(yīng)提升,說(shuō)明遷移學(xué)習(xí)不僅可以提高模型識(shí)別準(zhǔn)確率,還能加快模型的訓(xùn)練速度。
為了充分驗(yàn)證REP-ResNet 網(wǎng)絡(luò)對(duì)蘋(píng)果病害的識(shí)別效果,在試驗(yàn)條件相同的情況下,對(duì)比不同的經(jīng)典CNN 模型,其中包括AlexNet[15]、VGG[16]、MobileNet[21]、DenseNet[22]、EfficientNet[23]、ResNet 變體[24?25],結(jié)果如表5所示。并且對(duì)不同模型結(jié)果采用混淆矩陣可視化,如圖7所示。
表5 不同模型試驗(yàn)結(jié)果對(duì)比Tab.5 Comparison of experimental results of different models%
圖7 不同網(wǎng)絡(luò)模型的混淆矩陣Fig.7 Confusion matrix of different network models
由表5 可知,REP-ResNet 在準(zhǔn)確率、精確率、召回率以及F1-Score 4 個(gè)評(píng)價(jià)指標(biāo)中相較于其他經(jīng)典CNN 均為最高。由圖7可知,REP-ResNet 在斑點(diǎn)落葉病、黑腐病、褐斑病等8種病害中正確分類數(shù)量均最多。并且在斑點(diǎn)落葉病、黑斑病這種病斑較小的蘋(píng)果葉片病害中,其識(shí)別效果遠(yuǎn)高于其他CNN 模型。上述結(jié)果表明,REP-ResNet 網(wǎng)絡(luò)模型適合于蘋(píng)果病害的識(shí)別。
為驗(yàn)證REP-ResNet 網(wǎng)絡(luò)對(duì)病害識(shí)別的影響,選取部分病害圖像,采用Grad-CAM[26]技術(shù),對(duì)網(wǎng)絡(luò)中最后一層卷積層進(jìn)行特征可視化分析,結(jié)果如圖8所示。對(duì)于蘋(píng)果花葉病病害,使用ResNet和REPResNet 進(jìn)行識(shí)別,2 種網(wǎng)絡(luò)都可以清楚地注意到病害區(qū)域,能夠精準(zhǔn)識(shí)別。但是對(duì)于斑點(diǎn)落葉病,ResNet 網(wǎng)絡(luò)對(duì)于病害區(qū)域關(guān)注比較分散,雖然關(guān)注到病害區(qū)域,但是更多的則是關(guān)注到背景部分。REP-ResNet 則可以清楚地關(guān)注到病害區(qū)域。對(duì)于銹病,雖然2 種網(wǎng)絡(luò)都可以關(guān)注到病害區(qū)域,但是2種網(wǎng)絡(luò)關(guān)注的程度不同?;鶞?zhǔn)網(wǎng)絡(luò)ResNet 對(duì)于病害位置的關(guān)注程度較輕,而改進(jìn)后的REP-ResNet則可以更好地關(guān)注到病害位置。分析可知,由于花葉病病斑較大,所以2 種網(wǎng)絡(luò)對(duì)于該病斑位置都能關(guān)注到。但是由于斑點(diǎn)落葉病病斑較小,基準(zhǔn)網(wǎng)絡(luò)ResNet-50 網(wǎng)絡(luò)識(shí)別效果較差,而REP-ResNet 由于對(duì)基準(zhǔn)的網(wǎng)絡(luò)結(jié)構(gòu)ResNet-50 進(jìn)行了改進(jìn),所以對(duì)具有小病斑的葉片也具有很好的識(shí)別效果。由于銹病病斑位置分布較散,REP-ResNet 則更關(guān)注病害較重位置,有利提高病害識(shí)別效果。綜上所述,REP-ResNet 對(duì)于病斑較小且背景復(fù)雜的蘋(píng)果病害具有更好的識(shí)別效果。
圖8 網(wǎng)絡(luò)模型可視化結(jié)果Fig.8 Visualization results of network model
本研究針對(duì)蘋(píng)果病害葉片特征相似、斑點(diǎn)不一、背景復(fù)雜、傳統(tǒng)CNN 識(shí)別效果不佳的問(wèn)題,在基準(zhǔn)網(wǎng)絡(luò)ResNet-50的基礎(chǔ)上進(jìn)行改進(jìn)。通過(guò)消融試驗(yàn)驗(yàn)證模型改進(jìn)對(duì)蘋(píng)果病害識(shí)別的效果。本研究提出的REP-ResNet 網(wǎng)絡(luò)在蘋(píng)果花葉病、斑點(diǎn)落葉病等8 種病害的識(shí)別過(guò)程中達(dá)到96.82%的識(shí)別準(zhǔn)確率。將模型在公開(kāi)數(shù)據(jù)集PlantVillage 預(yù)訓(xùn)練的模型權(quán)重參數(shù)遷移至REP-ResNet 模型上重新訓(xùn)練,不僅模型的收斂速度加快,而且能夠提高模型識(shí)別準(zhǔn)確率。在使用遷移學(xué)習(xí)的基礎(chǔ)上,模型對(duì)蘋(píng)果病害的識(shí)別準(zhǔn)確率能夠達(dá)到97.69%。采用Grad-CAM 進(jìn)行特征可視化分析,有助于分析網(wǎng)絡(luò)模型的關(guān)注區(qū)域,驗(yàn)證模型可行性。
傳統(tǒng)的CNN 不能滿足復(fù)雜背景下的蘋(píng)果病害識(shí)別。從本研究結(jié)果來(lái)看,基于改進(jìn)的殘差網(wǎng)絡(luò)不僅能提高復(fù)雜背景下的蘋(píng)果病害識(shí)別效果,而且還能提高小病斑的蘋(píng)果病害的識(shí)別效果。REPResNet 網(wǎng)絡(luò)在一定程度上提高了病害識(shí)別效果,但是模型參數(shù)也相應(yīng)地增加。在未來(lái)的研究工作中,將設(shè)計(jì)更加輕量高效的模型對(duì)復(fù)雜背景下的蘋(píng)果病害進(jìn)行識(shí)別,相應(yīng)地減少模型參數(shù),使模型更適用于手機(jī)端識(shí)別。