路陽 劉婉婷 林立媛 張欣夢 管闖
摘要:針對水稻病害圖像識別中淺層特征無法記憶、深層特征提取不充分、序列特征魯棒性較弱等問題,提出一種將CNN與BiLSTM相結(jié)合的水稻病害識別新方法。首先,利用卷積神經(jīng)網(wǎng)絡(luò)自動提取水稻病害的淺層特征;然后,利用BiLSTM中各個循環(huán)單元之間的反饋鏈接可以充分挖掘和記憶水稻特征序列數(shù)據(jù)中的上下文相關(guān)信息和位置信息的優(yōu)勢,將淺層特征與序列特征結(jié)合形成一個新的特征序列,解決了特征無法記憶、提取不足的問題;最后,使用全局平均池化層代替全連接層,以減少參數(shù)、防止過擬合。針對自建的水稻病害數(shù)據(jù)庫,試驗(yàn)結(jié)果顯示:所提出模型的水稻病害平均識別精確率達(dá)到了99.38%,與CNN和CNN-LSTM模型相比,所提出模型分別提高0.63、1.38百分點(diǎn)。同時,在召回率和F1值上也顯現(xiàn)出了優(yōu)勢,分別達(dá)到99.42%、99.39%。因此,所提出的方法提升了水稻病害識別精確率,可應(yīng)用于實(shí)際的水稻病害診斷中。
關(guān)鍵詞:水稻病害;圖像識別;長短期記憶神經(jīng)網(wǎng)絡(luò);卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí)
中圖分類號:TP391.41文獻(xiàn)標(biāo)志碼:A
文章編號:1002-1302(2023)20-0211-07
水稻是重要的糧食作物之一,我國有60%以上的人口以大米為主食[1]。在水稻生長過程中會發(fā)生許多病害,影響水稻的產(chǎn)量,因此對這些病害的正確識別,進(jìn)一步掌握其發(fā)生的規(guī)律和動態(tài),才能達(dá)到精確的預(yù)測和防治。而傳統(tǒng)識別方式主要依靠專家的經(jīng)驗(yàn),或是肉眼觀察,或是在實(shí)驗(yàn)室進(jìn)行鑒別,費(fèi)時費(fèi)力,成本昂貴,無法普及。
隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,許多學(xué)者利用人工智能的方法對水稻病害分類識別進(jìn)行研究,通過使用支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等方法檢測和分類病害,為水稻病害識別提供了技術(shù)基礎(chǔ)。陳宇等利用交換粒子群優(yōu)化算法優(yōu)化支持向量機(jī)徑向基函數(shù)的參數(shù)和懲罰因子,通過支持向量機(jī)模型對3種水稻葉部病害進(jìn)行識別,平均識別準(zhǔn)確率達(dá)到了93.2%[2]。陳悅寧等提出了一種基于優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的水稻病害識別方法,對稻瘟病、白葉枯病以及細(xì)菌性條斑病3種水稻病害進(jìn)行識別,準(zhǔn)確率分別達(dá)到98.5%、96.0%、92.5%[3]。但機(jī)器學(xué)習(xí)在病害特征提取方面是需要人工提取的,人工提取耗時耗力,出現(xiàn)錯誤的可能性也大。近年來,深度學(xué)習(xí)在圖像識別和分類的研究中取得了巨大的進(jìn)步,尤其是卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,簡稱CNN),由于其能夠從輸入的大量水稻病害圖像中自主學(xué)習(xí)、提取出病害特征,因此在水稻病害圖像識別的應(yīng)用中不斷深入。劉婷婷等采用AlexNet深度卷積神經(jīng)網(wǎng)絡(luò)模型對水稻紋枯病進(jìn)行識別,試驗(yàn)結(jié)果證明ALexNet模型達(dá)到了97%的識別率[4]。Saeed等提出了ResNet152的變體,用于檢測水稻和玉米等基本作物的疾病,對主要和次要疾病亞群的準(zhǔn)確率分別達(dá)到99.10%、82.20%[5]。雖然CNN在水稻病害圖像識別中取得了顯著的效果,但由于CNN內(nèi)部有循環(huán)單元,使CNN在學(xué)習(xí)提取特征時,往往會丟掉在初始層學(xué)習(xí)到的淺層細(xì)粒度細(xì)節(jié),一些重要的細(xì)節(jié)沒有傳遞到網(wǎng)絡(luò)的深層。
現(xiàn)階段一些研究人員將循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,簡稱RNN)中的模塊結(jié)合CNN識別圖像,取得了不錯的效果。David等提出了一種 CNN-RNN 混合深度學(xué)習(xí)模型,對番茄葉部病害進(jìn)行檢測分類,利用時間序列數(shù)據(jù)實(shí)現(xiàn)早期病害檢測,檢測分類準(zhǔn)確率最高達(dá)到了98.25%[6]。Banzi等提出一種將長短期記憶網(wǎng)絡(luò)(long short-term memory,簡稱LSTM)嵌入到CNN層中的組合結(jié)構(gòu)對100種不同類型的植物物種進(jìn)行分類識別,所提出的模型能夠以95%的準(zhǔn)確率對每幅圖像的特定類別進(jìn)行分類[7]。
為深度挖掘水稻病害特征,提高水稻病害圖像的識別準(zhǔn)確率,提出一種結(jié)合了CNN與雙向LSTM的水稻病害識別新方法,即雙向長短期記憶網(wǎng)絡(luò)(bidirectional long and short-term memory,簡稱BiLSTM),。該系統(tǒng)能夠檢測和識別5種水稻病害類別,其中包括3種常見的水稻病害類型紋枯病、稻瘟病、白葉枯病,以及與稻瘟病和白葉枯病分別有著高相似度的胡麻斑病和東格魯病。首先通過CNN提取淺層病害特征,再由BiLSTM模型進(jìn)行前后信息相關(guān)性的建立,同時篩選、存儲病害特征序列以及病害位置信息,挖掘各個病害區(qū)域間的上下文相關(guān)信息,從而進(jìn)一步加深對特征信息的提取。最后通過比較、分析模型的訓(xùn)練效果和評價性能指標(biāo),驗(yàn)證所提出模型的優(yōu)異性,為水稻病害識別提供新的、有效的方法。
1 相關(guān)工作
1.1 Inception v1模塊
Inception v1模塊是GoogLeNet模型的一個重要的組成部分,其基本結(jié)構(gòu)如圖1所示[8]。原始的Inception結(jié)構(gòu)將卷積核尺度為1×1、3×3和5×5的卷積層以及最大池化層4個部分堆疊在一起,并通過ReLU激活函數(shù)增加網(wǎng)絡(luò)的非線性特征。由圖1可知,基于稀疏網(wǎng)絡(luò)結(jié)構(gòu)的Inception v1分別在卷積核尺度為3×3和5×5的卷積層之前以及最大池化層之后加入了尺度為1×1的卷積層,在多個尺度上同時進(jìn)行卷積,這使得其能夠在提取到更豐富特征的同時降低計(jì)算復(fù)雜度[9]。Inception v1中4個部分的卷積層可以獨(dú)立完成,每個部分的運(yùn)算之間沒有依賴,可以實(shí)現(xiàn)并行計(jì)算,極大地加快了模型的訓(xùn)練速度,最后將各個卷積運(yùn)算輸出結(jié)果連接為一個高維的特征圖,可以獲得更好的圖像表征。從而實(shí)現(xiàn)在有限的資源和內(nèi)存下得到更好的訓(xùn)練結(jié)果,是性能和資源利用率較好的選擇。
1.2 長短期記憶神經(jīng)網(wǎng)絡(luò)
RNN作為神經(jīng)網(wǎng)絡(luò)的一個重要分支,相較于CNN最大的特點(diǎn)是具有循環(huán)神經(jīng)單元,具有記憶功能,可以很好地利用輸入間隱含的依賴關(guān)系。而傳統(tǒng)的RNN存在梯度消失和梯度爆炸等問題,導(dǎo)致無法解決長時依賴的問題,為解決這些問題[10],Hochreiter和Schmidhuber(1997)提出了LSTM[11]。
LSTM基本單元如圖2所示。LSTM由輸入門(input gate,簡稱IG)、遺忘門(forget gate,簡稱FG)和輸出門(output gate,簡稱OG)組成[12],特別的是,隱藏狀態(tài)和單元狀態(tài)的使用使LSTM擁有短時間和長時間的記憶能力。簡單來說LSTM的工作原理就是保留重要的信息,遺忘不重要的信息。LSTM解決了RNN在實(shí)際應(yīng)用中出現(xiàn)的梯度消失和梯度爆炸等問題,需要的參數(shù)少,學(xué)習(xí)速度快[11]。
LSTM網(wǎng)絡(luò)結(jié)構(gòu)中包含遺忘門、輸入門和輸出門。遺忘門決定了來自上一個時間步的單元狀態(tài)中有多少信息被丟棄,有多少信息需要被繼承;輸入門決定了當(dāng)前處理的時間步中有多少輸入信息添加到當(dāng)前的單元狀態(tài)中;輸出門決定當(dāng)前單元狀態(tài)中將會有多少信息作為處理當(dāng)前時間步的輸出值,用于下一層網(wǎng)絡(luò)的更新中。計(jì)算公式如 (1)~(6)所示:
yt=ht=tanh(ct)ot。(6)
式中:xt、ft、it、ct′、ct、ot和yt分別為輸入量、遺忘門、輸入門、輸入節(jié)點(diǎn)、狀態(tài)單元、輸出門和中間輸入的狀態(tài);W為對應(yīng)門與輸入xt和中間輸出ht相乘的權(quán)重矩陣;b為對應(yīng)門的偏差;σ表示sigmoid函數(shù)變化。
1.3 雙向長短期記憶神經(jīng)網(wǎng)絡(luò)
BiLSTM是LSTM的一種擴(kuò)展。LSTM解決了特征信息無法記憶的問題,但忽略了對病害區(qū)域間的上下文相關(guān)信息和位置信息。BiLSTM由正向LSTM層和反向LSTM層融合而成,它既能捕獲過去的信息,也能捕獲未來的信息。BiLSTM各循環(huán)單元之間具有反饋連接,具有記憶性和進(jìn)一步挖掘的能力[13],同時考慮到了序列過去的特征和未來的特征,進(jìn)而提高模型處理序列問題的性能。BiLSTM結(jié)構(gòu)如圖3所示。
2 CNN-BiLSTM混合深度學(xué)習(xí)模型
本研究設(shè)計(jì)了一種在卷積神經(jīng)網(wǎng)絡(luò)中融入雙向長短期記憶網(wǎng)絡(luò)的水稻病害識別模型。將CNN挖掘特征的能力與BiLSTM整合特征序列未來、過去相關(guān)信息的能力相結(jié)合。在設(shè)計(jì)的模型中,水稻病害的識別分為3個部分:第1部分是初級特征提取模塊,實(shí)現(xiàn)對水稻病害圖像中病害特征的初步提取;第2部分是深度特征提取模塊,通過該模塊實(shí)現(xiàn)對水稻病害特征的進(jìn)一步挖掘和處理;第3部分是降維識別模塊,實(shí)現(xiàn)對水稻病害的分類識別。 CNN-BiLSTM 網(wǎng)絡(luò)模型的結(jié)構(gòu)如圖4所示,并且給出了每個模塊輸出的特征圖的寬度、高度和通道數(shù)目。
2.1 初級特征提取模塊
第1部分的淺層特征提取模塊是由卷積層+最大池化層+BN層的組合組成,對病害特征進(jìn)行局部特征提取。
對于深度網(wǎng)絡(luò)的訓(xùn)練是一個復(fù)雜的過程,只要網(wǎng)絡(luò)的前面幾層發(fā)生微小的改變,那么后面幾層就會被累積放大下去。一旦網(wǎng)絡(luò)某一層輸入數(shù)據(jù)的分布發(fā)生改變,那么這一層網(wǎng)絡(luò)就需要去適應(yīng)學(xué)習(xí)這個新的數(shù)據(jù)分布,所以如果訓(xùn)練過程中,訓(xùn)練數(shù)據(jù)的分布一直在發(fā)生變化,將會影響網(wǎng)絡(luò)的訓(xùn)練速度。
BN算法是一種旨在解決在訓(xùn)練過程中中間層數(shù)據(jù)分布發(fā)生改變的算法[14],在該模塊中使用BN層可以讓梯度變大,以此避免梯度消失問題的產(chǎn)生,提高模型穩(wěn)定性,提高學(xué)習(xí)收斂速度,加快訓(xùn)練速度。
2.2 深度特征提取模塊
第2部分的深層特征提取模塊是由Inception模塊+BiLSTM模塊的組合組成。通過Inception模塊的多特征融合特性實(shí)現(xiàn)對水稻病害的高維特征融合,通過BiLSTM模塊對特征序列信息的提取、整合過去、未來特征信息的能力實(shí)現(xiàn)對病害特征的深度提取。
2.2.1 Inception模塊
由于現(xiàn)有的水稻葉部病害圖像數(shù)據(jù)集中各類病害所包含的圖像數(shù)量較少,不利于葉部病害的特征提取,而Inception模塊正好可以解決資源有限的問題,同時防止由于訓(xùn)練集數(shù)據(jù)不足而產(chǎn)生的特征提取偏差。設(shè)計(jì)3個Inception模塊,這些模塊能夠增加網(wǎng)絡(luò)的寬度,也能降低feature map的厚度。為了保證Inception 模塊中3個尺寸的卷積操作和最大池化操作能夠進(jìn)行維度上的連接,將卷積操作的步長設(shè)為1、Padding方式設(shè)為same,池化操作的步長設(shè)為1,最后將這4個部分得到的特征圖通過Concatenate()拼接在一起,作為下一層的輸入。由于Inception v1自身的稀疏性,可以在很大程度上解決因?yàn)樵黾泳W(wǎng)絡(luò)的深度和寬度而導(dǎo)致的計(jì)算量劇增、參數(shù)量爆炸甚至過擬合等問題,從而提高深度網(wǎng)絡(luò)模型質(zhì)量[15]。為了可以更進(jìn)一步地挖掘水稻病害特征,在每個Inception 模塊之后加入BiLSTM模塊。
2.2.2 BiLSTM模塊
本研究設(shè)計(jì)的模型選擇使用BiLSTM作為特征學(xué)習(xí)存儲單元與Inception模塊相結(jié)合,是因?yàn)橄噍^于LSTM只能單向進(jìn)行特征學(xué)習(xí),BiLSTM可以實(shí)現(xiàn)雙向特征學(xué)習(xí),能夠更好地獲取水稻葉部病害特征信息之間的相關(guān)性,提供了處理序列數(shù)據(jù)的全新角度,能夠捕捉到可能被單向LSTM忽略的信息,挖掘并記憶特征序列上下文的相關(guān)信息以及病害區(qū)域的位置信息。
在經(jīng)過TimeDistributed()處理后,將特征序列傳入BiLSTM中,首先將輸入數(shù)據(jù)輸入到一個LSTM層,然后通過另一個反向的LSTM層重復(fù)訓(xùn)練,從而進(jìn)行雙向特征學(xué)習(xí),提高模型的依賴性,提高模型的精度,使其實(shí)現(xiàn)更深層次特征信息的挖掘并且對特征序列中的有用信息進(jìn)行存儲。
2.3 降維識別模塊
第3部分的降維識別模塊是由Global Average Pooling(GAP)層+Softmax層的組合組成。
使用GAP替代全連接層(fully connected,F(xiàn)C)基于2點(diǎn):一是GAP在特征圖與最終的分類間轉(zhuǎn)換更加簡單自然;二是不像FC層需要大量訓(xùn)練調(diào)優(yōu)的參數(shù),降低了空間參數(shù)會使模型更加“健壯”[16],有效防止第2部分產(chǎn)生過擬合現(xiàn)象;三是GAP整合了全局空間信息,對于輸入圖像的spatial translation更加魯棒[17]。GAP圖解如圖5所示。
2.4 模型參數(shù)
創(chuàng)建的CNN-BiLSTM網(wǎng)絡(luò)模型每一層的內(nèi)核大小、參數(shù)個數(shù)及輸出尺寸如表1所示。
3 基于CNN-BiLSTM的水稻病害診斷
3.1 水稻病害圖像數(shù)據(jù)庫的建立
在本研究中,一部分水稻病害圖像數(shù)據(jù)于2021年8月采集自黑龍江八一農(nóng)墾大學(xué)水稻試驗(yàn)田,在自然光照條件下使用1 600萬像素的OPPO N3手機(jī)拍攝獲取的水稻病害圖像。另一部分水稻病害圖像數(shù)據(jù)取自Kaggle公開數(shù)據(jù)集。將每張圖像按照病害類型命名,存儲到對應(yīng)病害名稱的文件夾中,共同組成水稻病害圖像數(shù)據(jù)集。
數(shù)據(jù)集中包括紋枯病、稻瘟病、白葉枯病、胡麻斑病、東格魯病5類水稻病害圖像,其中既有真實(shí)田間環(huán)境下復(fù)雜背景的病害圖像數(shù)據(jù),也包含將含有病害的葉片單獨(dú)裁剪出的圖像數(shù)據(jù)。通過對圖像進(jìn)行圖像增強(qiáng)處理來擴(kuò)充數(shù)據(jù)集,由于樣本數(shù)量不足且不均衡,采用了水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)、隨機(jī)水平平移和隨機(jī)垂直平移等圖像增強(qiáng)技術(shù)對每種病害樣本進(jìn)行擴(kuò)充,擴(kuò)大數(shù)據(jù)集的數(shù)量。數(shù)據(jù)量被擴(kuò)充至2 550幅圖像,每種病害各含有510幅圖像,每幅圖像的大小統(tǒng)一調(diào)整至256×256。水稻病害示例圖像如圖6所示。
3.2 數(shù)據(jù)預(yù)處理
3.2.1 圖像歸一化
在模型反向傳播時,梯度值更新與學(xué)習(xí)率一樣,當(dāng)學(xué)習(xí)率較小時,梯度值較小會導(dǎo)致更新緩慢,當(dāng)學(xué)習(xí)率較大時,梯度值較大會導(dǎo)致模型不易收斂,因此為了使模型訓(xùn)練收斂平穩(wěn),對圖像進(jìn)行歸一化操作,把不同維度的特征值調(diào)整到相近的范圍內(nèi),這樣就可以采用統(tǒng)一的學(xué)習(xí)率加速模型訓(xùn)練。
采用min-max標(biāo)準(zhǔn)化通過對原始圖像數(shù)據(jù)進(jìn)行線性變換,使其對應(yīng)的像素值均能縮放在[0,1]的范圍內(nèi),具有保留原始數(shù)據(jù)關(guān)系、消除量綱和數(shù)據(jù)取值范圍的影響等優(yōu)點(diǎn)[18]。min-max標(biāo)準(zhǔn)化的公式如式(7)所示。
(7)
式中:X′是歸一化后的值;X是原始圖像像素值;Xmin表示原始圖像像素值中的最小值;Xmax表示原始圖像像素值中的最大值。
3.2.2 獨(dú)熱編碼
在分類機(jī)器學(xué)習(xí)任務(wù)中,特征之間距離或相似度的計(jì)算是非常重要的,并且常用的距離或相似度的計(jì)算都是基于歐氏空間的相似度計(jì)算。
水稻病害特征的取值是[blast,blight,…]即病害對應(yīng)的名稱,其之間沒有大小的意義,但分類器往往默認(rèn)數(shù)據(jù)是連續(xù)的,并且是有序的[19],因此進(jìn)行獨(dú)熱編碼處理,將離散特征的取值擴(kuò)展到了歐氏空間,離散特征的某個取值就對應(yīng)歐氏空間的某個點(diǎn)。解決了分類器不好處理屬性數(shù)據(jù)的問題,并且在一定程度上起到了擴(kuò)充特征的作用。數(shù)據(jù)庫
中含有5類水稻病害類別,使用5位狀態(tài)寄存器來對5個狀態(tài)進(jìn)行編碼,每個狀態(tài)都有它獨(dú)立的寄存器位,并且在任意時候其中只有1位有效。
4 結(jié)果與分析
在本研究中的試驗(yàn)環(huán)境為windows10、64位操作系統(tǒng),CPU型號為 Intel Xeon CPU E5-2678 v3 @ 2.50 GHz,GPU型號為NVIDIA GeForce RTX 2080 Ti,顯卡內(nèi)存為11 G。采用Python編程語言和Tensorflow深度學(xué)習(xí)框架。
試驗(yàn)時按照8 ∶2的比例將數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集和測試集。將初始學(xué)習(xí)率lr設(shè)置為0.000 1,損失函數(shù)loss為多分類交叉熵?fù)p失函數(shù),迭代次數(shù)epoch為50。應(yīng)用構(gòu)造的水稻病害樣本集分別對CNN模型、CNN-LSTM模型、CNN-BiLSTM模型進(jìn)行訓(xùn)練,訓(xùn)練過程中3個模型隨著迭代次數(shù)的增加準(zhǔn)確率和損失率的收斂曲線如圖7、圖8所示。3種模型對水稻病害分類識別的結(jié)果如表2所示。
4.1 模型評價指標(biāo)
水稻病害分類可劃分為5種二分類情況,當(dāng)將稻瘟病作為正類時,紋枯病、白葉枯病、胡麻斑病以及東格魯病4種病害作為負(fù)類。那么在訓(xùn)練過程中正確判定為正類的數(shù)量記為TP,實(shí)際為正類但判斷為負(fù)類的總數(shù)量記為FN,實(shí)際為負(fù)類但判定為正類的總數(shù)量記為FP。為了評估提出的水稻病害識別模型的準(zhǔn)確性和穩(wěn)定性,本研究使用精確率P(precision)、召回率R(recall)以及F1值(F1 score)3項(xiàng)指標(biāo)進(jìn)行模型的評價。
精確率表示正確判定為正類的個數(shù)占模型分類為正類的個數(shù)的比例,計(jì)算公式如式(8)所示:
(8)
召回率表示模型判定正確的正類個數(shù)占實(shí)際中正類的個數(shù)的比例,計(jì)算公式如式(9)所示:
(9)
正常情況下,精確率和召回率是相互影響的,理想狀態(tài)下是期望2個指標(biāo)都高,但是實(shí)際兩者是相互制約的,精確率高召回率便低,反之,精確率低召回率便高。這就需要綜合考慮,最常見的便是引入F1值,表示準(zhǔn)確率和召回率的調(diào)和均值,用來權(quán)衡精確率和召回率,F(xiàn)1值越大說明模型的質(zhì)量越高。計(jì)算公式如式(10)所示:
(10)
3種模型的精確率、召回率以及F1值如表3所示。
4.2 討論與分析
由圖7中的訓(xùn)練曲線可以看出,CNN-BiLSTM模型的準(zhǔn)確率上升速度最快。由圖8中的收斂曲線可以看出,CNN-BiLSTM模型的損失率在經(jīng)過9次迭代之后開始趨于平穩(wěn),并沒有明細(xì)的波動,相較于CNN-LSTM模型在經(jīng)過22次迭代之后開始平穩(wěn),以及CNN模型直至訓(xùn)練結(jié)束也未平穩(wěn)、波動較大,CNN-BiLSTM模型的損失率在這3種識別模型中下降最快、穩(wěn)定性最好。因此,CNN-BiLSTM模型的收斂效果更好。由表2可知,CNN-BiLSTM 模型的訓(xùn)練集損失率只有0.08%,是這3類模型中損失率最小的,CNN-BiLSTM模型訓(xùn)練集準(zhǔn)確率比CNN模型高1.27百分點(diǎn)。在測試集上,CNN-BiLSTM模型的測試準(zhǔn)確率比CNN-LSTM模型的測試準(zhǔn)確率高出0.62百分點(diǎn),比CNN模型的準(zhǔn)確率高1.43百分點(diǎn),相對的損失率比CNN-LSTM模型低出0.92百分點(diǎn),比CNN模型低出1.56百分點(diǎn)。所以無論是從準(zhǔn)確率、損失率還是從穩(wěn)定性來看,CNN-BiLSTM模型的訓(xùn)練結(jié)果都要比其他2種模型的效果好。 因此從訓(xùn)練結(jié)果來看,CNN-BiLSTM模型比其他2種模型更具優(yōu)勢。
由表3可知,CNN-BiLSTM模型的精確率、召回率和F1值分別達(dá)到99.38%、99.42%、99.39%。精確率比CNN模型高出1.38百分點(diǎn),比CNN-LSTM模型高出0.63百分點(diǎn);召回率比CNN模型高出1.67百分點(diǎn),比CNN-LSTM模型高出0.63百分點(diǎn);F1值比CNN模型高出1.52百分點(diǎn),比 CNN-LSTM 模型高出0.63百分點(diǎn)。因此從模型的評價指標(biāo)來看CNN-BiLSTM模型比其他2種模型都要好。
綜合試驗(yàn)結(jié)果表明,無論是從訓(xùn)練結(jié)果還是評估指標(biāo)上看,CNN-BiLSTM都明顯優(yōu)于CNN-LSTM模型和CNN模型。CNN-BiLSTM模型加快了模型的收斂速度、訓(xùn)練速度,提高了識別準(zhǔn)確率,減少了過擬合的風(fēng)險,使模型更具有魯棒性,訓(xùn)練效果更好,是這3種模型中最具優(yōu)勢的。
5 結(jié)束語
根據(jù)BiLSTM可以聯(lián)系病害區(qū)域間的上下文相關(guān)信息和位置信息,提出一種CNN與BiLSTM相結(jié)合的水稻病害識別新方法。應(yīng)用CNN模型、CNN-LSTM模型和CNN-BiLSTM模型,分別對水稻病害圖像數(shù)據(jù)集進(jìn)行訓(xùn)練、測試。結(jié)果表明,所設(shè)計(jì)的CNN-BiLSTM模型水稻病害圖像識別率最高,平均識別率達(dá)到了99.38%。結(jié)果證明,在CNN模型中加入BiLSTM對于水稻病害識別診斷的準(zhǔn)確性具有一定的提高作用,同時也增加了模型的穩(wěn)定性并且加快了模型的收斂速度,因此本研究提出的將CNN與BiLSTM結(jié)合的這種新方法對于水稻病害診斷方面具有一定的可行性。
參考文獻(xiàn):
[1]胡培松,圣忠華. 水稻種植業(yè)的昨天、今天和明天[EB/OL]. (2021-04-22)[2022-10-20]. http:www.zys.moa.gov.cn/mhsh/202104/t20210422_6366373.htm.
[2]陳 宇,路 陽,蔡 娣,等. 基于SPSO+SVM的水稻葉部病害識別方法研究[J]. 上海農(nóng)業(yè)學(xué)報(bào),2021,37(6):136-142.
[3]陳悅寧,郭士增,張佳巖,等. 基于優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的水稻病害識別算法研究[J]. 電子技術(shù)應(yīng)用,2020,46(9):85-87,93.
[4]劉婷婷,王 婷,胡 林. 基于卷積神經(jīng)網(wǎng)絡(luò)的水稻紋枯病圖像識別[J]. 中國水稻科學(xué),2019,33(1):90-94.
[5]Saeed Z,Raza A,Qureshi A H,et al. A multi-crop disease detection and classification approach using CNN[C]//2021 International Conference on Robotics and Automation in Industry (ICRAI).October 26-27,2021,Rawalpindi,Pakistan.IEEE,2021:1-6.
[6]David H E,Ramalakshmi K,Gunasekaran H,et al. Literature review of disease detection in tomato leaf using deep learning techniques[C]//2021 7th International Conference on Advanced Computing and Communication Systems (ICACCS).March 19-20,2021,Coimbatore,India.IEEE,2021:274-278.
[7]Banzi J,Abayo T. Plant species identification from leaf images using deep learning models (CNN-LSTM architecture)[J]. Tanzania Journal of Forestry and Nature Conservation,2021,90(3):93-103.
[8]Szegedy C,Liu W,Jia Y Q,et al. Going deeper with convolutions[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).June 7-12,2015,Boston,MA,USA.IEEE,2015:1-9.
[9]薛文龍,于 炯,郭志琦,等. 基于特征融合卷積神經(jīng)網(wǎng)絡(luò)的端到端加密流量分類[J]. 計(jì)算機(jī)工程與應(yīng)用,2021,57(18):114-121.
[10]Hua Y S,Mou L C,Zhu X X.Recurrently exploring class-wise attention in a hybrid convolutional and bidirectional LSTM network for multi-label aerial image classification[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2019,149(3):188-199.
[11]Hochreiter S,Schmidhuber J. Long short-term memory[J]. Neural Computation,1997,9(8):1735-1780.
[12]李豐君,王 磊,趙 健,等. 基于天氣融合和LSTM網(wǎng)絡(luò)的分布式光伏短期功率預(yù)測方法[J]. 中國電力,2022,55(11):149-154.
[13]Cui Z,Ke R,Pu Z,et al. Deep bidirectional and unidirectional LSTM recurrent neural network for network-wide traffic speed prediction[EB/OL]. (2018-01-07)[2022-10-26]. https://arxiv.53yu.com/abs/1801.02143.
[14]Ioffe S,Szegedy C. Batch normalization:accelerating deep network training by reducing internal covariate shift[EB/OL]. (2015-02-11)[2022-10-26]. https://arxiv.org/abs/1502.03167.
[15]黃雙萍,孫 超,齊 龍,等. 基于深度卷積神經(jīng)網(wǎng)絡(luò)的水稻穗瘟病檢測方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2017,33(20):169-176.
[16]陳綺丹. 基于卷積神經(jīng)網(wǎng)絡(luò)的電驅(qū)動總成故障數(shù)據(jù)分類識別研究[D]. 重慶:重慶理工大學(xué),2020.
[17]Lin M,Chen Q,Yan S C. Network in Network[EB/OL]. (2013-12-16)[2022-10-28]. https://arxiv.org/abs/1312.4400.
[18]梅 瑩,尹藝璐,石稱華,等. 基于改進(jìn)VGG卷積神經(jīng)網(wǎng)絡(luò)的葉菜霜霉病智能識別算法研究[J]. 上海蔬菜,2021(6):76-84.
[19]梁 杰,陳嘉豪,張雪芹,等. 基于獨(dú)熱編碼和卷積神經(jīng)網(wǎng)絡(luò)的異常檢測[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,59(7):523-529.
收稿日期:2023-01-27
基金項(xiàng)目:國家自然科學(xué)基金(編號:U21A2019、61873058、61933007);黑龍江省自然科學(xué)基金聯(lián)合引導(dǎo)資助項(xiàng)目(編號:LH2022C061);黑龍江省博士后科研啟動基金(編號:LBH-Q17134);海南省科技專項(xiàng)(編號:ZDYF2022SHFZ105);黑龍江省省屬高等學(xué)校基本科研基金(編號:ZRCPY202020)。
作者簡介:路 陽(1976—),男,黑龍江雙城人,博士,教授,博士生導(dǎo)師,從事復(fù)雜系統(tǒng)智能故障診斷及模式識別技術(shù)研究。E-mail:luyanga@sina.com。