郝王麗 尉敬濤 韓猛 胡欣宇
摘 要:目前,谷子已成為我國一種非常重要的糧食作物,其生長期中土壤和施肥環(huán)境的檢測非常關鍵。為避免出現(xiàn)大規(guī)模缺鉀、缺鎂等元素缺失情況,研究者們提出許多元素失衡判斷方法。但傳統(tǒng)方法大多只提取圖像單尺度特征,識別性能受限。為解決該問題,提出一種改進的卷積神經(jīng)網(wǎng)絡來識別谷子生長期元素失衡情況。在神經(jīng)網(wǎng)絡中引入Inception結構,在不同尺度上組合深度特征以識別不同大小的異變斑塊形態(tài),從而提高識別準確率。同時,為提升模型魯棒性,在模型中引入了Dropout以及ReLU激活函數(shù)。實驗結果顯示該方法將識別準確率從95.6%提升到98%,說明多尺度特征提取可提高生長期元素失衡識別性能準確性。
關鍵詞:神經(jīng)網(wǎng)絡;多尺度特征;谷子;生長期;元素失衡識別;Dropout;ReLU
中圖分類號:TP39文獻標識碼:A文章編號:2095-1302(2020)03-00-04
0 引 言
在谷子生長發(fā)育過程中,各種營養(yǎng)元素都具有一定的生理功能,若谷子長期缺少某種元素,則會在形態(tài)結構與生理功能等方面發(fā)生相應反應并表現(xiàn)出特定癥狀[1],嚴重時會導致產(chǎn)量和品質的降低甚至絕產(chǎn)。因此,在谷子生長期間對作物表現(xiàn)出的營養(yǎng)元素缺乏癥狀進行正確診斷十分重要。
目前針對元素缺失診斷常見的方法包括基于人工經(jīng)驗的方法、基于化學的檢驗方法以及基于圖像的檢驗方法。
針對基于人工經(jīng)驗的方法,直觀來說,谷子或者任何一種農(nóng)作物缺少元素時,均會表現(xiàn)出一定的癥狀,從而可以通過對應的癥狀來判斷其營養(yǎng)情況。例如谷子缺氮時,新生葉子生長較慢且邊緣和尖端發(fā)黃,結籽數(shù)量減少;谷子缺鉀時,老葉子周圍出現(xiàn)缺損、不規(guī)則壞死以及紅色色素沉淀情況;若谷子缺磷,其根系會變小,籽粒灌漿受到抑制,葉子生長受阻且變得細長,顏色會變成深綠色和紫紅色,根部會變?yōu)樯钭鼗蛏詈谏?。另外,硼、鋅、銅等微量元素的缺乏同樣會使秕谷概率提高[2]。盡管不同元素缺失會出現(xiàn)不同的形態(tài)變化,但同一株谷子可能存在著多種營養(yǎng)素的缺乏,基于有限經(jīng)驗或肉眼觀測并不能準確識別具體的元素缺失情況。同時,由于各地區(qū)管理不同,也會導致谷子長勢和外觀不同,因此通過外觀診斷可靠性較低。
基于化學的檢驗方法是指采用化學診斷方法根據(jù)谷子組織液進行成分分析,從而獲悉生長體內的元素情況[3]。這類方法直接高效、結果準確,但操作耗時,同時會對農(nóng)作物造成一定程度的破壞,因此無法自動化、大規(guī)模地展開。此外,通過間接分析土壤或培養(yǎng)液的化學成分也可推斷農(nóng)作物體內的元素平衡情況,但實際研究表明,很難找到二者之間的關聯(lián)關系,且該方法對不同作物并不完全適用。
基于數(shù)字圖像處理方法是指利用計算機對不同圖像進行處理,該方法在作物營養(yǎng)診斷方面的應用非常廣泛[4]。使用數(shù)字圖像來對谷子元素缺失進行診斷具有工具簡單、方法可移植性高、對農(nóng)作物損耗小、費用低廉等優(yōu)點。是目前最適用于自動化大規(guī)模檢測谷子元素缺失診斷的有效手段。數(shù)字圖像處理方法包括傳統(tǒng)特征提取方法以及深度學習方法。傳統(tǒng)特征提取方法包括手工提取紅、綠、藍三種顏色特征[5],計算高光譜圖像灰度共生矩陣并提取葉片圖像區(qū)域的熵、二階矩、協(xié)同性、相異性、對比度以及相關性。通過計算葉片HSV圖像直方圖的一階、二階和三階矩來提取葉片特征[6]。使用全局特征(形狀上下文)和局部特征(SIFT特征描述子)提取葉片特征,并使用KNN對葉片所屬類別進行判斷[7]。使用基于核的模糊c-均值聚類(KFCM)對葉片區(qū)域進行聚類,再對其中的害蟲區(qū)域使用人工神經(jīng)網(wǎng)絡進行分類[8]。使用灰度共生矩陣提取葉片紋理信息,隨后使用SVM對農(nóng)作物營養(yǎng)性病害氮、磷、鎂進行檢測[9]。深度網(wǎng)絡提取特征方法包括使用卷積神經(jīng)網(wǎng)絡對去除葉柄后的葉片灰度圖像進行分類[10],采用AlexNet模型將在ImageNet圖像數(shù)據(jù)集上訓練得到的模型進行遷移與識別[11]等。
上述三種方法中,基于數(shù)字圖像處理方法效果較好。但不管是傳統(tǒng)手工提取特征方式還是深度特征提取方式均基于圖像單尺度特征,未考慮圖像的多尺度信息。因此,本文考慮引入多尺度信息來對谷子生成期缺素圖像進行識別。
本文將Inception結構引入神經(jīng)網(wǎng)絡單元,以便提取谷子生長期圖像多尺度信息,提升谷子生長期元素失衡判斷的準確率。同時,為增加模型的魯棒性,引入Dropout以及ReLU激活函數(shù)。最后,本文新建了一個谷子生長期圖像缺素數(shù)據(jù)集,為之后對谷子圖像進行更深入的缺素研究提供了數(shù)據(jù)基礎。
1 相關工作
1998年,Yann Lecun等人[12]提出了一個CNN模型LeNet-5,用以對手寫數(shù)字進行識別,取得了比較理想的識別效果。隨著計算機技術的飛速發(fā)展及可用訓練數(shù)據(jù)的大量增長,研究者們又相繼提出了很多性能更好的CNN模型,比如AlexNet[13],VGG[14],GoolgeNet[15],ResNet[16],
DenseNet[17]等,并應用于各種不同的識別任務中。鑒于后續(xù)CNN模型參數(shù)較多以及本文應用數(shù)據(jù)集規(guī)模較小的情況,我們的模型基于LeNet-5結構進行改進。LeNet-5共有8層,包含輸入層、輸出層、3個卷積層、2個池化層和1個全連接層。
2 方 法
2.1 相關基礎技術
2.1.1 激活函數(shù)
激活函數(shù)在卷積神經(jīng)網(wǎng)絡中起著非常重要的作用,作為非線性函數(shù),它不僅可以增強數(shù)據(jù)在網(wǎng)絡中的表達能力,還可以更好地處理非線性的復雜分類問題。
目前,sigmoid和tanh函數(shù)已被廣泛應用于人工神經(jīng)網(wǎng)絡[18]。其中,sigmoid將輸入映射到[0,1]之間,tanh將輸入映射到[-1,1]之間。它們可形式化為:
(1)
(2)
雖然sigmoid和tanh均可實現(xiàn)網(wǎng)絡的非線性激活,但它們均會出現(xiàn)梯度消失問題,得不到理想的網(wǎng)絡訓練結果。
為緩解上述梯度消失問題,ReLU(Rectified Linear Units)激活函數(shù)在文獻[19]中有涉及,其形式如下:
(3)
由公式(3)可以看出,ReLU函數(shù)只保留大于0的輸入值,因此其最大限度地保留了圖像特征,解決了梯度飽和問題,緩解了梯度消失問題且可加快收斂速度。
2.1.2 Inception結構
傳統(tǒng)的神經(jīng)網(wǎng)絡單元只基于單尺度特征,會影響任務性能。為解決該問題,研究者提出Inception結構[15]。該結構可將不同尺度的特征圖進行結合,從而提升網(wǎng)絡對圖像不同尺度特征的適應性。具體的Inception結構如圖1所示。
2.1.3 Dropout技術
深度神經(jīng)網(wǎng)絡的訓練對樣本數(shù)量要求較高,若訓練樣本數(shù)目較少而網(wǎng)絡規(guī)模較大,則在多數(shù)情況下會出現(xiàn)過擬合現(xiàn)象,即在訓練集上準確率很高,但在測試集上卻很低。為避免和緩解網(wǎng)絡過擬合,本文引入Dropout方法[20]進行優(yōu)化。
Dropout的核心思想是以一定的概率將隱藏層的激活值設為0,隨機讓它們失效,但并不刪除。即對于不同的輸入,隱藏層不同的節(jié)點被激活。該種方式導致每次輸入對應的網(wǎng)絡結構均未知且它們共享權值,在一定程度上可起到模型的高效平均。同時,這種操作可減少特征間的依賴性,避免某些特征在一些特征存在的情況下才起作用,增加了網(wǎng)絡模型的泛化性。
2.2 本文提出的模型
鑒于所處理數(shù)據(jù)規(guī)模較小的情況,本文采用LeNet-5基礎結構。但該模型在提取特征時只考慮了單尺度特征,忽略了多級特征包含的對識別有用的其他特征。為解決該問題,本文對LeNet-5進行了改進。在網(wǎng)絡中引入Inception結構來提取多尺度特征信息。同時為了避免或緩解過擬合現(xiàn)象,在網(wǎng)絡中的全連接層引入了Dropout;為緩解梯度消失問題,將網(wǎng)絡中的sigmoid激活函數(shù)替換成ReLU。
改進的網(wǎng)絡結構如圖2所示。
2.3 損失函數(shù)
本文模型采用的損失函數(shù)為交叉熵損失函數(shù):
(4)
式中:Y指圖像真實的標簽值;P指圖像預測的概率值;N為總的訓練樣本個數(shù);K為總的圖片類別數(shù)。
2.4 參數(shù)設置及訓練細節(jié)
本文采用隨機梯度下降算法進行權值的優(yōu)化更新,在網(wǎng)絡訓練中,學習率設為0.001;最大迭代次數(shù)設為100 000;衰減系數(shù)值為0.5;動量值設為0.9。
3 實 驗
3.1 數(shù)據(jù)集
為探索本文所提出的多尺度深度卷積神經(jīng)網(wǎng)絡的性能,本文新建了一個谷子生長期缺素數(shù)據(jù)集,包含六類圖像,分別是缺鉀、缺鎂、缺錳、缺硼、缺鐵及缺鋅圖像。每類圖像包含約1 000張圖像,其中80%用作訓練集,20%用作測試集。缺鉀、缺鎂、缺錳、缺硼、缺鐵及缺鋅示例如圖3所示。
谷子生長期數(shù)據(jù)集不同缺素類別圖片的數(shù)量見表1所列。
3.2.1 網(wǎng)絡模型訓練及分類結果
為驗證所提出模型的收斂性,圖4給出了其在迭代次數(shù)不斷增加的情況下,準確率和Loss的變化趨勢。從圖中可以看出訓練剛開始時,識別準確率迅速上升,損失值穩(wěn)步下降。在第1 000次迭代時,識別率達到94%,損失值從最初的3.76降至0.09。隨著迭代次數(shù)的進一步增加,模型參數(shù)不斷得到優(yōu)化,損失值緩慢下降,識別率不斷上升,在
第60 000次時準確率達到97.7%,隨后模型趨于穩(wěn)定。最后訓練結束時,識別率達到98%,Loss接近于0。
在模型訓練初期Loss較小,并未出現(xiàn)梯度爆炸的現(xiàn)象,表明本文所提出模型結構較為合理。在后面的迭代中,Loss并未出現(xiàn)大范圍的劇烈振蕩,表明網(wǎng)絡已經(jīng)收斂。
3.2.2 模型改進前后實驗結果對比
為驗證所提出的改進模型在谷子缺素識別應用中的優(yōu)越性,本小節(jié)將其與LeNet-5經(jīng)典網(wǎng)絡結構進行了對比。圖5和圖6分別展示了LeNet-5與本文改進算法的誤差與識別準確率隨迭代次數(shù)的變化趨勢。
從圖5可以看出,我們的方法與傳統(tǒng)的LeNet-5相比,可快速收斂,且誤差更小。圖6表明,我們的方法獲得了更高的準確率。上述結果說明所提出模型在準確性及收斂效率上均優(yōu)于LeNet-5,驗證了所提出模型的性能。
3.2.3 激活函數(shù)優(yōu)化前后性能對比
為驗證所提出模型中的ReLU激活函數(shù)在克服梯度消失問題上的優(yōu)越性,圖7給出了模型使用sigmoid及ReLU不同激活函數(shù)時的性能。由圖7可以看出,使用ReLU激活函數(shù)時模型獲得了更好的性能,驗證了ReLU激活函數(shù)在緩解梯度消失上的有效性。
3.2.4 Dropout優(yōu)化前后性能對比
為驗證Dropout優(yōu)化對模型的影響,圖8給出了模型在引入Dropout前后迭代10 000次的識別率變化趨勢。
如圖8所示,引入Dropout后,在迭代10 000次時,識別率由95.6% 提升到97.2%,驗證了Dropout的優(yōu)越性。需要注意的是,此處Dropout的概率值設為0.5。
為進一步驗證Dropout概率對模型性能的影響,表2給出了模型在不同概率值下迭代10 000次的識別率。從表2可以看出,概率值從0到0.5時,模型準確率隨概率值的增大而提升。而當概率值為0.9時,模型準確率反而下降。表2說明,在一定范圍內,Dropout的概率值越大,模型的魯棒性更強,性能更好。但當概率值超過一定閾值時,模型由于失效的節(jié)點過多而不能充分挖掘數(shù)據(jù)中的信息,從而導致性能下降。從表2得出Dropout概率值為0.5時,模型性能最佳。另一方面,Dropout概率值從0.3到0.5時,模型性能均優(yōu)于不加Dropout時的性能,進一步驗證了Dropout的優(yōu)越性。
3.2.5 Inception優(yōu)化前后實驗對比
為驗證Inception優(yōu)化對于模型的影響,圖9給出了模型在加入Inception優(yōu)化前后迭代10 000次的識別率變化趨勢。
如圖9所示,加入Inception之后,模型性能提升明顯,說明Inception引入的多層次特征對模型性能的提升非常關鍵。
4 結 語
本文基于LeNet-5提出了一個多尺度卷積模型,具體方法是在模型中引入Inception結構。同時,為提升模型的魯棒性,我們在模型的全連接層引入Dropout及在卷積層后引入ReLU激活函數(shù)。大量實驗表明,本文所提出模型在谷子生長期元素失衡識別中取得了優(yōu)于傳統(tǒng)單尺度模型的性能。同時,本文建立了一個新的谷子缺素數(shù)據(jù)集,為后續(xù)研究者開展谷子缺素研究提供了數(shù)據(jù)基礎。未來研究工作應聚焦構建更大更豐富的數(shù)據(jù)集,引入更多缺素類別,并提出更有效的谷類生長期缺素分類算法。
參 考 文 獻
[1]范青慈.植物營養(yǎng)元素缺乏癥的判斷及施肥[J].青海草業(yè),1994(2):41-43.
[2]陳繼俠,任艷華.植物缺氮、磷、鉀元素癥狀及防治技術[J].農(nóng)學學報,2008(9):51-52.
[3]唐菁,楊承棟,康紅梅.植物營養(yǎng)診斷方法研究進展[J].世界林業(yè)研究,2005,18(6):45-48.
[4] BLACKMER T M,SCHEPERS J S. Techniques for monitoring crop? nitrogen status in corn [J]. Communications in soil science and plant analysis,1994,25(9-10):1791-1800.
[5] JEYALAKSHMI S,RADHA R. A review on diagnosis of nutrient deficiency symptoms in plant leaf image using digital image processing [J]. ICTACT journal on image and video processing,2017,7(4):1515-1524.
[6] PATIL J K,KUMAR? R. Feature extraction of diseased leaf images [J]. Journal of signal and image processing,2012,3(1):60-63.
[7] WANG Z,LU B,CHI Z,et al. Leaf image classification with shape context and shift? descriptors [C]// International Conference? on Digital Image Computing: Techniques &Applications.IEEE Computer Society,2011.
[8] VINUSHREE N,HEMALATHA B,KALIAPPAN V K. Efficient kernel-based fuzzy c-means clustering for pest detection and classification [C]// Computing & Communication Technologies,2014.
[9] ASRAF H M,NOORITAWATI M T,RIZAM M S B S.A comparative study in kernel-based support vector machine of oil palm leaves nutrient disease [J]. Procedia engineering,2012,41:1353-1359.
[10]龔丁禧,曹長榮.基于卷積神經(jīng)網(wǎng)絡的農(nóng)作物葉片分類[J].計算機與現(xiàn)代化,2014(4):12-15.
[11]龍滿生,歐陽春娟,劉歡,等.基于卷積神經(jīng)網(wǎng)絡與遷移學習的油茶病害圖像識別[J]. Transactions of the Chinese society of agricultural engineering,2018,34(18):194-201.
[12] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient-based learning applied to document recognition [J]. Proceedings of the IEEE,1998,86(11):2278-2324.
[13] KRIZHEVSKY A,SUTSKEVER I,HINTON G. Imagenet classification with deep convolutional neural networks [C]// In Neural Information Processing Systems,2012.
[14] SIMONYAN K,ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [C]// In International conference on learning representations,2015.
[15] SZEGEDY C,LIU W,JIA Y ,et al. Going deeper with convolutions [C]// In:Proceedings Of The IEEE Conference On Computer Vision And Pattern Recognition,2015.
[16] HE K,ZHANG X,REN S,et al. Deep residual learning for image recognition [C]// In Proceedings of the IEEE conference on computer vision and pattern recognition,2016:770-778.
[17] HUANG G,LIU Z,VAN DER MAATEN L,et al. Densely connected convolutional networks [C]// In Proceedings of the IEEE conference on computer vision and pattern recognition,2017: 4700-4708.
[18]楊楠.基于Caffe深度學習框架的卷積神經(jīng)網(wǎng)絡研究[D].石家莊:河北師范大學,2016.
[19] GLOROT X,BORDES A,BENGIO Y. Deep sparse rectifier neural networks [C]// In Proceedings Of The Fourteenth International Conference On Artificial Intelligence And Statistics,2011:315-323.
[20] SRIVASTAVA N,HINTON G,KRIZHEVSKY A,et al. Dropout: a simple way to prevent neural networks from overfitting [J]. Journal of machine learning research,2014,15(1):1929-1958.