鄒立雯 梁春英 周 正 李 普 李圳鵬 張榮丹
(1 黑龍江八一農(nóng)墾大學(xué)工程學(xué)院 黑龍江大慶 163319;2 黑龍江八一農(nóng)墾大學(xué)信息與電氣工程學(xué)院 黑龍江大慶 163319)
水稻是我國(guó)主要的糧食作物之一,種植面積較大[1]。目前,由于水稻種植田塊高低不平、秸稈殘留、插秧機(jī)操作不當(dāng)?shù)葐?wèn)題,常發(fā)生水稻秧苗漏插、漂秧等情況,目前水稻田間秧苗識(shí)別還主要依賴于人工評(píng)估,這種傳統(tǒng)方式不僅費(fèi)時(shí)費(fèi)力,而且效率低下。隨著計(jì)算機(jī)信息技術(shù)的廣泛應(yīng)用,運(yùn)用圖像識(shí)別作物成為了可能,深度學(xué)習(xí)(Deep Learing,DL)是相對(duì)支持向量機(jī)、最大熵等“淺層學(xué)習(xí)”而言非線性、層級(jí)更多的新型學(xué)習(xí)模式,通過(guò)建立模型,模擬人類大腦對(duì)接收的信息進(jìn)行識(shí)別、處理與解釋。深度學(xué)習(xí)通過(guò)數(shù)據(jù)集訓(xùn)練和學(xué)習(xí),特征提取,可以快速準(zhǔn)確識(shí)別秧苗,在精度和實(shí)時(shí)性方面遠(yuǎn)超傳統(tǒng)作業(yè)方式,對(duì)水稻秧苗識(shí)別具有重要意義。
本文綜述了近年來(lái)國(guó)內(nèi)外水稻秧苗識(shí)別領(lǐng)域深度學(xué)習(xí)的相關(guān)研究,以期為研究者提供更多參考。
深度學(xué)習(xí)的優(yōu)勢(shì)在于特征學(xué)習(xí),即從初始數(shù)據(jù)中自動(dòng)提取特征,由較低階特征組合成更高層次特征[2]。不同的深度學(xué)習(xí)由各種不同組件構(gòu)成,具體取決于所使用的網(wǎng)絡(luò)類型。當(dāng)前網(wǎng)絡(luò)主要有卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)[3]、遞歸神經(jīng)網(wǎng)絡(luò)(Recursive Neural Network, RNN)[4]、棧式自編碼網(wǎng)絡(luò)(Stacked Auto Encoder)[5]、深 度 置 信 網(wǎng) 絡(luò)(Deep Belief Network, DBN)[6]等,其中卷積神經(jīng)網(wǎng)絡(luò)是農(nóng)業(yè)中最常用的一種網(wǎng)絡(luò)模型。
深度學(xué)習(xí)網(wǎng)絡(luò)基本構(gòu)成為卷積層(Convolution layer)、池化層(Pooling layer)、全連接層(Fully connected layer)、損 失函 數(shù)(Loss function)、激活函數(shù)(Activation Function)等。卷積層包括多個(gè)卷積單元,用于從原始圖像中提取復(fù)雜特征;池化層可以有效提取復(fù)雜特征信息,通過(guò)權(quán)矩陣集成局部信息,并輸出降維信息;全連接層在整個(gè)網(wǎng)絡(luò)中起“分類器”作用,將每一節(jié)點(diǎn)與上一層的節(jié)點(diǎn)相連,進(jìn)行特征提取;損失函數(shù)用于判斷模型輸出與實(shí)際值間的誤差,常用的損失函數(shù)有最小二乘損失函數(shù)、指數(shù)損失函數(shù)等;激活函數(shù)是深入學(xué)習(xí)建模的重要組成部分;神經(jīng)網(wǎng)絡(luò)通過(guò)激活函數(shù)進(jìn)行非線性學(xué)習(xí),常用功能包括Sigmoid、Tanne、Relu等。
目前,卷積神經(jīng)網(wǎng)絡(luò)是發(fā)展比較成熟的深度學(xué)習(xí)網(wǎng)絡(luò)[7],20 世紀(jì)90 年代LeNet5 的出現(xiàn)標(biāo)志著卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)初步成熟[8]。卷積神經(jīng)網(wǎng)絡(luò)包含輸入層、隱含層、輸出層,其中輸入層可以處理多維數(shù)據(jù),一般對(duì)原始數(shù)據(jù)進(jìn)行初步處理,經(jīng)過(guò)灰化度與歸一化,使數(shù)據(jù)特征更加顯著;隱含層為卷積神經(jīng)網(wǎng)絡(luò)的核心,經(jīng)卷積層提取特征數(shù)據(jù),由池化層選擇和過(guò)濾信息,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)并輸出降維信息,最后由全連接層分類整合傳遞給輸出層,由輸出層結(jié)合邏輯函數(shù)或歸一化函數(shù)輸出分類標(biāo)簽。
遞歸神經(jīng)網(wǎng)絡(luò)是空間上的展開(kāi),處理的是樹(shù)狀結(jié)構(gòu)的信息,分為全局反饋遞歸網(wǎng)絡(luò)、前向遞歸神經(jīng)網(wǎng)絡(luò)、混合型遞歸網(wǎng)絡(luò)。遞歸神經(jīng)網(wǎng)絡(luò)可以描述系統(tǒng)的動(dòng)態(tài)特征,使動(dòng)態(tài)數(shù)據(jù)在網(wǎng)絡(luò)中循環(huán),并將動(dòng)態(tài)特征與信息儲(chǔ)存[9];遞歸神經(jīng)網(wǎng)絡(luò)的隱含層環(huán)環(huán)相扣,對(duì)于上一結(jié)點(diǎn)的數(shù)據(jù)有記憶功能,并添加到當(dāng)前的計(jì)算中。
棧式自編碼網(wǎng)絡(luò)是基于自編碼神經(jīng)網(wǎng)絡(luò)改進(jìn)而成[10],由多層訓(xùn)練好的自編碼器組成,有效減少了自編碼網(wǎng)絡(luò)由于數(shù)據(jù)隨機(jī)初始化而造成的參數(shù)無(wú)法調(diào)節(jié)問(wèn)題,保證了數(shù)據(jù)的穩(wěn)定性;這種每層都由自編碼器單獨(dú)訓(xùn)練的好處是提高了算法準(zhǔn)確性,收斂效果更好。
深度置信網(wǎng)絡(luò)[11-12]是由無(wú)數(shù)個(gè)受限玻爾茲曼機(jī)(Restricted Boltzmann Machine,RBM)與單層反向傳播神經(jīng)網(wǎng)絡(luò)構(gòu)成,為生成概率模型;通過(guò)對(duì)數(shù)據(jù)高階相關(guān)性描述,得到聯(lián)合分布概率,推斷樣本的分布,常用來(lái)進(jìn)行文字檢測(cè)、人臉識(shí)別、遙感圖像分類等。
水稻秧苗識(shí)別對(duì)提高插秧質(zhì)量、預(yù)測(cè)產(chǎn)量等有重要意義。李愛(ài)傳等[13]通過(guò)監(jiān)測(cè)水稻的生長(zhǎng)指導(dǎo)水稻生產(chǎn)。景卓鑫等[14]使用神經(jīng)網(wǎng)絡(luò)與雷達(dá)結(jié)合實(shí)現(xiàn)水稻參數(shù)的估算,繪制水稻不同時(shí)期的空間分布圖,實(shí)現(xiàn)水稻生物量的生長(zhǎng)監(jiān)測(cè)。遲德霞等[15]基于模糊C均值聚類對(duì)水稻秧苗進(jìn)行圖像分割,發(fā)現(xiàn)對(duì)水稻圖像與背景像素的不同聚類點(diǎn)進(jìn)行分割,平均誤差率在1.5%,大大改善了插秧機(jī)的精確度。陳信新等[16]基于機(jī)器視覺(jué)對(duì)水稻的發(fā)育形態(tài)和生長(zhǎng)環(huán)境進(jìn)行識(shí)別,采用聚類算法對(duì)圖像進(jìn)行分割,結(jié)合Hough 預(yù)處理,秧苗識(shí)別準(zhǔn)確度達(dá)到87.5%,秧苗形態(tài)參數(shù)誤差不超過(guò)7%。Wang Y Y等[17]利用線性混合模型對(duì)水稻生物量進(jìn)行估測(cè),與傳統(tǒng)機(jī)器學(xué)習(xí)算法進(jìn)行比較,結(jié)果表明,線性混合效應(yīng)模型可以準(zhǔn)確估計(jì)水稻生物量和葉面積指數(shù),固定翼無(wú)人機(jī)在監(jiān)測(cè)大規(guī)模農(nóng)田作物生長(zhǎng)狀況方面很有前景。Vlaminck L 等[18]通過(guò)自動(dòng)計(jì)算機(jī)分析水稻幼苗的相關(guān)參數(shù),這種新型、穩(wěn)健、快速基于表型的水稻篩選方法與預(yù)期的植物生長(zhǎng)調(diào)節(jié)一致,揭示了該裝置在重現(xiàn)性方面的穩(wěn)健性。王姍姍等[19]提出基于特征點(diǎn)鄰域Hough 變換的水稻秧苗檢測(cè)方法,結(jié)合Faster RCNN 網(wǎng)絡(luò)對(duì)水稻秧苗的特征點(diǎn)進(jìn)行提取,這種方法對(duì)測(cè)試秧苗的平均識(shí)別準(zhǔn)確度達(dá)到92%,對(duì)曲率較大的秧苗行也能準(zhǔn)確識(shí)別。陳旭君等[20]提出基于YOLO 卷積神經(jīng)網(wǎng)絡(luò)對(duì)水稻秧苗的行線檢測(cè),通過(guò)YOLO網(wǎng)絡(luò)對(duì)水稻圖片訓(xùn)練,對(duì)秧苗進(jìn)行定位,檢測(cè)行線標(biāo)準(zhǔn),相比Faster R-CNN和Res Net101,該方法泛化能力更強(qiáng)、魯棒性更好。Ramadhani等[21]開(kāi)發(fā)了一個(gè)自動(dòng)繪圖工作流,使用多源遙感數(shù)據(jù)(Sentinel-2、MOD13Q1和Sentinel-1)以10 m 空間分辨率繪制水稻生長(zhǎng)階段的近實(shí)時(shí)多時(shí)相地圖,基于Sentinel-2的模型分類給出了90.6%的總體準(zhǔn)確率,融合模型MOD13Q1/Sentinel-1顯示了78.3%,Sentinel-2/MOD13Q1/Sentinel-1 的集成精度為84.15%。Ramadhani 進(jìn)行改進(jìn)[22],提出Sentinel-2 分類過(guò)程中的一些變化,以提高總體績(jī)效,這將為農(nóng)業(yè)決策者提供更好的信息。Yang M D等[23]將卷積神經(jīng)網(wǎng)絡(luò)與無(wú)人機(jī)結(jié)合,介紹了一種利用ExGR 索引生成水稻幼苗訓(xùn)練數(shù)據(jù)的半自動(dòng)標(biāo)注方法,采用k倍交叉驗(yàn)證,以獲得訓(xùn)練與測(cè)試比數(shù)據(jù)為80/20 的分割比。網(wǎng)絡(luò)的精度隨著歷元的增加而增加,交叉驗(yàn)證數(shù)據(jù)集的所有劃分均達(dá)到0.99的精度。Ramadhani F等[24]提出了光學(xué)(PROBA-V)和雷達(dá)(Sentinel-1)圖像的集成,用于水稻生長(zhǎng)階段的時(shí)間地圖繪制,PROBA-V 的水稻生長(zhǎng)階段模型的總體準(zhǔn)確率為83.87%,使用支持向量機(jī)分類器的Sentinel-1模型的準(zhǔn)確率為71.74%。植被面積和收獲面積之間的平均相關(guān)性為0.50,滯后時(shí)間為89.5 d,這一結(jié)果與當(dāng)?shù)亟y(tǒng)計(jì)數(shù)據(jù)相似。徐建鵬等[25]提 出 一 種 基 于Rectified Adam 優(yōu) 化 器 的ResNet50卷積神經(jīng)網(wǎng)絡(luò)圖像識(shí)別方法,對(duì)水稻生育期 進(jìn) 行 自 動(dòng) 識(shí) 別, 并 于VGG16、 VGG19、ResNet50 和Inception v3 進(jìn)行對(duì)比分析圖像識(shí)別能力,結(jié)果表明,在真實(shí)場(chǎng)景下,Rectified Adam 優(yōu)化器的ResNet50 卷積神經(jīng)網(wǎng)絡(luò)分類識(shí)別準(zhǔn)確率在97.33%,穩(wěn)定性好、收斂速度快、魯棒性強(qiáng)。朱偉等[26]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)Google Net 對(duì)水稻秧苗進(jìn)行形態(tài)識(shí)別,采用無(wú)人機(jī)進(jìn)行低空拍照,Google Net 訓(xùn)練數(shù)據(jù),對(duì)單穴秧苗分類識(shí)別,平均識(shí)別正確率為91.17%,平均耗時(shí)0.27 s,與傳統(tǒng)支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)相比,分類精度分別提高21%、13%,時(shí)間分別縮短了1.09、0.58 s。
本文介紹了深度學(xué)習(xí)在水稻秧苗識(shí)別中的應(yīng)用,前期試驗(yàn)表明,深度學(xué)習(xí)在水稻秧苗識(shí)別上的準(zhǔn)確度可達(dá)90%以上,可幫助插秧機(jī)有效規(guī)避錯(cuò)誤,實(shí)現(xiàn)水稻的優(yōu)質(zhì)高產(chǎn)。深度學(xué)習(xí)是目前最具潛力的圖像識(shí)別方法,具有良好的泛化能力和魯棒性,在水稻秧苗識(shí)別中可以有效提取圖像特征,擴(kuò)展數(shù)據(jù)集,節(jié)省更多的人工成本。
目前,有關(guān)深度學(xué)習(xí)的研究大多還處于試驗(yàn)階段,僅簡(jiǎn)單將采集到的圖片發(fā)送給終端,在水稻圖像集收集及前期處理過(guò)程中還存在很多問(wèn)題亟待解決,如田間圖片背景復(fù)雜,光線造成陰影斑駁等,后期訓(xùn)練過(guò)程中也出現(xiàn)數(shù)據(jù)集樣本不典型、過(guò)擬合等問(wèn)題。