摘要:隨著人工智能、計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)等科學(xué)技術(shù)在農(nóng)業(yè)領(lǐng)域的發(fā)展與應(yīng)用,數(shù)據(jù)驅(qū)動(dòng)的農(nóng)業(yè)深度學(xué)習(xí)模型成為農(nóng)業(yè)科學(xué)的新型研究范式,農(nóng)業(yè)數(shù)據(jù)集是深度學(xué)習(xí)模型訓(xùn)練的基礎(chǔ),高質(zhì)量、大規(guī)模、多樣性的數(shù)據(jù)集能夠有效提升模型性能,從而助力深度學(xué)習(xí)在智慧農(nóng)業(yè)領(lǐng)域的應(yīng)用。為幫助相關(guān)領(lǐng)域研究者更好地了解數(shù)據(jù)對(duì)于深度學(xué)習(xí)的驅(qū)動(dòng)力,充分發(fā)揮深度學(xué)習(xí)在農(nóng)業(yè)領(lǐng)域的應(yīng)用,本文通過(guò)計(jì)量分析的方法,總結(jié)農(nóng)業(yè)數(shù)據(jù)集的類型、規(guī)模、來(lái)源等基本特質(zhì),根據(jù)深度學(xué)習(xí)方法將其劃分為目標(biāo)檢測(cè)、圖像分割、圖像識(shí)別等4個(gè)類別,根據(jù)應(yīng)用領(lǐng)域?qū)⑵鋭澐譃橐曈X(jué)導(dǎo)航、特征識(shí)別、無(wú)損檢測(cè)等7個(gè)類別。結(jié)果顯示,數(shù)據(jù)集類型以圖像數(shù)據(jù)為主,圖像的數(shù)據(jù)量主要集中在50—1 500張范圍內(nèi),由于農(nóng)業(yè)數(shù)據(jù)采集的特殊性,數(shù)據(jù)集大部分由個(gè)人構(gòu)建,部分來(lái)自公開(kāi)數(shù)據(jù)集,主要利用數(shù)據(jù)集開(kāi)展特征識(shí)別。在未來(lái),隨著模型的規(guī)模越來(lái)越大,對(duì)于數(shù)據(jù)集的要求也不斷升級(jí),因此需要持續(xù)構(gòu)建大規(guī)模、分布均衡、標(biāo)注準(zhǔn)確的數(shù)據(jù)集。本文通過(guò)強(qiáng)調(diào)數(shù)據(jù)對(duì)深度學(xué)習(xí)模型的驅(qū)動(dòng)力及重要性,為數(shù)據(jù)推動(dòng)深度學(xué)習(xí)農(nóng)業(yè)應(yīng)用提供理論依據(jù)。
關(guān)鍵詞:數(shù)字農(nóng)業(yè);深度學(xué)習(xí);數(shù)據(jù)集;計(jì)量分析
1 "引言
1949年,機(jī)器學(xué)習(xí)誕生于赫布理論。隨著21世紀(jì)大數(shù)據(jù)時(shí)代的到來(lái),人們對(duì)于數(shù)據(jù)的收集和掌控能力逐漸提升,以海量數(shù)據(jù)為支撐的深度學(xué)習(xí)應(yīng)運(yùn)而生。深度學(xué)習(xí)是一個(gè)前沿的數(shù)據(jù)分析和圖像處理工具,最早在2006年由Geoffrey Hinton和他的學(xué)生提出[1],作為機(jī)器學(xué)習(xí)的一個(gè)分支,深度學(xué)習(xí)以人工神經(jīng)網(wǎng)絡(luò)為架構(gòu),通過(guò)大規(guī)模矩陣運(yùn)算開(kāi)展高效處理圖像、目標(biāo)檢測(cè)、圖像分類、精準(zhǔn)預(yù)測(cè)等工作,其在圖像識(shí)別領(lǐng)域的應(yīng)用對(duì)于計(jì)算機(jī)視覺(jué)來(lái)說(shuō)是一次技術(shù)革新[2],相較于傳統(tǒng)機(jī)器視覺(jué)方法,深度學(xué)習(xí)的優(yōu)勢(shì)在于處理數(shù)據(jù)量大、處理速度快且圖像識(shí)別精度高[3]。
當(dāng)今世界面臨勞動(dòng)力短缺、自然資源匱乏、耕地水平退化、極端天氣等多重壓力,農(nóng)業(yè)生產(chǎn)效率落后于世界人口的增長(zhǎng)速度,保護(hù)糧食安全迫在眉睫。機(jī)器人、無(wú)人機(jī)、傳感器等現(xiàn)代科技裝備激勵(lì)著農(nóng)業(yè)數(shù)據(jù)學(xué)家和農(nóng)藝家們開(kāi)發(fā)新的工具和程序,人工智能由此被廣泛地應(yīng)用在智慧農(nóng)業(yè)領(lǐng)域[4]。深度學(xué)習(xí)基于圖像分類能夠提高農(nóng)作物的產(chǎn)量與質(zhì)量,在農(nóng)業(yè)領(lǐng)域主要應(yīng)用于作物產(chǎn)量預(yù)測(cè)、植物脅迫檢測(cè)、雜草和害蟲(chóng)檢測(cè)、災(zāi)害監(jiān)測(cè)以及智慧農(nóng)場(chǎng)[5]。深度學(xué)習(xí)通過(guò)多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),提取出農(nóng)業(yè)數(shù)據(jù)的特征,為農(nóng)業(yè)生產(chǎn)者提供精準(zhǔn)的決策方案,改變勞動(dòng)密集型的農(nóng)業(yè)生產(chǎn)方式,提高農(nóng)業(yè)生產(chǎn)效率,拉動(dòng)農(nóng)業(yè)經(jīng)濟(jì)增長(zhǎng),解決糧食安全問(wèn)題,成為發(fā)展可持續(xù)高效農(nóng)業(yè)的重要工具[6]。
深度學(xué)習(xí)模型準(zhǔn)確率高、邏輯能力強(qiáng)、可適用性強(qiáng)等特點(diǎn),都是建立在龐大的數(shù)據(jù)集基礎(chǔ)上才可以實(shí)現(xiàn)[7],例如Imagenet數(shù)據(jù)庫(kù)包含了一千多萬(wàn)張圖像,對(duì)深度學(xué)習(xí)模型的訓(xùn)練有強(qiáng)大的推動(dòng)能力。數(shù)據(jù)集是深度學(xué)習(xí)模型訓(xùn)練的基礎(chǔ),數(shù)據(jù)集的數(shù)據(jù)量、數(shù)據(jù)復(fù)雜性、數(shù)據(jù)質(zhì)量對(duì)于深度學(xué)習(xí)模型的訓(xùn)練和性能至關(guān)重要,一定參數(shù)量是訓(xùn)練機(jī)器人開(kāi)展視覺(jué)分析的前提,大量可訓(xùn)練數(shù)據(jù)能充分發(fā)揮深度學(xué)習(xí)模型的特征提取和圖像分析能力[8],數(shù)據(jù)的復(fù)雜性能夠?yàn)樯疃葘W(xué)習(xí)模型提供更多的可能性,高質(zhì)量、標(biāo)注完整的數(shù)據(jù)集能夠提高模型的性能[9]。因此,對(duì)于深度學(xué)習(xí)模型訓(xùn)練來(lái)說(shuō),規(guī)模大、質(zhì)量高、標(biāo)注完整的數(shù)據(jù)集能夠保障模型的質(zhì)量、提高其泛化能力及魯棒性[10]。在現(xiàn)代農(nóng)業(yè)領(lǐng)域中,農(nóng)業(yè)數(shù)據(jù)的獲取方式不斷更新進(jìn)步,通過(guò)手機(jī)、相機(jī)、Go Por、傳感器、無(wú)人機(jī)、網(wǎng)絡(luò)爬蟲(chóng)、巡檢機(jī)器人等方式采集數(shù)據(jù),為深度學(xué)習(xí)模型訓(xùn)練提供了大量的參數(shù)量,進(jìn)一步促進(jìn)了深度學(xué)習(xí)在農(nóng)業(yè)圖像識(shí)別領(lǐng)域的發(fā)展。
在利用深度學(xué)習(xí)算法識(shí)別農(nóng)作物、蟲(chóng)害、畜禽、農(nóng)田及地物的過(guò)程中,都是以數(shù)據(jù)作為支撐進(jìn)行相關(guān)研究。因此,本文抽取了近三年深度學(xué)習(xí)應(yīng)用在農(nóng)業(yè)領(lǐng)域的257篇論文進(jìn)行調(diào)查分析,從數(shù)據(jù)集類型、數(shù)據(jù)量、數(shù)據(jù)集來(lái)源、深度學(xué)習(xí)方法、數(shù)據(jù)集應(yīng)用領(lǐng)域5個(gè)方面對(duì)文獻(xiàn)進(jìn)行計(jì)量分析,總結(jié)農(nóng)業(yè)數(shù)據(jù)集的特征,強(qiáng)調(diào)數(shù)據(jù)在深度學(xué)習(xí)中的重要性,幫助相關(guān)研究者更好地理解數(shù)據(jù)對(duì)于深度學(xué)習(xí)模型的驅(qū)動(dòng)力,充分發(fā)揮深度學(xué)習(xí)在農(nóng)業(yè)領(lǐng)域的應(yīng)用效果。
2 "數(shù)據(jù)集分析
數(shù)據(jù)集是深度學(xué)習(xí)模型訓(xùn)練的基礎(chǔ),數(shù)據(jù)集的規(guī)模、質(zhì)量、標(biāo)準(zhǔn)、完整度對(duì)于模型的性能、魯棒性、精準(zhǔn)性來(lái)說(shuō)都至關(guān)重要。本文檢索了2020—2023年發(fā)布的深度學(xué)習(xí)應(yīng)用于農(nóng)業(yè)領(lǐng)域的論文,并計(jì)量分析了文獻(xiàn)中的數(shù)據(jù)集情況,下面從數(shù)據(jù)集類型、數(shù)據(jù)量、數(shù)據(jù)集來(lái)源三個(gè)方面對(duì)數(shù)據(jù)集進(jìn)行綜合分析。
2.1 "數(shù)據(jù)集類型
深度學(xué)習(xí)被應(yīng)用到各行各業(yè),從整體來(lái)說(shuō),數(shù)據(jù)集類型包括圖像數(shù)據(jù)、遙感數(shù)據(jù)、視頻數(shù)據(jù)、音頻數(shù)據(jù)、數(shù)值數(shù)據(jù)等。根據(jù)257篇論文的統(tǒng)計(jì)分析,大部分農(nóng)業(yè)數(shù)據(jù)集類型為圖像數(shù)據(jù)、遙感數(shù)據(jù)、其他數(shù)據(jù)等,尤其以圖像數(shù)據(jù)為主要類型,如圖1所示,圖像數(shù)據(jù)占比78.23%,遙感數(shù)據(jù)占比15.73%,其他數(shù)據(jù)占比6.05%。究其原因,目前深度學(xué)習(xí)方法主要針對(duì)圖像、遙感及視頻數(shù)據(jù),而對(duì)于數(shù)值數(shù)據(jù)、序列數(shù)據(jù)等的應(yīng)用較少。通過(guò)分析數(shù)據(jù)集類型,篩選出248個(gè)類型明確的數(shù)據(jù)集。
如表1所示,圖像數(shù)據(jù)占比78.23%,論文數(shù)量為194篇,其主要分布為畜禽、作物、水果、病蟲(chóng)害、昆蟲(chóng)、花朵、雜草、農(nóng)田火源、農(nóng)田障礙物。其中以作物圖像為主,有80篇,其次是病蟲(chóng)害圖像,有53篇,再次是畜禽和水果圖像,分別有20和25篇,最后,以昆蟲(chóng)、花朵、雜草、農(nóng)田火源、農(nóng)田障礙物圖像為數(shù)據(jù)集的論文較少。遙感數(shù)據(jù)占比15.73%,論文數(shù)量為39篇,其中,耕地和作物的遙感圖像較多,分別有16和19篇,以河流和設(shè)施農(nóng)業(yè)遙感圖像為數(shù)據(jù)集的論文較少。其他數(shù)據(jù)占比6.05%,論文數(shù)量為15篇,其中,以氣象數(shù)據(jù)為數(shù)據(jù)集的論文最多,有7篇,以農(nóng)產(chǎn)品數(shù)據(jù)、視頻、音頻、光譜圖像、蛋白質(zhì)質(zhì)譜數(shù)據(jù)為數(shù)據(jù)集的文章較少。
2.2 "數(shù)據(jù)量
深度學(xué)習(xí)在各個(gè)領(lǐng)域的成功應(yīng)用,離不開(kāi)大規(guī)模的數(shù)據(jù)集,模型的訓(xùn)練需要大量的數(shù)據(jù),深度學(xué)習(xí)模型在數(shù)據(jù)量基礎(chǔ)上才能有效提取數(shù)據(jù)中的特征,數(shù)據(jù)量過(guò)少,模型難以獲取數(shù)據(jù)特征,導(dǎo)致模型訓(xùn)練時(shí)誤差率不能較好收斂,質(zhì)量較差。數(shù)據(jù)集的規(guī)模不僅能決定模型的精度與準(zhǔn)確率,并且一定規(guī)模的數(shù)據(jù)量可較好避免模型的過(guò)擬合發(fā)生,達(dá)到較強(qiáng)的模型泛化能力和魯棒性。
如圖2所示,在統(tǒng)計(jì)分析的文獻(xiàn)中,圖像數(shù)據(jù)的數(shù)據(jù)量集中在500—1500張范圍內(nèi),共57篇,數(shù)據(jù)量在1 500—3 000張范圍內(nèi)的論文有40篇,其次是數(shù)據(jù)量在0—200張、200—500張、3 000—5 000張的文章,分別有19篇、24篇、23篇,數(shù)據(jù)量在5 000—10 000張、10 000—15 000張、20 000張以上的文章較少,分別有8篇、10篇、11篇,數(shù)據(jù)量在15 000—20 000張范圍內(nèi)的文章最少,僅有2篇。相對(duì)于人臉、車輛、交通等非農(nóng)業(yè)數(shù)據(jù)集,農(nóng)業(yè)數(shù)據(jù)集的規(guī)模偏小,數(shù)據(jù)數(shù)量較少。例如SMFRD人臉數(shù)據(jù)庫(kù)包括50萬(wàn)張人臉圖像[11],這是因?yàn)檗r(nóng)業(yè)數(shù)據(jù)的人工耗費(fèi)大、采集難度大、場(chǎng)景較復(fù)雜、作物生長(zhǎng)具有季節(jié)性,所以整體來(lái)說(shuō)農(nóng)業(yè)的數(shù)據(jù)量較少。
遙感圖像以景為單位,空間較大,每景可達(dá)8GB以上,遠(yuǎn)遠(yuǎn)大于普通圖像大小,遙感圖像主要分布在1—25景范圍內(nèi),如馬永健等基于GF-1遙感影像對(duì)荒漠區(qū)耕地進(jìn)行分類提取[12]、宋曉倩等利用6景遙感圖像對(duì)葡萄種植信息進(jìn)行提取[13]、袁盼麗等利用22景多時(shí)相遙感影像監(jiān)測(cè)寒旱區(qū)土地利用及變化情況[14]。
2.3 "數(shù)據(jù)集來(lái)源
從深度學(xué)習(xí)模型應(yīng)用場(chǎng)景來(lái)看,農(nóng)業(yè)模型的應(yīng)用場(chǎng)景主要為大田、設(shè)施、室內(nèi)、山坡、高原等,場(chǎng)景類型各異、環(huán)境復(fù)雜、作物生育期較長(zhǎng),數(shù)據(jù)采集難度相對(duì)較大;從農(nóng)業(yè)采集對(duì)象來(lái)看,包括作物、水果、畜禽、蟲(chóng)害等;從農(nóng)業(yè)數(shù)據(jù)獲取方式來(lái)看,主要包括遙感衛(wèi)星、無(wú)人機(jī)、智能手機(jī)、相機(jī)、攝像頭、傳感器、專用儀器設(shè)備等,獲取方式多樣,數(shù)據(jù)類型各異。根據(jù)以上三點(diǎn),構(gòu)建數(shù)據(jù)集不僅需要耗費(fèi)大量人力物力,且周期長(zhǎng)、后期處理難度大。因此,數(shù)據(jù)集既由個(gè)人構(gòu)建,又來(lái)源于公開(kāi)數(shù)據(jù)集,或者兩者相結(jié)合形成新的數(shù)據(jù)集。
將數(shù)據(jù)集來(lái)源劃分為個(gè)人構(gòu)建、公開(kāi)數(shù)據(jù)集、網(wǎng)絡(luò)、衛(wèi)星遙感數(shù)據(jù)以及其他數(shù)據(jù),如圖3所示,數(shù)據(jù)集主要由個(gè)人構(gòu)建,占比66.67%,來(lái)源于公開(kāi)數(shù)據(jù)集的占比11.7%,來(lái)源于網(wǎng)絡(luò)的占比7.8%。這是由于通用性強(qiáng)、數(shù)據(jù)量大、數(shù)據(jù)類型齊全的公開(kāi)數(shù)據(jù)集較少,研究者們通常根據(jù)課題需求自建數(shù)據(jù)集。
如表2所示,個(gè)人構(gòu)建的數(shù)據(jù)集最多,占比66.67%,使用頻率188次,采集方式為手機(jī)、相機(jī)、攝像頭、無(wú)人機(jī)等。其中,大部分使用手機(jī)和相機(jī)采集數(shù)據(jù),使用頻率分別為60和65次,少部分使用攝像頭、無(wú)人機(jī)、光譜成像設(shè)備、圖像采集系統(tǒng)采集數(shù)據(jù),使用頻率分別為11、17、11、16次,誘蟲(chóng)燈、孢子囊捕捉設(shè)備、錄音設(shè)備及傳感器的使用頻率最低。
其次是公開(kāi)數(shù)據(jù)集,占比11.7%,使用頻率33次,具體包括GWHD、PlantVilllage、Imagenet等多個(gè)公開(kāi)數(shù)據(jù)集,這些數(shù)據(jù)集具有較高的準(zhǔn)確性、完整性及可靠性。大部分論文的數(shù)據(jù)來(lái)源于 PlantVillage,使用頻率12次,少部分來(lái)源于Ai Challenger2,使用頻率4次。
再次是衛(wèi)星遙感數(shù)據(jù),占比10.99%,使用頻率
31次,具體包括中國(guó)資源衛(wèi)星應(yīng)用中心、GEE平臺(tái)、WHU-RS19等。其中,中國(guó)資源衛(wèi)星應(yīng)用中心的使用頻率最高,達(dá)20次,其次是LandSat-8衛(wèi)星遙感圖像和Google Earth。
來(lái)源于網(wǎng)絡(luò)的較少,占比7.8%,使用頻率22次。其中,主要通過(guò)網(wǎng)絡(luò)爬蟲(chóng)獲取數(shù)據(jù),使用頻率11次,其次是通過(guò)搜索引擎獲取數(shù)據(jù),數(shù)據(jù)集來(lái)源于氣象數(shù)據(jù)網(wǎng)和農(nóng)業(yè)網(wǎng)站的論文較少。
來(lái)源于其他數(shù)據(jù)的最少,使用頻率8次,具體包括國(guó)家統(tǒng)計(jì)局、高校、研究所、國(guó)家級(jí)和省級(jí)農(nóng)業(yè)數(shù)據(jù)、氣象站、DIA 質(zhì)譜數(shù)據(jù)集,這類數(shù)據(jù)具有明確的用途和目的,多用于資源管理、氣象預(yù)測(cè)以及課題研究,具有一定的權(quán)威性和研究目的性[15]。
3 "模型方法
深度學(xué)習(xí)作為一種重要的人工智能模型方法,具備多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)模擬人腦神經(jīng)元的工作機(jī)制,對(duì)海量數(shù)據(jù)進(jìn)行特征提取,具有強(qiáng)大的學(xué)習(xí)和表達(dá)能力,廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等領(lǐng)域。在農(nóng)業(yè)領(lǐng)域與傳統(tǒng)農(nóng)業(yè)結(jié)合創(chuàng)新出智能模型方法,常被應(yīng)用于農(nóng)業(yè)領(lǐng)域的目標(biāo)檢測(cè)、圖像分割、圖像識(shí)別、評(píng)估等場(chǎng)景,成為農(nóng)業(yè)育種、生產(chǎn)、管理的科學(xué)工具[16]。其中,目標(biāo)檢測(cè)是基于計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)、圖像處理等多種學(xué)科交叉的一種方法,常用于作物品種、病蟲(chóng)害、動(dòng)植物表型等的識(shí)別與檢測(cè)[17];圖像分割是計(jì)算機(jī)視覺(jué)領(lǐng)域的重要部分,通過(guò)從輸入層中提取出有意義并連貫的區(qū)域,以完成作物植株、莖稈、葉片、種子等分割任務(wù)[18]。
如圖4所示,在統(tǒng)計(jì)分析的深度學(xué)習(xí)方法中,目標(biāo)檢測(cè)占比34.83%,圖像識(shí)別占比32.96%,圖像分割占比28.84%,預(yù)測(cè)占比3.37%,目標(biāo)檢測(cè)、圖像分割、圖像識(shí)別三者所占的比例相當(dāng),可見(jiàn)在深度學(xué)習(xí)在農(nóng)業(yè)領(lǐng)域中的應(yīng)用主要集中于這三個(gè)方面。
如表3所示,目標(biāo)檢測(cè)占比最高達(dá)到34.83%,使用頻率93次,包括YOLO v5、SSD、Resnet50等目標(biāo)檢測(cè)模型。其中,YOLO v5的使用頻率最高,達(dá)23次,其次是YOLO v3,使用頻率20次,再次是YOLO v4,使用頻率14次,EfficientDet、SSD、Center Net等16種目標(biāo)檢測(cè)模型的使用頻率較低,共36次。
圖像識(shí)別占比略低于目標(biāo)檢測(cè)為32.96%,使用頻率88次,包括卷積神經(jīng)網(wǎng)絡(luò)CNN、DenseNet、VGG16等。其中,卷積神經(jīng)網(wǎng)絡(luò)CNN的使用頻率最高,達(dá)40次,其次是殘差神經(jīng)網(wǎng)絡(luò)ResNet,使用頻率14次,
再次是VGG16和DenseNet,使用頻率分別為9次和7次,BM-DCNN、FCN、TCN等14種圖像識(shí)別算法的使用頻率較少,共18次。
圖像分割占比28.84%,使用頻率77次,包括U-Net、DeepLabv3+等。其中,F(xiàn)aster R-CNN語(yǔ)義分割模型的使用頻率最高,達(dá)19次,其次是U-Net語(yǔ)義分割模型,使用頻率16次,再次是MobileNetV3、DeepLabv3+、Mask R-CNN,使用頻率分別為9次、7次、6次,UPerNet、MSSN、Easy DL等13種圖像分割模型的使用頻率較少,共16次。
LSTM預(yù)測(cè)模型占比3.37%,使用頻率9次。LSTM模型是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)模型[19],能夠充分利用已知信息來(lái)預(yù)測(cè)未來(lái)信息,相較于其他模型,LSTM預(yù)測(cè)時(shí)間序列的性能更強(qiáng),其在農(nóng)業(yè)中常被應(yīng)用于耕地面積預(yù)測(cè)、農(nóng)作物種植面積預(yù)測(cè)、設(shè)施農(nóng)業(yè)占地預(yù)測(cè)等[20]。
4 "主要應(yīng)用領(lǐng)域的統(tǒng)計(jì)分析
根據(jù)田鵬菲的論文[21],本文將數(shù)據(jù)集的應(yīng)用領(lǐng)域劃分為視覺(jué)導(dǎo)航、無(wú)損檢測(cè)、目標(biāo)精準(zhǔn)定位、田間管理、特征識(shí)別、信息采集、其他領(lǐng)域。如圖5所示,數(shù)據(jù)集主要應(yīng)用于特征識(shí)別,占比47.67%,其次是無(wú)損檢測(cè),占比21.71%,再次是信息采集和目標(biāo)精準(zhǔn)定位,分別占比13.95%和10.47%,應(yīng)用于視覺(jué)導(dǎo)航、田間管理和其他領(lǐng)域的占比較少。
如表4所示,大部分應(yīng)用于特征識(shí)別,占比47.67%,共123篇。其中,主要應(yīng)用于作物病蟲(chóng)害識(shí)別檢測(cè),有57篇,其次是作物整株、芽苗、稻穗、種子、生育期等的識(shí)別以及農(nóng)作物、農(nóng)田地物遙感圖像識(shí)別,兩者各25篇,再次是動(dòng)物個(gè)體身份、聲音、行為等的識(shí)別,有16篇。
其次是無(wú)損檢測(cè),占比21.71%,共56篇。其中,主要應(yīng)用于農(nóng)產(chǎn)品分類分級(jí),有25篇,其次是農(nóng)產(chǎn)品質(zhì)量問(wèn)題檢測(cè),有10篇,應(yīng)用于作物體內(nèi)成分檢測(cè)、作物病害分級(jí)、昆蟲(chóng)數(shù)量和種類檢測(cè)、農(nóng)產(chǎn)品數(shù)量檢測(cè)的論文較少,分別有8篇、6篇、4篇、3篇。
再次是應(yīng)用于信息采集的占比13.95%,共36篇。其中,主要應(yīng)用于耕地信息提取與監(jiān)測(cè),有16篇,其次是作物表型信息獲取,有13篇,再次是農(nóng)產(chǎn)品經(jīng)濟(jì)指標(biāo)評(píng)估,有6篇,應(yīng)用于農(nóng)田技術(shù)指標(biāo)采集的論文較少,只有1篇。
應(yīng)用于目標(biāo)精準(zhǔn)定位的占比10.47%,共27篇。其中,主要應(yīng)用于采摘機(jī)械作業(yè),有23篇,其他的應(yīng)用于雜草精準(zhǔn)定位。
應(yīng)用于田間管理的較少,共7篇,主要應(yīng)用于精準(zhǔn)灌溉,少部分應(yīng)用于農(nóng)田環(huán)境監(jiān)測(cè)以及土壤健康管理;應(yīng)用于視覺(jué)導(dǎo)航的論文較少,共5篇,具體包括路徑規(guī)劃和規(guī)避障礙物;應(yīng)用于其他領(lǐng)域的最少,共4篇,具體應(yīng)用方式包括農(nóng)田災(zāi)害預(yù)警、精準(zhǔn)飼養(yǎng)以及河流識(shí)別。
綜上,在應(yīng)用領(lǐng)域的大類中,特征識(shí)別是主要應(yīng)用領(lǐng)域。在各個(gè)領(lǐng)域的細(xì)分應(yīng)用中,主要應(yīng)用于作物病蟲(chóng)害識(shí)別檢測(cè)、農(nóng)產(chǎn)品分類分級(jí)、耕地信息提取與監(jiān)測(cè)、采摘機(jī)械作業(yè)、精準(zhǔn)灌溉。
5 "結(jié)論與展望
基于科學(xué)的設(shè)備、強(qiáng)大的算法以及大規(guī)模的數(shù)據(jù)
集,深度學(xué)習(xí)在許多領(lǐng)域的應(yīng)用都十分突出,將深度學(xué)習(xí)應(yīng)用于農(nóng)業(yè)領(lǐng)域能夠提升農(nóng)作物識(shí)別精度、預(yù)防農(nóng)業(yè)病蟲(chóng)害、提高農(nóng)業(yè)生產(chǎn)效率,從而助力數(shù)字農(nóng)業(yè)發(fā)展。在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代背景下,研究者們不僅僅關(guān)注模型本身,更加意識(shí)到數(shù)據(jù)對(duì)于模型訓(xùn)練的重要性[22]。數(shù)據(jù)集是深度學(xué)習(xí)模型訓(xùn)練的基礎(chǔ),深度學(xué)習(xí)算法的實(shí)際應(yīng)用效果取決于科學(xué)合理、規(guī)模適當(dāng)、分布均衡、標(biāo)注準(zhǔn)確的數(shù)據(jù)集,數(shù)據(jù)集的質(zhì)量對(duì)于提高模型的魯棒性和準(zhǔn)確性至關(guān)重要[23]。
為了強(qiáng)調(diào)數(shù)據(jù)對(duì)于深度學(xué)習(xí)的驅(qū)動(dòng)力與重要性,促進(jìn)相關(guān)領(lǐng)域研究者更加重視數(shù)據(jù)集的作用,本文通過(guò)檢索2020—2023年深度學(xué)習(xí)應(yīng)用在農(nóng)業(yè)領(lǐng)域的論文,并計(jì)量分析數(shù)據(jù)集,得出以下結(jié)論:(1)數(shù)據(jù)集類型以圖像數(shù)據(jù)為主,并且以作物和病蟲(chóng)害圖像為主,目前深度學(xué)習(xí)算法主要針對(duì)圖像、遙感及視頻數(shù)據(jù),而對(duì)于數(shù)值數(shù)據(jù)、序列數(shù)據(jù)等的應(yīng)用較少;(2)由于農(nóng)業(yè)數(shù)據(jù)的采集難度大、費(fèi)時(shí)費(fèi)力、農(nóng)業(yè)場(chǎng)景較復(fù)雜、作物生長(zhǎng)具有季節(jié)性,所以整體來(lái)說(shuō)農(nóng)業(yè)的數(shù)據(jù)量較少,主要集中在500—1500范圍內(nèi);(3)構(gòu)建數(shù)據(jù)集需要耗費(fèi)大量人力物力、周期長(zhǎng)、后期處理難度大,并且通用性強(qiáng)、數(shù)據(jù)量大、標(biāo)注齊全的公開(kāi)數(shù)據(jù)集較少,因此為了滿足研究需求,數(shù)據(jù)集主要由個(gè)人構(gòu)建,大部分使用手機(jī)和相機(jī)采集,PlantVillage是主要的公開(kāi)數(shù)據(jù)集來(lái)源,此外,數(shù)據(jù)集還來(lái)源于網(wǎng)絡(luò)、衛(wèi)星遙感數(shù)據(jù)等其他來(lái)源;(4)主要利用目標(biāo)檢測(cè)、圖像分割、圖像識(shí)別三種深度學(xué)習(xí)方法進(jìn)行農(nóng)業(yè)場(chǎng)景的視覺(jué)檢測(cè),YOLO v5、U-Net語(yǔ)義分割模型、卷積神經(jīng)網(wǎng)絡(luò)CNN的使用頻率較高;(5)數(shù)據(jù)集主要應(yīng)用領(lǐng)域劃分為視覺(jué)導(dǎo)航、無(wú)損檢測(cè)、目標(biāo)精準(zhǔn)定位、田間管理、特征識(shí)別、信息采集以及其他領(lǐng)域七大類,其中,特征識(shí)別是主要應(yīng)用領(lǐng)域,其次是無(wú)損檢測(cè)、信息采集和目標(biāo)精準(zhǔn)定位,在各個(gè)領(lǐng)域的細(xì)分應(yīng)用中,主要應(yīng)用于作物病蟲(chóng)害識(shí)別檢測(cè)、農(nóng)產(chǎn)品分類分級(jí)、采摘機(jī)械作業(yè)、精準(zhǔn)灌溉、耕地信息提取與監(jiān)測(cè)等。
深度學(xué)習(xí)模型只有在大量數(shù)據(jù)的支撐下才能適應(yīng)更多的應(yīng)用場(chǎng)景,例如,2022年11月發(fā)布的ChatGPT,作為人工智能技術(shù)驅(qū)動(dòng)的自然語(yǔ)言處理工具,同樣也需要大量、豐富、可獲取的語(yǔ)言數(shù)據(jù)[24]。科技驅(qū)動(dòng)著農(nóng)業(yè)朝著智能化方向轉(zhuǎn)變,農(nóng)業(yè)生產(chǎn)方式從傳統(tǒng)的手工農(nóng)業(yè)、到農(nóng)業(yè)機(jī)械化、再到智能農(nóng)業(yè)、再發(fā)展到智慧農(nóng)業(yè),農(nóng)業(yè)數(shù)據(jù)的采集方式也朝著多樣化、精準(zhǔn)化方向發(fā)展,從而推動(dòng)著小規(guī)模、零散的數(shù)據(jù)轉(zhuǎn)變?yōu)榇笠?guī)模、完整的數(shù)據(jù)集,與此同時(shí)深度學(xué)習(xí)模型在大規(guī)模數(shù)據(jù)集的訓(xùn)練下,也從小規(guī)模、低質(zhì)量發(fā)展到大規(guī)模、高性能、標(biāo)準(zhǔn)完整的模型。數(shù)據(jù)驅(qū)動(dòng)著深度學(xué)習(xí)模型迭代進(jìn)步的同時(shí),高質(zhì)量的模型也越來(lái)越需要數(shù)據(jù)集具備大規(guī)模、高質(zhì)量的特質(zhì),以符合深度學(xué)習(xí)等人工智能技術(shù)快速發(fā)展下的應(yīng)用需求[25]。在未來(lái),計(jì)算機(jī)視覺(jué)領(lǐng)域中大模型的開(kāi)發(fā)和訓(xùn)練,依舊離不開(kāi)海量的圖像數(shù)據(jù),因此,需要挖掘數(shù)據(jù)集與算法模型之間的關(guān)聯(lián),探究數(shù)據(jù)量、標(biāo)注方法、數(shù)據(jù)類型與模型性能的相關(guān)性,并將數(shù)據(jù)集從圖像數(shù)據(jù)擴(kuò)增至文字、音頻、視頻等多模態(tài)數(shù)據(jù),以充分發(fā)揮數(shù)據(jù)集對(duì)于深度學(xué)習(xí)模型的驅(qū)動(dòng)力,提升模型在復(fù)雜場(chǎng)景下的實(shí)際應(yīng)用效果[26]。
參考文獻(xiàn)
[1] 詹騏源.機(jī)器學(xué)習(xí)的發(fā)展史及應(yīng)用前景[J].科技傳播, 2018, 10(21): 138-139.
[2] 徐清華,鄭譽(yù)煌,戴冰燕.基于深度殘差網(wǎng)絡(luò)的水果圖像分類算法研究[J].工業(yè)控制計(jì)算機(jī),2020,33(12):37-38+40.
[3] 彭順正,黃筑斌,岳延濱等.基于深度學(xué)習(xí)的油菜籽粒圖像分割方法初探[J].農(nóng)技服務(wù),2020,37(10):37-39.
[4] LIU Y, LIU S, XU J, et al. Forest pest identification based on a new dataset and convolutional neural network model with enhancement strategy[J/OL]. Computers and Electronics in Agriculture, 2022, 192:106625. https://doi.org/10.1016/j.compag.2021.106625.
[5] ATTRI I, AWASTHI L K, SHARMA T P, et al. A review of deep learning techniques used in agriculture[J/OL],Ecological Informatics, 2023,77:102217. https://doi.org/10.1016/j.ecoinf.2023.102217.
[6] ZHU Y, ABDALLA A, TANG Z. et al. Improving rice nitrogen stress diagnosis by denoising strips in hyperspectral images via deep learning[J]. Biosystems Engineering, 2022, 219:165-176. https://doi. org/10.1016/j.biosystemseng.2022.05.001.
[7] XUAN G, GAO C, SHAO Y, et al. Apple detection in natural environment using deep learning algorithms[J]. IEEE Access, 2020, 216772– 216780. https://doi.org/ 10.1109/ACCESS.2020.3040423.
[8] 孫燁,董春雨.復(fù)雜性視閾下的當(dāng)代人工智能發(fā)展——以深度學(xué)習(xí)為例[J].系統(tǒng)科學(xué)學(xué)報(bào),2023,31(4):13-22.
[9] 趙亞楠,鄧寒冰,劉婷,等.基于弱監(jiān)督學(xué)習(xí)的玉米苗期植株圖像實(shí)例分割方法[J].農(nóng)業(yè)工程學(xué)報(bào),2022,38(19):143-152.
[10] 蘇令濤,李瑞澤,張功磊,等.基于深度學(xué)習(xí)的農(nóng)作物病蟲(chóng)害識(shí)別研究[J].數(shù)學(xué)建模及其應(yīng)用,2022,11(4):1-12.
[11] 張慶輝,張媛,張夢(mèng)雅.有遮擋人臉識(shí)別進(jìn)展綜述[J].計(jì)算機(jī)應(yīng)用研究,2023,40(8):2250-2257+2273.
[12] 馬永建,汪傳建,趙慶展,等.基于GF-1遙感影像的荒漠區(qū)耕地分類與提取方法[J].石河子大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,39(3):383-390.
[13] 宋曉倩,張學(xué)藝,張春梅,等.基于深度遷移學(xué)習(xí)的釀酒葡萄種植信息提取[J].江蘇農(nóng)業(yè)學(xué)報(bào),2020,36(3):689-693.
[14] 袁盼麗,汪傳建,趙慶展,等.基于深度學(xué)習(xí)的寒旱區(qū)多時(shí)序影像土地利用及變化監(jiān)測(cè)——以新疆莫索灣墾區(qū)為例[J].干旱區(qū)地理,2021, 44(6):1717-1728.
[15] 馮權(quán)瀧,陳泊安,李國(guó)慶,等.遙感影像樣本數(shù)據(jù)集研究綜述[J].遙感學(xué)報(bào),2022,26(4):589-605.
[16] 田地.采用遺傳算法優(yōu)化的深度學(xué)習(xí)模型在育種中的實(shí)踐[J].分子植物育種,2024,22(1):286-291.
[17] 尉震行.目標(biāo)識(shí)別算法綜述[J].中國(guó)設(shè)備工程,2019,(1):94-97.
[18] 黃雯珂,滕飛,王子丹,等.基于深度學(xué)習(xí)的圖像分割綜述[J].計(jì)算機(jī)科學(xué),2024,51(2):107-116.
[19] 向雁,侯艷林,姜文來(lái),等.LSTM模型在耕地面積預(yù)測(cè)領(lǐng)域的構(gòu)建與應(yīng)用[J].科技導(dǎo)報(bào),2021,39(9):100-108.
[20] CORTEZ B, CARRERA B, KIM Y J, et al. An architecture for emergency event prediction using LSTM recurrent neural networks[J]. Expert Systems with Applications, 2018, 97: 315-324. https://doi.org/ 10. 1016/j.eswa.2017.12.037
[21] 田鵬菲,王皞陽(yáng).機(jī)器視覺(jué)技術(shù)在我國(guó)農(nóng)業(yè)領(lǐng)域內(nèi)的應(yīng)用分析[J].江蘇農(nóng)業(yè)科學(xué),2023,51(14):13-21.
[22] 黃凱奇,任偉強(qiáng),譚鐵牛.圖像物體分類與檢測(cè)算法綜述[J]. 計(jì)算機(jī)學(xué)報(bào),2014,37(6): 1225-1240.
[23] HORAK K, SABLATNIG R. Deep learning concepts and datasets for image recognition: overview 2019[C]//Proceedings Volume 11179, Eleventh International Conference on Digital Image Processing (ICDIP 2019), 2019:111791S. https://doi.org/10.1117/12.2539806
[24] 孫書(shū)魁,范菁,孫中強(qiáng),等.基于深度學(xué)習(xí)的圖像數(shù)據(jù)增強(qiáng)研究綜述[J/OL].計(jì)算機(jī)科學(xué),1-23[2023-12-07].
[25] ARSENOVIC M, KARANOVIC M, SLADOJEVIC S, et al. Solving current limitations of deep learning based approaches for plant disease detection[J]. Symmetry, 2019, 11(7): ID 939.
[26] 管博倫,張立平,朱靜波,等.農(nóng)業(yè)病蟲(chóng)害圖像數(shù)據(jù)集現(xiàn)狀及高質(zhì)量構(gòu)建綜述[J].智慧農(nóng)業(yè),2023,5(3):17-34.
引用格式:李佳樂(lè),張建華,王健,周國(guó)民.數(shù)據(jù)驅(qū)動(dòng)的農(nóng)業(yè)深度學(xué)習(xí)方法計(jì)量分析[J].農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào), 2024,6(3): 400-411.DOI: 10.19788/j.issn.2096- 6369.000023.
CITATION: LI JiaLe, ZHANG JianHua, WANG Jian, ZHOU GuoMin. Metrological Analysis of Data-driven Deep Learning Methods for Agriculture[J]. Journal of Agricultural Big Data,2024,6(3): 400-411. DOI: 10.19788/j.issn.2096-6369.000023.
Metrological Analysis of Data-driven Deep Learning Methods for Agriculture
LI JiaLe1,2,3, ZHANG JianHua1,2,3, WANG Jian1,2,3, ZHOU GuoMin1,2,3*
1. Agricultural Information Institute of Chinese Academy of Agricultural Sciences, Beijing 10081, China; 2. National Agriculture Science Data Center, Beijing 10081, China; 3. Hainan National Breeding and Multiplication Institute at Sanya, Chinese Academy of Agricultural Sciences, Sanya 572024, Hainan, China
Abstract: With the development and application of artificial intelligence, computer vision, deep learning and other science and technology in the field of agriculture, the data-driven deep learning model for agriculture has become a new research paradigm for agricultural information extraction, and agricultural datasets are the basis for deep learning model training, and high-quality, large-scale, and diverse datasets can effectively improve the model performance, thus boosting the application of deep learning in the field of smart agriculture. To help researchers in related fields better understand the driving force of data for deep learning and give full play to the application of deep learning in the field of agriculture, this paper analyzes the datasets through metrology and summarizes the basic qualities of agricultural datasets such as type, scale, and source, which are divided into four categories according to the deep learning methods, such as target detection, image segmentation, and image recognition, and into seven categories according to the application areas, such as visual navigation, feature recognition, non-destructive testing and other 7 categories. The results show that the type of dataset is dominated by image data, and the data volume of images is concentrated in the range of 500 to 1500, and due to the specificity of agricultural data collection, most of the dataset is constructed by individuals and some of them are from public datasets, and the dataset is mainly utilized to carry out feature recognition. In the future, as the scale of the model becomes larger and larger, the requirements for the dataset are also upgraded, and it is necessary to continuously construct large-scale, balanced distribution, and accurately labeled datasets.In this paper, we provide a theoretical basis for data to promote deep learning agricultural applications by emphasizing the driving force and the importance of data to the deep learning model.
Keywords: Digital agriculture; deep learning; datasets; metrological analysis
農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào)2024年3期