許晴,張錦水,張鳳,蓋爽,楊志,段雅鳴
1.北京師范大學(xué) 遙感科學(xué)國家重點(diǎn)實(shí)驗(yàn)室,北京 100875;2.北京師范大學(xué) 地理科學(xué)學(xué)部北京市陸表遙感數(shù)據(jù)產(chǎn)品工程技術(shù)研究中心,北京 100875;3.北京師范大學(xué) 地理科學(xué)學(xué)部遙感科學(xué)與工程研究院,北京 100875
準(zhǔn)確的分類圖是作物面積估算、長勢動(dòng)態(tài)監(jiān)測和產(chǎn)量預(yù)測等方面有著重要的用途,也是研究全球變化、物質(zhì)與能量流動(dòng)的支撐數(shù)據(jù),被廣泛應(yīng)用于農(nóng)業(yè)管理、作物保險(xiǎn)、供應(yīng)鏈物流等領(lǐng)域(Cai等,2018)。
傳統(tǒng)的農(nóng)作物遙感分類方法,如支持向量、機(jī)SVM(Support Vector Machine)和隨機(jī)森林RF(Random Forest)已經(jīng)比較成熟,能夠充分利用遙感影像的自身特征進(jìn)行作物的識(shí)別(Belgiu 和Dr?gu?,2016;Rodriguez-Galiano 等,2012;Rudiyanto等,2019),主要流程包括遙感數(shù)據(jù)預(yù)處理、獲取訓(xùn)練樣本、反演和確定分類特征、選擇特定分類器和評(píng)價(jià)精度等(Lu 和Weng,2007),其中分類特征和分類器是影響分類結(jié)果的關(guān)鍵因素(賈坤和李強(qiáng)子,2013)。但在實(shí)際應(yīng)用中,基于人工的訓(xùn)練樣本選擇和特征提取過程高度依賴專家經(jīng)驗(yàn)和行業(yè)知識(shí),缺乏靈活度,難以實(shí)現(xiàn)高效的自動(dòng)化生產(chǎn)。
隨著人工智能的技術(shù)迅速發(fā)展,大數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)在計(jì)算機(jī)視覺、語音識(shí)別和自然語言處理等諸多領(lǐng)域被廣泛應(yīng)用,成為近十年來的研究熱點(diǎn)(Ball 等,2017)。深度卷積神經(jīng)網(wǎng)絡(luò)DCNN(Deep Convolutional Neural Networks)是一種被廣泛研究與應(yīng)用的深度學(xué)習(xí)模型(Hinton 等,2006;曲景影等,2016),能克服傳統(tǒng)分類方法的缺點(diǎn),實(shí)現(xiàn)“端到端”自動(dòng)化分類,高效地提煉出大量深層次特征,具有強(qiáng)大的處理復(fù)雜分類問題的能力、魯棒性和泛化性(賈坤和李強(qiáng)子,2013;劉大偉等,2016;楊紅衛(wèi)和童小華,2012)。近年來,深度卷積神經(jīng)網(wǎng)絡(luò)已逐漸拓展到遙感影像的研究中,如針對(duì)中高分辨率衛(wèi)星的目標(biāo)檢測(Audebert 等,2018)和語義分割(Zhang 等,2020;Zhong 等,2019)、對(duì)高光譜影像進(jìn)行空間和光譜變量提?。℉u 等,2015;Kussul等,2017;Li等,2017),以及SAR影像解譯(Wagner,2014)等。遙感影像分類更是得益于其特征表達(dá)的靈活性、端到端的學(xué)習(xí)和運(yùn)行的高效性。
大量高精度訓(xùn)練標(biāo)簽樣本是訓(xùn)練深度學(xué)習(xí)模型的前提。如ImageNet 圖像數(shù)據(jù)集(http://www.image-net.org/[2021-03-11])目前為2 萬多個(gè)場景類別提供了1400 多萬幅圖像。對(duì)于農(nóng)作物遙感分類而言,在訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)時(shí),需要依靠大量準(zhǔn)確、全覆蓋的標(biāo)記訓(xùn)練樣本進(jìn)行空間特征提取,而這需要大量人力物力的投入,限制了深度學(xué)習(xí)方法在農(nóng)作物遙感分類的應(yīng)用。
受Kaiser 等(2017)利用OpenStreetMap 弱標(biāo)簽樣本進(jìn)行房屋和道路提取的啟發(fā):有一定誤差的弱標(biāo)簽樣本也能夠訓(xùn)練出高精準(zhǔn)的模型,因此我們探討利用傳統(tǒng)分類方法提取出的作物分布作為樣本來探討用于訓(xùn)練深度學(xué)習(xí)模型的適用性。這種非100%準(zhǔn)確精度的樣本視為弱樣本,但這些弱樣本達(dá)到一定的識(shí)別精度,包含了豐富的作物特征信息,滿足大樣本的數(shù)量要求(Hao 等,2020)。本研究的目標(biāo)是以傳統(tǒng)分類方法識(shí)別的結(jié)果為樣本(弱樣本),訓(xùn)練DCNN,提取遼寧省水稻和玉米的空間分布,分析弱樣本的適用性,討論弱樣本誤差對(duì)分類模型魯棒性的影響,解決獲取大量DCNN樣本困難的問題,為利用深度學(xué)習(xí)實(shí)現(xiàn)大尺度作物分類提供一定的技術(shù)鋪墊。
本文研究區(qū)為遼寧省,總面積為148×103km2(38°43′—43°26′N,118°53′—125°46′E)(圖1),屬于典型的溫帶大陸性季風(fēng)氣候區(qū),雨熱同期,地處中國最大的平原——東北平原,土壤肥沃,2017年耕地總面積約為32×103km2(來自FROMGLC 2017數(shù)據(jù)集),是中國重要的糧食農(nóng)作物種植區(qū)和生產(chǎn)基地。該地區(qū)的主要糧食作物包括水稻和玉米,這兩種作物的種植總面積超過了本省糧食作物種植面積的91%(數(shù)據(jù)來源于國家統(tǒng)計(jì)局2018年中國統(tǒng)計(jì)年鑒,http://www.stats.gov.cn/tjsj/ndsj/2018/indexch.htm[2021-03-11])。因此,準(zhǔn)確快速地識(shí)別出水稻和玉米的空間分布對(duì)政府部門制定合理農(nóng)業(yè)政策,調(diào)整農(nóng)業(yè)種植結(jié)構(gòu)具有重大意義。水稻和玉米屬于同期生長作物,全年種植一季,具體生長物候期見表1。
圖1 研究區(qū)概況Fig.1 The study area
許多研究利用不同關(guān)鍵時(shí)相遙感數(shù)據(jù),捕捉不同作物的生長過程在遙感影像上的特征變化,從而提高農(nóng)作物識(shí)別精度(Jia 等,2013;Murthy 等,2003;Shao 等,2001)。其中,選擇最佳分類時(shí)相遙感數(shù)據(jù)是農(nóng)作物分類的基礎(chǔ)(賈坤和李強(qiáng)子,2013),如王娜等(2017)主要選取了3 個(gè)作物生長時(shí)期的GF-1 影像提取蘇北地區(qū)水稻和玉米分布,總體精度最高達(dá)到了0.97?;诖?,本文通過分析遼寧省作物生長的物候期(表1),選擇作物生長的兩個(gè)時(shí)相影像進(jìn)行識(shí)別:(1)作物早期生長階段,時(shí)間為4月15日—6月30日,基本上處于作物播種和出苗初期,這個(gè)階段能夠?qū)⒆魑锖推渌脖粎^(qū)分開,同時(shí)稻田中含水量高,遙感影像上水體特征明顯,玉米地在影像上則呈現(xiàn)裸地或弱植被光譜特征;(2)作物生長旺盛階段,時(shí)間為7月15日—9月30日,兩種作物在遙感影像上均表現(xiàn)出強(qiáng)植被信息,這個(gè)階段主要是通過作物的遙感特征進(jìn)行識(shí)別。因此,將這兩個(gè)時(shí)期數(shù)據(jù)視為關(guān)鍵期影像來識(shí)別玉米和水稻。
表1 遼寧省主要農(nóng)作物物候表Table 1 Main crop calendar in Liaoning Province
分析整個(gè)區(qū)域的遙感影像,云是一個(gè)不可回避的限制性因素,幾乎每一景影像上都有云的存在,為保證充分?jǐn)?shù)量的影像用于作物識(shí)別,只要是整景影像云覆蓋占比低于70%的影像都被用來作物的識(shí)別。因此本研究選取了215 景GF-1 WFV影像數(shù)據(jù),第一階段126 景,第二階段89 景。影像有藍(lán)(0.45—0.52μm)、綠(0.52—0.59μm)、紅(0.63—0.69 μm)和近紅(0.77—0.89 μm)4 個(gè)波段,空間分辨率為16 m。
GF-1 WFV 原始影像通過一系列標(biāo)準(zhǔn)化預(yù)處理,包括大氣校正、幾何精校正、云/云陰影檢測和中值合成生成晴空影像,為便于影像處理采用30 km×30 km 格網(wǎng)單元進(jìn)行組織,數(shù)據(jù)類型為16 位整型。云/云陰影等不可避免地干擾農(nóng)作物識(shí)別結(jié)果,因此利用研究組提出的深度學(xué)習(xí)方法檢測云和云陰影(Duan,2020),之后以中值合成方式生成無云影像(Roy等,2014),計(jì)算公式為
式中,xi為像元值,當(dāng)xi在影像上為云像元時(shí),則為空值。為了方便高效地管理和搜索數(shù)據(jù),以邊長為30 km 的矩形格網(wǎng)作為處理單元裁剪影像。格網(wǎng)中每個(gè)像元的取值為同生長季內(nèi)無云影像像元值數(shù)組的中值,最后生成研究區(qū)兩個(gè)時(shí)間窗口內(nèi)的無云中值合成影像(圖2)。
圖2 研究區(qū)兩期GF-1中值合成影像Fig.2 GF-1 median fusion images of two phases in our study area
本研究的真實(shí)地表數(shù)據(jù)包括野外樣點(diǎn)數(shù)據(jù)集和目視解譯樣方數(shù)據(jù)。野外樣點(diǎn)數(shù)據(jù)為2017年在遼寧省采集的GPS 樣點(diǎn)數(shù)據(jù)。在遼寧省測試區(qū)內(nèi),共收集了1250 個(gè)地面點(diǎn),其中水稻98 個(gè),玉米633 個(gè),其他類別519 個(gè)(圖3)。目視解譯樣方為在測試區(qū)內(nèi)隨機(jī)選取的14 個(gè)1 km×1 km 矩形樣方(編號(hào)A—N),通過人工目視解譯高分辨率影像獲得樣方內(nèi)水稻、玉米和其他類別的空間分布,作為真實(shí)地表數(shù)據(jù),如圖3所示。
圖3 野外采樣點(diǎn)和目視解譯樣方分布Fig.3 Distribution map of field sampling points and visual interpretation samples
利用SVM 分類結(jié)果作為訓(xùn)練標(biāo)簽樣本訓(xùn)練模型。大量的標(biāo)簽樣本是深度學(xué)習(xí)的基礎(chǔ),為訓(xùn)練出具備高精度和強(qiáng)泛化能力的深度卷積網(wǎng)絡(luò)模型,獲取足夠多的訓(xùn)練標(biāo)簽樣本數(shù)據(jù)是基本要求之一(莊福振等,2015)。利用ENVI 5.3 軟件中監(jiān)督分類的SVM 分類器工具分縣區(qū)對(duì)遼寧省水稻、玉米和其他地物3 種類型分類,為DCNN 訓(xùn)練提供弱樣本。遼寧省一共有100個(gè)縣區(qū)。根據(jù)分類體系,參照2017年Google Earth 高分辨率影像,結(jié)合研究區(qū)的作物物候信息,以縣區(qū)為單位采用隨機(jī)手工選點(diǎn)的方式,獲取了16966個(gè)地面點(diǎn)作為SVM分類的訓(xùn)練樣本點(diǎn),其中水稻3475 個(gè),玉米7595 個(gè),其他類別5896 個(gè)。該實(shí)驗(yàn)過程包括了分區(qū)縣SVM 分類、人工分類后處理、耕地地塊掩膜等操作,采用人機(jī)交互后處理方式保證識(shí)別結(jié)果的準(zhǔn)確性。
根據(jù)模型訓(xùn)練需求,SVM 分類結(jié)果作為弱樣本用于模型的訓(xùn)練,分為訓(xùn)練集和測試集。圖2表明,遼寧省共有220 個(gè)30 km×30 km 格網(wǎng),其中有61 個(gè)格網(wǎng)跨在省邊界上,缺少部分的標(biāo)簽樣本,這一部分格網(wǎng)作為測試數(shù)據(jù);剩余159個(gè)格網(wǎng)按照7∶3 比例隨機(jī)劃分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),并使各個(gè)數(shù)據(jù)集在不同地形地貌景觀中均有分布,保證樣本的多樣性,如圖4和圖8(a)所示。之后將測試數(shù)據(jù)裁剪成256×256像元大小的切片,重疊度為50%,最終獲得26024個(gè)遙感影像分塊。
圖4 數(shù)據(jù)集在不同地形地貌景觀中的分布Fig.4 Image distributions in various terrain landscape
本研究在PSPNet 模型的基礎(chǔ)上構(gòu)建農(nóng)作物分類模型。Zhao 等(2017)提出PSPNet 模型能夠融合多層次特征,保留地物的局部空間信息的同時(shí)實(shí)現(xiàn)像元級(jí)的語義分割,具有較強(qiáng)的表征能力,提升分類的準(zhǔn)確率。在此基礎(chǔ)上,農(nóng)作物遙感分類的深度卷積神經(jīng)網(wǎng)絡(luò)DCNN(Deep Convolutional Neural Network)模型做了一些改進(jìn)(圖5),主要包括2 個(gè)核心模塊:加入膨脹卷積(Holschneider等,1990)的殘差模塊(He 等,2016)和金字塔平均池化模塊。模型采用10 個(gè)殘差結(jié)構(gòu)塊用于挖掘影像的深層抽象特征,并對(duì)最后3個(gè)殘差塊增加膨脹卷積層,增大模型對(duì)像元周圍語義信息的感知度,防止深層特征丟失像元之間的空間關(guān)系。之后4個(gè)不同尺度的平均池化層將深層特征的上下文信息結(jié)合起來,來提高目標(biāo)像元的定位精度。此外,考慮到本研究使用了2 個(gè)時(shí)期共8 個(gè)波段的遙感影像,我們也對(duì)模型的輸入模塊進(jìn)行相應(yīng)的調(diào)整,由傳統(tǒng)的三通道變?yōu)榘送ǖ?。在?xùn)練階段,輸入數(shù)據(jù)為8個(gè)波段兩時(shí)期遙感影像塊和對(duì)應(yīng)弱樣本標(biāo)簽;測試階段僅輸入遙感影像塊。
圖5 深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)框架Fig.5 Deep Convolutional Neural Network(DCNN)framework
輸入訓(xùn)練集對(duì)DCNN進(jìn)行訓(xùn)練,參考Krizhevsky等(2017)在ILSVRC-2012比賽中的學(xué)習(xí)策略對(duì)超參數(shù)進(jìn)行設(shè)置。為了防止訓(xùn)練過擬合,我們采用隨機(jī)分層分組的方法,從訓(xùn)練集中提取1/7 數(shù)據(jù)作為模型的驗(yàn)證數(shù)據(jù)。采用隨機(jī)梯度下降法(SGD)更新權(quán)值,學(xué)習(xí)率衰減策略為fixed,固定學(xué)習(xí)速率為1×10-10,每批次容量為16,反復(fù)進(jìn)行前向—后向傳播計(jì)算,迭代優(yōu)化模型。此外,分別將動(dòng)量和權(quán)值衰減常數(shù)設(shè)為0.9 和5×10-4,平滑每次迭代的權(quán)值更新,增強(qiáng)網(wǎng)絡(luò)學(xué)習(xí)的穩(wěn)定性。為了避免因訓(xùn)練數(shù)據(jù)量小造成模型過擬合,將在ImageNet分類數(shù)據(jù)集預(yù)訓(xùn)練好的模型參數(shù)作為DCNN的初始化權(quán)值(Zhang 等,2020)。最后通過最小交叉熵?fù)p失函數(shù)值Loss 找到最優(yōu)權(quán)值,對(duì)測試集進(jìn)行預(yù)測分類,計(jì)算公式如下:
式中,N為批次容量,即等于16;C為類別總數(shù),本研究C=3;ai為輸入影像對(duì)應(yīng)到每個(gè)類別標(biāo)簽i的概率。
為進(jìn)一步驗(yàn)證弱樣本能夠支撐DCNN 模型分類,我們進(jìn)一步設(shè)計(jì)噪聲實(shí)驗(yàn)分析弱樣本標(biāo)簽噪聲對(duì)DCNN 分類的影響。已有相關(guān)研究(Kussul 等,2017;宋德娟等,2020)表明,使用CNN 模型提取遙感影像地物時(shí),分類結(jié)果容易在小型目標(biāo)地物及地物邊緣地帶出現(xiàn)錯(cuò)分和漏分現(xiàn)象。基于此,我們設(shè)計(jì)了玉米膨脹—水稻腐蝕實(shí)驗(yàn),即擴(kuò)大玉米分布來侵蝕水稻的分布,如圖6所示。首先,從1 倍開始依次以1 倍的增量對(duì)弱樣本中的玉米分布進(jìn)行4 次膨脹運(yùn)算,然后再增加5—40 倍膨脹運(yùn)算,每次膨脹間隔5 倍,共8 次膨脹實(shí)驗(yàn),因此獲得12 個(gè)新的弱樣本標(biāo)簽。之后利用新標(biāo)簽樣本訓(xùn)練DCNN模型,對(duì)測試集進(jìn)行分類并精度評(píng)價(jià),分析DCNN分類模型對(duì)噪聲標(biāo)簽的魯棒性。需明確的是,在預(yù)實(shí)驗(yàn)中,發(fā)現(xiàn)玉米膨脹—水稻腐蝕和水稻膨脹—玉米腐蝕過程均能反映弱樣本噪聲對(duì)模型分類的影響,且原理相同,故本研究只介紹玉米膨脹—水稻腐蝕實(shí)驗(yàn)過程和結(jié)果。
圖6 玉米膨脹—水稻腐蝕實(shí)驗(yàn)示意圖Fig.6 The schematic diagram of corn dilation-rice erosion experiment
本文通過野外樣點(diǎn)、目視解譯數(shù)據(jù)和SVM 分類結(jié)果3 種不同參考數(shù)據(jù)驗(yàn)證基于弱樣本DCNN 模型識(shí)別作物的性能。野外采樣點(diǎn)覆蓋范圍廣,可從整體上反映模型的分類性能;目視解譯數(shù)據(jù)精細(xì)到地塊級(jí)別,用于具體分析不同農(nóng)業(yè)景觀下的分類效果和弱樣本噪聲對(duì)模型分類結(jié)果中作物地塊識(shí)別細(xì)節(jié)的影響;SVM 結(jié)果在農(nóng)作物分類上取得了很好的效果,作為弱樣本訓(xùn)練模型也可視為一種參照,將DCNN識(shí)別結(jié)果與之對(duì)比,更好體現(xiàn)DCNN的優(yōu)勢。
采用總體精度OA(Overall Accuracy)、用戶精度UA(User Accuracy)、制圖精度PA(Producer Accuracy)、F1 分?jǐn)?shù)(F1 score)、一致性指數(shù)CI(Consistency Index)作為量化的評(píng)價(jià)指標(biāo),計(jì)算公式如下:
式中,i指類別,n指類別總數(shù),Pii指被正確分類的像元數(shù),N指參考數(shù)據(jù)像元總數(shù),Nr指結(jié)果分為第i類的像元數(shù),Nt指參考數(shù)據(jù)中第i類的像元數(shù),Pii_svm指與SVM 結(jié)果分類一致的像元數(shù),Nsvm指SVM結(jié)果總像元數(shù)。
采用野外樣點(diǎn)驗(yàn)證SVM 分類結(jié)果,總體精度達(dá)到了0.92,其中水稻和玉米的制圖精度分別為0.97、0.80,用戶精度均為0.97。通過比較相關(guān)研究結(jié)果發(fā)現(xiàn)(Waske和Benediktsson,2007;Yang等,2011;張健康等,2012),本研究中的作物分類精度與已有研究的結(jié)果提取出的作物精度(平均總體精度約為0.90)持平。統(tǒng)計(jì)分類結(jié)果計(jì)算出遼寧省水稻和玉米種植面積約為6×103km2、34×103km2,水稻種植為玉米的1/5,結(jié)合分類結(jié)果圖7 可以看出,兩種作物集中種植在中部平原區(qū),少數(shù)分布在東西山區(qū)丘陵地帶及東南沿海平原(圖1),與耕地空間分布較為一致(圖1)。
圖7 遼寧省SVM分類結(jié)果Fig.7 Classification results of SVM in Liaoning Province
模型在遼寧省測試集上取得較好的農(nóng)作物分類結(jié)果,如圖8 和表2 所示。使用野外點(diǎn)對(duì)其進(jìn)行精度驗(yàn)證,總體精度高達(dá)0.90,其中兩種作物的制圖精度和用戶精度均大于0.70,較高的F1分?jǐn)?shù),分別為0.81、0.90。對(duì)比兩種作物的識(shí)別結(jié)果發(fā)現(xiàn),水稻整體提取精度比玉米偏低,存在較明顯的漏分誤差。由圖7 中SVM 識(shí)別結(jié)果可知,水稻的種植面積遠(yuǎn)小于玉米,因此訓(xùn)練集存在不同類別標(biāo)記樣本不平衡的問題:水稻的樣本數(shù)量少,玉米的樣本量多,這可能影響了模型對(duì)小樣本量地物的識(shí)別精度。
圖8 分類結(jié)果Fig.8 The classification results
表2 作物分類精度表Table 2 Classification accuracy table for crop
通過圖8(b)可見,平原區(qū)、山區(qū)因地形地貌差異導(dǎo)致了作物種植結(jié)構(gòu)的空間分布有所差異:平原區(qū)地塊規(guī)整,山區(qū)地塊破碎。利用弱樣本訓(xùn)練的DCNN 模型能夠準(zhǔn)確地識(shí)別出平原S1 和山地S2子區(qū)中水稻和玉米的空間分布。
DCNN 模型表現(xiàn)出良好的分類性能,不受地形地貌的影響。通過計(jì)算高程和方差,將測試集格網(wǎng)劃分成平原區(qū)和山區(qū)兩種地貌類型,利用野外樣點(diǎn)集分別對(duì)每個(gè)格網(wǎng)進(jìn)行精度評(píng)價(jià),并分析在每個(gè)區(qū)內(nèi)誤差的變化,如圖9所示。從整體分布上看,平原區(qū)格網(wǎng)總體精度集中在0.93—1.00,而位于山區(qū)的格網(wǎng)總體精度分布較為離散,最小值和最大值分別為0.70 和1.00。兩種類型格網(wǎng)OA 中值均大于0.93,且平原區(qū)略高于山區(qū),其中75%平原區(qū)格網(wǎng)的總體精度高于0.95,75%山區(qū)格網(wǎng)的總體精度高于0.85。這表明DCNN 模型在平原和山地不同地貌類型中均表現(xiàn)出較好的分類效果,具有一定的魯棒性,究其原因是PSPNet 采用多尺度特征非監(jiān)督學(xué)習(xí),既能夠?qū)W習(xí)到作物的遙感語義,又能夠?qū)W習(xí)到細(xì)節(jié)特征(Zhang 等,2020),只要弱樣本中保留的作物可分遙感特征被PSPNet 模型學(xué)習(xí)到,就能夠?qū)崿F(xiàn)準(zhǔn)確的作物分類。
圖9 平原區(qū)和山區(qū)作物識(shí)別總體精度空間分布Fig.9 The spatial distribution of OA in plain and mountainous area
對(duì)于復(fù)雜種植結(jié)構(gòu)的農(nóng)業(yè)景觀,該方法也表現(xiàn)出較好地識(shí)別作物類型。斑塊形狀是描述區(qū)域景觀的重要指標(biāo)之一。在農(nóng)業(yè)景觀中,耕地地塊的幾何形狀在一定程度上影響遙感影像分類的準(zhǔn)確性。因此,本文引入了景觀形狀指數(shù)LSI(Landscape Shape Index)(鄔建國,2000)來表達(dá)研究區(qū)農(nóng)業(yè)景觀中耕地地塊的形狀特征:
式中,E表示景觀中所有斑塊邊界的總長度(m),A表示景觀中所有斑塊的總面積(m2),0.25 為正方形校正常數(shù)。LSI≥1,景觀中斑塊形狀越不規(guī)則或偏離正方形時(shí),LSI 值越大。本文實(shí)驗(yàn)在測試集內(nèi)隨機(jī)選取14個(gè)1 km×1 km典型樣方(A—N),如圖3 所示。利用目視解譯結(jié)果對(duì)DCNN 作物識(shí)別結(jié)果計(jì)算OA 并降序排列,與每個(gè)1 km 樣本的LSI對(duì)比分析,見圖10。隨著LSI 從2.59 增加至5.81,OA 在0.82—0.99 呈現(xiàn)出上下波動(dòng),沒有出現(xiàn)明顯的上升或下降趨勢,說明了耕地地塊形狀的復(fù)雜性對(duì)分類結(jié)果影響不明顯,如樣方I的LSI值最大,為5.81,比樣方M 的LSI 值高了0.55,而前者OA值(0.92)卻比后者OA 值(0.82)高0.10。因此,這說明了由地塊形狀的變化所引起的空間分布差異幾乎沒有影響DCNN模型的分類性能,在復(fù)雜種植結(jié)構(gòu)的農(nóng)業(yè)景觀下利用所提出的方法策略進(jìn)行作物分類依舊能保持一定的準(zhǔn)確度,這是因?yàn)镈CNN 模型中的金字塔池化模塊能夠?qū)Σ煌叨鹊奶卣鬟M(jìn)行融合,解決了耕地地塊形狀變化的多尺度分割問題(Zhang等,2020)。
圖10 14個(gè)1 km×1 km典型樣方分類總體精度(OA)和景觀形狀指數(shù)(LSI)對(duì)比Fig.10 Comparison of OA and LSI of 14 1 km×1 km typical samples in different agricultural landscapes
對(duì)SVM和DCNN模型的分類結(jié)果進(jìn)行一致性檢驗(yàn),結(jié)果為0.90,表明兩種方法在整體上識(shí)別結(jié)果達(dá)到較高的空間吻合度(圖11),特別是在大面積作物種植區(qū)。本文選取了兩個(gè)30 km×30 km典型格網(wǎng)分類結(jié)果進(jìn)行對(duì)比,并分別從中提取了5 km×5 km子區(qū)放大觀察局部分布。從圖12中發(fā)現(xiàn),同種作物大面積成片種植范圍內(nèi),兩種方法均能準(zhǔn)確分類;但在種植范圍小和邊緣處,兩種方法則出現(xiàn)較多差異。對(duì)于地物之間交界地帶處的像元,兩種方法的識(shí)別結(jié)果均出現(xiàn)了像元錯(cuò)分漏分,導(dǎo)致邊界模糊現(xiàn)象,且SVM出現(xiàn)更多細(xì)碎的錯(cuò)分現(xiàn)象,這是因?yàn)镾VM分類過程中像元與周邊像元之間是相互獨(dú)立的,而DCNN模型在卷積過程中考慮了空間特征。
圖11 模型與SVM作物分類結(jié)果對(duì)比Fig.11 Comparison of crop mapping results of module and SVM
圖12 30 km×30 km格網(wǎng)和5 km×5 km子區(qū)分類結(jié)果圖Fig.12 Classification results of 30 km×30 km grids and 5 km×5 km subsets
隨著新訓(xùn)練樣本噪聲的不斷增強(qiáng),模型的分類性能呈現(xiàn)出明顯的變化,如圖13 所示。利用目視解譯數(shù)據(jù)集評(píng)價(jià)實(shí)驗(yàn)分類精度,從OA 上看,隨倍數(shù)逐步增加,精度值呈波動(dòng)下降趨勢,最大值為0.88,最小值為0.83,僅降低了0.05,這是由于研究區(qū)中其他類別相比水稻和玉米面積占比較大,因此即使在誤差倍數(shù)逐步增大的情況下,對(duì)比其他指標(biāo)的變化,總體精度值仍維持在較高水平。對(duì)于PA,水稻和玉米呈現(xiàn)相反的變化趨勢。玉米曲線仍有較弱的上升趨勢,增加了0.02,而水稻曲線則急劇下降,從0.74 直接降至0,漏分誤差明顯增大,表明隨著樣本噪聲的增多,新模型對(duì)水稻出現(xiàn)嚴(yán)重的漏分現(xiàn)象。相應(yīng)地,水稻的UA 曲線表現(xiàn)出波動(dòng)上升狀態(tài),從第30 倍開始,之后的精度值為空,說明模型識(shí)別的水稻像元越來越少,直至為0,全部轉(zhuǎn)化為玉米,因此其錯(cuò)分誤差逐漸減小到變?yōu)榭罩?。玉米UA 曲線呈現(xiàn)微弱的下降趨勢,從0.97 減少至0.90。F1-score 指標(biāo)將兩種作物的OA 和PA 結(jié)合起來,玉米曲線對(duì)膨脹系數(shù)的增大無明顯變化,而水稻曲線隨著膨脹系數(shù)增大而波動(dòng)下降,從第30 倍之后為空值。綜上,從4 個(gè)指標(biāo)曲線分布可以發(fā)現(xiàn),模型對(duì)樣本噪聲的變化有著明顯的響應(yīng),且當(dāng)玉米膨脹倍數(shù)不高于5 倍時(shí),模型預(yù)測結(jié)果的精度能保持在一定范圍內(nèi)上下浮動(dòng),超過5 倍之后,4 個(gè)指標(biāo)值均發(fā)生劇烈變化,說明了模型分類性能在5倍樣本噪聲左右發(fā)生了顯著的差異。
圖13 誤差實(shí)驗(yàn)分類精度評(píng)價(jià)結(jié)果Fig.13 Accuracy results of classification of error experiments
本文統(tǒng)計(jì)了每個(gè)新標(biāo)簽樣本作物的空間一致性(CI)和誤差面積比例(R),計(jì)算公式如下:
式中,S0指原始弱樣本中各類作物面積,S1指新樣本中各類作物面積。計(jì)算結(jié)果如圖14 所示,膨脹倍數(shù)為0 表示原始弱樣本。隨著膨脹倍數(shù)增加,新樣本對(duì)應(yīng)原始樣本中的玉米分布保持不變,空間一致性均為1,而水稻空間一致性斷崖式下降至0.1 以下。誤差面積比例曲線則均呈現(xiàn)出隨倍數(shù)增大而上升狀態(tài),且變化率慢慢減小。當(dāng)樣本噪聲為5倍時(shí),水稻的空間一致性和誤差面積比例分別變化了0.35、0.36,玉米的誤差面積比例增加了0.08,空間一致性保持不變。綜上,結(jié)合前面精度變化可知,當(dāng)研究區(qū)內(nèi)模型在5倍樣本噪聲內(nèi),即樣本最大誤差面積比例不超過0.36 時(shí),模型具有一定的魯棒性,識(shí)別結(jié)果總體精度維持在0.86 以上,這進(jìn)一步證明了弱樣本用于訓(xùn)練DCNN模型策略的可行性。
圖14 膨脹倍數(shù)對(duì)應(yīng)的作物空間一致性和誤差面積比例統(tǒng)計(jì)結(jié)果Fig.14 Statistical results of space consistency and error area ratio of crop corresponding to the expansion ratio
圖15 可視化了測試集中一個(gè)格網(wǎng)的分類結(jié)果,直觀對(duì)比每次誤差實(shí)驗(yàn)結(jié)果的空間分布,分析弱樣本誤差空間分布對(duì)DCNN 的影響。觀察圖15(b)、(c)和(d)可知,大片水稻分布在規(guī)整的平原耕地,當(dāng)中混雜著零星的玉米地塊,DCNN原始預(yù)測結(jié)果整體上能夠準(zhǔn)確識(shí)別出耕地形狀和作物類別(圖15(a))。隨著膨脹倍數(shù)的增大,水稻和玉米之間的混分現(xiàn)象越嚴(yán)重。在膨脹系數(shù)第5倍之后,兩種作物的空間分布較原始分類結(jié)果開始發(fā)生顯著的劇烈變化。對(duì)比所有誤差實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),產(chǎn)生識(shí)別誤差空間范圍并不是隨機(jī)分布的,而是在上一次結(jié)果邊界上的向外延伸區(qū)域:隨著膨脹倍數(shù)增加,玉米識(shí)別結(jié)果呈現(xiàn)膨脹分布趨勢,分布在玉米耕地周圍的水稻像元越多地被錯(cuò)分為玉米,與對(duì)應(yīng)實(shí)驗(yàn)中弱樣本標(biāo)簽的空間分布規(guī)律一致。這說明了DCNN模型能夠充分學(xué)習(xí)到訓(xùn)練樣本的空間位置特征,樣本中的誤差空間分布在DCNN結(jié)果中的作物邊緣帶也得到了明顯的反映。因此,弱樣本的誤差空間分布會(huì)影響DCNN的識(shí)別效果,弱樣本的誤差空間分布規(guī)律能夠通過DCNN 傳遞到預(yù)測結(jié)果中,即預(yù)測結(jié)果誤差也主要出現(xiàn)在地塊的邊緣帶,進(jìn)一步驗(yàn)證了DCNN識(shí)別遙感影像的誤差空間分布規(guī)律。
圖15 30 km×30 km格網(wǎng)誤差實(shí)驗(yàn)結(jié)果對(duì)比Fig.15 Comparison of error experiment results in grid level
本文通過弱樣本深度學(xué)習(xí)作物建模分類以及分析農(nóng)業(yè)景觀、弱樣本誤差對(duì)建模精度的影響,探討了弱樣本對(duì)深度學(xué)習(xí)作物遙感分類模型的適用性,說明了基于傳統(tǒng)分類方法得到的作物分類結(jié)果作為標(biāo)簽樣本(弱樣本)訓(xùn)練深度學(xué)習(xí)模型能夠取得較高的作物識(shí)別精度,且在不同地形地貌、復(fù)雜種植結(jié)構(gòu)的農(nóng)業(yè)景觀下都表現(xiàn)出良好的魯棒性,證明了采用傳統(tǒng)分類結(jié)果作為弱樣本用于深度學(xué)習(xí)建模的可行性理論;通過噪聲實(shí)驗(yàn)說明了弱樣本只要保證一定的標(biāo)識(shí)精度就可用于訓(xùn)練DCNN建模,建立了弱樣本精度與深度學(xué)習(xí)模型精度之間的定量關(guān)系,降低了深度學(xué)習(xí)建模標(biāo)記樣本的獲取門檻。綜上,該方法一定程度上彌補(bǔ)了深度學(xué)習(xí)模型對(duì)大量人工標(biāo)記樣本高度依賴的局限,并且在不同作物類型、不同地形地貌、不同種植結(jié)構(gòu)等情形下均具有普適性。同時(shí),考慮到弱樣本獲取的便捷性,一般重大的科研計(jì)劃或項(xiàng)目中已形成大量作物分類結(jié)果,如美國CDL(Cropland Data Layer),作為標(biāo)記樣本用于訓(xùn)練DCNN 模型,可解決標(biāo)記樣本獲取困難的問題。本研究成果為兩種大尺度分類策略打下實(shí)驗(yàn)基礎(chǔ),其一是在空間尺度上,在一個(gè)局部區(qū)域獲取弱樣本后訓(xùn)練模型,空間上進(jìn)一步推廣到更廣泛區(qū)域;其二是在時(shí)間尺度上,訓(xùn)練某一年份的弱樣本模型后,可以在來年甚至多年中推廣應(yīng)用,這兩種分類策略都能解決傳統(tǒng)作物分類方法“逐區(qū)域、逐年份”的不足,提高大尺度作物分類的效率。
在弱樣本適用深度學(xué)習(xí)作物分類建模的理論基礎(chǔ)上,今后將開展系列研究工作:(1)延伸研究對(duì)象和研究范圍,針對(duì)不同作物類型(大豆、春小麥、冬小麥、棉花等)、不同農(nóng)業(yè)景觀(華北平原、長江中下游平原等)進(jìn)一步定量分析弱樣本誤差與深度學(xué)習(xí)作物建模精度的關(guān)系,細(xì)化弱樣本精度的適用區(qū)間范圍,為采用歷史樣本進(jìn)行大尺度作物深度學(xué)習(xí)分類建模打下理論基礎(chǔ);(2)訓(xùn)練樣本存在作物類型樣本不平衡問題,后續(xù)研究可嘗試采用按比例分層抽樣、數(shù)據(jù)增強(qiáng)等方法,提高弱樣本的應(yīng)用能力。