周玨,李蒙蒙,汪小欽,吳思穎,金時來
(1.福州大學 空間數(shù)據(jù)挖掘與信息共享教育部重點實驗室,福州 350116;2.福建省水土保持試驗站,福州 350003)
南方多山地區(qū)耕地資源相對不足,特別是在素有“八山一水一分田”的福建地區(qū)。耕作梯田的建造可有效擴展農(nóng)耕面積,提高作物種植產(chǎn)量[1]。此外,耕作梯田也是控制水土流失的有效工程措施之一,且對生態(tài)系統(tǒng)具有良好的促進作用[2]。因此,準確地掌握耕作梯田的空間分布情況對農(nóng)業(yè)管理和水土保持部門開展科學的決策支持具有重要意義[3-4]。
隨著遙感技術(shù)的發(fā)展,基于遙感影像分類的耕作梯田信息提取備受關(guān)注。近年來,高空間分辨率衛(wèi)星技術(shù)的快速發(fā)展,眾多在軌的高分辨衛(wèi)星,如WorldView、GeoEye、Pleiades等,為耕作梯田的精細提取提供了海量高分辨率遙感數(shù)據(jù)[5]。南方地區(qū)耕作梯田分布較為破碎和分散,作物種植種類較多、種植結(jié)構(gòu)復雜,不同作物生長物候信息差異較大,使得高精度的耕作梯田精細識別較為困難[6]。高分辨率遙感影像具有豐富的空間細節(jié)信息,但光譜波段較少。常規(guī)的高分辨率影像耕作梯田提取多采用面向?qū)ο蠓治龇椒ǎㄟ^提取影像對象的光譜、紋理、形狀等特征進行圖像分類[7-8]。
近年來,基于深度學習的遙感圖像分析方法在各種遙感信息提取任務(wù)中獲得了成功應(yīng)用[9-11]。其中以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學習模型,由于強大的深層圖像自動提取能力,被廣泛應(yīng)用在高分辨率遙感圖像分類任務(wù)中。針對耕作梯田信息提取,楊亞男等[12]利用無人機遙感影像,構(gòu)建深度學習模型,使用語義分割的方法在像素級上提取了黃土高原丘陵區(qū)典型的梯田。Do等[13]利用RapidEye作為數(shù)據(jù)源,利用深層神經(jīng)網(wǎng)絡(luò)模型提取梯田,基于像素和面向?qū)ο筇崛〉目傮w精度均高于85%。
通常,基于卷積神經(jīng)網(wǎng)絡(luò)的影像分類對目標類別的邊界描繪不足,存在邊界鋸齒狀明顯的問題。結(jié)合面向?qū)ο蠓治鏊枷?,目前有學者以圖像對象為基本分析單元,利用卷積神經(jīng)網(wǎng)絡(luò)提取圖像對象的深層圖像特征進行圖像分類[14-15]。例如Huang等[16]構(gòu)建了一個面向?qū)ο蟮木矸e神經(jīng)網(wǎng)絡(luò)用于高分辨率影像城市土地利用分類,Tang等[17]研究利用面向?qū)ο笊窠?jīng)網(wǎng)絡(luò)進行高分辨率影像茶園提取。但目前基于深度學習的高分辨率遙感影像梯田空間分布精細提取研究相對較少,特別是針對中國南方多山的地形區(qū)域。本研究基于國產(chǎn)高分辨率遙感數(shù)據(jù),通過構(gòu)建一個面向?qū)ο蟮木矸e神經(jīng)網(wǎng)絡(luò),開展福建地區(qū)耕作梯田精細提取,針對高分辨率影像耕作梯田訓練樣本難獲取的問題,利用遷移學習對面向?qū)ο缶矸e神經(jīng)網(wǎng)絡(luò)進行參數(shù)優(yōu)化,提高耕作梯田提取精度。
研究區(qū)位于福建省南平市浦城縣和武夷山市交界處(117°12′E~119°12′E,26°14′N~28°02N)。該區(qū)域處于福建省北部,西接江西省,北鄰浙江省,山脈大致呈東北—西南走向,中部與南部以低山丘陵為主,地形以山地丘陵為主,梯田分布廣泛[18]。該區(qū)域具有亞熱帶季風氣候,降雨充沛,獨特的氣候環(huán)境和地形特征造就了該地梯田生態(tài)和梯田農(nóng)業(yè)的發(fā)展,其中具有“萬畝梯田”美譽之稱的楓溪梯田也位于研究區(qū)內(nèi)。
本研究選擇一景2018年4月19日獲取的高分二號(GF-2)遙感影像和一景2019年11月24日獲取的資源三號(ZY-3)遙感影像。GF-2衛(wèi)星是我國自主研制的首顆空間分辨率優(yōu)于1 m的民用光學遙感衛(wèi)星,搭載有兩臺高分辨率1 m全色、4 m多光譜相機,具有亞米級空間分辨率、高定位精度和快速姿態(tài)機動能力的特點[19]。ZY-3衛(wèi)星搭載了3臺全色和1臺多光譜相機,其空間分辨率為2.1 m,其光譜分辨率為5.8 m,重訪周期為5 d。利用ENVI軟件對獲取的GF-2和ZY-3影像進行數(shù)據(jù)預處理,主要操作包括正射校正和Gram-Schmidt影像融合。
本研究結(jié)合面向?qū)ο蠓治龊途矸e神經(jīng)網(wǎng)絡(luò),構(gòu)建一種面向?qū)ο缶矸e神經(jīng)網(wǎng)絡(luò)(object-based convolutional neural networks,OCNN)進行高分辨率遙感影像梯田提取,技術(shù)路線如圖1所示。首先,對高分辨率遙感影像(GF-2和ZY-3影像)進行圖像分割獲得圖像對象;然后,利用OCNN提取影像對象的深層圖像特征;最后,基于對象的深層圖像特征,利用機器學習分類器進行梯田分類以及精度評價。
圖1 技術(shù)路線圖
1)圖像分割。本文利用多分辨率分割算法進行影像分割,考慮到耕作梯田有明顯覆蓋物,邊緣模糊不規(guī)則,為了保證較好的對象內(nèi)部同質(zhì)性和對象間異質(zhì)性,形狀因子和緊致度因子均設(shè)為0.5。為了獲得耕作梯田的最優(yōu)分割尺度,采用試錯法,對比分割尺度為100、130和150的分割效果,通過目視解譯確定最優(yōu)分割尺度。
2)深層特征提取。深層次特征主要是提取適用于目標域的高層次語義特征,越高層特征包含的高層語義性越強、分辨能力也越強,抽取的特征也越來越全局,也越來越針對目標域所訓練的數(shù)據(jù)集[20]。針對高分辨率遙感影像訓練樣本難獲取的問題,可以將經(jīng)過自然圖像數(shù)據(jù)集訓練的卷積模型應(yīng)用于遙感圖像領(lǐng)域進行特征提取。本文采用基于卷積神經(jīng)網(wǎng)絡(luò)的模型遷移,將在ImageNet數(shù)據(jù)集上訓練至收斂的ResNet50為基礎(chǔ)網(wǎng)絡(luò)進行微調(diào),提取分割對象的深層次特征,具體步驟如下。
步驟1:樣本收集與數(shù)據(jù)增強。通過目視解譯的方式選取不同類型的樣本對象,包括耕作梯田樣本301個,非耕作梯田樣本267個,用仿射變換和顏色變換兩種方式對樣本數(shù)據(jù)進行數(shù)據(jù)增強,共擴充了11倍,樣本集從原本的568個擴充到6 248個。
步驟2:基于在ImageNet數(shù)據(jù)集上訓練收斂的ResNet50模型,移去作為分類使用的最后一次全連接層,對ResNet50模型進行凍結(jié)和微調(diào)。
步驟3:將裁剪過后的影像對象作為模型的輸入,得到各個對象的2 048維的深度卷積特征。
3)梯田提取。由于特征維數(shù)大、訓練參數(shù)多,在研究區(qū)小樣本的情況下,直接使用用于地物分類的Softmax分類器會導致模型過擬合嚴重,無法較好地實現(xiàn)地物分類[21]。機器學習算法具有快速處理高維且大量的數(shù)據(jù),對過擬合問題不敏感和分類精度高等優(yōu)點,被廣泛應(yīng)用于遙感領(lǐng)域?;诟呔S深層圖像特征,本文利用機器學習分類算法進行耕作梯田提取,設(shè)置了三組對比實驗。
(1)對比OCNN與傳統(tǒng)面向?qū)ο蠓诸惙椒??;趫D像分割結(jié)果,選取40個常用的光譜、形狀、紋理等低層級圖像對象特征(表1),利用隨機森林進行圖像分類。
表1 低層級圖像特征
(2)基于深層圖像特征,對比隨機森林、XG Boost、Ada Boost三種不同機器學習分類器的耕作梯田分類效果。
(3)對比不同分辨率數(shù)據(jù)源(GF-2和ZY-3影像)對OCNN梯田提取結(jié)果的影響。
4)精度評價。首先基于混淆矩陣,通過計算總體精度、誤提率、漏提率以及Kappa系數(shù)等指標對耕作梯田的提取結(jié)果進行精度驗證。除此之外,為了對所提取耕作梯田的形狀與屬性的準確性進行評價,利用Li等[22]提出的基于面向?qū)ο蟮募訖?quán)誤差指數(shù)的精度評價方法對耕作梯田識別結(jié)果進行精度評價。其中,GUC為總體欠提取誤差指數(shù),GOC為總體過提取誤差指數(shù),GTC為全局誤差指數(shù)。
利用eCognition軟件對預處理后的遙感影像進行分割,不同分割尺度的結(jié)果如圖2所示。圖2表示不同分割尺度下的分割結(jié)果,分割尺度為100時,圖2(a)影像出現(xiàn)明顯過分割現(xiàn)象,梯田地塊過于破碎,分割尺度為150時,圖2(c)中影像出現(xiàn)了欠分割現(xiàn)象,單個分割對象包含小塊耕作梯田與林地兩種地物類型,容易出現(xiàn)誤分或者漏提的現(xiàn)象。不管過分割還是欠分割現(xiàn)象的出現(xiàn),都會對耕作梯田提取效果產(chǎn)生一定的影響。通過對比不同分割尺度下耕作梯田與其他地物的分離情況,確定以130作為耕作梯田提取的最佳分割尺度。在該尺度下,耕作梯田可以有效地與其他地物分離,各地物邊界清晰,同時又能較好地保持梯田地塊邊界完整,有助于梯田特征的提取。
圖2 不同分割尺度對比圖
1)深層次特征與低層次特征對耕作梯田提取結(jié)果的對比。通過對比提取效果差異較大的典型區(qū)域(圖3),利用深層次特征提取結(jié)果能有效減少背景地物(如居住用地、道路、果園等)的干擾,可以較好地還原耕作梯田的邊界范圍和結(jié)構(gòu)特征,而低層特征提取結(jié)果在該地區(qū)出現(xiàn)了大量的誤提,道路、建筑物和部分林地被誤提為耕作梯田。圖3(a)與圖3(b)內(nèi)地物較為復雜,包含建筑、林地、平地農(nóng)田以及耕作梯田等,低層次特征的提取結(jié)果將大片平地農(nóng)田誤提為耕作梯田,也會誤提部分與農(nóng)田相連的建筑。圖3(c)包含大量典型耕作梯田,從圖中
圖3 低層次特征與深層次特征提取結(jié)果對比圖
可以看出,利用深層次特征的提取結(jié)果可以較好還原耕作梯田的邊緣形狀,低層次特征提取效果較差,出現(xiàn)大面積耕作梯田漏提現(xiàn)象。利用深層次特征識別的總體精度為87.1%,利用低層次特征識別的耕作梯田精度為76.9%,與深層次特征相比,降低10.2%。由此可見,傳統(tǒng)的遙感影像分類方法的特征提取能力有限,無法充分利用高分辨率遙感影像中豐富的信息。深度卷積特征相比于傳統(tǒng)低層次特征,能夠在小樣本的情況下,避免出現(xiàn)過擬合,可以達到較高精度。
2)不同分類器對耕作梯田提取結(jié)果的對比。通過對比提取效果差異較大的典型區(qū)域可知(圖4),不同分類器結(jié)合提取的耕作梯田結(jié)果相似,都能較好地將梯田提取出來。但從圖4(a)可知,XG Boost和Ada Boost分類器會出現(xiàn)小部分耕作梯田漏提現(xiàn)象。從圖4(b)可知,由于茶園梯田與耕作梯田光譜、紋理和輪廓相似,這三種分類器都存在小部分將茶園梯田誤提成耕作梯田的現(xiàn)象。不同機器學習分類器精度相差不超過2%,說明這三類分類器不是影響耕作梯田提取的關(guān)鍵因素。
圖4 不同分類器提取結(jié)果對比圖
3)不同分辨率數(shù)據(jù)源對耕作梯田提取結(jié)果的對比。本文利用同區(qū)域的ZY-3遙感影像數(shù)據(jù)(2.1 m),使用此方法進行提取,并與GF-2梯田提取結(jié)果進行對比。ZY-3影像根據(jù)目視解譯發(fā)現(xiàn)梯田雖仍能識別,但是與GF-2影像對比,耕作梯田的紋理特征不明顯,形狀指數(shù)不突出。通過對比提取效果差異較大的典型區(qū)域可知(圖5),利用ZY-3數(shù)據(jù)可以提取大部分耕作梯田,但是會誤提小部分與梯田相連的平地農(nóng)田。GF-2影像作為數(shù)據(jù)源提取結(jié)果較ZY-3(2.1 m)精度提高4.6%,Kappa系數(shù)提高5.2%。GF-2影像分辨率高,在圖像識別上有巨大優(yōu)勢,如果研究區(qū)范圍小、數(shù)據(jù)精度要求高的情況,可以選擇GF-2數(shù)據(jù)進行耕作梯田識別;針對范圍較大,數(shù)據(jù)精度要求低的研究,可以使用ZY-3數(shù)據(jù)進行識別,精度也能達到82.5%,再結(jié)合人工目視解譯進行修正,也基本滿足一般研究需求。
圖5 不同分辨率數(shù)據(jù)源提取結(jié)果對比圖
通過目視解譯和實地考察選取實際梯田的驗證樣本點作為評價樣本。精度驗證主要考慮兩個方面:一方面是利用耕作梯田點位驗證提取結(jié)果中正確提取的點位個數(shù);另一方面是提取結(jié)果中對非耕作梯田地物的誤提情況。由以上三組對比實驗可知,基于GF-2數(shù)據(jù)利用面向?qū)ο蟮木矸e神經(jīng)網(wǎng)絡(luò)的方法提取深層次特征,再結(jié)合隨機森林分類器的精度最高,總體精度為87.1%,Kappa系數(shù)為0.76,虛提率為11.9%,漏提率為14.2%。通過將遙感影像圖、提取結(jié)果和實地考察照片對比可知(圖6),此方法能提取出大部分耕作梯田,同時居住用地、道路、果園等被有效剔除,提取結(jié)果并沒有受到“異物同譜”和“同物異譜”現(xiàn)象的影響,沒有明顯的錯分和漏分。對于光譜信息比較相近的地物,如果園、茶園、林地等也能進行區(qū)分,有較高的識別精度,且可以有效地克服模型過擬合嚴重的問題。
圖6 梯田提取結(jié)果
為了評估面向?qū)ο蠓指畹木?,本文選取研究區(qū)內(nèi)耕作梯田面積占比較大的小塊區(qū)域用于精度驗證,通過計算加權(quán)的過提取和欠提取誤差指數(shù)可以得到基于面向?qū)ο蟮木仍u價的欠提取誤差指數(shù)GUC為0.195、過提取誤差指數(shù)GOC為0.306、全局誤差指數(shù)GTC為0.265。從面向?qū)ο蟮木仍u價指數(shù)結(jié)果可以看出,全局誤差指數(shù)較低,雖然耕作梯田形狀不規(guī)則,但整體誤差小于0.3,說明此方法可以有效地提取耕作梯田,可以提取大部分的梯田的形狀,邊緣還原較好。
本文基于高分辨率遙感影像利用面向?qū)ο蟮木矸e神經(jīng)網(wǎng)絡(luò)提取耕作梯田,并研究對比低層次特征與深層次特征、不同分類器以及不同分辨率數(shù)據(jù)源對提取效果的影響,主要結(jié)論如下。
1)基于GF-2遙感影像,構(gòu)建了一個面向?qū)ο蟮木矸e神經(jīng)網(wǎng)絡(luò)模型對耕作梯田進行提取,總體精度達到87.1%,Kappa系數(shù)0.76,虛提率為11.9%,漏提率為14.2%,利用面向?qū)ο缶仍u價方法得到全局誤差指數(shù)GTC為0.265。所提出方法可以降低目標域數(shù)據(jù)集的數(shù)量要求,省時省力,說明該方法在高分辨率提取耕作梯田的分布信息以及形狀完整性方面具有廣闊的應(yīng)用前景。
2)與傳統(tǒng)的低層次視覺特征相比,深度卷積特征可以有效避免人為因素干擾且提高了提取的精度,且精度提高10.2%,說明該方法具有較強的魯棒性,能應(yīng)用于大面積的耕作梯田提取任務(wù)。
3)不同的機器學習分類器對于耕作梯田提取效果差別不大,隨機森林算法的精度略高于XG Boost和Ada Boost,但精度相差未超過2%,說明這三個分類器對于耕作梯田提取影響不大。
4)本文分別利用GF-2數(shù)據(jù)與ZY-3(2.1 m)數(shù)據(jù)提取耕作梯田并進行比較,利用GF-2數(shù)據(jù)提取結(jié)果精度提高4.6%。越高分辨率遙感影像上耕作梯田的尺寸、形狀、結(jié)構(gòu)與鄰域關(guān)系都得到更好的反映,內(nèi)部組成要素豐富的細節(jié)信息可以更好地得到表征,利用此方法可以很好地挖掘高分辨率遙感影像的特征,分辨率越高,提取效果越好。GF-2影像分辨率高,在圖像識別上優(yōu)勢明顯。