寧曉剛,常文濤,王浩,張翰超,朱乾德
1.中國測繪科學(xué)研究院攝影測量與遙感研究所,北京100036;
2.山東科技大學(xué)測繪科學(xué)與工程學(xué)院,青島266590;
3.南京水利科學(xué)研究院水文水資源與水利科學(xué)國家重點(diǎn)實驗室,南京210029
濕地僅覆蓋地球陸地表面積的3%—8%,但它卻是減少全球溫室氣體和減輕氣候變化的最重要的因素之一,并且極大地影響了生物多樣性和水文聯(lián)系(Mitsch 等,2013)。濕地的生態(tài)系統(tǒng)服務(wù)功能包括調(diào)蓄洪水,改善水質(zhì),維持海岸線穩(wěn)定,保持水生植物生產(chǎn)力,維持野生動植物種群續(xù)存等(Mitsch 和Gosselink,2000)。但是由于人類活動和自然過程的影響,濕地面積正加速萎縮(Ozesmi 和Bauer,2002)。因此,對濕地進(jìn)行快速準(zhǔn)確的監(jiān)測是當(dāng)前濕地研究的熱點(diǎn)(Shalaby 和Tateishi,2007)。
相對于傳統(tǒng)的野外調(diào)查,遙感技術(shù)具有觀測范圍廣,更新周期短,信息量大等優(yōu)點(diǎn),在濕地信息提取及變化監(jiān)測方面發(fā)揮了重要作用。但是在大尺度范圍利用遙感數(shù)據(jù)進(jìn)行準(zhǔn)確的濕地信息提取仍具有挑戰(zhàn)性。光學(xué)影像作為最主要的遙感數(shù)據(jù)源,受到云雨等天氣影響很大,經(jīng)常形成無效觀測。云污染對重訪周期較長的中高分辨率衛(wèi)星數(shù)據(jù)影響更為顯著,對于大尺度區(qū)域和陰雨天氣較多的南方地區(qū)更易造成數(shù)據(jù)缺失?;谖⒉ǖ暮铣煽讖嚼走_(dá)(SAR)彌補(bǔ)了光學(xué)影像的不足,其對云層具有很強(qiáng)的穿透能力,可以不受天氣影響對地表進(jìn)行全天時全天候觀測。雷達(dá)后向散射系數(shù)對地物的介電特性敏感,對植被含水量和土壤含水量以及地表的幾何特性如粗糙度具有不同的響應(yīng),可以提供不同于光學(xué)影像的獨(dú)特信息(王安琪等,2012)。此外,利用地形地貌特征對提取某些濕地類型,如灌叢濕地和森林濕地具有重要作用(嚴(yán)婷婷等,2014)。研究表明,光學(xué)、雷達(dá)以及地形數(shù)據(jù)的結(jié)合使用可以發(fā)揮多源遙感數(shù)據(jù)優(yōu)勢互補(bǔ)的作用,光譜信息和散射機(jī)制的結(jié)合對濕地信息提取有著巨大的潛力。劉蕾等(2013)結(jié)合Landsat TM 影像、C 波段的ENVISAT ASAR 以及地形輔助數(shù)據(jù)對扎龍濕地進(jìn)行分類,發(fā)現(xiàn)雷達(dá)后向散射系數(shù)和地形輔助數(shù)據(jù)對濕地分類精度的提高起到重要作用。Dubeau 等(2017)使用了Landsat、L 波段ALOS PALSAR 以及地形數(shù)據(jù)對埃塞俄比亞的達(dá)布斯?jié)竦剡M(jìn)行分類,光學(xué)、雷達(dá)和地形數(shù)據(jù)的結(jié)合取得了最佳的總體分類精度。Limpitlaw 和Gens(2006)研究發(fā)現(xiàn),單獨(dú)使用光學(xué)或SAR 數(shù)據(jù)識別開闊水體、淹水植被和非淹水植被時,精度并不理想,而將兩者結(jié)合時可以顯著提高這3種地物的識別精度。然而在這些研究中鮮有將光學(xué)、SAR、地形特征進(jìn)行橫向?qū)Ρ?,以評價它們對沼澤濕地信息提取的重要性差異。
近年來,隨著歐洲空間局“哥白尼”計劃(Copernicus Programme)的啟動,先后發(fā)射了12 d重訪周期(雙星協(xié)同可達(dá)6 d)的Sentinel-1 合成孔徑雷達(dá)(SAR)衛(wèi)星和10 d重訪周期(雙星協(xié)同可達(dá)5 d)的Sentinel-2 多光譜衛(wèi)星。這為全球濕地制圖提供了前所未有的機(jī)會,高重訪周期有效地減輕了云污染的影響。并且,Sentinel-2 是目前唯一一個在紅邊范圍內(nèi)含有3個波段的多光譜傳感器,這對監(jiān)測植被健康信息非常有效(Shoko 和Mutanga,2017)。Chatziantoniou 等(2017)使用Sentinel-1 和Sentinel-2 數(shù)據(jù)與支持向量機(jī)(SVM)對希臘的科洛尼亞國家公園和沃爾維湖進(jìn)行土地覆蓋制圖,重點(diǎn)關(guān)注濕地類,取得了93.85%的總體精度。Whyte 等(2018)協(xié)同使用Sentinel-1 和Sentinel-2 數(shù)據(jù)和面向?qū)ο螅∣BIA)方法采用支持向量機(jī)和隨機(jī)森林算法對iSimangaliso 濕地公園進(jìn)行土地覆蓋制圖,Sentinel-1 和Sentinel-2 的聯(lián)合使用顯著提高了濕地制圖的精度。其他研究也表明了Sentinel-1 和Sentinel-2 在濕地研究方面的巨大潛力(Yesou 等,201)。此外,由于數(shù)據(jù)量和機(jī)器性能的限制,融合多源數(shù)據(jù)實現(xiàn)省級乃至更大范圍的高頻次觀測仍然面臨很大困難。使用基于工作站的常規(guī)遙感影像處理軟件在收集、存儲和處理覆蓋大尺度區(qū)域長時間序列的遙感數(shù)據(jù)方面效率低下(Teluguntla等,2018)。隨著高級機(jī)器學(xué)習(xí)工具的開發(fā)以及強(qiáng)大的云計算資源的集成,有效的解決了現(xiàn)有方法和產(chǎn)品的局限性,為地理空間科學(xué)在新的時空尺度上開展更廣泛的應(yīng)用提供了新的機(jī)遇(Hird 等,2017)。Google Earth Engine(GEE)是一個開放式的云計算平臺,擁有海量歷史遙感影像數(shù)據(jù)存檔,借助谷歌公司強(qiáng)大的計算資源實現(xiàn)PB 級遙感數(shù)據(jù)的高性能并行運(yùn)算(Gorelick 等,2017)。用戶通過調(diào)用GEE 提供的Python和JavaScript 應(yīng)用編程接口API(Application Programming Interface)實現(xiàn)對云端海量數(shù)據(jù)的訪問,結(jié)合其提供的算法實現(xiàn)在線計算和結(jié)果可視化等操作。憑借此優(yōu)勢,GEE 可以大大減少數(shù)據(jù)獲取和處理的工作量,已經(jīng)成為地理空間科學(xué)研究的重要工具(Gorelick 等,2017)。孟夢等(2019)使用GEE 平臺生產(chǎn)了白洋淀濕地1987年—2017年的NDVI 和NDWI 數(shù)據(jù)集并對其濕地生態(tài)系統(tǒng)景觀進(jìn)行分類。Mahdianpari 等(2019)利用GEE 平臺和Sentinel-1 和Sentinel-2 數(shù)據(jù)對紐芬蘭島進(jìn)行濕地分類,他們發(fā)現(xiàn)光學(xué)和SAR 的結(jié)合可以顯著提高濕地分類的準(zhǔn)確性,運(yùn)用基于對象的隨機(jī)森林(RF)分類可以實現(xiàn)88.37%的總體精度和0.85 的Kappa 系數(shù)。Amani 等(2019)使用GEE 和機(jī)器學(xué)習(xí)算法利用Landsat 8 和Sentinel-1 數(shù)據(jù)基于有限的實測樣本繪制了加拿大3個省的濕地地圖,總體準(zhǔn)確度分別為84%,78%和82%。常文濤等(2020)研究了Sentinel-2 紅邊特征和Sentinel-1 雷達(dá)特征對小范圍濕地提取的作用,但在更大的范圍上特征適用性問題需要進(jìn)一步研究。
綜上,盡管光學(xué)、SAR 和地形等多源數(shù)據(jù)結(jié)合已被用于濕地信息提取,但鮮有將光學(xué)、SAR等眾多特征進(jìn)行橫向?qū)Ρ?,定量評價各個特征對于沼澤濕地信息提取的作用,以尋找有利于沼澤濕地提取的最優(yōu)特征組合。為此,本文借助GEE云平臺,將Sentinel-1SAR、Sentinel-2 光學(xué)和地形數(shù)據(jù)以及機(jī)器學(xué)習(xí)算法相結(jié)合,對中國境內(nèi)黑龍江流域沼澤濕地進(jìn)行提取。設(shè)計了多種分類方案,探討了紅邊、雷達(dá)以及地形特征對大范圍區(qū)域沼澤濕地提取的重要性,驗證了利用JM 距離尋找最優(yōu)特征的可行性。鑒于全國濕地類別的特征相似性,希望未來能夠?qū)⒈疚牡姆椒ㄓ糜诟蟮某叨纫栽谌珖秶鷥?nèi)進(jìn)行沼澤濕地信息提取。
本文的研究區(qū)為黑龍江流域(中國境內(nèi))(41°42′N—53°33′N,115°25′E—135°2′E),文中所有黑龍江流域均特指位于中國境內(nèi)的部分。黑龍江跨蒙古國、中國、俄羅斯3國,中國境內(nèi)流域面積約為89萬km2,占流域總面積的48%。黑龍江流域有著中國最大的沼澤濕地,河流、湖泊等水資源豐富。黑龍江流域水系以黑龍江為干流,主要支流有松花江、烏蘇里江、嫩江等(崔茂歡,2006)。流域跨溫帶和寒溫帶兩個氣候帶,年均氣溫在-8—6 ℃。年均降水量為250—800 mm,主要發(fā)生在6—9月,約占全年降水量的70%(鄢波等,2019)。
研究中使用的所有遙感數(shù)據(jù)均由GEE 平臺在線調(diào)用和處理,具體包括Sentinel-2 衛(wèi)星的多光譜數(shù)據(jù),Sentinel-1 衛(wèi)星的后向散射系數(shù),SRTM 數(shù)字高程數(shù)據(jù)以及訓(xùn)練樣本數(shù)據(jù)。
根據(jù)已有研究(Lin 等,2015;Song 等,2011),使用訓(xùn)練樣本做監(jiān)督分類時,若訓(xùn)練樣本與研究區(qū)域的范圍和時相相對應(yīng)時,大氣校正并不是必須的。考慮到2018年GEE 上Sentinel-2 的地表反射率數(shù)據(jù)覆蓋不全,因此Sentinel-2 數(shù)據(jù)使用的是L1C級的大氣表觀反射率(TOA)產(chǎn)品。由于研究區(qū)范圍巨大(89 萬km2)以及云污染的影響,在短時間內(nèi)(例如一個月)難以獲取覆蓋研究區(qū)范圍的數(shù)據(jù)。因此,使用2018-08—2018-10創(chuàng)建了光學(xué)合成影像,選擇此時間段是因為它提供了最多的無云數(shù)據(jù)并且處于植被生長期,可以保留更多的濕地植被信息。在此期間內(nèi)共獲得了Sentinel-2 影像2942 景。為了減輕云污染的影響,在合成無云影像時對云量百分比進(jìn)行了限制(<20%)。然后使用Sentinel-2 云掩膜算法對指定時間和空間范圍內(nèi)影像進(jìn)行計算,以中值合成方法重構(gòu)最小云量合成影像。受益于GEE 平臺的數(shù)據(jù)運(yùn)算和管理機(jī)制,研究中使用的所有遙感數(shù)據(jù)均采樣至10 m,并且GEE 通過內(nèi)嵌算法統(tǒng)一坐標(biāo)系確保不同數(shù)據(jù)源之間的幾何配準(zhǔn)精度。
Sentinel-1 數(shù)據(jù)使用的是干涉寬幅模式(IW)的地距多視產(chǎn)品(GRD),分辨率為10 m。通常,Sentinel-1在極地地區(qū)收集全極化即HH、HV、VH和VV 數(shù)據(jù),而在其他地區(qū)只收集VH 和VV 數(shù)據(jù)。因此本研究共獲取2018-08—2018-10 VH 極化數(shù)據(jù)433 景,VV 極化數(shù)據(jù)407 景。然后通過調(diào)用GEE 預(yù)處理模塊完成軌道參數(shù)定標(biāo)、熱噪聲去除、輻射定標(biāo)和地形校正等操作。通過上述步驟將無單位的后向散射強(qiáng)度圖像轉(zhuǎn)換為后向散射系數(shù)值(以dB 為單位)。雖然SAR 影像不受云雨等天氣條件的影響但是其受觀測角度影響較大,即距離成像中心越遠(yuǎn)的像元噪聲越強(qiáng)。因此預(yù)處理后的SAR 數(shù)據(jù)逐像元計算其在時間范圍內(nèi)的中位數(shù),以減小噪聲的影響。
分類結(jié)果的精度與訓(xùn)練樣本的數(shù)量、分布和代表性顯著相關(guān)。根據(jù)黑龍江流域土地覆蓋情況結(jié)合相關(guān)文獻(xiàn)(方利等,2017)將研究區(qū)土地覆蓋類型分為沼澤、水田、人工地表、旱地、鹽堿地、林地、明水面7類,其中沼澤、水田和明水面是濕地的主要類型。采用隨機(jī)采樣的方法在研究區(qū)生成樣本點(diǎn),利用2018-08—2018-10 Google Earth 等高分辨率影像對樣本點(diǎn)進(jìn)行目視解譯,得到的樣本總數(shù)為6649 個,其中用于訓(xùn)練和驗證的比例為7∶3,分別為4673 個和1976 個。最終各類型樣本數(shù)量如表1所示。
表1 樣本采集情況Table 1 Situation of sample collection/個
3.2.1 技術(shù)路線
本文的技術(shù)路線如圖1所示。首先對2018-08—2018-10 Sentinel-2 影像進(jìn)行最小云量合成,結(jié)合SRTM DEM 數(shù)據(jù)提取的坡度和高程特征以及Sentinel-1 雷達(dá)數(shù)據(jù)提取的VV 和VH 后向散射系數(shù)特征進(jìn)行波段合成、研究區(qū)裁剪。為了說明紅邊、雷達(dá)和地形特征的作用以及有利于沼澤濕地提取的最佳特征設(shè)計6 種實驗方案:光譜特征+植被指數(shù)+水體指數(shù)(方案1),光譜特征+紅邊特征(方案2),光譜特征+地形特征(方案3),光譜特征+雷達(dá)特征(方案4),光譜特征+植被指數(shù)+水體指數(shù)+紅邊特征+地形特征+雷達(dá)特征(方案5),特征優(yōu)選(方案6)。利用樣本點(diǎn)進(jìn)行隨機(jī)森林分類和精度評價,對精度最高的實驗方案進(jìn)行分類器參數(shù)調(diào)優(yōu),最后得到分類結(jié)果。
圖1 技術(shù)路線Fig.1 Technical scheme
3.2.2 特征集構(gòu)建
選取光譜特征、植被指數(shù)、水體指數(shù)、紅邊指數(shù)、地形特征以及雷達(dá)后向散射系數(shù)構(gòu)建特征集,各個特征的詳細(xì)說明見表2。需要說明的是,Sentinel-2 包括3 個紅邊波段,為了說明紅邊波段的作用將紅邊波段與紅邊指數(shù)一起作為紅邊特征。
表2 特征說明Table 2 Description of the features
3.2.3 特征優(yōu)選
采用JM 距離(Jeffries-Matusita distance)對沼澤與其他地類的可分性進(jìn)行定量分析,并據(jù)此確定最佳特征組合。JM 距離是衡量類別間分離度的有效工具(張猛和曾永年,2015),表達(dá)式為
式中,B表示某一特征的巴氏距離。在樣本滿足正態(tài)分布的前提下,不同類別樣本的巴氏距離B(Bhattacharyya distance)為
式中,ek表示某類特征的均值,表示某類特征的方差(張猛等,2017)。JM距離表示樣本間的可分離程度,其值在0—2,值越大表示分離性越好。
3.2.4 隨機(jī)森林分類
本研究采用隨機(jī)森林(RF)算法用于黑龍江流域濕地分類。RF 是一種非參數(shù)分類器,由一組決策樹組成,能夠處理高維遙感數(shù)據(jù)(Belgiu 和Dr?gu?,2016)。與其他的機(jī)器學(xué)習(xí)算法如決策樹(DT)和支持向量機(jī)(SVM)相比,它更加穩(wěn)健并且易于使用(Rodriguez-Galiano 等,2012)。隨機(jī)森林的構(gòu)建過程為:首先使用bootstrap非參數(shù)抽樣方式從原始訓(xùn)練樣本集中有放回的隨機(jī)抽取樣本生成訓(xùn)練樣本集合進(jìn)行訓(xùn)練得到?jīng)Q策樹模型。假設(shè)每個樣本有M個特征,之后在決策樹的每個結(jié)點(diǎn)處從M個特征中隨機(jī)抽取m(m?M)個進(jìn)行結(jié)點(diǎn)分裂;由于隨機(jī)森林是一種集成學(xué)習(xí)方法,不容易出現(xiàn)過擬合現(xiàn)象,因此在決策樹構(gòu)建過程中不需要進(jìn)行剪枝(何云等,2019)。重復(fù)上述步驟k次得到由k個決策樹模型組成的隨機(jī)森林,每個分類樣本的分類結(jié)果由k個決策樹通過多數(shù)表決的方式?jīng)Q定。
隨機(jī)森林的效果通過兩個參數(shù)來調(diào)整,即決策樹的個數(shù)k和結(jié)點(diǎn)使用的特征數(shù)m。根據(jù)之前的研究(Belgiu 和Dr?gu?,2016),當(dāng)特征數(shù)使用以下值時(樹的個數(shù)固定為500):(1)特征總數(shù)的三分之一;(2)特征總數(shù)的平方根;(3)特征總數(shù)的二分之一;(4)特征總數(shù)的三分之二;(5)所有特征,分類精度的變化很小。因此根據(jù)文獻(xiàn)(Breiman,2001)的建議,將結(jié)點(diǎn)特征數(shù)設(shè)置為特征總數(shù)的平方根,研究中調(diào)用GEE 平臺提供的隨機(jī)森林算法并對決策樹的個數(shù)進(jìn)行調(diào)整。
3.2.5 精度評價
利用混淆矩陣和從Google Earth 等高分辨影像采集的樣本點(diǎn)(表1)對黑龍江流域濕地分類進(jìn)行精度驗證。計算總體精度、Kappa系數(shù)、制圖精度和用戶精度,總體精度反映了算法的總體效果,通過正確分類的樣本數(shù)占驗證樣本總數(shù)的比例來衡量。Kappa系數(shù)表示地面真實數(shù)據(jù)和預(yù)測值之間的一致性程度。制圖精度表示該類別的地面真實參考數(shù)據(jù)(驗證樣本)被正確分類的概率。用戶精度表示在該次分類中,在分類圖上,落在該類別上的檢驗點(diǎn),被正確分類為該類別的比率(Congalton,1991)。
基于GEE 平臺取得每個類別的樣本均值計算JM 距離對特征集內(nèi)所有特征進(jìn)行可分性分析,本研究關(guān)注的是不同特征對沼澤濕地信息提取的重要性,因此只計算沼澤同其他土地覆蓋類型的JM距離。利用JM 距離作為衡量不同特征沼澤同其他地類的分離程度的標(biāo)準(zhǔn),按照分離度由高到低依次增加特征,觀察沼澤的制圖精度變化(圖2)。當(dāng)特征數(shù)為21 時沼澤的制圖精度達(dá)到最大,之后隨著特征繼續(xù)增加沼澤精度開始趨于穩(wěn)定并有所下降。因此使用前21 個特征作為方案6 使用的特征,具體為B6、B11、B4、B2、NDVIre2、MDWI、
圖2 沼澤制圖精度隨特征變化情況Fig.2 Variation of marsh producer accuracy with features
B5、NDVIre1、MNDWI、B9、CIre、B7、Elevation、B3、NDVI、Slope、VH、B8A、B8、VV、NDre2。開始隨著所用特征的增加,沼澤制圖精度呈快速增長趨勢,當(dāng)使用特征數(shù)為10 時即能達(dá)到最優(yōu)精度的90.74%。
對前21 個特征的JM 距離進(jìn)行分類統(tǒng)計分析,將光譜特征、植被指數(shù)和水體指數(shù)作為其他光學(xué)特征類別,得到表3。4 類特征中分離度最高的是紅邊特征,其次是其他光學(xué)特征、地形特征、雷達(dá)特征。紅邊特征中分離度最高的是紅邊波段B6,分離度最低的是紅邊指數(shù)NDre2。紅邊特征與植被的生化信息(如葉面積指數(shù)、葉綠素含量等)息息相關(guān)(Dubeau 等,2017),相比其他特征更能凸顯植被種間差異,有利于植被茂密繁雜的沼澤區(qū)域的識別。雷達(dá)特征中,VH 交叉極化后向散射系數(shù)能獲取更多的植被結(jié)構(gòu)信息,分離度上要高于VV 極化后向散射系數(shù)。雷達(dá)特征在四類特征中的分離度最低,但仍對沼澤濕地信息提取起到積極作用。
表3 不同類型特征的Jeffries-Matusita(JM)距離Table 3 Jeffries-Matusita(JM)distance between different types of features
圖3 展示了6 種分類方案的分類結(jié)果,經(jīng)過特征優(yōu)化的方案6取得了最好的分類效果,分類結(jié)果碎片化的現(xiàn)象明顯少于其他幾種分類方案。
圖3 6種實驗方案的分類結(jié)果Fig.3 Classification results of six schemes
6 種分類方案的分類精度如表4所示,綜合來看在所有類別中明水面的分類精度最高,沼澤的分類精度最低。與植被指數(shù)和水體指數(shù)相比,紅邊特征、雷達(dá)特征和地形特征對沼澤提取的作用更大。紅邊特征、雷達(dá)特征和地形特征分別使沼澤的制圖精度和用戶精度提高了7.56%,5.01%;5.04%,5.39%;4.48%,4.22%。雖然所有特征都參與分類的方案5取得了較好的效果,但是沒有考慮到信息冗余問題。方案6 通過JM 距離對所有特征進(jìn)行優(yōu)選,不僅取得了比所有28 個特征參與分類的方案5 更好的精度而且有效的降低了數(shù)據(jù)量,特征數(shù)減少到21 個,減少了信息冗余提高運(yùn)算效率。通過特征優(yōu)化后,沼澤的制圖精度和用戶精度相比方案5 分別提高了1.40%和4.60%,總體精度和Kappa 系數(shù)提高了0.86%和0.02。因此采用方案6作為最終的濕地分類方案。
表4 分類精度統(tǒng)計Table 4 Classification accuracy statistics
對方案6進(jìn)行隨機(jī)森林分類,對每個結(jié)點(diǎn)決策樹的個數(shù)進(jìn)行了調(diào)整以尋找最佳值,首先將樹的個數(shù)設(shè)置為1記錄其沼澤的制圖精度,然后將樹的個數(shù)設(shè)置為5,之后以5 為步長,觀察樹的個數(shù)每增加5其精度的變化(圖4)。由圖4看出,增加樹的個數(shù),沼澤的生產(chǎn)者精度快速增長,當(dāng)樹的個數(shù)為20 時,沼澤的生產(chǎn)者精度達(dá)到最大,之后隨著樹的個數(shù)增加,沼澤的生產(chǎn)者精度開始緩慢下降。因此最優(yōu)參數(shù)為決策樹的個數(shù)為20 棵。經(jīng)過隨機(jī)森林調(diào)參后沼澤的制圖精度提高了13.16%,總體精度提高了7.99%。
圖4 隨機(jī)森林樹的個數(shù)與沼澤制圖精度的關(guān)系Fig.4 Relationship between the number of random forest trees and the producer accuracy of marsh
表5 顯示了方案6 最終的混淆矩陣,其中對角線表示制圖精度。利用JM 距離進(jìn)行特征優(yōu)選和隨機(jī)森林調(diào)參后分類精度顯著提高,水田、人工地表、鹽堿地和明水面的生產(chǎn)者精度均在90%以上。沼澤、旱地和林地的精度相對較低,這主要是由于旱地上農(nóng)作物種植時間存在差異,不同地區(qū)甚至是同一地區(qū)的旱地存在有植被覆蓋和無植被覆蓋兩種地表覆蓋差異,而本文在采集樣本點(diǎn)時沒有對此加以區(qū)分,導(dǎo)致旱地的訓(xùn)練樣本包含有植被覆蓋的旱地和無植被覆蓋的旱地2 類,由于這3種地類的光譜相似性導(dǎo)致相互混淆。利用最佳分類方案進(jìn)行濕地分類總精度為91.54%,Kappa 系數(shù)為0.90,沼澤的制圖精度和用戶精度分別為88.79%和88.30%,水田的制圖精度和用戶精度分別為94.23%和96.45%,明水面的制圖精度和用戶精度分別為98.67%和98.23%。
表5 方案6混淆矩陣Table 5 Confusion matrix of scheme 6
圖5展示了本文的分類結(jié)果圖,以及幾處細(xì)節(jié)的分類效果,圖5(b)和圖5(c)為扎龍濕地,圖5(d)為三江平原濕地。最終的分類結(jié)果邊界清晰,基本沒有破碎化的現(xiàn)象,對比光學(xué)影像絕大大多數(shù)土地覆蓋類型都得到了正確區(qū)分。圖5(b)中,靠近河流的區(qū)域被正確識別為了沼澤濕地。圖5(c)位于扎龍國家級自然保護(hù)區(qū),主要土地覆蓋類型為草本沼澤,本文中大部分區(qū)域識別正確,沼澤中分布的明水面、水田和鹽堿地等也都清晰可見。在圖5(d)中也是如此,沼澤濕地邊界清晰,比較符合實際情況,提取效果較好。
本文依托于Google Earth Engine 強(qiáng)大的計算能力以及哨兵衛(wèi)星收集的高空間和高時間分辨率遙感數(shù)據(jù),考慮了多種分類方案,基于GEE 平臺實現(xiàn)了大尺度區(qū)域沼澤濕地信息提取,探討了紅邊、雷達(dá)以及地形特征對沼澤濕地提取的作用,驗證了利用JM 距離尋找最優(yōu)特征的可行性。結(jié)果表明:(1)紅邊特征對沼澤濕地類別的辨別能力最好,紅邊特征、雷達(dá)特征和地形特征分別使沼澤的制圖精度和用戶精度提高了7.56%,5.01%;5.04%,5.39%;4.48%,4.22%。(2)利用JM距離橫向?qū)Ρ攘瞬煌卣鲗φ訚蓾竦匦畔⑻崛〉闹匾?,就沼澤同其他類型的分離度而言,紅邊特征>其他光學(xué)特征>地形特征>雷達(dá)特征。(3)利用JM 距離探索了有利于沼澤濕地信息提取的最優(yōu)特征組合,并將特征數(shù)由28減少到21。具體為B6、B11、B4、B2、NDVIre2、MDWI、B5、NDVIre1、MNDWI、B9、CIre、B7、Elevation、B3、NDVI、Slope、VH、B8a、B8、VV、NDre2,相比特征優(yōu)化前沼澤濕地的制圖和用戶精度分別提高了1.40%和4.60%。在最優(yōu)特征基礎(chǔ)上進(jìn)行隨機(jī)森林調(diào)參最終得到的總體精度為91.54%,Kappa系數(shù)為0.90,沼澤濕地的提取精度達(dá)到88.55%。JM 距離為特征優(yōu)選提供理論支持,相比其他特征選擇方法更為直觀合理,得到最優(yōu)特征組合后方便后續(xù)直接使用。需要注意的是訓(xùn)練樣本應(yīng)滿足與影像時相相對應(yīng)且具有代表性,否則將影響基于樣本特征計算的JM距離的結(jié)果。
盡管本文沼澤濕地提取取得了較好的精度,但仍存在一些不足,后續(xù)研究將從以下3個方面進(jìn)行改進(jìn):(1)利用沼澤與旱地、林地在多時相上展現(xiàn)出的物候特征差異減少單時相中三者的混淆;(2)更深入的探討有利于沼澤濕地提取的特征及不同特征間的相互影響,以期更好的優(yōu)化所用特征;(3)探索基于GEE 平臺實現(xiàn)面向?qū)ο蟮姆椒ㄒ愿纳苹谙裨椒óa(chǎn)生的“椒鹽現(xiàn)象”。