呂 燁,史良樹,田燕芹,張 麗,閆 敏,李一瓊
(1.中國國土勘測規(guī)劃院,北京 100035;2.中國科學(xué)院 空天信息創(chuàng)新研究院,北京 100094;3.蘇州科技大學(xué) 地理科學(xué)與測繪工程學(xué)院,江蘇 蘇州 215009)
濕地與森林、海洋并稱為地球3大生態(tài)系統(tǒng)[1],是目前自然界中功能最全、結(jié)構(gòu)最復(fù)雜、物種最豐富的一種自然生態(tài)結(jié)構(gòu),能夠產(chǎn)生經(jīng)濟(jì)、社會、生態(tài)和環(huán)境方面的作用和功能[2]。濕地不僅擁有極強(qiáng)的降解污染的功能,而且在氣候調(diào)節(jié)、水源涵養(yǎng)、生物多樣性和生態(tài)鏈完整性維護(hù)等方面都發(fā)揮著重要作用[3],具有“地球之腎”“生命的搖籃”和“物種基因庫”等美稱。中國是亞洲擁有濕地面積最大的國家。但第二次全國濕地資源調(diào)查統(tǒng)計,與第一次調(diào)查相比,我國濕地面積減少了將近340萬hm2,減少率達(dá)到8.82%,自然濕地面積減少了337多萬hm2,減少率達(dá)9.33%(來源于國家林業(yè)和草原局政府網(wǎng))。為了防止?jié)竦刭Y源進(jìn)一步損失并對其進(jìn)行有效保護(hù),研究濕地空間分布和定量化分析顯得尤為重要。
在國際上,應(yīng)用遙感技術(shù)進(jìn)行濕地制圖并以此開展?jié)竦刭Y源調(diào)查與監(jiān)測的相關(guān)研究最早起源于19世紀(jì)70年代[4]。隨著遙感技術(shù)應(yīng)用的快速發(fā)展,基于衛(wèi)星遙感進(jìn)行濕地信息提取已成為濕地資源調(diào)查、監(jiān)測與保護(hù)最為有效的手段之一[5]。如Finley等[6]利用 Landsant MSS 遙感數(shù)據(jù)進(jìn)行人工目視判讀,根據(jù)遙感影像自身提供的顏色、紋理等特征獲取了更高精度的濕地空間分布狀況信息,為濕地資源調(diào)查提供了可靠的基礎(chǔ)數(shù)據(jù)。郭焱州[7]基于國產(chǎn)GF-1衛(wèi)星對長沙市城區(qū)濕地信息提取獲得了Kappa系數(shù)0.88和總體精度90.53%的精確結(jié)果。王霄鵬等[8]通過融合Radarsat-2和Landsat-5兩種影像數(shù)據(jù),利用兩類數(shù)據(jù)源的綜合特征對濱海濕地進(jìn)行分類,驗證了應(yīng)用該分類方法的可行性與實用性。目前研究以Landsat系列數(shù)據(jù)為主,高分辨率數(shù)據(jù)的應(yīng)用較少,尤其是有關(guān)瑪多湖區(qū)域的針對性分析更少。而瑪多湖濕地是國家重要濕地之一,淡水資源豐富,擁有巨大的生態(tài)功能。在全球氣候變暖的大背景下,瑪多湖濕地是對氣候變化較為敏感的地區(qū)之一,但也極易受到氣候改變帶來的影響。因此,及時監(jiān)測并實時掌握瑪多湖濕地的空間分布及變化情況,對該地區(qū)的經(jīng)濟(jì)發(fā)展、社會穩(wěn)定以及政策決策有著深遠(yuǎn)影響,也為人類社會的發(fā)展提供充足的資源保障。本研究以瑪多湖國家濕地保護(hù)區(qū)為研究區(qū),基于Sentinel-2高分辨率遙感影像,采用3種分類方法進(jìn)行自動識別,量化3種分類方法應(yīng)用于高分辨率多光譜衛(wèi)星數(shù)據(jù)進(jìn)行濕地信息提取間的差異,并比較不同分類方法之間的性能與適用性,得到適合該區(qū)域濕地類型識別的最佳分類方法,以期為當(dāng)?shù)卣_展?jié)竦刭Y源保護(hù)和生態(tài)修復(fù)等工作規(guī)劃提供理論依據(jù)。
瑪多湖濕地位于青海省南部果洛藏族自治州西北部的瑪多縣,地理位置介于34°38′N~35°00′N,97°55′E~98°20′E之間,由4個面積分別為3 100,3 000,2 000和2 000 hm2的淡水湖泊及幾個更小的湖泊及沼澤地組成(見圖1)。該地區(qū)屬于典型的高原大陸性半濕潤氣候,一年中無四季之分,只有冷暖之別,且干濕分明,年平均氣溫為-4 ℃,全年無絕對無霜期,6—9月是植被生長季,地勢自西北向東南傾斜。該湖區(qū)水源來自當(dāng)?shù)貜搅鳎鏊魅朦S河上游,冬天湖泊及其沼澤地完全冰凍,濕地總面積約11 000 hm2。
圖1 研究區(qū)空間位置
Sentinel-2是歐洲航天局倡議的全球環(huán)境與安全監(jiān)測系統(tǒng)(即哥白尼計劃)的重要組成部分,主要服務(wù)于植被監(jiān)測、土地覆蓋變化、湖水和近海水域污染監(jiān)測,以及自然災(zāi)害應(yīng)對與管理等。它是由Sentinel-2A和Sentinel-2B兩顆互補(bǔ)衛(wèi)星組成的衛(wèi)星星座,軌道高度為786 km。兩顆衛(wèi)星均攜帶一個多光譜成像儀,可覆蓋13個光譜波段,空間分辨率分別為10 m,20 m和60 m,單顆衛(wèi)星重訪周期為10天,星座重訪周期為5天。本文選擇2020年9月2日無云Sentinel-2B影像作為原數(shù)據(jù),并通過美國地質(zhì)調(diào)查局網(wǎng)站(http://glovis.usgs.gov/)下載獲得,利用歐洲太空局提供的Sentinel-2 Toolbox軟件對影像進(jìn)行輻射校正和大氣校正。根據(jù)多光譜圖像中的波段計算4種光譜指數(shù)。計算公式如式(1)~(4)所示。
NDVI=(NIR-RED)/(NIR+RED),
(1)
NDWI=(GREEN-NIR)/(GREEN+NIR),
(2)
BI=BLUE+RED,
(3)
RVI=NIR/RED。
(4)
DEM數(shù)據(jù)是由ALOS(advanced land observing satellite)衛(wèi)星相控陣型L波段合成孔徑雷達(dá)(PALSAR)采集。該傳感器具有高分辨率、掃描式合成孔徑雷達(dá)、極化3種觀測模式,數(shù)據(jù)水平及垂直精度可達(dá)12.5 m。
分類系統(tǒng)與研究目的、分類層次及研究尺度相關(guān),同時分類系統(tǒng)的制定直接影響制圖精度[9],是濕地信息提取的首要步驟。參考《濕地公約》、我國濕地分類系統(tǒng)以及已有研究的分類體系,并基于瑪多湖濕地利用現(xiàn)狀,將研究區(qū)劃分為2個一級類、5個二級類,其劃分標(biāo)準(zhǔn)與解譯標(biāo)志如表1所示。
表1 瑪多湖濕地分類體系與影像解譯標(biāo)志
機(jī)器學(xué)習(xí)作為人工智能的核心,可從數(shù)據(jù)集中自主學(xué)習(xí)并發(fā)現(xiàn)知識,可用于預(yù)測高性能模型。如隨機(jī)森林(random forests,RF)、神經(jīng)網(wǎng)絡(luò)(neural net,NN)和支持向量機(jī)(support vector machine,SVM)等在作物識別中都有較好的表現(xiàn)。隨機(jī)森林算法由Breiman等于2001年提出,是一個包含多棵獨(dú)立決策樹的分類器,可對隨機(jī)抽取的樣本信息進(jìn)行類別預(yù)測的無參數(shù)分類器[10],并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。神經(jīng)網(wǎng)絡(luò)技術(shù)使用標(biāo)準(zhǔn)反向傳播進(jìn)行監(jiān)督學(xué)習(xí)[11],可通過調(diào)整節(jié)點(diǎn)中的權(quán)重以最小化輸出節(jié)點(diǎn)激活和輸出之間的差異來進(jìn)行學(xué)習(xí)。SVM分類器是一種基于內(nèi)核的機(jī)器學(xué)習(xí)技術(shù),可通過決策面將類分離,從而最大化類之間的余量[12]。
本研究選擇隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)3種機(jī)器學(xué)習(xí)分類器,應(yīng)用于原始數(shù)據(jù)和波段合成數(shù)據(jù)兩種數(shù)據(jù)源,共產(chǎn)生6種分類方法。研究區(qū)內(nèi)土地類型可分為6類,結(jié)合目視解譯與Goole Earth影像,在ENVI中劃定感興趣區(qū),每類選擇15到30個訓(xùn)練樣本,樣本總集群數(shù)大約為土地覆蓋類別的30倍。根據(jù)訓(xùn)練樣本的像素數(shù)量,按照7∶3的比例確定檢驗樣本的像素數(shù)量。每種分類方法使用相同的訓(xùn)練樣本集和檢驗樣本集。
利用檢驗樣本集,對6種分類方法進(jìn)行精度評價,生成每種分類圖的誤差矩陣?;谡`差矩陣計算分類精度度量,包括總體準(zhǔn)確度(OA)、總體Kappa系數(shù)(OKp)、生產(chǎn)者準(zhǔn)確度和用戶準(zhǔn)確度[13]。在此基礎(chǔ)上,計算單一類別的Kappa系數(shù),作為每個類別的精度評價指數(shù),公式為
(5)
式中:ki是類別i的Kappa系數(shù);N是像元總數(shù);xii是類別i被正確分類的像元個數(shù);xi+是類別i地表真實像元總數(shù);x+i是類別i被分類像元總數(shù)。
圖2顯示了6種分類方法的分類結(jié)果圖。從視覺上看,所有分類圖似乎都能提取出研究區(qū)內(nèi)不同的土地覆蓋類型,體現(xiàn)實際地類的分布情況,在“椒鹽”效應(yīng)上也表現(xiàn)出了較好的視覺效果。但分類效果上存在一定的差異,基于原始數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)分類圖與其他分類圖有著明顯的視覺差異,主要是將裸土錯分為人工表面。
圖2 分類結(jié)果圖(R=原始數(shù)據(jù),L=波段合成數(shù)據(jù))
6種分類方法的總體分類精度與Kappa系數(shù)如圖3所示??傮w精度從基于波段合成數(shù)據(jù)進(jìn)行支持向量機(jī)分類的95.8%到基于原始數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)分類的62.1%,相應(yīng)地,Kappa系數(shù)從0.95降到0.53。該結(jié)論與視覺效果一致,并且可進(jìn)一步得知6種分類方法下的分類精度差異較大。有趣的是,相對于兩種數(shù)據(jù)源所表現(xiàn)出的效果差異,分類方法間的差異更加明顯,尤其是NN分類方法與RF和SVM兩種分類方法間的差異。在兩種數(shù)據(jù)源下,RF和SVM兩種分類方法表現(xiàn)出了較好的一致性和穩(wěn)定性,總體精度均大于90%,Kappa系數(shù)也在0.90以上。而NN分類方法的總體精度還不到70%,Kappa系數(shù)更是低至0.53。總地來說,3種機(jī)器學(xué)習(xí)分類器的制圖精度趨勢可概括為SVM>RF>NN;波段合成數(shù)據(jù)較原始數(shù)據(jù)而言,分類精度雖有提高但幅度較小。
圖3 總體尺度精度評價(R=原始數(shù)據(jù),L=波段合成數(shù)據(jù))
圖4給出了6種分類方法下各類別的Kappa系數(shù)。從圖中可以看出,各個地類在6種分類方法下都有不同程度的精度差異。其中,裸土類的Kappa系數(shù)從R_NN的0.04到R_RF和L_SVM的1.00,相差了0.96,是所有地類中差異幅度最大的地類,湖泊則是差異幅度最小的地類。各地類在6種分類方法中的精度差異幅度的趨勢為草本沼澤>湖泊>草地>裸土>人工表面>河流。同時,也可以看出,RF和SVM兩分類器相對于NN來說,有著明顯的可分性。
按數(shù)據(jù)源的不同對圖4中的Kappa系數(shù)進(jìn)行重新排列,并計算兩種數(shù)據(jù)源下各地類在3種不同分類方法中的平均Kappa系數(shù)(AKp1),如表2所示??梢钥闯?,波段合成數(shù)據(jù)較原始數(shù)據(jù)有明顯的分類精度提高,尤其是在草地和人工表面兩個非濕地類中。裸土和所有濕地類的分類精度在兩種數(shù)據(jù)源下差異較小,具有較高的穩(wěn)定性和可分性。按分類方法的不同對圖4中的Kappa系數(shù)進(jìn)行重新排列,并計算3種分類方法下各地類在兩種不同數(shù)據(jù)源中的平均Kappa系數(shù)(AKp2),如表3所示??擅黠@看出,對所有地類而言,NN分類方法的分類效果均較差。在RF和SVM兩種分類方法中,裸土和所有濕地類的AKp2均在0.90以上,與表3中的結(jié)論一致。而草地和人工表面兩種地類在RF和SVM兩種分類方法中的AKp2值有0.1的差值,具有一定程度的低一致性。
表2 類別尺度上不同數(shù)據(jù)源的分類評價
表3 類別尺度上不同分類方法的分類評價
圖4 類別尺度精度評價結(jié)果(R=原始數(shù)據(jù),L=波段合成數(shù)據(jù))
在實際應(yīng)用中,對于新手或圖形處理能力較差的用戶來說,基于原始Sentinel-2影像進(jìn)行RF或SVM分類是個很好的選擇。對于一般用戶來說,加入地形信息和其他光譜信息的波段合成數(shù)據(jù)進(jìn)行SVM分類是一個合適的組合。對于有經(jīng)驗或精度要求較高的用戶,可以嘗試多種數(shù)據(jù)源和多種分類方法的不同組合進(jìn)行對比分析。
基于Sentinel-2影像數(shù)據(jù),以瑪多湖濕地自然保護(hù)區(qū)為例,采用隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)3種監(jiān)督分類方法進(jìn)行濕地信息的自動提取研究,并與加入DEM地形數(shù)據(jù)以及NDVI,NDWI,BI,RVI 4種光譜指數(shù)信息后的波段合成數(shù)據(jù)作對比分析。該研究結(jié)果表明,支持向量機(jī)分類方法和波段合成數(shù)據(jù)的組合在瑪多湖濕地制圖中表現(xiàn)出了最好的精度效果,總體精度為95.8%,Kappa系數(shù)為0.95。兩種數(shù)據(jù)源對分類結(jié)果的影響明顯低于分類器的影響。雖然支持向量機(jī)與隨機(jī)森林分類方法間的效果差異較小,但相較于神經(jīng)網(wǎng)絡(luò)分類方法,分類精度有著明顯提高。在實踐應(yīng)用中,如果用戶具有圖像處理能力或是較高的精度要求,可以使用多種方法進(jìn)行比較分析;否則,則可以基于原始Sentinel-2影像,簡單實現(xiàn)支持向量機(jī)或者隨機(jī)森林分類方法,無需復(fù)雜的圖像處理軟件且對硬件要求較低。