袁 勝
(廣西壯族自治區(qū)森林資源與生態(tài)環(huán)境監(jiān)測(cè)中心, 廣西 南寧 530028)
紅樹(shù)林是指生長(zhǎng)于陸地與海洋交界帶的灘涂淺灘,以紅樹(shù)植物為主體的濕地木本植物群落[1]。紅樹(shù)林具有防風(fēng)消浪、促淤保灘、固岸護(hù)堤、涵養(yǎng)凈化水域、保持生物多樣性的重要生態(tài)功能,是沿岸防護(hù)林體系的第一道海岸防線[2]。由于紅樹(shù)林生長(zhǎng)環(huán)境的特殊性,常規(guī)的森林野外實(shí)地調(diào)查方法難以大規(guī)模監(jiān)測(cè)和準(zhǔn)確提取紅樹(shù)林群落信息分布[3-4]。遙感技術(shù)觀測(cè)范圍廣、數(shù)據(jù)更新周期短、信息獲取方便快捷,成為紅樹(shù)林提取與動(dòng)態(tài)監(jiān)測(cè)的重要手段[5-6]。
紅樹(shù)林遙感識(shí)別提取方法主要有目視解譯、非監(jiān)督分類(lèi)、面向?qū)ο蟆⒈O(jiān)督分類(lèi)等[7-9]。目視解譯主要是結(jié)合研究者的專(zhuān)業(yè)知識(shí)及經(jīng)驗(yàn),根據(jù)遙感影像對(duì)紅樹(shù)林進(jìn)行識(shí)別。該法精度一般且費(fèi)時(shí)費(fèi)力。非監(jiān)督分類(lèi)是指人們事先對(duì)分類(lèi)過(guò)程不施加任何的先驗(yàn)知識(shí),僅憑遙感影像地物的光譜特征的分布規(guī)律進(jìn)行自然聚類(lèi)。非監(jiān)督分類(lèi)只能把樣本區(qū)分為若干類(lèi)別,而不能給出樣本的描述。面向?qū)ο蠓ㄔ谛畔⑻崛r(shí)綜合考慮了光譜特征、形狀、紋理及結(jié)構(gòu)等信息,成為紅樹(shù)林遙感自動(dòng)分類(lèi)的常用方法之一[9]。監(jiān)督分類(lèi)依據(jù)已知訓(xùn)練樣本,建立統(tǒng)計(jì)識(shí)別函數(shù),從而對(duì)各待分類(lèi)影像進(jìn)行分類(lèi)。機(jī)器學(xué)習(xí)方法能顯著減少分類(lèi)時(shí)間,并且算法的準(zhǔn)確率也得到了顯著的提高。其中,隨機(jī)森林分類(lèi)能直接處理高維數(shù)據(jù),對(duì)噪音和異常值有一定的容忍度,且預(yù)測(cè)誤差小、不易產(chǎn)生過(guò)擬合問(wèn)題,在已有紅樹(shù)林遙感分類(lèi)研究中具有較好效果[10-12]。在分類(lèi)特征上,常利用歸一化植被指數(shù)(NDVI)、歸一化水體指數(shù)(NDWI)、歸一化差值濕度指數(shù)(NDMI)等光譜特征變量及紋理參數(shù)來(lái)區(qū)分紅樹(shù)林與非紅樹(shù)林[7]。此外,還有部分研究結(jié)合海岸線、潮位高度、高程等輔助數(shù)據(jù),以提高紅樹(shù)林識(shí)別精度[13-14]。在影像數(shù)據(jù)方面,隨著遙感技術(shù)的發(fā)展,運(yùn)用到紅樹(shù)林研究中的遙感平臺(tái)及傳感器越來(lái)越多。其中,Google Earth Engine(GEE)[15]等遙感云計(jì)算平臺(tái)的發(fā)展,改變了傳統(tǒng)遙感數(shù)據(jù)處理和分析的模式,為遙感大數(shù)據(jù)挖掘提供了機(jī)遇。Sentinel-2作為分辨率較高的多光譜影像,光譜信息豐富,是紅樹(shù)林提取的重要數(shù)據(jù)源之一[14]。利用GEE處理、獲取Sentinel-2將極大地提高影像的利用效率。
本研究以廣西壯族自治區(qū)沿海紅樹(shù)林分布區(qū)為研究區(qū),基于GEE云平臺(tái)提取Sentinel-2遙感影像,結(jié)合紅樹(shù)林實(shí)地調(diào)查數(shù)據(jù),分別采用面向?qū)ο蠓椒ê突谙裨碾S機(jī)森林方法識(shí)別提取紅樹(shù)林空間分布信息,并構(gòu)建混淆矩陣進(jìn)行精度驗(yàn)證及對(duì)比分析,旨在為大范圍紅樹(shù)林遙感監(jiān)測(cè)提供參考。
研究區(qū)位于廣西壯族自治區(qū)南部沿海地區(qū),包括北海市、欽州市、防城港市等分布紅樹(shù)林的部分縣市(見(jiàn)圖1)。研究區(qū)地處低緯度,屬亞熱帶季風(fēng)氣候區(qū)和熱帶季風(fēng)氣候區(qū),年平均氣溫17.5~23.5 ℃,年平均降水量841.2~3 387.5 mm,年日照時(shí)數(shù)1 213.0~2 135.2 h。研究區(qū)南臨北部灣,海岸線曲折,溺谷多且面積廣闊,灘涂面積約10萬(wàn)hm2,其中紅樹(shù)林總面積達(dá)9 330 hm2。紅樹(shù)林樹(shù)種主要有桐花樹(shù)(Aegicerascorniculatum)、白骨壤(Avicenniamarina)、秋茄(Kandeliacandel)、無(wú)瓣海桑(Sonneratiaapetala)、木欖(Bruguieragymnorhiza)、老鼠簕(Acanthusilicifolius)、海漆(Excoecariaagallocha)。
圖1 研究區(qū)域概況Fig.1 The overview of the study area
根據(jù)廣西林地變更及森林資源調(diào)查成果,提取紅樹(shù)林現(xiàn)有林和宜林地圖斑;結(jié)合遙感影像,補(bǔ)充修正現(xiàn)有紅樹(shù)林資源圖斑,并通過(guò)2019年外業(yè)補(bǔ)充調(diào)查核實(shí),得到研究區(qū)紅樹(shù)林實(shí)際空間分布數(shù)據(jù)?;诩t樹(shù)林實(shí)地調(diào)查數(shù)據(jù),將研究區(qū)主要地物劃分為紅樹(shù)林和非紅樹(shù)林。在ArcGIS軟件中利用漁網(wǎng)工具進(jìn)行樣本布點(diǎn),最終共布設(shè)樣點(diǎn)4 709個(gè),其中地類(lèi)為紅樹(shù)林的樣點(diǎn)218個(gè),非紅樹(shù)林樣點(diǎn)4 491個(gè)。所布設(shè)樣點(diǎn)數(shù)據(jù)用于面向?qū)ο蠓椒半S機(jī)森林方法分類(lèi)及精度驗(yàn)證。
遙感云計(jì)算平臺(tái)Google Earth Engine(GEE)依托其遍布全球數(shù)以百萬(wàn)計(jì)的服務(wù)器,可以方便地訪問(wèn)高性能計(jì)算資源、計(jì)算龐大的地理空間數(shù)據(jù)集、并行處理和分析數(shù)以萬(wàn)億計(jì)的圖像[16]。采用的多光譜Sentinel-2影像數(shù)據(jù)通過(guò)GEE進(jìn)行最小云合成并下載。影像時(shí)間為2019年7-9月。
植被指數(shù)由不同遙感光譜波段經(jīng)線性或非線性組合構(gòu)成,對(duì)植被具有一定指示意義[17]。在紅樹(shù)林提取研究中,常用歸一化差值水體指數(shù)(NDWI)、歸一化差值濕度指數(shù)(NDMI)等植被指數(shù)進(jìn)行空間分布信息的提取[7]。因此,利用遙感影像計(jì)算分類(lèi)所需的光譜特征變量,包括單波段反射率[18]、紅邊葉綠素指數(shù)(RECI)[18]、紅邊歸一化植被指數(shù)(RENDVI)[18]、歸一化差值池塘指數(shù)(NDPI)[19]、歸一化差值濕度指數(shù)(NDMI)[13]、歸一化差值水體指數(shù)(NDWI)[13]、改進(jìn)歸一化差值水體指數(shù)(MNDWI)[12]、歸一化差值植被指數(shù)(NDVI)[18]及潮間紅樹(shù)林指數(shù)(NIMI)[14]。
面向?qū)ο蟮募t樹(shù)林提取采用eCognition Developer 9.0軟件對(duì)影像進(jìn)行多尺度分割后,結(jié)合對(duì)象的光譜特征,通過(guò)確定閾值并創(chuàng)建相應(yīng)規(guī)則對(duì)紅樹(shù)林進(jìn)行分類(lèi)提取,并將最終分類(lèi)結(jié)果以矢量數(shù)據(jù)形式輸出。隨機(jī)森林分類(lèi)算法在R語(yǔ)言中實(shí)現(xiàn),它通過(guò)隨機(jī)建立多棵決策樹(shù),分類(lèi)時(shí)使用多棵決策樹(shù)對(duì)樣本進(jìn)行判斷和投票,將投票次數(shù)最多的類(lèi)別指定為最終輸出[12]。研究選取70%的樣本數(shù)據(jù)作為訓(xùn)練樣本,剩余30%的樣本數(shù)據(jù)作為驗(yàn)證樣本。在分類(lèi)精度評(píng)價(jià)中,常采用分類(lèi)總體精度與Kappa系數(shù)來(lái)評(píng)價(jià)圖像整體分類(lèi)質(zhì)量[3]。為避免非感興趣區(qū)的分類(lèi)精度影響最終的評(píng)價(jià),最終基于混淆矩陣選取用戶(hù)精度[20](User Accuracy, UA)、生產(chǎn)者精度[20](Producer Accuracy, PA)、F度量[3]作為紅樹(shù)林分類(lèi)提取的精度評(píng)價(jià)指標(biāo)。
(1)
(2)
(3)
式(1)(2)(3)中:pii為混淆矩陣第i行i列的樣本總數(shù);pi+為混淆矩陣第i行的總和;p+i為混淆矩陣第i列的總和。
采用面向?qū)ο蠓椒ㄟM(jìn)行紅樹(shù)林提取時(shí),影像分割過(guò)程所需考慮的參數(shù)包括尺度、色調(diào)、形狀、緊密度及平滑度。結(jié)合目視分析評(píng)價(jià)分割效果,確定采用的分割參數(shù)如下:影像各層占比均為1;分割尺度為2;形狀0.6;色調(diào)0.4;緊密度 0.5;平滑度0.5。在影像分割的基礎(chǔ)上,結(jié)合對(duì)象的光譜特征進(jìn)行閾值分類(lèi)。最終選取的光譜特征變量包括NDPI、NDWI、NDMI、NDVI以及NIR。首先利用NDMI、NDPI及NDVI識(shí)別建設(shè)用地、水體及陸地植被等非紅樹(shù)林區(qū),再利用NIR及NDWI將紅樹(shù)林與農(nóng)田灘涂等進(jìn)行區(qū)分,最終得到紅樹(shù)林空間分布。特征變量閾值確定需結(jié)合影像目視判斷,具有主觀性,可能對(duì)紅樹(shù)林提取造成影響。
基于隨機(jī)森林方法進(jìn)行紅樹(shù)林提取時(shí),主要利用地物光譜波段特征及植被指數(shù)進(jìn)行分類(lèi),將所有特征變量進(jìn)行重要性排序(見(jiàn)圖2)。重要性越高代表對(duì)隨機(jī)森林建模的貢獻(xiàn)越大。選擇重要性較高的變量形成變量組合建立隨機(jī)森林模型對(duì)紅樹(shù)林進(jìn)行分類(lèi)提取。最終選用的特征變量包括NDMI、NDPI、MNDWI、RENDVI、RECI及GREEN。從隨機(jī)森林方法各特征變量重要性來(lái)看,紅邊、綠、近紅外及短波紅外波段組合而成的植被指數(shù)對(duì)于紅樹(shù)林的特征識(shí)別更為有效。
圖2 隨機(jī)森林特征變量重要性排序Fig.2 Importance sorting of feature variables based on random forest
分別采用面向?qū)ο蠓椒ê碗S機(jī)森林方法對(duì)紅樹(shù)林進(jìn)行識(shí)別提取,提取結(jié)果如圖3所示。從圖3來(lái)看,隨機(jī)森林方法提取結(jié)果噪點(diǎn)較多,這可能是由于隨機(jī)森林方法是在像元尺度進(jìn)行的分類(lèi)提??;而面向?qū)ο蠓椒ㄊ窃诜指钏脤?duì)象的基礎(chǔ)上進(jìn)行的提取,所得紅樹(shù)林空間分布相比于隨機(jī)森林方法噪點(diǎn)更少。但面向?qū)ο蠓椒ㄔ谔崛〖t樹(shù)林時(shí)存在較大程度的誤判,將部分非紅樹(shù)林區(qū)域識(shí)別為紅樹(shù)林。相比之下,隨機(jī)森林方法所得紅樹(shù)林空間分布相對(duì)更為合理。
圖3 面向?qū)ο蠹半S機(jī)森林法的紅樹(shù)林提取結(jié)果
采用混淆矩陣進(jìn)行分類(lèi)精度驗(yàn)證,最終結(jié)果如表1所示。兩種方法紅樹(shù)林的生產(chǎn)者精度均低于用戶(hù)精度。面向?qū)ο蠓诸?lèi)方法將紅樹(shù)林漏判為非紅樹(shù)林的數(shù)量約占據(jù)紅樹(shù)林總樣本的1/3,其紅樹(shù)林用戶(hù)精度為82.5%。隨機(jī)森林分類(lèi)紅樹(shù)林的用戶(hù)精度為91.8%,相比于面向?qū)ο蠓ㄌ岣吡?1.3%。此外,面向?qū)ο蠓诸?lèi)紅樹(shù)林生產(chǎn)者精度為65.1%,F(xiàn)度量為0.727;隨機(jī)森林分類(lèi)方法對(duì)應(yīng)的評(píng)價(jià)指標(biāo)值分別為81.2%、0.862。隨機(jī)森林方法的各項(xiàng)評(píng)價(jià)指標(biāo)均高于面向?qū)ο蠓椒ǎf(shuō)明隨機(jī)森林分類(lèi)方法有較高的分類(lèi)精度,采用隨機(jī)森林方法進(jìn)行紅樹(shù)林提取的效果優(yōu)于面向?qū)ο蠓椒ā?/p>
表1 分類(lèi)結(jié)果混淆矩陣及精度驗(yàn)證Tab.1 Confusion matrix and precision verification of the classification results分類(lèi)方法分類(lèi)類(lèi)別實(shí)際類(lèi)別紅樹(shù)林非紅樹(shù)林用戶(hù)精度/%生產(chǎn)者精度/%F面向?qū)ο蠹t樹(shù)林1423082.565.10.727非紅樹(shù)林764 461隨機(jī)森林紅樹(shù)林56591.881.20.862非紅樹(shù)林131 339
以廣西壯族自治區(qū)內(nèi)紅樹(shù)林分布區(qū)為研究區(qū),基于GEE云平臺(tái)提取Sentinel-2遙感影像,結(jié)合紅樹(shù)林實(shí)地調(diào)查數(shù)據(jù),提取波段反射率及植被指數(shù),分別采用面向?qū)ο?、隨機(jī)森林方法進(jìn)行紅樹(shù)林信息識(shí)別提取,并構(gòu)建混淆矩陣進(jìn)行精度驗(yàn)證及對(duì)比。研究結(jié)果表明:
(1) 綠、近紅外、短波紅外及紅邊波段組合而成的植被指數(shù),其重要性相對(duì)較高,能有效識(shí)別紅樹(shù)林的特征。利用這些波段信息進(jìn)行紅樹(shù)林識(shí)別能顯著提高分類(lèi)精度。
(2) 采用面向?qū)ο蠓椒ê碗S機(jī)森林方法進(jìn)行紅樹(shù)林提取時(shí),兩種方法的生產(chǎn)者精度均低于用戶(hù)精度。面向?qū)ο蠓椒ê碗S機(jī)森林方法生產(chǎn)者精度分別為65.1%和81.2%,用戶(hù)精度分別為82.5%和91.8%。
(3) 基于Sentinel-2影像數(shù)據(jù),結(jié)合NDMI、MNDWI、NDPI等分類(lèi)特征,構(gòu)建隨機(jī)森林模型,可以有效地提取紅樹(shù)林空間分布信息。采用面向?qū)ο蠓椒ê碗S機(jī)森林方法進(jìn)行紅樹(shù)林分類(lèi)提取時(shí),隨機(jī)森林方法的各項(xiàng)精度檢驗(yàn)指標(biāo)均高于面向?qū)ο蠓椒?。其中用?hù)精度為91.8%,相比面向?qū)ο蠓椒ㄌ岣吡?1.3%。
隨機(jī)森林分類(lèi)在紅樹(shù)林提取上表現(xiàn)較好,這與其他學(xué)者研究所得結(jié)果相符[11,14],但本研究所得的生產(chǎn)者精度相較而言較低,這可能是研究區(qū)范圍較大、地物復(fù)雜程度高所致。面向?qū)ο蠓椒ㄅc隨機(jī)森林方法在紅樹(shù)林提取中均存在較多漏判現(xiàn)象,這可能是因?yàn)樗褂肧entinel-2影像中部分紅樹(shù)林因潮位變化被水體淹沒(méi),導(dǎo)致其光譜特征更接近于水體,從而產(chǎn)生漏判。結(jié)合光譜特征及植被指數(shù)構(gòu)建隨機(jī)森林模型能有效提取紅樹(shù)林的空間分布信息,但紅樹(shù)林的分布和生長(zhǎng)受到潮汐、洋流等多種因素的影響,而遙感又存在 “同物異譜”、“異物同譜”及混合像元等多種現(xiàn)象,這使提升紅樹(shù)林分類(lèi)精度的難度增加。研究表明,結(jié)合紋理特征、高程數(shù)據(jù)或使用更高分辨率影像能有效識(shí)別紅樹(shù)林[21-22]。因此,結(jié)合更多有效的輔助數(shù)據(jù)進(jìn)而提高紅樹(shù)林提取精度值得進(jìn)一步研究。