高金萍 于慧娜 王月婷 高顯連 張曉麗
(1 國家林業(yè)和草原局林草調(diào)查規(guī)劃院,北京 100714)(2 北京林業(yè)大學(xué),北京 100083)
森林是陸地生態(tài)系統(tǒng)的主體,也是林業(yè)和草原行業(yè)主要的空間服務(wù)對象,在維護生態(tài)平衡、應(yīng)對氣候變化中發(fā)揮著重要作用[1]。森林資源的分布狀況直接影響國家重大林業(yè)和草原資源監(jiān)測規(guī)劃與管理政策的制定。森林類型信息是森林管理的基礎(chǔ)數(shù)據(jù),準(zhǔn)確的森林類型及樹種識別對繪制林相圖、清查森林資源、反演森林地上碳儲量、監(jiān)測物種多樣性及森林資源可持續(xù)管理具有重要意義[2]。傳統(tǒng)的手段基本為人工調(diào)查,由于森林分布廣、遍布山頭地塊,野外調(diào)查耗費大量人力和成本[3],對于環(huán)境復(fù)雜、人力無法到達的林區(qū)很難開展森林資源調(diào)查工作,且重復(fù)監(jiān)測周期較長[4]。近年來迅速發(fā)展的遙感技術(shù)可全面、快速掌握林草資源各種信息,在森林資源調(diào)查及森林樹種識別等方面發(fā)揮著重要作用,成為越來越重要的林草行業(yè)監(jiān)測技術(shù)手段[5-6]。
世界觀測-2(WorldView-2)、高分二號等衛(wèi)星的高分辨率遙感影像具備較高的空間分辨率,近年來在森林樹種識別領(lǐng)域研究甚多[7-11]。與中低分辨率影像相比,高分辨率影像的空間信息更加豐富,但其數(shù)據(jù)量龐大,處理時對計算機性能要求較高,且價格相對昂貴,在較大區(qū)域尺度開展森林精確識別應(yīng)用具有一定的局限。此外,分辨率提升的同時,光譜譜段會有所減小[12]。相對而言,中高分辨率遙感影像既可提供豐富的光譜信息,又可以提供清晰的結(jié)構(gòu)信息,在區(qū)域尺度森林樹種識別領(lǐng)域具備獨特的優(yōu)勢。近年來,我國陸續(xù)研發(fā)了具備寬覆蓋、中高空間分辨率及短重訪周期等特征的衛(wèi)星(如高分一號),利用中分辨率遙感影像進行樹種識別的研究也逐步增多[13-14]。
2020年9月27日,我國在太原衛(wèi)星發(fā)射中心以“一箭雙星”方式成功發(fā)射環(huán)境減災(zāi)二號A/B衛(wèi)星,用于接替已在軌運行12年的環(huán)境減災(zāi)一號A/B衛(wèi)星。2顆衛(wèi)星技術(shù)狀態(tài)相同,雙星組網(wǎng)可實現(xiàn)不大于2天的多光譜和紅外數(shù)據(jù)無縫覆蓋、不大于21天的高光譜數(shù)據(jù)無縫覆蓋,大幅提高我國中分辨率可見光、紅外及高光譜遙感數(shù)據(jù)獲取能力,最大限度地滿足各行業(yè)和部門對中高空間分辨率、高時間分辨率、高光譜分辨率、寬觀測幅寬性能衛(wèi)星影像的應(yīng)用需求。環(huán)境減災(zāi)二號A/B衛(wèi)星多光譜譜段含有豐富的光譜信息,除具有傳統(tǒng)衛(wèi)星的藍、綠、紅、近紅外譜段,還多了一個能反映綠色植物生長狀況的紅邊譜段,可提供植被狀態(tài)的關(guān)鍵信息。目前,森林樹種識別方面的研究大多是基于國外衛(wèi)星數(shù)據(jù)和其他國產(chǎn)衛(wèi)星數(shù)據(jù),對環(huán)境減災(zāi)二號A/B衛(wèi)星數(shù)據(jù)在樹種識別中的應(yīng)用研究還未開展。本文針對環(huán)境減災(zāi)二號A/B衛(wèi)星,利用在軌測試期間獲取的數(shù)據(jù)首次開展森林類型及主要樹種識別的業(yè)務(wù)應(yīng)用研究,采用衛(wèi)星多光譜和高光譜數(shù)據(jù),提取光譜特征、植被指數(shù)和紋理特征等信息,通過支持向量機(SVM)、原型網(wǎng)絡(luò)等分類方法進行試驗區(qū)森林類型及主要樹種的識別,初步評價環(huán)境減災(zāi)二號A/B衛(wèi)星數(shù)據(jù)在林業(yè)和草原行業(yè)的業(yè)務(wù)應(yīng)用能力,為后續(xù)充分發(fā)揮其應(yīng)用潛力、更好地服務(wù)林業(yè)和草原行業(yè)奠定基礎(chǔ)。
綜合已有的地面調(diào)查數(shù)據(jù)、森林植被代表性、在軌測試期間衛(wèi)星影像覆蓋情況等因素,選擇福建武夷山國家公園和東北虎豹國家公園2個區(qū)域作為試驗區(qū)。
武夷山國家公園位于福建省北部與江西省交界處,地理坐標(biāo)為117°24′13″E-117°59′19″E,27°31′20″N-27°55′49″N,總面積1001.41 km2。武夷山國家公園地處內(nèi)陸山區(qū),主要山脈大致呈東北-西南走向,地勢為西北、東北高,西南、東南低,自西向東分別屬于中山、中低山和丘陵地貌區(qū),海拔1630 m(九重天),屬中亞熱帶季風(fēng)氣候區(qū)。武夷山四季氣溫較均勻,溫和濕潤,總體年均氣溫17~19 ℃,1月均溫6~9 ℃,極端最低氣溫可達-9 ℃,7月均溫28~29 ℃;年均降水量1684~1780 mm,是福建省降水量最多的地區(qū)。
武夷山國家公園以森林生態(tài)系統(tǒng)為主體,森林覆蓋率達到87.86%;有常綠闊葉林、針闊葉混交林等多種植被類型,是世界同緯度保存最完整、最典型、面積最大的中亞熱帶森林生態(tài)系統(tǒng)。
東北虎豹國家公園位于我國吉林省和黑龍江省交界處,地理坐標(biāo)為129°5′0″E-131°18′48″E,42°31′06″N-44°14′49″N,總面積為1.492 6×108km2。虎豹公園海拔在1500 m以下,大部分山體海拔在1000 m以下,相對高度在200~600 m。以中低山、峽谷和丘陵地貌為主,土壤以暗棕壤和沼澤土為主,屬大陸濕潤性季風(fēng)氣候區(qū),年平均氣溫5 ℃,年降水量變化在450~750 mm。
東北虎豹國家公園以森林生態(tài)系統(tǒng)為主體,森林面積1.387 3×104km2。森林類型以針闊混交林為主,面積9.668×103km2,占森林面積的68.97%;闊葉林3.383×103km2,占24.38%;針葉林89.1 km2,占6.42%。原生性紅松闊葉混交林僅呈零星分布,次生林分布廣泛,以白樺林、山楊林、櫟林為主。該區(qū)域樹種組成復(fù)雜、分布零散,了解該區(qū)域主要森林類型或樹種組成對反映該區(qū)域森林資源豐富程度及天然林保護狀況具有重要意義。
環(huán)境減災(zāi)二號A/B衛(wèi)星均配置了4類光學(xué)載荷,包括16 m相機、高光譜成像儀、紅外相機和大氣校正儀。其中:16 m相機由4臺可見光CCD相機組成,通過視場拼接可提供幅寬為800 km的多光譜影像;高光譜成像儀幅寬為96 km;紅外相機幅寬為720 km;大氣校正儀可在軌同步獲取與16 m相機同視場的大氣多譜段信息,進行大氣輻射校正。衛(wèi)星多光譜數(shù)據(jù)空間分辨率為16 m,包含B1(0.45~0.52 μm),B2(0.52~0.59 μm),B3(0.63~0.69 μm),B4(0.77~0.89 μm),B5(0.69~0.73 μm)共5個譜段。高光譜數(shù)據(jù)在0.45~0.92 μm包含100個譜段,空間分辨率為48 m,平均光譜分辨率優(yōu)于5 nm;在0.90~2.5 μm譜段包含115個譜段,空間分辨率為96 m,平均光譜分辨率優(yōu)于14 nm。
在福建武夷山國家公園和東北虎豹國家公園2個試驗區(qū),選取云量不超過5%、質(zhì)量較好的多光譜影像各2景,數(shù)據(jù)等級為L1A級,數(shù)據(jù)獲取時間分別為2020年12月6日和2020年10月20日,能基本覆蓋2個試驗區(qū)。在福建武夷山國家公園試驗區(qū)內(nèi)選取質(zhì)量較好的高光譜影像,影像獲取時間為2021年2月20日,云量為0%;東北虎豹國家公園試驗區(qū)內(nèi)沒有合適的數(shù)據(jù)源,故該試驗區(qū)不采用高光譜數(shù)據(jù)。
獲取2個試驗區(qū)的實測樣地數(shù)據(jù),樣地為半徑為15 m的圓形,均勻分布于各試驗區(qū)。以樣地的優(yōu)勢樹種信息作為選取主要樹種分類的訓(xùn)練和驗證樣本數(shù)據(jù)的依據(jù)。
森林類型及樹種識別應(yīng)用主要包括數(shù)據(jù)預(yù)處理、特征提取、訓(xùn)練分類和精度評價等關(guān)鍵環(huán)節(jié),總體技術(shù)過程見圖1。
圖1 森林類型及樹種識別過程Fig.1 Process of forest type and tree species identification
收集在試驗區(qū)獲取的地面調(diào)查數(shù)據(jù),建立試驗區(qū)調(diào)查樣本集。數(shù)據(jù)預(yù)處理主要包括輻射校正、大氣校正、幾何校正、正射校正等步驟。①輻射校正和大氣校正。利用提供的數(shù)據(jù)定標(biāo)參數(shù)完成輻射校正,利用快速大氣校正模型對數(shù)據(jù)進行大氣校正。②幾何校正?;谏诒?2(Sentinel-2)衛(wèi)星數(shù)據(jù),在影像上手動選擇控制點,利用仿射變換模型對影像進行幾何精校正。③正射校正。利用影像產(chǎn)品自帶的有理多項式系數(shù)模型(RPC)文件進行自動正射校正,利用該模型和中國科學(xué)院計算機網(wǎng)絡(luò)信息中心地理空間數(shù)據(jù)云平臺(http://www.gscloud.cn)獲取的30 m分辨率先進星載熱反射和反輻射儀數(shù)字高程模型(ASTER DEM)數(shù)據(jù)對影像進行二次卷積法重采樣處理,得到正射校正影像。
很多森林樹種之間比較相似,區(qū)分度不高,僅依靠光譜特征常會出現(xiàn)同物異譜或異物同譜的現(xiàn)象。文獻[15-17]中結(jié)果表明:在光譜特征基礎(chǔ)上結(jié)合紋理特征、植被指數(shù)等信息,能更準(zhǔn)確地區(qū)分森林樹種信息,有效提升樹種識別的精度。
1)光譜特征
不同地物類別因組成與結(jié)構(gòu)差異而具有不同輻射特征和譜段反射率,在遙感影像中具有不同的亮度值,以此來區(qū)分不同地物。譜段反射率均值計算公式為
(1)
式中:i為譜段序號;ρi為第i個譜段的反射率;n為譜段數(shù)。
2)植被指數(shù)
歸一化植被指數(shù)(NDVI)是應(yīng)用最廣的植被指數(shù),該指數(shù)可以監(jiān)測植被生長狀態(tài),有效反映植被覆蓋情況,其取值范圍是[-1,1],在植被區(qū)域顯示為正值,值越大代表植被覆蓋度越高。NDVI計算公式為
(2)
式中:INDVI為歸一化植被指數(shù)值;ρN為近紅外譜段反射率;ρR為紅光譜段反射率。
3)主成分變換變量
主成分分析是基于變量之間的相關(guān)關(guān)系,在盡可能不丟失信息的前提下進行的線性變換,常用于信息增強和數(shù)據(jù)壓縮。它是對某一多光譜影像X,利用變換矩陣A進行線性組合,而產(chǎn)生一組新的多光譜影像,表達式為
Y=AX
(3)
式中:X為變換前的多光譜空間的像元矩陣;Y為變換后的主成分空間的像元矩陣;A為X空間協(xié)方差矩陣∑X的特征向量矩陣的轉(zhuǎn)置矩陣。
變換后,前三主成分能夠包含90%以上的信息,第四主成分多數(shù)為噪聲,在譜段組合時只使用前三主成分即可。
4)紋理特征
影像中地物的重要信息可以通過紋理分析獲取,灰度共生矩陣(GLCM)是從影像上像素之間的灰度空間相關(guān)角度來描述紋理。影像灰度的變化包括方向、相鄰間隔和變化幅度等綜合信息,都可以通過GLCM反映?;贕LCM可提取8個紋理特征[18],即對比性(CO)、協(xié)同性(HO)、二階矩(SE)、熵(EN)、均值(ME)、相異性(DI)、方差(VA)、相關(guān)性(CC)。紋理特征是基于主成分分析后的第一主成分提取的,窗口大小設(shè)置為3×3,方向為45°,步長為1。
機器學(xué)習(xí)理論與方法已成為遙感影像分類的重要技術(shù)手段,遙感影像的樣本數(shù)量相對較少,是制約分類精度的關(guān)鍵因素。SVM和原型網(wǎng)絡(luò)方法分別作為淺層機器學(xué)習(xí)和深度學(xué)習(xí)中小樣本分類的代表方法法,已得到了廣泛應(yīng)用。
(1)SVM從20世紀(jì)90年代被提出,在影像識別領(lǐng)域已經(jīng)得到了廣泛應(yīng)用,理論基礎(chǔ)和技術(shù)方法較為成熟[19]。典型的SVM需要一組輸入數(shù)據(jù)和訓(xùn)練目標(biāo),對于每個給定的輸入,其分類結(jié)果可能是兩個類。給定一組訓(xùn)練樣本,每個樣本都被標(biāo)記為屬于兩個類別之一,SVM算法通過建立一個模型從而把新的樣本分類到一個或者另一個類別中去。該算法模型把在空間中表示為點的對象映射為兩類,而且兩類樣本之間的分類間隔最大。新的對象將會被映射到同樣的空間并基于其落在間隔的哪一邊來預(yù)測屬于哪一種類別。這一算法是基于定義決策邊界的決策平面的概念,一個決策平面用來區(qū)分一系列具有不同類別成員關(guān)系的對象。SVM模型中具有不同的可用的內(nèi)核,常用的核函數(shù)有線性核、多項式核、高斯核和徑向基核,其中,徑向基核函數(shù)是SVM使用的內(nèi)核中最為普遍的一種選擇[20]。
(2)原型網(wǎng)絡(luò)分類的原理是每個類的點都圍繞1個原型進行聚類。通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)輸入到嵌入空間的非線性映射,并以支持集的平均值作為其在嵌入空間中類的原型。然后,查找最近的類原型,即可對嵌入式查詢點進行分類。以窗口大小為S·S的切片數(shù)據(jù)作為原型網(wǎng)絡(luò)的輸入源。嵌入函數(shù)架構(gòu)根據(jù)裁剪數(shù)據(jù)窗口大小由不同數(shù)量卷積塊組成(Layer 1,…,LayerN,Layer last)。每個卷積塊包括1個卷積層(Conv2d),1個批量歸一化層(Batch_norm),1個非線性激活函數(shù)(Relu)及1個最大池化層(Max_pool2d)。全連接層(Flatten),將最后1個卷積塊的輸出(1×1×F,F(xiàn)為通道數(shù))作為輸入,通過全連接層(Flatten)轉(zhuǎn)化為F個特征值。計算投影空間中查詢集到各個類原型的歐氏距離,使用Softmax激活函數(shù)計算屬于各個類別的概率,作為分類依據(jù)[21-22]。
本文使用的原型網(wǎng)絡(luò)以5個譜段作為輸入,采用的卷積層的輸出特征值數(shù)F為64,卷積核為3×3。最大池化層的池化核為2×2。此網(wǎng)絡(luò)結(jié)構(gòu)將產(chǎn)生64維輸出空間。使用相同的嵌入函數(shù)對支持集和查詢集進行運算,并將其作為損失和精度計算的輸入?yún)?shù),所有的模型都是通過Adam-SGD優(yōu)化器進行訓(xùn)練的,初始學(xué)習(xí)率為1×10-3,每2000次訓(xùn)練將學(xué)習(xí)率減半。使用歐式距離作為度量函數(shù),訓(xùn)練原型網(wǎng)絡(luò)。
(1)SVM分類精度評價。通過檢驗樣本建立混淆矩陣,檢驗分類結(jié)果的準(zhǔn)確性,選取的精度驗證指標(biāo)包括分類精度、Kappa系數(shù)、總精度。
(2)原型網(wǎng)絡(luò)分類精度評價。原型網(wǎng)絡(luò)分類精度包括網(wǎng)絡(luò)訓(xùn)練精度和測試精度。訓(xùn)練精度通過訓(xùn)練過程中最后1個epoch的精度(LEA)表示,即每次迭代的平均總體精度。測試精度通過總精度與Kappa系數(shù)表示。
針對環(huán)境減災(zāi)二號A/B衛(wèi)星的多光譜和高光譜數(shù)據(jù),分別提取2個試驗區(qū)影像的光譜特征、NDVI和基于主成分第一分量的8個紋理特征。其中,高光譜是基于前100個可見光譜段,提取了主成分分析后的前5個特征變量作為分類的特征量。
根據(jù)野外實測樣地的優(yōu)勢樹種信息,選取針葉林、闊葉林、杉木樣本各200個,同時結(jié)合目視解譯和影像質(zhì)量,選取裸地、水體、農(nóng)田和道路建筑4類地物,每類地物各選取樣本200個。每類地物及森林樹種各選取90個驗證樣本。分別采用SVM和原型網(wǎng)絡(luò)分類進行試驗區(qū)主要地類和森林樹種識別,并對識別結(jié)果進行精度評價。
1)應(yīng)用SVM的森林樹種識別
本文采用多光譜數(shù)據(jù),選擇高斯核函數(shù),設(shè)置參數(shù)gamma為0.2,懲罰因子為100。基于特征變量對各類地物及森林主要樹種進行識別,并利用驗證樣本進行精度評價,結(jié)果見表1。其中:針葉林和闊葉林的多光譜分類精度分別為88.61%和86.36%,杉木的多光譜分類精度略低,為54.47%;總精度為86.37%;Kappa系數(shù)為0.83。圖2為應(yīng)用SVM的武夷山國家公園主要樹種識別情況。
表1 應(yīng)用SVM的主要樹種識別分類精度Table 1 Classification accuracy of main tree species identification using SVM %
2)應(yīng)用原型網(wǎng)絡(luò)分類的森林樹種識別
本文分別采用多光譜和高光譜數(shù)據(jù),通過設(shè)置不同窗口大小來比較分類精度,最終設(shè)置窗口大小分別為21×21像元和17×17像元。利用驗證樣本對分類結(jié)果進行精度評價,見表2。其中:針葉林和闊葉林的多光譜分類精度分別為94.62%和79.66%,杉木的多光譜分類精度為92.96%,較SVM方法有了明顯提升;多光譜和高光譜總精度分別為91.11%和83.79%,Kappa系數(shù)分別為0.90和0.81。圖3為應(yīng)用原型網(wǎng)絡(luò)分類的武夷山國家公園主要樹種識別情況。
圖2 應(yīng)用SVM的武夷山國家公園主要樹種識別情況Fig.2 Main tree species identification using SVM in Wuyishan National Park
表2 應(yīng)用原型網(wǎng)絡(luò)分類的主要樹種識別分類精度Table 2 Classification accuracy of main tree species using prototype network classification %
根據(jù)野外實測樣地的優(yōu)勢樹種信息,選取針葉林、闊葉林、云杉樣本各200個。同時,結(jié)合目視解譯和影像質(zhì)量,選取了裸地、水體、農(nóng)田、道路建筑、云和陰影6個類別,每個類別各選取樣本200個。每個類別及森林樹種各選取90個驗證樣本。
1)應(yīng)用SVM的森林樹種識別
基于特征變量對各類別及森林主要樹種進行識別,并利用驗證樣本進行精度評價,見表3。其中:云杉、針葉林和闊葉林的分類精度分別為90.14%,88.65%,79.29%;總精度為91.77%;Kappa系數(shù)為0.90。圖4為應(yīng)用SVM的東北虎豹國家公園主要樹種識別情況。
表3 應(yīng)用SVM的主要樹種識別分類精度Table 3 Classification accuracy of main tree species identification using SVM %
圖4 應(yīng)用SVM的東北虎豹國家公園主要樹種識別情況Fig.4 Main tree species identification using SVM in Hubao National Park
2)應(yīng)用原型網(wǎng)絡(luò)分類的森林樹種識別
通過設(shè)置不同窗口大小來比較分類精度,最終設(shè)置窗口大小為17×17。基于特征變量對各類別及森林主要樹種進行識別,并利用驗證樣本進行精度評價,見表4。其中:云杉、針葉林和闊葉林的分類精度分別為79.32%,96.32%,92.21%;總精度為91.34%;Kappa系數(shù)為0.90。圖5為應(yīng)用原型網(wǎng)絡(luò)分類的東北虎豹國家公園主要樹種識別情況。
表4 應(yīng)用原型網(wǎng)絡(luò)分類的主要樹種識別分類精度Table 4 Classification accuracy of main tree species identification using prototype network classification %
本文采用環(huán)境減災(zāi)二號A/B衛(wèi)星多光譜和高光譜數(shù)據(jù),在福建武夷山國家公園和東北虎豹國家公園2個試驗區(qū)開展森林類型及主要樹種識別的應(yīng)用研究,總結(jié)如下。
(1)分類模型的選擇對于分類效果具有重要影響。在福建武夷山國家公園試驗區(qū),原型網(wǎng)絡(luò)分類對主要樹種識別的精度整體要優(yōu)于SVM;在東北虎豹國家公園試驗區(qū),SVM對云杉的識別精度更好,但在針葉林和闊葉林的識別上,原型網(wǎng)絡(luò)分類表現(xiàn)更佳。
(2)2個試驗區(qū)的主要樹種識別精度較高,杉木和云杉最優(yōu)分類精度分別為92.96%和90.14%。東北地區(qū)森林結(jié)構(gòu)相對簡單,而福建森林結(jié)構(gòu)更為復(fù)雜,樹種類型眾多交錯,因此福建武夷山國家公園森林類型及主要樹種識別精度略低于東北虎豹國家公園。
(3)環(huán)境減災(zāi)二號A/B衛(wèi)星在軌測試期間,由于時間和數(shù)據(jù)等約束條件,只做了局部試驗區(qū)的在軌測試,實現(xiàn)了部分類型地類和樹種的識別和分類。為提高衛(wèi)星在林業(yè)和草原資源監(jiān)測的應(yīng)用能力,后續(xù)需要持續(xù)探索衛(wèi)星數(shù)據(jù)在我國不同地區(qū)、不同地類、不同樹種分布等多種情況下的應(yīng)用能力。