李佳檸 李明澤 全迎 王斌 莫祝坤
(東北林業(yè)大學(xué),哈爾濱,150040)
森林是陸地生態(tài)系統(tǒng)的主體,在全球生態(tài)系統(tǒng)中發(fā)揮舉足輕重的作用[1]。研究森林的樹種組成及不同樹種單木的空間分布對評估森林生境質(zhì)量和森林生物多樣性以及制定合理的森林管理策略具有重大影響,對于估測森林生產(chǎn)力、生物量和碳儲量有很好的輔助作用[2-3]。隨著航天技術(shù)的迅速發(fā)展和傳感器技術(shù)的不斷成熟,遙感技術(shù)在森林資源監(jiān)測方面的應(yīng)用越來越廣泛[4]。使用遙感數(shù)據(jù)進(jìn)行樹種分類,可以減少外業(yè)調(diào)查的工作量,節(jié)約人力成本,提高森林資源調(diào)查的效率[5-6]。
光學(xué)遙感數(shù)據(jù)中的高光譜數(shù)據(jù)具有較高的光譜分辨率和較寬的光譜范圍[7],因此可以為樹種分類研究提供更多信息。然而,高光譜數(shù)據(jù)作為一種平面遙感數(shù)據(jù),雖然能夠很好的反應(yīng)冠層表面的信息,卻難以反映垂直方向上冠層結(jié)構(gòu)的特征。而激光雷達(dá)(LiDAR)點(diǎn)云數(shù)據(jù)可以很好的反映森林冠層的立體結(jié)構(gòu)特征,從而彌補(bǔ)高光譜數(shù)據(jù)的不足[8]。因此,使用激光雷達(dá)與高光譜遙感協(xié)同進(jìn)行樹種分類成為了近期的一個研究熱點(diǎn)。早期的研究普遍借助激光雷達(dá)點(diǎn)云數(shù)據(jù)及其生成的冠層高度模型(CHM)進(jìn)行樹冠邊界的精確勾繪,在此基礎(chǔ)上利用植被的光譜特征進(jìn)行分類[9-10]。后來,使用激光雷達(dá)提取的高度、強(qiáng)度變量與光譜數(shù)據(jù)協(xié)同分類的研究逐漸增多[11]。激光雷達(dá)提取的高度和強(qiáng)度變量能夠用于描述單木樹冠在垂直結(jié)構(gòu)上的特性,在樹種分類研究中具有積極意義[12]。后來,隨著無人機(jī)技術(shù)的發(fā)展和成熟,無人機(jī)激光雷達(dá)數(shù)據(jù)(UAV-LiDAR)被越來越多的應(yīng)用于單木尺度的參數(shù)提取當(dāng)中[13]。相較于星載或機(jī)載激光雷達(dá),無人機(jī)激光雷達(dá)通常具有掃描高度低、點(diǎn)云密度高的優(yōu)勢[14]。因此,無人機(jī)激光雷達(dá)對樹冠的三維結(jié)構(gòu)特征提取更為準(zhǔn)確[15]。但是,過去的相關(guān)研究主要是將高光譜數(shù)據(jù)與激光雷達(dá)提取的點(diǎn)云的回波高度及回波強(qiáng)度變量結(jié)合進(jìn)行分類[16],較少將激光雷達(dá)提取的樹冠形態(tài)應(yīng)用于樹種分類當(dāng)中。
綜上所述,使用多源遙感協(xié)同進(jìn)行樹種分類的研究是林業(yè)遙感的一個重要研究方向。然而,相關(guān)研究中很少將單木樹冠的形態(tài)特征,即描述樹冠形狀大小結(jié)構(gòu)的參數(shù)[17],用于樹種的分類研究。因此,本文以機(jī)載高光譜數(shù)據(jù)與無人機(jī)激光雷達(dá)數(shù)據(jù)為數(shù)據(jù)源結(jié)合機(jī)器學(xué)習(xí)算法,通過對比多種方案的分類效果,探究多源遙感數(shù)據(jù)協(xié)同在單木尺度上進(jìn)行樹種分類的科學(xué)應(yīng)用途徑,同時,定量評估無人機(jī)激光雷達(dá)提取的樹冠三維參數(shù)在單木樹種分類研究中的應(yīng)用潛力。
研究區(qū)位于黑龍江省尚志市帽兒山實(shí)驗(yàn)林場(127°18′~127°41′6″E,45°2′20″~45°18′16″N),平均海拔高度300 m,最高海拔為805 m,坡度在10°~15°,屬長白山系張廣才嶺西部小嶺余脈,屬中溫帶大陸性季風(fēng)氣候,是東北東部山區(qū)較典型的天然次生林區(qū),主要植被類型是溫帶針闊混交林[18]。主要樹種有白樺(Betulaplatyphylla)、水曲柳(Fraxinusmandshurica)、落葉松(Larixgmelinii)、榆樹(Ulmuspumila)、柞樹(QuercusmongolicaFisch)、紅松(PinuskoraiensisSieb.)、色木(AcerpictumThunb)和椴樹(TiliatuanSzyszyl.)等10多種。
2.1.1 數(shù)據(jù)源
本研究的樣地調(diào)查數(shù)據(jù)采集于2019年8月,在研究區(qū)內(nèi)選取典型針闊混交林,設(shè)置100 m×100 m樣地,在樣地中以20 m為間隔設(shè)置子樣地,共計25個(如圖1所示),對子樣地進(jìn)行每木檢尺,獲取單木的樹高、胸徑、冠幅、樹種等參數(shù)。采集時,利用實(shí)時動態(tài)載波相位差分技術(shù)(RTK)標(biāo)記了各個子樣地中角點(diǎn)絕對位置以及每個單木在子樣地內(nèi)的相對位置。以株數(shù)量為標(biāo)準(zhǔn),該林分內(nèi)的主要樹種為白樺、水曲柳、落葉松、榆樹和柞樹,同時還有少量的紅松、椴樹等其他樹種。
圖1 試驗(yàn)區(qū)基本概況
本研究中使用的無人機(jī)激光雷達(dá)數(shù)據(jù)采集于2019年8月。掃描設(shè)備是由飛馬D200無人機(jī)平臺攜帶的超輕RIEGL mini VUX-1無人機(jī)激光雷達(dá)掃描儀。無人機(jī)按交叉條帶飛行,飛行高度為80 m,速度為5 m/s,條帶間有80 m的旁向重疊。激光雷達(dá)脈沖的掃描頻率為105 Hz,掃描速度約100次/s,每束激光最多能產(chǎn)生5次回波,點(diǎn)云的平均點(diǎn)密度為243.5個/m2。機(jī)載高光譜數(shù)據(jù)是由運(yùn)20型飛機(jī)攜帶AISA Eagle II高光譜傳感器對林分進(jìn)行掃描得到的。掃描覆蓋面積約360 km2,相對航高1 200 m,飛行速率約65 m/s,高光譜圖像的地面分辨率為1.5 m,共有64個波段,波譜范圍380~1 000 nm,光譜分辨率為3.3 nm。高光譜數(shù)據(jù)采集于2015年9月,雖然與無人機(jī)數(shù)據(jù)存在時間差,但二者均為生長季采集,相對于季節(jié)性的周期變化,單木種內(nèi)光譜信息在相同生長季保持相對穩(wěn)定[19]。同時,在數(shù)據(jù)采集間隔期內(nèi),研究區(qū)內(nèi)沒有進(jìn)行過采伐等人為干擾活動,也沒有發(fā)生過火災(zāi)、病蟲害等自然干擾,因此可以認(rèn)為樣地內(nèi)的樹種及分布沒有變化。綜上所述,可以認(rèn)為時間差異對單木樹種分類的結(jié)果影響較小。
2.1.2 激光雷達(dá)數(shù)據(jù)預(yù)處理
原始激光雷達(dá)數(shù)據(jù)的預(yù)處理包括航帶拼接、噪聲去除、數(shù)字高程模型(DEM)和CHM的生成、點(diǎn)云的高程歸一化處理以及單木分割等。
CHM是激光雷達(dá)遙感在林業(yè)應(yīng)用中的一個重要模型,能夠用于描述冠層的水平和垂直分布情況,從而勾繪出精確的樹冠輪廓[20]?;贑HM的單木分割可以以較小的時間成本快速識別樹冠頂點(diǎn)和樹冠輪廓。本研究對歸一化點(diǎn)云采用Khosravipour et al.[21]2016年提出的孔洞填充算法生成無孔洞的CHM。根據(jù)樣地點(diǎn)云密度與單木最小冠幅將CHM的空間分辨率設(shè)置為0.5 m。選擇這一空間分辨率既可以保證一定的分割精度[22],也避免了和高光譜影像的空間分辨率差異過大。
使用標(biāo)記控制分水嶺分割算法[23]對CHM進(jìn)行單木分割以得到樣地內(nèi)單木樹冠邊界及單木結(jié)構(gòu)參數(shù)。利用實(shí)測數(shù)據(jù)的單木位置及冠幅作為參考對單木分割結(jié)果進(jìn)行評價。在單木分割基礎(chǔ)上,根據(jù)單木位置及樹冠邊界提取單木點(diǎn)云,以進(jìn)一步計算單木的樹冠形態(tài)特征。
2.1.3 圖像配準(zhǔn)和單木匹配
在提取單木特征之前,首先要將高光譜數(shù)據(jù)和激光雷達(dá)數(shù)據(jù)進(jìn)行配準(zhǔn)。本研究以樣地邊界內(nèi)的CHM圖像為基準(zhǔn),將高光譜影像與CHM進(jìn)行相對配準(zhǔn)。由于樣地為林地,缺少可以用于配準(zhǔn)的標(biāo)志性地物。因此,本研究將形狀、大小、位置都較為明顯的林隙作為配準(zhǔn)依據(jù),以林隙周圍較為明顯的單木作為控制點(diǎn),用目視解譯的方法對不同圖像進(jìn)行了相對配準(zhǔn),以高光譜圖像為參考,將位置誤差控制在0.5個像元內(nèi)。
將實(shí)測單木的位置與CHM圖像進(jìn)行相對配準(zhǔn),隨后將激光雷達(dá)識別的樹冠和實(shí)測單木按樹冠位置進(jìn)行匹配[16]。根據(jù)研究區(qū)具體情況,定義實(shí)測單木與其匹配的LiDAR識別單木樹高誤差小于識別單木30%時,可以做為1∶1匹配單木,否則剔除不用。
2.2.1 高光譜特征的提取
在單木分割的基礎(chǔ)上,本研究根據(jù)樣地內(nèi)的主要樹種,在每個樹種中隨機(jī)選取了10株單木樣本,并繪制其光譜曲線,作為光譜特征選取的依據(jù)(圖2)。可以看出,幾個主要樹種在光譜上的差異主要集中在近紅外波段和“紅邊”部分,因此在光譜特征的選擇上,應(yīng)對相關(guān)的波段加以關(guān)注。因此,本研究使用高光譜數(shù)據(jù)的原始波段、最小噪聲分?jǐn)?shù)變換及主成分變換變量、植被指數(shù)作為單木樹種分類的特征變量。其中,主成分變量選取了方差貢獻(xiàn)率在95%以上的部分,最小噪聲分?jǐn)?shù)變量則提取經(jīng)過最小噪聲分?jǐn)?shù)變換后,信噪比大于3的變量。具體的光譜特征變量見表1和表2。
圖2 5個主要樹種的光譜曲線
表1 光譜特征列表
表2 植被指數(shù)列表
2.2.2 LiDAR特征的提取
本研究同樣提取了激光雷達(dá)數(shù)據(jù)的高度、強(qiáng)度變量和葉面積指數(shù)等參數(shù)作為分類特征,用于探究激光雷達(dá)變量的加入對分類結(jié)果的影響。其中,高度變量包括高度平均絕對偏差、冠層起伏率、高度百分位數(shù)(5個)及四分位間距、均值、標(biāo)準(zhǔn)差、方差、最小值、中位數(shù)、最大值、變異系數(shù)、偏度、峰度、高度累計百分位數(shù)(5個)及四分位間距等共23個變量,強(qiáng)度變量包括平均絕對偏差、強(qiáng)度百分位數(shù)(5個)及四分位間距、均值、標(biāo)準(zhǔn)差、方差、最小值、中位數(shù)、最大值、變異系數(shù)、偏度、峰度、累計百分位數(shù)(5個)及四分位間距等共22個變量。其中,在高度、強(qiáng)度百分位數(shù)的選擇上,由于5%~10%間距的高度、強(qiáng)度百分位數(shù)具有共線性[24]。因此,本研究以25%為間隔,提取1%、25%、50%、75%、99%的高度及強(qiáng)度百分位數(shù)。
2.2.3 樹冠形態(tài)特征的提取
為了探究樹冠形態(tài)特征對單木樹種分類的影響,本研究還利用無人機(jī)激光雷達(dá)數(shù)據(jù)提取了3個與樹冠形態(tài)有關(guān)的參數(shù)[25],分別為樹冠率指數(shù)(RCi)、冠形率指數(shù)(RCSi)、樹冠體積比(RVH)。在進(jìn)行分類之前,對取得的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以降低因不同屬性的數(shù)據(jù)數(shù)值的差異對分類造成的影響[26]。3種樹冠形態(tài)特征及其計算方式如下:
LCi=VC/AC,
(1)
RCi=LCi/H,
(2)
RCSi=LCi/WC,
(3)
RVH=VC/H。
(4)
式中:H為探測樹高;WC為探測冠幅;AC為探測冠面積;VC為探測冠體積;LCi為冠長指數(shù)。
2.2.4 特征變量的篩選
本研究采用隨機(jī)森林的OOB(袋外數(shù)據(jù))檢驗(yàn)結(jié)果對變量的重要性進(jìn)行排序和篩選[27]。隨機(jī)森林的OOB檢驗(yàn)原理是在隨機(jī)森林的每一次抽取時,將未被抽取的“袋外數(shù)據(jù)”作為檢驗(yàn)樣本,對分類器精度進(jìn)行檢驗(yàn)。同時將每個分類參數(shù)分別置換為隨機(jī)數(shù),對比其對分類結(jié)果的影響,由此得到各個變量的重要性[28]。本研究以平均下降精度(MDA)和平均基尼系數(shù)衰減(MDG)兩個指標(biāo)作為衡量變量重要性的依據(jù)。其中MDA表示將該變量用隨機(jī)數(shù)替換后,分類精度的下降情況;MDG表示計算每個變量對分類樹每個節(jié)點(diǎn)上觀測值的異質(zhì)性的影響。二者都是數(shù)值越大,對分類的影響越大。根據(jù)OOB檢驗(yàn)結(jié)果,篩選掉重要性較低的變量,多次篩選直到得到精度符合要求的變量組合。
本研究以樣地內(nèi)的白樺、水曲柳、落葉松、榆樹和柞樹5個樹種作為分類對象。其他樹種由于在樣地內(nèi)數(shù)量過少,無法有效區(qū)分訓(xùn)練集和測試集,因此不作為分類目標(biāo)。本研究共設(shè)計8種單木樹種分類的方案,具體分類方案見表3。其中方案1、3、5和7對應(yīng)方案2、4、6和8用于對比兩種機(jī)器學(xué)習(xí)分類器在單木樹種分類上的優(yōu)劣;方案1~6用于對比單一數(shù)據(jù)源和多源遙感協(xié)同分類效果的差異;方案7和8相對于方案5和6,主要用于探究樹冠形態(tài)特征對分類的影響。
表3 8組分類方案簡介
為保證訓(xùn)練樣本和測試樣本中各個樹種分布均衡,本研究采用分層抽樣的方法將樣本分成5組,使用5折交叉檢驗(yàn)的方式評價不同分類器在不同樣本和變量下的分類效果。對不同樣本的分類結(jié)果進(jìn)行分析,對比不同分類器以及不同樣本之間分類精度的差異,并對差異做出討論。最后,將激光雷達(dá)提取的樹冠形態(tài)特征加入分類器中,用相同方式對模型進(jìn)行檢驗(yàn),對比這些變量加入前后分類結(jié)果的差異,評價這些參數(shù)對單木樹種分類的精度影響。本研究使用以下4個指標(biāo)評價分類精度,分別是每個類的生產(chǎn)者精度(AP)和用戶精度(AU),以及模型的總體精度(AO)和Kappa系數(shù)(Ikappa),兩種分類器均在R語言環(huán)境下進(jìn)行構(gòu)建。指標(biāo)的計算方法如下:
AP=(Xii/N)×100%,
(5)
AU=(Xii/X+i)×100%,
(6)
AO=(Xii/Xi+)×100%,
(7)
(8)
式中:Xii是檢驗(yàn)樣本中為第i類樹種且分類結(jié)果正確的總數(shù);X+i是被識別為第i類樹種檢驗(yàn)樣本總數(shù);Xi+為第i類樹種的檢驗(yàn)樣本總數(shù);N為檢驗(yàn)樣本數(shù)量;r為單木種類數(shù)。
由于樣地林分密度較大,因此樹冠會出現(xiàn)互相遮擋的情況,致使低矮單木的樹冠無法在遙感影像上或是激光雷達(dá)上探測出來。因此,在進(jìn)行單木匹配之前,本研究對枯死木和被遮擋的低矮單木進(jìn)行了剔除,剔除后,共得到單木854株。通過單木匹配,得到完全匹配的單木共計719株,單木匹配的生產(chǎn)者精度為80.7%,用戶精度為84.2%。圖3中紅色方框?yàn)橥涣窒稑?biāo)識物,可以看出,兩種遙感數(shù)據(jù)匹配的效果良好,樣地內(nèi)成功匹配的單木位置如圖4所示。最終用于分類的樣本及數(shù)量分別為:白樺258株、落葉松84株、水曲柳167株、榆樹60株、柞樹67株。
圖3 按林隙配準(zhǔn)柵格圖像
圖4 成功匹配單木分布圖
根據(jù)隨機(jī)森林OOB檢驗(yàn)對兩種遙感數(shù)據(jù)所提取的分類特征變量進(jìn)行篩選,結(jié)果如圖5所示。其中,僅以高光譜數(shù)據(jù)作為單一數(shù)據(jù)源時,提取了12個變量;僅以LiDAR數(shù)據(jù)作為單一數(shù)據(jù)源時,提取了13個變量;同時使用高光譜和LiDAR數(shù)據(jù)時,提取了15個變量(表5)。高光譜數(shù)據(jù)提取的變量的重要性比LiDAR提取的變量的重要性更高。LiDAR提取的變量中,高度變量的重要性要高于強(qiáng)度變量。僅使用高光譜數(shù)據(jù)時,最重要的變量為第1主成分變換變量和第54波段。僅使用LiDAR數(shù)據(jù)時,高度平均數(shù)和累計高度50%分位數(shù)重要性最高。
表5 各個變量對分類的影響
對樣地內(nèi)各樹種的分類結(jié)果如表6和表7所示。多源遙感協(xié)同分類的整體精度要明顯高于使用單一數(shù)據(jù)源分類的精度。其中,多源遙感數(shù)據(jù)協(xié)同結(jié)合隨機(jī)森林進(jìn)行分類的精度最高,為80.53%,而僅采用LiDAR數(shù)據(jù)作為單一數(shù)據(jù)源結(jié)合BP神經(jīng)網(wǎng)絡(luò)的分類方案精度最低,為51.33%。對比不同分類器,隨機(jī)森林的分類精度要高于BP神經(jīng)網(wǎng)絡(luò),平均高4.2%。在5個分類樹種中,白樺的分類精度相較于其他樹種較高。
表6 前6組分類方案樹種分類結(jié)果
加入樹冠形態(tài)特征后,得到分類結(jié)果如表8所示。對比方案5和6,加入樹冠形態(tài)特征后,模型的整體精度平均提高了1.19%。其中,對于落葉松的識別精度提高較為明顯,平均提高了5.98%。本研究最終采用分類精度最高的方案7對樣地內(nèi)的樹種進(jìn)行分類,分類結(jié)果如圖5所示。
表7 前6組分類方案的模型精度
表8 加入樹冠輪廓因子后的分類結(jié)果
圖5 樣地內(nèi)樹種分類結(jié)果
通過對比不同分類方案的分類結(jié)果可以看出,多元遙感協(xié)同進(jìn)行單木樹種分類的精度要略高于只使用單一數(shù)據(jù)源的分類結(jié)果。在使用多源遙感數(shù)據(jù)時,高光譜數(shù)據(jù)可以提供更為豐富的光譜信息,LiDAR數(shù)據(jù)則補(bǔ)充了冠層垂直結(jié)構(gòu)上的信息,使得分類器對于單個樹種特征的識別更為充分,從而可以獲得更高的精度[29-30]。分樹種來看,僅使用光譜特征時,白樺和柞樹的分類效果較好,精度在70%以上。這是由于這二者的光譜特異性表現(xiàn)更為明顯且樣本數(shù)也較多,以往也有研究得出過類似的結(jié)論[31]。僅使用LiDAR數(shù)據(jù)時,落葉松的分類精度較高,這是因?yàn)槁淙~松是本研究選取的5個樹種中唯一的針葉樹種,LiDAR數(shù)據(jù)很好地反映了針、闊葉樹種在垂直結(jié)構(gòu)上的差異。
對比方案1、3、5、7和2、4、6、8的分類結(jié)果可以看出,隨機(jī)森林的分類精度和Kappa系數(shù)相比與BP神經(jīng)網(wǎng)絡(luò)更高,這證明隨機(jī)森林分類器在單木樹種分類應(yīng)用中的準(zhǔn)確性和可靠性更高。隨機(jī)森林可以提供多個決策樹的不同解釋,在分類問題上具有更好的性能,而神經(jīng)網(wǎng)絡(luò)算法則對數(shù)據(jù)量要求較高,需要較大的數(shù)據(jù)量才能取得更好的分類效果[32]。由于本研究采用的數(shù)據(jù)樣本量相對較少,因此很難發(fā)揮BP神經(jīng)網(wǎng)絡(luò)分類器的的優(yōu)勢。
對比方案7、8和方案5、6的分類結(jié)果可以看出,樹冠形態(tài)特征的加入使得單木樹種識別精度平均提高了1.19%。雖然LiDAR提取的高度、強(qiáng)度變量可以一定程度上反映單木樹冠在垂直方向上的結(jié)構(gòu)特性,但難以描述樹冠整體的形態(tài)特征[33]。相比之下,本研究提取的樹冠形態(tài)特征參數(shù)可以更好的描述樹冠整體的形態(tài),從而補(bǔ)充了樹冠在垂直方向上的結(jié)構(gòu)信息。由于各個樹種樹冠形狀存在差異,因此引入樹冠形態(tài)特征可以進(jìn)一步提高單木樹種分類的精度。此外,加入樹冠形態(tài)特征變量后,落葉松識別精度的提高最為明顯。這是因?yàn)獒橀熑~的樹冠形狀差異更大[34]。但是因?yàn)闃拥貎?nèi)的各個闊葉樹之間樹冠的形態(tài)差異較小,且樣地內(nèi)林分密度較大并存在樹冠重疊的現(xiàn)象,因此分類精度提升幅度較小。不同樹種的樹冠點(diǎn)云如圖6。
圖6 5個主要樹種的點(diǎn)云
與此同時,本研究存在一些不足之處。首先,研究中采用的高光譜數(shù)據(jù)與實(shí)地數(shù)據(jù)的采集時間相差4 a,這可能導(dǎo)致遙感圖像所提取的光譜曲線與樣地樹木的實(shí)際光譜存在一定的差異。其次,本研究選取的范圍較小,且樹種的數(shù)量并不平衡,導(dǎo)致部分樹種無法進(jìn)行分類,這些不足將在日后的研究中加以彌補(bǔ)。
本研究以無人機(jī)激光雷達(dá)及機(jī)載高光譜數(shù)據(jù)為數(shù)據(jù)源,結(jié)合機(jī)器學(xué)習(xí)算法,探討了8種分類方案下的單木樹種分類結(jié)果。結(jié)果表明,相較于使用單一數(shù)據(jù)源,多源遙感協(xié)同分類的分類精度有顯著提高。且在使用單一數(shù)據(jù)源時,高光譜數(shù)據(jù)的分類精度要高于激光雷達(dá)數(shù)據(jù)。隨機(jī)森林分類器在單木樹種分類中的應(yīng)用效果要優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。無人機(jī)激光雷達(dá)所提取樹冠形態(tài)參數(shù)能夠有效提高單木樹種的識別精度,尤其在針、闊葉樹種的區(qū)分上具有較大的潛力。