周小成 鄭 磊 黃洪宇
(福州大學(xué)地理空間信息技術(shù)國(guó)家地方聯(lián)合工程研究中心 空間數(shù)據(jù)挖掘與信息共享教育部重點(diǎn)實(shí)驗(yàn)室 福州 350116)
作為森林資源調(diào)查的關(guān)鍵參數(shù),林分類(lèi)型信息的精準(zhǔn)提取對(duì)林業(yè)資源清查、生態(tài)健康評(píng)估等意義重大(Crossetal.,2019;Fassnachtetal.,2016)。傳統(tǒng)的林分類(lèi)型識(shí)別以實(shí)地調(diào)查為基礎(chǔ),不僅時(shí)間人力成本高,而且受空間范圍限制(Yuetal.,2017)。遙感手段可對(duì)森林資源進(jìn)行大范圍內(nèi)的周期性、可重復(fù)性觀測(cè)(尹凌宇等,2016),其中,中等空間分辨率衛(wèi)星遙感影像因覆蓋范圍廣常用于大區(qū)域尺度的林分類(lèi)型信息提取,如劉云鵬等(2017)基于多時(shí)相Landsat影像識(shí)別了江蘇全省的楊樹(shù)(Populus)信息;但由于影像分辨率較低,在各林分交界處存在一個(gè)像元包含多種林分類(lèi)型的情況,難以滿足林分尺度森林資源調(diào)查以及林業(yè)生產(chǎn)的要求。高空間分辨率衛(wèi)星遙感影像上紋理與樹(shù)冠輪廓的差異明顯,可用于區(qū)分更精細(xì)的林分類(lèi)型,如Xie等(2019)基于2.1 m分辨率的資源三號(hào)衛(wèi)星數(shù)據(jù)實(shí)現(xiàn)了內(nèi)蒙古喀喇沁旗旺業(yè)甸實(shí)驗(yàn)林場(chǎng)7種樹(shù)種的分布制圖;Cross等(2019)以哥斯達(dá)黎加一個(gè)熱帶植物園為研究區(qū),利用WorldView-3影像實(shí)現(xiàn)了6種熱帶樹(shù)種的分類(lèi)。雖然高空間分辨率衛(wèi)星遙感影像在林分類(lèi)型分類(lèi)識(shí)別中取得了良好效果,但是價(jià)格高,成像質(zhì)量受天氣影響,重返周期較長(zhǎng),難以及時(shí)獲取目標(biāo)地區(qū)數(shù)據(jù)。隨著通信與計(jì)算機(jī)技術(shù)的蓬勃發(fā)展,無(wú)人機(jī)遙感系統(tǒng)性能逐漸提高,已成為小區(qū)域林業(yè)遙感數(shù)據(jù)獲取的新手段(范承嘯等,2009)。
在基于無(wú)人機(jī)遙感數(shù)據(jù)的林分類(lèi)型分類(lèi)識(shí)別中,常用特征包括光譜特征、植被指數(shù)和紋理特征等。Brovkina等(2018)利用含有近紅外波段的多光譜無(wú)人機(jī)數(shù)據(jù)結(jié)合植被指數(shù)進(jìn)行多樹(shù)種分類(lèi),結(jié)果表明,植被指數(shù)對(duì)提高林分類(lèi)型分類(lèi)精度具有一定意義,但在地物結(jié)構(gòu)復(fù)雜區(qū)域,其帶來(lái)的精度提升有限,還需要輔助其他特征。Gini等(2018)提取多光譜無(wú)人機(jī)影像多個(gè)窗口的紋理特征并結(jié)合光譜特征,林分類(lèi)型分類(lèi)精度從58%提升至87%。Michez等(2016)將從攝影測(cè)量點(diǎn)云中獲取的冠層高度特征與多光譜影像相結(jié)合,構(gòu)建適用于河岸森林環(huán)境的林分類(lèi)型分類(lèi)模型,結(jié)果發(fā)現(xiàn),利用無(wú)人機(jī)數(shù)據(jù)生成的攝影測(cè)量點(diǎn)云可以提供地物高度信息,能夠區(qū)分出光譜紋理特征相似而高度上存在明顯差異的地物。Sothe等(2019)綜合運(yùn)用高光譜無(wú)人機(jī)數(shù)據(jù)中的光譜、紋理、植被指數(shù)以及高度特征對(duì)12種闊葉樹(shù)種進(jìn)行分類(lèi),總體精度達(dá)72.4%。除了光譜、植被指數(shù)、紋理和高度特征外,近年來(lái)表征空間特征的擴(kuò)展的形態(tài)學(xué)多屬性剖面(EMAPs)也被廣泛用于高分辨率遙感信息提取(Samiappanetal.,2017;Zhangetal.,2019)。此外,分類(lèi)方法也是影響林分類(lèi)型分類(lèi)精度的重要因素,常見(jiàn)的林分類(lèi)型分類(lèi)方法主要包括最小距離法、最大似然法等傳統(tǒng)算法以及決策樹(shù)、支持向量機(jī)、隨機(jī)森林等機(jī)器學(xué)習(xí)算法(任芯雨,2016;Ginietal.,2014;Xieetal.,2019),其中隨機(jī)森林算法和支持向量機(jī)應(yīng)用最為普遍。隨機(jī)森林算法參數(shù)設(shè)置簡(jiǎn)單,對(duì)高維數(shù)據(jù)和大數(shù)據(jù)量的影像處理效率高于支持向量機(jī),在林分類(lèi)型分類(lèi)識(shí)別中被廣泛應(yīng)用(郭玉寶等,2016;Maschleretal.,2018)。近年來(lái)興起的深度學(xué)習(xí)算法也被應(yīng)用到林分類(lèi)型分類(lèi)中,如林志瑋等(2019)利用DenseNet網(wǎng)絡(luò)實(shí)現(xiàn)了無(wú)人機(jī)影像樹(shù)種分類(lèi)識(shí)別,但該方法需要大量樣本數(shù)據(jù),復(fù)雜的模型參數(shù)調(diào)整以及長(zhǎng)時(shí)間的模型訓(xùn)練才能獲得較高的分類(lèi)精度,而隨機(jī)森林算法僅需要較少的樣本訓(xùn)練就能獲得高精度的分類(lèi)結(jié)果(溫小樂(lè)等,2018)。
已有研究往往利用單一或少量特征組合進(jìn)行林分類(lèi)型識(shí)別,分類(lèi)效果較差,而較多特征組合分類(lèi)又會(huì)造成數(shù)據(jù)冗余和維度災(zāi)難。王娜等(2017)研究指出,特征優(yōu)選可以降低特征維度,提升分類(lèi)器的運(yùn)行效率和分類(lèi)精度。遞歸特征消除隨機(jī)森林算法(RF_RFE)是一種比較常見(jiàn)的特征優(yōu)選算法,如Cheng等(2019)基于Sentinel-2數(shù)據(jù)進(jìn)行秦嶺山脈主要林分類(lèi)型分類(lèi)識(shí)別時(shí),利用RF_RFE算法篩選出了最有利于林分類(lèi)型分類(lèi)的特征,提高了分類(lèi)精度和效率。
目前,基于無(wú)人機(jī)遙感數(shù)據(jù)進(jìn)行林分類(lèi)型分類(lèi)主要采用多光譜和高光譜數(shù)據(jù),這2類(lèi)數(shù)據(jù)可以提供豐富的光譜特征,然而由于影像采集和加工難度較大,在實(shí)際林業(yè)生產(chǎn)和森林資源調(diào)查中使用最多的是僅包含紅、綠、藍(lán)3個(gè)波段的無(wú)人機(jī)可見(jiàn)光數(shù)據(jù)。該數(shù)據(jù)常用于估算株數(shù)、樹(shù)高等參數(shù),在林分類(lèi)型分類(lèi)識(shí)別方面的研究還很少,林業(yè)部門(mén)積累了大量無(wú)人機(jī)可見(jiàn)光影像,但沒(méi)有將其充分應(yīng)用到森林資源調(diào)查上。鑒于此,本研究以無(wú)人機(jī)可見(jiàn)光遙感影像為數(shù)據(jù)源,綜合擴(kuò)展的形態(tài)學(xué)多屬性剖面特征、光譜特征、植被指數(shù)、紋理特征、高度特征等構(gòu)建分類(lèi)模型,結(jié)合遞歸特征消除隨機(jī)森林特征優(yōu)選算法,使用隨機(jī)森林分類(lèi)器進(jìn)行林分類(lèi)型分類(lèi)識(shí)別,以拓展無(wú)人機(jī)可見(jiàn)光遙感數(shù)據(jù)在森林資源調(diào)查中的應(yīng)用范圍。
研究區(qū)位于福建省建甌市房道鎮(zhèn),總面積0.16 km2,屬中亞熱帶季風(fēng)氣候,多年平均氣溫18.7 ℃,年降水量1 663.8 cm。樹(shù)種以天然生長(zhǎng)的闊葉林和人工種植的毛竹(Phyllostachysedulis)、杉木(Cunninghamialanceolata)為主。研究區(qū)位置如圖1a、b所示。
圖1 研究區(qū)位置與樣本分布Fig.1 Location of the study area and distribution of samples
數(shù)據(jù)于2016年8月16日采集,使用小型固定翼eBee無(wú)人機(jī),配備SONYWX220相機(jī),相機(jī)的等效焦距為24 mm,像素為1 800萬(wàn)。航拍時(shí)高度為500 m,旁向重疊率和航向重疊率分別設(shè)置為60%和80%,同時(shí)使用差分GPS獲取4個(gè)地面控制點(diǎn)。
將航拍影像、POS數(shù)據(jù)和地面控制點(diǎn)輸入到Pix4Dmapper軟件進(jìn)行影像拼接,生成數(shù)字正射影像圖(DOM)和數(shù)字表面模型(DSM)。影像分辨率為0.1 m,均方根誤差為0.039 m,攝影測(cè)量點(diǎn)云密度為1.27 m-2。研究區(qū)影像大小為4 511行3 260列,總面積為0.16 km2,DOM和DSM如圖1c、d所示。
依據(jù)正射影像目視判讀情況結(jié)合《森林資源規(guī)劃設(shè)計(jì)調(diào)查主要技術(shù)規(guī)定》,建立研究區(qū)林分尺度森林分類(lèi)系統(tǒng)。由于主要研究對(duì)象為林分類(lèi)型,因此將其他非林地類(lèi)如農(nóng)田、裸地、道路等統(tǒng)稱為其他類(lèi)別,最終將研究區(qū)地物類(lèi)別分為闊葉林、針葉林、竹林和其他類(lèi)別4類(lèi)。利用分類(lèi)系統(tǒng)在影像上選取樣本,每個(gè)像素類(lèi)別代表其所在位置屬于的林分類(lèi)型,其中闊葉林樣本包含26 803個(gè)像素,針葉林樣本包含39 601個(gè)像素,竹林樣本包含30 039個(gè)像素,其他類(lèi)別樣本包含42 486個(gè)像素。樣本總量占影像的0.9%。樣本分布如圖1c所示。
為充分挖掘無(wú)人機(jī)可見(jiàn)光遙感影像的潛在信息,本研究考慮使用6類(lèi)特征:原始影像的光譜信息、利用攝影測(cè)量點(diǎn)云生成表征高度的DSM、擴(kuò)充光譜信息的植被指數(shù)、HSV三個(gè)顏色分量及其提取的紋理特征,以及表征空間信息的擴(kuò)展的形態(tài)學(xué)多屬性剖面。采用遞歸特征消除隨機(jī)森林算法優(yōu)選特征子集。根據(jù)不同類(lèi)型特征和優(yōu)選特征子集設(shè)置8組試驗(yàn),使用隨機(jī)森林分類(lèi)器進(jìn)行林分類(lèi)型分類(lèi),以獲得最佳分類(lèi)方案。技術(shù)路線如圖2所示。
圖2 技術(shù)路線Fig.2 Technical flowchart
2.1.1 植被指數(shù)提取 可見(jiàn)光數(shù)據(jù)僅包含紅、綠、藍(lán)3個(gè)波段的光譜信息,通過(guò)波段間的相互運(yùn)算生成植被指數(shù)(VIs),從而擴(kuò)充光譜信息。選擇常見(jiàn)的8個(gè)可見(jiàn)光范圍內(nèi)的植被指數(shù)進(jìn)行林分類(lèi)型識(shí)別,8個(gè)植被指數(shù)在濕地水生植物識(shí)別(井然等,2016)以及農(nóng)作物分布制圖(Davidetal.,2016)中均取得了良好效果。計(jì)算公式如表1所示。
表1 可見(jiàn)光植被指數(shù)①Tab.1 Vegetation indices(VIs)derived from visible bands
2.1.2 紋理提取 紋理特征用于揭示影像上各地物灰度信息的分布規(guī)律,在結(jié)合光譜特征進(jìn)行林分類(lèi)型分類(lèi)中具有良好表現(xiàn)?;叶裙采仃?gray level co-occurrence matrix,GLCM)是提取紋理特征的常見(jiàn)手段(裴歡等,2018)。使用原始可見(jiàn)光影像進(jìn)行紋理特征提取時(shí),紅、綠、藍(lán)3個(gè)波段間存在一定的相關(guān)性,導(dǎo)致提取的紋理特征間存在冗余,不利于信息提取,因此本研究通過(guò)HSV色彩空間轉(zhuǎn)換獲得的顏色分量進(jìn)行紋理特征提取(戴建國(guó)等,2018)。H表示色相(hue)、S表示飽和度(saturation)、V表示亮度(value),3個(gè)分量的計(jì)算公式如下:
(1)
(2)
V=max。
(3)
式中:max和min分別表示3個(gè)波段的最大值和最小值。
GLCM提供了8種紋理特征(Haralicketal.,1973),提取紋理特征的關(guān)鍵參數(shù)有窗口大小、步長(zhǎng)和方向,這3個(gè)參數(shù)對(duì)林分類(lèi)型紋理信息提取具有較大影響(Sotheetal.,2019)。本研究提取窗口大小為3×3、5×5、7×7、…、25×25的12組紋理特征,使用平均J-M(Jeffries-Matusita)距離來(lái)表達(dá)樣本間的可分性,從而確定最佳紋理特征提取窗口(劉友山等,2012)。在確定最佳紋理特征提取窗口大小的前提下設(shè)置步長(zhǎng)為1、2、3,方向?yàn)?°、45°、90°、135°,同時(shí)使用平均J-M距離確定最佳步長(zhǎng)和方向,從而提取最佳紋理特征。平均J-M距離的定義公式如下:
(4)
式中:p(X/ωi)表示第i個(gè)像元屬于第ωi個(gè)類(lèi)別的幾率。
J-M距離的取值范圍為0~2,且當(dāng)值在0~1之間時(shí)表明紋理特征不能對(duì)樣本數(shù)據(jù)進(jìn)行區(qū)分;當(dāng)值在1~1.9之間時(shí)表明紋理特征可對(duì)部分樣本進(jìn)行區(qū)分;當(dāng)值在1.9~2之間時(shí)表明紋理特征可以很好區(qū)分各樣本(馬娜等,2010;裴歡等,2018)。
2.1.3 擴(kuò)展的形態(tài)學(xué)多屬性剖面提取 擴(kuò)展的形態(tài)學(xué)多屬性剖面(extended morphological multi-attribute profiles,EMAPs)可對(duì)灰度影像進(jìn)行多尺度特征提取,有效保留地物的幾何特征,并削弱不重要的細(xì)節(jié)(Zhangetal.,2019;鮑蕊等,2016)。
選擇特定的屬性濾波器,根據(jù)設(shè)置的閾值集合{k1,k2,…,kn}對(duì)單個(gè)灰度影像I進(jìn)行多次細(xì)化和粗化操作,獲得I的屬性剖面(AP)。計(jì)算公式如下:
AP(I)={φkn(I),…,φk1(I),I,γk1(I),…,γkn(I)}。
(5)
式中:φ和γ分別表示形態(tài)學(xué)中的細(xì)化和粗化操作;φkn(I)表示灰度影像I在形態(tài)學(xué)濾波器下根據(jù)閾值kn進(jìn)行細(xì)化得到的特征影像;γkn(I)同理。
分別計(jì)算可見(jiàn)光影像3個(gè)波段的AP,將結(jié)果疊加得到擴(kuò)展的屬性剖面(extended attribute profile,EAP),多個(gè)屬性的EAP疊加獲得EMAPs。目前,常用的屬性濾波有表征區(qū)域尺寸和形狀的面積a和對(duì)角線長(zhǎng)度d、表征區(qū)域像素灰度同質(zhì)性的灰度值標(biāo)準(zhǔn)差s以及表示區(qū)域非緊致性的轉(zhuǎn)動(dòng)慣量i(史忠奎等,2018)。
由式(5)可知,EMAPs提取的關(guān)鍵是閾值設(shè)置。屬性濾波a的閾值可通過(guò)目視確定;s的閾值計(jì)算公式詳見(jiàn)Marpu等(2013);屬性濾波i和d的閾值直接使用Mura等(2010)和Zhang等(2019)中的值,該閾值具有一定通用性。
提取的EMAP具有高維度特征,利用主成分分析選取每個(gè)EAP中包含信息量大于99%的前n個(gè)主分量來(lái)構(gòu)建EMAPs(Ghamisietal.,2014)。
2.2.1 分類(lèi)方法 隨機(jī)森林(random forest,RF)是一種包含多株決策樹(shù)的機(jī)器學(xué)習(xí)算法(宋榮杰等,2018)。在每株決策樹(shù)生長(zhǎng)過(guò)程中,分裂節(jié)點(diǎn)的最佳特征子集以基尼指數(shù)、信息增益為標(biāo)準(zhǔn)從原始特征集合中獲得,當(dāng)節(jié)點(diǎn)分裂達(dá)到事先定義的深度或節(jié)點(diǎn)上的樣本無(wú)法再進(jìn)行分類(lèi)時(shí)停止節(jié)點(diǎn)分裂(馬慧娟等,2019)。每株決策樹(shù)單獨(dú)完成分類(lèi)后,由投票得出最終分類(lèi)結(jié)果(呂杰等,2017)。隨機(jī)森林算法需要設(shè)置決策樹(shù)的數(shù)目和分裂節(jié)點(diǎn)的特征數(shù)目2個(gè)關(guān)鍵參數(shù),本研究經(jīng)過(guò)試驗(yàn)確定決策樹(shù)的數(shù)目為150,分裂節(jié)點(diǎn)的特征數(shù)目為參與分類(lèi)總特征數(shù)目的平方根。
2.2.2 特征選擇 上述提取的眾多特征并非都對(duì)無(wú)人機(jī)可見(jiàn)光數(shù)據(jù)林分類(lèi)型分類(lèi)有意義,特征選擇可以在眾多特征中找到最有利于林分類(lèi)型分類(lèi)的特征子集,從而提升模型的效率和分類(lèi)精度。RF算法在進(jìn)行Bootstrap抽樣時(shí),未被選擇到的樣本數(shù)據(jù)生成的袋外誤差可用來(lái)計(jì)算不同特征變量的重要性(張磊等,2019)。遞歸特征消除(recursive feature elimination,RFE)是一種集成方法,其與RF算法結(jié)合在特征選擇上可以達(dá)到較優(yōu)的性能?;具^(guò)程是在RF特征重要性基礎(chǔ)上對(duì)特征進(jìn)行排序,每次從特征集中去掉重要性小的特征進(jìn)行隨機(jī)森林分類(lèi),逐次迭代直到特征集為空時(shí)停止(楊珺雯等,2015)。在此過(guò)程中將樣本數(shù)據(jù)等分為10份,每個(gè)特征集分類(lèi)時(shí)依次使用其中9份作為訓(xùn)練數(shù)據(jù)、1份作為驗(yàn)證數(shù)據(jù),10次分類(lèi)精度均值作為該特征集的分類(lèi)精度。最后對(duì)比不同特征集下的分類(lèi)精度確定最佳特征子集。
為了探究無(wú)人機(jī)可見(jiàn)光數(shù)據(jù)林分類(lèi)型分類(lèi)的最佳方案,本研究設(shè)置8組試驗(yàn),如表2所示。
表2 試驗(yàn)方案信息Tab.2 The information of experimental programs
為了評(píng)估各特征在林分類(lèi)型分類(lèi)識(shí)別中的作用以及無(wú)人機(jī)可見(jiàn)光數(shù)據(jù)在林分類(lèi)型分類(lèi)應(yīng)用中的可行性,采用人工目視解譯方法,將研究區(qū)林分類(lèi)型全部解譯出來(lái),生成真實(shí)的林分分布圖建立混淆矩陣?;煜仃囍锌傮w精度(overall accuracy,OA)和Kappa系數(shù)用于評(píng)價(jià)整體的分類(lèi)結(jié)果;生產(chǎn)者精度(production accuracy,PA)以及用戶精度(user accuracy,UA)用于評(píng)價(jià)單個(gè)林分類(lèi)型的漏分和錯(cuò)分情況。對(duì)于單個(gè)林分類(lèi)型的分類(lèi)精度評(píng)價(jià),采用F統(tǒng)計(jì)值來(lái)表示(宋榮杰等,2017),計(jì)算公式如下:
(6)
式中:PAi表示類(lèi)別i的生產(chǎn)者精度;UAi表示類(lèi)別i的用戶精度。
3.1.1 高度特征分析 通常使用去除地形影響的冠層高度模型(CHM)表示林分自身冠層高度,CHM是通過(guò)DSM與數(shù)字高程模型(DEM)的差值計(jì)算獲得的,其精度受DSM和DEM的精度影響。本研究區(qū)由于林分郁閉度大,林間地面點(diǎn)被林冠遮擋,僅利用無(wú)人機(jī)可見(jiàn)光遙感影像無(wú)法生成高精度的DEM,因此無(wú)法獲得可用的CHM。DSM反映的高度特征除林分自身冠層高度外,還包含地形高度,在無(wú)法獲得可用CHM的情況下,可以使用DSM表示高度特征。
為了確保生成的DSM精度滿足林分類(lèi)型分類(lèi)精度要求,無(wú)人機(jī)可見(jiàn)光遙感數(shù)據(jù)采集時(shí)同步使用差分GPS獲取4個(gè)地面控制點(diǎn),實(shí)測(cè)控制點(diǎn)的高度和對(duì)應(yīng)DSM如表3所示,DSM和實(shí)測(cè)高度誤差均小于0.1 m,與各林分在高度分布上的差異相比可以忽略。統(tǒng)計(jì)樣本高度如圖3所示,可以發(fā)現(xiàn)闊葉林高度分布集中在304~336 m之間,平均高度326 m,最大值414 m,最小值295 m;針葉林高度分布集中在378~389 m之間,平均高度381 m,最大值403 m,最小值310 m;竹林高度分布集中在385~390 m之間,平均高度381 m,最大值409 m,最小值311 m;其他類(lèi)別高度分布集中在289~324 m之間,平均高度315 m,最大值401 m,最小值280 m。由此可見(jiàn),闊葉林和其他類(lèi)別在高度分布上存在較大重疊部分,主要集中的高度區(qū)域遠(yuǎn)低于針葉林和竹林。針葉林和竹林在高度分布上較為一致。
表3 DSM精度Tab.3 DSM precision
圖3 林分樣本高度分布Fig.3 Height distribution of forest stand samples
3.1.2 植被指數(shù)提取分析 本研究共提取8個(gè)可見(jiàn)光植被指數(shù),不同植被指數(shù)值的范圍相差很大,將其歸一化到0~1之間。統(tǒng)計(jì)各林分樣本植被指數(shù)均值得到圖4,可以看出不同植被指數(shù)對(duì)林分類(lèi)型的區(qū)分程度不同,其中闊葉林區(qū)分度較高,針葉林和竹林難以區(qū)分。
圖4 各林分樣本植被指數(shù)均值Fig.4 Mean vegetation index of each forest stand samples
3.1.3 紋理特征提取分析 樣本平均J-M距離計(jì)算結(jié)果如圖5所示。從圖5a可以看出,當(dāng)提取窗口大于19×19后,各林分類(lèi)型的平均J-M距離均大于1.9,且趨于穩(wěn)定,具有較高可分性,因此選擇最佳紋理特征提取窗口為19×19。在窗口大小為19×19時(shí),不同方向和步長(zhǎng)下樣本平均J-M距離如圖5b所示,可以看出樣本平均J-M距離變化較小,且沒(méi)有哪些參數(shù)組合使得每個(gè)樣本的平均J-M距離都是最大的。當(dāng)步長(zhǎng)為1、方向?yàn)?5°時(shí),針葉林和竹林的平均J-M距離最大,闊葉林和其他類(lèi)別的平均J-M距離適中,選擇窗口大小為19×19、步長(zhǎng)為1、方向?yàn)?5°作為最優(yōu)的紋理特征提取參數(shù)。
圖5 樣本平均可分性Fig.5 Mean separability of samplesa.樣本平均可分性隨紋理尺度的變化Mean separability of samples with different scales texture;b.不同步長(zhǎng)和方向下樣本的平均可分離度Mean separability of samples with different distances and directions.
為了驗(yàn)證HSV顏色分量提取紋理的有效性,另提取窗口大小為3×3~19×19的RGB紋理特征,并單獨(dú)利用這些特征進(jìn)行隨機(jī)森林分類(lèi),采用OA和Kappa系數(shù)進(jìn)行精度評(píng)估。由圖6可知,HSV紋理的分類(lèi)精度優(yōu)于RGB紋理的分類(lèi)精度。
圖6 不同窗口下HSV紋理與RGB紋理分類(lèi)精度對(duì)比Fig.6 Comparison of classification accuracy between HSV texture and RGB texture under different window sizes
3.1.4 擴(kuò)展的形態(tài)學(xué)多屬性剖面提取分析 本研究在進(jìn)行形態(tài)學(xué)屬性剖面提取時(shí)使用4種濾波器,基于影像上各林分冠幅大小確定面積a的閾值集合為(5、9、61、115、171、325、1 027);標(biāo)準(zhǔn)差s閾值通過(guò)樣本自動(dòng)生成;對(duì)角線長(zhǎng)度d和轉(zhuǎn)動(dòng)慣量i根據(jù)已有文獻(xiàn)分別設(shè)置為(10、20、30、40、50、60、70、80、90)和(0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9)。共獲得45個(gè)EAPa特征、15個(gè)EAPa特征、57個(gè)EAPd特征和57個(gè)EAPi特征。對(duì)每個(gè)EAP進(jìn)行主成分分析,生成的EMAPs中分別包含EAPs前4個(gè)主成分、EAPs前5個(gè)主成分、EAPd前5個(gè)主成分和EAPi前13個(gè)主成分,維度為27。
3.1.5 特征選擇結(jié)果 共選擇66個(gè)特征用于林分類(lèi)型分類(lèi),分別為3個(gè)原始光譜特征、DSM、8個(gè)植被指數(shù)、3個(gè)HSV顏色分量、24個(gè)HSV紋理特征和27個(gè)擴(kuò)展的形態(tài)學(xué)多屬性剖面。采用RF_RFE的特征選擇結(jié)果如圖7所示,其中總體精度和Kappa系數(shù)均為十折交叉驗(yàn)證的均值。
圖7 采用遞歸特征消除隨機(jī)森林算法的特征選擇結(jié)果Fig.7 Feature selection using random forest_recursive feature elimination(RF_RFE)
從圖7可以看出,當(dāng)參與分類(lèi)的特征數(shù)從1增加到11時(shí),分類(lèi)精度先上升后降低再上升,特征數(shù)為11時(shí)最高,繼續(xù)增加特征,分類(lèi)精度并無(wú)改善,因此選擇前11個(gè)特征作為優(yōu)選的特征子集。選擇的特征按重要性從大到小的順序?yàn)镈SM、Hue_GLCM_Mean(色相紋理均值)、Sat_GLCM_Mean(飽和度紋理均值)、EAPa_PCA3(EAPa的第3主成分)、Val_GLCM_Correlation(亮度紋理相關(guān)性)、WI、Hue、EAPd_PCA5(EAPd的第5主成分)、EAPs_PCA2(EAPs的第2主成分)、EAPi_PCA11(EAPi的第11主成分)、EAPd_PCA3(EAPd的第3主成分)。
本研究共設(shè)置8組對(duì)比試驗(yàn),分類(lèi)結(jié)果如圖8所示。以人工目視解譯方法繪制出的林分類(lèi)型真實(shí)地面分布圖為參考(圖8i),從目視效果上看,試驗(yàn)1、3和4存在大量農(nóng)田與林分混淆的情況,小碎塊較多;試驗(yàn)2農(nóng)田與林分區(qū)分較好,但是3種林分類(lèi)型之間均混淆嚴(yán)重;試驗(yàn)5相比試驗(yàn)1農(nóng)田與林分混淆的情況得到改善,但針葉林和竹林存在混淆;試驗(yàn)6、7、8在目視效果上較好,地塊較完整,與地面參考影像較為接近。
圖8 不同試驗(yàn)分類(lèi)結(jié)果Fig.8 Classification results of different experiments
采用OA、Kappa系數(shù)、PA、UA和F統(tǒng)計(jì)值對(duì)各試驗(yàn)方案進(jìn)行定量評(píng)價(jià),如表4所示。從總體分類(lèi)結(jié)果來(lái)看,試驗(yàn)1以原始三波段光譜特征進(jìn)行林分類(lèi)型分類(lèi)識(shí)別,總體精度為65.68%,Kappa系數(shù)為0.53,分類(lèi)精度低。試驗(yàn)2、3、4在試驗(yàn)1的基礎(chǔ)上分別添加DSM、植被指數(shù)、HSV顏色分量,其中試驗(yàn)3的總體精度和Kappa系數(shù)略有下降,試驗(yàn)2和試驗(yàn)4的總體精度和Kappa系數(shù)提升不明顯。試驗(yàn)5在試驗(yàn)1的基礎(chǔ)上添加HSV紋理特征,分類(lèi)精度大幅度提升,總體精度提升9.49%,Kappa系數(shù)提高0.12。試驗(yàn)6在試驗(yàn)1的基礎(chǔ)上添加EMAPs,總體精度提升10.24%,Kappa系數(shù)提高0.13。試驗(yàn)7利用所有特征進(jìn)行分類(lèi),相比光譜與其他特征單獨(dú)結(jié)合使用分類(lèi)精度要高,但是低于經(jīng)過(guò)特征選擇的試驗(yàn)8的精度。經(jīng)過(guò)特征選擇后總體精度和Kappa系數(shù)達(dá)到最高,分別為81.05%和0.73。
表4 分類(lèi)精度統(tǒng)計(jì)Tab.4 The statistics of classification accuracy
從單個(gè)林分類(lèi)型的漏分和錯(cuò)分以及分類(lèi)精度來(lái)看,DSM在改善闊葉林漏分情況下加劇了錯(cuò)分,總體來(lái)說(shuō)對(duì)闊葉林的分類(lèi)提取是有益的,精度增加1.23%。HSV紋理特征在減少闊葉林錯(cuò)分時(shí)加劇了漏分,綜合錯(cuò)分、漏分情況,精度提升5.7%。EMAPs對(duì)闊葉林的漏分和錯(cuò)分均有改善,精度提升9.54%。HSV顏色特征對(duì)闊葉林的錯(cuò)分和漏分沒(méi)有明顯影響。植被指數(shù)使闊葉林分類(lèi)精度降低,錯(cuò)分、漏分情況均加重。綜合所有特征和優(yōu)選特征子集均可改善闊葉林的錯(cuò)分和漏分情況,使闊葉林的分類(lèi)精度分別提升15.66%和15.89%。對(duì)針葉林來(lái)說(shuō),使用原始光譜信息錯(cuò)分情況最少,其他特征引入均使針葉林錯(cuò)分加劇,除DSM外,其他特征均可改善針葉林的漏分情況,光譜特征單獨(dú)結(jié)合其他特征并不能提高針葉林的分類(lèi)精度。綜合所有特征進(jìn)行分類(lèi)時(shí),雖然針葉林錯(cuò)分較多,但漏分明顯改善,分類(lèi)精度提升4.67%。特征優(yōu)選子集在針葉林分類(lèi)時(shí)漏分明顯改善,分類(lèi)精度提升2.14%。各特征均可改善竹林錯(cuò)分情況,HSV紋理和EMAPs可同時(shí)改善竹林漏分和錯(cuò)分情況,使竹林的分類(lèi)精度分別提升15.16%和15.91%,其他特征雖然加劇了竹林的漏分情況,但總體上還是提高了分類(lèi)精度。綜合所有特征和優(yōu)選特征子集均可以改善竹林的錯(cuò)分和漏分情況,分類(lèi)精度分別提升18.99%和20.31%。
采用常見(jiàn)的Majority分析對(duì)8組試驗(yàn)結(jié)果進(jìn)行分類(lèi)后處理,以消除細(xì)小斑塊,提高分類(lèi)精度。設(shè)置變化核尺寸為15×15(約1株針葉樹(shù)冠幅大小),中心像元權(quán)重為1。試驗(yàn)1、3、4分類(lèi)結(jié)果中噪聲較多,經(jīng)分類(lèi)后處理的總體精度分別提升3.25%、3.01%和3.26%;試驗(yàn)2、5、6分類(lèi)結(jié)果中噪聲相對(duì)較少,總體精度分別提升1.24%、1.98%和1.45%;試驗(yàn)7、8分類(lèi)結(jié)果較為精確,小碎斑少,總體精度分別提升0.42%和0.38%。
研究區(qū)使用的影像分辨率為0.1 m,鑒于林業(yè)部門(mén)獲得的無(wú)人機(jī)可見(jiàn)光影像分辨率可能較粗,因此在較低分辨率影像上采用本研究方法進(jìn)行試驗(yàn),以驗(yàn)證方法的適用性。無(wú)人機(jī)可見(jiàn)光影像的分辨率基本上都優(yōu)于0.5 m,將原始影像分別重采樣成0.3 m和0.5 m分辨率,使用多特征優(yōu)選方法進(jìn)行分類(lèi)(圖9),均取得較好分類(lèi)結(jié)果,總體精度均在80%以上,這說(shuō)明本研究方法在較低分辨率影像上同樣適用。當(dāng)分辨率為0.3 m時(shí)精度最高,總體精度達(dá)82.46%,Kappa系數(shù)為0.75;當(dāng)分辨率為0.5 m時(shí)精度較低,總體精度為80.48%,Kappa系數(shù)為0.72。各林分類(lèi)型的分類(lèi)精度如圖10所示,分辨率為0.3 m時(shí)各林分類(lèi)型分類(lèi)精度均最高。當(dāng)分辨率較高時(shí)(0.1 m),林分內(nèi)部差異明顯,同物異譜現(xiàn)象較嚴(yán)重,分類(lèi)精度反而有所降低,當(dāng)分辨率較低時(shí)(0.5 m),林分間的差異減小,出現(xiàn)異物同譜現(xiàn)象,也會(huì)使分類(lèi)精度降低。同樣對(duì)0.3 m和0.5 m分辨率的分類(lèi)結(jié)果進(jìn)行分類(lèi)后處理,總體精度分別提升0.30%和0.43%。
圖9 不同分辨率影像分類(lèi)結(jié)果Fig.9 Classification results of different resolution image
本研究基于無(wú)人機(jī)獲取的可見(jiàn)光遙感數(shù)據(jù),充分發(fā)掘其潛在信息,對(duì)比不同特征對(duì)林分類(lèi)型分類(lèi)的影響,采用遞歸特征消除隨機(jī)森林算法進(jìn)行特征篩選,實(shí)現(xiàn)了闊葉林、針葉林和竹林的分類(lèi)識(shí)別。該研究方法對(duì)無(wú)人機(jī)可見(jiàn)光數(shù)據(jù)在林業(yè)資源調(diào)查中的應(yīng)用具有參考意義。分析本研究林分類(lèi)型分類(lèi)識(shí)別的流程和結(jié)果,認(rèn)為影響林分類(lèi)型分類(lèi)識(shí)別精度的因素主要有以下幾方面:
1)不同原始數(shù)據(jù)提取紋理特征影響林分類(lèi)型分類(lèi)結(jié)果。本研究在提取紋理特征時(shí),考慮到原始光譜特征間存在一定相關(guān)性,提取的紋理特征間存在冗余,不利于林分類(lèi)型分類(lèi)識(shí)別,因此通過(guò)HSV色彩空間轉(zhuǎn)換獲得3個(gè)顏色分量進(jìn)行紋理特征提取。經(jīng)過(guò)試驗(yàn)對(duì)比發(fā)現(xiàn),HSV紋理特征在林分類(lèi)型分類(lèi)識(shí)別上優(yōu)于RGB紋理特征。
2)不同紋理提取窗口影響林分類(lèi)型分類(lèi)結(jié)果。不同窗口大小提取的紋理特征在林分類(lèi)型分類(lèi)識(shí)別時(shí)精度存在明顯變化,因此本研究使用樣本的平均J-M距離確定最佳紋理提取窗口,紋理窗口確定后,方向和步長(zhǎng)設(shè)置對(duì)分類(lèi)結(jié)果影響較小。
3)不同特征組合影響林分類(lèi)型分類(lèi)精度。以原始光譜特征為基礎(chǔ),單獨(dú)引入其他特征對(duì)林分類(lèi)型分類(lèi)精度影響不同。其他特征均可提高竹林的分類(lèi)精度而使針葉林的分類(lèi)精度降低,DSM、HSV紋理和EMAPs可提高闊葉林的分類(lèi)精度。綜合所有特征和特征優(yōu)選子集均可提高所有林分類(lèi)型的分類(lèi)精度。
4)在不同分辨率影像上使用多特征優(yōu)選方法均可取得較好分類(lèi)效果,但并不是影像分辨率越高分類(lèi)精度就越高,分辨率較高或較粗均會(huì)降低分類(lèi)精度。
5)利用分類(lèi)后處理消除細(xì)小斑塊,可在一定程度上提高分類(lèi)精度。
另外,本研究還存在一些待改進(jìn)的地方。采用遞歸特征消除隨機(jī)森林算法優(yōu)選的特征子集進(jìn)行分類(lèi)時(shí)雖然獲得了最高分類(lèi)精度,但還具有一定提升空間,未來(lái)可以考慮使用深度學(xué)習(xí)方法提高分類(lèi)精度。
針對(duì)目前無(wú)人機(jī)可見(jiàn)光遙感數(shù)據(jù)林分類(lèi)型分類(lèi)識(shí)別研究較少的現(xiàn)狀,從原始數(shù)據(jù)中提取光譜、高度、植被指數(shù)、HSV顏色分量、HSV紋理以及擴(kuò)展的形態(tài)學(xué)多屬性剖面特征,采用遞歸特征消除隨機(jī)森林算法篩選出最佳特征組合,使用隨機(jī)森林分類(lèi)器實(shí)現(xiàn)了闊葉林、針葉林和竹林的分類(lèi)識(shí)別。主要結(jié)論如下:
1)單獨(dú)使用無(wú)人機(jī)可見(jiàn)光遙感影像的光譜信息進(jìn)行林分類(lèi)型分類(lèi)效果不理想,總體精度和各林分類(lèi)型分類(lèi)精度較低。以光譜特征為基礎(chǔ),單獨(dú)引入不同類(lèi)型特征,除植被指數(shù)外,其他特征均可提高總體分類(lèi)精度,其中EMAPs和HSV紋理特征提升效果明顯。
2)與單獨(dú)使用光譜特征相比,綜合所有特征進(jìn)行分類(lèi),總體精度以及各林分類(lèi)型分類(lèi)精度均大幅提升,但高維的特征會(huì)使分類(lèi)效率低,采用遞歸特征消除隨機(jī)森林算法可有效篩選出最佳分類(lèi)特征,在降維的同時(shí)提高分類(lèi)精度。
3)本研究的創(chuàng)新之處在于使用無(wú)人機(jī)可見(jiàn)光遙感影像作為數(shù)據(jù)源,充分挖掘多類(lèi)型特征中的有用信息實(shí)現(xiàn)林分類(lèi)型分類(lèi)識(shí)別,擴(kuò)展了無(wú)人機(jī)可見(jiàn)光數(shù)據(jù)在森林資源調(diào)查中的應(yīng)用范圍。但本研究對(duì)象為闊葉林、針葉林和竹林3種類(lèi)型,樹(shù)種組成較為單一且研究區(qū)面積較小,有待于對(duì)范圍更大、樹(shù)種組成更加復(fù)雜的區(qū)域進(jìn)行研究。