李華玉,陳永富,陳 巧,王 娟,張 超
(1.西南林業(yè)大學(xué) 林學(xué)院,云南 昆明 650224;2.中國林業(yè)科學(xué)研究院 資源信息研究所,國家林業(yè)和草原局林業(yè)遙感與信息技術(shù)重點(diǎn)實驗室,北京 100091)
森林類型/樹種(組)的精準(zhǔn)識別是森林參數(shù)的提取和計算的前提,是林業(yè)遙感領(lǐng)域的重要研究方向。森林樹種的精確識別對于森林生態(tài)系統(tǒng)和生物多樣性的宏觀監(jiān)測具有至關(guān)重要的作用和深遠(yuǎn)意義[1]。森林類型/樹種的空間分布信息能夠為如生物多樣性保護(hù)、外來物種入侵、森林資源調(diào)查等研究提供基礎(chǔ)信息[2]。
傳統(tǒng)的森林類型/樹種(組)識別主要依靠地面調(diào)查手段,通過目視的方法根據(jù)林木的根、莖、葉、花、果、種子等外部形態(tài)特征識別和鑒定樹種。這種方法雖然相對準(zhǔn)確,但同時也存在諸多不足。首先,對于不具備交通條件的地塊,可進(jìn)入性低、調(diào)查難度大;其次,僅靠人工進(jìn)行野外調(diào)查成本較大、耗時長,很難在短時間內(nèi)實現(xiàn)宏觀尺度的數(shù)據(jù)獲取。遙感技術(shù)的快速發(fā)展為森林類型/樹種(組)的識別提供了更為方便的數(shù)據(jù)源,特別是近年來近地低空無人機(jī)技術(shù)快速發(fā)展,能通過無人機(jī)搭載不同傳感器獲得地表森林植被的高空間分辨率和高光譜分辨率的影像,為實現(xiàn)森林類型/樹種(組)的識別提供了可能。
遙感技術(shù)的快速發(fā)展為森林樹種識別提供了諸多技術(shù)手段。遙感以其宏觀性、現(xiàn)勢性、周期性等特點(diǎn),為大范圍森林資源信息的及時、準(zhǔn)確、高效地獲取提供了有利條件,已被廣泛應(yīng)用于森林類型識別和信息提取研究。遙感技術(shù)的發(fā)展和成熟使得影像的空間分辨率和光譜分辨率不斷提高,多時相、多尺度、多源的遙感數(shù)據(jù)更加開源,使用遙感數(shù)據(jù)應(yīng)用于森林樹種的分類識別具有更廣的發(fā)展空間。根據(jù)傳感器類型的不同,可將遙感數(shù)據(jù)劃分為可見光、多光譜、高光譜、激光雷達(dá)等多種數(shù)據(jù)源,國內(nèi)外諸多學(xué)者將遙感技術(shù)應(yīng)用于森林樹種識別中,取得了階段性成果。
可見光(visible spectral)光譜段(0.38~0.76 μm)是最早用來進(jìn)行遙感觀測的波段,可見光遙感數(shù)據(jù)一般有紅、綠、藍(lán)3個波段。近年來,近地低空 無人機(jī)平臺的快速發(fā)展以及數(shù)碼相機(jī)性能的不斷提高,使得高空間分辨率的無人機(jī)可見光數(shù)據(jù)獲取更加便捷[3]。利用可見光數(shù)據(jù)空間分辨率高,能較好的表征森林植被的冠層信息的特點(diǎn),已有不少學(xué)者利用無人機(jī)采集的高分辨率可見光圖像對森林樹種的分類識別進(jìn)行了探索。A.Chenari等[4]用無人機(jī)拍攝的70 m航高可見光數(shù)據(jù),基于單木尺度對低郁閉度森林進(jìn)行樹種分類,總體精度達(dá)90%。滕文秀等[5]利用無人機(jī)拍攝的200 m相對航高的可見光數(shù)據(jù),結(jié)合深度遷移學(xué)習(xí)的方法,對東臺林場的4個優(yōu)勢樹種進(jìn)行分類制圖,精度達(dá)96%。無人機(jī)可見光數(shù)據(jù)雖然包含的光譜信息較少,但因其具有獲取方便、空間分辨率高等特點(diǎn),現(xiàn)已逐步成為遙感精細(xì)識別中應(yīng)用較多的一種數(shù)據(jù)源。
多光譜(multispectral)遙感是通過多波段探測器探測目標(biāo)地物的亮度,將地物輻射范圍較寬的連續(xù)電磁波譜分成若干光譜段,除了紅綠藍(lán)3個波段外,還包括紅外、微波等波譜范圍。其傳感器主要有多光譜掃描儀和多光譜攝像機(jī)等,每個波段單獨(dú)成為一幅灰度圖像。多光譜數(shù)據(jù)較可見光數(shù)據(jù),光譜段變多,原始的全波段或著寬波段區(qū)域的光信號被分成多個較的窄波段,這些光束分別在相應(yīng)的探測器上完成成像,從而獲得不同光譜波段的圖像,在實際樹種識別時,能更有效地提取目標(biāo)樹種特征并進(jìn)行識別。目前,多光譜數(shù)據(jù)也可由無人機(jī)搭載多光譜傳感器來獲得,相比星載影像,無人機(jī)獲取更加及時方便。R.A.Hill 等[6]用多時序的多光譜數(shù)據(jù)識別溫帶落葉林的6個典型樹種,精度可達(dá)88%。M.Immitzer等[7]借助WorldView-2數(shù)據(jù)對奧地利東部地區(qū)森林進(jìn)行分類識別,通過對比發(fā)現(xiàn),WorldView-2的新增波段比傳統(tǒng)波段在森林樹種的識別過程中更具優(yōu)勢。李若楠等[8]利用時間序列數(shù)據(jù)能夠提供不同森林類型的物候差異特征這一優(yōu)勢,基于GEE云平臺和Landsat8影像進(jìn)行香格里拉森林類型分類,精度達(dá)87.78%。
由于多光譜的波段較多,相比可見光影像,在光譜上有較強(qiáng)優(yōu)勢,在紅樹林的識別和健康監(jiān)測方面有一定的貢獻(xiàn)。L.Valderrama-Landeros等[9]將多光譜數(shù)據(jù)結(jié)合NDVI的組合算法對墨西哥太平洋沿岸地區(qū)的紅樹林進(jìn)行分類識別,并對不同健康狀況的紅樹林進(jìn)行分析,該研究為紅樹林的樹種保護(hù)提供了一定的數(shù)據(jù)支持和參考。李想等[10]通過ZY-3數(shù)據(jù),對北部灣地區(qū)的紅樹林樹種進(jìn)行識別,精度達(dá)85.9%。
高光譜(hyperspectral)遙感實際上是成像技術(shù)和多光譜技術(shù)的有效結(jié)合。在對地物目標(biāo)空間特征進(jìn)行成像時,每個空間像元都經(jīng)過色散而形成幾十個甚至幾百個較窄的波段,實現(xiàn)對地物特征形成連續(xù)的光譜覆蓋,獲取到連續(xù)光譜的影像數(shù)據(jù),相比多光譜數(shù)據(jù),高光譜數(shù)據(jù)的光譜信息更為豐富。
由于多光譜遙感的光譜分辨率低,對于在同一波長范圍內(nèi)反射率光譜曲線比較相近的樹種很難進(jìn)行精確識別,大多只能簡單進(jìn)行植被、非植被的區(qū)分,或者將森林區(qū)分為針葉林、闊葉林2類,很難精確到具體樹種的識別上[11]。高光譜數(shù)據(jù)突破了這一瓶頸,成為目前在遙感數(shù)據(jù)分類識別中應(yīng)用較多的數(shù)據(jù)源,常用的星載高光譜數(shù)據(jù)有MODIS、GF-5、HJ-1A、ASTER等,近年來還有一些搭載在無人機(jī)平臺的高光譜數(shù)據(jù)。M.P.Ferreira等[12]研究發(fā)現(xiàn),可見光、近紅外和短波紅外這幾個波段是森林樹種分類識別的重要波段。在這幾個波段范圍內(nèi),不同植被的理化特征和含水量等特征的差異能夠在光譜反射率中得以表現(xiàn),這些差異恰好為森林樹種分類識別提供了重要特征。陳爾學(xué)等[13]將EO-1 Hyperion和SPOT 5數(shù)據(jù)與外業(yè)實測數(shù)據(jù)結(jié)合,將國外發(fā)展的幾種先進(jìn)的高光譜數(shù)據(jù)統(tǒng)計模式識別方法應(yīng)用到我國的森林類型識別中,并對具體效果進(jìn)行了對比評價。王璐等[14]利用HJ-lA數(shù)據(jù),對大興安嶺塔河地區(qū)的優(yōu)勢樹種(組)進(jìn)行了識別,利用支持向量機(jī)方法分別對原始數(shù)據(jù)和5種經(jīng)變換處理后的數(shù)據(jù)進(jìn)行識別,總體精度均超過84.7%,Kappa系數(shù)超過0.715。M.Dalponte等[15]在利用高光譜數(shù)據(jù)對意大利曼圖亞的山地森林分類研究時發(fā)現(xiàn),對不同的森林類型應(yīng)用高光譜數(shù)據(jù)均可獲得較高精度。
高光譜數(shù)據(jù)所包含的豐富的光譜信息可用于各類植被指數(shù)的計算,用其作為特征變量應(yīng)用于森林樹種識別已取得較好效果。例如,C.Sun等[16]使用多時序的HJ-1影像,對華東的鹽沼地進(jìn)行動態(tài)監(jiān)測,研究發(fā)現(xiàn),以月NDVI時間序列為基礎(chǔ)的制圖精度與單相分類相比增加了約16%。
從遙感方式來劃分,激光雷達(dá)(light detection and ranging,LiDAR)屬于主動式遙感系統(tǒng)。它通過主動發(fā)射激光束來探測目標(biāo)的位置、速度、形狀等特征量,具有分辨率高、抗有源干擾能力強(qiáng)、低空探測性能好、獲取數(shù)據(jù)速度快、體積小質(zhì)量輕等特點(diǎn)。激光雷達(dá)數(shù)據(jù)包括星載、機(jī)載、地基、手持激光雷達(dá)數(shù)據(jù),與傳統(tǒng)的光學(xué)遙感相比,激光雷達(dá)的穿透能力強(qiáng),激光束可穿透植被間隙,生成密集的三維點(diǎn)云,提供與單木、冠型、葉片形狀、分枝方式等相關(guān)的森林垂直結(jié)構(gòu)特征[17]。在單木水平上,上述豐富的幾何特征有助于樹種的分類識別。J.J.Cao等[18]利用全波形LiDAR數(shù)據(jù)對亞熱帶森林樹進(jìn)行樹種分類,結(jié)果表明6類樹種的總體分類精度為68.60%,4類樹種為75.80%,而針葉林和闊葉林2類為86.20%。盧曉藝[19]利用地面LiDAR數(shù)據(jù),以水杉(Metasequoiaglyptostroboides)、棕櫚(Trachycarpusfortunei)和橡膠(Heveabrasiliensis)等5類樹種為研究對象,進(jìn)行單株分離和識別,取得較好結(jié)果。陳向宇等[20]利用LiDAR點(diǎn)云數(shù)據(jù)提供的單木結(jié)構(gòu)、紋理特征和冠型結(jié)構(gòu)特征,按照不同的組合方式對森林樹種進(jìn)行識別,精度達(dá)85%。從上述研究中可以得知,LiDAR數(shù)據(jù)與在森林樹種識別上有較大優(yōu)勢。
上述學(xué)者的研究均表明,LiDAR數(shù)據(jù)可以有效地提高森林樹種識別的精度。除了作為單一數(shù)據(jù)源進(jìn)行分類識別,激光雷達(dá)亦可作為一種輔助數(shù)據(jù)結(jié)合可將光、多光譜、高光譜和地面實測數(shù)據(jù)等提高森林樹種的識別精度。
除上述4種常用的數(shù)據(jù)源外,中紅外(mid-infrared,MIR)、熱紅外(thermalinfrared,TIR)、合成孔徑雷達(dá)(synthetic aperture radar,SAR)等數(shù)據(jù)亦被用于森林樹種的識別。
不同樹種葉片表層組織的化學(xué)成分不同,這些特征差異在熱紅外光譜中表現(xiàn)得更為明顯。因此,在對光譜信息高度相似,僅憑可見光、近紅外和短波紅外還難以區(qū)分的樹種識別時,就可用中紅外和熱紅外作為補(bǔ)充識別波段,來輔助樹種識別。S.Ullah等[21]通過對不同闊葉樹種葉片的中紅外和熱紅外光譜進(jìn)行分析,發(fā)現(xiàn)不同樹種的光譜信息有較為明顯差異。Da Luz等[22]通過比較5種不同樹冠部分的熱紅外光譜,并在單木個體水平上對樹種進(jìn)行識別,取得了較好結(jié)果。
合成孔徑雷達(dá)和激光雷達(dá)一樣,也具有較強(qiáng)的穿透力,分辨率高,不受氣象條件限制,能夠全天時全天候進(jìn)行對地觀測。目前,合成孔徑雷達(dá)技術(shù)已相對成熟,不同系統(tǒng)的頻率、波長、觀測角度、空間分辨率等參數(shù)會直接影響SAR數(shù)據(jù)在森林類型/樹種(組)識別分類上的應(yīng)用能力[23]。SAR數(shù)據(jù)用于樹種識別主要與林木的冠層結(jié)構(gòu)和林木含水量有關(guān),樹木的含水量、葉片的表面水分會通過影響介電常數(shù),從而影響合成孔徑雷達(dá)的信號反射,進(jìn)而影響數(shù)據(jù)精度。C.Dickinson等[24]研究發(fā)現(xiàn)利用SAR數(shù)據(jù)進(jìn)行樹種識別精度較高,且短波SAR數(shù)據(jù)比長波SAR數(shù)據(jù)在樹種識別方面更具應(yīng)用潛力。
上述多種遙感數(shù)據(jù)既可以單獨(dú)用來進(jìn)行森林樹種識別,亦可進(jìn)行優(yōu)勢互補(bǔ),輔助結(jié)合應(yīng)用,以提高樹種分類識別的精度。
Yu等[25]在對芬蘭南部森林進(jìn)行分類時發(fā)現(xiàn),多源數(shù)據(jù)結(jié)合的精度比使用單一數(shù)據(jù)的分類精度要高。LiDAR數(shù)據(jù)蘊(yùn)含的林分垂直結(jié)構(gòu)信息豐富,與表征冠層水平方向信息的二維數(shù)據(jù)融合后,能夠有效提高分類精度,使得森林樹種的高效、精細(xì)識別成為可能。Shi等[26]將多光譜和LiDAR結(jié)合用于溫帶樹種分類,結(jié)果表明紋理特征與LiDAR三維結(jié)構(gòu)特征結(jié)合用于樹種分類,精度顯著提高。張大力等[27]將多光譜的光譜和紋理特征、LiDAR數(shù)據(jù)的樹冠大小和高度強(qiáng)度變量結(jié)合用于單木樹種分類,結(jié)果表明光譜特征和LiDAR的三維結(jié)構(gòu)特征有效結(jié)合能夠提高分類精度。毛學(xué)剛等[28]將QuickBird多光譜影像和SAR數(shù)據(jù)協(xié)同進(jìn)行林分類型分類,發(fā)現(xiàn)多尺度多特征組合進(jìn)行林分類型分類優(yōu)勢明顯。
高光譜數(shù)據(jù)和LiDAR數(shù)據(jù)的有效結(jié)合在樹種識別中應(yīng)用較為廣泛。Alonzo等[29]利用LiDAR數(shù)據(jù)的冠層信息與高光譜融合,基于冠層尺度對美國圣巴巴拉、加利福尼亞等地區(qū)的29個常見樹種進(jìn)行分類識別,研究結(jié)果表明2種數(shù)據(jù)融合后,精度提高了4.2%。J.B.Feret等[30]、M.Dalponte等[31]、Liu等[32]和陶江玥等[33]將高光譜數(shù)據(jù)和LiDAR數(shù)據(jù)結(jié)合進(jìn)行樹種識別,發(fā)現(xiàn)2種數(shù)據(jù)結(jié)合的精度高于僅使用單一數(shù)據(jù)源的精度。劉怡君等[34]將機(jī)載高光譜數(shù)據(jù)和LiDAR數(shù)據(jù)融合,對普洱山區(qū)的森林樹種進(jìn)行分類,發(fā)現(xiàn)多源數(shù)據(jù)結(jié)合在山區(qū)森林樹種分類中更具可行性。
近年來隨著無人機(jī)技術(shù)的發(fā)展,無人機(jī)多源遙感應(yīng)用也在逐漸增多。N.Olli等[35]基于無人拍攝的83~94 m航高RGB圖像和高光譜影像,分析多源數(shù)據(jù)結(jié)合在北方森林單木檢測和樹種分類中的性能,精度均達(dá)90%以上。Tuominen等[36]利用無人機(jī)獲取70~120 m相對航高的高光譜和LiDAR數(shù)據(jù),兩者結(jié)合對樹種進(jìn)行分類,發(fā)現(xiàn)LiDAR的3D特征和高光譜VNIR、SWIR波段的組合比其他單獨(dú)的特征的分類結(jié)果表現(xiàn)得更好。陳向宇[37]利用無人機(jī)航拍的可見光和LiDAR數(shù)據(jù)進(jìn)行超像素分割后進(jìn)行樹種識別,5類樹種的識別精度達(dá)85%。楊禮[38]利用230 m航高拍攝的無人機(jī)高光譜和SFM點(diǎn)云數(shù)據(jù)在最小噪聲分離基礎(chǔ)上,構(gòu)建了基于光譜角匹配方法對單木樹種進(jìn)行識別。Effiom[39]研究發(fā)現(xiàn),無人機(jī)可見光和多光譜數(shù)據(jù)結(jié)合在樹種識別、模擬胸徑和碳儲量反演方面有較強(qiáng)潛力。
目前,基于遙感數(shù)據(jù)的樹種識別隨著數(shù)據(jù)源的不斷豐富和影像分辨率的提高,正在向高精度的單木樹種識別方向發(fā)展?;谶b感數(shù)據(jù)的單木樹種識別主要包括數(shù)據(jù)獲取、單木分割、特征提取和篩選、執(zhí)行分類、精度檢驗5個步驟[40](圖1)。
圖1 基于遙感數(shù)據(jù)的單木樹種識別主要過程
數(shù)據(jù)獲取包括遙感數(shù)據(jù)和野外地面調(diào)查數(shù)據(jù)2種,遙感數(shù)據(jù)除了傳統(tǒng)星載數(shù)據(jù)外,無人機(jī)遙感數(shù)據(jù)和地基數(shù)據(jù)應(yīng)用于森林資源信息提取也已經(jīng)為一種趨勢。地面調(diào)查數(shù)據(jù)通常是每木調(diào)查和森林生境因子調(diào)查,作為輔助因子用于樹種識別和驗證。
單木分割是進(jìn)行基于單木尺度樹種分類識別的前提,分割結(jié)果將直接影響樹種分類識別精度,目前所用的主要分割方法有基于點(diǎn)云分割、多尺度分割、分水嶺算法分割、區(qū)域增長結(jié)合閾值判斷的方法和局部最大值法等。多尺度分割的效果主要受分割尺度、形狀指數(shù)和緊致度、波段權(quán)重4個參數(shù)控制,分割耗時且受人為判斷的主觀影響較大,是利用光學(xué)遙感進(jìn)行樹種識別的研究中應(yīng)用較多的單木分割方法。分水嶺分割是一種基于拓?fù)淅碚摰臄?shù)學(xué)形態(tài)學(xué)的分割方法,李丹等[41]研究得出基于標(biāo)記的分水嶺分割算法能夠解決單木樹冠過分割難題。區(qū)域增長結(jié)合閾值判斷的方法,充分利用樹頂之間存在的距離,假定最高點(diǎn)為樹高點(diǎn),從最高點(diǎn)進(jìn)行區(qū)域增長,分割出單棵樹,以此迭代,直到完成所有單木分割。何藝等[42]對無人機(jī)可見光影像分別采用局部最大值法和多尺度分割法進(jìn)行分割,結(jié)果表明,局部最大值法在針葉林樣地分割中更具優(yōu)勢,而多尺度分割算法則更適用于闊葉林樣地的分割。
為達(dá)到分析和理解影像的目的,通過標(biāo)記及統(tǒng)計量定量化描述影像性質(zhì)的過程稱為特征提取。諸多研究結(jié)果表明,在森林樹種的識別時納入相應(yīng)的光譜特征及其衍生信息、紋理信息、幾何信息與地形因子等能夠有效提高分類識別的精度。紋理特征反映的是與圖像色調(diào)變化有關(guān)的局部空間信息,主要包括林木的冠形和大小、莖的分枝方式、林分郁閉度、葉片的形狀和密度等。但是林木在不同時期會因病蟲害、氣候和土壤等不同因素而呈現(xiàn)出不同的紋理信息特征,有效結(jié)合物候特征和紋理特征能夠提高樹種分類精度,同時也能增強(qiáng)對“異物同譜”和“同物異譜”現(xiàn)象的區(qū)分。
特征提取和特征選擇是目標(biāo)分類識別中一個至關(guān)重要的過程,亦是分類識別的一個必要條件。諸多特征變量及其組合為分類識別提供了一定的前提條件,但過多的特征變量構(gòu)成的超維特征空間常面臨參考數(shù)據(jù)集過小的問題。當(dāng)樣本的數(shù)量有限時,會出現(xiàn)分類的精度隨特征維數(shù)的上升而降低的趨勢,為了避免因樣本數(shù)量少而導(dǎo)致額過擬合問題需要進(jìn)行特征選擇。常用的特征選擇方法有隨機(jī)森林、主成分分析、最小噪聲分離、逐步回歸和相關(guān)性特征選擇等。
已有研究證明,特征選擇對減少特征冗余、提高分類精度具有顯著效果,特征提取的優(yōu)劣直接影響到識別分類的效果,因此選擇合適的特征對于目標(biāo)的分類識別尤為重要[43]。朱江濤等[44]發(fā)現(xiàn)基于Adaboost進(jìn)行特征選擇能夠依據(jù)特征重要度,進(jìn)一步選出有利于分類的特征構(gòu)成子集。董彥芳等[45]利用主成分分析法對高光譜和機(jī)載LiDAR數(shù)據(jù)進(jìn)行去噪和降維處理,采用面向?qū)ο蟮姆椒ㄟM(jìn)行城市典型地物的提取。林志瑋等[46]基于無人機(jī)光學(xué)影像,通Gabor過濾器提取森林植被紋理信息,結(jié)合隨機(jī)森林算法建立相應(yīng)的識別模型,為植被識別提出了一種新方法。
基于遙感數(shù)據(jù)的森林類型/樹種(組)的分類識別方法與數(shù)字圖像處理技術(shù)和計算機(jī)數(shù)據(jù)處理能力的不斷發(fā)展提高有密切聯(lián)系。早期的分類識別中,基于像元的監(jiān)督和非監(jiān)督分類占主導(dǎo)地位,k均值聚類算法、最大似然分類法、k-最近鄰分類法等應(yīng)用較多,隨著深度學(xué)習(xí)技術(shù)的進(jìn)步,各種機(jī)器學(xué)習(xí)的方法正不斷發(fā)展為森林類型/樹種(組)的分類識別提供了一種新的范式,如支持向量機(jī)、隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)等,正逐漸取傳統(tǒng)分類算法應(yīng)用于森林樹種的分類識別,更多例子見表1。
表1 常用分類方法與數(shù)據(jù)源對照
2.4.1 傳統(tǒng)方法 最大似然分類法(maximum likelihood classifiers,MLC),根據(jù)先驗知識及貝葉斯理論,選擇感興趣區(qū)并計算分類函數(shù),樣本歸屬于函數(shù)概率值最大的類別,具有操作簡單、方便實施、適于各種估計問題、樣本容量較大時幾乎無偏差等特點(diǎn)。支持向量機(jī)(support vector machine,SVM)是一種非參數(shù)監(jiān)督分類器,能將非遙感變量納入分類中,可解決樣本量小、高維度問題,提高泛化能力,具有較強(qiáng)的魯棒性和抗噪能力,更適用于高分辨率影像[47]。但在分類時需對多類支持向量機(jī)進(jìn)行優(yōu)化,訓(xùn)練計算成本、算法復(fù)雜度較高,應(yīng)用核函數(shù)時參數(shù)選擇復(fù)雜。謝珠利[48]通過對樹種分類研究得出,當(dāng)僅使用光譜特征作為變量時,最大似然分類方法比機(jī)器學(xué)習(xí)方法所取得的總體精度高;當(dāng)使用多源特征變量時,機(jī)器學(xué)習(xí)算法的總體精度要高于最大似然分類方法。綜合眾多研究中發(fā)現(xiàn),最大似然分類方法雖然取得了較好的結(jié)果,但也會存在小樣本數(shù)據(jù)有偏差、對輸入變量的個數(shù)比較敏感、分類耗時較長、訓(xùn)練樣本數(shù)量需大于波段數(shù)等缺點(diǎn),因此針對不同的數(shù)據(jù)選擇合適的分類方法尤為重要。
除最大似然法和支持向量機(jī)之外,隨機(jī)森林和決策樹也是應(yīng)用較多的分類算法。隨機(jī)森林分類器有對輸入變量個數(shù)不敏感、處理高維數(shù)據(jù)且無需特征選擇、能較好泛化和抗過擬合能力、訓(xùn)練速度快等特點(diǎn),在特征篩選中應(yīng)用較為廣泛[49]。決策樹分類算法具有靈活性強(qiáng)、運(yùn)算高效等優(yōu)點(diǎn),Zhang等[50]結(jié)合遙感影像與地理信息,采用決策樹算法對6種森林樹種進(jìn)行分類,最高精度達(dá)86%。孫小添等[51]基于MODIS數(shù)據(jù)利用決策樹進(jìn)行森林類型識別,精度達(dá)80%以上。陳明健等[52]通過提取葉片的紋理和傳統(tǒng)形狀特征,采用k-最近鄰分類器、距離矩陣和角點(diǎn)矩陣相結(jié)合的方法進(jìn)行樹種的精確識別,取得較好成果。
還有一些學(xué)者建立相關(guān)遙感模型來進(jìn)行森林類型/樹種(組)的識別,通過基于高光譜數(shù)據(jù),利用線性分離模型對復(fù)雜混交林落葉松林型中的森林樹種進(jìn)行識別,并與航空高光譜數(shù)據(jù)的識別結(jié)果進(jìn)行對比分析,結(jié)果較好[53]。
2.4.2 深度學(xué)習(xí)方法 近年來,模式識別和數(shù)字圖像處理技術(shù)的不斷發(fā)展,以及計算機(jī)數(shù)據(jù)處理能力的提高,使得圖像的模式識別技術(shù)開始被廣泛應(yīng)用于林業(yè)遙感領(lǐng)域,特別是將深度學(xué)習(xí)方法應(yīng)用于樹種識別已成為一種趨勢。
從諸多的研究中可以得知,分類器對海量數(shù)據(jù)的處理能力是對遙感影像進(jìn)行模式識別的重要因素之一,海量數(shù)據(jù)信息維度高,淺層的學(xué)習(xí)模型多處于欠擬合狀態(tài),很難將海量數(shù)據(jù)豐富的特征結(jié)構(gòu)得以充分的利用與表達(dá)[54]。目前,深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的理論和方法之一,不僅能夠從原始圖像中抽取不同層次的特征圖,通過低層特征抽象得到高層特征信息,來表達(dá)數(shù)據(jù)的復(fù)雜關(guān)系,而且還能實現(xiàn)影像對象特征的自動提取和選擇,具有強(qiáng)大的特征表達(dá)能力和容錯能力,因而深度學(xué)習(xí)的方法多被應(yīng)用到海量數(shù)據(jù)的處理中[55],為解決影像分類識別提供新思路。
深度置信網(wǎng)(deep belief network,DBN)和卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)模型是國內(nèi)外研究中常用的幾種深度學(xué)習(xí)模型,在這些模型基礎(chǔ)上,經(jīng)過諸多學(xué)者的研究發(fā)展出了Alex Net、VGG Net、Google Net和Res Net等深度神經(jīng)網(wǎng)絡(luò)模型[56]。隨著這些深度學(xué)習(xí)模型在計算機(jī)視覺領(lǐng)域逐漸取得成功并應(yīng)用于遙感領(lǐng)域,特別是卷積神經(jīng)網(wǎng)絡(luò),在樹種識別上已取得一定的研究成果。
卷積神經(jīng)網(wǎng)絡(luò)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一,通過卷積運(yùn)算可減少深層的網(wǎng)絡(luò)占內(nèi)存的容量,能夠高效表示圖像區(qū)域特征,從而提取到更豐富的信息,同時亦能減少網(wǎng)絡(luò)參數(shù)格式,避免過擬合問題。M.Carpentier等[57]在大數(shù)據(jù)集的條件下訓(xùn)練關(guān)于樹干的網(wǎng)絡(luò)模型,將其建立的包含2萬多張樹干圖片的數(shù)據(jù)庫,在Res Net模型上進(jìn)行訓(xùn)練,識別精度高達(dá)93.88%。趙鵬超等[58]用卷積神經(jīng)網(wǎng)絡(luò)對葉片進(jìn)行分類識別,最終識別率達(dá)95%。孫俊等[59]通過改進(jìn)傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)模型,有效改善了模型訓(xùn)練時間長、參數(shù)龐大的問題,應(yīng)用于實踐時對病害葉片識別的準(zhǔn)確率達(dá)99.56%。
通過樹干、樹葉、樹皮等局部照片建立識別模型準(zhǔn)確率較高,但在現(xiàn)實條件下,大量數(shù)據(jù)收集難度大,耗時費(fèi)力,且不便于大面積的森林樹種識別。無人機(jī)航拍影像具有清晰度高、現(xiàn)勢性強(qiáng)等優(yōu)勢,更適用于森林資源調(diào)查和信息提取?;跓o人機(jī)遙感的森林資源調(diào)查和信息提取研究已成為一種新趨勢。但是就目前的研究看來,深度學(xué)習(xí)的方法應(yīng)用于遙感影像數(shù)據(jù)時還存在不少難點(diǎn)。首先體現(xiàn)在標(biāo)記數(shù)據(jù)集的獲取方面,目前,基于深度學(xué)習(xí)的圖像分類主要是監(jiān)督分類的方法,如果需要進(jìn)行系統(tǒng)假設(shè)學(xué)習(xí),則對與該問題有關(guān)的標(biāo)記樣本需求量大,這將耗費(fèi)大量時間。目前已公開可獲取的標(biāo)記數(shù)據(jù)集還無法滿足相對復(fù)雜的分類任務(wù),在獲取的數(shù)據(jù)不足時,就需要降低模型的深度,以此適應(yīng)小規(guī)模的數(shù)據(jù)集。這樣一來,在處理復(fù)雜分類時,在特征學(xué)習(xí)過程中就需要更多的神經(jīng)元來完成,神經(jīng)元數(shù)目的增加的情況下,計算單元呈現(xiàn)出指數(shù)增長趨勢,小尺度的數(shù)據(jù)集會導(dǎo)致深度模型過擬合和模型泛化能力差等問題。其次是遙感影像場景的復(fù)雜性導(dǎo)致應(yīng)用能力有待提升。與一般拍攝的照片相比,遙感影像的來源廣泛、覆蓋區(qū)域廣、時間和季節(jié)跨度大等特點(diǎn),使得在分類時類內(nèi)特征差異變大,類間差異趨于一致,深度特征學(xué)習(xí)難度增加。除此之外,深度學(xué)習(xí)的模型設(shè)計、選擇也是深度學(xué)習(xí)在樹種識別應(yīng)用中的一個難點(diǎn)。選擇或者設(shè)計一個適用于影像分類的模型結(jié)構(gòu)是提高分類識別效率和精度的關(guān)鍵。目前的研究中,將深度學(xué)習(xí)方法應(yīng)用于遙感影像的分類識別大部分都是采用現(xiàn)有的或是比較成熟的模型,而這些模型在設(shè)計時,大多是解決自然圖像集的分類識別任務(wù),不一定能完全適用于當(dāng)前的高空間分辨率和高光譜分辨率的分類的場景。
雖然深度學(xué)習(xí)的方法在遙感影像的分類識別中存在一些難點(diǎn),但經(jīng)過不少學(xué)者的努力,還是取得了成就。T.M.Miyoshi等[60]利用無人機(jī)高光譜影像結(jié)合深度神經(jīng)網(wǎng)絡(luò)方法進(jìn)行單木樹種識別,結(jié)果證明該方法在復(fù)雜森林中單木識別達(dá)到了較為先進(jìn)的水平。栗旭升等[61]通過對亞熱帶森林樹種的識別時發(fā)現(xiàn),三維卷積神經(jīng)網(wǎng)絡(luò)能夠提取高維數(shù)據(jù)的立體結(jié)構(gòu),其改進(jìn)后能減少網(wǎng)絡(luò)深度帶來的誤差,降低退化現(xiàn)象造成的影響。隨著網(wǎng)絡(luò)層數(shù)的增加,雖然分類效果有一定上升趨勢,但梯度異?,F(xiàn)象亦將愈發(fā)嚴(yán)重。為解決此問題,He等[62]以恒等映射為基礎(chǔ),構(gòu)建Residual block模型,通過梯度反向傳播來緩解梯度不正常的現(xiàn)象。目前在神經(jīng)網(wǎng)絡(luò)在樹種識別方面的應(yīng)用正在不斷普及發(fā)展,越來越多的改進(jìn)方法被提出并取得一定成就。
分類結(jié)束后,需對分類識別結(jié)果做出評價,大部分研究均結(jié)合地面實測數(shù)據(jù),采用分層隨機(jī)抽樣產(chǎn)生獨(dú)立檢驗樣本,通過混淆矩陣或交叉驗證計算出的4個參數(shù)(總體精度、生產(chǎn)者精度、用戶精度、Kappa系數(shù))評價分類識別精度。綜合諸多研究可知,通常分類精度會隨著樹種的增多而降低,且錯分和漏分的概率越大,因此不能僅憑分類精度的高低來判斷一種分類算法的優(yōu)劣。
目前,利用遙感數(shù)據(jù)進(jìn)行森林樹種識別已經(jīng)成為林業(yè)遙感的一個研究熱點(diǎn),但仍然面臨以下幾方面挑戰(zhàn)。
我國森林資源豐富、分布廣泛,特別是在熱帶亞熱帶地區(qū),物種豐富度更高,林分的密度較大,冠層結(jié)構(gòu)復(fù)雜,很難進(jìn)行單木分割,且同一科屬的樹種間相似度較高,增加了樹種識別的難度。因此,可以考慮通過整合多源遙感數(shù)據(jù)和多時相數(shù)據(jù)來補(bǔ)充單一遙感數(shù)據(jù)信息獲取的局限性,例如利用高分辨率可見光影像進(jìn)行單木分割,用LiDAR三維結(jié)構(gòu)特征輔助識別。
近年來,除傳統(tǒng)的衛(wèi)星遙感數(shù)據(jù),無人機(jī)遙感數(shù)據(jù)用于樹種識別也比較熱門,但是從眾多研究中看出,他們利用的影像航拍高度較為單一,多采用一個高度來進(jìn)行研究,沒有形成一個可供參考的拍攝高度范圍。且基本都是以地面為基準(zhǔn)的絕對高度,在地形起伏較大的地區(qū),容易造成影像的幾何變形,閃花和波紋現(xiàn)象嚴(yán)重以及同一幅影像的分辨率不一致的問題,從而影響分類結(jié)果。針對這一問題,在今后的研究中,可以考慮以地面為基準(zhǔn),以相對高度設(shè)定航高,針對同一地區(qū)以不同航高進(jìn)行拍攝獲取影像,以建立可供參考的高度與樹種識別精度的關(guān)系。
遙感技術(shù)的不斷發(fā)展使得數(shù)據(jù)的獲取更為方便快捷,可應(yīng)用性得到提高,將不同類型的遙感數(shù)據(jù)結(jié)合已成為普遍發(fā)展趨勢。傳統(tǒng)光學(xué)遙感數(shù)據(jù)、激光雷達(dá)數(shù)據(jù)、地面實測數(shù)據(jù)等數(shù)據(jù)源的有效結(jié)合可實現(xiàn)優(yōu)勢互補(bǔ),提高分類識別的精度。但是,在不同數(shù)據(jù)源的融合過程中可能存在數(shù)據(jù)結(jié)構(gòu)、精度等不匹配問題;其次,對不同數(shù)據(jù)源特定波段特征信息的挖掘,能夠增加復(fù)雜地區(qū)樹種識別的可能性,但目前的研究中,對這些特定波段的信息挖掘還相對較少,多源遙感數(shù)據(jù)的獲取和使用成本仍較高,對此,近地低空無人機(jī)遙感平臺的快速發(fā)展為基于遙感數(shù)據(jù)的森林類型/樹種(組)的識別提供了新的契機(jī)。
在樹種識別中,紋理特征、幾何特征、光譜特征、以及其他數(shù)據(jù)源的特征等的提取和選擇是一個重要的問題,樣本的特征信息很大程度上決定了識別的準(zhǔn)確程度。研究表明,在進(jìn)行分類識別時,大量的數(shù)據(jù)特征可能會出現(xiàn)維數(shù)災(zāi)難的情況,造成分類精度下降的情況。在提取出各種特征后需要對海量的特征進(jìn)行篩選和組合,獲得對物種識別貢獻(xiàn)較大的特征。常用的特征選擇的方法,如主成分分析法、遺傳算法和隨機(jī)森林算法等已經(jīng)相對成熟,基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別方法能夠自主學(xué)習(xí)圖像中的各個特征,使得效率大幅提高,且最終分類效果往往能達(dá)到傳統(tǒng)的機(jī)器學(xué)習(xí)算法的效果甚至在有的研究數(shù)據(jù)上更是能夠超過傳統(tǒng)的機(jī)器學(xué)習(xí)方法[63]。
遙感技術(shù)之所以能夠在森林類型/樹種(組)的識別方面能夠快速發(fā)展,主要是數(shù)字圖像處理技術(shù)和機(jī)器學(xué)習(xí)等各個領(lǐng)域的不斷發(fā)展進(jìn)步,但目前機(jī)器學(xué)習(xí)還不是很成熟,海量遙感數(shù)據(jù)的處理需要強(qiáng)大的技術(shù)支持,分類識別算法技術(shù)的不成熟、普適性不高極大限制了分類識別精度,分類算法及模型研建也需要先進(jìn)的技術(shù)支持。
綜合諸多國內(nèi)外學(xué)者的研究結(jié)果來看,隨著航天遙感技術(shù)和近地低空遙感技術(shù)的發(fā)展以及計算能力的不斷增強(qiáng)和新的計算方法不斷發(fā)展,結(jié)合特征挖掘、核變換、多分類器集合、深度學(xué)習(xí)等技術(shù)的發(fā)展改進(jìn),利用遙感數(shù)據(jù)進(jìn)行自動化森林樹種識別技術(shù)能提高森林資源調(diào)查的工作效率,并有效降低調(diào)查成本。衛(wèi)星遙感應(yīng)用于樹種識別已取得一定的成果,但近地低空無人機(jī)在森林類型/樹種(組)的識別的研究還有很大的發(fā)展空間,無人機(jī)影像處理技術(shù)和適用于無人機(jī)模式識別的方法的提出和解決將會是今后的一個研究熱點(diǎn)。未來以遙感數(shù)據(jù)為基礎(chǔ)的森林類型/樹種(組)的快速高效識別將會向多模式方向發(fā)展。