滕文秀,王 妮,施慧慧,許振宇
(1. 南京林業(yè)大學(xué)林學(xué)院,江蘇 南京 210037; 2. 滁州學(xué)院地理信息與旅游學(xué)院,安徽 滁州 239000; 3. 安徽省地理信息智能感知與服務(wù)工程實(shí)驗(yàn)室,安徽 滁州 239000)
樹種分類對(duì)森林資源管理和森林資源監(jiān)測(cè)具有重要意義[1]。傳統(tǒng)樹種調(diào)查方法主要依賴于實(shí)地調(diào)查或利用大比例尺航片進(jìn)行人工判讀[2],該方法成本高且效率低下。高分辨率遙感圖像具有豐富的光譜和空間信息,為樹種分類提供了一種高效的方式?,F(xiàn)有的樹種分類方法主要采用手工提取特征結(jié)合傳統(tǒng)機(jī)器學(xué)習(xí)的方法。文獻(xiàn)[3]綜合利用光譜、紋理、植被指數(shù)、時(shí)相、地形等特征,在不同層次上采用適用于該層的支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、多分類器組合(multiple classifier combination,MCC)等分類方法。文獻(xiàn)[4]利用光譜和紋理特征結(jié)合隨機(jī)森林(random forest,RF)和支持向量機(jī)(support vector machine,SVM)進(jìn)行樹種分類。文獻(xiàn)[5]探討不同移動(dòng)窗口大小對(duì)紋理特征的影響,選擇合適的窗口大小及紋理因子組合提高了樹種分類精度。上述方法取得了較好的分類結(jié)果,但手工提取特征的方式自動(dòng)化程度低,而且這些特征是針對(duì)特定研究區(qū)特定任務(wù)設(shè)計(jì)的,如果使用在其他研究區(qū)其他任務(wù)上錯(cuò)誤率可能顯著提高,這種特征具有不可遷移性。深度學(xué)習(xí)[6]是人工智能的重要進(jìn)展之一,它顛覆了傳統(tǒng)算法的設(shè)計(jì)思路,能夠自動(dòng)從數(shù)據(jù)中學(xué)習(xí)特征,避免了傳統(tǒng)算法中人工設(shè)計(jì)、提取特征的復(fù)雜性和局限性,在沒有人為干預(yù)的情況下,具有極大的特征學(xué)習(xí)潛力,特別是深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,CNN)[7]已經(jīng)被廣泛用于遙感圖像的分類、提取、識(shí)別和檢索,基本全面超越了傳統(tǒng)方法[8]。為此本文將深度學(xué)習(xí)技術(shù)和高分影像樹種分類相結(jié)合,提出一種結(jié)合面向?qū)ο蠛蜕疃忍卣鞯母叻钟跋駱浞N分類方法,實(shí)現(xiàn)端到端的樹種分類,可以為森林資源管理和監(jiān)測(cè)提供技術(shù)支持。
皇甫山國(guó)家森林公園位于安徽省滁州市,地處北亞熱帶溫潤(rùn)性季風(fēng)氣候區(qū),海拔399.2 m,占地面積35 533 km2,是皖東地區(qū)保存最完整、面積最大的原始次生林國(guó)家森林公園。保護(hù)區(qū)森林覆蓋率達(dá)到96%,區(qū)內(nèi)建設(shè)有皇甫林場(chǎng),以人工林著稱,主要分布具備根系發(fā)達(dá)、樹冠濃密、落葉豐富易分解、生長(zhǎng)迅速、郁閉緊密等特點(diǎn)的樹種,在江淮流域地區(qū)植被類型有一定的代表性。其中,以松(pinus)和麻櫟(quercus acutissima)為主,占總株數(shù)的60%左右,其他數(shù)量較多的樹種還有刺槐(robinia pseucdoacacia)、楊樹(populus)、柳樹(salicaceae)、楓香樹(liquidambar formosana),以及輔助經(jīng)濟(jì)樹種,如桃樹(persica)等。本文采用2017年2月QuickBird遙感影像數(shù)據(jù),像素分辨率為0.61 m,區(qū)域無(wú)云覆蓋,質(zhì)量較好,利用二類調(diào)查成果與野外調(diào)查成果驗(yàn)證樹種分類精度。
針對(duì)現(xiàn)有樹種分類方法采用人工提取特征自動(dòng)化程度低并具有不可遷移性的問題,提出了一種結(jié)合面向?qū)ο蠛蜕疃葘W(xué)習(xí)的高分影像樹種分類方法。為了獲取精確的樹種邊界,首先利用多尺度分割技術(shù)分割整幅遙感影像,并選擇訓(xùn)練樣本作為深度卷積神經(jīng)網(wǎng)絡(luò)的輸入。為了避免樣本數(shù)量少導(dǎo)致過(guò)擬合問題,采用遷移學(xué)習(xí)方法,使用ImageNet上訓(xùn)練的VGG16模型參數(shù)初始化深度卷積神經(jīng)網(wǎng)絡(luò),并利用全局平局池化壓縮參數(shù),在網(wǎng)絡(luò)最后添加1024個(gè)節(jié)點(diǎn)的全連接層和7個(gè)節(jié)點(diǎn)的Softmax分類器層,利用反向傳播和Adam優(yōu)化算法訓(xùn)練網(wǎng)絡(luò)。最后分類整幅遙感影像,生成樹種專題地圖。本文分類流程如圖1所示。
圖1 結(jié)合面向?qū)ο蠛蜕疃冗w移學(xué)習(xí)的高分影像樹種分類流程
現(xiàn)有基于卷積神經(jīng)網(wǎng)絡(luò)的遙感影像制圖方法中,滑動(dòng)窗口方法沒有考慮像素的空間和光譜相關(guān)性,生成塊狀專題地圖,地圖邊界模糊[9],而像素級(jí)別的分類效率較低,容易出現(xiàn)“椒鹽現(xiàn)象”,已經(jīng)被證明不適合高空間分辨率遙感影像制圖[10]。為了獲得更精確的樹種專題地圖,本文引入面向?qū)ο蠹夹g(shù),首先利用圖像分割技術(shù)分割整個(gè)遙感影像。圖像分割技術(shù)面向?qū)ο蠓诸惖幕A(chǔ),它在整個(gè)影像信息提取中有著非常重要的作用。多尺度分割技術(shù)[11]是指采取不同的分割尺度對(duì)不同尺度的圖像對(duì)象層次進(jìn)行分割,進(jìn)而生成一個(gè)由不同尺度數(shù)據(jù)構(gòu)成的影像層次網(wǎng)狀結(jié)構(gòu)。它采用一種自下而上的分割算法,合并異質(zhì)性閾值以內(nèi)的空間鄰近對(duì)象,逐漸合并對(duì)象由小及大,循環(huán)往復(fù),直至沒有相鄰對(duì)象小于異質(zhì)性閾值,最終結(jié)束合并。多尺度分割算法中需要設(shè)置的參數(shù)包括尺度參數(shù)、形狀因子的權(quán)重和緊致因子的權(quán)重,影像分割后的區(qū)域在光譜信息上有一定的相似性,同時(shí)也有紋理、大小或上下文之間的一致性。通常假設(shè)每個(gè)區(qū)域中的全部像素都是屬于一個(gè)類別的,但在實(shí)際應(yīng)用中很難成立,為了避免一個(gè)對(duì)象中包含多個(gè)樹種對(duì)分類產(chǎn)生影響,本文采用過(guò)分割的方式分割整幅遙感影像,確保區(qū)域內(nèi)的像素具有相同的樹種類別。本文選取最優(yōu)分割尺度為35,最優(yōu)形狀因子為0.6,緊致度為0.4。多尺度分割后選擇部分對(duì)象作為卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本。
深度卷積神經(jīng)網(wǎng)絡(luò)參數(shù)數(shù)量多,利用少量的樣本訓(xùn)練一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)會(huì)導(dǎo)致過(guò)擬合問題,為此本文引入遷移學(xué)習(xí)方法,避免過(guò)擬合問題并加速網(wǎng)絡(luò)的學(xué)習(xí)和優(yōu)化。為了避免樣本數(shù)量少導(dǎo)致過(guò)擬合問題,采用遷移學(xué)習(xí)方法,使用ImageNet[12]上訓(xùn)練的VGG16模型參數(shù)初始化深度卷積神經(jīng)網(wǎng)絡(luò),并利用全局平局池化壓縮參數(shù),在網(wǎng)絡(luò)最后添加1024個(gè)節(jié)點(diǎn)的全連接層和7個(gè)節(jié)點(diǎn)的Softmax分類器層,最后利用反向傳播和Adam優(yōu)化算法訓(xùn)練網(wǎng)絡(luò)。本文設(shè)計(jì)的高分影像樹種分類模型如圖2所示。
圖2 高分影像樹種分類模型
卷積和池化層:將大型卷積及神經(jīng)網(wǎng)絡(luò)模型VGG16去掉全連接層,利用剩余的卷積和池化層提取樹種影像的特征圖。假設(shè)輸入樹種影像為I,F(xiàn)i為卷積神經(jīng)網(wǎng)絡(luò)第i層的特征圖(F0=I),卷積和池化操作可分別表示為
Fi=f(Fi-1?Wi+bi)
(1)
Fi=subsampling(Fi-1)
(2)
式中,Wi為第i層卷積核的權(quán)值;?代表卷積核與第i-1層圖像或特征圖進(jìn)行卷積操作,卷積的輸出與第i層的偏移bi相加,最終通過(guò)非線性的激活函數(shù)f(x)得到第i層的特征圖Fi;subsampling為下采樣(池化)函數(shù),修正線性單元(Relu)作為激活函數(shù),可表示為
(3)
(4)
全連接層:經(jīng)過(guò)特征提取和全局平局池化后,將全局平局池化后的所有特征值與全連接層每個(gè)節(jié)點(diǎn)連接,VGG16包含兩個(gè)4096個(gè)節(jié)點(diǎn)的全連接層,由于本文數(shù)據(jù)量較少,為了避免過(guò)擬合問題,本文利用一個(gè)1024個(gè)節(jié)點(diǎn)的全連接層。
Softmax分類器:最后一層使用Softmax分類器,將網(wǎng)絡(luò)輸出的特征放到Softmax分類器中進(jìn)行分類,其類標(biāo)簽為y∈{1,2,…,K},K為類別標(biāo)簽數(shù)量,本文N=7,分為松樹、麻櫟、楊樹、柳樹、楓香樹、毛竹、杉木7類。
對(duì)于模型的訓(xùn)練,本文利用Adam優(yōu)化算法和反向傳播更新全連接層可訓(xùn)練參數(shù)。Adam優(yōu)化算法[14]能夠自適應(yīng)選擇每個(gè)訓(xùn)練參數(shù)的學(xué)習(xí)率,并且該算法對(duì)內(nèi)存需求較小,具體表示為
(5)
(6)
為驗(yàn)證本文方法的有效性,采用本文方法對(duì)皇甫山森林公園的QuickBird高分影像進(jìn)行樹種分類,并利用二類調(diào)查成果與野外調(diào)查成果驗(yàn)證分類精度。首先利用多尺度分割技術(shù)分割整幅遙感影像,最優(yōu)分割尺度為35,最優(yōu)形狀因子為0.6,緊致度為0.4,然后選擇訓(xùn)練樣本,將訓(xùn)練樣本從影像中裁剪下來(lái)后縮放到模型輸入大小,本文采用預(yù)訓(xùn)練模型為VGG16[15],模型輸入大小為224×224像素,對(duì)于模型的訓(xùn)練,速率衰減周期設(shè)置為100 epoch,Batch size設(shè)置為32,Adam優(yōu)化算法中初始學(xué)習(xí)速率設(shè)置為0.000 1,epsilon設(shè)置為10-8,速率衰減因子為0.9,訓(xùn)練過(guò)程中的精度和損失變化曲線如圖3所示,從圖中可看出,模型在前40個(gè)epoch精度迅速上升,損失迅速下降,在經(jīng)過(guò)40個(gè)epoch后基本穩(wěn)定,因此使用預(yù)訓(xùn)練模型初始化網(wǎng)絡(luò)參數(shù)能夠有效加快網(wǎng)絡(luò)的訓(xùn)練,避免過(guò)擬合問題。
圖3 訓(xùn)練精度及損失變化曲線
模型訓(xùn)練完成后對(duì)整幅遙感影像進(jìn)行分類,利用二類調(diào)查成果與野外調(diào)查成果驗(yàn)證分類精度。為了驗(yàn)證本文方法的有效性,本文分別用支持向量機(jī)、隨機(jī)森林及本文方法對(duì)樹種進(jìn)行分類,利用混淆矩陣、總體精度和Kappa系數(shù)進(jìn)行精度評(píng)價(jià),結(jié)果見表1,制圖結(jié)果如圖4所示。本文方法樹種分類總體精度和Kappa系數(shù)分別為78.98%和0.685 0,比支持向量機(jī)高15.63%和23.85%,比隨機(jī)森林高6.82%和13.01%,其中柳樹、麻櫟、杉木、楊樹、毛竹的分類精度都高于傳統(tǒng)淺層機(jī)器學(xué)習(xí)方法支持向量機(jī)和隨機(jī)森林,松樹和楓香樹的分類精度相比傳統(tǒng)方法精度相對(duì)較低,但都很接近。總體來(lái)看,由于深層結(jié)構(gòu)模型包含多層非線性變換,具有更強(qiáng)的表達(dá)與建模能力,能夠從樹種影像中自動(dòng)學(xué)習(xí)有效的特征表示,因此分類精度優(yōu)于傳統(tǒng)淺層機(jī)器學(xué)習(xí)方法。綜上所述,本文方法能夠有效提高高分影像樹種分類精度,而且自動(dòng)化程度更高,更具有穩(wěn)健性,是一種有效的樹種分類方法。
表1 皇甫山高分影像樹種分類精度評(píng)價(jià)
本文針對(duì)傳統(tǒng)手工提取特征方法需要專業(yè)領(lǐng)域知識(shí),提取高質(zhì)量特征困難,提出了一種結(jié)合面向?qū)ο蠛蜕疃忍卣鞯母叻钟跋駱浞N分類方法。利用面向?qū)ο蠓指罴夹g(shù)獲取樹種的精確邊界,并利用遷移學(xué)習(xí)方法,將現(xiàn)有的知識(shí)遷移到高分影像樹種分類中,避免了樹種訓(xùn)練樣本較少容易導(dǎo)致過(guò)擬合問題,實(shí)現(xiàn)了端到端的高分影像樹種分類,避免了手工提取特征的不可遷移性。為驗(yàn)證本文方法的有效性,以安徽省滁州市的皇甫山國(guó)家森林公園為研究區(qū),QuickBird高分影像作為數(shù)據(jù)源,采用本文方法進(jìn)行樹種分類。試驗(yàn)結(jié)果表明,本文方法樹種分類總體精度和Kappa系數(shù)分別為78.98%和0.685 0,在保證樹種精度的同時(shí)實(shí)現(xiàn)了端到端的樹種分類,可以為森林資源管理和監(jiān)測(cè)提供技術(shù)支持。
圖4 皇甫山樹種專題地圖