国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CART決策樹技術(shù)的林業(yè)地類遙感影像分類研究

2011-06-08 06:56:52徐軍譚瑩鄭云峰
自然保護(hù)地 2011年4期
關(guān)鍵詞:結(jié)點(diǎn)決策樹波段

徐軍 譚瑩 鄭云峰

(1浙江省森林資源監(jiān)測中心 浙江杭州 310020;2國家林業(yè)局華東林業(yè)調(diào)查規(guī)劃設(shè)計(jì)院 浙江杭州 310019)

林業(yè)資源利用是否科學(xué)合理,是生態(tài)環(huán)境保護(hù)與可持續(xù)發(fā)展的焦點(diǎn)。實(shí)現(xiàn)林業(yè)資源可持續(xù)利用,及時(shí)準(zhǔn)確地了解林業(yè)用地的時(shí)空配置狀況,是林業(yè)資源管理的重要課題。3S技術(shù)形成了新型的對地觀測系統(tǒng),為林業(yè)科學(xué)研究提供了全新的科學(xué)方法和技術(shù)手段。

由于地物類別分布方式本身的復(fù)雜性,僅利用單一分類規(guī)則對影像進(jìn)行分類,而不考慮其他構(gòu)成影像的多種因素是造成傳統(tǒng)方法不理想的原因,加上衛(wèi)星遙感光譜數(shù)據(jù)的空間分辨率不高(TM30米),因而一般帶有綜合光譜信息的特點(diǎn)(即存在混合像元),致使計(jì)算機(jī)分類面臨著諸多模糊對象。近年來,采用決策樹分類法已被應(yīng)用于許多分類問題。決策樹分類法[1,2]具有靈活、直觀、清晰、強(qiáng)健、運(yùn)算效率高等特點(diǎn),在遙感分類問題上表現(xiàn)出巨大優(yōu)勢。本次研究將利用CART決策樹算法,結(jié)合光譜信息和紋理信息進(jìn)行林業(yè)地類的分類,并把獲得的結(jié)果與傳統(tǒng)的最大似然法分類進(jìn)行比較。

1 研究區(qū)概況及數(shù)據(jù)源介紹

翁源縣位于廣東省北部,韶關(guān)市東南部,地處北緯24°07′30"~24°37′15",東經(jīng)113°39′2"~114°18′5",總面積 2217 平方公里。翁源縣屬中亞熱帶季風(fēng)氣候區(qū),四季分明,季風(fēng)氣候明顯。春季低溫寡照,夏季高溫多雨,秋季涼爽,冬季多霜,年平均氣溫為 20.6℃,年平均降雨量為1693.9毫米。翁源縣山地植被屬亞熱帶常綠季風(fēng)雨帶,由于地形、母質(zhì)和人為活動的影響,形成植被多樣性。山地植被有三種類型:草本植被、針闊葉混交林、疏林草坡。本次研究所用到的研究資料主要包括:研究區(qū)2006年Landsat5 TM 衛(wèi)星影像數(shù)據(jù)及樣地調(diào)查數(shù)據(jù)。

2 研究方法

2.1 遙感數(shù)據(jù)處理

2.1.1 TM數(shù)據(jù)預(yù)處理

輻射校正:本次研究采用的是ENVI中的Landsat TM Calibration模塊來對遙感影像進(jìn)行輻射校正,即用已經(jīng)公開的 post-launch增益和偏移,將 Landsat TM 數(shù)字值轉(zhuǎn)換成輻射或外大氣層反射。

2.1.2 遙感影像融合處理

本研究針對經(jīng)過預(yù)處理后的原始波段數(shù)據(jù),分別進(jìn)行主成分變換、基于第一主成分的IHS融合、基于第一主成分的Brovey融合以及小波融合;然后利用原始近紅外波段和紅光波段生成多種植被指數(shù):RVI、NDVI、PVI和MSAVI。由上述融合變換生成的多個(gè)光譜特征將作為后續(xù)影像分類的基礎(chǔ)。

2.1.3 遙感影像紋理提取

在本次研究中,采用基于灰度共生矩陣的紋理分析方法,采用7*7的窗口大?。ó?dāng)窗口大小設(shè)為 7*7,紋理均值和熵值逐漸趨于穩(wěn)定),針對第一主成分圖像,計(jì)算均值、方差、均勻性、對比度、相異性、熵、二階矩、相關(guān)性8個(gè)紋理測度[3]。

2.2 基于CART決策樹的影像分類

2.2.1 分類系統(tǒng)

依據(jù)本研究區(qū)林業(yè)地類,由圖結(jié)合目視解譯和實(shí)地調(diào)查,確定該研究區(qū)包含6種主要地物類型,同時(shí)結(jié)合當(dāng)?shù)氐木唧w情況和林業(yè)生產(chǎn)特點(diǎn)以及TM數(shù)據(jù)對縣(市)級資源利用的分辨能力和分類精度影響等情況,將研究區(qū)土地利用類型劃分為有林地、灌木林、疏林地、未成林造林地、苗圃地和無林地6個(gè)大類。

2.2.2 特征波段選取及訓(xùn)練區(qū)選取

(1)在本次研究中,經(jīng)過融合處理及紋理提取后共有35個(gè)波段。在進(jìn)行分類前,要對分類的波段進(jìn)行選取,選擇合適的波段組合進(jìn)行分類。本次研究中,將采用美國的查維茨(Chavez)教授等提出最優(yōu)指數(shù)公式(0IF,0ptimum Index Factor)來選取參與分類的波段[4]。0IF值越大則相應(yīng)的波段組合越優(yōu)。經(jīng)過計(jì)算排序及綜合考慮,確定最優(yōu)數(shù)據(jù)集波段為:band14(IHS1 ,即 HIS轉(zhuǎn)換所得的第一波段)、band16(IHS3,即 HIS轉(zhuǎn)換所得的第三波段)、band18(NDVI)、band20(PVI)、band29(VA,即方差)、band31(C0,即對比度)。

(2)訓(xùn)練區(qū)的選取

本次研究在訓(xùn)練區(qū)的選擇主要依據(jù)目視判讀,以及地形圖、樣地調(diào)查數(shù)據(jù)和非監(jiān)督分類結(jié)果等輔助數(shù)據(jù)。

2.2.3 CART決策樹分類

(1)CART決策樹

分類與回歸樹CART(Classification and Regression Trees)是分類數(shù)據(jù)挖掘算法的一種[5,6]。CART模型最早由Breman等人提出并已在統(tǒng)計(jì)學(xué)領(lǐng)域普遍應(yīng)用。CART是一種有監(jiān)督學(xué)習(xí)算法,即用戶在使用CART進(jìn)行預(yù)測之前,必須首先提供一個(gè)學(xué)習(xí)樣本集(Learning samples)對CART進(jìn)行構(gòu)建和評估,然后才能使用。CART使用如下結(jié)構(gòu)的學(xué)習(xí)樣本集:

其中, X1~Xm稱為屬性向量(Attribute Vectors),其屬性可以是連續(xù)的,也可以是離散的;Y稱為標(biāo)簽向量(Label Vectors),其屬性可以是連續(xù)的,也可以是離散的。當(dāng)Y是連續(xù)的數(shù)量值時(shí),稱為回歸樹;當(dāng)Y是離散值時(shí),稱為分類樹。

根據(jù)給定的樣本集L構(gòu)建分類樹由以下三步組成:

[1]使用L構(gòu)建樹maxT ,使得maxT 中每一個(gè)葉節(jié)點(diǎn)要么很?。ü?jié)點(diǎn)內(nèi)部所含樣本個(gè)數(shù)小于給定值 minN );要么是純節(jié)點(diǎn)(節(jié)點(diǎn)內(nèi)部樣本的Y屬于同一個(gè)類);要么只有惟一屬性向量作為分支選擇。

[2]使用修剪(Pruning)算法構(gòu)建一個(gè)有限的遞減(節(jié)點(diǎn)數(shù)目)有序子樹序列。

[3]使用評估(Estimate)算法從第[2]步產(chǎn)生的子樹序列中選出一棵最優(yōu)樹作為最終的決策樹。

(2)研究區(qū)CART決策樹模型的生成及判別規(guī)則的建立

利用SPSS對研究區(qū)訓(xùn)練樣本建立CART決策樹。生成決策樹模型如圖1所示,分為5層,45個(gè)結(jié)點(diǎn),圖中的1-6類分別表示無林地、有林地、未成林造林地、灌木林、疏林地、苗圃地。圖中的每一個(gè)矩形代表樹的一個(gè)結(jié)點(diǎn),其中最頂層第一個(gè)矩形是根結(jié)點(diǎn),里面包含了全部的訓(xùn)練樣本。從樹的根結(jié)點(diǎn)到任一個(gè)葉結(jié)點(diǎn)代表了一條判別規(guī)則。

圖1 CART決策樹模型示意圖

下面以圖1決策樹的部分截圖為例,能更清楚地展示其中包含的內(nèi)容。

圖2 決策樹頂部的部分截圖

圖2是圖1 CART決策樹的最頂部的一段截圖。其中Node0(結(jié)點(diǎn)的序號從0開始,按照每一層從左往右的順序依次編號)就是樹的根結(jié)點(diǎn),Node1和Node2是根結(jié)點(diǎn)的第一個(gè)分支。在每個(gè)結(jié)點(diǎn)中注明了每一個(gè)類別所包含的樣本單元數(shù)及所占的比例。樹越往下,結(jié)點(diǎn)中的樣本單元越“純”。從上圖可以看出,用來分隔第一個(gè)結(jié)點(diǎn)的波段是band16(即IHS3波段),其中灰度值小于或等于86.153650的樣本單元被分入到左結(jié)點(diǎn),而灰度值大于86.153650的被分入到右結(jié)點(diǎn)。分完后,其非純度量(Gini索引)的改變?yōu)?.118,即“純度”提高了0.118。也就是說,在所有參與分類的波段中所有潛在的分割點(diǎn)中,band16灰度值為86.153650的分割點(diǎn)能使分完后兩部分的“純度”增值最大,這也從另一個(gè)方面能說明參與分類的波段重要性的大小。在一棵樹中,如果某波段參與的分割結(jié)點(diǎn)的次數(shù)越多,則說明該波段對分類的貢獻(xiàn)越大,也就越重要。

為了能更全面的說明樹的內(nèi)容,圖3所示是圖1決策樹葉結(jié)點(diǎn)的部分截圖。其中,葉結(jié)點(diǎn) Node43和Node44由Node26分割而來,分割準(zhǔn)則為band31(C0波段)灰度值大于1.5765的分入到Node44中去,band31(C0波段)灰度值小于等于1.5765的分入到Node43中去了。在Node43中第3類也即未成林造林地所占的比例最大(為81%),因而把該葉結(jié)點(diǎn)的類別定為未成林造林地。也就是說,從根結(jié)點(diǎn)到該葉結(jié)點(diǎn)路徑中所有判別規(guī)則的交集組成了一條未成林造林地的判別準(zhǔn)則。有多少個(gè)葉結(jié)點(diǎn),就有多少條地物類型的判別準(zhǔn)則,在本研究中,針對研究區(qū)生成的決策樹共有23個(gè)葉子結(jié)點(diǎn),則對應(yīng)23條判別準(zhǔn)則。很顯然,對于每一個(gè)地物類型,會對應(yīng)多條判別準(zhǔn)則。

圖3 決策樹葉結(jié)點(diǎn)的部分截圖

生成決策樹以后,就可以通過該樹生成判別規(guī)則。對于一個(gè)未知地物類型的像元點(diǎn)(已知IHS1、IHS3、NDVI、PVI、VA、C0六個(gè)波段的灰度值),該像元點(diǎn)符合哪條判別規(guī)則,則其就判讀為那條判別規(guī)則所對應(yīng)的地物類型。然后,將生成的這些判別規(guī)則導(dǎo)入到ENVI中Decision Tree模塊中,用這些判別規(guī)則建立一棵決策樹。對該研究區(qū)遙感圖像進(jìn)行自動分類后,生成如圖4所示的分類類碼圖。

圖4 CART決策樹模型分類類碼圖

圖5 最大似然法分類類碼圖

2.3 傳統(tǒng)的最大似然法分類

最大似然法是通過求出每個(gè)像素對于各類別的歸屬概率,根據(jù)貝葉斯判別準(zhǔn)則把該像素分到歸屬概率最大的類別中的方法。運(yùn)用ENVI 中Maximum Likelihood最大似然法,實(shí)現(xiàn)研究區(qū)遙感圖像自動分類,圖5是最大似然法生成的分類類碼圖。

3 結(jié)果與分析

分類完成后,將野外調(diào)查的地面驗(yàn)證點(diǎn)疊加到具有相同投影和坐標(biāo)系統(tǒng)的分類圖上,用分類生成的地物類別與野外記錄的地物類別進(jìn)行對照,從而建立混淆矩陣并計(jì)算Kappa系數(shù)、用戶精度和生產(chǎn)者精度和總分類精度來衡量各種分類方法的分類性能,實(shí)現(xiàn)對分類結(jié)果的精度評價(jià)[7]。

分類結(jié)果的總精度是指所有類別中被正確分類的像元數(shù)之和與參加驗(yàn)證的總像元數(shù)之比,也即混淆矩陣中主對角線上元素之和與參與驗(yàn)證的總像元數(shù)之比。將每一類中被正確分類的像元數(shù)除以該類參加驗(yàn)證的總像元數(shù),結(jié)果稱為生產(chǎn)者精度,它說明指定覆蓋類型的驗(yàn)證數(shù)據(jù)被分類后其效果的好壞。用戶精度是指每一類別被正確分類的像元數(shù)目除以被分做該類的總像元數(shù)之比,它是委任誤差的測度,表明一個(gè)像元被分到指定類別的可能性。依據(jù)驗(yàn)證數(shù)據(jù),針對決策樹及最大似然法分類結(jié)果圖像分別建立下述混淆矩陣。

表1 決策樹分類的混淆矩陣

表2 最大似然法分類的混淆矩陣

傳統(tǒng)的最大似然法是建立在假定訓(xùn)練區(qū)地物的光譜特征和自然界大部分隨機(jī)現(xiàn)象一樣,近似服從正態(tài)分布,利用訓(xùn)練區(qū)可求出均值、方差以及協(xié)方差等特征參數(shù),從而求出總體的先驗(yàn)概率密度函數(shù)的基礎(chǔ)上,因此對正態(tài)分布的輸入樣本具有非常高的判別精度。決策樹分類法是以各像元的特征值為設(shè)定的基準(zhǔn)值,分層逐次進(jìn)行比較的方法。比較中所采用的特征的種類及基準(zhǔn)值是按照地面實(shí)況數(shù)據(jù)及目標(biāo)物相關(guān)的知識等做成的。CART是一種有監(jiān)督學(xué)習(xí)算法,即用戶在使用CART進(jìn)行預(yù)測之前,必須首先提供一個(gè)學(xué)習(xí)樣本集(Learning samples)對 CART進(jìn)行構(gòu)建和評估,然后才能使用。由上述兩表可知,決策樹分類的精度及Kappa系數(shù)均高于最大似然法分類??梢?,決策樹分類比起傳統(tǒng)的最大似然法分類,明顯的提高了分類精度。將兩種方法進(jìn)行對比,相對于最大似然法,決策樹的樹狀分類結(jié)構(gòu)對數(shù)據(jù)特征空間分布不需要預(yù)先假設(shè)某種參數(shù)化密度分布,所以其總體分類精度優(yōu)于傳統(tǒng)的參數(shù)化統(tǒng)計(jì)分類方法。

[1]M.A. Friedl and C.E. Brodley(1997). Decision Tree Classification of Land Cover from Remotely Sensed Data[J], Remote Sensing Environmen, 61(3): 399-409.

[2]陳寶政,蔡德利,張有利等. 利用決策樹對 TM遙感影像的分類研究[J].黑龍江八一農(nóng)墾大學(xué)學(xué)報(bào),2010,1: 79-82.

[3]王登峰,楊志剛,魏安世.紋理信息在遙感影像分類中的應(yīng)用[J].南京林業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2010,34(3):97-100.

[4]王曉怡,張德強(qiáng),姚磊.TM遙感影像信息及最佳波段組合研究[J].山東師范大學(xué)學(xué)報(bào),自然科學(xué)版,2010,1:109-112.

[5]Hansen,M.Dubayah,R. and DeFries.R. Classification Trees: An Alternative to Traditional Land Cover Classifiers[J],International Journal of Remote Sensing,1996,17(5):1075-1082.

[6]D.K. McIver, M.A. Friedl.Using prior probabilities in decision-tree classification of remotely sensed data. Remote Sensing of Environment 81(2002):253-261.

[7]常慶瑞,蔣平安,周勇等.遙感技術(shù)導(dǎo)論[M].北京:科學(xué)出版社,2004.

猜你喜歡
結(jié)點(diǎn)決策樹波段
春日暖陽
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
Ladyzhenskaya流體力學(xué)方程組的確定模與確定結(jié)點(diǎn)個(gè)數(shù)估計(jì)
基于決策樹的出租車乘客出行目的識別
M87的多波段輻射過程及其能譜擬合
日常維護(hù)對L 波段雷達(dá)的重要性
西藏科技(2015年4期)2015-09-26 12:12:58
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
L波段雷達(dá)磁控管的使用與維護(hù)
河南科技(2014年18期)2014-02-27 14:14:53
基于Raspberry PI為結(jié)點(diǎn)的天氣云測量網(wǎng)絡(luò)實(shí)現(xiàn)
平南县| 喀什市| 道孚县| 临高县| 紫阳县| 布拖县| 瑞昌市| 乌拉特后旗| 高阳县| 尉氏县| 遵义市| 青铜峡市| 桐乡市| 连州市| 南投县| 中阳县| 高淳县| 抚顺市| 隆尧县| 忻州市| 甘肃省| 甘孜县| 弋阳县| 涿鹿县| 西和县| 广丰县| 凤庆县| 安吉县| 喀喇| 阳朔县| 慈利县| 平湖市| 江津市| 离岛区| 中阳县| 霞浦县| 巫山县| 奎屯市| 晴隆县| 上思县| 成武县|