李旭++程濤++曹衛(wèi)星++朱艷
摘要:以南京市為研究對(duì)象,獲取研究區(qū)域Landsat8 OLI遙感影像,利用QUEST決策樹的分類方法對(duì)影像進(jìn)行分類。將植被覆蓋指數(shù)(NDVI)、迭代自組織數(shù)據(jù)分析技術(shù)(ISODATA)非監(jiān)督分類作為地學(xué)輔助數(shù)據(jù)因子添加到分類波段中,構(gòu)建多源數(shù)據(jù)集進(jìn)行不同特征的融合,處理目標(biāo)類別之間的非線性關(guān)系。該方法靈活性大,總精度達(dá)91.045%,Kappa系數(shù)為0.851,取得了比普通方法更好的精度。精度的提高有助于解決南京市復(fù)雜的規(guī)劃、決策和管理等問題。
關(guān)鍵詞:遙感;QUEST決策樹;土地利用分類;南京市
中圖分類號(hào):TP751 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2017)01-0035-04
DOI:10.14088/j.cnki.issn0439-8114.2017.01.010
Research on Land-use Classification of Nanjing City with New Type Landsat 8 Remote Sensing Images Based on QUEST Decision Tree
LI Xu1,2,CHENG Tao2,CAO Wei-xing2,ZHU Yan2
(1.Information Engineering school of Tarim University,Alaer 843300,Xinjiang,China;
2.National Engineering and Technology Center for Information Agriculture,Nanjing Agriculture University,Nanjing 210095,China)
Abstract: Taking Nanjing city as the research object, Landsat 8 OLI remote sensing image of the study area was acquired and classified using the QUEST decision tree classification method. The NDVI(Normalized difference vegetation index), ISODATA(Iterative self-organizing date analysis technique) unsupervised classification of vegetation were added to the classification band as the geoscience auxiliary data factors. Multi-source data was constructed to fuse different feature, and nonlinear relationship among the target categories was analyzed. This method had great flexibility and better accuracy than conventional methods, with accuracy was 91.045% of the total and Kappa coefficient was 0.851. The improvement of the accuracy could help to solve complex planning, decision-making and management issues of Nanjing city.
Key words: remote sensing; quest decision tree; land use classification; Nanjing city
及時(shí)有效地獲取土地利用信息對(duì)指導(dǎo)社會(huì)、經(jīng)濟(jì)、土地資源的合理利用和環(huán)境發(fā)展及科學(xué)管理土地資源有著重要的現(xiàn)實(shí)意義[1]。利用遙感和地理信息系統(tǒng)獲取土地利用信息具有獲取信息更新周期短、信息速度快、信息現(xiàn)勢(shì)性強(qiáng)等特點(diǎn)。遙感圖像分類是指根據(jù)遙感圖像中地物的光譜特征、空間特征、時(shí)相特征等對(duì)地物進(jìn)行識(shí)別的過程[2]。
遙感影像分類的研究方法大體分為兩類[3]。一是基于像素遙感影像的分類方法[4],如傳統(tǒng)的監(jiān)督、非監(jiān)督分類方法,這些方法利用像元的亮度特征對(duì)影像進(jìn)行分割,分類的精度低,從而不能滿足實(shí)際應(yīng)用的需要。隨著人們對(duì)遙感認(rèn)識(shí)的不斷深入,新的分類方法不斷被提出,如多重濾波、波段組合法、基于主成分分析光譜角度制圖的分類法、紋理分析法、模糊分類法、植被指數(shù)法、神經(jīng)網(wǎng)絡(luò)法等[5]。這些分類方法雖然大大提高了分類精度,但是在分類結(jié)果中仍然存在“椒鹽效應(yīng)”[6],且分類后需要大量的處理工作以修正結(jié)果。二是采用面向?qū)ο蟮姆诸惙椒?,處理的最小單元是含有更多語義信息的多個(gè)相鄰像元組成的影像對(duì)象,在分類時(shí)利用的是對(duì)象的幾何信息以及影像對(duì)象之間的語義對(duì)象、紋理信息、拓?fù)潢P(guān)系等[7]。但此類方法多應(yīng)用在高分辨率遙感影像上,在山地丘陵地區(qū)大范圍資源遙感調(diào)查中,分類結(jié)果精度尚需提高[8]。
決策樹分類方法(Decision tree classifier)是以各像元的特征值為設(shè)定的基準(zhǔn)位置,按照一定知識(shí)規(guī)則進(jìn)行分層并逐次進(jìn)行比較,繼而從影像分離出目標(biāo)地物的分類法[9]。在決策樹的劃分過程中,可以融合影像以外的各種信息,且不需要任何先驗(yàn)假設(shè)條件,能使漏分和錯(cuò)分誤差最小化,因此在遙感信息提取以及影像分類中有著廣泛的應(yīng)用,例如農(nóng)業(yè)資源調(diào)查、耕地變化遙感監(jiān)測(cè)、城鎮(zhèn)土地規(guī)劃以及土地開發(fā)綜合評(píng)價(jià)[10-12]等?;赒UEST算法的決策樹分類方法是依靠多維遙感信息復(fù)合技術(shù),提高遙感影像在復(fù)雜地形中對(duì)不同土地類型的區(qū)分度的一種快速、無偏、高效的方法[13],此方法用于復(fù)雜多變地貌的分類比普通決策樹分類法精度更為提高。
南京市位于長江下游沿岸,是全國重要的產(chǎn)業(yè)城市和經(jīng)濟(jì)中心,也是華東地區(qū)重要的交通樞紐,由低山、崗地、河谷平原、濱湖平原和沿江河地等地形單元構(gòu)成的地貌綜合體,是江南典型土地[14]。因此本研究采用基于QUEST決策樹影像的分類方法,將南京市各種地物的光譜知識(shí)以及其他相關(guān)知識(shí)融入決策樹,進(jìn)行土地利用類型計(jì)算機(jī)自動(dòng)分類。結(jié)果與采用普通決策樹分類法進(jìn)行精度對(duì)比,以檢驗(yàn)該方法在地形復(fù)雜地區(qū)的多光譜遙感影像精度。
1 研究區(qū)概況及數(shù)據(jù)處理
1.1 研究區(qū)概況
南京市位于江蘇省西南部,地理坐標(biāo)為北緯31°14′-32°37′、東經(jīng)118°22′-119°14′。行政區(qū)域總面積6 582 km2。南京市橫跨長江,鎮(zhèn)江市、揚(yáng)州市、常州市以及滁州市、馬鞍山市、宣州市與其接壤。南京市區(qū)東倚鐘山,海拔448.9 m;西傍長江天塹,流經(jīng)南京段約為95 km,距長江入???47 km。南京市地貌特征屬于寧鎮(zhèn)揚(yáng)丘陵地區(qū),其以低山緩崗為主,丘陵占土地總面積的4.3%,低山占3.5%,崗地占53%,平原及河流湖泊占39.2%。在北部和中部廣大地區(qū)的土壤為黃棕壤(地帶性土壤),南部與安徽省接壤處有少量的紅壤,全市森林覆蓋率為13%[15]。
1.2 數(shù)據(jù)準(zhǔn)備和預(yù)處理
2013年2月11號(hào),NASA成功發(fā)射了Landsat 8衛(wèi)星,OLI陸地成像儀包括9個(gè)波段,空間分辨率為30 m,其中包括一個(gè)15 m的全色波段,成像寬幅為185 km×185 km。根據(jù)南京市地理特征,研究采用的數(shù)據(jù)源為2013年10月5日Landsat 8兩景影像,在研究區(qū)域范圍內(nèi)影像沒有云層覆蓋,圖像清晰,質(zhì)量良好,所在時(shí)期研究區(qū)域植被生長茂盛,利于地物識(shí)別與分類工作。
使用ENVI5.1軟件對(duì)原始遙感影像進(jìn)行圖像鑲嵌、幾何校正與配準(zhǔn),誤差控制在一個(gè)像元以內(nèi),同時(shí)利用南京市的行政邊界矢量數(shù)據(jù)進(jìn)行影像的掩膜裁剪,從而得出南京市遙感影像的范圍。根據(jù)Landsat 8影像的各波段特征以及研究?jī)?nèi)容需要,對(duì)影像的7、6、4波段分別賦予紅、綠、藍(lán)顏色,獲得近似自然彩色的合成圖像,有利于提高圖像最佳目視解譯的效果。
2 影像決策樹分類
2.1 土地類型及訓(xùn)練樣本選取
南京市平面位置南北長、東西窄,呈正南北向;南北直線距離150 km,中部東西寬50~70 km,南北兩端東西寬約30 km。根據(jù)野外遙感調(diào)查以及結(jié)合實(shí)際的土地利用現(xiàn)狀,得出土地利用類型主要分為建設(shè)用地、耕地、林地、草地、水體五大類,其中林地與草地大多為建設(shè)用地內(nèi)部以及附近的綠化用地,分布比較零散,所以將林地與草地合并為林地一種類型,綜合以上考慮,將研究區(qū)土地劃分為耕地、林地、建設(shè)用地、水體4種土地利用類型。
訓(xùn)練樣本的選取是影響遙感影像分類的關(guān)鍵因素,參考南京市1∶10 000比例尺及2009年土地利用圖,在遙感影像上均勻地選取各樣本訓(xùn)練區(qū),如表1所示。
2.2 QUEST算法
QUEST(Quick unbiased efficient statistical tree)是Loh和Shih[15]在1997年提出的建立決策樹的一種二元分類構(gòu)建方法。其基本思想主要涉及分支變量和分割值的確定問題,但它將分支變量選擇和分割點(diǎn)選擇以不同的策略進(jìn)行處理。一方面既要適用連續(xù)型變量又要適用離散型變量,另一方面還要考慮其他一般決策樹算法更傾向選擇那些具有更多潛在分割值的預(yù)測(cè)變量。QUEST在構(gòu)建決策樹變量選擇上基本無偏差,同時(shí)還可以在特征空間中通過多個(gè)變量構(gòu)成的超平面區(qū)別類別成員以及非類別成員。它的運(yùn)算速度和分類精度優(yōu)于其他決策樹方法[9,10]。
算法構(gòu)建流程如下:
1)首先進(jìn)行預(yù)測(cè)變量的選擇,依次對(duì)所有的預(yù)測(cè)變量X和目標(biāo)變量Y的相關(guān)性進(jìn)行分析,若X為離散變量,使用卡方檢驗(yàn)計(jì)算X與Y的關(guān)聯(lián)強(qiáng)度,并且求出歸入該類的概率P值;若X是有序的或者連續(xù)的變量,則利用方差分析計(jì)算P值。
2)通過將所有變量的P值與預(yù)先設(shè)定的界值α/M進(jìn)行比較,α為用戶指定的顯著性水平,在(0,1)之間,M為預(yù)測(cè)變量總數(shù)。如果均小于界值,就選擇最小的一個(gè)P值作為分支變量;如果均大于界值,則當(dāng)X為連續(xù)的或者有序的變量時(shí),利用Levene方差的齊性檢驗(yàn)計(jì)算P值,并且在P值小于界值的時(shí)刻,選擇最小的一個(gè)P值作為分支變量。若方差的齊性檢驗(yàn)P值均大于閾值,就選擇在第一步中的P值最小變量來作為分支變量。
3)如果選出的分支變量為離散型分類變量,需經(jīng)過變換,使不同X取值的目標(biāo)變量Y取值的差異最大化,并且計(jì)算其最大判別坐標(biāo)。
4)如果Y為多分類,就為每一Y取值計(jì)算X的均數(shù),使用聚類分析方法,將這些類別最終合并為兩大類,因此將多類類別簡(jiǎn)化為二類判別問題。
5)利用二次判別分析方法最終明確分割點(diǎn)的位置,獲得所選預(yù)測(cè)變量X原始取值,從而構(gòu)建分類規(guī)則。
2.3 決策樹的建立
選擇Landsat8 OLI影像,利用選取的訓(xùn)練樣本提取各種光譜和輔助地學(xué)特征構(gòu)建多源數(shù)據(jù)集,包括深藍(lán)、青、綠、紅、近紅外、2個(gè)短波紅外等7個(gè)多光譜波段以及植被覆蓋指數(shù)(Normalized difference vegetation index,NDVI)、迭代自組織數(shù)據(jù)分析技術(shù)(Iterative self-organizing data analysis technique,ISODATA)非監(jiān)督分類結(jié)果,組成一個(gè)9波段數(shù)據(jù)來進(jìn)行分類和精度分析。
NDVI是反映植被覆蓋度的重要指標(biāo),它是植物生長狀態(tài)以及植被空間分布密度最佳的指示因子,并且和植被分布密度呈線性相關(guān)關(guān)系,被廣泛地應(yīng)用于景觀生態(tài)、農(nóng)作物估產(chǎn)、環(huán)境監(jiān)測(cè)等領(lǐng)域。ISODATA非監(jiān)督分類是基于集群理論基礎(chǔ)上,依據(jù)不同影像地物在空間中的特征差別,收集由計(jì)算機(jī)集聚統(tǒng)計(jì)分析所得圖像,是一種無先驗(yàn)類別標(biāo)準(zhǔn)的圖像分類法,可以為QUEST決策樹分類提供參考。
3 結(jié)果與分析
3.1 訓(xùn)練區(qū)樣本分析
分離度是影響分類精度的重要指標(biāo),在影像中的訓(xùn)練區(qū)樣本的分離度如表2所示。計(jì)算結(jié)果表明不同土地利用類型之間的分離度均大于1.9,樣本的分離度符合分類的要求。
總共有2 078個(gè)像元作為測(cè)試變量和目標(biāo)變量,通過利用ENVI5.1軟件,建立基于QUEST的決策樹,在訓(xùn)練過程中,決策樹的深度為12層,結(jié)點(diǎn)數(shù)為145個(gè),從而比較方便地產(chǎn)生了IF-Then形式規(guī)則。根據(jù)南京市土地利用類型的實(shí)際情況以及調(diào)查數(shù)據(jù),適當(dāng)?shù)匦拚龥Q策樹的劃分條件,并且利用此類方法對(duì)多維影像進(jìn)行分類,南京市土地分類結(jié)果如圖1所示。生產(chǎn)的決策樹結(jié)構(gòu)比較復(fù)雜,分類生成的決策樹結(jié)構(gòu)如圖2所示。
3.2 精度檢驗(yàn)
參考南京市的土地利用數(shù)據(jù)、遙感影像圖、地形圖、野外調(diào)查資料等,研究區(qū)基于地物類型分布面積的比例大小,確定分層隨機(jī)采樣的1 982個(gè)像元樣本地物類型,驗(yàn)證基于普通決策樹分類結(jié)果和基于QUEST決策樹分類結(jié)果。QUEST決策樹分類方法總精度為91.045%,比普通決策樹分類方法高3.895個(gè)百分點(diǎn);Kappa系數(shù)為0.851,比普通決策樹分類方法高0.052。
4 結(jié)論
本研究利用基于QUEST的決策樹分類方法分析了地形條件較為復(fù)雜的南京市Landsat8 OLI遙感影像,將NDVI和ISODATA非監(jiān)督分類結(jié)果等因子納入分類規(guī)則相對(duì)單一的利用光譜信息遙感影像分類中,從分類結(jié)果可以得出,基于QUEST決策樹的遙感影像分類提高了林地、建設(shè)用地的分類精度,從而提高了研究區(qū)影像的總體精度,而且能快速地利用選定的訓(xùn)練樣本獲得集成遙感影像中比較精確的分類規(guī)則。此分類法可為區(qū)域土地利用開發(fā)、保護(hù)以及政府相關(guān)部門制定政策提供較為可靠的科學(xué)依據(jù)。
今后需要將多維地學(xué)信息,如光譜特征、紋理特征與地學(xué)輔助信息進(jìn)行有機(jī)的結(jié)合,以期發(fā)現(xiàn)新的分類規(guī)則,從而構(gòu)建決策樹專家分類模型,以進(jìn)一步提高遙感影像分類的精度。
參考文獻(xiàn):
[1] 劉曉娜,封志明,姜魯光.基于決策樹分類的橡膠林地遙感識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(24):163-172.
[2] 杜麗英.決策樹ID3算法的應(yīng)用研究[J].輕工科技,2014(9):67-68.
[3] 周美琴,徐章艷,陳詩旭,等.新型偏好敏感決策樹算法[J].計(jì)算機(jī)應(yīng)用研究,2016,33(10):3001-3006.
[4] 張 熙,鹿琳琳,王 萍,等.基于決策樹的漓江上游土地覆蓋分類[J].測(cè)繪科學(xué),2016,41(3):100-104.
[5] 張 森,陳健飛,龔建周.運(yùn)用C5.0決策樹進(jìn)行面向?qū)ο蠓诸悺詌andsat-8 OLI為例[J].測(cè)繪科學(xué),2016,41(6):1-8.
[6] 梅卓華,金 焰,張哲海,等.基于TM影像的南京市土地利用變化遙感監(jiān)測(cè)與評(píng)價(jià)[J].地球與環(huán)境,2010,38(1):63-67.
[7] 張 娟,黨耀國,李雪梅.基于前景理論的灰色多指標(biāo)風(fēng)險(xiǎn)型決策方法[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(22):7-10.
[8] 王 軍,溫興平,張麗娟,等.基于遙感技術(shù)的滇池水域面積變化監(jiān)測(cè)研究[J].河南科學(xué),2014,32(8):1589-1593.
[9] JIANG Y N,WANG Y,LIAO M S. Study of coastal wetland classification based on decision rules using ALOS AVNIR-2 images and ancillary geospatial data[J].Geocarto International, 2015,19(3):1172-1188.
[10] L?魻W F,CONRAD C,MICHEL U.Decision fusion and non-parametric classifiers for land use mapping using multi-temporal RapidEye data[J].Isprs Journal of Photogrammetry and Remote Sensing,2015,108:191-204.
[11] 袁林山,杜培軍,張華鵬,等.基于決策樹的CBERS遙感影像分類及分析評(píng)價(jià)[J].國土資源遙感,2008(2):91-98.
[12] 巴 桑,劉志紅,張正健,等.決策樹在遙感影像分類中的應(yīng)用[J].高原山地氣象研究,2011,31(2):31-34.
[13] 白秀蓮,巴雅爾,哈斯其其格.基于C5.0的遙感影像決策樹分類實(shí)驗(yàn)研究[J].遙感技術(shù)與應(yīng)用,2014,29(2):338-343.
[14] 王 茜,張?jiān)鱿?,?玲,等.南京城市擴(kuò)展的遙感研究[J].長江流域資源與環(huán)境,2007,16(5):554-559.
[15] LOH W Y,SHIH Y S.Split selection methods for classification trees[J].Statistica Sinica,1997,7:815-840.