廖珊珊 張建宇
摘 ? 要:本文以廣西扶綏縣為例,在對甘蔗種植區(qū)特征分析基礎(chǔ)上,運(yùn)用面向?qū)ο蟮母叻直媛视跋裉卣魈崛〉姆椒?,采取多尺度分割,分別采取不同的信息提取策略,得到試驗區(qū)信息分類成果。著重討論面向?qū)ο蟮母叻直媛蔬b感信息提取的關(guān)鍵技術(shù),探討光譜特征、形狀特征、紋理特征、典型特征等在甘蔗地種植區(qū)信息提取中的最優(yōu)參數(shù)選擇及具體應(yīng)用,并對其分類結(jié)果進(jìn)行精度驗證和評價。研究結(jié)果表明,試驗區(qū)影像分類的精度較高,且在一定程度上提高了面向?qū)ο笮畔⑻崛〉男屎妥詣踊潭取?/p>
關(guān)鍵詞:面向?qū)ο??多尺度分割 ?高分辨率影像 ?甘蔗 ?精度評價
中圖分類號:S566 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1674-098X(2019)06(b)-0124-03
本文以廣西扶綏縣為研究區(qū)域,以甘蔗地種植區(qū)為研究對象,采用面向?qū)ο蟮倪b感影像分析方法,在影像分割基礎(chǔ)上得到對象,充分利用對象特征,探討利用eCognition軟件對北京二號高分遙感影像進(jìn)行分類具體應(yīng)用,從而實現(xiàn)信息有效提取?;诿嫦?qū)ο蟮母收岱N植區(qū)的遙感影像處理技術(shù),突破了著眼于關(guān)注地物局部細(xì)節(jié)而忽略地物圖斑的整體紋理及結(jié)構(gòu)信息導(dǎo)致的分類精度降低的缺陷,解決了“同譜異物”及“同物異譜”問題,避免了“椒鹽現(xiàn)象”[2],有效地提高了甘蔗地識別的精度和效率,對廣西糖料蔗生產(chǎn)保護(hù)區(qū)及“雙高”基地的劃定、管理及監(jiān)測具有重要意義。
1 ?試驗區(qū)數(shù)據(jù)
1.1 試驗數(shù)據(jù)
試驗所用的遙感圖像數(shù)據(jù)為北京2號衛(wèi)星拍攝的廣西扶綏縣遙感影像,成像時間為2017年8月,影像數(shù)據(jù)共有4個光譜波段,空間分辨率為0.8m,波段范圍分別為:藍(lán)光波段0.45~0.9?m、綠光波段0.52~0.59?m、紅光波段0.63~0.69?m、近紅外波段0.77~0.89?m。本文選取具有代表性的4000*4000像素的子區(qū)進(jìn)行試驗研究。影像經(jīng)過輻射定標(biāo)、大氣校正、正射校正和融合處理等預(yù)處理后,獲取研究區(qū)影像。根據(jù)試驗區(qū)所在區(qū)域的先驗知識、專題資料和人工目視解譯,將研究區(qū)地物大類分為道路、水體、建筑物、林地、耕地、裸地和云層共7種地物類別。
1.2 真值數(shù)據(jù)
廣西第一次全國地理國情普查成果數(shù)據(jù)2017年通過驗收,數(shù)據(jù)范圍覆蓋了廣西全省經(jīng)過遙感人工目視解譯與外業(yè)實地調(diào)繪核實的地理國情要素,可認(rèn)定為真值。
2 ?研究方法
2.1 技術(shù)路線
在影像多尺度分割的基礎(chǔ)上,以遙感影像認(rèn)知和地學(xué)理解為主要分析視角,合理選擇目標(biāo)地物的分類特征,開展研究區(qū)高分辨率影像分類研究。本文探討采用eCognition軟件對廣西扶綏縣高分影像進(jìn)行最優(yōu)分割尺度分割,根據(jù)特征類別對影像對象特征賦值,再依據(jù)人工目視解譯數(shù)據(jù)用于樣本訓(xùn)練,并結(jié)合樣本監(jiān)督分類,高效高精度地提取地物對象,最后利用國情普查數(shù)據(jù)檢查樣本,并對分類結(jié)果進(jìn)行精度評價分析,分類結(jié)果精度較高。具體技術(shù)路線如圖1所示。
2.2 多尺度影像分割
影像分割依據(jù)同質(zhì)性或異質(zhì)準(zhǔn)則,把圖像分為一定數(shù)量具有特征差異的子區(qū)域,這些子區(qū)域內(nèi)部像元具有某種共性,且內(nèi)部相互聯(lián)系,且相鄰的子區(qū)域有明顯的差異性,是面向?qū)ο蟮倪b感影像分類的基本單元[1]。eCognition軟件中的多尺度分割算法,是采用基于異質(zhì)性最小的一種區(qū)域合并算法,其目標(biāo)是實現(xiàn)分割后影像對象保持各自同質(zhì)性最大的限度同時其平均異質(zhì)性最小化,完成兩兩區(qū)域合并實現(xiàn)的自上而下的分割方法[3]。經(jīng)試驗,F(xiàn)NEA分割算法符合試驗區(qū)數(shù)據(jù)要求。FNEA分割算法異質(zhì)性規(guī)則加權(quán)成分如圖2所示,其中Wcolor代表的是顏色因子權(quán)重,Wshape指的是形狀因子權(quán)重,兩者權(quán)重相加之和為 1;Wcom和Wsmo則表示緊湊度和平滑度的權(quán)重,兩者權(quán)重和也為1[2]。試驗區(qū)多尺度分割結(jié)果如圖3所示。
2.3 特征類別分析
2.3.1 形狀特征
一般情況下,人工地物的幾何形狀較為規(guī)則,如道路、建筑用地等。地類對象的幾何形狀特征提取是基于影像對象的矢量來建立幾何形狀特征提取的模型,形狀指標(biāo)由光滑度和破碎化程度兩個參數(shù)來決定,兩參數(shù)權(quán)重和為1。
2.3.2 光譜特征
植被的反射光譜特征可使其在遙感影像上與其他地物相區(qū)別,可利用光譜特征提取植被要素。隨著遙感影像空間分辨率的提高,高分辨率影像中同類地物的光譜特征也表現(xiàn)的更復(fù)雜也更多,最直接的表現(xiàn)是:影像中的單個像元混合表現(xiàn)多個地物的情況減少了,而僅表現(xiàn)一個地物的單個像元增多了,高分辨率影像中不同類別的地物能在影像空間上區(qū)分出來了。
2.3.3 紋理特征
面向?qū)ο蟮募y理分析,一種方法是使用eCognition Developer提供的預(yù)定義紋理特征,即由子對象的光譜屬性、對比以及形狀屬性等紋理表征來描述影像對象;另一種是分析已分類的子對象的組成,類相關(guān)特征(Relations to Sub-Objects)可用于提供一個影像對象的紋理信息?;叶裙采仃嚕℅LCM)可提供影像灰度值的方向、變化幅度和間隔等信息,但灰度共生矩陣并不能直接區(qū)別紋理之間差異,因此需要對灰度共生矩陣提取一些能夠定量描述紋理特征的相關(guān)統(tǒng)計屬性。常用于描述影像中紋理信息的灰度共生矩陣的統(tǒng)計屬性主要有8種。
本試驗區(qū)以突出影像中紋理的脊線和谷線的信息對比度為目的,一方面能夠更大顯示紋理信息,另一方面也能夠去除對影像產(chǎn)生質(zhì)量影響的各種噪聲。首先把全色的影像進(jìn)行轉(zhuǎn)換而生成灰度影像,然后對得到的灰度影像再進(jìn)行歸一化處理,最后再對歸一化成果進(jìn)行二值化處理,從而得到紋理特征增強(qiáng)后的影像,最后利用灰度共生矩陣特征量描述影像區(qū)域紋理用以提出影像地類信息[4]。
2.3.4 典型特征
遙感圖像上的植被信息主要通過綠色植物葉子和植被冠層的光譜特性及其差異、變化反映?;跇颖緦W(xué)習(xí),根據(jù)上述特征分類可有效剔除平地層中大部分的水體、裸地、道路、居民地等非植被地物,并區(qū)分出植被大類,如林地與耕地。但要從耕地內(nèi)區(qū)分出甘蔗種植區(qū),還需要增加三個典型特征指數(shù),比值植被指數(shù)(RVI)、歸一化植被指數(shù)(NDVI)和歸一化水指數(shù)(NDWI)。NDVI、NDWI、RVI值的綜合應(yīng)用可提取植被信息,也可以根據(jù)NDVI值與RVI值的范圍剔除非甘蔗地種植區(qū)的其它植被作物。不同地類反應(yīng)的NDVI和RVI范圍值不同,甘蔗地種植區(qū)的NDVI值區(qū)間在0.25~0.55,RVI值區(qū)間在1.8~3.0。
2.4 決策樹算法
決策樹算法(CART分類樹和回歸樹)是常見的用于數(shù)據(jù)約簡的方法,需要做一系列的決策以將數(shù)據(jù)分為許多個內(nèi)部同質(zhì)的子集,其目標(biāo)是創(chuàng)建一個模型基于一些輸入的變量可以預(yù)測目標(biāo)變量值,樹可以通過對基于屬性值的測試將原集分割為子集進(jìn)行學(xué)習(xí)。建立樹算法進(jìn)行分析的目的是為了決定一系列if-then邏輯(分割)條件,決策樹算法中每個節(jié)點(diǎn)需要的樣本數(shù)量的最小值取決于參數(shù)Min sample count。如果決策樹有太少的分支會失去提高分類精度的機(jī)會,而如果有太多的分支則會出現(xiàn)冗余,需在eCognition中通過設(shè)置“Cross validation folds”進(jìn)行交叉驗證。對于交叉驗證來說,分類樹根據(jù)學(xué)習(xí)樣本計算出來,并其預(yù)測精度由測試樣本進(jìn)行測試[3]。該試驗區(qū)決策樹分析過程如圖5所示。
3 ?結(jié)果與分析
3.1 分類結(jié)果
通過對影像特征類別隸屬度函數(shù)分析,隸屬度值的計算是根據(jù)函數(shù)的斜率計算隸屬的函數(shù)值,依據(jù)對象與樣本的不同距離,可得到不同的隸屬度值。設(shè)定特征類別函數(shù)的模糊區(qū)間,將其相互之間差異大的進(jìn)行組合,被分類的對象與樣本的特征空間距離由所有特征的標(biāo)準(zhǔn)差、波段均值、亮度等特征值進(jìn)行標(biāo)準(zhǔn)化,可實現(xiàn)不同特征在特征空間中的組合分類。經(jīng)過反復(fù)大量的實驗,進(jìn)行影像信息提取決策樹規(guī)則的構(gòu)建,再由每種特征確定出最準(zhǔn)確的分類閾值范圍,根據(jù)以上結(jié)果,進(jìn)行“與”運(yùn)算,由于本次試驗主要目的是提取甘蔗種植區(qū)信息,重點(diǎn)將對耕地分類予以確定,基于面向?qū)ο蠓诸惡蟮母貓D斑按特征類別分類綜合提取后,分類為耕地甘蔗地種植區(qū)(Farmland sugarcane)以及耕地非甘蔗地種植區(qū)(Farmland No sugar)。試驗區(qū)基于面向?qū)ο蟮姆诸愋Ч鐖D6所示。從圖中可看出,甘蔗種植區(qū)域分布較廣,種植面積大小較為規(guī)則,旱地與水田均有甘蔗種植區(qū),道路周圍區(qū)域種植面積較多也較為成片。
3.2 精度評價
混淆矩陣法是目前分類精度評價中使用范圍最廣的方法。本試驗區(qū)以人工目譯與先驗知識獲取的218個樣本對象為精度評價的樣本,該訓(xùn)練樣本均勻分布在整個研究區(qū),約占總分類對象的15%,而檢驗樣本則利用隨機(jī)采樣法選取620個地類要素圖斑點(diǎn)為真值數(shù)據(jù)檢驗點(diǎn)進(jìn)行分類結(jié)果驗證,云層無真值不參與精度評價故刪除,最后采用混淆矩陣方法獲得試驗區(qū)誤差矩陣,對試驗區(qū)各種類別遙感信息的制圖精度、用戶精度、Kappa系數(shù)進(jìn)行分析并得出面向?qū)ο蠓诸惥仍u價,Kappa系數(shù)為0.87394,甘蔗地種植區(qū)的用戶精度和生產(chǎn)精度均高于95%,結(jié)果顯示見表1,可得出試驗區(qū)影像分類的精度較好,滿足應(yīng)用的需求。
3.3 結(jié)果分析
對比分析以上試驗,得出如下結(jié)論。
(1)基于面向?qū)ο蟮男畔⑻崛》椒伸`活運(yùn)用地物的形狀、光譜和紋理等特征信息,相比基于像元的傳統(tǒng)分類方法,能得到更多的地物信息和更好的提取效果。
(2)通過多尺度影像分割算法,基于面向?qū)ο蟮男畔⒎诸愄崛》椒鼙3址诸悓ο笤诳臻g上的連續(xù)性,有效避免椒鹽噪聲現(xiàn)象。
(3)紋理是圖斑精細(xì)分類信息提取最重要的影響因素。尋找對象的顯著特征對面向?qū)ο蟮男畔⑻崛≈陵P(guān)重要,雖費(fèi)時長但精度高。在后續(xù)深度學(xué)習(xí)中,可強(qiáng)化紋理特征提取方法的應(yīng)用。
(4)決策樹算法可更充分合理的利用提取的這些對象的特征,能從眾多的特征中選擇出最優(yōu)的特征,進(jìn)而提取出分類規(guī)則,對提出的決策樹規(guī)則能夠?qū)崿F(xiàn)可視化,并在分類過程中對建立的規(guī)則加入人工干預(yù)。
綜上所述,隨著影像空間分辨率的提高,基于面向?qū)ο蟮挠跋穹诸愋畔⑻崛》椒ㄍㄟ^機(jī)器學(xué)習(xí)影像特征類別自動分析識別分類,并通過決策樹算法人工干預(yù)分類規(guī)則與類別參數(shù),用于精細(xì)化提取出甘蔗地,既減少外業(yè)核查工作量,又提高地類識別提取效率。
參考文獻(xiàn)
[1] 陳啟浩.面向?qū)ο蟮亩嘣催b感數(shù)據(jù)分類技術(shù)研究與實現(xiàn)[D].中國地質(zhì)大學(xué),2007.
[2] 李莉.面向?qū)ο蟮母叻直媛蔬b感影像信息提取研究[D].成都理工大學(xué),2012.
[3] 張振勇,王萍,朱魯,等.eCognition技術(shù)在高分辨率遙感影像信息提取中的應(yīng)用[J].國土資源信息化,2007(2):15-17.
[4] 李敏,崔世勇,李成名,等.面向?qū)ο蟮母叻直媛蔬b感影像信息提取—以耕地提取為例[J].遙感信息,2008(6):63-66.