楊佳佳,姜琦剛,陳永良,崔瀚文,張漢女
(1.吉林大學(xué)地球探測科學(xué)與技術(shù)學(xué)院,吉林長春 130026;2.沈陽地質(zhì)調(diào)查中心,遼寧沈陽 110034; 3.吉林大學(xué)綜合信息礦產(chǎn)預(yù)測研究所,吉林長春 130026)
基于最小二乘支持向量機(jī)和高分辨率遙感影像的大尺度區(qū)域巖性劃分
楊佳佳1,2,姜琦剛1,陳永良3,崔瀚文1,張漢女1
(1.吉林大學(xué)地球探測科學(xué)與技術(shù)學(xué)院,吉林長春 130026;2.沈陽地質(zhì)調(diào)查中心,遼寧沈陽 110034; 3.吉林大學(xué)綜合信息礦產(chǎn)預(yù)測研究所,吉林長春 130026)
基于大尺度區(qū)域分割的理念,提取高分辨率遙感圖像中與巖性相關(guān)的紋理、形狀、光譜信息,利用最小二乘支持向量機(jī)(LS-SVM)在非線性預(yù)測中的優(yōu)勢,對(duì)研究區(qū)地質(zhì)巖性進(jìn)行識(shí)別。首先對(duì)高分辨率圖像中與巖性相關(guān)的光譜、紋理、形狀、高程等特征信息進(jìn)行樣本選取,選取過程中以圖像的紋理為主要特征信息,同時(shí)以J-M距離、轉(zhuǎn)換分類度為依據(jù)選取最優(yōu)特征空間,采用因子分析變換降維對(duì)特征空間進(jìn)行壓縮,實(shí)現(xiàn)特征信息最優(yōu)化;然后對(duì)已知樣本進(jìn)行訓(xùn)練,建立分類模型,評(píng)價(jià)模型精度;最后利用模型對(duì)研究區(qū)進(jìn)行巖性劃分,并進(jìn)行分類后處理。研究結(jié)果表明:基于LS-SVM的分類方法在利用高分辨率遙感圖像巖性識(shí)別中表現(xiàn)良好,為地質(zhì)巖性分類提供了一種新的方法和手段;加入紋理等信息后的LS-SVM分類模型更加利于巖性的判別。
巖性識(shí)別;大尺度區(qū)域分割;最小二乘支持向量機(jī);高分辨率;遙感
隨著亞米級(jí)遙感圖像的問世,面向?qū)ο蟮膱D像分類方法現(xiàn)今已經(jīng)受到了廣泛的關(guān)注[1-6]。面向?qū)ο蠓诸惻c基于像元分類有很大不同,前者包含光譜、紋理、形狀等特征,后者一般只包括光譜特征。另外提到的支持向量機(jī)是近些年研究比較熱點(diǎn)的模式分類方法,許多學(xué)者采用支持向量機(jī)做了大量研究[7-9],但大都用于區(qū)分圖像像元的判別歸屬問題,并沒有在地質(zhì)大范圍巖性分類中有過研究。大尺度區(qū)域劃分[10]的概念由周成虎、駱劍承提出,關(guān)鍵在于模仿人類的視覺機(jī)制,認(rèn)為人類對(duì)場景的分割首先是基于大尺度的,即視覺細(xì)胞首先捕捉場景中的大目標(biāo)或背景,并獲得相應(yīng)的輪廓?;谇叭说难芯?,筆者把面向?qū)ο蟠蟪叨葏^(qū)域劃分應(yīng)用在地質(zhì)的巖性分類研究中,提出基于紋理-光譜-高程-形狀綜合體的最小二乘支持向量機(jī)(LS-SVM)巖性分類方法,以達(dá)到對(duì)研究區(qū)巖性進(jìn)行大區(qū)域劃分的目的。
一般來說,人的眼睛對(duì)場景的分割首先是基于大尺度的,即視覺細(xì)胞首先捕獲場景中的大目標(biāo)或背景,并獲得相應(yīng)的輪廓;在此基礎(chǔ)上,場景中的細(xì)節(jié)或子目標(biāo)才能逐漸聚焦[10]。因此,廣義條件下可以在一個(gè)較大的尺度下,根據(jù)影像的光譜、紋理等一切和地物相關(guān)的特征對(duì)研究區(qū)巖性進(jìn)行大區(qū)域分類,將圖像分為有地質(zhì)意義的不同區(qū)域,增強(qiáng)區(qū)域巖性的可識(shí)別性,同時(shí)可以方便對(duì)目標(biāo)地物的性質(zhì)做進(jìn)一步的深入研究。
1.2.1 支持向量機(jī)分類原理
支持向量機(jī)(SVM)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的模式識(shí)別方法,主要應(yīng)用于模式識(shí)別領(lǐng)域,在解決小樣本、非線性及高維模式識(shí)別問題中表現(xiàn)出許多特有的優(yōu)勢。主要包括線性支持向量機(jī)和非線性支持向量機(jī)。SVM是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的學(xué)習(xí)方法,其推廣能力明顯優(yōu)于一些傳統(tǒng)的學(xué)習(xí)方法。由于SVM的求解最后轉(zhuǎn)化成二次規(guī)劃問題的求解,因此SVM的解是全局唯一的最優(yōu)解[11]。通過求解一個(gè)約束條件下的極值,然后轉(zhuǎn)化成它的對(duì)偶問題,得到簡化的不等式約束極值問題,最終得到最優(yōu)分類函數(shù):
式中,sgn{}為符號(hào)函數(shù);αi為Lagrange乘子;b為分類的域值;x、y為樣本向量。αi不為零的樣本點(diǎn)就稱作支持向量。這些向量充分描述了整個(gè)訓(xùn)練樣本集數(shù)據(jù)的特征,使得對(duì)支持向量集的線性劃分等價(jià)于對(duì)整個(gè)數(shù)據(jù)集的分類。
對(duì)于非線性可分樣本,支持向量機(jī)構(gòu)造分類決策函數(shù)的方法是,首先將訓(xùn)練數(shù)據(jù)從原始模式空間經(jīng)過特定核函數(shù)的非線性變換,映射到高維特征空間。然后,在特征空間中,尋找最優(yōu)分類超平面,該超平面實(shí)際上對(duì)應(yīng)著原始模式空間中的非線性分類面[12]。因此,支持向量機(jī)在處理非線性情況時(shí),僅比線性情況多了一個(gè)非線性映射環(huán)節(jié)。其對(duì)偶形式變?yōu)?/p>
其中K(xi·xj)為滿足Mercer條件的核函數(shù)。目前,應(yīng)用較多的核函數(shù)有3種,即多項(xiàng)式核函數(shù)、徑向基核函數(shù)和Sigmoid核函數(shù)。對(duì)于多類分類問題,可采用多個(gè)二分類SVM組合的辦法解決。
1.2.2 改進(jìn)的LS-SVM分類
Suykens等[13]提出的最小二乘支持向量機(jī)(LS-SVM)是經(jīng)過改進(jìn)的支持向量機(jī)模型,從機(jī)器學(xué)習(xí)損失函數(shù)著手,在其優(yōu)化問題的目標(biāo)函數(shù)中使用二范數(shù),并利用等式約束條件代替SVM標(biāo)準(zhǔn)算法中的不等式約束條件,使得LS-SVM方法的優(yōu)化問題的求解變?yōu)橥ㄟ^Kuhn-Tucker條件得到的一組線性方程組的求解,避免了不敏感損失函數(shù),大大降低了計(jì)算復(fù)雜度,且運(yùn)算速度高于一般的支持向量機(jī)[14-15]。
最小二乘支持向量機(jī)的優(yōu)化問題體現(xiàn)在:經(jīng)驗(yàn)風(fēng)險(xiǎn)由一次方變?yōu)槎畏剑玫仁郊s束代替不等式約束[14],定義為
滿足等式約束
式中,ω為權(quán)向量;b為待確定的參數(shù);γ為模型泛化能力和精度之間的一個(gè)折中參數(shù),γ>0;ξ為松弛因子,ξ≥0。
1.3.1 巖性識(shí)別的前提依據(jù)
巖石是一種或多種礦物按一定規(guī)律構(gòu)成的固結(jié)礦物集合體,是地殼發(fā)展過程中各種地質(zhì)作用形成的地質(zhì)體。巖性是指反映巖石特征的一些屬性,如顏色、成分、結(jié)構(gòu)、構(gòu)造、膠結(jié)物及膠結(jié)類型、特殊礦物等。巖性組合是指巖性在橫向、縱向上的組合排列關(guān)系,它反映巖相的變化,是巖石生成環(huán)境的重要標(biāo)志之一。巖性的分類是基于面的分類,不能用類似基于像元的礦物單元識(shí)別一樣去研究。充分利用潛在于遙感圖像中的空間信息組合才是巖性分類的關(guān)鍵。空間信息又包括地物的紋理、形狀、大小、高程、位置等一系列信息,本次研究以地物的紋理信息為主,結(jié)合其他相關(guān)輔助信息對(duì)研究區(qū)進(jìn)行了巖性的大區(qū)域劃分。
影像的紋理結(jié)構(gòu)是遙感影像識(shí)別巖性過程中的重要信息,原始的光譜信息加上紋理信息可以提高影像解譯的精度。作為提高影像分類精度的重要分析因素——紋理分析,合理有效地使用紋理分析方法至關(guān)重要。紋理分析的方法很多,許多學(xué)者也做了相關(guān)紋理方面的研究[4,16]。目前方法主要有統(tǒng)計(jì)方法、結(jié)構(gòu)方法和譜方法。本研究的紋理信息主要是基于統(tǒng)計(jì)學(xué)的灰度共生矩陣的方法和基于數(shù)學(xué)變換的小波變換方法。
灰度共生矩陣是一種通過研究灰度的空間相關(guān)特性來描述紋理的常用方法,是對(duì)圖像上保持某距離的兩像素分別具有某灰度的狀況進(jìn)行統(tǒng)計(jì)得到的。從灰度圖像計(jì)算出灰度共生矩陣、能量、對(duì)比度、均勻度、熵等紋理特征。該方法在紋理基元很小并構(gòu)成微紋理時(shí),統(tǒng)計(jì)方法的效果較好[17],本次研究將這種灰度共生矩陣生成的紋理圖像作為微紋理圖像的信息。
小波分析最大的特點(diǎn)在于極其敏感的變焦特征,它能形成可調(diào)時(shí)頻窗,在低頻段采用高頻率分辨率和低時(shí)間分辨率,而在高頻段則采用低頻率分辨率和高時(shí)間分辨率,從而在不同的分辨率下,反映出不同的圖像結(jié)構(gòu),使其在增強(qiáng)圖像紋理信息方面具有特殊的能力。經(jīng)過小波與HIS(假彩色變換)融合后的圖像不僅增強(qiáng)了圖像的紋理清晰度,同時(shí)也繼承了原圖像的光譜信息。本次研究將小波HIS融合后的數(shù)據(jù)作為光譜-紋理信息源,考慮到本次研究采用的圖像分辨率高,故采用的小波分解水平為5級(jí)。
1.3.2 方法流程
基于紋理-光譜-形狀-高程-位置等為一體的信息綜合體,選取圖像上不同地物的光譜和紋理信息,另外在研究過程中還加入了形狀、高程、位置等輔助的識(shí)別信息作為源信息綜合體,隨后進(jìn)行樣本的選取,選取過程中要考慮到特征空間的最優(yōu)性,最后通過LS-SVM分類方法對(duì)采樣數(shù)據(jù)進(jìn)行訓(xùn)練、預(yù)測,達(dá)到對(duì)研究區(qū)巖性進(jìn)行大區(qū)域劃分的目的(圖1)。
圖1 方法流程圖Fig.1 Flow chart of research methods
研究區(qū)位于新疆克孜勒陶地區(qū),范圍為東經(jīng)76°11'~76°13',北緯38°34'~38°55'。該區(qū)地層分布主要為:上侏羅統(tǒng)庫孜貢蘇組(J3kz),出露于研究區(qū)西南部,呈條帶狀分布,本組為一套紅色粗碎屑巖建造;下白堊統(tǒng)江額結(jié)爾組(K1j),出露于研究區(qū)西部,巖性為褐紅、灰紅色厚 -巨厚層狀細(xì)粒長石石英砂巖,夾礫巖;下白堊統(tǒng)烏魯克恰特組(K1w),出露于研究區(qū)中部,以淺褐色、黃綠色上部灰白色厚-中層狀中-細(xì)粒長石石英砂巖為主;上白堊統(tǒng) -古新統(tǒng)英吉莎群(K2E1Y),出露于研究區(qū)東部,該群出露多少或受構(gòu)造影響,巖性主要為頁巖、介殼灰?guī)r、粉砂質(zhì)灰?guī)r、長石砂巖與泥巖互層、鮞?;?guī)r、泥晶灰?guī)r、棕紅、紫紅色厚層泥巖、膏泥巖等;古新統(tǒng)阿爾塔什組(E1a),出露于研究區(qū)東部,下部主體為白色塊狀硬石膏巖,局部夾少量灰?guī)r,底部為條帶狀石膏巖夾灰色白云石石膏巖,上部為深灰色厚層狀含生物屑泥晶灰?guī)r;上更新統(tǒng)湖積層(Qp3l),出露于研究區(qū)大部,為土黃色、棕黃色黏土層,上部腐殖層,發(fā)育植物根系,向洼地中心方向過渡為灰白色含鹽堿的黏土層。
2.2.1 遙感數(shù)據(jù)源
研究采用的影像為WorldViewⅡ高分辨率遙感數(shù)據(jù),于2010年7月6日獲取,大小為4188像素 × 3755像素。WorldViewⅡ衛(wèi)星相比同級(jí)別其他高分辨率衛(wèi)星的主要特點(diǎn)是:①圖像分辨率更高(多光譜1.84 m,全色0.46 m)、地理位置精度更高;②除提供常規(guī)藍(lán)、綠、紅和近紅外波段外,還提供另外4種波段1.8 m分辨率的數(shù)據(jù),增強(qiáng)了數(shù)據(jù)分類能力和提取地面目標(biāo)的能力;③圖像處理系統(tǒng)和多衛(wèi)星采集計(jì)劃效率高;④采樣區(qū)域重訪周期短,大面積立體采集能力高,機(jī)動(dòng)靈活性更強(qiáng)。
2.2.2 遙感數(shù)據(jù)預(yù)處理
(1)首先對(duì)數(shù)據(jù)進(jìn)行輻射定標(biāo),基于6S大氣糾正模塊進(jìn)行大氣校正得到圖像的視反射率值,然后進(jìn)行正射校正、幾何校正,最后要對(duì)圖像中相關(guān)干擾信息進(jìn)行去除。
(2)WORLDVIEWⅡ波段選取。通過統(tǒng)計(jì)各波段的均值、方差、最大值、最小值,及各個(gè)波段之間的相關(guān)性,確定了以4(R)、3(G)、2(B)波段組合作為本次研究的基礎(chǔ)圖像,該合成圖像集結(jié)了近紅外及可見光波段信息的優(yōu)勢,色彩反差明顯,清晰度高,層次感好,具有極為豐富的地質(zhì)信息,可解譯程度高,不同類型的巖石邊界清晰,巖石地層單元的邊界、特殊巖性的展布也顯示得較為清楚。
(3)小波變換HIS融合增強(qiáng)。通過小波結(jié)合HIS融合后的圖像不僅增強(qiáng)了圖像的清晰度,同時(shí)也繼承了原圖像的光譜信息。從融合后的統(tǒng)計(jì)數(shù)據(jù)來看,融合后的圖像方差及熵都大于原始圖像的相應(yīng)波段,均值和中值也普遍大于原始波段,說明融合后圖像動(dòng)態(tài)范圍變大,原圖中不太明顯的細(xì)節(jié)信息顯示了出來。
(4)綜合特征信息體。將小波HIS融合后的影像作為光譜-紋理信息的特征體;以基于二階矩陣生成的5個(gè)紋理濾波圖像作為微紋理信息的特征體(包括均值、熵、二階距、相關(guān)性、相異性5個(gè)信息特征信息);使用基于形狀的數(shù)學(xué)形態(tài)濾波圖像作為形狀信息特征體;以高程DEM數(shù)據(jù)圖像作為高程信息特征體;圖像中自帶的像元位置、像元投影坐標(biāo)可以作為位置信息的特征體,另外還加入了主成分分析后的圖像作為反映圖像信息分布及圖像波段間相關(guān)性變化的特征信息體。
LS-SVM分類的效果不僅與所選擇的核函數(shù)有關(guān),最關(guān)鍵的是特征樣本的選擇及相關(guān)調(diào)整參數(shù)的確定。
特征選擇與提取的優(yōu)劣極大地影響著分類器的設(shè)計(jì)和性能,本次特征選擇的原則基于以下三點(diǎn):包含的信息量大;類之間的相關(guān)性要降到最小;在保證精度的前提下盡量壓縮特征空間的維數(shù)。采用下述方案優(yōu)化特征空間:首先,針對(duì)不同巖性在遙感圖像上體現(xiàn)的差異選取樣本,根據(jù)樣本計(jì)算各特征空間類別之間的可分性;然后對(duì)優(yōu)化的特征空間采用因子分析變換進(jìn)行壓縮,從而確定最優(yōu)特征空間信息;最后從中隨機(jī)選取一定量的樣本分為兩類,一類用于模型訓(xùn)練,一類用于模型檢驗(yàn)。
建立LS-SVM分類模型(采用高斯RBF核函數(shù))還需要兩個(gè)調(diào)整參數(shù):γ是正則參數(shù),它取決于訓(xùn)練誤差最小化和平滑程度之間的權(quán)衡程度,σ2是平方帶寬,它們是影響LS-SVM性能的主要因素[18]。本文中采用貝葉斯框架來調(diào)整優(yōu)化參數(shù),以獲得適當(dāng)?shù)妮敵?。最?yōu)正規(guī)化參數(shù)γ和內(nèi)核參數(shù)σ2可分別通過優(yōu)化成本推理的第二層和第三層獲得。
根據(jù)巖性的不同將研究區(qū)分為6類地物,它們的代號(hào)分別是:Jkz、Kj、Kw、KEY、Ea、。
311211
3.1.1 樣本選取影響因素及可分性比較
對(duì)分類模型影響較大的因素有:樣本選取、樣本純度、不同類別空間屬性等。通過對(duì)這些影響因素的綜合考慮,確保選取樣本的可靠性。
(1)為了保證選取的樣本具有代表性,選樣本要順著巖層的傾向連續(xù)選取,這樣可以最大程度地體現(xiàn)紋理的差異信息,同時(shí)為避免不同顏色造成的光譜差異,選取樣本的范圍要廣,要體現(xiàn)出大區(qū)域的紋理特征。另外選取樣本時(shí)要綜合利用各個(gè)特征圖像的差異信息進(jìn)行選取。
(2)樣本的空間屬性特征也是影響分類精度很重要的因素,尤其是與巖性關(guān)系密切的紋理及形狀信息。通過加入紋理、形狀、高程信息作為類評(píng)價(jià)的重要參考因素,通過Jeffries-Matusta(J-M)距離和轉(zhuǎn)換分離度(transformed divergence)作為類分離性的度量,計(jì)算不同類樣本間的可分離性,這兩個(gè)度量值在0~2.0,值越大說明可分性越好。如果不滿足度量值的要求需返回重新進(jìn)行樣本的選取。研究發(fā)現(xiàn),加入紋理、形狀信息后明顯增強(qiáng)了類之間的可分性和可聚性(表1)。高程信息加入后并沒有發(fā)生明顯的變化甚至出現(xiàn)相反的趨勢,原因是DEM遙感數(shù)據(jù)的分辨率太低,故考慮排除使用。
表1 加入紋理、形狀信息后的類可分性變化Table 1 Class separability changes after adding texture and shape information
3.1.2 樣本N維空間顯示及純度的調(diào)整
如圖2所示,把選取的樣本加入到N維散點(diǎn)圖中進(jìn)行選擇,在N維散點(diǎn)圖中,點(diǎn)坐標(biāo)由N個(gè)值組成,它們可以在指定的波段形成的N維空間中進(jìn)行旋轉(zhuǎn)顯示,從而可以集中選取出最純凈的像元和極值波譜反應(yīng)。通過N維散點(diǎn)圖的選取后,類之間的可分性(表2)得到了明顯的提高,可以作為最終的樣本數(shù)據(jù)進(jìn)一步分析。
圖2 N 維散點(diǎn)圖樣本選取Fig.2 N-dimensional scatter plot sample selection
表2 通過N維散點(diǎn)圖選取后的類可分性變化Table 2 Class separability changes after selecting class by N-dimensional scatter plot
3.1.3 數(shù)據(jù)的壓縮降維
數(shù)據(jù)特征信息的增加本來是為了使研究過程趨于完整,但反過來,由于特征信息太多,使得分析的復(fù)雜性增加,運(yùn)算更為復(fù)雜,為了解決這種情況本次研究對(duì)不同特征的樣本信息進(jìn)行了因子分析,以較少的幾個(gè)特征因子替代原始特征集的大部分信息。因子分析后結(jié)果(表3),經(jīng)巴特利特球形檢驗(yàn)(Bartlett),Bartlett=190,P<0.0001,即相關(guān)矩陣不是一個(gè)單位矩陣,故符合因子分析的條件。另外,KMO (Kaiser-Meyer-Olkin measure of sampling adequacy)是用于比較觀測相關(guān)系數(shù)值與偏相關(guān)系數(shù)值的一個(gè)指標(biāo),其值愈逼近1,表明這些特征變量進(jìn)行因子分析后的效果愈好。KMO=0.721意味著因子分析的結(jié)果可以接受。
表3 正交旋轉(zhuǎn)矩陣Table 3 Rotated component matrix
用來做因子分析的特征信息體包含12個(gè)不同的特征矩陣信息。經(jīng)正交旋轉(zhuǎn)后的因子負(fù)荷矩陣(表3)旋轉(zhuǎn)的目的是使復(fù)雜的矩陣變得簡潔,即第一因子替代了X4、X5、X9、X10、X11、X12的作用,第二因子替代了X1、X2、X3的作用,第三因子替代了X6、X8、X10的作用,第四因子替代了X6、X7的作用,第五因子替代了X7、X8的作用。
3.1.4 加入紋理、形狀信息前后分類模板的比較
從因子分析后的樣本中隨機(jī)抽取一部分,分為兩類,一類用于建模,一類用于檢驗(yàn)。其中訓(xùn)練樣本個(gè)數(shù)分別為:Qp3l289個(gè);J3kz 220個(gè);K1j 283個(gè); K1w 242個(gè);K2E1Y 276個(gè);E1a 263個(gè)。檢驗(yàn)所用樣本個(gè)數(shù)分別為:Qp3l258個(gè);J3kz 236個(gè);K1j 223個(gè); K1w 281個(gè);K2E1Y 211個(gè);E1a 236個(gè)。將這些樣本根據(jù)屬性的不同分為兩類分別建立分類模型,一類的屬性為純光譜信息,另一類屬性為加入紋理、形狀信息后的全屬性信息。由這兩類不同屬性的樣本建立的分類模型如圖3所示。從圖中可以看出,加入紋理后的分類效果比純光譜分類效果有明顯提高,前后兩種模型的 γ判定值及 σ2判定值分別為4.6768、1.075 5和9.755 3、9.422。最后通過均方根誤差(erms)及預(yù)測精度(ap)來評(píng)價(jià)分類模型,前后兩種模型的精度分別為53.94%和80.286 7%。誤差和預(yù)測精度的計(jì)算公式為
式中,Xi為預(yù)測值;^Xi為實(shí)測值;m為預(yù)測項(xiàng)的均值。
將加入紋理、形狀信息后的分類模型用于研究區(qū)巖性分類,計(jì)算歸屬類別并顯示分類效果,然后與最大似然分類及基于純光譜的LS-SVM分類效果進(jìn)行對(duì)比,如圖4所示。
比較最大似然分類、純光譜LS-SVM分類和綜合信息體LS-SVM分類后的效果發(fā)現(xiàn),最大似然分類后的遙感圖像類別之間混淆不清,純光譜LSSVM分類后的圖像略有改觀,但是在研究區(qū)中部還有大片明顯的巖性混淆,相比之下加入紋理、形狀等信息后的LS-SVM分類更加明確,類之間的界限更加清晰,分類效果良好。
分類圖像和真實(shí)圖像之間混淆矩陣的計(jì)算顯示(表4),單純利用光譜信息SVM分類的總體分類精度只有51.168 0%,與純光譜SVM分類效果相比較,加入紋理、光譜等綜合信息后,總體分類精度達(dá) 到75.3610%,分類精度有了明顯提高。
圖3 加入紋理、形狀信息前后分類模型對(duì)比Fig.3 Comparison of classification model adding texture and shape information
圖4 幾種分類效果的比較Fig.4 Comparison of several classification results
表4 分類精度統(tǒng)計(jì)Table 4 Classification accuracy statistics
對(duì)分類后的圖像進(jìn)行調(diào)色,同時(shí)通過做主要分析來消除圖像中存在的零碎小圖斑問題,該分析功能可以將較大類別中的虛假像元?dú)w到該類中,變換核的尺寸要通過實(shí)踐來確定。由于巖性范圍的面積都很大,所以本次采用較大的變換核尺寸,當(dāng)選用31×31變換核時(shí),總體分類精度比處理前的分類圖像精度略有上升(表4),選用37×37變換核時(shí),總體分類精度達(dá)到80.967 6%,如果再選用過大的變換核時(shí),總體分類精度開始下降,說明該尺寸反映了分類圖像最佳的空間變化尺度,故選擇37×37為變換核作為最終變換效果。如圖5所示,最終的分類效果和野外地質(zhì)填圖相比存在一些不同,這是因?yàn)樗捎玫母叻直媛蔬b感數(shù)據(jù)分辨率達(dá)到了0.5 m,比實(shí)際1∶5×104比例尺的區(qū)域地質(zhì)圖更加詳細(xì),對(duì)前人地質(zhì)工作是一個(gè)很好的補(bǔ)充,可以用于地質(zhì)找礦的后期工作,達(dá)到了大尺度巖性分類的目的。
圖5 最終結(jié)果及印證Fig.5 Final results and mutal proof
基于地物綜合特征信息的大尺度區(qū)域信息提取技術(shù),從理論上更符合人類的視覺機(jī)制,從技術(shù)實(shí)踐上提高了大目標(biāo)識(shí)別的效率,在地質(zhì)巖性填圖工作中取得了很好的應(yīng)用效果,從遙感圖像上提取的巖性信息具有野外工作難以達(dá)到的效果,并且具有較強(qiáng)的實(shí)際應(yīng)用意義。WorldViewⅡ高分辨率遙感影像中反映的紋理信息和光譜信息都非常豐富,在地質(zhì)巖性識(shí)別中具有良好的應(yīng)用性?;诓煌牡刭|(zhì)巖性在遙感圖像上體現(xiàn)的紋理特征、光譜特征等信息,利用LSSVM分類方法,通過非線性決策函數(shù)進(jìn)行樣本訓(xùn)練并預(yù)測分類,僅需不多的樣本就可以得到很好的分類效果。通過高分辨率遙感圖像的巖性提取與野外填圖互補(bǔ)運(yùn)用,可以快捷方便地獲得地質(zhì)巖性的分布信息,在地質(zhì)填圖工作中能起到事半功倍的效果。在今后的工作中可以對(duì)所分類的巖性進(jìn)行面線狀基元提取,達(dá)到矢量化的目的,進(jìn)一步增強(qiáng)實(shí)用性。
[1]DE CARVALHO LMT,CLEVERSJG P W,SKIDMORE A K,et al.Selection of imagery data and classifiers for mapping Brazilian semideciduous Arlantic forest[J].Journal of Applied Earth Observation and Geoinformation,2004,5(3):173-186.
[2]KUMARS,GHOSH J,GRAWFORD MM.Best-bases feature extraction algorithms for classification of hyperspectral data[J].Geoscience and Remote Sensing,2001,39(7):1368-1379.
[3]SUND F.Study on fusion algorithms of IKONOSPan and multi-spectral images[J].Remote Sensing Technology and Application,2002,17(1):41-45.
[4]李培軍.用ASETR圖像和地統(tǒng)計(jì)學(xué)紋理進(jìn)行巖性分類[J].礦物巖石,2004,24(3):116-120.
LI Pei-jun.Classification of lithology used by ASTERimage and with geostatistics texture[J].JMineral Petrol,2004,24(3):116-120.
[5]張秀英,馮學(xué)智,江洪.面向?qū)ο蠓诸惖奶卣骺臻g優(yōu)化[J].遙感學(xué)報(bào),2009,13(4):664-669.
ZHANG Xiu-ying,F(xiàn)ENG Xue-zhi,JIANG Hong.Objectoriented classification feature space optimization[J].Journal of Remote Sensing,2009,13(4):664-669.
[6]李代林,朱化鳳,裴紅艷.基于圖像融合的水下成像技術(shù)[J].中國石油大學(xué)學(xué)報(bào):自然科學(xué)版,2008,32 (4):157-160.
LI Dai-lin,ZHU Hua-feng,PEI Hong-yan.Underwater imaging technology based on image fusion[J].Journal of China University of Petroleum(Edition of Natural Science),2008,32(4):157-160.
[7]傅文杰,洪金益,朱谷昌.基于光譜相似尺度的支持向量機(jī)蝕變信息提取[J].地質(zhì)與勘探,2006,42(2): 69-73.
FU Wen-jie,HONG Jin-yi,ZHU Gu-chang.Extraction altered and mineralized rock information from remote sensing image based on support vector machines and spectral similarity scale[J].Geology and Prospecting,2006,42(2):69-73.
[8]張耀波,張遷.基于SVM的遙感影像的分類[J].地理空間信息,2005,3(4):24-26.
ZHANG Yao-bo,ZHANG Qian.Support vector machine for classification of remotely sensed image[J].Geospatial Information,2005,3(4):24-26.
[9]薛云,戴塔根,鄒艷紅,等.基于主成分分析的SVM礦化信息提取研究:以青海黃南州阿哇地區(qū)為例[J].遙感應(yīng)用,2007,6:32-35.
XUE yun,DAI Ta-gen,ZOU Yan-hong,et al.Extracting alteration information by SVMbased on principal component analysis:a case study in Awa,Qinghai Huangnan[J].Remote Sensing Applications,2007,6:32-35.
[10]周成虎,駱劍承.高分辨率衛(wèi)星遙感影像地學(xué)計(jì)算[M].1版.北京:科學(xué)出版社,2009.
[11]SCHOLKOPF B,MIKA S,BURGESC.Input space vs.feature space in kernel-based methods[J].Transactions on Neural Networks,1999,10(5):1000-1017.
[12]張學(xué)工.關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J].自動(dòng)化學(xué)報(bào),2000,26(1):32-42.
ZHANG Xue-gong.Introduction to statistical learning theory and support vector machines[J].Acta Automatica Sinica,2000,26(1):32-42.
[13]SUYKENSJA K,VANDEWALLE J.Least squares support vector machine classfiers[J].Neural Processing Letter,1999,9:293-300.
[14]張全明,劉會(huì)金.最小二乘支持向量機(jī)在電能質(zhì)量擾動(dòng)分類中的應(yīng)用[J].中國電機(jī)工程學(xué)報(bào),2008,28 (1):106-110.
ZHANG Quan-ming,LIU Hui-jin.Application of LSSVMin classification of power quality disturbances[J].Proceedings of the CSEE,2008,28(1):106-110.
[15]李麗娟.最小二乘支持向量機(jī)建模及預(yù)測控制算法研究[D].杭州:浙江大學(xué)信息科學(xué)與工程學(xué)院,2008.
LI Li-juan.The study of modeling algorithm based on LS-SVMand predictive control algorithm[D].Hangzhou:School of Information Science and Engineering,Zhejiang University,2008.
[16]CHICA-OLMO,ABARCA-HERNANDEZ.Computing geostatistical image texture for remotely sensed data classification[J].Computers&Geosciences,2000,26 (4):373-383.
[17]馮建輝,楊玉靜.基于灰度共生矩陣提取紋理特征圖像的研究[J].北京測繪,2007(3):19-22.
FENG Jian-hui,YANG Yu-jing.Study of texture images extraction based on gray level co-occurrence matrix[J].Beijing Surveying and Mapping,2007(3):19-22.
[18]VAPNIK V N.統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)[M].張學(xué)工,譯.北京:清華大學(xué)出版社,2000.
Lithology division for large-scale region segmentation based on LS-SVMand high resolution remote sensing images
YANG Jia-jia1,2,JIANG Qi-gang1,CHENYong-liang3,CUI Han-wen1,ZHANG Han-nü1
(1.College of Geoexploration Science and Technology,Jilin University,Changchun130026,China; 2.Shenyang Institute of Geology and Mineral Resources,Liaoning110034,China; 3.Mineral Resources Prediction Institute of Comprehensive Information,Jilin University,Changchun130026,China)
Based on the concept of large-scale region segmentation,extraction of texture,shape,spectral information of high resolution remote sensing image associated with the lithology and the advantages of least squares-support vector machines(LSSVM)in the non-linear prediction were used in the geological lithology identification.Firstly,the samples of spectral,texture,shape and altitude information which are relevant to lithology in the high resolution remote sensing images are selected.During the course of selecting,the image's texture is the main characteristic information.In the meanwhile,the chosen optimization feature space is based on the J-Mdistance and the degree of conversion classification.The feature space is compressed by using factor analysis and transformation dimension reduction,so that the characteristic information can be optimized.Then,known samples are trained,and classification model is developed to evaluate model accuracy.Finally,the model was used to divide the study area's lithology and process classified objects.The classification method based on LS-SVMperforms well in the highresolution remote sensing images lithological identification,and provides a new method and means for the classification of geological lithology.LS-SVMclassification model is more conducive in lithology identification after adding texture.
lithology division;large-scale region segmentation;least squares-support vector machines(LS-SVM);high resolution;remote sensing
P 627;TP 79
A
10.3969/j.issn.1673-5005.2012.01.010
1673-5005(2012)01-0060-08
2011-07-19
國家自然科學(xué)基金資助項(xiàng)目(40872193);中國地質(zhì)調(diào)查局資助項(xiàng)目(1212010510218)
楊佳佳(1984-),男(漢族),山西晉城人,博士,主要從事遙感地學(xué)應(yīng)用研究。
(編輯 修榮榮)