賈詩(shī)超,薛東劍,2,李成繞
(1. 成都理工大學(xué)地球科學(xué)學(xué)院,四川 成都 610059; 2. 國(guó)土資源部地學(xué)空間信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,四川 成都 610059)
ALOS PALSAR是具有極化工作能力的SAR,它用于全天時(shí)全天候的陸地觀測(cè),通過極化測(cè)量獲得地物散射回波,繼而得到具有目標(biāo)地物相位、強(qiáng)度信息的散射矩陣。對(duì)散射矩陣進(jìn)行極化分解獲得極化特征,應(yīng)用極化特征可進(jìn)一步對(duì)圖像分類[1]。自1970年Huynen提出了目標(biāo)分解理論[2]后,遙感領(lǐng)域里面涌現(xiàn)了很多基于目標(biāo)分解的極化SAR圖像分類算法??v觀這些分類算法,可以將極化SAR圖像的分類主要概括為兩步:極化分解和分類方法的選擇。極化分解也可以分為兩大類:一是基于相干目標(biāo)分解,主要是針對(duì)Sinclair矩陣的分解;二是基于分布式目標(biāo)(部分相干目標(biāo))分解,主要是針對(duì)相干矩陣、協(xié)方差矩陣和Mueller矩陣的分解。文中的Cloude-Pottier分解和特征參數(shù)香農(nóng)熵、雷達(dá)植被指數(shù)都是基于相干矩陣的。而分類方法的選擇,根據(jù)是否存在訓(xùn)練樣本和人工干預(yù),可以分為監(jiān)督分類[3]和非監(jiān)督分類[4]。監(jiān)督分類應(yīng)用最為廣泛的是利用統(tǒng)計(jì)分布的Bayes分類[5];非監(jiān)督分類主要分為兩類:一是基于聚類分析,二是基于目標(biāo)電磁散射機(jī)制[6]。
本文中使用的SVM分類是一種監(jiān)督分類方法,基于SVM的極化SAR分類,國(guó)外最早開始做了很多研究。在2001年,F(xiàn)ukuda首次將支持向量機(jī)應(yīng)用到極化SAR圖像分類中[7],并取得了不錯(cuò)的分類效果,隨后基于SVM的極化SAR圖像分類不斷應(yīng)用與發(fā)展。這些應(yīng)用主要差別在于極化特征的選擇上,如基于Cameron分解[8]、Freeman分解[9]、Yamaguchi分解[10]的極化特征應(yīng)用;也有將不同的分解特征聯(lián)合起來進(jìn)行分類[11-12]。然而這些特征都沒有很好地利用目標(biāo)散射矩陣上的信息,本文采用的方法將Cloude-Pottier分解和香農(nóng)熵、雷達(dá)植被指數(shù)、極化總功率組合起來,更好地利用了目標(biāo)散射信息,各自發(fā)揮它們之間的特征優(yōu)勢(shì),如雷達(dá)植被指數(shù)對(duì)植被信息提取具有很好的效果。并且將本文方法與Freeman-Durden-SVM分類方法和Wishart監(jiān)督分類進(jìn)行比較,進(jìn)一步驗(yàn)證了本文方法良好的分類性能。
研究區(qū)位于四川省彭州市西北方向的中國(guó)石油四川石化有限公司(簡(jiǎn)稱為彭州石化)。彭州石化項(xiàng)目是國(guó)家能源發(fā)展戰(zhàn)略布局的重大項(xiàng)目,經(jīng)過國(guó)家環(huán)保部環(huán)境影響評(píng)價(jià)和國(guó)家發(fā)改委核準(zhǔn),國(guó)務(wù)院正式批準(zhǔn)該項(xiàng)目在彭州建設(shè)。彭州石化作為四川省內(nèi)大型的石化公司,對(duì)其周邊區(qū)域的土地分類研究是必不可少的,也為進(jìn)一步研究其對(duì)周邊區(qū)域不同地物的環(huán)境影響做準(zhǔn)備。研究區(qū)內(nèi)主要分布在成都平原,其內(nèi)有彭州石化的工廠,工廠內(nèi)分布著很多圓柱形的煙囪,然后是居民地、裸地、水體和耕地。裸地主要分布在河道周邊,由于4月正是岷江的枯水期,因此河道水流很小,河道周邊的沙地都裸露出來,還有部分是裸露的土地。居民地主要分布在公路兩邊,耕地在居民地的周邊。影像的左上角為山地,緊靠龍門山斷裂帶,山地植被覆蓋較茂密,如圖1 所示。在后面的地物分類中所選擇的訓(xùn)練樣本也是分為這六類地物。
ALOS是日本對(duì)地觀測(cè)衛(wèi)星,它載有3個(gè)傳感器:全色遙感立體測(cè)繪儀(PRISM),主要用于數(shù)字高程測(cè)繪;先進(jìn)可見光與近紅外輻射計(jì)-2(AVNIR-2),用于精確陸地觀測(cè);相控陣型L波段合成孔徑雷達(dá)(PALSAR),用于全天時(shí)全天候陸地觀測(cè)。文中使用的影像數(shù)據(jù)是ALOS PALSAR,成像時(shí)間是2011年4月7日,數(shù)據(jù)級(jí)別為1.1,入射角為21.5°,極化方式為HH、HV、VH、VV這4種。研究區(qū)的圖像大小為751×601,影像數(shù)據(jù)為單視復(fù)數(shù)數(shù)據(jù)(SLC)。
文中地物分類方法的流程分為以下6個(gè)步驟:
(1) 對(duì)ALOS PALSAR數(shù)據(jù)進(jìn)行多視處理,并獲取相干矩陣T3和基于Pauli分解下的RGB圖像。
(2) 由于地形影響,對(duì)數(shù)據(jù)進(jìn)行地形校正和地理編碼。
(3) 由于SAR影像都會(huì)受到相干斑的影響,進(jìn)行濾波處理。
(4) 提取極化總功率SPAN,再進(jìn)行Cloude-Pottier極化分解,獲取極化特征散射熵、平均散射角和各向異性度,并且獲取極化特征香農(nóng)熵(SE)和雷達(dá)植被指數(shù)(RVI)。
(5) 將極化總功率、散射熵、平均散射角、各向異性度、香農(nóng)熵和雷達(dá)植被指數(shù)組合起來,以此進(jìn)行SVM分類。
(6) 確定6類分類類別數(shù),選取訓(xùn)練樣本,對(duì)極化特征組合利用SVM進(jìn)行極化SAR圖像分類,并獲取分類后的分類精度。
由于初始數(shù)據(jù)是SLC數(shù)據(jù),因此在距離向和方位向的采樣大小不一致,為了目視解譯和訓(xùn)練樣本選取方便,進(jìn)行降斑和數(shù)據(jù)壓縮,對(duì)影像進(jìn)行5∶1的多視處理且在Pauli分解下得到該研究區(qū)的假彩色圖像,如圖1所示。
圖1 Pauli分解的RGB圖像
SAR圖像的成像方式為側(cè)視成像,其特有的成像方式也決定了圖像的一些幾何特點(diǎn)。在地形起伏的山地,SAR圖像會(huì)出現(xiàn)透視收縮、疊掩和陰影,這些固有的幾何特點(diǎn)對(duì)影像的正確分析會(huì)產(chǎn)生一定的影響。如本文使用的SAR影像數(shù)據(jù)在左上角有一部分是山地,原始數(shù)據(jù)在該部分有明顯的幾何形變,需要進(jìn)行地形校正。然后再對(duì)影像進(jìn)行濾波處理,去除相干斑噪聲的影響。
本文所采用的濾波方法為Refined Lee濾波,通過試驗(yàn)比較3種不同的濾波窗口,窗口大小分別為3×3、5×5和7×7,對(duì)3種窗口都做到最后的圖像分類,通過分類精度來選擇,發(fā)現(xiàn)7×7的濾波窗口分類效果更好,因此本文選擇7×7的濾波窗口,如圖1所示。但是7×7濾波窗口得到的圖像細(xì)節(jié)損失與其他兩種相比更為嚴(yán)重一些,不過所選擇的研究區(qū)域較大,區(qū)內(nèi)各地物的分布較多,不同地物之間的分界線也很明顯,因此細(xì)節(jié)損失對(duì)最后分類結(jié)果沒有太大的影響。圖2、圖3分別給出了3×3和5×5的濾波圖像。
圖2 3×3濾波圖像
圖3 5×5濾波圖像
在單站互易媒質(zhì)的后向散射情況下,Shv=Svh,對(duì)極化散射矩陣進(jìn)行矢量化,在Pauli基下
(1)
由散射矢量定義極化相干矩陣
(2)
式中,上標(biāo)H表示共軛矩陣;<·>表示集平均。
Cloude-Pottier極化分解是1997年Cloude和Pottier[13]利用相干矩陣T3將相干矩陣分解為不同的特征矢量和對(duì)應(yīng)的特征值,通過該極化分解,可得到3個(gè)特征參數(shù)
(3)
(4)
(5)
基于特征值的參數(shù)香農(nóng)熵(SE)是由Morio等提出的[14-15],它可以表示為與強(qiáng)度(SEI)和極化(SEP)相關(guān)的兩分量之和
SE=log(π3e3|T3|)=SEI+SEP
(6)
式中,SEI是與總后向散射功率相關(guān)的強(qiáng)度分量;SEP是與極化度相關(guān)的極化分量。
雷達(dá)植被指數(shù)是對(duì)極化SAR的各個(gè)極化通道的綜合表述,它可以描述植被的冠層特征。研究區(qū)內(nèi)有大量的林地,為了獲得更好的分類精度,本文加入雷達(dá)植被指數(shù)。Van Zyl利用隨機(jī)指向的介質(zhì)圓柱體模型分析植被區(qū)的散射,對(duì)于這種模型,第二個(gè)和第三個(gè)特征值相等[16]。雷達(dá)植被指數(shù)的定義為
(7)
當(dāng)RVI= 4/3時(shí),為細(xì)圓柱體,單調(diào)遞減到0時(shí),為粗圓柱體。
通過以上的極化分解和特征參數(shù)提取得到了極化總功率、散射熵、平均散射角、各向異性度、香農(nóng)熵和雷達(dá)植被指數(shù),如圖4所示。
這些特征所表現(xiàn)的研究區(qū)都有各自的不同信息,將它們組合起來,不同信息之間相互補(bǔ)充,可以提高分類的精度。但是特征之間也會(huì)有相同信息,過多的特征組合會(huì)造成信息冗余,對(duì)分類精度并沒有提高,反而分類精度會(huì)有所降低[17]。
SVM是一種線性和非線性數(shù)據(jù)分類的方法,它以訓(xùn)練誤差作為優(yōu)化問題的約束條件,以置信范圍最小化作為優(yōu)化目標(biāo)來構(gòu)造,將數(shù)據(jù)映射到高維空間中,然后尋找最優(yōu)分類超平面[18]。
設(shè)訓(xùn)練數(shù)據(jù)為{(x1,y1),(x2,y2),…,(xn,yn)},xi∈Rn,yi是分類結(jié)果標(biāo)簽,yi∈{+1,-1},i=1,2,…,n。求得的分類超平面為
wT+b=0
(8)
圖4 極化特征
支持向量機(jī)是為了使離超平面比較近的點(diǎn)能有更大的間隔,即最優(yōu)分類超平面,也就是等價(jià)于求二次規(guī)劃問題為
(9)
當(dāng)數(shù)據(jù)集線性不可分,可以利用核函數(shù)將數(shù)據(jù)集映射到高維空間中,進(jìn)而在新的空間中線性可分,求得最優(yōu)分類超平面。本文選擇徑向基函數(shù)作為核函數(shù),懲罰系數(shù)為4096,γ值為1.0。選取極化總功率、散射熵、平均散射角、各向異性度、香農(nóng)熵和雷達(dá)植被指數(shù)作為SVM的分類特征。然后在Pauli分解的RGB圖像上選取訓(xùn)練樣本,各個(gè)訓(xùn)練樣本的大小分別為:工廠煙囪2348個(gè)像素、林地3240個(gè)像素、居民地2911個(gè)像素、裸地2317個(gè)像素、水體1646個(gè)像素和耕地2511個(gè)像素。選擇的訓(xùn)練樣本如圖5所示。
圖5 訓(xùn)練樣本
SVM的參數(shù)設(shè)置完成且選好訓(xùn)練樣本后,進(jìn)行圖像分類,分類后得到地物分類結(jié)果圖和分類精度。
通過以上的試驗(yàn)過程得到本文研究方法的分類結(jié)果圖,然后進(jìn)行Wishart 監(jiān)督分類和Freeman-Durden-SVM分類。Wishart 監(jiān)督分類[19]是根據(jù)選取的訓(xùn)練樣本數(shù)據(jù)進(jìn)行Wishart 距離度量來分類。Freeman-Durden分解[20]是一種以物理實(shí)際為基礎(chǔ),將三分量散射機(jī)制模型用于極化SAR觀測(cè)技術(shù),它不需要使用任何地面觀測(cè)數(shù)據(jù)。3個(gè)散射機(jī)制分別為體散射、二次散射和表面散射。Freeman-Durden-SVM分類首先進(jìn)行Freeman-Durden極化分解,提取極化特征,然后在SVM里面進(jìn)行分類。為了避免由于訓(xùn)練樣本的不同影響最后的分類效果,本文的3種方法所選擇的訓(xùn)練樣本相同。3種方法的分類結(jié)果如圖6所示。
圖6 分類結(jié)果
通過分類結(jié)果可以明顯看出Wishart監(jiān)督分類效果最差,錯(cuò)分像素很多,各類地物之間界限也不明顯,如林地里錯(cuò)分了很多工廠煙囪和耕地。而Freeman-Durden-SVM和本文方法分類效果相對(duì)好很多,錯(cuò)分像素也出現(xiàn)很少,邊界清晰,但是Freeman-Durden-SVM方法在耕地和居民地的地方明顯錯(cuò)分一些裸地。這只是根據(jù)分類結(jié)果圖目視分析得到的結(jié)論,表1給出了3種方法精確的分類精度,包括用戶精度、總體精度和Kappa系數(shù),它們分別從不同的角度對(duì)不同方法的分類效果進(jìn)行評(píng)價(jià),精度值越大,分類效果越好[21]。
表1 圖像分類精度 (%)
從表1可以看出本文方法的用戶精度、總體精度和Kappa系數(shù)都高于其他兩種方法,其中工廠煙囪和林地的精度高達(dá)99.70%和99.38%。從分類結(jié)果圖中可以發(fā)現(xiàn)工廠煙囪很明顯地被提取出來,而且與工廠內(nèi)的其他建筑之間的分界線也很清晰。極化特征組合中加入的各向異性度和香農(nóng)熵可以將工廠煙囪的特征提取出來,有利于后面對(duì)它進(jìn)行準(zhǔn)確地分類;林地的分類效果也很好,邊界清晰且錯(cuò)分像素很少。雷達(dá)植被指數(shù)可以描述植被的冠層特征,從雷達(dá)植被指數(shù)圖可以觀察到,左上角的林地信息被描述得很清楚,再加上平均散射角的信息進(jìn)行補(bǔ)充,因此林地的精度很高。水體的分類精度相對(duì)于本文方法是最低的,這主要是因?yàn)橛跋竦某上駮r(shí)間是4月7日,四川省內(nèi)部分耕地已經(jīng)灌水,準(zhǔn)備水稻的種植,因此耕地被錯(cuò)分為水體。Freeman-Durden-SVM方法分類效果次之,裸地和水體的效果相對(duì)較差。由于Freeman-Durden分解為3個(gè)散射分量,水體和裸地都可以認(rèn)為是表面散射,僅依據(jù)協(xié)方差矩陣分解的表面散射分量,難以很好地區(qū)分出同為表面散射的水體和裸地。而本文方法將不同的極化特征組合起來,豐富了表面散射模型,可以較精確地分出水體和裸地。不過Freeman-Durden-SVM方法分類整體效果較好,Kappa系數(shù)為91.88%。Wishart監(jiān)督分類效果相對(duì)最差,林地的精度只有56.54%,工廠煙囪也沒有很好地提取出來,精度為62.10%,整體的Kappa系數(shù)只有69.94%。因?yàn)閃ishart監(jiān)督分類是根據(jù)訓(xùn)練樣本數(shù)據(jù)進(jìn)行Wishart 距離度量來分類,訓(xùn)練樣本的選擇對(duì)最后的分類結(jié)果也有一些影響,而且根據(jù)Wishart 距離度量很難準(zhǔn)確區(qū)分出研究區(qū)的六類地物。總體來說,本文方法將不同極化特征組合起來,信息之間相互補(bǔ)充,分類效果很好,各地物之間界限清晰,總體精度為97.64%,Kappa系數(shù)為97.14%。
本文通過Cloude-Pottier極化分解,用散射熵、各向異性度和平均散射角來表征各種散射機(jī)制,再加上香農(nóng)熵和雷達(dá)植被指數(shù)進(jìn)行補(bǔ)充,很好地獲得了目標(biāo)地物不同的散射機(jī)制。另外加入極化總功率對(duì)空間信息描述,組合這些極化特征對(duì)ALOS PALSAR全極化數(shù)據(jù)進(jìn)行SVM分類,得出以下結(jié)論:
(1) 本文方法分類結(jié)果效果較好,Kappa系數(shù)為97.14%,相對(duì)另兩種方法的Kappa系數(shù)分別提高了5.26%和27.20%。
(2) 耕地和水體的分類精度相對(duì)較差,主要是由于成像時(shí)間剛好是水稻的種植期,部分耕地已經(jīng)灌水,造成耕地錯(cuò)分為水體。
(3) 在Cloude-Pottier極化分解基礎(chǔ)上加入香農(nóng)熵可以提高工廠煙囪的分類效果,加入雷達(dá)植被指數(shù)可以提高林地的分類效果。