張臘梅 張思雨 董洪偉 朱 廈
①(哈爾濱工業(yè)大學(xué)電子與信息工程學(xué)院 哈爾濱 150001)
②(北京市遙感信息研究所 北京 100192)
合成孔徑雷達(dá)是非常成熟的一種主動模式微波遙感技術(shù),不依賴于太陽光源,不受云、霧、雨、雪等自然氣候影響,具備全天候、全天時(shí)的對地觀測能力。極化SAR通過發(fā)射兩個(gè)相互正交的電磁波,結(jié)合電磁波的極化信息以及合成孔徑雷達(dá)(Synthetic Aperture Radar, SAR)的優(yōu)良特性從而更加有效地對地面進(jìn)行觀測,在地物與土地利用[1]、海洋表面遙感、綠色植物覆蓋[2]等方面發(fā)揮了重要作用。圖像分類一直是極化SAR圖像解譯中的重要部分。對于極化SAR圖像而言,限制分類精度的主要因素在于噪聲。盡管對極化SAR圖像的濾波方法有很多[3,4],但都無法完全去除噪聲的影響,并且在進(jìn)行極化SAR圖像監(jiān)督分類時(shí),訓(xùn)練樣本的標(biāo)定范圍隨機(jī)性很強(qiáng),存在重采樣問題。
隨著機(jī)器學(xué)習(xí)的發(fā)展,大量半監(jiān)督[5]、無監(jiān)督[6-8]和全監(jiān)督[9-11]的分類方法被應(yīng)用于極化SAR圖像分類。相比全監(jiān)督的方法,無監(jiān)督的圖像分類方法省略了人為標(biāo)注的過程,但由于其分類精度無法令人滿意,因此應(yīng)用水平較低。目前基于深度表示學(xué)習(xí)的方法展現(xiàn)了更好的數(shù)據(jù)擬合能力[12],但訓(xùn)練神經(jīng)網(wǎng)絡(luò)所需的海量監(jiān)督信息是極化SAR圖像分類任務(wù)中所不具備的。在大量機(jī)器學(xué)習(xí)經(jīng)典算法中,支持向量機(jī)[13]方法因其在小樣本情況下表現(xiàn)出很好的學(xué)習(xí)能力和泛化能力,在極化SAR圖像分類中的應(yīng)用最為廣泛[14,15]。但是,原始的C-SVM(Support Vector Machine)通過求解兩類之間的最大間隔來確定分類超平面,其分類效果很容易受到噪聲和樣本采樣區(qū)域的影響[16],因此魯棒SVM一直以來被廣泛的研究[17,18],但多數(shù)研究是以大幅提高算法復(fù)雜度為代價(jià)得到的魯棒算法[19,20]。Huang等人[21]提出的基于Pinball損失函數(shù)支持向量機(jī)Pinball loss Support Vector Machine (Pin-SVM),通過求解最大分位數(shù)距離,在較小的復(fù)雜度下提高分類器的穩(wěn)定性和魯棒性。
本文從契合實(shí)際應(yīng)用環(huán)境的角度,提出一種基于Pin-SVM的極化SAR圖像分類方法。算法利用融合后的極化SAR圖像的散射和紋理特征,使用網(wǎng)格搜索與交叉驗(yàn)證結(jié)合的方式[22]尋找最優(yōu)超參數(shù)組合,求解最大分位數(shù)距離以確定SVM的分類超平面,以較低的算法復(fù)雜度實(shí)現(xiàn)對特征噪聲和重采樣具有較好魯棒性的極化SAR圖像分類。
Huang等人[21]根據(jù)分位數(shù)距離求解分類間隔,基于Pinball損失函數(shù)使分位數(shù)距離最大化。Pinball損失函數(shù)通過對正確分類的樣本附加一定的懲罰以提高對特征噪聲及重采樣的不敏感性,Pinball損失函數(shù)的表達(dá)式為
將式(2)帶入到式(1)中可得Pin-SVM的基本形式
從而可以得到Pin-SVM的另一種表達(dá)形式
根據(jù)這3個(gè)被標(biāo)記的集合,可以將式(7)轉(zhuǎn)化為
圖1 0-1損失、Hinge損失與Pinball損失的對比Fig. 1 The form of 0-1 loss, Hinge loss and Pinball loss
圖2 不同超參數(shù)取值下Pin-SVM分類示意圖Fig. 2 Schematic diagram of Pin-SVM classification with different hyperparameter
通過對極化SAR圖像的極化特性與紋理特性進(jìn)行分析,本文利用極化協(xié)方差矩陣多成分目標(biāo)分解[24],H-A-分解[25]以及灰度共生矩陣[26]方法分別提取常用的12種極化特征和紋理特征,并構(gòu)成極化SAR圖像分類的原始特征集
在對特征向量進(jìn)行訓(xùn)練之前,首先需要對特征向量中的每一種特征進(jìn)行加權(quán)優(yōu)化處理,以提高多種特征融合表達(dá)的效果。然而,如果采用人工分配的方法進(jìn)行加權(quán),工作量很大,而且很難保證分類結(jié)果的可信度,因此,本文采用歸一化巴氏距離對特征向量進(jìn)行加權(quán)處理。巴氏距離[27]描述的是某一特征對兩類地物的可區(qū)分度,如果巴氏距離較大,則該特征可以很好的區(qū)分這兩類地物,如果巴氏距離較小,則這兩類地物在該特征中很難區(qū)分。巴氏距離的表達(dá)式為
非參數(shù)模型的建模機(jī)理導(dǎo)致了超參數(shù)對支持向量機(jī)的泛化能力有很大影響。本文采用的核函數(shù)方法為高斯核函數(shù),主要考慮對線性不可分的樣本集合引入的誤差懲罰參數(shù)、高斯核參數(shù)和影響分位數(shù)距離的變量對分類器的影響。
使用網(wǎng)格搜索法與交叉驗(yàn)證法結(jié)合的方式進(jìn)行超參數(shù)選擇。首先利用網(wǎng)格搜索法確定各參數(shù)的選擇范圍:誤差懲罰參數(shù)有種選擇,高斯核參數(shù)有種選擇,參數(shù)有種選擇,將3種參數(shù)交叉組合可以得到種組合方式。然后利用交叉驗(yàn)證法將全部訓(xùn)練樣本分成10份,每次將訓(xùn)練樣本集合中的1份樣本作為訓(xùn)練集,其余9份樣本作為測試集,重復(fù)10次上述過程,并根據(jù)平均分類精度的大小來選擇最優(yōu)的超參數(shù)組合。
本文提出的分類算法的流程圖如圖3所示,算法具體的操作步驟如下:
步驟1 使用精致LEE濾波[28]對原始極化SAR數(shù)據(jù)進(jìn)行相干斑過濾;
步驟2 將極化SAR圖像的典型地物進(jìn)行人工標(biāo)注,并在每一類地物中隨機(jī)抽取一部分樣本構(gòu)成訓(xùn)練集和測試集;
步驟3 通過極化目標(biāo)分解和灰度共生矩陣提取極化SAR圖像的極化特征和紋理特征,構(gòu)成目標(biāo)的原始特征向量;
步驟4 根據(jù)每一種特征的歸一化巴氏距離,對原始特征向量進(jìn)行加權(quán)處理得到融合后的特征向量;
圖3 基于Pin-SVM的極化SAR圖像分類流程Fig. 3 Flowchart of PolSAR classification based on Pin-SVM
步驟5 在訓(xùn)練集上采用網(wǎng)格搜索與十折交叉驗(yàn)證結(jié)合的方法,在指定的參數(shù)范圍內(nèi)搜索Pin-SVM的最優(yōu)超參數(shù)組合,訓(xùn)練得到Pin-SVM;
步驟6 利用最終得到的Pin-SVM,在測試集上得到算法的分類精度,并對極化SAR圖像進(jìn)行全圖分類。
實(shí)驗(yàn)采用的數(shù)據(jù)是EMISAR在Foulum地區(qū)獲取的L波段全極化協(xié)方差矩陣數(shù)據(jù),該圖像的大小為1100×750,空間分辨率為2 m×2 m,其光學(xué)圖與Pauli分解的偽彩色RGB合成圖分別如圖4(a)和圖4(b)所示,該地區(qū)主要包括建筑物、森林、裸地以及豌豆、馬鈴薯、油菜、小麥等很多不同種類的農(nóng)作物。通過大致比對光學(xué)圖,把整幅圖像劃分為5類:建筑物、森林、裸地、細(xì)徑作物和闊葉作物,選取的地物類別分布如圖4(c)所示。
實(shí)驗(yàn)中從每類地物選取1200個(gè)像素進(jìn)行人工標(biāo)注,并從中隨機(jī)取出100個(gè)樣本作為訓(xùn)練集,其余樣本作為測試集。本文選取高斯核函數(shù),采用網(wǎng)格搜索與十折交叉驗(yàn)證法選擇最優(yōu)的參數(shù)組合C,和,最后根據(jù)“一對一”多分類策略對EMISAR數(shù)據(jù)進(jìn)行全圖分類,Pin-SVM分類結(jié)果如圖5(a)所示。可以看出,Pin-SVM對EMISAR圖像的分類效果較好,左側(cè)和右上角的森林區(qū)域用黃色很好地標(biāo)注出來,右上角和右下角的“楓葉形”和“馬蹄形”建筑區(qū)域的輪廓較為清晰,裸地也表現(xiàn)出清晰的紋理。兩種農(nóng)作物之間有少數(shù)像素誤分,但整體上能夠與森林和建筑物清晰劃分??梢詮膬蓚€(gè)角度分析,從極化特征的角度,因?yàn)樯趾徒ㄖ飬^(qū)域散射隨機(jī)性較強(qiáng),散射機(jī)理較為復(fù)雜,極化散射熵值較高,各向異性度值較小,而兩種農(nóng)作物散射機(jī)理較為單一,極化散射熵值較小,各向異性度值較高;從紋理特征的角度,農(nóng)作物區(qū)域地形較為均勻,表現(xiàn)為粗紋理,而森林和建筑物區(qū)域地形復(fù)雜,表現(xiàn)為細(xì)紋理,因此兩種作物區(qū)域的能量ENY和反差距IDM更大,熵ENT、對比度CON、和平均SAV更小。
為了驗(yàn)證本文方法的有效性,采用C-SVM分類器、監(jiān)督Wishart分類器、最小二乘支持向量機(jī)(Least Square SVM, LSSVM)以及基于Hinge損失的極限學(xué)習(xí)機(jī)(OPTimization based Extreme Learning Machine, OPTELM)實(shí)驗(yàn)作為對比模型,對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了分類實(shí)驗(yàn),分類結(jié)果分別如圖5(b)-圖5(e)所示。通過圖5(a)-圖5(e)對比,可以看出基于Pin-SVM和C-SVM分類器的分類結(jié)果圖中各地物的紋理比較清晰,但是C-SVM分類結(jié)果中包含較多雜點(diǎn),Pin-SVM的分類結(jié)果中雜點(diǎn)較少,特別是在森林區(qū)域,C-SVM會將很多森林區(qū)域的樣本判定為建筑物,而Pin-SVM對建筑物與森林的分類結(jié)果更好。監(jiān)督Wishart分類器僅僅采用極化相干矩陣進(jìn)行分類,沒有結(jié)合紋理特征和H,A,因此出現(xiàn)將不同地物之間的邊界以及森林區(qū)域有很多誤分為建筑物的現(xiàn)象。LSSVM分類器也同樣出現(xiàn)雜點(diǎn)較多的問題,OPTELM分類器對各地物的劃分效果都不太理想,尤其是建筑物與森林、細(xì)徑作物與闊葉作物出現(xiàn)誤分現(xiàn)象較為明顯。
圖4 Foulum地區(qū)EMISAR實(shí)驗(yàn)數(shù)據(jù)Fig. 4 EMISAR experimental datas of Foulum test site
表1為不同分類器對各地物測試樣本的分類精度對比,分類精度=(分類算法正確分類的樣本點(diǎn)個(gè)數(shù))/(測試樣本像素點(diǎn)個(gè)數(shù)),其中Pin-SVM,C-SVM,監(jiān)督Wishart, LSSVM和OPTELM的整體分類精度分別為91.3%, 86.7%, 84.0%, 84.5%和84.0%。
圖5 EMISAR圖像分類結(jié)果對比Fig. 5 Classification results comparison of EMISAR image
表1 不同分類器對測試樣本的分類精度(%)Tab. 1 Classification accuracy comparison of different classifiers
圖6展示了各地物分類精度的對比圖,從圖中可以看出Pin-SVM對各種類型地物的分類精度均高于C-SVM。綜合全圖分類實(shí)驗(yàn)的結(jié)果可知:相比于傳統(tǒng)的C-SVM分類方法,基于Pin-SVM的分類算法對極化SAR圖像中各類地物均具有更好的性能,整體分類精度也更高。由于二者使用完全一致的特征輸入,而此特征數(shù)據(jù)中必然存在一定程度的噪聲,較高的分類精度也能夠側(cè)面印證提出的算法具有一定的噪聲魯棒性。
圖6 不同分類器對各地物分類精度的對比圖Fig. 6 The comparison of the classification accuracy of different terrains
圖7 分類器預(yù)測的概率密度函數(shù)對比Fig. 7 Comparison of probability density functions for the prediction of classifiers
表2 重采樣實(shí)驗(yàn)結(jié)果Tab. 2 Experimental results of the resampling
圖8給出了法向量w和偏置b穩(wěn)定性的對比,從中可以看出,重采樣后C-SVM的法向量w和偏置b的標(biāo)準(zhǔn)差都大于Pin-SVM,相比C-SVM, Pin-SVM對于重采樣具有更好的魯棒性。
圖8 重采樣的魯棒性評估Fig. 8 Robustness evaluation of resampling
圖9 Pin-SVM的參數(shù)對分類精度的影響Fig. 9 The effect hyperparameters of Pin-SVM on classification accuracy
支持向量機(jī)在小樣本情況下表現(xiàn)出了良好的學(xué)習(xí)能力和泛化能力,在極化SAR圖像分類中應(yīng)用廣泛。但是極化SAR圖像中的噪聲會傳遞至圖像特征以影響C-SVM的分類精度,同時(shí)標(biāo)定樣本的隨機(jī)性會影響C-SVM的分類決策面的穩(wěn)定性,這兩點(diǎn)均不利于實(shí)際應(yīng)用。本文基于Pin-SVM提出一種極化SAR圖像地物分類的新方法,以提高對特征噪聲和重采樣的魯棒性。通過Foulum地區(qū)EMISAR數(shù)據(jù)對提出算法的分類精度、重采樣穩(wěn)定性、噪聲不敏感性和類內(nèi)離散程度等方面進(jìn)行實(shí)驗(yàn)分析,結(jié)果表明本文算法相對于傳統(tǒng)方法具有更好的地物分類效果,對噪聲和重采樣有更強(qiáng)的魯棒性。