趙 詣,蔣 彌
河海大學(xué)地球科學(xué)與工程學(xué)院,江蘇 南京 211100
土地覆蓋分類作為遙感領(lǐng)域最重要的應(yīng)用分支之一[1],分類結(jié)果從宏觀角度提供了地物的基本信息,在環(huán)境監(jiān)測(cè)、農(nóng)業(yè)管理、城市規(guī)劃等應(yīng)用中不可或缺[2-4]。遙感技術(shù)為大范圍掌握土地覆蓋情況提供了契機(jī)[5],傳統(tǒng)的光學(xué)遙感受天氣等環(huán)境因素制約無(wú)法在多云雨地區(qū)作業(yè)[6]。合成孔徑雷達(dá)(synthetic aperture radar,SAR)能夠全天時(shí)、全天候工作,利用SAR數(shù)據(jù)進(jìn)行土地覆蓋分類逐漸成為研究熱點(diǎn)[7]。自20紀(jì)90年代開始,已有學(xué)者就SAR分類能力展開研究[8],隨后大量研究表明,不同的雷達(dá)參數(shù)能夠提高分類精度[9-11]。此外,當(dāng)獲取多時(shí)相、多極化數(shù)據(jù)時(shí),不同的地物屬性得以更加完整的描述,地物識(shí)別能力得到加強(qiáng)[12-14]。還有許多學(xué)者使用多源數(shù)據(jù)融合光學(xué)和SAR遙感影像更加準(zhǔn)確地分析地物屬性[15-17]。
以上研究已經(jīng)較好地利用雷達(dá)數(shù)據(jù)的優(yōu)點(diǎn)進(jìn)行地物分類,但仍存在不足之處。第一,上述成果主要通過(guò)增加特征數(shù)量達(dá)到提高分類精度的目的,鮮有文獻(xiàn)考慮提取特征對(duì)地物的識(shí)別能力及其估計(jì)的準(zhǔn)確性。文獻(xiàn)[18]表明較分類器而言,輸入特征對(duì)分類精度影響更加顯著;文獻(xiàn)[19]使用不同濾波算法抑制噪聲,研究表明濾波后影像分類精度提高約5%;文獻(xiàn)[20]通過(guò)檢驗(yàn)假設(shè)更加準(zhǔn)確地估計(jì)相干性,分類結(jié)果保持良好的幾何特征,總體精度提高10%。以上研究均表明優(yōu)化特征參數(shù)能獲取精度更高的分類結(jié)果。第二,常用的基于像素分類方法難以保持地物幾何特征,椒鹽現(xiàn)象嚴(yán)重,部分研究考慮分割雷達(dá)影像[21-22],然而SAR影像中大量噪聲導(dǎo)致分割結(jié)果不可靠。最后,隨著新一代Sentinel系列衛(wèi)星發(fā)射,已有學(xué)者驗(yàn)證其分類能力[23-25],但Sentinel-1雙極化特性相關(guān)研究仍不成熟。
針對(duì)上述問題,本文對(duì)輸入特征與分類方法分別進(jìn)行優(yōu)化以期提高分類精度。首先,改進(jìn)極化參數(shù)提取方法,利用光學(xué)影像良好的波譜特性指導(dǎo)SAR影像選取同質(zhì)點(diǎn),取代原有正方形窗口選點(diǎn),估計(jì)極化參數(shù);其次,使用面向?qū)ο蟮姆诸惼?,將光學(xué)影像分割結(jié)果應(yīng)用于極化SAR分類;最后,評(píng)估Sentinel-1/2融合地表分類精度,并與現(xiàn)行基于像元的分類方法進(jìn)行對(duì)比,論證本文方法的可行性。
(1)
(2)
(3)
為了抑制噪聲,目標(biāo)分解通常使用正方形滑動(dòng)窗口平均鄰域像素。假設(shè)中心像素和鄰域像素屬于同一地物,然而實(shí)際應(yīng)用中滑動(dòng)窗口內(nèi)包含了大量異質(zhì)點(diǎn),直接平均影響地物統(tǒng)計(jì)特性,導(dǎo)致極化參數(shù)估計(jì)存在誤差且易出現(xiàn)分辨率損失,地物邊緣模糊等現(xiàn)象,在紋理豐富區(qū)域如城市、農(nóng)田區(qū)域這一問題更加嚴(yán)重。就如何選取同質(zhì)點(diǎn),國(guó)內(nèi)外學(xué)者從像素相似性和統(tǒng)計(jì)意義等不同角度提出大量算法[32-33]。這些方法計(jì)算了像素分布特性,通過(guò)假設(shè)檢驗(yàn)從SAR影像中直接選取同質(zhì)點(diǎn)。相比SAR影像,地物在光學(xué)影像中幾何特征和紋理信息更加顯著,因此本文從光學(xué)影像選取同質(zhì)點(diǎn)指導(dǎo)極化參數(shù)估計(jì)。
不同地物在灰度直方圖中具有不同的峰值,文獻(xiàn)[34]首先提出一種基于灰度直方圖的圖像分割方法,通過(guò)迭代計(jì)算閾值區(qū)分地物,隨后不同學(xué)者提出了大量的改進(jìn)方法[35-36]。然而閾值分割僅通過(guò)灰度直方圖將像素分為不同類型,不能直接用于中心像素的同質(zhì)點(diǎn)選擇。由于同質(zhì)像素各類屬性相似,因此本文使用歐氏距離作為判別標(biāo)準(zhǔn)。首先計(jì)算中心像素與鄰域像素的距離,將同質(zhì)點(diǎn)選擇問題轉(zhuǎn)換為閾值分割問題。為了避免“同譜異物”和“同物異譜”現(xiàn)象的干擾[37],試驗(yàn)選擇小尺寸滑動(dòng)窗口,在小窗口內(nèi)地物種類較少,通過(guò)閾值能夠準(zhǔn)確區(qū)分。
(1) 首先在光學(xué)和SAR影像相同位置選擇同樣大小滑動(dòng)窗口,計(jì)算中心像素與窗口內(nèi)各像素間的歐氏距離
(4)
式中,dp,c表示像素p與中心像素c的距離;xpi、xci分別表示像素p和中心像素c的第i個(gè)波段觀測(cè)值;N為影像總波段數(shù)量。
(2) 假設(shè)初始閾值T=T0為窗口內(nèi)所有像素距離均值。
(4) 重復(fù)迭代步驟(3)直至T不再變化,最終所有距離小于T的像素被選為同質(zhì)點(diǎn)。
圖1為同質(zhì)點(diǎn)選擇(a)和直方圖閾值分割結(jié)果(b),其中符號(hào)*和?分別代表中心像素與選中的同質(zhì)點(diǎn),多次模擬試驗(yàn)表明迭代閾值同質(zhì)點(diǎn)誤選率低于0.1。
圖1 同質(zhì)點(diǎn)選擇與直方圖分割結(jié)果Fig.1 Results of homogeneous pixels selection and threshold segmentation
雖然上述理論分析能夠更加準(zhǔn)確地提取極化參數(shù),但噪聲影響、分辨率損失依然存在,若直接作為輸入變量參與分類,特別是基于像素的分類方法,分類精度會(huì)因此衰減[38]。使用面向?qū)ο蟮姆诸惙椒軌蛞种圃肼曈绊?,分類結(jié)果能夠保持良好的幾何特征[39]。在眾多分割方法中,多尺度分割[40]根據(jù)影像灰度、紋理特征及像素間背景關(guān)系計(jì)算異質(zhì)性參數(shù)f,將性質(zhì)相同的像素合并為對(duì)象參與分類,分割效果優(yōu)越,如式(5)、式(6)所示
f=ωcol×Δhcol+ωsha×Δhsha
(5)
Δhsha=ωcom×Δhcom+ωsmo×Δhsmo
(6)
式中,Δhcol、Δhsha、Δhcom、Δhsmo分別表示灰度、形狀、精致度、光滑度的特征參數(shù)值;ωcol、ωsha、ωcom、ωsmo分別表示具體描述對(duì)應(yīng)特征的權(quán)重值,且ωcol+ωsha=1,ωcom+ωsmo=1。相比SAR影像,光學(xué)影像灰度和紋理特征更加清晰,因此,本文僅將光學(xué)影像作為分割輸入特征以避免污染紋理,SAR影像采用相同分割,避免相干斑引起的分割錯(cuò)誤。
本文選擇Bakersfield作為研究區(qū)域,該區(qū)域(35°15′N-35°42′N,118°29′W-119°20′W)位于美國(guó)加州南部沙漠,是加州主要城市之一。該地區(qū)地物類型多樣,以城市建筑用地與農(nóng)業(yè)用地為主,紋理復(fù)雜,適合用于檢驗(yàn)本文方法的分類能力。試驗(yàn)區(qū)域地理位置如圖2所示,其中紅色陰影為研究區(qū)域的范圍,紅色線框?yàn)橛跋窀采w范圍。
雷達(dá)數(shù)據(jù)采用Sentinel-1B干涉寬軌模式單視復(fù)數(shù)雙極化影像,極化方式為VH+VV組合,獲取于2017年7月13日,影像方位向和距離向分辨率分別為5 m和20 m。為了避免影像獲取時(shí)間不同對(duì)分類結(jié)果的影響,光學(xué)數(shù)據(jù)選取成像于2017年7月7日的Sentinel-2A1C級(jí)別影像。本文試驗(yàn)僅使用4個(gè)10 m分辨率波段(B2(藍(lán))、B3(綠)、B4(紅)、B8(近紅外))。
在數(shù)據(jù)驗(yàn)證方面,本文采用2011年美國(guó)地質(zhì)勘測(cè)局(USGS)發(fā)布的30 m分辨率全美土地覆蓋類型數(shù)據(jù)集(National Land Cover Database,NLCD)作為真實(shí)地物類型的參考[41]??紤]到NLCD數(shù)據(jù)與試驗(yàn)數(shù)據(jù)時(shí)間間隔長(zhǎng)達(dá)6年,與真實(shí)地物分布情況仍有差異,所以在訓(xùn)練樣本和驗(yàn)證樣本選擇過(guò)程中還參考了高分辨率GoogleEarth光學(xué)影像,以確保樣本獲取的質(zhì)量。
地物類型的定義根據(jù)美國(guó)2011年NLCD數(shù)據(jù)[41],共劃分為7類:水體、濕地、灌木、草地、農(nóng)田、高密度人工建筑及中低密度人工建筑。參照光學(xué)影像和NLCD數(shù)據(jù)隨機(jī)層析抽樣,每類地物各選取15個(gè)樣方作為訓(xùn)練樣本(圖3(a)),檢驗(yàn)樣本由每類10個(gè)樣本構(gòu)成(圖3(b))。
本文使用IDAN濾波算法抑制噪聲[42-43],圖4(b)中仍存在大量噪聲,圖4(c)、(d)比較了使用正方形窗口和利用光學(xué)影像選取同質(zhì)點(diǎn)兩種方法的平滑效果,窗口大小均為11×11。本文提出的方法能夠有效減少邊界模糊現(xiàn)象,部分地物邊緣得到加強(qiáng)。
圖2 研究區(qū)域地理位置Fig.2 Geographic location of study area and data set
圖3 訓(xùn)練樣本和檢驗(yàn)樣本(底圖為Sentinel-2A光學(xué)影像R、G、B:B4、B3、B2)Fig.3 Training sample and validation data(base map: Sentinel-2A optical image R,G,B:B4,B3,B2)
圖4 兩種方法平滑影像效果對(duì)比(VV)Fig.4 Comparison of images averaged using two methods (VV)
進(jìn)一步分析本文方法對(duì)解譯地物屬性的影響。圖5為兩種不同方法所得極化參數(shù)。傳統(tǒng)方法所得結(jié)果無(wú)法保持地物邊緣,白色窗口內(nèi)線狀地物甚至無(wú)法識(shí)別,本文提出的方法能夠有效避免這一現(xiàn)象。在保持地物邊界同時(shí),由于減弱了異質(zhì)點(diǎn)的影響,散射機(jī)制逐漸統(tǒng)一,隨機(jī)性得到抑制,因此極化參數(shù)H顯著降低。優(yōu)化輸入?yún)?shù)對(duì)分類結(jié)果的影響,將結(jié)合分類精度定量分析。
圖5 兩種方法提取極化參數(shù)對(duì)比Fig.5 Comparison of parameters extracted using two methods
由于試驗(yàn)區(qū)范圍較大且地物形狀較為規(guī)則,經(jīng)過(guò)多次試驗(yàn)比較最終確定分割尺度參數(shù)為300,形狀因子和緊致度參數(shù)分別設(shè)為0.6和0.5。原始影像中含有1120萬(wàn)個(gè)像素,經(jīng)過(guò)影像分割后僅剩3853個(gè)對(duì)象,運(yùn)算量大幅減少。局部分割結(jié)果如圖6所示,農(nóng)田、人工建筑等地物均能被準(zhǔn)確分割。
圖6 影像分割局部結(jié)果Fig.6 The results of segmentation at local scale
為確保各類要素在試驗(yàn)數(shù)據(jù)中可分,對(duì)各類地物觀測(cè)值進(jìn)行特征統(tǒng)計(jì),其光譜特征與極化參數(shù)統(tǒng)計(jì)如圖7(a)—(d)所示。可以看出,在光學(xué)影像中農(nóng)作物、草地、灌木及濕地幾類自然植被波譜特征相近,與人工建筑和水體差異顯著;相反,幾類自然地物由于物理結(jié)構(gòu)差異顯著因此通過(guò)后向散射系數(shù)與極化參數(shù)特征能夠輕易區(qū)分,而部分人工建筑與草地、濕地散射機(jī)制相似,以二次散射為主,僅通過(guò)SAR參數(shù)不易區(qū)分。這種光譜特征和散射機(jī)制差異說(shuō)明單個(gè)傳感器不能將所有特征進(jìn)行區(qū)分,而將兩者相結(jié)合,能夠增加特征對(duì)比度,進(jìn)而提高分類精度。
為了獲取穩(wěn)定的分類結(jié)果,避免“維數(shù)災(zāi)難”,本文選擇支持向量機(jī)分類器(support vector machine,SVM)[44-45],使用交叉檢驗(yàn)優(yōu)化RBF核函數(shù),懲罰因子C與核參數(shù)g分別為1和0.125,優(yōu)化精度為91%(圖8)。在分類之前采用Z轉(zhuǎn)換將所有特征進(jìn)行歸一化處理,減小不同特征層數(shù)值范圍差異對(duì)分類精度的影響。
圖7 樣本觀測(cè)值特征統(tǒng)計(jì)Fig.7 Statistics of all classes samples
圖8 SVM參數(shù)優(yōu)化結(jié)果Fig.8 SVM parameter optimization
本文試驗(yàn)結(jié)果分辨率為10 m,相比30 m分辨率NLCD數(shù)據(jù),地物細(xì)節(jié)特征更加豐富,能夠準(zhǔn)確識(shí)別尺寸較小及不連續(xù)分布的地物。NLCD數(shù)據(jù)與試驗(yàn)影像獲取時(shí)間相隔6年,城市范圍擴(kuò)張、植被面積減少等變化對(duì)比光學(xué)影像能夠明顯辨別。為強(qiáng)調(diào)本文分類方法的優(yōu)勢(shì),選取紋理豐富的城市區(qū)域(圖9(a))和濕地區(qū)域(圖9(b))為測(cè)試區(qū)。
定性分析,在兩個(gè)子區(qū)域,面向?qū)ο蟮姆诸惤Y(jié)果更加接近地物在光學(xué)影像中的分布,相比基于像素的分類結(jié)果,地物幾何特征更加規(guī)則??紤]輸入?yún)?shù)對(duì)分類結(jié)果的影響,從圖9中可以看出,兩種數(shù)據(jù)源所得結(jié)果并無(wú)明顯差異,僅有部分中低密度人工建筑和濕地分類存在分歧。對(duì)比光學(xué)影像,改進(jìn)參數(shù)所得結(jié)果更加合理。這一現(xiàn)象可以歸因于影像分割時(shí),已將同質(zhì)像素合并作為整體分析,噪聲得到抑制,因此未能體現(xiàn)參數(shù)質(zhì)量的重要性。對(duì)極化參數(shù)改進(jìn)的優(yōu)勢(shì)在基于像素分類時(shí)得以展現(xiàn),高密度人工建筑范圍估計(jì)更加準(zhǔn)確;濕地區(qū)域內(nèi),草地和人工建筑誤分顯著降低,不規(guī)則形狀的灌木和濕地紋理信息得以保持。
定量分析,本文選擇制圖精度、用戶精度及Kappa系數(shù)作為評(píng)價(jià)指標(biāo),基于對(duì)象和像素的分類結(jié)果評(píng)定分別如表1、表2所示。
使用改進(jìn)輸入?yún)?shù)的面向?qū)ο蠓诸惙椒ǐ@得最高總體精度92.6%。就分類方法而言:使用面向?qū)ο蠓诸惙椒〞r(shí),兩種輸入?yún)?shù)所得結(jié)果總體精度均提高8%左右。在各類地物中人工建筑和灌木紋理復(fù)雜,基于像素分類受異質(zhì)性影響嚴(yán)重,因此兩類地物精度最低。影像分割后,減少了異質(zhì)點(diǎn)的影響,對(duì)地物散射特性分析更加準(zhǔn)確,因此分類精度在人工建筑和灌木區(qū)域精度提高更加顯著,這一趨勢(shì)與目視解譯結(jié)果相吻合,也體現(xiàn)了面向?qū)ο蠓诸惙椒ǖ膬?yōu)勢(shì)。就數(shù)據(jù)源而言,如前分析,優(yōu)化輸入?yún)?shù)對(duì)面向?qū)ο蠓诸惥葲]有明顯改變,使用基于像素分類方法時(shí),各地物分類精度均有所提高,在紋理豐富的城市和濕地區(qū)域,精度提高達(dá)到8%。
表1 基于對(duì)象分類方法精度評(píng)估
Tab.1 Assessment of classification accuracy obtained with two kinds of parameters using object-based classifier
類別傳統(tǒng)方法提取參數(shù)本文方法優(yōu)化參數(shù)制圖精度/(%)用戶精度/(%)制圖精度/(%)用戶精度/(%)高密度人工建筑10059.110069.1中低密度人工建筑84.710085.7100水體81.066.282.784.3農(nóng)田10091.710093.6草地90.190.110090.8灌木88.010089.1100濕地79.210072.9100總體精度/(%)90.192.6Kappa系數(shù)0.890.91
表2 基于像素分類方法精度評(píng)估
Tab.2 Assessment of classification accuracy obtained with two kinds of parameters using pixel-based classifier
類別傳統(tǒng)方法提取參數(shù)本文方法優(yōu)化參數(shù)制圖精度/(%)用戶精度/(%)制圖精度/(%)用戶精度/(%)高密度人工建筑60.265.285.386.2中低密度人工建筑85.353.480.591.3水體64.367.585.270.0農(nóng)田50.471.196.371.6草地90.790.386.196.4灌木50.280.950.690.7濕地70.410088.690.8總體精度/(%)79.886.6Kappa系數(shù)0.740.84
綜合各數(shù)據(jù)的分類結(jié)果及精度評(píng)價(jià),可以看出,使用本文方法提取的輸入?yún)?shù)在紋理豐富區(qū)域優(yōu)勢(shì)顯著;面向?qū)ο骃VM分類方法能夠有效區(qū)分離散分布的地物,提高分類的精度,保持地物幾何特性。利用此法,繪制的研究區(qū)整體土地覆蓋類型分布如圖10所示。
相干斑噪聲和有限的空間分辨率制約了合成孔徑雷達(dá)獲得可靠的地物分類結(jié)果。本文提出了一種利用光學(xué)影像優(yōu)化極化參數(shù)的面向?qū)ο蠓诸惙椒?,同時(shí)結(jié)合兩種數(shù)據(jù)源優(yōu)點(diǎn)改善分類效果。本文方法的優(yōu)勢(shì)在于:
圖9 不同輸入特征和不同分類方法組合的分類結(jié)果比較Fig.9 Land cover classification maps obtained with different input variables
圖10 使用改進(jìn)參數(shù)的面向?qū)ο蠓诸惤Y(jié)果Fig.10 Object-based classification result using refined parameters
(1) 利用光學(xué)影像較高的光譜分辨率指導(dǎo)SAR影像選取同質(zhì)像素,避免了噪聲的干擾,較傳統(tǒng)的正方形窗口,剔除異質(zhì)點(diǎn)后極化參數(shù)估計(jì)更加準(zhǔn)確,提高了對(duì)地物特性的分析能力。
(2) 結(jié)合極化特征和光譜信息,相似地物得以區(qū)分,彌補(bǔ)了光學(xué)和SAR影像各自的不足。同時(shí)利用光學(xué)影像分割結(jié)果,地物幾何特征得以保留,在紋理復(fù)雜的城市和濕地區(qū)域分類表現(xiàn)卓越。
使用Sentinel 1/2數(shù)據(jù)進(jìn)行驗(yàn)證,分類精度提高約10%,試驗(yàn)結(jié)果展現(xiàn)出了Sentinel-1 SAR和Sentinel-2光學(xué)影像在大尺度范圍內(nèi)土地覆蓋分類方面的巨大潛力。雖然本文方法能夠有效提高分類精度,保持地物邊緣信息,但僅使用了一個(gè)時(shí)相的數(shù)據(jù),未結(jié)合時(shí)變的物候信息,因而造成部分農(nóng)作物與其他地物誤分現(xiàn)象。結(jié)合多時(shí)相數(shù)據(jù)和多源數(shù)據(jù),揭示地物在不同季節(jié)下的特性將成為今后的研究主題。
致謝:歐洲空間局通過(guò)哥白尼計(jì)劃提供Sentinel系列衛(wèi)星數(shù)據(jù);美國(guó)地質(zhì)調(diào)查局USGS提供全美土地類型數(shù)據(jù)