盛 君 王 杰 孫 策 洪年祥 高亞萍
(1.杭州天圖地理信息技術(shù)公司 浙江杭州 310012;2.浙江省測繪科學(xué)技術(shù)研究院 浙江杭州 310000)
近年來,隨著我國航空工業(yè)的飛速發(fā)展,高分辨率航空遙感影像在各行業(yè)與領(lǐng)域中不斷應(yīng)用。作為空間地理實(shí)體與要素中的重要組成部分,在人們?nèi)粘Ia(chǎn)生活中具有重要作用。將高分辨率遙感影像與河流信息聯(lián)系起來,充分利用河流信息在高分辨率遙感影像中的空間分布特征提取河流信息具有重要的應(yīng)用價(jià)值。
基于高分辨率遙感影像的河流信息提取方法研究經(jīng)歷了兩個(gè)階段:一是基于像元的方法,這類方法是將研究對象細(xì)化為每一個(gè)像元,主要包括決策樹、多波段譜間關(guān)系法和最大似然法等[1-3]。這類方法的缺陷是只考慮單個(gè)像元,沒有考慮像元之間的關(guān)系,使得河流信息提取效果不明顯。二是基于面向?qū)ο蟮姆椒?,這類方法在研究像元本身的基礎(chǔ)上,考慮了像元鄰近范圍內(nèi)的空間形態(tài)特征[4]。首先,根據(jù)光譜差異對像元進(jìn)行分簇,實(shí)現(xiàn)影像分割,然后通過不同算法對分割對象進(jìn)行分類與檢測[5]。付勇勇等[6]基于面向?qū)ο蠓治黾夹g(shù),提出一種選取最佳分割尺度和特征規(guī)則的方法,采用高分二號(GF-2)遙感影像數(shù)據(jù)提取河流信息,能夠有效地提取復(fù)雜水網(wǎng)平原水體信息;李艷華等[7]使用基于規(guī)則的面向?qū)ο蟮姆椒▽?shí)現(xiàn)了對山區(qū)細(xì)小水體的精確化提取,并利用形態(tài)學(xué)膨脹濾波及Pavlidis異步細(xì)化算法對提取的細(xì)小水體進(jìn)行后處理,最終得到細(xì)小河流的矢量化水系圖;黃帥等[8]以GF-1遙感影像為數(shù)據(jù)源,基于面向?qū)ο蟮暮恿餍畔⑻崛》椒ㄌ崛『恿餍畔?,提取結(jié)果較最大似然分類法更好。隨著機(jī)器學(xué)習(xí)分類器算法的不斷發(fā)展,基于面向?qū)ο蠛恿餍畔⑻崛〉臏?zhǔn)確率也得到相應(yīng)的提高,但仍存在河流提取結(jié)果中斷、河流識別率低等問題。本文充分發(fā)掘遙感影像中多特征融合的優(yōu)勢,提出了一種基于多特征融合的河流信息提取方法,并通過試驗(yàn)對提出的方法進(jìn)行驗(yàn)證。
河流、湖泊水體在紅外遙感影像中表現(xiàn)為藍(lán)黑色或紅色,在真彩色影像中表現(xiàn)為綠色或墨色,這種顏色上的差異有助于目視判別。本文根據(jù)水體在水體指數(shù)、陰影水體指數(shù)、紋理特征和顏色特征方面與遙感影像中其他地理要素的差異,對初始水體進(jìn)行檢測,然后通過對提取水體邊界進(jìn)行優(yōu)化得到最終水體檢測結(jié)果,技術(shù)路線如圖1所示。
圖1 水體檢測技術(shù)路線
水體信息對近紅外波段具有較強(qiáng)的吸收特性,對綠色波段具有較強(qiáng)的反射特征,根據(jù)這種特征差異性可以有效提取水體信息,抑制背景地物。根據(jù)二者的具體吸收與反射量化值可計(jì)算得到歸一化差異水體指數(shù)(NDWI)[10]。NDWI閾值可根據(jù)具體影像區(qū)域的特征進(jìn)行設(shè)置。
(1)
式中:b1、b4分別為綠波段和近紅外波段的亮度值。
為了得到較為“干凈”的水體信息,需要濾除陰影信息??梢酝ㄟ^構(gòu)建陰影水體指數(shù)(SWI)的方式區(qū)分陰影信息[11]。
SWI=b1+b2-b4
(2)
式中:b1、b2、b4分別為綠波段、藍(lán)波段和近紅外波段的亮度值。
遙感影像中,水體區(qū)域紋理信息通常較為均勻與平緩,表現(xiàn)出較強(qiáng)的噪聲抵抗力,而非水體區(qū)域地理要素的紋理信息則較為豐富。因此,可根據(jù)水體與其他地理要素紋理特征的區(qū)別進(jìn)行水體信息提取。本文使用線性反投影算法(Local Binary Patterns,LBP)進(jìn)行紋理特征提取。LBP算法對影像旋轉(zhuǎn)、變形及強(qiáng)度變換具有一定的不變性,能夠提取影像不同尺度的局部特征。LBP算法實(shí)現(xiàn)紋理特征提取的方法[11]:首先,創(chuàng)建3×3像素窗口,比較鄰域像素值與窗口中心像素值大小,若鄰域像素值大于窗口中心像素值,則將該鄰域位置標(biāo)記為1,否則標(biāo)記為0,最終得到8個(gè)0與1;其次,將0與1排列得到一個(gè)二進(jìn)制數(shù)據(jù),轉(zhuǎn)換此二進(jìn)制數(shù)后的十進(jìn)制數(shù)即為中心要素局部紋理值,如圖2所示。局部紋理值可有效表現(xiàn)出不同地理要素紋理特征。
圖2 基于LBP算法的紋理特征提取
在遙感影像中,水體區(qū)域的顏色通常表現(xiàn)為偏綠或偏黃。為了量化地理要素的顏色特征,計(jì)算顏色特征值,假設(shè)影像波段號為i,則第i波段像素均值為
(3)
式中:mi為像素均值,pi,j為像素值,n為像素個(gè)數(shù)。
影像離散程度可表示為
(4)
水體與非水體區(qū)域通常很難通過單一特征來反映,本文采用特征值串聯(lián)的方式將多特征量化值進(jìn)行融合,以充分挖掘水體區(qū)域信息。因上述特征量化的數(shù)據(jù)級別不同,故在基于特征進(jìn)行影像分類前需要對多種特征數(shù)據(jù)進(jìn)行歸一化處理,避免不同特征在分類時(shí)相互影響。特征向量x歸一化后的特征值yi為
(5)
式中:xi為特征向量值;xmin、xmax分別為x的最小值和最大值。
遙感影像中,特征影像的總維數(shù)就是顏色特征中的2個(gè)特征值、紋理特征中的1個(gè)特征值、水體指數(shù)中的1個(gè)特征值及陰影水體指數(shù)中的1個(gè)特征值的和。
水體邊界提取其實(shí)就是一種影像二分類,通常使用隨機(jī)森林(RF)分類器、極限學(xué)習(xí)分類器、支持向量機(jī)(SVM)和AdaBoost集成分類器等[12]進(jìn)行影像二分類。本文根據(jù)遙感影像中的不同特征,使用分類器進(jìn)行水體邊界提取試驗(yàn)。本文通過對隨機(jī)森林(RF)分類器、極限學(xué)習(xí)分類器、支持向量機(jī)(SVM)和AdaBoost集成分類器進(jìn)行試驗(yàn)對比分析,以選擇合適的分類器。水體檢測精度通常用準(zhǔn)確率A、精確率P及召回率R來評價(jià)?;谏鲜?種分類器對水體的提取精度如表1所示。
表1 4種不同分類器提取的水體精度單位:%Tab.1 Precision of Water Body Extracted by Four Classifiers試驗(yàn)精度指標(biāo)RF極限學(xué)習(xí)分類器SVMAdaBoost試驗(yàn)1A91.7494.2192.3593.02P82.0484.6883.1583.21R79.1081.3479.2479.83試驗(yàn)2A89.5693.7290.7891.27P82.1383.3081.6782.42R78.2780.1077.4079.02
由表1可知,試驗(yàn)1中極限學(xué)習(xí)機(jī)分類器的準(zhǔn)確率A、精確率P及召回率R分別為94.21%、84.68%、81.34%,試驗(yàn)2中準(zhǔn)確率A、精確率P及召回率R分別為93.72%、83.30%、80.10%,相比于其他分類器,極限學(xué)習(xí)機(jī)分類器的水體提取精度更高,表明極限學(xué)習(xí)機(jī)分類器更適用于本文提出的多種融合特征的河流信息提取方法。
使用分類器檢測待檢測遙感影像中的所有對象,得到初始水體檢測結(jié)果。初始水體檢測結(jié)果中存在誤檢現(xiàn)象,本文使用顏色空間距離、紋理相似度與角點(diǎn)分布差異3種判斷依據(jù),剔除錯(cuò)誤匹配對象。
2.2.1 顏色空間距離
在顏色空間中定義:
(6)
式中:DRGB,q為水體區(qū)域與待確定對象的顏色空間距離,mi為該影像對象的均值向量。
指數(shù)函數(shù)PRGB=10DRGB,q,將其作為距離閾值,若計(jì)算顏色空間距離大于該閾值,表明待檢測對象非水體。
2.2.2 紋理相似度
首先定義水體對象與待檢測對象在紋理空間中的距離,通過比較計(jì)算距離與紋理距離閾值的大小判斷待確定對象是否為水體。紋理距離閾值PLBP可表示為
PLBP=10DLBP,q
(7)
式中:DLBP,q為水體對象與待確定對象的距離,也是待確定對象紋理特征值mLBP,q與紋理均值mLBP的差值。
2.2.3 角點(diǎn)分布差異
水體區(qū)域在遙感影像中的表現(xiàn)通常較為平坦,水體對象的角點(diǎn)特征數(shù)量少,而非水體區(qū)域的角點(diǎn)特征數(shù)量相對較多,故可基于角點(diǎn)分布的差異來判斷待確定對象是否為水體。角點(diǎn)分布指標(biāo)mc.q為某待確定對象的角點(diǎn)總數(shù)N與像素總數(shù)S的比值,其中角點(diǎn)特征通過MinEigen算子提取得到。
若存在面積較大的待確定對象,需要選擇并計(jì)算5個(gè)子區(qū)域角點(diǎn)分布指標(biāo)均值mc,則角點(diǎn)分布差異Dc,q可表示為
Dc,q=|mc,q-mc|
(8)
角點(diǎn)分布判斷依據(jù)Pc=10Dc,q,若N>Pc,則表示待確定對象為水體對象。通過不斷試驗(yàn),當(dāng)N=2.2時(shí),水體提取效果最好。
2.2.4 投票決策
本文根據(jù)顏色空間距離、紋理相似度與角點(diǎn)分布差異3種特征之和判斷依據(jù),基于軟投票方法判斷待確定對象,決策函數(shù)為
P=PLBP+PRGB+Pc
(9)
設(shè)置投票閾值T,當(dāng)待確定對象的投票值P小于閾值T時(shí),將對象標(biāo)記為水體區(qū)域,否則標(biāo)記為非水體區(qū)域。經(jīng)過多次試驗(yàn),當(dāng)投票閾值T=2.5時(shí),水體檢測效果最好。
為了對基于多特征融合的河流信息提取方法的有效性及優(yōu)越性進(jìn)行檢驗(yàn),本文選取某地2019年高分辨率遙感影像作為數(shù)據(jù)源進(jìn)行試驗(yàn)驗(yàn)證,使用準(zhǔn)確率A、精確率P及召回率R來評價(jià)提取結(jié)果。其中,準(zhǔn)確率A表示提取正確樣本占總樣本的比例;精確率P表示正確提取為水體的樣本占總水體樣本的比例;召回率R表示正確提取為水體的樣本占提取出水體樣本的比例。3種評價(jià)指標(biāo)可表示為[13]
(10)
式中:FN為非水體中錯(cuò)誤判斷像素?cái)?shù)量,TN為非水體中正確判斷的像素?cái)?shù)據(jù),F(xiàn)p為水體中錯(cuò)誤判斷的像素?cái)?shù)量,Tp為水體中正確判斷的像素?cái)?shù)量。
影像數(shù)據(jù)分辨率為0.5 m,影像大小均為6 908個(gè)像素×7 300個(gè)像素。在樣本數(shù)據(jù)訓(xùn)練中,為了得到更多樣本數(shù)據(jù),對訓(xùn)練數(shù)據(jù)進(jìn)行平移和旋轉(zhuǎn)。
依次提取遙感影像中的多種特征,構(gòu)建五維特征空間向量,使用極限學(xué)習(xí)機(jī)分類器進(jìn)行訓(xùn)練。選擇一組高分辨率遙感影像數(shù)據(jù)作為試驗(yàn)數(shù)據(jù),使用訓(xùn)練后得到的模型對試驗(yàn)數(shù)據(jù)中的水體區(qū)域進(jìn)行檢測,結(jié)果如圖3所示。
圖3 遙感影像水體檢測結(jié)果
由圖3可知,初始水體檢測結(jié)果中包含較多的高大建筑物和樹木的陰影信息,通過軟投票法有效去除了陰影的干擾,得到優(yōu)化后的水體檢測信息。初始水體檢測結(jié)果及優(yōu)化后水體檢測結(jié)果的精度統(tǒng)計(jì)如表2所示。
表2 水體初始檢測結(jié)果與優(yōu)化后結(jié)果精度統(tǒng)計(jì) 單位:%Tab.2 Accuracy Statistics of Initial Detection Results and Optimized Results of Water Body檢測結(jié)果APR初始檢測90.2486.6478.87優(yōu)化后檢測94.7591.2290.84
由表2可知,初始水體檢測結(jié)果中,相比于精確率與召回率,準(zhǔn)確率更高,為90.24%,是由于初始水體檢測中的誤檢和漏檢現(xiàn)象較為嚴(yán)重。通過軟投票法對初始水體檢測結(jié)果進(jìn)行優(yōu)化,優(yōu)化后的水體檢測結(jié)果無論是正確率、精確率還是召回率都有了一定程度的提升,其中召回率的提升率最高,從而驗(yàn)證了本文提出的基于多特征融合的河流信息提取方法的有效性及優(yōu)越性。
本文提出的高分辨率遙感影像多特征融合的河流信息提取方法,充分考慮了遙感影像中的多種空間特征,通過極限學(xué)習(xí)機(jī)分類器結(jié)合軟投票法提取河流信息,并進(jìn)行了試驗(yàn)驗(yàn)證。
結(jié)果表明,與初始水體檢測結(jié)果相比,使用軟投票算法優(yōu)化后的水體檢測結(jié)果無論是在準(zhǔn)確率、精確率還是召回率上都有了一定程度的提高,有效抑制陰影信息的干擾。由于本文使用的試驗(yàn)數(shù)據(jù)有限,得到的結(jié)果還有待進(jìn)一步驗(yàn)證,下一步將擴(kuò)大范圍,進(jìn)行整個(gè)流域或更大范圍的河流水系提取研究,同時(shí)將本文方法應(yīng)用于遙感影像中其他地理要素的識別與檢測等。