許 凱,張倩倩,王彥華,劉福江,秦 昆
1. 中國(guó)地質(zhì)大學(xué)(武漢)信息工程學(xué)院,湖北 武漢 430074; 2. 武漢大學(xué)遙感信息工程學(xué)院,湖北 武漢 430079
多源遙感影像濕地檢測(cè)概率潛在語(yǔ)義分析
許 凱1,張倩倩1,王彥華1,劉福江1,秦 昆2
1. 中國(guó)地質(zhì)大學(xué)(武漢)信息工程學(xué)院,湖北 武漢 430074; 2. 武漢大學(xué)遙感信息工程學(xué)院,湖北 武漢 430079
提出了一種基于概率潛在語(yǔ)義分析的多源遙感影像濕地檢測(cè)方法。首先提取高分辨率影像的光譜、紋理和濕地場(chǎng)景的地物組成成分,并結(jié)合由多光譜遙感數(shù)據(jù)提取的濕地地表溫度、土壤含水量,組成濕地場(chǎng)景的特征空間;然后利用概率潛在語(yǔ)義分析將濕地場(chǎng)景表示成多個(gè)潛在語(yǔ)義的組合,并用潛在語(yǔ)義的權(quán)值向量來(lái)描述濕地場(chǎng)景的特征空間;最后利用SVM分類(lèi)器實(shí)現(xiàn)濕地場(chǎng)景的檢測(cè)。試驗(yàn)表明,概率潛在語(yǔ)義分析能夠?qū)竦氐母呔S特征空間映射到低維的潛在語(yǔ)義空間中,地物組成成分和定量環(huán)境特征的加入能更加有效地表征濕地特征空間,提高濕地檢測(cè)精度。
概率潛在語(yǔ)義分析;濕地檢測(cè);語(yǔ)義信息;多源遙感
濕地在調(diào)節(jié)氣候、維持區(qū)域生態(tài)平衡以及提供野生動(dòng)植物棲息地等方面具有重要作用。濕地的類(lèi)型多種多樣,通常分為自然和人工兩大類(lèi)。自然濕地包括沼澤地、泥炭地、湖泊、河流、海灘和鹽沼等,人工濕地主要有水稻田、水庫(kù)、池塘等[1-2]。濕地生態(tài)系統(tǒng)具有覆蓋范圍廣、難以直接接近等特點(diǎn),傳統(tǒng)的地面實(shí)測(cè)方法耗時(shí)長(zhǎng)且效率低,而遙感技術(shù)能夠宏觀、動(dòng)態(tài)地提取地表信息,利用遙感技術(shù)進(jìn)行濕地檢測(cè)和信息提取受到越來(lái)越多國(guó)內(nèi)外學(xué)者的關(guān)注[3-5]。
當(dāng)前,濕地信息提取主要采用的是中、低分辨率的遙感影像[6-7],利用高分辨率遙感影像進(jìn)行濕地信息提取難以得到令人滿意的結(jié)果,主要原因在于:①濕地在高分辨率遙感影像中表現(xiàn)為植被、土壤和水體組成的復(fù)雜場(chǎng)景,無(wú)論是基于像元還是面向?qū)ο蟮姆椒ǘ茧y以得到較完整的提取結(jié)果;②濕地常常與林地、水體和低矮灌木發(fā)生混淆,容易受到“同物異譜”和“異物同譜”現(xiàn)象的干擾[8]。
因此,將高分辨率影像和多光譜影像、SAR等多源遙感數(shù)據(jù)進(jìn)行結(jié)合,能克服單一數(shù)據(jù)源的局限性,提高濕地信息提取的精度[9-11]。并且,利用多源遙感數(shù)據(jù)可以提取土壤含水量、地表溫度、植被指數(shù)等地表環(huán)境參數(shù),使得濕地信息提取的結(jié)果更加準(zhǔn)確[12-14]。
使用多源遙感數(shù)據(jù)容易造成特征維度的增加,帶來(lái)的冗余及噪聲會(huì)降低分類(lèi)過(guò)程的效率,引起分類(lèi)的混淆,并導(dǎo)致分類(lèi)精度降低。面對(duì)多源遙感數(shù)據(jù)的濕地信息提取,如果不能對(duì)高維特征空間進(jìn)行有效的遴選與組合,難以得到令人滿意的精度。概率潛在語(yǔ)義分析(probabilistic latent semantic analysis,pLSA)[15]是一種文本分析方法,可以有效地進(jìn)行特征降維和特征組合,并能夠解決分類(lèi)過(guò)程中的“同物異譜”和“異物同譜”現(xiàn)象,目前已成功應(yīng)用于遙感圖像的識(shí)別和分類(lèi)中[16-17]。
本文將高分辨率遙感影像中的濕地看作是由水體、土壤和低矮灌木等多種地物組成的復(fù)雜場(chǎng)景,結(jié)合LandSat和MODIS等多光譜遙感圖像提取濕地的光譜、紋理、地物組成成分、地表溫度和土壤含水量等特征,利用概率潛在語(yǔ)義分析構(gòu)建濕地場(chǎng)景的語(yǔ)義特征空間,最后利用SVM分類(lèi)器實(shí)現(xiàn)濕地場(chǎng)景的檢測(cè)。
通過(guò)試驗(yàn)表明,pLSA能夠有效地對(duì)濕地的高維特征空間進(jìn)行特征降維和特征組合;土壤含水量、地表溫度等環(huán)境特征的加入能更加有效地表征濕地特征,提高濕地檢測(cè)精度。
pLSA是Hoffman針對(duì)潛在語(yǔ)義分析(latent semantic analysis,LSA)提出的一種數(shù)據(jù)生成模型,其基本思想是根據(jù)詞匯表中單詞出現(xiàn)的頻率發(fā)掘文本集中的主題[15,18]。假定一組由特征集W={w1,w2,…,wM}描述的目標(biāo)集O={o1,o2,…,oN},并由此組成一個(gè)N×M的特征頻率矩陣N=(n(oi,wj))ij,n(oi,wj)表示特征wj在目標(biāo)oi中出現(xiàn)的頻率。此外,每一對(duì)可視數(shù)據(jù)(oi,wj)與一組潛在成分(主題)Z={z1,z2,…,zK}相關(guān),K為人工指定的一個(gè)常數(shù)。
假設(shè):oi和wj之間是條件獨(dú)立的,并且潛在成分zk在目標(biāo)和特征集上的分布也是條件獨(dú)立的。則用于表述目標(biāo)中特征內(nèi)容的生成模型P(oi,wj)可以通過(guò)式(1)和式(2)計(jì)算得到
(1)
(2)式中,P(oi)表示目標(biāo)oi的出現(xiàn)概率;P(wj|zk)表示潛在成分zk在特征wj上的概率密度;P(zk|oi)表示目標(biāo)oi在潛在成分zk上的概率密度。
根據(jù)極大似然估計(jì),通過(guò)求取式(3)定義的對(duì)數(shù)-似然函數(shù)的極大值,計(jì)算pLSA模型的參數(shù)P(wj|zk)和P(zk|oi)
(3)
在pLSA模型中,極大似然估計(jì)的標(biāo)準(zhǔn)過(guò)程是期望最大(expectation maximization)算法。EM算法交替于兩個(gè)步驟:①E-步,利用當(dāng)前估計(jì)的參數(shù)值計(jì)算潛在成分變量的后驗(yàn)概率;②M-步,基于所給后驗(yàn)概率,更新參數(shù)值。對(duì)于pLSA模型,應(yīng)用貝葉斯公式即可得到E-步,如下
(4)
通過(guò)極大化式(4),重新估計(jì)參數(shù)P(wj|zk)和P(zk|oi),得M-步
(5)
(6)
在使用隨機(jī)數(shù)初始化之后,交替實(shí)施E步驟和M步驟進(jìn)行迭代計(jì)算,直至式(7)定義的E(L)達(dá)到收斂。
(7)
2.1 試驗(yàn)區(qū)概況
試驗(yàn)區(qū)選擇湖北省孝感市大悟縣,獲取2014年3月Quickbird高分辨率影像,大小為8310×3945像素,面積為11 834.945 km2。同時(shí)獲取與高分辨率影像對(duì)應(yīng)的同時(shí)期的LandSat 8和MODIS影像,多源遙感數(shù)據(jù)的詳細(xì)信息以及在濕地檢測(cè)中的作用如表1所示。
表1 多源遙感數(shù)據(jù)
為了在提高影像空間分辨率的同時(shí)保留圖像的光譜信息,采用Gram-Schmidt圖像融合方法,分別將Quickbird影像和LandSat 8影像的近紅外、紅光和綠光通道與全色波段進(jìn)行融合,該方法能夠較好保持空間紋理信息,在損失信息量較少的前提下,保留圖像的光譜信息。獲得空間分辨率為0.61 m和15 m分辨率的融合后影像,如圖1所示。
圖1 試驗(yàn)區(qū)影像Fig.1 Images for experiment
試驗(yàn)區(qū)內(nèi)主要地物為:道路、居民地、低矮灌木、林地、湖泊、河流等??紤]到城市濕地受人類(lèi)影響的特殊性和復(fù)雜性,本文所檢測(cè)的城市濕地類(lèi)型主要包含3大類(lèi),如表2所示。
表2 本文所檢測(cè)的城市濕地類(lèi)型
2.2 特征提取
提取圖像光譜、紋理、地物組成成分和地表環(huán)境4種類(lèi)型的特征,如表3所示。
表3 特征及特征描述
2.2.1 紋理特征提取
局部二進(jìn)制模式(local-binary-pattern,LBP)[19]是一種紋理描述算子,該算子計(jì)算局部窗口內(nèi)像素的局部空間結(jié)構(gòu)和灰度反差,并采用統(tǒng)計(jì)分析的方法來(lái)描述紋理。其定義如下
(8)
式中
(9)式中,p表示半徑為R時(shí)鄰域點(diǎn)的個(gè)數(shù);gc為中心點(diǎn)的灰度值;gp為鄰域點(diǎn)灰度值。按照該方法得到的二進(jìn)制模式較多,對(duì)于紋理的表達(dá)不利,因此,本文采用了等價(jià)模式LBP(uniform-pattern LBP)[20],即當(dāng)某個(gè)LBP所對(duì)應(yīng)的循環(huán)二進(jìn)制數(shù)從0到1或從1到0最多有兩次跳變時(shí),該LBP所對(duì)應(yīng)的二進(jìn)制就稱(chēng)為一個(gè)等價(jià)模式類(lèi),其余模式都?xì)w為另一類(lèi),由此得到的二進(jìn)制模式種類(lèi)大大減少,相比GLCM、HOG等方法,得到的特征向量維數(shù)較少,減少了高頻噪聲帶來(lái)的影響且計(jì)算復(fù)雜度低。
對(duì)于高分辨率影像,紋理在不同波段上具有高度的一致性,將各波段影像求均值得到灰度影像,并對(duì)此灰度影像的3×3鄰域進(jìn)行采樣,計(jì)算后得到59維的紋理特征向量。LBP紋理反映了每個(gè)像元與周?chē)裨年P(guān)系,描述了研究區(qū)域內(nèi)濕地的紋理信息。
2.2.2 地物組成成分特征提取
研究區(qū)內(nèi)濕地主要由土壤、水體和低矮灌木3種地物類(lèi)型組成,分析濕地中土壤、水體和低矮灌木這3種地物類(lèi)型的頻率分布有助于表征濕地的地物特征。然而研究區(qū)域除了這3種地物類(lèi)型,還包括不滲水面和林地,為了不影響濕地地物類(lèi)型的統(tǒng)計(jì),同時(shí)分類(lèi)更加精細(xì),本文用決策樹(shù)模型將QuickBird影像分成水體、林地、低矮灌木、裸土和不滲水面5種地物類(lèi)型,如圖2(a)所示。將研究區(qū)內(nèi)的濕地看作是由水體、土壤和低矮灌木等多種地物組成的場(chǎng)景,在圖像場(chǎng)景窗口中分別統(tǒng)計(jì)5類(lèi)地物出現(xiàn)的概率,將其作為濕地場(chǎng)景的地物組成成分特征。對(duì)整個(gè)研究區(qū)以及其中的濕地場(chǎng)景、非濕地場(chǎng)景樣本中的5種地物類(lèi)型分別出現(xiàn)的概率統(tǒng)計(jì)結(jié)果如圖2(b)所示。
圖2 分類(lèi)結(jié)果和不同地物類(lèi)別的概率Fig.2 Classification results and probability of different subclasses
2.2.3 環(huán)境特征提取
濕地具有較茂密的植被和豐沛的水源,因此對(duì)周?chē)h(huán)境有顯著降溫作用,土壤含水量也明顯高于非濕地,本文提取研究區(qū)的地表溫度和土壤含水量作為濕地的環(huán)境特征。由于QuickBird影像只有近紅外、紅、綠和藍(lán)光4波段,無(wú)法反演濕地的環(huán)境特征,因此本文利用同時(shí)期LandSat 8和MODIS影像進(jìn)行濕地地表溫度、土壤含水量等環(huán)境特征的反演。
LandSat 8衛(wèi)星自發(fā)射以來(lái),其TIRS傳感器第11波段的定標(biāo)精度一直達(dá)不到預(yù)定目標(biāo),不適合使用劈窗算法來(lái)對(duì)LandSat 8數(shù)據(jù)做地表溫度反演。因此本文中的地表溫度利用LandSat 8影像和MODIS影像使用單窗算法反演得到[21],如式(10)所示
(10)
式中,Ts是地表溫度;T10為L(zhǎng)andSat 8的TIRS10的亮度溫度;Ta為大氣平均作用溫度(K);K2為常數(shù)1 321.08;ε10表示地表等效比輻射率;τ10表示大氣透過(guò)率。
亮度溫度利用定標(biāo)系數(shù)對(duì)圖像DN值進(jìn)行輻射定標(biāo),將像元的DN值轉(zhuǎn)換為大氣層上界光譜輻射亮度,之后用普朗克公式反推得到,公式如下
(11)式中,K1、K2為常數(shù);L10為大氣層上界光譜輻射亮度。
根據(jù)研究區(qū)所處位置,大氣平均作用溫度選擇中緯度夏季模式的大氣平均作用溫度估算公式,如下所示
Ta=16.011 0+0.926 21T0
(12)式中,T0為研究區(qū)地面觀測(cè)得到的近地表空氣溫度。
地表等效比輻射率的計(jì)算考慮地物由裸土、水體和植被3種地物類(lèi)型組成,通過(guò)3種地物類(lèi)型的組成成分和植被、裸土和水體的比輻射率計(jì)算像元的等效比輻射率,如式(13)所示
ε=εvRvPv+εsRs(1-Pv-Pw)+εwRwPw
(13)
式中,εv、εs、εw分別表示植被、裸土和水體的比輻射率,εv=0.984 4,εs=0.973 1,εw=0.992;Rw、Rv和Rs分別是水體、植被和裸土的溫度比率,根據(jù)經(jīng)驗(yàn)估計(jì)分別取值為0.995 65、0.992 4、1.007 44;Pw和Pv分別是水體和植被在像元內(nèi)的構(gòu)成比例,采用基于NDVI的像元二分模型計(jì)算獲得。
大氣透過(guò)率通過(guò)同時(shí)期的MODIS數(shù)據(jù)反演獲得。利用MODIS數(shù)據(jù)第2和19波段計(jì)算大氣水汽含量,根據(jù)大氣透過(guò)率和大氣水含量之間存在的關(guān)系擬合得到大氣透過(guò)率。
土壤含水量反演使用條件植被溫度指數(shù)(vegetation temperature condition index,VTCI)法,如下
(14)
式中
LSTNDVIi.max=a+b·NDVIi
(15)
LSTNDVIi.min=a′+b′·NDVIi
(16)
式中,LSTNDVIi.max、LSTNDVIi.min分別表示在研究區(qū)內(nèi),當(dāng)NDVI值等于某一特定值時(shí)的地表溫度的最大值和最小值;a、b、a′、b′為待定系數(shù),通過(guò)做研究區(qū)內(nèi)的NDVI和LST的散點(diǎn)圖近似獲得。
VTCI可在理論上解釋為當(dāng)NDVI值相等時(shí),LST差異大小的比率。VTCI的值越小,干旱程度越嚴(yán)重。LSTmax被認(rèn)為是熱邊界(warm edge),在此邊界上土壤水分的有效性很低,干旱程度最為嚴(yán)重;LSTmin為冷邊界(cold edge),在此邊界上土壤水分不是植物生長(zhǎng)的限制因素,因此植被供水指數(shù)可以表征地物的土壤含水量。
將地表溫度和土壤含水量反演結(jié)果進(jìn)行重采樣后和QuickBird影像進(jìn)行配準(zhǔn),并對(duì)地表溫度和土壤含水量反演結(jié)果進(jìn)行聚類(lèi),劃分為5個(gè)等級(jí),如圖3所示。分別統(tǒng)計(jì)每一等級(jí)在濕地場(chǎng)景內(nèi)出現(xiàn)的頻率,將其作為濕地的環(huán)境特征。對(duì)試驗(yàn)區(qū)樣本的環(huán)境特征按照不同等級(jí)的概率進(jìn)行統(tǒng)計(jì),如圖4所示,可以看出濕地和非濕地在環(huán)境特征上是存在顯著差別的。
圖3 濕地環(huán)境數(shù)據(jù)反演結(jié)果Fig.3 Inversion results of environment data in wetland
圖4 環(huán)境特征概率統(tǒng)計(jì)Fig.4 Probability statistics of environment features
2.3 基于pLSA的濕地信息提取
采用目視判別與實(shí)地調(diào)研相結(jié)合的方法,在試驗(yàn)區(qū)圖像上進(jìn)行濕地(正樣本)與非濕地(負(fù)樣本)ground truth的標(biāo)注,分別如圖5(a)和5(b)所示。為了符合正負(fù)樣本實(shí)際分布情況,負(fù)樣本的個(gè)數(shù)要多于正樣本,最終選取的正負(fù)樣本數(shù)分別為204、462個(gè)。按照1∶1的比例分配訓(xùn)練樣本和測(cè)試樣本,分別將其中的102、231個(gè)作為訓(xùn)練,其余的作為測(cè)試。
圖5 試驗(yàn)區(qū)ground truthFig.5 Experimental area ground truth
圖6 Quickbird影像濕地檢測(cè)結(jié)果Fig.6 Wetland detection result from Quickbird image
本文采用查準(zhǔn)率(precision)、查全率(recall)和正確率(accuracy)來(lái)評(píng)價(jià)主題數(shù)目和多種特征的使用對(duì)濕地目標(biāo)檢測(cè)精度的影響[22-23],以及來(lái)衡量本文提出的方法與傳統(tǒng)方法檢測(cè)性能的好壞。其中,查全率反映了濕地檢測(cè)的完整性,查準(zhǔn)率反映了濕地檢測(cè)的準(zhǔn)確度,正確率反映了利用pLSA模型進(jìn)行濕地檢測(cè)的綜合正確性,如式(17)—式(19)所示。為了參照實(shí)際濕地分布情況檢驗(yàn)本文方法的效果,專(zhuān)門(mén)進(jìn)行了針對(duì)試驗(yàn)區(qū)的實(shí)地考察。經(jīng)過(guò)考察在研究區(qū)影像上標(biāo)注為濕地和非濕地區(qū)域的數(shù)目為E和E′,利用本文方法檢測(cè)為濕地區(qū)域的數(shù)目為M,其中,R個(gè)是正確的,利用本文方法判別為非濕地區(qū)域的數(shù)目中R′個(gè)是正確的,則
(17)
(18)
(19)
為了驗(yàn)證結(jié)果的穩(wěn)定性,在保證測(cè)試樣本個(gè)數(shù)相同(正樣本:102,負(fù)樣本:231)的前提下,對(duì)ground truth進(jìn)行20次隨機(jī)樣本選擇,對(duì)每一組樣本產(chǎn)生的濕地檢測(cè)正確率統(tǒng)計(jì)結(jié)果進(jìn)行平均。
3.1 主題個(gè)數(shù)K對(duì)濕地檢測(cè)精度的影響
對(duì)濕地高維特征進(jìn)行概率潛在語(yǔ)義建模時(shí),潛在主題Z的數(shù)目K是需要人工指定的,K值的大小影響著算法性能的優(yōu)劣[24],因此有必要分析不同的K值對(duì)于算法檢測(cè)結(jié)果的影響。分別對(duì)比采用“光譜+紋理”特征和采用“光譜+紋理+地物組成成分+環(huán)境數(shù)據(jù)”特征兩種情況下,不同潛在主題個(gè)數(shù)K對(duì)應(yīng)的濕地檢測(cè)正確率,統(tǒng)計(jì)結(jié)果如表4和圖7所示。其中,在圖7中,空心圓點(diǎn)代表20次隨機(jī)樣本選擇下的檢測(cè)平均正確率,每個(gè)空心圓點(diǎn)上兩條橫線之間的線段則對(duì)應(yīng)著檢測(cè)結(jié)果的兩倍標(biāo)準(zhǔn)差。
表4 不同K值對(duì)應(yīng)的檢測(cè)正確率統(tǒng)計(jì)結(jié)果
圖7 不同K值對(duì)應(yīng)的檢測(cè)平均正確率及標(biāo)準(zhǔn)差Fig.7 Average accuracy and standard deviation in different K
從表4和圖7中可以看出,不論潛在語(yǔ)義個(gè)數(shù)是多少,使用“光譜+紋理+地物組成成分+環(huán)境數(shù)據(jù)”特征組合的檢測(cè)平均正確率均高于使用“光譜+紋理”特征組合的平均正確率,說(shuō)明了本文提出的加入組成成分和環(huán)境數(shù)據(jù)特征有利于提高濕地檢測(cè)精度。
在采用“光譜+紋理+地物組成成分+環(huán)境數(shù)據(jù)”特征組合的情況下,從整體趨勢(shì)而言,平均正確率先隨著潛語(yǔ)義個(gè)數(shù)K值的增大而變高;當(dāng)K值為18時(shí),平均正確率達(dá)到最高值,說(shuō)明此時(shí)pLSA能夠?qū)竦睾头菨竦貥颖具M(jìn)行有效建模,實(shí)現(xiàn)較滿意的檢測(cè)效果;而當(dāng)K值大于18時(shí),濕地檢測(cè)的平均正確率總體呈現(xiàn)下降趨勢(shì)。由此可見(jiàn),潛語(yǔ)義個(gè)數(shù)K并不是越大越好,當(dāng)K值不斷增大時(shí),特征矩陣難以較好的聚類(lèi),導(dǎo)致檢測(cè)結(jié)果差或者不太穩(wěn)定。在本次濕地檢測(cè)試驗(yàn)中選定K值為18作為最優(yōu)潛語(yǔ)義主題個(gè)數(shù)。
3.2 不同特征組合、不同方法的濕地檢測(cè)結(jié)果評(píng)價(jià)及對(duì)比分析
為了進(jìn)一步對(duì)本文所提算法的檢測(cè)結(jié)果進(jìn)行評(píng)價(jià),分別采用“光譜+紋理”特征(特征組合a)、“光譜+紋理+地物組成成分”特征(特征組合b)和“光譜+紋理+地物組成成分+地表溫度+土壤含水量”特征(特征組合c)時(shí),使用“SVM”和“pLSA+SVM(本文方法)”兩種方法的濕地檢測(cè)平均查全率和平均查準(zhǔn)率,如表5所示。括號(hào)中顯示的是對(duì)應(yīng)的方法和特征組合下,對(duì)20次隨機(jī)采樣的查全率和查準(zhǔn)率分別統(tǒng)計(jì)后得到的標(biāo)準(zhǔn)差。
從表5的縱向可以看出,當(dāng)特征較少時(shí),雖然查全率高但結(jié)果不穩(wěn)定,查準(zhǔn)率也較低。加入了地物組成成分特征和定量特征來(lái)描述濕地場(chǎng)景后,查準(zhǔn)率顯著提高且標(biāo)準(zhǔn)差較小,說(shuō)明檢測(cè)結(jié)果趨于穩(wěn)定。從橫向來(lái)看,pLSA+SVM(本文方法)方法通過(guò)對(duì)低層特征提取了潛在語(yǔ)義后,比直接使用低層特征進(jìn)行檢測(cè)的SVM方法得到的查全率和查準(zhǔn)率均有提高,且標(biāo)準(zhǔn)差顯著下降了,證明了本文方法的優(yōu)勢(shì)。
表5 不同方法、不同特征組合的濕地檢測(cè)結(jié)果評(píng)價(jià)
注:a為“光譜+紋理”特征,b為“光譜+紋理+地物組成成分”特征,c為“光譜+紋理+地物組成成分+地表溫度+土壤含水量”特征,為20次查全率和查準(zhǔn)率統(tǒng)計(jì)后得到的標(biāo)準(zhǔn)差。
從表5可以看出,只使用光譜和紋理兩種特征時(shí),難以得到較好的濕地識(shí)別結(jié)果,濕地與其他灌木等地物出現(xiàn)了“異物同譜”的現(xiàn)象,為了改善這種現(xiàn)象,加入地表溫度、土壤含水量、場(chǎng)景組成成分等環(huán)境特征。因?yàn)闈竦刂饕伤⑺参?、濕土組成,且對(duì)周?chē)h(huán)境有降溫作用,土壤含水量也明顯高于非濕地,因此加入這些特征能夠提高濕地識(shí)別精度。
圖8(a)中地物類(lèi)別為低矮植被和裸土,圖8(b)中地物類(lèi)別主要為裸土,圖8(c)中地物為低矮植被和不滲水面,這3個(gè)區(qū)域中地物的光譜、紋理特征和濕地近似,容易被錯(cuò)分為濕地,加入了地物組成成分特征后,這3個(gè)區(qū)域均被正確識(shí)別為非濕地,說(shuō)明了地物組成成分特征對(duì)于解決“同特征異類(lèi)別”問(wèn)題的有效性。
圖8 加入地物組成成分特征檢測(cè)結(jié)果Fig.8 Detection results by adding object composition features
圖9(a)主要由裸土和低植被覆蓋組成,地表溫度相對(duì)較高。圖9(b)中主要由高速公路和綠化植被組成,溫度較高,且含水量較少。通過(guò)環(huán)境參數(shù)特征的加入,這兩個(gè)窗口區(qū)域可以被正確識(shí)別為非濕地。圖9(c)為村莊周邊的一個(gè)大的水塘,溫度較低,且含水量較高,在環(huán)境參數(shù)特征的參與下,該區(qū)域被識(shí)別為濕地。可見(jiàn),加入地表溫度、土壤含水量等環(huán)境參數(shù)特征能夠彌補(bǔ)光譜、紋理特征的不足。
圖9 加入環(huán)境參數(shù)特征檢測(cè)結(jié)果Fig.9 Detection results by adding environment features
在圖10(a)中,場(chǎng)景內(nèi)包含水體、低矮植被、裸土,pLSA將其描述為濕地潛語(yǔ)義,正確識(shí)別為濕地場(chǎng)景。圖10(b)為城市中的河流及其表面附著生長(zhǎng)的水生植被,pLSA通過(guò)建模,識(shí)別出場(chǎng)景中有組成濕地的潛語(yǔ)義要素,正確判別為濕地場(chǎng)景。圖10(c)中,為房屋和植被組合,pLSA將其描述為居民地場(chǎng)景潛語(yǔ)義,正確判別為非濕地??梢?jiàn)pLSA模型通過(guò)提取潛在語(yǔ)義,建立低層特征與高層語(yǔ)義特征之間的聯(lián)系,將復(fù)雜的場(chǎng)景用語(yǔ)義組合描述,從而實(shí)現(xiàn)了相比傳統(tǒng)SVM方法更優(yōu)的檢測(cè)效果。
圖10 pLSA+SVM方法檢測(cè)結(jié)果Fig.10 Detection results in pLSA+SVM method
本文提出一種基于概率潛在語(yǔ)義分析的多源遙感影像濕地檢測(cè)方法。首先提取高分辨率影像的光譜、紋理和濕地場(chǎng)景的地物組成成分,并結(jié)合由多光譜遙感數(shù)據(jù)提取的濕地地表溫度、土壤含水量,組成濕地場(chǎng)景的特征空間;利用概率潛在語(yǔ)義分析將濕地場(chǎng)景表示成多個(gè)潛在語(yǔ)義的組合,用潛在語(yǔ)義的權(quán)值向量來(lái)描述濕地場(chǎng)景的特征空間,利用SVM分類(lèi)器實(shí)現(xiàn)濕地場(chǎng)景的檢測(cè)。試驗(yàn)表明,地物組成成分和定量環(huán)境特征的加入能有效表征濕地特征空間,明顯提高濕地檢測(cè)精度,相比傳統(tǒng)的光譜和紋理特征,查準(zhǔn)率提升了7.759%。概率潛在語(yǔ)義分析將濕地場(chǎng)景的高維特征空間映射到低維的潛在語(yǔ)義空間,提高了檢測(cè)的精度和效率。與傳統(tǒng)SVM方法相比,加入定量特征后,查全率和查準(zhǔn)率分別提升了2.232%和6.013%。
[1] 李玉鳳, 劉紅玉. 濕地分類(lèi)和濕地景觀分類(lèi)研究進(jìn)展[J]. 濕地科學(xué), 2014, 12(1): 102-108. LI Yufeng, LIU Hongyu. Advance in Wetland Classification and Wetland Landscape Classification Researches[J]. Wetland Science, 2014, 12(1): 102-108.
[2] 曹宇, 莫利江, 李艷, 等. 濕地景觀生態(tài)分類(lèi)研究進(jìn)展[J]. 應(yīng)用生態(tài)學(xué)報(bào), 2009, 20(12): 3084-3092. CAO Yu, MO Lijiang, LI Yan, et al. Wetland Landscape Ecological Classification: Research Progress[J]. China Journal of Applied Ecology, 2009, 20(12): 3084-3092.
[3] 李建平, 張柏, 張泠, 等. 濕地遙感檢測(cè)研究現(xiàn)狀與展望[J]. 地理科學(xué)進(jìn)展, 2007, 26(1): 33-43. LI Jianping, ZHANG Bai, ZHANG Ling, et al. Current Status and Prospect of Researches on Wetland Monitoring Based on Remote Sensing[J]. Progress in Geography, 2007, 26(1): 33-43.
[4] FROHN R C, D’AMICO E, LANE C, et al. Multi-temporal Sub-pixel LandSat ETM+Classification of Isolated Wetlands in Cuyahoga County, Ohio, USA[J]. Wetlands, 2012, 32(2): 289-299.
[5] 江沖亞, 李滿春, 劉永學(xué). 海岸帶水體遙感信息全自動(dòng)提取方法[J]. 測(cè)繪學(xué)報(bào), 2011, 40(3): 332-337. JIANG Chongya, LI Manchun, LIU Yongxue. Full-automatic Method for Coastal Water Information Extraction from Remote Sensing Image[J]. Acta Geodaetica et Cartographica Sinica, 2011, 40(3): 332-337.
[6] SOSNOWSKI A, GHONEIM E, BURKE J J, et al. Remote Regions, Remote Data: A Spatial Investigation of Precipitation, Dynamic Land Covers, and Conflict in the Sudd Wetland of South Sudan[J]. Applied Geography, 2016, 69: 51-64.
[7] HAN Xingxing, CHEN Xiaoling, FENG Lian. Four Decades of Winter Wetland Changes in Poyang Lake Based on LandSat Observations between 1973 and 2013[J]. Remote Sensing of Environment, 2015, 156: 426-437.
[8] OZESMI S L, BAUER M E. Satellite Remote Sensing of Wetlands[J]. Wetlands Ecology and Management, 2002, 10(5): 381-402.
[9] HOUHOULIS P F,MICHENER W K. Detecting Wetland Change: A Rule-based Approach Using NWI and SPOT-XS Data[J]. Photogrammetric Engineering and Remote Sensing, 2000, 66(2): 205-211.
[10] JOLLINEAU M Y, HOWARTH P J. Mapping an Inland Wetland Complex Using Hyperspectral Imagery[J]. International Journal of Remote Sensing, 2008, 29(12): 3609-3631.
[11] LI Junhua, CHEN Wenjun. A Rule-based Method for Mapping Canada’s Wetlands Using Optical, Radar and DEM Data[J]. International Journal of Remote Sensing, 2005, 26(22): 5051-5069.
[12] 李慧. 基于多源遙感數(shù)據(jù)的濕地信息提取及景觀格局研究-以閩江河口區(qū)濕地為例[D]. 福州: 福建師范大學(xué), 2005. LI Hui. Wetland Information Extraction Based on Multi-source RS Data and Landscape Pattern Analysis: A Case of Minjiang River Estuary[D]. Fuzhou: Fujian Normal University, 2005.
[13] WRIGHT C, GALLANT A. Improved Wetland Remote Sensing in Yellowstone National Park Using Classification Trees to Combine TM Imagery and Ancillary Environmental Data[J]. Remote Sensing of Environment, 2007, 107(4): 582-605.
[14] KINDSCHER K, FRASER A, JAKUBAUSKAS M E, et al. Identifying Wetland Meadows in Grand Teton National Park Using Remote Sensing and Average Wetland Values[J]. Wetlands Ecology and Management, 1997, 5(4): 265-273.
[15] HOFMANN T. Unsupervised Learning by Probabilistic Latent Semantic Analysis[J]. Machine Learning, 2001, 42(1-2): 177-196.
[16] 周暉, 郭軍, 朱長(zhǎng)仁, 等. 引入PLSA模型的光學(xué)遙感圖像艦船檢測(cè)[J]. 遙感學(xué)報(bào), 2010, 14(4): 663-680. ZHOU Hui, GUO Jun, ZHU Changren, et al. Ship Detection from Optical Remote Sensing Images Based on PLSA Model[J]. Journal of Remote Sensing, 2010, 14(4): 663-680.
[17] 陶超, 譚毅華, 彭碧發(fā), 等. 一種基于概率潛在語(yǔ)義模型的高分辨率遙感影像分類(lèi)方法[J]. 測(cè)繪學(xué)報(bào), 2011, 40(2): 156-162. TAO Chao,TAN Yihua,PENG Bifa, et al.A Probabilistic Latent Semantic Analysis Based Classification for High Resolution Remotely Sensed Imagery[J]. Acta Geodaetica et Cartographica Sinica, 2011, 40(2): 156-162.
[18] WANG Yong,MEI Tao,GONG Shaogang,et al.Combining Global, Regional and Contextual Features for Automatic Image Annotation[J]. Pattern Recognition, 2009, 42(2): 259-266.
[19] OJALA T, PIETIKINEN M, HARWOOD D. A Comparative Study of Texture Measures with Classification Based on Featured Distributions[J]. Pattern Recognition, 1996, 29(1): 51-59.
[20] OJALA T, PIETIKAINEN M, MAENPAA T. Multiresolution Gray-scale and Rotation Invariant Texture Classification with Local Binary Patterns[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7): 971-987.
[21] 胡德勇, 喬琨, 王興玲, 等. 單窗算法結(jié)合LandSat 8熱紅外數(shù)據(jù)反演地表溫度[J]. 遙感學(xué)報(bào), 2015, 19(6): 964-976. HU Deyong, QIAO Kun, WANG Xingling, et al. Land Surface Temperature Retrieval from LandSat 8 Thermal Infrared Data Using Mono-window Algorithm[J]. Journal of Remote Sensing, 2015, 19(6): 964-976.
[22] CONGALTON R G. A Review of Assessing the Accuracy of Classifications of Remotely Sensed Data[J]. Remote Sensing of Environment, 1991, 37(1): 35-46.
[23] FOODY G M.Status of Land Cover Classification Accuracy Assessment[J]. Remote Sensing of Environment, 2002, 80(1): 185-201.
[24] QUELHAS P, MONAY F, ODOBEZ J M, et al. A Thousand Words in a Scene[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(9): 1575-1589.
(責(zé)任編輯:張艷玲)
Wetland Detection from Multi-sources Remote Sensing Images Based on Probabilistic Latent Semantic Analysis
XU Kai1,ZHANG Qianqian1,WANG Yanhua1,LIU Fujiang1,QIN Kun2
1. Faculty of Information Engineering, China University of Geosciences, Wuhan 430074, China; 2. School of Remote Sensing and Information Engineering, Wuhan University, Wuhan 430079, China
A novel wetland detection approach for multi-sources remote sensing images was proposed, which based on the probabilistic latent semantic analysis (pLSA). Firstly, spectral, texture, and subclass of wetland were extracted from high-resolution remote sensing image, and land surface temperature and soil moisture of wetland were derived from corresponding multispectral remote sensing image. The feature space of wetland scene was hence formed. Then, wetland scene was represented as a combination of several latent semantics using pLSA, and the feature space of the wetland scene was further described by weight vector of latent semantics. Finally, supporting vector machine (SVM) classifier was applied to detect the wetland scene. Experiments indicated that the adoption of pLSA is able to map the high-dimensional feature space of wetland to low-dimensional latent semantic space. Besides, the addition of subclass and quantitative environment features is able to characterize wetland feature space more effectively and improve the detection accuracy significantly.
probabilistic latent semantic analysis; wetland detection; semantic information; multi-sources remote sensing
National Key Research and Development Program of China (No. 2016YFB0502603); Key Laboratory for National Geographic State Monitoring of National Administration of Surveying, Mapping and Geoinformation (No. 2016NGCM09)
XU Kai (1983—) , male, PhD, lecturer, majors in processing of remote sensing image.
ZHANG Qianqian
許凱,張倩倩,王彥華,等.多源遙感影像濕地檢測(cè)概率潛在語(yǔ)義分析[J].測(cè)繪學(xué)報(bào),2017,46(8):1017-1025.
10.11947/j.AGCS.2017.20160292. XU Kai, ZHANG Qianqian, WANG Yanhua,et al.Wetland Detection from Multi-sources Remote Sensing Images Based on Probabilistic Latent Semantic Analysis[J]. Acta Geodaetica et Cartographica Sinica,2017,46(8):1017-1025. DOI:10.11947/j.AGCS.2017.20160292.
P237
A
1001-1595(2017)08-1017-09
國(guó)家重點(diǎn)研發(fā)計(jì)劃(2016YFB0502603);地理國(guó)情監(jiān)測(cè)國(guó)家測(cè)繪地理信息局重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金(2016NGCM09)
2016-06-15
許凱(1983—),男,博士,講師,研究方向?yàn)檫b感圖像處理的理論與方法。
E-mail: xukai_cug@163.com.
張倩倩
E-mail: zqqian_cug@163.com
修回日期: 2017-07-03