侯榜煥,王 錕,姚敏立,賈維敏,王 榕
1. 火箭軍工程大學(xué)信息工程系,陜西 西安 710025; 2. 國家計算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心,北京 100029
侯榜煥,王錕,姚敏立,等.面向高光譜圖像分類的半監(jiān)督空譜判別分析[J].測繪學(xué)報,2017,46(9):1098-1106.
10.11947/j.AGCS.2017.20170121.
HOU Banghuan,WANG Kun,YAO Minli,et al.Semi-supervised Spatial-spectral Discriminant Analysis for Hyperspectral Image Classification[J]. Acta Geodaetica et Cartographica Sinica,2017,46(9):1098-1106. DOI:10.11947/j.AGCS.2017.20170121.
面向高光譜圖像分類的半監(jiān)督空譜判別分析
侯榜煥1,王 錕2,姚敏立1,賈維敏1,王 榕1
1. 火箭軍工程大學(xué)信息工程系,陜西 西安 710025; 2. 國家計算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心,北京 100029
為充分利用高光譜圖像蘊(yùn)藏的空間信息提升分類精度,提出了面向高光譜圖像分類的半監(jiān)督空譜判別分析(S3DA)算法??紤]高光譜圖像數(shù)據(jù)集的空間一致性,首先利用少量標(biāo)記樣本定義類內(nèi)散度矩陣,保存數(shù)據(jù)集同類像元的光譜近鄰結(jié)構(gòu);再利用無標(biāo)記樣本定義空間近鄰像元散度矩陣,揭示像元間的空間近鄰結(jié)構(gòu)和地物的空間分布結(jié)構(gòu)信息。S3DA既保持?jǐn)?shù)據(jù)集在光譜域的可分性,又保存了無標(biāo)記樣本蘊(yùn)藏的空間域近鄰結(jié)構(gòu),增強(qiáng)了同類像元和空間近鄰像元在投影子空間的聚集性,從而提升分類性能。在PaviaU和Indian Pines數(shù)據(jù)集的試驗表明,總體分類精度分別達(dá)到81.50%和71.77%。與傳統(tǒng)的光譜方法比較,該算法能有效提升高光譜圖像數(shù)據(jù)集的地物分類精度。
高光譜圖像分類;特征提?。慌袆e分析;空譜聯(lián)合;半監(jiān)督學(xué)習(xí);空間近鄰
高光譜遙感圖像由數(shù)十?dāng)?shù)百個波段組成,每個像元可表示為一條連續(xù)的光譜曲線,即圖譜合一。目前已廣泛應(yīng)用于環(huán)境監(jiān)測、國防建設(shè)和目標(biāo)探測等領(lǐng)域[1-5]。由于波段數(shù)多、信息冗余多且波段間相關(guān)性強(qiáng),直接進(jìn)行地物分類時易出現(xiàn)“維數(shù)災(zāi)難”問題[3-5],致使處理過程復(fù)雜化,分類精度和分類效率明顯降低。因此,如何減少數(shù)據(jù)冗余、發(fā)掘內(nèi)在結(jié)構(gòu)、提取有用判別信息,是提升高光譜圖像分類性能的關(guān)鍵。
研究者們已提出一系列特征提取方法。經(jīng)典方法如主成分分析(principal component analysis,PCA)[6]和線性判別分析(linear discriminant analysis,LDA)[7],均為全局線性方法。PCA以方差最大化尋求全局最佳逼近,LDA利用了樣本的判別信息保持樣本集的可分性;雖然它們都有效減小了數(shù)據(jù)冗余,但無法真正揭示高光譜數(shù)據(jù)集的非線性多模結(jié)構(gòu)?;诹餍螌W(xué)習(xí)的拉普拉斯映射(Laplacian eigenmap,LE)[8]和局部線性嵌入(local linear embedding,LLE)[9],能處理非線性的高維數(shù)據(jù),但存在新樣本學(xué)習(xí)問題。其線性化算法是局部保持投影(locality preserving projection,LPP)[10]和鄰域保持嵌入(neighborhood preserving embedding,NPE)[11],具有良好的非線性流形學(xué)習(xí)能力,且方便處理新樣本,但這類方法忽視了樣本的判別信息,破壞了數(shù)據(jù)集的可分性,限制了分類精度的提高。為充分利用少量標(biāo)記樣本的判別信息和大量無標(biāo)記樣本蘊(yùn)藏的非線性結(jié)構(gòu)信息,半監(jiān)督判別分析(semi-supervised discriminant analysis,SDA)[12]、半監(jiān)督局部費(fèi)舍爾判別分析(semi-supervised local Fisher discriminant analysis,SELF)[13]和半監(jiān)督局部判別分析(semi-supervised local discriminant analysis,SELD)[14]等算法應(yīng)運(yùn)而生。這些算法充分利用少量標(biāo)記樣本的判別信息來保持?jǐn)?shù)據(jù)集的可分性,還深入發(fā)掘未標(biāo)記樣本包含的局部流形結(jié)構(gòu)信息或方差信息,改善了特征提取效果,提升了分類能力[15]。
以上算法只利用了光譜數(shù)據(jù),未考慮高光譜圖像數(shù)據(jù)集特有的地物空間分布結(jié)構(gòu)信息對特征提取和分類的作用。高光譜數(shù)據(jù)集圖譜合一,空間位置靠近的像元具有較強(qiáng)的光譜相關(guān)性,且距離越近,相關(guān)性越強(qiáng)[1-2];從地物分布看,空間近鄰像元在很大概率上屬于同類地物,相同類別地物在圖像中往往呈現(xiàn)集中性或呈塊狀分布[16-26]。聯(lián)合使用空間信息和光譜信息(簡稱空譜)的方式,有基于合成核分類器的多模特征融合[16]、基于圖像濾波或圖像分割的分類后處理[17-19]等,但這幾種方式都屬于在分類過程中加入空間信息。對空譜聯(lián)合特征提取的研究相對較少。主要有在光譜特征、紋理特征等多模特征空間提取低維特征[20],或者對基于光譜特征空間提取的低維特征進(jìn)行圖像域平滑濾波[21-22],但都沒有在特征提取算法函數(shù)中考慮高光譜地物的空間分布信息;文獻(xiàn)[23—25]在流形學(xué)習(xí)構(gòu)建相似圖時,考慮了空間距離的影響,但無監(jiān)督算法的本質(zhì),決定了此類算法無法進(jìn)一步提高后續(xù)的地物分類精度。
針對以上問題,本文提出面向高光譜分類的無監(jiān)督空間近鄰像元均值嵌入(local pixel mean embedding,LPME)和半監(jiān)督空譜判別分析(semi-supervised spatial-spectral discriminant analysis,S3DA)。通過空間近鄰像元散度的最小化,最大限度保存了高光譜圖像像元的空間近鄰結(jié)構(gòu),實現(xiàn)了空間近鄰像元均值嵌入;在此基礎(chǔ)上,S3DA充分利用標(biāo)記樣本的判別信息來保持?jǐn)?shù)據(jù)集的可分性,使同類地物像元和同一空間鄰域內(nèi)像元的聚集關(guān)系在投影子空間保持不變,更好揭示了高光譜圖像數(shù)據(jù)集圖譜合一的本質(zhì)屬性,從而提升分類性能。在PaviaU和Indian Pines高光譜數(shù)據(jù)集上驗證了本文算法的有效性。
1.1 線性判別分析(LDA)
記nl個有標(biāo)記的訓(xùn)練樣本構(gòu)成的樣本集為Xl∈Rd×nl,其中xi∈Rd,投影后的數(shù)據(jù)yi∈Rr。LDA算法能利用樣本集Xl的判別信息,構(gòu)建同類數(shù)據(jù)的類內(nèi)散度矩陣SW和異類數(shù)據(jù)的類間散度矩陣Sb,尋求一個最佳投影方向使異類數(shù)據(jù)的類間散度極大化、同類數(shù)據(jù)的類內(nèi)散度極小化,以保持?jǐn)?shù)據(jù)集在投影子空間的可分性。其中
(1)
(2)
LDA的目標(biāo)函數(shù)為
(3)
最佳投影向量a即廣義特征值問題Sba=λSWa的最大的非零特征值對應(yīng)的特征向量。由于類間散度矩陣Sb的秩為c-1,故最多存在c-1個非零特征值和對應(yīng)的特征向量,即LDA算法最多可以提取出c-1個低維嵌入特征。當(dāng)nl 1.2 空間近鄰像元均值嵌入(LPME) 高光譜圖像數(shù)據(jù)集具有明顯的空間聚集屬性,即空間上近鄰的像元在很大概率上屬于同類地物,其光譜特征也有較強(qiáng)的相似性和一致性[16-27]。為此,高光譜圖像數(shù)據(jù)集的像元間的空間近鄰結(jié)構(gòu),應(yīng)該在投影后的特征空間中得到保持。 令Ni代表像元xi∈Rd的空間近鄰區(qū)域,即以像元xi為中心的大小為ω×ω的正方形空間鄰域,其中ω為奇正整數(shù),是空間鄰域的大小。當(dāng)像元xi位于圖像邊緣或角落時,空間鄰域內(nèi)的空缺像元以中心像元xi填充。對某個較小的空間鄰域內(nèi)的像元,其均值向量在很大程度上代表著此處像元的典型光譜特征[26]。受LDA的類內(nèi)散度矩陣啟發(fā),定義空間近鄰像元散度矩陣為 (4) 式中,mi是以xi為中心的空間鄰域Ni內(nèi)所有像元的均值向量;xik是xi的空間鄰域Ni內(nèi)的第k個空間近鄰像元??臻g近鄰像元散度hi,表征著以xi為中心的空間鄰域Ni內(nèi)的像元,即空間近鄰像元,與均值向量mi的離散程度[27]。HW為樣本集Xl所有樣本的空間近鄰散度之和。 定義樣本集Xl的總體散度矩陣St為 (5) 與LDA的原理類似,本文提出LPME算法,使空間近鄰像元在投影后盡量靠近其均值向量,使空間近鄰像元散度極小化,以保存圖像的空間近鄰結(jié)構(gòu)和地物的空間分布信息;同時,使總體散度St最大化,最大限度保存數(shù)據(jù)的方差信息和多樣化信息[27-29]。LPME的目標(biāo)函數(shù)定義為 (6) LPME利用了樣本集Xl及其空間近鄰像元,但沒有使用Xl的標(biāo)記信息,故是無監(jiān)督的。最佳投影向量a即廣義特征值問題Sta=λHWa的最大的非零特征值對應(yīng)的特征向量。 1.3 半監(jiān)督空譜判別分析(S3DA) LDA是監(jiān)督算法,只能利用標(biāo)記樣本的光譜信息,學(xué)習(xí)得到的投影方向保存了數(shù)據(jù)集的判別信息,能夠使投影子空間中同類數(shù)據(jù)更加靠近、異類數(shù)據(jù)更加分散。當(dāng)LDA應(yīng)用于高光譜特征提取時,無法利用高光譜圖像特有的地物空間分布信息,其學(xué)習(xí)得到的子空間只反映了同類像元的光譜近鄰結(jié)構(gòu)(相似性關(guān)系),破壞了像元間特有的空間近鄰結(jié)構(gòu)。如果在特征提取過程考慮地物的空間分布信息,就能保存更多的像元間的空間近鄰細(xì)節(jié)結(jié)構(gòu)信息,從而降低局部空間鄰域內(nèi)像元在低維特征空間的波動起伏。 反之,LPME是無監(jiān)督的,只能利用高光譜圖像數(shù)據(jù)集的特有的地物空間分布信息,保存像元間的空間近鄰結(jié)構(gòu),使提取的低維特征符合地物的空間分布規(guī)律。然而,LPME沒有考慮像元的標(biāo)記信息,即沒有保存同類像元間的光譜近鄰結(jié)構(gòu)信息。對同類地物大片均勻分布區(qū)域的兩個光譜近鄰的同類像元,如果空間距離較遠(yuǎn),LPME無法將其直接聯(lián)系起來。為此,假如在算法中融入判別信息,就能夠更好地提升投影方向的判別能力,增強(qiáng)低維嵌入特征的類別可分性。 由于標(biāo)記樣本的獲取代價比較昂貴,而未標(biāo)記樣本數(shù)量龐大且容易獲得;同時,利用標(biāo)記樣本只能保存圖像的同類地物的光譜近鄰結(jié)構(gòu),而像元的空間近鄰結(jié)構(gòu)只需使用未標(biāo)記樣本即可得到?;诖?,本文提出S3DA算法。其目標(biāo)函數(shù)為 (7) S3DA能同時利用少數(shù)標(biāo)記樣本和較多的未標(biāo)記樣本,將高光譜圖像的光譜信息和空間信息自動融合,以保存光譜近鄰?fù)愊裨呐袆e信息和空間近鄰像元的分布信息;S3DA使用的未標(biāo)記樣本,都位于標(biāo)記樣本的周圍,有明確的空間分布和物理解釋,更符合高光譜圖像數(shù)據(jù)集的本質(zhì)屬性,因此能夠提取更有效的判別特征。由于ω2nl>d很容易滿足,此時樣本數(shù)大于維數(shù),故HW很容易滿秩,有效避免了奇異性。矩陣St的秩由nl和d決定,能提取的低維特征數(shù)大于c-1(當(dāng)nl>c時),較多的維數(shù)能更好地表達(dá)數(shù)據(jù)集的本質(zhì)特征;由于St能最大限度保存樣本集的方差信息和多樣化信息,有利于提升分類精度[27-29]。 在求解時,此問題轉(zhuǎn)化為廣義特征值問題,即 Sta=λ(SW+HW)a (8) 其前r個最大特征值λ1>λ2>…λr對應(yīng)的特征向量a1,a2,…,ar組成最優(yōu)投影矩陣A。 1.4LPME和S3DA求解步驟 LPME和S3DA算法求解的具體步驟為: 輸入:包含N個樣本點(diǎn)的高光譜圖像數(shù)據(jù)集X∈RI×J×m,N=I×J,用于訓(xùn)練投影矩陣的標(biāo)記樣本集Xl∈Rd×nl,類別數(shù)c,嵌入維數(shù)r,空間鄰域大小ω。 (1) 求類內(nèi)散度矩陣SW。 (2) 求空間近鄰像元散度矩陣HW。 (3) 求訓(xùn)練樣本集總體散度矩陣St。 (4) 求解廣義特征值問題,得到對應(yīng)的特征向量a1,a2,…,ar組成的最優(yōu)投影矩陣A∈Rd×r。 輸出:低維數(shù)據(jù)Y=ATX。 2.1 試驗數(shù)據(jù)集 為評估本文LPME和S3DA的分類性能,使用具有代表性的PaviaU[19]和Indian Pines[27]高光譜遙感數(shù)據(jù)集進(jìn)行分類試驗。 (1) PaviaU數(shù)據(jù)集:該數(shù)據(jù)集圖像是2002年由ROSIS傳感器獲取的航空遙感圖像,地點(diǎn)在意大利北部Pavia大學(xué)區(qū)域。圖像大小為610×340像素,空間分辨率為1.3 m;包含了430 nm到860 nm光譜范圍內(nèi)的115個波段,光譜分辨率為4 nm到12 nm;去除噪聲影響嚴(yán)重的波段后,剩余103個波段。該圖像參考數(shù)據(jù)樣本共計42 776個,含有9類地物信息。其假彩色圖像和真實地物信息如圖1所示。 圖1 PaviaU高光譜圖像Fig.1 PaviaU hyperspectral image (2) Indian Pines數(shù)據(jù)集:該數(shù)據(jù)集圖像由AVIRIS傳感器拍攝的美國西部的農(nóng)業(yè)植被區(qū)域。圖像大小為145×145像素,空間分辨率為20 m;包含了400 nm到2500 nm光譜范圍內(nèi)的224個波段,光譜分辨率為9.7 nm到12 nm;去除噪聲影響嚴(yán)重的波段后,剩余200個波段用于試驗。該圖像參考數(shù)據(jù)樣本共計10 249個,含有16類地物信息。其假彩色圖像和真實地物信息如圖2所示。 圖2 Indian Pines高光譜圖像Fig.2 Indian Pines hyperspectral image 2.2 試驗設(shè)置 試驗中,與Baseline、LDA、SDA、SELF、SELDlpp[14]和SELDnpe[14]等進(jìn)行對比。其中Baseline是對未降維數(shù)據(jù)直接分類的結(jié)果,LDA是經(jīng)典的監(jiān)督算法,SDA、SELF、SELDlpp和SELDnpe是半監(jiān)督算法。為避免小樣本時出現(xiàn)奇異,LDA的類內(nèi)散度矩陣SW加上了單位矩陣正則項,正則系數(shù)設(shè)置為10-3。SDA的參數(shù)α和SELF的參數(shù)β分別在{0.1,0.5,2.5,12.5,62.5}和{0,0.1,0.2,…,0.9,1.0}中選取,使分類精度最優(yōu)。SDA、SELDlpp和SELDnpe在構(gòu)建近鄰圖時,光譜近鄰數(shù)k設(shè)置為5。S3DA和LPME的空間鄰域ω設(shè)置為3。LDA、SDA提取的低維特征數(shù)量為c-1,其余算法的嵌入維數(shù)上界均設(shè)置為30。 在學(xué)習(xí)投影矩陣時,訓(xùn)練樣本包括標(biāo)記樣本集Xl∈Rd×nl和無標(biāo)記樣本集Xu∈Rd×nu;Xu由每類地物隨機(jī)選取的300個樣本點(diǎn)組成(對不足300個樣本的類別,選取除Xl之外的全部樣本),nu是選取的無標(biāo)記樣本的總數(shù)。試驗中,監(jiān)督方法LDA只使用Xl作為訓(xùn)練樣本;半監(jiān)督方法SDA、SELF、SELDlpp與SELDnpe,使用標(biāo)記樣本集Xl和無標(biāo)記樣本集Xu進(jìn)行學(xué)習(xí);LPME和S3DA只使用Xl,但隱含地使用了Xl中每個樣本的無標(biāo)記的空間近鄰像元;由于LPME是無監(jiān)督的,故只使用Xl的數(shù)據(jù),不使用Xl的標(biāo)記信息。 在分類時,所有算法均使用Xl作為訓(xùn)練樣本,剩余全部樣本均為測試樣本。使用最近鄰分類器(nereast neighbor,NN),并采用總體精度(overall accuracy,OA)、平均精度(average accuracy,AA)和Kappa系數(shù)作為評價指標(biāo)。為提高實驗的精確度和可靠性,重復(fù)進(jìn)行10次,每次隨機(jī)選取訓(xùn)練樣本,將10次試驗的分類精度求平均值。 3.1 PaviaU試驗結(jié)果及分析 根據(jù)試驗設(shè)置,圖3為各算法在PaviaU數(shù)據(jù)集上不同維數(shù)下的分類精度曲線,表1為不同標(biāo)記樣本數(shù)下的最大總體分類精度。 圖3 不同算法在不同標(biāo)記樣本、不同維數(shù)下的分類精度Fig.3 Overall accuracies of different algorithms with different labeled samples in different dimensions 由圖3可知,隨著嵌入維數(shù)的增加,各算法的分類精度不斷增加,并逐漸達(dá)到最大值,之后不再升高,或者逐步降低。這是由于各個算法在本征維數(shù)時取得最優(yōu)的分類精度,而嵌入在高維數(shù)據(jù)中的本征維數(shù)是未知的、不可確定的。當(dāng)?shù)途S嵌入特征逐步增加時,其包含的判別信息越來越豐富,分類精度也相應(yīng)地變大;但當(dāng)達(dá)到本征維數(shù)時,分類精度取得最優(yōu)值;此時,如果嵌入特征的維數(shù)再增加,有可能引入冗余信息或噪聲,致使分類精度不再提高,甚至逐漸降低。由圖可知,保留30個低維嵌入特征時,各算法均取得了最大分類精度,滿足了分類任務(wù)的要求。 在表1中,當(dāng)每類地物取5、10、15、20、25、30個標(biāo)記訓(xùn)練樣本(對樣本數(shù)不足50個的類別,最多選取一半)和300個未標(biāo)記訓(xùn)練樣本的情況下(S3DA使用的未標(biāo)記樣本是標(biāo)記樣本的8倍,即40、80、120、160、200、240個),各算法的最大總體分類精度隨著標(biāo)記樣本數(shù)的增加而增加,這是因為標(biāo)記樣本越多,包含的標(biāo)記信息越豐富,提取的低維特征的判別能力越強(qiáng),其分類精度越好。在不同的標(biāo)記樣本數(shù)目下,相比其他算法,S3DA的分類精度始終是最高的,LPME僅次于S3DA。LPME比其他算法提高約2%~7%,S3DA高出其余算法約3%~10%,且S3DA始終高于LPME約1%~3%;同時,訓(xùn)練樣本越少,S3DA相對LPME的分類精度提升越明顯。 這是因為,LDA使數(shù)據(jù)集的類內(nèi)散度最小化,即同類的光譜近鄰像元在投影后靠近其均值向量,保存了高光譜圖像的光譜近鄰結(jié)構(gòu)和同類地物的光譜相似性關(guān)系;SDA、SELF、SELDlpp和SELDnpe等算法,在LDA的基礎(chǔ)上還保存了流形結(jié)構(gòu)等信息,但他們都沒有考慮高光譜圖像的空間聚集屬性。而本文的LPME算法,能使高光譜圖像的空間近鄰像元散度極小化,即空間近鄰像元在投影后靠近其均值向量,保存了像元間的空間近鄰結(jié)構(gòu)和地物的空間分布信息,從而達(dá)到了較高的分類精度。S3DA集成了LDA和LPME的優(yōu)勢,同時利用了標(biāo)記樣本和無標(biāo)記樣本,不僅通過類內(nèi)散度極小化保證投影子空間的類別可分性,還保存了圖像的空間近鄰結(jié)構(gòu),增強(qiáng)了同類像元和同一空間鄰域像元的在低維空間的聚集性,使提取的低維特征更符合高光譜圖像數(shù)據(jù)集的本質(zhì)屬性,從而強(qiáng)化了判別能力,改善了特征提取效果。 表2是選取30個標(biāo)記樣本時各類地物的分類精度。S3DA和LPME在大部分地物類別都具有較好的分類效果,尤其是“Meadows”和“Bare Soil”的分類精度比其余算法提高約5%~25%,這是因為這兩類地物在圖像中呈大片塊狀均勻分布,有利于S3DA和LPME提取出更有判別力的低維特征。圖4為對應(yīng)的分類圖,可以看出S3DA和LPME獲得了更多光滑區(qū)域,尤其是在圖中圓圈所示的“Bare Soil”區(qū)域,錯分點(diǎn)明顯減少。但是,空間聚集特性的引入,也使得部分錯分點(diǎn)呈塊狀分布,即錯分像元的空間近鄰像元也傾向于被錯分,這在實際應(yīng)用中需要加以注意。 表2 PaviaU數(shù)據(jù)集各類地物在不同算法下的分類精度 圖4 在PaviaU上各算法的分類識別圖Fig.4 Classification maps of different algorithms in PaviaU data set 3.2 Indian Pines試驗結(jié)果及分析 在Indian Pines數(shù)據(jù)集上也進(jìn)行了試驗,圖5為各算法在不同標(biāo)記樣本下不同維數(shù)下的分類精度曲線,表3為對應(yīng)的最高總體分類精度。 圖5 不同算法在不同標(biāo)記樣本、不同維數(shù)下的分類精度Fig.5 Overall accuracies of different algorithms with different labeled samples in different dimensions 從圖5和表3可以看出,其他幾種算法的分類精度均低于本文提出的LPME和S3DA。在不同的標(biāo)記樣本數(shù)下,LPME比其他算法提高約5%~10%,S3DA高出其余算法約6%~14%,且S3DA始終高于LPME約1%~4%。同時,訓(xùn)練樣本越少,S3DA相比LPME的分類精度提升也越明顯。 這是因為LDA在線性二分類問題中應(yīng)用效果較好,但本數(shù)據(jù)集具有多模非線性屬性,雖然它能夠保證不同類別數(shù)據(jù)的可分性和同類數(shù)據(jù)的聚集性,卻無法利用高光譜數(shù)據(jù)集特有的空間信息;SDA、SELF、SELDlpp和SELDnpe等半監(jiān)督算法,充分利用了標(biāo)記樣本的判別信息,保持了數(shù)據(jù)集的可分性,且通過較多的未標(biāo)記樣本挖掘數(shù)據(jù)集的光譜近鄰流形結(jié)構(gòu)或最大的方差信息,保存了數(shù)據(jù)集的非線性屬性,但他們利用的未標(biāo)記樣本均是隨機(jī)選取的,其潛在分布是未知的,也沒有明確的物理意義,無法符合高光譜圖像中不同地物的空間分布規(guī)律。反之,S3DA使用的未標(biāo)記樣本,是標(biāo)記樣本的空間近鄰像元,有明確的空間分布和物理意義,更符合高光譜圖像數(shù)據(jù)集的本質(zhì)屬性,使同類像元和空間近鄰像元的相似性和聚集性在投影子空間保持不變,因此能夠提取更有效的判別特征,取得更高的分類精度。 3.3 空間鄰域大小與無標(biāo)記樣本數(shù)的影響 S3DA利用空間近鄰的無標(biāo)記樣本來保存圖像的空間近鄰結(jié)構(gòu),故空間鄰域大小ω與S3DA利用的無標(biāo)記樣本數(shù)有直接的對應(yīng)關(guān)系;同時,由于無標(biāo)記樣本的選取有明確物理意義,故無標(biāo)記樣本數(shù)量受空間鄰域大小限制,無法自由選擇。在Indian Pines和PaviaU數(shù)據(jù)集中選取30個標(biāo)記訓(xùn)練樣本進(jìn)行試驗。試驗中,ω分別選取為3、5、7、9、11、13,即選取的無標(biāo)記樣本總數(shù)為240、720、1440、2400、3600、5024。 圖6是不同ω時的分類精度。由圖6可知,隨著ω值的增加,盡管無標(biāo)記樣本數(shù)在增加,但S3DA的分類精度卻逐步下降。這是因為隨著ω值增加,空間鄰域內(nèi)的像元逐步增加,與中心像元距離逐步增大,屬于同類地物的概率逐漸變小,即屬于異類地物的概率逐步增大,像元的均值向量偏離了同類地物的典型光譜特征,使像元在投影后也偏離了同類地物,故分類精度不斷降低。由圖6可知,當(dāng)ω值較小時,即選取較少的無標(biāo)記樣本時,分類精度最高;這意味著較少的計算量,在實際應(yīng)用中具有重要意義。 3.4 時間復(fù)雜度分析 圖6 不同ω值下的分類精度Fig.6 Overall accuracies with different ω 由于nu通常大于nl,故SDA、SELF、SELDlpp、SELDnpe的計算量相對較大,LDA和本文S3DA、LPME的計算代價較小。試驗硬件平臺為Intel(R) Core(TM) i7-2600 3.40 GHz CPU和16.0 GB RAM,軟件版本為Matlab7.0。 以選取30個標(biāo)記樣本為例。表4是各算法的運(yùn)行時間。本文S3DA和LPME的運(yùn)行時間大于LDA,但小于SDA、SELF、SELDlpp和SELDnpe,這與復(fù)雜度分析的結(jié)論一致。由于Indian Pines數(shù)據(jù)集的波段數(shù)是PaivaU的近2倍,且地物類別較多,每次選取的樣本總數(shù)也較多,故Indian Pines數(shù)據(jù)集上各算法耗時比PaviaU數(shù)據(jù)集多。表中SELF的運(yùn)行時間最長,這主要是因為程序設(shè)計的原因。 表4 各算法的運(yùn)行時間 本文結(jié)合高光譜圖像的圖譜合一特性,提出了面向高光譜分類的無監(jiān)督空間近鄰像元均值嵌入和半監(jiān)督空譜判別分析算法。該算法利用少量標(biāo)記樣本和較多的無標(biāo)記空間近鄰樣本,通過類內(nèi)散度矩陣和空間近鄰像元散度矩陣極小化,使標(biāo)記樣本包含的判別信息和無標(biāo)記樣本蘊(yùn)藏的空間近鄰結(jié)構(gòu)在投影子空間得以保存,強(qiáng)化了同類像元和空間近鄰像元的聚集性,在特征提取過程中自動融入空間信息,提取了更有效的判別特征,提升了分類性能。在PaviaU和Indian Pines高光譜數(shù)據(jù)集的試驗表明,總體分類精度分別達(dá)到81.50%和71.77%。與傳統(tǒng)特征提取算法相比,分類精度有了明顯地提升。 但本文算法只考慮了高光譜圖像的判別能力和空間分布特性,沒有考慮高維數(shù)據(jù)蘊(yùn)藏的非線性流形結(jié)構(gòu),如何將三者同時結(jié)合起來提取更有效的特征,是下一步研究的內(nèi)容。 [1] FAUVEL M,TARABALKA Y,BENEDIKTSSON J A,et al.Advances in Spectral-Spatial Classification of Hyperspectral Images[J].Proceedings of the IEEE,2013,101(3):652-675. [2] 黃鴻,鄭新磊.高光譜影像空-譜協(xié)同嵌入的地物分類算法[J].測繪學(xué)報,2016,45(8):964-972.DOI:10.11947/j.AGCS.2016.20150654. HUANG Hong,ZHENG Xinlei.Hyperspectral Image Land Cover Classification Algorithm Based on Spatial-spectral Coordination Embedding[J].Acta Geodaetica et Cartographica Sinica,2016,45(8):964-972.DOI:10.11947/j.AGCS.2016.20150654. [3] 楊釗霞,鄒崢嶸,陶超,等.空-譜信息與稀疏表示相結(jié)合的高光譜遙感影像分類[J].測繪學(xué)報,2015,44(7):775-781.DOI:10.11947/j.AGCS.2015.20140207. YANG Zhaoxia,ZOU Zhengrong,TAO Chao,et al.Hyperspectral Image Classification Based on the Combination of Spatial-Spectral Feature and Sparse Representation[J].Acta Geodaetica et Cartographica Sinica,2015,44(7):775-781.DOI:10.11947/j.AGCS.2015.20140207. [4] 駱仁波,皮佑國.有監(jiān)督的鄰域保留嵌入的高光譜遙感影像特征提取[J].測繪學(xué)報,2014,43(5):508-513.DOI:10.13485/j.cnki.11-2089.2014.0079. LUO Renbo,PI Youguo.Supervised Neighborhood Preserving Embedding Feature Extraction of Hyperspectral Imagery[J].Acta Geodaetica et Cartographica Sinica,2014,43(5):508-513.DOI:10.13485/j.cnki.11-2089.2014.0079. [5] 李志敏,張杰,黃鴻,等.面向高光譜圖像分類的半監(jiān)督Laplace鑒別嵌入[J].電子與信息學(xué)報,2015,37(4):995-1001. LI Zhimin,ZHANG Jie,HUANG Hong,et al.Semi-Supervised Laplace Discriminant Embedding for Hyperspectral Image Classification[J].Journal of Electronics & Information Technology,2015,37(4):995-1001. [6] JACKSON J E.A User’s Guide to Principal Components[M].New York:A Wiley-Interscience Publication,1992. [7] BANDOS T V,BRUZZONE L,CAMPS-VALLS G.Classification of Hyperspectral Images with Regularized Linear Discriminant Analysis[J].IEEE Transactions on Geoscience and Remote Sensing,2009,47(3):862-873. [8] BELKIN M,NIYOGI P.Laplacian Eigenmaps for Dimensionality Reduction and Data Representation[J].Neural Computation,2003,15(6):1373-1396. [9] ROWEIS S T,SAUL L K.Nonlinear Dimensionality Reduction by Locally Linear Embedding[J].Science,2000,290(5500):2323-2326. [10] HE Xiaofei,NIYOGI P.Locality Preserving Projections[C]∥Advances in Neural Information Processing Systems.Cambridge:MIT Press,2004(16):153-160. [11] HE Xiaofei,CAI Deng,YAN Shuicheng,et al.Neighborhood Preserving Embedding[C]∥Proceedings of the 10th IEEE International Conference on Computer Vision.Beijing:IEEE,2005:150-156. [12] CAI Deng,HE Xiaofei,HAN Jiawei.Semi-supervised Discriminant Analysis[C]∥Proceedings of the 11th IEEE International Conference on Computer Vision.Rio de Janeiro:IEEE,2007:1-7. [13] SUGIYAMA M,IDé T,NAKAJIMA S,et al.Semi-supervised Local Fisher Discriminant Analysis for Dimensionality Reduction[J].Machine Learning,2010,78(1-2):35-61. [14] LIAO Wenzhi,PIZURICA A,SCHEUNDERS P,et al.Semisupervised Local Discriminant Analysis for Feature Extraction in Hyperspectral Images[J].IEEE Transactions on Geoscience and Remote Sensing,2013,51(1):184-198. [15] LUO Renbo,LIAO Wenzhi,HUANG Xin,et al.Feature Extraction of Hyperspectral Images with Semisupervised Graph Learning[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2016,9(9):4389-4399. [16] LI Jun,MARPU P R,PLAZA A,et al.Generalized Composite Kernel Framework for Hyperspectral Image Classification[J].IEEE Transactions on Geoscience and Remote Sensing,2013,51(9):4816-4829. [17] KANG Xudong,LI Shutao,BENEDIKTSSON J A.Spectral-Spatial Hyperspectral Image Classification with Edge-preserving Filtering[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(5):2666-2677. [18] TARABALKA Y,BENEDIKTSSON J A,CHANUSSOT J.Spectral-spatial Classification of Hyperspectral Imagery Based on Partitional Clustering Techniques[J].IEEE Transactions on Geoscience and Remote Sensing,2009,47(8):2973-2987. [19] LI Jun,BIOUCAS-DIAS J M,PLAZA A.Spectral-Spatial Hyperspectral Image Segmentation Using Subspace Multinomial Logistic Regression and Markov Random Fields[J].IEEE Transactions on Geoscience and Remote Sensing,2012,50(3):809-823. [20] WEN Jinhua,F(xiàn)OWLER J E,HE Mingyi,et al.Orthogonal Nonnegative Matrix Factorization Combining Multiple Features for Spectral-Spatial Dimensionality Reduction of Hyperspectral Imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2016,54(7):4272-4286. [21] KANG Xudong,LI Shutao,BENEDIKTSSON J A.Feature Extraction of Hyperspectral Images with Image Fusion and Recursive Filtering[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(6):3742-3752. [22] XIA Junshi,BOMBRUN L,ADALI T,et al.Spectral-Spatial Classification of Hyperspectral Images Using ICA and Edge-Preserving Filter via an Ensemble Strategy[J].IEEE Transactions on Geoscience and Remote Sensing,2016,54(8):4971-4982. [23] 魏峰,何明一,梅少輝.空間一致性鄰域保留嵌入的高光譜數(shù)據(jù)特征提取[J].紅外與激光工程,2012,41(5):1249-1254. WEI Feng,HE Mingyi,MEI Shaohui.Hyperspectral Data Feature Extraction Using Spatial Coherence Based Neighborhood Preserving Embedding[J].Infrared and Laser Engineering,2012,41(5):1249-1254. [24] PU Hanye,CHEN Zhao,WANG Bin,et al.A Novel Spatial-Spectral Similarity Measure for Dimensionality Reduction and Classification of Hyperspectral Imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(11):7008-7022. [25] LUNGA D,PRASAD S,CRAWFORD M M,et al.Manifold-Learning-based Feature Extraction for Classification of Hyperspectral Data:A Review of Advances in Manifold Learning[J].IEEE Signal Processing Magazine,2014,31(1):55-66. [26] YUAN Haoiang,TANG Yuanyan,LU Yang,et al.Spectral-Spatial Classification of Hyperspectral Image Based on Discriminant Analysis[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(6):2035-2043. [27] ZHOU Yicong,PENG Jiangtao,CHEN C L P.Dimension Reduction Using Spatial and Spectral Regularized Local Discriminant Embedding for Hyperspectral Image Classification[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(2):1082-1095. [28] GAO Quanxue,MA Jingjie,ZHANG Hailin,et al.Stable Orthogonal Local Discriminant Embedding for Linear Dimensionality Reduction[J].IEEE Transactions on Image Processing,2013,22(7):2521-2531. [29] WEINBERGER K Q,SAUL L K.An Introduction to Nonlinear Dimensionality Reduction by Maximum Variance Unfolding[C]∥Proceedings of the 21st Association on Advances in Artificial Intelligence.Boston,MA:AAAI,2006:1683-1686. Semi-supervised Spatial-spectral Discriminant Analysis for Hyperspectral Image Classification HOU Banghuan1,WANG Kun2,YAO Minli1,JIA Weimin1,WANG Rong1 1. Department of Information Engineering, Rocket Force Engineering University, Xi’an 710025, China; 2. National Computer Network Emergency Response Technical Team/Coordination Center of China, Beijing 100029, China In order to make full use of the spatial information embedded in the hyperspectral image to improve the classification accuracy, a semi-supervised spatial-spectral discriminant analysis (S3DA) algorithm for hyperspectral image classification is proposed. According to the spatial consistency property of hyperspectral image, the intra-class scatter matrix infered from a little labeled samples preserves the spectral similarity of the same class pixels, while the spatial local pixel scatter matrix defined by the unlabeled spatial neighbors uncovers the spatial-domain local pixel neighborhood structures and the ground objects detailed distribution. The S3DA method not only maintains the spectral-domain separability of the data set, but also preserves the spatial-domain local pixel neighborhood structure, which promotes the compactness of the same class pixels or the spatial neighbor pixels in the projected subspace and enhances the classification performance. The overall classification accuracies respectively reach 81.50% and 71.77% on the PaviaU and Indian Pines data sets. Compared with the traditional spectral methods, the proposed method can effectively improve ground objects classification accuracy. hyperspectral image classification; feature extraction; discriminant analysis; spatial-spectral; semi-supervised learning; spatial neighbors The Young Scientists Fund of the National Natural Science Foundation of China (No. 61401471); The China Postdoctoral Science Foundation(No. 2014M562636) HOU Banghuan(1985—),male,PHD Candidates,major in information processing,machine learning and hyperspectral remote sensing image classification. WANG Rong P237 A 1001-1595(2017)09-1098-09 國家自然科學(xué)基金青年科學(xué)基金(61401471);中國博士后科學(xué)基金(2014M562636) (責(zé)任編輯:張艷玲) 2017-03-20 修回日期: 2017-07-24 侯榜煥(1985—),男,博士生,研究方向為信號處理、機(jī)器學(xué)習(xí)、高光譜圖像處理等。 E-mail: chinayouth001@aliyun.com 王榕 E-mail: wangrong07@tsinghua.org.cn2 試驗數(shù)據(jù)及設(shè)置
3 試驗結(jié)果及分析
4 結(jié) 論