摘 要:針對高光譜遙感圖像復(fù)雜農(nóng)作物分類問題,提出了一種基于空譜融合和隨機(jī)多圖的高光譜遙感圖像農(nóng)作物分類方法。通過使用一種潛在特征融合和最優(yōu)聚類(Latent Features Fusion and Optimal Clustering Framework,LFFOCF) 的波段選擇方法和分段主成分分析(Segmented Principal Component Analysis,SPCA) 進(jìn)行光譜降維,采用多尺度二維奇異譜分析(2DSingular Spectrum Analysis,2-D-SSA) 應(yīng)用于降維圖像,以提取不同尺度的空間特征。將多尺度空間特征與主成分分析(Principal Component Analysis,PCA) 得到的全局光譜特征融合送到隨機(jī)多圖(Random Multi-Graphs,RMG) 中進(jìn)行分類。在印度松樹、薩利納斯和龍口數(shù)據(jù)集上,所提出的方法與一些現(xiàn)有的方法進(jìn)行了對比實驗。實驗結(jié)果表明,該方法的類別精度(Class Accuracy,CA)、總體分類精度(Overall Accuracy,OA)、平均分類精度(Average Accuracy,AA) 和Kappa 系數(shù)優(yōu)于這些方法。
關(guān)鍵詞:高光譜遙感圖像;農(nóng)作物分類;空譜融合;隨機(jī)多圖
中圖分類號:TP751 文獻(xiàn)標(biāo)志碼:A 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
文章編號:1003-3106(2024)05-1205-12
0 引言
農(nóng)作物類型的準(zhǔn)確識別是農(nóng)業(yè)監(jiān)測、農(nóng)作物估產(chǎn)、生長分析、確定農(nóng)作物面積和空間分布的重要依據(jù),也是農(nóng)業(yè)生產(chǎn)過程中資源配置、農(nóng)業(yè)結(jié)構(gòu)調(diào)整和經(jīng)濟(jì)發(fā)展戰(zhàn)略制定的重要參考信息[1]。遙感技術(shù)以其快速、簡單、成本低等優(yōu)點在農(nóng)作物分類中得到了廣泛的應(yīng)用。然而,傳統(tǒng)的多光譜遙感圖像由于其低光譜分辨率的限制,以及不同植物光譜之間存在許多相似特征,使得傳統(tǒng)的寬帶光譜數(shù)據(jù)無法準(zhǔn)確地區(qū)分不同的作物類型[2]。相比之下,高光譜圖像(Hyperspectral Images,HSI)的高空間分辨率為檢測農(nóng)作物之間細(xì)微的光譜差異提供了新的機(jī)會,這有利于農(nóng)作物的精細(xì)分類[3]。
然而,即使使用HSI 進(jìn)行作物識別,仍然存在一些挑戰(zhàn)[4]。其中之一是標(biāo)記樣本的不足,也就是缺乏足夠數(shù)量和多樣性的已知作物樣本進(jìn)行訓(xùn)練和驗證。此外,HSI 的維數(shù)非常高,意味著需要處理大量的光譜波段數(shù)據(jù),增加了分析和處理的復(fù)雜性。同時,HSI 可能受到噪聲的影響,例如由于大氣干擾、光照變化或傳感器誤差引起的噪聲,這可能干擾農(nóng)作物類型的準(zhǔn)確分類[5]。因此,克服這些挑戰(zhàn)需要采用有效的數(shù)據(jù)處理和分析技術(shù),以提高農(nóng)作物分類的準(zhǔn)確性。
HSI 早期的研究主要集中在使用光譜信息進(jìn)行分類[6],其中包括基于光譜的匹配方法和使用分類器,如支持向量機(jī)(Support Vector Machine,SVM)、隨機(jī)森林(Random Forest,RF)和多項式邏輯回歸(Mixed Logistic Regression,MLR)等對光譜信息進(jìn)行分類。一些降維策略也被用于HSI 分類,如主成分分析(Principal Component Analysis,PCA)、局部線性嵌入(Locally Linear Embedding,LLE)和最大噪聲分?jǐn)?shù)(Maximum Noise Fraction,MNF)[7]。然而,PCA 只考慮全局統(tǒng)計,通常無法提?。龋樱?的局部有用特征進(jìn)行分類。因此,提出了頻譜分割PCA 和折疊PCA,以更好地提?。龋樱?特征[8]。盡管這些基于光譜的方法可以通過探索光譜相似性來對標(biāo)簽進(jìn)行分類,但由于氣候條件變化和其他環(huán)境干擾導(dǎo)致的光譜可變性,分類性能通常不令人滿意[9]。目前人們嘗試了許多將空間信息納入HSI 分類,一些方法成功地表明空間信息有利于提高分類性能。因此,各種空間-光譜方法被提出[10]。例如,Zhang 等[11]提出了一種用于HSI 分類的基于局部相關(guān)矩陣的空間-光譜特征表示方法。作為一種強(qiáng)大的統(tǒng)計信號建模工具,協(xié)同表示(Collabrative Representation,CR)已成功用于圖像處理和計算機(jī)視覺應(yīng)用[12]。Jiang 等[13]將空間感知協(xié)同表示用于HSI 分類,通過在目標(biāo)函數(shù)中添加空間正則化項來合并空間信息。此外,二維奇異譜分析(2-D-Singular Spectrum Analysis,2-D-SSA)已成功應(yīng)用于圖像的空間特征提?。郏保矗荨Ec一維情況(SSA)類似,基于奇異值分解(SingularValue Decompositionm,SVD)將給定信號分解為幾個分量,并使用幾個分量重建原始信號的近似描述。但2-D-SSA 在分解數(shù)據(jù)時使用固定的窗口大小,這可能導(dǎo)致在不同尺度下無法充分捕捉到數(shù)據(jù)中的特征和模式[15]。集成學(xué)習(xí)方法[16]被認(rèn)為在HSI 分類方面具有巨大的潛力。通過使用一組“局部專門化”的分類器,集成學(xué)習(xí)方法可以有效地描述數(shù)據(jù)的特征。隨機(jī)多圖(Random Multi-Graphs,RMG)[17]是一種基于圖的集成方法。在RMG 中,分類器由任意數(shù)量的樹組成。這些樹是通過隨機(jī)選擇特征子集來系統(tǒng)地構(gòu)建。受這種隨機(jī)性的啟發(fā),可以提高HSI 分類的性能,以緩解眾所周知的休斯現(xiàn)象。
受以上內(nèi)容的啟發(fā),本文提出了一種基于空譜融合和RMG 的高光譜遙感圖像農(nóng)作物分類方法。首先,考慮到目標(biāo)的整體光譜和相鄰波段的相關(guān)性,通過潛在特征融合和最優(yōu)聚類(Latent Features Fusion and Op-timal Clustering Framework,LFFOCF)的波段選擇方法與分段PCA 相結(jié)合對HSI 進(jìn)行降維,提取全局和局部光譜特征。將多尺度2-D-SSA 應(yīng)用于降維圖像,以提取不同尺度的豐富空間特征。其次,將獲得的多尺度空間特征與光譜特征融合,形成多尺度空間-光譜特征。最后,將提取的特征送到RMG 中進(jìn)行分類。所提出的方法能夠充分利用HSI 的空間信息和光譜信息,在保證效率的同時,提高農(nóng)作物的分類準(zhǔn)確率。
1 光譜和空間特征提取
空譜融合和PMG 的分類方法的流程如圖1 所示,包括2 個主要步驟:① 提取空間和光譜特征;② 將空間和光譜信息集成到PMG 中用于分類。
1. 1 光譜特征提取
由于高光譜數(shù)據(jù)包含大量窄波段信息且維度很高,使用所有波段進(jìn)行分類任務(wù)會增加計算復(fù)雜性。因此,通過波段選擇方法選擇最相關(guān)的波段特征以降低數(shù)據(jù)維數(shù),同時保持重要的識別信息和特征表達(dá)能力。
將X∈RW×H×B 表示為HSI 數(shù)據(jù)立方體,其中W和H 表示數(shù)據(jù)的行和列,通過潛在特征融合和最優(yōu)聚類的波段選擇后數(shù)據(jù)為X∈RW×H×Q ,其波段選擇方法的具體步驟參考文獻(xiàn)[18]。然而,僅依靠全局光譜信息無法充分考慮不同波長范圍內(nèi)光譜輪廓的多樣性以及HSI 數(shù)據(jù)的局部有用特征。因此,可以在潛在特征融合和最優(yōu)聚類的波段選擇后采用分段主成分分析(Segmented Principal ComponentAmalysis,SPCA)方法。SPCA 不僅保留了光譜特征的多樣性,為進(jìn)一步挖掘空間特征提供有用的信息,而且通過減少數(shù)據(jù)維度和消除冗余信息來提高分析效率。在SPCA 方法中,基于相鄰頻帶之間的相關(guān)性通常高于相距更遠(yuǎn)的頻帶[8]這一事實,可以使用簡單的平均方法來快速選擇子集,而無需進(jìn)行復(fù)雜的聚類過程。將Q 波段分為K 個子集,每個子集Xsub 如下:
式中:[Q / K]表示大于Q / K 的最小整數(shù)的值,Xi 表示波段選擇后數(shù)據(jù)的第i 個頻帶。
然后,對相鄰的子集通過PCA 方法得到主成分,并將每個頻帶子集的第一個主成分疊加在一起,形成局部頻譜特征。PCA 的主要任務(wù)是用于將高維度的光譜數(shù)據(jù)降低到較低維度的表示。通過計算數(shù)據(jù)的協(xié)方差矩陣,并對其進(jìn)行特征值分解。對于含有N 個像素和Q 個頻帶的HSI 數(shù)據(jù)X∈?。选粒?,協(xié)方差矩陣C 定義為:
對C 進(jìn)行特征值分解,選擇前s(s<Q)個最大的特征值對應(yīng)的特征向量,可以構(gòu)建一個Q×s 的變換矩陣M。PCA 能夠找到一組稱為主成分的線性變換,將數(shù)據(jù)投影到新的低維空間。這個線性變換可寫為:
Y = MT X ∈Rs ×N 。(3)
為了方便,PCA 和SPCA 的光譜特征表示為:
YPCA = PCA(X,P)∈RW ×H ×P , (4)
YSPCA = {PCA(X1sub ,1),PCA(X2sub ,1),…,PCA(XKsub ,1)}∈ RW ×H ×K , (5)
式中:P(Pl(wèi)t;lt;B)和K(Klt;lt;B)分別表示PCA 和SPCA之后的維數(shù)。
1. 2 基于2DSSA 的多尺度空間特征提取
通過降維處理后,在特征維度更低的同時保留了圖像更集中的光譜多樣性特征。使用不同嵌入窗口大小的2DSSA 應(yīng)用于降維后的數(shù)據(jù)YSPCA 。
對于給定大小為h×w 的灰度圖像和大小為ul ×vl 的嵌入窗口(1≤ul≤h,1≤vl ≤w),該窗口從圖像的左上角開始移動,沿著水平和垂直的方向到達(dá)圖像的右下角。這些嵌入窗口涵蓋了圖像的不同區(qū)域,從而捕捉到更多的局部空間特征。然后將每個位置所提取的窗口內(nèi)的像素展開,再連接為向量V∈Rulvl×1 ,最終形成軌跡矩陣T:
軌跡矩陣T 具有漢克爾結(jié)構(gòu)。通過將漢克爾矩陣按行和按列劃分為多個子矩陣,然后將這些子矩陣再次按行和按列組合形成一個更大的矩陣。對軌跡矩陣T 進(jìn)行SVD,得到以下形式:
T = UΣVT , (7)
式中:Σ 是一個除主對角線上的元素以外全為0 的矩陣,主對角線上的每個元素稱為奇異值δ;U 和V是單位正交矩陣。TTT 的特征值及其對應(yīng)的特征向量表示為(λ1 ≥ λ2 ≥ … ≥ λL )和(U1 ,U2 ,…,UL )。
由于T1 包含了對分類最為關(guān)鍵的空間信息,因此選擇它作為T 的近似值。最后,通過在每個塊和塊之間的矩陣反對角線進(jìn)行兩步對角線平均過程,將矩陣T1 再次轉(zhuǎn)換為大小為h×w 的新圖像,作為重建圖像。這樣可以得到一個低維度的圖像表示,同時保留了重要的空間特征。嵌入窗口大小為ul ×vl 的2-D-SSA 在YSPCA 上執(zhí)行,以獲得第l 尺度空間特征FS,l,該特征可以簡述表示為:矩陣TTT 的特征值與對應(yīng)的奇異值δi 滿足以下關(guān)系:
式中:n 為不同嵌入窗口的總尺度數(shù)目,FS,l 的大小與YSPCA 完全相同。
多尺度2-D-SSA 能夠同時考慮HSI 中不同尺度上的空間特征。這種方法能夠有效捕捉圖像的局部和全局空間結(jié)構(gòu)。但使用不同尺度的堆疊特征會增加計算成本并引入冗余信息,而且從不同尺度2-D-SSA 獲得的圖像會變得連續(xù)平滑導(dǎo)致細(xì)節(jié)信息的丟失。因此,通過對每個尺度的特征圖像應(yīng)用PCA 來解決這個問題。設(shè)FMS,l 表示對第l 尺度特征圖像FS,l 上應(yīng)用PCA 之后的前J 個分量:
FMS,l = PCA(FS,l,J)∈ RW ×H ×J (l = 1,2,…,n),(11)
式中:J(J≤K)表示PCA 后的維數(shù)。最終的多尺度空間特征可以堆疊為:
FMS = {FMS,1 ,FMS,2 ,…,FMS,n }∈RW ×H ×(n ×J)。(12)
與FS,l 相比,FMS,l 特征能夠更好地捕捉不同尺度下的局部場景差異。疊加這些經(jīng)過PCA 處理的特征能進(jìn)一步豐富地物的空間特征,獲得更加精確的分類結(jié)果。
1. 3 特征融合
將多尺度空間特征FMS,l 和光譜特征YPCA 進(jìn)行融合,得到了FSS 特征,表示為:
FSS = {FMS,l,YPCA }∈ RW ×H ×(nJ +P)。(13)
在FSS 中,每個像素向量不僅包含原始光譜輪廓的主要特征,還包含了鄰域空間和相鄰頻帶的多尺度集中特征。多尺度集中特征有助于減少單個尺度上相似特征引起的誤分類,并提高識別能力,從而確定正確的標(biāo)簽。
2 基于RMG 的分類
將組合的光譜和空間特征輸入到RMG 中進(jìn)行分類。RMG 最初被應(yīng)用于人臉識別領(lǐng)域,但也可以應(yīng)用于其他高維數(shù)據(jù)的分類問題,試圖完成2 個目標(biāo):第一個是通過在圖中引入隨機(jī)性來避免維數(shù)災(zāi)難和過擬合問題;第二是提供一種用于處理高維數(shù)據(jù)的學(xué)習(xí)框架。
給定一個數(shù)據(jù)集,由標(biāo)記數(shù)據(jù)Xlab = [x1 ,x2 ,…,xα]和未標(biāo)記數(shù)據(jù)Xunlab = [xα+1 ,xα+2 ,…,xα+β ]組成的數(shù)據(jù)集可以構(gòu)建一個加權(quán)圖。N = α+β 個數(shù)據(jù)點對應(yīng)圖中的頂點,帶權(quán)值的邊表示節(jié)點之間的相似度,通常用權(quán)值矩陣A∈?。巍粒?表示。通過在圖中的標(biāo)記節(jié)點上設(shè)置相應(yīng)的標(biāo)簽來將標(biāo)簽信息注入到圖中的相應(yīng)頂點,并在整個圖中傳播,每個頂點會根據(jù)其鄰居節(jié)點的標(biāo)簽以及邊的權(quán)重進(jìn)行更新。如果權(quán)重aij 較大,則相鄰頂點xi 和xj 的標(biāo)簽預(yù)計相同。傳統(tǒng)基于圖的學(xué)習(xí)方法可以描述為以下二次優(yōu)化問題:
min F tr(F - Y) T G(F - Y)+ tr(FT LF), (14)
式中:tr(·)為跡函數(shù),Y = (y1 ,…,yα,0,…,0) T ∈?。巍粒纾啤剩。巍粒?預(yù)測標(biāo)簽,G∈?。巍粒?為對角矩陣,第i個對角元素gi 計算為:當(dāng)1≤i≤α 時,gi = Gα >0;當(dāng)1+α≤i≤N 時,gi = Gβ >0,其中Gα 和Gβ 是2 個參數(shù)。式(14)的第一項是擬合項,第二項是正則化項。L 是圖的拉普拉斯算子,定義為L = D-A,A 為圖的權(quán)重矩陣,D 是A 的行和。aij 表示節(jié)點i 和節(jié)點j 之間的連接強(qiáng)度,如若節(jié)點i 和節(jié)點j 不相鄰,則aij = 0;否則:
式中:σ 為需要調(diào)整的內(nèi)核寬度參數(shù)。
錨圖算法的關(guān)鍵是捕獲數(shù)據(jù)的局部結(jié)構(gòu),廣泛應(yīng)用于具有成對連接的關(guān)系和交互的復(fù)雜系統(tǒng)。與全局結(jié)構(gòu)相比,局部結(jié)構(gòu)包含更有用、更詳細(xì)的數(shù)據(jù)信息。在錨圖算法中,可以處理大規(guī)模數(shù)據(jù),并將標(biāo)簽預(yù)測函數(shù)表示為錨樣本子集上標(biāo)簽的加權(quán)平均值。因此,標(biāo)簽預(yù)測函數(shù)f 可以由子集表示為:
式中:Pij 是數(shù)據(jù)自適應(yīng)權(quán)重,O = {oj }mj= 1 ,每個oj 是一個錨點。
式(16)將未知標(biāo)簽的解空間更加精確。由于Kmeans 聚類中心對覆蓋整個數(shù)據(jù)集具有很強(qiáng)的表征能力,因此選擇該聚類中心為錨點。
RMG 的整體流程描述如下:
① 從每個樣本的所有高維特征中隨機(jī)選擇kf 個特征。
② 選擇m 個錨點來覆蓋由錨點矩陣表示的數(shù)據(jù)流形,計算映射矩陣P 以通過錨點表示其余數(shù)據(jù)點。
③ 利用圖拉普拉斯正則化對該圖進(jìn)行半監(jiān)督推理。
④ 重復(fù)上述步驟,多次進(jìn)行隨機(jī)特征選擇、錨點選擇和圖構(gòu)建的過程。
⑤ 對生成的多個圖進(jìn)行投票確定未標(biāo)記數(shù)據(jù)點的標(biāo)簽。
通過從每個樣本的所有高維特征中隨機(jī)選擇一小部分特征來構(gòu)建圖,未選擇的特征權(quán)重在圖中被懲罰為零。RMG 可以被認(rèn)為是一種正則化,這種正則化對緩解過度擬合現(xiàn)象做出很大貢獻(xiàn)。
3 實驗結(jié)果與分析
3. 1 實驗設(shè)置和數(shù)據(jù)集
3. 1. 1 實驗設(shè)置
2. 70 GHz CPU 和8 GB 內(nèi)存,開發(fā)環(huán)境為Matlab 2016b。由于不同的實驗參數(shù)設(shè)置會影響模型的分類精度,因此要確定實驗中的重要參數(shù)以獲得最優(yōu)的分類結(jié)果。在進(jìn)行光譜特征提取時,應(yīng)用了LFFOCF 來降低HSI 的維度。保持其他條件不變,印度松樹、薩利納斯和龍口數(shù)據(jù)集的波段數(shù)分別設(shè)置為40、45 和35。在3 個數(shù)據(jù)集中,參數(shù)K、P 和J分別固定為10、3 和8。
3. 1. 2 高光譜數(shù)據(jù)集
實驗數(shù)據(jù)為3 個廣泛使用的基準(zhǔn)數(shù)據(jù)集,可以用來評估所提出方法的有效性。這些數(shù)據(jù)集的細(xì)節(jié)描述如下。
① 印度松樹(Indian pines):該數(shù)據(jù)集由印第安納州的AVIRIS 傳感器獲得,包含224 個波段,每個波段的大小為145 pixel×145 pixel。此外,地面實物包括16 個類別(玉米、草、大豆等)。由于一些波段被吸水區(qū)域所覆蓋,去除吸水波段,最終得到200 個波段用于實驗。
② 薩利納斯(Salinas):覆蓋美國加利福尼亞州Salinas 山谷的一個區(qū)域。該圖像由機(jī)載可見光/紅外成像光譜儀獲得,具有3. 7 m 的空間分辨率。它由517 pixel×217 pixel 組成,共16 類。去除吸水率方面的20 個噪聲波段,保留204 個噪聲波段用于實驗分析。
③ 龍口數(shù)據(jù)集(WHU-Hi-LongKou)[19-20]:2018 年7 月17 日,成像傳感器在中國湖北省龍口鎮(zhèn)上空拍攝到這一場景,該場景由550 pixel×400 pixel 和270 個波段組成。測試中使用了受到噪聲嚴(yán)重影響的矩形部分。地面實況圖包含74 474 個像素,這些像素屬于9 個類別。
3. 2 評價指標(biāo)
在實驗結(jié)果評估中,采用了4 個指標(biāo)來評估模型的分類性能,分別是類別精度(Class Accuracy,CA)、總體分類精度(Overall Accuracy,OA)、平均分類精度(Average Accuracy,AA)和Kappa 系數(shù)。這4 個指標(biāo)的數(shù)值越大,表明模型的分類性能越好。OA 的計算為:
式中:C 表示圖像中待分類樣本的類別數(shù)目,Ni 表示第i(1≤i≤C)類樣本中待分類樣本的數(shù)量,Ni 表示第i 類樣本中被準(zhǔn)確劃分的樣本個數(shù)。
AA 體現(xiàn)出算法對各種類別樣本的總體分類效果,其計算如下:
3. 3 實驗結(jié)果分析
為了驗證所提出方法的優(yōu)越性,本文選擇對以下5 種分類方法進(jìn)行比較,分別是SVM、RMG[17]、局部相關(guān)矩陣(Local Correntropy Matrix,LCEM)[11]、超像素引導(dǎo)局部保持圖的局部低秩近似(Local Low-Rank Approximation with Superpixel-Guided LocalityPreserving Graph,LLRA-SLPG)[9]和聯(lián)合空間感知協(xié)同表示(Joint Spatial-aware Collaborative Represen-tation,JSaCR)[13]。為了確保每個方法都能獲得最佳效果,所有實驗均采用公開文章推薦的參數(shù)設(shè)置。從Indian pines、Salinas 和WHU-Hi-LongKou 這3 個數(shù)據(jù)集中隨機(jī)選擇每個類別5% 、0. 6% 、0. 3% 的標(biāo)記樣本作為訓(xùn)練樣本,其余樣本用于測試。表1 ~表3 比較了3 個數(shù)據(jù)集的詳細(xì)分類精度。所提出的方法在3 個數(shù)據(jù)集的OA、AA、Kappa 這幾個類別指標(biāo)和大多數(shù)類別方面獲得了較高的分類精度。
3. 3. 1 Indian pines 數(shù)據(jù)集上的實驗結(jié)果及評價分析
Indian pines 數(shù)據(jù)集上不同比較方法的定量結(jié)果如表1 所示,該數(shù)據(jù)集包括5 個類別的100% 準(zhǔn)確率和所有類別的94% 以上準(zhǔn)確率,所提出方法的OA 比其他先進(jìn)方法RMG、LCEM、LLRASLPG 和JSaCR 分別提升了0. 77% 、1. 64% 、1. 14% 、1. 9% ,AA 比其他幾種先進(jìn)方法分別高出約2. 01% 、3. 77% 、1. 92% 、1. 6% ,Kappa 系數(shù)比其他幾種先進(jìn)方法分別提升約0. 008 8、0. 018 7、0. 013、0. 021 7。相對于SVM 在OA、AA 和Kappa 這3 個指標(biāo)上分別提升了23. 46% 、30. 69% 、0. 252。所有比較的方法在準(zhǔn)確率上都比SVM 分類方法有不同程度的提高。在該數(shù)據(jù)集上就處理效率而言,所提方法不是最有效的,但仍然比LLRA-SLPG 更快,在計算時間上是可以接受的。
Indian pines 數(shù)據(jù)集的真實地物分類圖(Groundtruth)和使用相同訓(xùn)練像素5% 的不同方法的可視化結(jié)果如圖2 所示,本文方法對形狀不規(guī)則的小型地面物體具有優(yōu)異的分類性能。地面物體的形態(tài)得到了很好的保存,具有更高的內(nèi)部平滑度,進(jìn)一步證明了所提出方法的優(yōu)越性。這些優(yōu)點歸功于所提出的方法可以有效地利用隱藏在未標(biāo)記數(shù)據(jù)中的有價值信息。
3. 3. 2 Salinas 數(shù)據(jù)集上的實驗結(jié)果及評價分析
Salinas 數(shù)據(jù)集上不同比較方法的定量結(jié)果如表2 所示,包括5 個類別的100% 準(zhǔn)確率和所有類別的93% 以上準(zhǔn)確率,所提出方法的OA 比其他先進(jìn)方法RMG、LCEM、LLRASLPG 和JSaCR 分別提升了1. 0% 、0. 28% 、1. 42% 、0. 55% ,AA 比其他幾種先進(jìn)方法高出約0. 89% 、0. 12% 、1. 78% 、0. 59% ,Kappa 系數(shù)比其他幾種先進(jìn)方法高出約0. 011 1、0. 003、0. 015 7、0. 003 6。相對于SVM,在OA、AA和Kappa 這3 個指標(biāo)上分別提升了9. 86% 、7. 32% 、0. 106 4。同時,該方法在Salinas 數(shù)據(jù)集上具有合理的運(yùn)行時間。
Salinas 數(shù)據(jù)集的Ground truth 和使用相同訓(xùn)練像素0. 6% 的不同方法的可視化結(jié)果如圖3 所示,SVM 方法在土地覆蓋層內(nèi)部出現(xiàn)明顯的錯誤分類,表現(xiàn)為分類噪聲。所提出的方法合理利用光譜和多尺度空間特征進(jìn)行分類,其中類內(nèi)區(qū)域是平滑的,而類間區(qū)域有清晰的邊界,可以在保留邊緣的同時產(chǎn)生更均勻、更平滑的分類圖,顯示出令人滿意的性能。
3. 3. 3 WHU-Hi-LongKou 數(shù)據(jù)集上的實驗結(jié)果及評價分析
WHU-Hi-LongKou 數(shù)據(jù)集上不同比較方法的定量結(jié)果如表3 所示,可以得出相同的結(jié)論,即所提出的方法具有良好的魯棒性,并在具有挑戰(zhàn)性的場景中實現(xiàn)了最高的分類精度。該數(shù)據(jù)集包括所有類別的95% 以上準(zhǔn)確率,所提出方法的OA 比其他先進(jìn)方法RMG、LCEM、LLRA-SLPG 和JSaCR 分別提升了3. 23% 、1. 47% 、1. 65% 、0. 81% ,AA 比其他幾種先進(jìn)方法高出約2. 47% 、6. 71% 、7. 42% 、2. 47% ,Kappa 系數(shù)比其他幾種先進(jìn)方法高出約0. 043、0. 019 2、0. 021 5、0. 006 8。相對于SVM 在OA、AA 和Kappa 這3 個指標(biāo)上分別提升了4. 53% 、15. 32% 、0. 058 4。在運(yùn)行時間上,所提方法在WHU-Hi-LongKou 數(shù)據(jù)集上不是所有方法中最好的,但是相對于RMG 和LLRA-SLPG 花費更少的時間。
WHU-Hi-LongKou 數(shù)據(jù)集的Ground truth 和使用相同訓(xùn)練像素0. 3% 的不同方法的可視化結(jié)果如圖4 所示,通過分類圖突出了所提方法的優(yōu)越性,本文方法有效地消除了分類圖中的椒鹽和阻塞噪聲的影響,并保留了不同對象的形狀和語義結(jié)構(gòu),尤其是對于道路和農(nóng)作物。驗證了所提方法中包含的提取特征可以提高不同像素的可識別性和可分辨性。
3. 3. 4 訓(xùn)練樣本數(shù)量對分類性能的影響
在實驗中,對于Indian pines,所選擇的訓(xùn)練樣本的數(shù)量在{1% 、2% 、3% 、4% 、5% }變化,對于Salinas數(shù)據(jù)集,在{0. 2% 、0. 3% 、0. 4% 、0. 5% 、0. 6% }變化,而對于WHU-Hi-LongKou 數(shù)據(jù)集,則在{0. 1% 、0. 15% 、0. 2% 、0. 25% 、0. 3% }變化。
圖5 ~ 圖7 比較了Indian pines、Salinas 和WHU-Hi-LongKou 數(shù)據(jù)集上不同訓(xùn)練樣本數(shù)量對分類結(jié)果的影響??梢钥闯鲈诖蠖鄶?shù)方法中,用于訓(xùn)練的標(biāo)記樣本量的增加對分類性能有積極的促進(jìn)作用,主要是因為大的訓(xùn)練集可以提供更多的信息來學(xué)習(xí)判別特征。此外,一些比較方法,如RMG 在In-dian pines 上取得了優(yōu)異的結(jié)果,但在其他數(shù)據(jù)集上卻取得了較差的結(jié)果。所提出的方法可以在所有數(shù)據(jù)下實現(xiàn)較高的分類精度,WHUHi-LongKou 數(shù)據(jù)集即使在0. 1% 的訓(xùn)練樣本中也實現(xiàn)了最高的分類精度,證明了其高效性和魯棒性,這是由于所選波段子集上的空間特性得到了增強(qiáng),對象特征的可分辨性得到了提高。
4 結(jié)束語
本文通過加入隨機(jī)性來解決高光譜農(nóng)作物圖像分類問題,提出了一種基于空譜融合和RMG 的高光譜遙感圖像農(nóng)作物分類的新方法。首先,通過降維來提取不同尺度的豐富空間特征;然后,將獲得的多尺度空間特征與全局光譜特征融合,形成多尺度光譜-空間特征;最后,將提取的多尺度特征送到RMG 中用于分類。所提出的方法能夠有效利用HSI 的空間信息和光譜信息,保護(hù)特征的邊緣和形狀,緩解過度平滑的同時保留細(xì)節(jié)信息。在Indianpines、Salinas 和WHU-Hi-LongKou 這3 個數(shù)據(jù)集上,該方法相比SVM、RMG、LCEM、LLRA-SLPG 和JSaCR 方法的OA、AA 和Kappa 系數(shù)都有不同程度的提升。在農(nóng)作物分類中具有較好的分類性能和泛化能力。由于HSI 的人工標(biāo)記需要耗費大量的人力和物力,在HSI 分類任務(wù)中,可用的標(biāo)記樣本通常非常有限。因此,在小樣本條件下提高分類精度需要進(jìn)一步研究考。
參考文獻(xiàn)
[1] 薛乃丹. 基于高分衛(wèi)星遙感影像的農(nóng)作物分類方法研究[D]. 沈陽:沈陽農(nóng)業(yè)大學(xué),2022.
[2] LI X Y,ZHANG L F,YOU J. Hyperspectral Image Classification Based on Twostage Subspace Projection [J].Remote Sensing,2018,10(10):1565.
[3] 楊棟膗. 基于無人機(jī)遙感的農(nóng)作物分類方法研究[D].昆明:云南農(nóng)業(yè)大學(xué),2022.
[4] JIA S,JIANG S G,LIN Z J,et al. A Survey:Deep Learningfor Hyperspectral Image Classification with Few LabeledSamples[J]. Neurocomputing,2021,448:179-204.
[5] AGILANDEESWARI L,PRABUKUMAR M,RADHESYAMV,et al. Crop Classification for Agricultural Applicationsin Hyperspectral Remote Sensing Images [J ]. AppliedSciences,2022,12(3):1670.
[6] PAOLETTI M E,HAUT J M,PLAZA J,et al. Deeplearning Classifiers for Hyperspectral Imaging:A Review[J ]. ISPRS Journal of Photogrammetry and RemoteSensing,2019,158:279-317.
[7] FU H,SUN G Y,REN J C,et al. Fusion of PCA and SegmentedPCA Domain Multiscale 2DSSA for EffectiveSpectralspatial Feature Extraction and Data Classificationin Hyperspectral Imagery[J]. IEEE Transactions on Geoscience and Remote Sensing,2022,60:5500214.
[8] UDDIN M P,MAMUN M A,AFJAL M I,et al.Informationtheoretic Feature Selection with Segmentationbased Folded Principal Component Analysis (PCA)forHyperspectral Image Classification [J ]. InternationalJournal of Remote Sensing,2021,42(1):286-321.
[9] YANG S J,ZHANG Y,JIA Y H,et al. Local LowrankApproximation with Superpixelguided Locality PreservingGraph for Hyperspectral Image Classification [J]. IEEEJournal of Selected Topics in Applied Earth Observationsand Remote Sensing,2022,15:7741-7754.
[10] HE L,LIU C Y,LI J,et al. Hyperspectral Image SpectralSpatialrange Gabor Filtering [J]. IEEE Transactions onGeoscience and Remote Sensing,2020,58 (7 ):4818 -4836.
[11] ZHANG X Y,WEI Y T,CAO W J,et al. Local CorrentropyMatrix Representation for Hyperspectral Image Classification[J]. IEEE Transactions on Geoscience and RemoteSensing,2022,60:1-13.
[12] 張雷雨,曾毅,李勝輝,等. 加權(quán)的判別性協(xié)同表示方法用于高光譜遙感圖像分類[J]. 無線電工程,2023,53(6):1359-1367.
[13] JIANG J J,CHEN C,YU Y,et al. Spatialaware Collaborative Representation for Hyperspectral Remote SensingImage Classification [J]. IEEE Geoscience and RemoteSensing Letters,2017,14(3):404-408.
[14] ZABALZA J,QING C M,YUEN P,et al. Fast Implementation of Twodimensional Singular Spectrum Analysis forEffective Data Classification in Hyperspectral Imaging[J]. Journal of the Franklin Institute,2018,355 (4 ):1733-1751.
[15] FU H,ZHANG A Z,SUN G Y,et al. A Novel BandSelection and Spatial Noise Reduction Method for Hyperspectral Image Classification [J]. IEEE Transactions onGeoscience and Remote Sensing,2022,60:1-13.
[16] 陳萌. 改進(jìn)主動深度學(xué)習(xí)的高光譜圖像半監(jiān)督分類方法研究[D]. 哈爾濱:哈爾濱理工大學(xué),2022.
[17] GAO F,WANG Q,DONG J Y,et al. Spectral and SpatialClassification of Hyperspectral Images Based on RandomMultigraphs[J]. Remote Sensing,2018,10(8):1271.
[18] 聶萍,汪國強(qiáng). 潛在特征融合和最優(yōu)聚類的高光譜圖像降維[J]. 黑龍江大學(xué)工程學(xué)報,2023,14(1):51-59.
[19] ZHANG Y F,HU X,LUO C,et al. WHUHi:UAVbornehyperspectral with High Spatial Resolution (H2 )Benchmark Datasets and Classifier for Precise Crop IdentificationBased on Deep Convolutional Neural Network with CRF[J]. Remote Sensing of Environment,2020,250:112012.
[20] ZHONG Y F,WANG X Y,XU Y,et al. MiniUAVbornehyperspectral Remote Sensing:From Observation and Processing to Applications[J]. IEEE Geoscience and RemoteSensing Magazine,2018,6(4):46-62.
作者簡介
聶 萍 女,(1999—),碩士研究生。主要研究方向:高光譜遙感圖像處理。
李 飛 男,(1998—),碩士研究生。主要研究方向:數(shù)字圖像處理、微表情識別。
楊 昭 男,(1998—),碩士研究生。主要研究方向:數(shù)字圖像處理。
(*通信作者)汪國強(qiáng) 男,(1963—),博士,教授,碩士生導(dǎo)師。主要研究方向:信號檢測及處理。
基金項目:國家自然科學(xué)基金(51607059);黑龍江省自然科學(xué)基金(QC2017059)