朱 江, 胡華全, 范雯琦
(1. 裝備學(xué)院 研究生管理大隊(duì), 北京 101416; 2. 裝備學(xué)院 復(fù)雜電子系統(tǒng)仿真實(shí)驗(yàn)室, 北京 101416; 3. 北京跟蹤與通信技術(shù)研究所, 北京 100094)
基于深度神經(jīng)網(wǎng)絡(luò)的高光譜遙感影像分類方法研究
朱 江1, 胡華全2, 范雯琦3
(1. 裝備學(xué)院 研究生管理大隊(duì), 北京 101416; 2. 裝備學(xué)院 復(fù)雜電子系統(tǒng)仿真實(shí)驗(yàn)室, 北京 101416; 3. 北京跟蹤與通信技術(shù)研究所, 北京 100094)
分類是高光譜遙感影像處理中最為重要的一部分。針對現(xiàn)有影像分類方法存在預(yù)處理復(fù)雜、高維特征提取困難、分類不夠精確等缺陷,提出一種基于深度神經(jīng)網(wǎng)絡(luò)的高光譜遙感影像分類算法。算法首先采用最大噪聲分?jǐn)?shù)來降低特征空間維度,然后將自動(dòng)編碼器與softmax多項(xiàng)邏輯回歸分類器組合成含有多隱藏層的神經(jīng)網(wǎng)絡(luò),對高光譜遙感影像進(jìn)行非監(jiān)督型深度特征提取與分類。實(shí)驗(yàn)結(jié)果表明:與傳統(tǒng)的基于線性支持向量機(jī)分類方法相比,本算法可提取更高級(jí)的表達(dá)特征,并在較短的處理時(shí)間內(nèi)實(shí)現(xiàn)較好的影像分類精度。
高光譜遙感;影像分類;深層神經(jīng)網(wǎng)絡(luò);自動(dòng)編碼器;最大噪聲分?jǐn)?shù)
高光譜遙感是通過光譜成像儀(imaging spectrometer)將光譜信息引入遙感成像中去的多維度空間-光譜信息感知技術(shù)[1]。由于低空間分辨率導(dǎo)致混合像元現(xiàn)象、波段間高相似性導(dǎo)致Hughes現(xiàn)象、端元與光譜不對應(yīng)導(dǎo)致數(shù)據(jù)結(jié)構(gòu)高度非線性等原因,使得高光譜影像分類一直都是具有挑戰(zhàn)性的熱點(diǎn)問題,眾多科研人員設(shè)計(jì)了多種不同類型的分類方法[2]。文獻(xiàn)[3]將分類器根據(jù)設(shè)計(jì)方法異同劃分為:監(jiān)督類方法、非監(jiān)督類方法、半監(jiān)督類方法、混合類方法、集成類方法和多分類器融合方法6類。文獻(xiàn)[4]根據(jù)參與分類過程的特征類型及其描述不同,將分類器方法劃分為:光譜域特征分類、空間-光譜特征分類及多特征混合分類算法3類。本文則基于高光譜影像的統(tǒng)計(jì)特性,根據(jù)是否引入有標(biāo)簽訓(xùn)練樣本將分類器簡單劃分為監(jiān)督類方法、半監(jiān)督類方法和非監(jiān)督類方法。
顧名思義,監(jiān)督型分類方法通過訓(xùn)練具有明確標(biāo)識(shí)的像元來獲得最優(yōu)模型,再利用該模型將全部像元映射到對應(yīng)輸出,并對其結(jié)果進(jìn)行簡單判斷從而達(dá)到分類目的,主要方法包括:基于支持向量機(jī)(Support Vector Machine,SVM)的分類[5]、基于核方法的分類[6]、基于統(tǒng)計(jì)模型的最大似然分類[7]和基于稀疏表示的分類[8]。半監(jiān)督型分類方法利用少量已標(biāo)記像元和大量未標(biāo)記像元訓(xùn)練樣本來構(gòu)建有效的分類器,從而降低高光譜遙感影像分類中“不適定”問題的影響。其主要方法包括:自訓(xùn)練分類[9]、合作訓(xùn)練分類[10]、基于生成模型分類[11]、基于低密度分離分類[12]和基于圖的分類[13]等。相較于前2類方法,非監(jiān)督型分類方法不需要任何標(biāo)簽樣本或先驗(yàn)知識(shí),易于處理與實(shí)現(xiàn),常見方法包括K均值聚類[14]和NLTV(Nonlocal Total Variation)法[15]。
深度神經(jīng)網(wǎng)絡(luò)通過構(gòu)建多隱藏層的神經(jīng)元聯(lián)結(jié)從而提取目標(biāo)高維數(shù)據(jù)的深度特征,自2006年Hinton提出后被廣泛用于分類當(dāng)中[16]。對深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練可分為前段所述的監(jiān)督型和非監(jiān)督型。但當(dāng)深度神經(jīng)網(wǎng)絡(luò)通過監(jiān)督型方式進(jìn)行訓(xùn)練時(shí)會(huì)面臨以下問題:(1) 實(shí)際中標(biāo)簽數(shù)據(jù)稀缺,難以方便獲得;(2) 求解高度非凸優(yōu)化問題時(shí)會(huì)存在大量局部極值;(3) 使用梯度下降法時(shí)會(huì)發(fā)生彌散問題。因此,本文提出一種基于非監(jiān)督型多隱藏層的自動(dòng)編碼器深度神經(jīng)網(wǎng)絡(luò)算法:首先,通過最大噪聲分?jǐn)?shù)(Maximum Noise Fraction,MNF)降低頻譜波段數(shù)量,去除冗余相似信息;然后,采用不需要標(biāo)簽樣本的多隱藏層自動(dòng)編碼器對影像進(jìn)行深度特征提取,并在訓(xùn)練完成后使用誤差反向傳播(error Back Propagation,BP)方法進(jìn)行參數(shù)微調(diào)以避免局部極值;最后,借助softmax邏輯回歸分類器完成影像分類。
1.1 MNF方法
高光譜遙感成像可以同時(shí)收集地物的二維空間信息和一維光譜信息,進(jìn)而生成高光譜分辨率全波段連續(xù)的遙感影像。較高光譜分辨率的最大好處就是根據(jù)光譜信息可以更加精確的對地物進(jìn)行分類識(shí)別。如圖1所示,不同波段下的高光譜影像組合成一個(gè)數(shù)據(jù)立方體,每一幅影像中像元記錄的信息是其對應(yīng)瞬時(shí)視場(Instantaneous Field of View,IFOV)內(nèi)地物的輻射信息,每個(gè)像元在不同波段中的輻射信息組成了一個(gè)連續(xù)光譜曲線。然而,由于在狹窄帶寬中存在數(shù)百個(gè)頻帶,且相鄰頻帶之間具有高相關(guān)性,導(dǎo)致了信息冗余與高維數(shù)據(jù)處理困難等問題,還會(huì)產(chǎn)生Hughes現(xiàn)象。因此在分類之前需要對高光譜影像進(jìn)行降維預(yù)處理,即對高維度影像信息用低維度數(shù)據(jù)來簡化表征,在降低數(shù)據(jù)量的同時(shí)優(yōu)化地物的特征提取。
圖1 高光譜遙感成像示意圖
MNF變換是一種簡便高效的高光譜影像降維方法,基本原理是通過正交線性變換將所有波段的數(shù)據(jù)投影到新的特征空間中使彼此互不相關(guān),并按照各影像質(zhì)量由大到小排列各成分,這里影像質(zhì)量的衡量標(biāo)準(zhǔn)是信噪比(Signal to Noise Ratios,SNR)
(1)
式中:ai為變換矩陣中的第i個(gè)變換分量;N為噪聲矩陣;Y=S+N為影像矩陣,S為信號(hào)矩陣;ΓN為噪聲N的協(xié)方差矩陣;ΓY為影像Y的協(xié)方差矩陣。如果對ai標(biāo)準(zhǔn)化,則式(1)可轉(zhuǎn)換成如下最優(yōu)化問題
(2)
通過轉(zhuǎn)換后就可以利用Lagrange乘數(shù)法來求解上式。
相比較于基于信息量排列的主成分分析(PrincipalComponentsAnalysis,PCA)降維方法,MNF變換可以有效克服當(dāng)影像噪聲分布不均衡或噪聲協(xié)方差大于信號(hào)協(xié)方差時(shí),基于信息量排列的PCA方法可能出現(xiàn)的、影像質(zhì)量隨著主成分的增大而增大的情況。
1.2 自動(dòng)編碼器
圖2 自動(dòng)編碼器的基本結(jié)構(gòu)
由圖2可知,自動(dòng)編碼器通過對輸入的數(shù)據(jù)進(jìn)行非線性變換,最終使得x≈y。圖2中自動(dòng)編碼器的基本結(jié)構(gòu)在數(shù)學(xué)上可以表示為
(3)
(4)
(5)
(6)
(7)
(8)
式中,?為學(xué)習(xí)速率,設(shè)置它的主要目的是避免目標(biāo)函數(shù)陷入局部極小。
首先,根據(jù)式(2)使用MNF方法對高光譜影像數(shù)據(jù)進(jìn)行預(yù)處理,在降低原始影像頻譜波段數(shù)量的同時(shí)保留主要數(shù)據(jù)的特征信息。接下來,構(gòu)建自動(dòng)編碼器。為了降低所設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,減少需要訓(xùn)練的網(wǎng)絡(luò)參數(shù),令編碼器的每一層都具有相同的權(quán)重
W(1)=W(2)=…=W(n)=W
(9)
為了提升神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力,達(dá)到“深度”學(xué)習(xí)的目的,增加隱藏層層數(shù)顯然要比直接增加隱藏層神經(jīng)元數(shù)量更加有效。因此,在本算法中設(shè)計(jì)了含有多隱藏層的神經(jīng)網(wǎng)絡(luò)模型對影像特征進(jìn)行提取與分類,即每次訓(xùn)練一層的隱藏節(jié)點(diǎn),訓(xùn)練時(shí)將前一隱藏層的輸出作為本層的輸入,而本隱藏層的輸出則作為后一層的輸入。隱藏層層數(shù)根據(jù)實(shí)際影像數(shù)據(jù)來決定,這里先令n=1,根據(jù)式(3)~式(5)可得到h(1)和y的表達(dá)式
(10)
(11)
(12)
接下來,定義交叉熵代價(jià)函數(shù)
(13)
式中,m為被選取數(shù)據(jù)大小。則式中的損失函數(shù)可以表達(dá)成
(14)
式中,s為輸入數(shù)據(jù)的大小。
為了簡化式(10)和式(11),將其重新寫成
(15)
(16)
(17)
(18)
(19)
(20)
(21)
將上式全部代入到式(7)和式(8)中,可以得到
(22)
(23)
(24)
softmax(x) =P(y(i)=l|x,W,b) =
e(Wx+bl )∑je(Wx + bj )
(25)
最后用BP方法對softmax進(jìn)行微調(diào),直到模型的預(yù)測結(jié)果達(dá)到一個(gè)預(yù)期的準(zhǔn)確率。整個(gè)算法設(shè)計(jì)可以概括為“預(yù)訓(xùn)練+微調(diào)”的結(jié)構(gòu),先對每一層的各參數(shù)進(jìn)行預(yù)訓(xùn)練獲得本層的局部較優(yōu)解,然后再將這些局部較優(yōu)的結(jié)果綜合起來進(jìn)行微調(diào),進(jìn)而尋求整個(gè)網(wǎng)絡(luò)的最優(yōu)設(shè)置。具體算法的設(shè)計(jì)步驟如下:
步驟1 根據(jù)式(2)對原始數(shù)據(jù)進(jìn)行MNF變換,降低冗余波段數(shù)量。
步驟4 根據(jù)式(25)對softmax多項(xiàng)邏輯回歸分類器進(jìn)行訓(xùn)練,得到預(yù)分類結(jié)果。
步驟5 使用BP方法對深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行微調(diào),更新模型參數(shù)。重復(fù)步驟3和步驟4,直到網(wǎng)絡(luò)模型的配置達(dá)到最優(yōu)。
a) 理想的地物分類結(jié)果 b) 基于線性SVM方法的地物分類結(jié)果 c) 基于本算法的地物分類結(jié)果圖5 Indian Pines影像數(shù)據(jù)分類結(jié)果
3.1 實(shí)驗(yàn)測試集
為了驗(yàn)證本文算法的有效性,實(shí)驗(yàn)選取了國際上廣泛使用的標(biāo)準(zhǔn)高光譜測試集Indian Pines和測試集Italy Pavia。其中,Indian Pines測試集為1992年6月由機(jī)載AVIRIS光譜成像儀在美國印第安納州西北部地區(qū)的印第安松樹林上空拍攝,影像大小為145 × 145像素,幾何空間分辨率為20 m。在波長為0.4~2.5 μm的范圍內(nèi)有220個(gè)波段,本次實(shí)驗(yàn)去除了其中的20個(gè)包含強(qiáng)噪聲和水汽吸收的波段,即104~108、150~163和220波段。該測試集共包括草地、作物和建筑在內(nèi)的16種地物。其中,第170波段的真實(shí)影像如圖3所示。
圖3 Indian Pines第170波段真實(shí)影像數(shù)據(jù)
Italy Pavia測試集為帕維亞大學(xué)使用ROSIS光譜成像儀,在帕維亞市的西北方位上空拍攝的。影像大小為610 × 610像素,幾何空間分辨率為20 m。在波長為0.43~0.86 μm的范圍內(nèi)有115個(gè)波段,本次實(shí)驗(yàn)去除了其中的12個(gè)包含強(qiáng)噪聲和水汽吸收的波段。該測試集共包括公路、樹木和屋頂在內(nèi)的9種地物。其中,第13波段的真實(shí)影像如圖4所示。
圖4 Indian Pines第170波段的真實(shí)影像數(shù)據(jù)
3.2 實(shí)驗(yàn)結(jié)果與分析
目前,在高光譜影像分類算法中應(yīng)用最為廣泛的是基于SVM的機(jī)器學(xué)習(xí)方法,該方法原理簡單且特別是在高維模式識(shí)別中性能優(yōu)秀[18]。因此,這里采用基于線性SVM的分類方法與本文算法進(jìn)行對比。此外,實(shí)驗(yàn)所用的計(jì)算機(jī)硬件環(huán)境為Intel Core i7-4600U,CPU 2.69G,顯卡Intel(R) HD,軟件環(huán)境為Windows10(64bit),編程軟件MATLAB 2014b。
由于整個(gè)測試集中的像素?cái)?shù)量龐大,因此這里隨機(jī)選取了20%的樣本用于訓(xùn)練,剩余80%的數(shù)據(jù)用于測試。深度神經(jīng)網(wǎng)絡(luò)中層數(shù)和神經(jīng)元數(shù)目的選取根據(jù)具體測試集來確定,針對Indian Pines測試集,如算法設(shè)計(jì)中所述設(shè)置深度神經(jīng)網(wǎng)包含1個(gè)輸入層,2個(gè)隱藏層和1個(gè)輸出層。選取各層神經(jīng)元個(gè)數(shù)分別為180、120、120、16。設(shè)置學(xué)習(xí)速率?=0.05,預(yù)訓(xùn)練80次,微調(diào)200次。最終分類結(jié)果如圖5所示。針對ItalyPavia測試集,如算法設(shè)計(jì)中所述設(shè)置深度神經(jīng)網(wǎng)包含1個(gè)輸入層,4個(gè)隱藏層和1個(gè)輸出層。選取各層神經(jīng)元個(gè)數(shù)分別為90、70、70、70、70、9。設(shè)置學(xué)習(xí)速率?=0.05,預(yù)訓(xùn)練80次,微調(diào)200次。最終分類結(jié)果如圖6所示。
對上述2個(gè)測試集經(jīng)過重復(fù)10次實(shí)驗(yàn)后本算法的平均分類準(zhǔn)確度分別為90.54%和88.44%,線性SVM的平均分類準(zhǔn)確度分別為79.22%和76.61%。此外,線性SVM方法處理數(shù)據(jù)平均花費(fèi)時(shí)間分別為32.5s和40.5s,而本算法處理數(shù)據(jù)平均所用時(shí)間僅分別為15.2s和17.2s。但是,可以看出本算法在2種地物的交界處還存在較多分類錯(cuò)誤的問題。綜上可知,在高光譜影像分類技術(shù)中引入深層神經(jīng)網(wǎng)絡(luò)模型可以有效提高地物分類精度。
a) 理想的地物分類結(jié)果 b) 基于線性SVM方法的地物分類結(jié)果 c) 基于本算法的地物分類結(jié)果圖6 Italy Pavia影像數(shù)據(jù)分類結(jié)果
本文針對現(xiàn)有高光譜影像分類方法存在的不足,提出一種基于深度神經(jīng)網(wǎng)絡(luò)的高光譜遙感影像空譜聯(lián)合分類算法。該算法具有以下優(yōu)點(diǎn):(1) 在預(yù)處理中引入MNF方法降低原始數(shù)據(jù)的波段維數(shù),提高了計(jì)算處理速度;(2) 構(gòu)建自動(dòng)編碼器與softmax邏輯回歸分類器組合成多隱藏層神經(jīng)網(wǎng)絡(luò),可以更好地進(jìn)行特征深度提取與地物精準(zhǔn)分類。實(shí)驗(yàn)結(jié)果表明:本算法在對高光譜影像處理中,無論是地物分類精度還是時(shí)間消耗上均優(yōu)于傳統(tǒng)SVM分類方法,證明了算法的有效性和優(yōu)越性。
下一步將嘗試對其他特征更復(fù)雜的影像進(jìn)行分類從而驗(yàn)證算法的普適性,針對大規(guī)模的高光譜遙感影像進(jìn)行切割分塊處理。此外,還準(zhǔn)備將本算法與其他分類方法相結(jié)合,組合成一個(gè)多分類器系統(tǒng),從而達(dá)到比單一分類器更好的分類精度。
)
[1]PRASAD S,CHANUSSOT J,FOWLER J E,et al.Introduction to the issue on advances in hyperspectral data processing and analysis[J].IEEE Journal of Selected Topics in Signal Processing,2015,9(6):961-963.
[2]PLAZA A,BIOUCAS-DIAS J M,SIMIC A,et al.Foreword to the special issue on hyperspectral image and signal processing[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2012,5(2):347-353.
[3]CHUTIA D,BHATTACHARYYA D K,SARMA K,et al.Hyperspectral remote sensing classifications:a perspective survey[J].Transactions in GIS,2015,20(4):463-490.
[4]張兵.高光譜圖像處理與信息提取前沿[J].遙感學(xué)報(bào),2016(5):1062-1090.
[5]MELGANI F,BRUZZONE L.Classification of hyperspectral remote sensing images with support vector machines[J].IEEE Transactions on geoscience and remote sensing,2004,42(8):1778-1790.
[6]BUI D T,TUAN T A,KLEMPE H,et al.Spatial prediction models for shallow landslide hazards:a comparative assessment of the efficacy of support vector machines,artificial neural networks,kernel logistic regression,and logistic model tree[J].Landslides,2016,13(2):361-378.
[7]RICHARDS J A.Remote sensing digital image analysis:an introduction[M].Berlin:Springer,2013: 47-50.
[8]WRIGHT J,MA Y,MAIRAL J,et al.Sparse representation for computer vision and pattern recognition[J].Proceedings of the IEEE,2010,98(6):1031-1044.
[10]ZHANG H,LI J,HUANG Y,et al.A nonlocal weighted joint sparse representation classification method for hyperspectral imagery[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(6):2056-2065.
[11]JACKSON Q,LANDGREBE D A.Adaptive Bayesian contextual classification based on Markov random fields[J].IEEE Transactions on Geoscience and Remote Sensing,2002,40(11):2454-2463.
[12]CHI M,BRUZZONE L.Semisupervised classification of hyperspectral images by SVMs optimized in the primal[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(6):1870-1880.
[13]CAMPS-VALLS G,MARSHEVA T V B,ZHOU D.Semi-supervised graph-based hyperspectral image classification[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(10):3044-3054.
[14]JAIN A K.Data clustering:50 years beyond K-means[J].Pattern Recognition Letters,2010,31(8):651-666.
[15]ZHU W,CHAYES V,TIARD A,et al.Unsupervised classification in hyperspectral imagery with nonlocal total variation and primal-dual hybrid gradient algorithm[J].IEEE Transactions on Geoscience & Remote Sensing,2017,55(5):1-13.
[16]HINTON G E,SALAKHUTDINOV R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.
[17]CHEN Y,LIN Z,ZHAO X,et al.Deep learning-based classification of hyperspectral data[J].IEEE Journal of Selected topics in applied earth observations and remote sensing,2014,7(6):2094-2107.
[18]WU Y,YANG X,PLAZA A,et al.Approximate computing of remotely sensed data:SVM hyperspectral image classification as a case study[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2016,9(12):5806-5818.
(編輯:李江濤)
Research on Hyperspectral Remote Sensing Image Classification Based on Deep Neural Networks
ZHU Jiang1, HU Huaquan2, FAN Wenqi3
(1.Department of Graduate Management,Equipment Academy,Beijing 101416,China; 2.Science and Technology on Complex Electronic System Simulation Laboratory,Equipment Academy,Beijing 101416,China; 3.Beijing Institute of Tracking and Telecommunications Technology,Beijing 100094,China)
Classification is the most important part of hyperspectral remote sensing image processing. With view to the setbacks of complex preprocessing, difficult extraction of high-dimensional features and not accurate classification existing in the current classification method, the paper raises an algorithm of hyperspectral remote sensing image classification based on deep neural networks. This algorithm first uses the maximum noise fraction to reduce the feature space dimension, then combines the auto-encoders and the multinomial logistic regression classifier sofemax into a neural networks with multiple hidden layers, to extract and classify the unsupervised deep features of hyperspectral remote sensing images. Experiments show that, in comparison with the traditional linear support vector machine (SVM) classification method, it can extract more advanced expression features and realize better image classification accuracy in a shorter processing time.
hyperspectral remote sensing; image classification; deep neural network; auto-encoder; maximum noise fraction
2017-04-17
部委級(jí)資助項(xiàng)目
朱 江(1990—),男,博士研究生,主要研究方向?yàn)楦吖庾V影像處理。nudt1990@gmail.com
TP701
2095-3828(2017)03-0014-07
A DOI 10.3783/j.issn.2095-3828.2017.03.003