李秉璇,周 冰,賀 宣,劉賀雄
(陸軍工程大學(xué)石家莊校區(qū)電子與光學(xué)工程系,河北 石家莊 050003)
高光譜分辨率遙感通過使用連續(xù)細(xì)分光譜波段對地物進(jìn)行持續(xù)的遙感并成像[1],可以獲取地物和目標(biāo)的三維圖像,分別包括空間維和光譜維,圖像中獲取的信息可以對地物和目標(biāo)進(jìn)行深層次的分析。目前,高光譜成像無論在民用和軍用上都有很大的發(fā)展。民用上,高光譜成像在礦物勘察、災(zāi)害預(yù)防、植被生長監(jiān)視和大氣成分檢測已經(jīng)獲得了深入的發(fā)展。軍用上,高光譜成像可以通過與場景中物體特征波段的比較,達(dá)到識別偽裝的目的[2]。
為了進(jìn)一步進(jìn)行圖像處理和目標(biāo)識別,圖像分類已經(jīng)成為高光譜成像應(yīng)用的一項(xiàng)重要技術(shù)。通過對高光譜圖像中每一個(gè)像元賦予唯一的分類標(biāo)識,最終達(dá)到區(qū)分地物并識別目標(biāo)的目的。本文在總結(jié)了高光譜圖像分類方法發(fā)展現(xiàn)狀的基礎(chǔ)上,分析了其存在的問題,展望了其發(fā)展的方向。
用高光譜圖像遙感成像獲得的光譜數(shù)據(jù)量非常大,采用不當(dāng)?shù)姆椒ㄟM(jìn)行處理,反而影響分類。高維的數(shù)據(jù)也對高光譜圖像預(yù)處理造成了很大的困難,如何對高光譜數(shù)據(jù)進(jìn)行高速高效的處理成為高光譜圖像處理中的關(guān)鍵問題。
高光譜圖像獲取的數(shù)據(jù)細(xì)節(jié)程度較高,特征維數(shù)較高。隨著特征維數(shù)的升高,對于含參模型的參數(shù)估計(jì)需要的訓(xùn)練樣本急劇升高,圖像分類精度隨著參與運(yùn)算的波段數(shù)先增加后減少,也被稱為是hughes現(xiàn)象。
由于太陽不同入射角和大氣折射率的區(qū)別,不同空間位置分布的地物可能顯示出相同或相似的光譜特征,不同光譜曲線也有可能是同一種地物,這對高光譜圖像精細(xì)分類提出了新的挑戰(zhàn)。如何結(jié)合空間位置分布和光譜特征對高光譜圖像進(jìn)行分類也成為目前研究的熱點(diǎn)問題[3]。
從高光譜成像的原理來看,對于高光譜圖像分類過程如圖1所示。光譜數(shù)據(jù)預(yù)處理的目的主要是消除高光譜圖像由于大氣散射和折射、幾何畸變等引起的噪聲,包括幾何校正、大氣校正、光譜一階微分以及光譜平滑性處理。對于處理后的數(shù)據(jù),需要確定地物的種類數(shù)以及分類類別數(shù),選取分類類別的訓(xùn)練樣本對分類器進(jìn)行訓(xùn)練。然后采用波段選擇或者特征提取的方法對數(shù)據(jù)降維后進(jìn)行分類,對分類后的數(shù)據(jù)可以采用主成分濾波等手段進(jìn)一步消除孤立點(diǎn)和噪聲,提升分類效果[4]。最后,還需要對分類的結(jié)果進(jìn)行評價(jià),常用的結(jié)果評價(jià)方法有:混淆矩陣、Kappa分析、漏分誤差和多分誤差。
圖1 高光譜分類過程
高光譜圖像分類的理論基礎(chǔ)是“同譜同物”,其分類方法目前主要可以分為:①以先驗(yàn)樣本有無為依據(jù)的監(jiān)督分類和非監(jiān)督分類;②基于光譜信息的光譜相似性和光譜特征分類;③只基于光譜信息的分類器和空譜聯(lián)合分類器;④單分類器和多分類器融合的分類策略。
監(jiān)督方法是指事先已經(jīng)有了已知的先驗(yàn)訓(xùn)練樣本,通過訓(xùn)練樣本對模型進(jìn)行訓(xùn)練,獲得參數(shù)的最佳估計(jì)值,對模型進(jìn)行優(yōu)化,使用優(yōu)化后的模型或分類器進(jìn)行分類的過程[5]。監(jiān)督分類常用的方法有最小距離法、高斯最大似然分類法(MLC)等。
高斯最大似然分類法(MLC)是一種經(jīng)典的監(jiān)督分類算法,該類分類器被認(rèn)為是一種穩(wěn)定性好、魯棒性好的分類器。但是該類分類器訓(xùn)練樣本的需求隨著數(shù)據(jù)維數(shù)成二次方增加,當(dāng)數(shù)據(jù)維數(shù)較高或者樣本數(shù)據(jù)與模型符合度較差時(shí),分類效果不理想,對于出現(xiàn)的這些問題,很多學(xué)者做了相關(guān)研討和實(shí)驗(yàn)。姚伏天假設(shè)各類樣本數(shù)據(jù)服從高斯分布,建立判別函數(shù),通過最大似然比貝葉斯準(zhǔn)則來判斷各個(gè)像元對規(guī)定類別的歸屬概率[6]。Jon提出了一種聯(lián)合神經(jīng)網(wǎng)絡(luò)和統(tǒng)計(jì)建模的方法對高光譜數(shù)據(jù)進(jìn)行分類,首先單獨(dú)處理各個(gè)數(shù)據(jù)源的信息并進(jìn)行建模,然后應(yīng)用決策融合方案來組合數(shù)據(jù)源的信息,提升了分類精度[7]。
③綜合創(chuàng)新能力:初步具備常微分方程理論和方法解決實(shí)際問題的能力,以及初步的創(chuàng)新能力、小論文寫作能力等。
非監(jiān)督方法是在不存在先驗(yàn)知識的情況下,通過圖像自身的特征或者圖像上點(diǎn)的分布來進(jìn)行聚類分類的方法。非監(jiān)督方法缺乏先驗(yàn)知識,直接用于圖像分類效果不好,一般作為監(jiān)督方法的輔助方法。代表性的非監(jiān)督方法有:K均值聚類法、ISODATA動(dòng)態(tài)聚類、平行管道法。
半監(jiān)督方法是為了解決先驗(yàn)樣本較少且難獲取,從未分類樣本中挖掘分類信息的方法,通過先對未分類樣本進(jìn)行分類,再將已分類后的樣本信息加入訓(xùn)練樣本集中,從而減少對先驗(yàn)樣本的需求,緩解hughes現(xiàn)象。半監(jiān)督方法對于樣本分類錯(cuò)誤很敏感,經(jīng)過多次重復(fù)容易造成錯(cuò)誤的累積。為了彌補(bǔ)這一缺陷,blum提出了一種協(xié)同訓(xùn)練的方法,首先訓(xùn)練兩個(gè)分類器,然后將兩個(gè)分類器的無標(biāo)簽樣本分別交給對方進(jìn)行訓(xùn)練[8]。李蓉提出了融合KNN算法和SVM算法的一種新方法,通過KNN算法為SVM算法訓(xùn)練無標(biāo)簽樣本作為訓(xùn)練樣本,隨后SVM使用擴(kuò)展后的訓(xùn)練樣本集進(jìn)行分類的方法[9]。
還有一類半監(jiān)督算法是基于聚類假設(shè)或者流型假設(shè),直接將高光譜數(shù)據(jù)加入分類函數(shù)中。高恒辰提出了一種基于聚類假設(shè)的半監(jiān)督算法,首先基于聚類假設(shè)構(gòu)造新的核函數(shù),然后通過核函數(shù)有效融合空譜信息,提升分類效果[10]。田彥平提出了一種融合主動(dòng)學(xué)習(xí)與半監(jiān)督分類的方法,通過結(jié)合主動(dòng)學(xué)習(xí)算法,加入了大批未標(biāo)記樣本,提高了分類精度,節(jié)省了標(biāo)記樣本時(shí)間[11]。
通過光譜相似性分類的方法是通過計(jì)算樣本光譜曲線和像元光譜曲線之間的相似程度,通過設(shè)定閾值來進(jìn)行分類的方法。最為典型的有光譜相關(guān)系數(shù)、光譜信息散度、信息熵、光譜角度量等,這一方法的優(yōu)點(diǎn)是不需要降維和波段選擇,但是如果目標(biāo)光譜曲線和背景很相似時(shí),分類效果大大降低。Wang提出了一種利用低次諧波重建信號,通過測量目標(biāo)和參考光的頻譜幅度差來計(jì)算其相似性,實(shí)驗(yàn)結(jié)果表明,該方法具有良好的魯棒性和泛化性[12]。閆兵工提出了一種利用信息熵和光譜特征向量來進(jìn)行高光譜圖像分類的方法,提升了分類精度,取得了很好的效果[13]。
通過光譜特征分類的方法進(jìn)行分類是指在光譜特征空間中,利用圖像的統(tǒng)計(jì)特性來進(jìn)行分類的方法。在光譜特征分類中,由于hughes現(xiàn)象,圖像的分類精度對于訓(xùn)練樣本的要求很高,所以一般先進(jìn)行降維處理,再進(jìn)行分類,主要的方法有:主成分分析(PCA)[14]、最大噪聲分?jǐn)?shù)變換(MNF)[15]、線性判別分析[16]以及多種方式融合灰色關(guān)聯(lián)度分析等。經(jīng)過降維后的光譜數(shù)據(jù)再使用傳統(tǒng)分類方法諸如SVM[17]、決策樹、KNN算法等進(jìn)行分類,這種分類方式能夠提升分類速度,加強(qiáng)分類方法的魯棒性和泛化性。
經(jīng)典的高光譜圖像分類方法單單利用了高光譜圖像的光譜信息,而忽略了目標(biāo)的空間信息 。高光譜數(shù)據(jù)具有空間聚類的特點(diǎn),結(jié)合空間信息和光譜信息能夠提升分類速度和精度,更好的挖掘空間信息??兆V聯(lián)合分類分為兩種:同步分類和后處理分類方法。同步分類是將光譜信息和空間信息充分融合,綜合考量兩部分的信息進(jìn)行分類,但該類方法增大了數(shù)據(jù)維數(shù)和計(jì)算復(fù)雜度容易陷入不適定性問題,李娜采用了空間場模型和光譜向量結(jié)合的方法來融合空間信息和光譜信息,使用馬爾可夫隨機(jī)場模型描述空間信息,使用概率支撐向量機(jī)描述光譜信息,綜合兩類信息進(jìn)行分類,提升了分類精度[18]。
后處理分類的方法是在空間分類的基礎(chǔ)上,結(jié)合光譜信息進(jìn)一步優(yōu)化分類結(jié)果,提升分類精度。后處理分類原理簡單,能有效得消除“椒鹽噪聲”,在現(xiàn)有的分類算法中應(yīng)用廣泛。王彩玲和王洪偉等提出了一種空譜聯(lián)合探測的后處理算法,先利用分類器將分類區(qū)域劃分為潛在目標(biāo)區(qū)域以及背景區(qū)域,再利用目標(biāo)區(qū)域的聚類特性進(jìn)行鄰域聚類[19]。孫樂提出了一種空譜聯(lián)合的分類算法,使用融合分類器進(jìn)行光譜空間的信息提取,在采用馬爾可夫模型進(jìn)行空間信息挖掘,可以在訓(xùn)練樣本較少的情況下達(dá)到很好的分類效果[20]。
傳統(tǒng)的分類方法都只使用了單分類器進(jìn)行分類,但實(shí)踐和理論都證明,引入多個(gè)分類器能有效提升分類速度和分類精度。
多分類器進(jìn)行融合的方法有三種,包含并行構(gòu)造、串行構(gòu)造、混合結(jié)構(gòu),但目前并行結(jié)構(gòu)在多分類器融合中使用較為廣泛。吳爾津針對單個(gè)分類器的優(yōu)缺點(diǎn),運(yùn)用類集降少、重新判定、殘差交融等思想將基本分類器進(jìn)行融合,構(gòu)建一系列多分類器,結(jié)果表明,多分類器可以獲得更好的分類結(jié)果[21]。
為了進(jìn)一步提升高光譜分類的效果和精度,研究者基于傳統(tǒng)的分類方法提出了一系列的優(yōu)化方法,如:核函數(shù)、稀疏表示等。同時(shí),隨著機(jī)器學(xué)習(xí)與人工智能的快速發(fā)展,在高光譜圖像分類中引入人工智能算法也成為目前研究的熱點(diǎn)。
4.1.1 核函數(shù)方法
核函數(shù)使用某種非線性變換K(x,x′),將低維空間映射到高維光譜空間,當(dāng)K(x,x′)等于高維空間的內(nèi)積時(shí),能夠在低維空間直接進(jìn)行高維空間的內(nèi)積運(yùn)算,大大簡化了計(jì)算。核函數(shù)的方法在高光譜中的典型應(yīng)用就是Vapnik將線性SVMs推廣到非線性SVMs中。核函數(shù)的類型主要有線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向核函數(shù)。
線性核函數(shù)分類能力有限,隨著q的增大,分類效果也隨之提高,但是計(jì)算量也會(huì)增大,高斯徑向核函數(shù)分類能力不低于高階多項(xiàng)核函數(shù),并且包含其他核函數(shù)的特點(diǎn),計(jì)算復(fù)雜度低,因此在傳統(tǒng)核函數(shù)中最常使用。
核函數(shù)在解決高維空間向量內(nèi)積的問題上提供了新的思路,但目前核函數(shù)的參數(shù)確定方法往往是根據(jù)經(jīng)驗(yàn)確定,如何準(zhǔn)確快速確定和函數(shù)的參數(shù)仍待研究。
4.1.2 稀疏表達(dá)模型
稀疏表示本質(zhì)上就是通過訓(xùn)練樣本建立一個(gè)過完備基,將信號表示為過完備基上的稀疏線性組合。稀疏表示可以通過過完備基來簡化信號形式,進(jìn)一步提取信號中的信息,同時(shí)也有利于對信號進(jìn)行處理和加工,并減少了計(jì)算量。
稀疏表示應(yīng)用到高光譜分類一個(gè)重要的問題就是如何獲取稀疏表示的超完備字典。宋相法和焦李成利用稀疏表示的方法來提取特征空間信息,隨后通過隨機(jī)森林的方法對信息進(jìn)行分析,最后使用投票的方法進(jìn)行分類,雖然對于稀疏表示特征分析方法提高了精度,但對于光譜空間和特征空間的融合還有待研究[22]。
人工智能(artificial intelligence)算法在許多領(lǐng)域已經(jīng)成為研究的熱點(diǎn),人工智能算法最突出的特點(diǎn)就是可以通過機(jī)器學(xué)習(xí)的手段,解決一些復(fù)雜的問題,其通過訓(xùn)練建立的模型非常穩(wěn)定。目前在高光譜分類使用的人工智能算法主要有:支持向量機(jī)、遺傳算法、蟻群算法、人工神經(jīng)網(wǎng)絡(luò)。
4.2.1 支持向量機(jī)(SVM)
支持向量機(jī)是一種基于機(jī)構(gòu)風(fēng)險(xiǎn)最小化的機(jī)器學(xué)習(xí)監(jiān)督算法,支持向量機(jī)結(jié)合核函數(shù)的方式,對高維數(shù)據(jù)進(jìn)行分類時(shí)不需要降維,算法速度快,精度高,對于小樣本的分類目標(biāo)效果較好。劉向東和陳兆乾提出了一種快速支持向量機(jī)分類算法,幾乎不損失識別精度的前提下提高識別速度,但在進(jìn)行矩陣轉(zhuǎn)換時(shí)較為困難[23]。徐杰基于支持模糊向量機(jī)的分類方法通過灰色關(guān)聯(lián)度分析,有效的抑制了噪聲和孤立點(diǎn)[24]。譚琨使用投票的方法有效解決了SVM多分類問題,分別使用了幾種核函數(shù)進(jìn)行了分類,最終結(jié)果表明高斯RBF核函數(shù)精度最高,但是如何準(zhǔn)確估計(jì)參數(shù)值仍需研究[25]。陳建杰通過基于池的主動(dòng)學(xué)習(xí)引入SVM多分類算法中,提高了分類精度,當(dāng)樣本數(shù)據(jù)量較大時(shí),該算法仍較慢[26]。梁亮將ICA(獨(dú)立分量分析)特征提取和支持向量機(jī)算法結(jié)合起來,提出了一種新型算法,提升了分類效果[27]。
4.2.2 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)的一個(gè)分支,近年來在圖像處理方面獲得了很大的發(fā)展。深度學(xué)習(xí)是建立在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上的一種新的機(jī)器學(xué)習(xí)方法,其模型層數(shù)復(fù)雜,解決多分類問題的效果較好。深度學(xué)習(xí)典型的結(jié)構(gòu)包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、棧式自編碼網(wǎng)絡(luò)(SAE)、深度置信網(wǎng)絡(luò)(DBN)。在高光譜分類方面,李新國提出了一種利用深度置信網(wǎng)進(jìn)行高光譜分類的方法,其多層感知器結(jié)構(gòu)能夠?qū)?shù)據(jù)進(jìn)行更深層次的挖掘。馬效瑞提出了一種基于深度學(xué)習(xí)的高光譜影像分類方法,實(shí)現(xiàn)了深度特征提取,豐富了高光譜影響數(shù)據(jù)分析方法。
人工智能算法雖然在解決高光譜數(shù)據(jù)波段范圍廣、波段相關(guān)性高方面提供了一定的思路,但人工智能算法模型對于樣本量的需求非常大,只有通過足夠的訓(xùn)練才能建立穩(wěn)定的模型,達(dá)到良好的分類效果。如何設(shè)計(jì)新型人工智能分類模型和小樣本分類方法仍是人工智能算法需要解決的問題。
隨著高光譜遙感成像空間的分辨率和光譜分辨率不斷提高,對于高光譜圖像分類算法的要求也越來越高。對于傳統(tǒng)高光譜圖像分類策略的算法而言,發(fā)展空譜聯(lián)合、多特征融合、多分類器融合、多尺度融合的分類算法成為未來的發(fā)展方向,如何有效結(jié)合各方面數(shù)據(jù)源,深入挖掘圖像信息,提升分類效率和分類精度,使得算法更好地應(yīng)用到實(shí)際生活和應(yīng)用中成為尚待解決的問題。
對于人工智能算法而言,雖然人工智能算法在解決某些復(fù)雜問題上為我們提供了思路,但樣本需求高、建模困難、分類效果差、分類效率低仍是人工智能算法主要的問題。如何降低人工智能分類模型對樣本的需求量,以最少的訓(xùn)練樣本獲取最精確的模型參數(shù),提升人工智能算法的分類效果和分類精度,發(fā)展人工智能和傳統(tǒng)分類相結(jié)合的優(yōu)化算法,讓人工智能算法趨于實(shí)用成為未來高光譜圖像分類算法的重要研究方向之一。
綜上可以看到,高光譜圖像分類方法的發(fā)展方向呈現(xiàn)如下特點(diǎn):
(1)發(fā)展新型分類器和分類方法仍是高光譜圖像分類的主要方向之一。在機(jī)器學(xué)習(xí)、人工智能迅速發(fā)展的當(dāng)前,如何有效將先進(jìn)算法應(yīng)用到高光譜圖像識別上來仍是研究的熱點(diǎn)??梢灶A(yù)見,隨著智能算法的進(jìn)一步發(fā)展,其在高光譜圖像分類上的應(yīng)用也將越來越成熟。
(2)發(fā)展多尺度融合、多方法融合、空譜聯(lián)合的分類器。如何有效結(jié)合多個(gè)光譜尺度、多分類器方法、空間信息和光譜信息仍是尚待解決的問題,有效結(jié)合多個(gè)分類器的優(yōu)點(diǎn),挖掘各個(gè)光譜范圍內(nèi)的信息,聯(lián)合空間信息和光譜信息來進(jìn)行分類有利于高光譜圖像分類處理的進(jìn)一步發(fā)展。
(3)發(fā)展實(shí)時(shí)化、自動(dòng)化的高光譜高光譜圖像分類算法。目前常用的分類算法分類時(shí)間都相對較長,在一些自然災(zāi)害預(yù)警、軍事偽裝識別等領(lǐng)域?qū)τ谒惴ǖ膶?shí)時(shí)性和自動(dòng)化要求較高,如何能實(shí)現(xiàn)高光譜圖像實(shí)時(shí)分類以及自動(dòng)分類將成為未來主要的研究方向之一。