孫康 耿修瑞 陳金勇 計(jì)璐艷 唐海蓉 趙永超 許妙忠
1.中國電子科技集團(tuán)公司第五十四研究所
2.中國科學(xué)院電子學(xué)研究所
3.清華大學(xué)地球系統(tǒng)科學(xué)研究中心
4.武漢大學(xué)測(cè)繪遙感信息工程國家重點(diǎn)實(shí)驗(yàn)室
技術(shù)應(yīng)用
基于圖表示的魯棒高效的高光譜圖像波段選擇方法
孫康1耿修瑞2陳金勇1計(jì)璐艷3唐海蓉2趙永超2許妙忠4
1.中國電子科技集團(tuán)公司第五十四研究所
2.中國科學(xué)院電子學(xué)研究所
3.清華大學(xué)地球系統(tǒng)科學(xué)研究中心
4.武漢大學(xué)測(cè)繪遙感信息工程國家重點(diǎn)實(shí)驗(yàn)室
在非監(jiān)督波段選擇領(lǐng)域,算法魯棒性和高效性具有重要意義。本文基于圖表示提出了非監(jiān)督波段選擇算法,稱為GRBS(graph representation based band selection),該算法既對(duì)噪聲波段有較高的魯棒性,同時(shí)又具有較低的計(jì)算復(fù)雜度。在GRBS算中,高光譜波段被當(dāng)作高維空間中的一個(gè)節(jié)點(diǎn),這些節(jié)點(diǎn)聚成一些簇團(tuán),位于簇團(tuán)中心的波段是GRBS選擇的理想波段。有趣的是,不同于其他基于聚類的波段選擇方法,GRBS并不需要對(duì)波段進(jìn)行聚類分析,而是通過一個(gè)計(jì)算簡(jiǎn)單的準(zhǔn)則函數(shù)選擇目標(biāo)波段,這樣大大降低了計(jì)算復(fù)雜度同時(shí)提高了算法的魯棒性。試驗(yàn)結(jié)果表明,GRBS具有優(yōu)良的波段選擇性能,在精度和速度上能夠超越傳統(tǒng)的算法。
高光譜圖像,降維,特征提取,波段選擇,噪聲魯邦
高光譜遙感可以以精細(xì)的光譜分辨率對(duì)地面物體采集從可見到紅外的數(shù)百個(gè)波段(Landgrebe 2002;Plaza et al.2009)。這些豐富的信息為精細(xì)的圖像應(yīng)用,如地物分類和識(shí)別,提供了必要的數(shù)據(jù)基礎(chǔ)。然而,由于高光譜圖像的波段之間(尤其是相鄰的波段)有較大的相關(guān)性,因此高光譜數(shù)據(jù)也同時(shí)存在著很大冗余。此外,對(duì)于一些應(yīng)用,如分類,波段數(shù)的增多并不一定意味著好的結(jié)果,甚至還會(huì)降低分類精度,這就是“維數(shù)災(zāi)難”(Kim and Landgrebe 1991)。另一方面,高光譜巨大的數(shù)據(jù)量對(duì)計(jì)算能力也有很高的要求。因此,數(shù)據(jù)降維對(duì)高光譜應(yīng)用有重要的作用(Dópido et al.2012)。
特征提取是一種常用的降維手段,經(jīng)典的特征提取方法包括主成分分析(PCA)(Jolliffe 2005)、最小噪聲分離(MNF)(Green et al.1988)以及獨(dú)立成分分析(ICA)(Hyv?rinen,Karhunen, and Oja 2004),其他的一些特征提取方法包括(Bruce,koger,and Li 2002;Yang,Yu,and Kuo 2010; Chang et al.2014;Kuo 2004).。這些方法從信息保持的角度來看,具有很好的效果,選出的特征也更具有區(qū)分性。但這些特征由于是原始特征的變換,因此喪失了原始光譜的物理意義。另一個(gè)降維途徑是特征選擇(波段選擇),它從原始波段集合中根據(jù)一定的標(biāo)準(zhǔn),選出一個(gè)滿足要求波段子集(Bajcsy and Groves 2004)。相對(duì)于特征提取,波段選擇的好處是,得到的特征具有物理意義。此外,波段選擇對(duì)與高光譜數(shù)據(jù)獲取,傳輸,以及儲(chǔ)存也具有積極的意義。事實(shí)上,波段選擇已經(jīng)成為了高光譜預(yù)處理中的一個(gè)重要步驟。
整體上,波段選擇的方法可以分為監(jiān)督方式和非監(jiān)督方式兩大類。監(jiān)督的波段選擇需要一定的先驗(yàn)信息如訓(xùn)練樣本和目標(biāo)光譜等(Bruzzone and Serpico 2000;Kuo et al.2014; Yang et al.2011; Sun,Geng,and Ji 2014)。但是在實(shí)際中,受限于時(shí)間和經(jīng)費(fèi)的限制,這些先驗(yàn)信息往往無法獲得(Bruzzone,Chi,and Marconcini 2006;Dópido et al.2012),在這種情況下,我們需要發(fā)展一些廣泛適用于不同目標(biāo)或者類別的,能獲得較好性能的可靠波段選擇算法。也就是非監(jiān)督的波段選擇算法,本文重點(diǎn)著眼于非監(jiān)督波段選擇算法。
非監(jiān)督的波段選擇已經(jīng)有了一些研究成果。有些方法是基于波段排序的(Chang et al.1999;Chang and Wang 2006),這些方法一般先定義某個(gè)指標(biāo)(一般是單波段的指標(biāo)),然后對(duì)各個(gè)波段計(jì)算指標(biāo)并排序并依照排序順序選擇需要的波段。如IDBS依據(jù)波段的偏離對(duì)應(yīng)高斯分布的程度進(jìn)行排序,ID值越大,則權(quán)重越大。盡管排序算法不需要子集搜索果,因此速度較快,但是由于沒有考慮相關(guān)性,得到的波段往往相關(guān)性很大。
有些其他方法在設(shè)計(jì)代價(jià)函數(shù)時(shí)考慮了波段的相關(guān)性,比如OIF (Beauchemin and Fung 2001)和MEV (Sheffield 1985)。與基于排序的波段選擇方法不同,這類方法的準(zhǔn)則函數(shù)是針對(duì)多波段而不是單波段的。盡管這類方法在一定程度上克服波段的相關(guān)性問題,但由于涉及到組合優(yōu)化問題,往往具有較高的計(jì)算復(fù)雜度。比如,來自于端元提取方法OSP(Harsanyi and Chang 1994)的 OSPBS (orthogonal subspace projection based band selection) (Du and Yang 2008)方法,使用線性預(yù)測(cè)描述單個(gè)波段和多個(gè)波段之間的相似性。它由兩個(gè)最優(yōu)波段組合開始,然后逐個(gè)增加波段至三、四一直到選擇的波段符合需求。使用入選波段對(duì)待選波段進(jìn)行線性預(yù)測(cè),具有最大重建誤差的波段作為新入選波段。由于涉及到頻繁的最小二乘計(jì)算,該方法具有較高的計(jì)算復(fù)雜度。
這些基于目標(biāo)函數(shù)的波段選擇方法另外一個(gè)缺點(diǎn)是更傾向于選擇外點(diǎn)(噪聲點(diǎn))而不是代表性強(qiáng)的波段,見圖1。比如,MEV的目標(biāo)是選擇具有最大協(xié)方差矩陣行列式的波段組合,也即具有最大體積的波段(Geng et al.2010);constrained band selection (CBS)(Chang and Wang 2006)傾向選擇偏離數(shù)據(jù)云團(tuán)的波段;基于NFINDR(Winter 1999)的波段選擇方法(Wang,Jia,and Zhang 2007)選擇具有最大單形體體積大波段;OSP-BS選擇最不相似的波段集合。如圖1所示,這些波段選擇方法傾向于選擇外點(diǎn)(outliers)(圖1a),而不是代表點(diǎn)(exemplars)(圖1b)。然而,外點(diǎn)可能被噪聲嚴(yán)重污染,也有可能處于傳感器的異常響應(yīng)范圍,因此代表點(diǎn)是更理想的選擇目標(biāo),因?yàn)樗鼈儗?duì)各個(gè)子類具有較高的代表性。
現(xiàn)在有一些新的波段選擇方法嘗試選擇處于聚類中心的波段,如(Martínez-Usó et al.2007;Ahmad et al.2011;Hedjam and Cheriet 2011;Jia et al.2012)。這些方法將波段選擇為題看作波段聚類問題,比如WaLuMI(Ward's Linkage strategy using Mutual Information)(Martínez-Usó et al.2007)基于層次聚類,按最小類內(nèi)方差和最大類間方差對(duì)波段進(jìn)行聚類。盡管這些基于聚類的波段選擇方法對(duì)外點(diǎn)有一定的魯棒性,但仍有對(duì)噪聲敏感、計(jì)算復(fù)雜度高度的缺點(diǎn)。
本文提出了一個(gè)新波段選擇方法GRBS,該方法將基于準(zhǔn)則函數(shù)的波段選擇方法和基于聚類的波段選擇方法結(jié)合起來,具有以下特點(diǎn):①在不進(jìn)行噪聲估計(jì)的情況下,自動(dòng)去除噪聲波段;②對(duì)外點(diǎn)魯棒;③計(jì)算復(fù)雜度低。GRBS將波段視為高維空間中圖的節(jié)點(diǎn)(也稱頂點(diǎn)),在該空間中波段選擇問題可以作為聚類問題處理(Mitra,Murthy,and Pal 2002)。有趣的是,GRBS并不真正對(duì)波段聚類,而是通過一個(gè)新定義的準(zhǔn)則函數(shù)選擇代表波段。
本節(jié)詳細(xì)介紹GRBS的原理,包括準(zhǔn)則函數(shù)和搜索策略,同時(shí)對(duì)GRBS的計(jì)算復(fù)雜度也進(jìn)行了理論分析。
2.1 準(zhǔn)則函數(shù)
根據(jù)式(1),如圖2所示的圖的鄰接矩陣為:
鄰接矩陣的行(列)的和成為度,度是圖論中一個(gè)很重要的概念。在本例中,度如下所示:
可以看出,節(jié)點(diǎn)的度越大,則其越靠近圖的中心,反之,則偏離中心越遠(yuǎn)。比如,具有最大的度11,該點(diǎn)確實(shí)最靠近中心,而的度最小,該節(jié)點(diǎn)偏離中心最大。因此度可以用來描述節(jié)點(diǎn)成為代表點(diǎn)(中心)的可能性,或者是對(duì)類的代表程度。顯而易見,如果相似的兩個(gè)波段具有相似的度,但只需要他們中的一個(gè)。從式(1)中可以看出,如果某些節(jié)點(diǎn)之間相關(guān)性較?。ň嚯x較遠(yuǎn)),則這些節(jié)點(diǎn)之間的邊的權(quán)重會(huì)較低,因此一個(gè)波段集合中的相關(guān)性可以使用鄰接矩陣的總權(quán)重進(jìn)行衡量。
GRBS需要這樣的波段,每個(gè)波段都具有較大的度,并且這些波段之間的邊具有較低的權(quán)重。GRBS的具體指標(biāo)我們是這樣定義的,使選擇波段的度的和與這些波段之間的邊的權(quán)重的和的比值盡量大,如下所示:
從式(4)可以看出,波段的度盡量大是要使選擇的波段盡量往數(shù)據(jù)的中心靠近,而較低的波段之間邊的權(quán)重(相關(guān)性抑制),是要使選擇的波段盡量遠(yuǎn)離。這樣這兩個(gè)指標(biāo)就相當(dāng)于內(nèi)力和外力,一個(gè)是選擇傾向于數(shù)據(jù)中心的波段,一個(gè)傾向于外圍的波段。通過試驗(yàn)可以發(fā)現(xiàn),這兩個(gè)力的平衡可以有效的選擇魯棒性強(qiáng)的波段。
2.2 關(guān)于準(zhǔn)則函數(shù)的進(jìn)一步討論
從式(4)中可以發(fā)現(xiàn),鄰接矩陣對(duì)波段選擇的結(jié)果起到?jīng)Q定性作用。本文發(fā)現(xiàn)如果使用歐式距離按(1)式構(gòu)造鄰接矩陣,則噪聲波段可能沒有得到充分抑制。比如,當(dāng)噪聲波段的亮度比較低時(shí),噪聲波段之間的歐式距離也會(huì)比較小,從而導(dǎo)致不合理的較大的度。另一方面,當(dāng)信噪比較高的波段具有較大亮度時(shí),也可能具有較小的度。為此本文在計(jì)算鄰接矩陣前對(duì)波段歸一化,公式推導(dǎo)如下,將(1)式重寫為:
去除每個(gè)波段的亮度(模),可以得到:
關(guān)于式(6)的進(jìn)一步說明如下:由于噪聲之間是有極低的相關(guān)性,因此噪聲波段(或者信噪比較低的波段)與其他波段之間的相關(guān)性較小。從(6)式可以看出,這些波段之間的權(quán)重較小,因而這些波段的度也越小。而高信噪比的波段,與其他波段相關(guān)性較強(qiáng),因而具有較大的度。這樣通過使用(6)式計(jì)算的鄰接矩陣可以將噪聲較大的波段排斥在圖的外部,將有代表性的波段聚到圖的中心,使用(4)式選擇的波段就是信噪比高、更為魯棒的波段了。
2.3 子集搜索
如何找出具有最優(yōu)代價(jià)函數(shù)的波段組合對(duì)高光譜圖像來說是波段選擇中的另一個(gè)難題,因?yàn)檫@是一個(gè)NP困難問題。盡管Narendra and Fukunaga (Narendra and Fukunaga 1977)提出了快速的子集搜索算法,但只適應(yīng)于單調(diào)的目標(biāo)函數(shù)。對(duì)于其他目標(biāo)函數(shù),最優(yōu)搜索算法只能是窮舉法,對(duì)于一般擁有上百個(gè)波段的高光譜數(shù)據(jù)來說,這樣計(jì)算量是不可能完成的(Serpico and Bruzzone 2001)。因此,我們需要在搜索效率與效果之間進(jìn)行一次折中。幸運(yùn)的是,關(guān)于如何進(jìn)行這樣的折中已經(jīng)有了很多的方法,如 (Whitney 1971;Tsymbal,Pechenizkiy,and Cunningham 2005;Serpico and Bruzzone 2001;Pudil,Novovi?ová,and Kittler 1994;Narendra and Fukunaga 1977;Marill and Green 1963;Jain and Zongker 1997),其中較為經(jīng)典和常用的是序貫前向搜索法(SFS)(Whitney 1971)和序貫后向搜索法(SBS)(Marill and Green 1963)。
SFS和SBS方法都屬于貪婪搜索方法。前向法是一種自下而上的搜索算法,它從較少的波段組合(如一個(gè)或兩個(gè))開始,逐個(gè)增加波段,使得增加之后的波段集合具有最優(yōu)的代價(jià)函數(shù)。后向法與之相反,是一種自上而下的搜索算法,它從全部波段集合開始,逐個(gè)刪除波段,使得保留波段集合具有最優(yōu)的代價(jià)函數(shù)。由于高光譜波段選擇問題中,一般總的波段數(shù)遠(yuǎn)遠(yuǎn)大于選擇的波段數(shù),因此一般認(rèn)為后向法的計(jì)算復(fù)雜度大于前向法。為表示方便,將使用前向搜索和后向搜索的GRBS算法分別記為FGRBS和BGRBS。
2.4 計(jì)算復(fù)雜度分析
計(jì)算復(fù)雜度是波段選擇中的一個(gè)重要問題,因?yàn)槠渲匾康闹皇墙档陀?jì)算量。有些文獻(xiàn)專門研究了降低波段選擇計(jì)算時(shí)間的方法如Yang等(Yang,Du,and Chen 2011)提出使用GPU對(duì)波段選擇進(jìn)行加速。本節(jié)對(duì)GRBS的計(jì)算復(fù)雜度進(jìn)行理論分析,對(duì)于GRBS,首先需要計(jì)算圖的鄰接矩陣。對(duì)于L波段N像元的圖像,所需要的浮點(diǎn)操作次數(shù)約為,與計(jì)算協(xié)方差矩陣的相同。然后是波段子集搜索過程,根據(jù)(4)式,可以發(fā)現(xiàn),當(dāng)選擇波段數(shù)為n時(shí),前向法FGRBS所需的搜索復(fù)雜度為,而后向法BGRBS的復(fù)雜度為。由于,因此兩個(gè)搜索版本的GRBS的計(jì)算復(fù)雜度均為。
本節(jié)在兩個(gè)由AVIRIS獲取的真實(shí)數(shù)據(jù)的基礎(chǔ)上,設(shè)計(jì)試驗(yàn)對(duì)GRBS的性能進(jìn)行驗(yàn)證。三個(gè)波段選擇方法IDBS(Chang and Wang 2006),OSP-BS (Du and Yang 2008)以及WaLuMI (Archibald and Fann 2007)分別代表基于排序、基于準(zhǔn)則函數(shù)和基于聚類的波段選擇方法作為對(duì)照。試驗(yàn)主要研究GRBS波段選擇的計(jì)算效率和計(jì)算精度。精度評(píng)價(jià)采用SVM(Melgani and Bruzzone 2004)分類的精度作為評(píng)價(jià)指標(biāo)。試驗(yàn)使用的計(jì)算機(jī)配置為Intel Core i5-2400 3.10GHz處理器,2GB內(nèi)存,軟件環(huán)境為Windows XP Professional Service Pack 3操作系統(tǒng)以及Matlab 7.10編譯環(huán)境.
3.1 Indian Pines數(shù)據(jù)
數(shù)據(jù)共有220個(gè)波段(4個(gè)無效波段已被去除),空間大小為145×145像素,圖3(a)所示。該數(shù)據(jù)由于具有詳細(xì)的地面調(diào)查以及免費(fèi)使用,在遙感試驗(yàn)中使用非常廣泛,根據(jù)地面調(diào)查(如圖3 b所示),共有17中地物類型(其中16中為確定種類,1種為未知種類)。一般情況下,噪聲波段(1-3,103-112,148-165和217-220)應(yīng)該手工去除(Martínez-Usó et al.2007;Wang,Jia,and Zhang 2007),但在本實(shí)驗(yàn)中,這些波段故意保留用以測(cè)試波段選擇方法對(duì)噪聲的魯棒性。
精度試驗(yàn)
同(Jia et al.2012)一致,本文從220個(gè)中選擇15個(gè)波段,各個(gè)方法波段選擇的結(jié)果如見表1。
從表1中可以看出,F(xiàn)GRBS和BGRBS成功的將噪聲波段排除,選擇的波段相關(guān)性也較低(波段之間彼此不相鄰),這是由于GRBS的準(zhǔn)則函數(shù)抑制了具有較小的度(噪聲波段)和較高相關(guān)性的波段(會(huì)導(dǎo)致較大的分母)。IDBS從原理上來說會(huì)傾向于信噪比較高的波段,但是由于是排序算法,得到的波段往往相關(guān)性很強(qiáng)(得到的波段有扎堆現(xiàn)象)。OSPBS選擇了一個(gè)噪聲波段,但其選出的波段很靠前(1-100內(nèi)),這是因?yàn)樵摂?shù)據(jù)中前面的波段具有較大的模而后面的波段的模較小(如圖5所示)。容易驗(yàn)證,如果噪聲波段具有較大的模,那么這些噪聲波段會(huì)被選入。WaLuMI被噪聲嚴(yán)重影響,選擇了9個(gè)噪聲波段,這是因?yàn)樵肼暡ǘ沃g具有較低的相似性,而WaLuMI正是根據(jù)相似進(jìn)行波段選擇。
為了定量的比較這些方法,本文使用這些方法選出的波段進(jìn)行SVM分類,將分類精度作為衡量準(zhǔn)確性的依據(jù)。我們使用這些方法分別選出了10-50個(gè)不同數(shù)目的波段,然后使用20%的隨機(jī)訓(xùn)練樣本進(jìn)行SVM分類,得到的分類精度圖如圖6(a)所示,另外我們還比較了在選擇15個(gè)波段的情況下,SVM分類精度隨著訓(xùn)練樣本比例的關(guān)系。訓(xùn)練樣本比例從10%變化到50%,都是使用ENVI的工具隨機(jī)選取的,結(jié)果如圖6(b)所示。
從圖6(a)中可以看出,本文提出的兩個(gè)基于GRBS的波段選擇方法FGRBS和BGRBS選擇的波段具有最高的分類精度,其中前向選擇的波段好于后向選擇的波段。另外可以看出,波段數(shù)增多并不意味著分類精度的提高。如BGRBS在選擇40波段時(shí)具有最高分類精度(75.3%),而WaLuMI在選擇30個(gè)波段時(shí),達(dá)到最高精度 (66.52%)。
整體上來看,這些方法從10個(gè)波段增加到20個(gè)波段時(shí),精度提高最明顯,而大于20個(gè)波段時(shí),分類精度變化較小。此外,IDBS的分類精度隨著波段數(shù)的增加而迅速提高。波段數(shù)較多時(shí)(>30)甚至超過OSP-BS和WaLuMI。
從圖6 (b)可以看出,當(dāng)訓(xùn)練樣本比例增多時(shí),所有方法的分類精度都有所提高。整體上分類精度,兩個(gè)基于GRBS方法獲得的精度高于其他方法。同時(shí)也能看出,訓(xùn)練樣本對(duì)算法性能評(píng)價(jià)有一定的影響,比如當(dāng)訓(xùn)練樣本為10%時(shí),BGRBS具有最高的分類精度,而當(dāng)訓(xùn)練樣本為40%時(shí),F(xiàn)GRBS具有最高的分類精度。
計(jì)算效率
這些方法在計(jì)算時(shí)間如圖7所示,從圖7中可以發(fā)現(xiàn),從上計(jì)算時(shí)間上看,F(xiàn)GRBS<BGRBS<IDBS<OSPBS<WaLuMI。其中,F(xiàn)GRBS所用的計(jì)算時(shí)間最少,在(0.087s-0.091s)之間,隨著選擇波段數(shù)的增加而略有上升。BGRBS(0.127s-0.125s)的計(jì)算時(shí)間隨著波段數(shù)目的增加而有所下降,這是由于采用SBS搜索策略導(dǎo)致的。IDBS是波段排序算法,其計(jì)算時(shí)間與選擇波段無關(guān),平均時(shí)間為0.352s.OSPBS(1.192s-5.3653s)為前選擇向算法,計(jì)算時(shí)間隨著選擇波段數(shù)的增加呈線性增加?;诰垲惖腤aLuMI由于需要對(duì)波段進(jìn)行聚類分析,非常耗時(shí)(21s-22s)。
3.2 Salinas數(shù)據(jù)
為進(jìn)一步評(píng)估GRBS方法的性能,本文使用Salinas數(shù)據(jù)設(shè)計(jì)了一些試驗(yàn)。該數(shù)據(jù)包含224個(gè)波段,大小為512×217像素,根據(jù)地面真值,該地區(qū)包含16個(gè)地物類型,包括植被、裸土以及葡萄園等。真彩色合成圖和地面真值分如圖8所示。
噪聲試驗(yàn)
本節(jié)中,使用全波段數(shù)據(jù)(FB)和噪聲波段去除數(shù)據(jù)(NBR)的對(duì)比來研究噪聲波段對(duì)不同方法的影響。在NBR數(shù)據(jù)中,手動(dòng)去除噪聲波段和水汽吸收波段(1-3,106-114,150-167和221-224),因此包含194個(gè)波段。利用這五種方法分別從FB數(shù)據(jù)和NBR數(shù)據(jù)選出一系列不同數(shù)目(從10到60)的波段。然后對(duì)選出波段進(jìn)行SVM分類,訓(xùn)練樣本比例為10%隨機(jī)選取,得到的整體分類精度分別為圖9和圖10所示。
從FB數(shù)據(jù)的結(jié)果(圖9)可以看出,F(xiàn)GRBS和BGRBS性能十分接近,并且都由于其他波段方法,如果仔細(xì)比較(圖9b),F(xiàn)GRBS比BGRBS的分類精度稍高?;跍?zhǔn)則函數(shù)的方法OSP-BS比WaLuMI和IDBS具有更高的分類精度,而IDBS在所有不同的波段數(shù)目下都具有最低的分類精度。
從NBR數(shù)據(jù)的結(jié)果(圖10)可以看出,F(xiàn)GRBS和BGRBS性能仍然接近,并且都優(yōu)于其他方法。有趣的是,與FB數(shù)據(jù)相比,F(xiàn)GRBS和BGRBS的在NBR數(shù)據(jù)的結(jié)果并沒有明顯的不同。這說明這兩個(gè)方法對(duì)噪聲有較高的魯棒性,因?yàn)樵肼暼コc否并未影響它們的結(jié)果。而其他方法,特別是WaLuMI,在噪聲去除之后,分類精度有大幅提高,說明這些方法對(duì)噪聲波段較為敏感。對(duì)NBR數(shù)據(jù),WaLuMI精度優(yōu)于OSP-BS和IDBS。這是因?yàn)?,WaLuMI傾向于選擇可靠的代表波段,而OSP-BS傾向于選擇外點(diǎn)。從NBR數(shù)據(jù)可以看出代表波段對(duì)分類而言是更佳的選擇。IDBS的分類精度始終最低,主要原因是因?yàn)樵摲椒ㄊ腔诓ǘ闻判虻姆椒?,選出的波段具有較高的相關(guān)性。另一個(gè)可能的原因是該方法的非高斯性準(zhǔn)則并不適合于分類應(yīng)用(Archibald and Fann 2007)。
需要說明的是,對(duì)FB數(shù)據(jù),OSP-BS比WaLuMI獲得了更高的精度,但不能說明外點(diǎn)更適合分類。這是因?yàn)閃aLuMI被噪聲嚴(yán)重影響(Indian Pins數(shù)據(jù)驗(yàn)證了該點(diǎn)),而OSP-BS僅選擇了少數(shù)噪聲波段。本文提出的GRBS方法結(jié)合了基于準(zhǔn)則函數(shù)的方法和基于聚類的方法,在選擇代表波段的同時(shí)可以自動(dòng)去除噪聲波段,因此GRBS選擇的波段能夠獲得較高的分類精度。
計(jì)算時(shí)間
GRBS的另一個(gè)優(yōu)勢(shì)是具有較低的計(jì)算復(fù)雜度,各方法從Salinas NBR數(shù)據(jù)中選擇15個(gè)波段所用的計(jì)算時(shí)間見表2??梢钥闯?,本文提出的FGRBS和BGRBS的計(jì)算時(shí)間比其他方法少得多,并且這兩個(gè)方法的計(jì)算時(shí)間十分接近。此外,F(xiàn)GRBS和BGRBS的計(jì)算時(shí)間與選擇波段數(shù)目無關(guān),因?yàn)猷徑泳仃嚨挠?jì)算占據(jù)整個(gè)波段選擇的絕大部分時(shí)間(約0.4s)。
本文提出了一個(gè)具有噪聲魯棒、低計(jì)算復(fù)雜度的非監(jiān)督波段選擇方法GRBS。與傳統(tǒng)波段選擇方法不同,GRBS波段選擇的目標(biāo)是處理聚類中心的波段。有趣的是,GRBS無需對(duì)波段進(jìn)行聚類,而是將波段視為高維圖的節(jié)點(diǎn),并且通過鄰接矩陣進(jìn)行波段選擇,因而具有極低的計(jì)算復(fù)雜度。真實(shí)數(shù)據(jù)試驗(yàn)表明GRBS在精度、魯棒性和計(jì)算效率方面都由于參與比較的方法。
此外,鄰接矩陣中的調(diào)整參數(shù) 對(duì)平衡算法的魯棒性和相關(guān)性起到關(guān)鍵作用。本文給出了 的經(jīng)驗(yàn)取值,盡管該值對(duì)不同的數(shù)據(jù)有良好的適應(yīng)性,如何自動(dòng)化確定 的取值是未來的研究重點(diǎn)。
Ahmad,Muhammad,Ihsan Ul Haq,Qaisar Mushtaq,and Muhammad Sohaib. 2011."A new Statistical approach for band clustering and band selection using K-means clustering."IACSIT International Journal of Engineering and Technology 3 (6)∶606-14.
Archibald,Rick,and George Fann.2007."Feature selection and classification of hyperspectral images with support vector machines."Geoscience and Remote Sensing Letters,IEEE 4 (4)∶674-7.doi∶10.1109/LGRS.2007.905116.
Bajcsy,Peter,and Peter Groves.2004."Methodology for hyperspectral band selection."Photogrammetric engineering and remote sensing 70 (7)∶793-802.
Beauchemin,M.,and Ko B.Fung.2001."On Statistical Band Selection for Image Visualization."Photogrammetric engineering and remote sensing 67 (5)∶571-4.
Belkin,Mikhail,and Partha Niyogi.2001."Laplacian eigenmaps and spectral techniques for embedding and clustering."In Conference on Neural Information Processing Systems (NIPS),585-91.
Bruce,Lori Mann,Cliff H.koger,and Jiang Li.2002."Dimensionality reduction of hyperspectral data using discrete wavelet transform feature extraction."Geoscience and Remote Sensing,IEEE transactions on 40 (10)∶2331-8.doi∶10.1109/ TGRS.2002.804721.
Bruzzone,Lorenzo,Mingmin Chi,and Mattia Marconcini.2006."A novel transductive SVM for the semisupervised classification of remote sensing images."Geoscience and Remote Sensing,IEEE transactions on 44 (11)∶3363-73.doi∶10.1109/TGRS.2006.877950.
Bruzzone,Lorenzo,and Sebastiano B Serpico.2000."A technique for feature selection in multiclass problems."International Journal of Remote Sensing 21 (3)∶549-63.
Chang,Chein-I,Qian Du,Tzu-Lung Sun,and Mark LG Althouse.1999."A joint band prioritization and band-decorrelation approach to band selection for hyperspectral image classification." Geoscience and Remote Sensing,IEEE transactions on 37 (6)∶2631-41.
Chang,Chein-I,and Su Wang.2006."Constrained band selectionfor hyperspectral imagery."Geoscience and Remote Sensing,IEEE transactions on 44 (6)∶1575-85.doi∶10.1109/TGRS.2006.864389.
Chang,Yang-Lang,Jin-Nan Liu,Chin-Chuan Han,and Ying-Nong Chen.2014."Hyperspectral Image Classification Using Nearest Feature Line Embedding Approach."Geoscience and Remote Sensing,IEEE transactions on 52 (1)∶278-87.doi∶10.1109/ TGRS.2013.2238635.
Dópido,Inmaculada,Alberto Villa,Antonio Plaza,and Paolo Gamba.2012."A quantitative and comparative assessment of unmixing-based feature extraction techniques for hyperspectral image classification."Selected Topics in Applied Earth Observations and Remote Sensing, IEEE Journal of 5 (2)∶421-35. doi∶10.1109/JSTARS.2011.2176721.
Du,Qian,and He Yang. 2008."Similarity-based unsupervised band selection for hyperspectral image analysis."Geoscience and Remote Sensing Letters,IEEE 5 (4)∶564-8.doi∶10.1109/ LGRS.2008.2000619.
Geng,Xiurui,Yongchao Zhao,Fuxiang Wang,and Peng Gong.2010."A new volume formula for a simplex and its application to endmember extraction for hyperspectral image analysis." International Journal of Remote Sensing 31 (4)∶1027-35.
Green,Andrew A.,Mark Berman,Paul Switzer,and Maurice D.Craig.1988."A transformation for ordering multispectral data in terms of image quality with implications for noise removal." IEEE transactions on Geoscience and Remote Sensing 26 (1)∶65-74. Harsanyi,Joseph C,and Chein-I Chang. 1994."Hyperspectral image classification and dimensionality reduction∶an orthogonal subspace projection approach."Geoscience and Remote Sensing, IEEE transactions on 32 (4)∶779-85.
Hedjam,Rachid,and Mohamed Cheriet.2011."Hyperspectral band selection based on graph clustering."In Information Sciences, Signal Processing and their Applications,11th International Conference on,813-7.
Hyv?rinen,Aapo,Juha Karhunen,and Erkki Oja.2004. Independent component analysis.Vol.46.New York∶John Wiley & Sons."Indian Pines data sets."ftp∶//ftp.ecn.purdue.edu/biehl/ MultiSpec/92AV3C.tif.zip(original files) and ftp∶//ftp.ecn. purdue.edu/biehl/MultiSpec/ThyFiles.zip(ground truth).
Jain,Anil,and Douglas Zongker.1997."Feature selection∶Evaluation,application,and small sample performance."Pattern Analysis and Machine Intelligence,IEEE Transactions on 19 (2)∶153-8.
Jia,Sen,Zhen Ji,Yuntao Qian,and Linlin Shen.2012."Unsupervised band selection for hyperspectral imagery classification without manual band removal."Selected Topics in Applied Earth Observations and Remote Sensing, IEEE Journal of 5 (2)∶531-43. doi∶10.1109/JSTARS.2012.2187434.
Jolliffe,Ian.2005.Principal component analysis.New York∶Wiley Online Library.
Kim,Byungyong,and David A Landgrebe.1991."Hierarchical classifier design in high-dimensional numerous class cases." Geoscience and Remote Sensing,IEEE transactions on 29 (4)∶518-28.
Kuo,Bor-Chen.2004."Nonparametric weighted feature extraction for classification."Geoscience and Remote Sensing, IEEE transactions on 42 (5)∶1096-105.doi∶10.1109/TGRS.2004.825578.
Kuo,Bor-Chen,Hsin-Hua Ho,Cheng-Hsuan Li,Chih-Cheng Hung, and Jin-Shiuh Taur.2014."A Kernel-Based Feature Selection Method for SVM With RBF Kernel for Hyperspectral Image Classification."Selected Topics in Applied Earth Observations and Remote Sensing,IEEE Journal of 7 (2)∶317-26.doi∶10.1109/ JSTARS.2013.2262926.
Landgrebe,David.2002."Hyperspectral Image Data Analysis." Signal Processing Magzine, IEEE 19 (1)∶17-28.
Marill,Thomas,and David M Green.1963."On the effectiveness of receptors in recognition systems."information Theory, IEEE Transactions on 9 (1)∶11-7.
Martínez-Usó,Adolfo,Filiberto Pla,José Martínez Sotoca,and Pedro García-Sevilla.2007."Clustering-based hyperspectral band selection using information measures."Geoscience and Remote Sensing,IEEE transactions on 45 (12)∶4158-71.doi∶10.1109/ TGRS.2007.904951.
Melgani,Farid,and Lorenzo Bruzzone.2004."Classification of hyperspectral remote sensing images with support vector machines."Geoscience and Remote Sensing,IEEE transactions on 42 (8)∶1778-90.
Mitra,Pabitra,CA Murthy,and Sankar K.Pal.2002."Unsupervised feature selection using feature similarity."Pattern Analysis and Machine Intelligence,IEEE Transactions on 24 (3)∶301-12.
Narendra,Patrenahalli M.,and Keinosuke Fukunaga.1977."A branch and bound algorithm for feature subset selection."Computers,IEEE Transactions on 100 (9)∶917-22.
Plaza,Antonio,Jon Atli Benediktsson,Joseph W Boardman,Jason Brazile,Lorenzo Bruzzone,Gustavo Camps-Valls,Jocelyn Chanussot, Mathieu Fauvel,Paolo Gamba,and Anthony Gualtieri.2009."Recent advances in techniques for hyperspectral image processing." Remote Sensing of Environment 113∶S110-S22.
Pudil,Pavel,Jana Jana Novovi?ová,and Josef Kittler.1994."Floating search methods in feature selection."Pattern recognition letters 15 (11)∶1119-25.
Serpico,Sebastiano B,and Lorenzo Bruzzone.2001."A new search algorithm for feature selection in hyperspectral remote sensing images."Geoscience and Remote Sensing,IEEE transactions on 39 (7)∶1360-7.
Sheffield,Charles.1985."Selecting Band Combinations from Multispectral Data."Photogrammetric engineering and remote sensing 51 (6)∶681-7.
Sun,Kang,Xiurui Geng,and Luyan Ji.2014."A band selection approach for small target detection based on CEM." International Journal of Remote Sensing 35 (13)∶4589-600.doi∶10 .1080/2150704X.2014.930196.
Tsymbal,Alexey,Mykola Pechenizkiy,and Pádraig Cunningham.2005."Diversity in search strategies for ensemble feature selection."Information fusion 6 (1)∶83-98.doi∶10.1016/ j.inffus.2004.04.003.
Von Luxburg,Ulrike.2007."A tutorial on spectral clustering." Statistics and computing 17 (4)∶395-416.
Wang,Liguo,Xiuping Jia,and Ye Zhang.2007."A novel geometrybased feature-selection technique for hyperspectral imagery." Geoscience and Remote Sensing Letters,IEEE 4 (1)∶171-5.doi∶10.1109/LGRS.2006.887142.
Whitney,A Wayne.1971."A direct method of nonparametric measurement selection."Computers,IEEE Transactions on 100 (9)∶1100-3.
Winter,Michael E.1999."N-FINDR∶an algorithm for fast autonomous spectral end-member determination in hyperspectral data."In SPIE's International Symposium on Optical Science,Engineering, and Instrumentation,266-75.International Society for Optics and Photonics.
Yang,He,Qian Du,and Genshe Chen.2011."Unsupervised hyperspectral band selection using graphics processing units."Selected Topics in Applied Earth Observations and Remote Sensing,IEEE Journal of 4 (3)∶660-8.doi∶10.1109/ JSTARS.2011.2120598.
Yang,He,Qian Du,Hongjun Su,and Yehua Sheng.2011."An efficient method for supervised hyperspectral band selection." Geoscience and Remote Sensing Letters,IEEE 8 (1)∶138-42.doi∶10.1109/LGRS.2010.2053516.
Yang,Jinn-Min,Pao-Ta Yu,and Bor-Chen Kuo.2010."A nonparametric feature extraction and its application to nearest neighbor classification for hyperspectral image data."Geoscience and Remote Sensing, IEEE transactions on 48 (3)∶1279-93. doi∶10.1109/TGRS.2009.2031812.