洪 恒,何明一
(西北工業(yè)大學(xué) 電子信息學(xué)院,陜西省信息獲取與處理重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710129)
高光譜遙感成像技術(shù)(Hyperspectral Remote Sensing,HRS)作為一種新型遙感成像技術(shù),將二維成像遙感技術(shù)與光譜技術(shù)有機(jī)結(jié)合,能夠在獲取被測物空間信息的同時(shí),獲取地物的光譜信息。高光譜圖像可以看做在傳統(tǒng)二維圖像的基礎(chǔ)上新增一個(gè)光譜維度,這直接導(dǎo)致了高光譜圖像數(shù)據(jù)量龐大的特點(diǎn),給遙感數(shù)據(jù)傳輸和存儲(chǔ)帶來了挑戰(zhàn)。因而,如何對(duì)高光譜圖像進(jìn)行有效地壓縮是一個(gè)非常有意義的課題。常用的高光譜圖像壓縮算法主要包括基于預(yù)測的算法[1]、基于變換的算法[2]和基于矢量量化的算法[3]等。
由于大氣吸收等原因,高光譜圖像中一些波段與相鄰波段的相關(guān)性下降,使得在壓縮過程中直接采用波段的自然順序進(jìn)行處理無法獲得理想的壓縮效果。針對(duì)這種現(xiàn)象,有許多學(xué)者提出了相應(yīng)的預(yù)處理方法,如采用自適應(yīng)聚類的方法進(jìn)行自適應(yīng)波段分組,再分別對(duì)各組內(nèi)波段進(jìn)行壓縮[4],有效提高了壓縮性能。還有學(xué)者提出先通過比較相鄰波段的相關(guān)系數(shù)進(jìn)行自適應(yīng)分組,再對(duì)組內(nèi)波段進(jìn)行排序的方法[5],也能提高預(yù)測性能。但是這些預(yù)處理算法都是以高光譜圖像各波段間的相關(guān)系數(shù)矩陣為基礎(chǔ),而相關(guān)系數(shù)矩陣所需的計(jì)算量非常大,往往計(jì)算相關(guān)系數(shù)矩陣的時(shí)間要遠(yuǎn)遠(yuǎn)高于預(yù)處理算法本身所需的時(shí)間,這嚴(yán)重制約了這些預(yù)處理算法的實(shí)時(shí)應(yīng)用。
文中針對(duì)上述高光譜圖象壓縮中相關(guān)系數(shù)矩陣計(jì)算量過大的問題,提出先對(duì)高光譜圖像空間域進(jìn)行適當(dāng)采樣,然后利用采樣后圖像的相關(guān)系數(shù)矩陣來代替整幅圖像的相關(guān)系數(shù)矩陣。實(shí)驗(yàn)結(jié)果證明,該方法在基本保持壓縮算法性能的前提下,有效降低了計(jì)算量,保證了預(yù)處理算法的實(shí)時(shí)性,是一種簡單、有效的實(shí)用方法。
高光譜圖像壓縮主要利用了圖像像素間的相關(guān)性,相關(guān)性越強(qiáng),信息冗余就越多,壓縮效果也就越好。而高光譜圖像具有空間相關(guān)性和譜間相關(guān)性兩種相關(guān)性。空間相關(guān)性表現(xiàn)為,各波段中相鄰地物的光譜強(qiáng)度存在一定的連續(xù)性。譜間相關(guān)性包含譜間統(tǒng)計(jì)相關(guān)性和譜間結(jié)構(gòu)相關(guān)性,譜間統(tǒng)計(jì)相關(guān)性表現(xiàn)為各波段的光譜強(qiáng)度值分布存在相關(guān)性,譜間結(jié)構(gòu)相關(guān)性表現(xiàn)為各波段圖像間存在很強(qiáng)的結(jié)構(gòu)相似性。對(duì)于高光譜圖像而言,譜間相關(guān)性較強(qiáng),而空間相關(guān)性相對(duì)較低。為了充分利用高光譜圖像的譜間相關(guān)性,需要定量地評(píng)估波段間的相關(guān)性大小,定義波段i 和波段j 之間的相關(guān)系數(shù)如下:
式中,fi(x,y)和fj(x,y)分別代表波段i 圖像和波段j 圖像在坐標(biāo)(x,y)處的灰度值,ui和uj分別代表波段i 圖像和波段j 圖像的像素平均值,M 和N 分別代表圖像的長和寬。
可見,所有波段間的相關(guān)系數(shù)就構(gòu)成了高光譜圖像的相關(guān)系數(shù)矩陣。圖1 是一幅AVIRIS 高光譜圖像的相關(guān)系數(shù)矩陣,其中,相關(guān)性越高,其亮度越強(qiáng),反之則越暗。從該圖可以看出,高光譜圖像中相鄰波段間的相關(guān)性很高,非常接近于1。同時(shí)存在一些波段與相鄰波段的相關(guān)性急劇降低,反而與較遠(yuǎn)處的波段相關(guān)性更強(qiáng),這是由于大氣吸收等因素導(dǎo)致地物的光譜特征發(fā)生突變引起的結(jié)果。相關(guān)系數(shù)矩陣所反映出的這些波段特征,正是后續(xù)處理中對(duì)波段進(jìn)行分組排序的重要依據(jù)。
圖1 AVIRIS 高光譜圖像相關(guān)系數(shù)矩陣(白色代表1,黑色代表0)Fig.1 Band correlation coefficient image of AVIRIS hyperspectral image(“White”and“Black”denotes correlation coefficient 1 or 0,respectively)
由式(1)可知,相關(guān)系數(shù)矩陣的計(jì)算量巨大。對(duì)于一幅長、寬和波段數(shù)分別為M、N 和K 的高光譜圖像,利用相關(guān)系數(shù)矩陣的對(duì)稱性減少一半的計(jì)算量之后,直接計(jì)算仍然需要5MNK2/2 次加法,3MNK2/2 次乘法,K2/2 次除法和K2/2 次開方運(yùn)算,難以滿足實(shí)時(shí)性的要求。
首先考慮高光譜圖像空間分辨率較高時(shí)的情況。當(dāng)空間分辨率較高時(shí),圖像中的一個(gè)像素與周圍像素會(huì)有著較強(qiáng)的相關(guān)性,也即意味著這些相似的像素對(duì)圖像相關(guān)系數(shù)矩陣的影響也是相似的。因此,可以不必在譜間相關(guān)性計(jì)算中代入所有的像素值,而是通過對(duì)像素進(jìn)行適當(dāng)?shù)夭蓸?,用采樣點(diǎn)來代表其周圍的點(diǎn)進(jìn)行運(yùn)算。從而可以從一個(gè)較小的計(jì)算規(guī)模中得到一個(gè)滿意的近似解。然而對(duì)于空間分辨率不是很高的高光譜圖像而言,圖像中一個(gè)像素周圍的點(diǎn)很可能是其他類別的地物,采樣將會(huì)丟失一部分的信息。但是在丟失的信息中以空間信息為主,大部分波段信息仍然得到了保留。因而如果該圖像的地物變化不是那么劇烈,或者該圖像的地物內(nèi)容不是過于豐富且零散,那么均勻采樣后的圖像也能夠大致保留了原圖像所包含的波段特征,仍然能夠近似地求解出相對(duì)可靠的相關(guān)系數(shù)矩陣??梢?,近似算法具有一定的局限性,但是考慮到它所節(jié)約的計(jì)算量可以使預(yù)處理算法的實(shí)時(shí)性成為可能,仍是非常有意義的。
因此,文中通過在高光譜圖像的空間域進(jìn)行均勻采樣,以得到一幅較小的采樣圖像,然后利用該圖像的相關(guān)系數(shù)矩陣來近似整幅圖像的相關(guān)系數(shù)矩陣,從而大幅減少了計(jì)算量。近似和優(yōu)化過程如下:
1)對(duì)各波段圖像每隔L 行L 列進(jìn)行采樣,得到采樣后的圖像gi(x,y),且長寬分別為M′=?M/L」和N′=?N/L」,波段數(shù)依然為K。
2)計(jì)算各波段均值:
3)歸一化:
4)計(jì)算臨時(shí)變量:
5)計(jì)算近似相關(guān)系數(shù):
依據(jù)文中提出的相關(guān)系數(shù)矩陣近似計(jì)算方法,則計(jì)算量減少到MNK2/2L2次加法,MNK2/2L2次乘法,2K次除法,K次開方運(yùn)算,其中L為采樣步長。直接計(jì)算量與近似算法計(jì)算量之比見表1,效果非常顯著。
表1 相關(guān)系數(shù)矩陣計(jì)算量Tab.1 Calculation cost of correlation matrix
實(shí)驗(yàn)結(jié)果表明,在一定范圍內(nèi)L 的取值對(duì)算法性能影響不大,可以根據(jù)具體實(shí)際應(yīng)用的實(shí)時(shí)性要求,對(duì)L 進(jìn)行適當(dāng)取值。若選取L=32,對(duì)于一幅長、寬和波段數(shù)分別為512、512 和200 的高光譜圖像,即M=N=512,K=200,直接法與近似法計(jì)算相關(guān)系數(shù)矩陣的加法、乘法、除法以及開放運(yùn)算計(jì)算次數(shù)之比分別為5 120,3 070,50 和100,詳見表2。顯然,近似算法對(duì)于相關(guān)系數(shù)矩陣計(jì)算量的減少是非??捎^的。
表2 相關(guān)系數(shù)矩陣典型計(jì)算量Tab.2 Typical calculation cost of correlation matrix
實(shí)驗(yàn)采用的高光譜遙感圖像來自于NASA/JPL 實(shí)驗(yàn)室研制的AVIRIS 成像儀于2006年獲取的經(jīng)輻射數(shù)據(jù)校正的Yellowstone 圖 像(http://compression.jpl.nasa.gov/hyperspectral/)。該圖像為最新發(fā)布的標(biāo)準(zhǔn)測試圖像,采用新的校準(zhǔn)技術(shù),避免了1997年標(biāo)準(zhǔn)測試圖像中存在過多校準(zhǔn)引起的人為影響。該傳感器波長范圍為450~2 500 nm,光譜分辨率約10 nm,共包含224個(gè)波段。一組Yellowstone 圖像包含5 幅圖片,每幅圖片大小為512×677×224,每個(gè)像素16 位。圖3為 各 幅Yellowstone 場景中第70 波段的灰度圖像。實(shí)驗(yàn)的測試平臺(tái)為ASUS PC(Intel Core i3-2310M 2.1 GHz,6G 內(nèi)存),工作環(huán)境為Window7,編譯環(huán)境為Visual Studio C++2010。
圖2 實(shí)驗(yàn)用高光譜圖像Fig.2 hyperspectral images in test
為驗(yàn)證相關(guān)系數(shù)矩陣近似算法的有效性,分別比較不同采樣步長下近似算法對(duì)高光譜圖像壓縮算法最終壓縮性能的影響。實(shí)驗(yàn)采用的高光譜壓縮算法,首先根據(jù)相關(guān)系數(shù)矩陣采用最小生成樹算法[6]優(yōu)化波段預(yù)測順序,然后利用三維上下文模型[7]進(jìn)行譜間預(yù)測,熵編碼采用算術(shù)編碼。實(shí)驗(yàn)分別選取采樣步長L=1,2,4,8,16,32,64 進(jìn)行相關(guān)系數(shù)矩陣的近似計(jì)算(其中L=1 即為原始算法),并比較最終壓縮算法的壓縮比,結(jié)果如表3 所示。實(shí)驗(yàn)結(jié)果表明,在一定范圍內(nèi)采樣步長的提高幾乎不影響算法的壓縮性能。然而當(dāng)采樣步長過大時(shí),將因?yàn)椴蓸狱c(diǎn)過少而導(dǎo)致相關(guān)系數(shù)矩陣嚴(yán)重失真,使得算法的性能明顯退化。綜合以上考慮,本文選取采樣步長L=32,此時(shí)算法性能損失不大,同時(shí)計(jì)算量不到原來的千分之一,有效降低了計(jì)算負(fù)擔(dān)。表4 具體地給出了在測試平臺(tái)下,一幅AVIRIS高光譜圖像的相關(guān)系數(shù)矩陣采用近似算法前后的計(jì)算量對(duì)比和運(yùn)行時(shí)間對(duì)比??梢?,采用近似算法后,預(yù)處理過程的計(jì)算量大幅降低,運(yùn)行時(shí)間大幅減少,有效提高了算法的實(shí)時(shí)性。
表3 近似算法中不同采樣步長下的壓縮性能Tab.3 Compression ratio using different sample step in approximation algorithm
表4 采用近似算法前后相關(guān)系數(shù)矩陣計(jì)算量Tab.4 Calculation cost of correlation matrix(before and after using approximate algorithm)
另外值得注意的是,存在個(gè)別圖像采用某些步長下的近似算法后,其壓縮性能與原始算法相比沒有降低反而還有少量的提升。經(jīng)過觀察驗(yàn)證,發(fā)現(xiàn)這是由于相關(guān)系數(shù)與壓縮性能并不完全對(duì)應(yīng)所照成的。存在著一些波段一方面與一個(gè)波段相關(guān)性最高,另一方面最優(yōu)的參考波段又是另一個(gè)波段,如圖像Yellowstone0 中與波段1 相關(guān)性最高的為波段2,但是實(shí)驗(yàn)數(shù)據(jù)顯示以波段168 來預(yù)測波段1 得到的壓縮比更高,但是這樣提高的壓縮比往往是非常微弱的。同樣的情況也出現(xiàn)在近似算法中,由于近似算法的退化,導(dǎo)致后續(xù)壓縮算法在選擇參考波段時(shí)選擇了實(shí)際相關(guān)系數(shù)次優(yōu)的波段,但結(jié)果反而少量提高了預(yù)測波段的壓縮性能。但是總體而言,相關(guān)系數(shù)與壓縮比存在著一種正相關(guān)的關(guān)系,同時(shí)不像殘差熵、均方誤差這些指標(biāo)那樣需要先對(duì)圖像進(jìn)行預(yù)測才能得到,因而相關(guān)系數(shù)依然是目前較為理想的預(yù)測壓縮性能的指標(biāo)。同時(shí),對(duì)于是否有更好的預(yù)測壓縮性能的方式,也是往后開展工作的一個(gè)方向。
文中針對(duì)高光譜圖像壓縮過程中,波段預(yù)處理算法普遍使用的相關(guān)系數(shù)矩陣計(jì)算量過大的問題,提出一種基于空間域采樣的近似算法。實(shí)驗(yàn)結(jié)果表明,適當(dāng)選取采樣步長能在幾乎不影響壓縮算法性能的情況下,大幅降低計(jì)算量,使得預(yù)處理算法的實(shí)時(shí)應(yīng)用成為可能,是一種簡單、有效的實(shí)用方法。
[1]Mielikainen J,Huang B.Lossless compression of hyperspectral images using clustered linear prediction with adaptive prediction length[J].Geoscience and Remote Sensing Letters,IEEE,2012,9(6):1118-1121.
[2]陳雷,張曉林,楊維松,等.一種基于預(yù)測和變換混合設(shè)計(jì)的超光譜圖像壓縮方法[J].航空學(xué)報(bào),2010(4):754-761.CHEN Lei,ZHANG Xiao-lin,YANG Wei-song,et al.A hyperspectral image compression method based on hybrid predictive coding and transform coding[J].Acta Aeronautica et Astronautica Sinica,2010(4):754-761.
[3]溫佳,馬彩文,水鵬朗.改進(jìn)自適應(yīng)LBG矢量量化算法在干涉高光譜圖像壓縮中的應(yīng)用[J].光譜學(xué)與光譜分析,2011(4):1033-1037.WEN Jia,MA Cai-wen,SHUI Peng-lang.An adaptive VQ algorithm used in interferential multi-spectral image [J].Spectroscopy and Spectral Analysis,2011(4):1033-1037.
[4]HE Ming-yi,BAI Lin,DAI Yuc-hao,et al.Band regroupingbased lossless compression of hyperspectral images[J].Journal of Applied Remote Sensing,2010,4(1):041757-041757.
[5]ZHANG Jing,LIU Gui-zhong.An efficient reordering prediction-based lossless compression algorithm for hyperspectral images[J].Geoscience and Remote Sensing Letters,IEEE,2007,4(2):283-287.
[6]Ellis Horowitz.數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)[M].朱仲濤,譯.北京:清華大學(xué)出版社,2009.
[7]HE Ming-yi,BAI Lin,DAI Yu-chao,et al.Hyperspectral image lossless compression algorithm based on adaptive band regrouping[C].Satellite Data Compression,Communication,and Processing V.2009.San Diego,CA,United states:SPIE,2009,7455:745504.