張茗茗,周 詮,呼延烺,劉娟妮
(中國(guó)空間技術(shù)研究院西安分院空間微波技術(shù)國(guó)家級(jí)重點(diǎn)實(shí)驗(yàn)室,西安 710000)
隨著多媒體技術(shù)的飛速發(fā)展,產(chǎn)生和傳輸了大量的視頻和圖像信息,數(shù)據(jù)量急速增大,而數(shù)據(jù)內(nèi)部存在很強(qiáng)的冗余性,這就意味著降低壓縮帶來(lái)的冗余度的必要性[1]。在JPEG、JPEG2000、HEVC等算法中,不僅文件大小明顯減少,而且計(jì)算復(fù)雜度也大大提高。在航天航空數(shù)傳系統(tǒng)中,由于硬件資源有限,開(kāi)發(fā)特別復(fù)雜的圖像壓縮算法需要很大的硬件開(kāi)銷,而AMBTC在保證圖像質(zhì)量的前提下,計(jì)算復(fù)雜度低,且具有固定的壓縮比,非常適合低成本的衛(wèi)星數(shù)據(jù)傳輸。
絕對(duì)矩塊截?cái)嗑幋a(Absolute Moment Block Truncation Coding,AMBTC)是由Mohammed等人[2]首次提出的。根據(jù)平均值將每個(gè)塊中的數(shù)據(jù)分割成兩部分,用高平均值和低平均值表示像素。它是一位自適應(yīng)量化器,保留小塊的某些統(tǒng)計(jì)矩。Alrikabi等人[3]提出了一種基于AMBTC和Hadamard變換的壓縮方法。具體來(lái)說(shuō),將圖像分為兩個(gè)區(qū)域,輪廓區(qū)域采用Hadamard變換編碼,其余區(qū)域采用AMBTC編碼。毫無(wú)疑問(wèn),這種方法有助于減少阻塞偽影,并以增加文件大小為代價(jià)充分保留紋理。Daga等人[4]提出了一種樹(shù)分割的AMBTC方法,將每個(gè)16×16塊分割成16×8、8×8、8×4或4×4塊,這取決于方差和閾值的比較。盡管壓縮率降低了,但圖像質(zhì)量卻降低了,編碼效率大大提高。Liu等人[5]提出了一種利用點(diǎn)擴(kuò)散塊截?cái)嗑幋a分析計(jì)算效率與視覺(jué)偽影之間關(guān)系的新方法。盡管它具有良好的視覺(jué)質(zhì)量、視覺(jué)感知能力和處理效率,但壓縮率是無(wú)法固定的。Hui等人[6]應(yīng)用遺傳算法對(duì)上下中心進(jìn)行了反復(fù)迭代。同樣,PSNR可以達(dá)到最優(yōu),而復(fù)雜度大大提高。Balakrishnan等人[7]將AMBTC方法應(yīng)用于遙感圖像的彩色化。一般來(lái)說(shuō),RGB平面被轉(zhuǎn)換成HSV平面,每一個(gè)H和S平面使用四分簇AMBTC編碼,V平面使用基于雙分簇或三分簇的AMBTC編碼。原始圖像可以被有效地壓縮,但是每個(gè)平面上的塊大小是不同的,其大小取決于平面上呈現(xiàn)的邊緣信息。此外,Dacles等人[8]將AMBTC技術(shù)應(yīng)用于音頻數(shù)據(jù)。音頻數(shù)據(jù)首先被分割并替換為高中心和低中心,并在哈夫曼編碼中進(jìn)行無(wú)損編碼?;拘畔⒌玫奖A?,壓縮率高,但由于音頻數(shù)據(jù)本質(zhì)上不是圖像數(shù)據(jù),因此PSNR不適合測(cè)量性能。Xiang等人[9]提出了一種多分組AMBTC算法。即使用四組,簡(jiǎn)單塊以小尺寸編碼,而復(fù)雜塊以大尺寸編碼。不同的閾值會(huì)導(dǎo)致不同的圖像質(zhì)量,因此每個(gè)圖像中的最佳閾值可能會(huì)有所不同。Zhang等人[10]針對(duì)含有椒鹽噪聲的圖像提出定點(diǎn)預(yù)估的壓縮算法,進(jìn)一步提升了圖像質(zhì)量,但是沒(méi)有對(duì)噪聲進(jìn)行濾除,體現(xiàn)效果有限。
在原始圖像存在椒鹽噪聲并且壓縮比為4的前提下,上述算法不太可能獲得良好的視覺(jué)質(zhì)量。采用深度學(xué)習(xí)的對(duì)抗網(wǎng)絡(luò)可以有效對(duì)缺失信息進(jìn)行修復(fù),但是需要大量的樣本學(xué)習(xí)和計(jì)算開(kāi)銷,對(duì)硬件的要求較高,實(shí)際要求很難滿足。因此,為了在這種情況下獲得最佳的視覺(jué)質(zhì)量,本文首先對(duì)噪聲進(jìn)行濾除,并對(duì)損毀的區(qū)域進(jìn)行自適應(yīng)的修復(fù),然后采用AMBTC壓縮。
AMBTC是一種高效的圖像壓縮算法,它保證了每個(gè)塊的一階矩和二階矩不變。將m×n大小的原始圖像分為4×4個(gè)不重疊的塊。塊中的平均值為M,并作為閾值。將不大于M的像素聚集到較低的平均值a,而將大于m的像素聚集到較高的平均值b。此外,將不大于M的像素替換為a并以1比特“0”中編碼,而將大于M的像素替換為b并以1比特“1”編碼。
(1)
其中p和q分別表示4×4索引塊中“0”和“1”的個(gè)數(shù)。
塊的比特流由8位a、8位b和16位塊索引構(gòu)成,因此壓縮率(Compression Ratio, CR)等于16×8/32=4。基本信息得到了保留,AMBTC在計(jì)算量小的情況下可以獲得良好的視覺(jué)效果。
例如,在如圖1中所示,圖1(a)是原始圖像塊,圖1(b)是AMBTC圖像塊。塊中像素{162,162,161,164,158,155,160,163,158,159,159,155,157},M是160,a是157并編碼為8比特“10011101”中,b是163并編碼為8比特“10100011”中,塊索引是“11111100001000”,最終比特流是“10011101101000011110000000”。
(a) (b)
當(dāng)圖像受到椒鹽噪聲的污染時(shí),圖像的基本信息仍然能夠保留,但是圖像的顯示效果下降很多,同時(shí)也不利于壓縮。當(dāng)噪聲強(qiáng)度大于0.05時(shí),AMBTC圖像的PSNR值基本維持在20dB,即使采用全搜索的方法,提升非常有限,這就需要從圖像本身進(jìn)行修復(fù)。
椒鹽噪聲的像素值為0和255,一般圖像中很少出現(xiàn)這兩個(gè)值。當(dāng)圖像出現(xiàn)這兩個(gè)值時(shí),視覺(jué)對(duì)比相當(dāng)明顯。例如,在512×512的Lena圖像中加入強(qiáng)度為0.2的椒鹽噪聲,統(tǒng)計(jì)像素直方圖。直方圖的比較如圖2所示,圖2(a)為原始圖像的直方圖,圖2(b)為添加了椒鹽噪聲的圖像的直方圖。一般來(lái)說(shuō),直方圖并沒(méi)有很大的變化,但是0,255像素的出現(xiàn)頻率比其他像素的出現(xiàn)頻率要高得多。圖像對(duì)比如圖3所示,圖3(a)是原始Lena圖像,圖3(b)是強(qiáng)度為0.2的Lena圖像。受到噪聲污染后,圖像質(zhì)量有了明顯的下降。
(a)
(b)
噪聲是隨機(jī)添加到圖像中,即使強(qiáng)度很大,也不會(huì)出現(xiàn)大面積連通的缺損區(qū)域。圖像內(nèi)部仍然具有很強(qiáng)的相關(guān)性,可以利用周邊有效像素插值預(yù)測(cè)。采用圖像處理的膨脹算法可以解決這個(gè)問(wèn)題,但是該算法主要考慮的是大的連通區(qū)域部分的修復(fù),本文的主要對(duì)小區(qū)域的修復(fù),利用歐式距離來(lái)判斷鄰域內(nèi)有效像素的權(quán)重。距離越遠(yuǎn)的權(quán)重越低,距離越近的權(quán)重越大,這樣充分利用了數(shù)據(jù)間的相關(guān)性。
(a) (b)
而距離與像素點(diǎn)是否為真實(shí)值有關(guān),當(dāng)像素點(diǎn)為真實(shí)值時(shí),該點(diǎn)與所要預(yù)測(cè)的像素點(diǎn)較近,該點(diǎn)的真實(shí)性較高,權(quán)重應(yīng)較大,當(dāng)像素點(diǎn)為插值時(shí),意味著該點(diǎn)真實(shí)值不存在,周邊有效像素與所要預(yù)測(cè)的像素點(diǎn)較遠(yuǎn),該點(diǎn)的真實(shí)性較低,權(quán)重應(yīng)較小。權(quán)重w與像素點(diǎn)的關(guān)系為,
(2)
在圖像的3×3鄰域內(nèi),存在像素值的像素點(diǎn)個(gè)數(shù)為K,則預(yù)測(cè)結(jié)果m得到,
m=(w1×m1+w2×m2+…+wk×mk)/K(3)
其中,m1,m2,…,mK為已知像素,w1,w2,…,wK為相應(yīng)的權(quán)重,有效像素點(diǎn)的個(gè)數(shù)K大于閾值N,才可以進(jìn)行預(yù)測(cè)。
例如,在圖4所示的圖像塊中,m8,m9,m13,m17四個(gè)像素點(diǎn)受到噪聲的破壞,本文閾值N為6,即3×3鄰域內(nèi),至少有6個(gè)已知像素點(diǎn)。這樣,m8,m9,m17可以第一輪預(yù)測(cè),而m13的有效像素點(diǎn)個(gè)數(shù)K為5,需要第二輪預(yù)測(cè)。
m8=(m2+m3+m4+m7+m12+m14)/6
m9=(m3+m4+m5+m10+m14+m15)/6
m17=(m11+m12+m16+m18+m21+m22+m23)/7
m13=(m7+0.8×m8+0.8×m9+m12+m14+
0.8×m17+m18+m19)/7.4
(4)
其中,在m13的預(yù)測(cè)中,m8,m9,m17為插值點(diǎn),權(quán)重為0.8,這三個(gè)點(diǎn)方向的真實(shí)像素與m13歐式距離較大,可信度較低,權(quán)重相對(duì)于m7,m12,m14,m18,m19這樣的真實(shí)值較小。
原始圖像中存在個(gè)別像素值為0或255的點(diǎn)被誤判為噪聲,但是相對(duì)于大量噪聲點(diǎn)的影響,這些誤判所造成的影響可以忽略不計(jì)。
當(dāng)噪聲像素在圖像的四個(gè)頂點(diǎn)時(shí),以周圍的三個(gè)像素平均值做插值,當(dāng)噪聲像素在圖像的圖像邊沿時(shí),以周圍的五個(gè)像素平均值做插值。
圖像在經(jīng)過(guò)加權(quán)修復(fù)后,視覺(jué)質(zhì)量有了很大的提高。再使用常規(guī)的均值A(chǔ)MBTC算法壓縮修復(fù)后的圖像,得到最終的壓縮文件。圖5為經(jīng)過(guò)處理的Lena圖像,圖5(a)為L(zhǎng)ena的修復(fù)圖像,圖5(b)為L(zhǎng)ena的AMBTC解壓圖像。
圖4 5×5圖像預(yù)測(cè)塊
(a) (b)
本文算法的實(shí)驗(yàn)流程圖如圖6所示。
圖6 算法流程圖
本文南加大SIPI數(shù)據(jù)集中的8幅512×512大小的灰度圖像,分別為L(zhǎng)ena,Peppers,Couple,Bridge,Elaine,Boat,Baboon和Airplane。噪聲強(qiáng)度為0.1:0.1:0.4,當(dāng)強(qiáng)度大于0.4時(shí),圖像基本信息已經(jīng)無(wú)法正常顯示,說(shuō)明圖像的信息源存在嚴(yán)重問(wèn)題,圖像信息已經(jīng)沒(méi)有太多的價(jià)值。實(shí)驗(yàn)平臺(tái)為MATLAB 2013a,操作系統(tǒng)為64位windows 7,CPU為i5-5200u,主頻為2.2Ghz,內(nèi)存為8Gb。采用峰值信噪比(Power Signal-to-Noise Ratio,PSNR)和時(shí)間代價(jià)(Time Cost,TC)兩種方法評(píng)價(jià)壓縮效果。值得注意的是,PSNR越高,壓縮算法的性能越好,TC越低,壓縮算法的效率就越高。
當(dāng)噪聲為0.1時(shí),Peppers的壓縮效果如圖7所示,圖7(a)是原始圖像,圖7(b)是含噪聲圖像,圖7(c)是修復(fù)圖像,圖7(d)是AMBTC壓縮圖像。噪聲對(duì)圖像有著嚴(yán)重的干擾,但是經(jīng)過(guò)修復(fù)后,圖像質(zhì)量明顯增強(qiáng),和原始圖像區(qū)別都不明顯,再經(jīng)過(guò)AMBTC壓縮,圖像質(zhì)量有所下降,但是仍然在視覺(jué)的接受范圍內(nèi)。AMBTC圖像相對(duì)于含噪聲圖像的視覺(jué)效果要好很多,事實(shí)上,圖7(b)的PSNR為21.44dB,圖7(c)的PSNR為40.61 dB,圖7(d)的PSNR為32.81 dB。Airplane壓縮效果如圖8所示,其效果對(duì)比與圖像Peppers類似,自適應(yīng)修復(fù)可以很大程度地提升圖像的質(zhì)量,圖8(b)的PSNR為22.77dB,圖8(c)的PSNR為40.26 dB,圖8(d)的PSNR為31.39dB。
(a) (b) (c) (d)
(a) (b) (c) (d)
當(dāng)噪聲強(qiáng)度為0.1,0.2,0.3和0.4時(shí),8幅測(cè)試圖的PSNR對(duì)比如表1所示,PSNR1為修復(fù)圖像的PSNR值,PSNR2為AMBTC圖像的PSNR值。PSNR1基本在30dB左右,說(shuō)明即使噪聲強(qiáng)度很大,修復(fù)后的圖像視覺(jué)質(zhì)量仍然可以接受。PSNR2在25dB以上,圖像的細(xì)節(jié)部分丟失,但是基本信息仍然得到保留。說(shuō)明在有噪聲干擾的情況下,經(jīng)過(guò)修復(fù)處理后,AMBTC算法可以很好地壓縮圖像。
表1 測(cè)試圖PSNR對(duì)比表
在壓縮率為4的前提下,本文算法與AMBTC優(yōu)化算法PSNR平均值比較如圖9所示,本文算法在所有強(qiáng)度下的PSNR值優(yōu)勢(shì)明顯,平均有10dB的提高。充分印證了對(duì)圖像的內(nèi)容的預(yù)處理的重要性,只有對(duì)圖像內(nèi)容認(rèn)真篩選,才能保留屬于原始圖像的像素信息,這樣AMBTC壓縮才能有很好的顯示效果。
為了進(jìn)一步驗(yàn)證算法的有效性,8幅測(cè)試圖的仿真時(shí)間對(duì)比如表2所示,計(jì)算開(kāi)銷的平均值對(duì)比如圖10所示。在表2中,TC1為Hui等人[6]的方法,TC2為Zhang等人[10]的方法,TC3為本文的方法。Hui等人[6]采用了迭代尋優(yōu)的策略,而Zhang等人[10]采用了定點(diǎn)預(yù)估確定搜索范圍,這兩種方法都可以降低運(yùn)算的開(kāi)銷,但是都缺少濾除噪聲的步驟,這樣仍然存在很大的計(jì)算代價(jià),同時(shí)無(wú)法得到最優(yōu)的圖像質(zhì)量。本文算法避免了大量的迭代和搜索,省去了預(yù)估的環(huán)節(jié),大大降低了計(jì)算量,這樣計(jì)算復(fù)雜度進(jìn)一步減小。
圖9 PSNR對(duì)比圖
表2 測(cè)試圖TC對(duì)比表
圖10 TC對(duì)比圖
為了驗(yàn)證本文算法在遙感圖像中的泛化能力,本文采用南加大的38張圖像進(jìn)行算法比較,測(cè)試圖像均為512×512的無(wú)損TIFF格式灰度圖像。圖10為4幅噪聲強(qiáng)度為0.2的原始圖像,圖11為4幅最終恢復(fù)后的AMBTC圖像,視覺(jué)上圖像質(zhì)量有了明顯的提高。38幅圖像的PSNR平均值對(duì)比如圖12所示,TC平均值對(duì)比如圖13所示,可以看到,該算法同樣適用于遙感圖像。
(a) (b) (c) (d)
(a) (b) (c) (d)
圖13 遙感圖像PSNR對(duì)比圖
圖14 遙感圖像TC對(duì)比圖
本文提出了自適應(yīng)預(yù)處理的AMBTC圖像壓縮算法,得到以下結(jié)論:
將圖像中的椒鹽噪聲濾除,可以很大程度地提高數(shù)據(jù)內(nèi)部的相關(guān)性,使用自適應(yīng)預(yù)處理的方法,圖像內(nèi)容得到很好的修復(fù)。
與之前的文獻(xiàn)相比,本文的AMBTC圖像的PSNR平均提升在10dB,耗時(shí)小于1s。顯示效果好,運(yùn)算復(fù)雜度低,可以實(shí)時(shí)處理圖像。
本文只考慮了椒鹽噪聲的情況,對(duì)于其他噪聲還沒(méi)有做進(jìn)一步的研究。