張 洋, 李慶忠
(中國海洋大學(xué)工程學(xué)院,山東省海洋工程重點實驗室,山東 青島 266100)
基于WBCT變換的水下圖像高效壓縮方法*
張 洋, 李慶忠**
(中國海洋大學(xué)工程學(xué)院,山東省海洋工程重點實驗室,山東 青島 266100)
針對壓縮效率和重建質(zhì)量無法兼顧的問題,提出一種基于WBCT變換 (Wavelet-based contourlet transform)的水下圖像高效壓縮算法。首先根據(jù)水下圖像和人類視覺系統(tǒng)的特點,在WBCT變換域提出了一種改進的人眼最小可覺察失真(JND)模型,以自適應(yīng)去除水下圖像中的視覺冗余。然后,對重要的低頻系數(shù)采用定長量化和無損壓縮;而對高頻系數(shù),采用基于WBCT樹結(jié)構(gòu)的變精度定長量化和位置差降編碼策略進行編碼。實驗結(jié)果表明,提出的算法不僅具有較高的壓縮效率,而且能獲得視覺上較為滿意的解碼效果,適用于水下圖像在甚低比特率下的壓縮傳輸。
水下圖像; 圖像壓縮; WBCT變換; JND模型
受水聲信道的傳輸帶寬限制,水下自主機器人(AUVs)采集的圖像信息必需經(jīng)過有效壓縮才能實時傳輸?shù)剿婀ぷ髡?。水下圖像是操作人員遙控AUVs完成深海探測和作業(yè)任務(wù)的重要依據(jù)之一[1],故水下圖像的壓縮方法不僅要滿足水聲信道的帶寬要求,還應(yīng)滿足人眼的視覺特性。
與陸上圖像相比,水下圖像具有對比度低、細節(jié)信息少和顏色不豐富等特點。針對這些特點,許多學(xué)者提出了水下圖像特有的壓縮算法。Iglesias等[2]提出一種基于壓縮感知的水下圖像傳輸系統(tǒng),因壓縮感知的隨機采樣特性,其具有較好的抗誤碼能力,但壓縮比僅能達到8∶1。為了獲得高壓縮比,Murphy等[3]提出一種基于矢量量化的海底圖像壓縮算法,將圖像分塊并與樣本庫匹配,僅需編碼匹配索引即可實現(xiàn)高效壓縮,但解碼圖像塊效應(yīng)嚴重,影響人眼觀測效果。當前較多的水下圖像壓縮研究采用的是基于小波變換的方法[4-6],利用小波樹中系數(shù)的父子關(guān)系,實現(xiàn)高效編碼。然而,小波變換有限的三個分解方向決定了其無法充分描述圖像邊緣和輪廓信息,不符合人眼的多方向感知特性。特別在AUVs觀測海洋生物或水下人造物體等具有明顯輪廓特征的目標時,操作人員無法獲得低比特率下視覺質(zhì)量較好的解碼圖像。因此,目前的水下圖像壓縮方法還無法同時兼顧壓縮效率和重建質(zhì)量。
針對以上問題,本文結(jié)合水下圖像和人類視覺系統(tǒng)的特點,提出一種基于WBCT變換 (Wavelet-based contourlet transform)的水下圖像高效壓縮算法。該算法在WBCT域中,提出一種改進的人眼最小可覺察失真(JND)模型以有效去除水下圖像中的視覺冗余,采用基于WBCT樹結(jié)構(gòu)的變精度定長量化和位置差降編碼算法實現(xiàn)高效壓縮,并通過實驗驗證了提出算法的性能。
由于小波基函數(shù)僅具有正方形的支撐區(qū)間,導(dǎo)致小波變換無法以最優(yōu)形式逼近奇異曲線,不能充分利用圖像本身特有的幾何特征。為此,本文采用多尺度幾何分析方法中的WBCT變換,以克服小波變換方向性不足的缺點,既能有效捕捉圖像中的幾何結(jié)構(gòu),還可以提供接近最優(yōu)的稀疏表達形式。本文提出的水下圖像高效壓縮編碼算法流程如圖1所示。
首先根據(jù)水下圖像和人類視覺系統(tǒng)的特點,對圖像亮度分量Y和顏色分量U、V分別進行冗余去除,提出一種改進的JND模型以合理地消除亮度分量Y的視覺冗余。對低頻系數(shù)采用定長量化和無損壓縮;在高頻子帶間,構(gòu)造WBCT樹結(jié)構(gòu)以掃描重要高頻系數(shù),其中對重要系數(shù)的數(shù)值采用變精度定長量化編碼策略,而對重要系數(shù)的位置采用位置差降編碼算法以實現(xiàn)高效壓縮。下面具體介紹各模塊的實現(xiàn)過程。
圖1 水下圖像編碼算法框圖
1.1 WBCT變換
輪廓波(Contourlet)變換是一種能夠有效捕捉圖像輪廓信息的多尺度幾何分析方法,首先采用拉普拉斯金字塔濾波器對圖像進行多尺度分解,然后利用方向濾波器對各個尺度的高頻信息進行多方向分解,因此Contourlet變換能夠充分刻畫圖像邊緣特征。然而由于拉普拉斯金字塔自身的冗余性,導(dǎo)致Contourlet變換具有4/3冗余度,故采用Contourlet變換進行圖像壓縮編碼的效率較低。WBCT變換是一種改進的Contourlet變換,它采用小波分解替代Contourlet變換中的拉普拉斯金斯塔分解,再對小波高頻子帶進行多方向分解,使得WBCT變換不僅具備了小波變換的非冗余性,而且繼承了Contourlet變換的多方向性和各向異性[7]。有研究表明,人類的視皮層具有局部、方向和帶通特性,可以用最少的視覺神經(jīng)元捕捉自然場景中的關(guān)鍵信息,也就是以最稀疏的形式表達自然圖像,而WBCT變換的特點正好與人類視覺系統(tǒng)特性相吻合,既能有效描述圖像幾何結(jié)構(gòu),也可以顯著提升壓縮效率。對于含有重要觀測目標的水下圖像,采用WBCT變換可以獲得更好的解碼重建效果。所以,本文將WBCT變換用于水下圖像壓縮編碼。
圖2 Barbara圖像的4級WBCT變換結(jié)果
WBCT變換由小波分解和方向濾波器組兩部分實現(xiàn)。在小波分解部分,本文采用Daub5/3小波提升變換,以加快計算速度。在方向濾波部分,考慮到一般水下圖像含有的細節(jié)信息較少,同時兼顧計算速度,不需要對小波高頻子帶進行較多的方向分解,因此本文采用四級WBCT變換,對前三級小波高頻子帶均進行四方向分解,即每級可得到12個不同的方向子帶。圖2是Barbara圖像的四級WBCT變換結(jié)果,由圖可以看出,各高頻子帶從不同方向描述了圖像的邊緣和紋理。采用WBCT變換的優(yōu)點是:首先,WBCT變換繼承了小波變換的非冗余性和小波樹結(jié)構(gòu),有利于實現(xiàn)高效編碼;其次,WBCT變換具有多方向分解,能充分刻畫圖像的細節(jié)信息,獲得較好的圖像解碼質(zhì)量,以符合人眼視覺特性。
1.2 基于改進的JND模型的預(yù)處理
與陸上圖像相比,水下圖像具有對比度低、細節(jié)信息少和顏色不豐富的特點,所以水下圖像含有大量視覺冗余,必須對其進行冗余去除。由于人眼對顏色變化不敏感,而水下圖像多呈藍綠色,本文首先將水下彩色圖像由RGB空間轉(zhuǎn)換到Y(jié)UV空間,對顏色通道U和V進行四級WBCT變換,僅保留U和V的低頻部分以供編碼。而人眼對亮度變化較敏感,因此不能像去除顏色冗余一樣簡單舍棄亮度通道Y的高頻部分,需要根據(jù)人眼特性對亮度分量Y進行合理的冗余去除。
JND模型是一種基于人眼視覺特性建立的最小可覺察失真閾值檢測模型,能夠很好地表征人眼視覺敏感度[8]。它可以根據(jù)圖像內(nèi)容自適應(yīng)地建立一個閾值,以屏蔽掉人眼不敏感的變換系數(shù),保留視覺上的重要系數(shù),從而達到去除視覺冗余的目的。因此,本文針對水下圖像特點,提出一種改進的JND模型,以消除水下圖像亮度分量Y中的視覺冗余。JND模型由對比度敏感函數(shù)、亮度自適應(yīng)調(diào)節(jié)因子和對比掩蓋因子三部分組成,公式如下:
TJND(λ,θ,i,j)=fs(λ,θ)al(λ,θ,i,j)ac(λ,θ,i,j),
(1)
其中:λ為WBCT變換級數(shù);θ為高頻子帶方向;TJND(λ,θ,i,j)為(λ,θ)子帶中(i,j)位置系數(shù)的JND閾值;fs(λ,θ)是對比度敏感函數(shù);al(λ,θ,i,j)是亮度自適應(yīng)調(diào)節(jié)因子;ac(λ,θ,i,j)是對比掩蓋因子。
對比度敏感函數(shù)fs反映了人眼對不同空間頻率的敏感程度。人眼的對比度敏感性隨著空間頻率的增加而減小,即人眼對低頻敏感,對高頻不敏感。另外,人眼對水平和垂直方向敏感,對傾斜方向不敏感。因此,人眼對不同的圖像變換子帶具有不同的敏感程度。對比度敏感函數(shù)fs(λ,θ)的公式如下:
(2)
其中:Aλ,θ為(λ,θ)子帶的基函數(shù)幅值[9];γ為顯示器可視分辨率;gθ為方向權(quán)值,對于水平和垂直子帶,gθ取1,對于傾斜方向子帶,gθ取0.534。
亮度自適應(yīng)調(diào)節(jié)因子al反映了人眼對于背景亮度變化的敏感程度。由于水下環(huán)境光線較弱,采用人工照明使得水下圖像出現(xiàn)光照不均現(xiàn)象。人眼視覺注意力多集中在較亮的區(qū)域,而對較暗的區(qū)域不敏感,所以對于水下圖像中不同亮度區(qū)域應(yīng)采用不同的JND閾值。亮度自適應(yīng)調(diào)節(jié)因子al(λ,θ,i,j)采用如圖3所示的冪函數(shù)曲線形式[9],公式如下:
(3)
圖3 亮度自適應(yīng)調(diào)節(jié)因子al的冪函數(shù)曲線
對比掩蓋因子ac反映了人眼對于不同的圖像成分具有不同的敏感度。由于人眼較難辨別出紋理區(qū)域的失真變化,所以紋理區(qū)域可以掩蓋更多的噪聲,像水下圖像中海底沙石構(gòu)成的紋理區(qū)域可賦予較大的JND閾值。但是人眼卻對邊緣區(qū)域的失真變化較為敏感,所以對于水下圖像中人造目標或者海洋生物的邊緣區(qū)域應(yīng)賦予較小的JND閾值,以保留更多人眼敏感的圖像細節(jié)。另外由于水下圖像中的光滑區(qū)域一般為海水,并不是人眼感興趣的部分,所以在光滑區(qū)域可以容忍一定程度的失真。對比度掩蓋因子ac(λ,θ,i,j)采用如圖4所示的冪函數(shù)表示[9],其公式如下:
ac(λ,θ,i,j)=
(4)
其中:d1為高頻子帶(λ,1)到(λ,k)中相同位置(i,j)的系數(shù)v的標準差;d2為高頻子帶(λ,1)到(λ,k)中相同位置(i,j)的對比度敏感函數(shù)fs與亮度自適應(yīng)調(diào)節(jié)因子al乘積的標準差,當λ=1,2,3時k取12,當λ=4時k取3,ζ取0.25。
圖4 對比度掩蓋因子ac的冪函數(shù)曲線
因此,本文基于JND模型的預(yù)處理方法的具體實現(xiàn)步驟如下:
(1)將水下彩色圖像從RGB空間轉(zhuǎn)換到Y(jié)UV空間,以去除RGB各顏色分量間的相關(guān)性。
(2)對Y、U和V三個分量均進行4級WBCT變換,對前三級小波高頻子帶均進行四方向分解。
(3)對于顏色分量U和V,僅保留低頻部分以供后續(xù)量化編碼;對于亮度分量Y,除了保留低頻部分外,對各高頻子帶進行上述JND閾值檢測,對小于閾值TJND的高頻系數(shù)置零,保留大于閾值TJND的高頻系數(shù)以進行后續(xù)量化編碼。
根據(jù)人眼視覺特性和水下圖像特點,利用JND模型可以自適應(yīng)地去除水下圖像視覺冗余,使高頻系數(shù)最大程度稀疏化,有利于提高編碼效率。
1.3WBCT變換后系數(shù)的量化與編碼
經(jīng)過以上WBCT變換和預(yù)處理之后,待編碼的圖像信息為:亮度分量Y和顏色分量U、V的低頻部分;經(jīng)過JND模型去冗余后的Y分量高頻部分。
因低頻含有人眼較為敏感的重要圖像信息,對于Y、U和V三個分量的低頻子帶LL4,分別進行7位、6位和6位的定長量化,并利用差分脈沖編碼調(diào)制(DPCM)預(yù)測和熵編碼算法進行無損壓縮。
對于Y分量的高頻子帶,構(gòu)建WBCT樹以掃描重要系數(shù),對重要系數(shù)的數(shù)值進行變精度定長量化編碼,對重要系數(shù)的位置采用位置差降的編碼策略。下面具體介紹Y分量高頻子帶的量化編碼方法。
1.3.1 構(gòu)建WBCT樹WBCT變換依舊保留了類似小波樹的父子系數(shù)關(guān)系,并且水下圖像通常對比度低、紋理細節(jié)較少,經(jīng)WBCT變換后會出現(xiàn)較多零樹,所以可以利用樹結(jié)構(gòu)進行掃描編碼,以充分提高壓縮效率。圖5為4級WBCT變換的樹結(jié)構(gòu)示意圖,圖中實線為WBCT變換中的小波分解,虛線為方向分解,本文以不同層級間同一方向子帶的高頻系數(shù)構(gòu)造WBCT樹。由于采用的WBCT變換中前三級分解方向數(shù)相同,因此可直接構(gòu)造WBCT樹,掃描前無需對系數(shù)進行重新排列組合。
圖5 WBCT樹構(gòu)造示意圖
所有WBCT樹以首尾相接的方式進行掃描,在首輪掃描前取全部高頻系數(shù)中最大絕對值的二分之一作為初始掃描閾值T,掃描完全部WBCT樹后將閾值減半,作為下一輪掃描的閾值。掃描時,將小于閾值T的高頻系數(shù)作為非重要系數(shù),置零且無需編碼操作;將大于閾值T的高頻系數(shù)作為重要系數(shù),對其數(shù)值和位置分別采用如下的變精度量化編碼和位置差降編碼方法。
1.3.2 重要高頻系數(shù)的變精度量化編碼 根據(jù)人眼視覺特性,人眼對頻率較低的子帶的敏感程度要高于頻率較高的子帶,對于水平和垂直方向子帶的敏感程度要高于對角方向子帶。因此,根據(jù)人眼對不同子帶的敏感程度,本文按圖5所示將所有高頻子帶劃分為3大類:紅色子帶為第一類;黃色子帶為第二類;綠色子帶為第三類。對這三類高頻系數(shù)分別采用4位、3位和2位二進制定長量化編碼,其中一位用于系數(shù)的正負符號編碼,剩下的位用于系數(shù)的絕對值編碼。
圖6 量化位數(shù)為3時的變精度量化編碼示意圖
采用變精度定長量化編碼可以根據(jù)系數(shù)對重建質(zhì)量的重要程度,實施不同精度的量化,以兼顧重建質(zhì)量和壓縮效率,并且采用定長編碼可以避免傳輸差錯的傳輸和擴散。
1.3.3 重要高頻系數(shù)的位置編碼 對重要高頻系數(shù)的數(shù)值進行變精度定長量化編碼后,本文采用位置差降(WDR)算法對重要系數(shù)的位置進行編碼。記錄第一個重要系數(shù)的位置,以及剩余重要系數(shù)和上一個重要系數(shù)的位置差。將位置差編碼成二進制形式,由于最高位一定為1,所以可將其省略。最后重要系數(shù)的位置編碼序列中只剩0、1和位置差之間的間隔符3種符號。
總結(jié)亮度分量Y的高頻子帶編碼策略,實施步驟如下:
(1)找出所有方向高頻子帶中絕對值最大的系數(shù),作為初始閾值T。
(3)所有WBCT樹以首尾相接的方式進行掃描,將絕對值大于閾值T的高頻系數(shù)作為重要系數(shù),對重要系數(shù)的數(shù)值采用1.3.2節(jié)所述的變精度量化編碼策略。(4)對重要系數(shù)的位置采用上述位置差降算法進行編碼。
(5)每個重要系數(shù)與它的反量化重建值相減,得到一差值,在該重要系數(shù)的位置用這個差值替代當前的重要系數(shù)。
(6)重復(fù)步驟(2)至(5),直到達到目標壓縮比為止。
綜上所述,本文采用的編碼方法的特點是:低頻和高頻分開處理,保護了圖像的重要信息;充分利用WBCT樹結(jié)構(gòu),有效提高編碼效率;采用變精度量化,有利于保證圖像重構(gòu)質(zhì)量;編碼計算復(fù)雜度低,易于硬件實現(xiàn)。
本文通過3組實驗對提出的水下圖像壓縮算法的性能進行測試:一是基于JND模型的預(yù)處理可行性驗證;二是本文算法與基于小波變換的SPIHT[4]和WDR[5]編碼算法的比較;三是本文算法在較高壓縮比下的解碼效果測試。測試圖像均為256×256像素的水下圖像。
首先對大量水下彩色圖像進行基于JND模型的去冗余預(yù)處理,圖7是預(yù)處理后未經(jīng)壓縮的重建效果對比圖。由圖可知,人眼很難覺察出去冗余之后的重建圖像與原圖的差別,預(yù)處理后仍然較好地保持了人眼感興趣的圖像邊緣和光滑區(qū)域不變。表1給出了重建圖像YUV3個通道的峰值信噪比(PSNR)和采用JND模型去除的高頻系數(shù)占Y分量總系數(shù)數(shù)量的百分比,從表中可以看出,各分量PSNR值大于35dB,JND模型去除的Y分量高頻系數(shù)大于70%。通過主觀觀察和客觀評價指標可知,本文的預(yù)處理方法能有效去除視覺冗余,符合人眼的觀測質(zhì)量要求。對于較模糊的水下圖像,該方法不但能去除更多冗余,而且對重建質(zhì)量的影響更小。因此,本文基于JND模型的預(yù)處理方法是可行的。
((a)、(c)、(e)和(g):原始圖像;(b)、(d)、(f)和(h):預(yù)處理后圖像。(a)、(c)、(e)and(g):Originalimages; (b)、(d)、(f)and(h):Preprocessedimages.)
圖7 基于JND模型的預(yù)處理結(jié)果
Fig.7PreprocessedresultsbasedonJND
表1 基于JND模型的預(yù)處理結(jié)果
第二組實驗是本文算法與基于小波變換的SPIHT和WDR算法在相同壓縮比下解碼灰度圖像的對比結(jié)果。3種算法程序均采用MicrosoftVisualC++ 2008編寫。對水下灰度圖像,本文算法進行4級WBCT變換,SPIHT和WDR算法進行4級Daub5/3小波變換,采用相同預(yù)處理方法,然后分別利用各自編碼策略實現(xiàn)壓縮。圖8給出了壓縮比為0.2bpp時3種算法的重建效果對比圖。其中圖(a)和(b)是原始灰度圖像,圖(c)和(d)是WDR算法重建結(jié)果,圖(e)和(f)是SPIHT算法重建結(jié)果,圖(g)和(h)是本文算法重建結(jié)果。從圖中可以看出,在較高壓縮比下,3種算法的重建圖像細節(jié)均有不同程度的損失。但是本文算法的PSNR值高于另外兩種算法,且整體視覺效果最佳,尤其是在人眼感興趣的區(qū)域,SPIHT和WDR算法得到的重建圖像在邊緣部分已經(jīng)出現(xiàn)模糊,而本文算法依然可以較好地還原圖像邊緣信息。這主要是因為,與SPIHT和WDR算法采用的小波變換相比,本文算法采用的WBCT變換具有更好的各向異性,能夠分解出更多方向子帶,只需較少的系數(shù)就可以有效逼近圖像的邊緣和輪廓信息,而這部分圖像特征正是人眼比較關(guān)注的區(qū)域,因此本文算法的視覺效果更優(yōu)。另外,SPIHT和WDR算法的重建圖像背景也有一定失真。這是因為本文算法與SPIHT和WDR算法對高頻系數(shù)的編碼掃描路徑不同,本文算法對含有圖像主要信息的低頻子帶單獨采用無損編碼,然后掃描高頻子帶,這樣可以在高壓縮比下保護圖像的主要信息。而SPIHT和WDR算法則是從低頻子帶就開始掃描,可能造成某些低頻系數(shù)被誤認為“0”,進而導(dǎo)致圖像背景失真。
((a)和(b):原始圖像; (c)和(d):WDR算法重建圖像; (e)和(f):SPIHT算法重建圖像; (g)和(h):本文算法重建圖像。(a)and(b):Originalimages; (c)和(d):ReconstructionimagesbyWDRalgorithm; (e)和(f):ReconstructionimagesbySPIHTalgorithm; (g)和(h):Reconstructionimagesbyproposedalgorithm.)
圖8 在0.2bpp條件下三種算法解碼灰度圖像的對比結(jié)果
Fig.8Comparisonofdecodedgrayimagesbythethreealgorithmsat0.2bpprate
圖9 三種算法在不同壓縮比下重建圖6(a)的PSNR對比結(jié)果
圖10 三種算法在不同壓縮比下重建圖6(b)的PSNR對比結(jié)果
((a)、(e)、(i)和(m):原始圖像;(b)-(d)、(f)-(h)、(j)-(l)和(n)-(p):不同壓縮比下的解碼圖像。(a), (e), (i)and(m):Originalimages; (b)-(d), (f)-(h), (j)-(l)and(n)-(p):Decodedimagesatdifferentcompressionratio.)
圖11 較高壓縮比下本文算法解碼圖像的結(jié)果
Fig.11Decodedimagesbyproposedalgorithmathighcompressionratio
圖9和10給出了對圖6(a)和(b)采用3種算法在不同壓縮比下重建圖像的PSNR對比結(jié)果。由圖可知,在不同壓縮比下,本文算法的PSNR值均高于SPIHT算法和WDR算法,并且隨著壓縮比增加,本文算法的優(yōu)越性也愈加明顯。產(chǎn)生這種結(jié)果的原因是:首先如前文所述,本文算法采用的WBCT變換本身具有更強的捕捉圖像細節(jié)信息的能力;其次,由于本文算法單獨對低頻子帶采用無損編碼,在高壓縮比下能夠獲得比SPIHT算法更多的零樹結(jié)構(gòu),并且WDR算法并沒有采用更高效的樹結(jié)構(gòu)進行掃描編碼。因此,本文提出的算法具有較高的編碼效率。
第三組實驗測試了本文算法在較高壓縮比下彩色圖像的解碼效果。如圖11所示,隨著壓縮比增加,重建圖像的視覺質(zhì)量逐漸下降,但當壓縮比高于150:1時,解碼圖像的視覺效果仍然是可以接受的,所以本文算法可以保證高壓縮比下的解碼質(zhì)量。
根據(jù)水下圖像和人眼視覺的特點,提出一種基于WBCT變換的水下圖像高效壓縮算法。該算法采用WBCT變換,克服了小波變換方向性不足的缺點,能夠更好地表征圖像細節(jié),保證圖像重建質(zhì)量。依據(jù)人眼視覺敏感度,提出一種專門針對水下圖像的JND模型,能自適應(yīng)去除圖像中的視覺冗余,顯著增加了圖像的稀疏程度。分開處理低頻和高頻,并采用基于樹結(jié)構(gòu)的變精度量化和位置差降編碼策略,有利于提高壓縮效率。實驗結(jié)果表明:與基于小波變換的編碼算法相比,本文提出的算法具有更好的解碼效果,符合人眼視覺質(zhì)量要求;可以實現(xiàn)高效壓縮,適用于水下圖像在甚低比特率下的壓縮傳輸。如何提高壓縮算法的抗誤碼能力是下一步研究的目標。
[1]LiQ,ZhangY,ZangF.Fastmulti-cameravideostitchingforunderwaterwideFOVobservation[J].JournalofElectronicImaging, 2014, 23(2): 1-15.
[2]IglesiasI,SongA,GarciaJ,etal.Imagetransmissionovertheunderwateracousticchannelviacompressivesensing[C].Baltimore: 45thAnnualConferenceonInformationSciencesandSystems, 2011: 1-6.
[3]MurphyC,WangR,SinghH.Seafloorimagecompressionwithlargetilesizevectorquantization[C].Monterey:IEEEAUVConference, 2010: 1-8.
[4]MurphyC,WallsJ,SchneiderT,etal.CAPTURE:Acommunicationsarchitectureforprogressivetransmissionviaunderwaterrelayswitheavesdropping[J].IEEEJournalofOceanicEngineering, 2014, 39(1): 120-130.
[5]LiQ,WangW.Low-bit-ratecodingofunderwatercolorimageusingimprovedwaveletdifferencereduction[J].JournalofVisualCommunicationandImageRepresentation, 2010, 21(7): 762-769.
[6] 李慶忠, 王中琦, 李長順. 適合水聲信道傳輸?shù)乃聢D像高效編碼算法 [J]. 計算機工程與應(yīng)用, 2012, 48(6): 209-213.LiQ,WangZ,LiC.Efficientunderwaterimagecodingalgorithmsuitableforunderwateracousticchanneltransmission[J].ComputerEngineeringandApplications, 2012, 48(6): 209-213.
[7]EslamiR,RadhaH.Wavelet-basedcontourlettransformanditsapplicationtoimagecoding[C].Singapore:IEEEInternationalConferenceonImageProcessing, 2004: 3189-3192.
[8]LinW,KuoC.Perceptualvisualqualitymetrics:Asurvey[J].JournalofVisualCommunicationandImageRepresentation, 2011, 22(4): 297-312.
[9]LiuZ,KaramL,WatsonA.JPEG2000encodingwithperceptualdistortioncontrol[J].IEEETransactionsonImageProcessing, 2006, 15(7): 1763-1778.
責(zé)任編輯 陳呈超
Efficient Underwater Image Compression Method Based on WBCT
ZHANG Yang, LI Qing-Zhong
(College of Engineering, Ocean University of China, Shandong Provincial Key Laboratory of Ocean Engineering, Qingdao 266100, China)
A key application for underwater image compression is the real-time transmission of imagery from an autonomous underwater vehicle to a surface station, e.g., for man-in-the loop monitoring and inspection operations, through acoustic channels that have limited bandwidth. To achieve high compression efficiency while keeping visually pleasing reconstruction quality for underwater images, this paper presents an efficient underwater image compression method based on the wavelet-based contourlet transform (WBCT). According to the characteristics of underwater images and human vision system (HVS), an improved just noticeable distortion (JND) model is fist proposed to adaptively remove the visual redundancy of underwater images in the WBCT domain. In order to fully exploit the property of HVS, the JND-based preprocessor incorporates three modulation factors, including the contrast sensitivity, lamination adaption and contrast masking functions, respectively. For both luminance and chrominance components, the low frequency coefficients are quantized in the fixed length and encoded losslessly. For luminance channel, the high frequency coefficients are quantized by variable precision and fixed length method, and are coded by the difference reduction algorithm based on WBCT trees. The proposed scheme is compared with traditional wavelet-based encoders to assess the coding performance. The experimental results with underwater images confirm that the proposed compression algorithm provides both high coding efficiency and satisfactory reconstruction quality, which is highly desired for the transmission of underwater imagery at very low-bit rates.
underwater imagery; image compression; wavelet-based contourlet transform; just noticeable distortion
國家高技術(shù)研究與發(fā)展計劃項目(2006AA09Z237)資助 Supported by National High-Tech R&D Program (2006AA09Z237)
2014-09-15;
2015-10-11
張 洋(1987-),男,博士生,主要研究方向為水下圖像處理與水下機器人視覺。E-mail:zzephyyr@qq.com
** 通訊作者: E-mail:liqingzhong@ouc.edu.cn
TP391.41
A
1672-5174(2017)03-124-09
10.16441/j.cnki.hdxb.20140201
張洋, 李慶忠. 基于WBCT變換的水下圖像高效壓縮方法[J]. 中國海洋大學(xué)學(xué)報(自然科學(xué)版), 2017, 47(3): 124-132.
ZHANG Yang, LI Qing-Zhong. Efficient underwater image compression method based on WBCT[J]. Periodical of Ocean University of China, 2017, 47(3): 124-132.