高彥彥,李 莉,張 晶,賈英茜
(石家莊學(xué)院機(jī)電學(xué)院,石家莊050035)
近些年被人們廣泛關(guān)注的圖像壓縮感知是由David L.Donoho 在稀疏表示和優(yōu)化理論的基礎(chǔ)上提出的一種成像理論[1],其本質(zhì)就是在對(duì)信號(hào)進(jìn)行隨機(jī)投影得到維數(shù)遠(yuǎn)小于原始信號(hào)的觀測(cè)值后,利用信號(hào)在某一變換域的稀疏性,通過求解一系列的線性或者非線性的解碼模型,得到原始信號(hào)的逼近。這種成像方法在數(shù)據(jù)采集端實(shí)現(xiàn)了采樣與壓縮的同步進(jìn)行,因而極大地緩解了采集端的壓力。這樣就可以利用少量的傳感器或傳感器陣列采集信息,通過復(fù)雜的重構(gòu)算法重建高分辨率圖像,已應(yīng)用在諸多方面[2-5],圖像重構(gòu)是典型應(yīng)用之一。
基于壓縮感知的圖像重構(gòu)有多種算法[6-7],這些算法主要是利用信號(hào)在某一表示域的稀疏性,通過解決不同形式的優(yōu)化問題來得到信號(hào)的最優(yōu)逼近,文獻(xiàn)[8-9]對(duì)壓縮感知中涉及的相關(guān)內(nèi)容進(jìn)行了綜述。
信號(hào)在某一變換域的稀疏度是指變換系數(shù)中非零元素的個(gè)數(shù),這可以用系數(shù)的l0范數(shù)表示。一般來說由于自然信號(hào)的稀疏性或是可壓縮性,使得信號(hào)在某一變換域存在稀疏解或近似的稀疏解,因而壓縮感知重構(gòu)的目的就可以看成是尋找信號(hào)的最小稀疏解的過程,即:最小化系數(shù)的l0范數(shù)的過程。但是這是一個(gè)NP-hard 問題,不易求解,因而可以將l0范數(shù)轉(zhuǎn)化為其他函數(shù)的最小化問題。文獻(xiàn)[10]中將l0范數(shù)轉(zhuǎn)化為l1范數(shù)最小化后,利用基追蹤進(jìn)一步將其轉(zhuǎn)化為線性規(guī)劃問題進(jìn)行求解;也可以根據(jù)文獻(xiàn)[11]提出的迭代收縮算法,利用前一估計(jì)值和變化域的閾值處理得到迭代更新值,進(jìn)而逼近最優(yōu)解;匹配追蹤[12]是一種常用的貪婪算法,主要就是在每一步迭代中尋找投影字典中最匹配的原子,從而縮小剩余量,這種算法的計(jì)算量過大,對(duì)于圖像壓縮感知不是很好;文獻(xiàn)[13]中利用圖像的全變差(梯度稀疏性,變換系數(shù)的稀疏性可以看成是梯度的一種跳變)結(jié)合凸集投影和小波閾值處理完成了圖像的壓縮感知重構(gòu)。在以上介紹的這些方法中,均需要對(duì)投影矩陣A 進(jìn)行準(zhǔn)確處理,而文獻(xiàn)[14]針對(duì)稀疏重構(gòu)提出的梯度投影(Gradient Projection for Sparse Reconstruction,GPSR)算法則不需要對(duì)投影矩陣A 進(jìn)行準(zhǔn)確的處理,只需要計(jì)算A與AT的內(nèi)積,簡(jiǎn)化了算法。
壓縮感知中變換域的選擇目前常用的是正交小波,但正交小波存在一些不可避免的缺點(diǎn):振蕩、平移變性、方向選擇性差。Kingsbury[15]提出的雙樹復(fù)數(shù)小波變換(Dual-Tree Complex Wavelet Transform,DT CWT)克服了這些缺點(diǎn),具有平移不變性和良好的方向選擇性。為了提高壓縮感知重構(gòu)算法的有效性,本文在利用置亂離散余弦變換(Permute Discrete Cosine Transform,PDCT)得到觀測(cè)值后,利用圖像在雙樹復(fù)數(shù)小波域的稀疏性,結(jié)合GPSR 算法完成了圖像壓縮感知重構(gòu),并通過實(shí)驗(yàn)驗(yàn)證了該算法的有效性。
原始信號(hào)s ∈Rn,隨機(jī)投影過程表示為y=Φs,Φ ∈Rm×n定義為隨機(jī)投影矩陣,y ∈Rm(n ?m)。壓縮感知重構(gòu)的目的是利用信號(hào)在某一變換域(用Ψ 表示)的稀疏性,從遠(yuǎn)少于n的m個(gè)觀測(cè)值中恢復(fù)原始信號(hào)。對(duì)于這一問題需要保證Φ滿足Candes等提出的限制等容性,并且Φ與Ψ不相關(guān)[16]。
對(duì)于一維信號(hào),隨機(jī)矩陣Φ 通常情況下選擇高斯隨機(jī)陣[17],但是對(duì)于二維圖像,這種隨機(jī)矩陣是不可取的,本文選擇PDCT(將圖像進(jìn)行一維置亂,再轉(zhuǎn)為二維圖像進(jìn)行離散余弦變換),從得到的變換系數(shù)中選擇一定數(shù)量的數(shù)值作為觀測(cè)值y。
壓縮感知的重構(gòu)主要就是利用圖像變換系數(shù)的稀疏性來進(jìn)行的,需要找到最稀疏的變換系數(shù)。矩陣的稀疏性可以用其l0表示,但是對(duì)l0問題的求解并不易得到,因而可以將其轉(zhuǎn)為l1問題:
s.t.y=Φs
其中,α 是圖像的變換系數(shù),用α=Ψs 表示。對(duì)于式(1)所述優(yōu)化問題,通常情況下考慮:
其中參數(shù)τ 為非負(fù)值,用于平衡式(2)中的前后兩部分的比重。由于α=Ψs,將s=ΨTα代入式(2),得到:
設(shè)A=ΦΨT,x=α,則式(3)變?yōu)椋?/p>
GPSR算法[15]首先將式(4)代表的問題轉(zhuǎn)化為邊界約束二次問題:
s.t.u ≥0,v ≥0
其中u、v分別表示x的正負(fù)兩部分,即:
則 ui,j=(xi,j)+=max(0,xi,j),vi,j=(-xi,j)+=max(0,-xi,j),i,j=1,2,…,n。由 此 得 到,其 中 1n=[1,1,…,1]T。
將式(5)進(jìn)一步整理寫成標(biāo)準(zhǔn)的邊界約束二次問題形式:
s.t.z ≥0
對(duì)于給定的向量z=[uT,vT]T,存在:
由式(7)可得函數(shù)F(z)的梯度:
式(9)又可以表示為?F(z)=(?u,?v)T,根據(jù)式(5)可以得到:
梯度投影算法的主要步驟:
進(jìn)一步推導(dǎo),將其轉(zhuǎn)化為以u(píng)、v作變量的形式:
GPSR-Basic算法對(duì)應(yīng)的是λ()k=1,此時(shí)式(12)變?yōu)椋?/p>
在GPSR-Basic,標(biāo)量參數(shù)α(k)的初始值[8]設(shè)為:
其中向量g(k)具體表示為:
GPSR-Basic的具體步驟為:
1)初始化:設(shè)x(0)初始值為0,根據(jù)式(6)得到u(0)與v(0),并且由式(5)計(jì)算目標(biāo)函數(shù)f(0)。
2)根據(jù)式(10)計(jì)算得到?u(k)與?v(k),進(jìn)而得到?x(k)=?u(k)-?v(k)。
4)α(k)=α0。
5)根 據(jù) 式(13)、(14)得 到u(k+1)與v(k+1),從 而 得 到x(k+1)=u(k+1)-v(k+1),計(jì)算f(x(k+1))。
6)判斷下式是否成立:
如 果 成 立,進(jìn) 入 下 一 步;否 則α(k)=βα(k),返 回 步 驟5),β ∈(0,1)。
7)判斷是否停止迭代:根據(jù)目標(biāo)函數(shù)的變化情況進(jìn)行判斷,即是否成立,成立終止迭代,否則返回步驟2)繼續(xù)進(jìn)行。
GPSR-Basic 與文獻(xiàn)[14]中考慮Barzilai-Borwein 梯度策略的算法GPSR-BB 的不同之處在于標(biāo)量參數(shù)α(k)與λk的設(shè)定,后者的參數(shù)設(shè)定如下:
本文壓縮傳感系統(tǒng)是利用圖像在雙樹復(fù)數(shù)小波變換域的稀疏性,并結(jié)合GPSR算法實(shí)現(xiàn)圖像重構(gòu)。
DT CWT 是利用四個(gè)普通的離散正交小波實(shí)現(xiàn)的,其變換系數(shù)包括四個(gè)支路,分別對(duì)應(yīng)實(shí)部和虛部?jī)刹糠?,每一部分又分為上下兩個(gè)支路。DT CWT 克服了正交小波的缺點(diǎn),具有近似的平移不變性和良好的方向選擇性。如圖1(a)所示,DT CWT 具有6 個(gè)方向(°±15°,±45°,±75°),而普通的正交小波只具有3個(gè)方向(0°,45°,90°),如圖1(b)所示。由圖1可以看出,和普通正交小波相比,DT CWT不具有振蕩特性。
在基于壓縮感知的圖像重構(gòu)系統(tǒng)中,首先利用PDCT 得到觀測(cè)值y,然后利用GPSR算法得到式(4)中的最優(yōu)解?。對(duì)于圖像x,根據(jù)圖像大小N 進(jìn)行一維置亂后,再將其還原為2D圖像,進(jìn)行離散余弦變換(Discrete Cosine Transform,DCT),再從此系數(shù)中選擇M 個(gè)元素作為觀測(cè)值y,此時(shí)y=Φs(Φ 代表PDCT)。在實(shí)驗(yàn)中設(shè)定必要的參數(shù):A=ΦΨ,AT=ΨTΦT,其中:Ψ 表示DT CWT,ΦT表示IPDCT,表示DT CWT 的反變換;根據(jù)GPSR 算法設(shè)定式(5)中的參數(shù)τ,以及迭代終止值δ;按照GPSR 算法的具體步驟完成變換系數(shù)的重構(gòu),得到α?;最后利用逆變換得到重構(gòu)圖像?。
圖1 2D DT CWT和2D DWT的方向小波及振幅變化Fig.1 Directional wavelet and amplitude variation of 2D DT CWT and 2D DWT
本文利用三幅大小為512×512 的灰度圖像完成相關(guān)實(shí)驗(yàn),如圖2所示。
圖2 實(shí)驗(yàn)灰度圖像原圖Fig.2 Original grayscale images used in experiments
首先比較不同小波基下,采用GPSR-Basic 和GPSR-BB 兩種重構(gòu)算法的差異。在實(shí)現(xiàn)過程中,τ=2.0,迭代終止條件為δ=10-3,小波基包括DT CWT 和JPEG2000 中使用的小波基CDF 9/7(雙正交小波)。表1 給出了3 幅圖像在不同采樣率(M/N)下,利用不同小波基得到的峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)。
表1 不同采樣率下利用GPSR-Basic和GPSR-BB在DT CWT和CDF 9/7小波基下重構(gòu)圖像的PSNR對(duì)比 單位:dBTab.1 PSNR comparison of images reconstructed by GPSR-Basic and GPSR-BB based on DT CWT and CDF 9/7 with different sampling ratios unit:dB
由表1 可以看出,對(duì)于給定的采樣率(0.1~0.5),利用GPSR-Basic 算法實(shí)現(xiàn)重構(gòu)的圖像的PSNR 值在多數(shù)情況下大于GPSR-BB 實(shí)現(xiàn)的圖像的PSNR 值,但是差值小于1 dB,從視覺上不能直觀分辨。在同一種重構(gòu)算法下,采用DT CWT 小波基得到的重構(gòu)結(jié)果均優(yōu)于CDF。從PSNR 上來看,Lena 和Boat 圖像差值在1.5 dB 左右,Barbara 圖像的差值是2 dB 左右。圖3是Lena圖像在采樣率M/N=0.2時(shí),在不同小波基表示下,利用GPSR-Basic 重構(gòu)的結(jié)果及其局部放大圖像,并將其與原始圖像進(jìn)行了比較。重構(gòu)后的圖像與原始圖像相比,PSNR 在數(shù)值上相差1.72 dB,圖3 中有肉眼可見的改善,由局部細(xì)節(jié)可以看出利用DT CWT 小波基重構(gòu)的圖像比較清晰,噪點(diǎn)明顯減少。從表1中的PSNR數(shù)值來看,Lena和Boat圖像差值在1.5 dB 左右,Barbara 圖像的差值是2 dB 左右。由圖2的原始圖中可以看出,Barbara 圖像中含有較多的紋理區(qū)域,對(duì)小波的方向性要求較高,最終的實(shí)驗(yàn)結(jié)果也表明DT CWT小波基在方向選擇性和細(xì)節(jié)上優(yōu)于CDF 9/7小波基。
圖3 原始圖像與DT CWT、CDF 9/7重構(gòu)圖像的比較(M/N=0.2)Fig.3 Comparison of original image and images reconstructed by DTCWT and CDF 9/7(M/N=0.2)
本文在選擇DT CWT 小波基的基礎(chǔ)上,將GSPR 算法與迭代閾值收縮(Iteration Shrinkage Threshold,IST)方法進(jìn)行了比較,圖4 是對(duì)Lena 圖像利用三種方法實(shí)現(xiàn)重構(gòu)時(shí)目標(biāo)函數(shù)隨時(shí)間的變化情況。隨機(jī)投影部分選擇的是PDCT,目標(biāo)函數(shù)中的參數(shù)τ=2.0,迭代終止條件為δ=10-3,采樣率為0.2。從運(yùn)行時(shí)間和收斂情況上看,初始階段IST的下降速度比GPSRBasic 略快,但是后續(xù)收斂變慢,達(dá)到終止的用時(shí)最久;GPSRBB的收斂速度最快,達(dá)到終止條件用時(shí)最少。
圖4 不同重構(gòu)算法下目標(biāo)函數(shù)的變化Fig.4 Changes of objective function with different reconstruction algorithms
利用結(jié)構(gòu)隨機(jī)矩陣(Structurally Random Matrices,SRM)[18]對(duì)信號(hào)x 的處理過程可定義為y=D ?F ?P(x),其中:P 表示對(duì)原始信號(hào)進(jìn)行隨機(jī)投影,可以隨機(jī)置亂信號(hào)次序或者將信號(hào)符號(hào)隨機(jī)置亂;F 表示正交變換矩陣,可選擇快速傅里葉變換、離散余弦變換或沃爾什哈達(dá)瑪變換,為了與前文的PDCT 相比較,本文選擇的是DCT;D 表示根據(jù)采樣率隨機(jī)抽取數(shù)據(jù),最終得到觀測(cè)值y。
表2 給出了SRM 和PDCT 兩種不同觀測(cè)矩陣,在CDF9/7和DT CWT 兩種小波基下,利用GPSR-BB 對(duì)Lena 圖像重構(gòu)結(jié)果的PSNR。由表2 可以看出,在CDF 9/7 和DT CWT 小波基下,利用PDCT 的結(jié)果均優(yōu)于SRM;同一種隨機(jī)觀測(cè)矩陣下,DT CWT的結(jié)果優(yōu)于CDF 9/7。
表2 不同隨機(jī)投影方式的重構(gòu)結(jié)果的PSNR 單位:dBTab.2 PSNR of reconstructed results of different random projection methods unit:dB
本文利用圖像在DT CWT 小波域的稀疏性,通過GPSR 算法實(shí)現(xiàn)了圖像重構(gòu)。實(shí)驗(yàn)在同一重構(gòu)方法前提下比較了不同的稀疏表示域的PSNR 值,結(jié)果表明2D DT CWT 相比雙正交小波(CDF 9/7)在重構(gòu)細(xì)節(jié)上具有一定的優(yōu)勢(shì),特別是在紋理較多的圖像上優(yōu)勢(shì)明顯;PDCT 的隨機(jī)投影方式較SRM 也有提升;并且GPSR 的兩種重構(gòu)算法與IST 相比在收斂速度上提升明顯。雖然DT CWT 在重構(gòu)結(jié)果上有明顯的提升,但由于其方向小波數(shù)量較多,重構(gòu)的速度較之CDF 9/7 有所降低。對(duì)圖像的稀疏表示仍在進(jìn)一步研究中,可以考慮將其應(yīng)用到模式表示的其他領(lǐng)域。