彭天奇,禹 晶,郭樂寧,肖創(chuàng)柏
(北京工業(yè)大學(xué)信息學(xué)部,北京100124)
運動模糊是一種常見的圖像降質(zhì)現(xiàn)象,通常由于相機(jī)的抖動或者物體的運動造成。單幅圖像去模糊問題研究如何從一幅模糊圖像中恢復(fù)出原始的清晰圖像。根據(jù)模糊核是否已知,去模糊方法可分為兩類:若模糊核已知,則稱為非盲復(fù)原方法;若模糊核未知,則稱為盲復(fù)原方法。
對于均勻模糊圖像的形成過程可以表示為如下卷積模型:
其中:y為模糊圖像,h為模糊核,*表示卷積操作,x為清晰圖像,n為噪聲。在卷積模型下,圖像盲復(fù)原即研究如何從模糊圖像y中同時估計出模糊核h和清晰圖像x。由于將模糊過程建模為卷積的形式,因此盲復(fù)原問題也稱為盲解卷積問題。
圖像盲解卷積是一個嚴(yán)重的欠定逆問題,基于最大后驗概率(Maximum a Posteriori estimation,MAP)估計或變分模型的方法[1-15]通過構(gòu)建模糊核和圖像的先驗?zāi)P蛠砑s束問題的解空間?;贛AP估計的方法在條件概率服從某一種噪聲模型,并結(jié)合清晰圖像和模糊核的先驗概率模型的假設(shè)條件下,通過最大化后驗概率來估計清晰圖像和模糊核,而變分模型則是在噪聲概率模型服從高斯分布的條件下,通過負(fù)對數(shù)函數(shù)將最大化后驗概率問題轉(zhuǎn)換為最小化變分問題。前期,Chan等[4]利用全變分的方法來約束清晰圖像的梯度。Levin等[5]提出了一種超拉普拉斯先驗建模圖像的梯度來估計模糊核。Krishnan等[6]提出了一種歸一化的稀疏先驗,利用L1/L2范數(shù)約束圖像梯度,將L2范數(shù)對圖像梯度的約束作為L1范數(shù)的權(quán)重。Anger等[7]利用L0范數(shù)對圖像梯度進(jìn)行約束,增強圖像中的顯著邊緣,減小細(xì)節(jié)對模糊核估計的影響。
圖像梯度表示鄰域內(nèi)像素之間的關(guān)系,由于自然圖像包含復(fù)雜的結(jié)構(gòu),僅利用相鄰像素之間的關(guān)系很難清楚地描述這種復(fù)雜的結(jié)構(gòu),基于圖像塊的先驗可以表示更大更復(fù)雜的圖像結(jié)構(gòu)。Michaeli等[8]利用不同尺度圖像之間圖像塊的相似性作為先驗來估計模糊核。Pan等[9]在模糊核的估計中引入了暗通道先驗,但是這種方法不適用于缺乏暗像素以及存在噪聲的圖像,因為在這些情況下,無法保證暗通道的稀疏性。在Pan等[9]方法的基礎(chǔ)上,Yan等[10]結(jié)合亮通道先驗與暗通道先驗作為約束項以提高算法的魯棒性。Chen等[11]利用L1范數(shù)約束局部最大梯度值作為正則項來估計模糊核。
稀疏表示是指利用少量元素的線性組合來表示信號,稀疏表示作為圖像先驗廣泛應(yīng)用于圖像復(fù)原領(lǐng)域。Hu等[12]和Zhang等[13]將圖像塊的稀疏表示作為先驗進(jìn)行模糊估計,并從其他自然圖像或模糊圖像本身中隨機(jī)采樣圖像塊作為訓(xùn)練樣本,利用K-SVD算法[14]訓(xùn)練字典。Chang等[15]結(jié)合圖像塊的稀疏表示和結(jié)構(gòu)自相似性作為先驗進(jìn)行模糊核估計。
本文提出了一種基于跨尺度字典學(xué)習(xí)的圖像盲解卷積算法,利用圖像的跨尺度自相似性,從降采樣模糊圖像中學(xué)習(xí)字典,將圖像紋理區(qū)域在該自適應(yīng)字典下的稀疏表示作為圖像先驗。一方面,降采樣減弱了圖像的模糊程度,與模糊圖像相比,其降采樣圖像與清晰圖像具有更強的相似性,采用降采樣模糊圖像中的圖像塊訓(xùn)練字典能夠更好地對清晰圖像進(jìn)行稀疏表示,另一方面,由于僅在紋理區(qū)域清晰圖像的稀疏表示誤差小于模糊圖像的稀疏表示誤差,將稀疏表示作為正則化項僅對圖像中的紋理塊進(jìn)行約束,迫使重建圖像的邊緣接近清晰圖像的邊緣。因此,本文的算法能夠準(zhǔn)確地估計出模糊核,并具有良好的魯棒性。
本文提出了一種基于跨尺度字典學(xué)習(xí)的稀疏表示先驗?zāi)P停脠D像的跨尺度自相似性,從模糊圖像的降采樣圖像中抽取圖像塊作為稀疏表示字典的訓(xùn)練樣本,并對圖像中的紋理塊進(jìn)行稀疏表示。
在圖像中以n×n為圖像塊尺寸,按照固定步長(每相隔固定個像素)進(jìn)行有重疊的圖像塊劃分,并對圖像塊進(jìn)行列向量表示。設(shè)圖像中抽取的圖像塊表示為Qj x1,其中Qj∈Rn×N為抽取矩陣,用于從圖像中抽取第j個圖像塊,n為抽取的圖像塊尺寸,N為圖像的像素數(shù)(后文涉及到范數(shù)的表示和導(dǎo)數(shù)計算,為了方便表達(dá),需要將公式寫為矩陣向量的形式,因此,對于空域卷積,本文近似使用列向量的形式表示)。對于圖像中的任意圖像塊Qj x,可以將其表示為字典中少量原子的線性組合,即:
其中:矩陣D∈Rn×t為字典,字典中列向量為原子,若原子的數(shù)量大于列向量的維數(shù),即t>n,則D為過完備字典;αj∈Rt為稀疏表示系數(shù),αj中非零元素的數(shù)量越少,Qj x的表示越稀疏表示?0范數(shù),用于統(tǒng)計向量中非零元素的個數(shù)。
在字典確定的情況下,對于任意圖像塊Qj x,求解稀疏表示系數(shù)αj可表示為如下所示的?0范數(shù)約束最小化問題:
稀疏表示的關(guān)鍵任務(wù)是設(shè)計字典,使得圖像塊可以用字典中的原子稀疏表示。當(dāng)前存在兩種字典設(shè)計方法,一種是根據(jù)圖像的基本形態(tài)結(jié)構(gòu),選擇合適的基函數(shù)構(gòu)建解析字典,解析字典的生成簡單直觀,但只能對特定類型的信號進(jìn)行稀疏表示;另一種是通過對圖像內(nèi)容的學(xué)習(xí),自適應(yīng)地生成可表示信號實際結(jié)構(gòu)特征的訓(xùn)練字典,由于訓(xùn)練字典根據(jù)圖像內(nèi)容生成,因而更適合一般性圖像的稀疏表示。
利用訓(xùn)練樣本進(jìn)行字典學(xué)習(xí),可表示為如下約束最優(yōu)化問題:
其中:si∈Rn,i=1,...,m為訓(xùn)練樣本,m為樣本個數(shù)。本文利用K-SVD(Singular Value Decomposition)算法生成過完備字典D。式(4)在保證稀疏表示-系數(shù)稀疏性的條件下約束表示誤差,這是因為K-SVD算法的求解是稀疏表示和字典更新交替迭代過程,需要根據(jù)當(dāng)前更新的字典,利用OMP算法獲得式(3)的近似解。
字典學(xué)習(xí)的關(guān)鍵是選擇訓(xùn)練字典的樣本圖像。為了更好地表示清晰圖像,理想情況是將清晰圖像作為字典的訓(xùn)練樣本,然而,在實際情況下,清晰圖像是未知的、不可用的。常用的方法是從大量清晰圖像組成的數(shù)據(jù)集中提取訓(xùn)練圖像塊或者直接將模糊觀測圖像作為訓(xùn)練樣本來學(xué)習(xí)字典。文獻(xiàn)[12]利用數(shù)據(jù)集作為字典學(xué)習(xí)的樣本,一般數(shù)據(jù)集的規(guī)模較大,字典學(xué)習(xí)的效率較低、且當(dāng)數(shù)據(jù)集中的圖像與待復(fù)原圖像的特征差異較大時,無法保證待復(fù)原圖像在該字典下的稀疏性。文獻(xiàn)[13]利用模糊圖像本身訓(xùn)練字典,該字典無法準(zhǔn)確提供關(guān)于清晰圖像的特征,因而,無法保證清晰圖像在該字典下具有稀疏性。
多尺度自相似性是指在同一場景中存在著相同尺度以及不同尺度的相似結(jié)構(gòu)。這種多尺度自相似性具體表現(xiàn)為圖像中具有相同尺度以及不同尺度的相似圖像塊,從圖像中提取一個圖像塊,可在原尺度圖像及其他尺度的圖像中找到相似的圖像塊。相機(jī)的透視投影是圖像的多尺度自相似性普遍存在的主要原因。Glasner等[16]通過大量圖像的實驗驗證了相似圖像塊普遍存在于同一場景的相同尺度以及不同尺度圖像中。本文中將不同尺度的圖像自相似性簡稱為跨尺度自相似性,利用跨尺度自相似性為圖像復(fù)原提供附加信息。
由于降采樣降低了圖像的模糊程度,與模糊圖像本身相比,其降采樣圖像與清晰圖像具有更強的相似性。Michaeli等[8]從理論上證明了模糊圖像的降采樣圖像與清晰圖像更相似。由于從降采樣模糊圖像中提取的圖像塊與清晰圖像塊更相似,將降采樣模糊圖像作為字典的訓(xùn)練樣本能夠更好地對清晰圖像進(jìn)行稀疏表示。圖1比較了不同訓(xùn)練樣本字典學(xué)習(xí)下的清晰圖像稀疏表示誤差,對于圖1(a)所示的清晰圖像,以清晰圖像本身作為字典的訓(xùn)練樣本對清晰圖像進(jìn)行稀疏表示,圖1(b)為稀疏表示重建圖像與清晰圖像的差值圖像。采用模糊圖像與其降采樣圖像作為字典學(xué)習(xí)的訓(xùn)練樣本,所得稀疏表示重建圖像與清晰圖像的差值圖像分別如圖1(c)和(d)所示。通過比較圖1(b),(c)和(d)可以看出,使用清晰圖像中的圖像塊訓(xùn)練字典,稀疏表示誤差最小,而與模糊圖像本身相比,采用其降采樣圖像中的圖像塊訓(xùn)練字典能夠有效降低稀疏表示誤差,使其更接近清晰圖像作為訓(xùn)練樣本的稀疏表示誤差。圖1直觀說明了圖像降采樣對清晰圖像稀疏表示字典學(xué)習(xí)的貢獻(xiàn)。
圖1 不同訓(xùn)練樣本的稀疏表示誤差比較Fig.1 Comparison of sparse representation errors from different training samples
另一方面,由圖1(b)可以看出,圖像中紋理或細(xì)節(jié)區(qū)域不容易稀疏表示,稀疏表示誤差較大,而灰度平坦區(qū)域的稀疏表示誤差較小。本文將灰度值變化較小的圖像塊稱為平坦塊,灰度值變化較大的圖像塊稱為紋理塊。在圖像模糊的過程中,隨著圖像模糊程度的增大,圖像中紋理塊逐漸平滑趨于平坦塊。
顯然,對于整幅圖像,模糊圖像的稀疏表示誤差更小,直接對整幅圖像利用稀疏表示先驗使目標(biāo)函數(shù)的解偏向于模糊圖像而不是清晰圖像。圖2(a)顯示了清晰圖像稀疏表示誤差小于模糊圖像稀疏表示誤差的區(qū)域,將該區(qū)域表示為Rc=由于紋理塊是指灰度變化明顯的圖像塊,通常圖像塊的尺寸很小,圖像塊的灰度變化基本上等效于鄰域內(nèi)的灰度變化,因此,紋理塊實際上與圖像邊緣的位置基本一致。圖2(b)和圖2(c)分別為清晰圖像和模糊圖像的邊緣圖像,模糊平滑了小尺寸結(jié)構(gòu),因而在模糊圖像中檢測不出小尺寸目標(biāo)的邊緣,并且小尺寸結(jié)構(gòu)的邊緣也不利于模糊核的估計[17]。然而,模糊使大尺寸結(jié)構(gòu)的邊緣變寬,使邊緣加寬的部分對應(yīng)的紋理塊的稀疏表示誤差更大,通過比較圖2(a)和圖2(c)可以看出,區(qū)域Rc與模糊圖像邊緣加寬的部分一致,僅在邊緣周圍清晰圖像的稀疏表示誤差小于模糊圖像的稀疏表示誤差。因此,本文僅對圖像中的紋理塊進(jìn)行稀疏表示正則化約束,使重建圖像偏向于清晰圖像。
圖2 清晰圖像稀疏表示誤差小于模糊圖像稀疏表示誤差的區(qū)域以及解釋Fig.2 Area where the sparse representation error from the sharp image is less than that from the blurred image and its explanation
由于僅在紋理塊上,清晰圖像的稀疏表示誤差小于模糊圖像的稀疏表示誤差,且圖像降采樣過程減弱圖像的模糊程度,使圖像塊中的邊緣更清晰。因此,本文提出了一種跨尺度字典學(xué)習(xí)的稀疏表示先驗,該先驗?zāi)P腿缦滤荆?/p>
其中:M為二值標(biāo)記矩陣,用于標(biāo)記紋理塊的位置,j∈M表示將本文提出的基于跨尺度字典學(xué)習(xí)的稀疏表示先驗限制在標(biāo)記矩陣M中值為1的紋理塊。采用模糊圖像的降采樣圖像作為字典學(xué)習(xí)的訓(xùn)練樣本,將跨尺度自相似性引入字典學(xué)習(xí)中,并且僅作用于圖像中的紋理塊,使稀疏表示重建圖像偏向清晰圖像。
在上一節(jié)提出的跨尺度字典學(xué)習(xí)的稀疏表示先驗?zāi)P突A(chǔ)上,本節(jié)給出了本文提出的盲解卷積算法的數(shù)學(xué)模型及其求解過程。
本文將跨尺度自相似性引入稀疏表示框架中,利用跨尺度字典學(xué)習(xí)的稀疏表示先驗作為正則化約束,提出的單幅圖像盲解卷積算法可表示為如下約束最優(yōu)化問題:
其中:y為模糊圖像,x為清晰圖像,h為模糊核,?={?x,?y}為圖像梯度算子,*表示卷積操作,D為自適應(yīng)字典為M中非零元素的個數(shù),λc,λg,λh為正則化參數(shù)。式(6)中第一項為數(shù)據(jù)保真項,保證復(fù)原結(jié)果符合圖像的降質(zhì)模型;第二項為跨尺度字典學(xué)習(xí)稀疏表示正則項,迫使重建圖像接近清晰圖像;第三項為梯度約束項,利用L2范數(shù)對圖像梯度進(jìn)行約束保證圖像邊緣的平滑性;第四項為模糊核的正則化約束項,保證了模糊核的平滑性。
為了加快算法收斂速度,以及大尺寸模糊核的處理,與目前大部分算法相同,本文通過構(gòu)建圖像金字塔模型由粗到細(xì)地估計清晰圖像和模糊核。本文在通過圖像金字塔逐層估計清晰圖像和模糊核的過程中,直接將圖像金字塔上一層估計的清晰圖像結(jié)果作為當(dāng)前層稀疏表示字典的訓(xùn)練樣本,利用K-SVD算法生成過完備字典。由于式(6)所示的目標(biāo)函數(shù)是非凸的,沒有閉合解,本文在金字塔的每一層上采用交替迭代求解的方法對式(6)進(jìn)行求解,即固定清晰圖像的估計x^k,求解模糊核h^k+1,再固定模糊核h^k+1,更新清晰圖像的估計x^k+1。每一次迭代,利用清晰圖像的估計x^k+1更新標(biāo)記矩陣M,通過對圖像塊進(jìn)行篩選,排除平坦塊對估計模糊核的影響。
3.2.1 篩選圖像塊
對當(dāng)前估計的清晰圖像x^k進(jìn)行邊緣檢測,本文利用Sun等[18]的邊緣檢測算法確定當(dāng)前估計清晰圖像x^k中的邊緣像素,邊緣像素對應(yīng)的圖像塊即為紋理塊,參與模糊核的估計。引入二值矩陣M用于標(biāo)記圖像中的邊緣像素,若當(dāng)前估計的清晰圖像x^k中某一像素為邊緣像素,則將M中該位置的元素賦值為1,否則賦值為0。由于本文僅將稀疏表示正則項限制在圖像的紋理塊,導(dǎo)致當(dāng)前估計的圖像x^k中平坦塊受到的約束較少,從而可能導(dǎo)致復(fù)原圖像的平滑區(qū)域含有較多的噪聲。為了減小噪聲對邊緣估計造成的干擾,本文首先對當(dāng)前估計的圖像x^k進(jìn)行高斯濾波,然后對濾波后的圖像進(jìn)行邊緣估計。
3.2.2 估計模糊核
對模糊核進(jìn)行更新,即固定x^k,更新h^k+1,此時目標(biāo)函數(shù)簡化為:
其中:⊙表示逐元素相乘,二值標(biāo)記矩陣M保證了在估計模糊核時,僅利用紋理塊,避免了平坦塊對模糊核估計的影響。這是因為圖像中并不是所有的圖像塊都能為圖像復(fù)原提供有效的附加信息。紋理塊對模糊核的估計起著關(guān)鍵的作用,而平坦塊對模糊核估計幾乎不起作用,例如若某一圖像區(qū)域的像素值為常數(shù),則該區(qū)域經(jīng)過模糊后的像素值仍為同一常數(shù),在該區(qū)域清晰圖像與模糊圖像完全相同,因此這一區(qū)域并不能為模糊核的估計提供有效的信息。
式(7)為關(guān)于h的二次函數(shù),因此存在閉合解,令式(7)對h的導(dǎo)數(shù)為零,可得式(8),在式(8)中,⊙表示相關(guān)運算。根據(jù)卷積定理可知,空域中圖像的卷積等效于傅里葉變換的頻域乘積,本文將式(8)轉(zhuǎn)換到頻域求解,如式(9)所示。
由式(9)可得h的閉合解,式(10)給出了閉合解的表達(dá)式,在式(10)中,F(xiàn)(·)表示傅里葉變換,表示傅里葉逆變換表示傅里葉變化的復(fù)共軛。公式(8)~(10)如下所示:
3.2.3 估計清晰圖像
由于式(11)中的稀疏表示系數(shù)αj依賴于方程的解x^k+1,因此,該式?jīng)]有閉合解。本文利用上一次對清晰圖像的估計x^k近似x^k+1進(jìn)行求解,對每一個圖像塊Qj x^k,利用OMP算法求解稀疏表示系數(shù),即求解如下約束最優(yōu)化問題:
通過對所有紋理塊的重建圖像塊Dαj進(jìn)行求和處理可得稀疏表示的重建圖像,即:
本文直接使用圖像金字塔上一層估計的清晰圖像作為當(dāng)前層稀疏表示字典的訓(xùn)練樣本,通過K-SVD算法求解式(4)生成字典D。由于降采樣版本的圖像塊邊緣更加清晰,與清晰圖像更加相似,將其作為訓(xùn)練樣本獲得的字典能夠更好地對清晰圖像進(jìn)行稀疏表示,在該字典下僅對圖像中的紋理塊進(jìn)行稀疏表示重建,能夠使重建圖像的邊緣接近清晰圖像的邊緣。
將式(11)表示為矩陣向量乘積的形式,則有:
其中:Δx,Δy∈RN×N分別為梯度算子?x,?y的矩陣形式,Hk+1為模糊核矩陣。令式(14)對X的導(dǎo)數(shù)為零,可得如下方程:
本文設(shè)置圖像塊的尺寸n=5×5,字典大小t=100,稀疏度約束T=4,由于真實模糊圖像的模糊核尺寸一般小于51×51,參照文獻(xiàn)[18]和文獻(xiàn)[8],若無特殊說明,本文實驗中模糊核的尺寸設(shè)置為51×51。降采樣因子a越小,降采樣模糊圖像中的圖像塊越清晰,但同時圖像塊的個數(shù)也越少,本文參照Michaeli等[8]將圖像金字塔之間的降采樣因子設(shè)置為4/3,在構(gòu)建金字塔模型時,若當(dāng)前層對應(yīng)的模糊核尺寸小于3×3,則停止降采樣的過程。
在Kohler數(shù)據(jù)集[19]的實驗中,將本文的算法與Krishnan等[6]、Pan等[9]、Chang等[15]和Anger等[7]的算法進(jìn)行比較。Kohler數(shù)據(jù)集[19]中的模糊圖像是由真實記錄的三維空間運動軌跡而合成的,包括4幅圖像,12個運動軌跡,共生成48幅模糊圖像。該數(shù)據(jù)集屬于非均勻模糊,上述算法均利用線性卷積模型對非均勻模糊進(jìn)行近似建模。為了公平比較,本文的算法也根據(jù)模糊程度的不同,將模糊核尺寸設(shè)置為51×51和151×151。Krishnan等[6]、Pan等[9]和Chang等[15]的結(jié)果是由作者本人提供,Anger等[7]的結(jié)果由作者提供的程序運行得到。
通過比較每一幅圖像的去模糊結(jié)果與沿著相機(jī)運動軌跡捕獲的199個未模糊圖像的峰值信噪比(Peak Signal to Noise Ratio,PSNR),將PSNR的最大值作為定量評估的指標(biāo)。復(fù)原圖像與真值圖像之間的PSNR越大,表明復(fù)原圖像與真值圖像越接近。
圖3 為各個算法在Kohler數(shù)據(jù)集[19]上PSNR的均值與標(biāo)準(zhǔn)差,從圖中可以看出,本文算法在四幅圖像上的平均PSNR均高于Krishnan等[6]、Chang等[15]和Anger等[7]的結(jié)果,在后兩幅圖像上的平均PSNR高于Pan等[9]的結(jié)果。即使該數(shù)據(jù)集中的前3幅圖像含有足夠多的暗像素,符合Pan等[9]所提出的暗通道先驗,本文的算法也達(dá)到了與Pan等[9]方法相當(dāng)?shù)慕Y(jié)果。此外,從圖中的垂直誤差條可以看出,本文的算法在四幅圖像上均取得了最小的標(biāo)準(zhǔn)差,從而說明本文的算法具有良好的魯棒性。
圖3 Kohler數(shù)據(jù)集PSNR的平均值與標(biāo)準(zhǔn)差Fig.3 Mean and standard deviation of PSNR on Kohler et al.′s dataset
在Kohler數(shù)據(jù)集[19]中編號1~7、12為小幅度運動軌跡(對應(yīng)小尺寸模糊核),編號8~11為大幅度運動軌跡(對應(yīng)大尺寸模糊核),分別對于大尺寸模糊和小尺寸模糊這兩種情形比較各個算法的復(fù)原結(jié)果。圖4比較了各個算法對大尺寸模糊復(fù)原的PSNR均值與標(biāo)準(zhǔn)差,從圖中可以看出,本文算法的平均PSNR明顯高于Krishnan等[6]、Pan等[9]、Chang等[15]、Anger等[7]的結(jié)果。圖5為各個算法對小尺寸模糊復(fù)原的PSNR均值與標(biāo)準(zhǔn)差,由圖中可見,本文的算法在第四幅圖像上取得了最高的平均PSNR;在前三幅圖像上的平均PSNR高于Krishnan等[6]、Chang等[15]的結(jié)果。根據(jù)圖4和圖5給出的結(jié)果可見,本文的算法能夠更好地解決大尺寸模糊核的復(fù)原,并且對于小尺寸模糊核也具有良好的復(fù)原效果和魯棒性。
圖4 Kohler數(shù)據(jù)集中編號8~11模糊對應(yīng)的PSNR平均值與標(biāo)準(zhǔn)差Fig.4 Mean and standard deviation of PSNR on blur numbered 8-11 from Kohler et al.′s dataset
圖5 Kohler數(shù)據(jù)集中編號1~7,12模糊對應(yīng)的PSNR平均值與標(biāo)準(zhǔn)差Fig.5 Mean and standard deviation of PSNR on blur numbered 1-7 and 12 from Kohler et al.′s dataset
圖6 各個算法對Kohler數(shù)據(jù)集中一幅大模糊圖像復(fù)原結(jié)果的比較Fig.6 Comparison of the results deblurred by various state-of-the-art methods on a severely blurred image from Kohler et al.′s dataset
圖6 比較了各個算法對Kohler數(shù)據(jù)集[19]中一幅大模糊圖像的復(fù)原結(jié)果,在每幅圖像的左上角為各個算法估計的模糊核。圖6(a)為模糊圖像,圖6(b)~(f)為Krishnan等[6]、Pan等[9]、Chang等[15]、Anger等[7]以及本文的算法對圖6(a)的復(fù)原結(jié)果,它們與真值圖像的PSNR分別為22.75,22.30,22.94,21.57和29.90。本文的算法達(dá)到最高的PSNR,估計出更準(zhǔn)確的模糊核,從而復(fù)原結(jié)果更接近真值圖像。
在真實模糊圖像實驗中,將本文的算法與Yan等[10]、Chang等[15]、Chen等[11]以及Anger等[7]的算法進(jìn)行比較。Yan等[10]、Chen等[11]和Anger等[7]的復(fù)原結(jié)果是由作者提供的程序運行得到,Chang等[12]的復(fù)原結(jié)果由作者直接提供。由于真實模糊圖像一般為非均勻模糊,上述算法均利用線性卷積模型近似建模非均勻模糊。
圖7 和圖8比較了各個算法對兩幅真實模糊圖像的復(fù)原結(jié)果,圖(a)為模糊圖像,圖(b)~(f)為Yan等[10]、Chang等[15]、Chen等[11]、Anger等[7]以及本文算法的復(fù)原結(jié)果,在每幅圖像的左上角為各個算法估計的模糊核,下方為圖像中局部區(qū)域的細(xì)節(jié)放大圖。從各個算法對圖7(a)的復(fù)原結(jié)果和細(xì)節(jié)放大圖可以看出,本文的算法能夠復(fù)原出更清晰的邊緣和細(xì)節(jié),同時減小了振鈴效應(yīng)。圖8(a)為低光照環(huán)境中獲取的真實圖像,當(dāng)光線不充足時圖像容易產(chǎn)生噪聲,從各個算法的復(fù)原結(jié)果和細(xì)節(jié)放大圖可以看出,Yan等[10]、Chang等[15]和Anger等[7]的復(fù)原結(jié)果均放大了噪聲并且存在明顯的振鈴效應(yīng),Chen等[11]減小了振鈴效應(yīng),但仍存在噪聲放大的情況,本文的算法能夠有效地抑制振鈴效應(yīng)以及噪聲,具有良好的魯棒性。
圖7 各個算法對一幅真實模糊圖像復(fù)原結(jié)果的比較Fig.7 Visual comparison with various state-of-the-art methods on one real-world photo
圖8 各個算法對另一幅真實模糊圖像復(fù)原結(jié)果的比較Fig.8 Visual comparison with various state-of-the-art methods on another real-world photo
本文提出了一種基于跨尺度字典學(xué)習(xí)的稀疏表示先驗?zāi)P?,將降采樣模糊圖像作為字典的訓(xùn)練樣本,并在該字典下對圖像中的紋理塊構(gòu)造稀疏表示正則化約束項,加入圖像盲解卷積的目標(biāo)函數(shù)中,使目標(biāo)函數(shù)的解偏向于清晰圖像。同時,在金字塔的逐層迭代中,將上一層估計的清晰圖像作為當(dāng)前層稀疏表示字典的訓(xùn)練樣本,在該字典下對圖像中的紋理塊進(jìn)行稀疏表示,進(jìn)一步減小稀疏表示誤差,使當(dāng)前估計的圖像更加接近清晰圖像。本文算法在Kohler數(shù)據(jù)集上復(fù)原結(jié)果的平均峰值信噪比為29.54 dB。大量模糊圖像上的實驗驗證了本文算法的有效性和魯棒性。