余 雷,滿家巨*,劉利剛
(1.湖南師范大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,中國長沙 410081;2.浙江大學(xué)數(shù)學(xué)系,中國杭州 310027)
圖像去噪問題是由觀測的退化圖像估計(jì)原圖像要求在有效去除噪聲的同時(shí)能保證圖像邊緣等重要特征.利用稀疏表達(dá)的思想進(jìn)行圖像去噪當(dāng)前受到研究者們的關(guān)注.該方法最初只是考慮了單一小波系數(shù)的稀疏性,并由此提出一系列收縮算法[1-2].文獻(xiàn)[3]利用冗余字典來保證移不變性質(zhì);文獻(xiàn)[4-6]以具有方向性的多尺度冗余變換如curvelet,contourlet,wedgelet,bandlet 作為字典的方法.這些算法均采用預(yù)先選取一組小波基作為字典.但是利用這些已知字典表示圖像缺乏自適應(yīng)性.目前比較流行基于學(xué)習(xí)的字典獲取方式,如文獻(xiàn)[7]中,作者進(jìn)行了兩組實(shí)驗(yàn):分別從大量自然圖像集和噪聲圖像本身學(xué)習(xí)出字典,均獲得較好的去噪效果.
一般利用貝葉斯方法求解圖像處理中的反問題時(shí),都會(huì)對(duì)圖像做一個(gè)先驗(yàn)假設(shè),例如圖像的空間平滑性、最大(小)熵或者在某些變換域稀疏等.文獻(xiàn)[8]提出利用稀疏表達(dá)進(jìn)行圖像上采樣,文中作者通過從自然圖像的高分辨率和低分辨率版本中成對(duì)采樣學(xué)習(xí)字典,最終得到圖像邊緣和細(xì)節(jié)得到較好恢復(fù)的上采樣結(jié)果.受該文獻(xiàn)啟發(fā),本文嘗試將自然圖像和其經(jīng)過預(yù)處理的噪聲圖像對(duì)作為樣本聯(lián)合訓(xùn)練構(gòu)造一種新的字典,再利用圖像在相應(yīng)字典上的稀疏分解達(dá)到去噪聲的目的.
匹配追蹤[9]和基追蹤[10]去噪算法的提出將圖像去噪問題轉(zhuǎn)換成圖像在冗余字典上的稀疏分解問題.通常圖像去噪算法處理的是受均值為零的高斯白噪聲污染的圖像,即希望從以下觀測圖像y 估計(jì)圖像的清晰版本:y=x+N(0,δ).文獻(xiàn)[7]提出的稀疏表示模型假設(shè)自然圖像可以被某一字典D 近似稀疏表示,即的解是稀疏的,其中‖α‖0表示向量α 中非0 元素的個(gè)數(shù).可以通過求解下式構(gòu)造最大后驗(yàn)概率估計(jì)以去除噪聲:
其中,T 由用字典D 稀疏表示圖像的準(zhǔn)確程度和圖像噪聲的標(biāo)準(zhǔn)差σ 決定.該優(yōu)化的求解可以采用諸如匹配追蹤(MP[9])、正交匹配追蹤(OMP[11])、基追蹤(BP[10])、梯度投影法(GPSR[12])、FOCUSS 等算法.因此便可以得到去噪圖像
基于稀疏分解的圖像去噪算法需要事先確定一個(gè)字典(即一組基或者一種變換),使得圖像在其上有足夠稀疏的表達(dá)系數(shù).用隨意選取的固定字典近似表示任意自然圖像精度很難保證.近年廣受關(guān)注的基于學(xué)習(xí)的字典獲取方法在一定程度上解決了這個(gè)問題.該方法從大量自然圖像經(jīng)過學(xué)習(xí)得到具有某種結(jié)構(gòu)特征的字典,本文稱之為單字典.從統(tǒng)計(jì)意義上來講,這種單字典中部分原子的線性組合可以表示任意一幅與訓(xùn)練樣本具有類似結(jié)構(gòu)特征的自然圖像.但是具體到某一幅圖像或者某一類特殊的應(yīng)用時(shí),其針對(duì)性不強(qiáng).考慮到圖像復(fù)原問題中總會(huì)涉及同一幅圖像的兩個(gè)版本,如果學(xué)習(xí)所得的字典能夠記錄兩個(gè)版本之間的對(duì)應(yīng)關(guān)系,那么從觀測圖像估計(jì)原圖將會(huì)具有更強(qiáng)的指向性,從而所估計(jì)的圖像也會(huì)在結(jié)構(gòu)上與原圖更加接近.
假定我們已經(jīng)搜集大量某種類型的無污染的自然圖像版本(下文簡稱X 版本),對(duì)其模擬噪聲干擾,再通過簡單空間濾波得到所有圖像的低質(zhì)量版本(下文簡稱Z 版本),然后通過這兩類圖像樣本聯(lián)合學(xué)習(xí)以獲得字典.由于濾波處理有一定的抑制噪聲的作用,但同時(shí)模糊了圖像細(xì)節(jié).因此我們預(yù)先提取低質(zhì)量圖像的結(jié)構(gòu)特征作為復(fù)原圖像結(jié)構(gòu)特征的近似估計(jì),以此建立低質(zhì)量與高質(zhì)量圖像之間的結(jié)構(gòu)關(guān)系.為此,采用式(1)的4 個(gè)特征提取算子對(duì)該Z 版本圖像進(jìn)行處理,即圖像庫中的每一幅X 版本圖像,其Z 版本在4 個(gè)特征提取算子的作用下得到4 幅相應(yīng)的圖像Zi1,Zi2,Zi3,Zi4.若在圖像Xi中以(i,j)為中心的鄰域內(nèi)采樣,那么應(yīng)該同時(shí)在相應(yīng)的4 幅圖像Zi1,Zi2,Zi3,Zi4中的相同位置采樣.與單字典學(xué)習(xí)方法類似,若要分別以干凈圖像和經(jīng)濾波處理的低質(zhì)量圖像為樣本學(xué)習(xí)字典,可以采用以下形式的優(yōu)化[27](文獻(xiàn)[13-14]證明了采用l1范數(shù)替換l0范數(shù)的合理性).
其中A,X 分別表示系數(shù)矩陣和樣本矩陣.本文采用如圖1 的采樣方式,將上述所有樣本順次連接,即將(2)(3)式統(tǒng)一成(4):
其中n,m 分別表示從不同版本圖像采集樣本的維數(shù).再利用K-SVD 算法求解該式,所得字典稱之為聯(lián)合字典.最后,按樣本的組合方式對(duì)該聯(lián)合字典進(jìn)行拆分得到兩個(gè)字典:Dclr,Dflt.由于此處所采用的樣本來自于高質(zhì)量圖像塊和相同位置低質(zhì)量圖像塊的4 幅結(jié)構(gòu)特征圖像的組合,一幅圖像相同位置應(yīng)該具有同樣的結(jié)構(gòu)特征.由字典的學(xué)習(xí)過程可知,字典本質(zhì)上是訓(xùn)練樣本更緊湊的一種表示形式.圖3 為本文訓(xùn)練所得的一個(gè)字典,可見其中包含指向不同方向的邊緣.因此,采用這種方式搜集樣本無疑可以幫助我們獲得對(duì)擁有某類結(jié)構(gòu)的圖像更準(zhǔn)確的表達(dá).而且不難發(fā)現(xiàn),通過一次訓(xùn)練獲得的這兩個(gè)字典不僅和單字典一樣具有某類圖像的結(jié)構(gòu)特征,更重要的是它們之間具有該類圖像不同版本之間的一種對(duì)應(yīng)關(guān)系.另外,聯(lián)合字典的學(xué)習(xí)過程表明一幅自然圖像的兩種版本X 和Z 被聯(lián)合字典表示時(shí)共用一組表示系數(shù).因此,當(dāng)已知圖像的Z 版本時(shí),可以先將其在相應(yīng)的字典Dflt上進(jìn)行稀疏分解,所得系數(shù)與同時(shí)訓(xùn)練所得字典Dclr組合即可作為對(duì)原圖的估計(jì).圖2 即為通過采用本文聯(lián)合訓(xùn)練方法獲得的一個(gè)字典的一部分.
圖1 聯(lián)合字典學(xué)習(xí)的采樣過程Fig.1 Sampling process of joint-dictionary
圖2 本文方法學(xué)習(xí)所得字典的Dclr部分Fig.2 A dictionary learnt with the method from this paper
現(xiàn)將多類型樣本的聯(lián)合字典訓(xùn)練算法總結(jié)如下:
(1)從不同版本的圖像采樣,初始化DC為高斯隨機(jī)矩陣,并將矩陣的每一列規(guī)范化;
(2)采用匹配追蹤算法求解下式,找到樣本C 在字典DC上的分解系數(shù)A:
(3)用K-SVD 算法求解以下優(yōu)化函數(shù),得到聯(lián)合字典DC:
(4)重復(fù)2,3 兩步直到系數(shù)收斂到一組穩(wěn)定值;
(5)按照樣本的組合方式對(duì)所得聯(lián)合字典進(jìn)行拆分,得到所需要的兩個(gè)字典,它們分別對(duì)應(yīng)于不同類型的圖像樣本.
獲得字典后,可以通過求解以下優(yōu)化獲得圖像在該字典上的稀疏分解系數(shù)α:
其中F 同樣是式(1)的4 個(gè)特征提取算子,需要保證處理方式與字典的訓(xùn)練過程一致.在實(shí)際操作中,為了避免優(yōu)化函數(shù)的規(guī)模過大,以一定大小的圖像塊為單位進(jìn)行估計(jì),最后再將結(jié)果拼接整合得到最終的復(fù)原圖像.如式(5)所示,在求每一個(gè)子圖像塊的表達(dá)系數(shù)時(shí)先對(duì)每一塊提取特征,這一處理也包含了當(dāng)前子塊的鄰域信息,所以部分重疊的依次處理圖像中的每個(gè)子塊后,它們能夠很好的兼容在一起.現(xiàn)將基于聯(lián)合字典的圖像去噪算法流程總結(jié)如下.
算法:
(1)輸入:離線訓(xùn)練的字典Dclr,Dflt以及噪聲圖像Y;
(2)對(duì)圖像Y 做簡單的濾波處理(本文分別采用了高斯濾波和雙邊濾波進(jìn)行測試)得到低質(zhì)量圖像Z;
(3)以掃描順序從左到右,從上到下部分重疊的依次選取圖像Z 中的每一個(gè)k×k 的子圖像塊zi(i=1,2,…,n)(n 是子圖總個(gè)數(shù)),通過優(yōu)化求得稀疏系數(shù)α;
(4)由xi=Dclrα,(i=1,2,…,n)得到對(duì)應(yīng)的子圖像塊x,并將其放入去噪圖像^X;
(5)重復(fù)3,4 兩步直到Z 中所有子圖像塊被處理完.輸出去噪圖像^X.
本實(shí)驗(yàn)中,采用文獻(xiàn)[8]中的圖像庫作為學(xué)習(xí)字典的訓(xùn)練集.分別采用高斯和雙邊濾波兩種處理方式得到Z 版本圖像,訓(xùn)練出相應(yīng)的兩組聯(lián)合字典.對(duì)于訓(xùn)練圖像采用以下參數(shù)獲取相應(yīng)的X 版本和Z 版本:高斯白噪聲選擇δ=25,高斯濾波處理的模板大小與選取的子圖像塊大小相同,本文所有實(shí)驗(yàn)都采用5×5 的子圖像塊,標(biāo)準(zhǔn)差為2(這個(gè)值越大平滑過后的圖像越模糊),雙邊濾波中控制顏色和距離的兩個(gè)參數(shù)分別取為3 和0.2.采用如圖1 的采樣方式,從該圖像訓(xùn)練集隨機(jī)采集100 000 組子圖像對(duì)樣本用于離線訓(xùn)練超完備子典.從計(jì)算時(shí)間和圖像質(zhì)量兩方面權(quán)衡,本實(shí)驗(yàn)字典的原子個(gè)數(shù)取512,即對(duì)應(yīng)于X 版本圖像的字典是25×512 的矩陣.表1 表示利用高斯濾波處理訓(xùn)練的字典和同樣的預(yù)處理方式進(jìn)行恢復(fù)結(jié)果.表2 表示利用雙邊濾波處理訓(xùn)練字典的恢復(fù)結(jié)果.兩種情況下,本文方法都比單純采用對(duì)應(yīng)的濾波方法恢復(fù)的結(jié)果好.
表1 測試結(jié)果(PSNR:dB)Tab.1 Testing result(PSNR:dB)
表2 測試結(jié)果(PSNR:dB)(δ 表示噪聲強(qiáng)度,σ 表示雙邊濾波的一個(gè)參數(shù),值越大圖像越平滑)Tab.2 Testing result(PSNR:dB)(δ is noise intensity,σ is a parameter of bilateral filtering,the bigger the image will be smoother)
在本實(shí)驗(yàn)有限的測試過程中,隨著噪聲強(qiáng)度的增大,通過調(diào)節(jié)濾波器的參數(shù)使其達(dá)到一定的平滑程度后,用本文方法恢復(fù)的去噪結(jié)果在PSNR 值上總可以比單純的使用濾波方法高,但是從視覺上可接受的程度來講,噪聲強(qiáng)度太大導(dǎo)致?lián)p失掉的信息太多,此時(shí)無論什么方法都無法恢復(fù)出視覺上可接受的結(jié)果.圖3 和圖4 分別展示了不同噪聲強(qiáng)度下利用高斯濾波作為預(yù)處理方法的去噪結(jié)果圖像.從矩形框標(biāo)記的部位可見本文方法在去噪的同時(shí)能夠比單純?yōu)V波更好的保持圖像細(xì)節(jié).圖3 和圖4 分別展示了不同噪聲強(qiáng)度下利用雙邊濾波作為預(yù)處理方法的去噪結(jié)果.可見當(dāng)噪聲干擾較大的時(shí)候,盡管雙邊濾波可以通過調(diào)整參數(shù)控制圖像的平滑程度,但過度平滑也是不可避免的,從而導(dǎo)致圖像失真,這種情況下本文方法比單純的雙邊濾波方法會(huì)使圖像顯得更加真實(shí).
圖3 第1 列表示δ=25 的噪聲圖像,第2 列表示高斯濾波的去噪結(jié)果,第3 列表示本文方法的去噪結(jié)果Fig.3 Column 1st are noisy images with δ=25,column 2nd are denoise results by gaussian filtering,column 3rd are denoise results from this page
圖4 第1 列表示δ=50 的噪聲圖像,第2 列表示σ=[3,0,3]的雙邊濾波去噪結(jié)果,第3 列表示本文方法的去噪結(jié)果Fig.4 Column 1st are noisy images with δ=50,column 2nd are denoise results by bilateral filtering with parameter[3,0,3],column 3rd are denoise results from this page
本文提出采用聯(lián)合字典學(xué)習(xí)的方法進(jìn)行圖像去噪.這種方法結(jié)合了字典訓(xùn)練能夠?qū)W習(xí)獲得圖像的結(jié)構(gòu)信息以及成對(duì)學(xué)習(xí)能夠獲取圖像對(duì)之間的相關(guān)性這兩者的優(yōu)點(diǎn).既能很好的提取圖像的結(jié)構(gòu)信息,同時(shí)學(xué)習(xí)得到的字典里包含的高、低質(zhì)量圖像對(duì)之間的關(guān)系也為我們提供了去噪圖像的先驗(yàn)知識(shí).從實(shí)驗(yàn)結(jié)果可見,本文方法在去噪的同時(shí)比單純的濾波方法能夠更好地保持圖像的真實(shí)性.在某種意義上比一些傳統(tǒng)的去噪算法更具優(yōu)勢(shì).本實(shí)驗(yàn)同樣啟發(fā)我們相信通過對(duì)圖像訓(xùn)練樣本更有針對(duì)性的設(shè)計(jì),本文方法同樣適用于其他類似圖像的復(fù)原問題.
[1]DONOHO D L,JOHNSTONE I M.Ideal spatial adaptation by wavelet shrinkage[J].Biometrika,1994,81(3):425-455.
[2]DONOHO D L.De-noising by soft thresholding[J].IEEE Trans Inf Theory,1995,41(3):613-627.
[3]COIFMAN R,DONOHO D L.Translation invariant de-noising[J].In Wavelets and Statistics,Lecture Notes in Statistics,1995,125-150.
[4]STARCK J L,CANDES E J,DONOHO D L.The curvelet transform for image denoising[J].IEEE Trans Image Proc,2002,11(6):670-684.
[5]ESLAMI R,RADHA H.Translation-invariant contourlet transform and its application to image denoising[J].IEEE Trans Image Proc,2006,15(11):3362-3374.
[6]MATALON B,ELAD M,ZIBULEVSKY M.Improved denoising of images using modeling of the redundant contourlet transform[J].it Presented at the SPIE Conf Wavelets,Jul,2005.
[7]ELAD M,AHARON M.Image denoising via sparse and redundant representation over learned dictionaries[J].IEEE Trans Image Proc,2006,15(12):3736-3745.
[8]YANG J,WRIGHT J,HUANG T,et al.Image super-resolution via sparse representation[J].IEEE Trans Image Proc,2010,19(11):2861-2873.
[9]MALLAT S,ZHANG Z.Matching pursuit in a time-frequency dictionary[J].IEEE Trans Signal Proc,1993,41:3397-3415.
[10]CHEN S S,DONOHO D L,SAUNDERS M A.Atomic decomposition by basis pursuit[J].Soc Ind Appl Math Rev,2001,43(1):129-159.
[11]PATI Y C,REZAIIFAR R,KRISHNAPRASAD P S.Orthogonal matching pursuit:Recursive function approximation with applications to wavelet decomposition presented at the 27th Annu[M].Asilomar Conf Signals,Systems,and Computers,1993.
[12]FIQUEIREDO M A T,NOWAK R D,WRIGHT S J.Gradient projection for sparse reconstruction:Application to compressed sensing and other inverse problem[J].IEEE J Selected Topics Signal Proc,2007,1(4):586-598.
[13]DONOHO D L.For most large underdetermined systems of linear equations,the minimal l1-norm solution is also the sparsest solution[J].Commun Pure Appl Math,2006,59(6):797-829.
[14]DONOHO D L.For most large underdetermined systems of linear equations,the minimal l1-norm near-solution approximates the sparsest near-solution[J].Commun Pure Appl Math,2006,59(7):907-934.