王治文 羅曉清 張戰(zhàn)成
摘要:針對當前各種圖像清晰度評價方法在清晰度判別過程中單調性和區(qū)分度不夠以及適用范圍較小的問題,提出了一種基于四元數(shù)小波變換(QWT)幅值與相位的圖像清晰度評價方法。該算法通過四元數(shù)小波變換將圖像從空間域變換到頻率域,對得到的四元數(shù)小波變換系數(shù)進一步計算之后獲得低頻子帶與高頻子帶的幅值與相位信息,求得低頻子帶幅值各方向的梯度之后與對應方向的相位相乘求和,最終得到兩個清晰度指標值。采用該算法與多種現(xiàn)有算法對不同內容的圖像、不同程度模糊的圖像以及含有不同程度噪聲的圖像進行清晰度評價實驗:相對于現(xiàn)有算法,所提算法在對上述多種圖像的清晰度評價中都保持著很好的單調性與區(qū)分度。實驗結果表明,所提算法不但克服了現(xiàn)有算法在單調性與區(qū)分度上的不足,而且所提清晰度評價指標可以應用在圖像處理中。
關鍵詞:
圖像處理;清晰度評價;四元數(shù)小波變換;幅值;相位;梯度
中圖分類號: TN911.73; TP391.413 文獻標志碼:A
0引言
隨著智能手機、數(shù)碼相機等數(shù)字成像技術的不斷發(fā)展,產生的圖像越來越多,如何有效地辨別圖像的清晰度逐漸受到了研究人員的廣泛關注。
圖像清晰度評價一般分為主觀評價和客觀評價兩類。人對圖像的主觀感受是對圖像最好的評價,但評價結果易受觀察者的主觀影響,所以人們轉而關注客觀清晰度評價。
目前為止,圖像的客觀清晰度評價方法主要有基于空域和頻域的評價方法。Krotkov[1]提出通過拉普拉斯能量和來反映圖像清晰度,但是它在判斷噪聲圖像的清晰度時存在著缺陷。針對這個問題,Subbarao等[2]提出用灰度圖像方差作為評價指標;緊接著,Subbarao等[3]又提出通過圖像梯度范數(shù)或梯度的衍生量來衡量圖像的清晰度,實現(xiàn)了噪聲圖像質量評價。但是這些指標在評價同一清晰度下的多幅圖像時效果一般。Wee等[4]提出基于圖像特征值與奇異值的清晰度評價方法,在精確度上面有了一定的提升。以上方法都是基于空域的方法,雖然計算速度快、實時性高,但它們對圖像清晰度的細小變化不敏感,并且不能準確區(qū)分模糊圖像,因此,研究人員提出了基于頻域的圖像清晰度評價方法。該類方法利用多尺度變換工具先把圖像轉換到頻域,然后再提取其特征以得到清晰度評價函數(shù)。常用的多尺度工具有離散小波變換(Discrete Wavelet Transform, DWT)、雙樹復小波變換(DualTree Complex Wavelet Transform, DTCWT)、輪廓波變換(Contourlet Transform, CT)、非下采樣輪廓波變換(NonSubsampled Contourlet Transform, NSCT)和四元數(shù)小波變換(Quaternion Wavelet Transform, QWT)等。Kautsky等[5]提出小波域內的清晰度評價算法,但也不能準確評價噪聲圖像;Tian等[6]提出小波域內針對小波系數(shù)統(tǒng)計特性的圖像清晰度評價算法,解決了模糊圖像評價的難題,得到了不錯的效果;Liu等[7]針對四元數(shù)小波變換的特點提出了一種基于QWT相位信息的圖像清晰度評價算法,精確度有了很大的提升,但是對同一清晰度下的多幅圖像評價時個別圖像的評價結果出現(xiàn)錯誤;周厚奎等[8]在NSCT域也提出了一個圖像清晰度算法,效果不錯;但是運算時間較長,實時性差。
近年來,隨著QWT的提出,針對QWT的研究越來越深入。QWT克服了實小波在平移不變性上的不足以及復小波缺少相位信息的缺陷。與實小波和復小波不同,QWT具有近似平移不變性以及豐富的相位信息。正是因為QWT的這些特性,研究人員都將QWT引入到自己的研究中。高直等[9]利用QWT進行紋理分類;徐永紅等[10]利用QWT做人臉識別的研究;殷明等[11]則將QWT用在了圖像去噪領域。基于以上現(xiàn)狀,本文提出了一種基于QWT幅值與相位信息的圖像清晰度評價算法。為了提取圖像豐富的紋理變化信息并克服現(xiàn)有清晰度判別方法適用范圍的局限性,本文將QWT幅值的梯度引入到QWT的相位譜中,進而計算得到清晰度。實驗結果表明,本文的清晰度指標效果與當前指標相比有了很大的提升。
1四元數(shù)小波變換
QWT是一個新興的圖像解析工具。圖像經四元數(shù)小波變換后能夠得到一個低頻子帶(LL子帶)與三個高頻子帶(LH、HL、HH子帶),每一個子帶都對應著一個幅值與三個相位。低頻子帶的幅值信息反映了源圖像的概貌,且具有近似平移不變性[13-14]。為了更好地說明QWT的分解形式,并考慮到DWT在頻域變換領域的代表地位,本文使用DWT與QWT對比。以標準圖像barbara.bmp為例,其經DWT和QWT的分解結果如圖1~52中所示。由圖2~5可知,QWT分解的低頻相位信息表現(xiàn)為三個方向的紋理信息,表示為(φ,θ,ψ),其中φ、θ、ψ分別表示頻分子帶在垂直、水平、對角的紋理信息。經過對不同圖像的多次實驗分析之后,發(fā)現(xiàn)源圖像的大部分輪廓及細節(jié)信息集中在四元數(shù)小波變換的高頻子帶。高頻子帶的幅值反映了圖像在特定方向的輪廓,像素在幅值中越明顯,其對應的相位也就越突出。幅值越大代表對應的像素點在圖像中的重要性越高,這個像素點越有可能處在紋理的變化結構中;而幅值越小則代表對應的像素點更有可能處于圖像的平滑區(qū)域中,并且對應相位的數(shù)值也越趨于不穩(wěn)定[15-16]。相比圖1,可以發(fā)現(xiàn)QWT分解模式比DWT分解更能充分地反映圖像的本質內容,因此,QWT是一種有效的圖像分解工具。
2基于幅值與相位的清晰度評價指標
圖像的清晰度評價是圖像處理的基礎研究內容??紤]到圖像的模糊、噪聲等都會導致圖像不清晰,并且會對圖像的邊緣或輪廓的顯著性產生影響,故本文以四元數(shù)小波變換為分解工具,研究其變換特性,以此設計新的、有效的清晰度評價指標。
圖像經過四元數(shù)小波變換之后得到LH、HL、HH三個高頻子帶和一個LL低頻子帶,每個子帶均由一個幅值與三個相位信息構成,分別從低頻與高頻部分提取圖像細節(jié)信息構建清晰度評價指標。首先,針對低頻子帶幅值計算其梯度信息,如圖63。
其中:PhaseLHhor代表四元數(shù)小波變換后LH子帶中水平方向的相位信息;PhaseHLver代表四元數(shù)小波變換后HL子帶中垂直方向的相位信息;PhaseHHdia代表四元數(shù)小波變換后HH子帶中對角方向的相位信息。圖像經過變換后得到的高頻子帶主要代表紋理信息。就紋理來說,水平方向的紋理主要體現(xiàn)在LH子帶的水平方向相位,垂直方向的紋理主要體現(xiàn)在HL子帶的垂直方向相位,對角方向的紋理主要體現(xiàn)在HH子帶的對角方向相位[15-16]。另外,QWT系數(shù)的能量主要存在于低頻的幅值中,而高頻的幅值中只存在小部分的能量,多次實驗證實在高頻的清晰度評價中如果采用高頻幅值的梯度作為權重,清晰度的評價效果一般。故為了體現(xiàn)出紋理最大化,MLMHP采用低頻幅值作為權重,按照與MLMP相似的計算方法求取清晰度。
本文提出了兩個清晰度評價指標,其中:MLMP是低頻幅值梯度的絕對值與低頻對應相位相乘的結果,MLMHP是低頻幅值梯度的絕對值與高頻對應相位相乘的結果,它們的值越大說明圖像越清晰。
3實驗分析
經過多次實驗探究,發(fā)現(xiàn)對待測圖像進行不同處理后,如加入不同方差的高斯模糊,或不同方差的高斯噪聲,或不同噪聲強度的椒鹽噪聲,各清晰度指標在評價時均能得到相似的實驗結果。為了便于說明,文中高斯模糊的方差均取為10,高斯噪聲的均值和方差均取為0和0.005,椒鹽噪聲的噪聲強度均設置為0.05。
為了驗證本文提出的圖像清晰度指標的有效性,設計了三類實驗:第一,對不同模糊程度圖像清晰度判別的測試實驗;第二,對不同內容圖像清晰度判別的測試實驗;第三,對不同模糊程度含噪聲圖像清晰度判別的測試實驗。與MH、ML一樣,MLMP和MLMHP中四元數(shù)小波變換分解層數(shù)為1層。為了驗證有效性,選擇方差M[2]1、圖像梯度的L1范數(shù)M[3]2、圖像梯度的L2范數(shù)M[3]3、圖像二階導數(shù)的L1范數(shù)M[17]4、圖像二階導數(shù)的L2范數(shù)M[17]5、基于小波的清晰度評價M[5]6、基于特征值的圖像清晰度評價M[3-4]7、基于NSCT的圖像清晰度評價M[8]8、基于小波域統(tǒng)計建模的圖像清晰度評價M[6]9和基于QWT相位的圖像清晰度評價(MH、ML)[7]作為比較對象。實驗用到的圖像都經過模板尺寸從[1×1]逐漸增大到[15×15]的高斯模糊,縱坐標為經過歸一化的各指標的相對值,起始點的縱坐標值都為1。本文實驗使用Matlab R2012b軟件,計算機采用64位的Windows 7專業(yè)版,安裝內存4GB,處理器Intel Core i34150。
3.1對不同內容圖像的評價
此實驗是為了驗證指標是否與圖像的內容有關。一般來說,內容無失真的圖像的清晰度是接近的,優(yōu)秀的圖像清晰度評價方法判別同一清晰度下的多幅圖像時應該能夠得到接近的結果。由于需要對多幅圖像進行評價,本文選擇了標準圖像“barbara.bmp”“clock.bmp”“goldhill.bmp”“l(fā)ena.png”作為評價對象,如圖74所示。由于實驗需要,對每一幅圖像進行了高斯模糊。高斯模糊的方差設置為10,模板大小從[1×1]、[3×3]一直增加到[15×15]。
為了便于觀察,將圖85中每一個指標的數(shù)據進行了歸一化,使得第一個值為1,且縱坐標的范圍固定為0到1。11個指標中M1和ML顯示出了明顯的不一致,有三條折線很密集,但是另外一條偏離很遠,說明這兩個指標對部分圖像的清晰度判別很準確,但是對某一類圖像卻顯示了不一樣的結果。這使得它們的評價效果不能獨立于圖像內容,縮小了它們的適用范圍。而另外9個指標的折線圖就顯示出了相對一致性,表明這些指標與圖像內容關聯(lián)較小,適用的圖像也相應較廣。值得注意的是在M2、M3、M4、M5、M6、M7、M8和M9的折線圖中,當模板尺寸由[1×1]變化為[3×3]時,指標值經歷了一個突變,而后變化則越趨平和,隨著模板尺寸的增大,它們的折線圖逐漸趨于水平直線,這會導致清晰度評價指標不能區(qū)分不同模糊程度的圖像。相對而言,MH、MLMHP和MLMP指標值保持著一個均勻的下降速度,但是MLMHP和MLMP折線更為緊密,所以這兩個指標更為精確。根據上述分析,本文提出的MLMHP指標和MLMP指標不依賴于圖像內容,對多幅無失真的圖像都得到類似的評價效果。
圖85同一模糊程度下不同內容圖像的清晰度指標評價結果正文中的模板尺寸為“[1×1]”“[3×3]”“[5×5]”,而圖5中的橫軸刻度值卻是某個具體數(shù)值,二者不一致,這是規(guī)范表達嗎?是否需要統(tǒng)一一下(或者更改圖5中橫軸坐標名稱的表述)。另外,圖8與其前面的一段文字描述也存在著類似問題,是否也需要調整下。
3.2對模糊圖像的評價
此實驗是為了驗證清晰度指標對不同模糊程度圖像是否有差異性。對于不同模糊程度的圖像,一個好的圖像清晰度評價方法應該是可以得到相對差異化的結果的,而且這種差異化越明顯越好。與第一個實驗不同,本節(jié)對標準圖像“barbara.bmp”及“goldhill.bmp”進行高斯模糊,高斯模糊的方差統(tǒng)一為10,模板尺寸大小由[1×1]、[3×3]一直增加到[15×15]。圖96和圖107即為經過人工模糊后的圖像,限于篇幅僅列出4種模糊等級。
圖118(a)是各清晰度指標對不同模糊程度barbara圖像的評價對比??梢园l(fā)現(xiàn),隨著高斯模糊模板尺寸的增加,所有指標都顯示出下降的趨勢。觀察M2、M3、M4、M5、M6和M9,它們的值在模板尺寸從[1×1]到[3×3]時都經歷了一個突降,但是接下來的變化就沒有那么明顯,這會導致這幾個指標在對模糊程度較高的圖像進行評價時不能體現(xiàn)出清晰度的差異性。另外,M7、M8和M1的曲線一直在均勻地下降,但是下降的速度比較慢,導致指標對模糊不太敏感。其余指標下降的速度都能由快變慢,其中MLMHP、MLMP和ML相對MH來說下降速度更快、更均勻,因此在圖像模糊程度遞增時能夠對模糊圖像的清晰度作出正確的判別。
圖128(b)是各清晰度指標對不同模糊程度goldhill圖像的評價對比。與圖118(a)的結果相似,隨著高斯模糊模板尺寸的增加,所有指標都顯示出下降的趨勢。M3、M4、M5、M6和M9在剛開始下降得太快,而M7和M8下降得太慢。另外,圖11和圖128(a)、(b)對比可以發(fā)現(xiàn),當對不同圖像進行評價,M2、ML和MH沒有保持一致的表現(xiàn),具體原因還待進一步研究。其余指標下降的速度都能由快變慢,其中MLMHP、MLMP和MH相對M2和ML來說下降速度更快更均勻,因此在圖像模糊程度遞增時能夠對模糊圖像的清晰度作出正確的判別。
3.3噪聲影響下不同模糊程度圖像的評價
此實驗是為了驗證清晰度指標是否能準確判斷噪聲圖像的清晰度。與3.2節(jié)實驗相似,本節(jié)對標準圖像“barbara.bmp”及“goldhill.bmp”進行實驗。為了構造噪聲模糊圖像,先對圖像進行不同程度的高斯模糊,再在每一幅圖像中加入均值為0、方差為0.005的高斯噪聲,得到用于本次實驗的圖像。如圖129~10圖號重新進行了調整,此時指代哪個圖,請明確。所示,從左至右分別是經過方差為10、模板尺寸分別為[1×1]、[5×5]、[9×9]、[13×13]的高斯模糊后,再對其加入均值為0、方差為0.005的高斯噪聲后的圖像。由圖139和圖1410可以看出從左至右圖像的細節(jié)越來越模糊,圖像的質量也是越來越差。
圖1511(a)顯示了各清晰度指標對經過處理的barbara圖像的評價曲線??梢院芮宄匕l(fā)現(xiàn):MH指標基本上沒有什么變化,而且在模板尺寸增大時指標值增加導致評價出現(xiàn)錯誤;M2、M3、M4、M5、M6、M8和M9的指標值在一個大幅度的下降之后都趨于不變,而且在某些地方還有輕微的上升,這說明它們對噪聲圖像的評價不準確,因此M2、M3、M4、M5、M6、M8和M9在噪聲下都無法準確評價圖像的清晰度。M7的下降速度太不穩(wěn)定,其值無法體現(xiàn)圖像的清晰程度。分析本實驗結果可知,ML、M1和本文提出的MLMHP和MLMP在噪聲環(huán)境下依然能夠作出準確的評價,并且在圖像的模糊程度加重時表現(xiàn)出均勻的下降。
圖1611(b)顯示了各清晰度指標對經過同樣處理的goldhill圖像的評價曲線。可以很清楚地發(fā)現(xiàn):在模板尺寸增大時,MH、M7、M4、M2、M8、M9、M5、M6和M3指標的值都出現(xiàn)過增加的情況導致評價出現(xiàn)錯誤;ML的下降速度不太穩(wěn)定,而M1下降速度太慢;只有MLMHP和MLMP的實驗結果比較準確。
圖1712和圖1813顯示了barbara和goldhill經過不同程度高斯模糊之后再加入椒鹽噪聲的圖像,其中椒鹽噪聲的噪聲強度設置為0.05。能看出,從左往右圖像的清晰度越來越差,到最后已經無法看出圖像的細節(jié)了。
利用各清晰度指標對圖1712中經過處理的barbara圖像進行評價之后的清晰度曲線如圖1914(a)所示。觀察可以發(fā)現(xiàn),MH、M9、M6、M5、M3、M2和M4都有不同程度的增長,這會導致在評價過程中出現(xiàn)錯誤;M7和M8下降的速度不穩(wěn)定,不能體現(xiàn)出圖像的清晰程度;M1、ML、MLMP和MLMHP能保持下降,并且下降速度比較穩(wěn)定,故能對清晰度作出準確的判別。
利用各清晰度指標對經過同樣處理的goldhill圖像進行評價之后的清晰度曲線如圖2014(b)所示。MH、M7、M6、M8、M5、M3、ML、M4和M2都出現(xiàn)了不同程度的增長,導致清晰度評價錯誤;M1和M9雖然保持著穩(wěn)定的下降速度,但是下降得太慢導致區(qū)分度不夠;MLMP和MLMHP能保持適當?shù)南陆邓俣?,并且下降速度比較穩(wěn)定,故能對清晰度作出準確的判別。
綜合分析上述實驗可以發(fā)現(xiàn),在極端條件下,其他的清晰度指標或出現(xiàn)錯誤或評價不準確,而本文提出的兩個指標MLMHP和MLMP依然能作出準確的評價,在所有清晰度指標中表現(xiàn)最好。
3.4各指標耗時實驗
為了驗證本文及其他頻率域的清晰度指標與空間域的清晰度指標在效率上的差異,并說明本文算法在實際應用中的可行性,本節(jié)對上述各指標進行了耗時實驗。表1是各指標多次實驗得到評價圖像的平均耗時,實驗中所有圖像均為256×256的標準灰度圖像,為了便于比較,表中數(shù)據皆保留小數(shù)點后6位。
表1中第1列和第2列是各個指標及其所屬類型,第3列至第5列是各清晰度指標評價一幅256×256的標準灰度圖像所耗費的平均時間,實驗的灰度圖像分為3種,分別為不同內容的待評價圖像(稱之為源圖像)、源圖像加入高斯模糊后的模糊圖像及源圖像在加入高斯模糊之后再加入高斯噪聲后的圖像。表中數(shù)據顯示,同一個指標在評價不同類型的圖像時消耗的時間基本保持一致。另外,因為空間域的指標M1、M2和M3對圖像評價時操作比較簡單,所以耗時是所有指標中最少的;而M4、M5和M7由于涉及對圖像的多次開窗處理,尤其是M5還需要進行矩陣相乘等復雜計算,故M4、M5和M7耗時要遠多于M1、M2和M3。同樣,頻率域指標M6將圖像轉換到小波域中后對小波系數(shù)的處理相對簡單,故其耗時在頻率域指標中是最少的,但是略多于M1、M2和M3;ML、MH、MLMHP和MLMP采用的是比小波變換更復雜的四元數(shù)小波變換,導致它們耗時都比M6多;而M8和M9將圖像轉換到頻率域之后,需要對頻域的各個子帶進行多次開窗等復雜處理,導致它們耗費的時間遠多于其他指標。
總的來說,在算法復雜度相似的情況下,頻域的清晰度評價指標花費的時間要略長于空間域的清晰度評價指標,其耗時與算法的復雜度成正比。本文提出的清晰度指標耗時都在可接受范圍內,實時性不錯,有很好的實際應用意義。
4結語
本文提出了一種新的基于四元數(shù)小波變換的圖像清晰度評價方法,通過四元數(shù)小波變換得到圖像的幅值與相位,并通過進一步計算得到兩個清晰度指標MLMP和MLMHP。實驗表明,MLMP和MLMHP與現(xiàn)有的清晰度指標相比,它們的效果不受圖像內容影響,對有著相似模糊程度的圖像以及模糊噪聲圖像的評價很準確,適用范圍更廣。進一步的工作將會從如何利用高層次的QWT高頻系數(shù)中展開,以得到更好的清晰度評價效果。
參考文獻:
[1]
KROTKOV E. Focusing [J]. International Journal of Computer Vision, 1987, 1(3): 223-237.
[2]
SUBBARAO M, CHOI T S, NIKZAD A. Focusing techniques [J]. Optical Engineering, 1992, 32(11): 2824.
[3]
SUBBARAO M, TYAN J. Selecting the optimal focus measure for autofocusing and depthfromfocus [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(8): 864-870.
[4]
WEE C, PARAMESRAN R. Image sharpness measure using eigenvalues [J]. Information Sciences, 2007, 177(12): 2533-2552.
[5]
KAUTSKY J, FLUSSER J, ZITOVA B, et al. A new waveletbased measure of image focus [J]. Pattern Recognition Letters, 2002, 23(14): 1785-1794.
[6]
TIAN J, CHEN L. Adaptive multifocus image fusion using a waveletbased statistical sharpness measure [J]. Signal Processing, 2012, 92(9): 2137-2146.
[7]
LIU Y, JIN J, WANG Q, et al. Phases measure of image sharpness based on quaternion wavelet [J]. Pattern Recognition Letters, 2013, 34(9): 1063-1070.
[8]
周厚奎,葛品森,馮海林.基于非下采樣Contourlet變換的顯微圖像清晰度評價算法[J].合肥工業(yè)大學學報(自然科學版),2014,37(10):1204-1209.(ZHOU H K, GE P S, FENG H L. Microimage definition evaluation algorithm based on nonsubsampled Contourlet transform [J]. Journal of Hefei University of Technology (Natural Science), 2014, 37(10): 1204-1209.)
[9]
高直,朱志浩,徐永紅,等.基于四元數(shù)小波變換及多分形特征的紋理分類[J].計算機應用,2012,32(3):773-776.(GAO Z, ZHU Z H, XU Y H, et al. Texture classification based on quaternion wavelet transform and multifractal characteristics [J]. Journal of Computer Applications, 2012, 32(3): 773-776.)
[10]
徐永紅,趙艷茹,洪文學,等.基于四元數(shù)小波幅值相位表示及分塊投票策略的人臉識別方法[J].計算機應用研究,2010,27(10):3991-3994.(XU Y H, ZHAO Y R, HONG W X, et al. Face recognition method based on quaternion wavelet magnitude/phase representation and block voting strategy [J], Application Research of Computers, 2010, 27(10): 3991-3994.)
[11]
殷明,劉衛(wèi).基于四元數(shù)小波變換HMT模型的圖像去噪[J].計算機工程,2012,38(5):213-215.(YIN M, LIU W. Image denoising based on HMT model of quaternion wavelet transform [J]. Computer Engineering, 2012, 38(5): 213-215.)
[12]
BAYROCORROCHANO E. The theory and use of the quaternion wavelet transform [J]. Journal of Mathematical Imaging and Vision, 2006, 24(1): 19-35.
[13]
殷明.四元數(shù)小波變換理論及其在圖像處理中的應用研究[D].合肥工業(yè)大學,2012:57-59.(YIN M. Quaternion wavelet transform theory and its application in image processing [D]. Hefei: Hefei University of Technology, 2012: 57-59.)
[14]
GINZBERG P, WALDEN A T. Matrixvalued and quaternion wavelets [J]. IEEE Transactions on Signal Processing, 2013,61(6):1357-1367.
[15]
SOULARD R, CARR P. Quaternionic wavelets for texture classification [J]. Pattern Recognition Letters, 2011, 32(13): 1669-1678.
[16]
WAI L C, HYEOKHO C. Coherent multiscale image processing using dualtree quaternion wavelets [J]. IEEE Transactions on Image Processing, 2008,17(7):1069-1082.
[17]
HUANG W, JING Z. Evaluation of focus measures in multifocus image fusion [J]. Pattern Recognition Letters, 2007, 28(4): 493-500.