聶棟棟 馬勤勇 馬利莊
①(燕山大學(xué)理學(xué)院 秦皇島 066004)
②(燕山大學(xué)信息科學(xué)與工程學(xué)院 秦皇島 066004)
③(上海交通大學(xué)計算機(jī)科學(xué)與工程系 上海 200240)
圖像縮放是圖像處理領(lǐng)域的一個基本問題,它通過改變圖像的分辨率適應(yīng)不同的顯示設(shè)備,滿足各類應(yīng)用需求?;趦?nèi)容感知的圖像適應(yīng)算法成為近年來圖像縮放領(lǐng)域的一個新的研究熱點(diǎn)[1?4],尤其是其中的線裁剪算法得到了眾多研究者的廣泛關(guān)注。該算法定義單像素寬的連續(xù)的近似水平或垂直的曲線為像素線路,然后根據(jù)圖像像素的重要性,提取對人視覺影響最小的像素線路,最后通過復(fù)制或刪除圖像中像素線路,調(diào)整圖像尺寸。算法最初由文獻(xiàn)[5]提出,文獻(xiàn)[6]將其擴(kuò)展到了3維時空域中對視頻圖像進(jìn)行處理。文獻(xiàn)[7]通過線性算法在圖像相鄰的行或列間建立完全匹配關(guān)系,加快了算法的處理速度。文獻(xiàn)[8]利用用戶提供的相對深度地圖,在線裁剪過程中實現(xiàn)對象的相互遮擋。文獻(xiàn)[9]通過利用雙向相似函數(shù)[10]在主顏色描述[11]及歐拉距離等基礎(chǔ)上定義圖像距離函數(shù),并將圖像線裁剪與圖像縮放算法相結(jié)合。還有不少學(xué)者通過將顯著性地圖、人臉檢測等[12,13]引入像素能量圖的計算,改進(jìn)算法處理效果。
本文提出了一種基于梯度矢量方向性分析的線裁剪算法,它通過對局部區(qū)域的圖像梯度矢量場進(jìn)行低通濾波,能更好地利用這類存在大量視覺冗余的隨機(jī)紋理區(qū)域,進(jìn)而更好地保護(hù)圖像的邊緣輪廓結(jié)構(gòu)等真正視覺關(guān)注的重點(diǎn)區(qū)域。此外,本文還提出了新的像素能量計算方法,它在提取行、列像素線路時,對像素的梯度矢量的x,y方向的梯度分量分別賦予不同的權(quán)值。實驗結(jié)果顯示,文中算法算法的處理結(jié)果在整體視覺效果上更好,能夠更好地保護(hù)視覺敏感的邊緣輪廓結(jié)構(gòu)。通過對算法處理后的目標(biāo)圖像和原圖像的完整性距離和一致性距離進(jìn)行分析,結(jié)果也顯示與其它幾種算法相比較,本文算法處理后的目標(biāo)圖像內(nèi)所保留的圖像信息最為完整,而且新引入的畸變也最小。
傳統(tǒng)線裁剪算法根據(jù)圖像梯度區(qū)分圖像像素對人類視覺感知的重要性,以此提取像素線路并進(jìn)行刪除、插入處理。
一般而言,假設(shè)源圖像大小為M×N,目標(biāo)圖像大小為M′×N,則線裁剪算法就需要提取條行像素線路。每條行像素線路的定義如下:
提取像素線路則根據(jù)像素線路上像素的能量和,優(yōu)先選擇能量較小的,即
提取到行像素線路后,若目標(biāo)圖像尺寸比原始圖像小,則刪除該像素線路就可以使圖像尺寸縮小一行。如此循環(huán)處理次即可獲得行數(shù)為M′的目標(biāo)圖像。若目標(biāo)圖像尺寸比原始圖像大,為了避免同時選中一條像素線路,則先記錄次提取的像素線路,再將這些像素線路拷貝后插入到圖像相應(yīng)位置就可以使圖像尺寸達(dá)到目標(biāo)。
當(dāng)需要縮小圖像寬度時,需要提取的就是列像素線路,其處理過程與行像素線路的類似,本文就不再贅述。
大量實驗顯示,以上線裁剪算法處理后的圖像容易產(chǎn)生如下問題:首先是由于所提取的像素線路過度集中在某個圖像區(qū)域,造成目標(biāo)圖像信息缺失,使圖像整體的視覺效果處理前后差異過大;其次是部分圖像邊緣結(jié)構(gòu)處容易產(chǎn)生視覺敏感的畸變。
鑒于以上問題,本文提出新的線裁剪算法。它利用線裁剪算法中被忽略的梯度矢量的方向性,即利用梯度矢量方向在不同圖像區(qū)域的不同表現(xiàn),以及不同梯度矢量方向在行列像素線路提取時產(chǎn)生的視覺影響也不同這兩個特點(diǎn),改善圖像的處理效果。
研究發(fā)現(xiàn),當(dāng)線裁剪算法所提取的像素線路過度集中在某個圖像區(qū)域時,并不完全是因為只有該區(qū)域存在大量視覺冗余信息,更可能是因為其它視覺冗余區(qū)域存在有較雜亂的紋理細(xì)節(jié),使得算法誤認(rèn)為這些區(qū)域也是視覺關(guān)注的重點(diǎn)。注意到這類紋理區(qū)的梯度大小雖然會相對較大,但梯度方向卻非常雜亂。因此本文算法提出對圖像的梯度矢量場進(jìn)行低通濾波,以消除這些紋理區(qū)域?qū)ο袼刂匾杂嬎愕挠绊?。具體公式如下:
其中G為濾波后的梯度矢量場,?Iy, ?Ix和Gx,Gy分別表示低通濾波前后x,y方向的梯度值;*表示2維卷積運(yùn)算;F為低通濾波器,考慮到算法復(fù)雜性,本文采用簡單的2維均值濾波器,其大小取經(jīng)驗值為5×5。
需要說明的是本文通過Sobel算子計算圖像梯度。因此,對于灰度圖像:
其中H為Soble算子,?Ix表示Soble算子提取的灰度圖(亮度圖)上的x方向梯度值;
而且對于彩色圖像,考慮到彩色圖像轉(zhuǎn)換成灰度圖像后必然會損失部分信息,本文直接在RGB彩色圖像上提取像素梯度信息。對于彩色圖像:
其中Ir,Ig,Ib分別表示彩色圖像的紅、綠、藍(lán)3分量;表示Soble算子提取的相應(yīng)分量上x方向的梯度值。
需要注意的是,本文采用Matlab中的x,y坐標(biāo)方向,即x坐標(biāo)表示垂直(行)方向與y坐標(biāo)方向表示水平(列)方向。
與的計算類似,就不再重復(fù)說明了。
本文算法對圖像整體視覺效果的保護(hù),如圖1所示??梢钥闯?,由于梯度矢量的低通濾波削弱了近處大片紋理區(qū)的視覺重要性,使像素線路的提取更為合理,本文算法的整體視覺效果與原圖更相似。
研究還發(fā)現(xiàn),線裁剪算法所提取的像素線路在穿過不同梯度方向的邊緣后,對視覺效果造成的影響明顯不同。比如,當(dāng)行像素線路在穿過水平走向的邊緣后,會造成該邊緣的左右兩段發(fā)生顯著錯位,這是人類視覺感知非常敏感的圖像畸變。而在行像素線路在穿過垂直走向的邊緣后,雖然會改變該邊緣的高度,但這種變化很難被視覺感知。同樣,在列像素線路提取時也存在類似的情況。
這就說明,像素的重要性不僅取決于該像素梯度矢量的大小,同時與其梯度矢量的方向也有關(guān)。因此,本文對式(3)定義的像素能量函數(shù)進(jìn)行修改,使算法在提取行列像素線路時,分別采用不同的像素能量計算公式:
其中ex,ey分別對應(yīng)于提取行、列像素線路時的像素能量;w1,w2為經(jīng)驗權(quán)值,一般取w1=w2= 0 .8。
在新的像素能量計算基礎(chǔ)上,算法根據(jù)式(2)提取累積能量最小的像素線路,再通過刪除或復(fù)制像素線路改變原圖像的尺寸,生成合適的目標(biāo)圖像。
本文算法實驗是在PC機(jī)上的Matlab環(huán)境下進(jìn)行的,并著重與文獻(xiàn)[5],文獻(xiàn)[6]和文獻(xiàn)[12]的算法進(jìn)行了對比。為了表述的方便,本文分別以ASC, RSC,SSC表示這3種算法。
圖2,圖3顯示了本文算法與ASC, RSC, SSC算法的比較。從中可以看出,本文算法的處理結(jié)果視覺效果要明顯好于其它3種算法。如圖2中白鶴伸開的翅膀以及圖3中蘑菇的傘蓋部分其它3種算法處理后都產(chǎn)生了明顯的畸變,而本文算法的處理則保留了與原圖相似的輪廓結(jié)構(gòu)。
圖4顯示了本文算法對其它圖像的處理結(jié)果。從中可以看出本文算法可以更好地利用圖中的草地、樹林等視覺相對冗余的信息,進(jìn)而更好地保護(hù)圖像中視覺更重要的區(qū)域,如圖4(a)中的小房及樹,4(b)中的溪流,4(c)中的椰子樹。
為了客觀地衡量算法處理后的目標(biāo)圖像與原始圖像間的視覺相似性距離,實驗采用了圖像的完整性距離和一致性距離這兩個指標(biāo)。分別用于分析原圖像中信息在處理后的目標(biāo)圖像中是否被完整保留以及目標(biāo)圖像中的信息是否和原圖像一致(產(chǎn)生畸變的程度)。具體定義如下:
圖1 本文算法與文獻(xiàn)中算法對圖像整體視覺效果保護(hù)的比較
圖2 本文算法對白鶴圖的處理結(jié)果((a)為原始圖像,(b), (c), (d), (e)分別表示ASC, RSC, SSC以及本文算法對原圖寬度縮小后的處理結(jié)果,(f), (g), (h), (i)分別表示ASC, RSC, SSC以及本文算法對原圖高度縮小后的處理結(jié)果)
圖3 本文算法對黃蘑菇圖的處理結(jié)果((a)為原始圖像,(b), (c), (d), (e)分別表示ASC, RSC, SSC以及本文算法對原圖寬度縮小后的處理結(jié)果,(f), (g), (h), (i)分別表示ASC, RSC, SSC以及本文算法對原圖高度縮小后的處理結(jié)果)
圖4 本文算法對其它圖像處理結(jié)果(第1行為原始圖像,第2, 3, 4, 5行分別表示ASC, RSC, SSC以及本文算法的處理結(jié)果)
其中S,T分別表示原圖像和目標(biāo)圖像;表示完整性距離,表示一致性距離;P,Q分別表示原圖像和目標(biāo)圖像中的圖像塊;D(P,Q)表示多分辨率分析下兩圖像塊的歐拉距離的最小值;Ns,NT表示原圖像和目標(biāo)圖像的圖像塊數(shù)目。圖5給出了實驗中當(dāng)所刪除的像素線路占原圖比例的逐漸增加后,本文算法,ASC, RSC, SSC算法的處理結(jié)果與原圖像的相似性距離變化的曲線。從中可以看出,隨著所刪除的像素線路占原圖比例越來越大,4種算法的完整性距離和一致性距離都逐漸增大,但相比其它3種算法,本文算法在增長趨勢上明顯較緩。這也說明需要提取較多的像素線路時,本文算法處理后的圖像與原圖像的完整性距離、一致性距離比其它3種算法都要小,即本文算法生成的目標(biāo)圖像對原圖像的信息保存最為完整,新引入的圖像畸變最小。
圖5 ASC, RSC, SSC以及本文算法處理結(jié)果的相似性距離隨像素線路占原圖比例變化的曲線
本文重點(diǎn)考慮了之前線裁剪算法中被忽略的梯度矢量的方向性,提出了一種基于梯度矢量方向性分析的線裁剪算法。實驗通過主、客觀兩方面的分析,顯示相比其它幾種算法,本文算法處理后的目標(biāo)圖像與原始圖像整體視覺效果更加接近,圖像邊緣輪廓等細(xì)節(jié)保護(hù)的也較好。
[1] Kim Jun-Seong, Jeong Seong-Gyun, Joo Younghun,et al..Content-aware image and video resizing based on frequency domain analysis [J].IEEE Transactions on Consumer Electronics, 2011, 57(2): 615-622.
[2] Wang Shu-fan and Lai Shang-hong. Compressibility-aware media retargeting with structure preserving[J].IEEE Transactions on Image Processing, 2011, 20(3): 855-865.
[3] 施美玲, 徐丹. 主體大小能控的內(nèi)容感知圖像縮放[J]. 計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報, 2011, 23(5): 915-922.Shi Mei-ling and Xu Dan. A prominent object size adjustable method for content-aware image resizing[J].Journal of Computer-Aided Design&Computer Graphics, 2011, 23(5):915-922.
[4] 雷勵星. 基于混合能量的內(nèi)容敏感圖像縮放新方法[J]. 計算機(jī)學(xué)報, 2010, 33(10): 2016-2021.Lei Li-xing. Content-aware image resizing based on hybrid energy[J].Chinese Journal of Computers, 2010, 33(10):2016-2021.
[5] Avidan S and Shamir A. Seam carving for content-aware imageresizing [J].ACM Transaction on Graphics, 2007, 26(3):Article No.10.
[6] Rubinstein M, Shamir A, and Avidan S. Improved seam carving for video retargeting [J].ACM Transaction on Graphics, 2008, 27(3): Article No.16.
[7] Huang Hua, Fu Tian-Nan, Rosin P L,et al.. Real-time content-aware image resizing[J].Science in China Series F:Information Sciences, 2009, 52(2): 172-182.
[8] Mansfield A, Gehler P, Gool L,et al.. Scene carving: scene consistent image retargeting[C]. Proceedings of the 11th European Conference on Computer Vision: Part I. Heidelberg:Springer, 2010: 143-156.
[9] Dong Weiming, Zhou Ning, Paul J C,et al.. Optimized image resizing using seam carving and scaling[J].ACM Transactions on Graphics, 2009, 28(5): Article No.125.
[10] Simakov D, Caspi Y, Shechtman E,et al.. Summarizing visual data using bidirectional similarity[C]. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, Los Alamitos: IEEE Computer Society Press,2008: 1-8.
[11] Min Rui and Cheng H D. Effective image retrieval using dominant color descriptor and fuzzy support vector machine[J].Pattern Recognition, 2009, 42(1): 147-157.
[12] Achanta R and Susstrunk S. Saliency detection for content-aware image resizing[C]. Proc of IEEE ICIP’09,Piscataway, NJ, IEEE, 2009: 1005-1008.
[13] Chen Jianhui, Miao Lanfang, and Liu Xinguo. Balanced energy for content-aware image resizing [C]. Proc of 3rd IEEE International Conference on Ubi-media Computing,Piscataway, NJ, IEEE, 2010: 24-29.