摘要:票據(jù)圖像是一種廣泛應(yīng)用于人們生活及工作的圖像,由于票據(jù)圖像中主要包含文字、數(shù)字及線條等信息,其細(xì)節(jié)和邊緣信息極其重要。一般的壓縮方法,如JPEG壓縮,已經(jīng)不適用于票據(jù)圖像的壓縮,會(huì)造成邊緣細(xì)節(jié)信息的損失。因此針對(duì)票據(jù)圖像的特殊性,經(jīng)過(guò)顏色聚類和多分辨率分解后,應(yīng)用改進(jìn)的零樹(shù)編碼進(jìn)行壓縮編碼。實(shí)驗(yàn)結(jié)果表明,該文方法比JPEG壓縮標(biāo)準(zhǔn)具有更高的壓縮比和更好的圖像閱讀質(zhì)量。
關(guān)鍵詞: 票據(jù)圖像;多分辨率分解;零樹(shù)編碼;JPEG壓縮標(biāo)準(zhǔn);邊緣細(xì)節(jié)信息
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)16-3856-03
票據(jù)圖像作為人們生活和工作中廣泛應(yīng)用的圖像,在許多多媒體系統(tǒng)中都需要存儲(chǔ)和傳輸?shù)?,例如醫(yī)院信息系統(tǒng)和電子金融管理系統(tǒng)。長(zhǎng)期以來(lái),數(shù)字圖像壓縮編碼技術(shù)主要采用JPEG壓縮標(biāo)準(zhǔn)[1]來(lái)進(jìn)行壓縮。對(duì)于一般的自然圖像來(lái)說(shuō),JPEG壓縮標(biāo)準(zhǔn)在保證圖像質(zhì)量的前提下具有較高的壓縮比。但是對(duì)于JPEG壓縮標(biāo)準(zhǔn)中主要利用離散余弦變換DCT(Discrete Cosine Transform, DCT)技術(shù)完成圖像的變換編碼,然而經(jīng)過(guò)DCT處理的圖像編碼在大的壓縮比下存在著嚴(yán)重的塊狀效應(yīng),這非常不利于票據(jù)圖像的壓縮及存儲(chǔ)。因?yàn)槠睋?jù)圖像中包含了豐富的邊緣細(xì)節(jié)信息,這些都是票據(jù)圖像中的重要信息,需要完整的保留下來(lái)。所以出現(xiàn)了一些基于二值化分割算法來(lái)獲得高的壓縮比[2-6],但是這些方法不僅要面對(duì)圖像分割的挑戰(zhàn),而且有時(shí)對(duì)圖像重要的信息在壓縮以后已經(jīng)丟失了。
為此,該文通過(guò)對(duì)Shapiro提出的嵌入式零樹(shù)小波編碼算法EZW(Embedded Zerotree Wavelet, EZW)[7]分析的基礎(chǔ)上,實(shí)現(xiàn)了針對(duì)票據(jù)圖像的零樹(shù)編碼,并進(jìn)行了仿真試驗(yàn),仿真結(jié)果與JPEG壓縮標(biāo)準(zhǔn)作了比較,在大的壓縮比下,票據(jù)圖像的邊緣細(xì)節(jié)信息得以保留,保證了閱讀質(zhì)量。
1 算法設(shè)計(jì)
本文方法是是針對(duì)票據(jù)圖像進(jìn)行壓縮編碼,票據(jù)圖像與普通自然圖像有著明顯的區(qū)別,因此首先要了解票據(jù)圖像有如下特點(diǎn):
1)票據(jù)圖像顏色單一,從視覺(jué)效果上,一幅票據(jù)圖像有4-5種顏色就可以顯示整幅圖像的信息。
2)票據(jù)圖像在一個(gè)小區(qū)域內(nèi)像素顏色一致(不包括背景顏色)。
3)票據(jù)圖像存在著大面積的背景區(qū)域。
根據(jù)票據(jù)圖像特點(diǎn)(1)和(2),可以將票據(jù)圖像進(jìn)行顏色聚類,得到調(diào)色板和顏色位圖。每幅顏色位圖代表調(diào)色板中的一種顏色,而顏色位圖可以用一幅二值圖像來(lái)表示,黑色代表背景,白色代表前景,即前景信息就是原始圖像中代表該顏色的信息。根據(jù)特點(diǎn)(3),可以判斷出每幅位圖中都包含大面積的背景區(qū)域,對(duì)每幅顏色位圖進(jìn)行二值圖像的多分辨率分解得到金字塔結(jié)構(gòu)圖,在分析EZW算法的基礎(chǔ)上對(duì)每幅位圖的金字塔結(jié)構(gòu)圖進(jìn)行改進(jìn)的零樹(shù)編碼。在解碼端,根據(jù)解碼得到的金字塔結(jié)構(gòu)圖,重構(gòu)顏色位圖,根據(jù)對(duì)應(yīng)調(diào)色板的顏色得到解壓縮的圖像。
1.2 改進(jìn)的零樹(shù)編碼
EZW方法是基于小波變換之后進(jìn)行編碼的,經(jīng)過(guò)小波變換后的圖像具有多分辨特性,EZW算法就是利用不同分辨率子帶中同一空間位置的數(shù)據(jù)構(gòu)成一棵樹(shù),利用樹(shù)中的低頻數(shù)據(jù)的幅度值大、高頻數(shù)據(jù)的幅度值小的特點(diǎn),生成零樹(shù),從而達(dá)到壓縮的目的。
原始位圖經(jīng)過(guò)多分辨率分解后的金字塔結(jié)構(gòu)圖,在不同分辨率層級(jí)中同一空間位置的數(shù)據(jù)具有相關(guān)性。以圖3所示的金字塔結(jié)構(gòu)圖為例,將金字塔結(jié)構(gòu)中最低分辨率層級(jí)中的每個(gè)像素點(diǎn)作為“父親”,那么該分辨率層級(jí)上每個(gè)像素點(diǎn)都有4個(gè)“兒子”存在于下一分辨率層級(jí),在最高分辨率層級(jí)中有16個(gè)“孫子”。根據(jù)原始位圖多分辨分解算法,可以得知其金字塔結(jié)構(gòu)圖中不同分辨率層級(jí)中同一空間位置的數(shù)據(jù)有如下特點(diǎn):
1)每個(gè)分辨率層級(jí)中的“1”,其子孫后代全為0;
2)每個(gè)分辨率層級(jí)中的“0”,其子孫后代中可能全為0或者含有1。
EZW算法中從最低分辨率的系數(shù)開(kāi)始掃描,判斷掃描到的系數(shù)是否為“正顯著系數(shù)”、“負(fù)顯著系數(shù)”、“零樹(shù)跟”和“孤立零點(diǎn)”,然后進(jìn)行編碼輸出。因此,根據(jù)EZW的編碼思想及上述特點(diǎn),改進(jìn)的零樹(shù)編碼算法如下:
1)掃描整個(gè)金字塔結(jié)構(gòu)圖,按照自上至下,自左至右的順序掃描;
2)若掃描到“1”,則認(rèn)為該點(diǎn)為正的零樹(shù)跟,標(biāo)記其子孫節(jié)點(diǎn)都無(wú)需掃描編碼,將該點(diǎn)編碼為“p”;
3)若掃描到“0”,判斷其子孫節(jié)點(diǎn)是否全為0。
① 若其子孫節(jié)點(diǎn)全為0,則認(rèn)為該點(diǎn)為負(fù)的零樹(shù)跟,標(biāo)記其子孫節(jié)點(diǎn)都無(wú)需掃描編碼,將該點(diǎn)編碼為“t”;
② 若其子孫節(jié)點(diǎn)有1,則認(rèn)為該點(diǎn)為孤立零點(diǎn),編碼為“z”。
2 實(shí)驗(yàn)驗(yàn)證
為了檢驗(yàn)本文對(duì)于票據(jù)圖像的壓縮編碼算法,本小節(jié)對(duì)票據(jù)圖像分別進(jìn)行了本文的壓縮編碼算法和JPEG壓縮編碼,并給出實(shí)驗(yàn)結(jié)果對(duì)比。為了驗(yàn)證本文算法的有效性,同時(shí)給出了二者之間峰值信噪比、視覺(jué)效果和細(xì)節(jié)保留的對(duì)比。
3 結(jié)束語(yǔ)
本文研究了一種針對(duì)票據(jù)圖像有效的壓縮編碼算法。首先,針對(duì)票據(jù)圖像的特殊性進(jìn)行了預(yù)處理,其次對(duì)零樹(shù)編碼進(jìn)行了改進(jìn)以適用于票據(jù)圖像的編碼,不僅僅提高了壓縮比,而且還保留了票據(jù)圖像中重要的邊緣細(xì)節(jié)信息。實(shí)驗(yàn)表明,該文方法在同等壓縮比下,解壓縮后的圖像在峰值信噪比和視覺(jué)效果上,尤其是在邊緣細(xì)節(jié)信息的保留上都要優(yōu)于JPEG壓縮標(biāo)準(zhǔn)。
參考文獻(xiàn):
[1] http://www.jpeg.org/jpeg/index.html[S].
[2] Shapiro, J.M.: ‘Embedded image coding using zerotrees of wavelets coef?cients’[J].IEEE Trans. Signal Process., 1993, 41:3445–3462.
[3] Howard P G.Text image compression using soft pattern matching[J]. The Computer Journal, 1997(40):146-156.
[4] Seropian A, Vincent N.Writers authentication and fractal compression[J].Proceedings.8th International Workshop on Frontiers in Handwriting Recognition,2002:434-439.
[5] Howard P G.Lossless and lossy compression of text images by soft pattern matching[J].Proceedings Data CompressionConference, 1996:210-219.
[6] Ye Y, Cosman P.Fast and memory efficient text image compression with JBIG2”[J].IEEE Transactions on Image Processing, 2003, 12(8):944-956.
[7] Y. Ye, and P. Cosman, “Dictionary design for text image compression with JBIG2”[J].IEEE Transactions on Image Processing, 2001, 10(6):818-828.
[8] 楊萬(wàn)全.二值圖像的金字塔表示和最佳級(jí)聯(lián)方塊編碼[J].四川大學(xué)學(xué)報(bào):自然科學(xué)版,1992, 29(4):504-508.