梁國茂,楊光,李川
摘 要:數(shù)據(jù)壓縮是通過改變信息的表示方式,在有限的信息空間中表示盡可能多的信息。在信息設(shè)備容量有限的前提下,數(shù)字圖像壓縮技術(shù)對于數(shù)字圖像信息在網(wǎng)絡(luò)上實現(xiàn)快速傳輸和實時處理具有重要的意義。本文論述了數(shù)字圖像壓縮的必要性、可行性以及壓縮原理;介紹了幾種基本的數(shù)字圖像壓縮算法的思想和算法實現(xiàn)。
關(guān)鍵詞:數(shù)字圖像壓縮;理論研究;算法;壓縮編碼
現(xiàn)代圖像和多媒體通信業(yè)務(wù)的發(fā)展需要大量地存儲、記錄和傳輸各類靜止圖像和活動圖像,而圖像和視頻信號數(shù)字化具備許多在模擬信號條件下所不具備的優(yōu)點,諸如:數(shù)字傳輸質(zhì)量顯著高于模擬傳輸質(zhì)量;數(shù)據(jù)形式易于加密,提高信息安全性;數(shù)字電路易于大規(guī)模集成;數(shù)字設(shè)備可靠性高、維護簡便等。但是,任何事物都有兩面性,數(shù)字化在提供諸多優(yōu)點的同時也帶來了一些問題,其中最主要的問題是信號數(shù)字化后數(shù)據(jù)量太大,數(shù)碼率太高,占用頻帶太寬,直接傳輸對信道利用很不經(jīng)濟,存儲則占用巨大的存儲容量等。
如何妥善處理圖像和視頻信號數(shù)字化后的數(shù)據(jù)壓縮問題,在保證圖像質(zhì)量的前提下,用最少的數(shù)碼或最低的數(shù)碼率實現(xiàn)各類數(shù)字圖像和視頻信息的存儲、記錄和傳輸,達到優(yōu)質(zhì)、經(jīng)濟、可靠的要求,也就成為多媒體信息處理中的關(guān)鍵技術(shù)之一。
1 圖像數(shù)字壓縮的必要性和可能性
圖像信號可以壓縮的依據(jù)有兩個,一方面是圖像信號中存在大量冗余度可供壓縮,并且這種冗余度在解碼后還可無失真地恢復(fù);另一方面是可以利用人的視覺特性,在不被主觀視覺察覺的容限內(nèi),通過減少信號的精度,以一定的客觀失真換取數(shù)據(jù)壓縮。
圖像信號的冗余度存在于結(jié)構(gòu)和統(tǒng)計兩方面。圖像信號結(jié)構(gòu)上的冗余度表現(xiàn)為很強的空間(幀內(nèi)的)和時間(幀間的)相關(guān)性;信號統(tǒng)計上的冗余度來源于被編碼信號概率密度分布的不均勻。充分利用人的視覺特點,挖掘潛力,是實現(xiàn)數(shù)碼率壓縮的又一重要途徑。
2 圖像壓縮信源編碼過程
圖像和視頻信源編碼的整個過程一般由以下三個步驟完成:
(1)對表示信號的形式進行某種映射,即變換描寫信號的方式。通過這種映射解除或削弱存在于圖像信號內(nèi)部的相關(guān)性,降低其結(jié)構(gòu)上存在的亢余度;
(2)在滿足對圖像質(zhì)量一定要求的前提下,減少表示信號的精度。這通過采用符合主觀視覺特性的量化來實現(xiàn)。
(3)利用統(tǒng)計編碼消除最終被編碼的符號所含的統(tǒng)計亢余度。
3 常用數(shù)據(jù)壓縮編碼方法介紹
按照壓縮還原效果是否存在失真,數(shù)據(jù)壓縮分為無損壓縮和有損壓縮。對于某些數(shù)據(jù)(如計算機應(yīng)用軟件程序)里面的每個數(shù)據(jù)都不容許有任何變更,因此是無損壓縮。而對于一副彩色照片,它的某些對人眼不敏感的地方被壓縮掉,從而可以提高壓縮比,此為有損壓縮。
3.1 Huffman編碼
Huffman是一種基于統(tǒng)計的壓縮編碼方法。在對數(shù)據(jù)進行編碼時,對于出現(xiàn)頻率較高的字符,采用較短的編碼,對于出現(xiàn)頻率較低的字符,則采用較長的字符;兩個出現(xiàn)頻率最少的符號將有相同長度的碼字,并且它們只有最低有效位不同。
3.2 行程編碼
行程編碼的縮寫方法廣泛用于各種圖像格式的數(shù)據(jù)壓縮處理中,是最簡單的壓縮圖像方法之一。行程編碼技術(shù)是在給定的圖像數(shù)據(jù)中尋找連續(xù)重復(fù)的數(shù)值,然后用兩個字符值取代這些連續(xù)值。這種方法在處理包含大量重復(fù)信息的數(shù)據(jù)時可以獲得很好的壓縮效率。但是如果連續(xù)重復(fù)的數(shù)據(jù)很少,則難獲得較好的壓縮比。而且甚至可能會導(dǎo)致壓縮后的編碼字節(jié)數(shù)大于處理前的圖像字節(jié)數(shù)。所以行程編碼的壓縮效率與圖像數(shù)據(jù)的分布情況密切相關(guān)。
3.3 算術(shù)編碼
算術(shù)編碼與霍夫曼編碼方法相似,都是利用比較短的代碼取代圖像數(shù)據(jù)中出現(xiàn)比較頻繁的數(shù)據(jù),而利用比較長的代碼取代圖像數(shù)據(jù)中使用頻率比較低的數(shù)據(jù)從而達到數(shù)據(jù)壓縮的目的。其基本思想是將被編碼的數(shù)據(jù)序列表示成0 和1 之間的一個間隔(也就是一個小數(shù)范圍),該間隔的位置與輸入數(shù)據(jù)的概率分布有關(guān)。信息越長,表示間隔就越小,因而表示這一間隔所需的二進制位數(shù)就越多(由于間隔是用小數(shù)表示的)。
3.4 預(yù)測編碼
預(yù)測編碼方式是目前應(yīng)用比較廣泛的編碼技術(shù)之一。預(yù)測編碼中典型的壓縮方法有脈沖編碼調(diào)制、差分脈沖編碼調(diào)制、自適應(yīng)差分脈沖編碼調(diào)制等,它們較適合于聲音、圖像數(shù)據(jù)的壓縮,因為這些數(shù)據(jù)由采樣得到,相鄰樣值之間的差相差不會很大,可以用較少位來表示。采用預(yù)測編碼時,傳輸?shù)牟皇菆D像的實際像素值(色度值或亮度值),而是實際像素和預(yù)測像素值之差,即預(yù)測誤差。
3.5 變換編碼
變換編碼是將圖像時域信號變換到系數(shù)空間(頻域)上進行處理的方法。在時域空間上具有很強相關(guān)的信息,在頻域上反映出在某些特定的區(qū)域內(nèi)能量常常被集中在一起或者是系數(shù)矩陣的分布具有某些規(guī)律,從而可以利用這些規(guī)律分配頻域上的量化比特數(shù)而達到壓縮的目的。
3.6 矢量量化編碼
矢量量化編碼是利用相鄰圖像數(shù)據(jù)間的高度相關(guān)性,將輸入圖像數(shù)據(jù)序列分組,每一組m個數(shù)據(jù)構(gòu)成m維矢量,一起進行編碼,即一次量化多個點。矢量量化編碼屬于有損壓縮編碼,它的缺點是復(fù)雜度隨矢量維數(shù)呈指數(shù)增加,數(shù)據(jù)量和計算量都很大。
在上述常用圖像數(shù)據(jù)壓縮編碼方法中,霍夫曼編碼,行程編碼,算術(shù)編碼屬于無損壓縮,而預(yù)測編碼,變換編碼,其他編碼等屬于有損壓縮。
4 結(jié)束語
近年來,隨著計算機與數(shù)字通信技術(shù)的迅速發(fā)展,特別是網(wǎng)絡(luò)和多媒體技術(shù)的興起,已經(jīng)為圖像壓縮技術(shù)開拓全新的應(yīng)用領(lǐng)域打下了堅實的基礎(chǔ)。當前的數(shù)字圖像壓縮編碼技術(shù)充分利用了人的視覺、生理、心理和圖像信源的各種特征,而不僅僅局限于信息論的框架,而且可將多種編碼方法綜合起來運用,能獲得較高的壓縮比,但同時也帶來了運算復(fù)雜等問題。因此,在選擇圖像壓縮編碼方法的時候,應(yīng)該綜合考慮各種因素,選擇最適合的壓縮編碼算法。
參考文獻
[1] 張春田, 蘇育挺, 張靜..數(shù)字圖像壓縮編碼[M]. 北京: 清華大學(xué)出版社, 2006.
[2] 田浩, 葛秀慧, 王頂.數(shù)字圖像處理原理與應(yīng)用[M]. 北京: 清華大學(xué)出版, 2007.
[3] Anil K.Jain.數(shù)字圖像處理基礎(chǔ)[M]..北京: 清華大學(xué)出版, 2006.