侯 睿 王 昆
摘要圖像壓縮技術對于數(shù)字圖像信息實現(xiàn)快速傳輸和實時處理具有重要的意義。本文簡要論述了圖像和視頻壓縮技術的研究狀況,就目前國際上正在研究的壓縮標準和方法作了介紹,并對圖像和視頻壓縮技術的發(fā)展趨勢和前景進行了初步探討。
關鍵詞數(shù)字圖像圖像壓縮壓縮標準
中圖分類號:TP391文獻標識碼:A
1圖像壓縮技術概述
信息技術的迅猛發(fā)展產生了大量的圖片,包括氣象圖片、廣播電視、遙感圖片等各種各樣的圖像信息。要充分利用這些圖片,就要對它們進行大量的存儲和傳輸,并且要在保證質量的前提下以較小的空間存儲圖像和較少的比特率傳輸圖像,因此,就產生了各種圖像壓縮編碼技術。
圖像數(shù)據(jù)之所以可以進行壓縮,主要是因為一般原始圖像數(shù)據(jù)是高度相關的,都含有大量的冗余信息。圖像壓縮編碼的目的就是消除各種冗余,并在給定的畸變下用盡量少的比特數(shù)來表征和重建圖像,使它符合預定應用場合的要求。
2 圖像壓縮技術的分類
數(shù)據(jù)壓縮的效果好與不好,關鍵要看三個指標:一是壓縮比要大,二是壓縮算法簡單、速度快,三是恢復效果好。
圖像壓縮編碼的方法目前有很多種,按照信息保真度來分類,可以分為兩大類:一類是冗余度壓縮法。如著名的哈夫曼編碼、香農編碼、游程編碼等,其特征是壓縮比較低(一般不超過8:1),但不丟失任何數(shù)據(jù),可以嚴格恢復原圖像,實現(xiàn)編/解碼的互逆,故又稱可逆編碼或無損壓縮。另一類是熵壓縮法。如預測編碼、變換編碼、統(tǒng)計編碼等,由于在壓縮過程中要丟失一些人眼所不敏感的圖像信息,且所丟失的信息不可恢復,即圖像還原后與壓縮前不完全一致,故又稱有損壓縮。按照具體編碼技術分類,可以分為:預測編碼、變換編碼、統(tǒng)計編碼、輪廓編碼、模型編碼等。
3 圖像壓縮技術的國際標準
20世紀80年代后,ISO、IEC和ITU陸續(xù)制定了各種數(shù)據(jù)壓縮與通信的標準與建議。
3.1 H.261協(xié)議
H.261是ITU-T于1990年12月通過的有關圖像和視頻壓縮和編碼的第一個國際標準化協(xié)議,采用了運動補償預測和離散余弦變換相結合的混合編碼方案,獲得很好的圖像壓縮效果,其主要對象是m?4kbit/s 兩類碼率?,F(xiàn)在H.261廣泛使用在ISDN的p?4 kbit/s(1≤p≤30)信道上進行可視電話、會議電視等聲像服務。
3.2 H.263協(xié)議
H.263協(xié)議是ITU-T在1995年推出的面向低碼率多媒體通信協(xié)議。它提高了運動補償?shù)木?常用于超低速率的圖像傳輸。之后,ITU-T又對其進行了補充,以提高編碼效率,增強編碼功能。補充修訂的版本有1998年的H.263+,2000年的H.263++,2003年的H.263L。
3.3 JPEG 標準
JPEG標準是ISO和CCITT于1986年成立的聯(lián)合圖像專家于1992年推出的, 以作為靜止圖像壓縮算法的國際標準,中文名稱是“連續(xù)色調靜止圖像的數(shù)字壓縮編碼”。它在較低的計算復雜度下,能提供較高的壓縮比與保真度。
JPEG標準適用于各種不同類型,不同分標率要求的彩色和黑白靜止圖像,由多種編碼模式和數(shù)據(jù)格式。主要應用于彩色傳真、靜止圖像、可視通信、新聞圖片、醫(yī)學圖像和衛(wèi)星圖像的傳輸、檢索和存儲。
3.4 JPEG2000
JPEG2000,正式名稱為“ISO 15444”,由JPEG組織2000年提出了基本編碼系統(tǒng)的最終協(xié)議。JPEG2000與JPEG最大的不同,在于它放棄了JPEG所采用的以DCT為主的區(qū)塊編碼方式,而改用以DWT為主的多分辨率編碼方式。JPEG2000的新特征有:
(1)JPEG2000作為JPEG的升級版,具有良好的低比特率性能,特別是對細節(jié)豐富的圖像以0.25bpp的比特率進行壓縮時,總體上其壓縮率比JPEG高約30%左右。
(2)JPEG2000同時支持有損和無損壓縮;而JPEG只支持有損壓縮。
(3)JPEG2000能實現(xiàn)漸進傳送。它先傳輸圖像的輪廓,然后逐步傳輸圖像數(shù)據(jù)的細節(jié),接收端重構圖像時讓圖像由朦朧到清晰顯示,而不像JPEG那樣由上到下由左到右的顯示。
(4)JPEG2000支持所謂的“感興趣區(qū)域”編碼??扇我庵付▓D像上感興趣區(qū)域的壓縮質量,亦可以選擇指定的部分先解壓縮以突出重點。
3.5 MPEG-1 標準
MPEG是“活動圖像專家組”的簡稱,MPEG-1是MPEG專家組的第一個成果。1993年正式成為國際標準。MPEG-1包括三個主要部分(系統(tǒng)、視頻和音頻協(xié)議)以及測試和軟件實現(xiàn)等。它主要面向數(shù)字存儲媒體,應用于多媒體計算機、教育、演示、電子出版物、娛樂、數(shù)字視聽系統(tǒng)VCD及VOD、交互式電視ITV等領域。在技術上,MPEG-1比H.261在圖像類型、預測、運動估值以及隨機存取、節(jié)目編輯、碼流操作、系統(tǒng)控制等方面都有重大的改進和發(fā)展。
3.6 MPEG-2 標準
MPEG-2是MPEG專家組的又一個成果,制定于1994年。MPEG-2包括系統(tǒng)、視頻、音頻、測試等幾部分內容。與MPEG-1向下兼容,其視頻編碼部分碼率為4Mbit/s,圖像質量接近演播室質量。MPEG-2在技術、功能、語法結構、選擇項、可分級性和應用范圍等方面比MPEG-1、H.261有重大的改進和發(fā)展,因此成為一種從多媒體計算機到家用消費數(shù)字音像電子產品、從寬帶數(shù)字通信到數(shù)字視頻廣播以及高清數(shù)字電視的通用關鍵技術。
3.7 MPEG-4 標準
MPEG-4是對數(shù)字音/視頻數(shù)據(jù)進行壓縮、通信、存取和操作管理等的新標準,并為各種通信環(huán)境提供一種通用的技術解決方案。MPEG-4的目標是交互式的多媒體應用,其特點有:
(1)基于內容的交互性,基于內容的多媒體數(shù)據(jù)訪問,基于內容的碼流操作和編輯。
(2)高效的壓縮算法。
(3)自然的與合成的圖像編碼及其混合編碼。
(4)通用的可接入性,包括惡劣環(huán)境下強大的容錯糾錯能力和基于內容的可分級性。
3.8 MPEG-7 標準
MPEG-7由MPEG專家組于1998年10月提出提議,2001年9月正式成為國際標準,又稱為“多媒體信息內容的描述接口”,MPEG-7目標是建立對所有不同類型多媒體信息內容的標準化描述。這些描述要與信息內容直接相關以便用來快速有效的查詢、訪問各種多媒體信息。
MPEG-7的應用范圍廣泛,既可以應用于存儲,也可用于流式應用(如廣播、將模型加入Internet等)。它可以在實時或非實時環(huán)境下應用,如數(shù)字圖書館、多媒體編輯等。另外,MPEG-7在教育、新聞、導游信息、娛樂、研究業(yè)務、地理信息系統(tǒng)、醫(yī)學、購物、建筑等各方面均有較深的應用潛力。
3.9 MPEG-21 標準
MPEG-21是基于“多媒體框架標準”的,其目的是建立一個多媒體框架,以通過預購網(wǎng)絡和設備使多媒體資源在用戶之間透明方便的使用。MPEG-21的基本框架要素包括數(shù)字項目說明、內容表示、數(shù)字項目的識別和描述、內容管理和使用、知識產權管理和保護、終端和網(wǎng)絡、事件報告等。它支持的功能有:通過網(wǎng)絡存儲,使用并交互操作多媒體對象;實現(xiàn)多種業(yè)務模型,包括對版權和交易的自動管理;對內容進行隱私的尊重等。
4 圖像壓縮技術的發(fā)展趨勢
從國際數(shù)據(jù)壓縮技術的發(fā)展尤其是MPEG的發(fā)展可以看出,基于內容的圖像壓縮編碼方法是編碼的發(fā)展趨勢。它不僅能滿足進一步獲得更大的圖像數(shù)據(jù)壓縮比的要求,而且能夠實現(xiàn)人機對話的功能。小波圖像壓縮和分形圖像壓縮是當前研究的熱點,但二者也有各自的缺點??傊?圖像壓縮是一個非常有發(fā)展前途的研究領域,這一領域的突破對于我們的信息生活和通信事業(yè)的發(fā)展具有深遠的影響。
5 結束語
從圖像和視頻壓縮的發(fā)展可以看到:圖像壓縮的操作對象由像素到塊再走向對象;壓縮的分辨率逐漸提高,可擴展性逐漸增強;壓縮的目的由單純的減少數(shù)據(jù)量走向功能的多元化:交互性、可分級性、靈活性;壓縮的方法由單一化走向自適應的使用多種壓縮工具。壓縮技術的發(fā)展與社會的需求息息相關。隨著數(shù)學理論、信息論和計算機視覺等的發(fā)展必然會有功能更全面的更有效的圖像壓縮編碼技術的產生。