李立芳 大連91550部隊(duì)94分隊(duì) 116023
淺談數(shù)字圖像處理技術(shù)及應(yīng)用
李立芳 大連91550部隊(duì)94分隊(duì) 116023
從數(shù)字圖像處理的發(fā)展歷史與研究內(nèi)容出發(fā),介紹了數(shù)字圖像處理技術(shù)的優(yōu)點(diǎn)與發(fā)展趨勢(shì),總結(jié)了數(shù)字圖像處理技術(shù)的廣大應(yīng)用領(lǐng)域,對(duì)數(shù)字圖像處理的發(fā)展具有借鑒意義。
數(shù)字圖像處理
數(shù)字圖像處理是將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并利用計(jì)算機(jī)對(duì)其進(jìn)行處理的過程。 20世紀(jì)20年代,圖像處理首次得到應(yīng)用。20世紀(jì)60年代中期,隨電子計(jì)算機(jī)的發(fā)展得到普遍應(yīng)用。60年代末,圖像處理技術(shù)不斷完善,逐漸成為一個(gè)新興的學(xué)科。隨著圖像處理技術(shù)的深入發(fā)展,從70年代中期開始,隨著計(jì)算機(jī)技術(shù)和人工智能、思維科學(xué)研究的迅速發(fā)展,數(shù)字圖像處理向更高、更深層次發(fā)展。人們已開始研究如何用計(jì)算機(jī)系統(tǒng)解釋圖像,實(shí)現(xiàn)類似人類視覺系統(tǒng)理解外部世界,這被稱為圖像理解或計(jì)算機(jī)視覺。利用數(shù)字圖像處理主要是為了修改圖形,改善圖像質(zhì)量,或是從圖像中提取有效信息,數(shù)字圖像處理對(duì)圖像進(jìn)行體積壓縮,便于傳輸和保存。 數(shù)字圖像處理因易于實(shí)現(xiàn)非線性處理,處理程序和處理參數(shù)可變,故是一項(xiàng)通用性強(qiáng),精度高,處理方法靈活,信息保存、傳送可靠的圖像處理技術(shù)。
數(shù)字圖像處理主要研究的內(nèi)容有以下幾個(gè)方面:
1.1 圖像變換由于圖像陣列很大,如直接在空間域中進(jìn)行處理,涉及計(jì)算量很大。因此,往往采用各種圖像變換的方法,如傅立葉變換、沃爾什變換、離散余弦變換等間接處理技術(shù),將空間域的處理轉(zhuǎn)換為變換域處理,不僅可減少計(jì)算量,而且可獲得更有效的處理(如傅立葉變換可在頻域中進(jìn)行數(shù)字濾波處理)。目前新興研究的小波變換在時(shí)域和頻域中都具有良好的局部化特性,它在圖像處理中也有著廣泛而有效的應(yīng)用。
1.2 圖像編碼壓縮 圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量(即比特?cái)?shù)),以便節(jié)省圖像傳輸、處理時(shí)間和減少所占用的存儲(chǔ)器容量。壓縮可以在不失真的前提下獲得,也可以在允許的失真條件下進(jìn)行。編碼是壓縮技術(shù)中最重要的方法,它在圖像處理技術(shù)中是發(fā)展最早且比較成熟的技術(shù)。
1.3 圖像增強(qiáng)和復(fù)原 圖像增強(qiáng)和復(fù)原的目的是為了提高圖像的質(zhì)量,如去除噪聲,提高圖像的清晰度等。圖像增強(qiáng)不考慮圖像降質(zhì)的原因,突出圖像中所感興趣的部分。如強(qiáng)化圖像高頻分量,可使圖像中物體輪廓清晰,細(xì)節(jié)明顯;如強(qiáng)化低頻分量可減少圖像中噪聲影響。圖像復(fù)原要求對(duì)圖像降質(zhì)的原因有一定的了解,一般講應(yīng)根據(jù)降質(zhì)過程建立“降質(zhì)模型”,再采用某種濾波方法,恢復(fù)或重建原來的圖像。
1.4 圖像分割 圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一。圖像分割是將圖像中有意義的特征部分提取出來,其有意義的特征有圖像中的邊緣、區(qū)域等,這是進(jìn)一步進(jìn)行圖像識(shí)別、分析和理解的基礎(chǔ)。雖然目前已研究出不少邊緣提取、區(qū)域分割的方法,但還沒有一種普遍適用于各種圖像的有效方法。因此,對(duì)圖像分割的研究還在不斷深入之中,是目前圖像處理中研究的熱點(diǎn)之一。
1.5 圖像描述 圖像描述是圖像識(shí)別和理解的必要前提。作為最簡單的二值圖像可采用其幾何特性描述物體的特性,一般圖像的描述方法采用二維形狀描述,它有邊界描述和區(qū)域描述兩類方法。對(duì)于特殊的紋理圖像可采用二維紋理特征描述。隨著圖像處理研究的深入發(fā)展,已經(jīng)開始進(jìn)行三維物體描述的研究,提出了體積描述、表面描述、廣義圓柱體描述等方法。
1.6 圖像分類(識(shí)別) 圖像分類(識(shí)別)屬于模式識(shí)別的范疇,其主要內(nèi)容是圖像經(jīng)過某些預(yù)處理(增強(qiáng)、復(fù)原、壓縮)后,進(jìn)行圖像分割和特征提取,從而進(jìn)行判決分類。圖像分類常采用經(jīng)典的模式識(shí)別方法,有統(tǒng)計(jì)模式分類和句法(結(jié)構(gòu))模式分類,近年來新發(fā)展起來的模糊模式識(shí)別和人工神經(jīng)網(wǎng)絡(luò)模式分類在圖像識(shí)別中也越來越受到重視。
2.1 目前,數(shù)字圖像處理的信息大多是二維信息,處理信息量很大。如一幅256×256低分辨率黑白圖像,要求約64kbit的數(shù)據(jù)量;對(duì)高分辨率彩色512×512圖像,則要求768kbit數(shù)據(jù)量;如果要處理30幀/秒的電視圖像序列,則每秒要求500kbit~22.5Mbit數(shù)據(jù)量。因此對(duì)計(jì)算機(jī)的計(jì)算速度、存儲(chǔ)容量等要求較高。
2.2 數(shù)字圖像處理占用的頻帶較寬。與語言信息相比,占用的頻帶要大幾個(gè)數(shù)量級(jí)。如電視圖像的帶寬約5.6MHz,而語音帶寬僅為4kHz左右。所以在成像、傳輸、存儲(chǔ)、處理、顯示等各個(gè)環(huán)節(jié)的實(shí)現(xiàn)上,技術(shù)難度較大,成本亦高,這就對(duì)頻帶壓縮技術(shù)提出了更高的要求。
2.3 數(shù)字圖像中各個(gè)像素是不獨(dú)立的,其相關(guān)性大。在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個(gè)像素或相鄰兩行間的像素,其相關(guān)系數(shù)可達(dá)0.9以上,而相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性一般說還要大些。因此,圖像處理中信息壓縮的潛力很大。
2.4 由于圖像是三維景物的二維投影,一幅圖像本身不具備復(fù)現(xiàn)三維景物的全部幾何信息的能力,很顯然三維景物背后部分信息在二維圖像畫面上是反映不出來的。因此,要分析和理解三維景物必須作合適的假定或附加新的測(cè)量,例如雙目圖像或多視點(diǎn)圖像。在理解三維景物時(shí)需要知識(shí)導(dǎo)引,這也是人工智能中正在致力解決的知識(shí)工程問題。
2.5 數(shù)字圖像處理后的圖像一般是給人觀察和評(píng)價(jià)的,因此受人的因素影響較大。由于人的視覺系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺性能、人的情緒愛好以及知識(shí)狀況影響很大,作為圖像質(zhì)量的評(píng)價(jià)還有待進(jìn)一步深入的研究。另一方面,計(jì)算機(jī)視覺是模仿人的視覺,人的感知機(jī)理必然影響著計(jì)算機(jī)視覺的研究。例如,什么是感知的初始基元,基元是如何組成的,局部與全局感知的關(guān)系,優(yōu)先敏感的結(jié)構(gòu)、屬性和時(shí)間特征等,這些都是心理學(xué)和神經(jīng)心理學(xué)正在著力研究的課題。
3.1 再現(xiàn)性好 數(shù)字圖像處理與模擬圖像處理的根本不同在于,它不會(huì)因圖像的存儲(chǔ)、傳輸或復(fù)制等一系列變換操作而導(dǎo)致圖像質(zhì)量的退化。只要圖像在數(shù)字化時(shí)準(zhǔn)確地表現(xiàn)了原稿,則數(shù)字圖像處理過程始終能保持圖像的再現(xiàn)。
3.2 處理精度高 按目前的技術(shù),幾乎可將一幅模擬圖像數(shù)字化為任意大小的二維數(shù)組,這主要取決于圖像數(shù)字化設(shè)備的能力。現(xiàn)代掃描儀可以把每個(gè)像素的灰度等級(jí)量化為16位甚至更高,這意味著圖像的數(shù)字化精度可以達(dá)到滿足任一應(yīng)用需求。對(duì)計(jì)算機(jī)而言,不論數(shù)組大小,也不論每個(gè)像素的位數(shù)多少,其處理程序幾乎是一樣的。換言之,從原理上講不論圖像的精度有多高,處理總是能實(shí)現(xiàn)的,只要在處理時(shí)改變程序中的數(shù)組參數(shù)就可以了。試想一下圖像的模擬處理,為了要把處理精度提高一個(gè)數(shù)量級(jí),就要大幅度地改進(jìn)處理裝置,這在經(jīng)濟(jì)上是極不合算的。
3.3 適用面寬 圖像可以來自多種信息源,它們可以是可見光圖像,也可以是不可見的波譜圖像(例如X射線圖像、射線圖像、超聲波圖像或紅外圖像等)。從圖像反映的客觀實(shí)體尺度看,可以小到電子顯微鏡圖像,大到航空照片、遙感圖像甚至天文望遠(yuǎn)鏡圖像。這些來自不同信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像(彩色圖像也是由灰度圖像組合成的,例如RGB圖像由紅、綠、藍(lán)三個(gè)灰度圖像組合而成)組合而成,因而均可用計(jì)算機(jī)來處理。即只要針對(duì)不同的圖像信息源,采取相應(yīng)的圖像信息采集措施,圖像的數(shù)字處理方法適用于任何一種圖像。
3.4 靈活性高 圖像處理大體上可分為圖像的像質(zhì)改善、圖像分析和圖像重建三大部分,每一部分均包含豐富的內(nèi)容。由于圖像的光學(xué)處理從原理上講只能進(jìn)行線性運(yùn)算,這極大地限制了光學(xué)圖像處理能實(shí)現(xiàn)的目標(biāo)。而數(shù)字圖像處理不僅能完成線性運(yùn)算,而且能實(shí)現(xiàn)非線性處理,即凡是可以用數(shù)學(xué)公式或邏輯關(guān)系來表達(dá)的一切運(yùn)算均可用數(shù)字圖像處理實(shí)現(xiàn)。
圖像是人類獲取和交換信息的主要來源,因此,圖像處理的應(yīng)用領(lǐng)域必然涉及人類生活和工作的方方面面。隨著人類活動(dòng)范圍的不斷擴(kuò)大,圖像處理的應(yīng)用領(lǐng)域也將隨之不斷擴(kuò)大。
4.1 航天和航空技術(shù)方面的應(yīng)用
數(shù)字圖像處理技術(shù)在航天和航空技術(shù)方面的應(yīng)用,除了上面介紹的JPL對(duì)月球、火星照片的處理之外,另一方面的應(yīng)用是在飛機(jī)遙感和衛(wèi)星遙感技術(shù)中。許多國家每天派出很多偵察飛機(jī)對(duì)地球上有興趣的地區(qū)進(jìn)行大量的空中攝影。對(duì)由此得來的照片進(jìn)行處理分析,以前需要雇用幾千人,而現(xiàn)在改用配備有高級(jí)計(jì)算機(jī)的圖像處理系統(tǒng)來判讀分析,既節(jié)省人力,又加快了速度,還可以從照片中提取人工所不能發(fā)現(xiàn)的大量有用情報(bào)。從60年代末以來,美國及一些國際組織發(fā)射了資源遙感衛(wèi)星(如LANDSAT系列)和天空實(shí)驗(yàn)室(如SKYLAB),由于成像條件受飛行器位置、姿態(tài)、環(huán)境條件等影響,圖像質(zhì)量總不是很高。因此,以如此昂貴的代價(jià)進(jìn)行簡單直觀的判讀來獲取圖像是不合算的,而必須采用數(shù)字圖像處理技術(shù)。如LANDSAT系列陸地衛(wèi)星,采用多波段掃描器(MSS),在900km高空對(duì)地球每一個(gè)地區(qū)以18天為一周期進(jìn)行掃描成像,其圖像分辨率大致相當(dāng)于地面上十幾米或100米左右(如1983年發(fā)射的LANDSAT-4,分辨率為30m)。這些圖像在空中先處理(數(shù)字化,編碼)成數(shù)字信號(hào)存入磁帶中,在衛(wèi)星經(jīng)過地面站上空時(shí),再高速傳送下來,然后由處理中心分析判讀。這些圖像無論是在成像、存儲(chǔ)、傳輸過程中,還是在判讀分析中,都必須采用很多數(shù)字圖像處理方法?,F(xiàn)在世界各國都在利用陸地衛(wèi)星所獲取的圖像進(jìn)行資源調(diào)查(如森林調(diào)查、海洋泥沙和漁業(yè)調(diào)查、水資源調(diào)查等),災(zāi)害檢測(cè)(如病蟲害檢測(cè)、水火檢測(cè)、環(huán)境污染檢測(cè)等),資源勘察(如石油勘查、礦產(chǎn)量探測(cè)、大型工程地理位置勘探分析等),農(nóng)業(yè)規(guī)劃(如土壤營養(yǎng)、水分和農(nóng)作物生長、產(chǎn)量的估算等),城市規(guī)劃(如地質(zhì)結(jié)構(gòu)、水源及環(huán)境分析等)。我國也陸續(xù)開展了以上諸方面的一些實(shí)際應(yīng)用,并獲得了良好的效果。在氣象預(yù)報(bào)和對(duì)太空其它星球研究方面,數(shù)字圖像處理技術(shù)也發(fā)揮了相當(dāng)大的作用。
4.2 生物醫(yī)學(xué)工程方面的應(yīng)用
數(shù)字圖像處理在生物醫(yī)學(xué)工程方面的應(yīng)用十分廣泛,而且很有成效。除了上面介紹的CT技術(shù)之外,還有一類是對(duì)醫(yī)用顯微圖像的處理分析,如紅細(xì)胞、白細(xì)胞分類,染色體分析,癌細(xì)胞識(shí)別等。此外,在X光肺部圖像增晰、超聲波圖像處理、心電圖分析、立體定向放射治療等醫(yī)學(xué)診斷方面都廣泛地應(yīng)用圖像處理技術(shù)。
4.3 通信工程方面的應(yīng)用
當(dāng)前通信的主要發(fā)展方向是聲音、文字、圖像和數(shù)據(jù)結(jié)合的多媒體通信。具體地講是將電話、電視和計(jì)算機(jī)以三網(wǎng)合一的方式在數(shù)字通信網(wǎng)上傳輸。其中以圖像通信最為復(fù)雜和困難,因圖像的數(shù)據(jù)量十分巨大,如傳送彩色電視信號(hào)的速率達(dá)100Mbit/s以上。要將這樣高速率的數(shù)據(jù)實(shí)時(shí)傳送出去,必須采用編碼技術(shù)來壓縮信息的比特量。在一定意義上講,編碼壓縮是這些技術(shù)成敗的關(guān)鍵。除了已應(yīng)用較廣泛的熵編碼、DPCM編碼、變換編碼外,目前國內(nèi)外正在大力開發(fā)研究新的編碼方法,如分行編碼、自適應(yīng)網(wǎng)絡(luò)編碼、小波變換圖像壓縮編碼等。
4.4 工業(yè)和工程方面的應(yīng)用
在工業(yè)和工程領(lǐng)域中圖像處理技術(shù)有著廣泛的應(yīng)用,如自動(dòng)裝配線中檢測(cè)零件的質(zhì)量、并對(duì)零件進(jìn)行分類,印刷電路板疵病檢查,彈性力學(xué)照片的應(yīng)力分析,流體力學(xué)圖片的阻力和升力分析,郵政信件的自動(dòng)分揀,在一些有毒、放射性環(huán)境內(nèi)識(shí)別工件及物體的形狀和排列狀態(tài),先進(jìn)的設(shè)計(jì)和制造技術(shù)中采用工業(yè)視覺等等。其中值得一提的是研制具備視覺、聽覺和觸覺功能的智能機(jī)器人,將會(huì)給工農(nóng)業(yè)生產(chǎn)帶來新的激勵(lì),目前已在工業(yè)生產(chǎn)中的噴漆、焊接、裝配中得到有效的利用。
4.5 軍事公安方面的應(yīng)用
在軍事方面圖像處理和識(shí)別主要用于導(dǎo)彈的精確末制導(dǎo),各種偵察照片的判讀,具有圖像傳輸、存儲(chǔ)和顯示的軍事自動(dòng)化指揮系統(tǒng),飛機(jī)、坦克和軍艦?zāi)M訓(xùn)練系統(tǒng)等;公安業(yè)務(wù)圖片的判讀分析,指紋識(shí)別,人臉鑒別,不完整圖片的復(fù)原,以及交通監(jiān)控、事故分析等。目前已投入運(yùn)行的高速公路不停車自動(dòng)收費(fèi)系統(tǒng)中的車輛和車牌的自動(dòng)識(shí)別都是圖像處理技術(shù)成功應(yīng)用的例子。
4.6 文化藝術(shù)方面的應(yīng)用
目前這類應(yīng)用有電視畫面的數(shù)字編輯,動(dòng)畫的制作,電子圖像游戲,紡織工藝品設(shè)計(jì),服裝設(shè)計(jì)與制作,發(fā)型設(shè)計(jì),文物資料照片的復(fù)制和修復(fù),運(yùn)動(dòng)員動(dòng)作分析和評(píng)分等等,現(xiàn)在已逐漸形成一門新的藝術(shù)——計(jì)算機(jī)美術(shù)。
數(shù)字圖像處理技術(shù)在航空航天、工業(yè)生產(chǎn)、醫(yī)療診斷、資源環(huán)境、氣象及交通監(jiān)測(cè)、文化教育等領(lǐng)域有著廣泛的應(yīng)用,創(chuàng)造了巨額社會(huì)價(jià)值;同時(shí)還遠(yuǎn)遠(yuǎn)不能滿足社會(huì)需求,自身也在不斷完善和發(fā)展,有很多新的方面要探索。它必將向更深入、更完善的方向發(fā)展:處理算法更優(yōu)化,處理速度更快,實(shí)現(xiàn)圖形的智能生成、處理、識(shí)別和理解。
[1]李紅俊,韓冀皖.數(shù)字圖像處理技術(shù)及其應(yīng)用.計(jì)算機(jī)測(cè)量與控制,2002.10(9):620~622
[2]W.K.Pratt.DIGITAL IMAGE PROCESSING.John wiley & Sons,inc,1978
[3]楊枝靈,王開.Visual C++數(shù)字圖像獲取、處理及實(shí)踐應(yīng)用.人民郵電出版社,2003
[4]聶穎,劉榴娣.數(shù)字信號(hào)處理器在可視電話中的應(yīng)用.光電工程,1997.24(3):67~70
[5]侯遵澤,楊文采.小波分析應(yīng)用研究.物探化探計(jì)算技術(shù),1995.17(3):1~9
[6]李道遠(yuǎn),常敏,袁春風(fēng).基于小波變換的數(shù)字水印綜述.計(jì)算機(jī)應(yīng)用與工程,2003.23(10):65~67
10.3969/j.issn.1001-8972.2012.03.036