馬曉凱 付禹
摘 要:傅里葉變換是數(shù)字信號處理領(lǐng)域一種很重要的算法,該算法表明:任何連續(xù)測量的時序或信號,都可以表示為不同頻率的正弦波信號的無限疊加。本文簡述了針對圖像處理的二維離散傅里葉變換的理論基礎(chǔ)、物理意義和基本原理。對圖像增強與去噪、邊緣檢測、特征提取、圖像壓縮應(yīng)用到的方法進行了闡述。
關(guān)鍵詞:傅里葉變換 圖像處理 圖像增強 特征提取
中圖分類號:TN91 文獻標識碼:A 文章編號:1672-3791(2018)03(b)-0080-02
Abstract: Fourier transform is a very important algorithm in the field of digital signal processing. The algorithm shows that any continuous measurement of time sequence or signal can be represented as the infinite superposition of sinusoidal signals with different frequencies. The theoretical basis, physical meaning and basic principle of two-dimensional discrete Fourier transform for image processing are briefly described. The methods of image enhancement and denoising, edge detection, feature extraction and image compression are described.
Key Words: Fourier transform; Image processing; Image enhancement; Feature extraction
最初的傅里葉變換是作為熱過程的解析工具被提出的。英文的Fourier transform有多個中文譯名,如:傅里葉變換、傅立葉變換、傅立葉轉(zhuǎn)換、傅氏轉(zhuǎn)換、傅氏變換等,本文統(tǒng)一寫作“傅里葉變換”。
傅里葉變換是數(shù)字信號處理領(lǐng)域一種很重要的算法,該算法表明:任何連續(xù)測量的時序或信號,都可以表示為不同頻率的正弦波信號的無限疊加。
1 簡述
根據(jù)維度、信號特性的不同,可簡單將傅里葉變換劃分為一維連續(xù)變換、一維離散變化、二維連續(xù)變換、二維離散變換等情況。二維連續(xù)傅里葉變換及逆變換公式如下:
其中,F(xiàn)(u,v)是函數(shù)f(x,y)的頻率譜,變量u是對應(yīng)于x軸的空間頻率,變量v是對應(yīng)于y軸的空間頻率。對于一個尺寸為M*N的二維圖像的離散傅里葉變換公式如下:
F(u,v)是該圖像的頻率譜。若定義F(w)的實部和虛部分別為R(w)、I(w),則相應(yīng)的傅里葉變換幅度譜、相位譜的計算如下:
在圖像處理的實際應(yīng)用中,二維離散傅里葉變換的應(yīng)用最為廣泛。
2 物理意義
在數(shù)學角度,傅里葉變換可將函數(shù)轉(zhuǎn)換為疊加的周期函數(shù)進行處理。在物理角度,傅里葉變換則是將圖像從空間域轉(zhuǎn)換到頻率域,將圖像的灰度分布函數(shù)變換為圖像的頻率分布函數(shù),其逆變換是將圖像從頻率域轉(zhuǎn)換到空間域,將圖像的頻率分布函數(shù)變換為灰度分布函數(shù)。
3 基本原理
《圖像處理》(岡薩雷斯)有一個形象的比喻:棱鏡可以根據(jù)波長(頻率)將光分解為不同的顏色。傅里葉變換則是數(shù)學上的棱鏡,可以將函數(shù)基于頻率分解為不同的組分。分析光時,光譜或頻率譜是主要特性,同樣, 傅里葉變換使我們能通過頻率來分析一個函數(shù)。
根據(jù)傅里葉變換理論,滿足條件的任何信號都可表示為一系列正弦信號的疊加。在圖像處理中,即每幅灰度圖像都可表示為由正弦信息疊加組成的圖像。其中每個正弦信息由三個變量組成:頻率、幅值及相位。經(jīng)過變換的圖像即是該圖像頻譜圖(或功率圖),在頻譜圖中,更加關(guān)心頻率及幅值,舍棄了相位參數(shù)(在相位圖中進行體現(xiàn))。
在一維的情況下,圖像對應(yīng)的頻譜圖可表示為一個二維的坐標系,其中橫軸為頻率,縱軸為幅值。頻率為0的橫軸中心點代表直流頻率,即整幅圖像的平均亮度。其他頻率為f的信號在圖中表示為橫坐標為f的一個單峰,峰值高度為該信號的幅值。
二維圖像的頻譜圖形成與一維類似,只不過需對該二維圖像分別進行列掃描和行掃描,并進行疊加。不同的是,該頻譜圖的橫縱軸均代表頻率,每個像素點代表一個正弦信號的頻率值,該正弦信號的幅值由該像素點的亮度表示。在不移頻的情況下,頻譜圖的中心點代表了該幅圖像的直流頻率(平均亮度),頻譜圖中存在越亮的點,說明灰度圖中對比越強烈(對比度越大),頻譜圖中的點與灰度圖中的點并無對應(yīng)關(guān)系,而是反映了灰度圖的梯度(灰度圖中的明暗變化)分布。頻譜圖中的亮點多,代表圖像較為銳利,反之說明圖像較為柔和。
4 實際應(yīng)用
傅里葉變換在圖像處理中有著廣泛的應(yīng)用,主要應(yīng)用方向有:圖像增強與去噪、邊緣檢測、特征提取、圖像壓縮等。其核心思想是使用傅里葉變換將圖像由空間域轉(zhuǎn)換至頻率域,通過對頻率域進行不同的運算操作,實現(xiàn)預期的圖像處理效果。
圖像增強與圖像去噪:若簡單將圖像的頻率譜劃分為高頻分量和低頻分量,則其中的高頻分量代表了圖像的突變部分(即邊緣信息),低頻分量代表了圖像的平緩區(qū)域(即輪廓信息)。圖像增強和去噪即是通過不同的傳遞函數(shù)H(u,v)對頻率函數(shù)F(u,v)進行卷積運算,得到新的頻率函數(shù)G(u,v)。新的頻率函數(shù)中,我們期望保留的頻率信號被增強,期望去除的頻率信號(噪聲)被減弱。G(u,v)可通過傅里葉逆變換得到新的圖像函數(shù)g(x,y),即增強和去噪后的圖像。圖像增強和去噪的核心在于傳遞函數(shù)H(u,v)的選取,根據(jù)功能的不同,可大致劃分為低通濾波器、高通濾波器、帶通濾波器、帶阻濾波器等。需要注意的是,很多情況下,圖像增強和去噪本身是一對矛盾的存在,這種情況出現(xiàn)在噪聲信號本身是與需增強圖像的邊緣信息混雜在一起的時候。
邊緣檢測原理與圖像增強一致,圖像的邊緣信息即是頻譜圖中的高頻分量,有效地保留并處理這些高頻分量,以達到邊緣檢測的目的。
特征提?。簣D像特征可分為顏色特征、紋理特征、形狀特征、空間關(guān)系特征等。顏色特征是一種描述圖像表面性質(zhì)的全局特征,包含了圖像區(qū)域的所有像素點。該特征不能反映圖像區(qū)域的方向、大小等變化,因此不能捕捉圖像中的局部特征。常用的顏色特征提取方法有:顏色直方圖法、顏色集法、顏色矩法、顏色聚合向量法、顏色相關(guān)圖法等;紋理特征與顏色特征類似,也是一種全局特征,與顏色特征不同的是,紋理特征是基于全部像素點的統(tǒng)計運算而非基于單個像素點。紋理特征的優(yōu)點在于具有旋轉(zhuǎn)不變性,且具有較強的噪聲抵抗能力,缺點在于分辨率、光照等條件不同的情況下提取的紋理特征差別較大。常用的紋理特征提取方法有:統(tǒng)計法、模型法、幾何法、信號處理法等;形狀特征是一種局部特征,常用的形狀特征提取方法有:邊界特征法、傅里葉形狀描述法、幾何參數(shù)法、形狀不變法等;空間關(guān)系特征是指圖像中分割出來的多個目標之間相互的空間位置或相對方向關(guān)系,這些關(guān)系可分為連接/鄰接關(guān)系、交疊/重疊關(guān)系和包含/包容關(guān)系等。空間關(guān)系特征的使用可加強對圖像內(nèi)容的描述區(qū)分能力,但空間關(guān)系特征常對圖像或目標的旋轉(zhuǎn)、反轉(zhuǎn)、尺度變化等比較敏感。實際應(yīng)用中,僅僅利用空間信息不能有效準確地表達場景信息,還需要配合其他特征共同使用。
圖像壓縮:利用壓縮編碼理論,對頻率空間進行重新編碼及傳輸,可實現(xiàn)圖像壓縮的效果。由于圖像相關(guān)性的明顯降低,頻率域的編碼比空間域更為簡單。
5 結(jié)語
傅里葉變換提供了一種思考世界新思路,正如人們所認知的空間域中的圖像,可理解為無數(shù)頻率域中彼此無關(guān)的正弦曲線的疊加投影,伴隨著正弦曲線幅值、頻率、相位的變化,投影出的便是繽紛燦爛的大千世界。而圖像處理恰恰就扮演了這樣一個幕后之手的角色,通過對頻率域的篩選與改變,得到期望的圖像。
參考文獻
[1] 胡嗣柱,倪光炯.數(shù)學物理方法[M].2版.北京:高等教育出版社,2002.
[2] (美)Rafael C Gonzalez,(美)Richard E Woods.數(shù)字圖像處理[M].3版.北京:電子工業(yè)出版社,2017.
[3] (瑞典)Anders Vretblad.傅里葉分析及其應(yīng)用[M].北京:科學出版社,2017.
[4] 周武.基于圖形識別的數(shù)控機床運動誤差快速溯因與推算[D].重慶理工大學,2015.
[5] 魏偉娜.基于MPEG-7顏色描述符的自然物圖像分類[D].北京工業(yè)大學,2012.