丁 明
[摘要]本文介紹了ICA的基本概念、算法及其應(yīng)用情況,重點(diǎn)闡述了ICA在多媒體信號(hào)中的應(yīng)用。然后,分析了基于采樣和ICA的特征分析方法模型,并分別介紹了二層、高層分解模型和在離散小波變換中的概貌分量的能量統(tǒng)計(jì),最后提出將采樣與ICA相結(jié)合的信號(hào)處理方法。
[關(guān)鍵詞]ICA多媒體信號(hào)特征DWT
一、ICA的概念引入
獨(dú)立分量分析不同于其它多媒體信號(hào)處理方法。一些方法對(duì)信號(hào)的分解的分量只能保證是不相關(guān)的,并不能保證相互獨(dú)立(除非提取出的分量是高斯過(guò)程的,因?yàn)楦咚剐盘?hào)如果不相關(guān)就意味著獨(dú)立)。因此就使得這樣的分解能夠多的具有實(shí)際(生理)意義,提高了所提取特征的典型性。因此,ICA被視為一種具有很好的應(yīng)用前景的信號(hào)處理方法。
獨(dú)立分量分析可以看作是主分量分析的一種擴(kuò)展,它不同于主分量分析把目光投注于信號(hào)的二階統(tǒng)計(jì)量,研究信號(hào)間的相關(guān)關(guān)系,而是基于信號(hào)的高階,研究信號(hào)間的獨(dú)立關(guān)系,它將數(shù)據(jù)變換到相互獨(dú)立的方向上,使經(jīng)過(guò)變換所得到的各個(gè)分量之間不僅正交,而且相互獨(dú)立。
二、lCA在多媒體中的應(yīng)用
獨(dú)立分量分析算法由于具有處理后分量相互獨(dú)立的特點(diǎn),被作為一種信號(hào)處理的新方法,在通信信號(hào)處理、語(yǔ)音信號(hào)處理、生物醫(yī)學(xué)信號(hào)處理、金融數(shù)據(jù)分析、陣列信號(hào)處理及通用信號(hào)分析等方面有著非常重要的應(yīng)用。這種方法最初是被用于信號(hào)分離中,通常把一些信號(hào)視為相互的獨(dú)立的信號(hào)相混疊得到的,經(jīng)過(guò)ICA分解后可以得到這些相互獨(dú)立的信號(hào)。ICA在多媒體信號(hào)的應(yīng)用中離不開(kāi)信號(hào)的特征提取?;贗CA的特征提取為各種多媒體信號(hào)處理提供了很好的支持。
1.多媒體信號(hào)基于ICA的特征提取。ICA在多媒體信號(hào)處理中的應(yīng)用主要是基于ICA對(duì)多媒體信號(hào)的特征提取。特征提取的本質(zhì)是將高維向量空間映射到一個(gè)低維子空間中,使得原來(lái)在高維空間中表示的復(fù)雜信號(hào)投影到低維空間后,其與分類有意義的主要特征得以顯現(xiàn)。特征提取的主要目的是找到對(duì)觀測(cè)信號(hào)的一組特征表示。設(shè)計(jì)對(duì)觀測(cè)信號(hào)的統(tǒng)計(jì)生成模型是信號(hào)處理的基本方法,生成模型中的各個(gè)分量組成了對(duì)觀測(cè)數(shù)據(jù)的一種表示,這種表示可以用于數(shù)據(jù)的壓縮、去噪聲和模式識(shí)別等任務(wù)中。
可以假設(shè)變換后的表示成分的數(shù)量與觀測(cè)信號(hào)相同。這種線性疊加模型給出了一種信號(hào)在低階的有效描述,這里舍棄了高階的非線性部分。另一個(gè)方面,對(duì)于多媒體信號(hào)而言,其中大部分重要特征信息與信號(hào)的高階統(tǒng)計(jì)特性有著密切的關(guān)系。2.基于分塊的ICA特征提取。在當(dāng)前實(shí)際應(yīng)用,通常是將多媒體信號(hào)分塊或是利用窗口將其分解。對(duì)于圖像,通常是將圖像分成8×8或是16×16像素塊,并把這些塊作為ICA模型中的觀測(cè)信號(hào),再通過(guò)ICA,得到源信號(hào);對(duì)于語(yǔ)音信號(hào),通常是將語(yǔ)音分成若干段,將這些段作為觀測(cè)信號(hào)進(jìn)行ICA處理。
通過(guò)上述方法得到的這些源信號(hào)是相互獨(dú)立的,可以視為圖像的特征,因此這一過(guò)程可以稱作特征提取。而基于分塊法(加窗口)的這種方法,可稱之為基于分塊(加窗口)ICA特征提取法。通常為了更能表現(xiàn)出特征,人們采用一些標(biāo)準(zhǔn)化手段。具體做法為:首先將圖像進(jìn)行線形標(biāo)準(zhǔn)化,使得像素具有零均值、單位方差;然后將圖像分成塊,再進(jìn)行相關(guān)處理,最后得到ICA的向量基。
三、基于采樣和ICA的特征分析方法模型
本文提出將下采樣與ICA相結(jié)合的信號(hào)處理方法,該方法在將多媒體信號(hào)采樣的基礎(chǔ)上再進(jìn)行ICA處理,且不同于傳統(tǒng)的基于分塊的ICA特征提取方法。傳統(tǒng)的分塊法破壞了原始信號(hào)的全局特性,提取的特征只具有原始信號(hào)的局部特性,表征的意義并不是很明顯。而基于采用的ICA信號(hào)處理方法提取的特征具有原始信號(hào)的整體特性,且與小波多尺度分析十分相似。
1.二層、高層分解模型。在小波分析理論中,信號(hào)除了一層分解外還有二層、三層乃至高層的分析方法,在實(shí)際應(yīng)用中也被廣泛地應(yīng)用,如圖像、視頻的壓縮。超分辨率復(fù)原、數(shù)字水印等。因此,研究二層、高層的分解方法(ICAT)具有一定意義。
基于采樣和ICA的特征分析方法二層分解模型有兩種。其中,第一種與小波分析方法類似,把原始圖像將經(jīng)一層ICAT分解得到的各個(gè)分量繼續(xù)進(jìn)行一次ICAT處理。另一種方法是將圖像經(jīng)過(guò)采樣因子為4的采樣提取出16個(gè)子圖,對(duì)這16個(gè)圖像進(jìn)行ICA處理,這個(gè)過(guò)程稱為基于采樣因子為4的下采樣的ICAT。
2.離散小波變換(DWT)。離散小波變換(DiscreteWavelet transform)是當(dāng)前研究和應(yīng)用比較廣泛的信號(hào)處理方法,經(jīng)過(guò)十幾年的探索研究,理論基礎(chǔ)已經(jīng)非常成熟。離散小波變換是時(shí)間和頻率的局域化的變換,因而能有效地從信號(hào)中提取時(shí)頻分布參數(shù)。通過(guò)伸縮和平移等運(yùn)算可對(duì)函數(shù)或信號(hào)進(jìn)行多尺度的細(xì)化分析,解決了傅立葉變換不能解決的許多問(wèn)題,被認(rèn)為是時(shí)間一尺度分析和多分辨率分析的一種新技術(shù)。目前,它已被廣泛應(yīng)用于分形、信號(hào)處理、圖像處理、地震勘探、語(yǔ)音識(shí)別等應(yīng)用領(lǐng)域。
3.概貌分量的能量統(tǒng)計(jì)。小波多尺度分析中,圖像分解得到概貌分量表示的是原始圖像的低頻子帶,是原始圖像能量最集中部分,因而被用于基于小波的圖像壓縮理論中重要環(huán)節(jié)。為此,應(yīng)把概貌部分的能量統(tǒng)計(jì)作為概貌分量的一個(gè)重要特性。統(tǒng)計(jì)的方法、步驟如下:
(1)將概貌分量進(jìn)行二維離散余弦變換(ZD-DCT)。
(2)對(duì)得到的離散余弦系數(shù)進(jìn)行zigzag掃描,將得到的DCT系數(shù)按從低頻到高頻依次排列。
(3)除第一個(gè)DCT系數(shù)(直流系數(shù))外,再按照從低頻到高頻的順序統(tǒng)計(jì)交流系數(shù)能量分別占整個(gè)交流系數(shù)總能量95%、90%的個(gè)數(shù),即統(tǒng)計(jì)前多少個(gè)低頻交流系數(shù)的能量可以占整個(gè)交流系數(shù)總能量的95%、90%。然后分別對(duì)一層、二層小波分析方法和ICAT分解方法進(jìn)行上述DCT統(tǒng)計(jì)分析。
(4)ICAT和DWT比較。通過(guò)對(duì)ICAT和DWT進(jìn)行比較,可發(fā)現(xiàn)由ICAT提取出來(lái)的特征與小波提取出來(lái)的特征具有相同的特性,分別具有原始圖像概貌、細(xì)節(jié)信息。此外在圖像處理方面,ICAT至少有三點(diǎn)優(yōu)于DWT。首先,同一幅圖像被不同的母小波分析。通常子帶的大小是不同的。如本文實(shí)驗(yàn)中采用Db4小波的一階子帶大小為259×259,略大于原始圖像的四分之一;而在ICAT中一階分量大小是恒定的,為256×256,為原始圖像的四分之一,因此ICAT的分析比較方便。其次,概貌分量能量統(tǒng)計(jì)的結(jié)果說(shuō)明ICAT的概貌分量能量與DWT提取的概貌分量相比,能量更加集中。也就是說(shuō)可以用相對(duì)較少的DCT系數(shù)恢復(fù)出同樣質(zhì)量的圖像。ICAT提取的細(xì)節(jié)分量與小波相比,具有更多的方向性細(xì)節(jié)。綜合上述兩個(gè)優(yōu)點(diǎn)可說(shuō)明,ICAT方法的稀疏性要強(qiáng)于DWT,即可以用較少的數(shù)據(jù)恢復(fù)相同質(zhì)量的圖像。總所周知,DWT能去除數(shù)據(jù)的相關(guān)性以達(dá)到減少數(shù)據(jù)的冗余的目的而被應(yīng)用于數(shù)據(jù)壓縮,并已經(jīng)作為JPEG2000壓縮標(biāo)準(zhǔn)的理論基礎(chǔ)。ICA獲得分量不僅不相關(guān)而且是統(tǒng)計(jì)獨(dú)立的,這能更在更大程度上減少數(shù)據(jù)的冗余。最后,ICAT也可以用于圖像邊緣提取方面,而且在圖像邊緣提取中不會(huì)引入誤差。
通過(guò)上述對(duì)比。得到如下結(jié)論:這種基于下采樣和ICA的圖像圖像分析方法(ICAT)將成為一種比較有前景的圖像處理方法,它將廣泛地應(yīng)用于圖像特征分析、圖像壓縮、邊緣提取、數(shù)字水印等領(lǐng)域。