趙薔,郭新明,張晉平
(咸陽(yáng)師范學(xué)院信息工程學(xué)院,陜西咸陽(yáng)712000)
圖像特征提取是圖像分析的主要內(nèi)容,可廣泛應(yīng)用于路網(wǎng)的提取、港口、機(jī)場(chǎng)、大型建筑物的快速識(shí)別,還可應(yīng)用于重要軍事目標(biāo)的搜索與監(jiān)控,也可用于生物醫(yī)學(xué)圖像處理、車牌識(shí)別等領(lǐng)域[1]。隨著高分辨率傳感器技術(shù)的發(fā)展和應(yīng)用,多頻譜衛(wèi)星遙感圖像的應(yīng)用越來越廣泛,在諸如國(guó)土資源調(diào)查、地質(zhì)及礦產(chǎn)勘探中都有著廣泛的應(yīng)用。要實(shí)現(xiàn)各種實(shí)際應(yīng)用,前提是能夠進(jìn)行快速、高精度的遙感圖像分類。因此,遙感衛(wèi)星圖像分類已經(jīng)成為獲取及處理遙感衛(wèi)星圖像信息的關(guān)鍵技術(shù)之一[2]。
在多光譜遙感衛(wèi)星圖像中,色彩信息或者稱為多光譜信息是非常重要的信息。目前多光譜信息已經(jīng)被廣泛應(yīng)用于遙感圖像的分類[3]。找到一個(gè)高效的色彩描述對(duì)于分類算法來說是必須,也是至關(guān)重要的?,F(xiàn)在的很多變換都是將圖像從RGB色彩空間變換到一個(gè)新的色彩空間,如HSV色彩空間和CMYK色彩空間。但這些變換與實(shí)際圖像本身是無關(guān)的,變換本身獨(dú)立于圖像。
近年來出現(xiàn)了一些傳統(tǒng)的圖像特征提取方法如小波變換、Gabor濾波器等,這些方法都需要大量計(jì)算。目前,人們研究的遙感圖像分類方法一般都是基于圖像的統(tǒng)計(jì)信息進(jìn)行分類[4]。高維數(shù)據(jù)對(duì)遙感圖像的特征提取是不利的。降維是一種有效的解決方法。但這種降維不僅要能夠使得數(shù)據(jù)從原始圖像空間轉(zhuǎn)化為維數(shù)減少的特征空間,同時(shí)還要盡量保留原始圖像的絕大部分信息[5]。目前常用的一種特征提取方法是基于子空間的方法[6]。其中,主成分分析(Principal Components Analysis,PCA)是國(guó)際上近幾年出現(xiàn)的特征提取的有力工具。PCA是一種最小均方意義上的最優(yōu)變換,去除輸入隨機(jī)向量之間的相關(guān)性,突出原始數(shù)據(jù)中的隱含特性,具有去相關(guān)性和降低維數(shù)的特點(diǎn)。獨(dú)立成分分析(Independent Components Analysis,ICA)是在PCA的基礎(chǔ)上發(fā)展起來的一種通過變換去掉變量相關(guān)性的方法,使得變量之間彼此盡可能統(tǒng)計(jì)獨(dú)立。
本文研究使用ICA對(duì)遙感圖像的色彩進(jìn)行描述,即在ICA空間中對(duì)遙感圖像進(jìn)行描述。該方法不僅僅通過分析目標(biāo)圖像的色彩信息進(jìn)行編碼,而且通過對(duì)圖像的空間和光譜信息進(jìn)行統(tǒng)計(jì)分析來達(dá)到對(duì)遙感圖像編碼。我們假設(shè)R、G、B的值是復(fù)合相關(guān)的,并依賴于很多因素,如物體的反射率和工具的功能。從相同的背景中,不同的圖片可以得到不同的色彩圖像。我們使用ICA分析高清晰度敏感圖像的色彩信息,用R、G、B的獨(dú)立成份來對(duì)像素進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,該方法取得了很好的分類效果。
獨(dú)立成分分析(Independent Component Analysis,ICA)是在PCA基礎(chǔ)上發(fā)展起來的圖像特征提取技術(shù)。ICA是一種基于數(shù)據(jù)高階統(tǒng)計(jì)信息的有效的數(shù)據(jù)獨(dú)立特征提取技術(shù),它能夠更好地表示圖像的局部特征。ICA是PCA從二階統(tǒng)計(jì)分析向高階統(tǒng)計(jì)分析的拓展,其目的是把混合成分分解為相互獨(dú)立的成分,它強(qiáng)調(diào)分解出來的各分量之間的相互獨(dú)立性[7]。
ICA則具有非高斯且統(tǒng)計(jì)獨(dú)立的特點(diǎn),方法不僅能夠過提取線性特征,還能夠獲取非線性特征[8]。ICA算法的基本思路在于求解變換矩陣W,使其作用于圖像的特征向量y,得到估計(jì)向量x′=Wy,在統(tǒng)計(jì)獨(dú)立的意義下使x′最逼近未知原向量x,即要找到變換矩陣W,使得x′的各個(gè)分量盡可能地相互獨(dú)立。
ICA模型可以描述如下:
假設(shè)數(shù)據(jù)向量x=(x1,x2,…,xm)可以被描述成基函數(shù)的線性組合:
這里,s=(s1,s2,…,sn)是系數(shù),A是一個(gè)M*N的矩陣,序列a1,a2,…an是基函數(shù)?;瘮?shù)是調(diào)和的。系數(shù)s隨數(shù)據(jù)變化。我們的目標(biāo)是尋找一個(gè)ai的集合,使得系數(shù)盡可能統(tǒng)計(jì)獨(dú)立(在一個(gè)數(shù)據(jù)集合上),這樣,線性分析的過程就是尋找一個(gè)矩陣W,它使得:
這樣就能重新獲得獨(dú)立成份s,s很可能是序列改變的、尺度可調(diào)的,W的行對(duì)應(yīng)的列。
在圖像分類處理的過程中,需要根據(jù)前期處理得到的數(shù)據(jù)進(jìn)行分類。分類的方法對(duì)分類的結(jié)果有著重要的影響。分類方式有兩種:一種是監(jiān)督分類法;另一種稱為非監(jiān)督分類法。
如果事先已經(jīng)知道樣區(qū)類別的信息,這種信息可以通過對(duì)待分類地區(qū)的目視判讀,實(shí)地勘查或結(jié)合GIS信息獲得。在這種情況下對(duì)非樣本數(shù)據(jù)進(jìn)行分類的方法稱為監(jiān)督分類。常用的監(jiān)督分類方法有Euclid Distance法和Maximum Likelihood法
非監(jiān)督分類法以群集為理論基礎(chǔ),通過計(jì)算機(jī)對(duì)圖像進(jìn)行聚集統(tǒng)計(jì)分析的方法[9]。根據(jù)對(duì)分類樣本參數(shù)的統(tǒng)計(jì)特征,建立決策規(guī)則來進(jìn)行分類。不需要事先知道類別特征,把各個(gè)樣本的空間分布按期相似性分割或合并一群集,常用的非監(jiān)督分類方法有K-means法。
本文中使用的分類算法是最大相似度分類器(Maximum Likelihood)。該方法是一種靜態(tài)分類方法,屬于監(jiān)督分類法。
對(duì)于基數(shù)Xkn(k=1,2…5;n=1,2,…10),其最大相似度p(x|k)的公式為
其中Mk為平均向量,Σk為協(xié)方差矩陣
在RGB空間的3種主正交軸中,第一個(gè)是RGB的和,描述了光線的水平和級(jí)別,其它兩個(gè)分別描述了藍(lán)-黃、紅-綠之間的對(duì)比機(jī)制。這些色彩的對(duì)比機(jī)制依賴于實(shí)驗(yàn)的數(shù)據(jù),并沒有固定的形式。在來自RGB色彩空間的3個(gè)基函數(shù)中,有2個(gè)是反向色彩模型。通過它們把RGB的響應(yīng)與相反的樣式聯(lián)系起來。值得注意的是這里沒有其他變換中與照明相對(duì)應(yīng)的成分。
本文提出一種將ICA算法與相結(jié)合的分類方法,先對(duì)衛(wèi)星圖像進(jìn)行ICA變換,獲得ICA空間的顏色特征,然后將訓(xùn)練樣本與測(cè)試樣本分別向該特征空間投影,獲得識(shí)別特征;最后利用最大相似度分類器進(jìn)行顏色分類。
具體步驟如下:
1)先求ICA算法的特征子空間WIca。
將圖像像素點(diǎn)的R、G、B值組成矩陣。
設(shè)訓(xùn)練樣本為xi,i=1,…n,n表示訓(xùn)練樣本的數(shù)目。假設(shè)顏色分類為5類。首先讀入樣本xi,i=1,…n,計(jì)算訓(xùn)練樣本的均值M和其協(xié)方差矩陣C,即
再分別計(jì)算各個(gè)類的樣本均值Mk,k=1,…5,即
其中,nk表示屬于第k類的樣本數(shù)。
本文使用Bell和Sejnowski提出的關(guān)于ICA的神經(jīng)學(xué)習(xí)算法。該方法是通過隨機(jī)梯度上升來獲取關(guān)聯(lián)熵的最大值[10]。其中,W的修正公式是:
其中Y=Wx,且g(y)=1-2/(1+e-y)由Y的每一個(gè)成分來計(jì)算。
在開始學(xué)習(xí)過程之前,x由下式計(jì)算:
其中,W0是白化濾波器,由下式計(jì)算:
完整的變換由白化矩陣和學(xué)習(xí)矩陣的積來實(shí)現(xiàn),即
試驗(yàn)中,L=0.01,I和w都是單位陣。
迭代次數(shù)為:max=100,
迭代公式為:
2)對(duì)于基數(shù)Xkn(k=1,2,…,5;n=1,2,…10),計(jì)算平均向量Mk和協(xié)方差矩陣Σk
平均向量Mk:
3)對(duì)于圖像中的每一個(gè)像素點(diǎn)x(i,j),用ICA提取其顏色特征Y
4)計(jì)算該像素點(diǎn)x(i,j)對(duì)于每組的最大相似度值p(x|k),其中k=1,2,…5
5)對(duì)像素點(diǎn)x(i,j),若p(x|c)的取值最大(1<c<5),就把該像素點(diǎn)分在該類中,把該類的均值賦給它,即
6)瀏覽圖像,對(duì)每個(gè)像素點(diǎn)重復(fù)3)~5)步。
在實(shí)驗(yàn)中,選取一個(gè)IKONOS衛(wèi)星遙感圖像(如圖1),訓(xùn)練數(shù)據(jù)集包括100個(gè)樣本,選取5種顏色,每類選取20個(gè)訓(xùn)練樣本。一個(gè)樣本像素有3個(gè)值,分別對(duì)應(yīng)R、G和B。在試驗(yàn)中不考慮圖像紋理信息。
該遙感圖像是美國(guó)Space Imaging公司于2005年6月20日拍攝的IKONOS多頻譜衛(wèi)星遙感圖像,圖像大小為350×4 500像素。在Matlab7.0中進(jìn)行該實(shí)驗(yàn),實(shí)驗(yàn)平為臺(tái):CPU Intel酷睿2雙核T5600,主頻1.66 GHz,內(nèi)存1GB,顯示器分辨率1 280×800。
ICA學(xué)習(xí)過程重復(fù)了100次,其結(jié)果變換矩陣為:
圖1 衛(wèi)星遙感圖像Fig.1 Remote sensing image
一個(gè)像素的光譜成分為:
實(shí)驗(yàn)中,首先對(duì)原始衛(wèi)星圖像進(jìn)行ICA變換,得到圖像在ICA空間的R、G、B圖像及其顏色直方圖。圖2圖是原始圖像的顏色直方圖,(b)圖是經(jīng)ICA變換的圖像的顏色直方圖。
圖2 顏色直方圖Fig.2 Histograms of images
圖3 顏色分類圖像Fig.3 Classification by color features
圖2中的(a)圖是原始圖像的RGB直方圖。其中,3個(gè)直方圖有非常相似的形狀。G的分布比R和B更密一些,意味著RGB是高度相關(guān)的,并且G包含更多的信息。變換的前兩個(gè)軸反射回一個(gè)反轉(zhuǎn)色彩模型,通過它把R、G、B與相反的色彩成分結(jié)合起來,這與許多色彩變換的觀點(diǎn)是類似的。(a)圖中兩個(gè)圖有類似的色彩特征。3個(gè)獨(dú)立成分的分布如圖(b),與(a)圖中RGB的分布完全不同,3個(gè)獨(dú)立成分有非常不同的分布空間,主要分布在[15,30],[0,10],[30,100]。這說明獨(dú)立成分是RGB的反轉(zhuǎn)的結(jié)合,具有互補(bǔ)的分布。值得注意的是,這里沒有和的成分(通常它會(huì)在許多變換中出現(xiàn),如主成分分析中得到)。相反,最后一個(gè)成分主要由G來描述,這里R反轉(zhuǎn)成了B,
圖3中(a)圖是在直接在RGB空間的顏色分類圖像,采用最大相似度分類器進(jìn)行顏色分類。(b)圖是經(jīng)ICA變換的顏色分類圖像。從分類結(jié)果來看,采用ICA變換的顏色分類結(jié)果比在RGB空間效果更好,因?yàn)闆]有亮度成分,該方法較少受到照明度的影響。道路和草的像素用獨(dú)立成分分類效果較好。尤其是對(duì)大海、土地和森林的分類效果,更加接近原始圖像。
本文提出并研究了一種基于獨(dú)立成分分析方法的衛(wèi)星圖像顏色特征提取算法,將原始衛(wèi)星圖像投影到ICA空間中,提取圖像的光譜獨(dú)立成分,得到其顏色特征,再利用Maximum Likelihood對(duì)結(jié)果進(jìn)行分類。獨(dú)立成分是RGB的反轉(zhuǎn)的結(jié)合,具有互補(bǔ)的分布,沒有和的成分,且更獨(dú)立于照明度的影響。該算法去掉了原始衛(wèi)星圖像中大量冗余信息,僅保留有用的信息,得到了不受照明的影響的光譜主成分獲得的圖像特征。實(shí)驗(yàn)表明,該方法能高效的描述衛(wèi)星圖像的顏色特征,分類準(zhǔn)確度高。如何在算法中結(jié)合圖像的紋理信息來提高分類效果是該算法有待繼續(xù)深入探討的問題。
[1] 付毓生,謝艷,皮亦鳴,等.基于獨(dú)立分量分析的極化SAR圖像非監(jiān)督分類方法[J].電波科學(xué)學(xué)報(bào),2007,22(2):255-260.FU Yu-sheng,XIE Yan,PI Yi-ming,et al.Unsupervised classification of polarimetric synthetic aperture radar images based on independent component analysis[J].Chinese Journal of Radio Science,2007,22(2):255-260.
[2] 宦若虹,楊汝良.基于KFD+ICA特征提取的SAR圖像目標(biāo)識(shí)別[J].系統(tǒng)工程與電子技術(shù),2008,30(7):1237-1240.HUAN Ruo-hong,YANG Ru-liang.SAR image target recognition based on KFD+ICA feature extraction[J].Systems Engineering and Electronics,2008,30(7):1237-1240.
[3] 萬朋,王建國(guó),趙志欽,等.SAR圖像點(diǎn)目標(biāo)的檢測(cè)[J].電波科學(xué)學(xué)報(bào),2000,15(1):55-59.WAN Peng,WANG Jian-guo,ZHAO Zhi-qin,et al.Detection forSAR image point-target[J].Chinese Journal of Radio Science,2000,15(1):55-59.
[4] Oja E.Principal components,minor components,and linear neural networks[J].NeuralNetworks,1992,5(6):927-935.
[5] 余豐寧,蔡啟銘.主成分監(jiān)督分類及其在水質(zhì)特征遙感圖像識(shí)別中的應(yīng)用[J].湖波科學(xué),1997,9(3):261-268.YU Feng-ning,CAI Qi-ming.Application of principal component classification and recognition in remote sensing image in the water quality characteristics[J].Journal of Lake Science,1997,9(3):261-268.
[6] 張麗丹,黃鳳崗,李先偉.基于監(jiān)督式ICA的人臉識(shí)別[J].哈爾濱工程大學(xué)學(xué)報(bào),2006,27(52):748-751.ZHANG Li-dan,HUANG Feng-gang,LI Xian-wei.Face recognition based on supervised independent component analysis[J].Journal of Harbin Engineering University,2006,27(52):748-751.
[7] 曾生根,王小敏,范瑞彬,等.基于獨(dú)立分量的遙感圖像分類技術(shù)[J].遙感學(xué)報(bào),2004,8(2):150-157.ZENG Sheng-gen,WANG Xiao-min,F(xiàn)AN Rui-bin,et al.Classification of Remote sensing image based on independent component analysis[J].Journal of Remote Sensing,2004,8(2):150-157.
[8] 黃啟宏,王帥,劉釗.改進(jìn)的基于獨(dú)立成分分析的圖像顏色特征提取算法[J].光電工程,2007,34(1):121-125.HUANG Qi-hong,WANG Shuai,LIU Zhao.Improved algorithm of image feature extraction based on independent component analysis[J].Opto-Electronic Engineering,2007,34(1):121-125.
[9] 陳華,陳書海,張平,等.K-means算法在遙感分類中的應(yīng)用[J].紅外與激光工程,2000,29(2):26-30.CHEN Hua,CHEN Shu-hai,ZHANG Ping,et al.Application of K-means classification in remote sensing[J].Infrared and Laser Engineering,2000,29(2):26-30.
[10] Dubuisson-Jolly MP,Gupta A.Color and texture fusion:application to image segmentation and GIS updating[J].Image and Vision Computing,2000(18):823-833.