李咨興 唐堅剛 劉叢
摘 要:傳統(tǒng)模糊C均值算法沒有充分利用像素周圍的空間信息,所以算法抗噪效果不理想,且該算法僅利用像素隸屬度信息,分割規(guī)則過于單一。因此,提出一種基于包含度及空間信息的聚類算法以提高圖像分割抗噪性和準(zhǔn)確性。首先將包含度信息加入到目標(biāo)函數(shù)中,以彌補隸屬度單一化的不足;其次將像素周圍的鄰域信息作為空間信息加入到目標(biāo)函數(shù)中,使用信息熵與交叉熵調(diào)節(jié)像素信息和空間信息之間的權(quán)重;最后使用梯度下降法優(yōu)化該目標(biāo)函數(shù)以便對圖像進行正確分割。以4組衛(wèi)星圖像為例進行分割,并分別與FCM算法、PCM算法、AFCM_S1算法進行對比。實驗結(jié)果表明,基于包含度和空間信息的聚類算法對噪聲點具有較好的處理效果,可提升分割精度和負(fù)率度。
關(guān)鍵詞:模糊C均值;聚類分析;圖像分割;空間信息;包含度
DOI:10. 11907/rjdk. 181894
中圖分類號:TP317.4文獻標(biāo)識碼:A文章編號:1672-7800(2019)002-0148-05
Abstract: Since fuzzy C means algorithm does not make full use the spatial information, it is not ideal for noise reduction, and this algorithm applies membership degree as the only segmentation criterion. To solve these problems,this article proposes a novel clustering model based on inclusion degree and spatial information for enhancing noise resistance and accuracy of image segmentation. Firstly, this model adds inclusion degree into objective function for making up the shortage of membership degree. Secondly, this model adds spatial information into objective function and applies information entropy and cross entropy to obtain the weights of pixel information and spatial information. Three sets of satellite images are used for showing the goodness of the proposed method, and it is also compared with the FCM algorithm and AFCM_S1 algorithm respectively. According to the experimental results,this novel model has a good effect on noise resistance and improves the ACC and NRM.
Key Words:fuzzy C-mean; clustering analysis; image segmentation; spatial information; inclusion degree
0 引言
近年來,聚類技術(shù)在遙感圖像分割中發(fā)揮了重要作用。該技術(shù)使用圖像顏色、紋理及形狀等視覺特征將相似性較大的區(qū)域聚集到一起,使同一區(qū)域內(nèi)的像素盡量相似,不同區(qū)域的像素盡量不同[1-4]?,F(xiàn)有多種聚類算法,其中FCM算法最為常用,該算法將隸屬度信息加入到算法迭代中,軟化像素屬于某一類的強度,在比較復(fù)雜的遙感圖片分割中獲得了較好的效果[5-6]。
雖然FCM算法在遙感圖像分割中獲得了廣泛應(yīng)用,但該算法基于像素進行分割,所以噪聲點處理并不是很理想。由于衛(wèi)星成像技術(shù)的制約,遙感圖像在成像時會出現(xiàn)諸如像素不清晰、離散或者成塊等問題,嚴(yán)重影響FCM算法分割效果。基于此,眾多研究者將圖像空間信息加入到FCM算法中。Ahmed等[7]將像素周圍空間信息加入到FCM算法中,提出FCM_S算法,對目標(biāo)函數(shù)進行修改以增加算法對于噪聲點的魯棒性,提高分割結(jié)果精度。然而隨著圖像像素的增加,F(xiàn)CM_S算法計算每個像素點與周圍鄰域之間的關(guān)系耗時較大,且該方法計算也有一定重復(fù),會產(chǎn)生較多的冗余信息,所以Chen等[8]在FCM_S基礎(chǔ)上提出了基于鄰域灰度均值的FCM_S1模型,該模型利用像素點領(lǐng)域內(nèi)的平均灰度代替該點的灰度,對高斯噪聲有良好的處理效果,提升了算法計算速度和精度,但是FCM_S1對椒鹽噪聲效果較差,因此Chen等在FCM_S1的基礎(chǔ)上,又提出了基于鄰域中值濾波算法的FCM_S2模型,以處理圖像上的椒鹽噪聲[9]。針對FCM_S算法在運行過程中冗余信息較多、處理速度較慢的問題,Szilagyi等[9]提出En_FCM模型,首先獲得每個像素點鄰域平均值,用平均值形成一幅新的圖像,然后利用新圖像在直方圖上進行算法操作,由于圖像的灰度級一般在0~255,其值遠遠小于圖像的像素點數(shù)量,所以該算法進一步提高了執(zhí)行效率。上述算法的目標(biāo)函數(shù)中都有需要手動調(diào)節(jié)的平衡參數(shù),該參數(shù)可平衡圖像細(xì)節(jié)和異常值之間的權(quán)重,而每幅衛(wèi)星圖像對應(yīng)的參數(shù)值未必相同,需手動調(diào)節(jié)以獲得最優(yōu)值。為實現(xiàn)算法參數(shù)的自動化,Krinidis等[10]將像素點和其鄰域內(nèi)的歐氏距離作為空間信息,同時將灰度信息考慮在內(nèi),實現(xiàn)了平衡參數(shù)自動獲取。Zhong等[11]將像素點領(lǐng)域內(nèi)各個點的信息熵作為灰度信息與空間信息之間的權(quán)重,也解決了需要手動調(diào)節(jié)該參數(shù)的問題。
在增加空間信息的改進中,研究者大都集中在隸屬度的設(shè)置上,但如果僅考慮隸屬度會使聚類標(biāo)準(zhǔn)過于單一。基于此,Krishnapuram等[12]將類中心對各個像素點的包含度作為新的聚類準(zhǔn)則聚類,提出了PCM算法,并通過實驗證明PCM算法對噪聲值和異常值不敏感,能夠較好地聚類,但該算法缺少數(shù)據(jù)和類中心點之間的緊密聯(lián)系,對于中心點的選擇十分敏感,會導(dǎo)致一致性聚類的結(jié)果。因此研究者提出將隸屬度和包含度同時加入到目標(biāo)函數(shù)優(yōu)化中[13-17],使最終圖像分割結(jié)果相較于只考慮隸屬度的算法獲得了較大改進。
針對上述問題,本文提出了一種新的模型,該算法模型將包含度作為第二種分類規(guī)則加入到隸屬度中以提高聚類精度,并且將空間信息加入到聚類模型中,使用信息熵和交叉熵自動確定像素信息與空間信息之間的平衡,稱其為自動結(jié)合包含度與空間信息的圖像分割算法(Adaptive Combing Inclusion degress and Spatial Information Image Segmetation,ACIS)。
1 相關(guān)工作
本節(jié)首先介紹兩種相關(guān)算法:FCM算法和AFCM_S1算法。
通過最小化公式(1)使圖像獲得最佳分割結(jié)果。但FCM算法是一種基于像素的分割方法,且只使用單一的隸屬度標(biāo)準(zhǔn)對像素點進行聚類,對噪聲點的處理并不理想。
1.2 AFCM_S1算法
AFCM_S1算法在傳統(tǒng)FCM算法的基礎(chǔ)上加入了像素周圍的空間信息,以降低噪聲點對分類造成的影響,同時利用信息熵平衡像素信息與空間信息的權(quán)重。AFCM_S1算法的模型如公式(5)所示。
目標(biāo)函數(shù)為:
其中,[xj]是第j個點的像素灰度,[xj]是[xj]點周圍鄰域內(nèi)所有點的平均灰度,[αj]是利用信息熵計算的調(diào)節(jié)參數(shù),第一項描述像素信息緊湊度,第二項描述空間信息緊湊度,再使用梯度下降法求解,可獲得迭代公式(6)和(7)。
中心點更新公式為:
隸屬度更新公式為:
[Ej]表示第j個像素的信息熵,如公式(10)所示。[Emax]與[Emin]分別表示所有像素點最大和最小的信息熵,公式(9)可以將信息熵的范圍映射到[0,1]。如果第j個點比較明確地屬于某一個類,則該點對應(yīng)的熵比較小。如果該點隸屬度比較平均,表明其沒有明確地屬于某一個類,可使用[αj]值增加周圍信息的權(quán)重。
2 基于包含度及空間信息的聚類算法
2.1 目標(biāo)函數(shù)
本文提出ACIS算法,該算法利用包含度、隸屬度計算信息熵及交叉熵,將信息熵與交叉熵的比值作為鄰域空間信息,在處理圖像中的噪聲點和提高圖像的分割精度上有較高提升,其主要目標(biāo)函數(shù)如式(11)所示。
其中[xj]、[xj]及[uij]所指不變。[tij]是包含度,表示第i個類對[xj]的包含程度,滿足[j=1ntij=1],且0<[tij]<1。由于圖像中預(yù)定的聚類數(shù)目遠遠小于像素點數(shù)目,所以會導(dǎo)致[uij]和[tij]在運算數(shù)量級上相差很大。為了方便計算,令[j=1ntij=j=1nuij],由于需要優(yōu)化J(U,T,V)至最小值進行聚類,利用拉格朗日乘數(shù)法,加入約束條件,得式(12)。
2.2 參數(shù)[γj]設(shè)置
[γj]用于調(diào)整像素信息與空間信息之間的平衡,傳統(tǒng)算法通常用人工調(diào)節(jié)該參數(shù),本文為了使算法具有較高的自適應(yīng)性,使用隸屬度的信息熵[18]及隸屬度、包含度的交叉熵[19]設(shè)計該參數(shù)。公式(16)為第j個像素點的交叉熵,交叉熵越大,說明該像素點屬于某類的可能性(隸屬度和某類包含該點的可能性),或者說隸屬度差異性越大,即分類存在歧義性,該點分類情況不確定。[Ej]為第j個像素的信息熵,使用公式(10)計算。其值越大,說明該點越模糊,難以分類。[Rj]值越大,說明該點的隸屬度和包含度不相似,存在分類歧義的情況。
為了統(tǒng)一各參數(shù)之間的數(shù)量級,分別對信息熵[Ej]和交叉熵[Rj]進行歸一化,如公式(17)和(18)所示。
而后使用式(19)取信息熵和交叉熵的比值,若第j個點屬于某類的可能性和該類包含該點的可能性都較大,則[Lj]的值較小;反之則增加其空間信息。
而后對式(19)歸一化可得[γj]。
2.3 ACIS算法流程
ACIS算法描述如下:
輸入:遙感圖像DATA,聚類個數(shù)C,結(jié)束閾值ε
輸出:圖像分割結(jié)果
如果隸屬度U及包含度T的誤差同時小于ε,根據(jù)MAX(U×T),輸出聚類結(jié)果;否則重復(fù)步驟(2)-(5)。
3 實驗結(jié)果與分析
為展示ACIS算法有效性,將其與FCM算法和AFCM_S1算法進行對比。算法參數(shù)為m=2,ε=0.000 1。
3.1 評價指標(biāo)
為定量評價3個算法實驗結(jié)果,本文采用ACC表示分割精度,NRM表示負(fù)率度[20-21],兩種指標(biāo)分別定義為:
其中,TP是被劃分到正確類中的目標(biāo)像素數(shù);FP是原屬于其它類但被誤分到目標(biāo)中的像素點數(shù);FN是原屬于目標(biāo)但被誤分到其它類的像素點的數(shù)量。對于算法的圖片分割結(jié)果,ACC指標(biāo)數(shù)值越大,NRM指標(biāo)數(shù)值越小,說明分割結(jié)果越好。
3.2 圖像分割實驗結(jié)果
分別用本文算法ACIS、FCM算法和AFCM_S1算法對3張遙感圖像以及1張自然圖像進行分割實驗。其中圖1(a)是棒球場、(b)是飛機、(c)是河流、(d)是船,前3幅圖像是分辨率為0.5m的Worldview-2遙感圖像,每幅影像的尺寸大小都為256*256像素,圖1(d)是Berkeley圖像庫的自然圖像,尺寸大小為321*481像素,如圖1所示。
圖1(a)中棒球場由右上角的不規(guī)則扇形沙土地及草地兩個地物目標(biāo)構(gòu)成,但是在草地上還有部分離散的沙土地;圖1(b)飛機圖像中背景較為復(fù)雜,主要包含飛機及水泥地兩類地物目標(biāo),但在地面上還有道路標(biāo)識、車輪痕跡等;圖1(c)河流圖中的背景較為復(fù)雜,但主要包含河流和草地兩類地物目標(biāo),但在草地當(dāng)中含有離散的沙土地;圖1(d)的目標(biāo)物包括沙地和高速公路,但在沙地中有大量離散的灌木叢。圖1(e)目標(biāo)物體包括綠地和沙坑,但是在沙坑中存在部分樹木,會影響分割結(jié)果。圖1(f)的目標(biāo)物包括船和湖泊兩個目標(biāo),但在湖面上有大量波紋對分類產(chǎn)生影響。在本文實驗過程中,只需要分割出上述目標(biāo)物體,其它部分的信息都被視為噪聲信息點,例如在棒球場中,應(yīng)當(dāng)將右上角的沙土地和草地分開,草地中沙土地的像素點越少越好。因此,將各個圖像的分割區(qū)域數(shù)都設(shè)置為兩類。圖2包括了FCM算法、AFCM_S1算法以及本文算法對各種圖像的分割結(jié)果。
在圖1(a)-(e)中,存在著大量離散的噪聲點,而在船的圖像中存在著大量連續(xù)的噪聲。從圖1(a)-(d)對應(yīng)的分割結(jié)果可以看出,PCM算法抗噪能力較差,將大量噪聲點錯分到別的類中,嚴(yán)重影響了分割結(jié)果。FCM算法分割結(jié)果優(yōu)于PCM算法,但是對于離散點的處理依舊存在不足。而AFCM_S1算法和ACIS算法通過加入空間信息能夠較好地處理離散噪聲。但是AFCM_S1算法并不能很好處理處理圖1(e)、(f)中的連續(xù)噪聲(馬路邊沿、水面波紋)。ACIS算法加入包含度和隸屬度進行空間信息計算,對連續(xù)噪聲也有較好的處理效果。通過對圖2的分割結(jié)果綜合分析、對比可以看出,AFCM_S1能夠較好地處理離散的噪聲點,但是在處理連續(xù)噪聲時會出現(xiàn)誤分。本文算法在目標(biāo)物體分割過程中,取得了較好的分割結(jié)果,有效降低了噪聲信息點對分割的影響,提高了分割結(jié)果準(zhǔn)確度。AFCM_S1在處理連續(xù)噪聲時會出現(xiàn)誤分,而本文算法能夠較好處理連續(xù)噪聲。
4 結(jié)語
為了彌補傳統(tǒng)FCM算法的不足,本文從兩方面作出改進。首先將包含度作為一種新的度量規(guī)則加入到隸屬度中,提高了圖像分割精度;其次將像素空間信息加入到分割模型中,可以對圖像中的噪聲點進行有效處理。為了提高算法自適應(yīng)性,利用信息熵與交叉熵的比值自動調(diào)節(jié)模型中像素信息和空間信息之間的權(quán)重。將傳統(tǒng)FCM算法和AFCM_S1算法進行對比,可知本文算法具有較好的效果,但本文算法運行時間較長,如何提升算法運行速度和算法對圖像的分割精度是后續(xù)研究重點。
參考文獻:
[1] 王愛民,沈蘭蓀. 圖像分割研究綜述[J]. 測控技術(shù),2000,19(5):1-6.
[2] GHOSH A,MISHRA N S,GHOSH S,et al.? Fuzzy clustering algorithms for unsupervised change detection in remote sensing images[J]. Information Sciences, 2011, 181 (4) :699-715.
[3] NIAZMARDI S, HOMAYOUNI S, SAFARI A,et al. An improved FCM algorithm based on the SVDD for unsupervised hyper spectral data classification[J]. IEEE Geoscience & Remote Sensing Society. 2013,6 (2):1939-1404.
[4] 曹易, 張寧. 一種改進的模糊C-均值聚類算法[J]. 上海理工大學(xué)學(xué)報, 2012, 34(4):351-354.
[5] LI X,LIU H,WANG F. The survey of fuzzy clustering method for image segmentation[J]. Journal of Image and Graphics,2012,17(4): 447-458.
[6] WANG A M,SHEN L S.Study surveys on image segmentation [J].Measurement&Control Technology,2000,19(5): 1-7.
[7] AHMED M N, YAMANY S M, MOHAMED N, et al. A modified fuzzy c-means algorithm for bias field estimation and segmentation of MRI data[J]. IEEE Transactions on Medical Imaging,2002, 21 (3) :193-199.
[8] CHEN S,ZHANG D.? Robust image segmentation using FCM with spatial constraints based on new kernel-induced distance measure[J]. IEEE Systems,Man, and Cybernetics Society,2004,34(4):1907-1916.
[9] SZILAGYI L,BENYO Z,SZILAGYI S M,et al. MR brain image segmentation using an enhanced fuzzy c-means algorithm[C] 25th Annual International Conference of IEEE Engineering in Medicine and Biology Society,2003:724-726.
[10] KRINIDIS S,CHATZIS V. A robust fuzzy local information C-Means clustering algorithm[J]. IEEE Transactions on Image Processing,2010,19(5):1328-1337.
[11] ZHONG Y, MA A, ZHANG L. An adaptive memetic fuzzy clustering algorithm with spatial information for remote sensing imagery[J]. IEEE Geoscience & Remote Sensing Society,2014,7(4):1235-1248.
[12] KRISHNAPURAM R, KELLER J. A possibilistic approach to clustering[J]. IEEE Transaction of Fuzzy System, 1993,1:98-110.
[13] PAL N R,PAL K ,BEZDEK J C .A possibilistic fuzzy c-means clustering algorithm[J]. IEEE Tram Fuzzy Systems,2005,13(4): 517-530.
[14] PAL N R ,PAL K,BEZEDEK J C. A new hybrid C-means clustering model[C]. Proceedings of IEEE International Coference on Fuzzy Systems, 2004:179-184.
[15] ZHANG J S,LEUNG Y W. Improved possibilistic c—means clustering algorithms[J].IEEE Transactions on Fuzzy Systems,2004,12(2):209-217.
[16] ZHAO Q H,LIU D,LI X L,etc. Fuzzy segmentation algorithm for remote sensing images using inclusion degree and membership degree[J]. Journal of Image and Graphics,2017,22(7):988-995.
[17] ZHOU C B,LIU C C. Interactive image segmentation based on region merging using hierarchical match mechanism.[C] International Conference on Computer Science & Service System , 2012:1781-1784
[18] SHANNON C E. A mathematical theory of communication[J]. Bell System Technical Journal, 1997, 14(4):306.
[19] RUBINSTEIN R Y, KROESE D P. The cross-entropy method[M]. New York: Springer, 2004.
[20] 羅希平, 田捷, 諸葛嬰,等. 圖像分割方法綜述[J]. 模式識別與人工智能,1999(3):300-312.
[21] 許新征, 丁世飛, 史忠植,等. 圖像分割的新理論和新方法[J]. 電子學(xué)報,2010, 38(s1):76-82.
(責(zé)任編輯:江 艷)