任志武
(遼寧省自然資源事務(wù)服務(wù)中心遼寧省基礎(chǔ)測(cè)繪院,遼寧錦州 121003)
隨著遙感技術(shù)的發(fā)展,圖像分類技術(shù)重要的理論和實(shí)踐應(yīng)用價(jià)值日益凸顯。模糊聚類分析技術(shù)是一種根據(jù)客觀事物之間的特征和隸屬程度,通過建立模糊相似關(guān)系對(duì)客觀事物進(jìn)行聚類的分析方法,在一定程度上能夠解決混合像元的問題[1]。其中,模糊C 均值聚類(Fuzzy C-means,簡(jiǎn)稱FCM)算法應(yīng)用最為廣泛,但它沒有考慮空間約束的作用,在分類的過程中對(duì)噪聲及異常值極其敏感[2]。Cai[3]提出(Fast Generalized FCM,簡(jiǎn)稱FGFCM)促進(jìn)鄰域控制參數(shù)的選擇,提高算法的抗噪能力?;鹬也剩?]在此基礎(chǔ)上提出了隱馬爾科夫隨機(jī)場(chǎng)模糊C 均值(Hidden Markov Random Field FCM,HMRF-FCM)算法,在熵FCM 的基礎(chǔ)上,將馬爾科夫隨機(jī)場(chǎng)理論引入到FCM 聚類分析中,建立基于鄰域的標(biāo)號(hào)場(chǎng)模型,使圖像分類結(jié)果更加可靠。
本文在FCM 的基礎(chǔ)上,提出將空間約束融入到FCM 算法中。引入鄰域像素后,算法能夠平滑部分噪聲及異常值,提高抗噪能力,進(jìn)而達(dá)到提高圖像分類精度的目的。
FGFCM 定義了一個(gè)相似性測(cè)度,計(jì)算像素之間的相似度,然后結(jié)合鄰域關(guān)系和空間關(guān)系,重新產(chǎn)生一個(gè)新的圖像,并用這個(gè)新圖像代替原來的圖像進(jìn)行聚類分析[5]。
FGFCM 算法的基本思想與FCM 算法相近,故而模型建立最終也是求取模糊隸屬度。令隸屬度初始值為零,經(jīng)迭代之后的隸屬度為比對(duì)值,從而得到最終隸屬度[6]。首先需要計(jì)算出γi(i=1,2,…n),其與i具有相同顏色像素的個(gè)數(shù);之后根據(jù)像素點(diǎn)的坐標(biāo),計(jì)算出相似性測(cè)度,并利用此求得新的圖像,計(jì)算公式如式(1)所示:
式中:i為第i個(gè)像素;j為第j個(gè)像素;Sij為第i個(gè)像素和第j個(gè)像素的相似度;(pi,qi)為像素的坐標(biāo);xi為i的顏色,xj為j的顏色;λs、λg為控制參數(shù);Si定義如式(2)所示:
利用這個(gè)相似性測(cè)度,結(jié)合鄰域關(guān)系、空間關(guān)系重新產(chǎn)生新的圖像,并用這個(gè)新圖像代替原來的圖像進(jìn)行聚類分析。其目標(biāo)函數(shù)如式(3)所示:
式中:γi為與像素i具有相同顏色像素的個(gè)數(shù);uij為第i個(gè)像素隸屬于第j個(gè)像素聚類程度;M為顏色的總數(shù);N為像素個(gè)數(shù);c為聚類數(shù);vj為第j個(gè)像素聚類的聚類中心;m為模糊因子;ξi為新生成的圖像[7]。
綜上所述,F(xiàn)GFCM 算法實(shí)現(xiàn)的流程如圖1 所示。
圖1
1)給定聚類數(shù)目c,加權(quán)指數(shù)m,e為終止迭代的判斷參數(shù);
2)用[0,1]之間的隨機(jī)數(shù)對(duì)隸屬矩陣初始化,利用初始聚類中心,并設(shè)置迭代數(shù)Z=0,且迭代次數(shù)Z<LOOP;
3)計(jì)算聚類中心;
4)計(jì)算隸屬度矩陣;
5)如果聚類度<e,則停止;否則,令Z=Z+1,返回第4 步繼續(xù)算法迭代。
為測(cè)試FCM、FGFCM、HMRF-FCM 3 種算法對(duì)遙感影像的分類效果和精度,試驗(yàn)選取了4 張自然紋理圖像和4 張真實(shí)遙感圖像,尺度為128×128 像素,通過編寫代碼對(duì)影像進(jìn)行自動(dòng)分類處理。用定性分析來評(píng)價(jià)不同算法的特點(diǎn)和分類效果,通過計(jì)算用戶精度、產(chǎn)品精度、總體精度以及Kappa 系數(shù)(簡(jiǎn)稱Ka 系數(shù))來定量評(píng)價(jià)3 種算法的分類精度。
為了進(jìn)一步驗(yàn)證引入FGFCM 及HMRF-FCM算法的普適性,選取4 張自然紋理圖像來進(jìn)行驗(yàn)證,分類數(shù)分別設(shè)為2、2、3、4。3 種分類算法的分類疊加結(jié)果如圖2 所示。
圖2 自然紋理圖像分類比較
由圖2 可知:分別采用FCM、FGFCM、HMRFFCM 3 種算法對(duì)圖2(a1)紋理圖像1 進(jìn)行分類,設(shè)置分類參數(shù)為2。提取分類結(jié)果的輪廓線與原圖進(jìn)行疊加,從試驗(yàn)結(jié)果可以看出:FCM 算法分類效果較差,而其他兩種算法分類效果相對(duì)理想,噪聲少,且誤分的情況少。對(duì)圖2(b1)紋理圖像2 進(jìn)行分類,設(shè)置分類參數(shù)為2。FCM 算法分類效果不理想,噪聲較多;HMRF-FCM 算法分類效果稍好一些;FGFCM 算法分類效果最好,但由于圖像上類別差異不大,分類測(cè)試效果不明顯。對(duì)圖2(c1)紋理圖像3進(jìn)行分類,設(shè)置分類參數(shù)為3。經(jīng)FCM 算法分類后的圖片有明顯的噪點(diǎn),而其他兩種算法分類效果好一些。對(duì)圖2(d1)紋理圖像4 進(jìn)行分類,設(shè)置分類參數(shù)為4。對(duì)分類后的結(jié)果進(jìn)行分析,能夠看出,F(xiàn)CM 分類后的圖像出現(xiàn)了像素誤分的情況,HMRFFCM 分類后的圖像有細(xì)節(jié)損失,F(xiàn)GFCM 算法分類結(jié)果中的地物相對(duì)完整,且最大程度地保留了細(xì)節(jié)。
為了驗(yàn)證上述算法對(duì)真實(shí)遙感影像的處理效果,選取了部分典型地類的影像進(jìn)行試驗(yàn),試驗(yàn)結(jié)果如圖3 所示。
圖3 真實(shí)遙感圖像分類比較
由圖3 可知:對(duì)圖3(a1)影像進(jìn)行分類,設(shè)置分類參數(shù)為2。圖3(a2)-圖(a4)是經(jīng)FCM 算法、FGFCM 算法、HMRF-FCM 算法處理后的結(jié)果,由于FCM 算法只考慮到像素本身對(duì)圖像分類的影響,碎斑點(diǎn)較多;HMRF-FCM 算法碎斑點(diǎn)較少,分類精度較高;FGFCM 算法雖然分類精度稍差一點(diǎn),但是迭代次數(shù)少,運(yùn)行速度快。對(duì)圖3(b1)遙感影像2 進(jìn)行分類,設(shè)置分類參數(shù)為3。FCM 算法分類效果不是很理想,噪聲多;其他算法雖然分類效果相對(duì)較好,但是在對(duì)草地劃分時(shí),效果不好,即使是HMRF-FCM 算法分類后的圖像,仍然有碎斑點(diǎn)。對(duì)圖3(c1)遙感影像3 進(jìn)行分類,設(shè)置分類參數(shù)為3。從河流和草地的分類結(jié)果來看,3 種算法對(duì)河流分類的效果都可以;但對(duì)草地及其附近的淤泥,只有HMRf-FCM 算法處理的精度較高,F(xiàn)GFCM 算法處理的結(jié)果有一些噪聲點(diǎn);FCM 算法處理結(jié)果的碎斑點(diǎn)更多。對(duì)圖3(d1)遙感影像4 進(jìn)行分類,設(shè)置分類參數(shù)為4。能夠明顯看出HMRF-FCM 算法分類的效果最好,圖像分類輪廓線明確,基本沒有噪聲點(diǎn)。
為了對(duì)3 種算法的分類結(jié)果做出進(jìn)一步的定量評(píng)價(jià),利用混淆矩陣計(jì)算用戶精度、產(chǎn)品精度、總精度、Ka 系數(shù)值,計(jì)算結(jié)果如表1 所示。
表1 精度指標(biāo)、總體精度和Ka 系數(shù)值比較單位:%
由表1 可知:FCM 算法的總體精度只有92.98%,Ka 系數(shù)值為0.91。而FGFCM 和HMRFFCM 算法引入鄰域作用,能夠使分類總體精度達(dá)到96% 以上,Ka 系數(shù)值也高達(dá)0.95,通過總體精度和Ka 系數(shù)值能夠評(píng)價(jià)分類結(jié)果,值越大,表示分類結(jié)果越好。因此,從試驗(yàn)數(shù)據(jù)可以看出,F(xiàn)GFCM 算法相比較傳統(tǒng)FCM 算法,分類結(jié)果更加準(zhǔn)確。
從上述分類結(jié)果可以看出,經(jīng)FCM 算法處理后的圖像,分類效果并不理想,圖像上有明顯的噪聲點(diǎn)。雖然FCM 算法簡(jiǎn)單,易于操作,但是由于該算法只考慮到像素本身對(duì)圖像分類的影響,沒有引入空間約束的作用,從而導(dǎo)致在很多情況下,F(xiàn)CM 算法對(duì)于孤立點(diǎn)和噪聲比較敏感。此外,由于FCM 算法對(duì)初始值非常敏感,在無法準(zhǔn)確選取初始類中心的情況下,更容易使算法陷入局部最優(yōu),這樣會(huì)造成算法迭代收斂的速度降低、迭代次數(shù)的增加以及運(yùn)算量的加大。FGFCM 算法不但簡(jiǎn)單通用,還能實(shí)現(xiàn)快速分類,適用于大尺寸的灰度圖像分類。FGFCM 算法還引入了鄰域像素,提高了抗噪能力。但是,其以灰度級(jí)代替像素進(jìn)行分類,導(dǎo)致分割結(jié)果不準(zhǔn)確,存在部分誤分類像素。經(jīng)HMRF-FCM算法處理后的圖像分類效果較好,既沒有孤立的噪聲點(diǎn),也少見像素的誤分情況。該算法是在傳統(tǒng)FCM 算法的基礎(chǔ)上,引入K-L 規(guī)則化項(xiàng)來控制算法的模糊程度,以算數(shù)加權(quán)形式代替指數(shù)加權(quán),具有明確物理意義,同時(shí)基于標(biāo)號(hào)場(chǎng)利用HMRF 模型定義先驗(yàn)概率,以控制聚類尺度,并且以概率分布和似然率的負(fù)對(duì)數(shù)定義非相似性測(cè)度。與歐式距離相比較,其結(jié)果更加準(zhǔn)確,因此,能夠獲得較精確的分類結(jié)果。
從圖像的分類結(jié)果來看,F(xiàn)GFCM、HMRF-FCM算法相比較FCM 算法而言,主要有以下優(yōu)點(diǎn):
1)在處理噪聲問題上,F(xiàn)GFCM 算法不僅考慮自身像素對(duì)圖像分類的影響,還顧及到鄰域像素的作用,提高了抗噪能力。但是,由于圖像噪聲沒有先驗(yàn)知識(shí),即使通過經(jīng)驗(yàn)和使用試錯(cuò)法,對(duì)于參數(shù)的選擇仍然不是一件容易的事情。而HMRF-FCM 算法克服了上述缺點(diǎn),基于標(biāo)號(hào)場(chǎng)利用HMRF 模型定義先驗(yàn)概率,即使是在有高斯噪聲影響的情況下,仍然得到了較高的分類精度。因此,F(xiàn)GFCM 算法以及HMRF-FCM 算法要優(yōu)于FCM 算法。
2)在圖像分類效果上,F(xiàn)GFCM 算法以及HMRF-FCM 算法要優(yōu)于FCM 算法,HMRF-FCM 算法分類效果最佳。
FCM 算法簡(jiǎn)單、易操作,因此在影像自動(dòng)解譯中應(yīng)用廣泛,但是,在使用過程中,由于其自身存在著需要預(yù)先給定聚類數(shù)目、容易陷入局部最優(yōu)、對(duì)噪聲敏感等固有缺陷,所以影響圖像分類精度。本文在FCM 的基礎(chǔ)上,對(duì)圖像分類算法進(jìn)行了更深一步的優(yōu)化,提出改進(jìn)后的FGFCM 算法。FGFCM 算法針對(duì)FCM 算法存在的問題,增加鄰域像素作用,提高算法的抗噪能力,提出將空間約束融入到FCM算法之中,并分別采用FCM、FGFCM 和HMRFFCM 3 種算法對(duì)自然紋理圖像及真實(shí)遙感圖像進(jìn)行分類。通過對(duì)分類結(jié)果的定量與定性分析,得出本文提出的FGFCM 算法與FCM 和HMRF-FCM 2 種算法相比較,具有分類精度高、圖像分類輪廓線清晰,噪聲點(diǎn)少等優(yōu)點(diǎn),能夠得到較好的分類效果。