李 炫,范建容,張建強
(1.中國科學院·水利部成都山地災害與環(huán)境研究所,四川 成都 610041;2.中國科學院大學,北京 100049)
?
基于權重的WKFCM聚類算法在泥石流評價中的應用*
李 炫1,2,范建容1,張建強1
(1.中國科學院·水利部成都山地災害與環(huán)境研究所,四川 成都 610041;2.中國科學院大學,北京 100049)
泥石流的形成受地形條件、地質構造、氣象水文等多種因素的綜合影響,不同區(qū)域的泥石流災害在空間分布上具有一定的差異性和相似性,聚類分析能夠識別出這種相似的特性。針對KFCM聚類算法沒有考慮到不同影響因子對于泥石流災害的貢獻程度不同的缺陷,引入權重的概念,對KFCM算法進行改進,選取溝床比降、流域面積、構造系數(shù)、冰川坡度、巖性系數(shù)、平均坡度、最大淤積、可移方量、冰川面積與流域面積比9個因素作為區(qū)域內(nèi)冰川泥石流危險性的評價指標,采用層次分析法求取各個評價指標的權重值,以西藏境內(nèi)30條具有良好工作基礎的冰川泥石流溝為研究對象,探究改進后的WKFCM聚類算法在泥石流危險性評價中的應用。結果表明,改進后的算法可以避免傳統(tǒng)評價方法閾值確定時的主觀不確定性,將其應用在泥石流危險性評價中是有效可行的。
權重;WKFCM聚類算法;泥石流災害;評價
泥石流的是一種極為復雜的自然現(xiàn)象,它在暴雨、融雪等外界條件的激發(fā)下產(chǎn)生,來勢迅猛,運動速度很快,暴發(fā)突然,能量巨大,其攜帶的大量的石塊和碎屑物質具有沖擊力強和破壞性大的特點,給山區(qū)的經(jīng)濟發(fā)展和山區(qū)人民的生命安全都帶來了巨大威脅。泥石流危險性評價是災情評估、預測、防災救災的基礎[1],它對防范泥石流災害的發(fā)生,減少泥石流災害帶來的損失,以及區(qū)域的規(guī)劃建設都具有非常重要的意義。
長期以來,隨著對泥石流研究的不斷深入,泥石流危險性評價經(jīng)歷著從定性到定量的發(fā)展,多因子綜合評價模型、信息量模型、神經(jīng)網(wǎng)絡模型、多元回歸模型、灰色關聯(lián)度模型、模糊數(shù)學等等方法都在泥石流危險性評價中有著較好地應用[2-4]。但是這些評價方法,往往都需要足夠的災害訓練樣本做基礎,在樣本不足或缺失的情況下就難以實現(xiàn)準確的評價。聚類分析是指按照數(shù)據(jù)之間某種相似程度的度量,對數(shù)據(jù)進行歸類,使得被劃分到同一類的對象相似度最大,不同類別的相似度最小。不同區(qū)域的泥石流災害在空間分布上存在著一定的相似性和差異性[5],將聚類分析方法應用在泥石流評價中能夠較好的識別出這種相似特性,算法含義清晰,能夠對研究對象進行定量評價[6]。國內(nèi)很多學者對聚類分析方法在災害評價中的應用做了大量的嘗試,丁明濤等應用k-means聚類方法實現(xiàn)了三江并流區(qū)泥石流危險性評價[7];王建國等應用聚類分析的方法實現(xiàn)了撫順地區(qū)地質災害綜合評價,有效地確定了不同地質災害的類型區(qū)[5]。
聚類分析方法為泥石流等地質災害的評估提供了一種新的思路。但對于泥石流評價來說,傳統(tǒng)的聚類方法并沒有考慮到不同影響因子對泥石流的貢獻程度的不同,評價的精度難免會受到影響。本文在前人的基礎之上,選取西藏境內(nèi)具有良好工作基礎的30條冰川泥石流溝為研究對象,考慮到不同影響因子對泥石流災害的權重的不同,對KFCM算法進行改進,引入權重的概念形成WKFCM聚類方法,探討基于權重的WKFCM聚類算法在泥石流危險性評價中的應用。
1.1 KFCM聚類算法
將聚類方法應用到泥石流危險性評價中就是將不同危險性的泥石流溝進行識別和歸類??紤]一個樣本集X={x1,x2,…,xn},n為泥石流溝條數(shù),其中x1={xi1,xi2,…,xik}為K維向量,K為泥石流災害的影響因子, 建立n×K維向量,KFCM聚類算法就是把n個向量xi(i=1, 2,…,n)分為c個組, 使得非相似性指標的價值函數(shù)達到最小。KFCM聚類算法的具體描述如下[8]。
(1)根據(jù)目標函數(shù)把數(shù)據(jù)集X劃分成c類。
(1)
式中:m為模糊加權指數(shù),它的最佳取值范圍為[1.5,2.5];φ是到高維特征空間的非線性映射,滿足式(2)。uij表示數(shù)據(jù)j隸屬于i類的隸屬度,取值在0~1之間,vj表示聚類中心。
(2)依據(jù)式(2)實現(xiàn)從低維到高維的映射。
‖φ(xi)-φ(vj)‖2=K(xi,xi)-2K(xi,vj)+K(vj,vj),
(2)
式中:K為核函數(shù)。在本文中,采用高斯核函數(shù),如式(3)所示。
(3)
式中:‖x-y‖2表示x,y兩點的歐幾里德距離,σ是高斯參數(shù)。
依據(jù)上述公式,KFCM聚類算法的數(shù)學描述可以表示為:
(4)
對目標函數(shù)運用拉格朗日算法導出聚類中心vj和隸屬度uij的計算公式為:
(5)
(6)
泥石流危險性評價的過程就是通過迭代的方法求解式(5)、(6)中的聚類中心vj和隸屬度uij,使得目標函數(shù)J最小,以達到分類目的,然后對各個類別賦予不同的危險度,從而實現(xiàn)泥石流溝危險性評價。
1.2 基于權重的KFCM聚類算法
一般來說,KFCM聚類算法,是通過不同的核函數(shù)將數(shù)據(jù)非線性映射到高維特征空間中,使原來沒有顯現(xiàn)的特征突現(xiàn)出來,擴大了特征間的差異,再在高維特征空間中進行模糊C-均值聚類,能較好的實現(xiàn)不同數(shù)據(jù)結構的聚類[9]。但在KFCM算法中,數(shù)據(jù)之間相似度是通過歐幾里得距離衡量的,特征變量對目標函數(shù)的貢獻值都是相同的,而在泥石流的評價指標體系中,各指標對泥石流發(fā)育影響程度是不同的,反映到數(shù)據(jù)上面就是權重值的不同[2]。因此,本文在KFCM聚類算法的理論基礎上,引入權重的概念,運用加權歐式距離來計算核函數(shù)值,如式(7)、(8),從而實現(xiàn)基于權重的分類。
(7)
(8)
式中:k表示表示泥石流影響因子個數(shù),wi(i=1,2,…,k)表示各個因子的權重系數(shù),xi表示第i個泥石流溝的評價因子,yi表示聚類中心。
經(jīng)改進后的WKFCM算法計算過程如下:
(1)先初始化權重矩陣wi,隸屬度矩陣U和聚類中心Vi,設置模糊參數(shù)m,高斯核函數(shù)參數(shù)σ,收斂閾值ε;
(2)運用權重矩陣wi按照式(7)、(8)計算核函數(shù)值K;
(3)按照式(5)、(6)的計算方法計算聚類中心;
(4)按照式(5)、(6)的計算方法重新計算隸屬度矩陣;
(5)根據(jù)式(1)計算目標函數(shù)J,判斷目標函數(shù)值J的改變量ΔJ是否小于給定的閾值ε,若小于則算法終止,否則返回步驟2繼續(xù)執(zhí)行。
本文將改進后的WKFCM聚類算法參照以上步驟在Matlab中進以實現(xiàn),并將其應用于泥石流溝的危險性評價中。
2.1 泥石流評價因子的選取
本次研究選取的是西藏境內(nèi)有良好工作基礎的30條冰川泥石流溝作為研究的對象,以探究基于權重的WKFCM聚類算法在泥石流危險性評價中的可行性和合理性。然烏-培龍一帶是我國海洋性冰川的主要分布地區(qū),也是我國冰川泥石流的主要集中發(fā)育地段。冰川泥石流是泥石流災害中比較特殊的一類,冰川泥石流的危險性的評價不僅可以反映出流域的侵蝕強度,還可以反映流域內(nèi)泥石流的危害性,對區(qū)域內(nèi)的防災減災工作具有重要指導意義。
由于冰川泥石流的形成不同于一般的雨洪泥石流,其水源主要由冰雪消融、冰崩和雪崩、冰川湖潰決產(chǎn)生的瞬間洪流,而固體物質主要來源于新老冰川運動產(chǎn)生的冰磧物[10],所以在評價因素的選擇上也與雨洪泥石流有所不同。鐵永波等人總結了國內(nèi)學者對冰川泥石流的研究成果指出冰川泥石流的形成均伴隨者前期的洪水(冰湖潰決或冰雪融水)過程和后期沿程的侵蝕(側蝕及掏蝕等)過程[11]。黃偉等人運用灰色關聯(lián)度法篩選出日最高溫度、流域面積、一次泥石流最大沖出量、主溝長度、流域最大高差、冰川積雪面積等7個冰川泥石流的主要影響因子[12]。王磊在研究雅魯藏布江加查-米林段冰川泥石流形成條件與活動特征時也表明該研究區(qū)內(nèi)的冰川泥石流與流域面積、溝床比降、溝床堆積物等等都有著密切的聯(lián)系[13]。本文依據(jù)國內(nèi)學者對冰川泥石流形成機制的分析[11-14],選取流域面積F1(km2)、溝床比降F2、巖性系數(shù)F3、構造系數(shù)F4、冰川坡度F5(°)、平均坡度F6(°)、可移方量F7(×104m3)、最大淤積F8(×104m3)、冰川面積與流域面積的比值F9等9個因素作為泥石流危險性的評價指標(表1),泥石流溝的數(shù)據(jù)來源于文獻[15]。
表1 泥石流溝評價因素一覽表
2.2 評價過程
本文按照如下步驟,運用WKFCM算法進行研究區(qū)內(nèi)泥石流溝的危險性評價。
步驟1:先運用層次分析法計算各泥石流評價因子的權重系數(shù),并進行一致性檢驗。對數(shù)據(jù)進行歸一化處理以消除不同評價因子計量單位量綱之間的差異,按照式(9)計算各泥石流溝的綜合加權值。
(9)
式中:S表示綜合加權值,取值在0~1之間,F(xiàn)i表示第i個評價因子歸一化后的值,wi表示各因子對應的權重值。
步驟2:用步驟1中計算的權重系數(shù)初始化WKFCM算法的權重值,在Matlab軟件中進行泥石流溝的歸類。
步驟3:計算每個類別泥石流溝的綜合加權值,按照從高到低的順序賦予不同的危險度,從而實現(xiàn)研究區(qū)內(nèi)的泥石流危險性評價。
2.3 權重計算
權重的確定方法比較多,層次分析法是因子權重確定中比較常用的方法,最早由美國運籌學家T.L.Saaty提出[16],其方法是按一定的規(guī)則對因子兩兩之間進行比較并賦值,構造判斷矩陣,并采用隨機一致性指標作數(shù)據(jù)一致性檢驗,若通過一致性檢驗,則可以得到可信度較高的計算結果。這種方法既考慮了主觀不確定性因素,也結合邏輯思維定定量進行分析,是定性與定量的結合,主觀與客觀相結合的方法。本文采用層次分析法計算各影響因子權重。
2.4 泥石流危險性評價
根據(jù)表1中的泥石流基礎數(shù)據(jù),分別運用WKFCM算法和KFCM算法對泥石流溝進行聚類以便對比分析,兩個算法都迭代計算10次后結束,將泥石流溝分為5類,求取各類別的平均綜合加權值,依據(jù)各類別的平均綜合加權值的高低,分別賦值為極度危險、高度危險、中度危險、低度危險和極低危險(表4)。
表2 判斷矩陣
表3 評價因子的權重值
表4 泥石流溝危險性評價結果
文獻[15]中把區(qū)域內(nèi)的冰川泥石流的活動性劃分為極強、強、活躍、弱、極弱5個等級,本文評價結果把泥石流危險性劃分為極度危險、高度危險、中度危險、低度危險、極低危險5個危險級別與泥石流的活動性相對應。從表4的評價結果可以看到,基于權重的WKFCM方法的評價結果,除了米堆弄巴、格曲、次浪三條溝的評價結果與文獻[15]中的活動性相差較大外,其余的27條泥石流溝的評價結果與活動性強度總體上是比較一致的,吻合度達到90%;而KFCM算法的評價結果中差普、嘎浪、次浪、塞龍卡區(qū)、索通溝、角弄弄巴、卡貢弄巴、米堆弄巴、格曲等一共9個泥石流溝都與文獻[15]中的活動性相差較大,吻合度只有70%,所以考慮到不同因子的權重的WKFCM方法評價精度優(yōu)于普通的KFCM聚類方法。從泥石流溝的實際活動特征來看,以區(qū)域內(nèi)兩條著名的冰川泥石流溝培龍貢支和卡貢弄巴為例。培龍貢支曾于1983年7月28-29日、1985年5月29日暴發(fā)大型泥石流;卡貢弄巴于1950年、1953年、1954年、1972年都曾發(fā)生破壞性巨大的大型泥石流[14],活動比較劇烈。兩者WKFCM方法評價的結果都是極度危險,評價的結果較為準確可靠。
WKFCM聚類算法是在普通模糊C-均值聚類的基礎上改進形成的,運用高斯核函數(shù)擴大了特征間的差異,增強了分類的精度,考慮到不同影響因子對泥石流的貢獻程度不同,引入了權重的概念,更加切合了泥石流的特點。整個評價過程無需訓練樣本,可以避免賦予分類閾值時的主觀的不確定性,評價結果比較準確,可以為泥石流危險性評價提供一個新的思路。但由于目前研究條件的限制,在運用該方法時還有許多需要改進的地方,比如對于泥石流評價因子的分析上還可以進一步深入,因子選取時沒有考慮到不同因子之間是否存在線性相關等等問題,有待進一步完善。
[1] 孫紹騁. 災害評估研究內(nèi)容與方法探討[J]. 地理科學進展,2001,20(2):122-130.
[2] 王歡,丁明濤,陳廷方. 基于GIS的三江并流區(qū)泥石流危險性評價[J]. 水土保持通報,2011,31(5):167-170,267.
[3] 寧娜,馬金珠,張鵬,齊識,田黎明. 基于GIS和信息量法的甘肅南部白龍江流域泥石流災害危險性評價[J]. 資源科學,2013,35(4):892-899.
[4] 李闊,唐川.泥石流危險性評價研究進展[J]. 災害學,2007,22(1):106-111.
[5] 王建國,楊德明,陶景梅. 基于GIS及聚類分析法的撫順地區(qū)地質災害綜合評價[J].世界地質,2011,30(2):270-276.
[6] 桂蕾,殷坤龍,王佳佳. 基于聚類分析的滑坡災害危險性區(qū)劃研究[J]. 水文地質工程地質,2013,40(1):100-105.
[7] 丁明濤,韋方強,王歡,等. 基于聚類分析的三江并流區(qū)泥石流危險性評價[J].資源科學,2012,34(7):1257-1265
[8] 曲福恒,馬駟良,胡雅.一種基于核的模糊聚類算法[J].吉林大學學報:理學版,2008,46(6): 1137-1141.
[9] 施浩琴,周德云,張堃. 基于改進KFCM聚類的數(shù)據(jù)關聯(lián)算法[J].電光與控制,2012,19(4):13-17,58.
[10]張瑞江.青藏高原冰川演變與地質災害[J].國土資源遙感,2010,86(Supp.1):54-58.
[11]鐵永波,李宗亮. 冰川泥石流形成機理研究進展[J].水科學進展,2010,21(6):861-866.
[12]黃偉,唐川,劉洋. 基于灰色關聯(lián)度的冰川泥石流危險性評價因子分析[J]. 災害學,2013,28(2):172-176.
[13]王磊. 雅魯藏布江加查—米林段冰川泥石流形成條件與活動特征研究[D].成都:成都理工大學,2011.
[14]中國科學院·水利部成都山地災害與環(huán)境研究所,西藏自治區(qū)交通廳科學研究所.西藏泥石流與環(huán)境[M].成都:成都科技大學出版社,1999:29-39.
[15]陳杰,崔鵬,韋方強,等. 基于模糊關系理論的冰川泥石流活動性評價方法[J]. 水土保持究,2003,10(2):1-4,43.
[16]Saaty T L.The Analytical Hierarchy Process.NewYork,NY: M cGraw-Hill,1980.
Application of WKFCM Algorithm Based on Weight in Debris Flow Evaluation
Li Xuan1,2, Fan Jianrong1and Zhang Jianqiang1
(1.InstituteofMountainHazardsandEnvironment,ChineseAcademyofSciences&MinistryofWaterConservancy,Chengdu610041,China; 2.UniversityofChineseAcademyofSciences,Beijing100049,China)
Theformationofdebrisflowincludeterraincondition,geologicalstructure,weatherandotherfactors.Therearesomedifferencesandsimilaritiesindebrisflowofdifferentarea.Usingclusteranalysiscanidentifythesimilarity.GeneralKFCMAlgorithmhasalmostnoconsiderationforthecontributionofdifferentfactorshavedifferentweights,therefore,thisarticletrytoimprovetheKFCMalgorithmthroughintroducingconceptofweight,thenwegetWKFCMalgorithm.Afteranalyzethepresentdataoftheseglacierdebrisflowgullies, 9factorsarechosenasmainfactorsforevaluatingtheriskofthesegullies.AnalyticHierarchyProcessisusedtodeterminetheweightsofthefactors.ThestudyareaisslocatedinTibetalongtheSichuan-Tibethighwaywhere30glacierdebrisflowgulliesareselectedforstudy.Accordingwiththereferenceresult,itshowsthatitispracticaltousethismethodtoevaluatetheriskofdebrisflow.
weight;WKFCMalgorithm;debrisflowdisaster;evaluation
2014-12-04
2015-01-19
中國科學院科技服務網(wǎng)絡計劃項目(KFJ-EW-STS-094);數(shù)字制圖與國土信息應用工程國家測繪地理信息局重點實驗室開放基金(DM2013SC01);中國科學院重點部署項目(KZZD-EW-08-01)
李炫(1991-),男,四川瀘州人,碩士研究生,從事地理信息系統(tǒng)及災害遙感研究. E-mail: xuan121356@163.com
范建容(1969-),女,四川井研人,博士,研究員,從事山地生態(tài)與災害遙感研究. E-mail: fjrong@imde.ac.cn
P642.23;X43
A
1000-811X(2015)03-0214-05
10.3969/j.issn.1000-811X.2015.03.039
李炫,范建容,張建強. 基于權重的WKFCM聚類算法在泥石流評價中的應用[J].災害學, 2015,30(3):214-218. [Li Xuan, Fan Jianrong and Zhang Jianqiang. Application of WKFCM Algorithm based on weight in debris flow evaluation [J].Journal of Catastrophology, 2015,30(3):214-218.]