国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于PCA和SVM算法的滑坡穩(wěn)定性分析研究

2015-04-18 11:19蔣廷耀
科技視界 2015年14期
關(guān)鍵詞:滑坡穩(wěn)定性因素

雷 鵬 蔣廷耀

(三峽大學(xué)計算機(jī)與信息學(xué)院,湖北 宜昌 443002)

0 引言

由于滑坡地質(zhì)條件形成過程、誘發(fā)因素的多樣性及其變化的隨機(jī)性和復(fù)雜性,導(dǎo)致滑坡運(yùn)動信息極難預(yù)測,加之滑坡動態(tài)監(jiān)測技術(shù)的不完整、不成熟和滑坡預(yù)報理論的不完善,滑坡災(zāi)害嚴(yán)重威脅與危害人民群眾的生命財產(chǎn)安全。因而科學(xué)、準(zhǔn)確的進(jìn)行滑坡穩(wěn)定性研究,及時預(yù)測預(yù)報滑坡對減災(zāi)防災(zāi)具有重要意義。

從人們意識到滑坡的危害開始,地質(zhì)學(xué)研究人員就一直試圖建立一種預(yù)報準(zhǔn)確、可操作性強(qiáng)的滑坡預(yù)報模型[1-6],總結(jié)前人的滑坡預(yù)報模型的主要類型及對應(yīng)的預(yù)報方法,可把滑坡的預(yù)報模型分為定性和定量兩大類[7]。

定性分析方法能綜合考慮影響邊坡穩(wěn)定性的各種因子,并可快速地對邊坡的穩(wěn)定狀況和發(fā)展趨勢做出綜合評價,主要方法有:工程地質(zhì)分析法、邊坡穩(wěn)定性分析數(shù)據(jù)庫和專家系統(tǒng)法及圖解法等。定量分析方法是想通過力學(xué)原理對滑坡的穩(wěn)定性進(jìn)行分析,但嚴(yán)格地講,滑坡穩(wěn)定性分析還沒有達(dá)到完全的定量這一階段,目前只能算是一種半定量半定性的分析方法?;路€(wěn)定性定量分析目前大概可以分成三種方法:解析法,數(shù)值方法和概率法。

國內(nèi)外學(xué)者利用多種方法對滑坡穩(wěn)定性做了研究。例如:意大利學(xué)者 Carrara[8]、西班牙學(xué)者 Jiménez-Perálvarez[9],利用地理信息系統(tǒng)及空間分析進(jìn)行過滑坡易發(fā)性評價與制圖;美國學(xué)者Nandi[10]、中國學(xué)者李雪平和唐輝明等[11]利用統(tǒng)計模型進(jìn)行過滑坡易發(fā)性評價。但是,這些方法都需要地形、地質(zhì)、水文和人類工程活動等多種數(shù)據(jù),涉及到的評價指標(biāo)從幾個到幾十個不等,而要在這眾多的評價指標(biāo)中科學(xué)、合理地確定模型評價指標(biāo)體系是一個非常棘手的問題,也是在許多相關(guān)研究中沒有解決的關(guān)鍵問題。

1 影響滑坡穩(wěn)定性的因素分析

影響滑坡穩(wěn)定性因素有很多,主要包括滑坡巖性、地質(zhì)結(jié)構(gòu)、軟弱地層狀況、河流作用等。除此以外,還有巖石風(fēng)化狀況、地面變形情況、降雨、地震、植被覆蓋率及人類工程活動等[12]。這些因素綜合起來可分為兩大類,即內(nèi)在因素和外在因素。內(nèi)在因素包括:滑坡巖性,巖土體結(jié)構(gòu)、滑坡軟弱地層等。外在因素包括:水文地質(zhì)條件及降雨,巖石風(fēng)化狀況,地面變形情況,植被覆蓋率,地震以及人為因素等。內(nèi)在因素是主要因素,對滑坡穩(wěn)定性起決定性作用,它們決定滑坡變形破壞的形式和規(guī)模的大小。外在因素則是輔助因素,只有通過內(nèi)在因素才能對滑坡的穩(wěn)定性起到促進(jìn)作用,導(dǎo)致滑坡變形破壞的發(fā)生。但是外在因素如果變化頻繁,其作用有時不可小視,甚至能成為滑坡破壞的直接原因。

目前所擁有的212組實際滑坡數(shù)據(jù),每組數(shù)據(jù)有24個屬性,并運(yùn)用SVM算法對提取主成分前后的數(shù)據(jù)進(jìn)行檢驗,比較兩種數(shù)據(jù)的算法準(zhǔn)確度。本文根據(jù)滑坡穩(wěn)定狀況,將滑坡分為三類:滑坡、易滑坡和穩(wěn)定。

滑坡穩(wěn)定狀態(tài)的分類依據(jù)現(xiàn)場的影響因素所計算出的穩(wěn)定系數(shù),按照穩(wěn)定系數(shù)的大小分為四類,結(jié)果見表1[13]。

表1 滑坡穩(wěn)定狀況分類

2 PCA和SVM方法介紹

2.1 主成分分析

主成分分析(Principal Component Analysis,PCA)于1933年由Karl.Pension提出的,他是在研究非隨機(jī)變量引入的,隨后Harold Hotelling將此方法推廣到隨機(jī)向量的情形。PCA的主要思想是降維,在保留大部分原始數(shù)據(jù)信息的前提下,將多個冗余的指標(biāo)轉(zhuǎn)換為少數(shù)幾個綜合指標(biāo),稱為主成分[14]。

2.1.1 主成分分析的基本原理

主成分分析是將含有多種指標(biāo)的問題在準(zhǔn)確度不大幅降低的情況下,轉(zhuǎn)化為少數(shù)幾個關(guān)鍵指標(biāo)的一種重要的統(tǒng)計方法,它是一種將高維空間運(yùn)算的問題降低到低維空間中運(yùn)算的方法,從而簡化運(yùn)算的復(fù)雜度,使問題變得簡介、直觀。提取的少數(shù)幾個關(guān)鍵指標(biāo)之間互不相關(guān)且包含原有指標(biāo)大部分的信息。

運(yùn)用PCA對數(shù)據(jù)進(jìn)行降維,不僅降低數(shù)據(jù)系統(tǒng)的維度,還能使數(shù)據(jù)的數(shù)字特征簡化。PCA在對數(shù)據(jù)簡化的同時,還能提供很多數(shù)據(jù)的特征,比如數(shù)據(jù)的重心位置,數(shù)據(jù)變化的最大方向,以及數(shù)據(jù)點(diǎn)群的分布情況。

2.1.2 主成分分析的主要步驟

PCA有如下五個步驟:

(1)將原始數(shù)據(jù)標(biāo)準(zhǔn)化;

(2)計算相關(guān)系數(shù)矩陣;

其中rij(i,j=1,2,…,p)是原始數(shù)據(jù)變量xi和xj的相關(guān)系數(shù),其表達(dá)式為

(3)求出特征值和特征向量;

(4)求出每個主成分的貢獻(xiàn)率及主成分的累積貢獻(xiàn)率;

(5)計算主成分;

PCA不需要附加信息或者先驗知識,就能有效地分析和處理不精確、不完整和不一致等各種不完備數(shù)據(jù),將含有多種指標(biāo)的問題在準(zhǔn)確度不大幅降低的情況下,轉(zhuǎn)化為少數(shù)幾個關(guān)鍵指標(biāo)。它最大的特點(diǎn)是可對數(shù)據(jù)進(jìn)行信息約簡,獲得數(shù)據(jù)的核心知識,以降低人們對復(fù)雜系統(tǒng)的空間認(rèn)知復(fù)雜性,為研究滑坡等復(fù)雜系統(tǒng)提供有力工具。

2.2 支持向量機(jī)

支持向量機(jī)(SVM)是基于VC理論的機(jī)器學(xué)習(xí)方法,是繼神經(jīng)網(wǎng)絡(luò)之后的新一代學(xué)習(xí)算法,它利用核函數(shù)將原始線性不可分?jǐn)?shù)據(jù)轉(zhuǎn)換為高維空間線性可分的數(shù)據(jù)模式,既能有效地處理非線性數(shù)據(jù),又能限制過學(xué)習(xí),特別適合于小樣本集的數(shù)據(jù)處理。

SVM兩個突出的優(yōu)點(diǎn)是:一是基于結(jié)構(gòu)風(fēng)險最小原則,這優(yōu)于傳統(tǒng)的經(jīng)驗風(fēng)險最小原則;二是通過求解受限的二次型保證了其性能。但同時發(fā)現(xiàn),SVM在對數(shù)據(jù)處理中的優(yōu)勢也是其劣勢所在。假如小樣本集合中存在異常點(diǎn)或數(shù)據(jù)屬性眾多且相互影響,則對小樣本預(yù)測的結(jié)果會產(chǎn)生很大影響。因為支持向量機(jī)不能確定數(shù)據(jù)中哪些是重要的、核心的,哪些數(shù)據(jù)是冗余的、干擾的。而PCA所具有的特點(diǎn)正好能夠解決這些問題,若將二者相結(jié)合應(yīng)用于滑坡分析,尋找區(qū)域滑坡災(zāi)害發(fā)生的內(nèi)在規(guī)律應(yīng)該是完全有效的。

3 PCA和SVM在滑坡穩(wěn)定性分析中的應(yīng)用

3.1 數(shù)據(jù)的采集

本文利用了200多組邊坡穩(wěn)定性的實際情況數(shù)據(jù)。在這些數(shù)據(jù)中,影響邊坡穩(wěn)定性的因素包括斜坡類型、地層時代、容量、地層傾向、內(nèi)摩擦角、地震烈度、微地貌、地下水類型、相對河流位置、坡高、坡寬、坡長、坡角、坡向、土地利用、坡面形態(tài)、裂隙組數(shù)、斜坡結(jié)構(gòu)類型、全風(fēng)化帶深度、土質(zhì)名稱、粘聚力、下伏基巖埋深、伏基巖傾角、伏基巖傾向等,通過計算邊坡的穩(wěn)定系數(shù),按照表1的數(shù)據(jù),將滑坡穩(wěn)定狀況分為三類:滑坡、易破壞和穩(wěn)定。

3.2 數(shù)據(jù)的標(biāo)準(zhǔn)化

由于24個屬性的取值不屬于同一個數(shù)量級,輸入變量差異較大,因此,在建立模型之前,先對輸入的數(shù)據(jù)進(jìn)行歸一化處理,將同一屬性的數(shù)據(jù)歸一到-1至1的范圍之內(nèi)。

3.3 PCA 提取主成分

主成分的數(shù)目可以根據(jù)相關(guān)系數(shù)矩陣的特征根來判定,而方差是變量數(shù)據(jù)蘊(yùn)涵信息的重要判據(jù)之一。根據(jù)λ值決定主成分?jǐn)?shù)目的準(zhǔn)則有三條:

(1)只取λ>1的特征根對應(yīng)的主成分

取主成分特征值對應(yīng)的λ值都大于1,這意味著這三個主成分得分的方差都大于1。在實際情況中,可以將方差值減小為0.8,本例正是根據(jù)這條準(zhǔn)則提取主成分的。

(2)前q個主成分的累計百分比達(dá)到80%左右的的λ值對應(yīng)的主成分

所選取的主成分對應(yīng)的λ值累計百分比達(dá)到80%,這表明目前所選取的主成分信息量已經(jīng)夠了。

(3)根據(jù)特征根變化的突變點(diǎn)決定主成分的數(shù)量。

運(yùn)用PCA提取主成分后的數(shù)據(jù)見表2。

表2 全部解釋方差

在表2的初始特征根中,給出了按順序排列的主成分得分的方差,在數(shù)值上等于相關(guān)系數(shù)矩陣的各個特征根λ,因此可以直接根據(jù)特征根計算每一個主成分的方差百分比。由于全部特征根的總和等于變量數(shù)目,即有m=∑λi=24,故第一個特征根的方差百分比為λ1/m=3.949/24=16.445%, 第二個特征根的百分比為 λ2/m=2.719/24=11.329%,其余依此類推。然后可以算出方差累計值。

按照上文提及的三個提取主成分的條件,在λ>1的情況下,主成分的累積貢獻(xiàn)率只有61.095%,達(dá)不到80%左右的條件,故將λ的值減小到0.8,此時主成分的累積貢獻(xiàn)率達(dá)到79.455%,基本滿足前兩個條件。而第3個條件,根據(jù)特征根變化的突變點(diǎn)決定主成分的數(shù)量如圖1所示:

圖1 特征根數(shù)值衰減折線圖

為了找出選取的前12個主成分和具體影響因素之間的關(guān)系,將各主成分所對的特征向量分別與滑坡影響因素進(jìn)行相關(guān)分析,找出與該主成分相關(guān)性最大的影響因素。為了能夠準(zhǔn)確地描述變量之間的線性相關(guān)程度,可以通過計算相關(guān)系數(shù)來進(jìn)行相關(guān)分析。相關(guān)系數(shù)是衡量變量之間相關(guān)程度的一個統(tǒng)計量。相關(guān)系數(shù)的取值范圍為[-1,1],用r來表示相關(guān)系數(shù),如果大于 0.5,則兩個變量相關(guān)性很強(qiáng)?,F(xiàn)采用Pearson簡單相關(guān)系數(shù)計算變量之間的相關(guān)性:

表3是個主成分分別于滑坡影響因素進(jìn)行相關(guān)分析得到的相關(guān)系數(shù),與該主成分相關(guān)系數(shù)大的即可認(rèn)為是該主成分所對應(yīng)的影響因素。

表3 主成分與滑坡影響因素相關(guān)系數(shù)表

由表中Z1,Z2,…… ,Z12為前12個主成分,可以看出第一主成分與內(nèi)摩擦角、裂隙組數(shù)和伏基巖傾角的相關(guān)系數(shù)為0.868、0.724和0.881,即第一主成分為內(nèi)摩擦角、裂隙組數(shù)和伏基巖傾角有較強(qiáng)的正相關(guān),同理提取的其它9個最強(qiáng)相關(guān)的因素為地層年代、容量、相對河流位置、坡高、坡寬、坡角、坡面形態(tài)、粘聚力和伏基巖傾向。所以認(rèn)為這12分影響因素可以代替原始的24個影響因素進(jìn)行滑坡穩(wěn)定性的分析。

3.4 SVM核函數(shù)的選取

在訓(xùn)練SVM時應(yīng)該考慮核函數(shù)及相關(guān)參數(shù)對模型性能的影響,這里采用高斯徑向基函數(shù)(RBF)核函數(shù):

首先利用交叉驗證方法尋找最佳的參數(shù)C(懲罰因子)和參數(shù)σ2(RBF核函數(shù)中的方差),選擇最佳的參數(shù)訓(xùn)練模型。當(dāng)模型的性能相同時,為了減少計算時間,優(yōu)先選擇懲罰因子C比較小的參數(shù)組合,這是因為懲罰因子C越大,最終得到的支持向量數(shù)越多,計算量越大。通過實驗選擇參數(shù)后,選取核函數(shù)中的參數(shù)C=64,RBF核函數(shù)中的方差σ2=0.012。

4 結(jié)果分析

所擁有的212組數(shù)據(jù)中,滑坡類型數(shù)據(jù)有22個,易滑坡類型數(shù)據(jù)有155個,穩(wěn)定類型數(shù)據(jù)有35個。利用5折交叉檢驗的方式對212組數(shù)據(jù)分別進(jìn)行分析。采用5折交叉驗證來測試分類結(jié)果和驗證模型的正確性:將初始數(shù)據(jù)集隨機(jī)劃分成5個互不相交的子集,即,每個子集的大小基本相同。學(xué)習(xí)和測試分別進(jìn)行5次。在第i次迭代,用作測試集,其余的子集都用于訓(xùn)練分類器。取5次迭代正確分類數(shù)除以初始數(shù)據(jù)中的樣本總數(shù)的平均準(zhǔn)確率作為最終評估的結(jié)果。

為了與其他預(yù)測方法進(jìn)行對比,實驗中采用了相同的樣本數(shù)量和分析變量,利用Matlab和libsvm支持向量機(jī)方法,抽取其中1/5的數(shù)據(jù)進(jìn)行預(yù)測,其余的數(shù)據(jù)進(jìn)行支持向量機(jī)模型訓(xùn)練。如此進(jìn)行5次迭代,得到的提取主成分前后的對比結(jié)果如表4和表5所示。

表4 提取主成分前滑坡穩(wěn)定性分析結(jié)果

表5 提取主成分后滑坡穩(wěn)定性分析結(jié)果

將SVM分類算法運(yùn)用在PCA降維前后,由表4和表5可得到如下結(jié)論:

(1)運(yùn)用PCA提取主成分后滑坡穩(wěn)定性分析的結(jié)果較提取之前有小幅度的上升;

(2)降維前變量之間的關(guān)系有24*24=576組,而將為后只有12*12=144組,且提取的12個主成分之間互不相關(guān),從而避免了影響滑坡穩(wěn)定性的因素之間的相互影響;

(3)運(yùn)用PCA提取主成分之后,SVM算法在滑坡穩(wěn)定性分析的精確度只有2.5%的上升,但是在提取12個主成分之后,滑坡監(jiān)測的工作量將大大降低,運(yùn)用在滑坡監(jiān)測的成本也會大幅度減少,這在經(jīng)濟(jì)上還是有積極意義的。

5 結(jié)論

為了對滑坡穩(wěn)定性進(jìn)行分析,并實現(xiàn)實際滑坡預(yù)警,運(yùn)用了PCA和SVM算法對實際采集到的數(shù)據(jù)進(jìn)行分析,實驗結(jié)果證明兩種算法結(jié)合之后的算法精確度有所提高,可以在判斷滑坡的穩(wěn)定性上得出比較可靠的結(jié)論。在條件允許的情況下,可以考慮用多種分類算法來進(jìn)行綜合評價,以減小損失,提高準(zhǔn)確度。

[1]曾凡雷.滑坡地質(zhì)災(zāi)害變形預(yù)測及同步性預(yù)警機(jī)制研究[D].河北工程大學(xué),2012.

[2]賀小黑,王思敬,肖銳鏵,等.Verhulst滑坡預(yù)測預(yù)報模型的改進(jìn)及其應(yīng)用[J].Rock and Soil Mechanics,2013.

[3]付杰.卡爾曼濾波在滑坡變形預(yù)測中的應(yīng)用研究[D].中國地質(zhì)大學(xué),2013.

[4]李炯.基于馬爾可夫鏈模型的滑坡位移預(yù)測研究[D].中國地質(zhì)大學(xué),2012.

[5]Khai-Wern L,Tien T L,Lateh H.Landslide hazard mapping of Penang island using probabilistic methods and logistic regression [C]//Imaging Systems and Techniques(IST),2011 IEEE International Conference on.IEEE,2011:273-278.

[6]Gao W.Predication of Landslide Based on Grey System and Evolutionary Artificial Neural Networks[C]//System Science,Engineering Design and Manufacturing Informatization(ICSEM),2010 International Conference on.IEEE,2010,2:64-67.

[7]黃光東.基于智能算法的滑坡穩(wěn)定性建模與分析[D].北京:中國地質(zhì)大學(xué),2011.

[8]Carrara A,Pike R J.GIS technology and models for assessing landslide hazard and risk[J].Geomorphology,2008,94(3):257-260.

[9]Jiménez-Perálvarez J D,Irigaray C,El Hamdouni R,et al.Building models for automatic landslide-susceptibility analysis,mapping and validation in ArcGIS[J].Natural hazards,2009,50(3):571-590.

[10]Nandi A,Shakoor A.A GIS-based landslide susceptibility evaluation using bivariate and multivariate statistical analyses[J].Engineering Geology,2010,110(1):11-20.

[11]李雪平,唐輝明.基于 GIS的分組數(shù)據(jù) Logistic模型在斜坡穩(wěn)定性評價中的應(yīng)用[J].吉林大學(xué)學(xué)報:地球科學(xué)版,2005,35(3):361-365.

[12]黃光東.基于智能算法的滑坡穩(wěn)定性建模與分析[D].北京:中國地質(zhì)大學(xué),2011.

[13]郭社鋒.基于范例推理的黃土高邊坡穩(wěn)定性評價方法研究[D].西安:長安大學(xué),2006.

[14]張鵬.基于主成分分析的綜合評價研究[D].中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫,2004.

猜你喜歡
滑坡穩(wěn)定性因素
滑坡推力隱式解與顯式解對比分析——以河北某膨脹土滑坡為例
解石三大因素
非線性中立型變延遲微分方程的長時間穩(wěn)定性
淺談公路滑坡治理
半動力系統(tǒng)中閉集的穩(wěn)定性和極限集映射的連續(xù)性
基于Fluent的滑坡入水過程數(shù)值模擬
短道速滑運(yùn)動員非智力因素的培養(yǎng)
模糊微分方程的一致穩(wěn)定性
一類離散非線性切換系統(tǒng)的穩(wěn)定性
怎樣理解人是戰(zhàn)爭的決定因素?