孟 欣
(重慶交通大學(xué)土木工程學(xué)院,重慶 400074)
根據(jù)中國地質(zhì)環(huán)境信息網(wǎng)發(fā)布的《全國地質(zhì)災(zāi)害通報》數(shù)據(jù)統(tǒng)計[1],中國2018、2019年度發(fā)生的地質(zhì)災(zāi)害分別為2966起、6181起,滑坡占比分別為55%、68.27%,可見滑坡災(zāi)害是中國當(dāng)前最嚴重的地質(zhì)災(zāi)害。
近年來學(xué)者們提出了多個滑坡預(yù)測模型,如:黃發(fā)明(2017)[2]Extreme Learning Machine,ELM滑坡位移組合預(yù)測模型;李麟瑋等(2018)[3]GWO-MIC-SVR滑坡位移預(yù)測模型等。隨著軟件技術(shù)以及機器學(xué)習(xí)算法的發(fā)展,也開始有學(xué)者研究基于機器學(xué)習(xí)的滑坡災(zāi)害空間預(yù)測技術(shù)。
機器學(xué)習(xí)算法中,目前主要有:最近鄰分類算法、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、支持向量機(Support Vector Machine,SVM)等,但利用Adaboost算法進行滑坡預(yù)測的研究還比較少。本文選取對滑坡影響較大的降雨、地震因素來開展基于Adaboost算法的滑坡預(yù)測模型研究。
Adaboost是英文“Adaptive Boosting”的縮寫,算法中不同的訓(xùn)練集是通過調(diào)整每個樣本對應(yīng)的權(quán)重來實現(xiàn)的:開始時,每個樣本對應(yīng)的權(quán)重是相同的,在此樣本分布下訓(xùn)練出一弱分類器。對于分類錯誤的樣本,加大其對應(yīng)的權(quán)重;而對于分類正確的樣本,降低其權(quán)重。這樣,分錯的樣本就被突出出來,從而得到一個新的樣本分布。在新的樣本分布下,再次對弱分類器進行訓(xùn)練,得到一個新的弱分類器。依次類推,經(jīng)過T次循環(huán),得到T個弱分類器,把這T個弱分類器按一定的權(quán)重疊加起來,得到最終理想的強分類器。
Adaboost算法的計算過程如下:
1)權(quán)值初始化:給訓(xùn)練樣本中的每組數(shù)據(jù)賦予一個初始權(quán)值。
2)迭代計算:第 t 輪迭代中,使用權(quán)值分布Dt訓(xùn)練樣本數(shù)據(jù),得到第t個弱分類器Gt(x),計算Gt(x)在訓(xùn)練樣本數(shù)據(jù)上的誤差率εt、系數(shù)αt,以及函數(shù)f t(x),從而得到第t個弱分類器:
3)得到最終強分類器:如此往復(fù)訓(xùn)練,直到第 t=T 輪迭代后將數(shù)據(jù)全部分類正確時為止,得到最終強分類器:
圖1 月均滑坡次數(shù)-降雨量-地震次數(shù)(上月)分布曲線
通過中國地質(zhì)環(huán)境信息網(wǎng)[1]、中國氣象數(shù)據(jù)網(wǎng)[4]、國家地震科學(xué)數(shù)據(jù)中心[5]、中國統(tǒng)計年鑒[6]等官方網(wǎng)站獲取到了四川省1949—2001年及2014—2017年的滑坡數(shù)據(jù)、降雨數(shù)據(jù)、地震數(shù)據(jù),前者作為建模樣本數(shù)據(jù),后者作為測試數(shù)據(jù)。
經(jīng)整理繪制了1949—2001年月均滑坡次數(shù)-降雨量-地震次數(shù)(上月)分布曲線(圖1)如下所示。
為了便于計算,將當(dāng)月平均滑坡數(shù)≥18次的類別值設(shè)為“1”;將當(dāng)月平均滑坡數(shù)<18次的類別值設(shè)為“-1”。
計算前,繪制數(shù)據(jù)坐標(biāo)分布如圖2所示:
圖2 數(shù)據(jù)坐標(biāo)分布圖
由上圖可找到3個基本分類器如下:
按照Adaboost算法原理進行迭代計算,得到最終的強分類器即滑坡預(yù)測模型為:
用上述模型對四川省2014—2017年的月滑坡次數(shù)進行驗證,在48組數(shù)據(jù)中,預(yù)測成功的次數(shù)為41次,預(yù)測成功率為85.42%。
Adaboost算法可建立包括降雨量、地下水、庫水位、地應(yīng)力、地震、深部位移、地表沉降等的多維度預(yù)測模型,且在通過大量實測數(shù)據(jù)對模型進行優(yōu)化后能具有較高的預(yù)測準(zhǔn)確度,可為滑坡災(zāi)害防治提供宏觀決策依據(jù)。