国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SSA-BP 的泥石流敏感性分析

2022-04-12 03:40李英娜
電視技術(shù) 2022年3期
關(guān)鍵詞:搜索算法泥石流敏感性

高 原,李英娜*

(1.昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650500;2.云南省計(jì)算機(jī)技術(shù)應(yīng)用重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500)

0 引言

泥石流是一種以大于10 m·s-1的速度快速前行的混合物,由碎石、泥土和水組成,是一種極具破壞力的自然災(zāi)害。云南省昆明市東川區(qū)的泥石流有非常久遠(yuǎn)的歷史,經(jīng)過近百年的快速發(fā)展,東川區(qū)境內(nèi)現(xiàn)有330 條類型、規(guī)模不盡相同的泥石流溝,其中36 條對居民的生產(chǎn)生活造成了嚴(yán)重的影響。

國外對于泥石流災(zāi)害的調(diào)查分析開展的較早,關(guān)于泥石流敏感性的研究也卓有成效。KOVACS于20 世紀(jì)80 年代使用定性評價(jià)方法對泥石流敏感性進(jìn)行分析,為泥石流敏感性評價(jià)提供了思路[1-2]。與國外相比,我國對泥石流的研究起步晚,但是進(jìn)步很快,唐川在20 世紀(jì)90 年代就使用數(shù)值模擬法進(jìn)行泥石流敏感性評價(jià)。后來,層次分析法[3]、模糊數(shù)學(xué)法[4-5]、信息量法[6]、回歸分析[7]、頻率比法[8]以及人工神經(jīng)網(wǎng)絡(luò)[9-10]等多種模型被應(yīng)用于泥石流敏感性評價(jià)。

麻雀搜索算法(Sparrow Search Algorithm,SSA)具有收斂速度快、尋優(yōu)能力強(qiáng)等特點(diǎn),本文使用麻雀搜索算法(SSA)優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的泥石流敏感度評價(jià)方法,并對SVM,SSA-SVM,BP 神經(jīng)網(wǎng)絡(luò)及SSA-BP 神經(jīng)網(wǎng)絡(luò)4 種機(jī)器學(xué)習(xí)的模型進(jìn)行比較分析。

1 研究區(qū)概況

東川區(qū),東經(jīng)102°48′~103°19′北緯25°47′~26°33′,隸屬于云南省昆明市,位于云南高原北部,屬川滇經(jīng)向構(gòu)造帶與華夏東北構(gòu)造帶結(jié)合過渡部位,南北最大縱距84.6 km,東西最大橫距51.2 km。境內(nèi)山高谷深,地勢陡峻,位于地震活動(dòng)活躍的小江深大斷裂帶,幾乎每年都有地震發(fā)生。另外,小江是一條深切割構(gòu)型河谷,并且小江周圍的山體大部分是碳酸巖類、泥質(zhì)巖類和基性巖類等巖性軟弱、易于風(fēng)化的巖石,為泥石流的發(fā)生提供了豐富的物源條件。東川區(qū)年平均氣溫14.9 ℃,極端最高氣溫42 ℃,極端最低氣溫-7.8 ℃,年平均降水量約為1 000.5 mm,月最大降雨量208.3 mm,日最大降雨量153.3 mm,降雨主要集中在5—9 月,期間降水量占全年降水量的88%左右,充足的降水量容易引起泥石流的爆發(fā)。東川區(qū)礦產(chǎn)豐富,過度的開采使東川植被破壞嚴(yán)重,生態(tài)環(huán)境急劇下降,致使坡面抗沖刷能力差,容易形成泥石流。另外,由于東川泥石流具有分布廣、發(fā)生頻率高、破壞力大以及類型齊全等特點(diǎn),東川又被稱為“泥石流最佳觀測站”“泥石流天然博物館”[11]。

2 數(shù)據(jù)來源與評價(jià)因子分類

2.1 數(shù)據(jù)來源

本文采用的主要數(shù)據(jù)源如下。

(1)遙感數(shù)據(jù)。本文采用的遙感數(shù)據(jù)為2020年5 月成像的Landsat OLI 影像,來源于地理空間數(shù)據(jù)云平臺。其中,多光譜影像分辨率為30 m,全色影像15 m,覆蓋全區(qū)。根據(jù)Landsat OLI 影像,提取了歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)。

(2)地形數(shù)據(jù)。采用的地形數(shù)據(jù)為ASTER GDEM,空間分辨率為30 m,來源于地理空間數(shù)據(jù)云平臺。根據(jù)ASTER GDEM 數(shù)據(jù),本文提取了坡度、坡向及平面曲率3 個(gè)地形地貌因子。

(3)氣候數(shù)據(jù)。包括東川區(qū)及其周圍站點(diǎn)1998—2018 年近20 年間的逐日降雨數(shù)據(jù),來源于中國氣象局。根據(jù)逐日降雨數(shù)據(jù)提取年平均降雨數(shù)據(jù)。

(4)地質(zhì)數(shù)據(jù)。地質(zhì)數(shù)據(jù)基于云南省1∶200 000 的地質(zhì)圖,包括地層數(shù)據(jù)和構(gòu)造分布數(shù)據(jù),來源于全國地質(zhì)資料館。

(5)居民點(diǎn)數(shù)據(jù)。采用1∶250 000 數(shù)據(jù),包括居民地、普通房屋、蒙古包、放牧點(diǎn)等數(shù)據(jù),來源于地理信息專業(yè)知識服務(wù)系統(tǒng),用于提取居民點(diǎn)密度數(shù)據(jù)。

(6)道路數(shù)據(jù)。采用1∶250 000 路網(wǎng)數(shù)據(jù),包含鐵路、公路數(shù)據(jù)等,來源于地理信息專業(yè)知識服務(wù)系統(tǒng),用于提取路網(wǎng)密度數(shù)據(jù)。

(7)土地利用數(shù)據(jù)。為中科院空天院發(fā)布的2020 年土地利用分布數(shù)據(jù),空間分辨率為30 m,包括耕地、森林、草地、灌木地、濕地、水體、苔原、人造地表、裸地、冰川和永久積雪等10 種類型,來源于地球大數(shù)據(jù)科學(xué)工程數(shù)據(jù)共享服務(wù)系統(tǒng)。

(8)泥石流數(shù)據(jù)。本文采用的泥石流數(shù)據(jù)中,77 條來源于中國科學(xué)院資源環(huán)境科學(xué)數(shù)據(jù)中心,175 條來源于Google Earth 高分辨率影像人工解譯,共計(jì)252 條。

2.2 評價(jià)因子的分類

昆明市東川區(qū)泥石流評價(jià)因子多種多樣,并且各個(gè)評價(jià)因子之間并不相互獨(dú)立。為了更客觀地對泥石流敏感性進(jìn)行分析,根據(jù)云南地質(zhì)調(diào)查局野外調(diào)查結(jié)果和東川區(qū)泥石流分布特點(diǎn),選擇了10 個(gè)影響泥石流災(zāi)害的因素:坡度、坡向、曲率、年降雨量、歸一化植被指數(shù)(NDVI)、地層巖性、距構(gòu)造距離、土地利用、居民密度以及路網(wǎng)密度。同時(shí),根據(jù)各評價(jià)因子對泥石流發(fā)生的影響分析,將這些因素劃分為不同的等級如表1 所示。

表1 評價(jià)因子及其分類

評價(jià)因子的屬性值是從30 m×30 m 網(wǎng)格中提取出來的,根據(jù)表1 的分類標(biāo)準(zhǔn),生成各個(gè)評價(jià)因子的分級圖,結(jié)果如圖1(a)~圖1(j)所示。其中,圖1(a)、圖1(b)、圖1(c)分別為從DEM提取的坡度圖、坡向圖、曲率圖。圖1(d)為東川區(qū)年降雨量圖,圖1(e)是歸一化植被指數(shù)(NDVI)圖,圖1(f)為地層特征圖,圖1(g)為東川區(qū)距構(gòu)造距離圖,圖1(h)、圖1(i)、圖1(j)分別為土地利用分類圖、居民密度圖以及道路密度圖。在此基礎(chǔ)上,建立東川區(qū)泥石流敏感性評價(jià)因子數(shù)據(jù)庫,共有2 080 635 個(gè)網(wǎng)格評價(jià)單元。在現(xiàn)有數(shù)據(jù)庫中選擇1 140 個(gè)網(wǎng)格單元作為訓(xùn)練樣本構(gòu)建訓(xùn)練數(shù)據(jù)集,包括176 個(gè)泥石流災(zāi)害點(diǎn)和964 個(gè)非災(zāi)害點(diǎn);760 個(gè)網(wǎng)格單元作為測試樣本,構(gòu)建測試數(shù)據(jù)集,包括76 個(gè)泥石流災(zāi)害點(diǎn)和684 個(gè)非災(zāi)害點(diǎn)。利用訓(xùn)練數(shù)據(jù)集訓(xùn)練了用于泥石流災(zāi)害敏感性分析的4 個(gè)機(jī)器學(xué)習(xí)模型(SVM,SSA-SVM,BP 神經(jīng)網(wǎng)絡(luò)及SSA-BP 神經(jīng)網(wǎng)絡(luò)),并利用測試數(shù)據(jù)集驗(yàn)證了所構(gòu)建的4 個(gè)泥石流敏感性評價(jià)模型的性能。

圖1 泥石流敏感性評價(jià)因子分級圖

3 研究方法

3.1 麻雀搜索算法

XUE 等[12]在2020 年提出了麻雀搜索算法(Sparrow Search Algorithm,SSA),它是根據(jù)麻雀在尋找食物以及逃避追捕者時(shí)候的行為特征提出的。在尋找食物的過程中,一群麻雀負(fù)責(zé)尋找食物并且把食物的位置提供給族群,其余的麻雀則根據(jù)位置前往覓食。種群中的麻雀會相互識別對方的行為,并且有一部分麻雀作為爭奪者會去搶奪一些高攝入量的麻雀的食物,以提高自己的食物攝入。當(dāng)然,受到搶奪的麻雀會根據(jù)搶奪者的行為做出反應(yīng)。

能量儲備的水平是由尋優(yōu)過程中所尋食物的豐富性所決定的。麻雀會在遇到危險(xiǎn)的時(shí)候做出反捕食反應(yīng)。在算法迭代的過程中,發(fā)現(xiàn)食物的麻雀位置更新如下:

式中:t為當(dāng)前迭代次數(shù),itermax為最大的迭代次數(shù),為第i個(gè)麻雀在第j維中的位置信息,α∈(0,1]是一個(gè)隨機(jī)數(shù);R2和ST分別表示預(yù)警值和安全值,其中,R2∈[0,1],ST∈[0.5,1];服從正態(tài)分布的隨機(jī)數(shù)為Q,L中的每一個(gè)元素都為1,是一個(gè)1×d的矩陣。當(dāng)R2

跟隨者的最新位置為:

式中:目前發(fā)現(xiàn)者所占據(jù)的最優(yōu)位置為XP,Xworst為當(dāng)前全局最差的位置,A是1×d的矩陣,1 或-1是矩陣中每個(gè)元素的隨機(jī)賦值,并且A+=AT(AAT)-1,其中A+為偽逆矩陣。當(dāng)i>n/2 時(shí),表明此時(shí)的第i個(gè)跟隨者的適應(yīng)度值較低,處于非常饑餓的狀態(tài),為了獲得更多的能量,它需要去其他區(qū)域?qū)ふ沂澄铩?/p>

麻雀種群會在意識到危險(xiǎn)的時(shí)候進(jìn)行反捕食,其數(shù)學(xué)表達(dá)式為:

式中:Xbest為當(dāng)前的全局最優(yōu)位置,β為步長控制參數(shù),方差為1,服從均值為0 的正態(tài)分布的隨機(jī)數(shù);K是一個(gè)隨機(jī)數(shù),是步長控制參數(shù)同時(shí)還表示麻雀移動(dòng)的方向,且K∈[-1,1];fi為當(dāng)前麻雀個(gè)體的適應(yīng)度值,fg和fw分別為當(dāng)前全局最佳和最差的適應(yīng)度值,ε為最小的常數(shù)。為簡單起見,當(dāng)fi>fg時(shí),此時(shí)的麻雀非常容易受到捕食者的攻擊,因?yàn)樗鼈兲幱诜N群的邊緣位置;當(dāng)fi=fg時(shí),處于種群中間的麻雀非常容易受到捕食者的攻擊,因此它們要靠近其他麻雀來躲避風(fēng)險(xiǎn)。

3.2 BP 神經(jīng)網(wǎng)絡(luò)

反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)是由Rumelhart 和McCelland 帶領(lǐng)的科研團(tuán)隊(duì)在1986年提出的[13]。BP 神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的自學(xué)能力,可以對生物神經(jīng)網(wǎng)絡(luò)和模擬神經(jīng)系統(tǒng)結(jié)構(gòu)進(jìn)行模擬并傳遞信息,是一種非線性數(shù)據(jù)預(yù)測模型。

3.2.1 信號的正向傳播

設(shè)xi為BP 神經(jīng)網(wǎng)絡(luò)隱藏層的輸入值,那么隱藏層的輸出值Hk為:

式中:n是輸入層節(jié)點(diǎn)的個(gè)數(shù),ωik是隱藏層之間連接權(quán)值,αk是隱藏層閾值,g是隱藏層的激活函數(shù)。激活函數(shù)常采用sigmoid 函數(shù),即:

3.2.2 誤差反向傳播

通過連接權(quán)值和偏置的不斷更新,誤差函數(shù)的值逐步減小。當(dāng)誤差達(dá)到最小值時(shí),權(quán)重參數(shù)是最接近最優(yōu)解的[14]。運(yùn)用梯度下降法來求解修正權(quán)值。這樣的影響傳遞鏈條關(guān)系,可以通過參數(shù)的傳遞分析發(fā)現(xiàn),即ωkj影響輸出層輸出值,最后影響到誤差的大小。反向傳播中權(quán)值的更新公式為:

式中:ωkj是連接權(quán)值,ej是預(yù)測誤差,p是輸入層節(jié)點(diǎn)個(gè)數(shù),η是學(xué)習(xí)速率。

當(dāng)相鄰兩次之間的誤差值小于目標(biāo)值,算法收斂,迭代結(jié)束。

3.3 麻雀搜索算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)

圖2 為麻雀搜索算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)流程圖(SSA-BP),麻雀搜索算法對參數(shù)的優(yōu)化步驟如下。

圖2 SSA 優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)流程圖

(1)確定泥石流敏感性評價(jià)模型的輸入與輸出。將東川區(qū)泥石流敏感性評價(jià)因子作為模型的輸入,東川區(qū)泥石流發(fā)生的概率作為模型的輸出。劃分訓(xùn)練集與測試集。

(2)對麻雀搜索算法中的種群規(guī)模、最大迭代次數(shù)以及BP 神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行初始化。

(3)使用交叉驗(yàn)證對訓(xùn)練樣本進(jìn)行分類,每個(gè)麻雀的適應(yīng)度值為交叉驗(yàn)證的準(zhǔn)確率,將最優(yōu)的適應(yīng)度值和麻雀的位置保留下來。

(4)以預(yù)警值的大小作為依據(jù),根據(jù)式(1)對發(fā)現(xiàn)者的位置進(jìn)行更新。

(5)根據(jù)式(2)對跟隨者的位置進(jìn)行更新。

(6)按照式(3)對覺察到危險(xiǎn)的麻雀的位置進(jìn)行更新,在種群中心的麻雀隨機(jī)靠近其他麻雀,而外圍的麻雀會向安全區(qū)域靠攏。

(7)計(jì)算每個(gè)麻雀最新位置的適應(yīng)度值,將所得適應(yīng)度值與之前的最優(yōu)值進(jìn)行比較,然后更新全局最優(yōu)信息。

(8)判斷是否達(dá)到最大迭代次數(shù),如果不滿足,則從步驟(3)開始繼續(xù)重復(fù)上述步驟,反之則結(jié)束流程,輸出最優(yōu)參數(shù),將測試集作為BP 神經(jīng)網(wǎng)絡(luò)模型的輸入,并輸出結(jié)果。

4 敏感性分析與精度評價(jià)

4.1 敏感性分析

將東川區(qū)2 080 635 個(gè)網(wǎng)格中各個(gè)評價(jià)因子的值輸入到SVM,SSA-SVM,BP,SSA-BP 這4 個(gè)機(jī)器學(xué)習(xí)模型中,得到每個(gè)網(wǎng)格發(fā)生泥石流的概率。由于泥石流發(fā)生的概率為0~1,故將泥石流敏感性分為五個(gè)等級:極低、低、中、高和極高,并通過ArcGIS 軟件生成東川區(qū)泥石流敏感性圖。為了能直觀地看出泥石流災(zāi)害點(diǎn)落在各個(gè)敏感性區(qū)域的情況,將地質(zhì)災(zāi)害點(diǎn)標(biāo)記在敏感圖中,如圖3(a)~圖3(d)所示。由圖可以看出,極高以及高敏感性區(qū)域主要分布在小江干流、大白河、中廠河流域,由于河流附近本身就容易發(fā)生泥石流災(zāi)害,并且距離人類活動(dòng)區(qū)域并不遠(yuǎn),會受到人類工程地質(zhì)活動(dòng)影響,因此這些區(qū)域具有較大概率發(fā)生泥石流災(zāi)害。

圖3 不同模型生成的敏感性圖

滑坡點(diǎn)所占各敏感性等級的百分比如表2所示。從表2 可以看出,在SVM,SSA-SVM,BP,SSA-BP機(jī)器學(xué)習(xí)模型所輸出的泥石流敏感性圖中,災(zāi)害點(diǎn)在極高敏感性區(qū)域中的占比分別為0.108 3%,0.183 9%,0.159 3%,0.203 5%,這說明在極高敏感性區(qū)域內(nèi),模型的精度由高到低為SSA-BP,SSA-SVM,BP,SVM。通過表2 還可以看出,災(zāi)害點(diǎn)在極低敏感性區(qū)域中的占比分別為0.001 3%,0.000 7%,0.000 9%,0.000 5%,這說明在極低敏感性區(qū)域內(nèi),模型的精度由高到低依然為SSA-BP,SSA-SVM,BP,SVM。

表2 滑坡點(diǎn)所占各敏感性等級的百分比

4.2 精度評價(jià)

受試者工作特征曲線(Receiver Operator Characteristic Curve,ROC)是評價(jià)模型精準(zhǔn)度的常用方法[15-16]。ROC 曲線以敏感度(真陽性率)為縱坐標(biāo),代表東川區(qū)真實(shí)發(fā)生泥石流的概率;以特異度(假陽性率)為橫坐標(biāo),代表東川區(qū)不真實(shí)發(fā)生泥石流的概率。AUC 表示ROC 曲線下的面積,主要用于衡量模型的泛化性能,即分類效果的好壞。ROC 曲線越靠近左上角,其曲線下面積越大,表示模型精度越高[17]。

圖4 為東川區(qū)泥石流敏感性評價(jià)結(jié)果ROC 圖。由圖可以看出,各個(gè)機(jī)器學(xué)習(xí)模型的ROC 曲線很接近左上角,SVM,SSA-SVM,BP,SSA-BP 的AUC值分別為0.820,0.843,0.826,0.859。由此可見這四種模型精度較高,所得的東川區(qū)泥石流敏感性圖結(jié)果可靠。

圖4 東川區(qū)泥石流敏感性評價(jià)結(jié)果ROC 圖

5 結(jié)語

本文以東川區(qū)泥石流災(zāi)害發(fā)生概率為研究對象,為了提高泥石流預(yù)測模型準(zhǔn)確度,采用GIS 與RS 技術(shù)提取了10 個(gè)評價(jià)因子,并通過4 個(gè)機(jī)器學(xué)習(xí)模型進(jìn)行預(yù)測,最終生成東川區(qū)泥石流敏感性圖。結(jié)合東川區(qū)實(shí)際情況與各位學(xué)者對泥石流預(yù)測的研究,本文采用GIS 與RS 技術(shù)提取了坡度、坡向、曲率、年降雨量、歸一化植被指數(shù)(NDVI)、地層巖性、距構(gòu)造距離、土地利用、居民密度和路網(wǎng)密度這10 個(gè)泥石流評價(jià)因子,實(shí)驗(yàn)效果良好。與傳統(tǒng)SVM與BP 神經(jīng)網(wǎng)絡(luò)相比,通過SSA 優(yōu)化的SVM 與BP神經(jīng)網(wǎng)絡(luò)在預(yù)測精度方面有所提升,SVM,SSASVM,BP 神經(jīng)網(wǎng)絡(luò)以及SSA-BP 神經(jīng)網(wǎng)絡(luò)4 種模型的預(yù)測成功率可以達(dá)到0.820,0.843,0.826,0.859。綜合來看,SSA-BP 神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)最為優(yōu)異。根據(jù)252 條泥石流數(shù)據(jù),經(jīng)驗(yàn)證所生成的泥石流敏感性圖具有較高的可信度。該敏感性圖對于相關(guān)部門在城鄉(xiāng)規(guī)劃、道路規(guī)劃、防災(zāi)減災(zāi)方面具有實(shí)際指導(dǎo)意義,具有一定的社會經(jīng)濟(jì)價(jià)值。

猜你喜歡
搜索算法泥石流敏感性
CT聯(lián)合CA199、CA50檢測用于胰腺癌診斷的敏感性與特異性探討
CR1500HF熱成形鋼氫脆敏感性能研究
現(xiàn)代電力(2022年2期)2022-05-23
經(jīng)前煩躁障礙癥發(fā)病與四氫孕酮敏感性中西醫(yī)研究進(jìn)展
改進(jìn)的非結(jié)構(gòu)化對等網(wǎng)絡(luò)動(dòng)態(tài)搜索算法
改進(jìn)的和聲搜索算法求解凸二次規(guī)劃及線性規(guī)劃
泥石流
基于萊維飛行的烏鴉搜索算法
“民謠泥石流”花粥:唱出自己
泥石流
双城市| 民权县| 昌都县| 鄯善县| 建水县| 大名县| 黄石市| 玉树县| 苏尼特右旗| 温宿县| 明水县| 柳州市| 华阴市| 沧源| 鹤岗市| 庆安县| 锡林浩特市| 大石桥市| 淮阳县| 宜宾县| 新邵县| 长葛市| 扎鲁特旗| 城步| 云南省| 通许县| 北票市| 刚察县| 彭山县| 绥芬河市| 沙田区| 东城区| 神木县| 安泽县| 桂东县| 澄城县| 塘沽区| 沁源县| 柯坪县| 丹寨县| 江北区|