申玉松,張 宸,王藝杰,張 迪
1. 河南省第三地質(zhì)礦產(chǎn)調(diào)查院有限公司,河南 信陽 450000;2. 河南省自然資源科技創(chuàng)新中心(信息感知技術(shù)應(yīng)用研究),河南 鄭州 450000
地質(zhì)災(zāi)害易發(fā)性評價是在對以往地質(zhì)災(zāi)害調(diào)查基礎(chǔ)上,通過對其發(fā)育的地質(zhì)環(huán)境條件分析和判斷,總結(jié)有利于地質(zhì)災(zāi)害發(fā)育的地質(zhì)環(huán)境條件組合,推斷相同條件下地質(zhì)災(zāi)害發(fā)育的可能性[1],為防災(zāi)減災(zāi)工作提供目標(biāo)靶區(qū). 常用的地質(zhì)災(zāi)害易發(fā)性評價方法可分為定性評價、定量評價兩種,具體包括專家打分法、層次分析法、信息量法、證據(jù)權(quán)法、確定性系數(shù)法、支持向量機、決策樹、神經(jīng)網(wǎng)絡(luò)等. 這些方法經(jīng)廣泛應(yīng)用和驗證,取得了很好的效果[2-4]. 但各方法均存在一定的缺陷,如人為因素影響大、無法比較不同指標(biāo)間的相對重要性、偏離實際等. 而多方法、多模型的相互耦合,由于能相互驗證、相互補充且評價精度和合理性更高,在近年來被廣泛應(yīng)用[5-10].
傳統(tǒng)確定性系數(shù)(Certainty Factor,CF)模型[11]能客觀反映指標(biāo)內(nèi)部不同分級對地質(zhì)災(zāi)害易發(fā)性的影響值,解決多源數(shù)據(jù)類型的合并問題,但是忽略了不同指標(biāo)間的差異性;而邏輯回歸(Logistic Regression,LR)模型基于對大量數(shù)據(jù)的統(tǒng)計分析,能夠較為精確地反映指標(biāo)間的相對權(quán)重. 兩種方法結(jié)合使用[12],即CF-LR 模型,由傳統(tǒng)確定性系數(shù)模型提供地質(zhì)災(zāi)害與評價指標(biāo)關(guān)系的數(shù)據(jù),經(jīng)邏輯回歸計算得到指標(biāo)相對權(quán)重,能夠大大提高評價的精度和合理性.
信陽市地質(zhì)災(zāi)害數(shù)量多年保持在250~350 處,尤其是南部山區(qū)的縣區(qū),地質(zhì)災(zāi)害密度達3~6 處/100 km2,是地質(zhì)災(zāi)害多發(fā)市,地質(zhì)災(zāi)害防治任務(wù)艱巨. 本研究通過以往地質(zhì)災(zāi)害資料收集和分析,選取研究區(qū)內(nèi)地質(zhì)災(zāi)害影響指標(biāo),構(gòu)建評價指標(biāo)體系,基于ArcGIS 平臺,采用CF-LR 模型,對地質(zhì)災(zāi)害易發(fā)性進行評價,以期為信陽市防災(zāi)減災(zāi)、國土空間規(guī)劃等工作提供參考.
信陽市位于河南省東南部,豫皖鄂三省交界,地處中國地理南北分界線、氣候分界線. 整體地勢西南高、東北低,海拔高度19~1 570 m. 氣候溫暖濕潤,年均氣溫6~15 ℃,年均降雨量1 000~1 400 mm. 受大別山造山運動和淮河沖積共同作用,地貌類型自南向北依次為低山、丘陵、崗地和平原,巖性由南部的混合巖、花崗巖,逐漸向北變化為泥巖、砂巖和第四系沖洪積層. 復(fù)雜的造山運動對區(qū)內(nèi)巖土體擠壓、抬升和錯斷,形成網(wǎng)格狀構(gòu)造格局,龜梅斷裂、桐商斷裂和定遠(yuǎn)-八里販斷裂等區(qū)域斷層縱貫全區(qū). 區(qū)內(nèi)地質(zhì)災(zāi)害主要為崩塌、滑坡,多受降雨誘發(fā)失穩(wěn).
確定性系數(shù)模型(CF)以確定性系數(shù)來表征地質(zhì)災(zāi)害發(fā)育的可能性,主要通過衡量現(xiàn)狀條件下地質(zhì)災(zāi)害發(fā)育情況確定[13]. 通過式(1)可以獲得無量綱的CF值,其以比值形式將不同地質(zhì)環(huán)境條件統(tǒng)一. 通常CF取值為[-1,1],值越大表示地質(zhì)災(zāi)害發(fā)生的確定性越大.
式中,CF—確定性系數(shù),地質(zhì)災(zāi)害發(fā)育的概率;Pa—地質(zhì)災(zāi)害在地質(zhì)環(huán)境條件a 中發(fā)生的概率,通常用地質(zhì)環(huán)境條件a 中的地災(zāi)數(shù)量與地質(zhì)環(huán)境條件a 總面積的比值表示,其取值范圍為[0,1];Ps—地質(zhì)災(zāi)害發(fā)育的概率,通常用地質(zhì)災(zāi)害總數(shù)與研究區(qū)面積比值表示,同一研究區(qū)內(nèi)為定值.
邏輯回歸模型(LR)是探索眾多數(shù)據(jù)特征關(guān)系的一種常用的統(tǒng)計方法,計算公式見式(2). 在地質(zhì)災(zāi)害易發(fā)性評價中,地質(zhì)災(zāi)害是否發(fā)生為因變量(0 為否,1為是),各地質(zhì)環(huán)境條件為自變量,通過自變量與因變量之間關(guān)系分析,得到不同自變量組合下的地質(zhì)災(zāi)害發(fā)生概率.
式中,P—地質(zhì)災(zāi)害發(fā)生的概率;Y—地質(zhì)災(zāi)害與地質(zhì)環(huán)境條件的關(guān)系方程;β1,…,βn—邏輯回歸系數(shù),為各地質(zhì)環(huán)境條件對地質(zhì)災(zāi)害的作用強度;β0—常數(shù),表示在不受任何因素影響條件下,地質(zhì)災(zāi)害發(fā)生與不發(fā)生概率之比的對數(shù)值[14];x1,x2,…,xn—各地質(zhì)環(huán)境條件對應(yīng)的CF值.
信陽市地質(zhì)災(zāi)害數(shù)據(jù)主要來自2012~2021 年各縣區(qū)統(tǒng)計和公布的2022 年地質(zhì)災(zāi)害隱患點核查數(shù)據(jù),共收集933 處地質(zhì)災(zāi)害點(見圖1),其中崩塌、滑坡地質(zhì)災(zāi)害點914 處,占比98%,其他為泥石流和地面塌陷.由于泥石流和地面塌陷地質(zhì)災(zāi)害占比小,且發(fā)育分布受單個因素控制明顯,本次研究選取914 處崩塌、滑坡作為研究對象.
圖1 信陽市地質(zhì)災(zāi)害分布圖Fig. 1 Distribution map of geohazards in Xinyang City
研究采用DEM 數(shù)據(jù)為地理空間數(shù)據(jù)云平臺獲取的ASTER GDEM 數(shù)據(jù),夜間燈光數(shù)據(jù)源為2021 年NPP/VIIRS 年均夜光遙感數(shù)據(jù),植被數(shù)據(jù)為Landsat8影像波段疊加計算得到的歸一化植被指數(shù)(Normalized Differential Vegetation Index,NDVI),地質(zhì)數(shù)據(jù)源為1 ∶20 萬地質(zhì)圖.
影響地質(zhì)災(zāi)害發(fā)育分布的因素十分復(fù)雜[15],各因素的作用方式、強度在不同區(qū)域存在差異. 通過對研究區(qū)資料分析,選擇坡度、坡向、地形曲率、到水系距離、到斷層距離、夜間燈光指數(shù)和NDVI 共7 項指標(biāo)進行地質(zhì)災(zāi)害易發(fā)性評價. 地質(zhì)災(zāi)害點在各指標(biāo)圖層中的分布見圖2—8.
圖2 地質(zhì)災(zāi)害點在坡度圖層中的分布Fig. 2 Distribution of geohazard sites by slope gradient
坡度:斜坡巖土體是在各種力相互作用下保持平衡的,其中坡度的大小直接影響重力沿斜坡向下的分力,是影響斜坡穩(wěn)定性的重要因素. 坡度的大小還決定地質(zhì)災(zāi)害發(fā)生的類型和破壞機制. 通過ArcGIS 中坡度工具,基于DEM,提取得到地形坡度數(shù)據(jù),并分類成8 級:≤5°,5~10°,10~15°,15~20°,20~25°,25~30°,30~35°,>35°(圖2).
坡向:不同坡向在接受陽光照射、降雨等方面存在差異,從而間接影響植被覆蓋、風(fēng)化速率和人口分布等,進而影響地質(zhì)災(zāi)害的發(fā)育分布. 通常在相同巖土體條件下,陽坡面接受了較多的陽光照射和降雨,巖石風(fēng)化速率更快,坡表松散的覆蓋層更厚,人類對地質(zhì)環(huán)境條件的改造也更多. 將坡向數(shù)據(jù)分成東、西、南、北和平地共5 個方向(圖3).
圖3 地質(zhì)災(zāi)害點在坡向圖層中的分布Fig. 3 Distribution of geohazard sites by slope aspect
地形曲率:斜坡剖面形態(tài)影響了巖土體內(nèi)的應(yīng)力分布,凸型坡在坡體前緣形成應(yīng)力集中,更容易發(fā)生失穩(wěn). 地形曲率是斜坡剖面形態(tài)的定量度量指標(biāo),正值表示凸型坡,負(fù)值表示凹型坡,曲率越接近0 表示坡面越平坦. 研究區(qū)地形曲率為-0.84~0.45,將其分成6級:<-0.5,-0.5~-0.2,-0.2~-0.05,-0.05~+0.05,0.05~0.2,>0.2(圖4).
圖4 地質(zhì)災(zāi)害點在地形曲率圖層中的分布Fig. 4 Distribution of geohazard sites by terrain curvature
到水系距離:河流對地質(zhì)災(zāi)害的影響主要在于水流對河道兩側(cè)岸坡的侵蝕作用,不斷增加的岸坡高度和坡度,為巖土體失穩(wěn)提供了臨空條件. 區(qū)內(nèi)水系主要為淮河二級及以下支流,結(jié)合現(xiàn)場實際,將河流影響劃分成6 級:<100 m,100~200 m,200~300 m,300~400 m,400~500 m,>500 m(圖5).
圖5 地質(zhì)災(zāi)害點在到水系距離圖層中的分布Fig. 5 Distribution of geohazard sites by distance to water system
到斷層距離:斷層破壞巖土體的完整性,控制地質(zhì)災(zāi)害邊緣,為雨水入滲提供通道. 一般到斷層距離越近,巖土體結(jié)構(gòu)面越發(fā)育,結(jié)構(gòu)越破碎,地質(zhì)災(zāi)害發(fā)育也越集中. 選擇1 km 間隔作斷層緩沖區(qū),研究區(qū)共分為6 級:<0.5 km,0.5~1.5 km,1.5~3 km,3~5 km,5~8 km,>8 km(圖6).
圖6 地質(zhì)災(zāi)害點在到斷層距離圖層中的分布Fig. 6 Distribution of geohazard sites by distance to faults
夜間燈光指數(shù):為人類活動的一種有效表征形勢,對國民生產(chǎn)總值、人口數(shù)量有一定的指示意義. 研究區(qū)夜間燈光指數(shù)分布相對集中,其中大值主要分布在市區(qū)、縣城、經(jīng)濟活躍鄉(xiāng)鎮(zhèn)以及重要道路周邊,其余位置夜間燈光指數(shù)為小值. 將夜間燈光指數(shù)劃分成6級:0,0~10,10~20,10~30,30~40,>40(圖7).
圖7 地質(zhì)災(zāi)害點在夜間燈光指數(shù)圖層中的分布Fig. 7 Distribution of geohazard sites by nighttime light index
NDVI:植被能減少雨水沖刷,減緩水流入滲,對自然斜坡具有一定保護作用,但植被的自重加載和根劈作用又破壞著坡體的穩(wěn)定性. 研究區(qū)NDVI 值在-0.56~+0.79 之間,將其分成6 級:水域(<-0.1)、裸地(-0.1~0)、荒地(0~0.1)、草地(0.1~0.2)、林地(0.2~0.3,>0.3)(圖8).
圖8 地質(zhì)災(zāi)害點在NDVI 圖層中的分布Fig. 8 Distribution of geohazard sites by NDVI
為保證各評價指標(biāo)柵格單元的一致性,首先需要對各評價指標(biāo)圖層進行統(tǒng)一. 各評價指標(biāo)圖層按照100 m×100 m 進行重采樣,共計1 892 722 個柵格單元.
根據(jù)914 處地質(zhì)災(zāi)害點在各指標(biāo)分類級別中的分布數(shù)量和對應(yīng)面積,利用CF 模型,得到各分類級別對應(yīng)的CF值,結(jié)果見表1.
表1 各評價指標(biāo)確定性系數(shù)CF 計算結(jié)果表Table 1 Deterministic coefficient calculation results of each evaluation factor
相關(guān)性過大的指標(biāo)可導(dǎo)致計算結(jié)果偏離實際,為保證計算結(jié)果的合理性,需要對指標(biāo)的獨立性進行檢驗. 采用相關(guān)性分析法對7 個指標(biāo)的獨立性進行檢驗,在SPSS 19.0 中得到相關(guān)系數(shù)矩陣(見表2). 表2中x1、x2、x3、x4、x5、x6、x7分別代表坡度、坡向、地形曲率、到水系距離、到斷層距離、夜間燈光指數(shù)、NDVI.
表2 評價指標(biāo)間的相關(guān)性系數(shù)矩陣Table 2 Correlation coefficient matrix of evaluation indexes
結(jié)果顯示:評價指標(biāo)之間的相關(guān)性系數(shù)絕對值最大為0.177,小于0.3,表明所選取的因子之間的相關(guān)性小,7 個指標(biāo)全部可納入分析.
采用LR 模型計算回歸系數(shù),首先需要選擇訓(xùn)練樣本,確定訓(xùn)練樣本集. 樣本選擇的合理與否直接影響計算結(jié)果的準(zhǔn)確性. 本次計算采用隨機選取的方式確定,其中地質(zhì)災(zāi)害點隨機選取總數(shù)的80%左右,非地質(zhì)災(zāi)害點在地質(zhì)災(zāi)害點200 m 緩沖區(qū)以外的區(qū)域內(nèi)隨機生成. 共選取714 處地質(zhì)災(zāi)害點和714 處非地質(zhì)災(zāi)害點,形成包含1 428 點的訓(xùn)練集. 通過點提取,確定各樣本對應(yīng)的評價指標(biāo)分類,并替換成各CF值.將CF值作為自變量,是否發(fā)生地質(zhì)災(zāi)害作為因變量(0為否,1 為是),導(dǎo)入SPSS 軟件進行邏輯回歸,計算結(jié)果見表3. 由結(jié)果可知,評價指標(biāo)的顯著性均小于0.05,回歸系數(shù)有效,具有統(tǒng)計意義. 回歸系數(shù)均為正數(shù)表示所有評價指標(biāo)對模型均起正向作用.
表3 邏輯回歸結(jié)果匯總表Table 3 Results of logistic regression
將計算得到的各指標(biāo)回歸系數(shù)代入LR 模型,可得邏輯回歸方程,見式(3).
式中:P—地質(zhì)災(zāi)害發(fā)生的概率,值為[0,1];x1、x2、x3、x4、x5、x6、x7—坡度、坡向、地形曲率、到水系距離、到斷層距離、夜間燈光指數(shù)、NDVI 各分類等級的CF值.
利用ArcGIS 中柵格計算器將各指標(biāo)圖層的柵格值賦為對應(yīng)的CF,通過加權(quán)疊加計算,得到柵格單元的地質(zhì)災(zāi)害發(fā)生的概率P.
由計算可知,研究區(qū)發(fā)生地質(zhì)災(zāi)害的概率P 位于0.0043~0.9753 之間.
對得到的概率P 柵格圖按照等間距法確定地質(zhì)災(zāi)害易發(fā)程度等級(見圖9),共分成4 類:低易發(fā)區(qū)(<0.25)、中易發(fā)區(qū)(0.25~0. 5)、高易發(fā)區(qū)(0.5~0.75)、極高易發(fā)區(qū)(>0.75).其面積及占比分別為10 337.73 km2(54.90%)、2 674.38 km2(14.20%)、3 673.03 km2(19.51%)和2 145.30 km2(11.39%).
圖9 地質(zhì)災(zāi)害易發(fā)程度區(qū)劃與檢驗樣本分布Fig. 9 Susceptibility zoning and distribution of geohazard test samples
從易發(fā)程度分區(qū)結(jié)果可知:信陽市地質(zhì)災(zāi)害易發(fā)程度以低為主,分布在東北部,主要為淮河沖積平原,地勢較為平坦,地層巖性為沖洪積粉土、粉砂,構(gòu)造不發(fā)育;其次為中—高易發(fā)區(qū),合計占比33.71%,分布在中部,呈帶狀展布,為丘陵地貌區(qū);極高易發(fā)區(qū)主要分布在南部、西北部,溝道深切,地勢起伏較大,巖性復(fù)雜多變,構(gòu)造發(fā)育.
評價結(jié)果是否有效,通常進行兩個方面的檢驗,即合理性檢驗和準(zhǔn)確性檢驗.
為保持評價模型的穩(wěn)定性,減少檢驗樣本選擇中的人為影響,本研究選取未參與邏輯回歸計算的200處地質(zhì)災(zāi)害點進行合理性檢驗. 由檢驗結(jié)果(表4)可知,隨著地質(zhì)災(zāi)害易發(fā)等級的提高,地質(zhì)災(zāi)害在數(shù)量、密度上均呈增多的趨勢,占總面積30.9%的極高、高易發(fā)區(qū),分布了77.5%的檢驗點地質(zhì)災(zāi)害,說明易發(fā)程度越高,越易發(fā)育地質(zhì)災(zāi)害,區(qū)劃結(jié)果是合理的.
表4 地質(zhì)災(zāi)害易發(fā)性評價合理性檢驗統(tǒng)計表Table 4 Rationality test results of geohazard susceptibility evaluation
ROC 曲線[16]是一種不受臨界約束的結(jié)果評價方法,能有效地對評價結(jié)果的準(zhǔn)確性進行檢驗[17]. 其以假陽性率(未發(fā)生地質(zhì)災(zāi)害的單元被正確預(yù)測的比例)為橫坐標(biāo),真陽性率(發(fā)生地質(zhì)災(zāi)害的單元被正確預(yù)測的比例)為縱坐標(biāo)繪制的曲線,用于描述敏感性和特異性之間的關(guān)系. 曲線下的面積為AUC(Area Under Curve)值,是衡量模型準(zhǔn)確性指標(biāo)[18],取值區(qū)間為[0.5,1],值越大表示模型準(zhǔn)確性越好.
將914 處地質(zhì)災(zāi)害點和714 處隨機生成的非地質(zhì)災(zāi)害點全部作為樣本,通過SPSS 19.0 進行ROC 曲線分析(圖10). 結(jié)果顯示,本次評價AUC 值為0.828,易發(fā)性評價結(jié)果準(zhǔn)確性較高,表明CF-LR 模型可以較為準(zhǔn)確地對信陽市的地質(zhì)災(zāi)害易發(fā)程度進行評價.
圖10 評價模型ROC 曲線Fig. 10 ROC curve of evaluation model
1)在諸多前人研究中,指標(biāo)體系的構(gòu)建均根據(jù)經(jīng)驗人為選定,帶有一定的主觀性[19]. 本研究在指標(biāo)選取時,斷層、巖性、高程等相關(guān)性較大,進行了取舍,存在一定的片面性.
2)對地質(zhì)災(zāi)害評價目前趨于風(fēng)險評價,是在易發(fā)性、危險性、易損性基礎(chǔ)上開展的[20],將地質(zhì)災(zāi)害發(fā)生概率、承載對象易損程度綜合考慮,更客觀、合理. 研究區(qū)的風(fēng)險性將在其他論文中進行闡述.
1)信陽市地質(zhì)災(zāi)害易發(fā)性影響大小依次是:到水系距離>到斷層距離>坡向>夜間燈光指數(shù)>坡度>NDVI>地形曲率.
2)信陽市地質(zhì)災(zāi)害易發(fā)性以低易發(fā)為主,面積10 337.73 km2,占比54.90%,主要分布在東北部淮河沖積平原區(qū),地形起伏較?。粯O高易發(fā)區(qū)面積2 145.30 km2,占比11.39%,主要分布在南部、西北部,地勢起伏較大,巖性復(fù)雜多變,結(jié)構(gòu)破碎. 中—高易發(fā)區(qū)分布在中部,帶狀分布.
3)將邏輯回歸模型進行合理性檢驗,地質(zhì)災(zāi)害易發(fā)程度越高,地質(zhì)災(zāi)害分布則越多,評價結(jié)果較為合理. 用ROC 曲線對模型的準(zhǔn)確性進行檢驗,其AUC 值為0.828,精度較高,說明CF-LR 模型能夠較為客觀準(zhǔn)確地對信陽市地質(zhì)災(zāi)害進行評價.