国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于支持向量機(jī)遙感影像滑坡信息提取研究

2023-01-03 11:44趙軍利朱紅巍楊文濤
地理空間信息 2022年12期
關(guān)鍵詞:正確率分類器滑坡

趙軍利,朱紅巍*,楊文濤

(1. 中國地質(zhì)大學(xué)(武漢)地質(zhì)探測與評估教育部重點實驗室,湖北 武漢 430074;2. 北京林業(yè)大學(xué)水土保持學(xué)院,北京 100083)

滑坡信息自動提取一直以來是學(xué)者們研究的熱點問題。如何高效率并高正確率提取滑坡信息,人們還在不斷地探索中[1-11]。近年來,機(jī)器學(xué)習(xí)理論和方法廣泛被人關(guān)注。支持向量機(jī)(SVM)由于泛化能力強(qiáng)、提取精度高等優(yōu)點,在遙感影像信息提取中常常被人們應(yīng)用[12]?;诖?,本文繼續(xù)探索僅采用WorldView-2影像基于SVM提取地震滑坡信息,為以后應(yīng)用影像開展滑坡信息提取及相關(guān)應(yīng)用研究提供參考價值。

1 研究區(qū)概況和數(shù)據(jù)準(zhǔn)備

1.1 研究區(qū)概況

本文研究區(qū)位于汶川縣境內(nèi),映秀鎮(zhèn)(31.021°N,103.367°E)以北的一個區(qū)域,地理坐標(biāo)位于103°26′00″E~103°29′ 30″ E,31°4′ 30″ E~31°8′ 00″ N 之間(見圖1),面積25 km2,屬山間河谷的河流地貌,地形陡峭,平均坡度為34.7°[13]。從地質(zhì)構(gòu)造的角度而言,研究區(qū)位于龍門山活動斷裂帶的中央斷裂帶——北川-映秀斷裂帶上,研究認(rèn)為該斷裂帶是汶川地震的發(fā)震斷裂[13]。從地層巖性特征角度看,研究區(qū)以堅硬塊狀巖漿巖(中元古界花崗巖),侵入巖巖組(二疊系石英閃長巖,古元古界輝長巖)和片麻巖系(康定巖群)組成的彭灌雜巖體,以及沉積巖、火山巖及火山碎屑巖構(gòu)成[14]。2008年汶川地震發(fā)生后,映秀地區(qū)受災(zāi)情況非常嚴(yán)重,房屋幾乎全部倒塌,傷亡近萬人,大部分交通設(shè)施中斷,2 000多畝農(nóng)田被毀[15]。

圖1 研究區(qū)示意圖

1.2 數(shù) 據(jù)

本文使用的數(shù)據(jù)是WorldView-2 衛(wèi)星的高分辨率多光譜遙感影像,成像時間是2011-04-26。影像空間分辨率多2 m,影像由藍(lán)光波段(450~510 nm)、綠光波段(510~580 nm)、紅光波段(630~690 nm)和近紅外波段(770~895 nm)4 個波段組成,該影像質(zhì)量佳,無云。

本文驗證數(shù)據(jù)來自Yang[16],滑坡是許沖[2]基于WorldView 數(shù)據(jù)半自動提取并對部分滑坡野外驗證的結(jié)果。

2 研究方法

2.1 支持向量機(jī)方法原理

本文采用支持向量機(jī)進(jìn)行滑坡信息提取,該方法是一種基于統(tǒng)計學(xué)理論為基礎(chǔ)的機(jī)器學(xué)習(xí)模型算法,該方法是通過最優(yōu)化問題解算以在數(shù)據(jù)高維特征空間里確定最優(yōu)分類超平面,從而能夠處理復(fù)雜數(shù)據(jù)分類問題[17-19]。SVM 通過將低維空間向量集映射到高維空間向量,再構(gòu)造核函數(shù)進(jìn)行分類,使得分類誤差最小,最大程度提升分類器的泛化能力[19]。

SVM最優(yōu)分類函數(shù)表達(dá)式如下:

式中,ai為非負(fù)拉格朗日乘子;yi為類別;K(xi,xj)為核函數(shù);b為分類閾值。

目前,SVM 常采用的核函數(shù)有4 種,主要是Sig?moid核函數(shù)、多項式核函數(shù)(Polynomial)、徑向基核函數(shù)(RBF)、線性核函數(shù)(Linear)。其中,本文多項式采用2次多項式,所有核函數(shù)表達(dá)式如下:

線性核函數(shù)(Linear)為:

多項式核函數(shù)(Polynomial)為:

式中,g>0;c為自然數(shù),c=2。

徑向基核函數(shù)(RBF)為:

Sigmoid核函數(shù)為:

2.2 結(jié)果可靠性評價指標(biāo)

SVM 提取滑坡信息的好壞,需要進(jìn)行可靠性檢驗。本文選取許沖在文獻(xiàn)[11]中提出的滑坡提取率、滑坡非誤判率和滑坡提取正確率3 個指標(biāo)(見表1)評價SVM提取滑坡信息的可靠性。

表1 滑坡提取可靠性的評價指標(biāo)

3 個指標(biāo)中,A為檢驗數(shù)據(jù)集,即研究區(qū)內(nèi)滑坡的正確數(shù)據(jù)集,本文以許沖[2]等學(xué)者目視解譯提取的滑坡信息數(shù)據(jù)集為檢驗數(shù)據(jù)集。B為采用分類方法自動提取的滑坡數(shù)據(jù)集;A∩B為采用分類方法自動提取得到正確的滑坡數(shù)據(jù);A∪B為采用分類方法自動提取的滑坡數(shù)據(jù)集與正確數(shù)據(jù)集的并集,即所有滑坡數(shù)據(jù)集。因此,理想狀況下,應(yīng)該可以得到A=B=A∩B=A∪B,即滑坡提取的正確率為100%。

3 結(jié)果及評價

3.1 提取方法

本文采用ENVI 5.3軟件中的SVM進(jìn)行滑坡信息提取。SVM 分類器的提取結(jié)果主要受核函數(shù)和分類可能性閾值(CPT)影響。在SVM 分類器中,CPT 值為0時,表示影像上的所有像元都參與分類;為1時,表示所有像元都不參與分類。為此,本文結(jié)合SVM核函數(shù)與CPT 的值域進(jìn)行實驗。SVM 4 個核函數(shù)為線性(Lin?ear)、多項式(Polynomial)、徑向基(RBF)和Sig?moid,CPT 的值分別設(shè)置為0、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9共10種情況,依次進(jìn)行實驗。然后將分類結(jié)果由柵格數(shù)據(jù)轉(zhuǎn)換為矢量數(shù)據(jù),并單獨提取滑坡數(shù)據(jù)集,并做可靠性評價。將SVM提取的滑坡數(shù)據(jù)集與許沖[2]等學(xué)者目視解譯的數(shù)據(jù)集進(jìn)行對比分析,對每一個提取結(jié)果進(jìn)行可靠性評價,該方法的流程圖如圖2所示。

圖2 滑坡信息提取流程圖

SVM分類器是一種監(jiān)督分類方法,首先需要選取訓(xùn)練樣本ROI。本文重點考慮提取WorldView-2 影像中的滑坡信息,滑坡概念上有廣義和狹義之分。本文采用廣義的界定,滑坡指坡體上、裸露的沒有植被覆蓋的不穩(wěn)定基巖、碎屑物質(zhì)等,包含滑坡、崩塌以及泥石流等[4]。其余地物主要分為不透水面(道路、堤岸、橋梁等)、植被以及水體4類。結(jié)合前期相關(guān)研究成果,并參照影像共采集4 種地物的訓(xùn)練樣本,共30 181個像元。

為了更加快速自動提取滑坡信息,本文主要基于影像的光譜信息提取研究區(qū)的滑坡信息。結(jié)合World?View-2影像特點以及研究區(qū)地物情況,本文主要選取影像的多光譜波段、歸一化植被指數(shù)(NDVI)和歸一化水體指數(shù)(NDWI)以及紋理特征作為特征數(shù)據(jù)集。研究區(qū)位于山區(qū),有不少地區(qū)被植被覆蓋,NDVI能夠靈敏地反映植被生長狀況,在遙感影像植被信息提取中經(jīng)常被用的度量參數(shù)[5]。研究區(qū)有河流經(jīng)過,NDWI能夠在遙感影像上反映水體的特征狀況,并且能夠?qū)⑺w與非水體信息有效地區(qū)分[20]。WorldView-2是高分辨率影像,空間信息豐富,各種地物的紋理、結(jié)構(gòu)和細(xì)節(jié)等信息更加突出,為此本文還加入了影像的紋理特征。

3.2 結(jié)果評價

實驗總共獲得了40個滑坡信息提取的結(jié)果,基于滑坡提取率、滑坡非誤判率和滑坡提取正確率3 個指標(biāo)評價滑坡信息提取的可靠性,詳見表2,其中,滑坡檢驗數(shù)據(jù)集A包含2 358 273個像元。

表2 滑坡自動提取結(jié)果及可靠性評價

從表2反映出,采用SVM提取滑坡信息,同時取決于核函數(shù)與CPT 兩個量。且無論選取哪個核函數(shù),當(dāng)CPT 的值為0 時,影像中的所有像元參與分類,提取的滑坡面積最大,與之對應(yīng)的滑坡提取率也最大,相應(yīng)的滑坡非誤判率最小。

為了更直觀地分析SVM中的核函數(shù)與CPT值之間對滑坡信息提取的影響,繪制SVM每個核函數(shù)滑坡提取率、滑坡非誤判率和滑坡提取正確率結(jié)果圖(見圖3)

圖3 SVM 4個核函數(shù)滑坡提取率、滑坡非誤判率和滑坡提取正確率結(jié)果圖

圖3 四個子圖直觀反映出一個總的趨勢,滑坡正確提取率隨著CPT 的值越大,正確提取率逐漸變大。當(dāng)CPT 值達(dá)到某一個數(shù)值時,正確提取率達(dá)到最大值,然后正確提取率隨著CPT值變大而又逐步減小。

從圖3 四個子圖反映出,CPT、滑坡提取率與滑坡非誤判率之間存在一個總體趨勢,當(dāng)CPT的值越大時,滑坡提取率越小,滑坡非誤判率越大,相反,當(dāng)CPT的值越小時,滑坡提取率越大,滑坡非誤判率越小。但是在局部范圍內(nèi)存在一定的波動,如Sigmoid核函數(shù)CPT值為0.2時,線性核函數(shù)CPT值為0.3和0.5時,滑坡提取率出現(xiàn)了一小的波動。其中,Sigmoid核函數(shù)滑坡提取率最大,為77.77%;其正確提取率也最大,為73.34%,CPT值為0.7。表2實驗數(shù)據(jù)表明,滑坡提取率大,并不一定代表滑坡正確提取率就高。如線性核函數(shù)最大提取率為70.97%,其正確提取率最大為67.33%。而多項式核函數(shù)最大提取率為68.18%,其正確提取率最大為67.39%。

根據(jù)圖4b目視解譯的滑坡信息,可以發(fā)現(xiàn)研究區(qū)滑坡體多,并主要位于山區(qū)地帶。從圖4c、4d、4e、4f 4個子圖可以看出,SVM能夠提取大部分研究區(qū)的滑坡信息,但是總而言,滑坡信息提取的精度不夠高。主要是:①本文選擇分類器為基于像元的提取方法,基于像元的分類器在對影像信息提取時,部分影像像元受地形、地表覆蓋物、陰影等因素影響,導(dǎo)致在信息提取時被錯分或漏分,以至于降低影像信息提取的精度。②由于滑坡與不透水面之間在影像上存在一些差異,但是其包含的光譜信息差異卻不大,從4個信息提取的結(jié)果圖上看,滑坡提取的誤差主要是將一部分河岸、人工建筑物等要素錯分到滑坡中,滑坡中的一些像元又錯分至不透水面中去,導(dǎo)致滑坡信息提取精度不夠高。③面積較小的滑坡體由于其光譜特征在影像上表現(xiàn)的不明顯,多數(shù)小滑坡體被提取時存在錯分或漏分的情況,這也是導(dǎo)致本文滑坡提取正確率不高的一個關(guān)鍵因素。

圖4 影像原圖及SVM提取的滑坡信息結(jié)果圖

4 結(jié) 論

本文僅采用WorldView-2 高分辨率影像為數(shù)據(jù)基礎(chǔ),選擇汶川縣境內(nèi)映秀鎮(zhèn)以北的一個區(qū)域作為研究區(qū),采用SVM 分類器,針對該分類器中的核函數(shù)與CPT 閾值設(shè)定進(jìn)行滑坡信息提取,結(jié)果表明采用Sig?moid 核函數(shù),CPT 為0.7 時,SVM 提取的滑坡 正確率最高,為73.34%。但是相比許沖[11]采用最大似然法提取的滑坡正確率有顯著提高,且本文采用SVM提取的滑坡信息,面積較大的滑坡體提取的邊界和分布范圍相對完整?;碌刭|(zhì)災(zāi)害發(fā)生后,在時間緊、區(qū)域大、滑坡數(shù)量多等緊急狀況下,快速獲得滑坡信息值得進(jìn)一步研究探索,本文只采用一種影像數(shù)據(jù),這種方法的可避免多種數(shù)據(jù)源在融合過程中存在的各種誤差或復(fù)雜處理過程,但是本文自動提取的結(jié)果正確率還不夠高,直接應(yīng)用到滑坡定量分析研究中去,顯然達(dá)不到要求。定量分析研究針對每一個滑坡的邊界、位置等其他要素都有嚴(yán)格的量化要求,否則,其研究結(jié)果可靠性難以保證。因此,本文基于SVM在高分辨率影像上提取滑坡信息,雖然較前人研究在精度上取得了提高,但還需要進(jìn)一步探索研究。

猜你喜歡
正確率分類器滑坡
2001~2016年香港滑坡與降雨的時序特征
個性化護(hù)理干預(yù)對提高住院患者留取痰標(biāo)本正確率的影響
學(xué)貫中西(6):闡述ML分類器的工作流程
滑坡推力隱式解與顯式解對比分析——以河北某膨脹土滑坡為例
基于樸素Bayes組合的簡易集成分類器①
門診分診服務(wù)態(tài)度與正確率對護(hù)患關(guān)系的影響
基于特征選擇的SVM選擇性集成學(xué)習(xí)方法
基于差異性測度的遙感自適應(yīng)分類器選擇
淺談公路滑坡治理
生意
皋兰县| 左贡县| 霍林郭勒市| 阜南县| 武邑县| 剑阁县| 团风县| 兴城市| 东乌| 光山县| 比如县| 五莲县| 边坝县| 滦南县| 梅河口市| 怀集县| 墨玉县| 睢宁县| 静安区| 平潭县| 长汀县| 滨州市| 沈丘县| 四子王旗| 道真| 会泽县| 麻江县| 鄢陵县| 朝阳市| 尼勒克县| 石楼县| 军事| 武汉市| 遵化市| 义乌市| 长寿区| 东丰县| 合肥市| 江川县| 武胜县| 齐河县|