袁若浩 王保云
(1.云南南師范大學(xué) 數(shù)學(xué)學(xué)院,云南 昆明 650500;2.云南省高校復(fù)雜系統(tǒng)建模及應(yīng)用重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500)
我國是一個(gè)泥石流頻發(fā)的國家[1],特別是西南西北山區(qū),經(jīng)常性發(fā)生特大泥石流,而云南處于云貴高原,海拔較高,且云南省獨(dú)特的水文條件和地理特征、季節(jié)性充沛的降水和較大的地勢起伏成為孕育泥石流災(zāi)害的溫床[2,3],境內(nèi)災(zāi)害廣布、災(zāi)發(fā)頻率高、損失大的特征尤為顯著。因此引發(fā)了人們對泥石流的廣泛關(guān)注,而若是能預(yù)測泥石流發(fā)生的各種情形[4,5],這對相應(yīng)地區(qū)人們的生活以及社會各方面來說都非常有必要。
本文對云南瀾滄江上游流域泥石流發(fā)生的可能性進(jìn)行分析,對其歷年來發(fā)生的泥石流數(shù)據(jù)以及未發(fā)生泥石流的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。由于發(fā)生泥石流的數(shù)據(jù)較少,所以我們選取經(jīng)典模型VGG與AlexNet作為學(xué)習(xí)和訓(xùn)練的框架。通過發(fā)生泥石流與未發(fā)生泥石流的特點(diǎn)分析,來判斷該流域發(fā)生泥石流的可能性。
本文分別使用了上述兩種網(wǎng)絡(luò)模型以及其對應(yīng)的殘差這四種網(wǎng)絡(luò)模型,對泥石流數(shù)據(jù)進(jìn)行訓(xùn)練與測試,從而達(dá)到預(yù)測泥石流是否發(fā)生的目的。
迪慶藏族自治州位于云南西北部,其境內(nèi)有瀾滄江與怒江兩大流域,而且迪慶州地勢北高南低,地貌形態(tài)以山地、古高原面和嶺峰為主,境內(nèi)為“三山挾兩江”。三山為梅里雪山、云嶺雪山山脈、中甸雪山山脈,自西向東依次排列。最高海拔為梅里雪山卡瓦格博峰6740米,最低海拔為維西縣碧玉河入瀾滄江口處1486米。因此瀾滄江上游流域溝壑縱橫,地形復(fù)雜,高差大,是泥石流災(zāi)害的高發(fā)地區(qū)。研究區(qū)域如圖1所示。
圖1 研究區(qū)域示意圖
本文中的數(shù)據(jù)主要是通過DEM獲取的地表特征,這比人工實(shí)地考察更加方便快捷,也更加精確。且實(shí)驗(yàn)需要的許多參數(shù)都可以通過對DEM計(jì)算得到,比如說流域的沖淤面積[13]、土石量[14]等等。我們希望通過VGG和AlexNet及其對應(yīng)的殘差模型對這些泥石流的相關(guān)特征進(jìn)行捕獲,來完成對泥石流孕災(zāi)溝谷的快速識別,并探討哪一種模型的預(yù)測準(zhǔn)確率更高。為了使數(shù)據(jù)能夠適應(yīng)我們的模型,我們要對數(shù)據(jù)進(jìn)行一些篩選和處理。首先我們要區(qū)分出發(fā)生過泥石流的溝谷以及未發(fā)生過泥石流的溝谷。篩選方式如下:對于發(fā)生過泥石流災(zāi)害的溝谷,我們查閱了《云南減災(zāi)年鑒》以及相關(guān)的新聞報(bào)道,將泥石流的發(fā)生地精確到村。并結(jié)合相關(guān)新聞報(bào)道,在瀾滄江流域篩選出50條確認(rèn)發(fā)生過泥石流的溝谷。而在對于沒有被記錄的泥石流溝谷,我們通過谷歌地球的衛(wèi)星地圖篩選出溝谷附近有村莊或農(nóng)田的并記錄下來,通過這種方法同樣選取出了50條無災(zāi)害記錄的溝谷。我們將上述發(fā)生泥石流的50條溝谷記為正樣本,無災(zāi)害記錄的50條泥石流溝谷記為負(fù)樣本,這種負(fù)樣本的構(gòu)造方式與過去直接將無災(zāi)害記錄的泥石流溝谷作為負(fù)樣本的方式有些許不同。因?yàn)橹挥腥藛T和財(cái)產(chǎn)損失的泥石流災(zāi)害才會被記錄,而一些人煙罕至的地方的溝谷,是否發(fā)生過泥石流災(zāi)害是難以確定的。在確定了溝谷的處理后,我們通過ArcGIS確定溝谷的點(diǎn)位,從DEM圖中提取出這些溝谷。然后將收集到的所有圖像數(shù)據(jù)進(jìn)行匯總,選取正負(fù)樣本中各20%的DEM圖作為測試集,另外剩余的各80%的DEM圖作為訓(xùn)練集。
因?yàn)閿?shù)據(jù)樣本較少,為了保障數(shù)據(jù)的大小比例,將同一位置的圖,按照ArcGIS中DEM比例尺,縮放到同一比例下,使得所有的DEM圖變成相同的大小,而且訓(xùn)練的時(shí)候,再進(jìn)行隨機(jī)裁剪和旋轉(zhuǎn)等操作來擴(kuò)充樣本。本實(shí)驗(yàn)所用的DEM圖來自USGS的公開數(shù)據(jù)集,分辨率為30米。圖2為操作完成后的DEM圖。
圖2 正負(fù)樣本示意圖
AlexNet與VGG是神經(jīng)網(wǎng)絡(luò)里的兩個(gè)經(jīng)典模型,對神經(jīng)網(wǎng)絡(luò)的研究具有很深遠(yuǎn)的意義。AlexNet是2012年Image Net競賽冠軍獲得者Hinton和他的學(xué)生Alex Krizhevsky設(shè)計(jì)的。VGG全稱是Visual Geometry Group,因?yàn)樗怯蒓xford的Visual Geometry Group提出的,VGG網(wǎng)絡(luò)在2014年ImageNet圖像分類與定位挑戰(zhàn)賽中獲得分類任務(wù)的第二名和定位任務(wù)的第一名,因其優(yōu)異的性能為人熟知。
其網(wǎng)絡(luò)的主要思想如下:AlexNet打破原有的卷積必池化的思維定式,使用卷積層+卷積層+池化層來提取圖像的特征,并采用新的激活函數(shù)和抑制函數(shù)進(jìn)行多GPU訓(xùn)練。VGG是在AlexNet的基礎(chǔ)上增加網(wǎng)絡(luò)深度并減小卷積核尺寸。殘差網(wǎng)絡(luò)(Resnet)在2015年被提出,其獨(dú)特的殘差結(jié)構(gòu)解決了普通深度神經(jīng)網(wǎng)絡(luò)隨深度增加而導(dǎo)致的梯度爆炸或消失的問題,使得層數(shù)較高的網(wǎng)絡(luò)也能取得較好的性能,在各種圖像分類任務(wù)上表現(xiàn)優(yōu)異。而我們的殘差模型則是在AlexNet與VGG的基礎(chǔ)上分別添加了一些殘差結(jié)構(gòu)。所有正負(fù)樣本都是通過以上模型的特征提取器提取特征的,然后進(jìn)行訓(xùn)練,從而得到預(yù)測的準(zhǔn)確率。圖3為殘差模塊的結(jié)構(gòu)圖。
圖3 殘差模塊示意圖
上述所有模型進(jìn)行訓(xùn)練和測試的主要過程為:每次實(shí)驗(yàn)從所有圖片中隨機(jī)選取正負(fù)樣本的各20%作為測試集,不作增強(qiáng),剩余80%的圖片作為訓(xùn)練集。訓(xùn)練/測試集構(gòu)建方式與實(shí)驗(yàn)流程如圖4所示。
模型的訓(xùn)練與測試均在Pytorch框架下完成。硬件環(huán)境:Intel Xeon Gold-6271@2.60GHz CPU,NVIDIA RTX A4000 GPU;軟件環(huán)境:Ubuntu 18.04操作 系統(tǒng),Python 3.6,CUDA 9.0,Pytorch 0.4.1,以及圖像相關(guān)的第三方庫。
圖4 實(shí)驗(yàn)的流程圖
在實(shí)驗(yàn)開始前,我們在公開數(shù)據(jù)集上先對模型進(jìn)行了預(yù)訓(xùn)練,訓(xùn)練結(jié)果如表1所示。
本實(shí)驗(yàn)分為正負(fù)樣本,有四個(gè)通道,使用VGG和AlexNet作為骨干架構(gòu)來提取圖像特征。在不同超參數(shù)下的四種網(wǎng)絡(luò)的準(zhǔn)確率結(jié)果如表2所示。
表1 不同數(shù)據(jù)集下四種網(wǎng)絡(luò)的訓(xùn)練結(jié)果
由表2可以看出,在學(xué)習(xí)率為0.001的時(shí)候,模型的效果是比較好的。由于每次訓(xùn)練的模型的準(zhǔn)確率都有微小波動(dòng),因此選取多次實(shí)驗(yàn)的均值對比,作為實(shí)驗(yàn)結(jié)果。由表2的結(jié)果,我們將超參數(shù)的設(shè)置為:學(xué)習(xí)率lr:0.001、dropout率:0.5、batch_size:8、epoch:200。從正負(fù)樣本中隨機(jī)選擇20%的DEM圖作為測試集進(jìn)行了10輪實(shí)驗(yàn),由于各次實(shí)驗(yàn)的結(jié)果都比較接近,我們?nèi)∑渲斜憩F(xiàn)較好的兩組。結(jié)果如表3所示。
我們共進(jìn)行了10組平行實(shí)驗(yàn),選取其中一組最好的實(shí)驗(yàn)結(jié)果,繪制了圖5。
從圖5可以看出,損失函數(shù)(loss)都有很大波動(dòng),但最終能夠趨于穩(wěn)定;而且在測試集上的準(zhǔn)確率與在訓(xùn)練集上的準(zhǔn)確率變化趨勢基本保持一致。通過以上實(shí)驗(yàn),我們還可以發(fā)現(xiàn),對泥石流溝谷DEM圖特征的提取中,四個(gè)網(wǎng)絡(luò)的表現(xiàn)都差不多,但是對應(yīng)的兩個(gè)殘差模型表現(xiàn)要更加穩(wěn)定一些。再結(jié)合表3來看,AlexNet的準(zhǔn)確率為68.82%,AlexNet殘差的準(zhǔn)確率為68.86%,VGG的準(zhǔn)確率為73.87%,VGG殘差的準(zhǔn)確率為74.88%。這意味著,對于同流域的其他溝谷圖像,VGG殘差模型的預(yù)測準(zhǔn)確率是最高的。此模型有近75%的可信度認(rèn)為某一溝谷圖像具有發(fā)生或者是未發(fā)生的泥石流溝谷的特征,如果預(yù)測為發(fā)生泥石流溝谷圖像的類,那么此溝谷可能有發(fā)生泥石流的潛在可能,當(dāng)雨季來臨時(shí),溝谷附近的人應(yīng)該提前做好防范措施。
圖5 平行實(shí)驗(yàn)的預(yù)測結(jié)果
上述結(jié)果表明,通過DEM圖結(jié)合殘差網(wǎng)絡(luò)的方法可以快速識別出溝谷是否發(fā)生過泥石流,且有較好的識別準(zhǔn)確率。本文中截取的溝谷DEM灰度圖,保留了溝谷長度、流域面積、溝谷形態(tài)等地貌條件因子,還包括植被覆蓋、土地利用等物質(zhì)條件因子。借助神經(jīng)網(wǎng)絡(luò)對正負(fù)樣本的這些特征進(jìn)行學(xué)習(xí)和預(yù)測是一個(gè)有效的方法,但也存在一些問題,首先,此樣本DEM灰度圖樣本量極少且包含的信息有限,如高程差等信息缺失;其次,由于目前泥石流發(fā)生的背景、形成機(jī)理等認(rèn)識不深,單靠一個(gè)方面的條件來判斷,能提高的精度有限。降雨量是一個(gè)重要的誘發(fā)因素,將誘發(fā)因素、物質(zhì)條件和地貌條件綜合考慮的多模態(tài)深度學(xué)習(xí)可能會取得更好的預(yù)測效果。最后,雖然這幾種模型都是比較經(jīng)典的模型,但是對泥石流發(fā)生可能性的預(yù)測還是不夠精準(zhǔn),我們希望在未來能夠找到一種更加完善的模型,來進(jìn)一步提高預(yù)測的準(zhǔn)確性。