摘要:針對遙感圖像山體滑坡分割提取難度大、精度低等問題,提出了一種基于改進U-Net網(wǎng)絡(luò)的遙感圖像山體滑坡分割提取方法。首先將原始網(wǎng)絡(luò)中的特征提取模塊用殘差網(wǎng)絡(luò)ResNet進行替換,加深網(wǎng)絡(luò)防止梯度消失,可以學(xué)習(xí)到更深層的特征;其次,融入(multi-scale features fusion module)多尺度特征融合注意力模塊增強發(fā)現(xiàn)山體滑坡區(qū)域的能力;最后,采用廣義的損失函數(shù)FTL(Focal Tversky Loss)替換帶權(quán)重的交叉熵損失函數(shù)以平衡準(zhǔn)確率和召回率之間的關(guān)系。實驗結(jié)果表明,改進后算法mIoU為65.92%,比改進前提升了2.5個百分點,mPA為73.93%,比改進前提升了3.56個百分點,F(xiàn)1-score綜合得分指標(biāo)為60.08%,比改進前提升5.09個百分點。改進后模型算法能有效提高山體滑坡分割性能。
關(guān)鍵詞:遙感圖像;山體滑坡分割;U-Net網(wǎng)絡(luò);ResNet;損失函數(shù)
中圖分類號:TP277;TP311.1文獻標(biāo)識碼:A文章編號:1009-3583(2024)-0090-04
Landslide Segmentation Extraction from Remote Sensing Images Based on Improved U-Net Network
SUN Xie-yao1,LI Xiu-ru2,HOU Xiu-li1,YIN Xi-xiang1
(1.Anhui Business College,Wuhu 241000,China;2.Ma’anshan University,Ma’anshan 243000,China)
Abstract:A remote sensing image landslide segmentation and extraction method based on an improved U-Net network is proposed to address the difficulties and low accuracy of remote sensing image landslide segmentation and extraction.Firstly,replacing the feature extraction module in the original network with the residual network ResNet and deepening the network to prevent gradient vanishing,we can learn deeper features.Secondly,incorporating the MSF(multi-scale features fusion module)can enhance the ability to discover landslide areas in mountains.Finally,a generalized loss function FTL(Focal Tversky Loss)is used to replace the weighted cross entropy loss function to balance the relationship between accuracy and recall.The experimental results show that the improved algorithm has an mIoU of 65.92%,which is 2.5 percentage points higher than before,anmPA of 73.93%,which is 3.56 percentage points higher than be-fore,and an F1 score index of 60.08%,which is 5.09 percentage points higher than before.The improved model algorithm can effectively improve the segmentation performance of mountain landslides.
keywords:remote sensing image;mountain landslide segmentation;U-Netnetwork;ResNet;loss function
圖像分割是圖像處理的重要組成部分,也是圖像分析的關(guān)鍵步驟,目的是提取圖像中的一些有意義的區(qū)域[1]。由于圖像分割目標(biāo)與特征的不同,分割方式也不盡相同,針對不同的應(yīng)用場景有不同的分割方式。從遙感圖像中提取有價值信息一直以來都是人工智能領(lǐng)域和遙感領(lǐng)域中的研究熱點,因為有著很高的應(yīng)用價值[2]?;谶b感圖像信息的提取與分析也是監(jiān)測地球的重要方式[3],在自動駕駛、災(zāi)害評估、地理信息更新等方面有著廣泛應(yīng)用。例如胡宏宇等人[4]基于VGGU-Net框架構(gòu)建編碼器-解碼器網(wǎng)絡(luò),并設(shè)計了一個卷積塊,提出了一種面向自動駕駛的基于VGGU-Net++的遙感影像路網(wǎng)檢測方法;車子杰等人[3]將遙感影像進行融合,并將標(biāo)準(zhǔn)卷積用深度可分離卷積與空洞卷積替換,構(gòu)建新的網(wǎng)絡(luò)模型,提出了一種基于改進U-Net網(wǎng)絡(luò)的多源遙感影像洪澇災(zāi)害信息提??;高亦遠等人[5]將U-Net分割模型和Vision Transformer(ViT)集成,將自注意力機制引入CNN中,提出了一種基于自注意力機制的遙感影像建筑物提取方法,該方法有了提取多層次細節(jié)信息和全局信息的能力。
雖然目前很多學(xué)者對災(zāi)害的研究已經(jīng)相當(dāng)深入與成熟[6],但借助于人工智能技術(shù)對遙感圖像地質(zhì)災(zāi)害山體滑坡的圖像分割研究卻不多。根據(jù)現(xiàn)有資料,地質(zhì)災(zāi)害類型主要包括滑坡、崩塌、不穩(wěn)定斜坡及地面塌陷[7]。但由于遙感圖像的山體滑坡背景復(fù)雜,存在其他尤其是樹林的干擾,因而從遙感圖像中盡可能地準(zhǔn)確無誤地提取出山體滑坡信息仍然是有挑戰(zhàn)性的。文中提出的基于改進U-Net網(wǎng)絡(luò)能有效將遙感圖像山體滑坡進行分割提取。
1 U-Net網(wǎng)絡(luò)概述
U-Net網(wǎng)絡(luò)是由Ronneberger O等人[8]提出的一種二分類分割網(wǎng)絡(luò),U-Net網(wǎng)絡(luò)是在增強型全卷積神經(jīng)網(wǎng)絡(luò)(FCN)的基礎(chǔ)上改進而來,能有效提高圖像特征重構(gòu)能力。由于整個網(wǎng)絡(luò)呈現(xiàn)典型的U型結(jié)構(gòu),所以叫U-Net網(wǎng)絡(luò),左邊來源于增強型全卷積神經(jīng)網(wǎng)絡(luò)FCN的結(jié)構(gòu),主要是從原始圖像中經(jīng)過卷積、下采樣后得到高語義的特征圖。U-Net網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
針對遙感圖像山體滑坡的語義特征,原始U-Net網(wǎng)絡(luò)存在一定的提取缺陷,比如遙感圖像山體滑坡不同層次特征不能更好提取、卷積的感受野區(qū)域?qū)Πl(fā)現(xiàn)山體滑坡的能力有限等等。由于訓(xùn)練樣本的原因,不能更好地權(quán)衡準(zhǔn)確率和召回率之間的關(guān)系。
2 U-Net算法改進
2.1引入殘差網(wǎng)絡(luò)ResNet
網(wǎng)絡(luò)性能的提高可以將遙感圖像中不同層次的特征進行更好地提取,所以隨著網(wǎng)絡(luò)的加深,遙感圖像中的目標(biāo)分割效果會有所提升,但是簡單地對網(wǎng)絡(luò)加深會帶來一些問題,比如梯度爆炸或消失。殘差網(wǎng)絡(luò)思想油然而生,殘差由He K等人[9]提出,對卷積神經(jīng)網(wǎng)絡(luò)做了改進,避免了梯度爆炸或消失的問題。殘差網(wǎng)絡(luò)由殘差塊組成,殘差塊結(jié)構(gòu)如圖2所示。輸入為x,殘差指的是F(x),最后輸出是F(x)+x。
2.2多尺度特征融合注意力模塊
在遙感圖像中,山體滑坡區(qū)域不僅是在某一個區(qū)域,在一張遙感影像圖中也可能存在多個山體滑坡區(qū)域。由于卷積的感受野區(qū)域決定了特征區(qū)域范圍,因而感受野較大或者較小都會使模型對遙感圖像中的山體滑坡區(qū)域分割造成影響。為了提高模型的性能,增強其發(fā)現(xiàn)山體滑坡區(qū)域的能力,引入多尺度特征融合注意力模塊[10](multi-scale features fusion module)。MSF在2022年由謝娟英等人[10]提出,其實驗表明,該模塊能有效提高對目標(biāo)區(qū)域的分割效果。MSF模塊示意圖如圖3所示。
由圖3可知,該模塊使用了三種不同的卷積核進行特征的提取,提取后特征通過歸一化N和ReLU激活函數(shù)激活后再進行特征融合,以此來減少卷積時的特征丟失,保留更多信息。融合后特征再經(jīng)過GAM模塊(GlobalAttention Module)與SAM模塊(Spa-tial Attention Module)組成的分支,以及LAM模塊(Lo-cal Attention Module)和SAM模塊構(gòu)成的另一個分支,組合后形成新的特征圖。新特征圖具有更多的特征信息。假設(shè)輸入通道數(shù)、高、寬分別為c、h和w,M'則特征圖表達式如式(1)所示,特征M'經(jīng)過GAM和LAM得到特征MG和ML,分量加和后得新特征圖NM。MG、ML和NM表達式如式(2)(3)(4)所示。
2.3損失函數(shù)改進
損失函數(shù)簡單來說是用來估量一個模型的預(yù)測與真實的不一致程度,該值越小,說明模型效果越好。原算法中采用的損失函數(shù)為帶權(quán)重的交叉嫡損失函數(shù),表達式如式(5)所示。表達式中含有w(x)進行加權(quán),這和分割任務(wù)有關(guān),該損失函數(shù)由Ronne-berger O等人[8]為了加強粘連的同類細胞之間的分割線改進而來。
E=Σx∈w(x)log(pk(x)(x))(5)
其中:
pk(x)=exp(ak(x))/(Σk'(K)=1 exp(ak(x)))K(6)
w(x)=wc(x)+w0·exp(-((d1(x)+d2(x))2/2 2))(7)
該損失函數(shù)可以用于大多數(shù)的分割任務(wù)場景,但是其也有缺點,在山體滑坡遙感圖像中,由于存在前景區(qū)域像素數(shù)量遠小于背景區(qū)域像素數(shù)量的情況,山體滑坡在整個遙感圖像中可能只占據(jù)一小部分,所以占據(jù)主導(dǎo)的主要為背景區(qū)域損失,進而使得算法模型偏向背景,對山體滑坡的分割產(chǎn)生影響,分割效果不佳。并且,在遙感圖像上體滑坡中存在數(shù)據(jù)不平衡,訓(xùn)練時可能會導(dǎo)致精度高但召回率低的情況。在訓(xùn)練樣本時為了更好地權(quán)衡準(zhǔn)確率和召回率之間的關(guān)系,2020年JADON S等人[11]提出了一種廣義的損失函數(shù)FTL(Focal Tversky Loss),F(xiàn)TL損失函數(shù)表達如式(8)所示。
FTL損失函數(shù)通過對a和的參數(shù)調(diào)整來控制假陽性和假陰性之間的平衡,通過FTL損失函數(shù)代替交叉嫡損失函數(shù)。
3實驗結(jié)果
3.1實驗數(shù)據(jù)
由于遙感圖像山體滑坡數(shù)據(jù)集較少,采用自構(gòu)建的小樣本量遙感圖像山體滑坡數(shù)據(jù)集。為了獲取遙感圖像山體滑坡的多樣性,山體滑坡遙感圖像通過各大網(wǎng)站收集,采用LabelMe進行標(biāo)注,統(tǒng)一標(biāo)準(zhǔn)處理后共計1400張遙感圖片。
3.2實驗結(jié)果分析
實驗采用Pytorch深度學(xué)習(xí)框架,訓(xùn)練輪數(shù)epochs設(shè)置為100。表1給出了不同方法與本文算法的數(shù)據(jù)對比。由表1可知,在U-Net算法模型基礎(chǔ)上改進后,指標(biāo)mIoU和mPA均有所提升,均交并比mIou從63.42%提升為65.92%,上漲2.5個百分點;平均檢測精度mPA由70.37%提升到73.93%,上漲3.56個百分點。F1-score綜合得分指標(biāo)由54.99%提升為60.08%,上漲5.09個百分點。對比實驗結(jié)果表明,改進后算法模型能在一定程度上提升圖像分割效果。
為了更直觀地展示遙感圖像山體滑坡分割提取效果,隨機選取兩張圖片進行兩種算法的分割提取對比,效果如圖4所示。
4結(jié)論
本文對遙感圖像山體滑坡分割提取進行了研究,旨在提高山體滑坡分割提取模型性能。在U-Net網(wǎng)絡(luò)基礎(chǔ)上,首先將原始網(wǎng)絡(luò)中的特征提取模塊用殘差網(wǎng)絡(luò)ResNet進行替換,其次,融入多尺度特征融合注意力模塊增強發(fā)現(xiàn)山體滑坡區(qū)域的能力,最后采用廣義的損失函數(shù)FTL替換帶權(quán)重的交叉嫡損失函數(shù)以平衡準(zhǔn)確率和召回率之間的關(guān)系。實驗結(jié)果表明,改進后算法模型能有效提高遙感圖像山體滑坡分割提取性能。
參考文獻:
[1]吳祥.一種基于K-平均簇劃分算法的圖像分割方法[J].遵義師范學(xué)院學(xué)報,2006(03):51-52.
[2]何哲,陶于祥,羅小波,徐浩.基于改進U-Net網(wǎng)絡(luò)的遙感圖像道路提取[J/OL].激光與光電子學(xué)進展:1-14
[3]車子杰,高飛,吳兆福,李振軒.基于改進U-Net網(wǎng)絡(luò)的多源遙感影像洪澇災(zāi)害信息提取與變化分析[J].測繪通報,2022(01):26-32.
[4]胡宏宇,左記祥,呂穎,趙睿.面向自動駕駛的遙感影像路網(wǎng)檢測方法[J].中國公路學(xué)報,2022,35(11):310-317.
[5]高亦遠,佘江峰,趙強,汪李娜.基于自注意力機制的遙感影像建筑物提取方法研究[J].信息技術(shù)與信息化,2022,No.272(11):5-8.
[6]譚陽陽,李淥.明代貴州地區(qū)自然災(zāi)害與官方對策研究[J].遵義師范學(xué)院學(xué)報,2020,22(05):33-37.
[7]李華章,賈亮亮,何文剛,張相春.中緬天然氣管道貴州段地質(zhì)災(zāi)害分布特征與風(fēng)險評價[J].遵義師范學(xué)院學(xué)報,2022,24(04):98-101.
[8]RonnebergerO,F(xiàn)ischerP,BroxT.U-Net:Convolutionalnetworks for biomedical image segmentation.In:Proc.of the 18th Int’l Conf.on Medical Image Computing and Computer assisted Intervention.Munich:Springer,2015.234-241.
[9]He K,Zhang X,Ren S,etal.Deep Residual Learning for Im-age Recognition[C]//2016 IEEE Conference on Computer Vi-sion and Pattern Recognition(CVPR).Piscataway,NJ,USA:IEEE,2016:770-778.
[10]謝娟英,張凱云.XR-MSF-Unet:新冠肺炎肺部CT圖像自動分割模型[J].計算機科學(xué)與探索,2022,16(08):1850-1864.
[11]JADON S.A survey of loss functions for semantic segmentation[C].2020 IEEE Conference on Com-putational Intelli-gence in Bioinformatics and Com putationalBiology.Oc-tober 27-29,2020,Via del Mar,Chile.IEEE,2020:1-7.
(責(zé)任編輯:羅東升)