黃亮 宋晶
摘 要:隨著遙感影像空間分辨率的提高,地物紋理細(xì)節(jié)更加豐富,采用傳統(tǒng)的語義分割方法使分割結(jié)果過于細(xì)碎,整體性不強(qiáng)。針對該問題,提出一種改進(jìn)迭代條件模型的遙感影像語義分割方法。首先采用L0梯度最小化模型對遙感影像去噪,然后采用迭代條件模型,通過更新影像中每個(gè)點(diǎn)的標(biāo)記完成影像分割,最后采用Kappa指數(shù)對實(shí)驗(yàn)結(jié)果進(jìn)行精度評價(jià)。實(shí)驗(yàn)結(jié)果表明,該方法是一種有效的遙感影像語義分割方法。
關(guān)鍵詞:語義分割;遙感影像;迭代條件模型;精度評價(jià)
DOI:10. 11907/rjdk. 181846
中圖分類號:TP317.4文獻(xiàn)標(biāo)識碼:A文章編號:1672-7800(2019)001-0183-03
Abstract: With the improvement of spatial resolution of remote sensing images, the details of ground texture are more abundant, and the traditional semantic segmentation method will make the segmentation result too fine and the integrity is not strong. To solve this problem, an improved iterative conditional model for semantic segmentation of remote sensing image is proposed. Firstly, the L0 gradient minimization model is used to denoise the remote sensing image, and then the image segmentation is completed by updating the mark of each point in the image by using the iterative conditional model. Finally, the accuracy of the experimental results is evaluated by the Kappa index. Experimental results show that the proposed method is an effective method for semantic segmentation of remote sensing image.
0 引言
隨著航空航天平臺和遙感技術(shù)的不斷發(fā)展,越來越多的紋理細(xì)節(jié)清晰、光譜特征豐富的高空間分辨率遙感影像[1-2]成為經(jīng)濟(jì)建設(shè)、國防安全、地理信息服務(wù)等重要的空間信息源[3],而高空間分辨率遙感影像分析與處理也成為遙感領(lǐng)域研究的熱點(diǎn)。語義分割有助于遙感影像的準(zhǔn)確分析和理解[4-6],在分割的同時(shí)確定分割區(qū)域的語義類別,對于影像分析和處理更加準(zhǔn)確有著深遠(yuǎn)意義。
為實(shí)現(xiàn)圖像語義分割,很多學(xué)者開展了大量研究:首先是基于深度學(xué)習(xí)的方法[7],如陳鴻翔[8]提出的基于卷積神經(jīng)網(wǎng)絡(luò)的圖像語義分割方法;劉丹等[9]提出一種多尺度CNN的圖像語義分割算法;魏云超和趙耀[10]對基于DCNN的圖像語義分割方法中存在的困難和挑戰(zhàn)進(jìn)行了分析和描述;Long J等[11]提出基于全卷積網(wǎng)絡(luò)的語義分割方法;鄧國徽等[12]研究了基于改進(jìn)的全卷積神經(jīng)網(wǎng)絡(luò)高分辨率遙感影像語義分割方法;Hong S等[13]提出一種解耦深度神經(jīng)網(wǎng)絡(luò)的半監(jiān)督語義分割方法。其次是基于概率的方法,如毛凌和解梅[4]提出了一種基于高階CRF模型的圖像語義分割;張曉雪[14]提出基于概率圖模型的圖像語義分割方法;左向梅等[15]提出基于交互式條件隨機(jī)場的RGB-D圖像語義分割方法。
基于深度學(xué)習(xí)的語義分割方法對計(jì)算機(jī)性能及算法效率要求高,且要求進(jìn)行樣本采集,實(shí)現(xiàn)較為困難。而基于概率的方法相較于基于深度學(xué)習(xí)的方法實(shí)現(xiàn)較為簡單,為此本文采用基于概率的方法實(shí)現(xiàn)高空間分辨率遙感影像語義分割。其中,迭代條件模型(iterative condition model,簡稱ICM)[16]是一個(gè)基于局部條件概率的“貪婪算法”,通過更新影像中每個(gè)點(diǎn)的標(biāo)記完成影像分割。但該方法受到紋理細(xì)節(jié)的影響,使得語義分割結(jié)果過于細(xì)碎,整體性不強(qiáng)。為此,提出一種改進(jìn)的迭代條件模型語義方法,使用L0梯度最小化模型降低噪聲帶來的影響。
1 L0梯度最小化模型
徐立等[17]提出L0梯度最小化模型,以一個(gè)優(yōu)化框架為基礎(chǔ),統(tǒng)計(jì)稀疏梯度也就是L0范數(shù),通過增加影像過渡部分的陡度,進(jìn)而增強(qiáng)邊緣顯著性效果。與此同時(shí)減弱噪聲影響,通過去除低振幅部分,弱化高分辨率遙感影像豐富的細(xì)節(jié)信息。L0梯度最小化模型通過控制非零梯度數(shù)目增強(qiáng)邊緣部分[18-20]。
[f]為輸入影像,[U]為平滑處理后的影像,[?xUp]表示處理后影像[U]在[p]處沿[x]方向的偏導(dǎo)數(shù),[?yUp]表示處理后的影像[U]在[p]處沿[y]方向的偏導(dǎo)數(shù),則影像中任意一點(diǎn)處的像素梯度可表示為:
2 迭代條件模型
迭代條件模型(iterative condition model,簡稱ICM)是一個(gè)基于局部條件概率的“貪婪算法”,Besag等于1986年提出這一算法,通過更新影像中每個(gè)點(diǎn)的標(biāo)記完成影像分割。
條件迭代模式分割方法,需要預(yù)先設(shè)定分類數(shù)目、勢函數(shù)和最大迭代次數(shù)。首先對影像進(jìn)行初始聚類,常采用K-均值聚類算法獲取初始分割結(jié)果;然后根據(jù)聚類分割結(jié)果使用高斯混合模型,通過計(jì)算像素均值和方差計(jì)算概率矩陣,建模特征場數(shù)據(jù);考慮二階鄰域系統(tǒng),采用Potts模型用二階鄰域勢函數(shù)表示模型的局部概率,建模標(biāo)記場數(shù)據(jù);最后根據(jù)能量最小原則,當(dāng)所有像素點(diǎn)全局能量變化量總和最小時(shí),滿足終止條件則停止迭代,得到最終分割結(jié)果并標(biāo)注類別信息,圖1為算法流程。
3 實(shí)驗(yàn)結(jié)果與精度分析
3.1 實(shí)驗(yàn)數(shù)據(jù)
為驗(yàn)證本文方法的可靠性和有效性,本文采用昆明市宜良縣九鄉(xiāng)彝族回族鄉(xiāng)阿棚村部分影像,如圖2所示。影像大小為979×586像素,地面分辨率為0.05m,是一幅無人機(jī)高空間分辨率遙感影像。圖3為參考圖像,圖4為類別示意圖,包括道路、植被、深石棉瓦房屋、淺石棉瓦房屋和裸地5個(gè)類別,設(shè)置分類數(shù)目為5、勢函數(shù)為0.5和迭代次數(shù)200。
3.2 實(shí)驗(yàn)結(jié)果
4 結(jié)語
為提高遙感影像語義分割質(zhì)量,提出一種改進(jìn)迭代條件模型的遙感影像語義分割方法。該方法首先采用L0梯度最小化模型對遙感影像去噪,然后采用迭代條件模型,通過更新影像中每個(gè)點(diǎn)的標(biāo)記完成影像分割。通過改進(jìn),語義分割精度提高了2.7%,整體精度達(dá)到84.98%,結(jié)果表明改進(jìn)方法行之有效。但采用改進(jìn)方法還存在椒鹽情況,需要針對該問題進(jìn)行深入研究。
參考文獻(xiàn):
[1] 叢銘. 基于視覺感知原理的高分辨率遙感影像分割與人工目標(biāo)提取研究[D]. 武漢: 武漢大學(xué), 2015.
[2] 唐偉, 趙書河, 王培法. 面向?qū)ο蟮母呖臻g分辨率遙感影像道路信息的提取[J]. 地球信息科學(xué)學(xué)報(bào), 2008,10(2):257-262.
[3] 王江濤,鄧喀中,吳國富. 高分辨率遙感影像地物陰影去除算法研究[J]. 測繪與空間地理信息,2018(5):14,142-146.
[4] 毛凌,解梅. 基于高階CRF模型的圖像語義分割[J]. 計(jì)算機(jī)應(yīng)用研究,2013, 30(11):3514-3517.
[5] 張新明,祝曉斌,蔡強(qiáng),等. 圖像語義分割深度學(xué)習(xí)模型綜述[J]. 高技術(shù)通訊,2017(9):808-815.
[6] 魏云超,趙耀. 基于DCNN的圖像語義分割綜述[J]. 北京交通大學(xué)學(xué)報(bào),2016,40(4):82-91.
[7] 蔣子源. 用深度學(xué)習(xí)技術(shù)解決圖像語義分割問題[J]. 電子制作, 2017(20):39-40.
[8] 陳鴻翔. 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像語義分割[D]. 杭州: 浙江大學(xué),2016.
[9] 劉丹,劉學(xué)軍,王美珍. 一種多尺度CNN的圖像語義分割算法[J]. 遙感信息,2017, 32(1):57-64.
[10] 魏云超,趙耀. 基于DCNN的圖像語義分割綜述[J]. 北京交通大學(xué)學(xué)報(bào),2016,40(4):82-91.
[11] LONG J,SHELHAMER E,DARRELL T. Fully convolutional networks for semantic segmentation[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,2017,39(4):640-651.
[12] 鄧國徽,高飛,羅志鵬. 基于改進(jìn)的全卷積神經(jīng)網(wǎng)絡(luò)高分遙感數(shù)據(jù)語義分割研究[C].高分辨率對地觀測學(xué)術(shù)年會,2017.
[13] HONG S,NOH H,HAN B. Decoupled deep neural network for semi-supervised semantic segmentation[J]. NIPS,2015(1):1495-1503.
[14] 張曉雪. 基于概率圖模型的圖像語義分割技術(shù)研究[D]. 廈門:廈門大學(xué), 2014.
[15] 左向梅, 趙振, 茍婷婷. 基于交互式條件隨機(jī)場的RGB-D圖像語義分割[J]. 計(jì)算機(jī)應(yīng)用與軟件,2017,34(3):174-180.
[16] 唐麗煥, 陳輝, 呂小倩,等. 基于迭代條件模型算法的圖像超分辨率重建[J]. 計(jì)算機(jī)工程與應(yīng)用,2010,46(12):153-154.
[17] XU L, LU C, XU Y, et al. Image smoothing via L0 gradient minimization[J]. Acm Transactions on Graphics,2011,30(6):1-12.
[18] 龐學(xué)舜. 基于L0梯度最小化的圖像平滑方法研究[D]. 天津:天津理工大學(xué), 2016.
[19] NGUYEN R M H, BROWN M S. Fast and effective L0 gradient minimization by region fusion[C]. IEEE International Conference on Computer Vision. IEEE Computer Society, 2015:208-216.
[20] ZHANG W, CAO Y, ZHANG R, et al. Image denoising via L 0 gradient minimization with effective fidelity term[J]. Mathematical Problems in Engineering, 2015(2):1-11.
(責(zé)任編輯:杜能鋼)