摘 要:耕地是地表覆蓋的主要類型之一,也是糧食生產(chǎn)的直接載體。本文針對(duì)耕地提提取不準(zhǔn)確和效率低的問題,提出一種改進(jìn)的DeepLab v3+提取方法。首先,使用輕量級(jí)網(wǎng)絡(luò) 替代DeepLab v3+模型的特征提取網(wǎng)絡(luò)Xception,以減少模型參數(shù)量,提高訓(xùn)練速度。其次,引用SE注意力加入模型,提高網(wǎng)絡(luò)對(duì)耕地的提取精度。并在GID數(shù)據(jù)集上進(jìn)行試驗(yàn),結(jié)果顯示,本文方法具有優(yōu)秀的分割性能,能夠有效解決經(jīng)典模型分割結(jié)果中存在的不同程度的誤分、漏分等問題,在耕地提取中具有高效性,為后續(xù)耕地提取任務(wù)提供支持。
關(guān)鍵詞:遷移學(xué)習(xí);SE注意力;MobileNet v2;耕地提??;DeepLab v3+
中圖分類號(hào):P 208" " " " " " 文獻(xiàn)標(biāo)志碼:A
耕地是地表覆蓋的主要類型之一,也是糧食生產(chǎn)的直接載體,耕地變化對(duì)生態(tài)環(huán)境穩(wěn)定性和糧食安全具有非常重要的影響[1-2]。
傳統(tǒng)的耕地統(tǒng)計(jì)方法主要基于實(shí)地調(diào)查,不僅會(huì)導(dǎo)致數(shù)據(jù)更新滯后,還會(huì)極大地消耗人力和物力。傳統(tǒng)機(jī)器學(xué)習(xí)算法對(duì)含有復(fù)雜地物信息的高分辨率遙感影像信息提取效果較差,因此,應(yīng)用需求和遙感數(shù)據(jù)增加對(duì)耕地語義分割提出了更高要求。
深度學(xué)習(xí)在計(jì)算機(jī)視覺應(yīng)用中的成功使基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)[3]的方法逐漸應(yīng)用于遙感影像解譯領(lǐng)域,為遙感影像中的耕地提取識(shí)別帶來了重大突破。JADHAV等[4]采用ResNet101網(wǎng)絡(luò)對(duì)高分辨率遙感影像進(jìn)行土地覆蓋和作物類型的語義分割,實(shí)現(xiàn)了主要作物的準(zhǔn)確分類。陳玲玲等[5]借鑒輕量級(jí)網(wǎng)絡(luò)與UNet模型的優(yōu)點(diǎn),有效改進(jìn)了傳統(tǒng)模型提取耕地結(jié)果零散的情況。盡管上述方法在耕地提取中各有優(yōu)勢,但是長時(shí)間訓(xùn)練是一個(gè)主要問題,并且上述方法在提取結(jié)果方面存在整體結(jié)構(gòu)不連續(xù)、邊緣細(xì)節(jié)提取不準(zhǔn)確等問題。
為解決上述問題,本文以DeepLab v3+ 模型為基礎(chǔ),融合遷移學(xué)習(xí)和注意力機(jī)制,旨在提高高分辨率遙感影像中耕地信息提取的精度和效率。
1 道路提取網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
為了更好地進(jìn)行遙感影像耕地提取,本文在DeepLab v3+模型的基礎(chǔ)上進(jìn)行了3項(xiàng)改進(jìn)。編碼器采用的特征提取模塊Xception網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,參數(shù)量和內(nèi)存占用較大,可能會(huì)導(dǎo)致模型擬合速度緩慢、分割效率低。因此,將其替換為輕量級(jí)網(wǎng)絡(luò)MobileNet v2,以減少語義分割模型的參數(shù)量,提高模型訓(xùn)練效率。引入通道注意力機(jī)制SENet,對(duì)特征通道權(quán)重進(jìn)行重新分配,改進(jìn)目標(biāo)被漏分或誤判的問題,從而提高分割精度。如此可在降低模型復(fù)雜度的同時(shí)提高分割性能。改進(jìn)的DeepLab v3+網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
在圖1中,遙感影像被輸入編碼層中,在MobileNet v2網(wǎng)絡(luò)中經(jīng)過深度可分離卷積處理后得到低級(jí)特征。低級(jí)特征分別輸入空洞空間金字塔池化中和解碼層中。在空洞空間金字塔池化中經(jīng)過最大池化層、平均池化層以及3個(gè)空洞率分別為6、12和18的空洞卷積中進(jìn)一步處理,再經(jīng)1*1卷積合成后得到深層特征信息。深層特征信息和低級(jí)特征信息經(jīng)過SENet進(jìn)一步篩選目標(biāo)特征,最后經(jīng)過2個(gè)3*3卷積不斷恢復(fù)邊界信息和上采樣,得到輸出結(jié)果圖。
1.1 DeepLab v3+
DeepLab v3+網(wǎng)絡(luò)于2018年推出,采用編碼器-解碼器的結(jié)構(gòu)。編碼器部分包括主干特征提取網(wǎng)絡(luò)與空洞空間金字塔池化模塊。特征提取網(wǎng)絡(luò)采用串行空洞卷積,將主干網(wǎng)絡(luò)MobileNet v2網(wǎng)絡(luò)提取出的耕地特征分別傳入解碼器與ASPP模塊并進(jìn)行特征提取。ASPP模塊中由1個(gè)平均池化層、1個(gè)全局池化層以及3個(gè)空洞率分別為4、8和12的空洞卷積層組成。不同空洞率的空洞卷積分別捕捉多尺度特征信息,以提高網(wǎng)絡(luò)的感受野。深層特征經(jīng)過ASPP模塊提取后進(jìn)行堆疊,經(jīng)1*1卷積調(diào)整通道數(shù)后進(jìn)入解碼器部分。在解碼器部分,淺層特征經(jīng)1*1卷積降維后,與由編碼器部分輸出并經(jīng)過4倍上采樣操作的深層特征融合。該融合特征由3*3卷積進(jìn)行特征提取,并最終采用4倍上采樣操作,獲得與輸入影像尺寸相同的預(yù)測結(jié)果。
1.2 MobileNet v2網(wǎng)絡(luò)
MobileNet v2是一種輕量級(jí)的深度神經(jīng)網(wǎng)絡(luò),適用于移動(dòng)和嵌入式設(shè)備的計(jì)算資源有限的場景。在MobileNet v2中,圖像進(jìn)入網(wǎng)絡(luò)前需要進(jìn)行歸一化操作,將像素值縮放到[0,1]。利用MobileNet v2的核心深度可分離卷積對(duì)每個(gè)輸入通道進(jìn)行獨(dú)立的空間卷積操作。再利用卷積核進(jìn)行通道間的混合和降維操作,并應(yīng)用ReLU激活函數(shù)引入非線性特性。在每個(gè)卷積層后應(yīng)用加入批量歸一化,有助于加速訓(xùn)練過程并提高模型的泛化能力。在MobileNet v2的某些層中使用殘差連接,有助于減少梯度消失和梯度爆炸問題,并提升訓(xùn)練效果。將最后一個(gè)卷積層的輸出進(jìn)行全局平均池化操作,轉(zhuǎn)換為一個(gè)向量,該向量的每個(gè)元素表示對(duì)應(yīng)特征圖的平均值。最后,利用一個(gè)1*1的卷積層將全局平均池化后的特征圖轉(zhuǎn)換為最終輸出。
1.3 注意力機(jī)制
本文使用SENet對(duì)編碼器區(qū)域內(nèi)的輸出應(yīng)用不同權(quán)重,以優(yōu)化特征圖,從而在較小的額外計(jì)算成本下為提升現(xiàn)有分割模型性能,彌補(bǔ)輕量級(jí)特征提取網(wǎng)絡(luò)可能帶來的精度損失。SE注意力結(jié)構(gòu)如圖2所示。圖2(a)為普通注意力機(jī)制,其中的輸入特征經(jīng)過殘差快處理后,分別采用平均池化、全卷積、ReLU激活函數(shù)、全卷積和Sigmoid激活函數(shù)操作,得到權(quán)重后與輸入特征進(jìn)行加權(quán),最后輸出特征圖。SENet注意力機(jī)制模塊的結(jié)構(gòu)如圖2(b)所示。與普通注意力不同的是,SENet輸入特征經(jīng)過殘差塊處理后由平均池化和最大池化共同作用,進(jìn)一步提高了對(duì)目標(biāo)特征的篩選能力,更有利于目標(biāo)特征識(shí)別。
2 試驗(yàn)與分析
2.1 數(shù)據(jù)集構(gòu)建
將改進(jìn)的DeepLab v3+網(wǎng)絡(luò)分別在GID數(shù)據(jù)集中進(jìn)行訓(xùn)練,切片大小為(512×512)ppi。本文選取640張照片作為試驗(yàn)對(duì)象,將其按照7∶2∶1的比例劃分為訓(xùn)練集、測試集和驗(yàn)證集。數(shù)據(jù)集上的部分影像和對(duì)應(yīng)的標(biāo)簽如圖3所示。
2.2 試驗(yàn)結(jié)果和分析
為了驗(yàn)證本文算法在處理耕地遙感影像方面的有效性和優(yōu)越性,本文針對(duì)影像中耕地的分布、形狀和季節(jié)分布等特點(diǎn),選擇具有代表性的測試影像進(jìn)行試驗(yàn)。使用U-Net、PSPNet、DeepLab v3+以及本文算法對(duì)測試影像進(jìn)行耕地提取,并比較試驗(yàn)結(jié)果。影像的部分試驗(yàn)結(jié)果如圖4所示。
由圖4可知,本文方法無論是在提取準(zhǔn)確度上,還是在邊緣細(xì)節(jié)處理山均比較準(zhǔn)確。對(duì)于主要分布在山區(qū)的耕地,周圍的森林等地物是影響其提取效果的主要因素。從各算法的提取結(jié)果可以看出,U-Net算法的錯(cuò)誤提取明顯,對(duì)耕地的整體結(jié)構(gòu)提取不完全。PSPNet算法的提取結(jié)果碎片化比較嚴(yán)重,錯(cuò)誤提取較嚴(yán)重。DeepLab v3+算法的提取結(jié)果稍好一點(diǎn),但是仍然存在錯(cuò)誤提取的情況。本文算法的提取結(jié)果與標(biāo)簽圖相似,提取結(jié)果比其他3種方法更優(yōu)。綜上所述,在SENet注意力的作用下,本文方法的多余耕地識(shí)別能力得到了增強(qiáng),在邊緣細(xì)節(jié)和結(jié)構(gòu)的完整度上具有明顯優(yōu)勢,并在遷移學(xué)習(xí)的作用下,對(duì)耕地類型的多樣性辨別能力有所提升,能夠準(zhǔn)確提取耕地。綜上所述,本文方法在提取耕地上具有有效性和優(yōu)越性。
U-Net、PSPNet、DeepLab v3+和本文方法的定量評(píng)價(jià)結(jié)果見表1。從表1可看出,本文方法在各個(gè)指標(biāo)上均為最優(yōu)。在交并比上,比U-Net高了16.17%,比PSPNet高了15.32%。在召回率上,比U-Net高了18.51%,比DeepLab v3+高了13.04%。在總體精度指標(biāo)上,除了U-Net,其他3種方法均在90%以上,而本文方法遠(yuǎn)高于其他3種方法,為98.10%。在模型參數(shù)上,本文方法將MobileNet v2作為主干網(wǎng)絡(luò),模型參數(shù)量遠(yuǎn)小于其他3種方法,僅為22.85 MB。PSPNet的模型參數(shù)量為259.64 MB,遠(yuǎn)高于本文方法。以上數(shù)據(jù)均說明本文方法在耕地提取上具有高效性。
3 結(jié)論
糧食是人類生存的根本,快速且相對(duì)準(zhǔn)確的推算出糧食生產(chǎn)量離不開耕地信息統(tǒng)計(jì)。由于場景龐大、細(xì)節(jié)復(fù)雜且受光照和成像角度的影響,經(jīng)典語義分割模型對(duì)耕地信息的提取通常存在泛化性差、訓(xùn)練效率低、目標(biāo)識(shí)別不準(zhǔn)確和精度不高的問題。為了解決這些問題,本文提出一種融合遷移學(xué)習(xí)和注意力的輕量級(jí)DeepLab v3+ 遙感影像耕地提取算法。主干網(wǎng)絡(luò)替換后的模型參數(shù)為22.71 MB,改進(jìn)完成的本文算法的參數(shù)僅有22.85 MB,與擁有259.64 MB參數(shù)的PSPNet模型、94.95 MB的UNet模型以及208.7 MB的DeepLab v3+ 模型相比,分割效率顯著提升。本文方法融合了SE注意力機(jī)制,抑制了易受干擾的通道,使模型能重點(diǎn)關(guān)注有效信息。引入遷移學(xué)習(xí)思想,將預(yù)訓(xùn)練模型參數(shù)作為網(wǎng)絡(luò)的初始權(quán)重參數(shù),使模型分割效果更出色,在GID數(shù)據(jù)集用于耕地信息提取研究中表現(xiàn)出了優(yōu)秀性能。為進(jìn)一步驗(yàn)證本文方法在大尺度遙感影像中進(jìn)行耕地提取的有效性,以實(shí)例作為試驗(yàn)區(qū),結(jié)果顯示本文算法交并比為85%以上,證實(shí)了本文方法具有良好的泛化性,可作為耕地信息提取通用模型。
參考文獻(xiàn)
[1]陳紅,吳世新,馮雪力.新疆耕地時(shí)空變化特征[J].地理科學(xué)進(jìn)展,2010,29(3):312-318.
[2]楊忍,劉彥隨,陳玉福,等.環(huán)渤海地區(qū)耕地復(fù)種指數(shù)時(shí)空變化遙感反演及影響因素探測[J].地理科學(xué),2013,33(5):588-593.
[3]LECUN Y,BOTTOU L.Gradient-Based learning applied to
document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.
[4]JADHAV J,SINGH R.Automatic semantic segmentation and
classification of remote sensing data for agriculture[J].Mathematical models in engineering,2018,4:112-137.
[5]陳玲玲,施政,廖凱濤,等.基于卷積神經(jīng)網(wǎng)絡(luò)的高分遙感影像耕地提取研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2022,53(9):168-177.