国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積神經(jīng)網(wǎng)絡的遙感圖像水體提取*

2022-01-21 00:32張銘飛高國偉胡敬芳
傳感器與微系統(tǒng) 2022年1期
關鍵詞:池化集上水體

張銘飛, 高國偉, 胡敬芳, 宋 鈺

(1.北京信息科技大學 傳感器北京市重點實驗室,北京 100101;2.北京信息科技大學 現(xiàn)代測控技術教育部重點實驗室,北京 100192;3.傳感器聯(lián)合國家重點實驗室 中國科學院空天信息創(chuàng)新研究院,北京 100190)

0 引 言

水資源可用性是旱地可持續(xù)發(fā)展的主要限制因素。氣候變化加劇了人與環(huán)境之間的用水需求沖突,凸顯了有效水資源管理對于實現(xiàn)經(jīng)濟發(fā)展與環(huán)境保護之間平衡的重要性。2008年,中國北方典型旱地內蒙古提出了嚴格的水資源開發(fā)利用規(guī)定,以實現(xiàn)可持續(xù)發(fā)展。隨著全國水資源保護政策的提出,水域變化監(jiān)測顯得尤為重要。

現(xiàn)階段用來進行水體提取的方法主要有閾值法[1]、決策樹法[2]、支持向量機(SVM)法[3]。王鑫等人[4]將圖像的局部二值模式(local binary patterns,LBP)和頻譜特征通過視覺詞袋模型進行融合,以增強遙感影像中的水體目標特征表達能力,設計了基于詞袋的遙感圖像水體識別模型。然而由于該方式是在頻域范圍內對水體進行特征提取,并不能完全表征目標的特定信息。

陳坤等人[5]使用具有三層卷積層的神經(jīng)網(wǎng)絡模型,經(jīng)過訓練實現(xiàn)對遙感水體的提取;何海清等人[6]將水體指數(shù)與卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)相結合建立水體提取模型,水體識別精度達到了94.19 %;何紅術等人基于U-Net模型,經(jīng)過改進提高了其識別精度。以上文獻表明,CNN可用于水體識別,但這些模型的識別精度并不高,而且有些模型的網(wǎng)絡結構較為復雜。

針對現(xiàn)有的網(wǎng)絡結構復雜,模型訓練收斂慢等問題,基于CNN,本文提出了一種用于遙感圖像水體提取的模型。首先通過網(wǎng)絡爬蟲構造遙感圖像訓練數(shù)據(jù)集,為了比較模型的魯棒性,構造了兩種類型的數(shù)據(jù)集。第一個是由0.1~0.8 m辨率的高分一、二、六號衛(wèi)星圖像組成的粗標記的數(shù)據(jù)集,第二個是由0.8 m分辨率的高分二號衛(wèi)星圖像組成的精標記的數(shù)據(jù)集[7],最后在Tensorflow的框架下設計網(wǎng)絡模型,通過訓練后在測試集上進行模型驗證。

1 遙感圖像水體提取模型原理與結構

經(jīng)典語義分割模型UNet[8]最先用于醫(yī)學圖像的分割,并在醫(yī)學圖像數(shù)據(jù)集上取得了非常好的分割效果。由于網(wǎng)絡模型并沒有較深的層數(shù),并且在較少的數(shù)據(jù)集上表現(xiàn)出了非常好的分割效果,因此備受廣大研究者的追捧。受U-Net結構的啟發(fā),本文提出了一種具有通道注意力機制的殘差網(wǎng)絡U-Net(residual U-Net with attention mechanisms,AMR-Unet)模型。它不僅能夠學習圖像中簡單的局部特征,而且可以結合通道特征組成復雜的特征。其核心是將圖像局部特征和通道空間特征結合起來,從而獲得位移、尺度、形變的不變特征,具有很強的魯棒性。因此在以上背景下,利用AMR-Unet有利于克服水域的復雜環(huán)境因素,對水體進行提取。

1.1 網(wǎng)絡模型

U-Net結構由兩部分組成,由下采樣收縮路徑和上采樣擴張路徑組成,其中下采樣模塊遵循典型的卷積網(wǎng)絡架構,如圖1所示。AMR-Unet模型由Encoder和Decoder兩部分組成,如圖2所示,Encoder對應U-Net的收縮路徑,Decoder對應擴張路徑。

圖1 U-Net結構

圖2 AMR-Unet結構

1.2 卷積層計算

在CNN中,卷積層通過卷積運算,提取原始圖像的高維語義特征,可以增強信號的特征也可以降低信號噪聲[9~11]。卷積操作可表示下

input(Ni,k)

(1)

式中 *為二維離散卷積運算符,N為batch size,C為通道數(shù)量,H為輸入圖像特征圖的高度(以像素為單位),W為輸入圖像特征圖的寬度(以像素為單位),bias為偏置值,out為卷積運算的輸出結果。

1.3 池化層計算

CNN中,池化(pooling)層通常稱為下采樣(subsampling)層,池化操作利用圖像局部具有相關性原理,對上一層特征圖中相鄰矩形區(qū)域進行統(tǒng)計計算,起到了二次特征提取作用。常用的池化操作有最大池化(max pooling)、最小池化(min pooling)、平均池化(average pooling)[10]等。池化操作表示如下

(2)

式中Hin,Win分別為輸入特征圖的高和寬;Hout,Wout分別為池化操作后特征圖的高和寬;padding為對特征圖進行填充,通常在特征圖邊緣填充0或1;kernel_size為池化區(qū)域的大小;stride為池化操作移動的步長。

1.4 全連接層計算

全連接層將得到的一系列特征圖像素取出排成一個向量,其過程如下

(3)

1.5 SoftMax分類器

SoftMax分類器用作損失函數(shù)的評估,并對分類的正確與否進行調整??杀硎救缦?/p>

(4)

式中xi為進行評估的目標,xj為需要進行評估的所有目標。

2 實驗結果與分析

實驗數(shù)據(jù)集分為兩個數(shù)據(jù)集,第一個數(shù)據(jù)集是來自高分一號、高分二號、高分六號,擁有1 000張粗標注的數(shù)據(jù)集,訓練集、驗證集和測試集的比例為8︰1︰1,該數(shù)據(jù)集的分辨率為256×256;第二個數(shù)據(jù)集是來自高分二號的1 000張精標注的數(shù)據(jù)集[12],訓練集、驗證集和測試集比例與第一個數(shù)據(jù)集相同,該數(shù)據(jù)集的分辨率為492×492。

其中訓練過程平均交并比(mean intersection over union,MIOU)記錄如圖3、圖4所示。對于粗標記數(shù)據(jù)集,在訓練第115次時模型開始收斂;訓練精標記數(shù)據(jù)集,模型在第100次時進行收斂。

圖3 粗標記MIoU

圖4 精標記MIoU

將訓練后的模型在測試集上進分割的效果如圖5所示。其中AMR-Unet模型和U-Net分別在兩種數(shù)據(jù)集上的MIoU、像素準確度(pixel accuracy,PA)和推理時間(infer time)如表1所示。從表1可以看出,AMR-Unet模型的分割效果要好于U-Net模型,在Infer time變化較小的情況下提高了MIoU和PA。

圖5 分割結果對比

表1 評價指標

實驗所使用的計算機配置如下:CPU為Intel Core i7—11800H,運行內存大小為16 GB;GPU為NVIDIA GeForce GTX 3060,顯卡內存大小為6 GB。超參數(shù)設定為:學習率(learning rate)為1×e-4,批大小(batchsize)為2。

實驗結果表明,在兩種數(shù)據(jù)集上,模型提取精度分別為94.78 %,94.42 %,對于不同的數(shù)據(jù)集都表現(xiàn)出很好的分割效果,魯棒性較好,分割精度高于傳統(tǒng)的U-Net模型,表明該模型對于遙感圖像水體提取具有良好的效果。

3 結 論

本文提出了一種遙感圖像水體提取的卷積神經(jīng)網(wǎng)絡AMR-Unet,利用網(wǎng)絡爬蟲并手動標記,建立了兩種不同標記類型的數(shù)據(jù)集,通過實驗驗證模型分割精度達94.78 %,在模型復雜度較低的情況下,能夠達到理想的分割效果,為后續(xù)基于遙感圖像進行水域監(jiān)測打下基礎。由于訓練集中并未包含具有冰層的遙感數(shù)據(jù)集,因此,模型如何能夠將冰層也識別為水體還需進一步研究。

猜你喜歡
池化集上水體
基于雙空間模糊鄰域相似關系的多標記特征選擇
基于高斯函數(shù)的池化算法
卷積神經(jīng)網(wǎng)絡中的自適應加權池化
農村黑臭水體治理和污水處理淺探
農村黑臭水體治理與農村污水處理程度探討
關于短文本匹配的泛化性和遷移性的研究分析
本市達到黑臭水體治理目標
用于手寫漢字識別的文本分割方法
師如明燈,清涼溫潤
幾道導數(shù)題引發(fā)的解題思考