国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于U-Net的葡萄種植區(qū)遙感識別方法

2022-05-12 09:29張宏鳴張國良朱珊娜孫志同
農(nóng)業(yè)機械學(xué)報 2022年4期
關(guān)鍵詞:種植區(qū)卷積像素

張宏鳴 張國良 朱珊娜 陳 歡 梁 會 孫志同

(1.西北農(nóng)林科技大學(xué)信息工程學(xué)院,陜西楊凌 712100;2.寧夏智慧農(nóng)業(yè)產(chǎn)業(yè)技術(shù)協(xié)同創(chuàng)新中心,銀川 750004)

0 引言

中國是葡萄生產(chǎn)大國,葡萄種植規(guī)模不斷擴大,準(zhǔn)確地獲取葡萄種植區(qū)的空間分布,可以為葡萄種植區(qū)的精細(xì)化管理提供技術(shù)支撐,對促進經(jīng)濟發(fā)展具有重要意義[1]。隨著遙感技術(shù)的發(fā)展,遙感已成為精準(zhǔn)農(nóng)業(yè)中農(nóng)田信息獲取的重要手段,也是地塊面積量算、作物種類識別、長勢分析等工作的重要數(shù)據(jù)來源[2]。農(nóng)業(yè)遙感信息獲取的方式主要有衛(wèi)星遙感和無人機遙感等技術(shù)[3]。與無人機遙感相比,衛(wèi)星遙感的成像覆蓋更廣,更適用于大范圍的作物種植區(qū)信息監(jiān)測。

遙感圖像分類可分為像素級、對象級和場景級3個不同層次[4]。作物遙感識別屬于像素級遙感圖像分類,其最終目標(biāo)是給遙感圖像中的每一個像素賦以唯一的作物類別標(biāo)識[5]。目前國內(nèi)作物遙感識別研究多關(guān)注小麥[6]、玉米[7]、水稻[8]等農(nóng)作物,專門針對葡萄種植區(qū)的遙感識別研究相對較少。目前對農(nóng)作物的遙感識別大多采用監(jiān)督分類方法,常用的傳統(tǒng)監(jiān)督分類算法有支持向量機(Support vector machine,SVM)[9-11]、隨機森林[12-14]、決策樹[15-16]等。在具體應(yīng)用中,劉純等[9]將支持向量機與遙感影像的光譜特征、形狀特征和多尺度區(qū)域特征等相結(jié)合,以提高分類精度。宋榮杰等[14]提出一種基于小波紋理和隨機森林算法的獼猴桃果園自動提取方法。王利軍等[15]在波譜特征和植被指數(shù)的基礎(chǔ)上,采用決策樹和SVM相結(jié)合的方法對秋季復(fù)雜作物進行有效識別,以提高農(nóng)作物分類提取精度。雖然這些方法都有良好的分類精度,但是需要依靠人工設(shè)計不同的算法來提取適合的特征以解決不同的問題,使得作物特征信息尚未得到充分利用。

深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)通過對訓(xùn)練樣本的學(xué)習(xí)來自動提取樣本特征,不需要大量的專家知識,被廣泛用于自然圖像分類、圖像分割等領(lǐng)域。LONG等[17]在CNN基礎(chǔ)上設(shè)計一種兼容任意尺寸圖像、端到端、像素到像素的全卷積神經(jīng)網(wǎng)絡(luò)(Fully convolutional networks,F(xiàn)CN),把圖像級別的分類進一步延伸到像素級別的分類,成功地將原本用于圖像分類的網(wǎng)絡(luò)轉(zhuǎn)變?yōu)橛糜趫D像分割的網(wǎng)絡(luò)[18]。U-Net[19]基于FCN改進而成,首先被廣泛應(yīng)用于醫(yī)學(xué)影像分割[20-21]。U-Net因其具有融合高低級語義信息、所需訓(xùn)練數(shù)據(jù)集少、訓(xùn)練速度快等特點,也被廣泛應(yīng)用于遙感影像分割。JI等[22]在U-Net基礎(chǔ)上提出一種適用于多源建筑數(shù)據(jù)集的全卷積神經(jīng)網(wǎng)絡(luò),可實現(xiàn)遙感圖像建筑物實例分割、變化檢測等多種用途。李旭青等[23]在U-Net模型基礎(chǔ)上,引入可變形卷積的思想,以提高冬小麥自動解譯精度。徐知宇等[24]利用高分二號衛(wèi)星多光譜遙感影像,將一種改進的U-Net卷積神經(jīng)網(wǎng)絡(luò)首次應(yīng)用于城市綠地自動分類。注意力模塊可以增強相關(guān)特征,抑制無關(guān)特征,從海量信息中篩選出高價值信息。已有各種各樣的注意力模塊被應(yīng)用于U-Net網(wǎng)絡(luò),以充分發(fā)揮兩者的優(yōu)勢,提高網(wǎng)絡(luò)的分割精度。PAN等[25]提出一種具有空間和通道注意力機制的生成式對抗網(wǎng)絡(luò),并使用U-Net作為生成器,顯著提升了高分辨遙感影像建筑物分割精度。MAFU-Net[26]結(jié)合U-Net、位置注意力模塊和通道注意力模塊,在不顯著增加參數(shù)量的情況下,提升遙感影像地物分類的精度。擴張卷積可以靈活調(diào)整卷積核感受野尺寸,提供豐富的空間上下文信息,也被應(yīng)用于遙感影像領(lǐng)域。例如,F(xiàn)U等[27]在FCN中加入擴張卷積和多尺度網(wǎng)絡(luò)結(jié)構(gòu),并使用條件隨機場細(xì)化結(jié)果預(yù)測圖,顯著提高了多分辨率遙感影像的分類精度。張祥東等[28]在三維卷積和二維卷積串聯(lián)模型的基礎(chǔ)上,通過引入擴張卷積與注意力機制,分別構(gòu)建多尺度特征融合模塊和注意力模塊,有效提升了高光譜圖像的分類精度。

為提高葡萄種植區(qū)的遙感識別精度,本文提出一種基于高分二號衛(wèi)星遙感影像的深度語義分割模型。在U-Net網(wǎng)絡(luò)基礎(chǔ)上,使用空間與通道注意力模塊提取有效的遙感影像空間信息,以提升邊緣分割效果;減少下采樣次數(shù),使用混合擴張卷積代替常規(guī)的卷積操作來擴大卷積核感受野,以適應(yīng)不同尺寸的地物。并與FCN-8s、U-Net網(wǎng)絡(luò)進行比較,驗證本文方法的有效性,以期為其他農(nóng)作物的精確識別提供參考。

1 研究區(qū)概況

本文研究區(qū)域位于東經(jīng)105°58′~106°8′,北緯38°28′~38°44′,地處寧夏回族自治區(qū)賀蘭山東麓葡萄酒產(chǎn)區(qū),是國際釀酒葡萄最佳產(chǎn)區(qū)之一,圖1為研究區(qū)域位置示意圖。該地日照時間長,晝夜溫差大,屬于典型的大陸性氣候,地形為山前扇形沖積平原。根據(jù)實際地面調(diào)查,研究區(qū)主要植被包括葡萄、苜蓿、水稻、玉米、小麥、枸杞等;非植被包括裸地、建筑用地、水體、溝渠、山脈等。

圖1 研究區(qū)域位置示意圖Fig.1 Illustration of location of study area

選用2019年7月25日獲取的研究區(qū)高分二號(GF-2)衛(wèi)星影像,影像包括同期獲取的空間分辨率為1 m的全色波段(0.45~0.90 μm)和空間分辨率為4 m的4個多光譜波段(Band1(0.45~0.52 μm)、Band2(0.52~0.59 μm)、Band3(0.63~0.69 μm)、Band4(0.77~0.89 μm))。本研究區(qū)域圖像尺寸為14 351像素×29 124像素,覆蓋面積約為41 796 hm2。

2 數(shù)據(jù)處理與研究方法

本文旨在使用改進的U-Net模型對葡萄種植區(qū)進行遙感識別,主要步驟包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)集構(gòu)建、模型改進和實驗。方法流程如圖2所示。

圖2 方法流程圖Fig.2 Flow chart of method

2.1 數(shù)據(jù)預(yù)處理

首先利用影像有理多項式系數(shù)(Rational polynomial coefficients,RPC)參數(shù)文件和數(shù)字高程模型數(shù)據(jù),在ENVI 5.3中對原始GF-2衛(wèi)星影像進行輻射校正、幾何校正等預(yù)處理;然后將多光譜影像與全色影像自動配準(zhǔn)并使用圖像融合算法進行影像融合,生成空間分辨率為1 m的融合影像。參照人工調(diào)查數(shù)據(jù),在融合影像中對已標(biāo)明地物類型的地塊進行感興趣區(qū)域裁剪。

2.2 數(shù)據(jù)集構(gòu)建

將感興趣區(qū)域分割成2 560像素×2 560像素的影像。使用LabelMe軟件對分割后的影像逐像素點標(biāo)注,然后進行顏色填充,背景類為黑色,其像素值為0,葡萄類為白色,其像素值為255。考慮到實驗訓(xùn)練時間和網(wǎng)絡(luò)結(jié)構(gòu)所支持的圖像尺寸等因素,將標(biāo)注后的標(biāo)簽圖像以及相對應(yīng)的原始圖像分割成若干幅256像素×256像素的圖像,如圖3所示。

圖3 原始影像和標(biāo)簽圖像示例Fig.3 Example of original and labeled image

數(shù)據(jù)量越大,模型越容易學(xué)習(xí)到具有代表性的特征。為擴充數(shù)據(jù)集,本文將原始圖像與標(biāo)簽圖像進行同步旋轉(zhuǎn)、鏡像翻轉(zhuǎn)。具體地,將圖像分別逆時針旋轉(zhuǎn)90°、180°和270°;將圖像分別以水平、垂直、主對角線和副對角線鏡像翻轉(zhuǎn)。最后按照比例5∶1隨機劃分為訓(xùn)練集和測試集,其中訓(xùn)練集圖像2 369幅用于模型訓(xùn)練,測試集圖像439幅用于模型評價,數(shù)據(jù)集有效類別數(shù)為2。

2.3 模型改進

U-Net在FCN基礎(chǔ)上進行修改和擴充,由捕獲上下文的收縮路徑和實現(xiàn)精確定位的對稱擴展路徑組成,形成一個“U”型結(jié)構(gòu),是典型的編碼-解碼結(jié)構(gòu)。U-Net可以用很少的訓(xùn)練數(shù)據(jù)產(chǎn)生精確的分割效果且訓(xùn)練速度快。U-Net的最大特點在于:每次下采樣時,將特征圖的通道數(shù)量加倍,以便讓更多的特征信息(如邊界、顏色、形狀等)在各個卷積層間傳播;每次上采樣時,將特征圖的通道數(shù)量減半,并進行跳躍連接(Skip connection),通過維度拼接(Concatenation)操作融合不同尺度的特征圖,保留更多高分辨率細(xì)節(jié)信息,以幫助恢復(fù)輸出圖像的空間分辨率,提高分割精度。

直接將自然圖像語義分割模型應(yīng)用于遙感影像,難以達(dá)到預(yù)期的效果和精度。為保證卷積操作前后的影像尺寸不變,本文在模型的卷積層中加入卷積填充。此外,針對遙感影像中葡萄種植區(qū)的特點,本文主要對U-Net進行以下改進:

(1)自適應(yīng)校準(zhǔn)特征映射

葡萄種植區(qū)域內(nèi)多有主道路和支道路縱橫交叉,且部分種植區(qū)臨近交通要道,給葡萄種植區(qū)的遙感識別造成干擾。注意力機制可以從不同維度動態(tài)調(diào)整特征值的權(quán)重降低噪聲干擾,提升對有效資源的利用率。

為此本文引入scSE(Spatial and channel squeeze &excitation)模塊[29],分別從空間和通道2個維度自適應(yīng)地重新校準(zhǔn)特征映射。scSE模塊由cSE模塊和sSE模塊組成,其結(jié)構(gòu)如圖4所示,其中“1×1卷積層”表示卷積核大小為1×1的卷積層。

圖4 scSE模塊結(jié)構(gòu)示意圖Fig.4 Illustration of scSE block

圖4中,U為輸入特征圖,U∈RC×H×W(C表示特征圖通道數(shù),H表示特征圖空間方向上的高度,W表示特征圖空間方向上的寬度)。在cSE模塊中,定義U=[u1u2…ui…uC],表示通道ui∈RH×W。首先對特征圖U進行全局平均池化,得到向量z∈R1×1×C,具體操作為

(1)

式中zk——第k個通道的全局平均池化結(jié)果

uk——U的第k個通道分量

U′cSE=[σ(z′1)u1σ(z′2)u2…σ(z′i)ui…σ(z′C)uC]

(2)

式中σ(z′i)——向量z′第i個分量的歸一化結(jié)果

隨著網(wǎng)絡(luò)的學(xué)習(xí),通道的重要性被適應(yīng)性地調(diào)整,以增強特定語義信息的表達(dá)。

在sSE模塊中,定義U=[u1,1u1,2…ui,j…uH,W],其中ui,j∈R1×1×C對應(yīng)于U在空間位置(i,j)的子空間的特征值,i∈{1,2,…,H}且j∈{1,2,…,W}。先對特征圖U進行卷積,生成投影向量q=Wsq*U,其中q∈RH×W,Wsq∈R1×1×C×1為卷積層的權(quán)重向量。再用Sigmoid函數(shù)將向量q的值歸一化到區(qū)間[0,1],并與特征圖U進行矩陣相乘,得到空間注意力特征圖U′sSE為

U′sSE=[σ(q1,1)u1,1…σ(qi,j)ui,j…σ(qH,W)uH,W]

(3)

式中qi,j——q在空間位置(i,j)的子空間

每個σ(qi,j)值對應(yīng)于給定特征圖的空間信息在空間位置(i,j)的相對重要性。通過重新校準(zhǔn),使得不重要的空間信息特征值越來越小,而重要的空間信息基本不會損失。

在對特征圖進行處理的過程中,cSE和sSE并行操作,將生成的通道注意力特征圖U′cSE和空間注意力特征圖U′sSE進行加和運算,得到最終的注意力特征圖(圖4)。

為突出遙感影像中葡萄種植區(qū)的邊緣特征信息,在U-Net編碼和解碼路徑的每2個3×3卷積層后添加scSE模塊,本文提出的注意力模塊如圖5所示,在每次卷積之后添加批標(biāo)準(zhǔn)化(Batch normalization,BN)和修正線性單元(Rectified linear unit,ReLU)激活函數(shù)。

圖5 注意力模塊Fig.5 Attention block

(2)減少下采樣次數(shù),擴大網(wǎng)絡(luò)感受野尺寸

研究區(qū)內(nèi)的葡萄種植面積不一,種植區(qū)域分布零散,容易出現(xiàn)漏識別現(xiàn)象??赏ㄟ^靈活調(diào)整卷積核感受野,來捕獲多尺度信息。卷積神經(jīng)網(wǎng)絡(luò)通過一系列下采樣操作來擴大感受野。在U-Net中,會進行4次1/2下采樣和4次2倍上采樣。特征圖經(jīng)過具有1/2下采樣的4個最大池化層后,其空間分辨率減少到原來的1/16。對于高分辨率遙感圖像分割任務(wù),下采樣操作會導(dǎo)致圖像空間信息的嚴(yán)重丟失。擴張卷積(Dilated convolution)可以在不降低圖像空間分辨率的同時擴大感受野,且不需要引入額外參數(shù)[30]。

在一維情況下,擴張卷積定義為

(4)

式中g(shù)[i]——輸出信號

f[i+rl]——輸入信號

h[l]——長度為l的濾波器

L——濾波器的最大長度

r——擴張率,對應(yīng)于用來采樣輸入信號f[i]的步幅

在標(biāo)準(zhǔn)卷積中,r=1。在語義分割領(lǐng)域中,二維擴張卷積是通過在卷積核的每個像素之間插入r-1個“零”來實現(xiàn),可以有效地將卷積核的內(nèi)核從k×k擴大到kd×kd,其中kd=k+(k-1)(r-1),如圖6所示,隨著擴張率的增大,卷積核感受野也不斷擴大。

圖6 擴張卷積示意圖Fig.6 Illustration of dilated convolution

將擴張卷積應(yīng)用于網(wǎng)絡(luò)的每個卷積層時,會增加網(wǎng)絡(luò)的計算量,降低計算效率。為實現(xiàn)合理的效率和精度,通常把擴張卷積應(yīng)用于已經(jīng)下采樣的特征圖[31]。本文去掉U-Net中的最后一次下采樣操作和第1次上采樣操作,并借鑒文獻(xiàn)[31]的思想,在U-Net第3次下采樣之后,對每個卷積層使用不同的擴張率,而不是對所有層使用相同或指數(shù)增長的擴張率。本文提出的混合擴張卷積(Hybrid dilated convolution,HDC)模塊如圖7a所示,卷積層擴張率分別為1、2、5。

圖7 擴張卷積變體Fig.7 Variants of dilated convolution

結(jié)合以上改進,在不降低網(wǎng)絡(luò)分割精度的前提下,為減少模型整體的的參數(shù)量和計算量,本文在混合擴張卷積模塊的卷積層之間插入帶有1×1卷積核的卷積層進行降維,如圖7b所示,并將加入1×1卷積層的混合擴張卷積模塊稱為“HDC-1”模塊。

綜合上述分析,本文將U-Net作為骨干網(wǎng)絡(luò),使用卷積填充確保輸入與輸出影像的尺寸相同;通過注意力模塊進行特征自適應(yīng)和細(xì)化;通過混合擴張卷積及1×1卷積層,實現(xiàn)不同尺度特征的捕獲和聚集。本文模型示意圖如圖8所示。

圖8 本文模型示意圖Fig.8 Illustration of the proposed network architecture

2.4 分割精度評價指標(biāo)

使用像素準(zhǔn)確率(Pixel accuracy,PA)、平均交并比(Mean intersection over union,MIoU)和頻權(quán)交并比(Frequency weighted intersection over union,F(xiàn)WIoU)作為精度評價指標(biāo),指標(biāo)越大,表示模型的分割效果越好。

使用模型參數(shù)量作為模型的復(fù)雜度評估指標(biāo),參數(shù)量越少,表示模型所需的計算資源越少,越有利于模型部署。模型的參數(shù)量通過開源深度學(xué)習(xí)框架Keras中的model.summary()方法進行統(tǒng)計得到。

3 實驗與結(jié)果分析

3.1 實驗環(huán)境與模型訓(xùn)練

實驗采用Python作為實現(xiàn)語言,基于Keras開源深度學(xué)習(xí)框架搭建實驗環(huán)境并進行訓(xùn)練、調(diào)參和測試,使用NVIDIA GeForce RTX 2080 Ti顯卡加速。模型訓(xùn)練階段采用動量為0.9的隨機梯度下降算法進行優(yōu)化,初始學(xué)習(xí)率(Learning rate)為0.1,批大小為32,訓(xùn)練180輪次,總迭代次數(shù)為13 320次,損失函數(shù)使用多分類交叉熵?fù)p失函數(shù),并采用早停法進行模型終止判斷,以防止過擬合,早停法監(jiān)測數(shù)據(jù)為訓(xùn)練集損失值,用He_normal進行權(quán)重初始化,使用Same卷積進行邊緣像素填充。

學(xué)習(xí)率是神經(jīng)網(wǎng)絡(luò)訓(xùn)練中最重要的超參數(shù),為找到合適的學(xué)習(xí)率,本實驗在固定批大小和其他超參數(shù)的前提下,分別使用不同的學(xué)習(xí)率(1、0.1、0.01、0.001)訓(xùn)練模型。不同學(xué)習(xí)率對應(yīng)的訓(xùn)練集準(zhǔn)確率變化曲線如圖9a所示,不同學(xué)習(xí)率在測試集上的評價指標(biāo)如圖9b所示。

圖9 不同學(xué)習(xí)率下模型的效果對比Fig.9 Comparison of effects of model at different learning rates

由圖9a可知,學(xué)習(xí)率為1時,梯度下降方向不準(zhǔn)確、振蕩較大,出現(xiàn)梯度發(fā)散。學(xué)習(xí)率為0.01和0.1在網(wǎng)絡(luò)訓(xùn)練初始階段的收斂速度接近,沒有出現(xiàn)振蕩,但學(xué)習(xí)率0.1在測試集上的評價指標(biāo)明顯優(yōu)于學(xué)習(xí)率0.01(圖9b),故本實驗的初始學(xué)習(xí)率設(shè)置為0.1,且當(dāng)訓(xùn)練集的準(zhǔn)確率停止提高時,將學(xué)習(xí)率衰減為原來的1/10。

為確定合適的批量大小,本實驗在固定學(xué)習(xí)率和其他超參數(shù)的前提下,分別使用不同的批量大小(4、8、16、32)訓(xùn)練模型,受限于實驗硬件環(huán)境的GPU內(nèi)存、數(shù)據(jù)集的容量以及網(wǎng)絡(luò)輸入圖像尺寸等因素,本實驗所支持的批量大小的最大值為32。不同批量大小在測試集上的評價指標(biāo)如圖10所示。當(dāng)批量大小為8和32時,各項評價指標(biāo)都比較接近,又因為在合理范圍內(nèi),批量大小越大,其確定的下降方向越準(zhǔn),引起的訓(xùn)練震蕩越小,同時可以提高內(nèi)存的利用率,故本實驗的批量大小設(shè)置為32。

圖10 不同批量大小的模型結(jié)果對比Fig.10 Comparison of effects of model under different batch sizes

3.2 實驗結(jié)果分析

通過消融實驗和特征可視化來探究注意力模塊和混合擴張卷積對本文模型的影響;為驗證本文模型的有效性,將其與FCN-8s、U-Net進行對比,定性、定量分析對比結(jié)果;為驗證本文模型的實用性,從遙感影像中選取2個大范圍葡萄種植區(qū)場景進行分析。

3.2.1消融實驗及特征可視化分析

將scSE模塊和HDC模塊分別單獨嵌入U-Net網(wǎng)絡(luò)中進行實驗。從測試集中選取兩幅場景進行分析,分別記為場景1、2,圖11中上方圖像為場景1,下方圖像為場景2。其原始圖像的標(biāo)簽如圖11a所示,scSE模塊和HDC模塊分別單獨作用于U-Net得到的識別結(jié)果如圖11b、11c所示,圖11d為scSE模塊和HDC模塊共同作用于U-Net得到的識別結(jié)果,結(jié)合scSE模塊和HDC模塊的優(yōu)勢,達(dá)到了更好的識別結(jié)果。

圖11 消融實驗識別結(jié)果對比Fig.11 Comparison of recognition results of ablation experiment

相對于單獨使用U-Net網(wǎng)絡(luò),scSE模塊作用于U-Net網(wǎng)絡(luò)的PA、MIoU和FWIoU分別提升1.72、3.27、3.13個百分點,參數(shù)量有所增加(表1)。對識別結(jié)果進行對比發(fā)現(xiàn),scSE模塊作用得到的結(jié)果輪廓較為清晰,例如場景1的方形框區(qū)域,明顯優(yōu)于HDC模塊作用得到的結(jié)果,說明scSE模塊對地物的邊緣識別效果更佳。

相對于單獨使用U-Net網(wǎng)絡(luò),HDC模塊作用于U-Net網(wǎng)絡(luò)的PA、MIoU和FWIoU分別提升2.06、3.94、3.77個百分點,且沒有引入過多額外的參數(shù)(表1)。對于場景2中的圓形框區(qū)域,HDC模塊作用得到的結(jié)果較為完整,無過多漏識別,而scSE模塊作用得到的結(jié)果漏識別率較高,說明HDC模塊更適用于不同大小地物的識別。

表1 不同組成模塊在測試集上的實驗結(jié)果Tab.1 Experiment results of different components on test dataset

為進一步分析兩者的作用機制,分別對scSE模塊和HDC模塊單獨作用于U-Net生成的特征圖進行可視化分析。

圖12b、12c分別為scSE模塊、HDC模塊處理后得到的前16維特征圖,圖中顏色越亮(黃色)表示網(wǎng)絡(luò)越注意該區(qū)域的特征,通過對比可以發(fā)現(xiàn)scSE模塊對葡萄種植區(qū)邊緣的響應(yīng)更加集中,可以將道路和葡萄完全區(qū)分開;HDC模塊對邊緣特征的響應(yīng)較弱,但對整塊葡萄種植區(qū)的響應(yīng)更加明顯。

圖12 scSE模塊和HDC模塊處理特征可視化Fig.12 Visualization of processed feature by scSE block and HDC block

通過分析可知,scSE模塊可以強化葡萄種植區(qū)的邊緣語義信息;HDC模塊可以捕獲不同尺度的上下文語義信息,使葡萄種植區(qū)的識別結(jié)果更加完整。

3.2.2模型對比結(jié)果分析

U-Net、FCN-8s和本文模型對測試集中3個典型場景的預(yù)測結(jié)果及細(xì)節(jié)如圖13所示,從上到下依次為場景3~5。

對于場景3,F(xiàn)CN-8s存在明顯的漏識別現(xiàn)象,例如紅色圓形框區(qū)域;FCN-8s將道路誤識別為葡萄種植區(qū),例如紅色方形框區(qū)域,而U-Net和本文模型可以有效地識別出細(xì)線狀道路,說明高低級語義信息的融合對細(xì)節(jié)特征的識別具有重要指導(dǎo)作用。

對于場景4,本文模型的識別效果明顯優(yōu)于U-Net和FCN-8s,主要是因為本文模型使用注意力模塊,注意力模塊能夠剔除冗余信息,找到強相關(guān)性的地物特征,適用于小尺寸地物的識別,而且地物的邊緣識別更為平滑。

對于場景5,U-Net和FCN-8s的識別結(jié)果非常零散,而本文模型的識別結(jié)果較為完整,例如紅色方形框區(qū)域,說明混合擴張卷積可以保證目標(biāo)地物的連續(xù)性,提高大尺寸地物的識別精度。該場景中道路兩側(cè)的葡萄種植區(qū)的顏色和紋理略有不同,U-Net和FCN-8s均未成功識別,本文模型能夠較為完整的識別出來。

綜合上述分析,與U-Net、FCN-8s相比,本文模型的整體識別能力更加穩(wěn)健,識別效果圖較為完整清晰。

U-Net、FCN-8s模型和本文模型在測試集上的評價指標(biāo)如表2所示。

表2 不同模型在測試集上的實驗結(jié)果Tab.2 Experiment results of different models on test dataset

U-Net模型在測試集上的PA為94.17%,MIoU為88.52%,F(xiàn)WIoU為88.96%,明顯優(yōu)于FCN-8s模型。本文模型在測試集上的PA、MIoU和FWIoU分別為96.56%、93.11%、93.35%,相比U-Net模型,PA、MIoU和FWIoU分別提升了2.39、4.59、4.39個百分點,參數(shù)量減少了39.75%,相比FCN-8s模型,分別提升了5.17、9.57、9.17個百分點,同等條件下可以利用少量的計算資源達(dá)到更高的精度,更具實用性。

3.2.3大范圍葡萄種植區(qū)識別結(jié)果分析

本文模型對兩個大范圍葡萄種植區(qū)場景的預(yù)測結(jié)果如圖14b所示,其中紅色區(qū)域表示葡萄種植區(qū)。圖14上圖為場景6、下圖為場景7。兩個場景的尺寸均為2 560像素×2 560像素,覆蓋面積約為656 hm2。

圖14 本文模型識別結(jié)果Fig.14 Detection results of proposed model

場景6主要包含有葡萄、荒地、林地、果園和建筑物等,用來檢測網(wǎng)絡(luò)對易混淆地物的區(qū)分能力。本文模型對場景6識別結(jié)果的PA、MIoU和FWIoU分別為98.75%、95.32%、97.56%。從本文模型對場景6的預(yù)測圖和人工標(biāo)注圖對比來看,本文模型對不同大小地物的識別效果較好,但也存在一些誤識別現(xiàn)象,例如藍(lán)色圓形框區(qū)域,其放大細(xì)節(jié)如圖15a中圓形框所示,將部分果園誤識別為葡萄,主要原因是部分果園的紋理、顏色和葡萄種植區(qū)極其相似;也存在明顯的漏識別現(xiàn)象,例如藍(lán)色方形框區(qū)域,其放大細(xì)節(jié)如圖15a中的方形框所示,從放大細(xì)節(jié)可以發(fā)現(xiàn),主要原因是有一條溝渠流經(jīng)此處,且部分位置的紋理亮度突然變強,使得特征變化不連續(xù),特征波動強烈,導(dǎo)致漏識別的出現(xiàn)。

圖15 場景6和場景7中的局部放大細(xì)節(jié)圖Fig.15 Local magnification details in scene 6 and scene 7

場景7主要包含有葡萄、玉米、樹林、果園、建筑物和通信基站等,用來檢測網(wǎng)絡(luò)對不同尺寸地物的識別能力。本文模型對場景7識別結(jié)果的PA、MIoU和FWIoU分別99.52%、97.14%、99.06%。從人工標(biāo)注圖和本文模型預(yù)測圖對比來看,兩者結(jié)果基本一致,而且本文模型對此區(qū)域的果園沒有出現(xiàn)誤識別情況。本文模型對小尺寸地物的識別具有明顯的優(yōu)勢,例如藍(lán)色圓形框區(qū)域,其放大細(xì)節(jié)如圖15b所示,能夠較完整地剔除葡萄種植區(qū)中的通信基站輪廓。

4 結(jié)束語

以U-Net模型為基礎(chǔ),利用有限的樣本數(shù)據(jù),提出一種高分辨率遙感影像葡萄種植區(qū)像素級精確識別方法。通過空間與通道注意力模塊進行特征自適應(yīng),改善了葡萄種植區(qū)的邊緣分割效果;通過減少下采樣次數(shù),使用混合擴張卷積有效地聚合不同感受野和空間上下文的信息,提高了對不同尺寸葡萄種植區(qū)的分割精度。此外,通過消融實驗和特征可視化分析可知,scSE模塊和混合擴張卷積分別對作物的邊緣信息與多尺度上下文信息進行強化,從而改善分割效果。本模型的像素準(zhǔn)確率、平均交并比和頻權(quán)交并比均優(yōu)于經(jīng)典語義分割模型FCN-8s、U-Net,且參數(shù)量較少,適用于大范圍的葡萄種植區(qū)識別,具有較高的準(zhǔn)確性和實用性。

猜你喜歡
種植區(qū)卷積像素
基于全卷積神經(jīng)網(wǎng)絡(luò)的豬背膘厚快速準(zhǔn)確測定
基于Landsat-8遙感數(shù)據(jù)的冬小麥種植區(qū)地表蒸散量時空分布研究
基于波段增強的DeepLabv3+多光譜影像葡萄種植區(qū)識別
像素前線之“幻影”2000
一種基于卷積神經(jīng)網(wǎng)絡(luò)的地磁基準(zhǔn)圖構(gòu)建方法
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
一種并行不對稱空洞卷積模塊①
“像素”仙人掌
高像素不是全部
您的像素,飽和嗎?[上]
依兰县| 龙口市| 朝阳县| 武安市| 郧西县| 青河县| 琼中| 安西县| 六盘水市| 赫章县| 高邮市| 永福县| 湟源县| 南平市| 沂水县| 宜丰县| 福鼎市| 临清市| 寻乌县| 万安县| 宣恩县| 晋宁县| 岑溪市| 永丰县| 时尚| 蕲春县| 稷山县| 永善县| 濉溪县| 曲阳县| 江陵县| 报价| 利津县| 凤山市| 宜阳县| 天峻县| 辛集市| 左云县| 鄂尔多斯市| 山丹县| 汾阳市|