李心媛,賀 智,2,樓桉君,肖 曼
(1. 中山大學(xué)地理科學(xué)與規(guī)劃學(xué)院,廣東 廣州 510275; 2. 南方海洋科學(xué)與工程廣東省實(shí)驗(yàn)室(珠海),廣東 珠海 519082)
濕地具有強(qiáng)大的固碳功能[1],在實(shí)現(xiàn)我國(guó)碳達(dá)峰、碳中和目標(biāo),構(gòu)建新發(fā)展格局中發(fā)揮著重要作用。環(huán)南海地區(qū)是我國(guó)建設(shè)“21世紀(jì)海上絲綢之路”的關(guān)鍵對(duì)象[2]。20世紀(jì)60年代以來(lái),區(qū)域內(nèi)快速城市化發(fā)展導(dǎo)致濕地面積減少,生態(tài)功能下降。對(duì)環(huán)南海區(qū)域開(kāi)展?jié)竦剡b感監(jiān)測(cè),有利于推動(dòng)全區(qū)域濕地整體性、統(tǒng)籌性保護(hù)。
濕地類型多樣、斑塊小、類間差異小[3],高分辨率遙感影像能更好地滿足濕地解譯需求。深度學(xué)習(xí)能有效挖掘遙感數(shù)據(jù)的深層信息[4],近年來(lái)被逐漸應(yīng)用于濕地分類領(lǐng)域,如卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、生成對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)等已在濕地分類中取得了一定成效[5-7]。
圖卷積網(wǎng)絡(luò)(graph convolution network,GCN)可對(duì)全局空間關(guān)系建模,能充分利用深層特征及挖掘?qū)ο箝g的關(guān)系[8],在濕地分類中具有巨大潛力。雙線性模型[9]于2015年被提出,適用于細(xì)粒度分類,在提高濕地分類精度中具有廣闊前景?;诖?本文提出基于雙線性圖卷積網(wǎng)絡(luò)(bilinear GCN,BiGCN)的環(huán)南海地區(qū)濕地分類方法,以期為環(huán)南海地區(qū)的濕地監(jiān)測(cè)和保護(hù)提供支持。
環(huán)南海地區(qū)共包括9個(gè)國(guó)家,地處亞熱帶和熱帶太平洋西部區(qū)域,全年濕潤(rùn),降雨豐富[10]。該區(qū)域地理位置優(yōu)越,具有重要的經(jīng)濟(jì)與軍事價(jià)值[11]。本文基于FROM-GLC全球10 m分辨率地表覆蓋數(shù)據(jù)[12],以分布集中且涵蓋濕地類別多為原則,在環(huán)南海海岸帶選擇3塊研究區(qū),如圖1所示。
圖1 研究區(qū)分布
針對(duì)濕地分類,選取Sentinel-2多光譜影像為主要數(shù)據(jù)源,從Google Earth Engine平臺(tái)獲取研究區(qū)2020年云覆蓋率小于10%的Sentinel-2影像并求出均值;針對(duì)濕地特性,選取雷達(dá)、河網(wǎng)、地形、物候數(shù)據(jù)作為輔助,輸入深度學(xué)習(xí)網(wǎng)絡(luò),以提高對(duì)不同類別濕地的辨別能力。數(shù)據(jù)源信息見(jiàn)表1。其中,雷達(dá)數(shù)據(jù)選用Sentinel-1,GRD級(jí)數(shù)據(jù)產(chǎn)品;河網(wǎng)數(shù)據(jù)選用OSM(open street map)矢量數(shù)據(jù)中的water和waterways;地形數(shù)據(jù)選用SRTM DEM;物候數(shù)據(jù)在Google Earth Engine上利用全年Sentinel-2影像求出區(qū)域空間上每個(gè)位置的年最大歸一化植被指數(shù)和歸一化差異水體指數(shù),即全年最綠圖和全年最濕圖。
表1 數(shù)據(jù)源信息
綜合考慮研究區(qū)實(shí)際情況和現(xiàn)有濕地分類標(biāo)準(zhǔn),構(gòu)建環(huán)南海地區(qū)濕地二級(jí)分類體系。遵循各類樣本數(shù)目盡量均衡且在空間上均勻零散分布的原則,對(duì)3塊研究區(qū)進(jìn)行樣本標(biāo)記,分別構(gòu)建越南南部數(shù)據(jù)集、菲律賓西北部數(shù)據(jù)集、中國(guó)深圳灣沿岸數(shù)據(jù)集,3個(gè)研究區(qū)大小分別為959×760、815×885、897×642像素。濕地分類體系及各數(shù)據(jù)集標(biāo)記樣本數(shù)見(jiàn)表2,標(biāo)記樣本分布如圖2所示。試驗(yàn)隨機(jī)選取50%的標(biāo)記樣本作為訓(xùn)練集,其余為測(cè)試集。
表2 濕地地物分類體系及各數(shù)據(jù)集標(biāo)記樣本信息 個(gè)
表3 RF二分類精度 (%)
本文提出的基于BiGCN濕地分類方法如圖3所示。首先,采用多尺度分割方法將多光譜遙感影像提取為對(duì)象塊;其次,使用面向?qū)ο蟮碾S機(jī)森林(random forest,RF)[13]區(qū)分濕地與非濕地;然后,對(duì)濕地部分基于BiGCN與多源輔助數(shù)據(jù)進(jìn)行二級(jí)分類,非濕地部分采用隨機(jī)森林方法進(jìn)行二級(jí)分類;最后,將兩部分的分類結(jié)果相疊加,得到研究區(qū)影像分類結(jié)果。
圖3 基于BiGCN的濕地分類方法
采用多尺度分割方法獲取影像對(duì)象塊,越南南部數(shù)據(jù)集、菲律賓西北部數(shù)據(jù)集、中國(guó)深圳灣沿岸數(shù)據(jù)集分割后的對(duì)象塊數(shù)目分別約為2000、3300、3000,3個(gè)研究區(qū)的分割結(jié)果如圖4所示。
圖4 多尺度分割結(jié)果
為了減小圖卷積的運(yùn)算量,并提升濕地類內(nèi)緊湊性和類間的可分離性,利用RF區(qū)分濕地與非濕地,獲取濕地掩膜。3個(gè)數(shù)據(jù)集上得到的分類結(jié)果如圖5所示。
圖5 濕地與非濕地二分類結(jié)果
使用準(zhǔn)確率、精確率、召回率、F1值評(píng)價(jià)二分類結(jié)果的精度(見(jiàn)表 3),3個(gè)數(shù)據(jù)集上的分類精度均在91%以上。
2.3.1 圖卷積網(wǎng)絡(luò)
光譜信號(hào)間的關(guān)系可以表示為
G=(V,E,A)
L=D-A
為了提高圖的泛化能力,使用對(duì)稱歸一化拉普拉斯矩陣
式中,I為單位矩陣。
定義濾波器gθ=diag(θ)對(duì)圖G進(jìn)行節(jié)點(diǎn)構(gòu)建,它可以理解為標(biāo)準(zhǔn)化圖拉普拉斯矩陣L的特征值的函數(shù)。一個(gè)圖的光譜卷積可以定義為圖信號(hào)s與濾波器gθ的乘積,公式為
因此,GCN的傳播規(guī)則為
2.3.2 網(wǎng)絡(luò)模型結(jié)構(gòu)
BiGCN模型結(jié)構(gòu)如圖6所示,以Sentinel-2、多源輔助數(shù)據(jù)、分割對(duì)象塊及濕地掩膜為輸入,利用多層圖卷積提取抽象特征,最終輸出濕地分類結(jié)果。
圖6 BiGCN模型結(jié)構(gòu)
(1)根據(jù)多源數(shù)據(jù)和分割結(jié)果構(gòu)建圖結(jié)構(gòu),查找每個(gè)對(duì)象的鄰接對(duì)象是構(gòu)建圖結(jié)構(gòu)的基礎(chǔ)。如圖7所示,對(duì)象v1與對(duì)象v2、v3、v4以邊相鄰接,而與對(duì)象v5、v6、v7以點(diǎn)相鄰接。原始GCN中的查找方法能夠搜索到每個(gè)對(duì)象周圍以邊相鄰接的對(duì)象,但以點(diǎn)鄰接的對(duì)象間關(guān)系同樣十分密切。因此,本文在鄰接對(duì)象的查找上作出改進(jìn),在僅查找以邊鄰接對(duì)象的基礎(chǔ)上增加了以點(diǎn)相鄰接的對(duì)象。
圖7 考慮點(diǎn)鄰接的圖結(jié)構(gòu)
(2)建立圖結(jié)構(gòu)后,采用雙線性模型思想搭建兩路并行的子網(wǎng)絡(luò),每路網(wǎng)絡(luò)中包含兩層圖卷積,分別包含64和128個(gè)隱藏單元。兩層圖卷積之間使用Swish激活函數(shù),它同ReLU一樣有下界無(wú)上界,能夠防止梯度飽和問(wèn)題,具有非單調(diào)且平滑的特點(diǎn),能夠有效提升網(wǎng)絡(luò)性能,公式為
(3)對(duì)兩路網(wǎng)絡(luò)的輸出特征進(jìn)行雙線性池化運(yùn)算,將兩路網(wǎng)絡(luò)的特征融合,公式為
bilinear(l,I,fA,fB)=fA(l,I)TfB(l,I)
式中,I為輸入影像;l為輸出特征圖的位置序號(hào);fA和fB分別為兩路網(wǎng)絡(luò)的特征。通過(guò)兩路并行的網(wǎng)絡(luò)進(jìn)行特征提取及雙線性池化操作,兩路網(wǎng)絡(luò)可以分別實(shí)現(xiàn)區(qū)域檢測(cè)和特征提取的功能,且互為補(bǔ)充,能夠有效實(shí)現(xiàn)細(xì)粒度分類。
(4)對(duì)兩路特征融合后的向量執(zhí)行一個(gè)概率為0.5的Dropout層、一個(gè)全連接層,并根據(jù)全連接層輸出中最大值的位置確定濕地地物類別。
2.3.3 試驗(yàn)環(huán)境及參數(shù)設(shè)置
本文深度學(xué)習(xí)框架使用Tensorflow,硬件設(shè)備為Intel(R)Core(TM)i7-6700 CPU @ 3.40 GHz 3.41,內(nèi)存為8 GB。BiGCN模型學(xué)習(xí)率設(shè)置為0.001,最大迭代次數(shù)設(shè)置為300。
為驗(yàn)證濕地分類方法的有效性,選取5種典型分類模型進(jìn)行對(duì)比試驗(yàn),包括支持向量機(jī)(support vector machine,SVM)[15]、RF、K近鄰法(K-nearest neighbor,KNN)[16]、CNN、GCN。各模型在已構(gòu)建的3個(gè)數(shù)據(jù)集上得到的分類結(jié)果如圖8—圖10所示。
圖8 越南南部數(shù)據(jù)集分類結(jié)果
可以看出,SVM、RF、KNN這3種非深度學(xué)習(xí)方法在3個(gè)數(shù)據(jù)集上的總體分類精度(overall accuracy,OA)均在85%以下,低于3種深度學(xué)習(xí)方法;而在3種深度學(xué)習(xí)方法中,兩種GCN方法的分類精度高于CNN;使用本文分類方法得到的濕地分布圖與真實(shí)情況的吻合度最高且OA最高,3個(gè)數(shù)據(jù)集上的OA均超過(guò)92%。
由圖8可以看出,對(duì)于越南南部數(shù)據(jù)集,CNN和GCN的OA略微高于3種非深度學(xué)習(xí)方法,本文方法分類精度顯著高于其余5種方法。對(duì)非濕地和濕地的判別,RF、KNN和CNN中存在較多將濕地誤判為建設(shè)用地的情況。對(duì)濕地二級(jí)類的判別,深度學(xué)習(xí)方法能夠?qū)⒑拥肋吘壍恼訚膳c河流本身區(qū)分開(kāi);GCN分類結(jié)果圖中存在將河流誤判為水產(chǎn)養(yǎng)殖池的情況,而CNN與本文方法對(duì)河流的分類正確且完整;影像最右側(cè)區(qū)域中間部位有一處網(wǎng)格狀分布、沼澤穿插于間隙的林地,CNN將穿插的沼澤誤判為建設(shè)用地,原始GCN將整塊區(qū)域誤判為林地,沒(méi)有將林地格網(wǎng)間的濕地判別出來(lái),而本文方法則判別準(zhǔn)確。
由圖9可以看出,對(duì)于菲律賓西北部數(shù)據(jù)集,3種非深度學(xué)習(xí)方法的OA均低于77%;而深度學(xué)習(xí)方法的OA均大于83%。RF、GCN和本文方法對(duì)灘涂的判別更為準(zhǔn)確,而SVM、KNN和CNN對(duì)沿海地區(qū)的灘涂存在漏分現(xiàn)象;對(duì)于該區(qū)域北部的兩片湖泊,多數(shù)方法將其誤判為河流、裸地或海洋,CNN和本文方法則能將其較為完整、勻質(zhì)地判別出來(lái)。此外,該區(qū)域內(nèi)河流東部河道中存在較多沼澤,用于對(duì)比的幾種方法大多將沼澤誤判為建設(shè)用地,而本文方法能將其正確判別。
圖9 菲律賓西北部數(shù)據(jù)集分類結(jié)果
由圖10可以看出,對(duì)于中國(guó)深圳灣沿岸數(shù)據(jù)集,該區(qū)域北部有一處L形湖泊,SVM、RF和KNN均將其誤判為水產(chǎn)養(yǎng)殖池,而深度學(xué)習(xí)方法均分類正確,且準(zhǔn)確判別了深圳灣沿岸林地與灘涂間的過(guò)渡帶沼澤。CNN和GCN對(duì)二級(jí)濕地類的分類精度均優(yōu)于SVM、RF、KNN,但在南部淺海水域和灘涂的交界處,GCN存在將其誤判為水產(chǎn)養(yǎng)殖池的情況,在最南部的灘涂和林地交界處,CNN和GCN分別將其誤判為水產(chǎn)養(yǎng)殖池和湖泊,而本文方法則分類正確??傊?本文方法在該數(shù)據(jù)集上的OA相較于GCN顯著提升,提升幅度超過(guò)4%。
圖10 中國(guó)深圳灣沿岸數(shù)據(jù)集分類結(jié)果
設(shè)計(jì)5組消融試驗(yàn)進(jìn)一步檢驗(yàn)本文模型各部分的作用,使用OA、平均準(zhǔn)確率(average accuracy, AA)和Kappa系數(shù)對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià),消融試驗(yàn)的分類精度與用時(shí)見(jiàn)表 4,可以得到如下結(jié)論。
(1)相較于雙線性模型的網(wǎng)絡(luò),僅使用單通道網(wǎng)絡(luò)的運(yùn)算用時(shí)大幅縮短,但精度較低,3個(gè)數(shù)據(jù)集上單通道網(wǎng)絡(luò)的OA比雙線性網(wǎng)絡(luò)分別降低3.01%、1.72%、3.52%??梢?jiàn),構(gòu)建雙線性網(wǎng)絡(luò)進(jìn)行濕地分類,盡管消耗更長(zhǎng)的模型訓(xùn)練時(shí)間,但分類精度有顯著提升。
(2)加入多源輔助數(shù)據(jù)后,由于數(shù)據(jù)量明顯增加,運(yùn)算速度有小幅降低,但3個(gè)數(shù)據(jù)集的分類精度都得到明顯提升,其中菲律賓西北部數(shù)據(jù)集OA提升約3.79%。
(3)考慮點(diǎn)鄰接對(duì)象后,3個(gè)數(shù)據(jù)集運(yùn)算用時(shí)均縮短了約3%,且分類精度均有小幅提升。點(diǎn)鄰接對(duì)象加入后,每個(gè)對(duì)象的空間信息量更為豐富,提升了網(wǎng)絡(luò)的辨別能力,提高了濕地分類效率。
(4)相較于ReLU,使用Swish激活函數(shù)在3個(gè)數(shù)據(jù)集上得到的OA、AA和Kappa均有小幅提升,其中中國(guó)深圳灣沿岸數(shù)據(jù)集提高最多,3項(xiàng)指標(biāo)均提高1%以上;兩種激活函數(shù)運(yùn)算時(shí)間基本相當(dāng),ReLU的用時(shí)稍短于Swish??梢?jiàn),Swish激活函數(shù)的運(yùn)算量略大于ReLU,但分類表現(xiàn)更優(yōu)。
(5)不加掩膜時(shí),分類精度較低且模型訓(xùn)練耗時(shí)更長(zhǎng);加入掩膜后,3個(gè)數(shù)據(jù)集的分類用時(shí)分別縮短195.70、842.22、1 003.69 s??梢?jiàn),使用分層分類的方法首先把差異較大的濕地和非濕地分開(kāi),然后對(duì)濕地部分進(jìn)行細(xì)分,有助于同時(shí)提高分類精度與分類效率。
本文針對(duì)環(huán)南海地區(qū)濕地監(jiān)測(cè)需求,利用Sentinel-2影像制作了3組環(huán)南海地區(qū)濕地分類數(shù)據(jù)集,并提出一種基于BiGCN的濕地分類方法。該方法基于面向?qū)ο蟮姆謱臃诸愃枷?首先區(qū)分濕地與非濕地,然后構(gòu)建適用于濕地細(xì)粒度分類的BiGCN模型,并對(duì)濕地類型進(jìn)行細(xì)化,且采取多種策略對(duì)分類效果進(jìn)行優(yōu)化(如使用雙線性模型、在構(gòu)建圖結(jié)構(gòu)時(shí)考慮以點(diǎn)鄰接的節(jié)點(diǎn)及采用性能更優(yōu)的Swish激活函數(shù)等)。試驗(yàn)結(jié)果表明,在所構(gòu)建的3組數(shù)據(jù)集上,本文方法均能夠達(dá)到92%以上的總體分類精度,比原始圖卷積網(wǎng)絡(luò)提高4%以上,且分類耗時(shí)大幅縮短,同時(shí)也優(yōu)于多種常用的濕地分類方法。未來(lái)研究將聚焦于小樣本上的濕地高精度分類。