曹州,劉士彬,馬勇,姚武韜,姜麗媛
(1 中國(guó)科學(xué)院空天信息創(chuàng)新研究院, 北京 100094; 2 中國(guó)科學(xué)院大學(xué), 北京 100049) (2020年1月8日收稿; 2020年4月16日收修改稿)
變化檢測(cè)是指從覆蓋同一地表區(qū)域的不同時(shí)相遙感影像中定性和定量分析地物變化,廣泛應(yīng)用在土地利用及覆蓋監(jiān)測(cè)、自然災(zāi)害災(zāi)后分析評(píng)估和城鎮(zhèn)動(dòng)態(tài)變化監(jiān)測(cè)等領(lǐng)域[1]。隨著立體化對(duì)地觀測(cè)網(wǎng)的建立,遙感衛(wèi)星數(shù)據(jù)量急劇增加,為了滿足不同領(lǐng)域的應(yīng)用需求,對(duì)變化檢測(cè)的精度和效率設(shè)定了更高的期望[2]。
根據(jù)檢測(cè)目的的不同,可將變化檢測(cè)劃分成3個(gè)層次:確定是否發(fā)生變化、確定由什么變?yōu)槭裁匆约白兓倪^程[3]。確定地物變化類型(from-to)由于能夠提供詳細(xì)的地物變化類型信息,一直是雙時(shí)相影像變化檢測(cè)研究的熱點(diǎn)與核心[4]。就目前而言,一般使用分類比較法先對(duì)不同時(shí)相的影像獨(dú)立分類,再對(duì)比地物類型獲取變化檢測(cè)結(jié)果[5]。然而該種方法僅基于當(dāng)前影像進(jìn)行分類,忽略了不同時(shí)相影像間具有的時(shí)間聯(lián)系,分類存在的誤差容易在變化檢測(cè)的過程中被進(jìn)一步傳遞并疊加放大,產(chǎn)生較多的偽變化,變化檢測(cè)精度有待進(jìn)一步提升,因此聯(lián)合分類與變化檢測(cè)一體化成為新的研究熱點(diǎn)[6]。
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)是一種能夠?qū)r(shí)序數(shù)據(jù)進(jìn)行建模的神經(jīng)網(wǎng)絡(luò),其某一時(shí)刻隱藏層的輸入包括當(dāng)前時(shí)刻輸入層的輸出和上一時(shí)刻隱藏層的輸出,實(shí)現(xiàn)了上下文信息隨時(shí)間傳遞,當(dāng)前時(shí)刻輸出層的輸出和上一時(shí)刻輸出層的輸出建立聯(lián)系,這一特性為雙時(shí)相影像的聯(lián)合分類提供理論支撐,實(shí)現(xiàn)變化檢測(cè)整體化進(jìn)行[7]。有學(xué)者通過將雙時(shí)相影像光譜值組合成序列數(shù)據(jù),輸入至循環(huán)神經(jīng)網(wǎng)絡(luò)中挖掘光譜-時(shí)間特征,對(duì)雙時(shí)相影像進(jìn)行聯(lián)合分類,提取影像變化信息,與傳統(tǒng)分類比較法相比,有效地提升了變化檢測(cè)的精度[8-9]。目前RNN在變化檢測(cè)領(lǐng)域中的應(yīng)用多基于像素開展,由于“同物異譜,同譜異物”現(xiàn)象在遙感影像中普遍存在,僅使用光譜信息分析地物變化類型能力較弱,RNN的應(yīng)用仍有待完善[10]。
將遙感影像的對(duì)象特征與光譜波段等多種信息進(jìn)行特征融合,可以實(shí)現(xiàn)特征之間的互補(bǔ),這一方法能夠提高變化檢測(cè)的精度和泛化性[11]。學(xué)者們通過添加紋理特征和光譜特征等信息,加大像元間的可區(qū)分性,有效減少了偽變化結(jié)果的產(chǎn)生[12-13]。部分學(xué)者結(jié)合遙感指數(shù)特征和光譜特征,進(jìn)一步提高了地物分類的準(zhǔn)確性,相關(guān)地物的變化檢測(cè)精度也得到了針對(duì)性的改善[14-15]。鑒于以上思路,本文提出一種結(jié)合光譜特征、對(duì)象特征和時(shí)間特征的遙感影像變化檢測(cè)方法。該方法首先提取雙時(shí)相中分辨率遙感影像的光譜特征、紋理特征和遙感指數(shù)特征,將其作為神經(jīng)網(wǎng)絡(luò)的輸入,利用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(bi-directional long-short term memory,Bi-LSTM)的特征提取能力,提取出光譜-對(duì)象-時(shí)間特征,完成雙時(shí)相地物聯(lián)合分類與變化檢測(cè),變化檢測(cè)的精度和自動(dòng)化程度得到了有效提高。
遙感影像特征蘊(yùn)含了更多空間和波譜的信息,將多種特征進(jìn)行融合,構(gòu)造適用性更強(qiáng)的變化檢測(cè)模型,充分挖掘遙感影像信息,能夠有效提升變化檢測(cè)結(jié)果的完整性與準(zhǔn)確性??紤]到中分辨率遙感影像變化檢測(cè)的實(shí)際需求與應(yīng)用場(chǎng)景,本文選取影像光譜特征、紋理特征和指數(shù)特征,其中指數(shù)特征選取常用的歸一化植被指數(shù)(normalized vegetation index,NDVI)、歸一化水體指數(shù)(normalized difference water index,NDWI)和歸一化建筑指數(shù)(normalized difference build-up index,NDBI)。
基于像素開展的變化檢測(cè)方法僅利用當(dāng)前像元的波段光譜值,缺少對(duì)光譜空間信息的挖掘,針對(duì)這一問題,本文選取窗口大小為3×3的像元光譜均值作為光譜特征,光譜特征數(shù)與波段數(shù)保持一致。
紋理特征描述了地物表面的性質(zhì),包含地物的空間信息和結(jié)構(gòu)信息,能夠加大光譜特征相似地物的可區(qū)分性,這一特性能夠有效提高變化檢測(cè)的精度[16]。本文基于窗口大小為3×3的二階概率統(tǒng)計(jì)計(jì)算多個(gè)紋理特征,分別是協(xié)同性、均值、信息熵、方差、對(duì)比度、相異性、相關(guān)性、二階矩。在多光譜影像中,影像的紋理特征描述為各個(gè)光譜波段對(duì)應(yīng)像元的二階紋理特征的均值。
植被指數(shù)反映了地表植被覆蓋情況和生長(zhǎng)狀態(tài),已被廣泛應(yīng)用于土地利用分類和植被覆蓋評(píng)價(jià)[17]。本文選取常用的NDVI,其值為正且越接近于1意味植被越健康茂盛,其值為負(fù)表示植被健康的可能性較低。NDVI由紅波段和紅外波段的反射率值計(jì)算得出,計(jì)算公式為
(1)
式中:Rnir為近紅外波段反射率值,Rred為紅光波段反射率值。
水體指數(shù)突出了影像中的水體信息,有助于水體的解譯和識(shí)別[18]。本文選取NDWI,該指數(shù)是基于綠波段與近紅外波段反射率值的歸一化比值指數(shù),計(jì)算公式為
(2)
式中:Rgreen表示綠光波段反射率值。
建筑指數(shù)反映了城鎮(zhèn)建筑用地的密集情況,NDBI被設(shè)計(jì)用于建筑用地信息的提取[19]。NDBI計(jì)算公式為
(3)
式中:Rswir1為波長(zhǎng)范圍為1.57~1.65 μm的短波紅外波段反射率值。
RNN網(wǎng)絡(luò)結(jié)構(gòu)包括3個(gè)部分,分別為輸入層、隱藏層和輸出層。雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(bidirectional recurrent neural network,Bi-RNN)由2個(gè)RNN網(wǎng)絡(luò)疊加組成,共同決定隱藏層的輸出。Bi-RNN能夠同時(shí)對(duì)2個(gè)時(shí)相的輸入進(jìn)行處理,以端到端的方式進(jìn)行變化檢測(cè),為遙感影像變化檢測(cè)一體化提供技術(shù)支撐。而Bi-LSTM網(wǎng)絡(luò)與Bi-RNN不同在于其隱藏層使用了LSTM單元[20]。
本文模型(圖1)采用Bi-LSTM網(wǎng)絡(luò),分別提取雙時(shí)相影像每一時(shí)相的影像特征,網(wǎng)絡(luò)的輸入由提取出的影像特征和原始光譜波段值拼接組合而成。網(wǎng)絡(luò)的輸出為2個(gè)時(shí)相的地物類型結(jié)果,通過比較分類結(jié)果得到地物類型變化圖。模型輸入層包含當(dāng)前時(shí)刻影像的光譜信息和對(duì)象特征,LSTM單元對(duì)輸入進(jìn)行特征融合,提取光譜-對(duì)象特征。此外,LSTM單元對(duì)當(dāng)前時(shí)刻的輸入信息產(chǎn)生“記憶”,“記憶”隨時(shí)序進(jìn)行傳遞,不同時(shí)相的特征建立起時(shí)間聯(lián)系,進(jìn)一步提取高層抽象的光譜-對(duì)象-時(shí)間特征,并將該特征輸出至輸出層進(jìn)行地物分類。Bi-LSTM網(wǎng)絡(luò)獨(dú)特的雙向結(jié)構(gòu)使得不同時(shí)刻的地物分類結(jié)果都與其他時(shí)刻相關(guān),從而實(shí)現(xiàn)多時(shí)相影像地物聯(lián)合分類,提高變化檢測(cè)的精度和可靠性。
圖1 變化檢測(cè)模型
本文Bi-LSTM網(wǎng)絡(luò)的訓(xùn)練過程如下:首先分別計(jì)算雙時(shí)相影像對(duì)應(yīng)的各個(gè)像元的光譜均值特征、紋理特征和遙感影像指數(shù)特征,經(jīng)正則化處理后拼接成對(duì)象特征向量ft,再與光譜值向量st拼接形成xt,其中t表示時(shí)刻。組成輸入向量對(duì)(x1,x2),樣本的真實(shí)地物類別經(jīng)獨(dú)熱編碼后組成真值類別向量對(duì)(y1,y2);輸入向量經(jīng)過2個(gè)方向上的各層LSTM單元計(jì)算分別得到lt和rt并對(duì)其進(jìn)行拼接,最終得到隱藏層輸出(h1,h2);(h1,h2)作為全連接層的輸入,該層輸出長(zhǎng)度為地物類別數(shù)量的向量,該向量通過Softmax層輸出該像元是各個(gè)地物類別的概率向量(y′1,y′2);最后計(jì)算(y′1,y′2)和(y1,y2)的交叉熵,利用梯度下降法對(duì)參數(shù)進(jìn)行更新,直至模型訓(xùn)練完畢。
所選實(shí)驗(yàn)區(qū)域?yàn)閺埣铱谑屑捌渲苓叺貐^(qū),實(shí)驗(yàn)數(shù)據(jù)為L(zhǎng)andsat-8號(hào)衛(wèi)星OLI陸地成像儀獲取的2016年和2018年的L1T級(jí)多光譜影像,空間分辨率為30 m,共7個(gè)多光譜波段,覆蓋光譜范圍為0.4~2.3 μm。為驗(yàn)證本文模型的泛化性,另外選取與實(shí)驗(yàn)區(qū)域擁有相似地物類型以及時(shí)間相近的北京市及其周邊地區(qū)2014和2019年同一傳感器獲取的多光譜影像數(shù)據(jù),使用上一實(shí)驗(yàn)訓(xùn)練得到的模型參數(shù)直接進(jìn)行遷移實(shí)驗(yàn)。Landsat-8號(hào)衛(wèi)星的L1T級(jí)數(shù)據(jù)已進(jìn)行幾何校正,對(duì)同一區(qū)域不同時(shí)相的影像實(shí)現(xiàn)了配準(zhǔn)。此外,為消除因光照和大氣等因素導(dǎo)致的測(cè)量值與地物反射率不一致的影響,本文使用ENVI5.1軟件對(duì)影像進(jìn)行處理,利用Radiometric Calibration模塊進(jìn)行輻射定標(biāo),使用FLAASH Atmospheric Correction模塊完成大氣校正,使遙感影像更準(zhǔn)確地反映地物真實(shí)情況。經(jīng)影像裁剪后,張家口市及其周邊地區(qū)影像像素大小為4 516×4 889,北京市及其周邊地區(qū)影像像素大小為3 148×3 696,真彩色合成影像如圖2所示。
圖2 實(shí)驗(yàn)區(qū)域影像
根據(jù)研究區(qū)域的地物類型特點(diǎn),本文將研究區(qū)域分為4種土地類型:耕地、建設(shè)用地、水體和林地,其中建設(shè)用地包括道路、建筑、裸地等。采用目視解譯的方法分別在2個(gè)時(shí)相影像上標(biāo)注不同類型的樣本,各類地物目視解譯的主要標(biāo)志為:耕地在影像上呈綠色或淺綠色,紋理光滑,形狀多為規(guī)則的多邊形,附近常伴有道路;建設(shè)用地在影像上色調(diào)較多,大多呈灰白或灰黃色調(diào)或紅藍(lán)相間,城鎮(zhèn)建設(shè)用地密集且規(guī)模較大,而農(nóng)村建設(shè)用地較分散,周圍往往有大量耕田;水體一般呈深色或黑色,水庫(kù)具有規(guī)則形狀且具有一定面積,而河流呈界線明顯的條帶狀;林地呈深綠色,紋理顆粒較粗,形狀不規(guī)則,分布不均勻,主要分布在山區(qū)。此外,本文利用相近時(shí)刻的高分辨率影像,根據(jù)經(jīng)緯度坐標(biāo)對(duì)地物類別進(jìn)行核對(duì),以保證標(biāo)注工作的準(zhǔn)確性。
由于本文模型的輸入是雙時(shí)相影像對(duì)應(yīng)像元的信息,需比對(duì)在2幅影像已標(biāo)注的地物樣本的位置,篩選出符合在該位置上2幅影像均被標(biāo)注地物類型要求的模型樣本。最終獲得變化像素點(diǎn)83 721個(gè),未變化像素點(diǎn)1 073 442個(gè),按常用的數(shù)據(jù)集劃分比例8∶1∶1隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,分別進(jìn)行模型訓(xùn)練、模型選擇和精度評(píng)價(jià)。
本文模型超參數(shù)包含堆疊的隱層數(shù)l和LSTM單元大小r,在模型訓(xùn)練之前需要確定超參數(shù)大小。l與r共同決定模型參數(shù)的數(shù)量大小,合適的模型參數(shù)量會(huì)使模型學(xué)習(xí)能力較強(qiáng)且泛化性能較好,不產(chǎn)生過擬合問題。通常l和r的取值空間分別為{2,3,4}和{128,256,512},本文隨機(jī)排列l(wèi)和r的取值。不同參數(shù)組合模型在驗(yàn)證集下的準(zhǔn)確率(圖3)表明,準(zhǔn)確率隨著l和r從低增大逐步上升;當(dāng)l為3,r為256時(shí),準(zhǔn)確率達(dá)到最高;而當(dāng)l大于3,r大于256時(shí),準(zhǔn)確率下降,產(chǎn)生過擬合。因此,本文模型最終確定超參數(shù)l為3,r為256。
圖3 不同參數(shù)組合模型的準(zhǔn)確率
為檢驗(yàn)本文模型的有效性,基于相同的訓(xùn)練樣本和測(cè)試樣本,選取應(yīng)用較多的支持向量機(jī)(support vector machine,SVM)方法、加權(quán)迭代的多元變化檢測(cè)方法(iteratively re-weighted modification of the multivariate alteration detection,IR-MAD)及普通Bi-LSTM模型與本文模型進(jìn)行對(duì)比。其中,普通Bi-LSTM模型僅利用光譜值作為輸入,模型的超參數(shù)與本文模型一致。
變化檢測(cè)結(jié)果(圖4(a))反映了張家口市及其周邊地區(qū)2016—2018年各個(gè)位置上地物變化的類型,其中變化像元數(shù)量較小,占比2.4%。主要發(fā)生的變化按像元數(shù)從高到低排列,分別為林地到建設(shè)用地的變化(圖4(b))、建設(shè)用地到林地的變化(圖4 (c))和耕地到建設(shè)用地的變化(圖4 (d)),占變化像元總數(shù)的59%、24%和9%。其中,林地和耕地到建設(shè)用地的變化主要為修建道路和建筑設(shè)施,而建設(shè)用地到林地的變化主要為張家口市作為2022年冬奧會(huì)的舉辦地之一,積極踐行綠色奧運(yùn)理念,在多處荒山裸地造林綠化。
分類混淆矩陣(表1)表明,本模型的地物樣本總體分類精度超過90%。除耕地外,其余類別用戶精度和制圖精度在90%以上,水體類別可達(dá)97%。與普通Bi-LSTM模型的精度對(duì)比結(jié)果(表2)顯示,本文雙向Bi-LSTM模型在各個(gè)地物類別上的用戶精度和制圖精度上皆有不同程度的提升,耕地和林地的提升效果最好。
表1 分類混淆矩陣
表2 分類精度提升結(jié)果
由于耕地和林地的光譜信息相似,獨(dú)立分類又使得分類誤差在變化檢測(cè)過程中無法彌補(bǔ),SVM法變化檢測(cè)結(jié)果中出現(xiàn)大量的耕地-林地(圖5(a))和林地-耕地(圖5(b))的偽變化。無監(jiān)督的IR-MAD法變化檢測(cè)結(jié)果甚至出現(xiàn)了大量水體-林地(圖5(c))和水體-耕地(圖5(d))的偽變化,與現(xiàn)實(shí)結(jié)果產(chǎn)生嚴(yán)重偏差。
圖5 對(duì)比方法偽變化結(jié)果
變化檢測(cè)誤差矩陣(表3)顯示,在變化像元檢測(cè)上,本文模型的制圖精度和用戶精度均在0.8以上,能夠較好地滿足實(shí)際應(yīng)用的要求。各類方法地物變化類型精度評(píng)價(jià)表(表4)表明,本文模型提取地物變化信息的能力較強(qiáng),各類地物變化中以建設(shè)用地和水體的變化提取最為準(zhǔn)確。IR-MAD法和SVM法的總體精度和Kappa系數(shù)均小于0.75,而普通Bi-LSTM網(wǎng)絡(luò)和本文模型的結(jié)果較好,其中本文模型的總體精度和Kappa系數(shù)分別為0.95和0.84,相較于其他方法,均有較大幅度的提升。綜上,本文模型變化檢測(cè)效果最優(yōu)。
表3 變化檢測(cè)誤差矩陣
表4 各類方法地物變化類型精度評(píng)價(jià)
遷移實(shí)驗(yàn)變化檢測(cè)結(jié)果(圖6(a))顯示,北京市及其周邊地區(qū)的地物變化類型主要為耕地到建設(shè)用地(圖6(b))以及建設(shè)用地到耕地(圖6(c))的變化,其中耕地到建設(shè)用地的變化占所有變化70%以上。由于沒有使用遷移實(shí)驗(yàn)區(qū)域內(nèi)新標(biāo)注的樣本重新進(jìn)行模型訓(xùn)練,地物變化類型精度(表5)平均約有6%的小幅下降。遷移實(shí)驗(yàn)對(duì)比結(jié)果(表6)顯示,本文模型的總體精度和Kappa系數(shù)依然最高,其中總體精度大于0.8。
表5 遷移實(shí)驗(yàn)地物變化類型精度
表6 遷移實(shí)驗(yàn)對(duì)比結(jié)果
圖6 北京市及其周邊地區(qū)變化檢測(cè)結(jié)果
綜上,利用雙向長(zhǎng)短期記憶網(wǎng)絡(luò),聯(lián)合光譜-時(shí)間-對(duì)象特征進(jìn)行變化檢測(cè)可行有效。在提高精度的同時(shí),在變化檢測(cè)過程中本文模型無需手工設(shè)立閾值,減少了人為干預(yù)。此外,本文模型具有良好的泛化性,一定程度上可降低對(duì)樣本的依賴性,提高了變化檢測(cè)的自動(dòng)化程度。
本文將傳統(tǒng)遙感影像特征與深度學(xué)習(xí)技術(shù)相結(jié)合,提出了一種聯(lián)合光譜-對(duì)象-時(shí)間特征的變化檢測(cè)方法,遙感影像變化檢測(cè)的精度和自動(dòng)化程度得到有效提高。本模型作為遙感變化檢測(cè)手段的一種補(bǔ)充,能夠在不同場(chǎng)景中應(yīng)用,然而本文仍有以下問題有待改進(jìn):1)針對(duì)不同的遙感影像和任務(wù)需求,特征選擇可能不同,模型的復(fù)雜程度將會(huì)增加;2)變化檢測(cè)結(jié)果形態(tài)的規(guī)則性完整性有待提高,為了減少“椒鹽”現(xiàn)象,需要更多的后處理操作;3)中分辨率影像存在較多的混合像元,耕地和林地的之間的區(qū)分不夠明顯,為了更加準(zhǔn)確地進(jìn)行地物分類,需要學(xué)習(xí)更多時(shí)相的樣本數(shù)據(jù)。如何提高變化檢測(cè)精度的同時(shí)減少人工干預(yù)程度,依舊是未來變化檢測(cè)研究的重點(diǎn)和難點(diǎn)。