張友才,李 強(qiáng),臧英平,李樹明,程 宇,仲躋文,韋立新,張 泉,潘 鑫
(1.南京市長江河道管理處,江蘇 南京 210011;2.長江下游水文水資源勘測局,江蘇 南京 210011;3.河海大學(xué) 地球科學(xué)與工程學(xué)院,江蘇 南京 211100)
近年來,隨著城市化進(jìn)程的加速,大量自然景觀取代了人工地表。不透水面泛指能阻止水滲透到地表以下的下墊面類型,主要包括建筑、道路和工礦用地等人造地表。不透水面的擴(kuò)張可以衡量城市發(fā)展的進(jìn)程,也可提供環(huán)境質(zhì)量的判斷標(biāo)準(zhǔn);但其大規(guī)模擴(kuò)張使城市的生態(tài)體系遭到了破環(huán),從而導(dǎo)致了一系列的生態(tài)問題。不透水面的形成往往是以減小植被覆蓋面積為代價(jià)的,嚴(yán)重影響了城市綠色生態(tài)系統(tǒng)[1]。同樣的太陽輻射下,不透水面的溫度高于自然地表,因此其面積增加也將增強(qiáng)城市熱島效應(yīng)[2-4]。
長江是我國的母親河,也是永續(xù)華夏文明發(fā)展的支柱。隨著城市化的發(fā)展,人們不合理的生產(chǎn)生活方式對長江經(jīng)濟(jì)帶水環(huán)境的影響尤為突出,進(jìn)而導(dǎo)致生態(tài)系統(tǒng)格局的變化,主要表現(xiàn)為農(nóng)田、植被、湖泊、自然保護(hù)區(qū)等生態(tài)面積的減少以及水生生物多樣性指數(shù)的持續(xù)減少等。因此,長江大保護(hù)成為長江經(jīng)濟(jì)帶戰(zhàn)略中亟需完成的一項(xiàng)重大任務(wù),長江沿線的不透水面提取對于長江大保護(hù)時(shí)期(2016-2019年)前后岸線以及岸灘區(qū)域主要涉水工程的變化監(jiān)測具有重要意義。
相較于傳統(tǒng)的手工數(shù)字化和地面測量方法,遙感圖像解譯技術(shù)具有成本低、數(shù)據(jù)獲取周期短、覆蓋率高和空間尺度大等優(yōu)點(diǎn),已成為研究不透水面提取和動(dòng)態(tài)變化監(jiān)測的基本方法?,F(xiàn)有研究方法大多基于Landsat TM/ETM+等中、低分辨率影像數(shù)據(jù),利用有利于識別建筑、道路等人工地表的中紅外、熱紅外等光譜波段進(jìn)行大尺度不透水面制圖[5]。高分辨率影像所包含的細(xì)節(jié)信息更有利于地物提取分析,但除了少數(shù)具有中紅外波段外,大部分僅有可見光和近紅外波段,從而限制了很多不透水面提取方法的使用[6]。
機(jī)器學(xué)習(xí)方法是目前大范圍不透水面制圖或城市尺度下不透水面信息提取中具有優(yōu)勢的高級算法。與傳統(tǒng)方法相比,其可在經(jīng)驗(yàn)學(xué)習(xí)中進(jìn)行自動(dòng)改善,從而克服主觀因素,在處理噪聲和復(fù)雜數(shù)據(jù)源等方面具有良好的精度。郜燕芳[7]等利用隨機(jī)森林和支持向量機(jī)兩種機(jī)器學(xué)習(xí)方法,基于Landsat8影像對呼和浩特市的不透水面進(jìn)行了提取,并利用各種抽樣比例的訓(xùn)練樣本來提取城市不透水面。結(jié)果表明,隨機(jī)森林算法的精度均優(yōu)于支持向量機(jī),且隨機(jī)森林模型對于地物的分類辨識度更高,更有利于城市不透水面的提取。然而,僅靠單一的光譜特性很難解決光譜類內(nèi)變異和“同物異譜”等問題,將給分類效果帶來影響。多特征融合則能提高地物的識別精度,獲得比單一特征提取的圖像更完整的信息。趙藝淞[8]等利用隨機(jī)森林的多特征組合方式對深圳市福田區(qū)進(jìn)行了不透水面提取,在一定程度上克服了“同物異譜”和“異物同譜”的問題,陰影區(qū)的植被和個(gè)別細(xì)微的水體信息被正確區(qū)分,且城市道路輪廓清晰,總體精度可達(dá)92%以上。唐志光[9]等基于Google Earth Engine遙感大數(shù)據(jù)平臺,以光譜特征和紋理特征集為隨機(jī)森林模型參數(shù),進(jìn)行了近30年湖南省不透水面制圖,獲得大尺度長時(shí)序的不透水面信息,并進(jìn)行了時(shí)空變化分析。
本文基于Sentinel-2影像,利用隨機(jī)森林算法對南京長江岸線不透水面進(jìn)行了提取,并分析了南京長江岸線不透水面的時(shí)空變化特征,在一定程度上揭示了社會(huì)發(fā)展與長江岸線環(huán)境保護(hù)之間的動(dòng)態(tài)變化過程,為進(jìn)一步科學(xué)合理制定沿江岸線的開發(fā)保護(hù)政策提供了依據(jù)。
隨機(jī)森林算法是Breiman L[10]在2001年結(jié)合自己的Bagging集成學(xué)習(xí)理論[11]和Ho T K[12]的隨機(jī)子空間思想創(chuàng)建的一種機(jī)器學(xué)習(xí)方法。該模型利用分類與回歸樹(CART)算法構(gòu)建森林中獨(dú)立分布的二叉樹,每顆二叉樹對樣本分類時(shí)都會(huì)進(jìn)行預(yù)測并投票,得票最多的預(yù)測結(jié)果將作為最終結(jié)果輸出。隨機(jī)森林算法作為一種抗噪能力強(qiáng)、異常值敏感度低的機(jī)器學(xué)習(xí)方法已越來越多地應(yīng)用到遙感影像分類和回歸分析中[13-14]。 隨機(jī)森林算法流程如圖1所示,每棵樹的生長過程為;
圖1 隨機(jī)森林算法流程示意圖
1)根據(jù)Bootstrap采樣方法隨機(jī)有放回地對原始訓(xùn)練集D抽樣,獲得N個(gè)具有差異性且獨(dú)立分布的新訓(xùn)練集。
2)利用N個(gè)新訓(xùn)練樣本集Dn構(gòu)造N棵CART決策樹。對于每個(gè)節(jié)點(diǎn),假設(shè)每個(gè)樣本具有M個(gè)屬性,隨機(jī)地從這M個(gè)屬性中選擇m個(gè)屬性(其中m<0<M),再通過不純度分割標(biāo)準(zhǔn)的計(jì)算結(jié)果選定最佳特征組合,進(jìn)而構(gòu)造決策樹。
3)生成的決策樹無需剪枝,根據(jù)隨機(jī)特征完整的生長。在由N棵二叉樹組成的隨機(jī)森林里,利用未抽到的樣本進(jìn)行每棵樹的預(yù)測,并根據(jù)眾多投票結(jié)果輸出最終預(yù)測結(jié)果。
影像空間分辨率的提高,雖然能使細(xì)節(jié)信息更明顯,但也會(huì)導(dǎo)致光譜類內(nèi)變異和“同物異譜”等問題。為了提高分類精度,本文選取3個(gè)光譜指數(shù)作為新波段,加入到隨機(jī)森林模型中參與分類。為了提取水體信息,可利用水體和植被在不同波段的反射率不同來構(gòu)建水體指數(shù)[15],從而達(dá)到抑制植被、增強(qiáng)水體的目的,但該指數(shù)仍無法消除房屋建筑與水體的噪聲。因此,本文選用可增強(qiáng)水體與建筑物反差的歸一化差異水體指數(shù)(MNDWI)[16]來掩膜水體信息。
歸一化植被指數(shù)(NDVI)通常作為特征參數(shù)來評估地表植被的生長情況,被廣泛應(yīng)用于植被信息提取[17-19]。本文將NDVI作為南京長江沿線綠地覆蓋狀況的主要特征參數(shù),將2016年7月1日-2017年1月1日以及2019年7月1日-2020年1月1日兩個(gè)時(shí)段內(nèi)所有去云后的Sentinel-2數(shù)據(jù)作為輔助數(shù)據(jù),計(jì)算所有影像的 NDVI值,并根據(jù)影像時(shí)間對NDVI波段進(jìn)行排序;再計(jì)算已排序的NDVI序列兩個(gè)時(shí)段內(nèi)所有NDVI的平均值,并將得到的結(jié)果作為一個(gè)特征波段,即NDVI時(shí)序數(shù)據(jù),加入到隨機(jī)森林模型中參與分類。
由于不透水面和裸土信息在可見光范圍具有相似的光譜特性,因此大多基于高分辨率影像提取的不透水面會(huì)存在與裸土信息的錯(cuò)分。本文利用二者在近紅外、Sentinel-2短波紅外1、2波段的光譜差異顯著的特征,構(gòu)建了歸一化差值不透水面指數(shù)(MNDISI)[20],從而區(qū)分不透水面與裸土。
式中,Blue、Green、Red分別為藍(lán)、綠、紅光波段;NIR、SWIR1和SWIR2分別為近紅外和短波紅外1、2波段。
南京市是我國東部長江下游的丘陵地區(qū),距長江入???47km。長江干流呈西南—東北走向穿越南京市區(qū),南京長江岸線范圍為118°28′~119°13′E、31°46′~32°14′N。長江南京段為寬窄相間的藕節(jié)狀分汊河形狀,上連馬鞍山段、下接鎮(zhèn)揚(yáng)河段,沿線約為92.3 km,是長江中下游重點(diǎn)干流河段(圖2)。結(jié)合南京長江沿線保護(hù)范圍線,由保護(hù)范圍線向陸地拓展構(gòu)建約200 m的緩沖區(qū),即為研究區(qū)范圍。
圖2 長江南京段范圍示意圖
本文采用高分辨率多光譜成像衛(wèi)星Sentinel-2的影像數(shù)據(jù),下載于美國地質(zhì)勘探局官網(wǎng)。兩景影像日期分別為2016年2月7日和2019年12月28日,影像選擇應(yīng)確保無云且天氣狀況良好,避免因季節(jié)不同而導(dǎo)致雨季和非雨季各植被類型、生長情況、水田作物收割、灌排水情況和水體水位的差異,從而提高數(shù)據(jù)的準(zhǔn)確性和有效性。
本文參照地理國情檢測云平臺土地利用分類一級分類標(biāo)準(zhǔn),結(jié)合遙感影像的目視解譯和實(shí)地考察,將研究區(qū)的土地類型劃分為城鄉(xiāng)工礦用地、綠地、水域和裸土4種,其中城鄉(xiāng)工礦用地為不透水面。針對每種地物選取具有光譜代表性的地物樣本進(jìn)行分類模型的構(gòu)建和精度驗(yàn)證。南京長江沿線流域面積較大,應(yīng)在整個(gè)研究區(qū)內(nèi)充分選擇樣本,確保每塊流域樣本包含每個(gè)地物類別信息,且在隨機(jī)森林分類過程中需不斷地對訓(xùn)練樣本和驗(yàn)證樣本進(jìn)行修正,使得訓(xùn)練和驗(yàn)證樣本既能代表地物特征又不至于使樣本選擇過多。樣本的空間分布如圖3所示。
圖3 長江南京段土地利用類型樣本空間分布
由于2016年、2019年南京長江沿線地物變化程度不是十分明顯,因此選擇一景影像進(jìn)行樣本選擇即可,但在選取樣本的過程中應(yīng)保證樣本選擇區(qū)域在2016-2019年沒有發(fā)生變化。本文利用2019年影像進(jìn)行樣本選取,需避開可能發(fā)生變化的地物,以免影響分類精度,因此不透水面樣本中少部分為工礦用地,港口碼頭幾乎沒有。本文將所選樣本集劃分為70%的模型訓(xùn)練樣本集和30%的獨(dú)立驗(yàn)證樣本集,最終共選取樣本636個(gè),其中訓(xùn)練樣本445個(gè)、驗(yàn)證樣本191個(gè),并保證樣本點(diǎn)在研究區(qū)內(nèi)均勻分布。土地利用類型樣本統(tǒng)計(jì)如表1所示。
表1 南京長江沿線土地利用類型樣本統(tǒng)計(jì)
本文基于訓(xùn)練樣本集構(gòu)建多參數(shù)隨機(jī)森林算法分類模型用于土地利用分類,同時(shí)基于隨機(jī)抽取的獨(dú)立樣本構(gòu)建混淆矩陣對結(jié)果進(jìn)行精度檢驗(yàn)。
精度評價(jià)是將分類結(jié)果與已知屬性的訓(xùn)練樣本集進(jìn)行對比分析,是對遙感分類精確性進(jìn)行評估的方法,是對分類工作好壞的評估,是遙感分類的一個(gè)不可或缺的環(huán)節(jié)[21-22]。在目前的相關(guān)研究中,普遍采用的方法是基于混淆矩陣建立的各項(xiàng)統(tǒng)計(jì)參數(shù)的位置精度檢驗(yàn)。本文選取的參數(shù)主要包括生產(chǎn)者精度、用戶精度、總體精度和Kappa系數(shù)。
3.1.1 提取結(jié)果
本文采用隨機(jī)森林算法提取了南京長江沿線地區(qū)的不透水面,結(jié)果如圖4所示。結(jié)合Sentinel-2真彩色影像對分類結(jié)果進(jìn)行分析發(fā)現(xiàn),在長江南岸主城區(qū)即人口密度最大的地區(qū)不透水面覆蓋率最高,其中圖5a為南京長江大橋區(qū)域,城市建筑覆蓋密集,不透水面主要是城鄉(xiāng)居民用地和工礦用地,可以看出該區(qū)域不透水面的整體提取效果良好,一些建筑的細(xì)節(jié)提取也較好,但仍存在極少部分裸土與不透水面混分的問題;圖5c為八卦洲濕地公園,該區(qū)域多為裸土、植被和山體,不透水面主要是建筑,可以看出隨機(jī)森林算法能將裸土、植被、山體與城鄉(xiāng)居民用地區(qū)分開,在建筑物較少的區(qū)域也可得到不錯(cuò)的提取效果;圖5e為八卦洲下游區(qū)域,北岸多為裸土、植被且有少部分工礦用地,南部主要為棲霞區(qū)工業(yè)用地和碼頭,可以看出,盡管南岸存在極小部分裸土與植被覆蓋,隨機(jī)森林算法仍能較好地提取不透水面,也可將北岸的工礦用地與植被、裸土區(qū)分開。
圖4 南京長江沿線不透水面提取結(jié)果
圖5 Sentinel-2影像與不透水面提取結(jié)果對比圖
綜上所述,隨機(jī)森林算法對于南京長江沿線的不透水面提取整體上精度良好,但經(jīng)詳細(xì)目視判別仍能發(fā)現(xiàn)極少部分裸土與不透水面混分的問題;對比Sentinel-2的真彩色影像發(fā)現(xiàn),較少的高反射率的藍(lán)色、紅色房屋無法作為不透水面被提取出來。
3.1.2 精度評價(jià)
本文從原始樣本集中隨機(jī)抽取30%的樣本建立2016年、2019年分類結(jié)果的混淆矩陣,從而進(jìn)行分類精度檢驗(yàn)。結(jié)果表明,2016年的總體精度為88.25%,Kappa系數(shù)為0.76,2019年的總體精度為90.51%,Kappa系數(shù)為0.80。本文對Sentinel-2影像進(jìn)行目視解譯,并結(jié)合高空間分辨率影像進(jìn)一步檢驗(yàn)不透水面的比例結(jié)果。結(jié)果表明,Sentinel-2 影像提取的不透水面參考數(shù)據(jù)與實(shí)際不透水面比例分布基本一致,精度能滿足不透水面提取的要求。
為了驗(yàn)證隨機(jī)森林算法提取不透水面精度的可靠性,本文利用最大似然法進(jìn)行對比實(shí)驗(yàn)。最大似然法是基于概率統(tǒng)計(jì)的一種監(jiān)督分類判別規(guī)則,在不透水面提取方面得到廣泛應(yīng)用,并取得了較好的效果。
本文以江心洲南部和綠水灣濕地公園為驗(yàn)證數(shù)據(jù),兩種方法的提取結(jié)果如圖6所示,可以看出,隨機(jī)森林算法的提取效果明顯優(yōu)于最大似然法,隨機(jī)森林算法可清晰提取道路、橋梁和田埂的輪廓,而最大似然法提取的整體輪廓非常模糊,尤其是密集房屋之間的輪廓混淆得非常嚴(yán)重,這樣不僅影響了不透水面的提取精度,而且影響了房屋建筑之間的植被提取效果。由于隨機(jī)森林算法中加入了區(qū)分裸土信息的參數(shù),因此提取結(jié)果中建筑與裸土被很好地區(qū)分開;而最大似然法則將二者混淆,嚴(yán)重影響了不透水面的提取精度。兩種方法的精度評價(jià)對比如表2所示。
表2 2016年、2019年隨機(jī)森林算法與最大似然法提取精度評價(jià)對比表
圖6 隨機(jī)森林算法與最大似然法提取結(jié)果對比圖
由實(shí)驗(yàn)結(jié)果可知,2016年、2019年的不透水面面積分別為31.231 km2和28.447 km2,整體呈減少趨勢。不透水面面積的減少在很大程度上與城市建設(shè)有關(guān),推進(jìn)城市化發(fā)展的過程雖然會(huì)導(dǎo)致居民用地的不斷擴(kuò)張,但工礦用地將隨著時(shí)間逐漸減少,從而影響了不透水面的覆蓋率。2016年、2019年不透水面和透水面的面積占比如圖7所示。
圖7 兩期不透水面和透水面的面積占比
本文利用隨機(jī)森林算法將透水面進(jìn)一步劃分為綠地、水域和裸土,并將其提取出來。通過統(tǒng)計(jì)計(jì)算得到不透水面及其相應(yīng)的面積占比,其中不透水面面積占比從9.52%下降為8.69%,呈減少趨勢,各種土地利用類型面積占比如圖8所示。
圖8 兩期不同土地利用類型面積占比
由不透水面與透水面的面積轉(zhuǎn)移矩陣(表3)可知,南京長江沿線不透水面的變化顯著,2016-2019年不透水面轉(zhuǎn)化為透水面的面積為4.06 km2。
表3 2016-2019年南京長江沿線不透水面與透水面面積轉(zhuǎn)移矩陣/km2
由于透水面可細(xì)分為綠地、水域和裸土,因此通過不透水面與其細(xì)化的土地利用類型之間的面積轉(zhuǎn)移矩陣可以更加清晰地了解不同地物之間的變化,如表4所示,可以看出,2016-2019年各地物均有不同程度的面積轉(zhuǎn)移,其中不透水面轉(zhuǎn)移為綠地的面積為3.38 km2,占總變化面積的32.3%;綠地轉(zhuǎn)移為不透水面的面積為1.16 km2,占總變化面積的11.1%;綠地轉(zhuǎn)移為水域的面積為2.61 km2,占總變化面積的24.9%。
表4 2016-2019年南京長江沿線不透水面與其他用地類型面積轉(zhuǎn)移矩陣/km2
隨著對生態(tài)環(huán)境保護(hù)重視程度的加深,2016-2019年濕地公園和自然保護(hù)區(qū)的維護(hù)效果較為顯著,面積比重持續(xù)上漲,這是南京市作為長江流域沿岸較發(fā)達(dá)的高城市化水平城市,第二產(chǎn)業(yè)向第三產(chǎn)業(yè)優(yōu)化過渡發(fā)展過程中,堅(jiān)持響應(yīng)政府退耕還林還草、退耕還濕的號召,開展沿江大保護(hù)生態(tài)工程產(chǎn)生的直接效應(yīng)。近年來,南京市從全局角度實(shí)施的濕地資源保護(hù)與開發(fā)措施,在減少耕地和工礦用地侵占長江沿岸資源上取得了顯著成效,可為其他城市的生態(tài)治理、沿江保護(hù)提供一定的借鑒。
隨著生態(tài)文明城市建設(shè),退耕還林還草、自然保護(hù)區(qū)維護(hù),大力開展?jié)竦毓珗@的建設(shè)與保護(hù)等措施緩解了很多生態(tài)問題,這也與南京長江沿線不透水面面積變化趨勢,即濕地公園面積和自然保護(hù)區(qū)面積增加、工礦用地面積減少相應(yīng)證。
南京長江沿線濕地公園不透水面的空間變化主要體現(xiàn)在新濟(jì)洲濕地公園、綠水灣濕地公園和八卦洲濕地公園,2016-2019年濕地公園中的建設(shè)用地以及正在施工的工礦用地大多已轉(zhuǎn)移為林地,新濟(jì)洲上的港口碼頭已基本撤除。為堅(jiān)持響應(yīng)政府對長江沿岸濕地中圍墾的控制,綠水灣濕地公園和八卦洲濕地公園中的部分耕地已轉(zhuǎn)移為濕地公園中的小路和建筑。南京長江沿岸自然保護(hù)區(qū)不透水面的空間變化主要體現(xiàn)在江豚保護(hù)區(qū),包括核心區(qū)、緩沖區(qū)和實(shí)驗(yàn)區(qū)3個(gè)部分,每個(gè)區(qū)域均有不同程度的變化,不透水面覆蓋面積整體呈減少趨勢,大多工礦用地轉(zhuǎn)移為濕地或綠地資源,使得保護(hù)區(qū)發(fā)揮了穩(wěn)定的生態(tài)環(huán)境調(diào)節(jié)和保護(hù)的功能。2016-2019年不透水面與透水面的轉(zhuǎn)移情況如圖9、10所示。
圖9 2016-2019年透水面轉(zhuǎn)移為不透水面
圖10 2016-2019年不透水面轉(zhuǎn)移為透水面
本文利用隨機(jī)森林算法提取了南京長江沿線2016年、2019年的不透水面,并對其進(jìn)行時(shí)空變化分析,得到的結(jié)論為;
1)該方法可滿足不透水面提取的精度需求,并能準(zhǔn)確反映不透水面的空間分布情況。
2)2016-2019 年南京長江沿線不透水面比例整體呈減少趨勢,總面積減少2.784 km2,年均減少0.928 km2。其中,以新濟(jì)洲濕地公園、綠水灣濕地公園和八卦洲濕地公園為主的濕地公園以及各自然保護(hù)區(qū)的不透水面減少趨勢最明顯,大多為工礦用地轉(zhuǎn)移為植被或水體。
3)2016-2019 年南京長江沿線南岸的不透水面主要是城市建設(shè),今后應(yīng)在沿江建設(shè)濱江生態(tài)帶,既能對生態(tài)環(huán)境進(jìn)行保護(hù),又能提升城市美觀度。
本文從不透水面比例的時(shí)空變化方面分析了南京長江沿線的發(fā)展變化規(guī)律,未來需要加強(qiáng)基于城市擴(kuò)張變化驅(qū)動(dòng)力和不透水面變化的城市環(huán)境研究。