李媛
(東華理工大學(xué) 地球科學(xué)學(xué)院,江西南昌, 330013)
稀土是世界上的稀缺資源,在航天、軍工等高科技領(lǐng)域有著重要的作用[1]。贛州市擁有豐富的離子型稀土礦,具有寶貴的開采價(jià)值,帶動當(dāng)?shù)亟?jīng)濟(jì)快速發(fā)展,但也嚴(yán)重的破壞了生態(tài)環(huán)境[2]。植被恢復(fù)是礦山生態(tài)修復(fù)的關(guān)鍵階段,植被覆蓋度是植被長勢和質(zhì)量的綜合體現(xiàn),是評價(jià)礦區(qū)復(fù)墾效果的重要指標(biāo)[3]。
傳統(tǒng)的植被覆蓋變化調(diào)查大多依靠野外實(shí)地調(diào)查,監(jiān)測范圍小且成本高。而遙感技術(shù)可快速動態(tài)的獲取地面信息且監(jiān)測范圍廣,已成為植被覆蓋變化動態(tài)監(jiān)測的重要手段[4]。在多云多雨、地形復(fù)雜的中國南方地區(qū),僅依賴Landsat TM/ETM+、MODIS等中等空間分辨率遙感數(shù)據(jù)的光譜特征難以保證分類精度[5],通過結(jié)合雷達(dá)和光學(xué)數(shù)據(jù)可有效提高地物類型的識別精度。Wang等[6]融合合成孔徑雷達(dá)數(shù)據(jù)和Sentinel-2數(shù)據(jù)來監(jiān)測美國俄克拉荷馬州本地牧場的生產(chǎn)力,與中等空間分辨率的數(shù)據(jù)源相比,本研究使用的數(shù)據(jù)具有更高的分辨率,提高了估算的精度。Scarpa等[7]首先通過數(shù)據(jù)融合和深度學(xué)習(xí)來估計(jì)在多云條件下缺失的光學(xué)特征,再用卷積神經(jīng)網(wǎng)絡(luò)估算布基納法索農(nóng)業(yè)地區(qū)SAR雷達(dá)數(shù)據(jù)和光學(xué)數(shù)據(jù)融合后的NDVI值,和單一數(shù)據(jù)源相比,光學(xué)和雷達(dá)時(shí)間序列數(shù)據(jù)的聯(lián)合處理提高了結(jié)果的精度。在監(jiān)測和評估礦山恢復(fù)治理效果時(shí),早期有研究人員利用遙感影像開發(fā)對地形、土壤、氣候和水敏感的多種植被指數(shù),作為調(diào)查植被覆蓋度的重要手段[8]。植被覆蓋度(FVC)可評估區(qū)域的植被狀況和土地退化情況,是一個(gè)非常重要的地表植被參數(shù)[9]。近年來,機(jī)器學(xué)習(xí)算法廣泛應(yīng)用于許多領(lǐng)域,如土地利用分類和植被生物量計(jì)算等[10],其中隨機(jī)森林算法運(yùn)算速度快、分類精度高,顯示出巨大的應(yīng)用潛力[11]。Schultz等[12]基于Landsat時(shí)間序列數(shù)據(jù),使用Breaks for Additive Season and Trend(BFAST)監(jiān)測器和隨機(jī)森林算法來識別卡萬戈-贊比西跨邊界保護(hù)區(qū)從封閉樹冠森林到開放草原的6個(gè)土地覆蓋類別的退化情況,及時(shí)準(zhǔn)確地獲取稀土礦區(qū)復(fù)墾后的植被覆蓋情況,對于實(shí)現(xiàn)稀土礦區(qū)綠色可持續(xù)發(fā)展十分重要。
上述研究表明,使用雷達(dá)、光譜和紋理特征的融合影像可提高稀土礦區(qū)植被信息的提取精度[13]。因此,本研究以贛州市南部6個(gè)縣市為例,結(jié)合sentinel-1和sentinel-2遙感影像,基于像元二分模型和隨機(jī)森林算法,構(gòu)建適合于南方丘陵地區(qū)稀土礦植被信息的提取模型,并且監(jiān)測2016—2020年贛州市稀土礦區(qū)的植被變化情況,該研究可以為監(jiān)測稀土礦區(qū)治理效果和政府進(jìn)行生態(tài)環(huán)境管理決策提供科學(xué)依據(jù)。
稀土礦廣泛分布在贛州市的安遠(yuǎn)縣、全南縣、尋烏縣、定南縣、信豐縣和贛縣。因此,本文以這6個(gè)縣作為研究區(qū)域。研究區(qū)域?qū)儆趤啛釒Ъ撅L(fēng)氣候,光照充足,雨水充沛,無霜期長,年平均降水量1 318 mm,年均氣溫為19.8℃,地理位置如圖1。地形復(fù)雜,主要以山地和丘陵為主。研究區(qū)擁有豐富的離子型稀土礦,被譽(yù)為“稀土王國”,從上世紀(jì)八十年代開始進(jìn)行稀土開采,經(jīng)歷了池浸、堆浸和原地浸出等開采方式,造成了植被破壞、土壤污染和水土流失,加劇了地下水的污染和滑坡的風(fēng)險(xiǎn)。近年來,很多稀土礦陸續(xù)開展了治理工作,并取得了一定的成效,地表植被逐漸增多,生態(tài)功能逐漸恢復(fù)。
圖1 研究區(qū)概況
本研究采用2016—2020年共5年的基于Sentinel-1干涉寬幅模式(IW)的地距(Ground Range Detected,GRD)極化雷達(dá)影像數(shù)據(jù),因贛州市常年多雨,影像采集時(shí)間集中在10—12月,該數(shù)據(jù)擁有VH、VV 2種極化方式,數(shù)據(jù)質(zhì)量較高。利用官方預(yù)處理軟件SNAP對選用的Sentinel-1影像數(shù)據(jù)進(jìn)行預(yù)處理,并裁剪出研究區(qū)[14]。
Sentinel-2包括Sentinel-2A/2B兩顆衛(wèi)星,攜帶一致的MSI傳感器,收集13個(gè)波段的數(shù)據(jù),其中4個(gè)是紅邊波段,2個(gè)是短波紅外波段,廣泛應(yīng)用于陸地植被、土壤、水體等的監(jiān)測[15]。本研究采用與Sentinel-1同一時(shí)間段匹配的Sentinel-2數(shù)據(jù),對其進(jìn)行大氣校正、輻射定標(biāo)和重采樣,裁剪出研究區(qū)[16]。
研究區(qū)域目前主要用堆浸法和原地浸礦法進(jìn)行稀土開采,這會形成不規(guī)則的裸露開采區(qū),其在Google高分影像中呈土黃色,可能會伴有藍(lán)色的沉淀池和長方形建筑物。本研究根據(jù)野外的調(diào)研結(jié)果,以及在Google Earth目視解釋的稀土礦區(qū)分布范圍,勾繪稀土礦區(qū)邊界。
NDVI(Normalized Difference Vegetation Index)是定量評價(jià)植被覆蓋度最常用的指標(biāo)之一,可用來監(jiān)測植被生長狀態(tài)。用像元二分模型將像元信息分為裸土或純植被,計(jì)算植被覆蓋度[17]。其公式為:
式中,NDVIsoil為完全裸土或無植被覆蓋區(qū)域的NDVI值;NDVIveg則代表完全被植被所覆蓋的像元NDVI值,即純植被像元的NDVI值[18]。針對贛南稀土礦區(qū)植被恢復(fù)現(xiàn)狀和植被覆蓋度的特征,結(jié)合野外考察和建立的植被覆蓋度等級(表1),本研究將FVC共劃分4級:裸地(0≤FVC<0.25)、低植被覆蓋(0.25≤FVC<0.5)、中等植被覆蓋(0.5≤FVC<0.75)和高植被覆蓋(0.75≤FVC<1)。
表1 贛南稀土礦區(qū)不同植被恢復(fù)程度的土地類型劃分
1.5.1 隨機(jī)森林算法 機(jī)器學(xué)習(xí)分類法指通過計(jì)算機(jī)從大量的數(shù)據(jù)中學(xué)習(xí)其內(nèi)在的規(guī)律性信息,獲得經(jīng)驗(yàn)知識,在復(fù)雜的數(shù)據(jù)中分離出圖像的主要特征,機(jī)器學(xué)習(xí)分類法適用于多種傳感器獲取的圖像,并且具有較高的精度[19]。隨機(jī)森林是一個(gè)監(jiān)督分類器,使用一組分類和回歸樹,利用隨機(jī)選擇的訓(xùn)練樣本和變量的子集進(jìn)行預(yù)測,隨機(jī)森林分類器使用隨機(jī)選擇的特征來生長一棵樹,通過從森林中所有的樹狀預(yù)測器中選取最受歡迎的投票類別來對像素進(jìn)行分類[20]。與其他機(jī)器學(xué)習(xí)方法(如人工神經(jīng)網(wǎng)絡(luò)等)相比,運(yùn)行隨機(jī)森林需要指定的參數(shù)較少,同時(shí),隨機(jī)森林已被越來越多的用于遙感領(lǐng)域的圖像分類,且具有較高的效率和準(zhǔn)確率[21]。
1.5.2 特征變量提取 為了提高分類的精度,提取雷達(dá)影像中的極化特征,以及光學(xué)影像中的光譜特征和紋理特征,進(jìn)行波段融合[22]。為充分利用Sentinel-2特有的紅邊波段,通過Band maths波段計(jì)算獲取Sentinel-2的紅邊指數(shù)和植被指數(shù)[23](表2)。
表2 特征變量說明
1.5.3 建立植被覆蓋度分類的解譯標(biāo)志 贛州市屬于南方紅壤丘陵區(qū),根據(jù)《南方紅壤丘陵山區(qū)水土流失綜合治理技術(shù)標(biāo)準(zhǔn)》(SL757—2014)[24]、實(shí)地調(diào)研情況和Google Earth高分影像,通過歷史影像對比和直觀解讀來確立不同植被覆蓋度的解譯標(biāo)志,并以此作為稀土礦植被覆蓋度分類的標(biāo)準(zhǔn)。
1.5.4 精度評價(jià)指標(biāo) 研究利用融合后的影像,采用像元二分模型和隨機(jī)森林算法,提取稀土礦植被覆蓋的分類結(jié)果,并對結(jié)果做聚類處理去除零碎斑塊,使用混淆矩陣計(jì)算總體精度和Kappa系數(shù)對分類結(jié)果進(jìn)行精度評價(jià)[25]。總體精度公式如下:
式中,PC為總分類精度;m為分類類別數(shù);N為樣本總數(shù)。Pkk為第k類的判對樣本數(shù)。
Kappa系數(shù)公式如下:
式中,K為Kappa系數(shù);N為總樣本數(shù);Ppi為某一類所在列總數(shù);Pli為某一類所在行總數(shù)。
基于像元二分模型和隨機(jī)森林算法得到的植被覆蓋度分類結(jié)果如圖2、圖3所示。由此可以看出,分類后稀土礦區(qū)裸地類型的空間分布基本一致,整個(gè)贛南6縣稀土礦區(qū)主要以低植被覆蓋和中等植被覆蓋為主,植被覆蓋程度較低的地區(qū)主要集中在尋烏縣和龍南縣。從各個(gè)縣的情況來看,贛縣的稀土礦區(qū)數(shù)量較少,空間分布較為分散,自礦區(qū)復(fù)墾以來,贛縣稀土礦區(qū)的植被逐漸恢復(fù),幾乎所有稀土礦區(qū)都已復(fù)綠。信豐縣和安遠(yuǎn)縣的稀土礦區(qū)相對贛縣來說,數(shù)量較多,空間分布相對集中,從政府積極推廣礦山治理以來,大部分稀土礦區(qū)的植被恢復(fù)情況良好,植被覆蓋率增加,但仍有大面積的裸地,容易引起水土流失和山體滑坡等自然災(zāi)害,需要盡快治理。定南縣和龍南縣稀土礦的數(shù)量很多,空間分布集中且開采面積較小,在2002年以后,改進(jìn)采礦方式,基本采用原地浸礦工藝,這種工藝對地表植被的破壞較小。定南縣自2009年大規(guī)模開展稀土礦區(qū)綜合治理以來,礦區(qū)植被大面積恢復(fù)。尋烏縣稀土礦開采面積較大且分布集中,自稀土礦停止開采以來,尋烏縣積極對礦區(qū)進(jìn)行綜合治理與生態(tài)修復(fù),取得了顯著的成效,柯樹塘礦、雙茶亭礦以及周圍的礦區(qū)基本實(shí)現(xiàn)全面復(fù)綠,恢復(fù)了生態(tài)功能。老鴉橋和石角里等稀土礦區(qū)沒有采用生態(tài)恢復(fù)措施,而是將土地平整后建設(shè)為工業(yè)園區(qū)等建設(shè)用地??傮w來說,礦區(qū)復(fù)墾和稀土礦開采工藝的改進(jìn)使礦區(qū)的植被恢復(fù)效果較好。
在圖像上隨機(jī)選取400個(gè)樣點(diǎn),結(jié)合調(diào)查數(shù)據(jù)和Google Earth高分辨率數(shù)據(jù),確認(rèn)樣點(diǎn)的屬性,將其分別與本文提出的像元二分模型和隨機(jī)森林算法提取的植被信息相比較,生成2020年稀土礦區(qū)植被覆蓋度分類精度評價(jià)混淆矩陣,來反映2種模型的優(yōu)劣。像元二分模型的總體精度為81.37%,Kappa系數(shù)為0.78,隨機(jī)森林算法的總體精度為89.86%,Kappa系數(shù)為0.83,隨機(jī)森林算法在稀土礦區(qū)植被覆蓋度分類結(jié)果的精度明顯優(yōu)于像元二分模型。2種方法在高植被覆蓋區(qū)域的提取效果差異較小,而隨機(jī)森林算法在裸地、低植被覆蓋區(qū)域和中等植被覆蓋區(qū)域上分類精度較高。
對比圖2和圖3筆者發(fā)現(xiàn),與像元二分模型相比,隨機(jī)森林算法得到的分類結(jié)果能更詳細(xì)反映稀土礦區(qū)的植被信息,各種地物之間的界限也更加清晰,分類結(jié)果更為細(xì)致明顯。根據(jù)分類結(jié)果,結(jié)合同時(shí)期的Google高分影像對比發(fā)現(xiàn),裸地主要集中在稀土礦點(diǎn)開發(fā)區(qū)域,呈連片分布,稀土礦開采造成的尾砂分布范圍和水土流失區(qū)域在分類結(jié)果上得到了很好體現(xiàn),表明稀土礦開采引起的裸露地表和尾砂區(qū)域是礦區(qū)植被覆蓋度很低的主要原因。低植被覆蓋區(qū)域主要集中在稀土礦區(qū)內(nèi)的耕地及果園,自稀土礦停止開采以來,贛州市政府做了大量的礦山治理工作,在礦區(qū)內(nèi)種植臍橙、百香果、油茶等經(jīng)濟(jì)作物。中等植被覆蓋區(qū)域和高植被覆蓋區(qū)域,主要由大量林地、灌木組成,這些區(qū)域進(jìn)行礦區(qū)復(fù)墾工作較早,植被恢復(fù)效果很好。
圖2 像元二分模型分類結(jié)果圖
圖3 隨機(jī)森林算法分類結(jié)果圖
像元二分模型和隨機(jī)森林算法在提取稀土礦區(qū)植被覆蓋分類的適用性上存在一定的差異。像元二分模型把1個(gè)像元只劃分為2種地物,即植被和裸地,通過對端元的光譜測定,計(jì)算其豐度。但是,實(shí)際情況是1個(gè)像元可能包括多種地物,因此該方法不適用于復(fù)雜的植被覆蓋度分類,只能滿足簡單的土地覆蓋情況[26]。而基于多種特征的隨機(jī)森林算法可以綜合利用影像的光譜、紋理和雷達(dá)特征,雷達(dá)波段可以穿透冠層獲取植被信息,且對地表的起伏變化很敏感,主要通過微波在植物表面以及內(nèi)部的反射和散射來獲取植物信息,因此可以很好的識別出植被[27]。而sentinel-2新增的3個(gè)紅邊波段能夠較準(zhǔn)確地反映出不同植被覆蓋類別的光譜特征差異,紋理特征的加入可以有效地改善分類效果,因此,多源數(shù)據(jù)融合與隨機(jī)森林算法相結(jié)合可以提高稀土礦區(qū)植被覆蓋度分類的精度。但是,Sentinel高分辨率影像數(shù)據(jù)仍然存在“混合像元”的問題,在不同地物類型的交界處,混合地物類型劃分不準(zhǔn)確。在使用隨機(jī)森林算法時(shí),稀土礦區(qū)植被覆蓋分類評價(jià)體系繁多、指標(biāo)多樣,具體如何劃分稀土礦區(qū)的植被恢復(fù)程度還沒有統(tǒng)一的標(biāo)準(zhǔn)。在研究過程中,由于一定的因素限制,沒有更加細(xì)致全面考慮影響植被覆蓋度的多種因素,從而導(dǎo)致2種方法下的分類結(jié)果存在差異。
贛南礦區(qū)屬于典型的亞熱帶季風(fēng)濕潤氣候,植被類型豐富,降水充沛,植物生長周期快。因此,構(gòu)建中高分辨率的遙感數(shù)據(jù)時(shí)間序列,對于提高監(jiān)測效率具有重要意義。由于哨兵數(shù)據(jù)系列在2015年才開始使用,筆者選取了2016—2020年的Sentinel-1和Sentinel-2數(shù)據(jù),通過隨機(jī)森林算法提取稀土礦區(qū)的植被覆蓋信息,在統(tǒng)一的尺度上研究了近5年來稀土礦區(qū)植被覆蓋情況的時(shí)空演變規(guī)律,分析了不同時(shí)期的植被覆蓋變化,結(jié)果見表3和圖4。
表3和圖4顯示,在2016—2020年期間,裸地面積在不斷的減少,共減少了1 467 hm2,總體比例下降了24.23%??偟膩碚f,植被覆蓋面積是在不斷增加的,在2020年低植被覆蓋區(qū)域面積為2 026hm2,在研究區(qū)中所占的比例最大,達(dá)到33.48%。高植被覆蓋區(qū)域先逐漸增加,在2017年面積達(dá)到最高,為734 hm2,后有所下降,至2020年,高植被覆蓋區(qū)域面積為520 hm2,在稀土礦區(qū)中所占的比例為8.60%。在2013年之后,贛州市政府建立了規(guī)范有序的稀土資源開采技術(shù)和流程,限制了開采范圍和規(guī)模,為遏制生態(tài)環(huán)境的惡化,政府投入大量資本進(jìn)行礦山土地復(fù)墾,并對稀土礦進(jìn)行針對性的治理,大部分稀土礦的整體恢復(fù)情況良好,稀土礦區(qū)的裸地面積在明顯減少,植被面積在不斷地增加。由于大多數(shù)的稀土礦停止開采,為了解決失業(yè)問題,政府大力推廣當(dāng)?shù)鼐用裨趶U棄的稀土礦區(qū)種植臍橙、油茶和百香果等經(jīng)濟(jì)作物,緩解當(dāng)?shù)氐慕?jīng)濟(jì)壓力。由于礦區(qū)生態(tài)環(huán)境惡劣,治理過程緩慢,需要較長時(shí)間才能恢復(fù),尚未恢復(fù)到開采前的水平,目前主要以低植被覆蓋為主。
圖4 贛南稀土礦不同時(shí)期植被覆蓋面積變化
表3 贛南稀土礦不同時(shí)期植被覆蓋面積統(tǒng)計(jì)
對不同時(shí)期各縣稀土礦區(qū)植被覆蓋面積的統(tǒng)計(jì)結(jié)果表明(圖5),2016—2020年,贛南6縣稀土礦的植被恢復(fù)面積呈逐漸增加的態(tài)勢,共增加了4 254 hm2。從各個(gè)縣情況來看,裸地面積都呈下降趨勢,其中贛縣裸地減少的比例最大,為47.86%;龍南縣裸地減少的比例最小,為8.21%。從植被恢復(fù)情況來看,安遠(yuǎn)縣、尋烏縣和贛縣的植被增加的比例較多,恢復(fù)效果較好。贛縣是贛州市最早開始稀土礦治理工作的縣區(qū),當(dāng)?shù)卣紫葘ο⊥灵_采后留下的裸露地表進(jìn)行土地平整,再種植可富集稀土元素的寬葉雀稗、鐵芒萁等植物進(jìn)行土壤改良,改善稀土礦區(qū)及周邊的生態(tài)環(huán)境。因此,稀土礦區(qū)的植被恢復(fù)效果很好。而龍南縣的植被恢復(fù)效果較差,原因是龍南縣有許多稀土礦仍在開采,雖然已經(jīng)采用原地浸礦工藝,對地表植被的破壞較少,但還是會破壞土壤的酸堿平衡,使植被難以恢復(fù),并且人工治理的面積不大,主要靠自然恢復(fù)??傮w來看,贛南6縣各縣區(qū)的植被恢復(fù)情況整體效果較好。
本研究以贛南6縣的稀土礦區(qū)為例,研究稀土礦區(qū)植被覆蓋度的提取方法以及監(jiān)測礦區(qū)的植被恢復(fù)效果,得到如下結(jié)論:
(1)與以往的稀土礦區(qū)植被覆蓋信息提取的研究來比,本研究選用的數(shù)據(jù)源具有更高的分辨率,稀土礦區(qū)植被覆蓋度的分類結(jié)果顯示,像元二分模型和隨機(jī)森林算法提取的植被覆蓋區(qū)域在空間分布上大致相同,說明利用像元二分模型對稀土礦區(qū)的植被恢復(fù)度分類信息提取具有一定的可行性,但是隨機(jī)森林算法具有更高的精度,能夠更加細(xì)致的反映稀土礦區(qū)植被覆蓋的實(shí)際情況。
(2)在隨機(jī)森林算法中加入雷達(dá)特征、光譜特征和紋理特征后可以提高稀土礦區(qū)植被覆蓋度分類結(jié)果的精度,能夠有效地區(qū)分和統(tǒng)計(jì)不同植被恢復(fù)程度的稀土礦。此外,隨機(jī)森林算法可以從圖像中學(xué)習(xí)其他特征,并評估選定的特征參數(shù)在植被覆蓋度分類中的重要性,與像元二分模型相比,隨機(jī)森林算法的結(jié)果更加準(zhǔn)確。整體而言,這一研究結(jié)果和方法有利于對離子型稀土礦區(qū)植被恢復(fù)程度進(jìn)行定量監(jiān)測與分析。
(3)贛南6縣的稀土礦開采規(guī)模較大,并且多以堆浸法為主要的開采工藝,該工藝對地表植被的破壞很大,在國家管控稀土礦無序開采之后,各個(gè)縣區(qū)稀土礦的植被恢復(fù)效果整體較好,植被覆蓋率較高。并且近年來贛州市政府積極實(shí)施綠色生態(tài)修復(fù)工程,稀土礦區(qū)的植被恢復(fù)速度大大加快,原先裸露的地表大部分都已經(jīng)轉(zhuǎn)化為植被覆蓋區(qū),有的區(qū)域甚至恢復(fù)到稀土礦未開采前的植被覆蓋狀態(tài)??傮w來說,贛南6縣的稀土礦區(qū)治理效果較好。