李夢(mèng)潔, 張曼胤**, 崔麗娟, 王賀年, 郭子良, 李 偉, 魏圓云, 楊 思, 龍頌元
?
基于連續(xù)小波變換和隨機(jī)森林的蘆葦葉片汞含量反演*
李夢(mèng)潔1,3, 張曼胤1,3**, 崔麗娟1,2, 王賀年1,3, 郭子良1,3, 李 偉1,2, 魏圓云1,3, 楊 思1,3, 龍頌元1,3
(1. 中國林業(yè)科學(xué)研究院濕地研究所/濕地生態(tài)功能與恢復(fù)北京市重點(diǎn)實(shí)驗(yàn)室 北京 100091; 2. 北京漢石橋濕地生態(tài)系統(tǒng)國家定位觀測(cè)研究站 北京 101399; 3. 河北衡水湖濕地生態(tài)系統(tǒng)國家定位觀測(cè)研究站 衡水 053000)
植物重金屬污染是當(dāng)今世界面臨的重大生態(tài)環(huán)境問題之一, 高光譜技術(shù)為快速、大面積監(jiān)測(cè)植被重金屬含量提供了可能性。本研究以重金屬汞(Hg)和濕地植物蘆葦為研究對(duì)象, 采用連續(xù)小波變換(CWT)和隨機(jī)森林(RF)算法相結(jié)合的方法建立蘆葦葉片總汞含量反演模型, 以期尋求一種較為精準(zhǔn)的植物汞污染反演模型, 未來可通過高光譜技術(shù)建立模型來無損、快速估測(cè)濕地植物重金屬汞污染情況, 為濕地生態(tài)系統(tǒng)的監(jiān)測(cè)提供方法支持。結(jié)果表明: 蘆葦葉片總汞含量敏感波段主要分布在可見光波段419~522 nm、664~695 nm和724~876 nm以及近紅外波段1 450~1 558 nm和1 972~2 500 nm; 經(jīng)CWT變換后, 小波系數(shù)與葉片總汞含量的相關(guān)系數(shù)絕對(duì)值提高0.04~0.18, 所構(gòu)建的預(yù)測(cè)反演模型擬合效果2提高0.107~0.177, 模型精度RMSE提高0.008~0.013, 其中利用經(jīng)小波變換的去包絡(luò)線光譜(CR-CWT)數(shù)據(jù)建立的RF模型對(duì)蘆葦葉片總汞含量的反演精度和擬合效果最優(yōu)(2=0.713, RMSE=0.127); 同時(shí)在土壤總汞含量約為20 mg×kg-1時(shí), 采用CR-CWT數(shù)據(jù)構(gòu)建RF模型的方法來反演蘆葦葉片總汞含量更為準(zhǔn)確和可靠(2=0.825, RMSE=0.051)。因此, 利用RF算法進(jìn)行植被重金屬含量的反演具有一定的現(xiàn)實(shí)可行性, 而結(jié)合CWT后所構(gòu)建的反演模型對(duì)指導(dǎo)植被重金屬含量監(jiān)測(cè)更具參考價(jià)值, 應(yīng)用前景廣闊。
連續(xù)小波變換; 隨機(jī)森林; 高光譜; 重金屬汞; 蘆葦葉片
植物重金屬污染是當(dāng)今世界面臨的重大生態(tài)環(huán)境問題之一, 具有范圍廣、對(duì)象多的特點(diǎn)。傳統(tǒng)的植被重金屬污染監(jiān)測(cè)多以現(xiàn)場(chǎng)點(diǎn)采樣調(diào)查的方法進(jìn)行, 這種方法需在試驗(yàn)區(qū)設(shè)置足夠密度的采樣點(diǎn), 采集足夠的樣本進(jìn)行生物、化學(xué)分析以判斷污染程度。這不僅費(fèi)時(shí)費(fèi)力、難以大范圍應(yīng)用, 而且不能及時(shí)發(fā)現(xiàn)程度較輕的重金屬污染, 容易造成重金屬累積。因此, 快速、大面積監(jiān)測(cè)植被重金屬含量一直是國際性難題和重點(diǎn)研究問題[1-2]。
20世紀(jì)80年代興起的高光譜技術(shù)為快速、精準(zhǔn)地判斷植被重金屬污染提供了可能性。目前, 國內(nèi)外已有許多學(xué)者致力于研究植被重金屬含量的高光譜監(jiān)測(cè), 通過提取重金屬污染下植被高光譜敏感參數(shù), 建立模型來估測(cè)植被重金屬的污染情況。提取敏感光譜參數(shù)的方法有多種?,F(xiàn)階段, 研究者們多通過簡(jiǎn)單的光譜變換技術(shù)、連續(xù)統(tǒng)去除法提取可有效指示植被重金屬污染信息的“三邊”、吸收谷等敏感光譜參數(shù)[3-4]; 或嘗試多種可表征植物葉綠素、水分等生化組分含量的植被指數(shù)對(duì)特定重金屬污染進(jìn)行指示[5-7]; 此外還有學(xué)者利用經(jīng)離散小波變換的小波分形維數(shù)、小波奇異性等數(shù)據(jù)對(duì)鎘、鋅重金屬脅迫下的水稻()葉片及冠層重金屬含量進(jìn)行了估算[8-9]。所構(gòu)建的反演模型多為單變量回歸模型、多元逐步回歸模型、主成分回歸模型、偏最小二乘模型等經(jīng)驗(yàn)或半經(jīng)驗(yàn)?zāi)P蚚10-11], 以及人工神經(jīng)網(wǎng)絡(luò)及支持向量機(jī)模型[12-15]。這些模型不僅需要較多的訓(xùn)練集, 而且很容易過度擬合。本研究采用連續(xù)小波變換(continuous wavelet transform, CWT)和機(jī)器學(xué)習(xí)算法中的隨機(jī)森林(random forest, RF)算法相結(jié)合的方法進(jìn)行模型構(gòu)建。其中, CWT在表征光譜信號(hào)上比離散小波變換更加清晰[16], 而RF算法不僅具有較強(qiáng)的擬合能力, 不會(huì)產(chǎn)生過度擬合, 還具有較快的訓(xùn)練速度, 對(duì)高光譜數(shù)據(jù)這類大數(shù)據(jù)集的計(jì)算效率較高, 在模型構(gòu)建方面優(yōu)于其他算法[17]。
本研究以重金屬汞和濕地植物蘆葦()為研究對(duì)象, 采用一階導(dǎo)數(shù)變換法、包絡(luò)線去除法以及連續(xù)小波變換對(duì)蘆葦葉片原始光譜反射率(reflectance, R)進(jìn)行變換, 得到一階導(dǎo)數(shù)光譜(first derivative spectral reflectance, FD)、去包絡(luò)線光譜(continuum removal reflectance, CR), 根據(jù)閾值提取相關(guān)性強(qiáng)的R、FD、CR敏感波段和經(jīng)小波變換的原始光譜反射率(R-CWT)、經(jīng)小波變換的一階導(dǎo)數(shù)光譜(FD-CWT)、經(jīng)小波變換的去包絡(luò)線光譜反射率(CR-CWT)小波系數(shù), 利用RF算法建立蘆葦葉片汞含量反演模型, 促進(jìn)了高光譜技術(shù)在植被重金屬監(jiān)測(cè)方面的應(yīng)用。
試驗(yàn)設(shè)置8個(gè)汞濃度梯度, 分別為0 mg×kg-1(CK)、10 mg×kg-1、20 mg×kg-1、40 mg×kg-1、60 mg×kg-1、80 mg×kg-1、100 mg×kg-1、160 mg×kg-1, 處理代號(hào)為Hg(CK)、Hg(10)、Hg(20)、Hg(40)、Hg(60)、Hg(80)、Hg(100)、Hg(160), 每個(gè)濃度梯度3次重復(fù)。2017年4月3日, 按設(shè)計(jì)濃度將HgCl2溶液注入盛有營養(yǎng)土的玻璃缸中攪拌均勻, 同時(shí)注水至土壤飽和并覆蓋塑料薄膜防止汞蒸氣揮發(fā), 靜置1周后每個(gè)玻璃缸內(nèi)種植20 cm高蘆葦20株, 保持5 cm水層進(jìn)行植物培養(yǎng)。每培養(yǎng)1個(gè)月采集1次蘆葦葉片光譜信息, 測(cè)定蘆葦葉片總汞含量, 共采集7次。同時(shí), 為保證土壤總汞含量與試驗(yàn)設(shè)計(jì)基本一致, 在試驗(yàn)前后采集土壤并測(cè)定土壤總汞含量。
采用美國ASD(Analytical Spectral Devices)公司FieldSpec 4便攜式地物波譜儀(波譜范圍為350~2 500 nm)測(cè)量蘆葦葉片高光譜數(shù)據(jù), 為減少外界因素干擾, 選取健康、生長(zhǎng)良好的葉片, 使用葉片夾進(jìn)行葉片光譜的測(cè)定, 測(cè)定時(shí)保證葉片表面完全展開, 避開葉片中部葉脈, 至多每20 min進(jìn)行1次白板優(yōu)化。每個(gè)樣本保存40條光譜, 求取平均值作為該樣本的光譜數(shù)據(jù)。
對(duì)測(cè)量過光譜數(shù)據(jù)的葉片, 于實(shí)驗(yàn)室內(nèi)洗凈烘干, 采用硝酸水浴消解-冷原子熒光光譜法[18]測(cè)定葉片總汞含量, 采用分光光度計(jì)測(cè)定葉片葉綠素a含量。為保證建模樣本的數(shù)量, 將各汞處理濃度下的葉片樣本進(jìn)行整合后分組。選用Kennard-Stone(K-S)算法計(jì)算出各葉片樣本總汞含量之間的歐氏距離, 篩選建模集樣本101個(gè), 檢驗(yàn)集樣本68個(gè)(表1)。
表1 葉片總汞含量描述性統(tǒng)計(jì)特征
本文對(duì)原始光譜反射率(R)采用的光譜變換方法有一階導(dǎo)數(shù)光譜(FD)、去包絡(luò)線光譜(CR)以及連續(xù)小波變換(CWT)。其中, CWT是一種線性變換方法, 通過小波基函數(shù)將葉片高光譜數(shù)據(jù)分解為不同尺度上的一系列小波系數(shù), 其變換公式為[19]:
其中:
式中:(,)為小波變換結(jié)果,()為葉片高光譜反射率數(shù)據(jù),為光譜波段(350~2 500 nm),Ψ, b()為小波基函數(shù),為尺度因子,為平移因子。小波系數(shù)包含和兩維, 分別是分解尺度(= 1, 2, …,)和波段(= 1, 2, …,)組成的×矩陣。由此, CWT將一維葉片高光譜數(shù)據(jù)轉(zhuǎn)換為二維小波系數(shù), 通過與葉片總汞含量進(jìn)行相關(guān)性分析, 即可得出最優(yōu)分解尺度。
采用隨機(jī)森林(RF)算法建立蘆葦葉片總汞含量反演模型。RF是Breiman[20]提出的一種基于分類回歸樹模型的集成學(xué)習(xí)算法, 具有高效處理大樣本數(shù)據(jù)、不必?fù)?dān)心過擬合、可估計(jì)某個(gè)特征變量以及抗噪音等特點(diǎn)。RF利用bootsrap重抽樣方法從原始樣本中抽取多個(gè)樣本, 對(duì)每個(gè)bootsrap樣本進(jìn)行決策樹建模, 最后組合多棵決策樹的預(yù)測(cè), 通過投票得出最終預(yù)測(cè)結(jié)果[21]:
式中:()為組合分類模型,h為單個(gè)決策樹分類模型,為輸出變量,為示性函數(shù)。
模型精度檢驗(yàn)選取決定系數(shù)2、均方根誤差RMSE以及1∶1線3個(gè)參數(shù)衡量。其中, 1∶1線表示實(shí)測(cè)值和預(yù)測(cè)值所構(gòu)成的點(diǎn)偏離=線的程度。
對(duì)不同程度汞污染下的土壤及蘆葦葉片總汞含量進(jìn)行分析(表2、表3)可知: 在試驗(yàn)周期中土壤總汞含量沒有發(fā)生顯著變化; 蘆葦葉片總汞含量隨著土壤總汞含量的增加而升高, 與土壤總汞含量呈極顯著正相關(guān); 蘆葦葉片葉綠素a含量隨著土壤總汞含量的增加而降低, 與土壤總汞含量呈極顯著負(fù)相關(guān)。表明不同土壤汞濃度處理引起蘆葦葉片總汞含量及葉綠素a含量的變化。同時(shí), 蘆葦葉片總汞含量與葉綠素a含量呈極顯著負(fù)相關(guān)。
表2 不同程度Hg污染水平下土壤總汞含量及蘆葦葉片總汞含量和葉綠素a含量
表3 土壤總汞、葉片總汞及葉綠素a含量的相關(guān)性分析
**<0.01
將R、FD以及CR 3種形式的高光譜反射率與蘆葦葉片總汞含量進(jìn)行相關(guān)性分析以篩選汞敏感波段, 結(jié)果如圖1所示。分析可知, R相關(guān)曲線較為平緩, 在可見光波段419~522 nm、664~695 nm和724~876 nm與蘆葦葉片總汞含量存在顯著正相關(guān)(<0.01), 正相關(guān)系數(shù)最大可達(dá)0.43; 在近紅外波段1 450~1 558 nm和1 972~2 500 nm存在顯著負(fù)相關(guān)(<0.01), 負(fù)相關(guān)系數(shù)最大可達(dá)-0.51。經(jīng)一階導(dǎo)數(shù)和去包絡(luò)線處理后, 相關(guān)曲線波動(dòng)較大, 敏感波段增加且分布零散, 光譜數(shù)據(jù)與葉片總汞含量的正負(fù)相關(guān)系數(shù)均有不同程度提高, 其中FD正相關(guān)系數(shù)最大可達(dá)0.60, 負(fù)相關(guān)系數(shù)最大可達(dá)-0.68, CR正相關(guān)系數(shù)最大可達(dá)0.40, 負(fù)相關(guān)系數(shù)最大可達(dá)-0.67。為保證建模效果, 選取相關(guān)系數(shù)絕對(duì)值大于0.5的波段用于模型構(gòu)建。
選取Mexican Hat函數(shù)作為小波基函數(shù)[19,22], 對(duì)葉片建模樣本的R、FD、CR曲線進(jìn)行CWT變換分解, 分解尺度為21、22、23、24、25、26、27、28、29、210, 即1~10個(gè)尺度。將變換后的10尺度的小波系數(shù)與葉片總汞含量進(jìn)行相關(guān)性分析, 得到相關(guān)系數(shù)圖(圖2), 圖中紅色區(qū)域表示相關(guān)性強(qiáng)的波段。經(jīng)CWT處理后, 各尺度小波系數(shù)與葉片總汞含量的相關(guān)系數(shù)均有不同程度的提升, 其中R-CWT最大相關(guān)系數(shù)絕對(duì)值可達(dá)-0.69, DR-CWT最大相關(guān)系數(shù)絕對(duì)值可達(dá)0.72, CR-CWT最大相關(guān)系數(shù)絕對(duì)值可達(dá)0.74。
為更好地篩選敏感小波系數(shù), 進(jìn)一步繪制決定系數(shù)圖, 如圖3所示。從圖中可知, R-CWT與蘆葦葉片總汞含量相關(guān)性較好的波段主要集中在772~884 nm、1 206~1 235 nm、1 478~1 618 nm、2 042~2 148 nm以及2 316~2 361 nm, 并在821 nm、1 225~1 226 nm、1 508 nm、2 080 nm以及2 321 nm達(dá)到最大值, 對(duì)應(yīng)的尺度分別為第3、4、2、2和4尺度; FD-CWT與蘆葦葉片總汞含量相關(guān)性較好的波段主要集中在648~ 650 nm、782~820 nm、824~855 nm、1 377~1 378 nm以及2 299~2 499 nm, 并在649 nm、811 nm、835~838 nm、1 378 nm以及2 303 nm達(dá)到最大值, 對(duì)應(yīng)的尺度為第2、3、4、1和4尺度; CR-CWT與蘆葦葉片總汞含量相關(guān)性較好的波段主要集中在775~834 nm、841~874 nm、1 103~1 143 nm、1 188~1 238 nm、1 273~1 386 nm以及2 286~2 365 nm, 并在820~821 nm、850~851 nm、1 127 nm、1 225 nm、1 320~1 321 nm、1 363~1 364 nm以及2 291 nm達(dá)到最大值, 對(duì)應(yīng)的尺度為第3、3、6、4、7、6和3尺度。將篩選出的小波系數(shù)用于模型構(gòu)建。
圖1 蘆葦葉片總汞含量與原始光譜反射率(a)、一階導(dǎo)數(shù)光譜(b)、去包絡(luò)線光譜(c)的相關(guān)性分析
圖2 原始光譜小波系數(shù)(a)、一階導(dǎo)數(shù)光譜小波系數(shù)(b)、去包絡(luò)線光譜小波系數(shù)(c)與蘆葦葉片總汞含量的相關(guān)系數(shù)圖
圖3 原始光譜小波系數(shù)(a)、一階導(dǎo)數(shù)光譜小波系數(shù)(b)、去包絡(luò)線光譜小波系數(shù)(c)小波系數(shù)與蘆葦葉片總汞含量的決定系數(shù)圖
依據(jù)上述分析, 選取R、FD、CR與葉片總汞含量顯著相關(guān)(>0.05,<0.01)的敏感波段以及R-CWT、FD-CWT、CR-CWT與葉片總汞含量顯著相關(guān)的小波系數(shù)為自變量, 葉片總汞含量為因變量, 采用RF方法構(gòu)建反演模型, 結(jié)果如表4所示。
表4 蘆葦葉片總汞反演模型的建模集和預(yù)測(cè)集結(jié)果
分析可知, 未經(jīng)CWT變換的光譜數(shù)據(jù), FD模型的建模、預(yù)測(cè)擬合效果及模型精度均優(yōu)于R、CR模型; 經(jīng)CWT變換的光譜數(shù)據(jù), CR-CWT模型的預(yù)測(cè)精度明顯優(yōu)于R-CWT和FD-CWT模型。此外, 是否經(jīng)過CWT變換光譜數(shù)據(jù)模型分別對(duì)比可知, R-CWT、FD-CWT、CR-CWT模型的建模、預(yù)測(cè)擬合效果及精度均優(yōu)于R、FD、CR模型, 其中預(yù)測(cè)集模型擬合效果2提高0.107~0.177, 模型精度RMSE提高0.008~0.013, 表明經(jīng)過CWT變換后葉片總汞含量反演模型擬合效果及精度有所增加。
為更直觀地觀察模型對(duì)未知樣本的適應(yīng)性, 將R、FD、CR、R-CWT、FD-CWT以及CR-CWT模型的預(yù)測(cè)值與實(shí)測(cè)值進(jìn)行1∶1線分析(圖4)。由圖可知, FD-CWT以及CR-CWT模型的實(shí)測(cè)值和預(yù)測(cè)值樣點(diǎn)分布更貼近1∶1線附近, 其中CR-CWT模型(2=0.713, RMSE=0.127)擬合效果優(yōu)于FD-CWT模型, 能夠更好地實(shí)現(xiàn)葉片總汞含量的反演。因此, CWT作為一種光譜數(shù)據(jù)處理方法, 對(duì)葉片光譜數(shù)據(jù)進(jìn)行變換處理并提取重構(gòu)小波系數(shù)的敏感波段, 不僅模擬了不同尺度上的小波基函數(shù)與葉片光譜的相似性, 而且能夠察別到光譜范圍內(nèi)細(xì)微的變化情況, 更好地挖掘出微弱的隱藏信息, 與常規(guī)的相關(guān)系數(shù)分析相比反演精度上有所提高[16], 在蘆葦葉片總汞含量高光譜定量分析中具有重要意義。
圖4 利用原始光譜(a)、一階導(dǎo)數(shù)光譜(b)、去包絡(luò)線光譜(c)、原始光譜小波系數(shù)(d)、一階導(dǎo)數(shù)光譜小波系數(shù)(e)以及去包絡(luò)線小波系數(shù)(f)反演蘆葦葉片總汞含量的實(shí)測(cè)值與預(yù)測(cè)值比較
在不同土壤汞處理水平下, 隨著土壤總汞含量的增加, 蘆葦葉片總汞含量逐漸增加, 但葉綠素a含量逐漸降低。這是因?yàn)橹亟饘俟瘯?huì)抑制葉綠素酸脂還原酶, 并影響氨基-γ-戊酮酶的合成[23], 從而影響葉綠素的合成, 降低葉綠素含量[24-25]。從一定程度上說明, 不同土壤汞的處理水平對(duì)蘆葦葉片內(nèi)總汞含量產(chǎn)生了影響, 使得各處理水平下的蘆葦葉片總汞含量存在差異, 可進(jìn)一步利用高光譜技術(shù)進(jìn)行反演監(jiān)測(cè)。
對(duì)敏感波段和敏感小波系數(shù)的篩選以及模型的構(gòu)建發(fā)現(xiàn), 經(jīng)過連續(xù)小波變換的光譜小波系數(shù)與蘆葦葉片總汞含量的相關(guān)性更優(yōu), 所構(gòu)建的模型預(yù)測(cè)精度也更優(yōu)。這是因?yàn)樾〔ǚ治隹蓪?duì)光譜數(shù)據(jù)進(jìn)行時(shí)域和頻域上的多尺度分解, 通過搜索不同尺度上的最佳信號(hào)來預(yù)測(cè)植被生理生化成分[26-27], 而連續(xù)小波變換更可以對(duì)光譜數(shù)據(jù)進(jìn)行連續(xù)分解, 使得分解后的小波系數(shù)與原始光譜數(shù)據(jù)一一對(duì)應(yīng), 從而更有效提取光譜信息中的細(xì)微信號(hào), 在表征光譜信號(hào)上比離散小波變換更加清晰[16,28-29]。目前, 國內(nèi)外很多學(xué)者已通過實(shí)驗(yàn)證明, 經(jīng)過小波分析的光譜數(shù)據(jù)對(duì)植被葉綠素含量、水分含量、光合速率及病蟲害探測(cè)等方面的反演均取得了較高的精度, 且優(yōu)于傳統(tǒng)光譜變換形式下的模型精度[19,29-33], 這與本研究結(jié)果極為相近。
隨機(jī)森林算法選擇樣本和自變量時(shí)具有隨機(jī)性, 不僅會(huì)尋找自變量與因變量的關(guān)系, 還注重不同樣本和自變量的差異, 使得回歸結(jié)果既考慮每個(gè)樣本和自變量的影響, 還不會(huì)過分趨近于某個(gè)樣本[34]。李旭青等[17]發(fā)現(xiàn)利用隨機(jī)森林算法反演水稻冠層氮含量模型精度可達(dá)0.81; 程立真等[35]認(rèn)為隨機(jī)森林模型反演蘋果()葉片磷含量的精度高達(dá)0.923; 高振東[36]曾利用隨機(jī)森林算法反演水稻葉綠素含量, 并間接用葉綠素含量所處值域判斷水稻的重金屬污染情況。但直接利用隨機(jī)森林算法反演植被重金屬含量的研究還比較匱乏。本研究中除原始光譜建模集外, 通過隨機(jī)森林算法建立的蘆葦葉片總汞含量的反演模型擬合效果均在0.5以上, 表明利用隨機(jī)森林算法進(jìn)行植物葉片總汞含量的反演具有一定的可行性。
為了更好地說明所篩選模型的實(shí)用性, 利用篩選出的CR-CWT模型分別對(duì)各土壤汞處理水平下的蘆葦葉片總汞含量進(jìn)行模型建立(表5), 檢驗(yàn)?zāi)P途?。可以發(fā)現(xiàn), 利用CR-CWT數(shù)據(jù)所構(gòu)建的各土壤濃度梯度下的RF模型, 擬合效果2均在0.5以上, 說明該模型在反演蘆葦葉片總汞含量方面具有一定的穩(wěn)定性。在所有土壤汞處理水平中, Hg(20)處理下所構(gòu)建的模型擬合效果和精度最優(yōu)(2=0.825, RMSE=0.051), 但各模型擬合效果與土壤總汞含量沒有相關(guān)性。因此, 隨機(jī)森林算法適用于蘆葦葉片重金屬總汞含量的反演, 且在土壤總汞含量約為20 mg×kg-1時(shí), 采用CR-CWT數(shù)據(jù)構(gòu)建RF模型的方法來反演植物葉片總汞含量更為準(zhǔn)確和可靠。
表5 各土壤汞濃度梯度下去包絡(luò)線光譜小波系數(shù)模型的反演精度
利用隨機(jī)森林算法進(jìn)行植被重金屬含量的反演具有一定的現(xiàn)實(shí)可行性, 而結(jié)合常用光譜變換方法和連續(xù)小波變換后, 所構(gòu)建的反演模型更具有指導(dǎo)植被重金屬含量監(jiān)測(cè)的參考價(jià)值, 應(yīng)用前景廣闊。本文以濕地植物蘆葦為例, 采用CWT對(duì)R、FD、CR進(jìn)行不同尺度上連續(xù)波段的分解, 利用與葉片總汞含量相關(guān)性高的R、FD、CR敏感波段和R-CWT、FD-CWT、CR-CWT小波系數(shù), 采用RF算法建立蘆葦葉片總汞含量反演模型。研究結(jié)果表明:
1)蘆葦葉片總汞含量敏感波段主要分布在可見光波段419~522 nm、664~695 nm和724~876 nm以及近紅外波段1 450~1 558 nm和1 972~2 500 nm。
2)經(jīng)CWT變換后, 小波系數(shù)與葉片總汞含量的相關(guān)系數(shù)絕對(duì)值提高0.04~0.18, 所構(gòu)建的預(yù)測(cè)反演模型擬合效果2提高0.107~0.177, 模型精度RMSE提高0.008~0.013。
3)利用CR-CWT數(shù)據(jù)建立的RF模型對(duì)蘆葦葉片總汞含量的反演精度和擬合效果最優(yōu)(2=0.713, RMSE=0.127)。
4)在土壤總汞含量約為20 mg×kg-1時(shí), 采用CR-CWT數(shù)據(jù)構(gòu)建RF模型的方法來反演植物葉片總汞含量更為準(zhǔn)確和可靠(2=0.825, RMSE=0.051)。
[1] KEMPER T, SOMMER S. Maping and monitoring of residual heavy metal contamination and acidification risk after the Aznalcollar mining accident (Andalusia, Spain) using field and airborne hyperspectral data[C]//Proceedings of the 3rd EARSeL Workshop on Imaging Spectroscopy. Herrsching, 2003: 333–343
[2] REN H Y, ZHUANG D F, PAN J J, et al. Hyper-spectral remote sensing to monitor vegetation stress[J]. Journal of Soils and Sediments, 2008, 8(5): 323–326
[3] SLONECKER T, HAACK B, PRICE S. Spectroscopic analysis of arsenic uptake inferns[J]. Remote Sensing, 2009, 1(4): 644–675
[4] 陳圣波, 周超, 王晉年. 黑龍江多金屬礦區(qū)植物脅迫光譜及其與金屬元素含量關(guān)系研究[J]. 光譜學(xué)與光譜分析, 2012, 32(5): 1310–1315 CHEN S B, ZHOU C, WANG J N. Vegetation stress spectra and their relations with the contents of metal elements within the plant leaves in metal mines in Heilongjiang[J]. Spectroscopy and Spectral Analysis, 2012, 32(5): 1310–1315
[5] DE OLIVEIRA M T G, ROLIM S B A, DE MELLO-FARIAS P C, et al. Industrial pollution of environmental compartments in the Sinos River Valley, RS, Brazil: Geochemical- biogeochemical characterization and remote sensing[J]. Water, Air, and Soil Pollution, 2008, 192(1/4): 183–198
[6] 顧艷文, 李帥, 高偉, 等. 基于光譜參數(shù)對(duì)小白菜葉片鎘含量的高光譜估算[J]. 生態(tài)學(xué)報(bào), 2015, 35(13): 4445–4453 GU Y W, LI S, GAO W, et al. Hyperspectral estimation of the cadmium content in leaves ofbased on the spectral parameters[J]. Acta Ecologica Sinica, 2015, 35(13): 4445–4453
[7] 史鋼強(qiáng), 楊可明, 孫陽陽, 等. 玉米葉片光譜紅邊位置的銅脅迫響應(yīng)與污染監(jiān)測(cè)[J]. 湖北農(nóng)業(yè)科學(xué), 2015, 54(13): 3234–3239 SHI G Q, YANG K M, SUN Y Y, et al. Spectral red edge position responding and pollution monitoring of corn leaves stressed by heavy metal copper[J]. Hubei Agricultural Sciences, 2015, 54(13): 3234–3239
[8] 劉美玲, 劉湘南, 李婷, 等. 水稻鋅污染脅迫的光譜奇異性分析[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2010, 26(3): 191–197 LIU M L, LIU X N, LI T, et al. Analysis of hyperspectral singularity of rice under Zn pollution stress[J]. Transactions of the CSAE, 2010, 26(3): 191–197
[9] LIU M L, LIU X N, DING W C, et al. Monitoring stress levels on rice with heavy metal pollution from hyperspectral reflectance data using wavelet-fractal analysis[J]. International Journal of Applied Earth Observation and Geoinformation, 2011, 13(2): 246–255
[10] 鄔登巍, 吳昀昭, 馬宏瑞. 植物污染脅迫遙感監(jiān)測(cè)研究綜述[J]. 遙感技術(shù)與應(yīng)用, 2009, 24(2): 238–245 WU D W, WU Y Z, MA H R. Review on remote sensing monitoring on contaminated plant[J]. Remote Sensing Technology and Application, 2009, 24(2): 238–245
[11] 曹仕, 劉湘南, 劉清俊. 利用獨(dú)立變量分析與高光譜植被指數(shù)模型監(jiān)測(cè)成熟期水稻中砷污染[J]. 農(nóng)業(yè)環(huán)境科學(xué)學(xué)報(bào), 2010, 29(5): 881–886 CAO S, LIU X N, LIU Q J. Monitor arsenic contamination in mature rice by the model based on the independent component analysis and hyperspectral vegetation indices[J]. Journal of Agro-Environment Science, 2010, 29(5): 881–886
[12] CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20(3): 273–297
[13] 李蜜, 劉湘南, 劉美玲. 基于模糊神經(jīng)網(wǎng)絡(luò)的水稻農(nóng)田重金屬污染水平高光譜預(yù)測(cè)模型[J]. 環(huán)境科學(xué)學(xué)報(bào), 2010, 30(10): 2108–2115 LI M, LIU X N, LIU M L. Fuzzy neural network model for predicting stress levels in rice fields polluted with heavy metals using hyperspectral data[J]. Acta Scientiae Circumstantiae, 2010, 30(10): 2108–2115
[14] 張龍, 潘家榮, 朱誠. 基于近紅外光譜的重金屬汞、鎘和鉛污染水稻葉片鑒別[J]. 浙江大學(xué)學(xué)報(bào): 農(nóng)業(yè)與生命科學(xué)版, 2013, 39(1): 50–55 ZHANG L, PAN J R, ZHU C. Discrimination of mercury, cadmium and lead polluted rice leaves based on near infrared spectroscopy technology[J]. Journal of Zhejiang University: Agriculture & Life Sciences, 2013, 39(1): 50–55
[15] 許吉仁, 董霽紅, 楊源譞, 等. 基于支持向量機(jī)的礦區(qū)復(fù)墾農(nóng)田土壤-小麥鎘含量高光譜估算[J]. 光子學(xué)報(bào), 2014, 43(5): 102–109 XU J R, DONG Q H, YANG Y H, et al. Support vector machine model for predicting the cadmium concentration of soil-wheat system in mine reclamation farmland using hyperspectral data[J]. Acta Photonica Sinica, 2014, 43(5): 102–109
[16] 于雷, 洪永勝, 周勇, 等. 連續(xù)小波變換高光譜數(shù)據(jù)的土壤有機(jī)質(zhì)含量反演模型構(gòu)建[J]. 光譜學(xué)與光譜分析, 2016, 36(5): 1428–1433 YU L, HONG Y S, ZHOU Y, et al. Inversion of soil organic matter content using hyperspectral data based on continuous wavelet transformation[J]. Spectroscopy and Spectral Analysis, 2016, 36(5): 1428–1433
[17] 李旭青, 劉湘南, 劉美玲, 等. 水稻冠層氮素含量光譜反演的隨機(jī)森林算法及區(qū)域應(yīng)用[J]. 遙感學(xué)報(bào), 2014, 18(4): 923–945 LI X Q, LIU X N, LIU M L, et al. Random forest algorithm and regional applications of spectral inversion model for estimating canopy nitrogen concentration in rice[J]. Journal of Remote Sensing, 2014, 18(4): 923–945
[18] 鄭偉, 馮新斌, 李廣輝, 等. 硝酸水浴消解-冷原子熒光光譜法測(cè)定植物中的總汞[J]. 礦物巖石地球化學(xué)通報(bào), 2006, 25(3): 285–287 ZHENG W, FENG X B, LI G H, et al. Determination of total mercury in plants by HNO3digestion in the water bath coupled with cold vapor atomic fluorescence spectrometry[J]. Bulletin of Mineralogy, Petrology and Geochemistry, 2006, 25(3): 285–287
[19] CHENG T, RIVARD B, SáNCHEZ-AZOFEIFA G A, et al. Continuous wavelet analysis for the detection of green attack damage due to mountain pine beetle infestation[J]. Remote Sensing of Environment, 2010, 114(4): 899–910
[20] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5–32
[21] LIAW A, WIENER M. Classification and regression by random forest[J]. R News, 2002, 23(2/3): 18–22
[22] ZHANG J C, YUAN L, PU R L, et al. Comparison between wavelet spectral features and conventional spectral features in detecting yellow rust for winter wheat[J]. Computers and Electronics in Agriculture, 2014, 100: 79–87
[23] STOBART A K, GRIFFITHS W T, AMEEN-BUKHARI I, et al. The effect of Cd2+on the biosynthesis of chlorophyll in leaves of barley[J]. Physiologia Plantarum, 1985, 63(3): 293–298
[24] 郁達(dá), 沈宗根, 張恒澤, 等. 汞對(duì)蘿卜種子發(fā)芽及幼苗某些生理特性的影響[J]. 西北植物學(xué)報(bào), 2004, 24(2): 231–236 YU D, SHEN Z G, ZHANG H Z, et al. Effects on some physiological characters of seedling and germination of radish seeds after treated with Hg2+[J]. Acta Botanica Boreali- Occidentalia Sinica, 2004, 24(2): 231–236
[25] GUPTA P, JAIN M, SARANGTHEM J, et al. Inhibition of 5-aminolevulinic acid dehydratase by mercury in excised greening maize leaf segments[J]. Plant Physiology and Biochemstry, 2013, 62: 63–69
[26] 宋開山, 張柏, 王宗明, 等. 小波分析在大豆葉綠素含量高光譜反演中的應(yīng)用[J]. 中國農(nóng)學(xué)通報(bào), 2006, 22(9): 101–108 SONG K S, ZHANG B, WANG Z M, et al. Application of wavelet transformation inmeasured hyperspectral data for soybean LAI estimation[J]. Chinese Agricultural Science Bulletin, 2006, 22(9): 101–108
[27] 宋開山, 張柏, 王宗明, 等. 基于小波分析的大豆葉綠素a含量高光譜反演模型[J]. 植物生態(tài)學(xué)報(bào), 2008, 32(1): 152–160 SONG K S, ZHANG B, WANG Z M, et al. Soybean chlorophyll a concentration estimation models based on wavelet-transformed,collected, canopy hyperspectral data[J]. Journal of Plant Ecology, 2008, 32(1): 152–160
[28] 梁棟, 楊勤英, 黃文江, 等. 基于小波變換與支持向量機(jī)回歸的冬小麥葉面積指數(shù)估算[J]. 紅外與激光工程, 2015, 44(1): 335–340 LIANG D, YANG Q Y, HUANG W J, et al. Estimation of leaf area index based on wavelet transform and support vector machine regression in winter wheat[J]. Infrared and Laser Engineering, 2015, 44(1): 335–340
[29] 方圣輝, 樂源, 梁琦. 基于連續(xù)小波分析的混合植被葉綠素反演[J]. 武漢大學(xué)學(xué)報(bào): 信息科學(xué)版, 2015, 40(3): 296–302 FANG S H, LE Y, LIANG Q. Retrieval of chlorophyll content using continuous wavelet analysis across a range of vegetation species[J]. Geomatics and Information Science of Wuhan University, 2015, 40(3): 296–302
[30] CHENG T, RIVARD B, SáNCHEZ-AZOFEIFA A. Spectroscopic determination of leaf water content using continuous wavelet analysis[J]. Remote Sensing of Environment, 2011, 115(2): 659–670
[31] BLACKBURN G A. Wavelet decomposition of hyperspectral data: A novel approach to quantifying pigment concentrations in vegetation[J]. International Journal of Remote Sensing, 2007, 28(12): 2831–2855
[32] BLACKBURN G A, FERWERDA J G. Retrieval of chlorophyll concentration from leaf reflectance spectra using wavelet analysis[J]. Remote Sensing of Environment, 2008, 112(4): 1614–1632
[33] 孫少波, 杜華強(qiáng), 李平衡, 等. 基于小波變換的毛竹葉片凈光合速率高光譜遙感反演[J]. 應(yīng)用生態(tài)學(xué)報(bào), 2016, 27(1): 49–58 SUN S B, DU H Q, LI P H, et al. Retrieval of leaf net photosynthetic rate of moso bamboo forests using hyperspectral remote sensing based on wavelet transform[J]. Chinese Journal of Applied Ecology, 2016, 27(1): 49–58
[34] 王云飛, 龐勇, 舒清態(tài). 基于隨機(jī)森林算法的橡膠林地上生物量遙感反演研究——以景洪市為例[J]. 西南林業(yè)大學(xué)學(xué)報(bào), 2013, 33(6): 38–45 WANG Y F, PANG Y, SHU Q T. Counter-Estimation on aboveground biomass ofplantation by remote sensing with random forest algorithm — A case study of Jinghong[J]. Journal of Southwest Forestry University, 2013, 33(6): 38–45
[35] 程立真, 朱西存, 高璐璐, 等. 基于隨機(jī)森林模型的蘋果葉片磷素含量高光譜估測(cè)[J]. 果樹學(xué)報(bào), 2016, 33(10): 1219–1229 CHENG L Z, ZHU X C, GAO L L, et al. Hyperspectral estimation of phosphorus content for apple leaves based on the random forest model[J]. Journal of Fruit Science, 2016, 33(10): 1219–1229
[36] 高振東. 基于水稻葉綠素含量變化的重金屬污染脅迫遙感分析與評(píng)價(jià)[D]. 長(zhǎng)春: 東北師范大學(xué), 2015 GAO Z D. Analysis and evaluation of heavy-metal pollution stress based on chlorophyll content of rice using hyperspectral data[D]. Changchun: Northeast Normal University, 2015
Inversion of Hg content in reed leaf using continuous wavelet transformation and random forest*
LI Mengjie1,3, ZHANG Manyin1,3**, CUI Lijuan1,2, WANG Henian1,3, GUO Ziliang1,3, LI Wei1,2, WEI Yuanyun1,3, YANG Si1,3, LONG Songyuan1,3
(1. Institute of Wetland Research, Chinese Academy of Forestry / Beijing Key Laboratory of Wetland Services and Restoration, Beijing 100091, China; 2. Hanshiqiao National Wetland Ecosystem Research Station, Beijing 101399, China; 3. Heibei Hengshuihu National Wetland Ecosystem Research Station, Hengshui 053000, China)
Heavy metal pollution of plants is one of the most important eco-environmental problems in the world. Rapid and large-scale monitoring of heavy metal content in plants has always been an international problem and a key research topic. Due to its high resolution, multiple band and abundant data, hyperspectral technology could offer a rapid and accurate determination of heavy metal pollution in plants. It can be used to detect the absorption, reflection and transmission characteristics of spectral bands corresponding to phytochemical components and to quantitatively analyze weak spectral differences for large-scale determination of the growth and health of plants. However, researchers mostly construct sensitive spectral parameters (e.g., vegetation index) through simple spectral transformation techniques and continuous removal methods. Most of the inversion models are of univariate regression, multiple stepwise regression, principal component regression and other empirical or semi-empirical models. There have also been uses of artificial networks and support vector machine models. These models not only require more training sets, but also easily over-fit. Thus continuous wavelet transform (CWT) and Random Forest (RF) algorithms are used as more accurate models for inverting heavy metal pollution in plants. While CWT model can more clearly characterize spectral signals, RF has strong fitting ability and also has shorter iteration time. It has higher calculation efficiency for large datasets such as hyperspectral data and is superior in model construction. The heavy metal mercury (Hg) and the wetland plant reed () were used in this research to test the effectiveness off the CWT and RF models. CWT was used to decompose continuous wavelength at different scales in the original spectral reflectivity (R), first-order derivative reflectivity (FD) and de-envelope reflectivity (CR). Correlation analysis was used to determine sensitive bands of R, FD, CR, the spectral reflectance by continuous wavelet transform (R-CWT), the first derivative reflectivity by continuous wavelet transform (FD-CWT) and de-envelope reflectivity by continuous wavelet transform based on the correlation with leaf total Hg content. Then the sensitive bands and RF algorithm were used to establish the inversion model of reed leaf total Hg content. The results showed that sensitive bands of leaf total Hg content were mainly distributed in the visible regions of 419-522 nm, 664-695 nm and 724-876 nm, and the near-infrared regions of 1 450-1 558 nm and 1 972-2 500 nm. After CWT transformation, the absolute value of correlation coefficient between wavelet coefficient and leaf total Hg content increased by 0.04-0.18, the fitting effect (2) of the prediction inversion model increased by 0.107-0.177 and the accuracy (RMSE) of the prediction inversion model increased by 0.008-0.013. The RF model which used continuum removal reflectance after wavelet transformation (CR-CWT) had optimal inversion precision and fitting effect (2= 0.713, RMSE = 0.127). At the same time, it was more accurate and reliable to use RF model with CR-CWT to retrieve leaf total Hg content when soil total Hg content was about 20 mg×kg-1(2= 0.825, RMSE = 0.051). Therefore, it was feasible to use RF algorithm to retrieve heavy metal content in plants. The inversion model constructed by CWT had a more reference value in terms of monitoring heavy metal content in plants. The model was widely used and provided methodological support for non-destructive and rapid monitoring of heavy metal pollution in ecosystems.
Continuous wavelet transformation; Random forest; Hyperspectral data; Heavy metal mercury; Reed leaf
, E-mail: cneco@126.com
Jan. 31, 2018;
May 3, 2018
X5
A
1671-3990(2018)11-1730-09
10.13930/j.cnki.cjea.180131
* 中央級(jí)公益性科研院所基本科研業(yè)務(wù)費(fèi)專項(xiàng)(CAFINT2014K05)資助
張曼胤, 主要研究方向?yàn)闈竦厣鷳B(tài)學(xué)及濕地景觀與規(guī)劃設(shè)計(jì)。E-mail: cneco@126.com
李夢(mèng)潔, 主要研究方向?yàn)闈竦厣鷳B(tài)學(xué)。E-mail: 993288528@qq.com
2018-01-31
2018-05-03
* This study was supported by the Fundamental Research Funds of Central-level Nonprofit Research Institutes of China (CAFINT2014K05).
李夢(mèng)潔, 張曼胤, 崔麗娟, 王賀年, 郭子良, 李偉, 魏圓云, 楊思, 龍頌元. 基于連續(xù)小波變換和隨機(jī)森林的蘆葦葉片汞含量反演[J]. 中國生態(tài)農(nóng)業(yè)學(xué)報(bào), 2018, 26(11): 1730-1738
LI M J, ZHANG M Y, CUI L J, WANG H N, GUO Z L, LI W, WEI Y Y, YANG S, LONG S Y. Inversion of Hg content in reed leaf using continuous wavelet transformation and random forest[J]. Chinese Journal of Eco-Agriculture, 2018, 26(11): 1730-1738
中國生態(tài)農(nóng)業(yè)學(xué)報(bào)(中英文)2018年11期