劉 宇,朱丹瑤
(牡丹江師范學(xué)院歷史與文化學(xué)院,黑龍江牡丹江157012)
隨著經(jīng)濟的高速發(fā)展,我國內(nèi)陸水體的污染不斷加劇,致使一些湖泊藻類物質(zhì)急劇增多,富營養(yǎng)化狀況也日趨嚴(yán)重。藻類的富集與死亡不僅會降低湖泊的功能與作用,還可能通過食物鏈進(jìn)一步損害人類身體健康[1]。地表水狀況與飲水安全已然成為影響生態(tài)與社會發(fā)展的重要因素。水質(zhì)監(jiān)測作為水污染防治與評價的重要依據(jù),其結(jié)果直接影響區(qū)域生產(chǎn)與居民生活用水[2,3]。傳統(tǒng)的水質(zhì)監(jiān)測不僅耗時長,費用高,且難以及時地掌握整個研究區(qū)水質(zhì)的空間分布狀況。遙感技術(shù)憑借其獨特優(yōu)勢已被廣泛應(yīng)用到了水質(zhì)監(jiān)測中[4,5]。隨著遙感監(jiān)測研究的日益成熟,水體中可監(jiān)測指標(biāo)也在不斷增加。在眾多水質(zhì)參數(shù)當(dāng)中,葉綠素a 作為藻類物質(zhì)的重要組成成分之一,一直是內(nèi)陸水體富營養(yǎng)化狀況監(jiān)測的重要參數(shù)指標(biāo)[6,7]。
目前,國內(nèi)外已有不少關(guān)于內(nèi)陸水體葉綠素a濃度的遙感監(jiān)測研究,但無論采用哪種方法,其研究的范圍主要集中在富營養(yǎng)狀態(tài)的水域,對于中/貧營養(yǎng)狀態(tài)的水域研究較少。如:在傳統(tǒng)經(jīng)驗?zāi)P椭?,Gitelson 等[8]利用植物色素在700 nm 附近熒光峰位置與葉綠素a濃度的變化規(guī)律進(jìn)行建模,估算了渾濁水體葉綠素a濃度;Hoogenboom 等[9]在Ljsselneer湖區(qū),通過分析水體光譜數(shù)據(jù)發(fā)現(xiàn),波段比值Rrs(708)/Rrs(676)在葉綠素a 濃度建模中精度最高;Ricardo 等[10]通過分析FLH(Fluoresce Line Height)算法在MODIS 影像的應(yīng)用,發(fā)現(xiàn)該算法較依賴于波段位置的準(zhǔn)確性。馬萬棟等[11]利用高光譜數(shù)據(jù)對比研究發(fā)現(xiàn),反射峰面積模型NPA(Normalized Peak Area)較適合用于實測高光譜數(shù)據(jù)來反演葉綠素濃度。隨著水質(zhì)遙感研究的不斷深入,一些半經(jīng)驗半分析模型也被一些學(xué)者采用,常用的模型主要有三波段模型、四波段模型等。如:Dall’Olmo等[12]利用三波段模型通過反演葉綠素濃度證實了該模型在內(nèi)陸水體中的應(yīng)用。Le 等[13]通過分析太湖水域懸浮物吸收和散射特性,進(jìn)一步構(gòu)建了四波段模型,并取得不錯的效果。安如等[6]利用歸一化葉綠素指數(shù)法NDCI(Normalized Difference Chlorophyll Index)對比不同研究區(qū)發(fā)現(xiàn),NDCI穩(wěn)定性與適用性更好。
而對于中/貧營養(yǎng)水體的遙感反演研究,目前主要集中在光學(xué)特性較為簡單的大洋等開闊性水域。由于水體清潔,內(nèi)部組成成分較為單一,模型框架算法相對較為成熟。如應(yīng)用SeaWiFS 數(shù)據(jù)的CZCS 算法和OC4 算法[14],以及MODIS 數(shù)據(jù)的藍(lán)綠比值算法等。與大洋水體相比,我國大部分內(nèi)陸水體光學(xué)特性較為復(fù)雜。水體組成成分除葉綠素a外,通常還包括懸浮顆粒物和有色可溶有機物。因此,這也導(dǎo)致內(nèi)陸水體的反演算法適用性不同于大洋水體。
除此之外,部分學(xué)者也對內(nèi)陸水體中/貧營養(yǎng)水域葉綠素a濃度反演做出了初步的探索,如:李苗等[15]對克欽湖葉綠素a濃度模型進(jìn)行了對比研究,發(fā)現(xiàn)波段反射率比值模型Rrs(703)/Rrs(677)對克欽湖葉綠素濃度估算效果最佳。馬馳等[16]利用的Landsat 7 ETM+影像對松嫩平原水體葉綠素a 含量進(jìn)行估算,結(jié)果表明波段組合Rrs4/(Rrs2+Rrs3)擬合效果最好。但所使用的算法都為傳統(tǒng)的經(jīng)驗?zāi)P停唵尾ǘ谓M合缺乏物理依據(jù),并具有一定的隨機性[5]。
參照生態(tài)部《地表水環(huán)境質(zhì)量評價辦法》關(guān)于湖泊富營養(yǎng)化評價TLI 指數(shù)法,對照單一指標(biāo)葉綠素a 濃度表明,鏡泊湖水體大部分處于中/貧養(yǎng)狀態(tài)。本文基于高光譜數(shù)據(jù),使用包括傳統(tǒng)經(jīng)驗?zāi)P汀虢?jīng)驗半分析模型在內(nèi)的8種比較成熟的反演方法,通過分析不同模型的適用性來確定適合鏡泊湖水域的最優(yōu)模型。以期為中/貧營養(yǎng)內(nèi)陸水域葉綠素a 濃度遙感監(jiān)測提供參考模型。另外,鏡泊湖不僅是該地區(qū)重要的淡水資源之一,而且位于該地區(qū)旅游景區(qū)的核心位置。近些年,由于旅游產(chǎn)業(yè)的不斷發(fā)展和人類活動的顯著增加,尤其河流上游的農(nóng)業(yè)影響。鏡泊湖的環(huán)境壓力日益明顯,湖泊生態(tài)系統(tǒng)的平衡也受到了嚴(yán)重的影響。因此,通過對鏡泊湖葉綠素a遙感監(jiān)測,不僅可以實時的、全面地了解其水質(zhì)狀況,同時也可以為鏡泊湖開展水資源保護(hù)、旅游資源開發(fā)等提供重要的數(shù)據(jù)基礎(chǔ)與理論依據(jù)。
野外葉綠素a 濃度數(shù)據(jù)獲取時間為2015年9月22日和2018年7月28日。通過GPS 定位,共獲取鏡泊湖50 個表層水樣,經(jīng)過篩選剔除異常點,最后選取45 個有效采樣點。其中1-30 號采樣點為2015年數(shù)據(jù),作為建模數(shù)據(jù)庫; a-o 號采樣點為2018年數(shù)據(jù),作為檢驗數(shù)據(jù)庫,具體分布如圖1所示。獲取的水樣通過熱乙醇分光光度法,測得葉綠素濃度范圍為0.62~3.21μg/L,平均濃度為1.51μg/L。
圖1 鏡泊湖采樣點分布圖Fig.1 Distribution of sample stations in Jinpo Lake
水體光譜信息獲取是使用ASD Field Spec Pro FR 便攜式光譜儀,其波長范圍為350~1 050 nm,光譜分辨率為3 nm,光譜采集與處理參照唐軍武等[17]推薦方法。
1.2.1 波段比值模型
波段比值模型是結(jié)合葉綠素a 光譜特征選取2 個波段的比值作為葉綠素a的反演因子,通過構(gòu)建回歸方程來估算葉綠素a 濃度。該模型通常使用近紅外波段反射峰值與紅光反射谷值的比值來估算葉綠素a 濃度,如L Han 等[18]通過分析3 個不同月份的實測數(shù)據(jù)對比發(fā)現(xiàn),波段比值Rrs(705)/Rrs(670)模型穩(wěn)定性較高。
1.2.2 三波段模型
三波段模型是在Gordon 等對生物光學(xué)模型研究的基礎(chǔ)之上發(fā)展起來的,早期用來估算地表植被葉綠素含量。目前,國內(nèi)外眾多學(xué)者通過結(jié)合研究區(qū)不同水體特征,建立了大量水質(zhì)參數(shù)的反演算法。其中,部分水域已經(jīng)得到了較好的驗證[19,20]。該方法原理是利用不同物質(zhì)的光學(xué)特性,建立特定范圍的3個波段組合與特定水質(zhì)參數(shù)的相關(guān)關(guān)系,進(jìn)而達(dá)到盡可能減少其他水色物質(zhì)干擾的效果。三波段模型可用公式表示:
式中:Cchl.a表示葉綠素a 濃度;Rλ1和Rλ2分別代表λ1和λ2處反射率值,其中,λ1應(yīng)選擇在葉綠素a 反射谷附近;λ2應(yīng)選擇在700 nm附近的熒光峰波段。
由于此處對懸浮物和黃色物質(zhì)的吸收系數(shù)與λ1位置相近,因此三波段模型可有效減輕該組分對水體吸收系數(shù)的影響。λ3所在的位置主要是用來抵消所受后向散射的影響。三波段模型的適用性較好,并具有相對較高的驗證效果。但不同學(xué)者選取的3 個波段所在的實際位置并不完全一致。如Gitelson等[21]通過分析Chesapeake 渾濁水體光學(xué)特性發(fā)現(xiàn),3 個波段位置分別位于675、695 和730 nm;而Dall′Olmo 等[22]通過大量的實驗來確定波段位置及敏感性,研究發(fā)現(xiàn)λ1應(yīng)設(shè)置在660~690 nm 之間、λ2應(yīng)設(shè)置在700~750 nm 之間、λ3設(shè)置應(yīng)大于730 nm。
1.2.3 四波段模型
在三波段模型的基礎(chǔ)之上,Le 等[13]通過加入第4 個波段,建立了四波段模型。其目的是為了減弱渾濁水體懸浮物及純水吸收和向后散射的影響。四波段模型一般形式如下:
式中:λ1與λ2位置與三波段模型相同,λ3位置通常選擇在720~740 nm之間,λ4位置通常選擇在740~780 nm之間。具體位置可通過所建模型決定系數(shù)最優(yōu)原則,迭代確定。
1.2.4 NDCI模型
NDCI 是由Maisha 等[23]提出,模型采用歸一化形式,主要針對內(nèi)陸水體復(fù)雜的組分而設(shè)定。模型簡單實用,一般形式如下:
式中:Rλ1和Rλ2分別代表波段λ1與λ2處的反射率值。
為減弱其他組分的干擾,λ1與λ2應(yīng)選取在葉綠素a導(dǎo)致光譜變化明顯波段。另考慮到模型假設(shè)懸浮物與有色可溶有機物在所選位置吸收系數(shù)相等,故λ1與λ2位置差不能過大。綜合考慮2種因素,λ1與λ2分別選取在675 nm 附近葉綠素a強吸收波段和700 nm附近的葉綠素強反射波段。
1.2.5 WCI模型
WCI,即葉綠素a 監(jiān)測指數(shù),是通過借鑒陸地植被葉綠素監(jiān)測指數(shù)MTCI發(fā)展而來[24],模型計算公式為:
式中:Cchl.a表示葉綠素a 濃度值,λ3應(yīng)選擇在675 nm 附近的葉綠素強吸收波段。
由于不存在陸地植被的紅邊效應(yīng),λ1與λ2應(yīng)盡量選擇在與λ3反差較大的波段。即λ1選擇在左側(cè)650 nm左右的反射峰,λ2選擇在700 nm 附近的熒光峰。具體的波段位置的確定可通過決定系數(shù)最優(yōu)原則,逐步迭代確定。
1.2.6 熒光峰位置模型
熒光峰是由于植物色素的熒光效應(yīng)所引起的反射鋒,并且葉綠素a濃度與該反射峰的位置成正相關(guān)。因此,通常用該波段反射峰的位置來判斷葉綠素a濃度。D.Zhao等[25]通過分析400~750 nm 反射光譜與葉綠素a 濃度的相關(guān)性,并發(fā)現(xiàn)葉綠素濃度由3 mg/L 增加到100 mg/L 時,熒光峰位置相應(yīng)的從680 nm向715 nm變化,并且峰幅逐漸增加。
1.2.7 熒光峰光高度模型
水體熒光峰高度模型由Gower[26]提出,其原理是通過連接700 nm 附近熒光峰左右兩側(cè)反射谷作為基線(見圖2)。計算熒光峰位置反射率值與基線高度之差,即基線熒光峰高度,公式如下:
圖2 基線熒光高度示意圖Fig.2 Illustration of the FLH
式中:FLH為熒光峰高度;λmax為是峰值波長;λ1、λ2分別為熒光峰左右兩側(cè)反射谷的波長;Rλmax、Rλ2和Rλ2分別為λmax、λ1和λ2處光譜反射率值。
1.2.8 熒光峰面積模型
對于熒光峰面積模型目前主要通過選取700 nm 附近熒光峰兩側(cè)的吸收谷來計算反射峰面積(見圖3),計算公式為:
圖3 葉綠素a 紅波段反射峰面積示意圖Fig.3 Illustration of the NPA in red band region of chlorophyll-a
式中:NPA為葉綠素a 熒光峰面積;λ1、λ2分別為熒光峰左右兩側(cè)吸收谷的波長,nm;Rλ1、Rλ2分別為λ1和λ2處光譜反射率。
圖4為本次采集的鏡泊湖水體光譜反射率分布狀況。可以看出,分布曲線在400~900 nm 波段范圍內(nèi)具有明顯的內(nèi)陸水體特征。其中,由于葉綠素吸收及細(xì)胞散射作用形成的反射峰出現(xiàn)在570~580 nm 波段;由藻藍(lán)蛋白色素吸收形成的反射谷出現(xiàn)在670~680 nm 波段;由植物色素的熒光效作用形成的反射峰出現(xiàn)在695~705 nm 波段,該反射峰位置與葉綠素a 濃度成正相關(guān)[27]。因此,通常用該波段反射峰的位置和數(shù)值來判斷葉綠素a濃度。
圖4 鏡泊湖水體光譜反射率曲線Fig.4 Remote sensing reflectance spectra of the Jinpo Lake
在獲取的45 組實測光譜數(shù)據(jù)與同步葉綠素濃度數(shù)據(jù)中,本文利用建模數(shù)據(jù)庫(2015年9月獲?。?,使用上述8 種模型進(jìn)行建模。其中波段比值模型選擇熒光峰Rrs(693)與其左側(cè)的反射率谷Rrs(680)比值;三波段和四波段模型則根據(jù)R2值最大原則,循環(huán)迭代確定最佳波段,經(jīng)測試λ1、λ2、λ3分別為676、697 和740 nm,四波段λ1、λ2、λ3和λ4分別為681、693、733和766 nm。另外5種模型波段選取參考1.2所述。
在獲取的樣本數(shù)據(jù)(30 組)中,將以上最終確定的最優(yōu)波段特征值作為自變量,同步葉綠素a數(shù)據(jù)作為因變量,通過相應(yīng)算法的回歸分析后,所建立的葉綠素a 濃度反演模型如表1所示。其中三波段模型擬合度最高,R2值達(dá)到0.79,優(yōu)于波段比值模型的0.74,兩個模型的最優(yōu)回歸方程都為一元二次方程,這與大多數(shù)學(xué)者研究一致[28,29];NDCI 模型和四波段模型的最優(yōu)模型也為一元二次方程,R2值也分別達(dá)到了0.74 和0.69;熒光峰位置模型、光峰高度模型和熒光峰面積模型R2值也達(dá)到了0.6 左右,與多數(shù)學(xué)者觀點一致,最優(yōu)回歸方程為指數(shù)方程[11,24,29];WCI 模型是本次所選模型中決定系數(shù)相對較低的模型,R2值為0.51,但也可以明顯地表現(xiàn)出葉綠素a 濃度與光譜值之間的相關(guān)性。
表1 不同方法葉綠素a反演模型Tab.1 Chlorophyll-a retrieval model in different methods
使用驗證數(shù)據(jù)庫(2018年7月獲?。ι鲜? 種葉綠素a濃度模型的反演精度進(jìn)行評價。結(jié)果見圖5。
圖5 葉綠素a 濃度估算值與實測值的對比Fig.5 Comparison between measured and estimated the chlorophyll-a concentration
可以看出,上述8種方法都能在一定程度上反演出鏡泊湖水體的葉綠素a 濃度狀況(MAPE為20.6%~46.3%,RMSE 為0.34~0.63 μg/L)。但在不同營養(yǎng)狀況的水域,由于水體光學(xué)特性的差異,模型適用性有所不同[29]。在本研究區(qū),鏡泊湖屬于中營養(yǎng)/貧營養(yǎng)水域。檢驗結(jié)果顯示,與其他模型相比,三波段模型效果最好,RMSE與MAPE分別為0.34μg/L和20.6%。
三波段模型和四波段模型都是基于內(nèi)陸水體復(fù)雜的組成成分和光譜特性所構(gòu)建的。模型中波段的選擇范圍位于紅外與近紅外波段之間,其中λ1與λ2分別選取在葉綠素a反射谷與熒光峰波段。由于兩處懸浮物和有色可溶性有機物的吸收系數(shù)相近,因此模型可在一定程度消除兩種物質(zhì)對水體光譜的影響。同時,λ3的加入也可以部分抵消水體后向散射的影響[26]。但是由于不同水域水體組成成分不同,所呈現(xiàn)的光譜特征也往往不同,因而建模的最佳波段具有一定的不固定性。在此基礎(chǔ)之上,四波段模型通過加入第4個波段來進(jìn)一步減弱渾濁水體懸浮物及純水吸收和后向散射的影響。但本研究四波段模型MAPE為22.9%,RMSE為0.41μg/L,均低于三波段模型的檢驗效果。其原因一方面,可能是由于鏡泊湖水體組成成分和光學(xué)特性在時間上與空間上差異較大,當(dāng)懸浮物在所選波段的吸收系數(shù)差異較大時,增加近紅外波段的四波段模型也可能帶來一定干擾,從而無法改善模型的效果[29]。另外,在近紅外區(qū)域,三波段模型是以懸浮物顆粒遠(yuǎn)小于純水吸收系數(shù)為前提,而在高渾濁水域,近紅外波段的吸收和散射并不能被忽略,四波段模型也正是基于此改進(jìn)模型的精度[13]。但鏡泊湖水體并非高渾濁水體,因此,加入的第四波段也可能對模型產(chǎn)生一定的干擾。
在NDCI 模型的驗證中,RMSE為0.42 μg/L,MAPE為22.3%。由于模型的波段選擇與波段比值一致(700 nm 左右反射鋒與葉綠素吸收峰),因此反演效果與波段比值模型也比較接近,并沒有優(yōu)于三波段模型。這與安如等[6]對太湖的反演模型結(jié)論一致,即NDCI法較適用于葉綠素濃度較高的湖泊水質(zhì)監(jiān)測,對于中營養(yǎng)/貧營養(yǎng)狀況的鏡泊湖反演效果并沒有較大的提升。WCI 模型雖擬合效果不高,但在模型驗證中,平均相對誤差MAPE卻達(dá)到19.2%。一方面可能是由于本次采集樣本數(shù)量較少,建模數(shù)據(jù)的選取也會影響模型的精度;另一方面WCI 模型是在陸地植被葉綠素a 監(jiān)測模型MTCI 的基礎(chǔ)上,通過波段差值的比值來增大葉綠素a 吸收和反射的差異。該研究區(qū)具有較高葉綠素a濃度,通過波段的處理,水體葉綠素a特征更加明顯[24]。而本研究區(qū)屬于中營養(yǎng)/貧營養(yǎng)水域,葉綠素a濃度相對較低,通過該模型的波段變換并沒有改善葉綠素a 濃度的反演精度。這也體現(xiàn)了在不同類型水體中,模型通用性不確定的特點[2,5,7]。
熒光峰位置模型、熒光峰高度模型和熒光峰面積模型已經(jīng)被很多學(xué)者證明過可以作為反演葉綠素a濃度的傳統(tǒng)經(jīng)驗?zāi)P蚚11,24,29]。對比該3 種反演模型的檢驗效果,熒光峰高度模型與熒光峰面積模型比較穩(wěn)定,反演精度差別不大,RMSE分別為0.43 和0.47μg/L,MAPE分別為25.9%與30.4%。而熒光峰位置模型的驗證精度則相對較低,RMSE為0.63 μg/L,MAPE為46.3%。其主要原因可能為此次采樣湖泊水體葉綠素濃度普遍偏低,濃度跨度較小導(dǎo)致建模數(shù)據(jù)熒光峰位置比較接近,甚至相同,從而影響模型精度。
本文結(jié)合2015年9月和2018年7月實測光譜數(shù)據(jù),對鏡泊湖葉綠素a 濃度反演模型的精度進(jìn)行了評估。以期為中營養(yǎng)/貧營養(yǎng)內(nèi)陸湖泊的最佳反演模型提供一定的數(shù)據(jù)支撐。具體結(jié)論如下:
(1)在所構(gòu)建的8種模型中,三波段模型是最適用于中營養(yǎng)/貧營養(yǎng)狀況的鏡泊湖葉綠素a 濃度估算模型,模型R2值為0.79,MAPE為20.6%,RMSE為0.34μg/L。模型可表示為y=2 864.3x2-107.43x+2.14,x=[Rrs-1(676)-Rrs-1(697)]×Rrs-1(740)。
(2)與三波段模型對比研究發(fā)現(xiàn),在低葉綠素濃度及低渾濁水體中,增加近紅外波段的四波段模型也可能帶來一定的不確定性,從而降低反演精度,但仍需更多水體樣來進(jìn)一步驗證。
(3)WCI 模型的R2值較低,但在模型驗證中,MAPE卻只有19.2%。是否與中營養(yǎng)/貧營養(yǎng)湖泊葉綠素a濃度較低有關(guān)仍需要進(jìn)一步驗證。
(4)對于葉綠素a濃度跨度較小的鏡泊湖水域,半經(jīng)驗半分析模型建模精度優(yōu)于傳統(tǒng)的經(jīng)驗?zāi)P停ㄈ纾?熒光峰位置模型、熒光峰高度模型和熒光峰面積模型)。