汪志成,王 杰,3,晏實江,崔玉環(huán),王行行
(1:安徽大學資源與環(huán)境工程學院,合肥 230601) (2:安徽大學濕地生態(tài)保護與修復安徽省重點實驗室,合肥 230601) (3:安徽省地理信息工程中心,合肥 230601) (4:安徽農(nóng)業(yè)大學理學院,合肥 230036)
在人類活動和氣候變化因素的共同作用下,內(nèi)陸水體藍藻問題日趨嚴重,已成為全球環(huán)境關注的焦點[1-2]. 巢湖為我國五大淡水湖之一,近年來富營養(yǎng)化嚴重,水華頻發(fā),不僅給水產(chǎn)養(yǎng)殖和景區(qū)旅游帶來了重大損失,還威脅到了周圍居民的生產(chǎn)生活[3]. 因此,在治理藍藻水華的同時,開展對湖區(qū)水環(huán)境監(jiān)測以及藍藻水華的預測預警己成為當務之急[4]. 相比于傳統(tǒng)的實地采樣監(jiān)測,衛(wèi)星遙感具有范圍廣、速度快、成本低和便于長期動態(tài)監(jiān)測的優(yōu)勢,在內(nèi)陸水體水質(zhì)監(jiān)測中起到了重要作用[5].
已有對藍藻水華監(jiān)測的研究大多將水體葉綠素a(Chl.a)看作藍藻生物量的替代色素,對Chl.a的遙感反演研究較多,反演方法也相對成熟[6-8]. 然而,Chl.a不僅存在于藍藻中,還存在于所有浮游植物中,僅用Chl.a濃度很難將藍藻生物量與浮游植物生物量分離[9]. 藻藍素(phycocyanin, PC)是水體藍藻的特征色素,因此可以將藻藍素濃度作為水體中藍藻生物量的指示性指標[10]. 利用藻藍素在620 nm波長處具有強吸收這一特性,國內(nèi)外學者根據(jù)實測高光譜數(shù)據(jù)或遙感影像開展了關于藻藍素濃度反演的研究,其算法主要集中在經(jīng)驗統(tǒng)計模型上. 經(jīng)驗統(tǒng)計模型中運用較廣的有單一反射比算法(single reactance ratio algorithm)[11-13]、半經(jīng)驗基線算法(semi-empirical baseline algorithm)[14-16]. 除經(jīng)驗統(tǒng)計模型外,Simis等[10]提出了一種嵌套波段半分析算法(the nested band semi-analytical algorithm),利用波段比值和水的后向散射系數(shù)估算藻藍素濃度;Liu等[17]利用Sentinel-3 OLCI數(shù)據(jù)的4個波段反射率數(shù)據(jù)構建了一種四波段藻藍素半分析算法,該類方法具有較好的物理意義,但需輸入的參數(shù)較多. 近年來,機器學習模型在水色遙感監(jiān)測中被廣泛應用[18],該類方法是將數(shù)據(jù)之間進行多次訓練、驗證和擬合,來擬合輸入層和輸出層之間的非線性關系,具有自調(diào)節(jié)、自聚類和高容錯的優(yōu)點. 苗松等[19]和Yim等[20]分別利用機器學習模型中的隨機森林(random forest)、深度神經(jīng)網(wǎng)絡(deep neural networks)構建了適用于富營養(yǎng)化湖泊的藻藍素濃度反演模型,模型精度優(yōu)于波段比等經(jīng)驗統(tǒng)計方法.
目前用于水體藻藍素濃度反演的遙感數(shù)據(jù)主要有MODIS、MERIS和Sentinel系列. 其中,MERIS影像具有中心波長在620 nm處的波段,適用于水體藻藍素濃度反演,但該數(shù)據(jù)已于2012年5月停止發(fā)布;長時序的EOS MODIS影像缺乏中心波長在620 nm處的波段,難以準確反映藻藍素濃度的光譜信號[21]. Sentinel-3 A/B衛(wèi)星是歐洲航空局研發(fā)的多光譜中分辨率衛(wèi)星,其搭載的海洋和陸地彩色成像光譜儀(OLCI),設有21個光譜波段(400~1020 nm),空間分辨率為300 m,繼承了MERIS影像空間和光譜分辨率的優(yōu)勢. 其雙星觀測模式的重返周期為陸地1.1 d,可提供全球多光譜中等分辨率觀測能力. 該傳感器針對浮游植物的光譜特征,設計了更為精準的窄波段來檢測,且具有覆蓋藻藍素吸收特征峰(620 nm)的波段[22]. 綜合考慮到傳感器波段設置及時間分辨率等因素,Sentinel-3 OLCI影像在水體藻藍素濃度高頻率遙感監(jiān)測方面具有很大的潛力.
綜上所述,國內(nèi)外學者針對不同遙感數(shù)據(jù)源已提出了多種藻藍素濃度反演方法,目前還未有根據(jù)Sentinel-3 OLCI影像集的高時譜分辨率特性開展湖庫水體藻藍素濃度長時序變化規(guī)律的相關研究. 本研究嘗試根據(jù)不同季節(jié)實測水體藻藍素濃度與同期Sentinel-3 OLCI遙感影像,構建適用于巢湖的水體藻藍素濃度反演模型,篩選出最優(yōu)模型并應用至2019年及2020年1、2月的Sentinel-3 OLCI影像集上,分析巢湖藻藍素濃度年內(nèi)變化特征及其影響因素,以期為巢湖藍藻水華監(jiān)測與預測預警提供參考依據(jù).
巢湖(31°25′~31°43′N,117°16′~117°51′E)位于安徽省合肥市,屬于長江中下游北岸水系,是我國五大淡水湖之一. 巢湖自西向東分為西湖區(qū)、中湖區(qū)和東湖區(qū),主要入湖河流有南淝河、十五里河、派河、兆河和柘皋河等[23](圖1). 湖區(qū)總面積約780 km2,流域面積約9258 km2,平均水深為3.0 m,最大水深6.78 m. 巢湖富營養(yǎng)化嚴重,藍藻水華時常發(fā)生,主要分布在湖泊西北部,每年藍藻水華最早暴發(fā)的月份為5-7月,高頻暴發(fā)月份為8月[4].
本研究分別于2019年12月27日(冬季)、2020年6月25日(夏季)、2020年11月3日(秋季)和2021年3月25日(春季)對巢湖按照點位圖進行表層水樣采集(圖1). 其中,第1次采樣(冬季)的樣點數(shù)為30個,后3次采樣將樣點數(shù)增加到了36個,共得到了138個湖面樣點數(shù)據(jù).
圖1 巢湖概況與采樣點分布Fig.1 Overview of Lake Chaohu and distribution of sampling sites
湖面采樣通過租用快艇進行,水樣采集及現(xiàn)場測定在北京時間9:00-14:00,與遙感影像成像時差控制在±3 h以內(nèi). 為避免陸地臨近像元影響,采樣點離岸線大于2 km. 在每個樣點采集表層水樣1.5 L,根據(jù)Xue等[24]關于巢湖水體的吸收特性在垂直方向上的變化研究并參考葉綠素a(Chl.a)采樣的國家標準(HJ897-2017),將采樣深度設置為0.5 m,該深度能保證樣品不受水面聚集藍藻的影響,并能對應遙感反應的真光層. 同時利用Avantes Field便攜式地物光譜儀根據(jù)水表面以上測量法測定水體反射光譜數(shù)據(jù)[25],相關參數(shù)為光譜范圍300~1100 nm、光譜分辨率1.5 nm、波長精度±0.3 nm. 光譜測定時,觀測方位角為135°,觀測天頂角為40°,需要測量的遙感參量有標準板、天空光和水面上行光譜輻亮度. 測量的遙感反射率Rrs根據(jù)公式(1)計算.
(1)
式中,Ssw、Ssky和Sp分別為水面以上測量的輻射亮度、天空光的輻射亮度和標準板的輻射亮度;ρp為標準板的反射率,10%;r是無量綱的空氣水反射,取研究中常用的數(shù)值0.025[26].
為防止水體色素分解,采集的樣品帶回實驗室后在24 h內(nèi)過濾并測定藻藍素濃度,測定全程在避光條件下進行. 藻藍素濃度測量采用紫外可見光分光光度法[27],用直徑47 mm的玻璃纖維濾膜過濾一定體積(取決于水樣渾濁程度)的水樣計為V1,濾膜放入離心管中,用pH=7的磷酸鹽緩沖液定容至15 mL(V2),然后將離心管置于溫度為-70℃的超低溫冰箱中反復凍融3次,在4℃、9000 r/min條件下離心10 min,離心結束后取上清液作為待測液,利用紫外分光光度計測得其在615、652和750 nm處的吸光度,計為A615、A652和A750. 藻藍素濃度Cpc(μg/L)采用龐曉宇等[28]在Bennett等[29]提出的藻藍素濃度計算公式的基礎上所改進的公式進行計算:
(2)
巢湖主要富營養(yǎng)化指標的濃度數(shù)據(jù)來源于安徽省水文局(http://slt.ah.gov.cn/tsdw/swj/),包括總氮(TN)、總磷(TP)、氨氮(NH3-N)和高錳酸鹽指數(shù)(CODMn). 氣溫、降水、日照時數(shù)、風向和風速等氣象數(shù)據(jù)來源于中國氣象數(shù)據(jù)網(wǎng)(http://data.cma.cn/),湖泊水位數(shù)據(jù)來源于合肥水旱情信息網(wǎng)(http://sq.hfswj.net:8000/).
本研究選取與湖面采樣同期成像的4景Sentinel-3 OLCI影像進行反演建模,該數(shù)據(jù)來自歐洲太空局(https://scihub.copernicus.eu),影像質(zhì)量較好,無云覆蓋. 水體遙感影像的大氣校正是保證水質(zhì)參數(shù)反演精度的前提,目前常用于Sentinel-3 OLCI影像的大氣校正方法有集成在SNAP軟件中的C2RCC(case 2 regional coast colour)算法[30]和SEADAS 7.5軟件中的MUMM(management unit mathematical models)算法[31]. 為評價遙感影像大氣校正效果,本研究結合實測水面光譜與Sentinel-3 OLCI傳感器的光譜響應函數(shù),計算得到OLCI傳感器模擬波段反射率(公式(2)),與經(jīng)過C2RCC和MUMM算法大氣校正后的OLCI影像波段反射率進行比較,而后選擇效果更好的大氣校正算法應用于后續(xù)工作中.
(3)
式中,R為模擬波段反射率,Rrs為實測光譜反射率,fi(λ)為光譜響應函數(shù),λ1和λ2為傳感器波段對應的波長.
影像中近岸水體像元反射率會受到附近陸地反射的影響而偏高,稱之為近鄰效應[32]. 在對鄱陽湖濁度反演的研究中,F(xiàn)eng等[33]利用遠離岸線的最近鄰像素來校正近鄰效應. 相較于鄱陽湖,巢湖比較開闊且沒有狹窄的河道,受近鄰效應的影響相對較小,因此本研究參考畢順等[32]所用的方法,在根據(jù)巢湖邊界對影像裁剪的基礎上,對離岸2個像元以內(nèi)的區(qū)域進行掩膜處理,不參與后續(xù)反演建模及應用工作中.
本文根據(jù)巢湖實測藻藍素濃度與同期的Sentinel-3 OLCI影像,通過對影像波段組合與實測數(shù)值的相關性分析,采用波段組合模型、基線模型、機器學習模型等方法,構建了多種水體藻藍素濃度反演模型,并篩選出最佳的模型. 在機器學習建模中,利用網(wǎng)格搜索法來確定各模型的主要參數(shù),提高模型精度并防止過擬合;采用十折交叉驗證的方法對模型效果進行評價,即將數(shù)據(jù)集隨機排序并劃分為10份,輪流將其中9份作為訓練數(shù)據(jù),1份作為測試數(shù)據(jù),最后將10次的結果平均. 反演模型的構建及精度評價通過Python語言中的keras庫和scikit-learn庫實現(xiàn).
1.4.1 模型輸入變量選擇 在構建藻藍素濃度反演模型時,需要選取與實測藻藍素濃度相關性最高的波段或波段組合作為模型輸入變量構建反演模型. 根據(jù)前人研究,Sentinel-3 OLCI影像中常用于水體藻藍素濃度反演的為第6~12波段[21],其中第7波段(620 nm)為藻藍素特征吸收峰波段. 因此,本文將第7波段與第6~12波段中的若干波段進行組合,共得到106種組合,對各個波段組合與實測藻藍素濃度進行相關性分析,對相關性系數(shù)大于0.5的波段組合進行統(tǒng)計(表1),從中篩選相關性最高的波段組合作為后續(xù)建模工作中的自變量.
1.4.2 藻藍素濃度反演模型 本研究構建的藻藍素濃度反演模型包括波段組合模型、基線算法以及不同形式的機器學習模型,下面對這3種模型進行介紹.
波段組合模型是基于經(jīng)驗統(tǒng)計原理所構建的,選擇與藻藍素濃度相關性較高的波段組合作為自變量,實測藻藍素濃度作為因變量,建立統(tǒng)計回歸方程. 本文選取了表1中相關性最高的波段組合(B7/(B6+B12))作為自變量構建對應的反演模型.
基線算法是以波長λ1和λ3的遙感反射率所連接直線為基線,再計算波長λ2處的遙感反射率到基線的距離H,建立H與實測藻藍素濃度的線性關系,進而實現(xiàn)藻藍素濃度的估算. 本文選用的基線算法是齊琳等[15]提出的PCI指數(shù),其峰值波長λ2為620 nm,基線兩端波長λ1和λ3分別為560和665 nm.
表1 OLCI影像波段組合與實測藻藍素濃度的相關性分析Tab 1 Correlation analysis between OLCI band combinations and in-situ phycocyanin concentration
機器學習回歸模型通過構建復雜結構的神經(jīng)網(wǎng)絡來捕捉輸入變量的豐富特征,擬合輸入變量與輸出變量的非線性關系. 本研究分別采用隨機森林、極端隨機樹、K近鄰、支持向量機、梯度提升以及深度神經(jīng)網(wǎng)絡6種機器學習算法構建反演模型. 為防止模型過擬合同時保證模型精度,選擇Sentinel-3 OLCI的第6~12波段反射率以及表1中相關性較高的波段組合共13個變量作為建模的輸入變量,建模輸入變量的選擇參考了Cao等[34]對水體Chl.a濃度反演的研究.
1.4.3 精度評價方法 本文利用決定系數(shù)(R2)、均方根誤差(RMSE)和相對均方根誤差(rRMSE)來評價各模型的反演精度.
(4)
(5)
(6)
式中,n為樣本數(shù)目,yi為第i個樣本對應的真實藻藍素濃度值,y′i為第i個樣本對應的反演藻藍素濃度值.
為有效評價不同水體大氣校正算法的效果,將實測反射率與大氣校正后的OLCI影像反射率(第6~12波段)進行比較. 圖2顯示,在第6~12波段,經(jīng)MUMM算法大氣校正后的反射率顯著高于實測光譜反射率,在第6波段(560 nm)誤差最小(rRMSE=45.5%),在第12波段(754 nm)誤差最大(rRMSE=241.3%);而經(jīng)C2RCC算法大氣校正所得到的反射率整體低于實測光譜反射率,但兩者一致性較好,樣點基本分布在1∶1線附近,在第6波段(560 nm)誤差最小(rRMSE=22.8%),在第12波段(754 nm)誤差最大(rRMSE=40.9%). 2種大氣校正下的影像波段反射率均呈現(xiàn)波長越長,誤差越大的特點,這可能是因為近紅外波段信號整體比較弱,從而影響了校正精度. 由于C2RCC算法大氣校正具有較好的精度,本研究采用該算法對Sentinel-3 OLCI影像進行大氣校正.
圖2 水體實測反射率與大氣校正OLCI影像反射率比較Fig.2 Comparison of measured Rrs of water and atmospheric corrected OLCI image Rrs
利用1.4.2節(jié)中的方法,構建了不同形式的水體藻藍素濃度反演模型. 利用各模型交叉驗證結果,對各反演模型的預測精度進行評價(表2).
表2 不同形式反演模型的精度評價Tab.2 Precision evaluation of different retrieval models
傳統(tǒng)的波段組合方法和PCI指數(shù)法的反演精度整體相對較低,其rRMSE均大于所有機器學習算法. 在6種機器學習方法中,精度最高的反演模型為梯度提升回歸模型,其R2、RMSE和rRMSE分別達到0.84、49.76 μg/L和34.1%. 該模型精度低于Simis等[10]在荷蘭某湖泊的反演精度(rRMSE=19.7%、R2=0.94);相比Duan等[35]在太湖的反演精度(rRMSE=83%,R2=0.88),該模型的R2略低,而rRMSE大幅降低. 這可能與不同研究區(qū)水體的富營養(yǎng)化程度差異有關.
經(jīng)網(wǎng)格搜索調(diào)參,本文中梯度提升回歸模型的主要參數(shù)n_esimators、learning_rate、random_state、sunbsample的最優(yōu)值分別為10000、0.089、0和0.8.
為比較梯度提升回歸模型與傳統(tǒng)的波段組合、PCI指數(shù)模型反演結果的差異,生成這3種模型的反演精度散點圖(圖3). 圖3顯示,波段組合指數(shù)和PCI指數(shù)模型對藻藍素濃度較高值(>300 μg/L)的估算出現(xiàn)了嚴重的低估,原因可能是線性模型較簡單且輸入變量較少,難以體現(xiàn)藻藍素高低濃度間的差別. 而梯度提升回歸模型雖在藻藍素濃度較高時(>300 μg/L)出現(xiàn)輕微低估,在藻藍素濃度較低時(<50 μg/L)出現(xiàn)一定高估的現(xiàn)象,但其具有較高的反演精度,樣點大多分布在1∶1線附近. 因此,本文將構建的梯度提升回歸模型,應用于巢湖長時序Sentinel-3 OLCI影像集.
圖3 不同類型方法反演精度對比: (a)波段組合;(b)PCI指數(shù);(c)梯度提升回歸Fig.3 Comparison of the retrieval and in-situ of phycocyanin concentration in water: (a) band combination; (b)PCI index; (c) gradient boosting regression
為探究巢湖水體藻藍素濃度年內(nèi)變化規(guī)律,根據(jù)2019年全年Sentinel-3 OLCI影像集的反演得到不同日期的藻藍素濃度,通過GIS空間分析,統(tǒng)計得到各湖區(qū)的藻藍素濃度年內(nèi)變化圖(圖4).
圖4表明,在2019年1-4月,中、東湖區(qū)藻藍素濃度普遍較低,大多處于100 μg/L附近,中、東湖區(qū)僅在3月出現(xiàn)過一次濃度急增,其濃度分別達到287.1和238.9 μg/L,西湖區(qū)藻藍素濃度在1-3月則明顯高于中、東湖區(qū);6月14日3個湖區(qū)出現(xiàn)同步大幅增長(平均增幅達315.4 μg/L),此后藻藍素濃度整體較高且波動頻繁,各湖區(qū)差異不大;10月3日西湖區(qū)藻藍素濃度達到年內(nèi)峰值580.0 μg/L,此后西湖區(qū)藻藍素濃度維持在較高值,而中、東湖區(qū)藻藍素濃度有所下降,湖區(qū)之間差異增大;12月后3個湖區(qū)藻藍素濃度降至100 μg/L左右,趨于穩(wěn)定.
圖4 巢湖水體2019年藻藍素濃度的年內(nèi)變化Fig.4 Intra-annual variation of phycocyanin concentration in Lake Chaohu in 2019
氣象因子是影響藍藻增殖的關鍵因素,本文在合肥市2019年實測氣象資料中,選擇5種與藍藻水華增殖密切相關的因子[36],包括氣溫、降水、風速、水位和日照時數(shù),統(tǒng)計其日均值和月均值,與藻藍素濃度反演值進行Pearson相關性分析(表3). 考慮到氣象因子對藍藻生長的影響存在一定滯后性[37],氣象因子的日均值數(shù)據(jù)為藻藍素濃度數(shù)據(jù)前5日的平均值. 表3顯示,在5種氣象因子中,日均氣溫與水體藻藍素濃度的相關性較高且呈現(xiàn)顯著正相關,表明其為影響巢湖藻藍素濃度年內(nèi)變化的主要因素. 在相關性上,中、東湖區(qū)的相關系數(shù)差異較小,而西湖區(qū)則明顯小于中、東湖區(qū).
表3 巢湖藻藍素濃度與氣象因子的相關性分析Tab.3 Correlation coefficient between phycocyanin concentration and meteorological factors in Lake Chaohu
圖5 不同季節(jié)巢湖藻藍素濃度的空間分布Fig.5 Spatial distribution of phycocyanin concentration in Lake Chaohu in different seasons
圖6 巢湖夏季主要富營養(yǎng)指標濃度分布Fig.6 Concentration distribution of main eutrophic indexes in Lake Chaohu in summer
為探究巢湖藻藍素濃度的空間分布特征,本文將已構建的梯度提升反演模型應用于2019年3月到2020年2月成像的95景巢湖Sentinel-3 OLCI影像上,按照氣象學所劃分的季節(jié)(3-5月為春季(22景),6-8月為夏季(20景),9-11月為秋季(32景),12月-次年2月為冬季(21景))對反演值進行均值統(tǒng)計,得到不同季節(jié)的巢湖藻藍素濃度分布(圖5). 由圖5可見,巢湖藻藍素濃度空間差異較大. 春、冬季巢湖藻藍素濃度較低,處于50~150 μg/L,部分沿岸區(qū)域因藍藻聚集而濃度過高,可達到300~550 μg/L,3個湖區(qū)間的數(shù)值差異不大. 夏、秋季氣溫較高且日照充足,巢湖藍藻水華頻發(fā),富營養(yǎng)化程度加劇,藻藍素濃度在 200~600 μg/L之間,西、中和東個湖區(qū)的濃度均值分別為(307.54±67.51)、(219.60±35.77)和(220.14±34.96) μg/L,西湖區(qū)藻藍素濃度以及空間差異均顯著高于中、東湖區(qū).
水體藻藍素空間分布與湖區(qū)營養(yǎng)狀況密切相關[13,38],其中夏、秋季節(jié)巢湖西湖區(qū)藻藍素濃度顯著高于中、東湖區(qū). 因此,本研究根據(jù)安徽省水文局水環(huán)境監(jiān)測中心所提供的2019年夏季巢湖主要富營養(yǎng)化指標的測定結果,生成各樣點TN、TP、NH3-N和CODMn濃度空間分布圖(圖6). 圖6顯示,西湖區(qū)各樣點的TN、TP和NH3-N濃度整體較高,尤其是在西北部入湖河口區(qū)域,而CODMn雖呈現(xiàn)微弱的西高東低的趨勢,但各樣點濃度差別不大. 通過對比圖5和圖6,可以看出TN、TP和NH3-N濃度與夏季藻藍素濃度分布具有較高的一致性,這說明氮磷營養(yǎng)鹽是影響巢湖藻藍素濃度空間分布的主要因素. 西湖區(qū)的氮磷營養(yǎng)鹽濃度高主要是因為西湖區(qū)與合肥市區(qū)接壤,大量生產(chǎn)生活污水經(jīng)由南淝河、派河和十五里河等城市河流排入該區(qū)域所導致的[39].
為探究不同遙感數(shù)據(jù)源對水體藻藍素濃度反演結果的影響,本文利用以往研究[6,39]采用的EOS MODIS影像對巢湖藻藍素濃度進行反演,選用數(shù)據(jù)源為MODIS逐日反射率產(chǎn)品(MOD09GA),空間分辨率為500 m,包含第1~7波段的反射率數(shù)據(jù). 使用MODIS重投影工具(MODIS Reprojection Tools,MRT)將其投影到UTM-WGS84坐標系,利用其反射率數(shù)據(jù)與對應實測藻藍素濃度進行反演建模,反演方法與1.4節(jié)中對OLCI影像反演的方法一致. 交叉驗證的結果表明,對MODIS影像的最優(yōu)藻藍素濃度反演模型仍為梯度提升回歸模型,其精度為R2=0.64,RMSE=75.37 μg/L,rRMSE=51.2%,略低于Sentinel-3 OLCI影像(R2=0.84,RMSE=49.76 μg/L,rRMSE=34.1%).
而后將建立的反演模型應用至2020年11月3日成像的MODIS逐日反射率影像上,與同期Sentinel-3 OLCI影像的反演結果進行對比分析(圖7). 圖7顯示,兩種數(shù)據(jù)源的藻藍素濃度分布反演結果比較相似,其差異主要體現(xiàn)在西湖區(qū)的藻藍素濃度高值區(qū)域(圖中紅色部分)的分布上. OLCI影像西、中、東湖區(qū)的藻藍素濃度平均值分別為(139.6 ± 122.4)、(103.1 ± 42.3)、(89.1 ± 26.9) μg/L,MODIS影像的西、中和東湖區(qū)的藻藍素濃度平均值分別為(194.3 ± 104.5)、(97.6 ± 32.0)、(85.0 ± 25.5) μg/L. OLCI影像的高值區(qū)域分布在西北部沿岸區(qū)和湖中的部分區(qū)域,高值和低值(圖中藍色部分)間的分割比較明顯;MODIS影像的高值區(qū)域覆蓋面積較大,整個西湖區(qū)的藻藍素濃度平均值較高,且差距較小.
圖7 基于Sentinel-3 OLCI和MODIS影像的巢湖藻藍素濃度反演結果對比Fig.7 Comparison of phycocyanin concentration retrieval results from Sentinel-3 OLCI data and MODIS data in Lake Chaohu
相較而言,基于MODIS的藻藍素濃度反演精度較低,可能是由于MODIS影像在500~900 nm光譜范圍的波段較少且缺少620 nm的藻藍素強吸收波段,難以提取藻藍素濃度細微的差別,導致反演精度受限[40];此外,MOD09GA產(chǎn)品的空間分辨率較高(500 m),在反演建模時會存在較大的誤差. 因而,Sentinel-3 OLCI影像可為湖庫水體藻藍素濃度動態(tài)監(jiān)測提供重要數(shù)據(jù)源.
梯度提升回歸模型的優(yōu)勢在于通過多次迭代訓練n個不同的弱學習器,再將弱學習器有權重的分配生成強學習器,結果是多顆回歸樹的累加之和[41],其在小樣本數(shù)據(jù)處理上的交叉驗證精度高,對低維數(shù)據(jù)、非線性數(shù)據(jù)的處理能力強,在回歸問題中有很強的應用價值[42]. 由于不同湖泊水體的光學特性存在較大差異[43]. 本文所用的反演方法可在其他富營養(yǎng)化水體藻藍素濃度遙感監(jiān)測中推廣,但仍需要利用其他湖泊的實測數(shù)據(jù)集對模型進行重新訓練. 在今后研究中,可考慮利用多個湖泊的實測藻藍素濃度數(shù)據(jù)進行反演建模,以提高模型的泛化能力.
研究采用的遙感數(shù)據(jù)源Sentinel-3 OLCI以其高光譜分辨率、高時間分辨率及特殊的波段設置等優(yōu)勢,可為內(nèi)陸水體藻藍素濃度反演提供良好的數(shù)據(jù)支撐,但其目前還缺少比較成熟的大氣校正算法[19]. 研究過程嘗試了C2RCC和MUMM兩種算法對水體影像進行大氣校正,其中C2RCC算法大氣校正的精度整體令人滿意. 針對富營養(yǎng)化水體,后期嘗試采用6S等大氣校正算法,并根據(jù)不同時相、大氣環(huán)境、傳感器類型對影像數(shù)據(jù)進行劃分,選擇最優(yōu)的大氣校正算法進行大氣校正.
巢湖各湖區(qū)的藻藍素濃度在年內(nèi)會發(fā)生同步的劇烈波動. 據(jù)統(tǒng)計,在2019年全湖藻藍素濃度均值在半個月內(nèi)發(fā)生了大幅波動(幅度達100 μg/L以上)的情況共發(fā)生3次,分別在3月、6月和10月(圖4). 在排除了影像質(zhì)量問題后,本研究對波動時期的原始遙感影像進行目視解譯發(fā)現(xiàn):在藻藍素濃度大幅增長的日期,巢湖表面均暴發(fā)了嚴重的水華,在水華消退后,藻藍素濃度也隨之降低. 藍藻水華的暴發(fā)及消退會受到多種氣象因素的綜合作用,其原因和機制較為復雜[44],如降水可能會增加水體營養(yǎng)鹽,促進藻類增殖[13],但降水時期又會伴有較低的日照時長,不利于藍藻的增殖. 因此,為更好地探究氣象因素對藍藻水華暴發(fā)的影響,將劇烈波動時期的逐日藻藍素濃度和氣象指標列于表4.
從表4中可以看出,在藻藍素濃度的劇烈波動時期,氣象變化有著一定規(guī)律:在藻藍素濃度增高時期,降水量均為0 mm,日照時長相對較高;在6月和10月藻藍素濃度下降的時期,發(fā)生了多次降水,且日照時長出現(xiàn)0值. 由此可見,藻藍素濃度的劇烈波動主要是由于日照時數(shù)和降水量的變化所導致的. 長時間的日照能促進藍藻的光合作用使其迅速增殖[36];降水會加快藻類遷移同時暫時性破壞水體的熱分層,從而減少并抑制藻類生長[45]. 另外,3月12-13日,藻藍素濃度迅速降低,考慮到兩種可能,一是人工打撈[46],二是從其水位下降了0.1 m來看,可能是因為閘控因素,導致巢湖水體流動加快,聚集的藻類被水流沖散.
表4 劇烈波動時期的逐日巢湖藻藍素濃度和氣象指標*Tab.4 Concentration data and daily meteorological data of Lake Chaohu during periods of large fluctuations in phycocyanin
本文利用巢湖藻藍素濃度實測數(shù)據(jù)和同期的Sentinel-3 OLCI影像,構建多種水體藻藍素濃度反演模型,并將反演精度最高的梯度提升回歸模型應用于巢湖OLCI影像數(shù)據(jù)集,分析了湖泊藻藍素濃度的年內(nèi)變化特征及影響因素,得到以下結論:
1)在水體大氣校正算法中,C2RCC算法校正后的影像反射率更接近實測光譜反射率;在各種藻藍素濃度反演模型中,梯度提升回歸模型的反演精度最高,其R2、RMSE和rRMSE分別達到0.84、49.76 μg/L和34.1%,在富營養(yǎng)化水體參數(shù)反演中具有較大的應用潛力.
2)在時間變化上,巢湖藻藍素濃度在1-4月及12月普遍較低,在5-11月較高且波動劇烈,藻藍素濃度變化與日均氣溫、日照時長以及降水量有顯著關系. 在空間分布上,夏、秋季節(jié)西湖區(qū)的藻藍素濃度較高,主要是西湖區(qū)入湖河流攜帶的大量氮、磷等營養(yǎng)鹽大量輸入引起的.
3)相較于MODIS影像對藻藍素濃度的反演結果,本文所用的Sentinel-3 OLCI影像具有更高的反演精度,可為湖庫水體藻藍素濃度的高時頻動態(tài)監(jiān)測提供重要數(shù)據(jù)源.