曹 引,冶運濤,趙紅莉,蔣云鐘,王 浩,王俊鋒
?
內(nèi)陸水體水質(zhì)參數(shù)遙感反演集合建模方法
曹 引1,2,冶運濤2*,趙紅莉2,蔣云鐘2,王 浩1,2,王俊鋒1
(1.東華大學環(huán)境科學與工程學院,國家環(huán)境保護紡織工業(yè)污染防治工程技術中心,上海 201620;2.中國水利水電科學研究院,流域水循環(huán)模擬與調(diào)控國家重點實驗室,北京 100038)
以微山湖為研究對象,利用2015年6月11~13日獲取的實測高光譜和水體葉綠素a濃度、總懸浮物濃度和濁度數(shù)據(jù),構(gòu)建3種水質(zhì)參數(shù)遙感反演常用的經(jīng)驗模型和PSO-SVM模型并進行精度評價,確定參與3種水質(zhì)參數(shù)集合建模的反演模型,分別利用以熵權法(EW-CM)、集對分析法(SPA-CM)為代表的確定性集合建模方法和以貝葉斯模型平均(BMA)為代表的概率性集合方法構(gòu)建反演3種水質(zhì)參數(shù)的EW-CM、SPA-CM和BMA集合模型.通過貝葉斯平均方法獲取各模型和BMA集合模型反演3種水質(zhì)參數(shù)的不確定性區(qū)間,對比3種水質(zhì)參數(shù)各模型和集合模型反演結(jié)果.結(jié)果表明:(1)確定性集合模型中SPA-CM模型精度整體高于EW-CM模型;(2)BMA概率性集合模型建模精度整體上要優(yōu)于SPA-CM和EW-CM集合模型,驗證精度稍低于SPA-CM模型,和EW-CM模型相當;(3)概率性集合建??梢越o出集合模型和各模型反演水質(zhì)參數(shù)的不確定性區(qū)間;(4)確定性和概率性集合模型可以綜合各模型信息,使得集合模型同時具有較高的建模和驗證精度,降低單一模型反演水質(zhì)參數(shù)的不確定性,并在一定程度上提高水質(zhì)參數(shù)反演精度.
內(nèi)陸水體;水質(zhì)遙感;集合建模;微山湖;葉綠素a;總懸浮物;濁度
目前,從事內(nèi)陸水質(zhì)遙感相關研究的學者提出以水體葉綠素a濃度、總懸浮物濃度和濁度等水質(zhì)參數(shù)為主要監(jiān)測對象的眾多遙感反演模型,由于內(nèi)陸水體光學特征的復雜性,不同遙感反演模型隨內(nèi)陸水體的時空變化呈現(xiàn)不同的適用性,目前還沒有普適性的水質(zhì)遙感反演模型[1].現(xiàn)階段用于水質(zhì)反演的經(jīng)驗模型、分析模型和機器學習模型在不同時間、不同水體、不同遙感數(shù)據(jù)源以及不同水質(zhì)參數(shù)反演中的表現(xiàn)具有顯著差異[2-9],各模型反演能力均存在一定的局限性,使得模型選擇具有不確定性.而集合建??梢酝ㄟ^賦予各模型不同權重將不同模型集合,可以綜合各模型信息,提高模型的穩(wěn)定性,并在一定條件下提高水質(zhì)參數(shù)反演精度[10].
集合建模是指通過集合方法確定各模型權重,將各模型模擬值進行加權求和,進而綜合各模型信息的一種建模方法.集合建模思想常用于水文預報,在水質(zhì)遙感領域的應用鮮有報道.集合建模的關鍵在于集合方法的選擇,即各模型權重的確定方法.目前有關集合建模權重確定的方法主要有5種: (1)利用各模型的相對誤差來確定權重,相對誤差越小其權重越大,主要有熵權法[11]和集對分析法[12];(2)將各模型權重計算轉(zhuǎn)化為非線性優(yōu)化問題,基于目標函數(shù)和約束條件采用優(yōu)化算法求解,如遺傳算法[13]和粒子群算法[14];(3) 根據(jù)各模型預測值和實測值,利用神經(jīng)網(wǎng)絡等多元回歸模型來構(gòu)建各模型預測值和實測值之間的關系,達到集合建模的目的[15];(4) 基于數(shù)據(jù)同化思想推導權重計算公式,利用均方根誤差來確定權重[16];(5) 基于貝葉斯理論,利用貝葉斯模型加權平均(BMA)方法來確定權重,獲取預測變量的最優(yōu)估計,并且可以獲取預測變量的不確定性區(qū)間[17-18],因此,稱該方法為概率性集合方法,相應稱(1)-(4)為確定性集合方法.確定性集合建模方法中,熵權法和集對分析法相對簡單,易于實現(xiàn).本文以南水北調(diào)東線重要水源地南四湖最大湖泊微山湖為研究區(qū),構(gòu)建微山湖水體葉綠素a濃度、總懸浮物濃度和濁度常用的經(jīng)驗模型和支持向量機(SVM)模型,引入集合建模思想,選擇以熵權法和集對分析法為代表的確定性集合方法和以貝葉斯平均為代表的概率性集合方法研究微山湖3種水質(zhì)參數(shù)遙感集合建模方法,以期提高水質(zhì)參數(shù)反演精度,降低水質(zhì)參數(shù)遙感反演的不確定性.
1.1.1 基于熵權法的集合建模方法 集合建模關鍵在于各模型權重的確定,基于熵權法的集合建模(EW-CM)利用各模型反演采樣點處水質(zhì)參數(shù)的相對誤差e(式(1))計算各模型相對誤差權重P()熵值H(式(2)、式(3)),利用熵值計算各模型誤差變異程度系數(shù)D(式(4)),最后確定各模型權重(式(5)),構(gòu)建反演水質(zhì)參數(shù)EW-CM集合模型(式(6))[10].
將三元聯(lián)系度轉(zhuǎn)換成聯(lián)系數(shù),進而求出各模型的相對隸屬度v.根據(jù)相對隸屬度確定各模型權重W,建立反演水質(zhì)參數(shù)的SPA-CM集合模型:
v=1/+1/×¢(8)
1.2.1 貝葉斯模型加權平均 貝葉斯模型加權平均(BMA)方法基于貝葉斯理論確定各模型權重和誤差,實現(xiàn)多模型集合建模,并能提供各模型和集合模型反演不同樣點處水質(zhì)參數(shù)的不確定區(qū)間.BMA集合建模思路如下[17]:
假設為待反演水質(zhì)參數(shù),=[,]為實測數(shù)據(jù)(其中表示實測光譜反射率,表示實測水質(zhì)參數(shù)),=[1,2,×××,y]為個模型水質(zhì)參數(shù)反演值的集合.BMA的集合反演表示如下:
利用權重對各模型水質(zhì)參數(shù)反演值進行加權求和,得到BMA集合模型水質(zhì)參數(shù)反演值.如果各模型對水質(zhì)參數(shù)的反演值和水質(zhì)參數(shù)的實測值均服從正態(tài)分布,則BMA集合模型反演值可利用式(12)計算:
1.2.2 期望最大化算法 期望最大化(EM)算法是一種計算BMA集合模型中各模型權重的方法[19].EM算法要求各模型對水質(zhì)參數(shù)的反演值和水質(zhì)參數(shù)的實測值均服從正態(tài)分布,因此,在用EM算法計算各模型權重前,首先對水質(zhì)參數(shù)的實測值和反演值進行正態(tài)檢驗,若不符合正態(tài)分布,則利用Box-Cox函數(shù)對水質(zhì)參數(shù)的實測值和反演值進行正態(tài)轉(zhuǎn)換.EM算法的詳細過程參考文獻[17].
圖1 水質(zhì)參數(shù)濃度區(qū)間反演流程
圖2 2015年6月份采樣點分布
微山湖位于濟寧市微山縣境內(nèi),地處蘇魯邊界結(jié)合部,為內(nèi)陸湖泊南四湖中面積最大的一個湖泊,水面面積531.17km2,是全國著名的淡水湖之一.微山湖是南水北調(diào)東線工程重要的湖泊水源地,具有防洪、排澇、灌溉、供水、養(yǎng)殖及旅游等多種功能.2015年6月12~13日在微山湖布設41個采樣點(圖2),進行實地光譜采集和同步水質(zhì)取樣.利用SVC公司生產(chǎn)的HR-1024地物光譜輻射計采用水面以上傾斜測量法采集光譜[20-21];水體取樣后冷藏,于24h內(nèi)送至實驗室,用醋酸纖維膜過濾,放置于90%丙酮中萃取,再將萃取液放置冰箱中遮光冷藏24h,用UV-2550分光光度計測量葉綠素a濃度.總懸浮物濃度測定按照國家標準GB 11901-89[22],采用過濾烘干法,先將濾膜置于105℃烘箱中烘干2h,除去水分并稱重1,用稱重后的濾膜過濾100mL水樣后于105℃烘干2h再次稱重2,兩次重量相減(2-1)除以過濾水樣體積,即求得總懸浮物質(zhì)量濃度,=(2-1)/.濁度用美國哈希HACH濁度儀1900C現(xiàn)場測量.剔除一個光譜異常點,保留剩余40個點,其中28個點用于建模,12個點用于驗證,其中建模數(shù)據(jù)中包含葉綠素a濃度、總懸浮物濃度和濁度極值,模型反演時內(nèi)插精度往往高于外推,2015年6月微山湖水質(zhì)參數(shù)統(tǒng)計情況見表1,40個樣點光譜曲線如圖3所示.
圖3 采樣點水體光譜曲線
表1 2015年6月微山湖水質(zhì)參數(shù)統(tǒng)計表
選擇水體葉綠素a濃度、總懸浮濃度和濁度反演常用的經(jīng)驗模型和支持向量機模型作為集合反演備選模型集,其中3種水質(zhì)參數(shù)反演模型集如表2所示.單波段模型和一階微分模型分別利用400~850nm歸一化光譜反射率 (式(13))、一階微分光譜反射率(用¢()表示處一階微分光譜反射率)和3種水質(zhì)參數(shù)進行相關分析,選擇和水質(zhì)參數(shù)相關性最好的特征波段構(gòu)建模型;波段比值模型分別利用400~850nm原始光譜反射率、歸一化光譜反射率兩兩比值,選擇和3種水質(zhì)參數(shù)相關性最好的原始光譜反射率比值和歸一化光譜反射率分別建立波段比值模型;葉綠素a濃度三波段、四波段模型、總懸浮物濃度和濁度統(tǒng)一模式構(gòu)建原理分別參考文獻[23-25];上述模型僅利用了400~850nm波段范圍內(nèi)有限幾個波段的光譜反射率,而偏最小二乘模型(PLS)可以充分利用多個波段的光譜信息,首先利用小波變換[26]對光譜去噪,在此基礎上利用改進的離散粒子群優(yōu)化算法(NDBPSO)優(yōu)選3種水質(zhì)參數(shù)多個特征波段和特征變量,構(gòu)建NDBPSO-PLS模型,具體過程參考文獻[27];支持向量機模型構(gòu)建采用PSO算法優(yōu)選懲罰系數(shù)和核參數(shù),利用光譜反射率構(gòu)建PSO- SVM模型,具體參考文獻[28].
式中:R()和()分別為波長處的歸一化光譜反射率和光譜反射率,∈[400~850nm];為400~850nm范圍內(nèi)的波段個數(shù).
表2 水體葉綠素a濃度、總懸浮濃度和濁度反演模型集
模型精度由建模和驗證精度同時決定.模型精度用相對均方根誤差、平均相對誤差、綜合誤差以及模型決定系數(shù)2來衡量.相關計算公式如下:
(1)均方根誤差RMSE:
(2)相對均方根誤差rRMSE:
(3)相對誤差ARE:
(4)綜合誤差CE:
利用2015年6月12~13日在微山湖獲取的水體葉綠素a濃度、總懸浮物濃度和濁度以及同步獲取的水體高光譜數(shù)據(jù),依次構(gòu)建表2中3種水質(zhì)參數(shù)反演模型集,其中葉綠素a濃度和三波段、四波段的相關系數(shù)偏低無法建模,對3種水質(zhì)參數(shù)的各反演模型進行精度評價.葉綠素a濃度反演模型集中的一階微分模型、總懸浮物濃度反演模型集中的單波段模型、統(tǒng)一模式和NDBPSO -PLS模型以及濁度反演模型集中的單波段反演模型、統(tǒng)一模式綜合誤差均較大,不參與集合建模.最終參與集合建模的3種水質(zhì)參數(shù)反演模型及其精度如表3、表4和表5所示.
由表3可以看出,葉綠素a濃度4種反演模型中*692.1nm單波段模型、696.2nm401.9nm波段比值模型和基于特征波段的NDBPSO-PLS模型的2和建模綜合誤差差別較小,模型2均在0.78~0.8之間,建模誤差介于26%~28%之間; PSO-SVM模型2顯著高于前3種模型,2達0.90,建模綜合誤差僅為14.77%,PSO-SVM模型模擬光譜特征和水質(zhì)參數(shù)之間這種復雜的非線性關系具有顯著優(yōu)勢,但其驗證綜合誤差較經(jīng)驗模型要大,模型反演能力偏低,存在過擬合的風險.由表4可以看出,總懸浮物濃度反演模型中PSO- SVM模型建模精度最高,但驗證綜合誤差最大,一階微分模型建模精度最差,但驗證精度最高,由此可見,模型的建模和驗證精度存在不一致性.由表5可以看出,濁度5種反演模型中PSO-SVM模型同時具有最高的建模和驗證精度,模型綜合誤差最小;688nm568.2nm波段比值模型和NDBPSO-PLS模型建模2最大,達到0.95以上,但建模誤差和*684nm單波段模型、¢585.6nm一階微分模型較為接近,建模2和建模綜合誤差之間無單調(diào)關系.綜上所述,不同水質(zhì)參數(shù)的不同反演模型建模和驗證精度往往存在較大差異,兩者難以一致,使得只利用單一模型進行水質(zhì)參數(shù)反演充滿了不確定性.
分別利用熵權法和集對分析法獲取反演3種水質(zhì)參數(shù)的各模型權重,構(gòu)建EW-CM和SPA- CM集合模型,各模型權重和集合模型精度評價如表3、表4和表5所示.
由表3可以看出,葉綠素a濃度各反演模型中,PSO-SVM模型具有最高建模2和最低建模誤差,基于特征波段的NDBPSO-PLS模型具有最高驗證精度,驗證誤差為24.54%;葉綠素a濃度EW-CM和SPA-CM集合模型建模2分別為0.84和0.85,高于單波段模型、波段比值模型和NDBPSO-PLS模型,僅低于建模精度最高的PSO-SVM模型;建模誤差分別為22.99%和22.13%,僅高于建模誤差最小的PSO-SVM模型;驗證誤差分別為27.55%和27.66%,僅高于驗證誤差最小的NDBPSO-PLS模型、EW-CM和SPA-CM集合模型;綜合誤差分別為25.27%和24.89%,僅低于綜合誤差最小的PSO-SVM模型.可以看出,葉綠素a濃度EW-CM和SPA-CM集合模型建模2、建模精度和驗證精度均僅次于表現(xiàn)最佳的模型,集合模型集合了各模型信息,建模和驗證精度具有一致性,降低了模型反演水質(zhì)參數(shù)的不確定性;綜合對比葉綠素a濃度EW- CM和SPA-CM集合模型,SPA-CM集合模型整體上要優(yōu)于EW-CM集合模型.
由表4可以看出,總懸浮物濃度各反演模型中,688nm568.2nm波段比值模型具有最高建模2和最低建模誤差,¢585.6nm一階微分模型驗證誤差最低;總懸浮物濃度EW-CM和SPA-CM集合模型建模2、建模誤差分別為0.97、19.17%和0.98、16.47%,建模精度僅次于PSO-SVM模型,驗證綜合誤差分別為39.43%和38.97%,低于所有模型,集合模型在驗證精度上得到一定程度的提高;綜合對比總懸浮物濃度EW-CM和SPA- CM集合模型,SPA-CM集合模型整體上要優(yōu)于EW-CM集合模型.
表3 葉綠素a濃度反演模型集
注:*代表歸一化反射率;¢代表一階微分光譜反射率;_c代表建模,_v代表驗證,-代表無對應屬性, 加粗代表最優(yōu)屬性,下同.
表4 總懸浮物濃度反演模型集
表5 濁度反演模型集
由表5可以看出,濁度各反演模型中688nm/568.2nm波段比值模型和NDBPSO-PLS模型具有最高建模2,2達0.95以上,且2種模型誤差和驗證誤差相近,PSO-SVM建模和驗證誤差具有相似特點,且建模和驗證誤差均小于其他模型,模型精度最高;濁度EW-CM和SPA-CM集合模型建模2高于所有模型,擬合精度得到一定程度提升,兩種集合模型建模和驗證誤差接近,僅高于PSO-SVM模型,且差異較小,顯著高于其他模型;若各模型中存在建模和驗證精度同時優(yōu)于其他模型的模型,則該模型可作為最佳模型,此時集合模型在建模和驗證精度的提升上有限.
首先檢驗3種水質(zhì)參數(shù)實測值和各模型反演值分布的正態(tài)性,繪制其概率分布圖(圖4),由圖4可以看出3種水質(zhì)參數(shù)實測值和反演值的正態(tài)概率圖接近一條直線,可以定性判定3種水質(zhì)參數(shù)實測值和反演值接近正態(tài)分布.同時利用Jarque-Bera定量檢驗其正態(tài)性,3種水質(zhì)參數(shù)均通過正態(tài)性檢驗(返回值=0).在此基礎上,利用期望最大化算法迭代計算3種水質(zhì)參數(shù)BMA集合模型中各模型權重,對集合模型進行精度評價,同時計算集合模型和各模型反演3種水質(zhì)參數(shù)的90%不確定性區(qū)間,本文僅顯示BMA集合模型反演3種水質(zhì)參數(shù)的90%不確定性區(qū)間(圖5),分別計算集合模型和各模型反演3種水質(zhì)參數(shù)的覆蓋率、區(qū)間寬度和平均偏移幅度[17],結(jié)果分別見表6、表7和表8.
由表6可以看出,葉綠素a濃度BMA集合模型建模2為0.86,僅次于建模2最高的PSO-SVM模型,顯著高于其他3種模型的建模2;建模綜合誤差和建模2類似,高于PSO-SVM模型,低于其他3種模型,驗證綜合誤差僅高于NDBPSO-PLS模型;可以發(fā)現(xiàn)集合模型無論建模2、建模綜合誤差和驗證綜合誤差都最大程度接近最優(yōu)模型.對比分析BMA集合模型和各模型獲取的葉綠素a濃度90%不確定性區(qū)間的覆蓋率、平均帶寬和平均偏移幅度,BMA集合模型建模和驗證90%不確定性區(qū)間對實測值的覆蓋率分別為89.29%和83.33%,均和覆蓋率最高的模型持平;建模90%不確定性區(qū)間平均帶寬PSO-SVM模型最小,BMA集合模型和其他3種模型差異較小;建模90%不確定性區(qū)間平均偏移幅度PSO-SVM模型最小,BMA集合模型和其他3種模型比較接近,驗證90%不確定性區(qū)間平均偏移幅度BMA集合模型小于各模型,區(qū)間對稱性較好,集合建模可一定程度上提高水質(zhì)參數(shù)反演的穩(wěn)定性.
由表7可以看出,總懸浮物濃度BMA集合模型建模2為0.98,和建模2最大的PSO-SVM模型十分接近,建模精度僅低于PSO-SVM模型,顯著高于其他兩個模型,驗證精度高于各模型,集合模型一定程度上提高了總懸浮物濃度反演精度.對比分析BMA集合模型和各模型獲取總懸浮物濃度90%不確定性區(qū)間的覆蓋率、平均帶寬和平均偏移幅度,BMA集合模型建模不確定性區(qū)間覆蓋率高于各模型,驗證不確定區(qū)間覆蓋率和覆蓋率最高的模型持平,具有較高覆蓋率的同時具有較大的平均帶寬;總懸浮物濃度BMA集合模型90%不確定性區(qū)間的平均偏移幅度和葉綠素a濃度反演類似,建模不確定性區(qū)間平均偏移幅度小于PSO-SVM模型,和其他3種模型之間的差異較小,驗證不確定性區(qū)間平均偏移幅度小于各模型,集合建模可一定程度上提高水質(zhì)參數(shù)反演的穩(wěn)定性.
由表8可以看出,濁度BMA集合模型建模2達0.96,高于所有模型,建模和驗證誤差僅大于誤差最小的PSO-SVM模型.BMA集合模型和各模型獲取濁度90%不確定性區(qū)間的覆蓋率、平均帶寬特征和總懸浮物濃度BMA集合模型類似,具有較高覆蓋率的同時具有較大的平均帶寬;建模不確定性區(qū)間平均偏移幅度低于PSO-SVM模型,驗證不確定性區(qū)間僅高于PSO-SVM模型.由于濁度PSO-SVM反演模型同時具有最小的建模和驗證誤差,此時集合模型對濁度建模和驗證精度的提高有限,但從獲取的90%不確定性區(qū)間特征來看,集合建??梢欢ǔ潭忍岣邊^(qū)間覆蓋率,降低平均偏移幅度,提升模型反演的穩(wěn)定性和可靠性.
表6 葉綠素濃度BMA集合模型和各單一模型評價表
表7 總懸浮物濃度BMA集合模型和各單一模型評價表
表8 濁度BMA集合模型和各單一模型評價表
由表3~表5中基于熵權法的EW-CM集合模型和基于集對分析的SPA-CM集合模型反演三種水質(zhì)參數(shù)的精度評價結(jié)果對比分析可知,3種水質(zhì)參數(shù)EW-CM和SPA-CM集合模型綜合了各模型信息,同時具有較高的建模和驗證精度.2種確定性集合模型中,SPA-CM集合模型建模2、建模綜合誤差、驗證綜合誤差以及模型綜合誤差整體上要優(yōu)于EW-CM集合模型, SPA-CM集合模型反演3種水質(zhì)參數(shù)精度高于EW-CM集合模型.
結(jié)合表6~表8,從建模2來看,3種水質(zhì)參數(shù)BMA集合模型整體上高于SPA-CM和EW-CM集合模型;從建模綜合誤差來看,葉綠素a濃度和總懸浮物濃度BMA集合模型要低于SPA-CM和EW-CM集合模型,濁度BMA集合模型和SPA-CM和EW-CM集合模型相當;從驗證綜合誤差來看,3種水質(zhì)參數(shù)BMA集合模型整體上要高于SPA-CM集合模型,和EW-CM集合模型相當.綜上所述,BMA集合模型建模精度整體上優(yōu)于SPA-CM和EW-CM集合模型,驗證精度稍低于SPA-CM集合模型,和EW-CM集合模型相當,且差異較小.
BMA概率性集合模型相較于SPA-CM和EW-CM確定性集合模型的優(yōu)勢主要在于給定各模型權重構(gòu)建集合模型的同時,可以給出集合模型和各模型反演水質(zhì)參數(shù)的不確定性區(qū)間,利用區(qū)間覆蓋率、平均帶寬和平均偏移幅度來衡量各模型反演水質(zhì)參數(shù)的不確定性.
集合建模可以綜合各模型信息,提高模型穩(wěn)定性,但集合模型的時空移植性需要進一步驗證.后續(xù)將基于具有一定物理機理的內(nèi)陸水體半經(jīng)驗/半分析模型進行集合建模,利用不同研究區(qū)和不同時序數(shù)據(jù)研究集合模型的時空移植性.
4.1 3種水質(zhì)參數(shù)不同反演模型建模和驗證精度往往存在較大差異,兩者難以一致,只利用單一模型進行水質(zhì)參數(shù)反演充滿了不確定性.
4.2 確定性集合模型中,3種水質(zhì)參數(shù)SPA-CM和EW-CM集合模型建模和驗證精度最大程度接近或一定程度高于單一最優(yōu)模型,2種確定性集合模型同時具有較高的建模和驗證精度,其中3種水質(zhì)參數(shù)SPA-CM集合模型反演精度整體上優(yōu)于EW-CM集合模型.
4.3 BMA概率性集合模型中,3種水質(zhì)參數(shù)BMA集合模型建模精度和驗證都最大程度接近或一定程度上高于單一最優(yōu)模型,同時BMA方法可以給出集合模型和各模型反演水質(zhì)參數(shù)的不確定性區(qū)間,3種水質(zhì)參數(shù)BMA集合建??梢欢ǔ潭忍岣邊^(qū)間覆蓋率,降低平均偏移幅度,集合模型較單一模型具有更高的穩(wěn)定性.
4.4 3種水質(zhì)參數(shù)概率性BMA集合模型建模精度整體上要優(yōu)于SPA-CM和EW-CM集合模型,驗證精度稍低于SPA-CM集合模型,和EW-CM集合模型相當.
4.5 確定性和概率性集合模型可以綜合各模型信息,使集合模型同時具有較高的建模和驗證精度,降低單一模型反演水質(zhì)參數(shù)的不確定性,并在一定程度上提高模型精度.
[1] 黃昌春,李云梅,徐良將,等.內(nèi)陸水體葉綠素反演模型普適性及其影響因素研究 [J]. 環(huán)境科學, 2013,34(2):525-531.
[2] 馮 奇,程學軍,沈 欣,等.利用 Landsat 8OLI 進行漢江下游水體濁度反演[J]. 武漢大學學報:信息科學版, 2017,(5):643- 647.
[3] Tian L Q, Chen X L, Li W B, et al. Retrieval of total suspended matter concentration from Gaofen-1Wide Field Imager (WFI) multispectral imagery with the assistance of Terra MODIS in turbid water–case in Deep Bay [J]. International Journal of Remote Sensing, 2016,37(14):3400-3413.
[4] Tian H, Cao C, Xu M, et al. Estimation of chlorophyll-a concentration in coastal waters with HJ-1A HSI data using a three-band bio-optical model and validation [J]. International Journal of Remote Sensing, 2014,35(16):5984-6003.
[5] 包 穎,田慶久,陳 旻,等.基于GOCI影像分類的太湖水體葉綠素a濃度日變化分析 [J]. 光譜學與光譜分析, 2016,36(8): 2562-2567.
[6] Ryan K, Ali K. Application of a partial least-squares regression model to retrieve chlorophyll-a [J]. Ocean Science Journal, 2016,51(2):209-221.
[7] 曠 達,韓秀珍,劉 翔,等.基于環(huán)境一號衛(wèi)星的太湖葉綠素a濃度提取 [J]. 中國環(huán)境科學, 2010,30(9):1268-1273.
[8] Sun D Y, Li Y M, Wang Q. A unified model for remotely estimating chlorophyll a in Lake Taihu, China, based on SVM and in situ, hyperspectral data [J]. Geoscience & Remote Sensing IEEE Transactions on, 2009,47(8):2957-2965.
[9] 朱云芳,朱 利,李家國,等.基于GF-1WFV影像和BP神經(jīng)網(wǎng)絡的太湖葉綠素a反演 [J]. 環(huán)境科學學報, 2017,37(1):130-137.
[10] 袁 喆,嚴登華,楊志勇,等.集合建模在徑流模擬和預測中的應用 [J]. 水利學報, 2014,45(3):351-359.
[11] 張鳳太,蘇維詞,周繼霞.基于熵權灰色關聯(lián)分析的城市生態(tài)安全評價 [J]. 生態(tài)學雜志, 2008,27(7):1249-1254.
[12] 王文圣,李躍清,金菊良.基于集對原理的水文相關分析 [J]. 四川大學學報:工程科學版, 2009,41(2):1-5.
[13] 金菊良,魏一鳴,丁 晶.用基于加速遺傳算法的組合預測模型預測海洋冰情 [J]. 系統(tǒng)管理學報, 2003,12(4):367-370.
[14] 吳靜敏,左洪福,陳 勇.基于免疫粒子群算法的組合預測方法 [J]. 系統(tǒng)管理學報, 2006,15(3):229-233.
[15] 張 青.基于神經(jīng)網(wǎng)絡最優(yōu)組合預測方法的應用研究 [J]. 系統(tǒng)工程理論與實踐, 2001,21(9):90-93.
[16] 李 淵,李云梅,呂 恒,等.基于數(shù)據(jù)同化的太湖葉綠素多模型協(xié)同反演 [J]. 環(huán)境科學, 2014,35(9):3389-3396.
[17] 董磊華,熊立華,萬 民.基于貝葉斯模型加權平均方法的水文模型不確定性分析 [J]. 水利學報, 2011,42(9):1065-1074.
[18] 王 斌,張洪波,辛 琛,等.基于貝葉斯模型加權平均法的徑流序列高頻分量預測研究 [J]. 水力發(fā)電學報, 2016,35(5):75-83.
[19] Raftery A E, Gneiting T, Balabdaoui F, et al. Using Bayesian model averaging to calibrate forecast ensembles [J]. Monthly Weather Review, 2005,113(5):1155-1174.
[20] Mueller, J.L., Fargion, G.S., Mcclain, C.R., et al. Ocean optics protocols for satellite ocean color sensor validation, Revision 4, Volume III: radiometric measurements and data analysis protocols [R].Greenbet, Maryland: NASA Goddard Space Flight Center, 2003.
[21] 唐軍武,田國良,汪小勇,等.水體光譜測量與分析I:水面以上測量法 [J]. 遙感學報, 2004,8(1):37-44.
[22] GB11901-89 水質(zhì)懸浮物的測定重量法 [S].
[23] Giorgio D, Gitelson A A, Rundquist D C. Towards a unified approach for remote estimation of chlorophyll-a in both terrestrial vegetation and turbid productive waters [J]. Geophysical Research Letters, 2003,30(18):159-171.
[24] Le C F, Li Y M, Yong Z, et al. A four-band semi-analytical model for estimating chlorophyll a in highly turbid lakes: the case of Taihu Lake, China [J]. Remote Sensing of Environment, 2009, 113(6):1175-1182.
[25] 黎 夏.懸浮泥沙遙感定量的統(tǒng)一模式及其在珠江口中的應用 [J]. 遙感學報, 1992,7(2):106-114.
[26] 米 晨,湯秀芬,魏鳳蘭.基于Haar小波變換的圖像分解與重構(gòu) [J]. 實驗室研究與探索, 2003,22(2):78-81.
[27] 曹 引,冶運濤,趙紅莉,等.基于離散粒子群和偏最小二乘的湖庫型水源地水體懸浮物濃度和濁度遙感反演方法 [J]. 水力發(fā)電學報, 2015,34(11):77-87.
[28] Bazi Y, Melgani F. Semi-supervised PSO-SVM regression for biophysical parameter estimation [J]. IEEE Transactions on Geoscience and Remote Sensing, 2007,45(6):1887-1895.
Ensemble modeling methods for remote sensing retrieval of water quality parameters in inland water.
CAO Yin1,2, YE Yun-tao2*, ZHAO Hong-li2, JIANG Yun-zhong2, WANG Hao1,2, WANG Jun-feng1
(1.State Environmental Protection Engineering Center for Pollution Control in Textile Industry, College of Environmental Science and Engineering, Donghua University, Shanghai 201620, China;2.State Key Laboratory of Smimulation and Regulation of Water Cycle in River Basin, China Institute of Water Resources and Hydropower Research, Beijing 100038, China)., 2017,37(10):3940~3951
Based on the measured hyperspectral data and concentration of chlorophyll a, total suspended matter (TSM) and turbidity obtained during June 11 to 13, 2015 in Weishan Lake, empirical models and PSO-SVM model were established to retrieve the three water quality parameters. Meanwhile, the performance of those models was evaluated to determine the models applied to ensemble modeling. The ensemble models containing EW-CM, SPA-CM and BMA were established to retrieve the three water quality parameters by using deterministic ensemble method and probabilistic ensemble method. The deterministic and probabilistic ensemble method was based on the entropy weight method along with pair analysis method and Bayesian averaging method, respectively. Bayesian averaging method was employed to obtain the retrieval uncertainty range of the three water quality parameters by using the single model and the BMA ensemble model, and the retrieval uncertainty range of these models was compared. These results demonstrated that (1) the accuracy of SPA-CM model was better than that of EW-CM model in deterministic ensemble models; (2) the modeling accuracy of BMA probabilistic ensemble model was better than that of SPA-CM and EW-CM model; the verification accuracy of BMA probabilistic ensemble model was similar with that of EW-CM model but slightly lower than that of the SPA-CM model; (3) Probabilistic ensemble modeling could obtain the retrieval uncertainty range of water quality parameters by using the ensemble model and the single model; (4) The deterministic and probabilistic ensemble model associated with the single model information showed a higher modeling and verification accuracy, which could be used to reduce the uncertainty of water quality parameters retrieval compared with single model and promote the retrieval accuracy of water quality parameters in a manner.
inland water;remote sensing of water quality;ensemble modeling;Weishan Lake;chlorophyll a;total suspended matter;turbidity
X832
A
1000-6923(2017)10-3940-12
曹 引(1991-),男,安徽滁州人,東華大學博士研究生,主要從事流域水資源遙感及水循環(huán)模型數(shù)據(jù)同化研究.發(fā)表論文10余篇.
2017-03-23
國家自然科學基金資助項目(51309254);國家重點研發(fā)計劃資助項目(2017YFC0405801,2017YFC0405804);中國水利水電科學研究院科研專項“十三五”重點科研項目(WR0145B272016);中國水利水電科學研究院流域水循環(huán)模擬與調(diào)控國家重點實驗室開放研究基金資助項目(IWHR-SKL-201517)
* 責任作者, 高級工程師, yeyuntao@iwhr.com