解啟蒙,林茂森,楊國范,2,夏曉蕓,張 曦,閻孟冬
(1. 沈陽農(nóng)業(yè)大學(xué)水利學(xué)院,沈陽 110866;2. 沈陽工學(xué)院能源與水利學(xué)院,遼寧 撫順 113122;3.朝陽市水務(wù)局,遼寧 朝陽 122000)
清河水庫是遼河流域重要的水利樞紐工程之一,水庫擔負著防洪、灌溉、漁業(yè)、工業(yè)供水等任務(wù),如果水庫水體處于富營養(yǎng)化,不僅威脅水庫的供水安全,也制約水庫功能的正常運轉(zhuǎn)。而高錳酸鹽指數(shù)(CODMn)是綜合評價水體污染程度的重要指標之一,也是水質(zhì)監(jiān)測的重要項目[1-4]。由于清河水庫所在地交通和測量方面存在很大的不便,如果人工進行實地監(jiān)測,需要耗費大量的人力、物力、財力,且在空間全局性、時效性等方面存在一定的局限性,而應(yīng)用遙感技術(shù)很好地解決了這一問題。借助遙感技術(shù),根據(jù)水體所含不同成分的光譜反射特征,尋找不同成分的敏感波段,分析其與實測CODMn的相關(guān)關(guān)系,通過單波段或波段組合作為自變量建立遙感監(jiān)測模型,對水體CODMn進行定量遙感反演,這一技術(shù)具有速度快、效率高、數(shù)據(jù)同步性好、觀測范圍大、監(jiān)測成本低等優(yōu)勢,已成為水質(zhì)監(jiān)測的重要手段之一[5-6]。目前CODMn反演技術(shù)常用的方法有經(jīng)驗法[7]、半經(jīng)驗法[8]、分析法[9],李旭文[10]等(1993)利用TM數(shù)據(jù)評價了蘇州運河的有機污染,通過回歸分析表明TM1、2、3與CODMn相關(guān)性最好;王學(xué)軍(2000)[11]選取了太湖水質(zhì)中CODMn等7個監(jiān)測參數(shù),利用TM數(shù)據(jù)的單波段或多波段組合與實測數(shù)據(jù)相關(guān)關(guān)系分析及主成分分析來監(jiān)測太湖的水質(zhì)污染,并建立了每種水質(zhì)參數(shù)的預(yù)測模型;趙玉芹、汪西莉[12]利用SPOT-5遙感影像數(shù)據(jù)和現(xiàn)場水質(zhì)監(jiān)測數(shù)據(jù)建立BP和RBF兩種神經(jīng)網(wǎng)絡(luò)反演模型,對水質(zhì)參數(shù)CODMn進行反演,反演結(jié)果表明該模型的精度滿足要求,反演結(jié)果比線性回歸模型好;郝海森[13]以波段組合TM2/TM5為自變量建立高弗地區(qū)平原水庫CODMn定量遙感反演模型;葉圓圓[14]以波段組合B1+B2為自變量建立的日顧橋沉陷水域CODMn定量遙感反演模型;趙旭陽[15]以HJ-1數(shù)據(jù)的B4波段為自變量建立的大洋河河口水域CODMn定量遙感反演模型;王建平[16]等在通過遙感技術(shù)對鄱陽湖環(huán)境監(jiān)測的過程中,利用人工神經(jīng)網(wǎng)絡(luò)技術(shù)對湖泊水色進行了定量遙感反演研究,在同步實驗的基礎(chǔ)上構(gòu)造了包含一個隱含層的BP神經(jīng)網(wǎng)絡(luò)模型,再利用TM衛(wèi)星影像數(shù)據(jù)反演CODMn,反演精度較高,相對誤差大多在25%以下。由此可見,現(xiàn)有模型大多數(shù)是針對湖泊、運河、沉陷區(qū)、河口等渾濁水體,以及平原地區(qū),不具有普遍性,對北方內(nèi)陸清潔水體會存在一定的局限性,可能會導(dǎo)致反演精度過低、誤差偏大。
故本研究以清河水庫為研究區(qū),利用Landsat8衛(wèi)星的OLI數(shù)據(jù),分析其與清河水庫高錳酸鹽實測數(shù)據(jù)的相關(guān)性,通過單波段、波段組合等方法,建立最小二乘支持向量機(LS-SVM)模型清河水庫水體CODMn反演監(jiān)測,同時為清河水庫及其他水庫CODMn定量反演提供理論依據(jù)。
清河水庫位于遼寧省鐵嶺市清河區(qū),東經(jīng)124°10′~124°26′,北緯42°29′~42°36′,占地面積465.09 km2,控制流域面積為2 376 km2,設(shè)計總庫容為9.71 億m3,是遼河中游左側(cè)一級支流(清河)上的一座大Ⅱ型水庫。
研究選用由美國國家航天宇航局(NASA)和美國地質(zhì)調(diào)查局(USGS)聯(lián)合發(fā)射運行的空間分辨率為30 m、重訪周期為16天的Landsat8衛(wèi)星OLI數(shù)據(jù),OLI包括了ETM+的所有波段,為了避免大氣吸收部分特征,OLI對波段進行了重新調(diào)整,新增兩個波段:海藍波段 (band 1;0.433~0.453 μm)主要應(yīng)用海岸帶觀測;短波紅外波段,又稱卷云波段(band 9;1.360~1.390 μm)包含水汽強吸收特征,可用于云檢測,具體波段劃分如表1所示。
本研究影像數(shù)據(jù)獲取時間為2015年6月23日(云量顯示為0.08 %,滿足數(shù)據(jù)對云量的要求),利用ENVI軟件對OLI數(shù)據(jù)進行輻射定標、大氣校正、幾何裁剪等預(yù)處理,得到清河水庫衛(wèi)星影像及庫區(qū)采樣點波普曲線(如圖1-4所示)。
為獲取清河水庫采樣點數(shù)據(jù),本研究采用網(wǎng)格法將25個采樣點均勻分布覆蓋在整個庫區(qū),如圖5所示。于2015年6月23日上午,天氣晴朗,利用水庫船只對庫區(qū)水面以下0.5 m處進行實地水樣采集,將采集的水樣裝入棕色瓶內(nèi)并標號,同時用GPS記錄采樣點的經(jīng)緯度。在實驗室采用滴定法,向水樣中加入定量且過量的高錳酸鉀溶液,并在沸水浴中加熱反應(yīng)一定時間,剩余的高錳酸鉀用過量的草酸鈉還原,再用高錳酸鉀溶液回滴過量的草酸鈉,通過計算求出CODMn。
表1 Landsat8-OLI波段劃分Tab.1 Landsat8-OLI Band division
圖1 清河水庫衛(wèi)星影像數(shù)據(jù)輻射定標結(jié)果Fig.1 Radiometric calibration results of satellite image data in Qinghe Reservoir
圖2 清河水庫衛(wèi)星影像數(shù)據(jù)大氣校正結(jié)果Fig.2 Atmospheric correction results of satellite image data in Qinghe Reservoir
圖3 清河水庫庫區(qū)采樣點輻射亮度值Fig.3 The radiant intensity of sampling points in Qinghe Reservoir
圖4 清河水庫庫區(qū)采樣點真實反射率Fig.4 Real reflection of sampling points in Qinghe Reservoir
圖5 研究區(qū)各采樣點地理分布Fig.5 All sampling points in the study area distribution
本文的采樣點為25個,通過ENVI對landsat8的OLI數(shù)據(jù)做輻射定標、大氣校正、裁剪處理之后,得到每個波段在采樣點的水體真實反射率,并分別將每個波段的水體真實反射率與實測值組成25組數(shù)據(jù),從中隨機選出17組數(shù)據(jù)進行建模,另外8組數(shù)據(jù)作為驗證。利用SPSS對建模數(shù)據(jù)進行Perason相關(guān)性分析,結(jié)果發(fā)現(xiàn)藍色波段(b2)、綠色波段(b3)、紅色波段(b4)、近紅外波段(b5)對CODMn較為敏感,如表2所示。
表2 波段敏感性Tab.2 Band sensitivity
從相關(guān)性系數(shù)來看,b4波段的敏感性最好為0.447,但系數(shù)相對來說過低,不能用于對清河水庫CODMn進行遙感反演研究。因此,將landsat8的OLI數(shù)據(jù)的9個波段進行波段組合,發(fā)現(xiàn)S1=b4-b2、S2=(b4-b2)/(b3-b2)、S3=b2/b4、S4=b4/b2這4種波段組合與CODMn敏感性較高,系數(shù)分別為0.568、0.632、0.687、0.701。選取Pearson系數(shù)最高的波段組合S4=b4/b2作為自變量X,實測的高錳酸鹽指數(shù)Y作為因變量,構(gòu)建比值線性回歸模型與比值非線性最小二乘支持向量機模型(LS-SVM),從中選取最適合清河水庫CODMn反演的模型。
對波段組合S4=b4/b2,其線性回歸模型可分別用一元一次、指數(shù)及一元二次3種形式進行表達,如表3所示。
表3 比值線性回歸模型Tab.3 Ratio linear regression model
但Williams[17]研究認為相關(guān)系數(shù)的大小可以評價模型的好壞,當R2在0.5~0.65之間為較差模型,R2在0.66~0.81之間為一般模型,R2在0.82~0.9之間為較好模型,R2在0.91~1之間為精準模型。則由表3可知,一元二次模型y=7.760 9x2-19.249x+14.921的相關(guān)系數(shù)最高,為0.711,但其模型標準為一般模型。
本方法基于Matlab領(lǐng)域,選用RBF函數(shù)作為LS-SVM的核函數(shù),對25組數(shù)據(jù)中的17組數(shù)據(jù)通過最小二乘支持向量機算法建立清河水庫CODMn的遙感反演監(jiān)測模型。由于一元回歸和多元回歸的方法及原理相對簡單,不能適應(yīng)非線性的預(yù)測,但支持向量機(Support Vector Machines,SVM)模型的預(yù)測在非線性、樣本小及高維模式識別問題中具有更大的優(yōu)勢[18]。支持向量機是由AT&Bell實驗室的技術(shù)人員提出的,以統(tǒng)計學(xué)理論的VC維理論和最小結(jié)構(gòu)風(fēng)險為原則,由訓(xùn)練樣本及核函數(shù)確定建立的。最小二乘支持向量機(Least square support vector machine,LS-SVM)是在標準的支持向量機的目標函數(shù)中增加了誤差平方和,對標準的支持向量機回歸方法進行優(yōu)化,把非線性空間的問題轉(zhuǎn)換到線性空間,減小其復(fù)雜程度,減低求解難度,提高求解速度[19]。其算法如下:
設(shè)訓(xùn)練樣本集為:B={(xj,yj)|j=1,2,…,K},xj∈Rn,yj∈R,xj是輸入數(shù)據(jù),yj是輸出數(shù)據(jù)。在ω空間中的函數(shù)問題可以描述為:
(1)
其中:誤差變量ej∈R,b是偏差量,γ是正則化參數(shù)。
約束條件:
(2)
其對偶問題的lagrange多項式函數(shù)為:
(3)
式中:αj∈R,為lagrange乘子。對上式求最優(yōu)解的KTT條件為:
(4)
首先,消去e和ω,再利用Mercer條件,得到如下方程:
(5)
其中:1=[1,…,1]T,Y=[y1,…,yN]T,a=[a1,…,aN]T。M為一個方陣,其第i行第j列的元素為Mij=φ(xi)Tφ(xj)=M(xi,xj);M(x,y)為核函數(shù)。用最小二乘法算出a和b,由此得到預(yù)測輸出:
(6)
式中:y(x)為預(yù)測輸出值;M(x,xj)為核函數(shù);αj為拉格朗日乘子。
本文通過對landsat8的OLI影像數(shù)據(jù)的輻射定標、大氣校正、幾何裁剪預(yù)處理,并與實測數(shù)據(jù)構(gòu)成25組數(shù)據(jù),用其中17組數(shù)據(jù)建立兩種不同遙感反演模型,把剩余8組數(shù)據(jù)的波段比值分別放入兩種模型計算CODMn的預(yù)測值,將預(yù)測值與實際值進行相關(guān)性分析如圖6所示,計算相對誤差結(jié)果如表4所示。
圖6 CODMn預(yù)測值與實際值的相關(guān)性Fig.6 Correlation between predicted value and actual value of CODMn
CODMn實測值/(mg·L-1)比值線性回歸模型預(yù)測值/(mg·L-1)相對誤差/%比值非線性LS-SVM模型預(yù)測值/(mg·L-1)相對誤差/%3.403.513.203.7811.183.103.4812.423.213.543.703.2512.063.884.963.603.2310.283.743.843.403.196.043.739.723.203.375.223.385.863.303.009.093.516.403.003.144.833.144.55
(1)本研究利用郝海森[13]以波段組合TM2/TM5為自變量建立高弗地區(qū)平原水庫CODMn定量遙感反演模型、葉圓圓[14]以波段組合B1+B2為自變量建立的日顧橋沉陷水域CODMn定量遙感反演模型、趙旭陽[15]以HJ-1數(shù)據(jù)的B4波段為自變量建立的大洋河河口水域CODMn定量遙感反演模型分別對清河水庫CODMn進行定量反演,其預(yù)測結(jié)果與實測值的平均相對誤差分別為17.82%、22.56%、27.43%,模型的精度相對較低不能滿足清河水庫CODMn的預(yù)測要求,主要原因是以上學(xué)者所研究的區(qū)域是對平原地區(qū)水庫、沉陷區(qū)水體及大河河口處,并不適用于內(nèi)陸清潔水體的清河水庫。
(2)本研究對清河水庫這種內(nèi)陸清潔水體選用landsat8-OLI數(shù)據(jù)的波段組合值與清河水庫CODMn實測值進行相關(guān)性分析,并以相關(guān)性最高的S4=b4/b2為自變量分別建立比值線性回歸模型與比值非線性LS-SVM模型對清河水庫進行定量反演。從表4可看出以比值非線性LS-SVM模型反演結(jié)果的最大誤差為11.18%、最小誤差為3.54%、平均相對誤差為6.26%,反演相對誤差在10%以下的7個;以比值線性回歸模型中相關(guān)性最高的一元二次多項式模型反演結(jié)果的最大誤差為12.42%、最小誤差為3.20%、平均相對誤差為7.89%,反演相對誤差在10%以下的5個;且比值非線性LS-SVM模型預(yù)測值與實測值的相關(guān)性R2=0.942 7大于比值線性一元二次多項式模型預(yù)測值與實測值的相關(guān)性R2=0.693 1,而比值非線性LS-SVM模型的誤差算數(shù)平方根RMSE=2.71、平均相對誤差6.26%也小于比值線性一元二次多項式模型的誤差算數(shù)平方根RMSE=4.76、平均相對誤差7.89%。
由此可知比值非線性LS-SVM模型的預(yù)測效果要遠好于比值線性一元二次多項式模型,因此利用比值非線性LS-SVM模型對2015年6月23日的清河水庫庫區(qū)CODMn進行反演,其濃度分布如圖7所示。
圖7 清河水庫CODMn分布Fig.7 The distribution map of Qinghe Reservoir of CODMn
從圖7中可以清楚看出清河水庫庫區(qū)在壩前的CODMn大部分處于4~6 mg/L之間,對于二類水的清河水庫來說相對較高;而在入庫口處,CODMn也主要是出于2~3 mg/L;在庫區(qū)的邊緣個別部分的CODMn較高,不是很多;但在整個庫區(qū)中CODMn大部分還是處于3~6 mg/L,這主要是由于反演時間為2015年6月23日,6月為鐵嶺氣候干燥,降雨較少,水庫庫容較少的時候,再加上周邊的工廠、養(yǎng)殖場及生活污水攜帶大量的有機物質(zhì)進入庫區(qū),導(dǎo)致庫區(qū)中有機腐殖含量較高,因此清河水庫庫區(qū)反演的CODMn相對較高。
本文用實時遙感影像數(shù)據(jù)與實測數(shù)據(jù)建立適用于清河水庫CODMn反演監(jiān)測的最小二乘支持向量機模型。但由于水體中存在多種復(fù)雜、相互影響的光學(xué)活性物質(zhì),在很大程度上影響了水質(zhì)參數(shù)的反演精度,且本次所用的建模數(shù)據(jù)與檢驗數(shù)據(jù)相對較少,在今后的研究中應(yīng)再加密采樣點,加大訓(xùn)練數(shù)據(jù)量,同時增加采樣周期,使模型的精度更高,反演效果更好。
□
[1] Ministry of Health,Labour and Welfare.Health Minisrty Ordinance 101
Guidelines for Japanese Drinking Water Quality[M].Tokyo: Act Press,2004.
[2] 邢 竹,朱德新.關(guān)于高錳酸鉀指數(shù)測定中影響因素的初探[J].廣東化工,2012,39(2):203.
[3] Merman Ministry of Health Regulation on the Quality of Water for Human Consumption[Z]. Hamburg :Felix Meiner Press,2001.
[4] 煙貫發(fā),齊少群,張思沖,等.松花江哈爾濱江段高錳酸鹽指數(shù)的遙感反演[J].環(huán)境化學(xué),2013,32(9):1 798-1 804.
[5] 宋 瑜,宋曉東,江 洪,等.基于定量遙感反演的內(nèi)陸水體藻類監(jiān)測[J].光譜學(xué)與光譜分析,2010,30(4):1 075-1 079.
[6] 尹 改,王 橋,鄭丙輝,等.國家環(huán)??偩謱χ袊Y源衛(wèi)星的需求與分析(上)[J].中國航天,1999,(9):3-7.
[7] A.G.Dekker,S.W.M.Peter. The use of the Thematic Mapper for the analysis of eutorphic lakes: a case study in the Netherlands[J]. International Journal of Remote Sensing,1993,14(5):799-821.
[8] John M,Melack,Mary Gastil.Airborne remote sensing of chlorophyll distributions in Mono Lake[J].California Hydrobiologia,2001,466:31-38.
[9] Hoogenboom H J,Dekker A G,Dehaan J F.Retrieval of chlorophyll and suspended matter in inland waters from CASI data by matrix inversion[J].Canadian Journal of Remote Sensing, 1998,24(2):144-152.
[10] 祝令亞.湖泊水質(zhì)遙感監(jiān)測與評價方法研究[D].北京:中國科學(xué)院,2006.
[11] 蔣金雄.內(nèi)陸水體水質(zhì)遙感監(jiān)測[D]. 北京:北京交通大學(xué),2009.
[12] 趙玉芹,汪西莉,蔣 賽,等.渭河水質(zhì)遙感反演的人工神經(jīng)網(wǎng)絡(luò)模型研究[J].遙感技術(shù)與應(yīng)用,2009,(1):63-67.
[13] 郝海森,曹志勇,莫金平,等.高弗地區(qū)平原水庫高錳酸鉀指數(shù)的定量遙感研究[J].中國農(nóng)村水利水電,2011,(6):44-48.
[14] 葉圓圓.基于RS淮南采煤沉陷水域水質(zhì)實時監(jiān)測技術(shù)研究[D]. 安徽淮南:安徽理工大學(xué),2014.
[15] 王 皓.基于HJ_1星數(shù)據(jù)的大洋河河口水域水質(zhì)參數(shù)反演研究[D]. 遼寧大連:遼寧師范大學(xué),2012.
[16] 胡舉波.黃浦江上游水域水質(zhì)遙感監(jiān)測模型的研究[D]. 上海:同濟大學(xué),2006.
[17] Williams A.N, Grabau W E. Sediment Concentration Mapping in Tidal Estuaries.Third Earth Resources Technology Satellite-1 Symposium[Z]. NASA SP-351,1973,1:1 347-1 386.
[18] 徐紅敏.基于支持向量機理論的水環(huán)境質(zhì)量預(yù)測與評價方法研究[D]. 長春:吉林大學(xué),2007.
[19] 閻威武,邵惠鶴.支持向量機和最小二乘支持向量機的比較及應(yīng)用研究[J]. 控制與決策,2003,18(3):358-360.