陳吉江,毛洪翔,李鵬程,夏國(guó)團(tuán),章衛(wèi)軍
(1. 余姚市水利局,浙江余姚 315400; 2. 宜水環(huán)境科技(上海)有限公司,上海 200125)
目前,水質(zhì)預(yù)測(cè)主要利用監(jiān)測(cè)的歷史數(shù)據(jù)作為初始序列或訓(xùn)練數(shù)據(jù),運(yùn)用不同數(shù)學(xué)邏輯方法推算在各類(lèi)影響因素作用下未來(lái)水質(zhì)數(shù)據(jù)的發(fā)展趨勢(shì)[1]。方法有時(shí)間序列模型[2]、灰色理論模型[3]、模糊理論模型[4]、回歸模型和動(dòng)態(tài)系統(tǒng)物元模型[5],以及近年來(lái)得到應(yīng)用的人工神經(jīng)網(wǎng)絡(luò)[6]等。其中,基于自回歸的時(shí)間序列模型,理論基礎(chǔ)堅(jiān)實(shí),計(jì)算方法簡(jiǎn)便,在水質(zhì)預(yù)測(cè)中受到普遍歡迎,得到廣泛應(yīng)用。基于自回歸的水質(zhì)預(yù)測(cè)方法可以有多種型式,如①單一自回歸模型, 即對(duì)時(shí)間序列建立單一自回歸方程進(jìn)行預(yù)測(cè);②小波分解+雙自回歸,即預(yù)先對(duì)時(shí)間序列進(jìn)行小波分解,然后對(duì)分解所得的高、低頻序列分別建立各自的自回歸方程,最后以高、低頻自回歸方程計(jì)算值的疊加值作為預(yù)測(cè)值;③自回歸+卡爾曼濾波,即對(duì)單一自回歸模型求得的預(yù)測(cè)值,采用卡爾曼濾波進(jìn)行校正,作為最終預(yù)測(cè)值;④小波分解+雙自回歸+卡爾曼濾波,即對(duì)小波分解+雙自回歸模型求得的預(yù)測(cè)值,采用卡爾曼濾波進(jìn)行校正,作為最終預(yù)測(cè)值。進(jìn)行水質(zhì)預(yù)測(cè)時(shí),為了盡量提高預(yù)測(cè)的精度,要根據(jù)水庫(kù)水質(zhì)監(jiān)測(cè)資料的實(shí)際情況,合理選擇模型,這點(diǎn)至關(guān)重要。
一些水庫(kù)的水質(zhì)監(jiān)測(cè)數(shù)據(jù)序列在頻域上存在著明顯的高頻部分和低頻部分。自回歸預(yù)測(cè)模型的方法基于時(shí)間序列的平穩(wěn)假設(shè),對(duì)數(shù)據(jù)的平穩(wěn)性要求較高。如果把時(shí)間序列看做一種信號(hào),通過(guò)將原始信號(hào)分離成低頻信號(hào)和高頻信號(hào),必然可以提高時(shí)間序列的平穩(wěn)性,從而提高自回歸預(yù)測(cè)模型的精度。因此,本文選擇上述第2種模型,對(duì)其原理、步驟及預(yù)測(cè)成果(以梁輝水庫(kù)為例)進(jìn)行介紹,并與單一自回歸模型預(yù)測(cè)成果進(jìn)行比較。
水質(zhì)監(jiān)測(cè)數(shù)據(jù)序列的預(yù)處理采用離散小波變換,多尺度離散小波變換能將原始信號(hào)(也就是原始水質(zhì)監(jiān)測(cè)數(shù)據(jù)序列)進(jìn)行不同時(shí)間分辨率上的分解。以分解層數(shù)n為例,其一般步驟為先將原始信號(hào)S分解為低頻部分c1和高頻部分d1,然后對(duì)低頻部分c1進(jìn)一步分解為c2和d2,以此類(lèi)推,逐層分解[7]。
多尺度小波分解與重構(gòu)一般通過(guò)Mallat算法實(shí)現(xiàn)[8]。Mallat算法理論如下:設(shè)Vj是L2(R)中的一個(gè)多分辨率的分析,φ為尺度函數(shù),ψj,n為小波函數(shù),Mallat算法的分解式如下:
(1)
式中:H為低通濾波器;G為高通濾波器。通過(guò)式(1)可以將原始信號(hào)分解為d1,d2,…,dj和cj(j為最大分解層數(shù)),cj和dj分別稱(chēng)為原始信號(hào)在分辨率為2-j的低頻信號(hào)和高頻信號(hào)。
為保證水質(zhì)預(yù)測(cè)結(jié)果更加可靠,分解后還必須利用Mallat算法分別重構(gòu)分解后的高頻和低頻信號(hào)[9],使它們的樣本數(shù)與原信號(hào)S的樣本數(shù)一致,重構(gòu)描述公式如下:
(2)
式中:H*和G*分別是H和G的對(duì)偶算子。
采用上式對(duì)小波分解后的信號(hào)進(jìn)行重構(gòu),且有:T=D1+D2+…+Dj+Cj
(3)
式中:D1,D2,…,Dj分別為第1層、第2層、…、第j層高頻信號(hào)重構(gòu)結(jié)果;Cj為第j層低頻信號(hào)重構(gòu)結(jié)果。
(4)
(5)
上述方法中,用最小二乘法進(jìn)行參數(shù)估計(jì)非常簡(jiǎn)單,參數(shù)估計(jì)無(wú)偏,精度高,可表示為以下方程組:
(6)
則Φ的最小二乘估計(jì)為:φ=(xTx)-1xTY
(7)
本文則以直接最小二乘估計(jì)和Akaike信息檢驗(yàn)準(zhǔn)則的FPE(Final Prediction Error),AIC(Akaike Information Criterion) ,BIC 準(zhǔn)則結(jié)合具體計(jì)算成果進(jìn)行討論。準(zhǔn)則的具體計(jì)算公式如下:
(8)
(9)
(10)
在各自的準(zhǔn)則函數(shù)取得最小值時(shí)的模型為適用模型。
該模型建模共分以下5個(gè)步驟: ①利用多尺度小波分析理論對(duì)水質(zhì)數(shù)據(jù)序列進(jìn)行多尺度分解,得到數(shù)據(jù)序列的低頻信號(hào)和高頻信號(hào);②通過(guò)低通濾波器和高通濾波器的對(duì)偶算子分別重構(gòu)水質(zhì)信號(hào)的低頻部分和高頻部分;③對(duì)重構(gòu)后的高頻信號(hào)(D1,D2,…)和低頻信號(hào)(Cj)自回歸模型進(jìn)行定階和參數(shù)估計(jì),并對(duì)模型的適用性進(jìn)行檢驗(yàn),最后分別建立J+1個(gè)自回歸模型;④建立的自回歸模型分別預(yù)測(cè)各層重構(gòu)后的高頻信號(hào)和低頻信號(hào);⑤疊加各層預(yù)測(cè)值得出下一個(gè)時(shí)刻的預(yù)測(cè)結(jié)果。
以梁輝水庫(kù)為例,詳細(xì)說(shuō)明小波分解高、低頻雙自回歸模型進(jìn)行水庫(kù)水質(zhì)預(yù)測(cè)的具體過(guò)程。梁輝水庫(kù)位于余姚市梨洲街道南廟村,流域面積35.06 km2,是一座以防洪、供水為主,結(jié)合發(fā)電、水產(chǎn)等綜合利用功能的中型水庫(kù),總庫(kù)容3 152.3萬(wàn)m3。根據(jù)浙江省水資源監(jiān)測(cè)中心余姚監(jiān)測(cè)站多年的人工水質(zhì)監(jiān)測(cè)數(shù)據(jù),影響其水質(zhì)的主要因素為pH(酸堿度)、DO(dissolved oxygen-溶解氧)、TN(total nitrogen-總氮)、TP(total phosphorus-總磷) 。
選取2005年1月至2011年12月的水質(zhì)指標(biāo)(PH,DO,TN,TP)數(shù)據(jù)用于預(yù)測(cè)模型的建立,2012年1月至2012年12月的數(shù)據(jù)用于預(yù)測(cè)結(jié)果的對(duì)比驗(yàn)證。由于篇幅的限制,只以DO水質(zhì)指標(biāo)為例。
(a) 低 頻 (b) 高 頻圖1 DO 小波分解Fig.1 DO wavelet low frequency and high frequency diagram
為避免分層過(guò)多造成各層預(yù)測(cè)誤差的疊加現(xiàn)象,故對(duì)水質(zhì)監(jiān)測(cè)數(shù)據(jù)序列進(jìn)行一層分解。將DO序列分解,所得到的高頻與低頻序列如圖1。
(a) 方差和FPC曲線(xiàn) (b) AIC和BIC曲線(xiàn) 圖2 由DO高頻數(shù)據(jù)所得的方差和各準(zhǔn)則函數(shù)曲線(xiàn)Fig.2 Variance and standard curves given by DO high frequency data
同理可以得到低頻系列的AR模型參數(shù)。
最后將高頻低頻的系列值疊加,得到小波分解高、低頻雙自回歸模型的率定期和預(yù)測(cè)期的DO過(guò)程(圖3)。
(a) 率定期模擬 (b) 預(yù)測(cè)期模擬圖3 小波分解高、低頻雙自回歸模型模擬DO的率定期和預(yù)測(cè)期Fig.3 Simulation results of wavelet decomposition high and low frequency double autoregressive model for DO in the period of calibration and predication
由圖3可見(jiàn),小波分解高、低頻雙自回歸模型得到的率定期和預(yù)測(cè)期模擬效果較好,通過(guò)計(jì)算其相對(duì)誤差的平均值可知率定期模擬的平均相對(duì)誤差為4.23%,預(yù)測(cè)期的平均相對(duì)誤差為4.34%。因此,對(duì)于DO數(shù)據(jù)系列,小波分解高、低頻雙自回歸模型得到了令人滿(mǎn)意的預(yù)測(cè)效果。這一模型與單一自回歸模型的應(yīng)用效果對(duì)比見(jiàn)表1。
表1 小波分解高、低頻雙自回歸模型與單一自回歸模型的應(yīng)用效果對(duì)比Tab.1 Comparison between application effects of the wavelet decomposition of high and
由表1可見(jiàn),不管是在率定期還是在檢驗(yàn)期,小波分解高、低頻雙自回歸模型的模擬精度大大優(yōu)于單一自回歸模型。
從數(shù)據(jù)序列平穩(wěn)性角度出發(fā),將多尺度小波分析理論方法與自回歸模型相結(jié)合,提出了小波分解高、低頻雙自回歸模型的方法,并將其應(yīng)用于水質(zhì)預(yù)測(cè)中。分析結(jié)果表明:
(1)小波的多層分解可以過(guò)濾出更加精細(xì)的數(shù)據(jù)信號(hào)系列,但在建立自回歸模型時(shí),各層預(yù)測(cè)誤差會(huì)出現(xiàn)疊加現(xiàn)象,為避免多個(gè)系列誤差的疊加現(xiàn)象,層數(shù)不宜過(guò)多,一般作一層分解。
(2)不管是在率定期還是在檢驗(yàn)期,小波分解高、低頻雙自回歸模型的模擬精度均大大優(yōu)于單一自回歸模型,表明了這一模型的可行性與實(shí)用價(jià)值。
(3)定期復(fù)核,動(dòng)態(tài)優(yōu)化模型參數(shù)。自回歸模型基于歷史系列進(jìn)行模型參數(shù)的率定,因此,隨著歷史序列數(shù)據(jù)的增加,數(shù)據(jù)樣本容量增加,自回歸模型的參數(shù)宜每隔幾年做必要的復(fù)核,以動(dòng)態(tài)識(shí)別參數(shù),保證模型的適用性及精度,必要時(shí)可采用卡爾曼濾波實(shí)時(shí)校正。由于自回歸方法本身的局限性(僅僅從歷史數(shù)據(jù)推測(cè)未來(lái)的演變情況),當(dāng)出現(xiàn)突發(fā)污染事件的情況下,小波分解高、低頻雙自回歸模型的預(yù)測(cè)精度可能達(dá)不到要求,這時(shí)可以結(jié)合水庫(kù)的具體情況,采用卡爾曼濾波進(jìn)行實(shí)時(shí)校正,即上面介紹的第4種模型(小波分解+雙自回歸+卡爾曼濾波)。
參 考 文 獻(xiàn):
[1]黃國(guó)如, 芮孝芳. 流域降雨徑流時(shí)間序列的混沌識(shí)別及其預(yù)測(cè)研究進(jìn)展[J]. 水科學(xué)進(jìn)展, 2004, 15(2): 255-260. (HUANG Guo-ru, RUI Xiao-fang. Study advances in diagnosis of chaotic behaviour and its prediction for rainfall and streamflow time series in watershed[J]. Advances in Water Science, 2004, 15(2): 255-260. (in Chinese))
[2]翟顥瑾, 高晶. 長(zhǎng)江未來(lái)水質(zhì)污染的時(shí)間序列分析[J]. 沈陽(yáng)師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2006, 24(1): 22-24. (ZHAI Hao-jin, GAO Jing. Time series analysis of future water pollution in Yangtze River[J]. Journal of Shenyang Normal University (Natural Science), 2006, 24(1): 22-24. (in Chinese))
[3]王開(kāi)章, 劉福勝, 孫鳴. 灰色模型在大武水源地水質(zhì)預(yù)測(cè)中的應(yīng)用[J]. 山東農(nóng)業(yè)大學(xué)學(xué)報(bào): 自然科學(xué)版, 2002, 33(1): 66-71. (WANG Kai-zhang, LIU Fu-sheng, SUN Ming. The application of greymodel in Dawu water quality predication water resource site[J]. Journal of Shandong Agricultural University (Natural Science), 2002, 33(1): 66-71. (in Chinese))
[4]汪萬(wàn)芬, 譚綠貴, 劉曉升. 基于模糊綜合評(píng)價(jià)法的淠河水環(huán)境質(zhì)量評(píng)價(jià)[J]. 資源開(kāi)發(fā)與市場(chǎng), 2008, 24(5): 411- 413. (WANG Wan-fen, TAN Lü-gui, LIU Xiao-sheng. Water quality assessment of Pihe River based on fuzzy comprehensive evaluation[J]. Resource Development & Market, 2008, 24(5): 411- 413. (in Chinese))
[5]萬(wàn)金保, 朱邦輝. 物元模型在廬山風(fēng)景名勝區(qū)水環(huán)境質(zhì)量評(píng)價(jià)中的應(yīng)用[J]. 安徽農(nóng)業(yè)科學(xué), 2010, 38(6): 3094-3097. (WAN Jin-bao, ZHU Bang-hui. Application of matter element model in water environment quality of Lushan scenic areas[J]. Journal of Anhui Agriculture Science, 2010, 38(6): 3094-3097. (in Chinese))
[6]田建平, 曹東衛(wèi), 李海楠. LM-BP神經(jīng)網(wǎng)絡(luò)在于橋水庫(kù)水質(zhì)預(yù)測(cè)中的應(yīng)用[J]. 水利信息化, 2010(3): 31-34. (TIAN Jian-ping, CAO Dong-wei, LI Hai-nan. Application of LM-BP neural network in water quality prediction for Yuqiao reservoir[J]. Water Resources Informatization, 2010(3): 31-34. (in Chinese))
[7]MALLAT S G. A theory for multiresolution signal decomposition: the wavelet representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1989, 11(7): 674-693.
[8]徐偉, 何金平. 基于多尺度小波分析的大壩變形自回歸預(yù)測(cè)模型[J]. 武漢大學(xué)學(xué)報(bào): 工學(xué)版[J]. 2012, 45(3): 285-289. (XU Wei, HE Jin-ping. Forecast model of dam deformation based on multi-scale wavelet analysis and autoregressive method[J]. Engineering Journal of Wuhan University: 2012, 45(3): 285-289. (in Chinese))
[9]顧嵐, 安鴻志. 自回歸模型的精細(xì)結(jié)構(gòu)與統(tǒng)計(jì)分析[J]. 應(yīng)用數(shù)學(xué)學(xué)報(bào), 1985, 8(4): 433- 445. (GU Lan, AN Hong-zhi. Statistical analysis of subset AR models[J]. Acta Mathematicae Applicatae Sinica, 1985, 8(4): 433- 445. (in Chinese))