童俊
摘 要:?介紹了用于水質(zhì)預(yù)測的Support Vector Regerssion (SVR)及Autoregressive Integrated Moving Average model (ARIMA)兩種回歸模型的優(yōu)缺點(diǎn),以金澤水庫取水口水質(zhì)氨氮為例,構(gòu)建SVR-ARIMA組合模型,通過模型和實(shí)際數(shù)據(jù)驗(yàn)證了SVR-ARIMA模型的可預(yù)測性,預(yù)測效果優(yōu)于單模型,短期的水質(zhì)預(yù)測模型較準(zhǔn)確的預(yù)測了金澤水庫取水口的水質(zhì),可為水庫取水水質(zhì)提供支撐。
關(guān)鍵詞:?水質(zhì); 時(shí)間序列數(shù)據(jù); SVR; ARIMA; SVR-ARIMA模型
中圖分類號: TP 311
文獻(xiàn)標(biāo)志碼: A
Prediction of Ammonia Nitrogen in Jinze Reservoir Based on
SVR-ARIMA Combination Model
TONG Jun
(Shanghai Municipal Monitor Center of Water Supply, Shanghai 200002, China)
Abstract:
This paper introduces the advantages and disadvantages of SVR and ARIMA regression models for water quality prediction. The SVR-ARIMA combination model is constructed based on the ammonia nitrogen data of Jinze Reservoir. The model and actual data verification shows that the SVR-ARIMA model is predictable. The prediction effect is better than the single model. The short-term water quality prediction model is used to predict the water quality of the reservoir intake accurately and give the support to ensure water quality of the reservoir.
Key words:
water quality; time series data; SVR; ARIMA; SVR-ARIMA model
0 引言
隨著生產(chǎn)生活用水的增加,水資源的利用成為研究的熱點(diǎn)[1],而水質(zhì)是水資源能否高效合理利用的關(guān)鍵,因此研究水質(zhì)的變化趨勢是極其迫切和必要的。以往對于水質(zhì)的研究常常局限于從生物化學(xué)角度出發(fā)[2],從水源地采樣進(jìn)行生物、化學(xué)機(jī)理性分析,研究其組成成分,按照人為規(guī)定的指標(biāo)對其參數(shù)進(jìn)行比對以確定所采水樣的各項(xiàng)指標(biāo)是否達(dá)到一定的標(biāo)準(zhǔn)[3],這一類的研究特點(diǎn)是效果好、研究檢測目標(biāo)明確,但從采樣到分析結(jié)果報(bào)告,水質(zhì)檢測周期較長,對于一些突發(fā)的水質(zhì)污染反應(yīng)時(shí)間慢,無法及時(shí)應(yīng)對。因此有必要進(jìn)行基于非機(jī)理性的水質(zhì)參數(shù)預(yù)測[4]。為了對水質(zhì)參數(shù)進(jìn)行更好的預(yù)測研究,需要分別對其線性特點(diǎn)和非線性特點(diǎn)進(jìn)行有針對性的分析。支持回歸向量機(jī)模型(SVR)[5]通常對于非線性的數(shù)據(jù)有一定的預(yù)測效果,而ARIMA模型[6]則對于線性的時(shí)間序列預(yù)測有較好的效果,本文采取結(jié)合SVR和ARIMA模型兩者的優(yōu)勢,通過優(yōu)勢互補(bǔ),建立SVR-ARIMA組合模型[7]對水質(zhì)進(jìn)行預(yù)測,以氨氮為例,研究其變化規(guī)律。
1 數(shù)據(jù)來源和數(shù)據(jù)特征分析
1.1 數(shù)據(jù)來源
本文數(shù)據(jù)的時(shí)間為2017年11月—2018年11月,水質(zhì)數(shù)據(jù)以氨氮為例。水質(zhì)數(shù)據(jù)是每小時(shí)金澤水庫取水口的在線實(shí)測數(shù)據(jù)。由于水質(zhì)數(shù)據(jù)每小時(shí)變化的緩慢性和受上游水質(zhì)變化的影響,因此呈現(xiàn)出一定的時(shí)間序列特性。
1.2 水質(zhì)數(shù)據(jù)特性分析
如圖1所示。
實(shí)線為金澤水庫取水口的水質(zhì)氨氮參數(shù),紅色虛線則反映了整個(gè)時(shí)段的水質(zhì)氨氮指標(biāo)的變化趨勢。通過分析,取水口的水質(zhì)數(shù)據(jù)主要呈現(xiàn)出如下的特點(diǎn):第一、夏季4—5月是上游來水較大,藻類增多水質(zhì)變化呈現(xiàn)出較強(qiáng)的非線性特點(diǎn);第二、8—9月由于秋季上游來水減少,水質(zhì)變化較小;第三、在冬季到春季10—3月由于河流水量減少,汛期未到,河流兩岸排污,氨氮總體含量偏高。除了一些極端的天氣如驟降暴雨、臺風(fēng)的侵襲等影響,其他時(shí)段水質(zhì)的變化趨勢總體較為平穩(wěn)。
2 水質(zhì)預(yù)測模型
2.1 支持向量機(jī)回歸模型SVR
Vapnik及其合作者提出了支持向量機(jī)(SVM)[8],SVR作為SVM的一個(gè)變種的模型,由于其很強(qiáng)的非線性擬合能力,目前被用于各行各業(yè),如電力負(fù)荷預(yù)測、金融股票預(yù)測等領(lǐng)域。支持向量回歸及SVR通過引入ε不敏感損失函數(shù)從而達(dá)到實(shí)現(xiàn)回歸的目的,例如,一組訓(xùn)練樣本數(shù)據(jù):
的回歸問題可以看成要找到一個(gè)函數(shù)f∈F={f|f·Rn→R}
(F為假設(shè)函數(shù)集)使得在訓(xùn)練樣本上該函數(shù)值f(x)與期望值y之間的誤差不大于給定的值ε。
現(xiàn)假設(shè)f(x)=ωT(x)+b,其中ω為權(quán)重矢量,b為閾值。引入不敏感損失函數(shù)ε,支持向量機(jī)回歸表示為下面的問題,如式(1)—(3)。
其中C>0為懲罰參數(shù),表示樣本擬合精度核函數(shù)回歸模型的復(fù)雜度之間的折中參數(shù),C值越大表示擬合效果越好,松弛變量用
ξi和ξ*i表示。引入拉格朗日乘子αi和α*i及核函數(shù),再利用對偶原理,將上式轉(zhuǎn)化為其對偶問題,如式(4)—(7)。