楊 朔
(濟南市水文中心,山東 濟南 250000)
在機器學(xué)習(xí)方法普及之前,調(diào)洪演算主要采用傳統(tǒng)的半圖解法和列表試算法等方法。半圖解法是較為有效和快捷的方法,但該方法需要借助輔助線,對每一計算時段的V2和q2通過量取、查找計算得到結(jié)果,不僅計算工作量大,而且其計算精度受到較大的人為影響[1,2]。對這些方法進行深入的分析,發(fā)現(xiàn)其存在的一些問題。數(shù)值解析法對水位庫容曲線、水位泄流能力曲線的擬合要求比較高,而現(xiàn)有的方法大多是采用線性插值或者高階多項式插值的方法,線性插值的較大誤差和高階多項式可能出現(xiàn)的龍格現(xiàn)象,大大降低了數(shù)值解析法精度[3,4];牛頓迭代法由于需要求出水位庫容曲線和水位泄流能力曲線的一階導(dǎo)數(shù),從而會產(chǎn)生較大的誤差和計算量[5,6]。
本文主要研究機器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)方法和高斯回歸在調(diào)洪演算中的應(yīng)用,并與試算法的調(diào)洪演算結(jié)果和實際的泄洪過程線進行比較分析,該研究結(jié)果不僅可為機器學(xué)習(xí)方法進行調(diào)洪演算提供理論支撐,而且可以對大壩設(shè)計過程中水文設(shè)計提供參考。
利用試算法進行調(diào)洪,在計算過程中,每一時段的初始入庫流量Q1、時段末入庫流量Q2、q1、V1都可看作已知。其步驟如下:
a)根據(jù)已知水庫水位容積關(guān)系曲線V~Z和泄洪建筑物方案,用水力學(xué)公式求出下泄流量與庫容關(guān)系曲線q~Z,并將V~Z,q~Z繪制在圖上;
b)決定開始計算時刻和此時的q1、V1,然后列表試算,試算過程中,對每一時段的q2、V2進行試算;
c)將計算結(jié)果繪成曲線:Q~t、q~t在一張圖上,Z~t曲線繪制在下方。
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)系統(tǒng)是20世紀40年代后出現(xiàn)的。它是由眾多的神經(jīng)元可調(diào)的連接權(quán)值連接而成,具有大規(guī)模并行處理、分布式信息存儲、良好的自組織自學(xué)習(xí)能力等特點。BP(Back Propagation)算法又稱為誤差反向傳播算法,是人工神經(jīng)網(wǎng)絡(luò)中的一種監(jiān)督式的學(xué)習(xí)算法。BP神經(jīng)網(wǎng)絡(luò)算法在理論上可以逼近任意函數(shù),基本的結(jié)構(gòu)由非線性變化單元組成,具有很強的非線性映射能力。而且網(wǎng)絡(luò)的中間層數(shù)、各層的處理單元數(shù)及網(wǎng)絡(luò)的學(xué)習(xí)系數(shù)等參數(shù)可根據(jù)具體情況設(shè)定,靈活性很大,神經(jīng)網(wǎng)絡(luò)的示意圖如圖1所示。
高斯過程回歸(Gaussian Process Regression,GPR)是使用高斯過程先驗對數(shù)據(jù)進行回歸分析的非參數(shù)模型。GPR的模型假設(shè)包括噪聲(回歸殘差)和高斯過程先驗兩部分,其求解按貝葉斯推斷進行。若不限制核函數(shù)的形式,GPR在理論上是空間內(nèi)任意連續(xù)函數(shù)的通用近似。此外,GPR可提供預(yù)測結(jié)果的后驗,且在似然為正態(tài)分布時,該后驗分布具有解析形式。因此,GPR是一個具有泛用性和解析性的概率模型,基于高斯過程及其核函數(shù)所具有的便利性質(zhì),GPR在時間序列分析的問題中應(yīng)用較好。
某水電站系某流域多級開發(fā)中規(guī)模最大的水電站。流域面積4 847 km,多年平均流量164 m3/s,年徑流量35億m3,具有徑流豐沛、河谷狹窄、落差集中、地質(zhì)條件好、淹沒耕地少、發(fā)電效益高等特點。樞紐布置為常態(tài)混凝土重力壩,壩后式廠房分布,裝機3×16.5 MW。攔河大壩以弧形閘門攔蓄洪水,大壩最大壩高92 m,庫容1.19億m3,壩頂5孔12×16 m的泄洪閘,能安全抵擋1 000年一遇的特大洪水。水電站正常蓄水位395.0 m,多年平均設(shè)計發(fā)電量0.55 kW·h,年利用小時1 400 h,作為該流域規(guī)模最大水電站,不僅增強了該地區(qū)的洪水調(diào)節(jié)能力,同時也為其經(jīng)濟增長注入了活力。
基于此工程多年運行的數(shù)據(jù)分別采用神經(jīng)網(wǎng)絡(luò)方法和高斯回歸分析法進行調(diào)洪演算,隨后對于其日出庫徑流量的預(yù)測結(jié)果與實測結(jié)果進行分析比較。
為了提高調(diào)洪演算的精度及效率,采用了神經(jīng)網(wǎng)絡(luò)的方法。圖1為輸入的學(xué)習(xí)參數(shù)之間的回歸圖,神經(jīng)網(wǎng)絡(luò)模型預(yù)測的結(jié)果在表1中進行了詳細說明,首先使用2 110組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),452組數(shù)據(jù)作為驗證數(shù)據(jù),452組數(shù)據(jù)作為測試數(shù)據(jù),模型整體的誤差較小。神經(jīng)網(wǎng)絡(luò)模型誤差結(jié)果表明,ANN模型進行調(diào)洪演算有較好的結(jié)果,神經(jīng)網(wǎng)絡(luò)模型預(yù)測的泄洪過程線如圖3。
表1 神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果的誤差
圖1 神經(jīng)網(wǎng)絡(luò)回歸圖
將學(xué)習(xí)的數(shù)據(jù)導(dǎo)入程序進行高斯歸回的分析,回歸過程圖如圖2所示,由此可見,計算的誤差較小。
圖2 高斯回歸圖
以上兩種方法分別進行計算,將其結(jié)果在一張坐標圖中表示,如圖3所示。對比計算結(jié)果,神經(jīng)網(wǎng)絡(luò)模型與高斯回歸模型計算值與實際值擬合效果較好,誤差均較小,從數(shù)值上看神經(jīng)網(wǎng)絡(luò)模型的誤差最小,高斯回歸的誤差較小且計算速度較快。
圖3 不同方法進行調(diào)洪演算結(jié)果比較圖
表2 不同模型計算結(jié)果的比較
本文針對調(diào)洪演算的主要方法神經(jīng)網(wǎng)絡(luò)方法和高斯回歸方法進行研究分析,以某水電站洪水過程線為例分別采用兩種方法進行了調(diào)洪演算,與真實的泄洪過程進行比較分析。主要得到以下幾個方面的結(jié)論:
1)神經(jīng)網(wǎng)絡(luò)方法由于具有很強的自學(xué)習(xí)性、自組織性和自適應(yīng)能力,因而,在水庫調(diào)洪演算過程中表現(xiàn)出許多優(yōu)點,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程中的大量參數(shù)是學(xué)習(xí)所得,不受人為因素影響,預(yù)報結(jié)果準確、精度高,但其學(xué)習(xí)時間比高斯回歸分析較長。
2)高斯回歸分析相對于神經(jīng)網(wǎng)絡(luò)方法,其收斂的速度較快且誤差在可接受的范圍內(nèi),因此,對于一般工程,建議采用高斯回歸分析進行調(diào)洪演算。