,, ,,
(1.長江科學院 a.水資源綜合利用研究所;b.流域水資源與生態(tài)環(huán)境科學湖北省重點實驗室,武漢 430010;2.武漢大學 水資源與水電工程科學國家重點實驗室,武漢 430072)
耦合動態(tài)方程的神經(jīng)網(wǎng)絡模型在水質(zhì)預測中的應用
周彥辰1a,1b,2,胡鐵松2,陳進1a,1b,許繼軍1a,1b,周研來1a,1b
(1.長江科學院 a.水資源綜合利用研究所;b.流域水資源與生態(tài)環(huán)境科學湖北省重點實驗室,武漢 430010;2.武漢大學 水資源與水電工程科學國家重點實驗室,武漢 430072)
水質(zhì)變化趨勢的有效預測對于水資源綜合管理具有重要意義。針對現(xiàn)有數(shù)據(jù)驅(qū)動模型不能有效反映研究對象物理機理的問題,提出了一種耦合動態(tài)方程的神經(jīng)網(wǎng)絡模型,并給出了動態(tài)方程的耦合方法。分別從數(shù)值算例和實際案例2個方面對傳統(tǒng)網(wǎng)絡模型和機理先驗前饋網(wǎng)絡模型進行了對比計算分析,擬合程度指標和計算誤差指標都表明機理性先驗知識的加入可以提高網(wǎng)絡模型的預測精度和非線性擬合能力。同時,該模型在水質(zhì)預測中具有適用性和合理性。在樣本數(shù)量一定的情況下,機理性先驗知識的耦合是進一步提高網(wǎng)絡計算精度的有效途徑。
水質(zhì)預測;神經(jīng)網(wǎng)絡模型;耦合動態(tài)方程;機理性先驗知識;Mackey-Glass混沌系統(tǒng)
準確預測重要水體的水質(zhì)變化趨勢對采取治理措施、建立決策預警機制具有重要意義。目前進行水質(zhì)預測和評價的主要手段包括數(shù)值模擬模型和數(shù)據(jù)驅(qū)動模型2類[1],其中數(shù)據(jù)驅(qū)動模型由于輸出結(jié)果快而得到廣泛的應用,如神經(jīng)網(wǎng)絡預測模型,在具有一定數(shù)量早期監(jiān)測數(shù)據(jù)的情況下可輸出滿足精度要求的計算結(jié)果[2-3]。數(shù)據(jù)驅(qū)動模型多采用黑箱模型形式,計算過程中并不需要考慮研究對象的物理機理,然而相關研究人員對這些物理機理并非一無所知,他們開展了諸多關于提示[4-5]和先驗知識[6-7]的探索性工作,研究表明將已有的先驗知識耦合到黑箱模型的計算中可以提高模型的計算精度。Hu等[8]在對降雨徑流預報中,依據(jù)徑流量隨前期土壤含水量增加而增加的經(jīng)驗性先驗知識,建立了基于先驗知識的徑流預報神經(jīng)網(wǎng)絡模型,在一定程度上提高了徑流預報的精度。Chua和Wong[9]在研究降雨徑流過程時采用了動力波方程,通過對預報流量時的確定性系數(shù)和相關系數(shù)等誤差指標的對比表明了串聯(lián)耦合建模技術的優(yōu)越性。
目前運用先驗知識改善神經(jīng)網(wǎng)絡性能的研究基本局限于利用研究對象的單調(diào)性、凹凸性、對稱性和增益等一些簡單特征。這種先驗知識雖然可以認為在計算過程中增加了一定的約束,但僅僅表征由樣本數(shù)據(jù)反映的數(shù)值特性,依然不能反映研究對象的領域知識。在水質(zhì)預測過程中,控制方程是一組已知的能反映研究對象物理特性的動態(tài)方程,本文嘗試從數(shù)值模型與實際案例2方面討論將動態(tài)方程與神經(jīng)網(wǎng)絡相結(jié)合的可行性和在水質(zhì)預測領域的適用性。
2.1 黑箱神經(jīng)網(wǎng)絡模型
傳統(tǒng)的神經(jīng)網(wǎng)絡模型是按照既定的規(guī)則進行輸入變量與輸出變量間的映射計算,屬于典型的黑箱模型。按照網(wǎng)絡模型的分類方式,可以分成前饋網(wǎng)絡和反饋網(wǎng)絡、離散型網(wǎng)絡和連續(xù)型網(wǎng)絡、有導師學習網(wǎng)絡和無導師學習網(wǎng)絡等[10]。本文選擇結(jié)構簡單、技術成熟的BP網(wǎng)絡作為研究工具。
BP網(wǎng)絡稱為誤差反傳前饋神經(jīng)網(wǎng)絡,由輸入層、輸出層與若干隱含層組成,相鄰兩層間的神經(jīng)元采用全互連的連接方式,同一層內(nèi)的神經(jīng)元沒有連接。所謂誤差反傳是指依據(jù)網(wǎng)絡計算輸出與樣本輸出間的誤差,按照從輸出層到隱含層,再從隱含層到輸入層的順序逐層修正神經(jīng)元上的權閾值。
(1)
2.2 動態(tài)方程的耦合
(2)
當式(2)等號右邊的各項數(shù)值都能得到時,可以將該式作為神經(jīng)網(wǎng)絡優(yōu)化模型的一項新的約束。對于優(yōu)化問題來說,把先驗知識作為一項約束條件,將其整合到計算過程中的常用方法是采用罰函數(shù)法[11-12]。罰函數(shù)法是指通過將原目標函數(shù)與約束條件進行組合,實現(xiàn)將有約束優(yōu)化問題轉(zhuǎn)化為無約束優(yōu)化問題的方法。具體做法就是將約束條件變化為懲罰項,加到原目標函數(shù)上,迫使迭代點遠離不滿足約束條件的空間范圍,不斷逼近可行域。假設所有函數(shù)都是連續(xù)的,則含有等式約束的優(yōu)化問題的函數(shù)表達形式為
(3)
假設最優(yōu)解存在,則可行域為
D={x/h(x)=0} 。
令懲罰項p(x)=h2(x) ,
(4)
則包含懲罰項的新目標函數(shù)可表示為
minF(x,M)=f(x)+Mp(x)=f(x)+Mh2(x)。
(5)
式中:F(x,M)為罰函數(shù);M為懲罰因子。
F(x,M)的最優(yōu)解應當是在M足夠大時能夠逼近式(3)的最優(yōu)解?;诖耍瑧土P項Mp(x)應具有以下性質(zhì):當x屬于可行域,即x∈D,h(x)=0,此時懲罰項不對計算造成影響;當x?D,即不滿足約束條件時,懲罰項Mp(x)應給予一個極大的懲罰。懲罰項的工作原理可用式(6)表示,即
Mh2(x)=0,x∈D;
Mh2(x)>0,x?D。
(6)
為檢驗本文提出的動態(tài)方程耦合網(wǎng)絡模型的可行性和可操作性,同時考慮到樣本獲取的便利性,從數(shù)值算例的角度選取包含典型動態(tài)方程的Mackey-Glass混沌系統(tǒng)進行數(shù)值計算,探討動態(tài)方程的耦合對網(wǎng)絡模型泛化性能的影響。
3.1 基于Mackey-Glass混沌系統(tǒng)的先驗前饋網(wǎng)絡模型
Mackey-Glass混沌系統(tǒng)的微分方程形式為
(7)
微分方程參數(shù)取a=0.2,b=0.1,c=10,τ=17時,產(chǎn)生混沌現(xiàn)象[13]。初值取y(0)=0.2,在t=0~1 500 s內(nèi)對y進行采樣,時間步長為1 s,由此產(chǎn)生1 500組數(shù)據(jù),把前面500組過渡序列舍去,取后面1 000組作為計算樣本,從這1 000組數(shù)據(jù)中選擇700組作為訓練樣本,其余300組作為測試樣本。
采用前5組數(shù)據(jù)計算后1組,即采用y(t),y(t-1),y(t-2),y(t-3),y(t-4)計算y(t+1)的值。對于Mackey-Glass混沌系統(tǒng),輸入層有5個節(jié)點:y(t),y(t-1),y(t-2),y(t-3),y(t-4),預測時段末對應的時間t;輸出層有1個節(jié)點:y(t+1);隱含層節(jié)點數(shù)由試算原則確定為5個,網(wǎng)絡模型的結(jié)構確定為5-5-1。先驗知識采用微分方程本身,結(jié)合式(2)其數(shù)學表達式為
(8)
3.2 動態(tài)方程對網(wǎng)絡泛化性能的影響
對神經(jīng)網(wǎng)絡的預測效果進行檢驗,主要需從預測結(jié)果與樣本值的擬合程度及誤差大小2個方面考慮。對于擬合程度,本文采用確定性系數(shù)CE和相關系數(shù)R兩項指標,CE和R值越大,說明擬合效果越好,計算值與樣本值越接近。擬合指標的計算公式為:
(9)
(10)
對于計算誤差,本文采用均方根誤差RMSE和平均絕對百分誤差MAPE兩項指標,RMSE采用的是絕對誤差的形式,對特大或特小的誤差比較敏感;MAPE則采用的是相對誤差的形式,可以反映出所有測試樣本的平均計算誤差大小。誤差指標的計算公式為:
(11)
(12)
采用生成的樣本序列和給定的網(wǎng)絡結(jié)構對含有先驗知識和不含先驗知識的網(wǎng)絡模型進行訓練和預測計算,圖1和圖2分別表示變量在2種模型中擬合程度和誤差大小,表1表示2種預測模型的計算指標。
圖1 有無先驗知識計算結(jié)果擬合程度Fig.1 Fitting degree of calculation with and without priori-knowledge
圖2 有無先驗知識的計算結(jié)果誤差Fig.2 Error of calculation with and without priori-knowledge
表1 數(shù)值算例計算結(jié)果指標統(tǒng)計Table 1 Indexes of calculation for numerical cases
由表1可知,在Mackey-Glass混沌系統(tǒng)的預測中:①在其他條件不變的情況下,先驗知識的加入提高了網(wǎng)絡模型的預測精度;②先驗前饋網(wǎng)絡模型計算結(jié)果的擬合程度更高,其中確定性系數(shù)相較一般網(wǎng)絡模型提高了0.019,相關系數(shù)提高了0.008;③先驗前饋網(wǎng)絡模型將誤差控制在一個更合理的范圍,相較一般神經(jīng)網(wǎng)絡模型均方根誤差下降了0.018 6,平均絕對百分誤差下降了1.819。從圖1可以看出,加入先驗知識后,神經(jīng)網(wǎng)絡模型預測的結(jié)果能夠更好、更準確地反映Mackey-Glass數(shù)據(jù)變化的趨勢,更加符合自身產(chǎn)生的規(guī)律,在對新的未知數(shù)據(jù)進行預測時有更好的擬合能力,更接近真實模型,而一般神經(jīng)網(wǎng)絡模型的預測結(jié)果中出現(xiàn)了較多違背變化規(guī)律的現(xiàn)象。圖2顯示,先驗知識加入后,模型計算結(jié)果的相對誤差得以有效控制,極值下降了近50%。
綜上所述,先驗知識可以顯著提高網(wǎng)絡模型的預測精度,相較于一般神經(jīng)網(wǎng)絡預測模型,先驗前饋網(wǎng)絡模型對于Mackey-Glass系統(tǒng)有更好的非線性擬合能力。
4.1 工程概況
為探討本文提出的先驗前饋網(wǎng)絡模型在水質(zhì)預測中的應用效果,以湖北省某電廠排放的污染物為研究對象,污染物的物理特性如表2所示。
表2 污染物物理特性Table 2 Physical characteristics of contaminant
電廠運行過程中會有污染物隨廢水持續(xù)排放進入附近河道的受納水體。由于污染物自身的衰減和河水的稀釋作用,污染物濃度會沿水流方向逐漸下降。本案例以固定監(jiān)測斷面的污染物平均濃度的相對濃度值為研究對象,對文章中提出的方法進行探討。
4.2 組分輸運方程的耦合
污染物的遷移擴散運動主要受描述水動力學特性的連續(xù)性方程、動量守恒方程以及描述溶質(zhì)運動的組分輸運方程控制[14]。本文嘗試將組分輸運方程作為神經(jīng)網(wǎng)絡預測模型的先驗知識進行耦合計算。二維組分輸運方程為
(13)
式中:Cw為水體中污染物的相對濃度;u,v分別為x,y方向上的流速(m·s-1);εx,εy分別為x,y方向上的擴散系數(shù)(m2·s-1);t為時間(s);λi為污染物濃度衰減系數(shù)(L·s-1);Si是污染物源項,在本文描述的監(jiān)測斷面可忽略不計。
由于擴散系數(shù)、衰減系數(shù)和源項都是計算時給出的定值,流速、污染物濃度及濃度在方向上的一階導數(shù)都是可以在數(shù)值模擬中導出的,所以只需采用有限差分法得到濃度在方向上的二階導數(shù),組分輸運中的各個變量便都可以獲得求解。此時,將方程的瞬態(tài)項(?Cw/?t)中的2個變量使用網(wǎng)絡模型的輸入輸出表示,方程的其他項全部移動到等式的右邊,便可以采用2.2節(jié)的方法將其耦合到前饋網(wǎng)絡模型的迭代計算過程中。其中,先驗知識得到的懲罰項為
(14)
4.3 水質(zhì)預測分析
在不考慮溫度和水生動植物的影響下,污染物的濃度主要受到當前一段時期的濃度值與上游來水流量的影響。分析電站受納水體多年徑流量得知2006年可作為典型年,同時2005年來水流量的上下限包含了2006年的來水流量數(shù)值范圍。故采用2005年的數(shù)據(jù)對含有先驗知識和沒有先驗知識的2種網(wǎng)絡模型進行訓練。采用2006年2—6月份的數(shù)據(jù)進行預測計算和討論,2006年的來水流量與污染物相對濃度的關系如圖3所示。
圖3 2006年來水流量與污染物相對濃度的關系Fig.3 Relationship between runoff and relative concentration of contaminant in 2006
神經(jīng)網(wǎng)絡模型的輸入層包括當前濃度、前2 d濃度和來水流量共4個節(jié)點,輸出層包括下一天濃度1個節(jié)點,試算確定網(wǎng)絡的拓撲結(jié)構為4-4-1。2種訓練模型的預測結(jié)果如表3所示。
表3 實例分析計算結(jié)果指標統(tǒng)計Table 3 Indexes of calculation for practical case
由表3可知,在水質(zhì)預測問題中采用先驗前饋網(wǎng)絡模型可以提高網(wǎng)絡模型的預測精度。組分輸運方程作為先驗知識在優(yōu)化模型的迭代計算中可以促進計算結(jié)果朝目標方向收斂,說明本文提出的改進網(wǎng)絡模型在水質(zhì)預測研究領域中具有適用性和合理性。
另一方面,從擬合精度的角度來看,CE值和R值都相較數(shù)值案例時有所下降,這是由于實例分析的樣本數(shù)量較少引起。但由于并不是所有的研究問題都可以提供足夠容量的樣本用于網(wǎng)絡模型的訓練,那么在樣本容量一定的情況下,有理由認為耦合機理性動態(tài)方程的先驗前饋網(wǎng)絡模型能提供更高的計算精度。
本文針對數(shù)據(jù)驅(qū)動模型不能反映研究對象物理機理的不足,考慮將表征污染物運動的控制方程耦合到網(wǎng)絡模型的迭代計算過程中,提出了一種耦合動態(tài)方程的先驗前饋網(wǎng)絡模型及其耦合方法。從數(shù)值算例和現(xiàn)實案例2個方面對比計算了新模型和傳統(tǒng)網(wǎng)絡模型的預測效果。
(1) 將動態(tài)方程作為先驗知識耦合到神經(jīng)網(wǎng)絡的訓練過程中,可以提高網(wǎng)絡模型的預測精度和非線性擬合程度。
(2) 本文提出的機理性先驗前饋網(wǎng)絡模型在水質(zhì)預測中具有適用性和合理性。
(3) 在樣本一定的情況下,可考慮通過機理性先驗知識的加入進一步提高模型的精度。
[1] 劉俊威, 呂惠進. 人工神經(jīng)網(wǎng)絡在水質(zhì)預測中的應用研究[J]. 長江科學院院報, 2012,29(9):95-97.
[2] 唐婉瑩, 楊宇川, 黃 剛. BP神經(jīng)網(wǎng)絡用于水體中N綜合污染評價[J]. 計算機與應用化學, 2002,19(4):438-440.
[3]ALY A H, PERALTA R C. Optimal Design of Aquifer Cleanup Systems under Uncertainty Using a Neural Network and a Genetic Algorithm[J]. Water Resources Research, 1999,35(8):2523-2532.[4] CAI X,MCKINNEY D C,LASDON L S.Integrated Hydrologic-Agronomic-Economic Model for River Basin Management[J]. Journal of Water Resources Planning & Management, 2003,129(1):4-17.[5] ABU-MOSTAFA Y S. Learning from Hints in Neural Networks[J]. Journal of Complexity, 1990,6(2):192-198.
[6] 婁海川, 蘇宏業(yè), 謝 磊. 融合過程先驗知識的遞歸神經(jīng)網(wǎng)絡模型及其應用[J]. 化工學報, 2013,64(5):1665-1673.
[7] 史步海, 朱學峰, 陳錦威. 基于先驗知識的混凝沉淀過程神經(jīng)網(wǎng)絡建模[J]. 華南理工大學學報(自然科學版), 2008,36(5):113-118.
[8] HU T, WU F, ZHANG X. Rainfall-runoff Modeling Using Principal Component Analysis and Neural Network[J]. Water Policy, 2007,38(3):235-248.
[9] CHUA L H C, WONG T S W. Runoff Forecasting for an Asphalt Plane by Artificial Neural Networks and Comparisons with Kinematic Wave and Autoregressive Moving Average Models[J].Journal of Hydrology,2011,397(3/4):191-201.
[10]胡鐵松. 神經(jīng)網(wǎng)絡預測與優(yōu)化[M]. 大連:大連海事大學出版社, 1997.
[11]馬 騁, 李 迅, 姚家暉, 等. 一種新的求解帶約束的有限極大極小問題的精確罰函數(shù)[J]. 應用數(shù)學和力學, 2012,33(2):250-264.
[12]韓艷麗. 約束優(yōu)化問題的罰函數(shù)的研究[D]. 焦作:河南理工大學, 2011.
[13]董 梅. 具時滯的Mackey-Glass混沌系統(tǒng)的Hopf分支分析[D]. 哈爾濱:哈爾濱工業(yè)大學, 2008.[14]王福軍. 計算流體動力學分析——CFD軟件原理與應用[M]. 北京: 清華大學出版社, 2004.
(編輯:陳 敏)
Application of Neural Network Model Coupled with Dynamic Equationin Water Quality Prediction
ZHOU Yan-chen1,2,3,HU Tie-song3,CHEN Jin1,2,XU Ji-jun1,2,ZHOU Yan-lai1,2
(1.Water Resources Department, Yangtze River Scientific Research Institute, Wuhan 430010, China; 2.Key Laboratory of Basin Water Resource and Eco-environmental Science in Hubei Province, Yangtze River Scientific Research Institute, Wuhan 430010, China;3.State Key Laboratory of Water Resources and Hydropower Engineering Science, Wuhan University, Wuhan 430072, China)
Precise prediction of water quality trend is of vital importance for water resources management. Commonly used data-driving models cannot reflect the physical characteristics of research objective. In view of this, a neural network coupled with dynamic equation is proposed in this paper, and the method to couple dynamic equation into model iteration is also given. A numerical case and a practical case are used to demonstrate the difference between network model with mechanism priori-knowledge and traditional network model. The results of fitting degree and calculation error indicate that the coupled priori-knowledge is able to improve calculation accuracy and enhance non-linear fitting. The proposed model is applicable and rational in water quality prediction. Sample size is the basis of neural network model application, and coupling mechanism priori knowledge under the circumstance of fixed sample size is an efficient approach to improving prediction accuracy.
water quality prediction; neural network model; dynamic equation; mechanism priori knowledge; Mackey-Glass chaotic system
2016-05-25;
:2016-06-30
國家自然科學基金項目(71171151,51509008);湖北省自然科學基金項目(2015CFA157)
周彥辰(1988-),男,湖北武漢人,在站博士后,主要從事水資源管理研究,(電話)027-82927557(電子信箱)zhouyc_omg@126.com。
10.11988/ckyyb.20160520
2017,34(9):1-5
X824
:A
:1001-5485(2017)09-0001-05