孫 策,李傳奇,白 冰,楊 圭,王 茜
(1.山東大學(xué)土建與水利學(xué)院,濟(jì)南 250061;2. 山東省水利綜合事業(yè)服務(wù)中心,濟(jì)南 250013)
隨著我國(guó)工業(yè)化進(jìn)程與城市化進(jìn)程的不斷加快,公眾對(duì)于生態(tài)環(huán)境安全的需求不斷提升,但與此同時(shí)各類危化用品的不斷使用導(dǎo)致突發(fā)水污染事件頻發(fā)。自2012-2017年我國(guó)突發(fā)環(huán)境事件2 657 起,其中突發(fā)性水污染事件占95%以上[1]。事件成因主要包括污染物違規(guī)排放、生產(chǎn)事故泄露、自然災(zāi)害等[2]。目前,我國(guó)突發(fā)水污染事故的研究主要集中在水環(huán)境質(zhì)量監(jiān)測(cè)、污染事件預(yù)警與快速模擬、風(fēng)險(xiǎn)評(píng)估、處置技術(shù)、應(yīng)急決策支持等方面[ 3],對(duì)突發(fā)水污染事件精準(zhǔn)溯源的研究相對(duì)較少[4, 5]。河流突發(fā)性水污染事故溯源,也稱為污染源識(shí)別定位問(wèn)題,或源參數(shù)識(shí)別。其基于監(jiān)測(cè)的濃度數(shù)據(jù),追蹤定位進(jìn)入河道的污染物質(zhì)的來(lái)源,尋找出污染源泄露節(jié)點(diǎn)、泄露時(shí)間、泄露強(qiáng)度等污染源的關(guān)鍵信息。
實(shí)際情況中想要實(shí)現(xiàn)污染物精準(zhǔn)溯源是十分困難的,傳統(tǒng)的識(shí)別模型需要大量的先驗(yàn)信息,以污染物的泄露歷史,污染物衍生的化學(xué)產(chǎn)品以及精準(zhǔn)的事故環(huán)境監(jiān)測(cè)數(shù)據(jù)作為支撐[6]。然而在水環(huán)境監(jiān)測(cè)中,想要實(shí)現(xiàn)對(duì)各類污染物空間位置全覆蓋式的實(shí)時(shí)監(jiān)控,是極不現(xiàn)實(shí)的。因此用具有代表性的幾個(gè)監(jiān)測(cè)斷面的監(jiān)測(cè)數(shù)據(jù)來(lái)反映整個(gè)監(jiān)測(cè)區(qū)域水環(huán)境的水質(zhì)情況是最常見的監(jiān)測(cè)方法。如何利用有限的監(jiān)測(cè)數(shù)據(jù),反演出污染源位置等關(guān)鍵信息,這就需要一套行之有效的追溯污染源的方法?,F(xiàn)有的識(shí)別方法主要有直接法、優(yōu)化法和概率統(tǒng)計(jì)法[7]。直接法通過(guò)及時(shí)反演控制方程,重建觀測(cè)污染物的歷史分布,解決了溯源問(wèn)題。李云良等[8]用粒子示蹤耦合模型,并結(jié)合野外粒子示蹤實(shí)驗(yàn)來(lái)調(diào)查鄱陽(yáng)湖洪水期污染物遷移路徑;優(yōu)化方法則通過(guò)最小化污染物濃度觀測(cè)值與預(yù)測(cè)值的差值,從而得到污染源參數(shù)的識(shí)別值。湯雪萍等[9]利用移動(dòng)水質(zhì)監(jiān)測(cè)平臺(tái),結(jié)合行為規(guī)劃法和濃度梯度法進(jìn)行污染源定位識(shí)別;概率統(tǒng)計(jì)法通過(guò)對(duì)事件的發(fā)生概率進(jìn)行估計(jì),不斷改進(jìn)基于似然函數(shù)的識(shí)別值來(lái)識(shí)別污染源的參數(shù),主要方法有貝葉斯推理、最小相對(duì)熵等。朱嵩等[10]建立了基于貝葉斯推理的反演數(shù)學(xué)模型,進(jìn)而求解水動(dòng)力-水質(zhì)耦合數(shù)學(xué)模型的點(diǎn)源強(qiáng)度與位置的聯(lián)合識(shí)別。
本文基于貝葉斯-蒙特卡洛方法,采用適用性更強(qiáng)的M-H采樣方法和GIBBS采樣方法來(lái)處理二維污染物排放的溯源問(wèn)題。并對(duì)M-H采樣方法做了一定的改進(jìn):在每一次根據(jù)建議分布生成樣本值時(shí),增加一個(gè)判斷樣本值是否滿足于后驗(yàn)概率密度函數(shù)的條件,以使根據(jù)建議分布生成的樣本值更快更準(zhǔn)確地趨近于真實(shí)值。最后運(yùn)用算例對(duì)比分析了兩種采樣方法各自的優(yōu)點(diǎn),并分析了兩種采樣方法在計(jì)算精度和計(jì)算維度上的差異性。
依據(jù)質(zhì)量守恒原理和連續(xù)性法則,河道中任一點(diǎn)污染物擴(kuò)散及對(duì)流基本方程式為[11]:
(1)
式中:C(x,y,z,t)為t時(shí)刻控制體積單元內(nèi)污染物的濃度,mg/L;xyz為坐標(biāo)位置,m;t為污染物排放時(shí)長(zhǎng),s;k為污染物降解系數(shù),s-1;ux、uy、uz分別為污染物沿xyz方向的平均流速,m/s;Dx,Dy,Dz分別為污染物在x,y,z方向的彌散系數(shù),m/s;S為源匯項(xiàng)。
由于三維模型求解復(fù)雜,且污染物在垂向擴(kuò)散速度遠(yuǎn)小于橫向擴(kuò)散,因此可將三維模型轉(zhuǎn)化為二維模型[12]。
(2)
由于實(shí)際河流受到河岸影響,污染物在水體中的擴(kuò)散受到邊界限制并產(chǎn)生反射,將其作為影響因素,此時(shí)污染物濃度的解析解為:
C=C1+C2+C3
(3)
式中:C1,C2,C3分別為污染源、近岸邊反射、遠(yuǎn)岸邊反射在點(diǎn)(x,y)處產(chǎn)生的質(zhì)量濃度增量,其各自的計(jì)算表達(dá)式為:
(4)
(5)
(6)
考慮到河流寬度一般較大,所以假設(shè)岸邊的反射次數(shù)為1次[13],即n=1,b=0,此時(shí)得到污染源下游河段斷面上污染物濃度隨時(shí)空變化的規(guī)律為:
(7)
式中:m為污染物排放總量,g;B為河道寬度,m;其余符號(hào)意義同前。
在一定的溫度范圍內(nèi),k1與溫度關(guān)系的表達(dá)式為:
k1=k20θ(T-20)
(8)
式中:k1,k20為溫度分別為T℃和20 ℃時(shí)的耗氧速率系數(shù),d-1;θ為溫度校正因子,為無(wú)量綱經(jīng)驗(yàn)系數(shù)。一般情況下,當(dāng)溫度為10~37 ℃時(shí),校正因子取1.047。
河流中的垂向擴(kuò)散與明渠流中的擴(kuò)散相似,可采用對(duì)數(shù)流速分布形式,得到河流垂向擴(kuò)散系數(shù):
Dz=0.067hu
(9)
(10)
式中:h為河流平均水深,m;u為河流摩阻流速,m/s;i為水力坡度;g為重力加速度,m/s2。
對(duì)于順直的河流,F(xiàn)USCGER[14]收集了多個(gè)實(shí)驗(yàn)資料,統(tǒng)計(jì)得到橫向擴(kuò)散系數(shù)平均值的估算式為:
Dy=0.23hu*
(11)
若流速分布資料缺乏,可采用經(jīng)驗(yàn)公式粗略估算縱向擴(kuò)散系數(shù)。FISCHER[15]提出經(jīng)驗(yàn)公式:
Dx=0.11u2B2/hu*
(12)
在貝葉斯統(tǒng)計(jì)的情況下,所有未知參數(shù)都被視為隨機(jī)變量,它們的分布是從已知信息中得出的[15,16]。因此,貝葉斯統(tǒng)計(jì)為不確定性分析提供了嚴(yán)格的方法,可為管理決策提供關(guān)鍵信息[17]。貝葉斯推理基于以下公式[18]:
(13)
式中:p(X|Y)為X的后驗(yàn)概率分布函數(shù),表示獲得觀測(cè)值Y后參數(shù)X的分布規(guī)律;p(X)為先驗(yàn)概率分布函數(shù),表示由資料及經(jīng)驗(yàn)獲得的參數(shù)X的分布規(guī)律;p(Y|X)為似然函數(shù),表示模型參數(shù)與觀測(cè)值的擬合程度。
但是未知參數(shù)的后驗(yàn)分布一般為復(fù)雜的高維非常見分布,要實(shí)現(xiàn)對(duì)這些分布的直接計(jì)算十分困難,這就使得貝葉斯推斷方法應(yīng)用于實(shí)踐中時(shí)受到很大的限制。然而,近幾十年來(lái),蒙特卡羅方法,特別是馬爾可夫鏈蒙特卡羅(MCMC)算法,已被應(yīng)用于獲得參數(shù)的數(shù)值總結(jié)[19]。
在統(tǒng)計(jì)學(xué)中,馬爾可夫鏈蒙特卡羅(MCMC)方法是一類基于構(gòu)造一個(gè)馬爾可夫鏈的概率分布抽樣算法,該馬爾可夫鏈具有理想的平穩(wěn)分布[20, 21]。其基本思想是對(duì)比較復(fù)雜或無(wú)明確數(shù)學(xué)表達(dá)式的概率分布p進(jìn)行抽樣,得到一個(gè)大量服從p的隨機(jī)向量序列,并通過(guò)建立合適的抽樣算法使該序列滿足馬爾科夫鏈的性質(zhì),即新狀態(tài)的參數(shù)只依賴于目前的參數(shù)狀態(tài),而與之前的參數(shù)狀態(tài)無(wú)關(guān)[22]。
基于此,溯源問(wèn)題可以轉(zhuǎn)化為對(duì)后驗(yàn)概率密度函數(shù)的抽樣問(wèn)題。在貝葉斯方法的基礎(chǔ)上構(gòu)建出待反演參數(shù)的后驗(yàn)概率密度函數(shù),依賴于MCMC方法對(duì)其進(jìn)行抽樣。本文采用適用性較強(qiáng)的M-H采樣方法和Gibbs采樣方法進(jìn)行采樣,兩種方法的基本思路及步驟如下[23]。
M-H采樣方法步驟:
(3)生成新的參數(shù)狀態(tài)下模型的模擬結(jié)果,計(jì)算模擬值與觀測(cè)值之間的納什系數(shù)(NSE);
(4)產(chǎn)生一個(gè)0~1間均勻分布的隨機(jī)數(shù)u,若α>u且NSE滿足提前設(shè)定的精度范圍,則xi+1=x*,否則xi+1=xi,且i值加1;
(5)重復(fù)步驟(2)~(3),得到一系列參數(shù)的抽樣值,進(jìn)而可進(jìn)行參數(shù)后驗(yàn)規(guī)律的統(tǒng)計(jì)。
GIBBS采樣方法步驟:
(4)按順序依次從相應(yīng)條件概率分布中得到每一個(gè)參數(shù)新的抽樣值;
(6)重復(fù)步驟(2)~(5),得到一系列參數(shù)的抽樣值,進(jìn)而可進(jìn)行參數(shù)后驗(yàn)規(guī)律的統(tǒng)計(jì)。
可以看出,M-H采樣方法和GIBBS采樣方法在生成新的參數(shù)狀態(tài)時(shí)有著很大的不同。M-H采樣方法每次給所有參數(shù)一個(gè)新的狀態(tài),且生成新的參數(shù)狀態(tài)時(shí)借助于建議分布,故為了判斷建議分布選取的合理性,每一次采樣都要通過(guò)計(jì)算接受概率判斷是否接受該狀態(tài)。而Gibbs采樣方法則借助于已知的條件概率分布逐次生成每一個(gè)參數(shù)新的狀態(tài),通過(guò)坐標(biāo)軸的輪換采樣來(lái)確保每一次采樣的合理性。
為方便計(jì)算,此次研究中以點(diǎn)源岸邊污染物瞬時(shí)排放為例對(duì)M-H采樣方法和GIBBS采樣方法進(jìn)行計(jì)算,以對(duì)比分析兩種方法各自的優(yōu)越性及其之間的差異性。此次研究選取長(zhǎng)約8 500 m,寬約1 200 m的河段作為研究對(duì)象,縱向和橫向的水流平均速度可以利用渦輪流速儀測(cè)得,ux=21.6 m/min,uy=0.3 m/min,橫向擴(kuò)散系數(shù) 和縱向擴(kuò)散系數(shù) 由所測(cè)數(shù)據(jù)代入式(7)、式(8)計(jì)算得到。同時(shí)河段的水體深度h取1.0 m,通過(guò)查閱資料得到模擬污染物的羅丹明B在類似環(huán)境的河流里的降解系數(shù)k=0.1 d-1。河段的水文水質(zhì)參數(shù)如表1和表2所示[24]。設(shè)定在河流某斷面發(fā)現(xiàn)污染情況的時(shí)間為初始監(jiān)測(cè)時(shí)間,隨后每隔25 min監(jiān)測(cè)1次,共得到12個(gè)該斷面的監(jiān)測(cè)數(shù)據(jù)。
表1 河流已知水文參數(shù)表Tab.1 River known hydrological parameter table
表2 河流待反演水文參數(shù)表Tab.2 River to be inverted hydrological parameter table
將表1及表2的數(shù)據(jù)代入公式(3),可以得到研究中監(jiān)測(cè)斷面的污染物濃度觀測(cè)序列,如圖1所示??梢钥闯鲇^測(cè)斷面污染物的濃度近似于正態(tài)分布,最高值約在開始觀測(cè)后的第110 min。需要進(jìn)行反演計(jì)算的未知參數(shù)有污染物排放位置x(以觀測(cè)斷面為坐標(biāo)原點(diǎn),污染物排放量m,污染物排放時(shí)間t(為距離首次得到污染物濃度數(shù)據(jù)的時(shí)間)。本研究采用上下限區(qū)間的均勻分布作為待反演參數(shù)的先驗(yàn)分布。其對(duì)應(yīng)的先驗(yàn)分布概率密度函數(shù)分別為:
(14)
(15)
(16)
為了更符合現(xiàn)實(shí)情況并證明選用算法的適用性,可以在污染物觀測(cè)數(shù)據(jù)上疊加一個(gè)觀測(cè)誤差,這里設(shè)定觀測(cè)誤差εi=Ti(m,x,t|X)-Yi服從正態(tài)分布N(0,0.52),設(shè)θ=(m,x,t)為待反演參數(shù),因此考慮了誤差概率分布的似然函數(shù)可定義為:
(17)
此時(shí)污染源參數(shù)的后驗(yàn)概率密度函數(shù)可表示為:
(18)
式中:P(θ)為待反演參數(shù)的先驗(yàn)分布;σ為觀測(cè)誤差所服從正態(tài)分布的標(biāo)準(zhǔn)差;N為觀測(cè)點(diǎn)得到的濃度值個(gè)數(shù);Yi為觀測(cè)點(diǎn)測(cè)得的濃度值大??;ci為根據(jù)污染物擴(kuò)散模型模擬出的觀測(cè)點(diǎn)污染物濃度理論值大小。
圖1 觀測(cè)斷面污染物濃度序列值Fig.1 Observed section pollutant concentration sequence value
分別采用M-H采樣方法和GIBBS采樣方法對(duì)待反演參數(shù)的后驗(yàn)概率密度函數(shù)進(jìn)行抽樣計(jì)算,為得到較穩(wěn)定的抽樣結(jié)果,對(duì)兩種方法均迭代計(jì)算了2 萬(wàn)次,抽樣的結(jié)果如圖2及圖3所示。
由抽樣結(jié)果可以得到,M-H采樣方法的抽樣結(jié)果分布很緊湊,污染物排放位置確定為距離觀測(cè)斷面4 500 m,污染物排放時(shí)間距離第一次在觀測(cè)斷面得到污染物濃度100 min,污染物排放量在1 t附近。而GIBBS采樣的抽樣結(jié)果分布接近于正態(tài)分布,污染物排放位置在4 400~4 600 m,污染物排放時(shí)間為距離第一次在觀測(cè)斷面得到污染物濃度的95~105 min,污染物排放量0.99~1.01 t,但每一個(gè)未知參數(shù)分布的峰值與M-H采樣得到的結(jié)果是較一致的。
圖2 M-H抽樣結(jié)果Fig.2 M-H sampling result
圖3 GIBBS抽樣結(jié)果Fig.3 GIBBS sampling results
為進(jìn)一步分析對(duì)比兩種抽樣方法的溯源效果,對(duì)兩種方法分別進(jìn)行了以下操作:繪制抽樣過(guò)程中的迭代曲線(見圖4、5);剔除掉迭代前期不穩(wěn)定的結(jié)果,此次研究中根據(jù)實(shí)驗(yàn)結(jié)果情況剔除掉了前200次迭代的結(jié)果,對(duì)迭代后期較穩(wěn)定的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析(見表3)。
表3 M-H與GIBBS方法誤差統(tǒng)計(jì)表Tab.3 M-H and GIBBS method error statistics
圖4 M-H法迭代曲線Fig.4 M-H method iteration curve
圖5 Gibbs法迭代曲線Fig.5 Gibbs method iteration curve
通過(guò)分析M-H抽樣方法與GIBBS抽樣方法的抽樣結(jié)果,迭代曲線以及誤差統(tǒng)計(jì)表可以得到兩種方法各自的優(yōu)點(diǎn)及其之間的差異性:
(1)M-H抽樣方法的計(jì)算精度更高。從抽樣結(jié)果圖可以看出,3個(gè)待反演的參數(shù)都極為接近真實(shí)值。但需要的計(jì)算時(shí)間也更長(zhǎng),這是因?yàn)槊恳淮瓮ㄟ^(guò)建議分布計(jì)算的值還要進(jìn)行接受概率的計(jì)算。不難看出,由于接受概率的存在,在數(shù)據(jù)維度更高的情況下,需要的計(jì)算時(shí)間會(huì)更長(zhǎng)。
(2)GIBBS抽樣方法的計(jì)算精度略低于M-H抽樣方法,其抽樣得到的待反演參數(shù)的分布區(qū)間相對(duì)較寬。但GIBBS抽樣需要的計(jì)算時(shí)間較短,這是因?yàn)镚IBBS抽樣中沒(méi)有判斷接受概率的環(huán)節(jié),故其在高維數(shù)據(jù)的計(jì)算中具有一定的優(yōu)勢(shì)。
(3)對(duì)迭代情況而言,兩種算法的收斂程度均較好,能夠較快的在迭代計(jì)算中趨近于真實(shí)值。
(4)對(duì)計(jì)算誤差而言,兩種方法對(duì)于3個(gè)待反演參數(shù)的計(jì)算誤差都遠(yuǎn)小于5%,計(jì)算精度很高。M-H算法中對(duì)于污染物排放位置和排放量的計(jì)算結(jié)果是相對(duì)準(zhǔn)確的。
(1)基于MCMC方法的M-H抽樣方法和GIBBS抽樣方法能夠準(zhǔn)確地對(duì)突發(fā)點(diǎn)源岸邊污染物瞬時(shí)排放事件進(jìn)行溯源,其計(jì)算結(jié)果接近于真實(shí)值,能夠有效地解決點(diǎn)源岸邊污染物瞬時(shí)排放的溯源問(wèn)題。
(2)本研究中的創(chuàng)新點(diǎn)為對(duì)M-H采樣方法做了改進(jìn):根據(jù)建議分布采樣時(shí)先判斷所取樣本值是否使后驗(yàn)概率密度函數(shù)有意義,如果無(wú)意義則重新根據(jù)建議分布采樣,再判斷接受概率是否滿足條件。這樣可以有效加快迭代時(shí)的收斂速度,使待反演參數(shù)的抽樣值更快地趨近于目標(biāo)值。從計(jì)算結(jié)果可以看出這樣的改進(jìn)是比較有效的。改進(jìn)的M-H抽樣方法在計(jì)算精度上要高于GIBBS抽樣方法,但由于添加了抽樣的判斷條件其計(jì)算時(shí)間也較長(zhǎng)。而GIBBS抽樣方法在高維數(shù)據(jù)的處理上具有一定的優(yōu)勢(shì)。
(3)通過(guò)案例應(yīng)用, 一方面論證了采用概率方法,即通過(guò)對(duì)后驗(yàn)概率密度函數(shù)抽樣從而進(jìn)行突發(fā)水污染溯源的可行性;另一方面也說(shuō)明本研究采用的改進(jìn)的M-H抽樣方法與傳統(tǒng)的GIBBS抽樣方法相比在提高計(jì)算精度,精確溯源污染源信息方面的優(yōu)勢(shì)所在。
□