基于貝葉斯方法的突發(fā)水污染事件溯源研究

2020-08-22 07:26:48李傳奇

中國(guó)農(nóng)村水利水電 2020年8期

孫策，李傳奇，白冰，楊圭，王茜

(1.山東大學(xué)土建與水利學(xué)院，濟(jì)南 250061；2. 山東省水利綜合事業(yè)服務(wù)中心，濟(jì)南 250013)

隨著我國(guó)工業(yè)化進(jìn)程與城市化進(jìn)程的不斷加快，公眾對(duì)于生態(tài)環(huán)境安全的需求不斷提升，但與此同時(shí)各類危化用品的不斷使用導(dǎo)致突發(fā)水污染事件頻發(fā)。自2012-2017年我國(guó)突發(fā)環(huán)境事件2 657 起，其中突發(fā)性水污染事件占95%以上[1]。事件成因主要包括污染物違規(guī)排放、生產(chǎn)事故泄露、自然災(zāi)害等[2]。目前，我國(guó)突發(fā)水污染事故的研究主要集中在水環(huán)境質(zhì)量監(jiān)測(cè)、污染事件預(yù)警與快速模擬、風(fēng)險(xiǎn)評(píng)估、處置技術(shù)、應(yīng)急決策支持等方面[ 3]，對(duì)突發(fā)水污染事件精準(zhǔn)溯源的研究相對(duì)較少[4, 5]。河流突發(fā)性水污染事故溯源，也稱為污染源識(shí)別定位問(wèn)題，或源參數(shù)識(shí)別。其基于監(jiān)測(cè)的濃度數(shù)據(jù)，追蹤定位進(jìn)入河道的污染物質(zhì)的來(lái)源，尋找出污染源泄露節(jié)點(diǎn)、泄露時(shí)間、泄露強(qiáng)度等污染源的關(guān)鍵信息。

實(shí)際情況中想要實(shí)現(xiàn)污染物精準(zhǔn)溯源是十分困難的，傳統(tǒng)的識(shí)別模型需要大量的先驗(yàn)信息，以污染物的泄露歷史，污染物衍生的化學(xué)產(chǎn)品以及精準(zhǔn)的事故環(huán)境監(jiān)測(cè)數(shù)據(jù)作為支撐[6]。然而在水環(huán)境監(jiān)測(cè)中，想要實(shí)現(xiàn)對(duì)各類污染物空間位置全覆蓋式的實(shí)時(shí)監(jiān)控，是極不現(xiàn)實(shí)的。因此用具有代表性的幾個(gè)監(jiān)測(cè)斷面的監(jiān)測(cè)數(shù)據(jù)來(lái)反映整個(gè)監(jiān)測(cè)區(qū)域水環(huán)境的水質(zhì)情況是最常見的監(jiān)測(cè)方法。如何利用有限的監(jiān)測(cè)數(shù)據(jù)，反演出污染源位置等關(guān)鍵信息，這就需要一套行之有效的追溯污染源的方法?，F(xiàn)有的識(shí)別方法主要有直接法、優(yōu)化法和概率統(tǒng)計(jì)法[7]。直接法通過(guò)及時(shí)反演控制方程，重建觀測(cè)污染物的歷史分布，解決了溯源問(wèn)題。李云良等[8]用粒子示蹤耦合模型，并結(jié)合野外粒子示蹤實(shí)驗(yàn)來(lái)調(diào)查鄱陽(yáng)湖洪水期污染物遷移路徑；優(yōu)化方法則通過(guò)最小化污染物濃度觀測(cè)值與預(yù)測(cè)值的差值，從而得到污染源參數(shù)的識(shí)別值。湯雪萍等[9]利用移動(dòng)水質(zhì)監(jiān)測(cè)平臺(tái)，結(jié)合行為規(guī)劃法和濃度梯度法進(jìn)行污染源定位識(shí)別；概率統(tǒng)計(jì)法通過(guò)對(duì)事件的發(fā)生概率進(jìn)行估計(jì)，不斷改進(jìn)基于似然函數(shù)的識(shí)別值來(lái)識(shí)別污染源的參數(shù)，主要方法有貝葉斯推理、最小相對(duì)熵等。朱嵩等[10]建立了基于貝葉斯推理的反演數(shù)學(xué)模型，進(jìn)而求解水動(dòng)力-水質(zhì)耦合數(shù)學(xué)模型的點(diǎn)源強(qiáng)度與位置的聯(lián)合識(shí)別。

本文基于貝葉斯-蒙特卡洛方法，采用適用性更強(qiáng)的M-H采樣方法和GIBBS采樣方法來(lái)處理二維污染物排放的溯源問(wèn)題。并對(duì)M-H采樣方法做了一定的改進(jìn)：在每一次根據(jù)建議分布生成樣本值時(shí)，增加一個(gè)判斷樣本值是否滿足于后驗(yàn)概率密度函數(shù)的條件，以使根據(jù)建議分布生成的樣本值更快更準(zhǔn)確地趨近于真實(shí)值。最后運(yùn)用算例對(duì)比分析了兩種采樣方法各自的優(yōu)點(diǎn)，并分析了兩種采樣方法在計(jì)算精度和計(jì)算維度上的差異性。

1 研究方法

1.1 污染物擴(kuò)散模型

依據(jù)質(zhì)量守恒原理和連續(xù)性法則，河道中任一點(diǎn)污染物擴(kuò)散及對(duì)流基本方程式為[11]：

(1)

式中：C(x,y,z,t)為t時(shí)刻控制體積單元內(nèi)污染物的濃度，mg/L；xyz為坐標(biāo)位置，m；t為污染物排放時(shí)長(zhǎng)，s；k為污染物降解系數(shù)，s-1；ux、uy、uz分別為污染物沿xyz方向的平均流速，m/s；Dx，Dy，Dz分別為污染物在x，y，z方向的彌散系數(shù)，m/s；S為源匯項(xiàng)。

由于三維模型求解復(fù)雜，且污染物在垂向擴(kuò)散速度遠(yuǎn)小于橫向擴(kuò)散，因此可將三維模型轉(zhuǎn)化為二維模型[12]。

(2)

由于實(shí)際河流受到河岸影響，污染物在水體中的擴(kuò)散受到邊界限制并產(chǎn)生反射，將其作為影響因素，此時(shí)污染物濃度的解析解為：

C=C1+C2+C3

(3)

式中：C1,C2,C3分別為污染源、近岸邊反射、遠(yuǎn)岸邊反射在點(diǎn)(x,y)處產(chǎn)生的質(zhì)量濃度增量，其各自的計(jì)算表達(dá)式為：

(4)

(5)

(6)

考慮到河流寬度一般較大，所以假設(shè)岸邊的反射次數(shù)為1次[13]，即n=1，b=0，此時(shí)得到污染源下游河段斷面上污染物濃度隨時(shí)空變化的規(guī)律為：

(7)

式中：m為污染物排放總量，g；B為河道寬度，m；其余符號(hào)意義同前。

在一定的溫度范圍內(nèi)，k1與溫度關(guān)系的表達(dá)式為：

k1=k20θ(T-20)

(8)

式中：k1,k20為溫度分別為T℃和20 ℃時(shí)的耗氧速率系數(shù)，d-1;θ為溫度校正因子，為無(wú)量綱經(jīng)驗(yàn)系數(shù)。一般情況下，當(dāng)溫度為10～37 ℃時(shí)，校正因子取1.047。

河流中的垂向擴(kuò)散與明渠流中的擴(kuò)散相似，可采用對(duì)數(shù)流速分布形式，得到河流垂向擴(kuò)散系數(shù)：

Dz=0.067hu

(9)

(10)

式中：h為河流平均水深，m；u為河流摩阻流速，m/s；i為水力坡度；g為重力加速度，m/s2。

對(duì)于順直的河流，F(xiàn)USCGER[14]收集了多個(gè)實(shí)驗(yàn)資料，統(tǒng)計(jì)得到橫向擴(kuò)散系數(shù)平均值的估算式為：

Dy=0.23hu*

(11)

若流速分布資料缺乏，可采用經(jīng)驗(yàn)公式粗略估算縱向擴(kuò)散系數(shù)。FISCHER[15]提出經(jīng)驗(yàn)公式：

Dx=0.11u2B2/hu*

(12)

1.2 溯源方法

在貝葉斯統(tǒng)計(jì)的情況下，所有未知參數(shù)都被視為隨機(jī)變量，它們的分布是從已知信息中得出的[15,16]。因此，貝葉斯統(tǒng)計(jì)為不確定性分析提供了嚴(yán)格的方法，可為管理決策提供關(guān)鍵信息[17]。貝葉斯推理基于以下公式[18]：

(13)

式中：p(X|Y)為X的后驗(yàn)概率分布函數(shù)，表示獲得觀測(cè)值Y后參數(shù)X的分布規(guī)律；p(X)為先驗(yàn)概率分布函數(shù)，表示由資料及經(jīng)驗(yàn)獲得的參數(shù)X的分布規(guī)律；p(Y|X)為似然函數(shù)，表示模型參數(shù)與觀測(cè)值的擬合程度。

但是未知參數(shù)的后驗(yàn)分布一般為復(fù)雜的高維非常見分布，要實(shí)現(xiàn)對(duì)這些分布的直接計(jì)算十分困難，這就使得貝葉斯推斷方法應(yīng)用于實(shí)踐中時(shí)受到很大的限制。然而，近幾十年來(lái)，蒙特卡羅方法，特別是馬爾可夫鏈蒙特卡羅(MCMC)算法，已被應(yīng)用于獲得參數(shù)的數(shù)值總結(jié)[19]。

在統(tǒng)計(jì)學(xué)中，馬爾可夫鏈蒙特卡羅(MCMC)方法是一類基于構(gòu)造一個(gè)馬爾可夫鏈的概率分布抽樣算法，該馬爾可夫鏈具有理想的平穩(wěn)分布[20, 21]。其基本思想是對(duì)比較復(fù)雜或無(wú)明確數(shù)學(xué)表達(dá)式的概率分布p進(jìn)行抽樣，得到一個(gè)大量服從p的隨機(jī)向量序列，并通過(guò)建立合適的抽樣算法使該序列滿足馬爾科夫鏈的性質(zhì)，即新狀態(tài)的參數(shù)只依賴于目前的參數(shù)狀態(tài)，而與之前的參數(shù)狀態(tài)無(wú)關(guān)[22]。

基于此，溯源問(wèn)題可以轉(zhuǎn)化為對(duì)后驗(yàn)概率密度函數(shù)的抽樣問(wèn)題。在貝葉斯方法的基礎(chǔ)上構(gòu)建出待反演參數(shù)的后驗(yàn)概率密度函數(shù)，依賴于MCMC方法對(duì)其進(jìn)行抽樣。本文采用適用性較強(qiáng)的M-H采樣方法和Gibbs采樣方法進(jìn)行采樣，兩種方法的基本思路及步驟如下[23]。

M-H采樣方法步驟：

(3)生成新的參數(shù)狀態(tài)下模型的模擬結(jié)果，計(jì)算模擬值與觀測(cè)值之間的納什系數(shù)(NSE)；

(4)產(chǎn)生一個(gè)0～1間均勻分布的隨機(jī)數(shù)u，若α>u且NSE滿足提前設(shè)定的精度范圍，則xi+1=x*，否則xi+1=xi，且i值加1；

(5)重復(fù)步驟(2)～(3)，得到一系列參數(shù)的抽樣值，進(jìn)而可進(jìn)行參數(shù)后驗(yàn)規(guī)律的統(tǒng)計(jì)。

GIBBS采樣方法步驟：

(4)按順序依次從相應(yīng)條件概率分布中得到每一個(gè)參數(shù)新的抽樣值；

(6)重復(fù)步驟(2)～(5)，得到一系列參數(shù)的抽樣值，進(jìn)而可進(jìn)行參數(shù)后驗(yàn)規(guī)律的統(tǒng)計(jì)。

可以看出，M-H采樣方法和GIBBS采樣方法在生成新的參數(shù)狀態(tài)時(shí)有著很大的不同。M-H采樣方法每次給所有參數(shù)一個(gè)新的狀態(tài)，且生成新的參數(shù)狀態(tài)時(shí)借助于建議分布，故為了判斷建議分布選取的合理性，每一次采樣都要通過(guò)計(jì)算接受概率判斷是否接受該狀態(tài)。而Gibbs采樣方法則借助于已知的條件概率分布逐次生成每一個(gè)參數(shù)新的狀態(tài)，通過(guò)坐標(biāo)軸的輪換采樣來(lái)確保每一次采樣的合理性。

2 結(jié)果分析

為方便計(jì)算，此次研究中以點(diǎn)源岸邊污染物瞬時(shí)排放為例對(duì)M-H采樣方法和GIBBS采樣方法進(jìn)行計(jì)算，以對(duì)比分析兩種方法各自的優(yōu)越性及其之間的差異性。此次研究選取長(zhǎng)約8 500 m，寬約1 200 m的河段作為研究對(duì)象，縱向和橫向的水流平均速度可以利用渦輪流速儀測(cè)得，ux=21.6 m/min，uy=0.3 m/min，橫向擴(kuò)散系數(shù) 和縱向擴(kuò)散系數(shù) 由所測(cè)數(shù)據(jù)代入式(7)、式(8)計(jì)算得到。同時(shí)河段的水體深度h取1.0 m，通過(guò)查閱資料得到模擬污染物的羅丹明B在類似環(huán)境的河流里的降解系數(shù)k=0.1 d-1。河段的水文水質(zhì)參數(shù)如表1和表2所示[24]。設(shè)定在河流某斷面發(fā)現(xiàn)污染情況的時(shí)間為初始監(jiān)測(cè)時(shí)間，隨后每隔25 min監(jiān)測(cè)1次，共得到12個(gè)該斷面的監(jiān)測(cè)數(shù)據(jù)。

表1 河流已知水文參數(shù)表Tab.1 River known hydrological parameter table

表2 河流待反演水文參數(shù)表Tab.2 River to be inverted hydrological parameter table

2.1 溯源結(jié)果分析

將表1及表2的數(shù)據(jù)代入公式(3)，可以得到研究中監(jiān)測(cè)斷面的污染物濃度觀測(cè)序列，如圖1所示?？梢钥闯鲇^測(cè)斷面污染物的濃度近似于正態(tài)分布，最高值約在開始觀測(cè)后的第110 min。需要進(jìn)行反演計(jì)算的未知參數(shù)有污染物排放位置x(以觀測(cè)斷面為坐標(biāo)原點(diǎn)，污染物排放量m，污染物排放時(shí)間t(為距離首次得到污染物濃度數(shù)據(jù)的時(shí)間)。本研究采用上下限區(qū)間的均勻分布作為待反演參數(shù)的先驗(yàn)分布。其對(duì)應(yīng)的先驗(yàn)分布概率密度函數(shù)分別為：

(14)

(15)

(16)

為了更符合現(xiàn)實(shí)情況并證明選用算法的適用性，可以在污染物觀測(cè)數(shù)據(jù)上疊加一個(gè)觀測(cè)誤差，這里設(shè)定觀測(cè)誤差εi=Ti(m,x,t|X)-Yi服從正態(tài)分布N(0,0.52)，設(shè)θ=(m,x,t)為待反演參數(shù)，因此考慮了誤差概率分布的似然函數(shù)可定義為：

(17)

此時(shí)污染源參數(shù)的后驗(yàn)概率密度函數(shù)可表示為：

(18)

式中：P(θ)為待反演參數(shù)的先驗(yàn)分布；σ為觀測(cè)誤差所服從正態(tài)分布的標(biāo)準(zhǔn)差；N為觀測(cè)點(diǎn)得到的濃度值個(gè)數(shù)；Yi為觀測(cè)點(diǎn)測(cè)得的濃度值大??；ci為根據(jù)污染物擴(kuò)散模型模擬出的觀測(cè)點(diǎn)污染物濃度理論值大小。

圖1 觀測(cè)斷面污染物濃度序列值Fig.1 Observed section pollutant concentration sequence value

分別采用M-H采樣方法和GIBBS采樣方法對(duì)待反演參數(shù)的后驗(yàn)概率密度函數(shù)進(jìn)行抽樣計(jì)算，為得到較穩(wěn)定的抽樣結(jié)果，對(duì)兩種方法均迭代計(jì)算了2 萬(wàn)次，抽樣的結(jié)果如圖2及圖3所示。

由抽樣結(jié)果可以得到，M-H采樣方法的抽樣結(jié)果分布很緊湊，污染物排放位置確定為距離觀測(cè)斷面4 500 m，污染物排放時(shí)間距離第一次在觀測(cè)斷面得到污染物濃度100 min，污染物排放量在1 t附近。而GIBBS采樣的抽樣結(jié)果分布接近于正態(tài)分布，污染物排放位置在4 400～4 600 m，污染物排放時(shí)間為距離第一次在觀測(cè)斷面得到污染物濃度的95～105 min，污染物排放量0.99～1.01 t，但每一個(gè)未知參數(shù)分布的峰值與M-H采樣得到的結(jié)果是較一致的。

圖2 M-H抽樣結(jié)果Fig.2 M-H sampling result

圖3 GIBBS抽樣結(jié)果Fig.3 GIBBS sampling results

2.2 溯源效果分析

為進(jìn)一步分析對(duì)比兩種抽樣方法的溯源效果，對(duì)兩種方法分別進(jìn)行了以下操作：繪制抽樣過(guò)程中的迭代曲線(見圖4、5)；剔除掉迭代前期不穩(wěn)定的結(jié)果，此次研究中根據(jù)實(shí)驗(yàn)結(jié)果情況剔除掉了前200次迭代的結(jié)果，對(duì)迭代后期較穩(wěn)定的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析(見表3)。

表3 M-H與GIBBS方法誤差統(tǒng)計(jì)表Tab.3 M-H and GIBBS method error statistics

圖4 M-H法迭代曲線Fig.4 M-H method iteration curve

圖5 Gibbs法迭代曲線Fig.5 Gibbs method iteration curve

通過(guò)分析M-H抽樣方法與GIBBS抽樣方法的抽樣結(jié)果，迭代曲線以及誤差統(tǒng)計(jì)表可以得到兩種方法各自的優(yōu)點(diǎn)及其之間的差異性：

(1)M-H抽樣方法的計(jì)算精度更高。從抽樣結(jié)果圖可以看出，3個(gè)待反演的參數(shù)都極為接近真實(shí)值。但需要的計(jì)算時(shí)間也更長(zhǎng)，這是因?yàn)槊恳淮瓮ㄟ^(guò)建議分布計(jì)算的值還要進(jìn)行接受概率的計(jì)算。不難看出，由于接受概率的存在，在數(shù)據(jù)維度更高的情況下，需要的計(jì)算時(shí)間會(huì)更長(zhǎng)。

(2)GIBBS抽樣方法的計(jì)算精度略低于M-H抽樣方法，其抽樣得到的待反演參數(shù)的分布區(qū)間相對(duì)較寬。但GIBBS抽樣需要的計(jì)算時(shí)間較短，這是因?yàn)镚IBBS抽樣中沒(méi)有判斷接受概率的環(huán)節(jié)，故其在高維數(shù)據(jù)的計(jì)算中具有一定的優(yōu)勢(shì)。

(3)對(duì)迭代情況而言，兩種算法的收斂程度均較好，能夠較快的在迭代計(jì)算中趨近于真實(shí)值。

(4)對(duì)計(jì)算誤差而言，兩種方法對(duì)于3個(gè)待反演參數(shù)的計(jì)算誤差都遠(yuǎn)小于5%，計(jì)算精度很高。M-H算法中對(duì)于污染物排放位置和排放量的計(jì)算結(jié)果是相對(duì)準(zhǔn)確的。

3 結(jié) 論

(1)基于MCMC方法的M-H抽樣方法和GIBBS抽樣方法能夠準(zhǔn)確地對(duì)突發(fā)點(diǎn)源岸邊污染物瞬時(shí)排放事件進(jìn)行溯源，其計(jì)算結(jié)果接近于真實(shí)值，能夠有效地解決點(diǎn)源岸邊污染物瞬時(shí)排放的溯源問(wèn)題。

(2)本研究中的創(chuàng)新點(diǎn)為對(duì)M-H采樣方法做了改進(jìn)：根據(jù)建議分布采樣時(shí)先判斷所取樣本值是否使后驗(yàn)概率密度函數(shù)有意義，如果無(wú)意義則重新根據(jù)建議分布采樣，再判斷接受概率是否滿足條件。這樣可以有效加快迭代時(shí)的收斂速度，使待反演參數(shù)的抽樣值更快地趨近于目標(biāo)值。從計(jì)算結(jié)果可以看出這樣的改進(jìn)是比較有效的。改進(jìn)的M-H抽樣方法在計(jì)算精度上要高于GIBBS抽樣方法，但由于添加了抽樣的判斷條件其計(jì)算時(shí)間也較長(zhǎng)。而GIBBS抽樣方法在高維數(shù)據(jù)的處理上具有一定的優(yōu)勢(shì)。

(3)通過(guò)案例應(yīng)用, 一方面論證了采用概率方法，即通過(guò)對(duì)后驗(yàn)概率密度函數(shù)抽樣從而進(jìn)行突發(fā)水污染溯源的可行性；另一方面也說(shuō)明本研究采用的改進(jìn)的M-H抽樣方法與傳統(tǒng)的GIBBS抽樣方法相比在提高計(jì)算精度，精確溯源污染源信息方面的優(yōu)勢(shì)所在。

□

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡