[英國(guó)]S.布萊茲科瓦 K.貝文
李紅梅 譯自荷刊《結(jié)構(gòu)與基礎(chǔ)結(jié)構(gòu)工程》2009年第 8期
洪水預(yù)報(bào)中不確定性處理的方法在很大程度上取決于洪水的預(yù)報(bào)目的,例如,是用于實(shí)時(shí)預(yù)報(bào)還是用于洪水風(fēng)險(xiǎn)評(píng)估方面的模擬等。在實(shí)時(shí)預(yù)報(bào)中,主要目標(biāo)是在利用事件中可以獲得的任何數(shù)據(jù),使得預(yù)見(jiàn)期精度最大化,并且預(yù)測(cè)變量的變化范圍最小化。因此,這種方法應(yīng)該是自適應(yīng)的并且能充分利用同化數(shù)據(jù)。這種對(duì)于預(yù)報(bào)問(wèn)題的自適應(yīng)性意味著能用簡(jiǎn)單模型來(lái)代表系統(tǒng),并且能超強(qiáng)適應(yīng)不可避免的誤差。如下文所述,可以用歷史數(shù)據(jù)來(lái)建立這樣的模型。
模型模擬的問(wèn)題是各不相同的。在尋求最大的精確度和最小的預(yù)測(cè)不確定性的同時(shí),對(duì)不同類(lèi)型的應(yīng)用都要求模型能以合適的方式代表水文過(guò)程,或者以合適的原因獲得正確的水文預(yù)報(bào)值。這可能會(huì)帶來(lái)一些問(wèn)題。即使在流域研究中,也常會(huì)發(fā)生這樣的情況:沒(méi)有足夠的信息來(lái)確定不明確的自然過(guò)程。實(shí)際上,獲得流域出口的合理的流量模擬可以有很多不同的方式,研究人員把這種現(xiàn)象稱(chēng)為“殊途同歸”現(xiàn)象 ,或稱(chēng)為 “模糊 ”、“非唯一 ”、“不可識(shí)別”的現(xiàn)象。研究人員用“殊途同歸”這一術(shù)語(yǔ)暗示其不僅是在很多解決方法中擇優(yōu),同時(shí)也表明所研究的問(wèn)題具有普遍性。很多模型都可產(chǎn)生合理的結(jié)果,可以認(rèn)為是有很多關(guān)于系統(tǒng)過(guò)程的假設(shè)在起作用,這些假設(shè)如果在有足夠多的數(shù)據(jù)的情況下,有些可能得到驗(yàn)證,有些則被拒絕。
多種假設(shè)共同作用的方法是根據(jù)基于優(yōu)化的模型率定所遇到的問(wèn)題而采取的解決方式。這種解決方式當(dāng)然很自然地將重點(diǎn)置于流域系統(tǒng)的模擬方面,尤其是模型顯示出某些“最好”的統(tǒng)計(jì)特征,例如最小的誤差變化等。然而,經(jīng)驗(yàn)表明,好的模型可能會(huì)有很大的變幅,這取決于所使用數(shù)據(jù)的系列,而結(jié)果殘差用常規(guī)的統(tǒng)計(jì)結(jié)構(gòu)卻難以表達(dá)。這并不奇怪,水文系統(tǒng)的自然過(guò)程模擬受制于每一個(gè)事件的輸入,這就意味著有期望改變誤差的分布。很顯然,不合適的誤差假設(shè)會(huì)導(dǎo)致不合適的結(jié)果。
如果有多種模型結(jié)構(gòu),不同的模型運(yùn)行時(shí)的同一參數(shù)可能會(huì)有不同的值(或者是同一模型的不同方式運(yùn)行時(shí)),這種情況還會(huì)更復(fù)雜。尺度問(wèn)題也可能意味著合適的模型參數(shù)值可能會(huì)與實(shí)際測(cè)量值不同。而模型需要的有效參數(shù)值是由模型的結(jié)構(gòu)決定的。
本文僅僅是研究洪水預(yù)報(bào),重點(diǎn)是預(yù)報(bào)中的不確定性,提出了一種使用“殊途同歸”的方法來(lái)解決問(wèn)題及確定有效參數(shù)值。
在實(shí)時(shí)預(yù)報(bào)模型中,原則上是可以使用任何功能完備的降雨產(chǎn)流模型,概念性或者是基于物理的分布式模型。實(shí)時(shí)預(yù)報(bào)模型有很多種,但是基于數(shù)據(jù)的機(jī)理模型(DBM)卻顯示出有較大的優(yōu)越性。這種模型主要是識(shí)別和評(píng)估能代表線性轉(zhuǎn)換功能等動(dòng)態(tài)行為的主導(dǎo)模型。非線性問(wèn)題可以通過(guò)輸入過(guò)濾功能來(lái)完成轉(zhuǎn)換。假設(shè)在事件的過(guò)程中,知道關(guān)于降雨或者水位方面的信息,研究人員從處理不確定性出發(fā),目標(biāo)是預(yù)報(bào)誤差變化范圍的最小化。數(shù)據(jù)同化中一個(gè)重要的步驟是使用卡爾曼濾波方法(Kalman filter-based approach)更新預(yù)報(bào)值和評(píng)估預(yù)報(bào)中的不確定性因素。
基于數(shù)據(jù)的機(jī)理模型(DBM)能夠用于產(chǎn)流和匯流的實(shí)時(shí)預(yù)報(bào)系統(tǒng),基于數(shù)據(jù)的機(jī)理模型能和預(yù)報(bào)流量一樣,準(zhǔn)確地實(shí)時(shí)預(yù)報(bào)水位。這個(gè)模型有的是直接使用水位更新預(yù)報(bào)值,而不必用水位流量曲線將水位轉(zhuǎn)為流量來(lái)更新預(yù)報(bào)值。通過(guò)避免水位流量關(guān)系曲線的非線性,該方法有望穩(wěn)定預(yù)報(bào)變量的異方差,尤其是在發(fā)生漫岸流量的時(shí)候更是如此。
然而,仍然需要考慮一些非線性關(guān)系,例如降雨-水位預(yù)測(cè)和水位 -水位預(yù)測(cè)等。研究人員發(fā)現(xiàn),存在于降雨 -水位或者降雨 -流量的非線性關(guān)系,能夠用一個(gè)帶有參數(shù)的指數(shù)關(guān)系來(lái)表達(dá):
式中 uk代表過(guò)濾后的有效降雨;rk代表測(cè)量后的降雨;yk是水位或者是代表土壤濕度的流量;c是一個(gè)常數(shù);γ是一個(gè)冪指數(shù);k代表時(shí)間步長(zhǎng)的序數(shù)。
對(duì)于流量或者水位與有效降雨之間的關(guān)系,可以采用線性轉(zhuǎn)化函數(shù)來(lái)表達(dá):
式中 a1…an和 b0…bm是系數(shù);δ是一個(gè)時(shí)間推遲;k是時(shí)間步長(zhǎng)的序數(shù);ηk是噪聲輸入;uk是有效降雨。
經(jīng)驗(yàn)表明,可以使用2個(gè)以上的系數(shù)靈活地確定降雨 -水位或者流量模型。這可以分解為一個(gè)快速響應(yīng)和一個(gè)慢速響應(yīng)來(lái)代表占主導(dǎo)的系統(tǒng)行為。使用卡爾曼濾波法進(jìn)行數(shù)據(jù)處理是最簡(jiǎn)單的辦法,可根據(jù)時(shí)間變?cè)鲆鎭?lái)處理不斷更新的預(yù)報(bào)值。其目的是在追求給定的預(yù)見(jiàn)期內(nèi)預(yù)報(bào)方差的最小化。
洪水預(yù)報(bào)模擬在確定設(shè)計(jì)數(shù)據(jù)時(shí),需要一定重現(xiàn)期的設(shè)計(jì)水文過(guò)程線,如預(yù)估一定重現(xiàn)期的洪水淹沒(méi)范圍,或者研究洪水產(chǎn)生機(jī)制等等。
通常,模擬方面的不確定性問(wèn)題由兩個(gè)部分組成,兩個(gè)部分的不確定性都有多種來(lái)源。首先是預(yù)測(cè)在指定條件下的流量,尤其是不同重現(xiàn)期下的極端流量。其次是預(yù)測(cè)這些事件的影響,例如水庫(kù)入流、洪泛區(qū)淹沒(méi)面積、泥沙輸移和財(cái)產(chǎn)損失等。這可能需要額外(不確定性)的模型模塊。
在這兩種情況下,預(yù)測(cè)的準(zhǔn)確性將受制于模型輸入的誤差,某些系統(tǒng)特征的模型參數(shù),模型率定所使用的數(shù)據(jù),以及代表系統(tǒng)主導(dǎo)過(guò)程的模型結(jié)構(gòu)自身的誤差等。目前存在著很多結(jié)構(gòu)復(fù)雜的流域徑流產(chǎn)生模型,例如概念性模型(主要是基于很多水庫(kù)概念的模型)和一些所謂的基于物理的模型(這些模型以一種分布式的微分方程表示)。將各個(gè)產(chǎn)流過(guò)程統(tǒng)合起來(lái)引入了越來(lái)越多的參數(shù),以至于不能夠很好地確定每個(gè)參數(shù)的意義,實(shí)測(cè)數(shù)據(jù)也沒(méi)有足夠的關(guān)于參數(shù)的信息用于模型率定。模型的參數(shù)由觀測(cè)到的降雨徑流數(shù)據(jù)率定得到,試圖使用不經(jīng)過(guò)參數(shù)率定的模型來(lái)進(jìn)行降雨產(chǎn)流模擬肯定是不行的。
模型的校驗(yàn)一開(kāi)始是由有經(jīng)驗(yàn)的水文專(zhuān)家根據(jù)模型參數(shù)的物理意義手工完成,或者采用自動(dòng)優(yōu)化步驟完成。由于模擬過(guò)程的復(fù)雜性,模型的響應(yīng)面也是復(fù)雜的,存在著很多局部最優(yōu)值。研究人員花費(fèi)了很多的努力,試圖尋找有效的優(yōu)化方法獲得全局最優(yōu)值。經(jīng)驗(yàn)表明,相同模型的不同參數(shù)系列,或者是非模型的不同參數(shù)系列都能夠得出同樣的結(jié)果。模型的識(shí)別并非唯一,從這個(gè)角度來(lái)說(shuō),降雨徑流模型和環(huán)境模型在數(shù)學(xué)上是不適宜的。因此,不可能將誤差具體分解為多種誤差源。
優(yōu)化的參數(shù)設(shè)置對(duì)應(yīng)于特定的模型輸入系列。不同的誤差可能會(huì)相互抵消,例如參數(shù)的誤差可能會(huì)與某種輸入誤差相抵消。對(duì)于另外一套輸入系列,研究者可能會(huì)得到另外一套最優(yōu)化參數(shù)設(shè)置。解決這種問(wèn)題的辦法就是拋棄最優(yōu)參數(shù)設(shè)置和最優(yōu)模型的觀念,并且對(duì)能產(chǎn)生合理結(jié)果的參數(shù)系列(有效參數(shù)系列)進(jìn)行評(píng)估。計(jì)算的結(jié)果是可以從有效預(yù)測(cè)值的累積分布圖上讀出預(yù)測(cè)的包絡(luò)線。
“殊途同歸”理論認(rèn)為模型有很多合理的表達(dá),并且不能輕易被拒絕,還要在預(yù)報(bào)不可確定性的評(píng)估中考慮。這就是研究人員使用的“通用不確定性評(píng)估”方法。
在“通用不確定性評(píng)估”方法中,參數(shù)系列是在物理成因的范圍內(nèi)隨機(jī)設(shè)置,通常在參數(shù)設(shè)置前并沒(méi)有關(guān)于參數(shù)值的信息,而是均勻取值。參數(shù)被用來(lái)實(shí)現(xiàn)不同的模型輸出,然后再使用一定的標(biāo)準(zhǔn)進(jìn)行檢驗(yàn),并且確定每個(gè)參數(shù)的權(quán)重。其中重要的一步是,如果參數(shù)不能得出令人可接受的模擬結(jié)果,則該參數(shù)需要被舍棄?!翱赡苄浴痹谶@里比統(tǒng)計(jì)學(xué)上的“幾率”范疇要廣。確定“可能性”的措施包括觀測(cè)流量和模擬流量之間的確定系數(shù),這是一種基于觀測(cè)數(shù)據(jù)和模型流量數(shù)據(jù)的頻率曲線之間絕對(duì)誤差之和,或者其他各種表達(dá)觀測(cè)值與模擬值之間相似程度的模糊判別方法。在進(jìn)行模擬以前,一些觀測(cè)誤差的范圍如果能夠確定,將會(huì)簡(jiǎn)化不確定性的分析過(guò)程。模型的模擬結(jié)果超出誤差范圍,都應(yīng)被舍棄。
這種概念下的集合理論模型評(píng)估則十分簡(jiǎn)單,模型結(jié)果不在誤差范圍之內(nèi)的都要被舍棄。這樣可能有很多模型的模擬結(jié)果均在誤差范圍之內(nèi),并且會(huì)被接受。因此,任何這種類(lèi)型的模型評(píng)估應(yīng)當(dāng)仔細(xì)考慮模型誤差的不同來(lái)源,如前所述,這種誤差評(píng)估在實(shí)際中是很困難的。模型誤差的來(lái)源可以簡(jiǎn)化為輸入誤差、模型結(jié)構(gòu)誤差和實(shí)際測(cè)量誤差。這些誤差不能通過(guò)簡(jiǎn)單地比較觀測(cè)值和預(yù)測(cè)值得到,在非線性模擬中,還沒(méi)有通用的理論來(lái)指導(dǎo)分析不同來(lái)源的誤差。大多數(shù)模擬者只是簡(jiǎn)單地認(rèn)為這些誤差數(shù)量相同,即使事實(shí)并非如此。因此,在評(píng)估模型的可接受程度的時(shí)候,有必要考慮確定合適水平的“有效觀測(cè)誤差”來(lái)考慮這些差別。這樣定義以后,有效觀測(cè)誤差不必要有零均值或者是方差為常數(shù),不必為高斯(Gaussian)分布,尤其是該種誤差受著某種物理制約的時(shí)候。這樣,任何有效模型都應(yīng)該提供有效觀測(cè)誤差范圍之內(nèi)的模擬結(jié)果。
因此,對(duì)于一個(gè)有參數(shù)設(shè)置 Θ的模型,如果其所預(yù)測(cè)的變量 M(Θ,X,t)對(duì)于任何一個(gè)變量 Q(X,t)來(lái)說(shuō),滿(mǎn)足:
則認(rèn)為該模型是可以接受的。根據(jù)模型的可見(jiàn)性能,假設(shè)[Qmin(X,t),Qmax(X,t)]是觀測(cè)值可能的范圍,模型的“可能性”加權(quán)方式不一定非要使模型輸出的結(jié)果在觀測(cè)值Q(X,t)周?chē)鶆驅(qū)ΨQ(chēng),可能有其他多種分布形式。
這組簡(jiǎn)單的模糊隸屬函數(shù)或者相對(duì)可能性方法適用于所有能提供預(yù)報(bào)的模型,其所提供的預(yù)報(bào)范圍在可接受的范圍之內(nèi)。模型預(yù)報(bào)值與觀測(cè)值很接近,賦予較高的權(quán)重;模型預(yù)報(bào)值超出觀測(cè)誤差范圍則被賦予零權(quán)重。用這種方式對(duì)模型預(yù)報(bào)值進(jìn)行限制,是基于如下隱含的假設(shè),即模型預(yù)測(cè)中的誤差與評(píng)估中的誤差是相似的。
對(duì)于任何時(shí)刻的變量Q(X,t),如果預(yù)測(cè)值不在可接受的誤差范圍之內(nèi),則模型將被視為不可接受,并且要被舍棄。這與傳統(tǒng)的統(tǒng)計(jì)模型不同,在那里一個(gè)錯(cuò)誤的模型受制于模型結(jié)構(gòu),有時(shí)可能會(huì)被誤認(rèn)為是正確的,且在結(jié)構(gòu)中補(bǔ)償模型模擬的不足。如果沒(méi)有一個(gè)模型被證明是理想的,那么表明,模型可能存在著概念上、結(jié)構(gòu)上和數(shù)據(jù)方面的錯(cuò)誤(盡管哪個(gè)原因是最為主要的仍然很難確定)。
所有模型的被拒絕或者被舍棄不能認(rèn)為模型是失敗,只是表明研究者需要了解更多的關(guān)于模型的系統(tǒng)結(jié)構(gòu)、輸入數(shù)據(jù)或者邊界條件方面的信息。輸入數(shù)據(jù)和邊界條件是一個(gè)重要的考慮因素,因?yàn)榧词挂粋€(gè)“完善”的模型在輸入數(shù)據(jù)有較大誤差的情況下,也不能得到具有較高精確度的預(yù)測(cè)。所以需要將輸入數(shù)據(jù)和邊界數(shù)據(jù)的實(shí)際情況和模型參數(shù)共同進(jìn)行評(píng)估,以確保模型誤差是在觀測(cè)誤差的范圍。最終結(jié)果是希望得到一些可接受的模型,每個(gè)模型賦有一定的可能性權(quán)重。
這種方法提供了一種比較好的模型檢驗(yàn)和評(píng)估方式,通過(guò)假定有效的觀測(cè)誤差來(lái)避免對(duì)模擬誤差進(jìn)行假設(shè)。重點(diǎn)放在模型可預(yù)測(cè)變量和實(shí)際所觀測(cè)變量在評(píng)價(jià)合理觀測(cè)誤差上的差異。
用散點(diǎn)圖(將可能性空間的點(diǎn)投射到以單個(gè)參數(shù)為坐標(biāo)軸的圖上)可以說(shuō)明模型的“殊途同歸”理論和估計(jì)有效參數(shù)的可能范圍。在大多數(shù)模型的應(yīng)用中,只有1~2個(gè)參數(shù)是具有敏感性的,那些不敏感的參數(shù)在整個(gè)范圍的模擬過(guò)程中能反應(yīng)出模型是否可接受(圖1)。圖1為可能性散點(diǎn),即確定性(圖中的橫軸為參數(shù)范圍;縱軸為可能性檢測(cè);每個(gè)點(diǎn)為一次模擬)。
有時(shí),模型需要考慮多個(gè)變量,例如在評(píng)估水力學(xué)模型的時(shí)候,出口的水文過(guò)程線和洪水淹沒(méi)范圍都可用作確定可能性。在評(píng)估洪泛區(qū)淹沒(méi)范圍的過(guò)程中,研究人員使用了一個(gè)淹沒(méi)插值與觀測(cè)值之間差異的方法,其方程式為:
還有研究者在評(píng)估洪水淹沒(méi)范圍的模型時(shí)是采用模糊方法,其結(jié)果是顯示了一個(gè)給定流量下淹沒(méi)范圍的概率分布,提供一個(gè)未來(lái)事件淹沒(méi)風(fēng)險(xiǎn)的簡(jiǎn)單評(píng)估辦法。
圖1 可能性散點(diǎn)示意
在提供土壤含水量空間分布水文模型中,可能性評(píng)估方法是兩個(gè)標(biāo)準(zhǔn)的組合,即流域出口流量模擬符合程度,以及土壤飽和模擬與實(shí)測(cè)區(qū)域的對(duì)比。
下面用一個(gè)實(shí)例來(lái)講述“通用不確定性評(píng)估”方法在熱利夫卡(Zelivka)河流域洪水頻率研究方面的應(yīng)用。
研究流域面積為1186 km2,被分為7個(gè)子流域,其中 4個(gè)流域的流量信息是可以獲得的。計(jì)算過(guò)程詳見(jiàn)圖2和圖 3。模擬是使用的頂級(jí)模型(TOPMODEL)的頻率模塊進(jìn)行的,該模型適用于在雨雪累積和融化的大型流域。
對(duì)于每個(gè)有觀測(cè)數(shù)據(jù)的流域,設(shè)置一個(gè)模糊模型,同時(shí)結(jié)合以下 3個(gè)標(biāo)準(zhǔn):即洪水頻率曲線的擬合、洪水歷時(shí)曲線和年最大水(雪)深(見(jiàn)圖2)。
圖2 短歷時(shí)(100a)模擬可能性計(jì)算
在此基礎(chǔ)上,對(duì)區(qū)域子流域模擬的可能性進(jìn)行了研究。3個(gè)子流域的可能性評(píng)估,以及有長(zhǎng)歷時(shí)的觀測(cè)數(shù)據(jù)的下克拉洛維采(Dolni Kralovice)站的流量頻率可能性評(píng)估,壩址處洪水歷時(shí)可能性評(píng)估,再加之跨流域融雪水當(dāng)量評(píng)估,這些都是第2個(gè)模糊系統(tǒng)的輸入?;诖?對(duì)以小時(shí)為單位的100a的短歷時(shí)模擬進(jìn)行了評(píng)估,然后用其參數(shù)進(jìn)行了10000a的長(zhǎng)系列模擬,以獲得較長(zhǎng)歷時(shí)頻率統(tǒng)計(jì)的較好評(píng)估。最后的評(píng)估也是以一種模糊的方式進(jìn)行的,并使用了模擬降雨和最大可能降雨(PMP)的關(guān)系。預(yù)測(cè)的百分位通過(guò)從所有有效模型及相關(guān)的最終模糊可能性估計(jì)得到的預(yù)測(cè)值取權(quán)重來(lái)確定。圖 3顯示的是下克拉洛維采站的洪水頻率曲線的包絡(luò)線及觀測(cè)數(shù)據(jù)。
圖3 長(zhǎng)歷時(shí)(10000a)模擬可能性計(jì)算
“通用不確定性評(píng)估”方法要求有很多主觀因素,例如決定模型的參數(shù),哪些是固定的,哪些是要變化的,以及參數(shù)范圍、有效觀測(cè)誤差的合理范圍、可能性的標(biāo)準(zhǔn)、輸入數(shù)據(jù)和邊界條件誤差的處理等。然而,為便于分析和改變所有這些參數(shù),都要精心考慮確定。例如對(duì)于洪水頻率的評(píng)估問(wèn)題,與終端用戶(hù)討論設(shè)計(jì)頻率曲線的預(yù)測(cè)百分位是有必要的:他們是否會(huì)認(rèn)為 95%的預(yù)測(cè)邊界太高了?
最近幾年,“通用不確定性評(píng)估”方法已經(jīng)擴(kuò)展為更加依賴(lài)與觀測(cè)值有關(guān)的模型合理性的預(yù)估。這將會(huì)使人們的注意力集中到不可比較的誤差(由于尺度或者不均勻性導(dǎo)致的預(yù)測(cè)值和觀測(cè)值之間的差異),以及輸入誤差的影響方面,這兩方面往往會(huì)被忽略。模擬只考慮預(yù)測(cè)值在有效觀測(cè)誤差范圍之內(nèi)的模型行為評(píng)估。
這種“通用不確定性評(píng)估”方法需要考慮在輸入誤差、有效觀測(cè)誤差,以及模型被拒絕的可能性假設(shè)等方面的“殊途同歸”,會(huì)產(chǎn)生很多模擬過(guò)程的研究課題。這個(gè)方法在應(yīng)用上受到限制,尤其是對(duì)具有多個(gè)參數(shù)、長(zhǎng)歷時(shí)或者是多結(jié)構(gòu)的模型,希望未來(lái)這些制約因素會(huì)減少。