杜 懿,麻榮永
(1.廣西大學(xué)土木建筑工程學(xué)院,廣西 南寧 530004;2.廣西防災(zāi)減災(zāi)與工程安全重點(diǎn)實(shí)驗(yàn)室,廣西 南寧 530004)
洪水、暴雨等水文極值事件一般都具有總量、強(qiáng)度和歷時(shí)等多屬性特點(diǎn),且各屬性之間均存在著一定的相依關(guān)系[1]。傳統(tǒng)的單變量分析法已無法滿足應(yīng)用要求,為了讓水文事件得到全面描述,進(jìn)行多變量分析就顯得尤為必要。關(guān)于多變量分析的計(jì)算,目前概括起來主要有多元正態(tài)分布、非參數(shù)法、將多維聯(lián)合分布轉(zhuǎn)換成一維分布等方法[2]。但上述方法均存在一定問題。Copula函數(shù)的引入,有效地解決了這一問題。Copula函數(shù)是構(gòu)建多變量聯(lián)合分布的一種高效方法,能夠構(gòu)造出邊緣分布為任意分布的多變量聯(lián)合分布函數(shù),具有極強(qiáng)的靈活性與適應(yīng)性[3]。但Copula函數(shù)類型的選擇是個(gè)難題,不同的Copula函數(shù)具有不同的分布特性,對(duì)水文變量的描述也存在差異。對(duì)此,國內(nèi)外很多學(xué)者也做了大量研究,大體上均認(rèn)為Archimedean Copula函數(shù)族更適合于多數(shù)水文變量的描述[4]。隨著更多Copula函數(shù)的不斷涌現(xiàn),這一經(jīng)驗(yàn)逐漸受到越來越多的挑戰(zhàn)。基于此,本文以郁江南寧水文站歷年最大洪峰、洪量為研究對(duì)象,通過建立不同Copula函數(shù)下兩變量的聯(lián)合分布來推求最佳函數(shù)選擇,以期為未來區(qū)域水利工程規(guī)劃和防洪減災(zāi)工作提供一定指導(dǎo)。
Copula函數(shù)是定義在[0,1]區(qū)間上均勻分布的多維聯(lián)合分布函數(shù),其理論最早可追溯到1959年Sklar提出的Sklar定理。該定理認(rèn)為可以將一個(gè)N維聯(lián)合分布函數(shù)分解成N個(gè)邊緣分布函數(shù)和一個(gè)Copula連接函數(shù)。Nelsen于1999年給出了Copula函數(shù)的嚴(yán)格定義,即Copula函數(shù)是把隨機(jī)變量X1,X2,…,XN的聯(lián)合分布函數(shù)F(x1,x2,…,xN)與各自的邊緣分布函數(shù)FX1(x1),FX2(x2),…FXN(xN)相連接的連接函數(shù)。即函數(shù)C(u1,u2,…,uN),使得
F(x1,x2,…,xN)=C[FX1(x1),
FX2(x2),…FXN(xN)]
(1)
Copula函數(shù)具有橢圓型、二次型和Archimedean型三大類。其中,Archimedean Copula函數(shù)族又包括G-H、Clayton和Frank 等多種Copula函數(shù)[5]。本文選用的5種Copula函數(shù)的分布函數(shù)分別如下:
(1)正態(tài)(高斯)Copula
(2)
式中,u、v;ρ為變量間的線性相關(guān)系數(shù);φ-1為標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)的逆函數(shù);其他變量為函數(shù)中的參數(shù)。
(2)t-Copula函數(shù)
(3)
(3)G-H、Clayton、Frank Copula函數(shù)
C(u,v)=e-[(-lnu)θ+(-lnv)θ]1/θ
(4)
C(u,v)=(u-θ+v-θ-1)-1/θ
(5)
(6)
式中,θ為各Copula連接函數(shù)的參數(shù)值。
以上Copula函數(shù)具有不同的特點(diǎn),無明顯的優(yōu)劣之別??傮w來說,正態(tài)Copula函數(shù)和Frank Copula函數(shù)適合于尾部對(duì)稱且漸近獨(dú)立的二維隨機(jī)變量; t-Copula函數(shù)適合于尾部對(duì)稱且尾部相關(guān)的二維隨機(jī)變量;G-H Copula函數(shù)和Clayton Copula函數(shù)均適合于具有非對(duì)稱尾部的二維隨機(jī)變量,前者上尾相關(guān)、下尾漸近獨(dú)立,后者相反。
本文根據(jù)郁江南寧水文站1942年~2002共61a洪水資料,整理出歷年最大洪水所對(duì)應(yīng)的洪峰流量與洪水總量(具體數(shù)據(jù)略)。從推求兩變量各自最佳的邊緣分布、選取Copula連接函數(shù)、參數(shù)估計(jì)、模型評(píng)價(jià)4個(gè)過程來進(jìn)行郁江南寧水文站洪水峰量聯(lián)合分布Copula函數(shù)選取問題的研究。
在我國,一般認(rèn)為,P-Ⅲ型曲線可以很好地?cái)M合水文變量的頻率分布?;诖耍疚某踹xP-Ⅲ型分布對(duì)洪峰、洪量兩序列進(jìn)行擬合,二者累積概率密度函數(shù)如圖1、2所示。
圖1 洪峰的P-Ⅲ型分布擬合結(jié)果
圖2 洪量的P-Ⅲ型分布擬合結(jié)果
從圖1、2中可以看出,P-Ⅲ型曲線對(duì)洪峰、洪量兩序列的擬合結(jié)果均不理想,誤差較大。為準(zhǔn)確快速地推求出兩變量的邊緣分布,筆者采用非參數(shù)核密度估計(jì)法來對(duì)兩變量的分布形態(tài)進(jìn)行研究。利用MATLAB軟件編程得到兩變量的核分布估計(jì)與經(jīng)驗(yàn)分布函數(shù)的擬合結(jié)果(見圖3、4)。
圖3 洪峰的核分布估計(jì)與經(jīng)驗(yàn)分布函數(shù)
圖4 洪量的核分布估計(jì)與經(jīng)驗(yàn)分布函數(shù)
從圖3、4可看出,洪峰和洪量的經(jīng)驗(yàn)分布函數(shù)與核分布估計(jì)幾乎重合,擬合效果優(yōu)秀,誤差較?。粡亩f明本次利用非參數(shù)核密度估計(jì)法求得的兩個(gè)變量的邊緣分布較為準(zhǔn)確,很好地反映出了兩序列的分布特性。
G-H、Clayton、Frank 3個(gè)Copula函數(shù)的參數(shù)取值分別為θ1=3.117 415,θ2=3.660 801,θ3=9.997 817。
將計(jì)算得到的經(jīng)驗(yàn)聯(lián)合分布值與用5種Copula函數(shù)計(jì)算得到的理論聯(lián)合分布值點(diǎn)繪作圖,結(jié)果如下。
圖5 經(jīng)驗(yàn)聯(lián)合分布與理論聯(lián)合分布的擬合
由圖5可以看出,以上5種Copula函數(shù)的擬合效果都較好,點(diǎn)據(jù)均分布在45°直線附近。為了更精確地評(píng)價(jià)每個(gè)Copula函數(shù)的擬合效果,分別以擬合趨勢線斜率(k)、相關(guān)系數(shù)平方(R2)、平方歐式距離(d)為標(biāo)準(zhǔn)進(jìn)行判別。其中,k和R2值越接近于1或d值越小,擬合效果越好。比較結(jié)果見表1。
表1 五種Copula函數(shù)比較結(jié)果
比較發(fā)現(xiàn),5種Copula連接函數(shù)中以二元t-Copula函數(shù)的擬合效果最好,F(xiàn)rank Copula函數(shù)最差(與經(jīng)驗(yàn)結(jié)論相悖)。故在郁江南寧水文站洪水峰量聯(lián)合分布研究中,推薦使用二元t-Copula連接函數(shù)。函數(shù)的聯(lián)合概率密度見圖6。其中,U表示洪峰,V表示洪量。
圖6 二元t-Copula概率密度
仔細(xì)觀察圖6可知,二元t-Copula函數(shù)具有對(duì)稱的尾部,且尾部較厚。該函數(shù)對(duì)變量之間的尾部相關(guān)變化較為敏感,可以很好地捕捉到變量的對(duì)稱的尾部相關(guān)關(guān)系。
本文以郁江南寧站61a洪水資料為基礎(chǔ),采用5種不同的Copula函數(shù)來建立洪峰與洪量的聯(lián)合分布。在洪峰、洪量的邊緣分布推求中,由于傳統(tǒng)的P-Ⅲ型分布擬合較差,遂采用了非參數(shù)核密度估計(jì)法來描述兩個(gè)變量各自的邊緣分布,擬合誤差較小,結(jié)果有了很大提高;通過點(diǎn)繪5種Copula函數(shù)的理論聯(lián)合分布與經(jīng)驗(yàn)聯(lián)合分布的相關(guān)圖發(fā)現(xiàn),5種Copula函數(shù)均適用于本次峰量聯(lián)合分布研究;以擬合趨勢線斜率、相關(guān)系數(shù)平方、平方歐式距離作為評(píng)價(jià)指標(biāo),比較得出適用于本次研究的最優(yōu)Copula連接函數(shù),即二元t-Copula函數(shù)。