国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

論水文計(jì)算中的相關(guān)性分析方法

2017-05-07 03:18:02閆寶偉段美壯
水利學(xué)報(bào) 2017年9期
關(guān)鍵詞:樣本容量水文洪水

閆寶偉,潘 增,薛 野,段美壯

(華中科技大學(xué) 水電與數(shù)字化工程學(xué)院,湖北 武漢 430074)

1 水文現(xiàn)象中的相關(guān)性及其度量

相關(guān)性分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對(duì)具有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機(jī)變量之間相關(guān)關(guān)系的一種統(tǒng)計(jì)方法。相關(guān)性普遍存在于水文現(xiàn)象中,無(wú)論水文事件內(nèi)部屬性間(如洪水的峰和量等),還是由外部原因(如空間、因果關(guān)系等)引起的相關(guān)性,如洪水的地區(qū)組成和遭遇、降雨和徑流的關(guān)系等,都是兩個(gè)或多個(gè)變量間的互相關(guān)。水文時(shí)間序列(如年、月徑流)有時(shí)會(huì)存在短滯時(shí)或長(zhǎng)滯時(shí)的相依關(guān)系,屬于單個(gè)變量不同時(shí)序間的相關(guān),稱之為自相關(guān)。除了單相關(guān)即兩個(gè)變量相關(guān)外,一個(gè)要素或變量還可能同時(shí)與幾個(gè)要素或變量之間相關(guān),如徑流不僅與降雨有關(guān),還受蒸發(fā)、氣溫、下墊面及人類活動(dòng)等影響,這種相關(guān)關(guān)系稱為復(fù)相關(guān),水文計(jì)算中的多元回歸就屬于此類。在多變量情況下,研究?jī)蓚€(gè)要素或變量同時(shí)消除了其余控制要素影響后的相關(guān),稱為偏相關(guān),例如應(yīng)用偏相關(guān)分析可以尋找與徑流量顯著相關(guān)的氣象因素和土地利用-覆被變化因素等[1]。相關(guān)性分析是水文計(jì)算的一項(xiàng)重要內(nèi)容,深入了解水文現(xiàn)象中出現(xiàn)的這些相關(guān)性,并能根據(jù)研究對(duì)象和分析目的的不同選用適合的分析方法,對(duì)解決實(shí)際問(wèn)題將有很大的幫助。

1.1 相關(guān)性的度量 水文變量之間的相關(guān)性按其度量方式不同可分為相關(guān)性指標(biāo)和相關(guān)性結(jié)構(gòu),其中相關(guān)性指標(biāo)是衡量變量間相關(guān)程度的度量指標(biāo),包括以下指標(biāo)。

(1)刻畫全局相關(guān)性的相關(guān)系數(shù),如Pearson線性相關(guān)系數(shù)ρ、Spearman秩相關(guān)系數(shù)R和Kendall秩相關(guān)系數(shù)τ。線性相關(guān)系數(shù)僅適用于描述呈線性相關(guān)關(guān)系的變量,而秩相關(guān)系數(shù)由于具有單調(diào)遞增變換不變性和對(duì)異常數(shù)據(jù)有較強(qiáng)的抗沖擊能力等良好性質(zhì),致使它非常適用于描述變量間的非線性相關(guān)關(guān)系。但它們只是對(duì)變量間關(guān)聯(lián)程度的全局度量,不能捕捉到復(fù)雜變量的局部相關(guān)性特征。

(2)描述極值相關(guān)特征的尾部相關(guān)系數(shù),包括上尾部相關(guān)系數(shù)λU和下尾部相關(guān)系數(shù)λL。尾部相關(guān)系數(shù)是一個(gè)廣泛應(yīng)用于極值理論的相關(guān)性測(cè)度指標(biāo),在分析水文極值事件的屬性特征(如洪峰與洪量、干旱歷時(shí)與烈度等)時(shí)發(fā)揮著重要作用[2-3],如果不考慮它們之間的尾部相關(guān)性,可能會(huì)出現(xiàn)高估或低估水文極值事件的風(fēng)險(xiǎn)[3-4]。

(3)表示變量間共享信息量的互信息I,它能夠有效捕捉變量間的非線性關(guān)系。I越大,變量之間的相關(guān)性越強(qiáng),也可以將互信息看作是相關(guān)系數(shù)在高維非線性情況下的推廣,在水文預(yù)報(bào)因子的選擇和水文模型的不確定性分析等方面有一定的優(yōu)勢(shì)[5-7]。

相關(guān)性結(jié)構(gòu)是指變量間是以何種模式相關(guān),或者通過(guò)什么結(jié)構(gòu)可以將兩個(gè)或多個(gè)變量的概率分布聯(lián)系起來(lái),通常采用Copula函數(shù)描述。Copula函數(shù)是定義域?yàn)椋?,1]均勻分布的多維聯(lián)合分布函數(shù),它可以將隨機(jī)變量之間的相關(guān)程度和相關(guān)模式有機(jī)地結(jié)合在一起,從而刻畫隨機(jī)變量間的相關(guān)性結(jié)構(gòu)。相關(guān)性指標(biāo)是一個(gè)單一數(shù)值,無(wú)法充分反映變量之間的相關(guān)特性,而相關(guān)性結(jié)構(gòu)能夠捕捉變量間所有的相關(guān)性信息[8]。

1.2 相關(guān)性指標(biāo)和相關(guān)性結(jié)構(gòu)的聯(lián)系 Copula函數(shù)是刻畫變量間相關(guān)性結(jié)構(gòu)的一種有效工具,它通過(guò)參數(shù)θ間接地描述變量間的相關(guān)性,如對(duì)于隨機(jī)變量X與Y,其邊緣分布分別為u和v,則上述相關(guān)性指標(biāo)可由二維Copula函數(shù)Cθ(u,v)得出。例如,對(duì)于Kendall秩相關(guān)系數(shù)τ,兩者存在如下關(guān)系[9]:

式中:E(·)為期望函數(shù)。

對(duì)于Spearman秩相關(guān)系數(shù)R,則存在如下關(guān)系[9]:

而對(duì)于尾部相關(guān)系數(shù),引入Copula函數(shù)后,λU和λL可簡(jiǎn)化為[4]:

根據(jù)互信息的定義,有[10]

其中,HC(uv)稱為Copula熵。從而Copula函數(shù)將相關(guān)性指標(biāo)與相關(guān)性結(jié)構(gòu)有機(jī)結(jié)合起來(lái),由于隨機(jī)變量的所有統(tǒng)計(jì)特征均包含在邊緣分布中,Copula函數(shù)通過(guò)將聯(lián)合分布分為邊緣分布和相關(guān)性結(jié)構(gòu)兩部分分別處理,完整地保留了變量間所有關(guān)于相關(guān)性的信息,逐漸成為水文變量相關(guān)性分析的一種理想工具,近幾年得到了廣泛應(yīng)用和發(fā)展[10-12]。

2 相關(guān)性分析方法及適用范圍

水文計(jì)算中相關(guān)性分析的目的,一是插補(bǔ)展延資料,分析目標(biāo)變量的統(tǒng)計(jì)特征;二是通過(guò)隨機(jī)模擬,增大樣本容量;三是辨識(shí)主要影響因子,簡(jiǎn)化計(jì)算。相應(yīng)的分析方法包括回歸分析、自回歸分析、R/S分析、主成分分析及Copula函數(shù)等。其中,回歸分析是研究?jī)蓚€(gè)或多個(gè)變量間的互相關(guān)性;自回歸分析則是分析某一變量時(shí)序間的短滯時(shí)相關(guān)性;R/S分析適用于描述某一變量的長(zhǎng)程相依性;主成分分析則試圖將多個(gè)變量含有的共同成分提取出來(lái),重新組合成一組新的互相無(wú)關(guān)的綜合變量;Copula函數(shù)旨在通過(guò)構(gòu)造變量間的聯(lián)合分布函數(shù),研究變量間的相依概率特征。

2.1 回歸分析 回歸分析尤其是線性回歸分析是進(jìn)行水文系列插補(bǔ)展延最常用的方法,而實(shí)際上建立在二元正態(tài)分布假設(shè)基礎(chǔ)上的線性回歸并不是水文系列插補(bǔ)展延的合格方法[13]。究其原因,線性回歸中的相關(guān)變量X和Y的總體分布是遵循二元正態(tài)分布的,而水文變量往往呈偏態(tài)型,拿偏態(tài)型的水文變量套用只有服從正態(tài)分布的變量才適用的方法,本身就存在理論誤差,劉光文[13]曾利用兩個(gè)假想水文系列對(duì)線性回歸進(jìn)行誤差檢驗(yàn),結(jié)果表明,線性回歸插補(bǔ)展延的誤差往往不小,他認(rèn)為“人們對(duì)水文頻率計(jì)算從最初即不肯使用正態(tài)分布,何以對(duì)系列插補(bǔ)展延等水文問(wèn)題就坦然使用假定二元正態(tài)分布的回歸相關(guān),豈非自相矛盾”。

由此看來(lái),偏態(tài)型的水文變量不宜直接應(yīng)用線性回歸方法,要么經(jīng)過(guò)正態(tài)變換后應(yīng)用[14],要么進(jìn)行非線性回歸分析。回歸分析的目的無(wú)非是插補(bǔ)展延資料或是預(yù)測(cè)未來(lái)趨勢(shì),其實(shí)質(zhì)是求因變量Y在自變量X已知時(shí)的期望,即回歸方程相當(dāng)于y=E(y|x),對(duì)于偏態(tài)型的水文變量,該方程一般為非線性方程,其求解可以借助于Copula函數(shù),如下[15]:

Copula函數(shù)的引入,從概率的角度分析了變量間的非線性相依關(guān)系,從而可以實(shí)現(xiàn)水文變量的非線性回歸分析,并可以給出預(yù)測(cè)的置信區(qū)間[15]。以清江隔河巖水庫(kù)為例,說(shuō)明這種方法的有效性,其中Copula函數(shù)選用Gumbel-Hougaard Copula。

選取清江隔河巖水庫(kù)壩址斷面1960—2003年共44年的年降水與年徑流資料,按本文介紹的非線性回歸方法,計(jì)算出降水-徑流的非線性回歸曲線及95%的置信區(qū)間,如圖1所示。便于比較,圖中還同時(shí)繪出了線性回歸的趨勢(shì)線及95%的置信區(qū)間。其中,降水與徑流的相關(guān)系數(shù)r2高達(dá)0.929 8,如此高的相關(guān)性,線性回歸似乎可以取得很精確的插補(bǔ)展延,而事實(shí)并非如此,兩條趨勢(shì)線在降水量的均值附近幾乎是重合的,在此區(qū)間內(nèi)兩種方法都可以進(jìn)行有效的插補(bǔ),但對(duì)于極值(最不利)樣本,線性回歸預(yù)測(cè)值明顯小于非線性回歸值。以樣本中最大值為例,即P=2.2%,線性回歸插補(bǔ)值為629.55,非線性回歸值為664.71,真實(shí)值為671.20,誤差分別為-6.21%和-0.97%,外延的誤差可能會(huì)更高。再者,線性回歸的置信區(qū)間要大于非線性回歸值,尤其是在極值附近,也進(jìn)一步驗(yàn)證了文獻(xiàn)[13]關(guān)于“線性回歸不是水文系列插補(bǔ)展延的合格方法”的科學(xué)論斷。

2.2 自回歸分析 不同于回歸分析,自回歸分析的研究對(duì)象是一個(gè)時(shí)間序列,研究的是一個(gè)變量短滯時(shí)自相關(guān)的性質(zhì),多用于隨機(jī)模擬或誤差校正。同線性回歸模型一樣,自回歸模型也是建立在正態(tài)分布的基礎(chǔ)上,對(duì)于偏態(tài)型的水文變量仍需做一些變換,這樣難免在轉(zhuǎn)換過(guò)程中出現(xiàn)信息失真。在假定水文時(shí)間序列服從馬爾柯夫過(guò)程的前提下,水文隨機(jī)模型可以看作是一種條件概率模型,這樣模型的重點(diǎn)就轉(zhuǎn)移到如何構(gòu)造有效的聯(lián)合分布或條件分布,如基于核密度估計(jì)的非參數(shù)方法[16-17]。如上所述,Copula函數(shù)是構(gòu)造聯(lián)合分布的一種有效方法,從而可以將該條件概率模型推廣到更一般的情形[18]。

設(shè)水文時(shí)間序列Xt一階相依,利用Copula函數(shù)可求得Xt依Xt-1的條件分布函數(shù)[19],根據(jù)抽樣的反函數(shù)法就可以對(duì)水文時(shí)間序列進(jìn)行隨機(jī)模擬了,稱這種基于Copula函數(shù)的隨機(jī)模型為CAR(1)模型[19]。如果Xt是平穩(wěn)序列,如年徑流,則該模型為平穩(wěn)CAR(1)模型;如果Xt是非平穩(wěn)序列,如月或日徑流等,則該模型為季節(jié)性CAR(1)模型[20]。CAR(1)模擬的原理不是對(duì)樣本進(jìn)行直接抽樣,而是首先生成樣本對(duì)應(yīng)的概率值,并且該值是按一定的相依結(jié)構(gòu)進(jìn)行排序的,然后再以此概率對(duì)樣本抽樣。由于樣本序列的所有特性都包含在分布函數(shù)里面,所以不會(huì)產(chǎn)生信息的失真,能夠保持原有序列的分布特征。

圖1 隔河巖水庫(kù)降水—徑流的回歸分析

2.3R/S分析 根據(jù)相關(guān)結(jié)構(gòu)特性,水文時(shí)間序列可分為獨(dú)立、短滯時(shí)相關(guān)和長(zhǎng)滯時(shí)相關(guān)三種情形。短滯時(shí)相關(guān)可以由自相關(guān)系數(shù)來(lái)定量表征,長(zhǎng)滯時(shí)相關(guān)結(jié)構(gòu)常由Hurst系數(shù)給出。Hurst系數(shù)是水文學(xué)家Hurst在大量實(shí)證研究的基礎(chǔ)上提出的,用來(lái)定量表征時(shí)間序列的持續(xù)性或長(zhǎng)程相依性[21],一般采用R/S分析法(也稱重標(biāo)極差分析法)計(jì)算,其基本內(nèi)容是:對(duì)于一個(gè)時(shí)間序列{xt},把它分為A個(gè)長(zhǎng)度為N的等長(zhǎng)子區(qū)間,對(duì)于每一個(gè)子區(qū)間Ia,記Ra為IM上的極差,Sa為IM上的標(biāo)準(zhǔn)差,計(jì)算每個(gè)IM上的Ra/Sa,可得A個(gè)值,取其平均值記作(R/S)N,Hurst提出并經(jīng)Mandelbrot證實(shí),有如下關(guān)系式存在[22]:

式中:K為常數(shù),h為Hurst系數(shù),可由最小二乘法求得。

為了描述現(xiàn)在對(duì)未來(lái)的影響,Mandelbrot引進(jìn)了一個(gè)相關(guān)性度量的指標(biāo)C(t),它表示零時(shí)刻過(guò)去的增量和未來(lái)增量的相關(guān)系數(shù)。根據(jù)分?jǐn)?shù)布朗運(yùn)動(dòng)理論,得出了C(t)與h的關(guān)系:

從分?jǐn)?shù)布朗運(yùn)動(dòng)及其相關(guān)函數(shù)來(lái)看,當(dāng)h=0.5時(shí),任意t時(shí)刻過(guò)去與未來(lái)增量的相關(guān)函數(shù)C(t)=0,這時(shí)序列為獨(dú)立的隨機(jī)過(guò)程;當(dāng)h>0.5時(shí),C(t)>0,正相關(guān),即序列未來(lái)的變化趨勢(shì)受過(guò)去變化趨勢(shì)的影響,并且兩者的變化趨勢(shì)相同;當(dāng)h<0.5時(shí),C(t)<0,負(fù)相關(guān),序列未來(lái)的變化趨勢(shì)同樣受過(guò)去變化趨勢(shì)的影響,但兩者的變化趨勢(shì)相反。因此R/S分析在時(shí)間序列中具有很強(qiáng)的預(yù)測(cè)預(yù)報(bào)作用[23],還可以用于水文序列的變異性分析[24]。

布朗運(yùn)動(dòng)是分?jǐn)?shù)布朗運(yùn)動(dòng)h=0.5時(shí)的特例,兩者的區(qū)別在于布朗運(yùn)動(dòng)中的增量是獨(dú)立的,而分?jǐn)?shù)布朗運(yùn)動(dòng)中的增量是非獨(dú)立的。如果假定水庫(kù)蓄水過(guò)程服從分?jǐn)?shù)布朗運(yùn)動(dòng),即認(rèn)為在調(diào)洪過(guò)程中,任意時(shí)間間隔的蓄洪量增量不是相互獨(dú)立的,而是與過(guò)去有關(guān),或者認(rèn)為,任意時(shí)刻水庫(kù)的蓄水量與初始蓄水狀態(tài)有關(guān),由此可以得到水庫(kù)調(diào)洪演算隨機(jī)數(shù)學(xué)模型的一般形式[25-26],即

式中:H(t)為庫(kù)水位過(guò)程,H0為初始庫(kù)水位;Q(t)為任意時(shí)刻入庫(kù)洪水;(qH,C)為相應(yīng)時(shí)刻的泄洪;、分別為入流和泄洪的均值過(guò)程線;C為流量系數(shù)等水力參數(shù);G(H)為水庫(kù)面積-水位關(guān)系曲線。

與文獻(xiàn)[25]不同的是,Bh(t)服從分?jǐn)?shù)布朗運(yùn)動(dòng)而不是維納過(guò)程(布朗運(yùn)動(dòng)),由此將水庫(kù)調(diào)洪演算的隨機(jī)數(shù)學(xué)模型推廣為更一般的情形,通過(guò)方程的求解或模擬,可以求得庫(kù)水位過(guò)程的概率密度,進(jìn)而可以應(yīng)用于水庫(kù)的防洪風(fēng)險(xiǎn)分析。

2.4 主成分分析 水文事件往往包含多個(gè)特征變量,這些特征變量能從不同的側(cè)面反映所研究對(duì)象的特征,但在某種程度上存在信息的重疊,具有一定的相關(guān)性,因此有可能用較少的綜合指標(biāo)分別綜合存在于各變量中的各類信息。主成分分析就是這樣一種方法,在力求數(shù)據(jù)信息丟失最少的原則下,對(duì)高維的變量空間降維,將多個(gè)實(shí)測(cè)變量轉(zhuǎn)換為少數(shù)幾個(gè)不相關(guān)的主成分,把各變量之間互相關(guān)聯(lián)的復(fù)雜關(guān)系進(jìn)行簡(jiǎn)化分析。在水文計(jì)算中,主成分分析較多的用于提取影響氣候變化因子的主成分,建立降水與主成分的回歸分析模型,進(jìn)而對(duì)未來(lái)降水進(jìn)行預(yù)測(cè)[27]。

洪水事件是一個(gè)包含洪峰、洪量和峰現(xiàn)時(shí)間等多特征變量的極值水文事件,單純由一個(gè)變量分析其重現(xiàn)期是不全面的,文獻(xiàn)[28]試圖對(duì)各個(gè)變量加權(quán),求得一個(gè)能反映洪水過(guò)程量級(jí)的綜合指標(biāo),但由于各變量間存在一定的相關(guān)性,直接加權(quán)求和可能會(huì)使某些重疊信息多次加權(quán),因此,可以考慮采用主成分分析的方法先提取出洪水事件的幾個(gè)相互獨(dú)立的主成分,然后對(duì)所得的主成分根據(jù)方差貢獻(xiàn)率加權(quán)得到綜合指標(biāo)?,F(xiàn)以隔河巖水庫(kù)為例說(shuō)明之。

根據(jù)隔河巖水庫(kù)1951—2004年汛期3h時(shí)段資料選取歷時(shí)為7d的年最大洪水過(guò)程,描述洪水過(guò)程的指標(biāo)選為洪峰、1d洪量、3d洪量、7d洪量和主峰峰現(xiàn)時(shí)間5個(gè)指標(biāo),分別記為x1、x2、x3、x4和x5。按主成分分析方法,前兩個(gè)主成分的方差貢獻(xiàn)率分別為75.24%和19.26%,累積貢獻(xiàn)率接近95%,因此可以認(rèn)為前兩個(gè)主成分足以反映整個(gè)洪水事件的信息。得到的兩個(gè)主成分分別為:

則對(duì)兩個(gè)主成分按方差貢獻(xiàn)率進(jìn)行加權(quán)得到的綜合指標(biāo)為:z=0.796y1+0.204y2。

根據(jù)所得的綜合指標(biāo)計(jì)算每年最大洪水過(guò)程的綜合指標(biāo)值,按指標(biāo)大小對(duì)每年的洪水過(guò)程進(jìn)行排序。水庫(kù)調(diào)洪的結(jié)果可以作為洪水過(guò)程量級(jí)的一個(gè)較客觀的衡量,對(duì)洪水的惡劣程度可以按洪水經(jīng)水庫(kù)調(diào)度所得的最高庫(kù)水位和最大下泄流量進(jìn)行排序[28]:對(duì)于調(diào)洪最高水位高于汛限水位的洪水過(guò)程,按調(diào)洪最高水位進(jìn)行排序,對(duì)于調(diào)洪水位相等的洪水過(guò)程,按照最大下泄流量進(jìn)行排序。將隔河巖水庫(kù)每年的最大洪水過(guò)程輸入到水庫(kù)的調(diào)洪程序中,得到每年的最高調(diào)洪水位和最大下泄流量。按上述原則對(duì)每年的洪水過(guò)程進(jìn)行排序,并與由綜合指標(biāo)法所得的排序進(jìn)行比較,得到兩種方法排序的秩相關(guān)系數(shù)τ=0.96,優(yōu)于文獻(xiàn)[28]所得結(jié)果(τ=0.91),圖2繪出了兩種排序所得經(jīng)驗(yàn)頻率的P-P圖,說(shuō)明兩種排序結(jié)果基本一致,尤其是對(duì)較嚴(yán)重的幾次洪水過(guò)程排序完全一致,從而表明所得的綜合指標(biāo)確實(shí)能夠反映洪水事件的總體量級(jí)。

圖2 兩種排序方法所得經(jīng)驗(yàn)頻率的P-P圖

圖3 不同樣本容量同頻率設(shè)計(jì)值的分布情況

2.5 Copula函數(shù)分析法 相關(guān)性指標(biāo)是變量間整體或局部相關(guān)程度的衡量,無(wú)法完整刻畫變量間的相依關(guān)系。Copula函數(shù)以概率的形式反映變量間的相依性,是描述變量間相關(guān)性結(jié)構(gòu)的有效工具,它不僅可以描述變量間的互相關(guān)關(guān)系,還可以刻畫變量的自相關(guān)特性,如上面提到的年、月或日徑流等的隨機(jī)模擬。Copula函數(shù)所刻畫的互相關(guān)既可以是同一水文事件的各屬性變量,如暴雨、洪水和干旱等極值水文事件的各特征變量[29];還可以是相互之間有關(guān)聯(lián)的不同水文事件,原則上要有一定的物理聯(lián)系,如不同區(qū)域的豐枯遭遇[30]、不同季節(jié)的旱澇組合[31]以及干支流或支流間的洪水遭遇問(wèn)題等[32]。

在數(shù)學(xué)上,隨機(jī)變量之間的相關(guān)性由多元分布函數(shù)完全刻畫,Copula函數(shù)作為構(gòu)造多元分布函數(shù)的一種有效工具,在理論層面上,可作為一種比較理想的相關(guān)性分析方法,但在應(yīng)用層面上,可能會(huì)受到水文樣本容量的制約而產(chǎn)生較大的抽樣誤差,使計(jì)算結(jié)果失真。以二維Copula函數(shù)推求的同頻率設(shè)計(jì)值為例,分析抽樣誤差對(duì)設(shè)計(jì)值的影響,進(jìn)而分析Copula函數(shù)計(jì)算結(jié)果的可靠性。圖3給出了不同樣本容量N下,文獻(xiàn)[33]統(tǒng)計(jì)試驗(yàn)方案①在相關(guān)性系數(shù)ρ=0.3、聯(lián)合概率p=0.999(聯(lián)合重現(xiàn)期為千年一遇)、模擬次數(shù)m=1000時(shí),Copula函數(shù)計(jì)算的同頻率設(shè)計(jì)值組合,可以看出,樣本容量越大,抽樣誤差越小,推求的設(shè)計(jì)值越接近于理論值。若推求的設(shè)計(jì)值相對(duì)誤差同時(shí)小于等于某一給定的許可誤差,則認(rèn)為該設(shè)計(jì)值組合結(jié)果可靠,相應(yīng)的可靠度即為圖中方框內(nèi)點(diǎn)的個(gè)數(shù)與所有點(diǎn)的個(gè)數(shù)的比值。

表1 不同樣本容量Copula函數(shù)計(jì)算結(jié)果的可靠性分析

表1列出了許可誤差分別為10%和20%時(shí),不同樣本容量下Copula函數(shù)計(jì)算結(jié)果的可靠度。若許可誤差為10%,3種樣本容量對(duì)應(yīng)的可靠度都較低,N=100時(shí)可靠度也只有46.7%;若降低對(duì)許可誤差的要求,例如取許可誤差為20%,3種樣本容量對(duì)應(yīng)的可靠度均有較大程度提高,N=100時(shí)可靠度接近90%,即便如此,我國(guó)目前也很少有站點(diǎn)能滿足該樣本容量的要求。因此,即使Copula函數(shù)較其他多變量分析方法優(yōu)勢(shì)明顯[33],但仍然難以擺脫樣本容量對(duì)它的制約。有限樣本容量下,利用大數(shù)據(jù)理論進(jìn)一步挖掘樣本數(shù)據(jù)隱含的有效信息,如外延性和相關(guān)性等特征,或許可以在一定程度上提高Copula函數(shù)計(jì)算結(jié)果的可靠性。實(shí)際應(yīng)用中,也可根據(jù)給定的可靠度和許可誤差,參考本例的統(tǒng)計(jì)試驗(yàn)確定滿足精度要求所需的最小樣本數(shù)。

3 假相關(guān)

假相關(guān)一般指兩個(gè)變量之間表現(xiàn)出的一種虛假的相關(guān)關(guān)系,而實(shí)際并不存在統(tǒng)計(jì)關(guān)系。假相關(guān)可分為兩類[34],一類是隱假相關(guān),是由于包含相同的變量造成的,也稱自身假相關(guān),例如上下游年徑流、徑流量與輸沙率、降雨歷時(shí)與降雨強(qiáng)度等,它們之間由于包含了相同的元素而呈現(xiàn)出較強(qiáng)相關(guān)性,若利用它們之間的強(qiáng)相關(guān)性通過(guò)回歸分析間接插補(bǔ)展延區(qū)間年徑流、含沙量和降雨量等,則絲毫無(wú)助于計(jì)算精度的提高[35],屬于典型的回歸分析方法的誤用?;貧w方程除了包含反映變量平均關(guān)系的確定項(xiàng)之外,還包含反映變量隨機(jī)性的誤差項(xiàng),但該誤差也僅僅是當(dāng)前因變量的誤差,若利用當(dāng)前自變量、因變量的某種函數(shù)關(guān)系推算第3個(gè)變量,該誤差也將不可避免的傳遞給第3個(gè)變量。對(duì)于因變量而言,由于其和自變量的高度相關(guān)而使誤差項(xiàng)可以忽略,但該誤差傳遞到第3個(gè)變量時(shí),由于變量的量級(jí)發(fā)生了變化,誤差的影響可能會(huì)占據(jù)主導(dǎo)地位,從而造成插補(bǔ)展延的失效。

第2類是顯假相關(guān),包括點(diǎn)簇假相關(guān)、對(duì)數(shù)變換假相關(guān)和輾轉(zhuǎn)假相關(guān)等。對(duì)于點(diǎn)簇假相關(guān),仍然是回歸分析技術(shù)的誤用,回歸分析的前提是樣本來(lái)自于同一個(gè)總體,而點(diǎn)簇分布的樣本顯然不是,因此會(huì)造成相關(guān)分析的失效。對(duì)數(shù)變換是否會(huì)造成假相關(guān),不可一概而論,若變量間存在指數(shù)函數(shù)、冪函數(shù)等非線性關(guān)系,經(jīng)對(duì)數(shù)變換后可轉(zhuǎn)化為線性關(guān)系,從而可以繼續(xù)使用線性回歸分析方法;而若利用對(duì)數(shù)變換將兩個(gè)不相關(guān)的變量處理成看似相關(guān)的變量,則會(huì)造成視覺(jué)上的錯(cuò)覺(jué)而誤用回歸分析。輾轉(zhuǎn)假相關(guān)則同第1類假相關(guān)類似,存在誤差的傳遞和累積,致使計(jì)算結(jié)果誤差過(guò)大而失效。

假相關(guān)是相關(guān)分析中出現(xiàn)的一種假象,它并非相關(guān)分析技術(shù)本身的問(wèn)題,而是誤用這種技術(shù)所引起的。為了避免誤用假相關(guān),不宜對(duì)原始變量進(jìn)行任何數(shù)學(xué)轉(zhuǎn)換和運(yùn)算(指數(shù)和冪函數(shù)關(guān)系除外),而應(yīng)直接研究原始變量。

4 結(jié)語(yǔ)

水文變量常呈現(xiàn)非線性和非正態(tài)性,線性回歸和自回歸分析直接用于水文計(jì)算時(shí)會(huì)遇到理論障礙,Copula函數(shù)通過(guò)描述變量間的相關(guān)結(jié)構(gòu),理論上可以有效解決水文變量的非線性、非正態(tài)問(wèn)題,但在應(yīng)用層面上,可能會(huì)受到水文樣本容量的制約而使其計(jì)算結(jié)果失真,尤其是對(duì)于多維Copu?la函數(shù)更應(yīng)該慎用。R/S分析能夠表征時(shí)間序列的長(zhǎng)程相依性,如果任意時(shí)刻水庫(kù)的蓄水量與初始蓄水狀態(tài)有關(guān),則可利用R/S分析法建立更為一般的水庫(kù)調(diào)洪演算隨機(jī)模型,借此分析水庫(kù)防洪風(fēng)險(xiǎn)。主成分分析通過(guò)對(duì)高維變量進(jìn)行空間降維,可以將洪水事件的多個(gè)特征變量轉(zhuǎn)換為少數(shù)幾個(gè)不相關(guān)的主成分,進(jìn)而得到反映洪水惡劣程度的綜合指標(biāo),實(shí)現(xiàn)洪水的綜合排序。

相關(guān)性分析是水文計(jì)算的一項(xiàng)重要內(nèi)容,幾乎涉及到水文計(jì)算的各個(gè)領(lǐng)域,除了上面列出的幾種方法外,還包括典型相關(guān)分析、灰關(guān)聯(lián)分析和協(xié)整理論等,由于這些方法在水文計(jì)算中運(yùn)用較少,本文不再贅述。此外,還有一些分析計(jì)算要盡量避免相關(guān)性,例如在水文模型的構(gòu)建中,參數(shù)間要盡量獨(dú)立,以減少模型的不確定性;在進(jìn)行多目標(biāo)優(yōu)化時(shí),多個(gè)目標(biāo)也要保證相互獨(dú)立,否則可能會(huì)對(duì)某個(gè)目標(biāo)多重加權(quán),難以達(dá)到優(yōu)化的目的[36]。相關(guān)性分析的先決條件是變量間確實(shí)存有物理上的聯(lián)系,對(duì)物理意義上毫無(wú)干系卻表現(xiàn)出統(tǒng)計(jì)關(guān)系的變量進(jìn)行相關(guān)性分析反而可能會(huì)得到錯(cuò)誤的結(jié)論,在確保可以應(yīng)用相關(guān)性分析方法解決問(wèn)題時(shí),還要明晰各種方法的適用條件和范圍,避免誤用和濫用這種技術(shù)。

參 考 文 獻(xiàn):

[1] 冉圣宏,李秀彬,呂昌河.漁子溪流域水文過(guò)程影響因素的特征時(shí)間尺度分析[J].地理研究,2007,26(2):337-345.

[2] 閆寶偉,郭生練,陳璐,等.Copula函數(shù)在水文計(jì)算中的適用性分析[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2012,42(3):85-93.

[3] 劉和昌,梁忠民,常文娟,等.干旱歷時(shí)與干旱烈度的尾部相關(guān)性分析[J].水電能源科學(xué),2014(4):1-3.

[4] POULIN A,HUARD D,F(xiàn)AVRE A-C,et al.Importance of tail dependence in bivariate frequency analysis[J].Journal of Hydrologic Engineering,2007,12(4):394—403.

[5] 趙銅鐵鋼,楊大文.神經(jīng)網(wǎng)絡(luò)徑流預(yù)報(bào)模型中基于互信息的預(yù)報(bào)因子選擇方法[J].水力發(fā)電學(xué)報(bào),2011,30(1):24-30.

[6] 陳璐,葉磊,盧韋偉,等.基于Copula熵的神經(jīng)網(wǎng)絡(luò)徑流預(yù)報(bào)模型預(yù)報(bào)因子選擇[J].水力發(fā)電學(xué)報(bào),2014,33(6):25-29.

[7] 龔偉,楊大文.水文變量高維非線性相關(guān)分析與水文模型結(jié)構(gòu)不確定性評(píng)估[J].水力發(fā)電學(xué)報(bào),2013,32(5):13-20.

[8] 肖義.基于Copula函數(shù)的多變量水文分析計(jì)算研究[D].武漢:武漢大學(xué),2007.

[9] Nelson R B.An Introduction to Copulas[M].Springer,New York,1999.

[10] 陳璐.COPULA函數(shù)理論在多變量水文分析計(jì)算中的應(yīng)用研究[M].武漢:武漢大學(xué)出版社,2013.

[11] 郭生練,閆寶偉,肖義,等.Copula函數(shù)在多變量水文分析計(jì)算中的應(yīng)用及研究進(jìn)展[J].水文,2008,28(3):1-7.

[12] 宋松柏.Copulas函數(shù)及其在水文中的應(yīng)用[M].北京:科學(xué)出版社,2012.

[13] 劉光文.泛論水文計(jì)算誤差[J].水文,1992(1):4-11.

[14] 吳燕,李松仕.應(yīng)用分布轉(zhuǎn)換法插補(bǔ)展延水文系列的探討[J].福州大學(xué)學(xué)報(bào),1986(4):70-76.

[15] 閆寶偉,郭生練,郭靖,等.基于Copula函數(shù)的設(shè)計(jì)洪水地區(qū)組成研究[J].水力發(fā)電學(xué)報(bào),2010,29(6):60-65.

[16] SHARMA A,TARBOTON D G,LALL U.Streamflow simulation:a nonparametric approach[J].Water Resourc?es Research,1997,33(2):192-308.

[17] 王文圣,丁晶.基于核密度估計(jì)的多變量非參數(shù)隨機(jī)模型初步研究[J].水利學(xué)報(bào),2003(2):9-14.

[18] CHEN X,F(xiàn)AN Y.Estimation of copula-based semiparametric time series models[J].Journal of Econometrics,2006,130:307-335.

[19] 閆寶偉,郭生練,劉攀,等.基于Copula函數(shù)的徑流隨機(jī)模擬[J].四川大學(xué)學(xué)報(bào):工程科學(xué)版,2010,42(1):5-9.

[20] 周研來(lái),郭生練,李天元,等.Copula-SAR模型及其在洪水地區(qū)組成隨機(jī)模擬中的應(yīng)用[J].武漢大學(xué)學(xué)報(bào):工學(xué)版,2013,46(2):137-142.

[21] HURST H E,BLACK R P,SIMAIKA Y M.Long-term Storage:An Experimental Study[M].London:Consta?ble,1965.

[22] MANDELBROT B,VAN NESS J W.Fractional Brownian motion,fractional noise and application[J].SIAM Re?view,1968,10:422-437.

[23] 門寶輝,劉昌明,夏軍,等.R/S分析法在南水北調(diào)西線一期工程調(diào)水河流徑流趨勢(shì)預(yù)測(cè)中的應(yīng)用[J].冰川凍土,2005,27(4):568-573.

[24] 謝平,雷紅富,陳廣才,等.基于Hurst系數(shù)的流域降雨時(shí)空變異分析方法[J].水文,2008,28(5):6-10.

[25] 姜樹(shù)海,水庫(kù)調(diào)洪演算的隨機(jī)數(shù)學(xué)模型[J].水科學(xué)進(jìn)展,1993,4(4):294-300.

[26] 閆寶偉,郭生練.考慮洪水過(guò)程預(yù)報(bào)誤差的水庫(kù)防洪調(diào)度風(fēng)險(xiǎn)分析[J].水利學(xué)報(bào),2012,43(7):803-807.

[27] 陳華,郭靖,郭生練,等.應(yīng)用統(tǒng)計(jì)學(xué)降尺度方法預(yù)測(cè)漢江流域降水變化[J].人民長(zhǎng)江,2008,39(14):53-55.

[28] 肖義,郭生練,劉攀,等.綜合多特征量的洪水事件頻率問(wèn)題研究[J].人民長(zhǎng)江,2007,38(4):127-129.

[29] 馮平,李新.基于Copula函數(shù)的非一致性洪水峰量聯(lián)合分析[J].水利學(xué)報(bào),2013,44(10):1137-1147.

[30] 閆寶偉,郭生練,肖義.南水北調(diào)中線水源區(qū)與受水區(qū)降水豐枯遭遇研究[J].水利學(xué)報(bào),2007,38(10):1178-1185.

[31] 楊志勇,袁喆,方宏陽(yáng),等.基于Copula函數(shù)的灤河流域旱澇組合事件概率特征分析[J].水利學(xué)報(bào),2013,44(5):556-561.

[32] 閆寶偉,郭生練,陳璐,等.長(zhǎng)江和清江洪水遭遇風(fēng)險(xiǎn)分析[J].水利學(xué)報(bào),2010,41(5):553-559.

[33] 閆寶偉,郭生練,郭靖,等.多變量水文分析計(jì)算方法的比較[J].武漢大學(xué)學(xué)報(bào):工學(xué)版,2009,42(1):10-15.

[34] 丁晶,楊樹(shù)林.論水文計(jì)算中的假相關(guān)[J].四川水力發(fā)電,1987(4):13-19.

[35] 馬秀峰.回歸分析中的偽相關(guān)與輾轉(zhuǎn)相關(guān)[J].水文,1986(6):6-16.

[36] 紀(jì)昌明,李榮波,劉丹,等.梯級(jí)水電站負(fù)荷調(diào)整方案評(píng)價(jià)指標(biāo)體系及決策模型[J].水利學(xué)報(bào),2017,48(3):261-169.

猜你喜歡
樣本容量水文洪水
2022年《中國(guó)水文年報(bào)》發(fā)布
采用無(wú)核密度儀檢測(cè)壓實(shí)度的樣本容量確定方法
水文
水文水資源管理
洪水時(shí)遇到電線低垂或折斷該怎么辦
又見(jiàn)洪水(外二首)
水文
洪水來(lái)了
幼兒畫刊(2016年8期)2016-02-28 21:00:52
論設(shè)計(jì)洪水計(jì)算
廣義高斯分布參數(shù)估值與樣本容量關(guān)系
龙山县| 丽水市| 五峰| 通海县| 曲靖市| 逊克县| 隆子县| 南靖县| 美姑县| 富锦市| 宁陵县| 晋宁县| 通化市| 南昌市| 英山县| 漯河市| 镇雄县| 纳雍县| 大厂| 香格里拉县| 和硕县| 子长县| 全州县| 平江县| 南安市| 斗六市| 冷水江市| 乌拉特前旗| 和政县| 东宁县| 阳江市| 应用必备| 湛江市| 兰州市| 襄汾县| 永修县| 宣城市| 巫山县| 县级市| 廊坊市| 平泉县|