仲靜文,朱 晶,周 健,顧 冬,劉永濤
(1.南京市水利規(guī)劃設(shè)計院股份有限公司,江蘇南京210022;2.南京新港開發(fā)總公司,江蘇南京210038;3.河海大學(xué)水利水電學(xué)院,江蘇南京210098)
面板堆石壩因其成本較低、施工快速方便、地形地質(zhì)適應(yīng)性強等優(yōu)點迅速發(fā)展為一種重要的壩型[1]。面板堆石壩的沉降變形是影響其安全穩(wěn)定的重要因素,故研究面板堆石壩的沉降,特別是施工期和蓄水期沉降以評估其安全狀態(tài)就十分必要[2]。研究面板堆石壩沉降的模型和方法有很多,如傳統(tǒng)的統(tǒng)計預(yù)測模型、智能算法模型、有限元計算模擬方法等。目前,研究學(xué)者們提出了大量智能優(yōu)化算法的大壩沉降模型,如萬臣等提出了基于新維BP神經(jīng)網(wǎng)絡(luò)-馬爾科夫鏈模型的大壩沉降預(yù)測方法[3];朱創(chuàng)家等基于極限學(xué)習(xí)機分析預(yù)測了面板堆石壩施工期沉降[4];藍善勇等構(gòu)建了基于最小二乘法的邏輯回歸的土石壩沉降預(yù)測模型[5]等。上述模型和方法在研究沉降問題上總體精度較高、適應(yīng)性較好,但很多堆石壩沉降模型沒有考慮每個影響因子的影響因素,如水位、時間、溫度等因子,從而導(dǎo)致局部過擬合、計算結(jié)果精度不高。
影響因子的選擇一般有相關(guān)系數(shù)法、逐步回歸法、主成分分析法等。相關(guān)系數(shù)法要求變量之間線性相關(guān),局限性大;逐步回歸法挑選步驟繁瑣,無法直接準(zhǔn)確地將預(yù)選因子引入方程中;主成分分析法將多個變量降維后選取比重大的因子作為主成分進行分析,但因子之間相關(guān)性較差時誤差較大[6]。為此,陳西江等采用不同相關(guān)系數(shù)法,基于BP網(wǎng)絡(luò)進行大壩位移預(yù)報[7],但前期無效數(shù)據(jù)影響到預(yù)報穩(wěn)定性;進一步,袁從貴等提出偏互信息(PMI)確定預(yù)測輸入因子,同時聯(lián)合最小二乘定尺度支持向量機進行咸潮預(yù)測[8];麥紫君等在傳統(tǒng)構(gòu)造模型的基礎(chǔ)上,采用偏互信息(PMI)篩選與月徑流相關(guān)性較強的氣候因子,從而預(yù)測中長期徑流[9]。通過研究多個偏互信息方法篩選效果,偏互信息法(PMI)不僅計算方便快捷、適應(yīng)性強,對于因子的優(yōu)選精度也已達到較高標(biāo)準(zhǔn),且較少應(yīng)用在堆石壩沉降因子優(yōu)選。由于偏互信息法計算回歸值時誤差較大,對篩選正確率不利[10],因此本文以大壩沉降變形為例,采取雙重因子優(yōu)選:①根據(jù)Pearson及Kendall秩相關(guān)系數(shù)等方法,預(yù)選因子集;②分析二維Gumbel函數(shù),采用基于PMI的Copula熵法,優(yōu)選因子集,并將其引入方程中,對大壩沉降值進行擬合及預(yù)測。
面板堆石壩的沉降位移中,固結(jié)所占比例較大,同時溫度及水位等也有一定影響,而時效因子的性質(zhì)部分由固結(jié)引起。故運行期沉降值由水壓分量δH、溫度分量δT和時效分量δθ組成,統(tǒng)計模型[11]為
(1)
H(x1,x2,…,xn)=C(F1(x1),F2(x2),…,Fn(xn))
(2)
若邊緣分布即F1,F2,…,Fn連續(xù),則C唯一,否則,C在RanF1×RanF2×…×RanFn上是唯一的。
Copula函數(shù)中橢圓分布族和阿基米德分布族最為常見,而后者中Gumbel Copula函數(shù)的概率密度函數(shù)圖形呈“丁”字形,呈現(xiàn)明顯的上尾相關(guān)性,適合變量非對稱變化,從而得到推廣和應(yīng)用。本文以二維Gumbel Copula函數(shù)為例,即
(3)
式中,u、v分別為兩變量的邊緣分布函數(shù)F(x)、F(y);α為參數(shù),且α∈[1,∞]。
熵理論由Shannon提出解決隨機變量不確定性的方法[13],多維聯(lián)和熵為
(4)
考慮與大壩變形相關(guān)的二維隨機變量情況
(5)
式中,f(x1,x2)為Copula函數(shù)的概率密度函數(shù)。
則分布函數(shù)及密度函數(shù)為
F(x;δ1,δs,θ)=C(F1(x1;δ1),F2(x2;δ2),θ)
(6)
f(x;δ1,δ2,θ)=c(F1(x1;δ1),F2(x2;δ2),θ)1f1(x1;δ1),f2(x2;δ2)
(7)
偏互信息由Sharma提出,為互信息的改進方法,可以估計大壩變形在預(yù)選因子基礎(chǔ)上,新加入因子與變形值的相關(guān)性。具體如下
(8)
x′=x-E[x|Z];y′=y-E[y|Z]
(9)
式中,E為期望值,x為輸入因子;y為輸出值;Z為預(yù)選因子集。又H(x′,y′)=H(x)′+H(y′)+Hc(u′,v′),則PMI=-Hc(u′,v′)。
1.5.1預(yù)選因子指標(biāo)
Pearson相關(guān)系數(shù)及Kendall秩相關(guān)系數(shù)等是常用的度量變量相關(guān)性的方法,前者主要用來衡量兩個變量的線性關(guān)系,后者基于Copula函數(shù),用來描述變量之間的線性與非線性的相關(guān)關(guān)系[14]。后者方法具體如下
(10)
(11)
1.5.2因子優(yōu)化指標(biāo)
在計算出因子與輸出值的偏互信息后,需要為PMI一個閾值作為確定最有因子的指標(biāo)。本文采用Fernando等和May等研究成果,以Hampel檢驗作為PMI算法的停止準(zhǔn)則[15-16]。具體如下
(12)
綜上所述,模型因子集的確定步驟如圖1所示。
圖1 模型因子優(yōu)選流程
某混凝土面板堆石壩位于我國東南地區(qū),壩址以上流域面積667 km2,設(shè)計洪水位365.04 m。壩基最低部位高程274.20 m,壩頂高程368.0 m,壩頂長210.0 m。考慮到蓄水初期面板堆石壩常規(guī)統(tǒng)計模型的欠擬合情況,采用基于Gumbel Copula函數(shù)的大壩沉降位移模型,選取壩頂?shù)湫蜏y點2及測點4、5、6進行計算。實測資料時間為1997年2月2日至2014年12月31日(監(jiān)測頻次為每月一次),預(yù)測資料時間選取2015年1月1日至2015年5月31日。本文以測點2為例進行分析。
表1 預(yù)選因子集統(tǒng)計
為了驗證Gumbel Copula函數(shù)在大壩沉降模型中的可行性,對Copula熵優(yōu)化后的模型與多元回歸統(tǒng)計模型進行計算及對比分析,結(jié)果如表2、3及圖2所示。
表2 測點的擬合結(jié)果對比
表3 2015年測點2沉降值預(yù)測結(jié)果及誤差分析
圖2 測點2沉降模型曲線擬合及預(yù)測情況對比
由表2可知,Gumbel函數(shù)模型的擬合效果明顯優(yōu)于多元回歸模型,精度較高。經(jīng)計算測點4、5、6沉降預(yù)測值的多元回歸模型平均殘差分別為4.5、4.14、3.68 mm,平均相對誤差分別為3.97%、3.26%、2.81%;Gumbel函數(shù)模型的平均殘差分別為2.10、1.66、1.62 mm,平均殘差分別為1.85%、1.31%、1.25%。Gumbel函數(shù)模型預(yù)測沉降值的平均殘差和平均相對誤差明顯小于多元回歸模型。表3和圖2的對比結(jié)果同樣驗證了Gumbel函數(shù)模型的擬合效果更優(yōu)。
(1)本文建立了基于 Copula 熵的因子優(yōu)選流程,對影響沉降的因子集采用了Pearson和Kendall雙重相關(guān)系數(shù)進行預(yù)選,通過Copula熵理論進行篩選,提高了模型的穩(wěn)定性,該方法為堆石壩沉降模型的因子優(yōu)選提供了新思路。
(2)通過與常規(guī)模型的結(jié)果對比,基于Gumbel Copula函數(shù)的因子優(yōu)選方法可以有效地篩選掉影響較小的因子,解決蓄水初期堆石壩擬合不佳的問題,降低了回歸誤差,提高了堆石壩沉降的預(yù)測精度,減小了計算工作量和復(fù)雜程度。
(3)由于采用的是二維Gumbel Copula函數(shù),可以進一步研究高維Gumbel Copula函數(shù)在沉降模型的應(yīng)用。