鄧興升 陳石橋 殷自成
(1)長(zhǎng)沙理工大學(xué)測(cè)繪工程系,長(zhǎng)沙 410004 2)湖南省電力公司柘溪水電廠,安化413508)
動(dòng)態(tài)回歸模型在變形分析中的應(yīng)用*
鄧興升1)陳石橋2)殷自成1)
(1)長(zhǎng)沙理工大學(xué)測(cè)繪工程系,長(zhǎng)沙 410004 2)湖南省電力公司柘溪水電廠,安化413508)
為了使回歸模型適應(yīng)動(dòng)態(tài)數(shù)據(jù)集,推導(dǎo)了動(dòng)態(tài)回歸模型的遞推最小二乘算法,數(shù)據(jù)更新時(shí),采用修正方式更新回歸系數(shù)計(jì)算兩個(gè)矩陣,避免了重復(fù)矩陣求逆運(yùn)算,實(shí)現(xiàn)了觀測(cè)數(shù)據(jù)增加而矩陣階數(shù)不增加,理論上減少了計(jì)算時(shí)間。以柘溪和東江兩大壩變形分析多元?jiǎng)討B(tài)回歸模型為例進(jìn)行實(shí)驗(yàn),結(jié)果表明:該方法建模過(guò)程簡(jiǎn)潔、無(wú)需迭代計(jì)算,易于編程實(shí)現(xiàn),在計(jì)算效率與預(yù)報(bào)精度等方面均具優(yōu)勢(shì),可應(yīng)用于實(shí)時(shí)變形分析建模。
動(dòng)態(tài)回歸模型;遞推最小二乘算法;數(shù)據(jù)更新;動(dòng)態(tài)數(shù)據(jù)集;變形分析
為了揭示變形與環(huán)境因素的關(guān)系,人們研究了許多變形監(jiān)測(cè)模型[1-6],這些方法適用范圍不同,各有其優(yōu)點(diǎn),但無(wú)論何種模型都較為復(fù)雜,涉及迭代運(yùn)算;且都不能提高觀測(cè)數(shù)據(jù)固有的觀測(cè)精度。對(duì)實(shí)時(shí)性高要求的大壩安全監(jiān)測(cè)應(yīng)用而言,分析模型的計(jì)算效率非常重要。多元線性回歸分析模型是一種經(jīng)典的實(shí)用于變形觀測(cè)數(shù)據(jù)處理的數(shù)理統(tǒng)計(jì)方法,模型參數(shù)計(jì)算無(wú)需迭代與隨機(jī)搜索,易于編程實(shí)現(xiàn),因而具有簡(jiǎn)潔易用的特點(diǎn)。但回歸模型自建立后便有其生命周期,隨著觀測(cè)數(shù)據(jù)的增加,回歸模型可能不再適用而需要重新建立。為了提高模型參數(shù)的計(jì)算效率,本文推導(dǎo)了動(dòng)態(tài)回歸模型最小二乘遞推算法,它是在已建立回歸模型的基礎(chǔ)上,通過(guò)模型修改實(shí)現(xiàn)模型參數(shù)的遞推計(jì)算。
式中,Qe為殘差平方和,為σ2的無(wú)偏估計(jì),n為樣本數(shù),p為因子數(shù)。求得后則可以根據(jù)自變量和公式=計(jì)算因變量的預(yù)測(cè)值。
在建立回歸方程的過(guò)程中,對(duì)于動(dòng)態(tài)數(shù)據(jù)集,當(dāng)環(huán)境條件發(fā)生變化時(shí),原先建立的回歸方程就不可能反映這些新的信息,如繼續(xù)使用它進(jìn)行預(yù)測(cè),勢(shì)必導(dǎo)致預(yù)測(cè)精度降低和模型誤差增大。解決這個(gè)問(wèn)題的方法有兩種:一是將新增加的觀測(cè)數(shù)據(jù)同歷史數(shù)據(jù)放在一起,重新建立回歸方程,但這種作法計(jì)算量大,不便于應(yīng)用;二是對(duì)回歸方程的參數(shù)采取遞推估計(jì)的辦法,使它能隨新觀測(cè)數(shù)據(jù)的增加不斷地修改回歸方程的參數(shù),以反映出最新環(huán)境的變化,這種方法計(jì)算量少,便于應(yīng)用。
由于回歸模型沒(méi)有考慮動(dòng)態(tài)數(shù)據(jù)集的建模問(wèn)題,新增觀測(cè)數(shù)據(jù)后,回歸模型面臨修改或重新建立。由于數(shù)據(jù)集的變化導(dǎo)致在模型計(jì)算過(guò)程中需要反復(fù)進(jìn)行矩陣相乘、求逆,需要耗用較多計(jì)算時(shí)間,因此本文建立動(dòng)態(tài)回歸模型的最小二乘遞推算法,當(dāng)獲得新增觀測(cè)數(shù)據(jù)后,在對(duì)原有模型進(jìn)行參數(shù)估計(jì)時(shí),為了滿足動(dòng)態(tài)回歸的需要,不需要重新建模求解,而是由最小二乘估計(jì)導(dǎo)出回歸系數(shù)的遞推最小二乘算法,使新的信息加入后可以直接修正原來(lái)的計(jì)算結(jié)果。這樣可以簡(jiǎn)化計(jì)算量,避免費(fèi)時(shí)的矩陣求逆運(yùn)算,理論上提高了計(jì)算效率。
在初始回歸模型的基礎(chǔ)上,設(shè)新增觀測(cè)數(shù)據(jù)為(Xa,Ya),ε為一設(shè)定的任意小值,它與具體的應(yīng)用有關(guān),如果
則認(rèn)為現(xiàn)有模型對(duì)新觀測(cè)數(shù)據(jù)是適應(yīng)的,可以不對(duì)模型進(jìn)行修改。否則設(shè):
則
隨著新觀測(cè)數(shù)據(jù)的增多,X1與Y1矩陣階數(shù)逐漸增大,直接根據(jù)式(4)進(jìn)行新的模型參數(shù)計(jì)算需要進(jìn)行矩陣求逆,反復(fù)計(jì)算,效率較低,難以適應(yīng)于動(dòng)態(tài)數(shù)據(jù)集及實(shí)時(shí)建模領(lǐng)域。因此本文提出了以下不增加矩陣階數(shù),且避免矩陣求逆的動(dòng)態(tài)回歸算法。
在式(1)中,設(shè)
根據(jù)矩陣反演公式(D+ACB)-1=D-1-D-1A (C-1+BD-1A)-1BD-1,其中A、B為任意矩陣,C、 D為任意可逆矩陣。結(jié)合式(5)、(6)有:
在式(7)中,XaL0的結(jié)果為1×1階矩陣,即為一個(gè)數(shù),單位矩陣I為1,設(shè)
則有,
由公式(9)可見(jiàn),只需要根據(jù)初始回歸模型中的逆L0和新增數(shù)據(jù)Xa就可以得到動(dòng)態(tài)回歸模型的逆L1,且不涉及求逆運(yùn)算。
結(jié)合公式(5),有
由公式(10)可見(jiàn),根據(jù)新增觀測(cè)數(shù)據(jù)(Xa,Ya)和初始回歸模型的W0,可求得動(dòng)態(tài)模型的W1。
則動(dòng)態(tài)回歸模型的系數(shù)矩陣為:
動(dòng)態(tài)回歸模型參數(shù)的解,仍遵守最小二乘準(zhǔn)則,由式(8)~(12)計(jì)算,避免了矩陣求逆,充分利用原回歸模型的計(jì)算結(jié)果L0和W0進(jìn)行遞推計(jì)算,計(jì)算過(guò)程中矩陣階數(shù)不增加,L0為p+1階方陣,W0為(p+1)×1階矩陣;新增觀測(cè)數(shù)據(jù)(Xa,Ya),其中Xa為1×(p+1)階矩陣,Ya為1×1階矩陣;p為常數(shù),意義同公式(1)。歷史數(shù)據(jù)不必存儲(chǔ),無(wú)論樣本增加多少,該算法中的矩陣階數(shù)始終不變,因此計(jì)算效率不隨樣本增加而下降。矩陣階數(shù)與矩陣求逆運(yùn)算時(shí)間呈正比,因此,對(duì)于高階高維問(wèn)題,本算法的優(yōu)勢(shì)更顯著。而常規(guī)回歸公式(4)需保存歷史數(shù)據(jù),并涉及矩陣階數(shù)增加及矩陣求逆問(wèn)題,因而隨著觀測(cè)數(shù)據(jù)增加,其計(jì)算效率將逐漸下降。
1)提出原假設(shè)H0:線性關(guān)系不顯著;
3)由顯著性水平a,查F分布表,得到Fa(k,n -k-1);
4)若F>Fa,拒絕H0,即認(rèn)為線性關(guān)系顯著;否則接收H0,即認(rèn)為線性關(guān)系不顯著。
以柘溪大壩和東江大壩水平位移建立動(dòng)態(tài)回歸模型,對(duì)比測(cè)試計(jì)算時(shí)間與效率;在不同因子組合模式下,測(cè)試模型預(yù)報(bào)精度、相關(guān)系數(shù)、模型修正次數(shù)。在表1、2中,R代表相關(guān)系數(shù);MAPE代表預(yù)報(bào)平均絕對(duì)百分比誤差;MSE代表預(yù)報(bào)均方根誤差,單位為mm;MAE代表預(yù)報(bào)平均絕對(duì)誤差,單位為mm; TN代表模型修正次數(shù)。
柘溪大壩主要為單支墩大頭壩及寬縫重力壩,大壩全長(zhǎng)330 m,壩頂高174 m,最大壩高104 m。壩頂水平位移采用視準(zhǔn)線法觀測(cè),視準(zhǔn)線全長(zhǎng)473 m,基準(zhǔn)點(diǎn)設(shè)在兩岸堅(jiān)硬的基巖上,測(cè)點(diǎn)布設(shè)在壩頂下游欄桿外專用的牛腿上,距壩軸線15.40 m,由4號(hào)進(jìn)水口至左重3號(hào)重力壩段,每個(gè)壩段設(shè)一個(gè)測(cè)點(diǎn),共17個(gè)測(cè)點(diǎn)。采用Wild T3經(jīng)緯儀和專用的固定和活動(dòng)覘標(biāo)施測(cè)。1968年5月開(kāi)始觀測(cè),每月觀測(cè)1次,至今已獲得550期觀測(cè)數(shù)據(jù)。該視準(zhǔn)線距附近建筑物較近,全長(zhǎng)超過(guò)300 m,觀測(cè)誤差達(dá)3 mm左右,超出《DLT5178-2003混凝土大壩安全監(jiān)測(cè)技術(shù)規(guī)范》要求。
先對(duì)柘溪大壩壩頂水平位移進(jìn)行建模分析。由250周期觀測(cè)值建立初始回歸模型;然后采用2.2中的方法,每增加一周期觀測(cè)數(shù)據(jù)判斷公式(2)(ε取0.9 mm)的條件是否滿足,如果不滿足,則根據(jù)公式(8)~(12)建立動(dòng)態(tài)回歸模型,對(duì)300周期的觀測(cè)位移進(jìn)行預(yù)報(bào),若每次采用回歸模型直接求解,計(jì)算時(shí)間為0.46 s;若采用動(dòng)態(tài)回歸模型,計(jì)算時(shí)間為0.41 s,計(jì)算效率提高了12.2%。水平位移觀測(cè)值和模型預(yù)報(bào)值之間的對(duì)比見(jiàn)圖1,預(yù)報(bào)誤差見(jiàn)圖2。不同因子組合條件下模型各指標(biāo)見(jiàn)表1。
圖1~2及表1顯示,32%的預(yù)報(bào)誤差大于2 mm,MSE為1.957 8 mm(偏大)。采用全部因子建模時(shí),相關(guān)系數(shù)為0.706 3,表明位移預(yù)報(bào)值與觀測(cè)值之間吻合欠佳,其主要原因是在于視準(zhǔn)線較長(zhǎng),受大氣折光、活動(dòng)覘標(biāo)隙動(dòng)差等因素的影響,導(dǎo)致視準(zhǔn)線的觀測(cè)精度偏低。從不同因子組合模式下的測(cè)試結(jié)果可知,影響柘溪大壩水平位移的主要因子是溫度和水位組合,其中溫度因子占的權(quán)重更大,而時(shí)效因子的影響較小。
顯著性F檢驗(yàn)時(shí),F(xiàn)值為32.97,顯著性水平a設(shè)為0.005,查F分布臨界值表得Fa(10,289)為2.55,F(xiàn)大于Fa,故認(rèn)為回歸方程線性關(guān)系顯著。
圖1 柘溪大壩水平位移觀測(cè)值與預(yù)報(bào)值過(guò)程曲線Fig.1 Curves of Zhexi dam deformation observations and predicted values
圖2 柘溪大壩水平位移預(yù)報(bào)誤差Fig.2 Dynamic prediction errors of deformation of Zhexi dam
表1 不同因子組合條件下的模型指標(biāo)Tab.1 Model indexes under different factor combinations for the Zhexi dam
東江大壩為混凝土雙曲拱壩。本例取自垂線觀測(cè)項(xiàng)目,觀測(cè)點(diǎn)為250 m高程L5號(hào)垂線徑向位移,已有觀測(cè)數(shù)據(jù)293周期,以其中前50周期建立初始模型;采用動(dòng)態(tài)建模預(yù)報(bào)后243周期,取ε為0.9 mm。若每次采用回歸模型直接求解,計(jì)算時(shí)間為0.44 s;若采用動(dòng)態(tài)回歸模型,計(jì)算時(shí)間為0.39 s,計(jì)算效率提高12.8%。水平位移觀測(cè)值和模型預(yù)報(bào)值之間的對(duì)比見(jiàn)圖3,預(yù)報(bào)誤差見(jiàn)圖4,不同因子組合條件下模型各指標(biāo)見(jiàn)表2。
圖3 東江大壩水平位移觀測(cè)值與預(yù)報(bào)值過(guò)程曲線Fig.3 Curves of Dongjiang dam deformation observations and predicted values
圖4 東江大壩水平位移預(yù)報(bào)誤差Fig.4 Dynamic prediction errorsofdeformation of Dongjiang dam
表2 不同因子組合條件下模型各指標(biāo)Tab.2 Model Indexes under different factor combinations for the Dongjiang dam
由圖3~4及表2可知,位移預(yù)報(bào)值與觀測(cè)值之間吻合很好,67%的預(yù)報(bào)誤差小于1 mm,反映了東江大壩垂線觀測(cè)精度較高;另一方面表明了東江壩體水平位移與庫(kù)水位、氣溫、時(shí)效等因素有密切的相關(guān)性,位移觀測(cè)值與模型預(yù)報(bào)值之間的相關(guān)系數(shù)為0.986 3,兩者的一致性非常好。模型預(yù)報(bào)MSE誤差值為0.963 3 mm,低于大壩監(jiān)測(cè)規(guī)范要求的1 mm,模型預(yù)報(bào)精度指標(biāo)整體上優(yōu)于柘溪大壩的預(yù)報(bào)結(jié)果。從不同因子組合模式下的測(cè)試結(jié)果可知,影響東江拱壩水平位移的主要因子是溫度和水位組合,其中溫度權(quán)重比較顯著,而時(shí)效因子的貢獻(xiàn)較小。
顯著性F檢驗(yàn)時(shí),F(xiàn)值為748.14,顯著性水平a設(shè)為0.005,查F分布臨界值表得Fa(10,232)為2.55,F(xiàn)遠(yuǎn)遠(yuǎn)大于Fa,故認(rèn)為回歸方程線性關(guān)系顯著。
兩個(gè)實(shí)例表明,只需要獲得少量觀測(cè)數(shù)據(jù)就可以建立初始回歸模型,并根據(jù)新增觀測(cè)數(shù)據(jù)逐漸建立動(dòng)態(tài)回歸模型,使模型始終保持最優(yōu)的預(yù)測(cè)性能。動(dòng)態(tài)回歸遞推算法具有線性、簡(jiǎn)潔、易于編程實(shí)現(xiàn)、無(wú)需迭代與隨機(jī)搜索的優(yōu)點(diǎn)。實(shí)例中提高計(jì)算效率12%,在計(jì)算時(shí)間與精度等方面都具有一定優(yōu)勢(shì),對(duì)于高階高維問(wèn)題,算法的優(yōu)勢(shì)更顯著,可適用于動(dòng)態(tài)數(shù)據(jù)集的實(shí)時(shí)回歸建模。
1 王新洲,等.基于小波變換和支持向量機(jī)的大壩變形預(yù)測(cè)[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2008,33(5):469 -471.(Wang Xinzhou,et al.Dam deformation prediction based on wavelet transform and support vector machine[J].Geomatics and Information Science of Wuhan University,2008,33(5):469-471)
2 王利,等.動(dòng)態(tài)灰色預(yù)測(cè)模型在大壩變形監(jiān)測(cè)及預(yù)報(bào)中的應(yīng)用研究[J].西安科技大學(xué)學(xué)報(bào),2005,25(3):328 -332.(Wang Li,et al.Application of dynamic gray forecast model in dam deformation monitoring and forecast[J].Journal of Xi’an University of Science and Technology,2005,25(3):328-332)
3 李捷斌,孔令杰.基于Kalman濾波的BP神經(jīng)網(wǎng)絡(luò)方法在大壩變形預(yù)測(cè)中的應(yīng)用[J].大地測(cè)量與地球動(dòng)力學(xué),2009,(4):124-126.(Li Jiebin and Kong Lingjie.Application of BP neural network based on Kalman filtering to dam deformation prediction[J].Journal of Geodesy and Geodynamics,2009,(4):124-126)
4 劉福深,等.基于差異進(jìn)化算法的前饋神經(jīng)網(wǎng)絡(luò)在大壩變形監(jiān)測(cè)中的應(yīng)用[J].巖土力學(xué),2006,27(4):597-600.(Liu Fushen,et al.Application of feed-forward neural networks to dam deformation monitoring based on differential evolution algorithm[J].Rock and Soil Mechanics,2006,27(4):597-600)
5 趙二峰,等.基于遞階對(duì)角神經(jīng)網(wǎng)絡(luò)的大壩變形預(yù)報(bào)模型[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版),2009,42(3):344-348.(Zhao Erfeng,et al.Dam deformation forecast model based on hierarchical diagonal neural network[J].Engineering Journal of Wuhan University,2009,42(3):344-348)
6 談小龍,等.高邊坡變形的組合預(yù)測(cè)模型及其應(yīng)用[J].水利學(xué)報(bào),2010,41(3):294-299.(Tan Xiaolong,et al.Hybrid prediction model for high slope displacement and its application[J].Journal of Hydraulic Engineering,2010,41 (3):294-299)
7 林志興,梁飛豹.基于最小二乘法的遞推回歸[J].福州大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,34(1):24-27.(Lin Zhixing and Liang Feibao.The recursive regression based on least square method[J].Journal of Fuzhou University(Natural Science),2006,34(1):24-27)
APPLICATION OF DYNAMIC REGGRESSION MODEL IN DEFORMATION ANALYSIS
Deng Xingsheng1),Chen Shiqiao2)and Yin Zhicheng1)
(1)Department of Surveying Engineering,Changsha University of Science&Technology,Changsha 410004 2)Hunan Electric Power Zhexi Hydro-electric Power Plant,Anhua413508)
The recursive least squares algorithm for dynamic regression model,which can be used in the online regression modeling for dynamic data sets,is deduced.When the new observations updating,the dynamic regression algorithm,by avoiding the increment of matrix size,and avoiding the computation of the inverter matrix,can decrease the computation time of solving model parameters.The algorithm is easy to be programmed and no iterative computation is needed.The simplicity and practicality have been verified by using the dynamic regression approach in Zhexi and Dongjiang Dam deformation prediction samples.By compared with other algorithms,the method can reduce computation time and improve prediction precision.
dynamic regression model;recursive least squares algorithm;data update;dynamic data sets;deformation analysis
1671-5942(2011)05-0132-05
2011-03-29
湖南省自然科學(xué)基金(10JJ3090)
鄧興升,男,1971年生,高級(jí)工程師,博士,主要從事統(tǒng)計(jì)學(xué)習(xí)理論及其在大地測(cè)量中應(yīng)用方面的研究.E-mail:whudxs@ 163.com
P207
A