陳西江 花向紅 魯鐵定 翟高鵬 楊燕景
(1)武漢大學(xué)測繪學(xué)院,武漢 430079 2)武漢大學(xué)災(zāi)害監(jiān)測與防治研究中心,武漢 430079 3)東華理工大學(xué)測繪工程學(xué)院,撫州 344000 4)河北省測繪產(chǎn)品質(zhì)量監(jiān)督檢驗站,石家莊050000)
殘差自適應(yīng)回歸TLS*
陳西江1,2)花向紅1,2)魯鐵定3)翟高鵬4)楊燕景3)
(1)武漢大學(xué)測繪學(xué)院,武漢 430079 2)武漢大學(xué)災(zāi)害監(jiān)測與防治研究中心,武漢 430079 3)東華理工大學(xué)測繪工程學(xué)院,撫州 344000 4)河北省測繪產(chǎn)品質(zhì)量監(jiān)督檢驗站,石家莊050000)
TLS在擬合及推估過程中,其擬合和推估的殘差會隨著觀測數(shù)據(jù)量的增加而呈現(xiàn)上揚的趨勢,為了抑制殘差的上揚,將自適應(yīng)回歸模型引入到TLS的擬合及推估中,采用適宜的回歸模型對經(jīng)過灰色數(shù)據(jù)處理的殘差進(jìn)行分析,將分析的結(jié)果與TLS的擬合和推估結(jié)果進(jìn)行組合以減弱殘差的影響,從而對整體的殘差起到了抑制的作用。經(jīng)過實例分析,驗證了該方法的可行性。
TLS;殘差;自適應(yīng)回歸;擬合;回歸模型
總體最小二乘是在最小二乘基礎(chǔ)上發(fā)展起來的同時考慮自變量和因變量誤差的模型,眾多學(xué)者對其進(jìn)行了深入的研究,文獻(xiàn)[1]推導(dǎo)了正交TLS模型,Schaffrin[2,3]等人研究了帶權(quán)情況下的 WTLS,Van Huffel和 Vandewalle[4]給出了混合 LS-TLS模型,該模型對于整體誤差起到了平滑作用。但并沒有起到抑制殘差的作用,在利用擬合確定參數(shù)后的TLS模型進(jìn)行推估的時候仍將帶有誤差的原始觀測數(shù)據(jù)x、y作為自變量,這樣推估的結(jié)果不僅具有本身的誤差vz,還將自變量的誤差vx、vy轉(zhuǎn)嫁到所需推估的變量上,其推估的精度就會降低,從而造成了推估殘差的凸凹現(xiàn)象,為了平滑推估殘差的凸凹及抑制殘差上揚的趨勢,本文將自適應(yīng)回歸模型引入到TLS模型中,對TLS的初始擬合殘差進(jìn)行分析,確定適宜的殘差回歸模型來對殘差進(jìn)行推估,從而可以抵消TLS推估殘差的凸凹及上揚,提高了TLS擬合及推估的精度。
總體最小二乘的基本數(shù)學(xué)模型為
文獻(xiàn)[5]提出了同時顧及x和y相互影響的TLS模型:
本文考慮到對TLS解算結(jié)果的穩(wěn)定性,采用文獻(xiàn)[1]提出的正交TLS模型:
將式(3)一元正交TLS模型延伸到多元,則:
殘差自適應(yīng)回歸TLS的基礎(chǔ)是對TLS模型的殘差進(jìn)行分析,根據(jù)原始觀測數(shù)據(jù),利用正交TLS的性質(zhì),可以解得參數(shù)a、b、c的值,根據(jù)公式(6)得到因變量的擬合值[…],并利用公式(7)將擬合值與真值[z1z2… zn]進(jìn)行殘差處理得到殘差vi:
由于擬合殘差較小或者可能存在負(fù)值,利用公式(8)適當(dāng)加一常數(shù)b把vi序列變?yōu)榉秦?fù)Vi,即
根據(jù)灰色理論的數(shù)據(jù)預(yù)處理,為了較為準(zhǔn)確地對殘差序列Vi進(jìn)行趨勢分析,需要對Vi做一次累加以凸顯其規(guī)律性,得出生成序列,即:
式中
其中i為時間序列,an、a、b、c為待定系數(shù)。
根據(jù)處理之后的殘差數(shù)據(jù),利用最小二乘對式(11)、(12)、(13)中的未知參數(shù)an、a,b,c進(jìn)行解算,最終可確定多項式、冥函數(shù)、指數(shù)曲線方程,根據(jù)前n序列的已有擬合殘差信息,利用曲線回歸方程對殘差信息進(jìn)行擬合,并進(jìn)行擬合結(jié)果誤差的解算,從而得到多項式曲線擬合中誤差、冥函數(shù)曲線擬合中誤差、指數(shù)曲線擬合中誤差,其中,對于多項式曲線擬合回歸方程,如果項數(shù)太多,就會陷入過擬合現(xiàn)象,因此本文選用常用的二項式、三項式、四項式曲線回歸方程。根據(jù)擬合結(jié)果圖,剔除偏離殘差離散點最大的曲線回歸方程,對剩余的曲線擬合中誤差進(jìn)行對比分析,為了同時能夠顧及到擬合精度及過度擬合的情況下,將擬合精度最低和擬合精度最高的曲線回歸方程排除,再對剩余的曲線擬合中誤差進(jìn)行對比分析,最終將擬合精度較高的回歸方程f (i)作為的推估方程,利用f(i)計算n+i時刻的推估值,對進(jìn)行累減得出殘差Vi的推估值,再將所加入的常數(shù)b消去,便得到TLS擬合殘差vi的推估值。最終利用式(6)對推估樣本進(jìn)行推估,得到初始推估值,將初始推估值與殘差推估值進(jìn)行結(jié)合,形成最終的TLS推估值zi:
以文獻(xiàn)[6]中例5.4的數(shù)據(jù)作為樣本(表1),將溫度、壓力作為自變量,變形值作為因變量,將20組觀測數(shù)據(jù)分為兩部分,前15組數(shù)據(jù)作為擬合樣本,后5組數(shù)據(jù)作為推估樣本,利用公式(5)對擬合樣本進(jìn)行擬合得到總體最小二乘的參數(shù)為a= 0.397 1,b=-0.055,c=0.916 1,根據(jù)所求的參數(shù)利用公式(6)對變形值進(jìn)行擬合,并將擬合結(jié)果與原始數(shù)據(jù)相減得到擬合殘差。
表1 觀測數(shù)據(jù)Tab.1 Observations
通過公式(8)、(9)對擬合殘差進(jìn)行處理,利用幾種常用的曲線回歸方程對處理結(jié)果的V1i進(jìn)行擬合(圖1)。
圖1 曲線擬合Fig.1 Curve fitting
通過圖1可直觀判定能夠較為準(zhǔn)確擬合V1i的曲線方程為多項式或冥函數(shù)回歸方程,根據(jù)最小二乘解算原則,確定這兩種曲線回歸方程為:
從表2可知二項式曲線回歸方程擬合精度最低、四項式曲線回歸方程擬合精度最高,在綜合考慮擬合精度及過擬合現(xiàn)象的情況下,將二項式、四項式曲線擬合方程去除,對于三項式及冥函數(shù)曲線擬合方程,確定精度較高的三項式曲線擬合方程為V1i的回歸模型。利用式(16)與(6)組成的殘差自適應(yīng)回歸TLS對原始觀測數(shù)據(jù)進(jìn)行模擬及推估,并將模擬,推估結(jié)果與最小二乘、TLS進(jìn)行對比分析,結(jié)果如表3、4所示。從表3可知,TLS、最小二乘模擬精度相當(dāng),而殘差自適應(yīng)回歸TLS模擬精度要優(yōu)于其他兩種方法;從表4可明顯看出殘差自適應(yīng)回歸TLS推估精度較優(yōu)于其他兩種方法,同時從推估殘差可看出,其殘差分布較為平滑,不會出現(xiàn)太大的凸凹,從而抑制了殘差的上揚趨勢,增強了模型的穩(wěn)定度,提高了擬合精度。
表2 曲線擬合誤差對比分析Tab.2 Comparison of curve fitting error
表3 三種模型的模擬值對比分析Tab.3 Comparison among the simulation values with three models
表4 三種模型的推估值對比分析Tab.4 Comparison among the estimation values with three models
本文對擬合后的數(shù)據(jù)進(jìn)行了分析,將幾種常用的回歸模型引入到擬合殘差中,對不同回歸模型的擬合精度進(jìn)行了評價分析,選取最佳的回歸模型作為擬合殘差的推估模型并對擬合殘差進(jìn)行模擬及推估,實現(xiàn)了殘差的推估,同時隨著序列號的增加,其模型推估的殘差也呈現(xiàn)出上揚趨勢,因此對殘差進(jìn)行分析并將殘差推估結(jié)果與觀測數(shù)據(jù)的TLS推估結(jié)果進(jìn)行結(jié)合,實現(xiàn)了殘差的平滑處理,提高了推估精度。
由于對殘差序列的分析采用的是幾種常用的回歸模型,而這幾種回歸模型是否適用于所有變形體擬合后的殘差序列,對多項式曲線擬合過程中,次數(shù)越高,模擬精度越高,但推估的精度可能會降低,怎樣平衡殘差的擬合精度與推估精度及怎樣選用最佳回歸方程將有待進(jìn)一步探討。
1 張賢達(dá).矩陣分析與應(yīng)用[M],北京:清華大學(xué)出版社,2004.(Zhang Xianda.Matrix analysis and applications[M].Beijing:Tsinghua University Press,2004)
2 Schaffrin B and Felus Y A.On total least squares adjustment with constraints[J].A Windows on the Future of Geodesy,2005,128(4):417-421.
3 Felus Y and Schaffrin B.Performing similarity transformations using the Errors-In-Variables Model[R].American Society for Photogrammetry and Remote Sensing(ASPRS) Annual Meeting,2005.
4 Huffel S Van and Vandewalle J.The least square problem: Computational aspects and analysis,F(xiàn)rontiers in Appl[R].Math.SIAM,Philadelphia,1991.
5 魯鐵定,陶本藻,周世健.基于總體最小二乘法的線性回歸建模和解法[J],武漢大學(xué)學(xué)報(信息科學(xué)版),2008,33(5):504-507.(Lu Tieding,Tao Benzao and Zhou Shijian.Modeling and algorithm of linear regression based on total Least squares[J].Geomatics and Information Science of Wuhan University,2008,33(5):504-507)
6 邱衛(wèi)寧,等.測量數(shù)據(jù)處理理論與方法[M].武漢:武漢大學(xué)出版社,2008.(Qiu Weining,et al.The theory and method of surveying data processing[M].Wuhan:Wuhan University Press,2008)
RESIDUALS ADAPTIVE REGRESSION TLS
Chen Xijiang1,2),Hua Xianghong1,2),Lu Tieding3),Zhai Gaopeng4)and Yang Yanjing3)
(1)Institute of Surveying and Mapping,Wuhan University,Wuhan 430079 2)Hazard monitoringamp;prevention Research Center,Wuhan University,Wuhan 430079 3)Institute of Surveying and Mapping,East China Institute of Technology,F(xiàn)uzhou 344000 4)The Station of Quality Supervision and Inspection about Surveying and Mapping Products,Shijiazhuang050000)
The TLS fitting and estimation residuals will be upward with the increasing in the amount of observed data in the process of TLS fitting and estimation.In order to curb the trend,the adaptive regression is introduced to the TLS fitting and estimation.The appropriate regression model is used to analyze the residuals handled by gray method.The results of residual analysis is combined to the results of TLS fitting and estimation to weaken the impact of residuals.The experimental results confirm the feasibility of the method.
TLS;residual;adaptive regression;fitting;regression model
1671-5942(2012)03-0090-04
2011-12-26
國家自然科學(xué)基金(41174010,41074025);精密工程與工業(yè)測量國家測繪地理信息局重點實驗室開放基金(PF2011-17)
陳西江,男,1985年生,博士研究生,主要從事三維激光點云數(shù)據(jù)處理研究工作.E-mail:cxj_0421@163.com
P207
A