王淑超,馬永梅
(巢湖學(xué)院 應(yīng)用數(shù)學(xué)學(xué)院,安徽 合肥 238000)
數(shù)理研究
一元線性回歸中自相關(guān)的處理
王淑超1,馬永梅2
(巢湖學(xué)院 應(yīng)用數(shù)學(xué)學(xué)院,安徽 合肥 238000)
涉及時間序列的線性回歸模型往往會出現(xiàn)自相關(guān)問題,以往學(xué)者在建模時大多忽略了自相關(guān)問題而直接使用普通最小二乘法進行回歸,這會造成模型的估計不夠準(zhǔn)確.文章對自回歸進行闡釋,利用保險業(yè)數(shù)據(jù)實證分析自回歸的檢驗方法和解決辦法.廣義差分法解決自回歸問題使得線性回歸模型的普通最小二乘估計量具有良好的統(tǒng)計特性.
線性回歸;自相關(guān);自相關(guān)檢驗;廣義差分;財產(chǎn)保費
回歸分析是研究一個所謂的因變量對另一個或多個所謂自變量的依賴關(guān)系,并通過自變量在重復(fù)抽樣中的已知或設(shè)定值,去估計或預(yù)測因變量的總體均值.根據(jù)回歸模型中參數(shù)是否線性,回歸分析可以分為線性回歸分析和非線性回歸分析.[1]
線性回歸模型的一般形式為:
對線性回歸模型進行估計常用的方法是普通最小二乘法,使用普通最小二乘法對線性回歸模型進行估計時首先要進行如下假設(shè):隨機干擾項零均值、同方差、相互獨立且服從正態(tài)分布,隨機干擾項與自變量不相關(guān),自變量之間不存在線性相關(guān).滿足以上假設(shè)的線性回歸模型被稱為經(jīng)典線性回歸模型,經(jīng)典線性回歸模型使用普通最小二乘法進行估計具有良好的統(tǒng)計特性.[1]
實際上,并不是所有的回歸分析問題都能滿足經(jīng)典假設(shè),在不滿足經(jīng)典假設(shè)時使用普通最小二乘法進行估計的結(jié)果就值得懷疑,結(jié)果可能并不可靠,尤其在時間序列數(shù)據(jù)中,常常會違背“隨機干擾項相互獨立”的假設(shè),此時即存在自相關(guān)問題.
如果回歸模型不滿足“隨機干擾項相互獨立”的假設(shè),則稱為自相關(guān).[1]
自相關(guān)按形式可以分為一階自相關(guān)和高階自相關(guān).[1]若ui=ρui-1+vi(-1<ρ<1),則該模型存在一階自相關(guān);若ui=f(ui-1,ui-2,…)+vi,則存在高階自相關(guān).其中,ρ為自相關(guān)系數(shù),vi為經(jīng)典誤差項.
回歸模型存在自相關(guān)時使用普通最小二乘法對回歸模型進行估計會導(dǎo)致估計的參數(shù)非有效、模型預(yù)測失效等問題.因此在對回歸模型進行估計前,檢驗其是否存在自相關(guān)問題就尤為重要.
近年來,隨著人們收入水平的提高,人們對財產(chǎn)的風(fēng)險控制意識增強,我國的財產(chǎn)保費收入迅速增長,因此可將衡量人們收入水平的國家GDP作為自變量X,將我國的財產(chǎn)保費總收入作為因變量Y,建立一元線性回歸模型.[2]然而,財產(chǎn)保費總收入的時間序列除了受GDP影響外,可能受人們保險意識的影響自身具有一定的慣性,因此需要檢驗其是否存在自相關(guān)問題.文章采用1997-2015年我國GDP和我國財產(chǎn)保費總收入數(shù)據(jù)進行實證分析,數(shù)據(jù)來源于國家統(tǒng)計局網(wǎng)站.
建立一元線性回歸模型(1):
使用普通最小二乘法進行估計,估計結(jié)果如式(2):
括號內(nèi)的數(shù)字為回歸系數(shù)對應(yīng)的t統(tǒng)計量的值(下同),由回歸結(jié)果可以看出,擬合系數(shù)為0.9804,說明模型擬合的較好;回歸系數(shù)的t統(tǒng)計量的值較大,對應(yīng)的p值接近于0,說明變量顯著.
2.1 圖示檢驗法
作殘差和滯后一期殘差的關(guān)系圖,繪制圖形如圖1.由圖1可以看出大多數(shù)散點落在第1、3象限內(nèi),說明殘差之間存在正相關(guān).
圖1 即期殘差與滯后殘差
2.2 D.W.檢驗
檢驗自相關(guān)最常用的檢驗是德賓-沃森檢驗,簡稱為D.W.檢驗.其原理是利用線性回歸的殘差構(gòu)造D.W.統(tǒng)計量,見式(3),并可根據(jù)顯著性水平和樣本容量查臨界值的上限du和下限dL,根據(jù)D.W.統(tǒng)計量落在不同區(qū)間得出不同的結(jié)論,見圖2.
圖2 D.W.統(tǒng)計量判別[1]
由回歸結(jié)果(2)得D.W.=0.2936,數(shù)值較小,小于顯著性水平5%和樣本容量為19的臨界值dL=1. 18,說明模型存在一階自相關(guān).但是D.W.檢驗只適用于存在一階自相關(guān)的情形,對于高階自相關(guān)無法檢驗,因此需要進一步使用其他方法進行檢驗.
2.3 LM檢驗
LM檢驗不僅可以檢驗?zāi)P褪欠翊嬖谧韵嚓P(guān),還能檢驗?zāi)P痛嬖谧韵嚓P(guān)的階數(shù),它是通過建立殘差項關(guān)于自變量和滯后期殘差項的輔助回歸模型完成的.在eviews軟件的回歸結(jié)果窗口中點擊”View/Residual Tests/Serial Correlation LM Test”,將滯后期分別設(shè)為1、2,分別得到如式(4)、式(5)的估計結(jié)果:
由式(4)、式(5)的估計結(jié)果分析可得:在5%的顯著性水平下,三個模型的擬合系數(shù)均較高,F(xiàn)統(tǒng)計量均顯著,說明三個模型在整體上均是顯著的;由模型中變量的t統(tǒng)計值可以看出,只有模型(4)中各變量均顯著;由模型的LM值可以得出,模型存在自相關(guān),結(jié)合模型中各變量t統(tǒng)計量的大小可以得出模型只存在一階自相關(guān),不存在高階自相關(guān).因此可利用式(2)中的D.W.計算的
2.4 回歸檢驗法
回歸檢驗法是對原模型式(1)進行回歸,根據(jù)回歸結(jié)果計算殘差序列ei=yi-y?i,然后對殘差序列ei用普通最小二乘法進行不同形式的回歸擬合,如式(6)、式(7):
由式(6)和式(7)的估計結(jié)果可知,兩個模型的擬合系數(shù)均較大,說明兩個模型整體擬合較好;由模型中t統(tǒng)計值可知,在1%的顯著性水平下,模型(6)中變量顯著,模型(7)中ei-2不顯著,說明原模型(2)只存在一階自相關(guān),不存在高階自相關(guān).由模型(6)可知
回歸檢驗法得到的ρ值原則上應(yīng)該與利用式(2)中D.W.計算的ρ一致,文章中兩者有差別的原因是:一方面回歸檢驗由于采用滯后期導(dǎo)致自由度有所降低,另一方面是關(guān)系式是在樣本容量充分大時成立,本文的樣本容量并沒有達到充分大.
當(dāng)模型存在自相關(guān)時,直接使用普通最小二乘法進行估計可能得到不正確的估計結(jié)果,因此須消除自相關(guān),本文采用廣義差分法消除自相關(guān).廣義差分法是將原模型轉(zhuǎn)化為對應(yīng)的差分形式以消除自相關(guān),然后再通過普通最小二乘法對差分后的模型進行估計,從而間接得到原模型的估計值.
對式(1)取滯后一期后,兩邊同乘以ρ作變換Yt-ρYt-1,得到式(8):
由于vt滿足經(jīng)典假設(shè),新模型不存在自相關(guān)問題.本文采用回歸檢驗法得到的ρ?=0.8532對數(shù)據(jù)進行處理,用處理后的數(shù)據(jù)對式(9)進行回歸得到式(10):
由式(10)的估計結(jié)果可知,在5%的顯著性水平下,模型的擬合系數(shù)為0.925449,擬合優(yōu)度較高,F(xiàn)統(tǒng)計量為198.6168,說明模型整體上顯著;x的回歸系數(shù)的t統(tǒng)計值較大,變量x顯著;dL=1.18,dU=1. 40,dL≤D.W.=1.008553≤dU,因此無法使用D.W.值檢驗是否存在自相關(guān),經(jīng)過LM檢驗,式(10)不再存在自相關(guān).根據(jù)差分模型的參數(shù)估計值計算原模型的參數(shù)估計值,如式(11)和式(12):
因此,消除自相關(guān)的回歸模型為Y?i,經(jīng)濟含義是我國財產(chǎn)保費收入的1.4171%是由我國GDP的增長引起的.
在使用普通最小二乘法建立線性回歸模型對時間序列數(shù)據(jù)進行分析時,首先要檢驗是否存在自相關(guān)問題,殘差圖、D.W.檢驗、LM檢驗、回歸檢驗等都可以檢驗自相關(guān)問題.其中殘差圖的方法只適合初步判斷是否存在自相關(guān),無法給出精確的結(jié)果;D.W.檢驗只適合檢驗存在一階自相關(guān)的情況不適合存在高階自相關(guān)時使用;LM檢驗和回歸檢驗是檢驗自相關(guān)問題比較好的方法,不僅可以檢驗自相關(guān)是否存在,還可以檢驗存在自相關(guān)的階數(shù).對存在自相關(guān)的模型可以采用廣義差分法進行處理,然后再采用普通最小二乘法回歸.
〔1〕張曉彤.計量經(jīng)濟學(xué)基礎(chǔ)[M].4版.天津:南開大學(xué)出版社,2014:135-157.
〔2〕張芳潔.影響我國保險業(yè)發(fā)展的經(jīng)濟因素的實證分析[J].數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究,2004,21(3): 25-31.
〔3〕劉明,王永瑜.Durbin-Watson自相關(guān)檢驗應(yīng)用問題探討 [J].數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究,2014,31(6):153-160.
〔4〕林天水,陳佩樹.一元線性回歸中異方差的處理[J].統(tǒng)計與決策,2015,31(21):86-88.
O212
A
1673-260X(2017)06-0001-03
2017-03-11
安徽省重點科研項目(KJ2016A505);巢湖學(xué)院校級科研項目(XLY-201502)