葉宗裕,王衛(wèi)杰
(浙江師范大學(xué) a.經(jīng)濟(jì)與管理學(xué)院;b.數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,浙江 金華 321001)
由于經(jīng)濟(jì)發(fā)展的連續(xù)性所形成的“慣性”,使得許多經(jīng)濟(jì)變量的前后期值之間是相互關(guān)聯(lián)的。經(jīng)濟(jì)發(fā)展的這種慣性作用,使得利用時(shí)序數(shù)據(jù)建立計(jì)量經(jīng)濟(jì)模型時(shí)經(jīng)常會(huì)遇到“自相關(guān)性”的問題,即模型中隨機(jī)誤差項(xiàng)μt的各期值之間存在著較強(qiáng)的相關(guān)關(guān)系。自相關(guān)性的存在將會(huì)增大模型系數(shù)的估計(jì)誤差,降低統(tǒng)計(jì)檢驗(yàn)的可靠性和預(yù)測(cè)的精度。因此,進(jìn)行計(jì)量經(jīng)濟(jì)分析時(shí)一般都要檢驗(yàn)?zāi)P褪欠翊嬖谧韵嚓P(guān)性,并根據(jù)自相關(guān)性的類型采取相應(yīng)的解決方法。
自相關(guān)性的檢驗(yàn)方法有多種,如回歸檢驗(yàn)法、DW檢驗(yàn)法、LM檢驗(yàn)等?;貧w檢驗(yàn)法是以殘差et為被解釋變量,以殘差滯后項(xiàng)et-1、et-2等為解釋變量建立輔助回歸方程,如果方程顯著成立,則模型存在自相關(guān)性?;貧w檢驗(yàn)法的優(yōu)點(diǎn)是一旦確定了模型存在自相關(guān)性,也就同時(shí)知道了自相關(guān)的形式,而且它適用于任何類型的自相關(guān)性的檢驗(yàn)[1]。但是回歸檢驗(yàn)法由于沒有明確的臨界值,在實(shí)際中幾乎沒有得到應(yīng)用。在實(shí)際應(yīng)用中,一階自相關(guān)性是人們最常考慮的形式, DW檢驗(yàn)是檢驗(yàn)一階自相關(guān)性的一種經(jīng)典方法,在一般的計(jì)量經(jīng)濟(jì)學(xué)教科書中,DW檢驗(yàn)是重點(diǎn)介紹的自相關(guān)檢驗(yàn)方法,許多統(tǒng)計(jì)分析軟件在建立模型時(shí)也將DW統(tǒng)計(jì)量值作為基本統(tǒng)計(jì)量直接輸出。由于DW統(tǒng)計(jì)量的分布及其臨界值,不僅與樣本容量n和解釋變量數(shù)目k有關(guān),還與解釋變量序列的具體取值有關(guān)。Durbin和Watson考慮了不依賴于解釋變量取值的兩個(gè)極限分布,DW統(tǒng)計(jì)量位于這兩個(gè)極限分布之間[2]。所以,Durbin和Watson根據(jù)樣本容量n和解釋變量數(shù)目k,在給定置信度α下,建立了DW檢驗(yàn)統(tǒng)計(jì)量的下臨界值dL和上臨界值dU[3]。若DW≤dL,則有正自相關(guān);若dU 此外,DW檢驗(yàn)的使用需要滿足一些先設(shè)條件,如:待檢驗(yàn)的回歸模型包含截距項(xiàng),解釋變量X是非隨機(jī)的,解釋變量中不包含滯后的被解釋變量等。劉明和王永瑜對(duì)這些先設(shè)條件存在的原因逐一進(jìn)行了分析討論,并由此引出另一些不被注意的先設(shè)條件[5]。當(dāng)模型中含有被解釋變量的滯后項(xiàng)時(shí),DW統(tǒng)計(jì)量的取值有經(jīng)常偏向于2的缺陷,Durbin提出使用h統(tǒng)計(jì)量,對(duì)含有被解釋變量滯后項(xiàng)模型的自相關(guān)性進(jìn)行檢驗(yàn)[6]。為了克服DW檢驗(yàn)的缺陷,統(tǒng)計(jì)學(xué)家Breusch和Godfrey(1978)提出了一種新的檢驗(yàn)方法,即拉格朗日乘數(shù)檢驗(yàn)法(LM檢驗(yàn))。這種方法允許被解釋變量的滯后項(xiàng)存在,同時(shí)還可以檢驗(yàn)高階自相關(guān)[1]158。若無(wú)自相關(guān)的原假設(shè)為真,在大樣本情況下,LM統(tǒng)計(jì)量漸近服從2分布。 但在大多數(shù)應(yīng)用中,樣本往往都不是很大。在樣本不大的情況下,LM統(tǒng)計(jì)量的分布與2分布會(huì)有較大差距,用2分布的臨界值進(jìn)行檢驗(yàn),可能會(huì)給出錯(cuò)誤的結(jié)果。Mei-Yu Lee指出,由于受樣本量和自變量個(gè)數(shù)的影響, LM統(tǒng)計(jì)量在小樣本情況下并不趨向于卡方分布,只有當(dāng)樣本量大于1 000時(shí), LM統(tǒng)計(jì)量才接近卡方分布[7]。另一方面,由于LM檢驗(yàn)不能直接確定自相關(guān)的階數(shù)。針對(duì)這一問題,劉漢中提出對(duì)殘差最高階滯后項(xiàng)的回歸系數(shù)進(jìn)行常規(guī)的t檢驗(yàn),以此來(lái)確定自相關(guān)的階數(shù)[8]。但由于輔助回歸中的殘差滯后項(xiàng)具有隨機(jī)性及相關(guān)性,殘差最高階滯后項(xiàng)回歸系數(shù)的t統(tǒng)計(jì)量并不服從標(biāo)準(zhǔn)t分布,用常規(guī)的t檢驗(yàn)可能會(huì)給出錯(cuò)誤的檢驗(yàn)結(jié)果。 本文主要做了以下幾項(xiàng)工作:第一,針對(duì)不同的解釋變量,運(yùn)用蒙特卡羅模擬方法,通過EViews軟件編程,得到DW檢驗(yàn)、回歸檢驗(yàn)、LM檢驗(yàn)的臨界值和LM檢驗(yàn)中最高階滯后項(xiàng)回歸系數(shù)t統(tǒng)計(jì)量的臨界值,并分析臨界值的一些特點(diǎn)。根據(jù)DW檢驗(yàn)和LM檢驗(yàn)的模擬臨界值進(jìn)行序列自相關(guān)檢驗(yàn),可以避免DW檢驗(yàn)存在不確定區(qū)域和LM檢驗(yàn)的臨界值不準(zhǔn)確的缺陷。第二,當(dāng)用模擬方法確定臨界值時(shí),可采用回歸檢驗(yàn)法進(jìn)行自相關(guān)性檢驗(yàn),即用殘差et對(duì)et-1回歸系數(shù)的估計(jì)量ρ和其t統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量,分別稱為ρ檢驗(yàn)和t檢驗(yàn)。通過蒙特卡羅模擬方法,計(jì)算了DW檢驗(yàn)和回歸檢驗(yàn)法的檢驗(yàn)功效,結(jié)果表明,回歸檢驗(yàn)法的檢驗(yàn)功效優(yōu)于DW檢驗(yàn),可以作為DW檢驗(yàn)的替代方法。第三,在LM檢驗(yàn)中,通常通過對(duì)最高階滯后項(xiàng)系數(shù)進(jìn)行t檢驗(yàn)以確定自相關(guān)的階數(shù),但模擬計(jì)算表明,LM檢驗(yàn)中最高階滯后項(xiàng)系數(shù)的t統(tǒng)計(jì)量不服從標(biāo)準(zhǔn)t分布,且小樣本情況下差距較大,不能用標(biāo)準(zhǔn)t分布臨界值進(jìn)行檢驗(yàn),在實(shí)際檢驗(yàn)時(shí),可以用模擬方法計(jì)算臨界值。最后舉了兩個(gè)應(yīng)用案例。 為節(jié)省篇幅,本文僅就DW檢驗(yàn)時(shí),蒙特卡羅模擬的具體方法及EViews程序進(jìn)行說明,其他檢驗(yàn)時(shí)的方法類似(1)讀者若需要,可向作者索要EViews軟件的程序,讀者在對(duì)實(shí)際模型進(jìn)行DW檢驗(yàn)時(shí),只要參照說明進(jìn)行操作,就可以計(jì)算出相關(guān)檢驗(yàn)的臨界值。。假設(shè)在實(shí)際應(yīng)用中,一個(gè)被解釋變量y與k個(gè)解釋變量x1,x2,…,xk之間有線性模型關(guān)系,當(dāng)給定解釋變量的樣本序列時(shí),由于DW檢驗(yàn)的原假設(shè)與隨機(jī)誤差項(xiàng)之間相互獨(dú)立,因此可?。?/p> y=b0+b1x1+b2x2+…+bkxk+μ, μ~i.i.dN(0,σ2) (1) 由于DW檢驗(yàn)的臨界值,與樣本容量n、解釋變量數(shù)目k和解釋變量序列的具體取值有關(guān),而與模型的系數(shù)及標(biāo)準(zhǔn)差σ無(wú)關(guān)。因此在實(shí)際應(yīng)用中計(jì)算模擬臨界值時(shí),解釋變量x1,x2,…,xk必需取實(shí)際的樣本數(shù)據(jù),系數(shù)b0,b1,…,bk和標(biāo)準(zhǔn)差σ可任意取值。但為了提高模擬結(jié)果的精度,可分別根據(jù)實(shí)際樣本數(shù)據(jù)中的被解釋變量y關(guān)于解釋變量x1,x2,…,xk回歸所得的系數(shù)估計(jì)值和誤差項(xiàng)標(biāo)準(zhǔn)差估計(jì)值進(jìn)行輕微調(diào)整得到。蒙特卡羅模擬方法的具體步驟如下:第一步,對(duì)系數(shù)b0,b1,…,bk和標(biāo)準(zhǔn)差σ賦值,輸入x1,x2,…,xk的樣本數(shù)據(jù);第二步,產(chǎn)生隨機(jī)序列μ;第三步,根據(jù)公式(1)計(jì)算序列y;第四步,將y關(guān)于解釋變量x1,x2,…,xk回歸,并計(jì)算DW統(tǒng)計(jì)量值;重復(fù)第二至第五步,本文重復(fù)50萬(wàn)次,得到50萬(wàn)個(gè)DW統(tǒng)計(jì)量值,再計(jì)算50萬(wàn)個(gè)DW統(tǒng)計(jì)量值的0.01、0.05、0.1、0.99、0.95、0.9分位數(shù)。其中0.01、0.05、0.1的分位數(shù)分別為正序列相關(guān)檢驗(yàn)時(shí),顯著性水平為0.01、0.05、0.1的DW檢驗(yàn)臨界值;0.99、0.95、0.9分位數(shù)分別為負(fù)序列相關(guān)檢驗(yàn)時(shí),顯著性水平為0.01、0.05、0.1的DW檢驗(yàn)臨界值。由于重復(fù)次數(shù)越多,模擬臨界值與真實(shí)臨界值越接近,本文進(jìn)行了高達(dá)50萬(wàn)次的重復(fù)實(shí)驗(yàn),所得模擬臨界值將很接近真實(shí)的臨界值。 為研究DW檢驗(yàn)臨界值的特點(diǎn),本文選取了約20個(gè)實(shí)際的時(shí)間序列數(shù)據(jù)和幾組標(biāo)準(zhǔn)正態(tài)分布、均勻分布的隨機(jī)數(shù)序列,針對(duì)不同的樣本量,進(jìn)行了模擬計(jì)算。從這些模擬結(jié)果可以得出一些普遍性的結(jié)論。因篇幅所限,本文僅給出樣本量n為30的一元線性回歸模型時(shí),解釋變量分別取有代表性的四種變量時(shí)的模擬結(jié)果,見表1所示。表1中的變量x1、x2、x3是威廉·H.格林提供的數(shù)據(jù)文件TableF5-1中的變量M1、TBILRATE、INFL從1976年起的100個(gè)數(shù)據(jù)(2)數(shù)據(jù)文件可從參考文獻(xiàn)[9]中附錄F所示網(wǎng)址中下載。[9],NDR是一個(gè)固定的標(biāo)準(zhǔn)正態(tài)分布隨機(jī)數(shù)序列(3)根據(jù)作者的理解,隨機(jī)數(shù)序列具有更廣泛的代表性。。這里取各變量的前30樣本值。查DW檢驗(yàn)臨界值表可得,一個(gè)解釋變量,樣本量為30時(shí),顯著水平分別為0.01和0.05時(shí)臨界值的上界和下界,也在表1中列出。表1中的最后三列分別給出各變量對(duì)應(yīng)的50萬(wàn)個(gè)DW統(tǒng)計(jì)量的均值、標(biāo)準(zhǔn)差,以及對(duì)于檢驗(yàn)H0:μ=2,H1:μ2的檢驗(yàn)統(tǒng)計(jì)量Z值,Z值服從標(biāo)準(zhǔn)正態(tài)分布。Durbin和Watson在其經(jīng)典論文中沒有給出顯著水平為0.1的臨界值,作者所見的文獻(xiàn)中也沒有顯著水平為0.1的臨界值。為論述方便,下文將DW檢驗(yàn)臨界值表中的臨界值稱為經(jīng)典臨界值。 表1 樣本數(shù)為30不同解釋變量時(shí)DW檢驗(yàn)的模擬臨界值 根據(jù)表1及其他許多次隨機(jī)模擬實(shí)驗(yàn)的結(jié)果可得如下結(jié)論:首先,DW統(tǒng)計(jì)量的分布不是關(guān)于2對(duì)稱的分布,但都在經(jīng)典臨界值的上、下界區(qū)間內(nèi)。從Z值可以看出,全部都非常顯著地拒絕原假設(shè)。由此可知,對(duì)于變量x1、x2、x3,其DW統(tǒng)計(jì)量的均值大于2;而對(duì)于變量NDR,其DW統(tǒng)計(jì)量的均值小于2。其次,不論是正、負(fù)序列相關(guān)檢驗(yàn),對(duì)于實(shí)際的時(shí)間序列,各個(gè)模擬臨界值都與經(jīng)典臨界值中較大的一個(gè)比較接近,而且在很多情況下,在保留兩位小數(shù)時(shí),模擬臨界值與經(jīng)典臨界值中較大的一個(gè)完全相等;只有解釋變量是隨機(jī)數(shù)序列時(shí),模擬臨界值位于兩個(gè)經(jīng)典臨界值的中點(diǎn)附近。也即當(dāng)解釋變量波動(dòng)頻數(shù)與波動(dòng)幅度較小時(shí),模擬臨界值與經(jīng)典臨界值中大的一個(gè)相差較小,而當(dāng)解釋變量波動(dòng)頻數(shù)與波動(dòng)幅度較大時(shí),模擬臨界值與經(jīng)典臨界值的上界相差較大。由于大多經(jīng)濟(jì)序列都存在趨勢(shì)性,波動(dòng)不大,所以在實(shí)際應(yīng)用中,如果不通過模擬方法計(jì)算臨界值,也可以直接采用經(jīng)典臨界值的上界進(jìn)行檢驗(yàn)。 本文僅就一階自相關(guān)檢驗(yàn)時(shí),回歸檢驗(yàn)法的臨界值及其特點(diǎn)進(jìn)行研究。此時(shí)回歸檢驗(yàn)法就是將殘差et關(guān)于其一階滯后et-1作輔助回歸,可以用回歸系數(shù)的估計(jì)量ρ進(jìn)行檢驗(yàn),也可以用其t統(tǒng)計(jì)量進(jìn)行檢驗(yàn),為方便起見,以下分別稱為ρ檢驗(yàn)和t檢驗(yàn)。通過蒙特卡羅模擬方法,可以得到ρ檢驗(yàn)和t檢驗(yàn)的臨界值。由于將殘差et對(duì)et-1回歸時(shí)樣本數(shù)少一個(gè)(對(duì)更高階滯后項(xiàng)回歸時(shí)以此類推),本文參照EViews軟件中序列相關(guān)LM檢驗(yàn)時(shí)將缺失的殘差滯后值設(shè)為零的做法(下文在涉及此類的回歸時(shí)都采用此做法),使輔助回歸方程的樣本量與原方程相同,以減小估計(jì)誤差,增加模擬臨界值的準(zhǔn)確性,提高檢驗(yàn)功效。 實(shí)際上,DW檢驗(yàn)除了存在不確定區(qū)域外,還有一個(gè)問題是DW統(tǒng)計(jì)量比較復(fù)雜,不易為初學(xué)者所理解。在許多相關(guān)的文獻(xiàn)中,在介紹DW檢驗(yàn)時(shí),都將DW統(tǒng)計(jì)量轉(zhuǎn)化為殘差et與et-1的相關(guān)系數(shù)ρ的表達(dá)式,再通過ρ分析DW統(tǒng)計(jì)量的取值范圍及具體意義。根據(jù)作者的理解,Durbin和Watson提出DW檢驗(yàn),主要是為了能夠在理論上研究DW統(tǒng)計(jì)量的分布特性,確定其臨界值。但當(dāng)我們用模擬方法確定臨界值時(shí),則用回歸檢驗(yàn)法更加直接。而且后文的模擬結(jié)果表明,回歸檢驗(yàn)法的檢驗(yàn)功效高于DW檢驗(yàn)。 由于ρ及其t統(tǒng)計(jì)量的取值可正可負(fù),所以當(dāng)進(jìn)行負(fù)的自相關(guān)檢驗(yàn)時(shí),是左側(cè)檢驗(yàn),對(duì)應(yīng)于顯著性水平為0.01、0.05、0.1的臨界值分別是相應(yīng)50萬(wàn)個(gè)模擬統(tǒng)計(jì)量值的0.01、0.05、0.1分位數(shù);當(dāng)進(jìn)行正的自相關(guān)檢驗(yàn)時(shí),是右側(cè)檢驗(yàn),對(duì)應(yīng)于顯著性水平為0.01、0.05、0.1的臨界值分別是相應(yīng)50萬(wàn)個(gè)模擬統(tǒng)計(jì)量值的0.99、0.95、0.9分位數(shù)。 與前文相同,這里僅給出樣本量n為30的一元線性回歸模型時(shí),解釋變量分別取表1中的四種變量時(shí)的模擬結(jié)果,見表2所示。表2中的最后三列分別給出各變量對(duì)應(yīng)的50萬(wàn)個(gè)ρ值及其t統(tǒng)計(jì)量的均值、標(biāo)準(zhǔn)差,以及檢驗(yàn)“H0:總體均值=0”的Z統(tǒng)計(jì)量值。Z統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。另外需要說明的是,本文在模擬實(shí)驗(yàn)中,針對(duì)每一組解釋變量和被解釋變量的回歸方程,同時(shí)計(jì)算DW統(tǒng)計(jì)量、ρ及其t統(tǒng)計(jì)量和它們的臨界值,這樣三種臨界值之間的相對(duì)誤差更小,后文根據(jù)此臨界值所得的三種檢驗(yàn)功效也更具可比性,結(jié)論更為可靠。 表2 樣本數(shù)為30不同解釋變量時(shí)回歸檢驗(yàn)法的模擬臨界值 從Z值可以看出,全部均非常顯著地拒絕原假設(shè)。由此可知,在各種情形下,ρ值及其t統(tǒng)計(jì)量的均值都小于0,它們的分布不是關(guān)于0對(duì)稱的分布。從各臨界值也可以看出其具有不對(duì)稱性。在表2中也給出了相應(yīng)樣本量時(shí)的標(biāo)準(zhǔn)t分布臨界值,由于回歸檢驗(yàn)法中的回歸沒有常數(shù)項(xiàng),樣本量為30時(shí)對(duì)應(yīng)自由度為29的t分布。可以看出,回歸檢驗(yàn)法中的t統(tǒng)計(jì)量的臨界值與標(biāo)準(zhǔn)t分布的臨界值有較大差距,所以當(dāng)用回歸的t統(tǒng)計(jì)量進(jìn)行檢驗(yàn)時(shí)也不能使用標(biāo)準(zhǔn)t分布臨界值,需要用模擬方法計(jì)算臨界值。 評(píng)價(jià)檢驗(yàn)方法好壞的主要依據(jù)是檢驗(yàn)水平與檢驗(yàn)功效。檢驗(yàn)水平是犯棄真錯(cuò)誤的概率,即誤差序列不存在自相關(guān),被判斷為存在一階自相關(guān),檢驗(yàn)水平越小越好。檢驗(yàn)功效是原假設(shè)為假而被拒絕的概率,即存在一階自相關(guān)時(shí)被判斷為存在一階自相關(guān)的概率,檢驗(yàn)功效越大越好。當(dāng)兩種檢驗(yàn)方法用各自的檢驗(yàn)臨界值進(jìn)行檢驗(yàn)時(shí),檢驗(yàn)水平即為顯著性水平。所以,當(dāng)取相同的顯著性水平進(jìn)行檢驗(yàn)時(shí),各種方法的檢驗(yàn)水平?jīng)]有區(qū)別,檢驗(yàn)方法的好壞在于它們的檢驗(yàn)功效。首先對(duì)滿足DW檢驗(yàn)條件的自相關(guān)模型,運(yùn)用模擬方法計(jì)算DW檢驗(yàn)、ρ檢驗(yàn)和t檢驗(yàn)的檢驗(yàn)功效。本文以誤差項(xiàng)存在自相關(guān)的一元線性回歸模型為例。針對(duì)給定解釋變量的樣本序列,構(gòu)造自相關(guān)模型: yt=b0+b1xt+μt, μt=ρμt-1+εt,εt~i.i.dN(0,σ2) (2) 在實(shí)際模擬實(shí)驗(yàn)時(shí),系數(shù)b0、b1、ρ和標(biāo)準(zhǔn)差σ要取具體值,但除ρ以外,其他參數(shù)的值不影響檢驗(yàn)功效,而不同的ρ值有不同的檢驗(yàn)功效。εt為獨(dú)立同分布的正態(tài)序列,這時(shí)只要每隨機(jī)產(chǎn)生一個(gè)序列εt,就可以計(jì)算序列yt;將yt關(guān)于解釋變量xt回歸,提取DW統(tǒng)計(jì)量和殘差序列et;再將et關(guān)于et-1作輔助回歸,得到ρ的估計(jì)值及其t統(tǒng)計(jì)量值。重復(fù)上述步驟,本文重復(fù)50萬(wàn)次,得到50萬(wàn)個(gè)DW統(tǒng)計(jì)量值、ρ的估計(jì)值及其t統(tǒng)計(jì)量值。再將各統(tǒng)計(jì)量值與各自的臨界值比較。當(dāng)ρ取正值時(shí),即假設(shè)誤差項(xiàng)存在正的自相關(guān),對(duì)于DW檢驗(yàn),如果計(jì)算的統(tǒng)計(jì)量值小于臨界值,則檢驗(yàn)結(jié)果為存在正自相關(guān);對(duì)于ρ檢驗(yàn)和t檢驗(yàn),如果計(jì)算的統(tǒng)計(jì)量值大于臨界值,則檢驗(yàn)結(jié)果為存在正自相關(guān)。再計(jì)算出50萬(wàn)次實(shí)驗(yàn)中存在自相關(guān)的頻率,即為相應(yīng)的檢驗(yàn)功效。作者對(duì)各種不同的情形進(jìn)行了大量的模擬計(jì)算。限于篇幅,本文給出以表1中的4個(gè)解釋變量,樣本數(shù)n分別為30和50,ρ值分別為0.2、0.4、0.6、0.8的情形,以顯著水平α=0.05的模擬臨界值模擬計(jì)算的檢驗(yàn)功效,結(jié)果見表3所示。 表3及其他的模擬結(jié)果均顯示,只在樣本量為50、ρ值為0.8時(shí),由于檢驗(yàn)功效很接近1,三種檢驗(yàn)方法的功效,在保留4位小數(shù)時(shí),幾乎完全相等,其他情況下,DW檢驗(yàn)的檢驗(yàn)功效均小于ρ檢驗(yàn)和t檢驗(yàn)。由于檢驗(yàn)功效是被檢驗(yàn)為自相關(guān)的次數(shù)與總次數(shù)的比率,根據(jù)兩個(gè)總體比率之差的檢驗(yàn)原理,檢驗(yàn)H0:π2-π1≤0,H1:π2-π1>0的統(tǒng)計(jì)量: (3) 服從標(biāo)準(zhǔn)正態(tài)分布。π1和π2分別是兩種檢驗(yàn)方法的真實(shí)檢驗(yàn)功效,p1和p2分別是兩種檢驗(yàn)方法的模擬功效,N是模擬的總次數(shù),本文中N=50萬(wàn)。根據(jù)表3可以分別計(jì)算得到三種原假設(shè)H0:πρ-πDW≤0、H0:πt-πDW≤0 、H0:πρ-πt≤0下的檢驗(yàn)統(tǒng)計(jì)量Z值,見表4所示。 表3 DW檢驗(yàn)與ρ檢驗(yàn)、t檢驗(yàn)的檢驗(yàn)功效比較(=0.05) 表3 DW檢驗(yàn)與ρ檢驗(yàn)、t檢驗(yàn)的檢驗(yàn)功效比較(=0.05) 變量n3050ρ/方法0.20.40.60.80.20.40.60.8x1DW檢驗(yàn)0.24770.60840.87520.97170.37110.83420.98460.9992ρ檢驗(yàn)0.25210.61520.87730.97220.37470.83730.98490.9992t檢驗(yàn)0.25230.61460.87660.97180.37480.83720.98470.9992x2DW檢驗(yàn)0.24570.60180.86830.96860.37100.83280.98430.9992ρ檢驗(yàn)0.25080.61070.87240.97000.37440.83630.98480.9992t檢驗(yàn)0.25120.61060.87180.96970.37420.83600.98470.9992x3DW檢驗(yàn)0.24650.60560.87340.97050.36820.83050.98360.9990ρ檢驗(yàn)0.25200.61460.87740.97220.37420.83560.98450.9991t檢驗(yàn)0.25240.61440.87650.97160.37460.83560.98440.9990NDRDW檢驗(yàn)0.24740.61890.89300.98070.37600.84580.98860.9996ρ檢驗(yàn)0.25270.62760.89630.98150.38100.84990.98910.9996t檢驗(yàn)0.25320.62740.89560.98120.38060.84960.98900.9996 表4 三種原假設(shè)下的檢驗(yàn)統(tǒng)計(jì)量Z值 表4中原假設(shè)H0:πρ-πDW≤0、H0:πt-πDW≤0時(shí),*號(hào)表示顯著水平0.05下不拒絕H0。從表4可見,只在n=50且ρ=0.8時(shí),全部不拒絕原假設(shè);另外在n=50且ρ=0.6時(shí),有三個(gè)Z值不拒絕原假設(shè),在n=30且ρ=0.8時(shí),有一個(gè)Z值不拒絕原假設(shè)。其余情況均拒絕原假設(shè)。這表明,除檢驗(yàn)功效很接近1時(shí),差別不顯著外,ρ檢驗(yàn)和t檢驗(yàn)的功效顯著大于DW檢驗(yàn)。表4中原假設(shè)H0:πρ-πt≤0時(shí),Z值大部分為正,表明大多數(shù)情況下,ρ檢驗(yàn)的功效大于t檢驗(yàn),但幾乎全部不顯著,只有一個(gè)(含*號(hào)的)在顯著水平0.05下拒絕H0,可以認(rèn)為t檢驗(yàn)和ρ檢驗(yàn)的功效沒有顯著差別。因此,應(yīng)該用ρ檢驗(yàn)和t檢驗(yàn)作為DW檢驗(yàn)的替代方法。 為研究LM檢驗(yàn)臨界值的特點(diǎn),作者選取了多個(gè)實(shí)際的時(shí)間序列數(shù)據(jù),針對(duì)不同的樣本量進(jìn)行了模擬實(shí)驗(yàn)。大量的模擬計(jì)算表明,LM檢驗(yàn)的實(shí)際臨界值除了與序列相關(guān)的階數(shù)p有關(guān)外,在樣本量不很大時(shí),還與樣本量n、解釋變量取值、解釋變量的個(gè)數(shù)k有關(guān)。但LM檢驗(yàn)的實(shí)際臨界值與系數(shù)b0,b1,…,bk和標(biāo)準(zhǔn)差σ的具體取值無(wú)關(guān)。表5中給出序列相關(guān)階數(shù)p=2和4,樣本量為20、100、1 000,解釋變量取1個(gè)、2個(gè)及3個(gè)時(shí)較有代表性的部分模擬結(jié)果。表5中同時(shí)給出相對(duì)應(yīng)的50萬(wàn)個(gè)LM統(tǒng)計(jì)量的均值、標(biāo)準(zhǔn)差,及二階對(duì)應(yīng)的檢驗(yàn)H0:μ=2,H1:μ>2和四階對(duì)應(yīng)的檢驗(yàn)H0:μ=4,H1:μ>4(2(2)的均值為2,2(4)的均值為4)的檢驗(yàn)統(tǒng)計(jì)量Z的值。 從表5可以得出如下結(jié)論:第一,樣本量較小時(shí),LM統(tǒng)計(jì)量的分布與相應(yīng)的2分布有很大差異,因而LM檢驗(yàn)的臨界值與相應(yīng)的2臨界值有很大差距,當(dāng)解釋變量個(gè)數(shù)增加時(shí),多數(shù)情況下差距會(huì)更大,當(dāng)序列相關(guān)的階數(shù)p增加時(shí),差距也可能會(huì)更大,而且差距沒有固定的方向性。由均值和方差可見,例如,當(dāng)樣本量n=20,p=4,解釋變量為x3時(shí),LM統(tǒng)計(jì)量的均值比2(4)的均值大0.328,LM統(tǒng)計(jì)量的方差比2(4)的方差小1.703;而當(dāng)解釋變量為x3、x6時(shí),LM統(tǒng)計(jì)量的均值比2(4)的均值大1.027,LM統(tǒng)計(jì)量的方差比2(4)的方差小0.455。從臨界值看,例如當(dāng)樣本量n=20,解釋變量為x3,p=4時(shí),顯著水平為0.01的LM檢驗(yàn)臨界值比卡方臨界值小1.94;顯著水平為0.05的LM檢驗(yàn)臨界值比卡方臨界值小0.431。第二,即使當(dāng)樣本量達(dá)到很大的1 000時(shí),LM統(tǒng)計(jì)量的分布也很可能與相應(yīng)的2分布有顯著差異,兩種臨界值也可能有比較大的差距。由表5中Z值可知,當(dāng)n=1 000時(shí),在所模擬的各種情況下,都在顯著水平0.01下拒絕原假設(shè),即LM統(tǒng)計(jì)量的均值與相應(yīng)的2分布的均值有顯著差異,因而LM統(tǒng)計(jì)量的分布也很可能與相應(yīng)的2分布有顯著差異。從臨界值看,例如當(dāng)n=1 000時(shí),在解釋變量為x4,x5,x7,p=2時(shí),顯著水平為0.01的LM檢驗(yàn)臨界值比卡方臨界值大0.135;顯著水平為0.05的 LM檢驗(yàn)臨界值比卡方臨界值大0.102,也可以認(rèn)為是比較大的差距。 表5 各種情況下LM檢驗(yàn)?zāi)M臨界值與2臨界值的比較 表5 各種情況下LM檢驗(yàn)?zāi)M臨界值與2臨界值的比較 注:x4是從1993年1月8日起的上證綜合指數(shù)的周收盤價(jià),x5是1999年11月18日起的上證綜合指數(shù)的日收盤價(jià);x6是參考文獻(xiàn)[10]提供的數(shù)據(jù)文件TableF5-1中的變量REALDPI,1976年第1季度至2000年第4季度的100個(gè)數(shù)據(jù);x7是2011年7月6日至2017年9月5日上證指數(shù)日收盤價(jià),共1 500個(gè)數(shù)據(jù)。其他變量同前。 由于LM檢驗(yàn)不能直接確定自相關(guān)的階數(shù)。在實(shí)際運(yùn)用中,通常是從一階開始逐次向更高階檢驗(yàn),并對(duì)最高階滯后系數(shù)進(jìn)行t檢驗(yàn)以確定自相關(guān)的階數(shù)。但最高階滯后系數(shù)的t統(tǒng)計(jì)量并不服從標(biāo)準(zhǔn)t分布,用常規(guī)的t檢驗(yàn)可能會(huì)給出錯(cuò)誤的檢驗(yàn)結(jié)果。為研究LM檢驗(yàn)中最高階滯后回歸系數(shù)t統(tǒng)計(jì)量的分布及其臨界值的特點(diǎn),作者選取了與前面相同的多個(gè)實(shí)際的時(shí)間序列數(shù)據(jù),針對(duì)不同的樣本量,當(dāng)隨機(jī)干擾項(xiàng)存在一階、二階自相關(guān)時(shí)分別按二階、三階序列相關(guān)進(jìn)行LM檢驗(yàn)時(shí),最高階滯后回歸系數(shù)t統(tǒng)計(jì)量的分布及其臨界值。大量的模擬結(jié)果表明,最高階滯后回歸系數(shù)t統(tǒng)計(jì)量的實(shí)際臨界值在樣本量不很大時(shí),與樣本量n、解釋變量取值、解釋變量的個(gè)數(shù)k有關(guān),但與系數(shù)b0,b1,…,bk和標(biāo)準(zhǔn)差σ的具體取值無(wú)關(guān)。本文僅給出較有代表性的部分結(jié)果,見表6所示。表6中最后一列的Z值是檢驗(yàn)“H0:總體均值=0”的統(tǒng)計(jì)量值。表6中也給出了相應(yīng)自由度的標(biāo)準(zhǔn)t分布臨界值。 表6 實(shí)際一階自相關(guān)按二階LM檢驗(yàn)時(shí)滯后二階回歸系數(shù)t檢驗(yàn)?zāi)M臨界值(單側(cè)) 從表6及其他許多次隨機(jī)模擬實(shí)驗(yàn)結(jié)果可以得出如下結(jié)論:第一,從Z值可以看出,全部均非常顯著地拒絕原假設(shè),說明在各種情形下,其t統(tǒng)計(jì)量的均值都顯著小于0,它的分布不是關(guān)于0對(duì)稱的分布。所以當(dāng)用t統(tǒng)計(jì)量進(jìn)行檢驗(yàn)時(shí),應(yīng)該用單側(cè)檢驗(yàn)。第二,模擬標(biāo)準(zhǔn)差均小于t分布的標(biāo)準(zhǔn)差,所以導(dǎo)致左邊的臨界值與標(biāo)準(zhǔn)t分布臨界值差距較小,右邊的臨界值差距較大。第三,隨著樣本量增大,模擬臨界值與標(biāo)準(zhǔn)t分布臨界值差距越來(lái)越小,解釋變量個(gè)數(shù)越多,臨界值的差距普遍越大。所以,當(dāng)對(duì)LM檢驗(yàn)中最高階滯后回歸系數(shù)進(jìn)行t檢驗(yàn)時(shí)不能使用標(biāo)準(zhǔn)t分布臨界值,需要用模擬方法計(jì)算臨界值。 為了更好地說明以上檢驗(yàn)方法的應(yīng)用,本文以兩個(gè)案例分別說明一階序列相關(guān)檢驗(yàn)和高階序列相關(guān)的LM檢驗(yàn)的具體過程。 以Kt、Lt、Yt分別表示1978—2000年陜西省資本存量、就業(yè)人數(shù)和地區(qū)生產(chǎn)總值[10],建立C-D生產(chǎn)函數(shù)模型,得回歸結(jié)果如下: lnYt=-2.805+0.862lnKt+0.429lnLt+et, R2=0.998,DW=1.244 3 (4) 查DW臨界值表,可得顯著水平為0.05時(shí),dL=1.17,dU=1.54;顯著水平為0.01時(shí),dL=0.94,dU=1.29。兩種顯著性水平下均有dL 1.計(jì)算三種方法的模擬臨界值。先建立樣本量為23的工作文件,將lnKt、lnLt分別錄入至以x1和x2命名的序列中,因?yàn)镈W檢驗(yàn)和回歸檢驗(yàn)法的模擬臨界值與系數(shù)b0,b1,…,bk和標(biāo)準(zhǔn)差σ的具體取值無(wú)關(guān),所以本文本著簡(jiǎn)潔的原則,對(duì)式(4)中的系數(shù)估計(jì)值稍作調(diào)整,取b0=-3,b1=0.86,b2=0.43,σ=0.3,運(yùn)行模擬程序,可得DW檢驗(yàn)、ρ檢驗(yàn)和t檢驗(yàn)的模擬臨界值如表7所示,本例為正相關(guān)檢驗(yàn),所以只給出正相關(guān)檢驗(yàn)的臨界值。 表7 一階序列相關(guān)性檢驗(yàn)三種方法的正自相關(guān)模擬臨界值 2.三種模擬方法的檢驗(yàn)結(jié)果。由DW=1.244 3<1.279,可知在0.01的顯著水平下,DW檢驗(yàn)結(jié)果為模型存在正的一階自相關(guān)。將式(4)中的et關(guān)于et-1回歸,可得ρ和t統(tǒng)計(jì)量的值分別為0.372 8和1.841 9,分別大于ρ檢驗(yàn)和t檢驗(yàn)在0.01的顯著水平下的臨界值,即ρ檢驗(yàn)和t檢驗(yàn)結(jié)果為模型存在正的一階自相關(guān)。也即三種檢驗(yàn)的結(jié)果相同。 實(shí)際上,當(dāng)檢驗(yàn)結(jié)果為存在一階自相關(guān)時(shí),一般來(lái)說三種方法都會(huì)得出相同的結(jié)論。但本文的研究表明,ρ檢驗(yàn)和t檢驗(yàn)的檢驗(yàn)功效大于DW檢驗(yàn)的檢驗(yàn)功效,這意味著當(dāng)用ρ檢驗(yàn)和t檢驗(yàn)得出模型不存在一階自相關(guān)時(shí),檢驗(yàn)正確的可能性較大。 以xt、yt分別表示我國(guó)1978—2004年國(guó)內(nèi)生產(chǎn)總值和進(jìn)口總額[11],建立一元線性回歸模型,得回歸結(jié)果如下: yt=0.234xt-1966+et,R2=0.92, DW=0.389 (5) 由DW的值可知,該模型存在一階自相關(guān)。再對(duì)該模型進(jìn)行二階的LM檢驗(yàn),結(jié)果顯示,LM統(tǒng)計(jì)量的值為22.26,遠(yuǎn)遠(yuǎn)大于2(2)的臨界值,也必然大于LM檢驗(yàn)的模擬臨界值。殘差二階滯后項(xiàng)的t統(tǒng)計(jì)量值為-1.872,查表可知,顯著水平為0.05時(shí),標(biāo)準(zhǔn)t檢驗(yàn)的臨界值t0.05(23)=-1.714,因-1.872<-1.714,所以在0.05的顯著水平下,認(rèn)為模型存在二階序列相關(guān)性。 若用本文的方法計(jì)算t統(tǒng)計(jì)量的模擬臨界值進(jìn)行檢驗(yàn),則得出不同的結(jié)論。先建立樣本量為27的工作文件,將xt錄入以x命名的序列中,取b0=-2 000,b1=0.25,s=500,ρ1=0.9,p=1,運(yùn)行EViews程序,可得殘差二階滯后項(xiàng)的t統(tǒng)計(jì)量,顯著水平為0.01、0.05、0.1的左側(cè)模擬臨界值分別為-2.886、-2.151、-1.781。因?yàn)?1.872>-2.151,所以在5%的顯著水平下,不拒絕原假設(shè),即模型不存在二階自相關(guān)。 進(jìn)行計(jì)量經(jīng)濟(jì)分析時(shí)一般都要檢驗(yàn)?zāi)P褪欠翊嬖谧韵嚓P(guān)性,對(duì)于一階自相關(guān)性的檢驗(yàn),DW檢驗(yàn)是一種經(jīng)典方法。由于DW檢驗(yàn)有上、下兩個(gè)臨界值,使檢驗(yàn)存在兩個(gè)不確定區(qū)域。在實(shí)際應(yīng)用中,可以通過運(yùn)行EViews程序得到模擬臨界值。根據(jù)該模擬臨界值進(jìn)行檢驗(yàn),可以避免DW檢驗(yàn)存在不確定區(qū)域的缺陷。而且,當(dāng)用模擬方法確定臨界值時(shí),可用回歸檢驗(yàn)法,即將回歸殘差et對(duì)et-1作輔助回歸的系數(shù)估計(jì)量ρ及其t統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量,分別稱為ρ檢驗(yàn)和t檢驗(yàn)。根據(jù)模擬所得的臨界值,對(duì)DW檢驗(yàn)、ρ檢驗(yàn)和t檢驗(yàn)的檢驗(yàn)功效進(jìn)行模擬計(jì)算,結(jié)果表明,在本文所進(jìn)行的各種情況的模擬實(shí)驗(yàn)中,除檢驗(yàn)功效很接近1的情形外,ρ檢驗(yàn)和t檢驗(yàn)的功效均顯著大于DW檢驗(yàn)。因此,ρ檢驗(yàn)和t檢驗(yàn)都可以作為DW檢驗(yàn)的替代方法。對(duì)于高階序列相關(guān)性的檢驗(yàn),LM檢驗(yàn)是一種常用方法。在大樣本情況下,LM統(tǒng)計(jì)量近似服從卡方分布,但在大多數(shù)應(yīng)用中,樣本往往都不是很大。大量的模擬結(jié)果表明,當(dāng)樣本量不是很大時(shí),LM統(tǒng)計(jì)量的分布與卡方分布差距較大,其臨界值與卡方分布的臨界值差距較大,且解釋變量的取值對(duì)臨界值的影響較大,因此,在對(duì)高階序列相關(guān)進(jìn)行LM檢驗(yàn)時(shí),不能使用標(biāo)準(zhǔn)卡方臨界值,需要用模擬臨界值。而且LM檢驗(yàn)不能直接確定自相關(guān)的階數(shù),在實(shí)際運(yùn)用中,通常是從一階開始逐次向更高階檢驗(yàn),并對(duì)最高階滯后系數(shù)進(jìn)行t檢驗(yàn)以確定自相關(guān)的階數(shù)。大量的模擬計(jì)算結(jié)果表明,LM檢驗(yàn)中最高階滯后項(xiàng)回歸系數(shù)t統(tǒng)計(jì)量并不服從標(biāo)準(zhǔn)t分布,所以與標(biāo)準(zhǔn)t分布臨界值不同,且小樣本情況下差距更大,所以對(duì)最高階滯后系數(shù)進(jìn)行t檢驗(yàn)時(shí)也不能使用標(biāo)準(zhǔn)t分布臨界值,需要用模擬方法計(jì)算臨界值,以提高檢驗(yàn)的精確性。二、蒙特卡羅模擬的具體方法及EViews程序
三、DW檢驗(yàn)的模擬臨界值及其特點(diǎn)
四、回歸檢驗(yàn)法的臨界值及其特點(diǎn)
五、DW檢驗(yàn)與ρ檢驗(yàn)、t檢驗(yàn)的檢驗(yàn)功效比較
六、LM檢驗(yàn)的模擬臨界值及其特點(diǎn)
七、LM檢驗(yàn)中最高階滯后回歸系數(shù)t檢驗(yàn)臨界值及其特點(diǎn)
八、實(shí)證案例
(一)一階序列相關(guān)檢驗(yàn)的實(shí)證案例
(二)高階序列相關(guān)檢驗(yàn)的實(shí)證案例
九、研究結(jié)論
——基于收入貧困與多維貧困視角
——基于動(dòng)態(tài)面板數(shù)據(jù)模型的實(shí)證分析