杜 穎, 李體政
(1-西安外國語大學經(jīng)濟金融學院,西安 7 10128;2-西安建筑科技大學理學院,西安 7 10055)
近年來在對經(jīng)濟等領(lǐng)域問題的研究分析過程中,發(fā)現(xiàn)如犯罪率、社會互動、經(jīng)濟增長、溢出效應、同伴效應、價格競爭、稅收競爭、房價、地價等重要的經(jīng)濟指標中普遍存在著空間相關(guān)性,而線性空間自回歸模型是描述空間相關(guān)性的最經(jīng)典和最流行的模型之一.有關(guān)模型的估計、統(tǒng)計推斷及應用等方面的問題得到了深入研究[1-3].一方面由于線性空間自回歸模型對回歸函數(shù)的假設過于嚴格,當回歸函數(shù)的設定不準確時就會產(chǎn)生很大的估計偏差,甚至可能會得到錯誤的結(jié)論.另一方面線性空間自回歸模型忽略了空間數(shù)據(jù)中可能存在的動態(tài)特征,即響應變量與協(xié)變量之間的關(guān)系會隨著某個變量(比如年齡、受教育程度、收入水平等)的變化而變化,因而不能有效處理具有動態(tài)特征的空間數(shù)據(jù).針對上述問題,李坤明和陳建寶[4]通過假定線性空間自回歸模型中的回歸系數(shù)是某個協(xié)變量的未知函數(shù),提出了變系數(shù)空間自回歸模型,其形式如下
變系數(shù)空間自回歸模型假定經(jīng)典線性空間自回歸模型中的常數(shù)回歸系數(shù)為其他解釋變量的未知函數(shù),增加了模型的靈活性和適應性,同時由于系數(shù)函數(shù)通常被看作是某個自變量的一元函數(shù)而有效避免了擬合中因自變量維數(shù)增加而造成的維數(shù)災難問題.更重要的是由于模型中的系數(shù)函數(shù)隨著某個協(xié)變量的變化而變化,從而使得該模型能夠有效挖掘空間數(shù)據(jù)中的動態(tài)特征.在實踐中,模型(1)中的一些系數(shù)函數(shù)可能是常數(shù),而其他系數(shù)與解釋變量u有關(guān).在這種情況下,模型(1)可以進一步簡化為空間計量經(jīng)濟學中的半變系數(shù)空間自回歸模型.從估計的角度看,半變系數(shù)空間自回歸模型不能簡單認為是變系數(shù)空間自回歸模型的特殊情況,因為將常系數(shù)視為變系數(shù)會導致估計效率的損失.對于半變系數(shù)空間自回歸模型,Wei等[5]提出了一種輪廓擬最大似然方法,該方法利用局部線性平滑法估計變系數(shù),利用擬最大似然法估計常系數(shù).Sun[6]也建立了一個基于半?yún)?shù)序列的最小二乘法估計方法分別估計變系數(shù)和常系數(shù).盡管半變系數(shù)空間自回歸模型的建立能更全面真實地描述響應變量與協(xié)變量之間的關(guān)系,但在實際應用中,我們首先應明確哪些回歸系數(shù)可以假定為常數(shù),僅憑對實際問題背景的了解做出符合實際的假設在很多情況下是困難的,甚至是不可能的,這就需要系統(tǒng)地檢驗變系數(shù)空間自回歸模型中哪些系數(shù)函數(shù)是常數(shù),解決這個問題將為半變系數(shù)空間自回歸模型的確定提供理論依據(jù).本文建立了一種確定變系數(shù)空間自回歸模型中部分系數(shù)函數(shù)是否為常數(shù)的Bootstrap檢驗方法,利用在備擇假設和零假設下關(guān)于系數(shù)擬合值的輪廓擬對數(shù)似然函數(shù)的差值構(gòu)造了檢驗統(tǒng)計量,并且通過模擬實驗考察了Bootstrap方法逼近其零分布的有效性以及統(tǒng)計量的檢驗功效.
由于估計方法是檢驗的基礎,在討論參數(shù)的統(tǒng)計推斷問題之前,我們先簡單回顧一下變系數(shù)空間自回歸模型的輪廓擬最大似然估計方法.
對于模型(2),文獻[4]給出一種兩步估計方法.
第1步 固定ρ,并整理模型(2),可得
其中Y(ρ)=T(ρ)Y.設β1(·),β2(·),···,βq(·)具有連續(xù)的二階導數(shù),則對任一給定的u0∈U,變系數(shù)模型的局部線性擬合為選擇β(u0),使
這里Yi(ρ)是Y(ρ)的第i個分量,Kh(·)=K(·/h)/h,其中K(·)為給定的核函數(shù),h為窗寬.
因此,求上述局部加權(quán)最小二乘問題的解可得到系數(shù)函數(shù)向量β(u)在u0處的局部線性估計
其中0q×q表示q×q零矩陣,
特別地,分別取u0=U1,U2,···,Un,對于給定的ρ,可得
其中
第2步 最大化下面的輪廓擬對數(shù)似然函數(shù)
其中M1=(In?S)T(In?S).進而將結(jié)果帶入式(7)中得到
如前所述,對于變系數(shù)空間自回歸模型,通常人們感興趣的問題為,是否其中的某些系數(shù)可視為常數(shù),因而有如下的假設
其中{i1,i2,···,ir}是{1,2,···,q}的一個非空子集,βi1,βi2,···,βir為未知常數(shù).
本小節(jié)中,針對上述假設,我們給出由在備擇假設和零假設下關(guān)于系數(shù)擬合值的輪廓擬對數(shù)似然函數(shù)的差值所構(gòu)造的似然比檢驗統(tǒng)計量.
在假設H1下,按照第2節(jié)介紹的方法擬合變系數(shù)空間自回歸模型,可得到輪廓擬對數(shù)似然函數(shù)在此估計下的值
在假設H0下,模型(1)變成如下的半變系數(shù)空間自回歸模型
其中
Ic={i1,i2,···,ir},Ic∪Iv={1,2,···,q},Ic∩Iv=φ.
下面通過簡單介紹文獻[5]的輪廓擬最大似然估計過程與結(jié)果來計算相應的半變系數(shù)空間自回歸模型的對數(shù)似然函數(shù)值.首先,固定βc和ρ,并將模型(14)寫成如下形式
根據(jù)文獻[7]的局部線性光滑方法可以得到模型(15)中的系數(shù)函數(shù)的估計值,因而,對于給定的βc和ρ,可以得到Mv的估計值
其中
然后,對于任一給定的ρ,找到βc和σ2,使得
的值最大.求解上述問題可得βc和σ2的輪廓擬最大似然估計值如下
其中
則假設(11)下的似然比檢驗統(tǒng)計量為
其中當T過分偏大時,應拒絕H0.設t為T的觀測值,則檢驗的p值為
上述統(tǒng)計量經(jīng)常被用來比較兩個相關(guān)模型之間的擬合優(yōu)度問題[5,8,9].如果不考慮空間相關(guān)性取ρ=0,則檢驗統(tǒng)計量即為經(jīng)典的廣義似然比檢驗[10],并被廣泛用于各種非參數(shù)和半?yún)?shù)回歸模型的推斷問題[11].Fan和Huang[12]指出用廣義似然比檢驗方法進行假設檢驗時,除了原假設中模型的參數(shù)估計過程不需要選擇窗寬的情形,其它情形在對零模型和備擇模型的估計過程中應該選擇相同的窗寬,否則窗寬的變動可能會使得零模型和備擇模型的對數(shù)似然函數(shù)之間無法比較,從而導致檢驗成效的損失.此外,F(xiàn)an和Jiang[11]以及Cai[13]提出,對于給定的數(shù)據(jù)集,由于原假設中的模型設定不確定是否正確,應該使用備擇假設中擬合的結(jié)果來生成Bootstrap取樣所需要的殘差值.基于這兩點考慮,本文在構(gòu)造檢驗統(tǒng)計量(21)時,使用變系數(shù)空間自回歸模型選出的窗寬對半變系數(shù)空間自回歸模型進行擬合.
在計算統(tǒng)計推斷的p值時,尋求檢驗統(tǒng)計量的零分布是首先要解決的重要問題.然而,由于模型中存在空間滯后項,使得檢驗統(tǒng)計量零分布很難精確得到.即使這個漸近分布能夠得到,F(xiàn)an和Jiang[11]指出在有限樣本容量下有可能會導致錯誤的推斷結(jié)果.眾所周知,Bootstrap方法是一種非常有效的模擬統(tǒng)計量分布的再抽樣方法,已被廣泛應用于各種統(tǒng)計推斷問題中[14,15],也是本文用以逼近檢驗統(tǒng)計量零分布的方法.
因而,關(guān)于p值的計算,由如下的Bootstrap方法實現(xiàn):
其中
其中#A表示集合A中元素的個數(shù).
1) 此方法可用于全局回歸關(guān)系平穩(wěn)性檢驗,可以檢驗所有的系數(shù)函數(shù)均為常數(shù)的假設,即驗證經(jīng)典的線性空間自回歸模型是否適用于所給的樣本數(shù)據(jù).此時原假設變?yōu)?/p>
H0:模型(1)中所有系數(shù)均為常數(shù),
對應的是經(jīng)典的線性空間自回歸模型
在此情形下,上述的零模型很容易由擬最大似然估計法來擬合.
2) 此檢驗方法可以進一步推廣.盡管我們所構(gòu)造的Bootstrap方法是用來確定變系數(shù)空間自回歸模型中的常系數(shù)的,它還可以用于檢驗系數(shù)函數(shù)更復雜的結(jié)構(gòu).其中一個自然推廣為檢驗一些系數(shù)是否為自變量u的一些已知函數(shù)的線性組合.對應的原假設為
這里對每個k∈{i1,i2,···,ir},θkl(l=1,2,···,Ik)為未知參數(shù),fkl(u)(l=1,2,···,Ik)為已知的相互獨立的,自變量u的線性函數(shù),則原假設中假定部分系數(shù)是線性的或者是u的廣義多項式函數(shù)均可以看作是(25)的特殊情形.在原假設下對應的模型為
若令
Zikl=fkl(Ui)Xik,l=1,2,···,Ik,k=i1,i2,···,ir,i=1,2,···,n,
則零模型可以進一步表示為
由于Zikl(l=1,2,···,Ik,k=i1,i2,···,ir,i=1,2,···,n)是已知的,故上述模型也是半變系數(shù)空間自回歸模型.因而,所構(gòu)造的檢驗方法可用于檢驗原假設(25).
檢測方法的另一個推廣是對一個半變系數(shù)空間自回歸模型與另一個半變系數(shù)空間自回歸模型之間的假設進行檢驗.在這種情況下,備擇模型是一個半變系數(shù)空間自回歸模型,原假設對應的模型可以有多種選擇.例如,為了評估備擇模型的常系數(shù)部分中的一些解釋變量是否確實影響了響應變量,可以相對應的設置一個假定這些解釋變量對應的系數(shù)均為零的原模型.
本節(jié)通過模擬試驗考察Bootstrap方法的有效性,在觀測值來自正態(tài)和非正態(tài)總體時分別考察檢驗方法逼近檢驗統(tǒng)計量零分布的精確性以及檢驗的功效.由于解釋變量存在共線性會影響系數(shù)估計的結(jié)果,我們也考察了解釋變量間共線性的存在對檢驗性能的影響.
在試驗中,在由l×l個方塊組成的格點處選取觀測值,這樣樣本容量為n=l2.空間權(quán)重矩陣W設為Queen矩陣.用以產(chǎn)生數(shù)據(jù)的變系數(shù)空間自回歸模型為
這里wij表示W(wǎng)的(i,j)分量,Xi1≡1,Ui為產(chǎn)生于均勻分布U(0,1)的隨機變量,(Xi2,Xi3,Xi4)T(i=1,2,···,n)為產(chǎn)生于N(0,Σ)的隨機變量(其中Σ的主對角線元素為1,其它元素取值為γ).為了全面考察解釋變量X2,X3以及X4之間的共線性程度對檢驗方法的檢驗效果帶來的影響,我們分別選取γ為常數(shù)0,0.5和0.8以及
四種情形.同時為了考察空間相關(guān)性對檢驗的影響,空間滯后相關(guān)系數(shù)ρ取值為?0.9,?0.6,?0.3,0,0.3,0.6以及0.9.系數(shù)函數(shù)β1(u),β2(u),β3(u)以及β4(u)的選取如下
這里c是一個常數(shù),通過對c的不同取值來評價檢驗的功效.注意,當c=0時,表示H0為真,而c?=0時,表示H1為真,且H1與H0之間的偏差會隨著c的絕對值的增加而增加.
為了考察誤差項對檢驗方法有效性的影響,我們同時給出了下面四種常見的誤差分布情況下的模擬結(jié)果:
模擬中采用Gaussian核函數(shù)
窗寬選擇根據(jù)文獻[5]采取ROT方法.
針對樣本數(shù)n=102和n=132,ρ的七種不同取值,γ的四種不同取值以及四種不同的誤差分布組合的每一種設定情形,重復試驗N=500次,且每一次試驗都將進行500次Bootstrap抽樣模擬來計算統(tǒng)計量的p值.
1) Bootstrap方法逼近零分布的有效性
令系數(shù)函數(shù)β3(u)和β4(u)中的c=0,此時H0為真且β3(u)=0.5,β4(u)=1,則在原假設條件和每一種設定情況下,我們計算500次重復下的p值分別小于給定的不同顯著性水平(即拒絕H0)的頻率,其中p值是基于500次Bootstrap模擬計算得到的.擬合的結(jié)果展示在表1中.
表1 在Bootstrap檢驗拒絕H 0的頻率
續(xù)表1 在Bootstrap檢驗拒絕H0的頻率
由表1的結(jié)果可知,當H0為真時在所有的試驗設定下,拒絕H0的頻率非常接近于給定的顯著性水平α的值.也就是說,即使在較小樣本n=100時,Bootstrap方法都可以精確地逼近統(tǒng)計量T的零分布.我們發(fā)現(xiàn)不管是在正態(tài)的誤差分布還是非正態(tài)的誤差分布下,模擬結(jié)果沒有明顯差別,這表明對統(tǒng)計量T的零分布的Bootstrap逼近的表現(xiàn)對誤差項的分布是穩(wěn)定.同樣,空間自相關(guān)參數(shù)ρ和解釋變量之間共線性也沒有表現(xiàn)出明顯影響拒絕H0的頻率的結(jié)果的情況.這些都說明了Bootstrap方法逼近零分布的有效性.
2) 統(tǒng)計量的檢驗功效
當c?=0,則假定所有系數(shù)都是變系數(shù)的備擇假設為真.在這種情形下,我們將β3(u)和β4(u)中的c分別取值為0.1,0.2和0.3.在顯著性水平α=0.05下,分別計算N=500次重復下拒絕H0的頻率,并以此模擬檢驗功效.擬合的結(jié)果展示在表2中.
由表2可以看出,隨著樣本容量的增加或者c的增加即備擇假設與原假設模型之間的偏差加大,檢驗功效是逐漸增大趨近于1的,這表示所用的檢驗方法具有良好的檢驗功效性質(zhì).由表2,我們發(fā)現(xiàn)檢驗方法的表現(xiàn)對于我們所考察的四種正態(tài)和非正態(tài)情形下的誤差分布,以及七個不同取值的空間滯后相關(guān)系數(shù)ρ,并沒有出現(xiàn)太大的差異,說明檢驗功效對于誤差項分布以及空間自相關(guān)程度的變化具有一定的穩(wěn)健性.然而,相對于相互獨立的解釋變量所得到的結(jié)果,共線性在一定程度上會減弱檢驗的功效.這主要是由于自變量間的共線性的增強會導致各個自變量的系數(shù)不太容易識別,降低了檢驗功效.但是,這個不利的影響會隨著n或者c的增加而逐漸改善.
表2 當α=0.05時的檢驗功效
續(xù)表2 當α=0.05時的檢驗功效
通過基于殘差的Bootstrap方法來逼近檢驗統(tǒng)計量的零分布,本文建立了確定變系數(shù)空間自回歸模型中的常系數(shù)項的檢驗方法.通過模擬試驗驗證了這種方法的準確性和可靠性.同時,本文還分別給出了在不同的誤差分布、空間相關(guān)性參數(shù)以及解釋變量的共線性程度這些情形下的模擬結(jié)果,進一步反映出該檢驗方法的穩(wěn)健性.
對比變系數(shù)模型,半變系數(shù)模型反映了回歸函數(shù)的更為精細的結(jié)構(gòu),從而為分析和了解自變量對因變量的影響提供了更詳細的信息.但從實際應用角度來看,分析者事先往往并不知道哪些系數(shù)是常數(shù),哪些是隨u而變化的.對于給定的數(shù)據(jù)集,我們可利用本文所給出的檢驗部分系數(shù)為常數(shù)的檢驗方法來識別變系數(shù)空間自回歸模型中的常值系數(shù),從而為建立半變系數(shù)空間自回歸模型提供依據(jù).