丁飛鵬
(江西財經(jīng)大學(xué) 統(tǒng)計學(xué)院,江西南昌 330013;江西師范大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,江西南昌 330022)
眾多領(lǐng)域的數(shù)據(jù)呈現(xiàn)空間效應(yīng)(即空間相依性和空間異質(zhì)性)問題,這與經(jīng)典計量理論的基礎(chǔ)假設(shè)相違背,導(dǎo)致經(jīng)典計量分析方法難以解釋這種空間效應(yīng),為此,計量經(jīng)濟學(xué)家建立了空間計量模型.該模型自提出后,引起了學(xué)術(shù)界的高度重視.文[1-2]詳細(xì)地描述了空間計量模型的理論方法及應(yīng)用.在各種空間計量模型中,空間自回歸模型(SAR)受到了極大關(guān)注,大量針對該模型的估計方法相繼建立,例如,糾正普通最小二乘法(參見文[3]),矩估計法(參見文[4]),廣義矩估計法(參見文[5-7]),準(zhǔn)極大似然估計法(參見文[8-10]).這些模型的特點是通常假設(shè)回歸函數(shù)為線性或已知的非線性形式.然而在實際應(yīng)用中,變量間的空間計量經(jīng)濟關(guān)系往往存在高度非線性,而且事先也很難預(yù)知回歸函數(shù)的形式,因此采用這些模型進行實證分析,容易出現(xiàn)模型誤設(shè)現(xiàn)象,影響結(jié)論分析的準(zhǔn)確性.
非參數(shù)計量方法的出現(xiàn),為解決模型誤設(shè)問題提供了新的途徑.該方法降低了對回歸函數(shù)形式的要求,能夠提供更好的擬合效果,在計量理論和實證分析中得到了廣泛研究和應(yīng)用.目前,一些學(xué)者已將非參數(shù)計量技術(shù)引入空間計量模型中,建立了大量非參數(shù)空間計量模型及其估計方法.文[11]將邊際積分法和局部線性法結(jié)合,研究了空間數(shù)據(jù)的非參數(shù)回歸模型,并建立了漸近理論;與文[11]不同,文[12]在誤差項存在空間相關(guān)性,條件異質(zhì)性及非同分布的條件下,研究了空間數(shù)據(jù)的非參數(shù)回歸模型,在給定一些充分條件下,推導(dǎo)了模型的大樣本性質(zhì);文[13]為部分線性空間自回歸模型建立了截面極大似然估計法;隨后,文[14-15]將截面極大似然估計法分別應(yīng)用于非參數(shù)空間動態(tài)模型和部分線性單指標(biāo)空間自回歸模型的研究中;然而,截面極大似然估計法無法獲得解析表達式,因此在實際中不易實施,為此,文[16]建議采用廣義矩法估計半?yún)?shù)空間自回歸模型;根據(jù)文[16]的建議,文[17-18]采用廣義矩估計法分別研究了部分線性單指標(biāo)空間自回歸模型和部分線性可加空間自回歸模型;文[19]則考慮了隨機場(random fields)下的非參數(shù)空間自回歸模型,推導(dǎo)了估計量的大樣本性質(zhì);文[20]為部分線性單指標(biāo)空間自回歸模型建立貝葉斯估計法.
最近,面板數(shù)據(jù)計量模型發(fā)展迅速.其主要原因是面板數(shù)據(jù)具有純截面數(shù)據(jù)和時間序列數(shù)據(jù)無可比擬的優(yōu)點:一是面板數(shù)據(jù)具有更多的自由度,可讓研究人員估計更復(fù)雜的模型;二是面板數(shù)據(jù)可以消除異質(zhì)性問題,估計結(jié)果更加有效;三是可減少共線性等問題的出現(xiàn).基于此,一些學(xué)者將非參數(shù)空間計量模型與面板數(shù)據(jù)計量模型結(jié)合,建立了非參數(shù)空間面板模型.當(dāng)前關(guān)于非參數(shù)空間面板模型的文獻還較為有限,文[21]結(jié)合樣條函數(shù)及半?yún)?shù)最小二乘法,研究了誤差項具有空間異質(zhì)和空間相關(guān)情形下的半?yún)?shù)空間面板固定效應(yīng)模型;文[22]則考慮了半?yún)?shù)空間動態(tài)面板固定效應(yīng)模型,為模型建立了兩階段最小二乘法,并證明了估計量的大樣本性質(zhì);文[23]采用空間異質(zhì)懲罰算法(algorithm based on spatial anisotropic penalties)研究了一種半?yún)?shù)空間自回歸面板模型,該模型的特點是時空趨勢具有非參數(shù)形式,時間序列方向存在自相關(guān)性.
與通常的非參數(shù)模型類似,非參數(shù)空間面板模型也存在“維數(shù)災(zāi)難”現(xiàn)象,即隨著非參數(shù)部分協(xié)變量維數(shù)的增加,估計精度會不斷降低.部分學(xué)者建立了具有降維功能的半?yún)?shù)空間面板模型以克服“維數(shù)災(zāi)難”現(xiàn)象,其中包括單指標(biāo)空間自回歸面板模型(見文[24]).與文[24]不同,本文將研究個體內(nèi)存在相關(guān)性下部分線性單指標(biāo)空間自回歸固定效應(yīng)面板模型,這主要基于以下幾點考慮:一是所述模型具有顯著的降維功能;二是所述模型不僅保留了非參數(shù)空間面板模型的靈活性,還通過加入線性部分,增加了模型的解釋力,更具實用性;三是實際中的面板數(shù)據(jù)在個體內(nèi)通常存在相關(guān)性,若忽略該相關(guān)性,將減少估計量的有效性,甚至影響估計量的一致性;四是固定效應(yīng)模型應(yīng)用范圍更廣.
本文其余部分安排如下:§2介紹相關(guān)的模型及其估計方法;§3說明在實際操作中的一些問題;§4給出了模型估計量的大樣本性質(zhì),并提供了相關(guān)證明;§5采用Monte Carlo模擬和實際數(shù)據(jù)分析評價了模型及估計方法在有限樣本下的表現(xiàn);最后對全文進行了總結(jié).
假設(shè)個體數(shù)N較大,時期數(shù)T固定.所述模型的數(shù)學(xué)形式為
其中γl為樣條函數(shù)系數(shù),l=1,···,q.將式(4)代入式(3)中,有
記B(·)=[B1(·),···,Bq(·)]′,γ=(γ1,···,γq)′.則式(5)可重寫為
式(6)的矩陣形式為
式(7)的均衡表示形式為
其中S(ρ)=[(IN-ρW)?IT]-1.令uW=S(ρ)(Xβ+B(Zθ(ψ))γ),?=(ρ,β′,ψ′,γ′)′.經(jīng)過簡單計算可得
其中?=IN ?V,V為ei=(ei,1,···,ei,T)′的協(xié)方差矩陣(本文假設(shè)誤差項滿足同分布假設(shè)),i=1,···,N.式(9)中,α為干擾參數(shù),采用差分方法雖然可以消除該個體效應(yīng),但將導(dǎo)致部分信息損失,影響連接函數(shù)的估計.根據(jù)識別條件,本文采用LSDV法消除個體效應(yīng),即給定參數(shù)向量?的值,α的值為
將式(10)代入式(9),于是有
其中LD=INT-D(D′D)-1D′.在式(11)中,協(xié)方差矩陣V是未知的,若用其估計值代替,將損失大量的自由度,損害估計量的有效性.按照文[25]的建議,采用已知對稱基矩陣的線性組合近似V-1,
其中M1,···,Ms為已知對稱矩陣,a1,···,as為未知常數(shù).式(12)說明
將式(13)代入式(11)中有
為避免估計常數(shù)a1,···,as,構(gòu)建擴展計分函數(shù)
顯然E(gN(?))=0,參數(shù)向量的估計值?可由矩條件gN(?)=0獲得.事實上gN(?)的方程個數(shù)為s(d+p+q) 大于未知參數(shù)的個數(shù),因此矩估計法不可行,需訴諸于廣義矩估計法,為此令
由于QN(?)具有非線性形式,因此無法獲得參數(shù)向量?的解析表達式,需要運用迭代算法.本文中,采用Newton-Raphson迭代算法.
設(shè)?(0)為任意參數(shù)向量值,在?(0)的鄰域內(nèi)利用Talor展式可知
第一步 利用兩階段最小二乘法獲得參數(shù)估計的初始值?(0);
第二步 給定第k步的迭代值?(k),則第k+1步的迭代值為
第三步 不斷重復(fù)第二步,直到滿足給定收斂準(zhǔn)則為止.
對于常見的一些特殊相關(guān)結(jié)構(gòu),基矩陣M1,M2,···,Ms的選擇并不困難.例如對于一階自相關(guān)的結(jié)構(gòu),可以選擇M1=IT,IT為T階單位矩陣,M2為次對角線元素為1,其它為0的矩陣,M3為在(1,1)和(T,T)的位置為1,其它為0的矩陣,在實際應(yīng)用中,M3通常省略;對于等相關(guān)結(jié)構(gòu),通常M1的選擇與一階自相關(guān)結(jié)構(gòu)相同,的對角元素為0,非對角元素為1的矩陣;若相關(guān)結(jié)構(gòu)不確定,則可同時使用矩陣M2和,或應(yīng)用自適用估計法(具體參見文[26]).基矩陣選取方法的詳細(xì)討論可參考文[25].
由于計算的復(fù)雜性,在模型估計時,無法做到同時確定樣條函數(shù)的階,節(jié)點的位置和節(jié)點的數(shù)量.一般的做法是,固定樣條函數(shù)的階,同時用等間距的方式選擇節(jié)點,剩余的工作就只需選擇合適的節(jié)點數(shù).目前已有大量的節(jié)點數(shù)選擇方法:近似選擇法,AIC準(zhǔn)則,BIC準(zhǔn)則及廣義交叉確證法(詳細(xì)可參見文[27]).本文采用BIC準(zhǔn)則選擇節(jié)點數(shù),其統(tǒng)計量為
實際操作中,通常采用網(wǎng)格搜素法尋找最優(yōu)的節(jié)點數(shù).
A7.(i) 空間加權(quán)矩陣W的元素為已知常數(shù),對任意空間相關(guān)系數(shù)ρ ∈(-1,1)有IN-ρW是非奇異的;(ii)W和(IN-ρW)-1的行與列元素的絕對值和均是一致有界的.
這是都是常用的假設(shè)條件,實際應(yīng)用中很容易驗證.假設(shè)條件A1是為了大概率保證處于分母的變量不為零;假設(shè)條件A2主要用于說明非參數(shù)估計量的收斂速度;假設(shè)條件A3表明誤差項滿足中心極限定理的條件;假設(shè)條件A4主要是保證可以選擇到合適的樣條函數(shù),條件→0是定理證明的需要,在此條件下,函數(shù)的經(jīng)驗內(nèi)積將足夠接近其理論內(nèi)積;假設(shè)條件A5為保證加權(quán)矩陣CN的特征值有界;假設(shè)條件A6 確保均值項有限,同時說明用非參數(shù)技術(shù)估計X的條件期望時的收斂速度,該條件可減弱為E(X|Z,Zθ)滿足一階連續(xù)可導(dǎo),見文[28];假設(shè)條件A7是空間相關(guān)系數(shù)及空間加權(quán)矩陣的基本假設(shè).
定理4.1在假設(shè)條件(A1)–(A7)下,連接函數(shù)的估計量實現(xiàn)了最優(yōu)收斂速度,即
引理4.1在假設(shè)條件A2下,存在參數(shù)向量γ0和某個常數(shù)C,使得
證證明的細(xì)節(jié)請參見文[29].
再次由a的任意性可知‖ξ2k‖=Op((Nh)-1/2).定理結(jié)論得證.
引理4.3在假設(shè)條件A1-A7下,的特征值有界,進一步,對任意? ∈ΘN(C)有
引理4.4在假設(shè)條件A1-A7下,有
證要證明式(28)中的結(jié)論成立,只要證明結(jié)論對每個分量成立即可.根據(jù)各表達式的定義可知,對k=1,···,s有
引理4.5在假設(shè)條件A1-A7下,存在常數(shù)C=C(ε),使得當(dāng)N →∞時,
同理由假設(shè)條件A5,存在常數(shù)C2有
定理4.1的證明由引理4.4及4.5立即可得
式(37)說明定理4.1的結(jié)論成立.
定理4.2的證明首先類似于文[30],由引理4.4,不難證明
另一方面,根據(jù)Newton-Raphson算法,Talor展示及定理4.1的結(jié)論可知
式(39)表明
進一步由引理4.3知,存在存在系數(shù)矩陣Λ,使得
綜上可得‖J2‖=Op(h2r)=op(N-1/2).
綜合上述結(jié)論立即可得定理4.2的結(jié)論成立.
表1為參數(shù)估計量在自相關(guān)結(jié)構(gòu)下的表現(xiàn).從表1可知,無論空間加權(quán)矩陣是Rook矩陣還是Queen矩陣,在ρ=0.3和ρ=0.8下,MAD值均隨著個體數(shù)N的增大而下降,且數(shù)值大小逐漸接近于0,表明參數(shù)估計值與真實值的接近程度隨個體數(shù)N的增加而增加,均符合大樣本性質(zhì)的表現(xiàn);同樣S.E.值也隨著個體數(shù)N的增大而減少,且數(shù)值趨于0,表明估計方法的穩(wěn)健性隨N的增大而增大.進一步,Rook矩陣下的數(shù)值大小與Queen矩陣非常接近,說明估計方法的表現(xiàn)與空間加權(quán)矩陣的選擇無關(guān).表2為等相關(guān)結(jié)構(gòu)下參數(shù)估計量的表現(xiàn).與表1類似,可得出以下三個結(jié)論:一是估計方法的表現(xiàn)與空間加權(quán)矩陣的選擇無關(guān);二是參數(shù)估計量的表現(xiàn)符合大樣本性質(zhì);三是隨著N的增大,估計方法的表現(xiàn)越來越穩(wěn)健.表3為獨立結(jié)構(gòu)下參數(shù)估計量的表現(xiàn),與表1和表2的情況類似,參數(shù)估計量的表現(xiàn)符合大樣本性質(zhì),估計方法的表現(xiàn)隨N的增加而更加穩(wěn)健,且與空間加權(quán)矩陣的選擇無關(guān).綜上所述,所述方法在參數(shù)估計方面具有非常優(yōu)越的表現(xiàn),且不會因空間相關(guān)程度及空間加權(quán)矩陣的改變而改變.
表1 自相關(guān)結(jié)構(gòu)下參數(shù)估計量的表現(xiàn)
表2 等相關(guān)結(jié)構(gòu)下參數(shù)估計量的表現(xiàn)
表3 獨立結(jié)構(gòu)下參數(shù)估計量的表現(xiàn)
表4為非參數(shù)估計量的表現(xiàn).從表4的數(shù)值可以看到,在Rook矩陣和Queen矩陣下MAISE的數(shù)值相近,說明非參數(shù)估計量的表現(xiàn)與空間加權(quán)矩陣的選擇無關(guān).其次,在所有相關(guān)結(jié)構(gòu)下,隨著個體數(shù)N的增加,MAISE的數(shù)值逐漸減小,表明連接函數(shù)的估計值與真實的連接函數(shù)隨著N的增加而不斷接近,符合大樣本性質(zhì)的表現(xiàn).最后,當(dāng)ρ=0.3時MAISE的數(shù)值要小于ρ=0.8的數(shù)值,說明較強的空間相關(guān)性對非參數(shù)估計量具有一定的影響,但這種影響會隨著N的增加而不斷減少.
表4 非參數(shù)估計量的表現(xiàn)
例2 與兩階段最小二乘法(TLS)的比較為說明忽略個體內(nèi)的相關(guān)性對估計量造成的影響,本文將所述方法與TSL法進行比較.數(shù)據(jù)產(chǎn)生過程與例1相同,個體數(shù)N=100,時期數(shù)T=5,zi,t的所有分量均獨立來自于參數(shù)為0.2和0.5的beta分布,θ=(2/3,1/3,2/3)′,其他變量的設(shè)置與例1相同,模擬次數(shù)為500,模擬結(jié)果分別呈現(xiàn)在表5至表8中.
表5 估計方法在自相關(guān)結(jié)構(gòu)下參數(shù)估計量的比較
表5為本文所述方法與TLS在自相關(guān)結(jié)構(gòu)下參數(shù)估計量表現(xiàn)的比較,從表中的數(shù)值可以看到,在所有的空間加權(quán)矩陣下,對所有的空間相關(guān)系數(shù)ρ的值,本文所述方法下所有參數(shù)估計量的MAD值和S.E.值要遠(yuǎn)遠(yuǎn)小于TSL的相應(yīng)數(shù)值,表明本文所述方法在參數(shù)估計方面的表現(xiàn)要大大優(yōu)于TSL,且與空間加權(quán)矩陣的選擇和空間相關(guān)系數(shù)的大小無關(guān);表6為本文所述方法與TSL在等相關(guān)結(jié)構(gòu)下參數(shù)估計量表現(xiàn)的比較,與表5的結(jié)果類似,在等相關(guān)結(jié)構(gòu)下,本文所述方法的表現(xiàn)仍遠(yuǎn)遠(yuǎn)優(yōu)于TSL;表7為本文所述方法與TSL在獨立結(jié)構(gòu)下參數(shù)估計量表現(xiàn)的比較;類似與自相關(guān)和等相關(guān)的情形,本文所述方法仍然要優(yōu)于TSL;表8為各種情形下本文所述方法與TSL在非參數(shù)估計量表現(xiàn)的比較,各數(shù)值均清晰地表明,在所有情形下,本文所述方法的MAISE值要遠(yuǎn)遠(yuǎn)小于TSL,本文所述方法的表現(xiàn)要更優(yōu)越.綜上所述,當(dāng)忽略個體內(nèi)的相關(guān)性時,參數(shù)估計量的偏度和標(biāo)準(zhǔn)誤會偏大,連接函數(shù)的估計量與真實函數(shù)的偏度增大,導(dǎo)致估計量的精確度降低,損害了統(tǒng)計的推斷力.
表6 估計方法在等相關(guān)結(jié)構(gòu)下參數(shù)估計量的比較
表7 估計方法在獨立結(jié)構(gòu)下參數(shù)估計量的比較
表8 非參數(shù)估計量表現(xiàn)的比較
本節(jié)中,將本文所述模型和方法應(yīng)用于分析美國各州生產(chǎn)力的影響因素.數(shù)據(jù)為美國48個州1970年至1986年的生產(chǎn)力數(shù)據(jù),變量的選取和度量與Baltagi和Pinnoi(1995)中所使用的變量一致,因變量為各州總產(chǎn)值(用Y表示),影響因素有勞動輸入(用L表示),私人資本(用PK表示),公共資本(用CK表示),失業(yè)率(用UNE表示),所有變量均為原始變量的對數(shù)值(除失業(yè)率外).由于主要關(guān)注本文所述模型和方法的應(yīng)用,因此忽略數(shù)據(jù)測度的誤差.為避免“虛假回歸”,將針對差分后的變量進行分析.通過分析各變量差分與?Y之間的散點圖(限于篇幅,散點圖沒有在本文中報告)發(fā)現(xiàn),?L和?UNE與變量?Y具有非常明顯的線性關(guān)系,其他變量差分與?Y具有不同程度的非線性關(guān)系,鑒于此建立模型
其中wi,j為空間加權(quán)矩陣W中的相應(yīng)元素,空間加權(quán)矩陣是根據(jù)美國48個州的地理位置,按照Queen矩陣方式計算而得;(ρ,β1,β2,θ1,θ2)′為未知參數(shù)向量;αi為第i個州的固定效應(yīng);ei,t為隨機誤差項;i=1,···,48;t=1,···,16.運用本文所述方法對模型進行估計,估計結(jié)果呈現(xiàn)在表9和圖1中.
圖1 連接函數(shù)估計圖
表9 各參數(shù)估計結(jié)果
根據(jù)表9中本文所述方法的估計結(jié)果,空間相關(guān)系數(shù)ρ=0.217,說明各州之間生產(chǎn)力的增長存在正向空間溢出效應(yīng),意味著周邊地區(qū)的經(jīng)濟增長會帶動本地區(qū)的經(jīng)濟增長;β1=0.782<1表明勞動輸入對生產(chǎn)力具有正向影響作用,但生產(chǎn)力對勞動輸入缺乏彈性,即大量的勞動輸入并不能引起生產(chǎn)力的快速增長;β2=-0.256>-1表示失業(yè)率增長會阻礙生產(chǎn)力發(fā)展,但生產(chǎn)力對失業(yè)率同樣缺乏彈性,即失業(yè)率的上升不會導(dǎo)致生產(chǎn)力的大幅下降.
圖1為連接函數(shù)的估計圖,圖中虛線分別表示連接函數(shù)估計量的95%置信上下限(連接函數(shù)估計量置信上下限的獲得方法為:首先獲得樣條系數(shù)估計量的置信上下限,然后類似于連接函數(shù)的估計,進而得到置信上下限的估計量).觀察圖1中縱坐標(biāo)和橫坐標(biāo)數(shù)值發(fā)現(xiàn),大多數(shù)情況下,資本增長率變化5個單位,生產(chǎn)力增長率變化不足一個單位,說明生產(chǎn)力對資本是缺乏彈性的;進一步用連接函數(shù)值除以單指標(biāo)值作為生產(chǎn)力對資本彈性的度量,通過計算發(fā)現(xiàn),當(dāng)資本在0值附近時,生產(chǎn)力對資本的彈性非常大,接近于40,在其他地方的彈性均小于1,表明大部分情形下,生產(chǎn)力對資本缺乏彈性,只有在資本相當(dāng)匱乏時,生產(chǎn)力對資本才富有彈性.此外,由θ1和θ2大于零表明,私人資本增長率和公共資本增長率對生產(chǎn)力增長率的影響均與單指標(biāo)變量的影響方向一致,因而可推知,在大部分情形下,生產(chǎn)力對私人資本和公共資本是缺乏彈性的.
本文研究了固定效應(yīng)下個體內(nèi)存在相關(guān)性的部分線性單指標(biāo)空間自回歸面板模型.該模型不僅存在空間內(nèi)生性,個體內(nèi)還具有某種相關(guān)性,而且受到固定效應(yīng)的干擾.為有效地估計模型,首先采用B樣條函數(shù)近似連接函數(shù),采用LSDV法消除個體效應(yīng),再根據(jù)模型的特點,利用均衡模型的均值項與原模型的誤差項不相關(guān)的事實,結(jié)合二次推斷函數(shù)法,為模型構(gòu)建了新的估計方法.該方法不僅消除了個體效應(yīng)的干擾和空間內(nèi)生性,還可以捕捉個體內(nèi)的相關(guān)性,提高了估計量的有效性.進一步,在一些正則條件下,推導(dǎo)了連接函數(shù)估計量的收斂速度和參數(shù)估計量的漸近正態(tài)性.同時,采用Monte Carlo模擬評估了估計方法在有限樣本下的表現(xiàn),結(jié)果發(fā)現(xiàn),本文所述方法在有限樣本下的表現(xiàn)符合大數(shù)定律,且明顯優(yōu)于忽略個體內(nèi)相關(guān)性下的估計方法.最后,利用本文所述方法分析了美國各州生產(chǎn)力增長率的影響因素,結(jié)論表明,勞動輸入增長率對提高生產(chǎn)力增長率具有顯著的正向線性影響,失業(yè)率增長量會阻礙生產(chǎn)力增長率的提高,私人資本增長率和公共資本增長率對生產(chǎn)力增長率具有不同程度的非線性影響.