武大勇,周永衛(wèi)
(鄭州航空工業(yè)管理學院 數理系,鄭州 450015)
假設我們要估計G(x)=E[Y|X=x],這里Y為被解釋變量,X為 p×1維解釋變量,在本文中,我們對于回歸函數G(x)利用下面形式的變系數模型做近似:
這里 β∈?p為一方向參數系數 g(˙)=(g0(?),g1(?),…,gp(?))τ為未知函數,我們將選擇方向參數β和系數函數gj(?)使得E[G(x)-g(x)]2達到最小。我們所給出的這種自適應變系數模型與一般的變系數模型相比具有如下有點:一旦β給定,對于未知函數g(?)的估計我們很容易利用一維局部線性核估計的方法得到,而且,系數函數g(?)的圖像也很容易畫出,這或許對分析函數g(?)是如何變化的非常有用。另外,當模型中的βτx固定時,模型(1)包含更多關于解釋變量xj的形式,如xj的平方項、xj的交叉項等,因此此模型對于捕捉作為解釋變量的xj的非線性結構更具有實用性和靈活性。
在本文中,我們將把上面的自適應變系數模型中推廣到面板數據中,以得到自適應變系數面板數據模型。對于變系數面板數據數據模型中的非參數或半參數估計,已有一些結果,如Cai and Li(2005),Cai and Xiong(2006),Cai and Li(2007)中考慮了變系數動態(tài)面板數據的非參數估計,Fan,Yao和Cai(2003)還考慮了一種自適應的時間序列模型的非參數估計,但是對自適應變系數的面板數據模型利用半參數的方法還沒有相關的文獻。
本文將介紹一種有效的后適應算法來估計未知函數g(?),來選擇的核估計通過Monte Carlo試驗,對于上面所給出的估計從兩個具體的例子做出驗證。
在本文中我們考慮一種半參數的面板數據模型(自適應變系數面板數據模型),我們假設模型有如下形式:
這里 Xi,t為 p×1維的,且第一個元素為1,系數函數g(˙)是?p空間里的光滑函數;β為 p×1維的未知參數,且誤差項假設為獨立同分布(i.i.d)的。在本文中我們主要的結果都是建立在Xi,t是純外生變量的基礎上,即 E(εi,t|Xi,t)=0 。
則模型(1)可被改寫為:
在模型(1)中包含許多我們所熟悉的模型,如若β=1,即
上模型一般稱為變系數面板數據模型,對模型(3),Cai和Li(2005),Cai和Xiong(2006),Cai和Li(2007)得到了函數系數g(Xi,t)的非參數廣義矩估計和估計的漸進正態(tài)性。并且,從后面我們的分析知自適應變系數面板數據模型(1)比一般的變系數面板數據模型(3)所要估計的參數要少得多,避免了估計參數過多而引起的參數災難問題,因此應用起來也更方便、有效。
此模型就是一般的面板數據回歸模型,對于模型(4),Arellano(2003),Baltagi(2005),Hsiao(2003)得到了參數的廣義矩估計,后來,Byeong,Robin和Leopold(2007)利用一類特殊的矩條件,得到了此模型參數的半參數估計,并對參數估計的性質從理論和數值試驗上得到了驗證。
因此,模型(1)所包含的形式顯然要比模型(3)和(4)要多,這樣我們就可以通過選擇與模型獨立的參數β的方位來減少估計的偏,同時,對于參數β在我們進行并不會為我們的參數估計帶來額外的困難。實際上,參數β通常只估計出它的數值解,而非參數函數g(˙)在參數β已知的條件下很容易被估計出。
對于模型(1),這里將介紹一種剖面最小二乘估計(Profile Least-Squares Estimation)的方法,對于模型中出現的參數β和變系數函數g(˙)給出估計。這種方法的基本思想是對于給定的參數 β ,首先找到非參數項 g(˙)的估計,然后用估計出的參數函數再來估計未知的參數項β,即在模型(2)中,用替換掉 g(˙)后可得合成參數模型
(1)若給出 β ,非參數項 g(˙)的估計
對于給定的系數β=β0已知,我們假設為二階連續(xù)可微的函數,則對于給定的和其鄰域內的利用Taylor公式展開有z),這里則估計未知函數g(˙)可轉化最小化下面的式子
這里w( ?)為定義在一個有界支撐上的有界權函數,它用來控制邊界效應。函數為定義在緊支撐上的一對稱的概率密度函數。h為窗寬,用它來控制估計的精確性。
(2)若給出 g(˙)的估計 g(˙),估計參數 β
若令實際上R(β)就是未知函數g(˙)的估計的殘差,它的大小從一個方面說明了我們所給出估計的好壞。若已知g(˙)的估計g(˙),估計參數β的過程實際上相當于關于β最小化R(β)的過程。但是,由于非參數項 g(˙)的估計 g(˙;β)依賴參數β,因此關于β直接最小化(7)式是非常困難的,下面利用Newton-Raphson迭代的方法得到參數β的數值解。
由(7)式可得
上述參數和非參數估計的好壞依賴于核估計中窗寬的選擇,因此如何選取最優(yōu)的窗寬使我們的估計更有效是必須討論解決的問題。根據Craven and Wahba(1979)提供的選擇最優(yōu)窗寬的廣義交叉核實方法(the generalized cross-validation method),對 于 給 給 定 的 β ,令顯然
這 里 H(h)是 一 個 n×n矩 陣 ,顯 然 其 與是獨立的,根據廣義交叉核實方法(GCV),選擇h最小化
最小化上式可得最優(yōu)窗寬為
這里n=NT,其中的系數c0,c1,c2可根據Ruppert(1997)提供的方法獲得。為了計算tr(H(h)),對于給定的1≤l≤N;1≤s≤T ,有:
這里Ο為 p×1維元素全為0的列向量,令
(2)對于可供選擇的窗寬的值hk,k=1,…,q,重復下面的步驟(a)和(b),直到兩次迭代中(7)式 R(β)的差別足夠?。?/p>
(a)對于給定的 β ,按照(6)式來估計 gj( ?);
(b)對于給定的gj( ?),按照上面所給的方法來估計β;
(3)對于k=1,…,q,用β的估計值來計算GCV(hk),令c1和c2為最小化下式所得
考慮如下面的面板數據模型
模擬結果如表1。
表1為模型(10)的模擬,在這里核函數取的為Gauss核函數,即
表1
由上例的模擬結果可以看出,對于一個未知函數g(?),估計的殘差是比較小的;同時,殘差對于樣本容量的選取有一定的依賴,當樣本容量有顯著增大的時候,殘差也隨之變小。
[1]Arellano,M.Panel Data Econometrics[M].Oxford:Oxford University Press,2003.
[2]Baltagi,B.Econometric Analysis of Panel Data(2ndEdition)[M].New York:John Wiley and Sons,2005.
[3]Byeong,U.P,Robin,C.S.,Leopold,S.Semiparametric Efficient Estimation of Dynamic Panel Data Models[J].Journal of Econometrics,2007,136.
[4]Cai,Z,H.Xiong.Efficient Estimation of Partially Varying Coefficient Instrumental Models[C].Department of Mathematics and Statistics,University of North Carolina at Charlotte,2006.
[5]Cai,Z.,Q.Li.Nonparametric Estimation of Varying Coefficient Dynamic Panel Data Models[C].Department of Economics,Taxes A&M University,2005.
[6]Cai,Z.,Q.Li.Nonparametric Estimation of Varying Coefficient Dynamic Panel Data Models[R].The Wang Yanan Institute for Studies in Economics,Xiamen University in China,2007.
[7]Horowitz,J.L.,M.Markatou.Semi para metric Estimation of Regression Models for Panel Data[J].The Review of Economic Studies,1996,63.
[8]Hsiao,C.Analysis of Panel Data(2ndEdition)[M].Cambridge:University Press,2003.
[9]Kniesner,T.J.,Q.Li.Nonlinearity in Dynamic Adjustment:Semipara metric Estimation of Panel Labor Supply[J].Empirical Econometrics,2002,27.
[10]Fan,J.,Yao,Q.,Cai,Z.Adaptive Varying-coefficient Linear Models[J].Journal of the Royal Statistical Socient,Series B,2003,(65).
[11]Ruppert,D.Empirical-bias Bandwidths for Local Polynomial Nonparametric Regression and Density Estimation[J].Journal of the American Statistical Assiociation,1997,(92).