周衍琪 劉靜頤 王越
一、前言
回歸模型是統(tǒng)計(jì)學(xué)中發(fā)展較早、理論豐富深厚且應(yīng)用性強(qiáng)的統(tǒng)計(jì)模型。由于實(shí)際解決問題的需要,回歸模型一直是處于不斷的發(fā)展、進(jìn)步之中,由參數(shù)回歸模型到非參數(shù)回歸模型,上個(gè)世紀(jì)后期又興起了半?yún)?shù)回歸模型。
參數(shù)回歸模型有形式Y(jié)i=f(Xi;β)+εi,i=1,2,...,n,f為已知函數(shù),β為未知的有限維參數(shù),εi為均值為0的隨機(jī)誤差。該模型最重要的是f是已知函數(shù),但實(shí)際應(yīng)用中,不能給出一個(gè)已知的函數(shù),所以參數(shù)模型在實(shí)際中有模型設(shè)定的誤差。為了減少模型偏差,、提出非參數(shù)回歸模型:設(shè)響應(yīng)變量Y是隨機(jī)變量,協(xié)變量X是隨機(jī)變量或非隨機(jī)變量。給定隨機(jī)樣本xi,yi,1≤i≤n,可建立回歸模型:yi=m(xi)+εi,i=1,2,…n,其中m(.)是未知的回歸函數(shù),εi為隨機(jī)誤差。但當(dāng)協(xié)變量X的維數(shù)增加時(shí),多元非參數(shù)回歸估計(jì)的精度下降很快,為了克服這種問題,提出了降維模型--半?yún)?shù)回歸模型。
接下來本文主要討論的是半?yún)?shù)模型中一類很重要的模型--部分線性模型,通過查閱大量文獻(xiàn)資料,研究了各個(gè)學(xué)者在部分線性模型中所做的工作,接下來本文就以文獻(xiàn)綜述的形式一一闡述,首先介紹該模型是怎么提出的,然后將從統(tǒng)計(jì)推斷和大樣本性質(zhì)這兩個(gè)部分闡述各統(tǒng)計(jì)學(xué)家都做了哪些工作。
二、模型的提出
Engle等(1986)在研究電力與氣候環(huán)境之間的關(guān)系時(shí)給出了部分線性模型,模型為:
Yi=βT0Xi+g(Ui)+εi,i=1,2,…,n,
其中β0是p維參數(shù)向量,g(.)是未知函數(shù)。模型由兩部分構(gòu)成:第一部分βT0Xi表示Yi與Xi是線性關(guān)系;第二部分g(Ui)表明Yi與Ui是未知的非線性關(guān)系。如果使用非參數(shù)回歸來處理,將會(huì)失去Yi與Xi線性關(guān)系的信息,從而導(dǎo)致估計(jì)值存在較大的偏差,如果用參數(shù)回歸來擬合,一般不能有好的估計(jì)。
三、部分線性模型的統(tǒng)計(jì)推斷及大樣本性質(zhì)的文獻(xiàn)綜述
(1)國(guó)外研究狀況。Robinson(1988)在非參數(shù)分量g(.)取N-W核估計(jì)時(shí),構(gòu)建參數(shù)部分β0的加權(quán)最小二乘估計(jì)和非參數(shù)g(.)的估計(jì)g∧(.),在一些必要的條件下,分析了的漸近正態(tài)性和g∧(.)的收斂速度。同年Speckman(1988)采用參數(shù)化形式Wγ逼近非參數(shù)分量g(.),然后用最小二乘法構(gòu)造β0的估計(jì),同樣研究了該估計(jì)量的漸近性質(zhì)。還有一些作者使用光滑樣條方法構(gòu)造了β0和g(.)的估計(jì)量。Heckman(1986)在Xi和Ui獨(dú)立的情況下研究了β0的懲罰最小二乘估計(jì)的相合性和漸近正態(tài)性。 Cuzick(1992)利用漸近估計(jì)方程來估計(jì)參數(shù),且證明估計(jì)量的n相合性。Hamilton和Truong(1997)采用局部線性回歸給出了各未知量估計(jì),證明漸近正態(tài)性。Mammen和van de Geer(1997)應(yīng)用經(jīng)驗(yàn)過程理論給出了參數(shù)的懲罰擬似然,并推導(dǎo)漸近性質(zhì)。Xue等(2004)提出了sieve極大似然估計(jì),證明了參數(shù)估計(jì)的強(qiáng)相合性和漸近正態(tài)性,得到了非參數(shù)估計(jì)最優(yōu)收斂速度。Ma等(2006)研究了異方差的部分線性回歸模型,構(gòu)造了未知量相合估計(jì),證明了參數(shù)的估計(jì)是半?yún)?shù)有效的且具有漸近正態(tài)性。Dabo-Niang和Guillas(2010)研究了具有自回歸誤差的部分線性模型,構(gòu)造了未知量估計(jì)量,并證明估計(jì)量的相合性和漸近正態(tài)性。
Severini和Staniswalis(1994)與H?rdle等(1998)研究了模型的推廣形式:廣義部分線性模型。估計(jì)β0和g(.),Severini和Staniswalis(1994)引進(jìn)了擬似然估計(jì)方法,該方法有類似于似然函數(shù)的性質(zhì),但僅需指定Y的二階矩而不是完全分布。Boente等(2006)對(duì)廣義部分線性模型構(gòu)造了穩(wěn)健估計(jì)量,并證明了參數(shù)估計(jì)的n相合性和漸近正態(tài)性。
(2)國(guó)內(nèi)研究狀況。洪圣巖(1991)用最近鄰和最小二乘方法定義了估計(jì)量,證明了參數(shù)估計(jì)的漸近正態(tài)性,非參數(shù)估計(jì)的最優(yōu)收斂速度。Shi(1992)用分段多項(xiàng)式逼近得到了β0 和g(.)的穩(wěn)健M估計(jì)和g∧(.),證明了漸近正態(tài)性,得到了和g∧(.)的弱收斂速度。洪圣巖和趙忠柏(1993)用核和最小二乘定義了估計(jì)量,證明了參數(shù)分量的漸近正態(tài)性,并得到了非參數(shù)的最優(yōu)收斂速度。柴根象和徐克軍(1999)與錢偉民和柴根象(1999)將小波方法引入,建立了回歸未知量小波估計(jì),證明了好的大樣本性質(zhì),并討論了誤差方差的小波估計(jì)及其漸近性質(zhì)。
以上為國(guó)內(nèi)外的專家學(xué)者在隨機(jī)點(diǎn)列(設(shè)計(jì)點(diǎn)列Xi,Ui,1≤i≤n是隨機(jī)的)下對(duì)部分線性模型主要的研究成果,其他的很多研究工作大家可以參考相關(guān)文獻(xiàn)。
四、總結(jié)
本文按時(shí)間順序羅列了對(duì)部分線性模型在設(shè)計(jì)點(diǎn)列為隨機(jī)的時(shí)候的相關(guān)文獻(xiàn),給出了各文獻(xiàn)研究的主要內(nèi)容,主要是對(duì)模型的參數(shù)部分和非參數(shù)部分運(yùn)用各種方法進(jìn)行估計(jì),并驗(yàn)證了這些估計(jì)的一些大樣本性質(zhì)。(作者單位:云南大學(xué))
參考文獻(xiàn):
[1] Robinson P M. 1998. Root-n-consistent semiparametric regression. Econometrika,56:931~954
[2] Speckman P.1988. Kernel smoothing in partial linear models. Journal of the Royal Statistical Society, Series B, 50:413~436
[3] Heckman N.1986. Spline smoothing in a partly linear model. Journal of the Royal Statistical Society,Series B, 48:244~248
[4] Cuzick J.1992. Semiparametric additive regression. Journal of the Royal Statistical Society,Series B,54(3):831~843
[5] Hamilton S A,Truong Y K.1997. Local linear estimation in party linear models. Journal of Multivariate Analysis,60:1~19
[6] Mammen E,van de Geer S. 1997. Penalized quasi-likelihood estimation in partial linear models. The Annals of Statisticals,25:1014~1035
[7] Xue H Q, Lam K F, Li G Y.2004. Sieve maximum likelihood estimator for semiparametric regression models with current status data. Journal of the American Statistical Association,99(466):346~356
[8] Ma Y Y,Chiou J M,Wang N.2006. Efficient semiparametric estimator for heteroscedastic partially linear models. Biometrika,93(1):75~84
[9] Dabo-Niang S, Guillas S.2010. Functional semiparametric partially linear model with autoregressive errors. Journal of Multivariate Analysis,101(2):307~315
[10] Severini T A,Staniswalis J G. 1994. Quasilikelihood estimation in semiparametric models. Journal of the American Statistical Association,89:501~511
[11] Boente G, He X M,Zhou J H.2006. Robust estimates in generalized partially linear models. The Annals of Statisticals,34(6):2856~2878
[12] Shi P D.1992. Mstimation for partly Linear Models. Ph D Thesis, Institute of Systems Science, Chinese Academy of Sciences,Beijing,P R China
[13] 洪圣巖.1991.一類半?yún)?shù)回歸模型的估計(jì)理論.中國(guó)科學(xué),A輯,21(21):1258~1271
[14] 洪圣巖,趙忠柏.1993.偏線性模型的核~-最小二乘估計(jì)法的漸近性質(zhì).數(shù)學(xué)年刊,14A(6):717~731
[15] 柴根象,徐克軍.1999.半?yún)?shù)回歸的線性小波光滑.應(yīng)用概率統(tǒng)計(jì),15(1):97~105
[16] 錢偉民,柴根象.1999.半?yún)?shù)回歸模型小波估計(jì)的強(qiáng)逼近.中國(guó)科學(xué),29(3):233~240