馮井艷,張志強(qiáng),李華鵬
(山西大同大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,山西大同 037009)
變系數(shù)模型誤差方差的估計(jì)
馮井艷,張志強(qiáng),李華鵬
(山西大同大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,山西大同 037009)
變系數(shù)模型是由古典的線性模型發(fā)展而來(lái),它們可以很好地檢驗(yàn)函數(shù)系數(shù)隨著協(xié)變量的變化程度.本文用PLR提出了變系數(shù)模型的誤差方差的估計(jì),并研究了它的漸近正態(tài)性,進(jìn)一步用一個(gè)模擬例子來(lái)說(shuō)明估計(jì)的結(jié)果是有效的.
變系數(shù)模型 誤差方差 Profile最小二乘估計(jì) 漸近正態(tài)性
變系數(shù)模型產(chǎn)生于實(shí)際需要,它可以很好地探索動(dòng)態(tài)數(shù)據(jù)特征使得模型更好地?cái)M合數(shù)據(jù),因此廣泛應(yīng)用到各科學(xué)領(lǐng)域中,比如:經(jīng)濟(jì)學(xué),政治學(xué),醫(yī)藥學(xué),生態(tài)學(xué)等.
Hastie和Tibshirani[1]提出了變系數(shù)模型,其定義如下
到目前為止,對(duì)于具有不同光滑變量的變系數(shù)模型的研究還是比較少[4],其定義如下
其中,X=(X1,X2,…,XP)T∈RP,Z=(Z1,Z2,…,ZP)T∈RP為協(xié)變量,Y∈R為響應(yīng)變量,ε為隨機(jī)誤差,且ε與(X,Z)獨(dú)立,滿足E(ε)=0,Va(rε)=σ2.{aα(·)}pα=1是從R到R上的未知可測(cè)函數(shù).文獻(xiàn)[4]已經(jīng)估計(jì)了函數(shù)系數(shù){aα(·)}pα=1,類(lèi)似的討論還有文獻(xiàn)[5].但是,有時(shí)候,對(duì)誤差方差σ2=E(ε2)的估計(jì)的研究也是很有必要的,它可以有利于置信區(qū)間的建立,模型檢驗(yàn)及選擇等.在本文中,由最小二乘法得到了誤差方差σ2的估計(jì),并得到了它的漸近性質(zhì).
假定{Yi,Xi,Zi,i=1,…,n}是模型(2)的一個(gè)簡(jiǎn)單隨機(jī)樣本,{aα(·)}pα=1是Lipschitz連續(xù)的,那么a(αXα)在Xα的支撐內(nèi)的一點(diǎn)xα附近能夠用一個(gè)線性函數(shù)表示,即
關(guān)于{aα}pα=1和{bα}pα=1極小化,其中,Xiα,Ziα分別是X,Z的第i個(gè)觀測(cè)值的第α個(gè)分量;Kα,hα(·)=h-1αKα(·/ hα),Kα(·)是一個(gè)有緊支撐的關(guān)于0對(duì)稱的有界非負(fù)的Lipschitz連續(xù)的概率密度函數(shù);hα=hnα是一個(gè)正數(shù)數(shù)列,稱作窗寬.設(shè)(αx),α=1,…,p,是使(3)式達(dá)到極小化的前p個(gè)值.由最小二乘理論,可得
其中x=(x1,…,xp)T,eα,2p是第α個(gè)分量為1的單位向量,U是一個(gè)n×2p矩陣,它的i行是
在(4)式的基礎(chǔ)上,使用平均方法定義函數(shù)系數(shù)aα(Xα)的平均估計(jì)為
其中,a=(a1(X1),…,ap(Xp))T.我們可以定義誤差方差σ2的估計(jì)為
假設(shè):A1隨機(jī)變量X是有緊支撐的,它的密度函數(shù)f(·)是Lipschitz連續(xù)有界的,且大于某一正數(shù).
A3存在s,k分別有s>2滿足E‖z‖2s<∞,k<2-s-1滿足n2k-1h→∞.
A4{aα(·),α=1,…,p}有二階導(dǎo)數(shù).
A5核函數(shù)K(·)是有緊支撐的,關(guān)于0對(duì)稱的,有界非負(fù)的Lipschitz連續(xù)的概率密度函數(shù);窗寬h滿足nh8→0,nh2(/log n)2→0.
定理1若假設(shè) A1~A5成立,如果Eε41<∞,E‖X1‖4<∞,當(dāng)n→∞時(shí),則有
定理2若假設(shè) A1~A5成立,如果Eε41<∞,當(dāng)n→∞時(shí),則
推論1在定理1和定理2的條件下有
這一節(jié)我們應(yīng)用Monte Carlo模擬方法來(lái)說(shuō)明如上提出的估計(jì)方法的有效性.假定模擬例子為:
它的證明類(lèi)似于Zhou和You[6]的定理3.2的證明.則有I3=οp(1).定理1證畢.
表1 2的均值和標(biāo)準(zhǔn)誤差
表1 2的均值和標(biāo)準(zhǔn)誤差
■ σ)σ2 0.04 0.25 0.64 0.04 0.25 0.64 Mean 0.057 0.072 0.533 0.073 0.836 0.065 SD 0.009 0.038 0.085 0.006 0.029 0.075 ε~N(0,σ2) ε~U(- 3■ σ, 3
則,J3=οp(1),J4=οp(1),J5=οp(1).則只需證明 J2=οp(1),它的證明類(lèi)似于I2=οp(1)的證明,則定理2證畢.
[1]Hastie T,TibshiraniR.Varying-coefficientmodels[J].Royal Statistical Society,2003,55(4):757-796.
[2]Hoover D R,Rice JA,Wu C O,et al.Nonparametric smoothing estimates of time-varying coefficientmodels with longitudinal data[J].Biometrika,1997,85:809-822.
[3]Fan J,Zhang J.Functional linearmodels for longitudinal data[J].JRoy Statist Soc B,2000,62:303-322.
[4]Zhang Riquan,Li Guoying.Efficient estimation of functional-coefficient regression models with different smoothing variables[J].Acta Mathematica Scientia,2008,28B(1):989-997.
[5]張日權(quán),張志強(qiáng),馮井艷.一類(lèi)新的變系數(shù)模型的積分估計(jì)[J].山西大同大學(xué)學(xué)報(bào):自然科學(xué)版,2007,23(5):1-5.
[6]Zhou X,You J.Waveletestimation in varying coefficientpartially linear regressionmodels[J].Statist probab Lett,2004,68:91-104.
Error V ariance E stimation of V arying C oefficient M odels
FENG Jing-yan,ZHANG Zhi-qiang,LIHua-peng
(School ofMathematics and Computer Science,ShanxiDatong University,Datong Shanxi,037009)
Varying coefficientmodels are a useful extension of classical linear models.These models can easily examine how regression coefficient change over different groups characterized by certain covariates.In this article,the estimator of error variance by profile least-squares procedure is proposed and its asymptotic normality is studied.Furthermore,some simulations are conducted to examine the performance of our estimating approach and the results are substantial.
varying coefficientmodels;error variance;profile least-squares estimation;asymptotic normality
O212.7
A
〔編輯 高?!?/p>
1674-0874(2010)01-0005-03
2009-11-30
國(guó)家自然科學(xué)基金項(xiàng)目[10871072];山西省自然科學(xué)基金項(xiàng)目[2007011014]
馮井艷(1982-),女,山西太原人,碩士,助教,研究方向:數(shù)理統(tǒng)計(jì).