劉 彭,張 超,柳平增
(山東農(nóng)業(yè)大學a.應用統(tǒng)計與農(nóng)業(yè)信息化實驗室;b.大數(shù)據(jù)中心,山東 泰安 271000)
經(jīng)驗似然方法是Owen[1]在1988年提出的一種非參數(shù)統(tǒng)計推斷方法,這種方法具有很多優(yōu)點:可以完全根據(jù)數(shù)據(jù)來決定變量對應的置信區(qū)間,便于將多元數(shù)據(jù)進行組合,還可以合并偏度信息,使得刪失數(shù)據(jù)或缺失數(shù)據(jù)的樣本更易于處理,具有糾偏性、無需構造統(tǒng)計量等。因此,經(jīng)驗似然方法在半?yún)?shù)回歸模型的各個領域應用廣泛。
半?yún)?shù)回歸模型既含有參數(shù)分量,又含有非參數(shù)分量,結合了線性回歸模型和非參數(shù)回歸模型的優(yōu)點,因此不論是在理論研究上,還是在實際應用中都具有重要意義。經(jīng)驗似然方法已大量應用于半?yún)?shù)回歸模型中,本文考慮變系數(shù)部分線性模型:
對于模型(1)的經(jīng)驗似然推斷已有了大量的研究,如Hu[2]在2009年對變量有誤差的變系數(shù)部分線性模型進行了研究,在兩種不同的情況下,提出了參數(shù)部分經(jīng)驗對數(shù)似然比,構造了參數(shù)部分的置信區(qū)間,Huang[3]在2009年對模型(1)利用經(jīng)驗對數(shù)似然方法構造了非參數(shù)部分的置信區(qū)間,同時得到了估計的經(jīng)驗似然比服從標準卡方分布。本文針對變量有測量誤差的變系數(shù)部分線性模型,提出了非參數(shù)部分的經(jīng)驗似然,并用對數(shù)似然法構造了非參數(shù)部分的置信區(qū)間,證明了估計的經(jīng)驗似然比服從標準卡方分布:
其中Eη=0,Eη2=Ση,且η與( )X,Z,U,ε獨立。
為了定義經(jīng)驗似然估計量,先假設β已知,可以利用約束,其中f(u)為U的密度函數(shù),并有一個緊支撐S(f)。由此,引入如下輔助隨機向量:
其中h是帶寬,Kh(·)=h-1K(·h)且K(·)是核函數(shù)。
如果β已知,由于是獨立的且,則可以構造估計方程,此方程的解為α(u)的最小二乘估計,同樣可以通過經(jīng)驗似然方法得到,因此,下面定義剖面經(jīng)驗對數(shù)似然比函數(shù):
若α(u)為真參數(shù),則 ?n(α(u) )服從自由度為p的標準χ2分布,但是這里β未知,要對 ?n(α(u) )進行分析,比較可行的方法就是用估計量β?來代替β,下面就來估計β:
對l=1,…,p用kl個基函數(shù)的線性組合來逼近變系數(shù)函數(shù)為kl×1基函數(shù)向量,為kl×1未知函數(shù)向量,此方法的優(yōu)點在于:kl可任意增大,從而存在的線性組合很好地逼近任何光滑函數(shù)αl(U),故其逼近的均方誤差可任意小。
定義K×1階矩陣逼近,此時,式(2)等價于:
令:
又式(2)可以寫成矩陣形式:
下面用修正的最小二乘法估計:
即得到估計量:
其中λ滿足:
若α(u)為真參數(shù),則分布,要得到這個結論,下面先給出一個定義和一些條件:
定義1:?是一個函數(shù)類,如果?中任一函數(shù)g(x,z)滿足:
上述定義的詳細介紹參考文獻[4]。
條件1:u的密度函數(shù)f(u)有緊支撐S(f),對所有l(wèi),k=1,…,p,γl,k(u),f(u)在u0處有連續(xù)一階導,對每個r=1,…,p,αr(u)在u0處的二階導數(shù)為連續(xù)有界函數(shù);
條件2:核函數(shù)K(u)為有界對稱密度函數(shù),其導數(shù)有界,且滿足
條件 3:存在τ>1,使得
條件6:①對每個K,存在非奇異陣B,使得的最小特征值在K上一致有界大于 0;②存在滿足和K=Kn的序列ζ0(K),使得,其中S是(x1,u1)的支集。
定理1:在條件1至條件7下,且滿足h→0,nh3→∞,nh8→0, 若α(u0)為 真 參 數(shù) ,那 么
根據(jù)定理1,α(u0)的置信區(qū)間可以由式(10)構造,對任意的的置信區(qū)間。
為了構造α(u)的分片置信區(qū)間,這里借助部分剖面經(jīng)驗似然方法來定義αr(u)的經(jīng)驗對數(shù)似然比函數(shù):考慮估計方程,這里er是第r個元素為1,其余元素為0的p維向量,α?(·)為的最小值,這里假設Q(u)可逆,對任意的h,聯(lián)合式(11)得:
其中,α?(u)等價于最小二乘估計,具體參考文獻[5]。
對數(shù)似然比函數(shù)為:
從定理2可將αr(u0)的置信區(qū)間定義為:
根據(jù)大數(shù)定律有:
下面逐項證明:
其中:
顯然結論得證。
引理2:在定理1的條件下,如果α(u0)是真參數(shù),則有
這里僅證A4,A5,其他的類似可以得到。
對任意的δ>0,
故A4=op(nh)12,A5=op(nh)12,即結論成立。
引理3:在定理1的條件下,如果α(u0)是真參數(shù),那么:
引理4:在定理1的條件下,如果α(u0)是真參數(shù),那么:
引理5:在定理1的條件下,如果α(u0)是真參數(shù),則,其中λ在式(12)中定義。
引理3、4、5的證明參考文獻[2],這里不再詳述。
定理1的證明:結合引理,對式(11)利用Taylor展開式得:
根據(jù)式(12)可以得到:
由上面三個式子定理1易證。
定理2的證明參考文獻[6]。
本文介紹了協(xié)變量有誤差的半?yún)?shù)變系數(shù)部分線性模型的似然推斷,提出了經(jīng)驗似然在半?yún)?shù)誤差模型中的應用。對于刪失數(shù)據(jù)、缺失數(shù)據(jù)在廣義線性模型、線型混合模型中的經(jīng)驗似然推斷有所欠缺,還有待進一步的研究。