余新宏,朱文君,鄭劍平
(合肥經(jīng)濟學院基礎(chǔ)課教學部,安徽 合肥 230011)
考慮線性模型
(1)
其中,Y是n×1的觀測隨機向量,X是n×p列滿秩的設(shè)計陣,β是p×1未知參數(shù)向量,ε是n×1的未知隨機誤差向量,n≥p.
在線性模型的缺落值及數(shù)據(jù)挖掘、動植物研究、經(jīng)濟計量等問題中,一般不能完全觀測到Y(jié),而只能觀測到Y(jié)的一部分分量或Y的某些線性組合,這種情況下獲取的變量Y的數(shù)據(jù)稱為聚集數(shù)據(jù).通常情況下,可觀測到向量Z=TY,其中T為已知n階方陣.對此,文獻[1]提出了Peter & Karsten估計:
(2)
(3)
并提出了聚集數(shù)據(jù)線性模型參數(shù)的廣義嶺估計[4]:
(4)
(5)
嶺型估計過于重視估計參數(shù)的穩(wěn)定性而輕視了其無偏性影響,常使得估計參數(shù)的均值與實際值產(chǎn)生較大的偏離.Liu型估計的優(yōu)點在于通過引入新的參數(shù),使得估計既能保證估計參數(shù)的穩(wěn)定性,又能保證估計參數(shù)的近似無偏性,因而這方面的研究與應(yīng)用為一些學者所熱捧.周永正等[6]提出了聚集數(shù)據(jù)線性模型廣義聚集雙參數(shù)估計:
β*(K,D)=(X′T′TX+I)-1(X′T′TX+QDQ′)(X′T′TX+QKQ′)-1X′T′TY.
(6)
(7)
(8)
上述效率分別稱為推廣歐氏模之比意義下的效率和加權(quán)歐氏模之比意義下的效率.
注1本文中λi(A)表示方陣A的第i個順序特征值.
定義1在線性模型(1)下,未知參數(shù)向量β的估計
(9)
稱為聚集數(shù)據(jù)線性模型參數(shù)β的廣義聚集雙參數(shù)改進估計.其中,D=diag(d1,d2,…,dp),K=diag(k1,k2,…,kp),0
注3在定義1中,當d1=d2=…=dp=h時,得
注4在定義1中,當d1=d2=…=dp=1,k1=k2=…=kp=0時,得
引理1設(shè)U為n×p階矩陣.Δ=diag(δ1,δ2,…,δp),δ1≥δ2≥…≥δp>0,且U′U=Δ,則對于任意n階矩陣A>0,有:
證明見文獻[7].
引理2設(shè)A、B為n階實對稱矩陣,且B>0,則有
λn(B)λi(A2)≤λi(ABA)≤λ1(B)λi(A2)(i=1,2,…,n).
(10)
證明見文獻[8].
引理3設(shè)A為P階正定陣,則有p1-q(trA)q≤trAq≤(trA)q(q≥1).
證明見文獻[8].
證明
(X′T′TX+hI)-1(X′T′TX+I)(X′T′TX+I)-1(X′T′TX+QDQ′)(X′T′TX+
A(X′T′TX+I)-1(X′T′TX+QDQ′)(X′T′TX+QKQ′)-1(X′T′TX)β=
AB(X′T′TX)β.
為了討論此類有偏估計的優(yōu)良性,首先需要進入下列定義.
證明設(shè)q1,q2,…,qp為X′T′TX對應(yīng)于特征值λ1,λ2,…,λp的標準正交特征向量,記
Q=(q1,q2,…,qp), Λ=diag(λ1,λ2,…,λp),
(ABX′T′TX-I)ββ′(ABX′T′TX-I)′ ;
σ2ABX′T′TXB′A′+(ABX′T′TX-I)ββ′(ABX′T′TX-I)′ ;
MSE(β*(K,D))=tr(Cov(β*(K,D)))+‖E(β*(K,D))-β‖2=
σ2BX′T′TXB′+(BX′T′TX-I)ββ′(BX′T′TX-I)′.
因此,
σ2ABX′T′TXB′A′+(ABX′T′TX-I)ββ′(ABX′T′TX-I)′-
σ2BX′T′TXB′+(BX′T′TX-I)ββ′(BX′T′TX-I)′=
其中,b1=(ABX′T′TX-I)ββ′(ABX′T′TX-I)′,b2=(BX′T′TX-I)ββ′(BX′T′TX-I)′.因為
定理2設(shè)n階方陣T的秩為Rank(T)=p,X′X的特征值為δ1≥…≥δp>0,TT′的特征值為h1≥…≥hp>0,X′T′TX的特征值為λ1≥…≥λp>0,k1≥…≥kp≥0,0 (11) 設(shè)B=(X′X)-1,由引理3知 又設(shè) V=TX(X′T′TX+QKQ′)-1(X′T′TX+QDQ′)(X′T′TX+hI)-1Q, 其中Q為正交矩陣,且Q′X′T′TXQ=Λ. V′V=Q′(X′T′TX+hI)-1(X′T′TX+QDQ′)(X′T′TX+QKQ′)-1X′T′TX· (X′T′TX+QKQ′)-1(X′T′TX+QDQ′)(X′T′TX+hI)-1Q= Q′(X′T′TX+hI)-1QQ(X′T′TX+QDQ′)QQ′(X′T′TX+QKQ′)-1QQ′· (X′T′TX)QQ′(X′T′TX+QKQ′)-1QQ′(X′T′TX+QDQ′)QQ′(X′T′TX+hI)-1Q= (Λ+hI)-1(Λ+D)(Λ+K)-1Λ(Λ+K)-1(Λ+D)(Λ+hI)-1= diag[(λ1+h)-2·(λ1+d1)2·(λ1+k1)-2λ1,…,(λi+h)-2·(λi+di)2·(λi+ki)-2λi,…, (λp+h)-2·(λp+dp)2·(λp+kp)-2λp]. 又由引理1、引理2可得 tr(C)=tr(Q′CQ)=tr[Q′(X′T′TX+hI)-1(X′T′TX+QDQ′)(X′T′TX+QKQ′)-1X′T′TT′TX· (X′T′TX+QKQ′)-1(X′T′TX+QDQ′)(X′T′TX+hI)-1Q]≥ 從而 故有 定理3設(shè)n階方陣T的秩為Rank(T)=p,X′X的對應(yīng)特征值為δ1≥…≥δp>0,TT′的對應(yīng)特征值為h1≥…≥hp>0,X′T′TX的對應(yīng)特征值為λ1≥…≥λp>0,H的對應(yīng)特征值為q1≥…≥qp>0,k1≥…≥kp≥0,0 (12) 又因 σ2[(X′T′TX+hI)-1(X′T′TX+QDQ′)(X′T′TX+QKQ′)-1X′T′TT′TX· (X′T′TX+QKQ′)-1(X′T′TX+QDQ′)(X′T′TX+hI)-1+σ-2εε′], σ4tr{[(X′T′TX+hI)-1(X′T′TX+QDQ′)(X′T′TX+QKQ′)-1X′T′TT′TX· (X′T′TX+QKQ′)-1(X′T′TX+QDQ′)(X′T′TX+hI)-1+σ-2εε′]}· H·[(X′T′TX+hI)-1(X′T′TX+QDQ′)(X′T′TX+QKQ′)-1X′T′TT′TX· (X′T′TX+QKQ′)-1(X′T′TX+QDQ′)(X′T′TX+hI)-1+σ-2εε′]. 設(shè)B=(X′X)-1, C=(X′T′TX+hI)-1(X′T′TX+QDQ′)(X′T′TX+QKQ′)-1X′T′TT′TX· (X′T′TX+QKQ′)-1(X′T′TX+QDQ′)(X′T′TX+hI)-1, 設(shè)P為正交矩陣,使P·diag(q1,q2,…,qp)·P′=H. tr(BHB)=tr(B2H)=tr[B2·P·diag(q1,q2,…,qp)·P′]= 其中,b11,…,bii,…,bpp為P′B2P的主對角線元素. tr[(C+σ-2εε′)H(C+σ-2εε′)]=tr[(C+σ-2εε′)2H]≥ tr[C2P·diag(q1,q2,…,qp)·P′]= 其中,c11,…,cii,…,cpp為P′C2P的主對角線元素. 由定理2的證明可知 故 即 定理4設(shè)n階方陣T的秩為Rank(T)=p,X′T′TX的特征值為λ1≥…≥λp>0,TT′的特征值為h1≥…≥hp>0,k1≥…≥kp≥0,0≤dp≤…≤d1<1,則 (13) 證明類似于定理2的證明,略. 定理5設(shè)n階方陣T的秩為Rank(T)=p,X′T′TX的特征值為λ1≥…≥λp>0,TT′的特征值為h1≥…≥hp>0,H的特征值為q1≥…≥qp>0,k1≥…≥kp≥0,0≤dp≤…≤d1<1,則 (14) 證明類似于定理3的證明,略.4 廣義聚集雙參數(shù)改進估計代替Peter & Karsten估計對的估計效率
5 結(jié)論