程鵬鵬,曹連英
(東北林業(yè)大學,哈爾濱150040)
線性模型是一類統(tǒng)計模型的總稱,它包括線性回歸模型、方差分析模型、協(xié)方差分析模型和線性混合效應模型等.線性模型在許多生物、醫(yī)學、經(jīng)濟、管理、地質、氣象、農(nóng)業(yè)、工業(yè)、工程技術等領域都普遍使用.因此線性模型成為現(xiàn)代統(tǒng)計學中應用最為廣泛的模型之一[1].
經(jīng)典最小二乘方法假設自變量的觀測是精確的,僅僅因變量存在測量誤差.事實上,這種假設是不現(xiàn)實的,自變量在取樣、人為、儀器誤差的影響下同樣存在誤差擾動.因此需要含誤差變量的線性模型,我們把自變量帶有誤差的模型簡稱EIV模型.近幾年EIV模型以及關于模型的深入探索Fekri and Ruiz - Gazen[2]和 He Xuming and Liang Hua[3]等都對這一模型進行了進一步的研究.
本文基于矩陣擾動分析理論,給出線性模型在擾動下仍然可估的充分條件,并進一步討論了線性模型數(shù)據(jù)擾動對模型參數(shù)的影響,給出參數(shù)的擾動估計式.
設線性模型
其中y為n×1觀測向量,X為n×p的設計矩陣,β為p×1未知參數(shù)向量,e為隨機誤差,σ2為誤差方差 σ2>0.
若 rank(Xn×p)=p,則 X'X 可逆,這時=X'X-1X'y,且有),即是β的無偏估計,這時我們稱=X'X-1X'y為β的最小二乘估計.
若 rank(Xn×p)< p,則不是β的無偏估計,表明β沒有線性無偏估計,此時我們稱 β 是不可估的[4].
引理1[5]A是Hermite陣并且是滿秩矩陣,其特征值為λ1≥λ2≥…≥λn;A+E為Hermite陣其特征值為1≥2≥ … ≥n,如果 η = ‖A-1/2EA-1/2‖2≤1,其中 A1/2為 A 的 Hermite平方根,那么有
實驗中得到的數(shù)據(jù)與實際數(shù)據(jù)之間會有誤差,這就會出現(xiàn)數(shù)據(jù)的擾動問題,進而會影響線性模型的參數(shù)估計結果,定理1給出了設計矩陣擾動范圍的大小,從而解決了擾動后設計矩陣的虧秩問題.
定理1:設X為n×p的實的設計矩陣,且rank(Xn×p)=p;記 A=X'X,A 的特征值為 λ1≥λ2≥…≥λp,設計矩陣 X的擾動為 ΔX,A+ΔA=(X+ΔX)'(X+ΔX),則當設計矩陣ΔX滿足:時,其中0<ρ<1為常數(shù),則擾動后模型y=(X+ΔX)β+e仍可估.
證明:A=X'X為實對稱陣,是Hermite陣,其特征值為 λ1≥λ2≥…≥λp>0,A+ΔA(X+ΔX)'(X+ΔX)也是 Hermite陣,記其特征值為也是 Hermite 矩陣.
令
η = ‖A-1/2ΔAA-1/2‖2
又 ΔA=ΔX'X+X'ΔX+ΔX'ΔX 是 Hermite陣,于是
2‖(ΔX‖2‖X‖2+‖(ΔX‖22≤ρλmin(A)
則
這里
由引理1,可得
在定理1的條件下,擾動后線性模型參數(shù)仍是可估的.接下來給出在此條件下,擾動對線性模型參數(shù)的影響.
定理1解決了設計矩陣出現(xiàn)擾動可能出現(xiàn)的虧秩問題,下面討論在矩陣擾動前后秩不變的情況下,擾動ΔX、Δy對的影響.
引理 2[6]設 A∈Cn×n是非奇異陣,b∈Cn,x 是方程AX=b的解,又設B=A+ΔA,滿足條件‖A-1‖2‖ΔX‖2<1,則方程(A+ΔA)(x+Δx)=b+Δb有惟一解x+Δx,并且滿足不等式,其中 k=‖A‖2‖A-1‖2,r=1 -k‖ΔA‖2./‖A‖2>0.
定理2:設X為n×p實的設計矩陣,且rank(Xn×p)=p,是線性模型(1)的最小二乘無偏估計;ΔX,Δy分別為設計矩陣X和y的擾動矩陣,=X+ΔX~=y+Δy,線性模型(1)擾動后的線性模型為=,其最小二乘估計為 若記 A=X'X,則當
時,其中0<ρ<1,則有
其中k=‖A‖2‖‖A-12.
證明:線性模型(1)的最小二乘解為正規(guī)方程X'Xβ=X'y的解,而線性模型=的最小二乘解為正規(guī)方程=的解.記 A=X'X,A+ΔA=(X+ ΔX)'(X+ ΔX),ΔA= ΔX'X+X'ΔX+ΔX'ΔX,則線性模型=的正規(guī)方程為
(A+ΔA)β=X'y+Δb
其中 Δb= ΔX'·y+X'Δy+ΔX'Δy.注意到
因此
其中 k= ‖A‖2‖A-1‖2.于是
又
其中
所以
因此線性回歸模型的相對擾動的一個上界為
結論得證.
對帶有擾動的設計矩陣線性模型進行探討,是擾動問題研究的一種擴展.實驗中由于取樣、人為、儀器誤差所產(chǎn)生的數(shù)據(jù)有時擾動很大,為了擾動后線性模型的可估性設定了擾動數(shù)據(jù)的范圍.本文在特征值擾動的基礎上,從線性模型設計矩陣擾動的角度探討了擾動后的模型可估的充分條件,給出了可估的擾動數(shù)據(jù)范圍并在此基礎上進一步分析了擾動數(shù)據(jù)對模型參數(shù)的影響.本文結果為優(yōu)化線性模型的實驗設計提供理論依據(jù).
[1]王松桂.線性統(tǒng)計模型:線性回歸與方差分析[M].北京:高等教育出版社,1999.
[2]FEKRI M,RUIZ-GAZEN A.Robust estimation in the simple errors- in - variables model[J].Statistics&Probability Letters,2006,76:1741-1747.
[3]HE X,LIANG H.Quantile regression estimates for a class of linear and partially linear errors-in-variables models[J].Statist.Sinica,2000,10:129 -140.
[4]王松桂.線性模型引論[M].北京:科學出版社,2004.
[5]DOPICO F M,MORO J,MOLERA J M.Weyl- type relative perturbation bounds for eigensystems of Hermitian matrices[J].Linear Algebra and Its Applications,2000,309:3 -18.
[6]孫繼廣.矩陣擾動分析[M].北京:科學出版社,1987.