李光輝, 張 洪, 葉緒國(guó)
(1. 凱里學(xué)院 數(shù)學(xué)科學(xué)學(xué)院,貴州 凱里 556011;2. 東南大學(xué) 數(shù)學(xué)系,南京 210096)
含有p-1個(gè)自變量的理論線性回歸模型一般形式為
y=Xβ+e,E(e)=0, Cov(e)=σ2I
(1)
其中y為n×1的觀測(cè)向量,X為n×p的已知設(shè)計(jì)陣,且rank(X)=p,e為n×1的隨機(jī)誤差向量,模型中n次觀測(cè)到的數(shù)據(jù)記為Ai=(yi,xi1,…,xi,p-1),i=1,2,…,n,并記W={A1,A2,…,An}為n組觀測(cè)值所組成的樣本空間,Ai為其中的樣本點(diǎn).對(duì)于模型(1),通過最小二乘法可獲得β的LSE,建立經(jīng)驗(yàn)回歸方程為
(2)
記Lj={Aj1,Aj2,…,Ajnj}是由W中的nj個(gè)樣本點(diǎn)所組成的子樣,即Lj?W,j1,j2,…,jnj為自然數(shù)1,2,…,n中的nj個(gè)數(shù).易知,W中共包含2n個(gè)子樣.
現(xiàn)考慮以下情形:若W中存在m個(gè)子樣L1,L2,…,Lm,且滿足p+1≤nj≤n-1,j=1,2,…,m,即在這m個(gè)子樣下建立的經(jīng)驗(yàn)回歸方程和參數(shù)β的LSE為
(3)
這k個(gè)經(jīng)驗(yàn)回歸方程與總數(shù)據(jù)下的回歸方程(2)具有較大的差別,且擬合效果明顯優(yōu)于式(2).以一元線性回歸為例,圖1給出了兩組數(shù)據(jù)的散點(diǎn)圖及擬合直線.
圖1 子樣下的經(jīng)驗(yàn)回歸方程與總體回歸方程的差別示意圖
如圖1示,兩組數(shù)據(jù)下所建立的回歸方程都通過了R檢驗(yàn),在W下的R2都大于0.7,說明兩組數(shù)據(jù)的線性關(guān)系都顯著,但圖1(a)中數(shù)據(jù)取得兩組子樣下所建立的回歸方程與總回歸方程差別較大,但擬合效果更佳;圖1(b)中的散點(diǎn)呈明顯分段,用3段擬合所得的回歸方程擬合效果明顯優(yōu)于總回歸直線,所以,在以上兩種線性關(guān)系都顯著的情形下,對(duì)總回歸方程的擬合效果仍然提出質(zhì)疑.
同理,在多元回歸模型中,即使總回歸方程通過了F檢驗(yàn),且每個(gè)自變量系數(shù)都通過了t檢驗(yàn),若以均方誤差來度量回歸方程的擬合效果,在W中的k個(gè)子樣下的回歸方程與總回歸方程差別較大,且具有更小的均方誤差,但總回歸方程的擬合效果欠佳.
所以,線性模型的同一性就是指,在總回歸方程顯著的條件下,對(duì)于?Lj?W,在Lj下建立的子樣回歸方程(3)與總回歸方程(2)之間不存在較大差別,擬合效果相近.線性模型的同一性檢驗(yàn)就是對(duì)k個(gè)子樣作如下檢驗(yàn):
H0:β(j)=β,j=1,…,m; H1:β(j)不全等于β
(4)
張雙林[1,2]對(duì)多組自相關(guān)數(shù)據(jù)服從同一模型作了假設(shè)檢驗(yàn).此處在此基礎(chǔ)上,利用文獻(xiàn)[3]中的方法,提出利用自助法獲得W中的k個(gè)子樣,通過文獻(xiàn)[4]中的結(jié)論,對(duì)每個(gè)子樣分別建立回歸方程,檢驗(yàn)整體數(shù)據(jù)W是否服從同一線性模型,并導(dǎo)出了檢驗(yàn)統(tǒng)計(jì)量.
設(shè)從W中取出m個(gè)完全不同的自助樣本,并保證每個(gè)自助樣本下的已知設(shè)計(jì)陣X(j)都是列滿秩的,記為
Lj={Aj1,Aj2,…,Ajnj},j=1,2,…,m,p+1≤nj≤n-1
(5)
特別地,每個(gè)自助樣本中取a個(gè)樣本點(diǎn),若a≤ni,i=1,2,…,k,則取到這些子樣的概率為
若a≥ni時(shí),i=1,2,…,k,取到這些子樣的概率為
所以,不論以何種方式獲得自助樣本,只要W含有不滿足同一性的子樣越多,就會(huì)導(dǎo)致取到該子樣的概率越大,進(jìn)一步構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量中也會(huì)含有更多與總模型相悖的信息.
設(shè)m組自助樣本下的理論線性回歸模型為
yij=β10+βi1xi1j+…+βi(p-1)xi(p-1)j+eij,i=1,…,m,j=1,…,nj
(5)
其中yij和eij分別表示第i組自助樣本下的第j次的觀測(cè)值和隨機(jī)誤差,βik表示第i組自助樣本下的第k個(gè)未知參數(shù),xikj表示第i個(gè)自助樣本下的第k個(gè)變量的第j次觀測(cè)值,k=1,2,…,p-1.將模型(5)記為矩陣形式得
y(i)=X(i)β(i)+e(i),e(i)~N(0,σ2Ini),i=1,2,…,m
(6)
(7)
現(xiàn)需要檢驗(yàn)的假設(shè)(4)可記為
(8)
下面計(jì)算模型(6)下的殘差平方和SSe與約束殘差平方和SSHe.
(9)
(10)
由式(9)(10)得
由于SSHe-SSe~χ2(p),SSe~χ(N+n-(m+1)p)且兩者相互獨(dú)立,則可得到檢驗(yàn)統(tǒng)計(jì)量為
(11)
有F~F(p,N+n-(m+1)p),對(duì)于給定的水平α,若F>Fα(p,N+n-(m+1)p),則拒絕原假設(shè),認(rèn)為模型不滿足同一性,此時(shí)不認(rèn)同模型具有良好的預(yù)測(cè)水平.
由此得到的檢驗(yàn)統(tǒng)計(jì)量為
更進(jìn)一步,若每個(gè)自助樣本中的樣本容量都為α,此時(shí)檢驗(yàn)統(tǒng)計(jì)量為F~F(p,m(a-p)+n-p).
參考文獻(xiàn):
[1] 張雙林,沙秋英.k組多元自相關(guān)數(shù)據(jù)服從同一模型的假設(shè)檢驗(yàn)[J].應(yīng)用數(shù)學(xué)學(xué)報(bào),1995,18(4):518-527
[2] 張雙林,陳超. 線性模型的等價(jià)性檢驗(yàn)[J].黑龍江大學(xué)學(xué)報(bào),1997,14(1):1-8
[3] 王松桂.線性模型引論[M]. 北京:科學(xué)出版社,2004
[4] 胡雪梅,吳代紅,李楠.基于原始自助法估計(jì)異方差線性模型[J]. 重慶工商大學(xué)學(xué)報(bào):自然科學(xué)版,2010,27(1):15-17