彭 凱
(南京財經(jīng)大學(xué)應(yīng)用數(shù)學(xué)學(xué)院,江蘇南京210023)
現(xiàn)實(shí)中,常常需要比較不同分布的方差,尤其需要知道總體間是否具有方差齊性.例如在容器制造過程中,為了更高的適配率,質(zhì)控人員不僅希望其生產(chǎn)的容器和蓋子的尺寸有相等的均值,而且希望它們具有方差齊性;大型考試,常常需要多名批卷老師合作批卷,管理者會希望不同的老師有相似的改卷風(fēng)格即具有方差齊性,以使批卷結(jié)果對不同的學(xué)生更為公平合理. 因此,比較不同分布的方差具有非常重要的現(xiàn)實(shí)意義.
傳統(tǒng)的參數(shù)統(tǒng)計領(lǐng)域,對于兩總體方差的比較是在總體為正態(tài)分布的假設(shè)下進(jìn)行的.在實(shí)際研究中,遇到的多是非正態(tài)數(shù)據(jù),這時用傳統(tǒng)的方法并不合理,要想去證明非正態(tài)總體下檢驗(yàn)統(tǒng)計量的分布或漸進(jìn)分布也未必容易.
本文基于Qin 和Zhang[1]提出的半?yún)?shù)密度比模型,以方差比作為統(tǒng)計指標(biāo)來比較總體間方差大小.以G,H分別表示隨機(jī)變量X,Y的分布函數(shù),以g(x),h(x)分別表示兩個總體的密度函數(shù). 該模型如下:
這里α 是一個標(biāo)量參數(shù),β 是一個p×1 的向量參數(shù),r(x)是一個p×1 的關(guān)于x 的光滑的向量函數(shù).該模型已被應(yīng)用到各種具體統(tǒng)計方法上. 例如:Zhang[2]研究了半?yún)?shù)分位數(shù)估計方法;Qin 和Zhang[3]以及Wan 和Zhang[4]建立了該模型下進(jìn)行ROC 曲線估計的半?yún)?shù)方法;Wan 和Zhang[5]建立了該模型下進(jìn)行ROC 曲線比較的半?yún)?shù)方法;Folkianos[6]、Cheng 和Chu[7]、Qin 和Zhang[8]建立了半?yún)?shù)密度函數(shù)估計方法;Wan 和Xu[9]證明了半?yún)?shù)估計下的均值差以及方差之差各自漸進(jìn)服從于正態(tài)分布,并且給出半?yún)?shù)估計量比參數(shù)估計量漸進(jìn)有效的理論證明. Kay 和Little[10]討論了r(x)的選取以及其下適用的具體分布類型.
本文的核心思想是假定兩總體服從密度比模型下用經(jīng)驗(yàn)似然方法討論兩獨(dú)立總體方差比的推斷問題. 密度比模型不設(shè)定總體分布類型,并且模型包含未知參數(shù),因此屬于半?yún)?shù)模型范疇. 這種方法可以看作是常用F統(tǒng)計量推斷的一種半?yún)?shù)推廣.
設(shè)兩總體樣本數(shù)據(jù)分別為X1,X2,…,Xn0~g(x),Z1,Z2,…,Zn1~h(x)并且設(shè)定聯(lián)合數(shù)據(jù)為{X1,X2,…,Xn0,Z1,Z2,…,Zn1} ={t1,t2,…,tn} ,記n=n0+n1.另,設(shè)g(x)的均值為μ1,方差為;h(x)的均值為μ2,方差為.此外,假定模型(1)成立.
根據(jù)經(jīng)驗(yàn)似然方法,可以寫出經(jīng)驗(yàn)似然函數(shù):
其中pi=dG(ti)(i=1,2,…,n)是概率的躍遷,且總和為1.
時獲得. 式中ρ= n1n0,(α?,β?)是(α,β)的似然估計量,其數(shù)值可解以下計分方程組而獲得:
這里l(α,β)是關(guān)于(α,β)的剖面對數(shù)似然函數(shù),其值為:
那么,可以用以下半?yún)?shù)經(jīng)驗(yàn)分布函數(shù)作為總體G,H的半?yún)?shù)估計量:
為使表達(dá)式更為簡便,規(guī)定:
根據(jù)以上結(jié)果能得到θ的半?yún)?shù)估計量:
Bootstrap 置信區(qū)間有多種構(gòu)建方式,對于該假設(shè)檢驗(yàn)采用EP法獲得置信區(qū)間,那么Bootstrap推斷算法步驟如下:
(1)根據(jù)原始數(shù)據(jù)X,Z計算θ的點(diǎn)估計數(shù)值θ?.
(2)從樣本X 中有放回重抽樣(以原始數(shù)據(jù)容量)得到B組Bootstrap數(shù)據(jù)X*(b).
(3)從樣本Z 中有放回重抽樣(以原始數(shù)據(jù)容量)得到B組Bootstrap數(shù)據(jù)Z*(b).
(4)聯(lián)合以上數(shù)據(jù)得到B 組Bootstrap 數(shù)據(jù)( X*(b),Z*(b)),b=1,2,…,B進(jìn)而計算θ?*(b)的數(shù)值.
(5)對{θ?*(1),θ?*(2),…,θ?*(B)}數(shù)值向量進(jìn)行升序排列,并用百分位數(shù)法獲得95% 等尾置信區(qū)間(),其中是百分位數(shù).
(6)把Bootstrap 置信區(qū)間用于假設(shè)檢驗(yàn)H0:θ=θ0vs H1:θ ≠θ0. 如果θ0數(shù)值落在該置信區(qū)間內(nèi)則保留原假設(shè),否則拒絕原假設(shè). 這一步相當(dāng)于置信水平為0.05 時的顯著性檢驗(yàn). 類似地,還可以運(yùn)用單側(cè)置信區(qū)間進(jìn)行單側(cè)假設(shè)檢驗(yàn).
模擬實(shí)驗(yàn)?zāi)康氖球?yàn)證方法的可行性. 這里考慮正態(tài)和指數(shù)分布兩類情況.
(1)對每種情況下產(chǎn)生N組容量為(n,n) 的蒙特卡洛模擬數(shù)據(jù).
(2)對每組蒙特卡洛數(shù)據(jù)進(jìn)行有放回重抽樣得到B組Bootstrap數(shù)據(jù),其容量為(n,n).
(3)每組蒙特卡洛數(shù)據(jù)下可以得到B 對α?,β?估計值,從而得到B個θ?估計值.
(4)計算N×B個θ?估計值的均值.
(5)計算N×B個θ?估計值的均方誤差.
(6)對每組蒙特卡洛數(shù)據(jù)構(gòu)造一個95%等尾置信區(qū)間,并計算覆蓋概率(即N個置信區(qū)間中包含θ真值的個數(shù)與N的比例).
表1、表2 是統(tǒng)計模擬結(jié)果. 從表1、表2 可以看出,參數(shù)真值與估計值的均值相差較小. 隨著樣本容量增加,參數(shù)真值與估計值均值逐漸接近,均方誤差逐漸減小.另外,置信區(qū)間覆蓋概率與預(yù)期的95%非常接近.因此,該方法是可行的.
表1 正態(tài)分布模擬結(jié)果(g( x )~N( 1,4 ),h( x )~N( 3,4 ),N=500,B=1000)
表2 指數(shù)分布模擬結(jié)果(g( x )~exp( 2 ),h( x )~exp( 1 ),N=500,B=1000)
在給定數(shù)據(jù)下使用半?yún)?shù)密度比模型時一個必要的步驟是檢驗(yàn)該模型對于數(shù)據(jù)的適合度即擬合優(yōu)度. 該模型的擬合優(yōu)度檢驗(yàn)統(tǒng)計量有很多種,例如Qin[1]提供的KS 統(tǒng)計量,Zhang[11]給出的卡方型檢驗(yàn)統(tǒng)計量,Zhang[12]給出的信息矩陣統(tǒng)計量等等. 以下用到的實(shí)例數(shù)據(jù)已經(jīng)完成擬合優(yōu)度檢驗(yàn),其結(jié)果可參考Qin[1].
采用Glovsky & Rigrodsky(1964)的數(shù)據(jù)作為分析案例.作者分析比較了智力缺陷兒童的發(fā)展歷史數(shù)據(jù),研究了參加新澤西維蘭培訓(xùn)學(xué)校的語言治療項目的41 名兒童. 其中有20 個兒童在其早年發(fā)展中被診斷出患有失語癥,剩下的21個兒童被診斷患有智力障礙. 令隨機(jī)變量Z 代表患有失語癥兒童的指標(biāo)變量,X代表患有智力障礙兒童的指標(biāo)變量.根據(jù)威尼蘭社會成熟量表測量得到的每個兒童的得分如下:
考慮以下假設(shè)檢驗(yàn)
根據(jù)前面的推斷算法,得到θ?=1.088,置信區(qū)間為( 0.752,1.591 ). 另外,θ0=1 落在置信區(qū)間內(nèi),因此選擇保留原假設(shè). 換句話說,無法做出拒絕原假設(shè)的判斷.