王 鈺,李濟(jì)洪
無(wú)重復(fù)因析試驗(yàn)中一種散度效應(yīng)的估計(jì)方法
王 鈺,李濟(jì)洪*
(山西大學(xué)計(jì)算中心,山西太原030006)
在無(wú)重復(fù)因析試驗(yàn)的多個(gè)散度效應(yīng)分析中,現(xiàn)有的許多方法都存在錯(cuò)誤識(shí)別的現(xiàn)象,即兩個(gè)顯著的散度效應(yīng)可能在它們的交互列上產(chǎn)生一個(gè)錯(cuò)誤的(spurious)散度效應(yīng).為了解決這種模棱兩可性,文章提出了一種基于閉的位置效應(yīng)集合殘差的改進(jìn)H方法(稱(chēng)為AH方法),證明了AH的估計(jì)的無(wú)偏性,并通過(guò)一個(gè)基于實(shí)例的模擬驗(yàn)證了此方法.
多個(gè)散度效應(yīng);無(wú)重復(fù)因析;無(wú)偏性;模擬
無(wú)重復(fù)因析試驗(yàn)中散度效應(yīng)的分析近年來(lái)得到了許多學(xué)者的關(guān)注.最早Harvey[1]從一般回歸模型的角度考慮了散度參數(shù)的估計(jì)問(wèn)題,提出了一個(gè)H估計(jì)方法.而B(niǎo)ox和Meyer[2]于1986年最先從試驗(yàn)設(shè)計(jì)的角度提出了一個(gè)無(wú)重復(fù)因析試驗(yàn)中散度效應(yīng)的分析方法.接著Wang[3],Bergman和Hynén[4],Brenneman和Nair[5]分別研究了此問(wèn)題,提出了基于對(duì)數(shù)散度模型的不同散度效應(yīng)識(shí)別和估計(jì)方法.最近,McGrath和Yeh[6],Chen-Tuo Liao[7],van de Ven[8]又分別從各種角度出發(fā),給出了一些新的散度效應(yīng)估計(jì)方法和研究結(jié)果.但是在多個(gè)散度效應(yīng)的分析中,上面提到的方法都存在錯(cuò)誤識(shí)別的現(xiàn)象,即兩個(gè)顯著的散度效應(yīng)可能在它們的交互列上產(chǎn)生一個(gè)錯(cuò)誤的散度效應(yīng).為了解決這種模棱兩可性,McGrath and Lin[9]曾提出了一個(gè)基于閉的位置效應(yīng)集合殘差樣本方差的檢驗(yàn)統(tǒng)計(jì)量.本文就是在此基礎(chǔ)上,把上述閉的位置模型應(yīng)用于H估計(jì),給出了一種新的估計(jì)方法,記為AH估計(jì).接著討論了AH估計(jì)的無(wú)偏性,并通過(guò)一個(gè)基于實(shí)例的模擬驗(yàn)證了此方法.
考慮位置散度模型
模型(1)稱(chēng)為位置效應(yīng)模型,是利用響應(yīng)的均值對(duì)因子效應(yīng)建模;模型(2)稱(chēng)為散度效應(yīng)模型,是利用響應(yīng)的方差對(duì)因子效應(yīng)建模.在試驗(yàn)設(shè)計(jì)中就是要首先識(shí)別出對(duì)位置和散度有顯著影響的因子效應(yīng),然后設(shè)置因子的水平使得響應(yīng)的方差達(dá)到最小,均值盡可能接近目標(biāo)值.而在顯著效應(yīng)的識(shí)別過(guò)程中,又需要首先給出因子效應(yīng)的估計(jì),然后借助于半正態(tài)概率圖,Lenth方法等識(shí)別顯著的因子效應(yīng).因此可見(jiàn),因子效應(yīng)的估計(jì)尤為重要.
在模型中,y=(y1,y2,…,yn)′是觀測(cè)值向量,x′i是n×p維設(shè)計(jì)矩陣X的第i行;X=(X1,X2,…,Xp),p
假定:
1.S(k+)={j:Xk,j=+1}記因子k的正水平的行標(biāo)的集合;S(k-)={Xk,j=-1}記因子k的負(fù)水平的行標(biāo)的集合,其中Xk,j是Xk的第j個(gè)元素.
2.記k1=k2°k3,如果Xk1可以通過(guò)Xk2和Xk3的對(duì)應(yīng)元素相乘得到,例如因子A和B的交互項(xiàng)AB=A°B.
3.如果集合S對(duì)于運(yùn)算°是封閉的,則稱(chēng)它為閉集,記為S.
4.L={I,l1,…,lp-1}和D={I,d1,…,dq-1}分別記顯著的位置和散度效應(yīng)集.
在無(wú)重復(fù)因析試驗(yàn)中,無(wú)論是位置還是散度效應(yīng)的研究,效應(yīng)稀疏原則常常被假定,即只有大約30%的效應(yīng)被認(rèn)為是顯著的.所謂的效應(yīng)鑒別就是識(shí)別出顯著的位置和散度效應(yīng).而位置效應(yīng)的鑒別問(wèn)題已經(jīng)被廣泛的研究,相關(guān)文獻(xiàn)可參考Hamade和Balakrishnan[10]的綜述文章.在本文中總假定正確的位置模型已經(jīng)被識(shí)別,主要考慮散度效應(yīng)的估計(jì)問(wèn)題.
^β對(duì)于對(duì)數(shù)線性散度模型,如果記{ri,i=1,2,…,n}為擬合位置模型以后得到的殘差,即ri=yi-x′i^β,^β為β的普通最小二乘估計(jì),那么對(duì)散度效應(yīng)因子k,Harvey[1]提出H方法可以表示為:
McGrath和Lin[9]曾提出了一個(gè)基于閉的位置效應(yīng)集殘差樣本方差的ML檢驗(yàn)統(tǒng)計(jì)量,此閉的位置效應(yīng)集包括四部分: 1.總均值項(xiàng);2.顯著的位置效應(yīng)以及它們的交互效應(yīng)列;3.顯著的散度效應(yīng)以及它們的交互效應(yīng)列;4.上面所有列的交互列.例如:如果L={I,A,B},D={I,C,D},那么擬合的閉的位置效應(yīng)模型~L={I,A,B,AB,C,D,CD,A C,A D,A CD,BC,BD, BCD,ABC,ABD,ABCD}.本文就是把擬合此位置模型的殘差應(yīng)用于H方法,然后得到了一種新的散度效應(yīng)估計(jì)方法,稱(chēng)為AH估計(jì).如果記{~ri,i=1,2,…,n}為擬合的殘差,則散度參數(shù)φk的AH估計(jì)可以表示為如下形式:
接下來(lái)考慮AH估計(jì)的無(wú)偏性,為證明的方便首先給出幾個(gè)引理.
引理1[5]記L={I,l1,…,lp-1},k∈{2,…,n},Lk={k,k°l1,…,k°lp-1},則擬合位置模型LEK=L∪Lk得到的殘差有如下形式:
引理2[5]在給定模型(1)下,φk的AH估計(jì)的期望
定理 如果ˉL記閉的位置效應(yīng)集,ˉD記顯著散度效應(yīng)的閉集,并且dimˉL≤n/2,則對(duì)任意的k∈ˉD?~L,DAHk是無(wú)偏的.
證明 由ˉL構(gòu)造,我們知道它肯定是一個(gè)閉集,并且可以寫(xiě)為引理1中LEk的形式,那么由引理1和引理2
記{Si,i=1,…,M}為ˉL所對(duì)應(yīng)的設(shè)計(jì)矩陣的M個(gè)不同的行的組合,則由ˉL的閉集性質(zhì),有?j,m∈Si,x′jxm=p;j∈Si,m∈Si′,i≠i′,x′jxm=0.并且對(duì)j,m∈Si,當(dāng)j=m時(shí),~hjm=1-p/n,當(dāng)j≠m時(shí),~hjm=-p/n.(詳細(xì)的證明見(jiàn)文獻(xiàn)[11])不妨設(shè)S(k +)={S1,…,SM/2},S(k-)={SM/2+1,…,SM},又因?yàn)閗∈ˉD?ˉL,類(lèi)似地記φˉL={φ0,φl(shuí)1,…,φl(shuí)q},q=dimˉL,那么AH估計(jì)的期望
又對(duì)任意的j,m∈Si,x′j=x′m,
對(duì)任意j∈Si,m∈Si′,i≠i′,
這樣,(4)可以寫(xiě)為證明完畢.
本節(jié)考慮一個(gè)最早的由Davies[12]提出,后被Bergman和Hynén[4],McGrath和Lin[9]都分析過(guò)的染料質(zhì)量的實(shí)例,它使用了一個(gè)25-1V部分因析設(shè)計(jì),五個(gè)試驗(yàn)因子分別是溫度(A),原始材料(B),減壓(C),烘爐干燥壓力(D),真空漏泄(E).表1中給出了它的設(shè)計(jì)矩陣和響應(yīng),所有的作者都發(fā)現(xiàn)因子D對(duì)位置有較大的影響,關(guān)于顯著的散度效應(yīng),McGrath和Lin[9]鑒別出了因子E,而B(niǎo)ergman和Hynén[4](BH方法)發(fā)現(xiàn)除了因子E之外還有D,D E.但是我們知道BH方法存在錯(cuò)誤識(shí)別的現(xiàn)象,下面我們就通過(guò)基于此實(shí)例的模擬來(lái)給出本文方法和BH方法,H方法的一個(gè)對(duì)照.
具體地,假定真正的位置模型是L={I,D},散度模型是D={I,D,E},βD=33,φD=φE=2,模擬次數(shù)為5 000次.模擬結(jié)果見(jiàn)表2.
表1 設(shè)計(jì)矩陣和響應(yīng)Table 1 Design Matrix and Responses
表2 基于實(shí)例的模擬對(duì)照Table 2 Simulateed Comparison Based on Real Example
從表2中我們可以看到BH方法高估了因子D E,偏度達(dá)到了1.56,從而在識(shí)別中肯定會(huì)錯(cuò)誤識(shí)別D E,而H方法雖然無(wú)偏的估計(jì)出了D E,但它卻低估了因子E,從而可能會(huì)丟掉顯著的因子E.對(duì)于AH方法,它無(wú)偏的估計(jì)出了因子D,E,D E,并且AH估計(jì)的均方誤差一致地比BH方法和H方法小,比如AH方法使因子D E的均方誤差從BH估計(jì)的2.78,H估計(jì)的0.43減小到了0.36.從而可見(jiàn)本文方法可以用于多個(gè)散度效應(yīng)的參數(shù)估計(jì)問(wèn)題研究,不會(huì)出現(xiàn)對(duì)參數(shù)的高估和低估現(xiàn)象,保證散度效應(yīng)的正確識(shí)別.
在試驗(yàn)設(shè)計(jì)中,效應(yīng)稀疏原則是最基本的三大原則之一,即在所有因子效應(yīng)中至多有30%的效應(yīng)是顯著的,那么在此原則下對(duì)于一大類(lèi)位置散度模型,定理?xiàng)l件dimˉL≤n/2常常可以滿足,并且本文中提到的所有方法都是在效應(yīng)稀疏原則下得到的.當(dāng)dimˉL≤n/2不能滿足時(shí),無(wú)法給出一個(gè)精確的條件來(lái)保證散度參數(shù)估計(jì)的無(wú)偏性.特別地,當(dāng)dimˉL=n/2時(shí),對(duì)于任意的k?ˉL,因子k都是不可估的,相關(guān)的參考文獻(xiàn)見(jiàn)Brenneman和Nair[5].
當(dāng)模型假設(shè)不正確時(shí),本文方法同樣適用,可以直接推廣.但方法的性質(zhì)需要作進(jìn)一步的探討,比如此時(shí)可能得不到參數(shù)估計(jì)的無(wú)偏性,只能給出一個(gè)近似無(wú)偏的條件,這也是我們下一步要做的工作.
[1] HAVREY A C.Estimating Regression Models with Multiplicative Heteroscedasticity[J].Econometrica,1976,44:461-465.
[2] BOX G E P,MEYER R D.Dispersion Effects from Fractional Designs[J].Technometics,1986,28:19-27.
[3] WANG P C.Tests for Dispersion Effects from Orthogonal Arrays[J].Computational Statistics and Data A nalysis,1989, 8:109-117.
[4] BERGMAN B,HYNéN A.Dispersion Effects form Unreplicated Designs in the 2k-pSerises[J].Technometrics,1997,39: 191-198.
[5] BRENNEMAN W A,NAIR V N.Methods for Identifying Dispersion Effects in Unreplicated Factorial Experiments:A Critical Analysis and Proposed Stra tegies[J].Technometrics,2001,43:388-404.
[6] MCGRATH R N,YEH A B.A Quick,Compact Two-Sample Dispersion Test:Count Five[J].The A merican Statistician, 2005,59:47-53.
[7] LIAO Chen-Tuo.Two-level Factorial Designs for Searching Dispersion Factors and Estimating Location Main Effects[J]. J ournal of Statistical Planning and Inf erence,2006,136:4071-4087.
[8] VAN de VEN P M.On the Equivalence of Three Estimators for Dispersion Effects in Unreplicated Two-level Factorial Designs[J].J ournal of Statistical Planning and Inf erence,2008,138:18-29.
[9] MCGRATH R N,LIN KJ.Testing Multiple Dispersion Effects in Unreplicated Fractional Factorial Designs[J].Technometrics,2001,43:406-414.
[10] HAMADA M,BALAKRISHNAN N.Analyzing Unreplicated Factorial Experiments:A Review with Some New Proposals[J].Statistica Sinica,1998,8:1-41.
[11] BRENNEMAN W A.Inference for Location and Dispersion Effects in Unreplicated Factorial Experiments[J].Unpublished Ph D dissertation.University of Michigan,Statistics Department.
[12] DAVIES O L.Design and Analysis of Industrial Experiments[M].London:Oliver and Boyd,1956.
A Estimator of Dispersion Effects in Unreplicated Factorial Experiments
WANG Yu,LI Ji-hong
(Computer Center,Shanxi University,Taiyuan030006,China)
In the analysis of multiple dispersion effects for unreplicated factorial experiments,there often exists the phenomenon for picking up factors spuriously,that is,two active dispersion effects may create a spurious dispersion effect in their interaction column,and the most existing methods are subject to these spurious effects.To resolve the ambiguousness,a adapted H method(called the AH method)was introduced based on residuals from the fitted closed set of location effects.The unbiased condition of the AH estimator was proved,and the simulations based on a real example were used to illustrate the results.
multiple dispersion effects;unreplicated factorial;unbiasedness;simulation
O212.1
A
2009-01-15;
2009-02-05
國(guó)家自然科學(xué)基金(60873128)
王 鈺(1981-),男,助教,碩士,主要從事概率統(tǒng)計(jì)研究.E-mail:wangyu@sxu.edu.cn,*通訊聯(lián)系人E-mail: lijh@sxu.edu.cn
0253-2395(2010)02-0186-04