胡純嚴(yán),胡良平,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029
在運(yùn)用統(tǒng)計學(xué)的過程中,離不開一些基本的統(tǒng)計量,例如平均指標(biāo)(算術(shù)平均值、幾何平均值、中位數(shù)等)和變異指標(biāo)(方差、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤等)等;也離不開一些基本的分析方法,例如差異性分析、相關(guān)分析、關(guān)聯(lián)分析、回歸分析、聚類分析和判別分析等。其中,“方差”和“方差分析(或稱為F檢驗)”在統(tǒng)計學(xué)中具有重要的作用。本文將對方差分析的內(nèi)容進(jìn)行介紹。
設(shè)X是一個隨機(jī)變量,又設(shè)E(X)是隨機(jī)變量X的數(shù)學(xué)期望(即算術(shù)平均值),若E(X2)存在,則稱由式(1)定義的V(X)為X的總體方差(簡稱為方差)[1-2],通常記為V(X)或Va(rX)或σ2。
方差V(X)的單位是隨機(jī)變量X的單位的平方,故在實(shí)際應(yīng)用時,常取其算術(shù)平方根,令稱其為標(biāo)準(zhǔn)差或均方差。顯然,標(biāo)準(zhǔn)差σ與隨機(jī)變量X具有相同的量綱。
設(shè)x1,…,xn是從特定總體中隨機(jī)抽取的樣本含量為n的一個樣本,并設(shè)為該樣本的樣本均值,則樣本方差由式(2)給出:
設(shè)總體中個體的數(shù)目為N,觀測指標(biāo)為X,其總體平均值為μ,總體方差也可由式(3)給出:
由數(shù)理統(tǒng)計知識可知:E(s2)=σ2,即樣本方差是總體方差的無偏估計量。
隨機(jī)變量X的方差V(X)具有如下性質(zhì):其一,設(shè)X=C(常數(shù)),則V(X)=0,即常數(shù)的方差為零。其二,設(shè)Y=CX(C為常數(shù)、X為隨機(jī)變量),則V(Y)=C2V(X),即常數(shù)與隨機(jī)變量之積的方差等于該常數(shù)的平方與該隨機(jī)變量的方差之積。其三,設(shè)A、B是兩個不相等的常數(shù),則V(AX+B)=A2V(X)。其四,V(X)=E(X2)-[E(X)]2。其五,設(shè)X1與X2是兩個相互獨(dú)立的隨機(jī)變量,則V(X1+X2)=V(X1)+V(X2),即兩個相互獨(dú)立的隨機(jī)變量之和的方差等于它們各自方差之和[1-2]。這個性質(zhì)可以推廣到n個相互獨(dú)立的隨機(jī)變量,即設(shè)X1,…,Xn相互獨(dú)立,則有下式成立:
一個隨機(jī)變量的期望值(即均值)只能反映該隨機(jī)變量平均取值的大小,而無法反映其取值的波動情況;方差是用來刻畫一個隨機(jī)變量的全部取值圍繞其期望值波動程度大小的變異指標(biāo)之一。雖然有類似功能的變異指標(biāo)還包括標(biāo)準(zhǔn)差、變異系數(shù)和四分位數(shù)間距,但它們的應(yīng)用場合遠(yuǎn)遠(yuǎn)少于方差。其根本原因在于方差中的主要部分是離均差平方和,人們可以依據(jù)資料中所包含的“變異來源的數(shù)目”對其進(jìn)行分解,從而揭示因各變異來源所引起的數(shù)據(jù)波動的大小。尤其是在對調(diào)查資料進(jìn)行統(tǒng)計分析時,當(dāng)計算得出調(diào)查結(jié)果估計量之后,需要知道其估計的精度是多少,而精度最常用的度量是調(diào)查估計量的方差[3]。
1.4.1 方差的估計
對于來自復(fù)雜抽樣設(shè)計的資料,研究者關(guān)注的是調(diào)查結(jié)果的方差大小,這就是方差估計問題[3]。由于調(diào)查結(jié)果的精度受抽樣調(diào)查設(shè)計類型、樣本含量、調(diào)查結(jié)果資料性質(zhì)等因素的影響,故調(diào)查結(jié)果估計量的方差估計問題是一個非常復(fù)雜的統(tǒng)計學(xué)問題[3]。
1.4.2 方差的比較
方差的比較包括兩方面內(nèi)容:其一,比較地位平等的兩個或多個方差之間的差別是否有統(tǒng)計學(xué)意義,以推斷它們所代表的兩個或多個總體的方差是否相等。與此研究目的對應(yīng)的假設(shè)檢驗被稱為方差齊性檢驗[4-5]。其二,比較地位可能不平等的兩個或多個方差(例如某因素各水平組間方差與組內(nèi)方差、某因素各水平組間方差與包含該因素的統(tǒng)計模型的誤差的方差)之間的差別是否有統(tǒng)計學(xué)意義,以推斷不同變異來源對試驗結(jié)果平均效應(yīng)的影響是否有統(tǒng)計學(xué)意義。第二方面的內(nèi)容就是基于均值比較的方差分析,通常被稱為一元或多元單因素方差分析或多因素方差分析[6-7]。
在前述提及的第二方面內(nèi)容中,若觀測結(jié)果變量為定量變量且構(gòu)建的回歸模型是多重線性回歸模型,基于兩個嵌套回歸模型(其中一個為包含所有自變量的全模型、另一個為僅包含部分自變量的部分模型)的殘差方差的比較,可推斷出是否可用部分模型取代全模型[6]。
F分布是一種連續(xù)型分布,它不僅是方差分析的基礎(chǔ),還與正態(tài)分布、χ2分布和t分布都有密切聯(lián)系。最初,人們是通過研究組間方差與組內(nèi)方差之比入手的。Fisher于1924年發(fā)現(xiàn)方差比有一個分布,并以的形式來編表。
在式(5)中,F(xiàn)的分布稱為分子和分母的自由度分別為m和n的F分布[8],并記作F~Fm,n。F分布的密度函數(shù)見式(6):
2.3.1 概率密度函數(shù)的圖形
在f(x;m,n)中,m為分子的自由度,n為分母的自由度,當(dāng)m=10,n分別取4、10、50、∞時,F(xiàn)分布的概率密度函數(shù)圖形見圖1;當(dāng)n=10,m分別取4、10、50、∞時,F(xiàn)分布的概率密度函數(shù)圖形見圖2。
圖1 第一組條件下F分布概率密度函數(shù)圖形
圖2 第二組條件下F分布概率密度函數(shù)圖形
F分布概率密度函數(shù)圖形特點(diǎn)如下:①f(x;m,n)的形狀受分子和分母自由度的影響,固定其中一個自由度,改變另一個自由度,可以得到兩簇密度函數(shù)曲線;②單側(cè)F分布表用于方差分析,雙側(cè)F分布表用于兩總體方差齊性檢驗。
通常是已知右側(cè)尾端概率p(單側(cè))或雙側(cè)尾端概率p(雙側(cè))、分子和分母的自由度m和n,去查F分布的分位數(shù)(也稱為臨界值)。單、雙側(cè)時,分別由式(8)和式(9)來確定橫軸上的分位數(shù)F。
雙側(cè)時,左側(cè)分位數(shù)F可由下式算出:,它通常小于1,而在計算兩樣本方差比時,特意將較大方差放在分子上,故用于檢驗兩總體方差齊性的F統(tǒng)計量的值通常大于等于1。因此,制表時,即使是雙側(cè)分位數(shù),也只列出右側(cè)的分位數(shù),省略了左側(cè)的分位數(shù)。
2.3.2 倒數(shù)變換后的隨機(jī)變量仍服從F分布
服從F分布的隨機(jī)變量的倒數(shù)仍是服從F分布的隨機(jī)變量,但需要調(diào)換分子與分母的自由度,即若X~Fm,n,Y=1/X,則有下式:
2.3.3 F分布與其他分布之聯(lián)系
若 X~tn,則 X2~F1,n;若,則 X~mFm,∞;若 X~z(標(biāo)準(zhǔn)正態(tài)變量),則X2~F1,∞??偨Y(jié)上述關(guān)系,可得到式(11):
在應(yīng)用中,利用上述關(guān)系有時可將一種檢驗轉(zhuǎn)化為另一種檢驗,或用來核對計算是否正確。
2.3.4 服從F分布的隨機(jī)變量經(jīng)對數(shù)變換后服從正態(tài)分布
若 X~Fm,n,令Zm,n=lnX,則當(dāng)m和n都較大時,Zm,n的分布近似于式(12):
在分析試驗資料時,若觀測結(jié)果為定量資料,一個最常見的分析目的就是比較某試驗因素在不同水平條件下定量觀測指標(biāo)平均值之間的差別是否有統(tǒng)計學(xué)意義。在單因素試驗研究場合下,需要進(jìn)一步考察試驗設(shè)計的具體類型和定量資料所滿足的前提條件,方可選擇合適的差異性檢驗方法。通常,單因素試驗設(shè)計類型可分為以下四種:單組設(shè)計、配對設(shè)計、成組設(shè)計和單因素多水平設(shè)計;定量資料可分為滿足和不滿足參數(shù)檢驗前提條件(即獨(dú)立性、正態(tài)性和方差齊性)這兩種情形。
當(dāng)定量資料滿足參數(shù)檢驗的前提條件且設(shè)計類型為“單組設(shè)計、配對設(shè)計和成組設(shè)計”三種時,人們習(xí)慣于選擇基于t分布為理論依據(jù)的t檢驗;而當(dāng)定量資料滿足參數(shù)檢驗的前提條件且設(shè)計類型為“單因素多水平設(shè)計”時,統(tǒng)計學(xué)上要求進(jìn)行方差分析。
在多因素試驗研究場合下,當(dāng)定量資料滿足參數(shù)檢驗的前提條件且設(shè)計類型為“某種特定的多因素設(shè)計”時,統(tǒng)計學(xué)上強(qiáng)調(diào)必須選用與特定設(shè)計類型對應(yīng)的方差分析方法處理定量資料。常見的多因素試驗設(shè)計類型包括隨機(jī)區(qū)組設(shè)計、拉丁方設(shè)計、交叉設(shè)計、析因設(shè)計、嵌套(或系統(tǒng)分組)設(shè)計、具有重復(fù)測量因素的設(shè)計和正交設(shè)計等。
實(shí)施用于均值比較的方差分析的一個重要前提條件是方差齊性,即某試驗因素各水平組總體方差相等。SAS/STAT的GLM過程中介紹了4種方差齊性檢驗方法:Bartlett’sχ2檢驗、Levene’sF檢驗、O′Brien’sF檢驗以及Brown和Forsythe提出的F檢驗方法。另外,基于兩樣本方差之比構(gòu)造出檢驗統(tǒng)計量來推斷兩總體方差是否相等的檢驗方法,也屬于用于方差比較的方差分析。
假定在一個包含k(k≥2)個自變量和一個定量因變量且樣本含量為n的統(tǒng)計資料中,先構(gòu)建一個包含全部k(k≥2)個自變量(假定每個自變量都以一次方形式出現(xiàn),未引入任何派生自變量)的多重線性回歸模型,得到其殘差的離差平方和記為SSFR,自由度記為dfFR;依據(jù)專業(yè)知識,從k(k≥2)個自變量中取出m(m 在式(13)中,F(xiàn)服從分子與分母自由度分別為df1和dfFR的F分布;?=SSPR-SSFR,df1=dfPR-dfFR。若檢驗統(tǒng)計量F值大于臨界值則表明不能采用簡化回歸模型取代全模型,反之亦然。 方差分析的基本思想是對定量結(jié)果變量Y的總離均差平方和的分解。分解出來的項數(shù)為所考查的影響因素(包含擬考查的因素之間的交互作用項)的項數(shù)加一個誤差項。由于基于均值比較的方差分析與試驗設(shè)計類型和擬考查的交互作用項數(shù)有密切關(guān)系,故對定量結(jié)果變量Y的總離均差平方和的分解結(jié)果將會隨具體情況而變化。下面給出兩種常見試驗設(shè)計類型對應(yīng)的總離均差平方和分解的樣例。 設(shè)試驗因素A有k個水平,各水平下獨(dú)立重復(fù)試驗次數(shù)為nj(j=1,2,…,k);又設(shè)在第j個水平下第i(j=1,2,…,nj)次獨(dú)立重復(fù)試驗結(jié)果為Yij,設(shè)該水平條件下Y的平均值為;再設(shè)定量結(jié)果變量Y的總均值為Yˉ..。則定量結(jié)果變量Y的總離均差平方和的分解結(jié)果見式(14): 在式(14)中,SSA和SSE分別代表因素A和誤差E的離均差平方和,表達(dá)式見式(15)、式(16): 設(shè)試驗因素A有k個水平,區(qū)組因素B有c個水平,試驗因素A各水平下都獨(dú)立重復(fù)試驗c次;又設(shè)在第j個水平下第i(i=1,2,…,c)次獨(dú)立重復(fù)試驗結(jié)果為Yij;再設(shè)定量結(jié)果變量Y的總均值為則定量結(jié)果變量Y的總離均差平方和的分解結(jié)果見式(17): 在式(17)中,SSA、SSB和SSE分別代表因素A、因素B和誤差E的離均差平方和,具體表達(dá)式見式(18)、式(19)、式(20): 在總離均差平方和被正確分解之后,進(jìn)行方差分析就需要構(gòu)造出檢驗統(tǒng)計量F,然后基于樣本數(shù)據(jù)計算出檢驗統(tǒng)計量F的值,再依據(jù)F分布做出接受或拒絕無效假設(shè)的結(jié)論。也就是說,檢驗統(tǒng)計量F是與特定無效假設(shè)和備擇假設(shè)相對應(yīng)的。 4.4.1 與單因素多水平設(shè)計一元定量資料對應(yīng)的方差分析 第一步,建立檢驗假設(shè)。H0:因素A各水平下定量觀測結(jié)果Y的平均值相等;H1:因素A各水平下定量觀測結(jié)果Y的平均值不等或不全相等;給定顯著性水平α的值,通常取α=0.05。 第二步,構(gòu)造檢驗統(tǒng)計量F,見式(21),其中n為總樣本含量,F(xiàn)服從分子與分母自由度分別為(k-1)與(n-k)的F分布。 第三步,做出統(tǒng)計結(jié)論。計算出檢驗統(tǒng)計量F的值,若F大于等于F分布下右側(cè)尾端概率為α=0.05對應(yīng)的臨界值,可得出拒絕無效假設(shè)H0、接受備擇假設(shè)H1的統(tǒng)計結(jié)論。 4.4.2 與隨機(jī)區(qū)組設(shè)計一元定量資料對應(yīng)的方差分析 與“第4.4.1節(jié)”步驟基本相同,不同的是需要構(gòu)造兩個檢驗統(tǒng)計量,分別用于檢驗因素A和因素B。因篇幅所限,現(xiàn)將兩個檢驗統(tǒng)計量扼要呈現(xiàn)如下,見式(22)、式(23): 總離均差平方和的分解方法不是唯一的,它與分解方法所依據(jù)的統(tǒng)計假設(shè)密切相關(guān)。在SAS/STAT的GLM過程[5]中,基于一般線性模型的理論進(jìn)行方差分析時,對總離均差平方和給出了四種分解方法,分別為I型、II型、III型和IV型離均差平方和。在對多因素輕度非平衡(不同試驗因素水平組合條件下獨(dú)立重復(fù)試驗次數(shù)不等,但沒有一種組合條件下重復(fù)試驗次數(shù)為0)試驗設(shè)計定量資料進(jìn)行方差分析時,基于四型離均差平方和所得到的方差分析結(jié)果不盡相同(此時,III型和IV型離均差平方和所對應(yīng)的方差分析結(jié)果相同);尤其是在嚴(yán)重非平衡(不同試驗因素水平組合條件下獨(dú)立重復(fù)試驗次數(shù)不等,且部分組合條件下重復(fù)試驗次數(shù)為0)試驗設(shè)計條件下,基于四型離均差平方和所得到的方差分析結(jié)果幾乎完全不同。 雖然方差分析可用于分析多因素試驗研究資料,但它一般是由多次F檢驗組成的。因為每次F檢驗都只針對一個因素或交互作用項;而當(dāng)某因素的水平數(shù)大于2,且當(dāng)F檢驗的結(jié)果為該因素的全部水平條件下定量結(jié)果變量的均值之間差異有統(tǒng)計學(xué)意義時,還需要進(jìn)行多重比較。一般來說,不適合采用簡單的t檢驗[9-10]進(jìn)行多重比較,而需要根據(jù)不同的要求和精度,從眾多的多重比較方法中選用最符合分析要求的方法[5]。 本文介紹了與方差分析有關(guān)的內(nèi)容,包括基本概念、方差分析的數(shù)學(xué)基礎(chǔ)——F分布、方差分析在差異性檢驗中的應(yīng)用場合以及基于均值比較的方差分析的基本思想。最后,在討論部分中提出了“四型離均差平方和”的概念。之所以介紹這些在常規(guī)統(tǒng)計學(xué)教科書中幾乎未曾提及過的內(nèi)容,以引起讀者的興趣和思考。4 基于均值比較的方差分析的基本思想
4.1 概述
4.2 單因素多水平設(shè)計一元定量資料總離均差平方和的分解
4.3 隨機(jī)區(qū)組設(shè)計一元定量資料總離均差平方和的分解
4.4 檢驗統(tǒng)計量F的構(gòu)造
5 討論與小結(jié)
5.1 討論
5.2 小結(jié)