張洪璐 ,劉媛媛 ,李長平 ,2,胡良平
(1.天津醫(yī)科大學公共衛(wèi)生學院,天津 300070;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029;3.軍事科學院研究生院,北京 100850
t分布的發(fā)現(xiàn)使得小樣本統(tǒng)計推斷成為可能,以t分布為基礎的檢驗稱為t檢驗[1]。在醫(yī)學統(tǒng)計學中,t檢驗具有所需樣本量小、計算簡便及檢驗效能較高等特點,成為應用較多的一類假設檢驗方法[2]。若統(tǒng)計分析的目的是比較算術均數(shù),根據試驗設計類型,t檢驗可以分為三種:單組設計一元定量資料t檢驗、配對設計一元定量資料t檢驗和成組設計一元定量資料t檢驗[3]?;谒阈g均數(shù)的t檢驗的應用條件一般包括:隨機樣本(即獨立性)、來自正態(tài)分布總體(即正態(tài)性)以及兩總體方差相等(即方差齊性)[4]。本文將分別介紹上述三種類型的一般差異性t檢驗,并結合實例,采用SAS 9.4予以實現(xiàn)。
算術均數(shù)是大家最為熟悉的平均數(shù)指標[5],是指一個變量所有觀測值的總和除以觀測值的個數(shù),反映一個變量所有觀測值的平均水平,簡稱為均數(shù)或均值。樣本均數(shù)用表示,計算公式見式(1):
如果沒有收集到個體觀測值數(shù)據,而只是獲得了匯總的頻數(shù)分布表數(shù)據,則可用每個組段的組中值作為該組段中各個觀測值的估計值,并用式(2)計算均數(shù)的近似值:
式(2)中,fi為第i組段的頻數(shù),xMi為對應組段的組中值,xMi=(第i組段上限+第i組段下限)/2。
均數(shù)計算簡便,易于理解,是應用最為廣泛的平均數(shù)指標。但是均數(shù)對于特大或特小的觀測值十分敏感。對于偏態(tài)分布數(shù)據,均數(shù)也會偏向拖尾一側,不能很好地反映全部觀測值的平均水平。因此,均數(shù)主要適用于描述不含極端值的對稱分布變量的平均水平,這時均數(shù)位于分布的中心位置。
單組設計一元定量資料t檢驗,實際上是推斷該樣本來自總體均數(shù)μ與某一已知總體均數(shù)μ(0常為理論值或標準值)有無差別。零假設H0:μ=μ0,備擇假設H1:μ≠μ0;檢驗水準:α=0.05。
單組設計一元定量資料t檢驗的檢驗統(tǒng)計量為:
式(3)中,分子是樣本均數(shù)與零假設中μ0的差距,分母是樣本均數(shù)的標準誤,t統(tǒng)計量實為用標準誤來度量的樣本均數(shù)與μ0的差距。這個差距小,將傾向于接受零假設;這個差距大,將傾向于拒絕零假設。數(shù)學家已證明:式(3)定義的檢驗統(tǒng)計量t是服從自由度為n-1的t分布的隨機變量。故可以依據實際計算出來的t檢驗統(tǒng)計量的數(shù)值以及t分布,做出接受或拒絕零假設的決定[6]。
配對設計一元定量資料的分析著眼于每一對中兩個觀察值之差d,這些差值構成一組資料,用t檢驗推斷差值的總體均數(shù)是否為“0”。檢驗假設為:
H0:μd=0,即差值的總體均數(shù)為0;H1:μd≠ 0,即差值的總體均數(shù)不為0;檢驗水準:α=0.05。
當H0成立時,檢驗統(tǒng)計量為:
將受試對象隨機分為兩組,每一組接受一種處理(注意:對照組也可被視為一種處理)。一般把這樣獲得的兩組定量資料視為代表兩個總體的兩個獨立樣本,據此推斷它們的總體均數(shù)是否相等。此類檢驗也基于t分布,必需假定定量資料應滿足獨立性、正態(tài)性和方差齊性。
2.3.1 兩樣本所屬總體方差相等,即具有方差齊性
檢驗統(tǒng)計量為:
式(5)中的分子是兩個樣本均數(shù)之差,分母是樣本均數(shù)之差的標準誤,檢驗統(tǒng)計量t實為用標準誤度量的均數(shù)之差。
可以證明,當H0成立時,這個檢驗統(tǒng)計量服從自由度為v=n1+n2-2的t分布。
根據式中算得檢驗統(tǒng)計量的數(shù)值后,利用這個t分布可得相應的P值。同樣,依據實際計算出來的t檢驗統(tǒng)計量的數(shù)值以及t分布(自由度為n1+n2-2),給定一個小概率α作為檢驗水準,如果與t值相應的P值小于給定的α,拒絕H0;否則,不拒絕H0。
2.3.2 兩樣本所屬總體方差不等
此時,可采用t'作為檢驗統(tǒng)計量:
式(6)中,分子仍是兩樣本均數(shù)之差,分母是均數(shù)之差的標準誤,t'仍是用標準誤度量的均數(shù)之差。
H0成立時,t'的分布比較復雜,可用如下自由度的t分布來近似t'的分布。
利用該式算得統(tǒng)計量t'的數(shù)值后,據此近似的t分布可以得到相應的P值。同樣,給定一個小概率α作為檢驗水準,如果與t值相應的P值小于給定的α,拒絕H0;否則,不拒絕H0。
【例1】大量研究顯示,正常人的血清鈣標準值是2.50 mmol/L,現(xiàn)有20名骨質疏松患者的血清鈣測量值如下(單位:mmol/L):2.39、2.41、2.47、2.28、2.19、2.50、2.37、2.49、2.18、2.09、2.29、2.34、2.55、2.27、2.31、2.39、2.29、2.20、2.41、2.42。試比較骨質疏松患者血清鈣與正常人是否不同。
SAS程序如下:
【程序說明】創(chuàng)建名為calcium的數(shù)據集,首先調用UNIVARIATE過程進行正態(tài)性檢驗,VAR語句后面的變量為待檢驗的血清鈣測量值,然后調用TTEST過程,設置評價指標的理論均值h0為2.50。
【主要輸出結果及解釋】正態(tài)性檢驗的結果W=0.9785,P=0.9136,可以認為評價指標的測定值符合正態(tài)性的要求。t檢驗結果如下:t=-5.87,P<0.0001,骨質疏松患者血清鈣均值與正常人不同,骨質疏松患者血清鈣濃度均值2.34 mmol/L低于正常人血清鈣濃度均值2.50 mmol/L。
【例2】采集10只正常成年大耳白兔下肢骨標本,共10對脛骨,行三點彎力學測試。從實驗兔脛骨三點彎載荷撓度曲線得最大撓度,見表1。試比較雙側脛骨最大撓度是否不同。表1資料對應的實驗設計類型為自身配對設計。
表1 10只家兔雙側脛骨最大撓度
SAS程序如下:
【程序說明】創(chuàng)建名為bending的數(shù)據集。首先生成一個新的變量d,代表每對中同一評價指標取值的差量;調用UNIVARIATE過程對其進行正態(tài)性檢驗;然后調用TTEST過程。與單組設計一元定量資料t檢驗的區(qū)別是,PAIRED語句后面為變量的對子,對子間用*連接。
【主要輸出結果及解釋】差值d正態(tài)性檢驗的結果為W=0.8808,P=0.1334,可以認為符合正態(tài)性的要求,t檢驗結果如下:t=0.03,df=9,P=0.9748,雙側脛骨最大撓度均值之間差異無統(tǒng)計學意義。
【例3】在一項氯氮平血濃度對白細胞總數(shù)的影響的研究中[7],研究者選取受試組28例,給予氯氮平治療,對照組28例,比較受試組治療一周末與三周末的血藥濃度是否存在差異。假設測定的患者血藥濃度(單位:μg/L)如下。治療一周末血藥濃度:49、417、229、342、445、700、273、50、286、212、516、444、334、176、170、434、791、219、384、213、96、327、217、16、256、438、102、495;治療三周末血藥濃度:1189、517、534、293、708、588、374、691、694、1025、278、611、854、597、721、479、530、755、610、583、672、71、194、457、132、570、721、421。試分析兩組受試者血藥濃度差異是否有統(tǒng)計學意義。
SAS程序如下:
【程序說明】創(chuàng)建名為blood的數(shù)據集,設置分組變量g,利用循環(huán)語句DO-END分別輸入兩組變量值。調用UNIVARIATE過程分別對兩組定量數(shù)據進行正態(tài)性檢驗,CLASS語句后加分類變量。然后,調用TTEST過程,與前兩種t檢驗的程序相比,增加了CLASS語句。
【主要輸出結果及解釋】兩組定量資料均符合正態(tài)性的要求(一周末:W=0.9558,P=0.2757;三周末:W=0.9687,P=0.5463)。方差齊性檢驗的結果:F=1.75,P=0.1542,符合方差齊性的要求。t檢驗的結果見表2。t檢驗結果:t=-4.42,P<0.0001,兩組血藥濃度均值不同,治療一周末血藥濃度均值308.3 μg/L低于三周末血藥濃度均值566.8 μg/L。
表2 成組設計一元定量資料t檢驗分析結果
數(shù)據的集中位置表示大多數(shù)觀測值所在的中心位置。算術均數(shù)是一個良好的描述集中位置的指標,具有計算簡單、簡明易解等優(yōu)點。但每個數(shù)據或大或小的變化都會對均數(shù)造成影響。因此,均數(shù)更適用于描述呈正態(tài)分布數(shù)據的集中位置。在實際應用中,均數(shù)常和標準差相結合用于描述數(shù)據的集中趨勢和離散程度。
t檢驗是在統(tǒng)計學中較常應用于定量資料差異性分析的一類假設檢驗方法。值得注意的是,對于定量資料而言,在數(shù)據分析時,應先考察該數(shù)據是否符合t檢驗的應用條件:①結合調查研究方式及樣本來源等判斷是否符合隨機樣本的要求;②調用UNIVARIATE過程進行正態(tài)性檢驗,若數(shù)據為非正態(tài)分布,則考慮采用變量變換的方式使其滿足正態(tài)或采用非參數(shù)假設檢驗的方法;③在對成組設計一元定量資料進行分析時,對于正態(tài)分布的數(shù)據,要求其兩總體方差相等,即滿足方差齊性,若經檢驗方差不齊,則可使用t'檢驗。
此外,應根據專業(yè)知識確定選擇單側檢驗還是雙側檢驗。對于單因素k水平設計的定量資料或多因素設計的定量資料,應嚴格檢查是否滿足參數(shù)檢驗的前提條件,進而選擇合適的檢驗方法[2]。
本文基于3個實例,采用SAS軟件實現(xiàn)了對單組設計、配對設計和成組設計下一元定量資料的t檢驗。在此過程中,借助直觀判斷法,考察了“獨立性”的前提條件;借助UNIVARIATE過程中的選項“NORMAL”實現(xiàn)了正態(tài)性檢驗;借助TTEST過程中自身帶有的方差齊性檢驗功能,實現(xiàn)了方差齊性檢驗。此外,還交代了基于均值比較的t檢驗的基本原理和應用時的注意事項。