蘭州大學公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學研究所 申希平 祁海萍 劉小寧
Friedman M檢驗平均秩的多重比較在SPSS軟件的實現(xiàn)*
蘭州大學公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學研究所 申希平 祁海萍 劉小寧△
△通信作者:劉小寧,E-mail:liuxn@lzu.edu.cn
完全隨機區(qū)組設計的秩和檢驗(Friedman’s test)是隨機化區(qū)組設計方差分析不滿足方差分析條件時采用的方法。隨機化區(qū)組設計的秩和檢驗是由M·Friedam在符號檢驗的基礎上提出來的,又稱M檢驗,目的是推斷各處理組樣本分別代表的總體分布是否不同〔1〕。對于Friedman M檢驗,在當P<α(α為檢驗水準)差異有統(tǒng)計學意義時,可認為多個總體間相比較有差異,但不能說明任何兩個總體間均是有差異的。通常,研究者更想知道究竟是哪兩個組之間有差異,哪兩個組之間無差異,此時需要做多重比較。目前,尚無書籍或文獻介紹Friedman M檢驗的組間兩兩比較在SPSS軟件中的實現(xiàn)過程〔2-3〕。本研究的目的是通過SPSS中的菜單操作(限于SPSS18.0及以上版本)和編寫程序兩種方式,實現(xiàn)Friedman M檢驗的組間多重比較。
實例〔4〕:8名受試對象在相同實驗條件下分別接受4種不同頻率聲音的刺激,他們的反應率(%)資料見表1。問4種頻率聲音刺激的反應率是否有差別?
表1 8名受試對象對4種不同頻率聲音刺激的反應率(%)比較
1.將數(shù)據(jù)輸入SPSS 19.0軟件,輸入格式見表2。
2.Friedman M檢驗。步驟為:
(1)Analysis→Nonparametric Test→Related Samples…,彈出 Nonparametric Tests:Two or More Related Samples對話框。
表2 實例數(shù)據(jù)輸入格式
(2)在Fields標簽中,將變量“頻率A、頻率B、頻率C、頻率”移入Test Fields:欄中。
(3)在Settings標簽中,左邊的Select an item:欄中選擇Chosen Tests,右邊選擇Customize tests,復選框中勾選 Friedman’s 2-way ANOVA by Ranks(k samples),multiple comparisons:下拉框選擇 All pairwise。
(4)點擊Run按鈕,即可得到運行結果。
(5)點擊運行結果“Hypothesis Test Summary”并單擊右鍵,選擇Edit Content→In Separate Window,結果窗口將變?yōu)镸odel Viewer窗口(圖1)。
(6)從該窗口可得到:Friedman M檢驗M=15.152,自由度=3,P=0.002,說明不同頻率的反應率有差異。需進行兩兩比較;頻率A的平均秩MRA=1.38,MRB=2.00,MRC=2.94,MRD=3.69。
(7)在該窗口下方的View:下拉菜單中選擇Pairwise Comparisons,則出現(xiàn)兩兩比較結果(表3)。
(8)由表3的概率(Sig.列)可得:頻率A和頻率C,D有差異,頻率B和頻率D有差異(P<0.05);由調整概率(Adj.Sig列)可得:僅頻率A和頻率D有差異(P=0.002)。
多個相關樣本兩兩比較的q檢驗〔4〕,公式為:
圖1 Model Viewer窗口
表3 兩兩比較結果
(1)打開SPSS的程序編輯窗口(syntax Editor,F(xiàn)ile→New→Syntax),輸入表4程序。
第1行:變量定義。
Num:行的編號。最大值(本例為6)可理解為兩兩比較次數(shù)。
表4 多個相關樣本兩兩比較的q檢驗
n:區(qū)組數(shù),也即樣本含量。本例n=8。
g:處理組數(shù)。本例g=4。
g_MeanRank:每組平均秩。
I_MeanRank:第I組平均秩。
J_MeanRank:第J組平均秩。
第2行:輸入數(shù)據(jù)。
第3~4:計算比較兩組的秩和。公式為Ri=n*平均秩。
第5~14:計算公式(2)中的∑R2i。
第16行:按照公式(2)計算MS誤差。
第17行:按照公式(1)計算q值。
第19行:將運行結果刪除不需要的中間結果后保存在‘d:/friedman.sav’。
第20行:打開‘d:/friedman.sav’數(shù)據(jù)文件。見表5。
運行結果中q值的結果與文獻〔4〕的結果基本一致。查q界值表,所得結論與文獻〔4〕完全一致。
表5 多個相關樣本q檢驗程序運行結果
菜單操作方式的分析結果提供了2個概率值,即直接運算結果概率和調整的概率P(Adj.P)。程序操作按照文獻中多個相關樣本兩兩比較的q檢驗公式的計算過程編寫程序,其運行結果與軟件菜單操作的結果基本一致,與文獻〔4〕查q界值表得到的概率更為接近(表6)。
表6 菜單方式與程序方式結果比較
Friedman M 檢驗平均秩的多重比較,在SPSS18.0及以上版本中已經可以通過菜單操作實現(xiàn),但在低版本中無法得到多重比較的結果。本研究通過編程方式進行Friedam M檢驗的多重比較,結果與高版本菜單運行結果一致,很好地解決了SPSS軟件對Friedam M檢驗的多重比較問題。
結果顯示,SPSS編程方式和菜單操作結果稍有不同,如頻率B與C的比較結果不一致。這是因為兩者所用的兩兩比較的方法不同。在編程方式中,秩次間的多重比較用的是SNK-q檢驗。而SPSS菜單方式中,統(tǒng)計量的構建如下〔5〕:
如在表3的運行結果中,頻率A與頻率B“Test Statistic”的值為兩平均秩次之差(1.38-2.00=-0.625),為公式(3)的分子,“Std Error”的值計算公式見公式(4),為0.645,因此“Std.Test Statistic”的值為TAB=-0.625/0.645=-0.968,TAB服從標準正態(tài)分布,利用 SPSS提供的 CDF.NORMAL(Z,0,1)函數(shù)可以計算出P=2*(1-φ|Z|)=0.3482,與0.333接近。同時,為減少I類錯誤的發(fā)生概率,對概率P進行調整,調整的概率公式為:P*=P*g(g-1)/2。對于頻率A與B比較的調整概率值為0.33*4(4-1)/2=1.98>1,故直接置為1〔5〕。與直接計算的概率值相比較,調整后的概率值皆偏大,這主要是由于考慮到隨著兩兩比較次數(shù)的增加,發(fā)生I類錯誤的概率會增加,研究者在下結論時,可結合專業(yè)知識進行權衡。
1.顏虹主編.醫(yī)學統(tǒng)計學第2版.北京:人民衛(wèi)生出版社,2010:178-179.
2.孫紅衛(wèi),王玖,韓春蕾.基于Monte Carlo模擬的非參數(shù)多重比較方法評價.中國衛(wèi)生統(tǒng)計,2011,28(5):501-504.
3.胡小剛,陳劍鴻,劉鳳軍,等.基于Matlab的Kruskal-Wallis和Nemenyi檢驗的界面實現(xiàn).中國衛(wèi)生統(tǒng)計,2011,28(4):466-467.
4.孫振球主編.醫(yī)學統(tǒng)計學第3版.北京:人民衛(wèi)生出版社,2010:142-145.
5.SPSS 19.0 幫助文件.鏈接為:http://127.0.0.1:2072/help/index.jsp?topic=/com.ibm.spss.statistics.help/alg_introduction.htm.
.蘭州大學中央高校基本科研業(yè)務費專項資金(lzujbky-2010-192)
(責任編輯:丁海龍)