劉方針
(黑龍江醫(yī)藥科學編輯部,黑龍江 佳木斯 154003)
統(tǒng)計資料分析方法的選擇,是我們醫(yī)學研究者應該掌握的基本常識。如果選擇不當,不僅影響實驗研究的結(jié)果,也可能對工作實踐起誤導作用。所以說,統(tǒng)計資料分析方法的選擇至關(guān)重要?,F(xiàn)就常見統(tǒng)計資料分析方法的選擇簡述如下。
目前對資料的分類大致為兩類[1]:即數(shù)值變量和分類變量,也就是以往的計量資料和計數(shù)資料。也有文獻分出第三種資料 ,即等級資料[2],但我認為,等級資料可以歸類于計數(shù)資料,因為等級資料的統(tǒng)計分析方法多與計數(shù)資料一致。
計量資料或稱數(shù)值變量,為測定每個觀察單位指標大小而獲得的資料,系定量指標,多有計量單位。如身高(厘米)、體重(公斤 )、血壓(毫米汞柱)等。這類資料據(jù)其分布可大致分為正態(tài)資料、偏態(tài)資料、成倍數(shù)資料。資料分布不同則統(tǒng)計分析方法不同,所以,資料到手后,先分析資料的分布情況,然后選擇適宜的統(tǒng)計分析方法。
成倍數(shù)資料是指資料的觀察值相差較大,有的成倍數(shù)分布,較簡單明了,一看便知。如臨床檢驗的抗體滴度、生物效價等。這類資料可計算其幾何均數(shù),如資料是樣本與總體比較,可選擇樣本幾何均數(shù)與總體幾何均數(shù)比較的檢驗方法,如是樣本之間比較,可選擇樣本之間幾何均數(shù)比較的檢驗方法。其具體步驟請參考相應工具書。
正態(tài)資料一般來說是分布相對均勻的資料,即頻數(shù)分布以均數(shù)為中心,左右側(cè)數(shù)據(jù)分布基本對稱,靠近均數(shù)兩側(cè)頻數(shù)較多,離均數(shù)愈遠頻數(shù)愈少,形成一個中間數(shù)據(jù)多、兩側(cè)數(shù)據(jù)逐漸減少、基本對稱的分布。符合上述條件的資料,基本可以確定為正態(tài)資料,必要時可以對資料進行正態(tài)性 D檢驗,以確定資料分布。正態(tài)資料多計算均數(shù)和標準差。樣本與總體、或樣本之間的比較,可進行相應的 U檢驗或 t檢驗 ,兩樣本或多樣本之間比較可進行 t檢驗或方差分析。多變量(多指標)間資料可以進行多元分析。
偏態(tài)資料不像正態(tài)資料那樣分布均勻,而是分布不均勻,可能數(shù)據(jù)集中于小值一側(cè)或大值一側(cè),即數(shù)據(jù)分布較離散。偏態(tài)資料計算中位數(shù)(M),同時給出范圍值(最小-最大)。對這類中位數(shù)資料可進行中位數(shù)間的比較,如樣本中位數(shù)與總體中位數(shù)、樣本中位數(shù)之間的比較。此類資料亦多用秩和檢驗(此法簡單實用,不考慮資料的分布型),也可用超過數(shù)檢驗(此法精確度差)。
計數(shù)資料亦稱定性資料或分類變量,是對觀察指標按某種屬性或類別分組計數(shù)所得的資料,如按年齡、性別、病情、(輕、中、重 )、療效 (痊愈、顯效、好轉(zhuǎn)、有效 )等。此類資料可計算率或構(gòu)成比,即計算相對數(shù)。根據(jù)資料的不同,如樣本率與總體率的比較、樣本率之間的比較,可選擇相應的 U檢驗或t檢驗,亦可選擇卡方檢驗(由于資料不同 ,具體公式不同,如四格資料、配對資料、多行多列資料,應據(jù)具體資料選擇相應公式。)、秩和檢驗、Ridit分析等。其中卡方檢驗比較常用 ,且簡便快捷。
統(tǒng)計分析方法的種類繁多,初學者在分析方法的選擇上常不知所措。本文旨在為初學者在統(tǒng)計資料分析方法的選擇上起到相應作用,這些是基本的、也是常用的方法,僅供參考。
[1]四川醫(yī)學院主編.衛(wèi)生統(tǒng)計學 [M].北京:人民衛(wèi)生出版社,1978,13
[2]孫振球.醫(yī)學統(tǒng)計學[M].北京:人民衛(wèi)生出版社,2002,2