○ 文/司效東
在醫(yī)學(xué)研究中常常會(huì)遇到選擇樣本量的問題。醫(yī)學(xué)研究者一般都缺乏概率論和數(shù)理統(tǒng)計(jì)方面的背景知識(shí),所以在研究中對(duì)這個(gè)問題重視不夠,選擇研究的樣本量具有很大的隨機(jī)性,因此代表性和準(zhǔn)確性較差。特別是動(dòng)物實(shí)驗(yàn)。其實(shí)這個(gè)問題在科學(xué)研究中非常重要,它影響到研究過程的嚴(yán)謹(jǐn)性及研究結(jié)論的可靠性??蒲姓n題的建立其實(shí)就是一個(gè)醫(yī)學(xué)科研設(shè)計(jì)的過程,在這個(gè)過程中涉及很多問題,其中很重要的問題就是樣本量大小的確定,正確選擇樣本量,直接影響最終科研結(jié)論的可靠性。本文就樣本量選擇的意義及一些簡(jiǎn)單的方法進(jìn)行闡述。
樣本量是指總體中抽取的樣本元素的總個(gè)數(shù),應(yīng)用于統(tǒng)計(jì)學(xué)、數(shù)學(xué)、物理學(xué)等學(xué)科。樣本量大小是選擇檢驗(yàn)統(tǒng)計(jì)量的一個(gè)要素。由抽樣分布理論可知,在大樣本條件下,如果總體為正態(tài)分布,樣本統(tǒng)計(jì)量服從正態(tài)分布;如果總體為非正態(tài)分布,樣本統(tǒng)計(jì)量漸近服從正態(tài)分布。
合理確定樣本量的意義:
第一,樣本量過大,會(huì)增加調(diào)查工作量,造成人力、物力、財(cái)力、時(shí)間的浪費(fèi);
第二,樣本量過小,則樣本對(duì)總體缺乏足夠的代表性,從而難以保證推算結(jié)果的精確度和可靠性;
第三,樣本量確定的科學(xué)合理。一方面,可以在既定的調(diào)查費(fèi)用下,使抽樣誤差盡可能小,以保證推算的精確度和可靠性;另一方面,可以在既定的精確度和可靠性下,使調(diào)查費(fèi)用盡可能少,保證抽樣推斷的效果最好。
樣本量的估計(jì)是臨床研究科學(xué)設(shè)計(jì)的重要內(nèi)容。任何科學(xué)研究都要具有可重復(fù)性原則,其目的是要排除偶然因素的影響,得出科學(xué)的、真實(shí)的、規(guī)律性的結(jié)論。在臨床研究中,樣本量越小,抽樣誤差越大;若樣本量不足,可重復(fù)性差,檢驗(yàn)效能低,不能排除偶然因素的影響,其結(jié)論就缺乏科學(xué)性及真實(shí)性;若樣本量過大,實(shí)驗(yàn)條件難以控制,容易造成人力、物力和時(shí)間上的浪費(fèi)。估計(jì)樣本量的目的就是在保證某個(gè)臨床試驗(yàn)或臨床研究的結(jié)論具有科學(xué)性、真實(shí)性、可靠性的前提下,同時(shí)考慮到醫(yī)學(xué)研究所限定的條件,確定某研究所需要的最小觀察例數(shù)。
樣本量越大,越能反應(yīng)總體特征。當(dāng)給定置信水平時(shí),樣本量越大,誤差區(qū)間越小,然而這個(gè)關(guān)系并不是線性的,樣本量增大兩倍,并不一定能將誤差區(qū)間減少一半。同時(shí),樣本量也不能低于某一個(gè)數(shù)量下限。
可以根據(jù)設(shè)計(jì)方案、資料類型及可能涉及的統(tǒng)計(jì)學(xué)方法來選擇樣本量的計(jì)算方法,也可以利用統(tǒng)計(jì)軟件來完成樣本量的計(jì)算。由于估算的樣本量是最少需要量,考慮受試者可能有不合作者、中途失訪、意外死亡等情況,而減少有效觀察的例數(shù),因此應(yīng)該在估算的樣本量基礎(chǔ)上增加若干樣本例數(shù)。
目前,醫(yī)學(xué)研究樣本量的選擇主要遵循對(duì)照、隨機(jī)與重復(fù)三個(gè)原則,在結(jié)合統(tǒng)計(jì)學(xué)的基礎(chǔ)上,通過公式計(jì)算或查表獲得。國內(nèi)有關(guān)書籍提供的樣本量計(jì)算公式,主要適用于臨床試驗(yàn),并不適用動(dòng)物實(shí)驗(yàn)。動(dòng)物實(shí)驗(yàn)的樣本量可以參考臨床試驗(yàn)的樣本量,并在此基礎(chǔ)上適當(dāng)減少其樣本例數(shù)。理論上,研究者可以保證除干預(yù)以外的其他因素在不同組間完全均衡,也就是完全可以保證所有的實(shí)驗(yàn)動(dòng)物如實(shí)驗(yàn)鼠的基因型、體重等完全一致,即在實(shí)驗(yàn)干預(yù)之前所有的實(shí)驗(yàn)動(dòng)物之間不存在變異,所以對(duì)樣本量不做特別要求。研究者只需考慮在研究過程中動(dòng)物死亡的損耗率,適當(dāng)增加樣本例數(shù)即可。
確定樣本量方法有以下兩種:第一,根據(jù)允許的抽樣誤差范圍確定樣本量。如在excel里設(shè)置α、p和△的值;計(jì)算累積機(jī)率值;選擇“NORMINV”函數(shù);計(jì)算Z值,計(jì)算樣本量。第二,根據(jù)特定目的確定樣本量。 1.若將一個(gè)樣本分成不同的組,要保證每組的樣本量都不能低于100;2.當(dāng)每組樣本還需按不同的特性或配額劃分成更小的組時(shí),要保證每個(gè)小組的樣本量至少在20-50之間;確定樣本量要考慮樣本結(jié)構(gòu)、精度要求、調(diào)研經(jīng)費(fèi)以及總體特征易變性等因素。如果總體易變性強(qiáng),或者個(gè)體之間的差異性大的時(shí)候,則需要適當(dāng)增加樣本量。
在醫(yī)學(xué)研究中樣本量的準(zhǔn)確確定是一個(gè)難點(diǎn)。
必須考慮到,醫(yī)學(xué)研究的成組設(shè)計(jì)。應(yīng)盡可能采用樣本量相等的設(shè)計(jì),尤其是多組設(shè)計(jì)時(shí),一般要求各組的樣本量相等,只有在某些特殊情況下才考慮各組的樣本含量不相等。
必須考慮到,在足夠樣本的前提下,滿足樣本選擇的隨機(jī)性所需要的最小樣本量,以提高樣本的均衡性,不能把隨便、隨意當(dāng)作隨機(jī),使研究結(jié)果不可信。
必須考慮到,不同醫(yī)學(xué)條件下的樣本量選擇。由于醫(yī)學(xué)研究樣本的特殊性,按照不同條件增加最低樣本量;樣本量過少要適當(dāng)?shù)脑黾訕颖玖?,使結(jié)果具有可靠性。