李黎 ,唐雨欣 ,何偉 ,張韜 ,李吉杰
1.四川大學華西第二醫(yī)院病案管理科,四川成都 610041;2.四川大學華西公共衛(wèi)生學院,四川成都 610041
近年來,我國新藥上市評審機制日益規(guī)范,對藥物臨床試驗生物統(tǒng)計工作的指導和規(guī)范也更加嚴格。2016年6月3日起正式執(zhí)行的新版 《藥物臨床試驗的生物統(tǒng)計學指導原則》[1],是在上一版的基礎上,根據(jù)當前國際公認原則和共識理念,并適當體現(xiàn)近年來生物統(tǒng)計學的發(fā)展趨勢而制定的。但該文件過于凝練,部分內(nèi)容缺少細節(jié)描述,容易造成臨床醫(yī)生理解不到位,使得該文件的指導和規(guī)范意義降低[2]。并且很多臨床醫(yī)生對于樣本量估計的公式選擇或者軟件應用存在一定困惑,導致估算的樣本量不夠準確[3]。該文對臨床試驗中常用類型的樣本量估計方法進行系統(tǒng)研究,包括各類樣本量估計的適用條件、所需參數(shù)、公式計算等,旨在對研究者在研究設計時提供適宜方法估計樣本量,提高研究質(zhì)量。常用臨床試驗樣本量估計分類[4]:臨床試驗的比較類型分為以0為參照的差異性檢驗和以Δ為參照的檢驗,以Δ為參照的檢驗又分為優(yōu)效性檢驗、等效性檢驗、非劣效性檢驗。按資料類型可分為計量資料和計數(shù)資料,按參數(shù)檢驗方法可分為均數(shù)比較或非參數(shù)檢驗、率的比較等,按試驗組數(shù)可分為單組、兩組或多組;該文將從以上幾個方面進行對常用臨床試驗的樣本含量估計方法進行闡述。
單組均數(shù)的差異性檢驗常用單樣本的t檢驗或基于差值均數(shù)的配對t檢驗和單因素重復測量方差分析等。另外還有等效性配對t檢驗。樣本含量計算公式如下:
此公式適用雙側檢驗,其中Zα/2為標準正態(tài)分布的雙側臨界值;若為單側檢驗,可改成單側臨界值;無論是雙側還是單側檢驗,Zβ均取單側臨界值[5]。若為配對比較,σ可取σd,若用S估計則可取Sd[6]。上述公式也可用于交叉設計的樣本含量估計[7]。
例如:為了解某藥對心率的影響,隨機抽取10名受試者做預試,測得標準差S=6.2次/分。若受試者心率高于普通人群3.0次/分認為有專業(yè)意義,α=0.05,β=0.10,需要多大樣本含量?
本例 S=6.2 次/分,δ=3.0 次/分。 現(xiàn) α=0.05,β=0.10,均取單側,查 Ζ 臨界值表得 Ζα=Ζ0.05=1.645,Ζβ=Ζ0.10=1.282,代入上式得N≈37。故需37位受試者,才有90%的概率發(fā)現(xiàn)該藥對心率的影響。
兩組均數(shù)比較常用兩樣本的t檢驗或秩和檢驗和兩組重復測量方差分析、交叉設計的方差分析。樣本含量估計方法可分為非劣效性檢驗、等效性檢驗和優(yōu)效性檢驗[8]。
①非劣效性檢驗兩樣本均數(shù)比較的樣本量估計公式如下[9]:
式中 δ=μ1-μ2,為兩總體均數(shù)的差值,μ1和 μ2分別為試驗組和對照組的總體均數(shù)。Δ為非劣效性界值。σ為兩總體合并標準差。Zα,Zβ為標準正態(tài)分布的單側臨界值;Q1和 Q2為樣本比例,Q1=n1/N,Q2=n2/N[7]。
②等效性檢驗兩樣本均數(shù)比較的樣本量估計公式如下[10]:
③優(yōu)效性檢驗兩樣本均數(shù)比較的樣本量估計公式如下[11]:
式中 δ=μ1-μ2,為兩總體均數(shù)的差值,μ1和 μ2分別為試驗組和對照組的總體均數(shù)。Δ為優(yōu)效性界值。σ為兩總體合并標準差。其他符號同前。
多組均數(shù)比較的差異性檢驗常用方差分析。樣本含量估計公式如下[12]:
例如:某研究欲比較3種方案治療嬰幼兒貧血患者(血紅蛋白<100 g/L)后,血紅蛋白變化有無差異,3組各需觀察多少例。預試驗:將隨機抽取嬰幼兒貧血患者(血紅蛋白<100 g/L)均分為3組,分別采用3種方案治療后血紅蛋白增加的均數(shù)Xi分別為18.5 g/L、13.2 g/L、10.4 g/L, 標準差 Si為 11.8 g/L、13.4 g/L、9.3 g/L。參數(shù):
①α:為檢驗水平,本例取α=0.05
②β:為檢驗效能,本例取β=0.10
③K:為組數(shù),本例K=3。
④Ψ:該例K=3,自由度V1=K-1=2;自由度V2=N-1,N 未知,可取最大 ∞,查 α=0.05,β=0.10 時的 Ψ值表得:Ψ(α,β,K-1,∞)=2.52。
⑤:分別為第i組的均數(shù)(X1=18.5、X2=…)和標準差(S1=11.8,S2=…)的估計值,由預試驗或文獻來估計。
⑥X均的確定:X均=(X1+X2+X3)/K=(18.5+13.2+10.4)/3=14.0
代入計算出樣本例數(shù):n≈51。
單組率的比較常用單樣本或配對設計的χ2檢驗和或確切概率檢驗,樣本含量估計公式如下:
適用于大樣本情形,Zα/2和 Zβ同前其中π0為已知的總體概率,π1為預期實驗結果的總體概率[13]。
例如:用常規(guī)方法治療過敏性鼻炎的有效率為85%,現(xiàn)試驗新藥預計有效率為95%。若α=0.05(單側),β=0.10,問需多少病例?
兩組率的比較常用兩樣本的χ2檢驗、構成比檢驗或CMH檢驗,可分為非劣效性檢驗、等效性檢驗和優(yōu)效性檢驗。
①非劣效性檢驗兩樣本率比較的樣本量估算公式如下[14]:
式中Zα,Zβ為標準正態(tài)分布的單側臨界值。π1和π2分別為試驗組和對照組的陽性概率。πc為兩總體合計概率,πC=Q1π1+Q2π2。 Q1和 Q2為樣本比例,Q1=n1/N,Q2=n2/N。 δ=π1-π2。 Δ 為非劣效性界值。
例如:為研究某藥物治療手足廯的療效,擬采用陽性藥物做對照的非劣效性試驗。主要指標為臨床治愈率,已知對照藥的治愈率為85%,試驗藥的治愈率為80%,在一項隨機對照試驗中如果試驗藥比對照藥最多差10%則可被接受。設α=0.025(單側),β=0.20,Q1=Q2=0.5,則需要的例數(shù)為:
即每組需要n1=n2=Q1N=0.50×1181≈906例。
②等效性檢驗兩樣本率比較的樣本量估計公式如下[15]:
式中Zα/2和Zβ/2為標準正態(tài)分布的雙側臨界值。為等效性界值。其他符號同前。
③優(yōu)效性檢驗兩樣本率比較的樣本量估計[16]:
說明:與非劣效性試驗的公式相仿,只是分母由δ+Δ變成了δ-Δ,且Δ由非劣效性界值換成了優(yōu)效性界值(當Δ=0時,樣本量估計公式與通常的差異性檢驗的意義相同)[14]。其他符號同前。
多組率的比較的差異性檢驗常用列聯(lián)表的χ2檢驗、線性趨勢檢驗和構成比的比較等。樣本含量估計公式如下[17]:
注意,該公式中出現(xiàn)反正弦函數(shù),以對樣本率進行以弧度為單位的反正弦被換,從而解決該類資料的率向兩側偏離的偏態(tài)現(xiàn)象[15]。其中,λ根據(jù)檢驗水平α,檢驗效能 β,和設計的組數(shù)查值表可得,即 λα,β,K-1;Pmax、Pmin:分別為最大率和最小率,根據(jù)預試驗或查文獻來估計。
例如:比較矯治近視的3種方法的效果有無差異,問需觀察多少例?預試驗:采用3種方法矯治近視,結果A方法有效率為37.78%,B方法為18.75%,C方法為27.78%。
參數(shù):
①α:檢驗水平,本例取α=0.05;
②β:檢驗效能,本例取β=0.10;
③K:設計的組數(shù),本例K=3;
④λ:查 α=0.05 時的 λ 值表得,λ(α,β,K-1)=12.65;
⑤SIN-1:反正弦函數(shù),若用Excel函數(shù)計算0.5的反正弦值:=ASIN(0.5)
⑥Pmax、Pmin:分別為最大率和最小率,根據(jù)預試驗或查文獻來估計。該例Pmax=0.3778,Pmin=0.1875。代入計算得樣本例數(shù)n≈138。
樣本含量對于臨床研究的作用應受到足夠的重視,若樣本含量被高估,可能導致醫(yī)藥研發(fā)投入更多的人力、物力和財力以及研究時間。若樣本含量被低估,抽樣誤差大,觀察指標穩(wěn)定性低,檢驗效能低;得到陰性結論時難以判斷是檢驗效能過低導致未能檢測出總體實際存在的差異還是差異確實沒有統(tǒng)計學意義[18]。
綜上所述,各種不同類型的臨床試驗需要考慮不同的樣本含量計算方法以估算合適的樣本量。