陸夢潔 劉玉秀 繆華章 鐘偉華 李永昌
南方醫(yī)科大學(xué)南京臨床醫(yī)學(xué)院(南京軍區(qū)南京總醫(yī)院)(210002)
Bland-Altman一致性評價的樣本含量估計*
陸夢潔 劉玉秀△繆華章 鐘偉華 李永昌
南方醫(yī)科大學(xué)南京臨床醫(yī)學(xué)院(南京軍區(qū)南京總醫(yī)院)(210002)
目的 兩種定量測量方法的一致性評價普遍采用Bland-Altman方法,但有關(guān)其樣本含量的估計迄今未見報道。本文初步探討B(tài)land-Altman一致性評價的樣本含量估計方法。方法 根據(jù)Bland-Altman方法采用LoA可信區(qū)間進(jìn)行一致性推斷的原理,對相應(yīng)的樣本含量公式進(jìn)行了理論推導(dǎo),并借助Monte-Carlo模擬方法對計算公式進(jìn)行了正確性驗證。通過事先確定α和β水平,采用導(dǎo)出的公式計算出兩方法測量結(jié)果差值總體均數(shù)不同水平下的樣本含量,并分別模擬獲得相應(yīng)樣本含量下的把握度。結(jié)果 模擬獲得的把握度與事先給定的β水平能夠很好地吻合,驗證了計算公式的正確性。結(jié)論 本文導(dǎo)出的樣本含量計算公式可以用于Bland-Altman一致性評價研究。
Bland-Altman一致性 樣本含量 把握度 Monte-Carlo模擬
在醫(yī)藥衛(wèi)生領(lǐng)域定量方法比較研究中,經(jīng)常會采用 Bland-Altman方法進(jìn)行一致性評價,進(jìn)而判定方法間的可互換性。然而,該方法迄今仍未解決樣本含量估計問題。Bland曾有過一些推薦,認(rèn)為采用Bland-Altman分析的樣本含量最好達(dá)到100例[1],但并未形成具體的方法。Bland-Altman方法的實際應(yīng)用表明,一致性評價在設(shè)計時普遍缺少樣本含量估計[2]。本文擬根據(jù)Bland-Altman方法LoA的可信區(qū)間估計公式,結(jié)合統(tǒng)計推斷原理,對相應(yīng)的樣本含量計算公式進(jìn)行理論推導(dǎo),并借助Monte-Carlo模擬方法驗證公式的正確性。
兩種方法同時對個體進(jìn)行一次測量的Bland-Altman方法,其應(yīng)用有三個假定:一是差值的平均趨勢在測量范圍內(nèi)保持不變(constant bias);二是差值的散布程度在測量范圍內(nèi)保持一致(no proportional bias);三是差值的分布呈正態(tài)分布(normality)。測量數(shù)據(jù)在這三方面的表現(xiàn)總稱為數(shù)據(jù)行為(data behavior)。若測量結(jié)果滿足這三個條件,可認(rèn)為數(shù)據(jù)行為良好(well-behaved data),否則認(rèn)為數(shù)據(jù)行為不良(badly behaved data)。只有數(shù)據(jù)行為良好的方法對比研究結(jié)果才適用于Bland-Altman方法進(jìn)行一致性評價[3]。
Bland-Altman一致性評價時,首先計算100(1-γ)%的LoA,公式為
(1)
然后計算100(1-γ)%LoA的100(1-α)%的可信區(qū)間[4-5],公式為
(2)
按服從t分布的假設(shè),由圖1可得
則
(3)
(4)
β=β1+β2=
(5)
(6)
該公式中t分位數(shù)和樣本含量有關(guān),需要采用迭代方法,第一次迭代時用標(biāo)準(zhǔn)正態(tài)分布分位數(shù)t分位數(shù)替代獲得n的初值,當(dāng)?shù)昂髢纱谓Y(jié)果無明顯差異時即可停止,最后結(jié)果即為所求的樣本含量n。
為了驗證所推導(dǎo)的樣本含量的正確性,我們對上述不同設(shè)定下獲得的樣本含量,逐個進(jìn)行Monte-Carlo模擬,獲得相應(yīng)的把握度,如果該把握度和事先設(shè)定的β能夠吻合,即模擬得到的把握度和100(1-β)%接近,則可驗證上述公式是正確的。
具體模擬步驟如下:
(2)重復(fù)第(1)步驟10000次,計算得出一致性推斷的次數(shù),該次數(shù)除以10000即為把握度。
模擬結(jié)果見圖3所示。結(jié)果表明模擬獲得的把握度和事先設(shè)定的把握度非常接近。
按照設(shè)定的參數(shù)采用公式(5)和(6)進(jìn)行樣本含量估計。首先根據(jù)公式(6)計算得到n=103作為迭代初值,經(jīng)迭代運(yùn)算最終得到樣本含量為80例。該樣本含量經(jīng)Monte-Carlo模擬得到把握度為79.18%。
本文提出的樣本含量估計在某種程度上類似于臨床等效性試驗中有關(guān)情形。而等效性試驗的樣本含量至今仍然存在著問題,例如Chow等提供的樣本含量公式用β/2[7-8],有的學(xué)者用β[9-10]。于莉莉、夏結(jié)來進(jìn)行模擬驗證,提出當(dāng)組間總體療效差異為0時,公式用β/2,若差值不為0,則采用β[11]。但這都是有問題的,若差值不為0時,不論差值的大小一味使用β,會導(dǎo)致差值較小時達(dá)不到應(yīng)有的把握度要求。不考慮差值的大小對樣本含量的影響,這必然導(dǎo)致不同差值時可能會出現(xiàn)把握度不足或者把握度浪費(fèi)的問題。本文提出的方法可為完美地解決上述等效性試驗樣本含量估計的問題提供借鑒。
由于本文給出的樣本含量估計公式和把握度是一體化存在的,因此,容易實現(xiàn)一致性評價的把握度計算。
[1]Bland JM.Sample size for a study of agreement between two methods of measurement.http://www.users.york.ac.uk/~mb55/meas/sizemeth.html.
[2]Bland JM,Altman DG.Agreed statistics:measurement method comparison.Anesthesiology,2012,116:182-185.
[3]Bland JM,Altman DG.Statistical methods for assessing agreement between two methods of clinical measurement.Lancet,1986:307-310.
[4]繆華章,陳林,劉玉秀.定量方法對比研究一致性評價Bland-Altman法LoA的可信區(qū)間估計.中國衛(wèi)生統(tǒng)計,2014,31(1):64-67.
[5]劉玉秀,繆華章,陸夢潔,等.定量方法對比研究重復(fù)測量設(shè)計Bland-Altman一致限LoA 的可信區(qū)間估計.中國衛(wèi)生統(tǒng)計,2014,31(2):224-229.
[6]周宇豪,許金芳,賀佳.診斷試驗一致性評價中幾種方法的比較及應(yīng)用.中國衛(wèi)生統(tǒng)計,2011,28(1):40-46.
[7]Chow SC,Shao J,Wang H.Sample Size Calculation in Clinical Research.2nd edition.Chapman & Hall/CRC.2008:57-61.
[8]劉玉秀,姚晨,陳峰,等.非劣性/等效性試驗的樣本含量估計及統(tǒng)計推斷.中國新藥雜志,2003,12(5):371-376.
[9]周國詩,柳偉偉,陶麗新,等.對基于均差做推斷的成組設(shè)計非劣效性試驗功效分析及樣本量估計公式正確性的探討.中國衛(wèi)生統(tǒng)計,2011,28(2):203-206.
[10]王楊,李衛(wèi),成小如,等.隨機(jī)模擬法驗證非劣效臨床試驗樣本量計算公式.中國衛(wèi)生統(tǒng)計,2008,25(1):26-27.
[11]于莉莉,夏結(jié)來.模擬驗證等效性檢驗中β的單、雙側(cè)取值.中國衛(wèi)生統(tǒng)計,2006,23(5):407-409,412.
(責(zé)任編輯:郭海強(qiáng))
*國家自然科學(xué)基金項目(81473066)
△通信作者:劉玉秀,E-mail:liu_yuxiu@163.com