国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

臨床試驗(yàn)中多重性問題的統(tǒng)計(jì)學(xué)考慮

2012-03-11 14:07:18王彤,易東
中國衛(wèi)生統(tǒng)計(jì) 2012年3期
關(guān)鍵詞:多重性假設(shè)檢驗(yàn)校正

臨床試驗(yàn)根據(jù)研究目的不同可分為“探索性臨床試驗(yàn)”和“確證性臨床試驗(yàn)”,而臨床研究結(jié)論通常需要根據(jù)確證性臨床試驗(yàn)的統(tǒng)計(jì)推斷結(jié)果得到。如果某一確證性臨床試驗(yàn)需要對多個(gè)檢驗(yàn)假設(shè)做出統(tǒng)計(jì)學(xué)推斷,例如多個(gè)主要療效指標(biāo)的多重檢驗(yàn)、多組間多重比較、多個(gè)時(shí)間點(diǎn)的期中分析(interim analysis)等情況下,便會(huì)涉及多重性(multiplicity)問題。無須考慮多重性問題的臨床試驗(yàn)一般限于下列情況:即單臂或雙臂設(shè)計(jì)、使用單個(gè)主要指標(biāo)、事先只指定了一個(gè)與主要指標(biāo)相關(guān)的原假設(shè)且在一個(gè)時(shí)間點(diǎn)上進(jìn)行統(tǒng)計(jì)推斷。除此以外的其他情況理論上都應(yīng)考慮多重性問題。在一個(gè)假設(shè)檢驗(yàn)中,錯(cuò)誤地拒絕原假設(shè)稱為I類錯(cuò)誤(type I error),I類錯(cuò)誤概率通常用α表示。若進(jìn)行統(tǒng)計(jì)推斷時(shí)遇到多重性問題但未經(jīng)妥善處理,則會(huì)導(dǎo)致I類錯(cuò)誤增大。對確證性臨床試驗(yàn)進(jìn)行評(píng)價(jià)時(shí),將I類錯(cuò)誤控制在可接受的α水平上是一個(gè)重要的原則。所以在制定研究方案和進(jìn)行統(tǒng)計(jì)分析時(shí)應(yīng)慎重考慮統(tǒng)計(jì)推斷的多重性及相關(guān)問題。多重性問題的定義、統(tǒng)計(jì)推斷的原則以及控制I類錯(cuò)誤的方法等關(guān)鍵點(diǎn)需在方案中事先詳細(xì)闡述。

妥善處理多重性問題的意義

I類錯(cuò)誤的增大,會(huì)導(dǎo)致將一個(gè)無效或劣效的藥物有更大的機(jī)會(huì)推向市場,其后果是災(zāi)難性的。例如,在一項(xiàng)確證性臨床試驗(yàn)中,設(shè)定了4項(xiàng)主要療效指標(biāo),如果從這4個(gè)指標(biāo)的統(tǒng)計(jì)分析結(jié)果中選擇P值最小者來判斷療效,若每次假設(shè)檢驗(yàn)均為單側(cè)0.025的檢驗(yàn)水平,那么4次檢驗(yàn)至少出現(xiàn)1次假陽性結(jié)論的概率最高可接近10%(即1-0.9754),而不是研究者假定的2.5%。像這樣在確證性研究中試圖從多個(gè)檢驗(yàn)結(jié)果中僅選擇有利的部分結(jié)果,將大大增加發(fā)生假陽性錯(cuò)誤的機(jī)會(huì)。因此,針對多重性問題就需要在方案設(shè)計(jì)時(shí)制定出有效的策略和方法來事先控制I類錯(cuò)誤。

多重檢驗(yàn)中I類錯(cuò)誤的有關(guān)概念

假設(shè)同一項(xiàng)研究中的m個(gè)假設(shè)檢驗(yàn)結(jié)果如表1所示。

表1 多重檢驗(yàn)的結(jié)果

其中R是可觀察到的隨機(jī)變量,S、T、U、V均無法觀察到,m和m0是固定數(shù)值,但m0大小未知。

將多個(gè)假設(shè)檢驗(yàn)看做一個(gè)整體,其中至少有一次錯(cuò)誤拒絕原假設(shè),就會(huì)導(dǎo)致錯(cuò)誤的決策,這一錯(cuò)誤的概率稱為總I類錯(cuò)誤率(family-wise error rate,F(xiàn)WER):

FWER=P(V>0)

即m次檢驗(yàn)中至少發(fā)生一次I類錯(cuò)誤的概率。在確證性臨床試驗(yàn)中所指的“控制I類錯(cuò)誤”發(fā)生率,是強(qiáng)控制(in the strong sense)總I類錯(cuò)誤率FWER,即在同一問題的多個(gè)假設(shè)檢驗(yàn)中,應(yīng)控制至少一個(gè)真的原假設(shè)被拒絕的概率在通??山邮艿哪硞€(gè)α水平即αFWER上,而不論多次檢驗(yàn)中的哪個(gè)或哪些原假設(shè)為真;相應(yīng)地在所有原假設(shè)為真的條件下控制總I類錯(cuò)誤率FWER則屬于弱控制(in the weak sense)。

強(qiáng)控制FWER常常意味著事先對αFWER進(jìn)行分配,不同的原假設(shè)須在其分配所得到的校正后檢驗(yàn)水平上進(jìn)行檢驗(yàn)。采用何種分配αFWER的算法視具體問題而定,相應(yīng)的理論有簡有繁,不同的選擇可能會(huì)得出不同的結(jié)論,因此,必須在試驗(yàn)設(shè)計(jì)時(shí)事先指定校正方法,包括是否需要進(jìn)行多重性校正的考慮,并詳細(xì)介紹具體校正步驟。如果出現(xiàn)非預(yù)見的多重性問題,就必須使用保守的方法,例如Bonferroni法,當(dāng)然此時(shí)會(huì)降低把握度。

常用的控制I類錯(cuò)誤的方法

1.一般原則

(1)并-交檢驗(yàn)與交-并檢驗(yàn)

并-交檢驗(yàn)(UIT,union-intersection test)意為:若對應(yīng)于m次檢驗(yàn)的基本原假設(shè)為H1,H2,…,Hm,相應(yīng)備擇假設(shè)表示為 K1,K2,…,Km。并-交檢驗(yàn)是把上述各基本假設(shè)的交集HI作為全局的原假設(shè),而把上述各備擇假設(shè)的并集KU作為全局的備擇假設(shè),即檢驗(yàn):

并-交檢驗(yàn)中,只要有一次檢驗(yàn)有統(tǒng)計(jì)學(xué)意義即可拒絕全局HI,故需要調(diào)整每次檢驗(yàn)的水準(zhǔn)以控制總I類錯(cuò)誤。如果對某種疾病療效的評(píng)價(jià)涉及多個(gè)方面問題,根據(jù)其中一個(gè)或多個(gè)(但不是全部)方面問題上的有利證據(jù)即可判定為藥物開發(fā)成功,這樣就可能帶來從多重分析中選擇有利結(jié)果的機(jī)會(huì),需采用并-交檢驗(yàn)考慮控制FWER的方法。

而交-并檢驗(yàn)(IUT,intersection-union test)所定義的全局原假設(shè)HU是各基本原假設(shè)的并集,全局備擇假設(shè)KI定義為各備擇假設(shè)的交集,即檢驗(yàn):

交-并檢驗(yàn)中當(dāng)每個(gè)假設(shè)Hi均被拒絕時(shí),才可拒絕全局原假設(shè)HU。如果一項(xiàng)臨床試驗(yàn)中所有的多個(gè)主要指標(biāo)同時(shí)都需要有統(tǒng)計(jì)學(xué)意義才可認(rèn)為療效有臨床意義,則需采用交-并檢驗(yàn)。例如預(yù)防宮頸癌有針對HPV(人乳頭狀瘤病毒)16、18、6、11 型的四價(jià)疫苗,其療效評(píng)價(jià)指標(biāo)是針對上述四種分型來評(píng)價(jià)其各自免疫原性的抗體滴度。無論哪一個(gè)分型的免疫原性沒有統(tǒng)計(jì)學(xué)意義,原假設(shè)HU就不被拒絕(疫苗的有效性就不會(huì)被法規(guī)部門認(rèn)可),或者說只有四個(gè)指標(biāo)均有統(tǒng)計(jì)學(xué)意義時(shí)才可拒絕原假設(shè),此時(shí)由于沒有機(jī)會(huì)選擇四項(xiàng)指標(biāo)中最有利的單次假設(shè)檢驗(yàn)結(jié)果,因此無需進(jìn)行多重性校正。

實(shí)際工作中的多重檢驗(yàn)往往是并-交檢驗(yàn)、交-并檢驗(yàn)或其組合。圖1、圖2分別為二者的示意圖,其拒絕全局原假設(shè)的條件非常類似于物理學(xué)上的并聯(lián)和串聯(lián)電路。

圖1 并-交檢驗(yàn)

圖2 交-并檢驗(yàn)

(2)閉合原理與分割原理

如何確定前述并-交檢驗(yàn)拒絕HI時(shí)哪個(gè)(些)基本原假設(shè)不成立,可采用閉合原理(closure principle)構(gòu)建逐步法來進(jìn)行分析。1976年Marcus等人提出的這種多重檢驗(yàn)構(gòu)造方法,能靈活地把各種研究目的之間的關(guān)系和重要性綜合反映到一個(gè)恰當(dāng)?shù)亩嘀貦z驗(yàn)步驟中,基于此原理構(gòu)造出的多重比較方法稱為閉合檢驗(yàn)(closed test procedures)。很多常見的多重比較方法實(shí)際上都可視為某種閉合檢驗(yàn),如Holm、Shaffer、固定順序檢驗(yàn)法等。閉合原理的缺點(diǎn)是難以構(gòu)造相應(yīng)參數(shù)的聯(lián)合可信區(qū)間。

例如以下的最簡單情形:兩個(gè)主要指標(biāo)在兩組間比較,設(shè) θi=μiT- μiC為感興趣參數(shù),i=1,2 分別表示兩個(gè)指標(biāo),μt、μc分別表示處理組與對照組的總體均數(shù)。這里的基本原假設(shè)為 Hi:θi≤0,i=1,2。如果采用Bonferroni檢驗(yàn),為把總I類錯(cuò)誤率控制在α水平,可對每個(gè)基本原假設(shè)Hi在α/2水平進(jìn)行檢驗(yàn)。但運(yùn)用閉合原理即可以得到把握度高于Bonferroni的檢驗(yàn)。形式上可以把Hi看作要進(jìn)行推斷的參數(shù)空間的子集。令Θ=?2表示具有參數(shù)θ=(θ1,θ2)∈Θ的參數(shù)空間。圖3顯示原假設(shè)Hi={θ∈?2:θi≤0},i=1,2是實(shí)平面(參數(shù)空間)的子集。顯然,兩個(gè)基本原假設(shè)H1和H2相交,兩者的交集為H12=H1∩H2={θ∈?2:θ1≤0,θ2≤0},就是圖 3中的第 3象限。檢驗(yàn)交集H12需要多重性調(diào)整。假如考慮采用Bonferroni檢驗(yàn)來調(diào)整,這個(gè)方法實(shí)際上是在α/2水平檢驗(yàn)整個(gè)并集H1∪H2,而不僅僅是檢驗(yàn)交集H12。圖3也表明剩下的2、4象限部分均能在α水平進(jìn)行檢驗(yàn),不需要進(jìn)行進(jìn)一步的多重性調(diào)整。由此得到如下自然的檢驗(yàn)策略:首先采用適當(dāng)?shù)牟?交檢驗(yàn)以檢驗(yàn)交集H12,如果H12在第一步?jīng)]有被拒絕,則無需對H1或H2作進(jìn)一步檢驗(yàn)即可認(rèn)為H1和H2均不能被拒絕;如果H12有意義,那么繼續(xù)在全局α水平檢驗(yàn)H1和H2,當(dāng)且僅當(dāng)H1和H12均在(局部)α水平被拒絕,才可認(rèn)為H1可被拒絕,對H2亦然。

圖3 參數(shù)空間?2中兩個(gè)假設(shè)H1和H2及其交集H12

對于更一般的情況,閉合檢驗(yàn)也同樣首先對基本假設(shè)Hi的所有交集采用適當(dāng)?shù)男U龣z驗(yàn)水平進(jìn)行并-交檢驗(yàn),當(dāng)且僅當(dāng)包含基本假設(shè)Hi的所有交集有統(tǒng)計(jì)學(xué)意義時(shí)再逐級(jí)向上直至最后對基本假設(shè)Hi采用全局α作檢驗(yàn),若包含基本假設(shè)Hi的交集在校正的檢驗(yàn)水平上無統(tǒng)計(jì)學(xué)意義,則無需對含有Hi的假設(shè)做進(jìn)一步檢驗(yàn)。

分割原理(partitioning principle)最先由Finner和Strassburger(2002)正式提出,基本想法是把感興趣的參數(shù)所對應(yīng)的基本假設(shè)Hi的并集分割成不相交的若干個(gè)參數(shù)空間的子集,由于這些子集互不相交,所以其中最多只有一個(gè)子集對應(yīng)的假設(shè)為真,這樣對每個(gè)子集的檢驗(yàn)只需在α水平上進(jìn)行即可控制FWER。其優(yōu)點(diǎn)是可構(gòu)造出比閉合檢驗(yàn)把握度更高的方法且便于得到相應(yīng)參數(shù)的聯(lián)合可信區(qū)間。

仍以兩指標(biāo)兩組比較為例,令 θi=μiT- μiC,i=1,2為感興趣的參數(shù),再令Θ=?2表示具有參數(shù)θ=(θ1,θ2)∈Θ 的參數(shù)空間。基本原假設(shè)為 Hi={θ∈?2:θi≤0},i=1,2。Ki表示相應(yīng)的備擇假設(shè)。圖 3顯示基本原假設(shè)H1和H2是實(shí)平面(參數(shù)空間)的子集?,F(xiàn)在把參數(shù)空間Θ分解為如下集合:Θ1=H1,Θ2=H2∩K1,Θ3=K1∩K2,見圖 4。因?yàn)?Θi,i=1,2,3 不相交,且Θ1∪Θ2∪Θ3=Θ,因此,它們構(gòu)成參數(shù)空間Θ的一個(gè)分割。這樣,真實(shí)的參數(shù)向量θ在且僅在互不相交的子集Θi中的某一個(gè)集合里。因此,對這些子集采用(局部)α水平檢驗(yàn)就是一個(gè)多重檢驗(yàn),這個(gè)檢驗(yàn)把總I類錯(cuò)誤嚴(yán)格控制在了α水平。另外,參數(shù)向量θ的可信集就是被拒絕的假設(shè)的補(bǔ)集之交集。

圖4 兩個(gè)原假設(shè)H1和H2的分割原理

2.常見多重比較方法

根據(jù)對檢驗(yàn)順序是否有要求,多重性校正方法可分為單步法和逐步法。單步法對每個(gè)檢驗(yàn)是否拒絕原假設(shè)的結(jié)論均不依賴于其他各次檢驗(yàn),也就是說各個(gè)檢驗(yàn)的順序并不重要,可同時(shí)進(jìn)行所有的檢驗(yàn)。例如Bonferroni和Dunnett檢驗(yàn)。而逐步法是按照一定順序依次對相應(yīng)原假設(shè)進(jìn)行檢驗(yàn)的,這些順序上的安排使得其中一些原假設(shè)被隱含在其他假設(shè)中,從而有可能進(jìn)行一次檢驗(yàn)就能對多個(gè)假設(shè)下結(jié)論。逐步法又分為向上法和向下法。向上法是從P值最大的假設(shè)開始檢驗(yàn),若結(jié)果無統(tǒng)計(jì)學(xué)意義,則對P值次大的假設(shè)進(jìn)行檢驗(yàn),若結(jié)果有統(tǒng)計(jì)學(xué)意義,則宣布該假設(shè)及之后的所有假設(shè)均具有統(tǒng)計(jì)學(xué)意義,如Hochberg方法。向下法的檢驗(yàn)順序則相反,它首先從P值最小的假設(shè)開始檢驗(yàn),若結(jié)果有統(tǒng)計(jì)學(xué)意義,則對P值次小的假設(shè)進(jìn)行檢驗(yàn),若結(jié)果無統(tǒng)計(jì)學(xué)意義,則宣布該假設(shè)及之后的所有假設(shè)均具無統(tǒng)計(jì)學(xué)意義,如Holm方法。一般而言,單步法的把握度會(huì)低于相應(yīng)逐步法,但前者的優(yōu)點(diǎn)是其聯(lián)合可信區(qū)間構(gòu)造相對簡單。

根據(jù)對分布假設(shè)的要求,多重性校正方法可分為3類:其一是基于P值的方法或非參數(shù)方法。這類方法不指定檢驗(yàn)統(tǒng)計(jì)量的聯(lián)合分布,只依據(jù)單變量的P值來進(jìn)行檢驗(yàn),如Bonferroni和Holm方法。在檢驗(yàn)次數(shù)很多或檢驗(yàn)統(tǒng)計(jì)量之間有很強(qiáng)的相關(guān)時(shí)這類方法把握度較低,結(jié)論偏保守。其二是參數(shù)方法,如指定了統(tǒng)計(jì)量服從多元正態(tài)分布或多元t分布時(shí)的Dunnett檢驗(yàn)等。其三是基于再抽樣的方法,通常是通過bootstrap再抽樣法或permutation檢驗(yàn)來近似統(tǒng)計(jì)量的聯(lián)合分布。后兩種方法在進(jìn)行多重性校正時(shí)考慮了多個(gè)檢驗(yàn)間的相關(guān)性。多個(gè)指標(biāo)相互獨(dú)立時(shí),F(xiàn)WER增大得最嚴(yán)重,相關(guān)性高,F(xiàn)WER增大程度減少。

為節(jié)省篇幅,將一些常見多重比較方法列于表2,有興趣的讀者可參閱相關(guān)文獻(xiàn)。

表2 常見的一些多重比較方法

常見的多重性問題及處理方法

以下主要針對多個(gè)主要療效指標(biāo)和多組間比較的情況作一介紹,多個(gè)時(shí)間點(diǎn)的期中分析將作為專題另作討論。

1.多個(gè)主要指標(biāo)

需要指出,當(dāng)事先指定了一個(gè)主要指標(biāo)和多個(gè)次要指標(biāo),且聲明所有次要指標(biāo)屬于支持性證據(jù)的情況下,由于結(jié)果的判斷主要取決于單個(gè)主要指標(biāo),故不存在從多次比較中選擇有利結(jié)果的機(jī)會(huì),不需要考慮多重性校正。

(1)所有的多個(gè)主要指標(biāo)同樣都需要有統(tǒng)計(jì)學(xué)意義才可下推斷結(jié)論時(shí),屬于交-并檢驗(yàn)。此時(shí)由于沒有意圖或機(jī)會(huì)選擇最有利的某次假設(shè)檢驗(yàn)結(jié)果,因此可設(shè)定每次檢驗(yàn)的I類錯(cuò)誤水平等于αFWER,無需進(jìn)行多重性校正。但應(yīng)注意此時(shí)會(huì)增大II類錯(cuò)誤(錯(cuò)誤地不拒絕至少1個(gè)原假設(shè)),在估算試驗(yàn)的樣本量時(shí)應(yīng)設(shè)定較高的把握度。把握度的損失除了與指標(biāo)多少有關(guān),還受到指標(biāo)間相關(guān)性的影響。若相互獨(dú)立,其把握度為單個(gè)指標(biāo)把握度的乘積,若完全相關(guān)且標(biāo)準(zhǔn)化的效應(yīng)值相同(實(shí)際上很難發(fā)生),則不增大II類錯(cuò)誤。

(2)假設(shè)有m≥2個(gè)主要指標(biāo),至少有一個(gè)達(dá)到有統(tǒng)計(jì)學(xué)意義即可認(rèn)為藥物有效的情況下,由于存在從多次比較中選擇有利結(jié)果的機(jī)會(huì),故需要考慮多重性校正來構(gòu)建并-交檢驗(yàn)。如前述基于Bonferroni類和Simes類的各種方法。

(3)同一個(gè)試驗(yàn)中多個(gè)療效指標(biāo)可能具有不同的重要性,其中一個(gè)指標(biāo)最為重要,而其他指標(biāo)如果出現(xiàn)令人信服的結(jié)果也將明顯提升試驗(yàn)品的價(jià)值。此時(shí)原假設(shè)可以按照分級(jí)的策略進(jìn)行檢驗(yàn)。分級(jí)的次序可以是自然的次序(例如假設(shè)按時(shí)間或指標(biāo)的重要程度排序),也可以根據(jù)研究者具體的關(guān)注點(diǎn)。檢驗(yàn)原假設(shè)的等級(jí)次序應(yīng)當(dāng)在方案中事先說明。如果多個(gè)主要指標(biāo)存在上述層次結(jié)構(gòu)從而決定了其假設(shè)檢驗(yàn)的順序,只有在位次靠前的檢驗(yàn)有統(tǒng)計(jì)學(xué)意義時(shí)才可進(jìn)行下一個(gè)檢驗(yàn),此時(shí)不需要校正I類錯(cuò)誤,每次檢驗(yàn)的水準(zhǔn)均等于αFWER。這是由于每次檢驗(yàn)的拒絕域總是落在上一次大小已設(shè)定為αFWER的拒絕域之內(nèi),故而這種固定順序的序貫檢驗(yàn)的I類錯(cuò)誤不會(huì)超過第一次檢驗(yàn)所設(shè)定的αFWER,但是對應(yīng)較低等級(jí)指標(biāo)的假設(shè)檢驗(yàn)的II類錯(cuò)誤將增大。需要注意的是,一旦依次進(jìn)行的某個(gè)原假設(shè)沒有被拒絕,該序貫檢驗(yàn)終止,本次及之后的所有檢驗(yàn)均認(rèn)定為無統(tǒng)計(jì)學(xué)意義。例如E1、E2、E3三個(gè)指標(biāo)依次被檢驗(yàn),指標(biāo)E2沒有統(tǒng)計(jì)學(xué)意義,那么E2和E3所指向的臨床價(jià)值就不能被肯定(無論指標(biāo)E3是否有統(tǒng)計(jì)學(xué)意義)。這一策略典型地體現(xiàn)于主要指標(biāo)和次要指標(biāo)共存時(shí)的假設(shè)檢驗(yàn),亦即當(dāng)主要指標(biāo)沒有統(tǒng)計(jì)學(xué)意義時(shí)就不能根據(jù)次要指標(biāo)的檢驗(yàn)結(jié)果推斷藥物療效。

(4)設(shè)有三個(gè)主要指標(biāo)E1,E2和E3,當(dāng)E1單獨(dú)有統(tǒng)計(jì)學(xué)意義或者E2和E3同時(shí)有統(tǒng)計(jì)學(xué)意義即可認(rèn)為藥物有效。全局原假設(shè)可寫為HE1∩{HE2∪HE3}。這種情況下的原假設(shè)實(shí)際上是另外兩個(gè)原假設(shè)的交集,其一是E1無效,其二是E2和E3至少有一個(gè)無效。對這兩個(gè)原假設(shè)的交集可采用Bonferroni類方法來控制FWER,即首先在小一點(diǎn)的α1水平檢驗(yàn)E1,之后再用剩余的α-α1水平檢驗(yàn)E2和E3中的每一個(gè)。

(5)設(shè)有三個(gè)主要指標(biāo) E1,E2和 E3,當(dāng) E1和 E2同時(shí)有統(tǒng)計(jì)學(xué)意義或者E1和E3同時(shí)有統(tǒng)計(jì)學(xué)意義即可認(rèn)為藥物有效。全局原假設(shè)可寫為{HE1∪HE2}∩{HE1∪HE3}。這種情況相當(dāng)于(E1,E2)和(E1,E3)的交集作為了臨床決策依據(jù)。此時(shí)E1是臨床收益方面最有關(guān)的指標(biāo),但僅這一個(gè)指標(biāo)尚不能足以說明臨床療效,還需要E2或E3中至少一個(gè)也有統(tǒng)計(jì)學(xué)意義。這樣E1和E2、E3的交集就存在一種分級(jí)次序:如果E1沒有被拒絕就無需檢驗(yàn)E2和E3。故而可以首先對E1在整個(gè)α水平上作檢驗(yàn),如果被拒絕,接著再對E2和E3采用在α水平上控制FWER的方法做并-交檢驗(yàn)。

2.多組比較

(1)多劑量組與對照組相比

若劑量組間無效應(yīng)大小順序限制,可采用Dunnett及其逐步法;如劑量組間效應(yīng)已確認(rèn)有大小順序限制(如隨著劑量增加效應(yīng)值單調(diào)上升),可采用固定順序的檢驗(yàn)方法,此時(shí)無需調(diào)整I類錯(cuò)誤。

(2)多個(gè)劑量組相比,無安慰劑和陽性對照

通常是由于倫理方面的考慮不設(shè)安慰劑且沒有合適的陽性藥物。高劑量組的耐受性和低劑量組的療效可能會(huì)不滿足要求,而某個(gè)較高劑量組可能安全有效??稍谌中约僭O(shè)檢驗(yàn)的基礎(chǔ)上進(jìn)行有I類錯(cuò)誤控制的多重比較,如進(jìn)行所有兩兩比較所采用的Shaffer方法等。

(3)試驗(yàn)藥、陽性對照和安慰劑比較

當(dāng)符合倫理要求時(shí)常常建議采用如下三個(gè)組的設(shè)計(jì)來證明新藥的療效和安全性:試驗(yàn)藥、陽性對照和安慰劑。通常這種研究的目的有多個(gè):①驗(yàn)證試驗(yàn)藥與安慰劑相比的優(yōu)效性(確證療效);②驗(yàn)證陽性對照藥與安慰劑相比的優(yōu)效性(證明試驗(yàn)的靈敏度);③驗(yàn)證試驗(yàn)藥非劣于陽性對照藥(證明非劣效性)。如果這三個(gè)目的要同時(shí)達(dá)到,即要求所有這3個(gè)假設(shè)檢驗(yàn)都必須在所需的檢驗(yàn)水平顯示有統(tǒng)計(jì)學(xué)意義,可進(jìn)行交-并檢驗(yàn)而不需要校正I類錯(cuò)誤。此時(shí),如果未能顯示試驗(yàn)藥優(yōu)于安慰劑,就可解釋為試驗(yàn)藥無效(當(dāng)陽性對照藥優(yōu)于安慰劑時(shí)),或試驗(yàn)缺乏靈敏度(當(dāng)試驗(yàn)藥和陽性對照藥未顯示優(yōu)于安慰劑)。

復(fù)合指標(biāo)

多個(gè)指標(biāo)均有統(tǒng)計(jì)學(xué)意義時(shí)才能判斷藥物有效則通常進(jìn)行交-并檢驗(yàn)而不考慮對I類錯(cuò)誤的校正,故而在多個(gè)指標(biāo)均有統(tǒng)計(jì)學(xué)意義而其臨床意義并不是很明顯的時(shí)候常常會(huì)考慮將臨床上既往經(jīng)驗(yàn)證握與治療效果有關(guān)的多個(gè)指標(biāo)構(gòu)造成一個(gè)單獨(dú)的復(fù)合指標(biāo)來避免多重性問題。復(fù)合指標(biāo)的類型有2種。第一種即等級(jí)評(píng)定量表,它是由多個(gè)反應(yīng)不同側(cè)面治療效果的臨床指標(biāo)合并而產(chǎn)生。這種類型的復(fù)合指標(biāo)在某些適應(yīng)證(例如精神或神經(jīng)系統(tǒng)疾病)中有長期的使用經(jīng)驗(yàn)。另一種類型的復(fù)合指標(biāo)是在生存分析的背景下產(chǎn)生的。可以綜合幾個(gè)事件來定義復(fù)合指標(biāo)。定義復(fù)合指標(biāo)最好是把所有較為重要的臨床事件都作為構(gòu)成指標(biāo)。如果患者出現(xiàn)事先指定的構(gòu)成指標(biāo)(例如死亡、或心肌梗死,或致殘性卒中)列表中的一個(gè)或多個(gè)事件,則認(rèn)為患者有這種臨床結(jié)果。至出現(xiàn)結(jié)果的時(shí)間以患者隨機(jī)化至首次出現(xiàn)列表中事件的時(shí)間計(jì)算。通常,各構(gòu)成指標(biāo)代表相對罕見的事件,并且單獨(dú)研究每個(gè)構(gòu)成指標(biāo)需要非常大的樣本量。此時(shí),使用復(fù)合指標(biāo)旨在增加達(dá)到預(yù)期的事件數(shù),從而可以提高研究的把握度。除主要指標(biāo)外建議還要分別分析單個(gè)構(gòu)成指標(biāo)以提供支持性信息。當(dāng)主要指標(biāo)有統(tǒng)計(jì)學(xué)意義,則對單個(gè)構(gòu)成指標(biāo)的檢驗(yàn)無需進(jìn)行多重性校正。如果宣稱的療效是基于復(fù)合指標(biāo)中某個(gè)或某些成分時(shí),則需事先定義這些成分并納入包括多重性考慮的確證性分析策略。

定義復(fù)合指標(biāo)時(shí),建議各構(gòu)成成分僅采用以同樣的方式受到預(yù)期治療影響的指標(biāo)。所有構(gòu)成成分都應(yīng)該能夠反應(yīng)好的治療效果,或者臨床上更為重要的成分至少不能出現(xiàn)負(fù)面的療效,增加一個(gè)可以預(yù)見的對治療作用不敏感的構(gòu)成指標(biāo)會(huì)導(dǎo)致變異性增大,其直接的后果將是降低靈敏度。非劣效性或等效性研究中也應(yīng)避免指標(biāo)的變異性增大。對于目的是為了證明優(yōu)效性的研究,首選較為一般性的構(gòu)成指標(biāo)作為主要指標(biāo),因?yàn)檫@是最保守的分析。由于同樣原因,對于非劣效性/等效性試驗(yàn),首選更特殊的構(gòu)成指標(biāo)(例如疾病相關(guān)的病死率)作為主要指標(biāo)。

常見問題問答

(1)是否有多個(gè)主要療效指標(biāo)的情況進(jìn)行統(tǒng)計(jì)推斷時(shí)就要進(jìn)行多重性校正?

答:對多重性的考慮是必要的。但是否要進(jìn)行多重性校正要視具體情況,例如如果多個(gè)指標(biāo)同時(shí)有統(tǒng)計(jì)學(xué)意義才可以判斷試驗(yàn)品有效,則無需進(jìn)行多重性校正。

(2)是否多個(gè)劑量組比較就要考慮統(tǒng)計(jì)推斷時(shí)進(jìn)行多重性校正?

答:對多重性的考慮是必要的。但是否要進(jìn)行多重性校正要視具體情況,例如多個(gè)劑量組的劑量組間效應(yīng)已確認(rèn)有大小順序限制(如隨著劑量增加效應(yīng)值單調(diào)上升),可采用固定順序的檢驗(yàn)方法,此時(shí)無需調(diào)整I類錯(cuò)誤。

(3)如何決定多個(gè)主要療效指標(biāo)應(yīng)采用并-交檢驗(yàn)還是交-并檢驗(yàn)?

答:單純的交-并檢驗(yàn)不需要多重性校正,而并-交檢驗(yàn)要考慮多重性校正,所以存在多個(gè)主要療效指標(biāo)時(shí)確定哪種類型的檢驗(yàn)較為重要。而檢驗(yàn)類型的確定與試驗(yàn)品本身的藥效特點(diǎn)有關(guān),為明確檢驗(yàn)類型,臨床專家在方案中要明確描述出多個(gè)指標(biāo)同時(shí)有意義還是多個(gè)指標(biāo)中任意幾個(gè)有意義或者多個(gè)指標(biāo)的某幾種組合有意義表示試驗(yàn)品有效,這樣才能明確定義出檢驗(yàn)類型。

(4)同一指標(biāo)在多個(gè)數(shù)據(jù)集中進(jìn)行假設(shè)檢驗(yàn),是否要考慮多重性校正?

答:不需要考慮。對不同的個(gè)體分屬何種數(shù)據(jù)集(FAS或PPS)在研究方案和統(tǒng)計(jì)分析計(jì)劃中須明確定義,從中選擇一個(gè)(通常是FAS)作為主要的分析集。一般而言,對受試者不同子集進(jìn)行多重分析是用于分析主要結(jié)論的敏感性,增加從主要分析集所得結(jié)果的可靠性,不需要校正I類錯(cuò)誤。

(5)對于相同的數(shù)據(jù)集使用不同的統(tǒng)計(jì)學(xué)模型作多次檢驗(yàn)是否需考慮多重性校正?

答:對于相同的數(shù)據(jù)集,有時(shí)會(huì)使用不同的統(tǒng)計(jì)學(xué)模型或2步法,目的是為了選擇恰當(dāng)?shù)慕y(tǒng)計(jì)學(xué)方法,在第一個(gè)統(tǒng)計(jì)學(xué)檢驗(yàn)結(jié)果的基礎(chǔ)上進(jìn)行主要療效的比較(如首先在正態(tài)性檢驗(yàn)的基礎(chǔ)上決定其后采用t檢驗(yàn)或者秩和檢驗(yàn))。如果這些方法提供有明顯的機(jī)會(huì),使得根據(jù)已知的患者治療分組情況可選擇有利于結(jié)論的分析策略時(shí),則會(huì)立即產(chǎn)生對多重性的顧慮。雖然技術(shù)上而言對同一數(shù)據(jù)用不同的統(tǒng)計(jì)方法需要考慮分配總I類錯(cuò)誤,但若基于正式的盲態(tài)核查(見ICH E9)而選擇的最終統(tǒng)計(jì)學(xué)模型則不會(huì)出現(xiàn)這些顧慮,而且主要的統(tǒng)計(jì)分析策略應(yīng)在統(tǒng)計(jì)分析計(jì)劃中提前說明,并在隨機(jī)化治療分配信息公開之前確定。即使是使用了不同的統(tǒng)計(jì)方法,通常也是為說明研究的可靠性和結(jié)果的穩(wěn)健性。類似的問題可存在于協(xié)方差分析或其他多因素模型中,須納入模型的變量和分析策略需要在方案中事先說明才可用于療效的確證性研究。

(6)多個(gè)劑量組的設(shè)計(jì),建立了劑量-反應(yīng)關(guān)系,是否均需考慮多重性校正?

答:有時(shí)一項(xiàng)研究沒有足夠的把握度來發(fā)現(xiàn)和推薦單個(gè)有效和安全的劑量(或劑量范圍),但可以成功地確證總體上臨床作用與劑量增加呈正相關(guān)。此時(shí)可以按外推的方式將組間比較的估計(jì)值和可信區(qū)間用于設(shè)計(jì)將來的研究,或者分析目的是為了探索劑量-反應(yīng)關(guān)系模型,在這種情況下,沒有必要調(diào)整I類錯(cuò)誤。

(7)對實(shí)驗(yàn)室安全性數(shù)據(jù)或不良反應(yīng)的分析是否需要多重性校正?

答:安全性數(shù)據(jù)分析主要通過列表來進(jìn)行描述,但如果某個(gè)安全性指標(biāo)在整個(gè)研究中要作為確證性策略的一個(gè)部分,如欲聲稱所研究藥物可以增效減毒,那么此安全性指標(biāo)就應(yīng)和主要療效指標(biāo)同樣對待,統(tǒng)計(jì)分析策略中應(yīng)考慮所涉及的多重性問題。不良反應(yīng)的分析中率差或風(fēng)險(xiǎn)比等描述嚴(yán)重性程度的指標(biāo),以及相應(yīng)的可信區(qū)間,通常要比假設(shè)檢驗(yàn)的P值更為重要,而且由于是否發(fā)生特定的不良反應(yīng)是難以在制定方案時(shí)事先預(yù)設(shè)的,其假設(shè)檢驗(yàn)也就難以事先明確定義,故而其重要性通常是依據(jù)已掌握的關(guān)于此藥物的藥理學(xué)知識(shí)來決定。同時(shí),由于通常的研究設(shè)計(jì)(包括樣本量的估計(jì))不是針對不良反應(yīng)的,對不良反應(yīng)進(jìn)行統(tǒng)計(jì)學(xué)推斷的樣本量往往達(dá)不到一定的把握度,因此,其假設(shè)檢驗(yàn)結(jié)果也只有參考價(jià)值。除非觀察某種不良反應(yīng)是研究的主要目標(biāo),針對不良反應(yīng)的假設(shè)檢驗(yàn)無需調(diào)整檢驗(yàn)水準(zhǔn)。

(8)多次訪視的結(jié)果在不同時(shí)間點(diǎn)比較是否需要進(jìn)行多重性校正?

答:在多次訪視時(shí),由于對主要療效的評(píng)價(jià)通常是在事先指定的某個(gè)訪視點(diǎn)或按照方案中的治療終點(diǎn)進(jìn)行,此時(shí)一般不考慮類似重復(fù)測量分析的潛在多重性問題。

(9)雙單側(cè)等效性檢驗(yàn)是否應(yīng)考慮多重性校正?

答:等效性檢驗(yàn)是一種典型的交-并檢驗(yàn),因?yàn)橹挥袃纱螁蝹?cè)檢驗(yàn)都具有統(tǒng)計(jì)學(xué)意義時(shí)才可以認(rèn)為等效性結(jié)論成立,所以兩次單側(cè)檢驗(yàn)都不需要校正檢驗(yàn)水準(zhǔn)。

(10)亞組分析是否應(yīng)考慮多重性校正?

答:如果研究目的中特別聲稱特定亞組的治療作用,研究計(jì)劃中就要事先指定相應(yīng)的原假設(shè)和妥善的確證性分析策略,其中包括對多重性問題的考慮。許多研究中,當(dāng)達(dá)到主要目標(biāo)后,亞組分析具有支持性或探索性目的,即證明顯著的總體臨床受益。當(dāng)總的研究人群中療效未被證實(shí),基于亞組分析的療效推斷結(jié)論被接受的可能性極小。需要注意的是,無計(jì)劃的亞組分析有時(shí)會(huì)形成錯(cuò)誤的進(jìn)一步研究假設(shè);而無法事先明確假設(shè)檢驗(yàn)的次數(shù)有時(shí)也難以控制總I類錯(cuò)誤;使用隨機(jī)化之后測量的某個(gè)變量分組會(huì)形成不恰當(dāng)?shù)膩喗M,例如這樣的亞組中排除了試驗(yàn)失敗者。而恰當(dāng)?shù)膩喗M是根據(jù)隨機(jī)化之前測量的基線指標(biāo)形成,如人口學(xué)特征或預(yù)后有關(guān)變量等。事先的計(jì)劃是任何亞組分析的關(guān)鍵點(diǎn)。除了可能的多重性問題,方案中應(yīng)當(dāng)考慮到把握度,隨機(jī)化一般應(yīng)當(dāng)分層。

1.Committee for Proprietary Medicinal Products(CPMP).Points to Consider on Multiplicity issues in clinical trials.http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2009/09/WC500003640.pdf

2.ICH.ICH Topic E9:Notes for Guidance on Statistical Principles for Clinical Trials,International Conference on Harmonization,London.http://www.emea.europa.eu/docs/en_GB/document_library/Scientific_guideline/2009/09/WC500002928.pdf

3.Alex Dmitrienko,Ajit C.Tamhane,F(xiàn)rank Bretz.Multiple testing problems in pharmaceutical statistics.Chapman & Hall,CRC Press,2010.

4.Frank Bretz,Torsten Hothorn,Peter Westfall.Multiple comparisons using R.Chapman & Hall,CRC Press,2010.

5.Marcus R,Peritz E,Gabriel KR.On closed testing procedures with special reference to ordered analysis of variance.Biometrika,1976,63,655-660.

6.Finner H,Strassburger K.The partitioning principle:A powerful tool in multiple decision theory.The Annals of Statistics,2002,30:1194-1213.

猜你喜歡
多重性假設(shè)檢驗(yàn)校正
電報(bào)方程的正雙周期解:存在性、唯一性、多重性和漸近性
一類二階Duffing方程反周期解的存在性和多重性
含Hardy位勢的非線性Schr?dinger-Poisson方程正規(guī)化解的多重性
非線性Schr?dinger-Bopp-Podolsky系統(tǒng)解的多重性及集中現(xiàn)象
劉光第《南旋記》校正
國學(xué)(2020年1期)2020-06-29 15:15:30
一類具有校正隔離率隨機(jī)SIQS模型的絕滅性與分布
機(jī)內(nèi)校正
統(tǒng)計(jì)推斷的研究
雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
固原市| 伽师县| 松潘县| 贵州省| 隆安县| 滨州市| 芜湖县| 富蕴县| 巴青县| 徐汇区| 大关县| 靖西县| 青铜峡市| 五莲县| 潜江市| 西昌市| 松阳县| 弋阳县| 中江县| 正安县| 鹤庆县| 新和县| 阿克陶县| 沙坪坝区| 旬邑县| 黔江区| 蒙城县| 延吉市| 松江区| 闵行区| 正宁县| 天峻县| 江安县| 榆树市| 博罗县| 嘉定区| 瑞丽市| 宜川县| 镇原县| 永德县| 保靖县|