佟 亮 蔣志偉 李 晨 李 凡 葛 偉 胡海霞 王 陵△ 夏結(jié)來(lái)△
【提 要】 目的 在折扣因子D的基礎(chǔ)上,提出一種新的貝葉斯方法用于評(píng)價(jià)多區(qū)域臨床試驗(yàn)中目標(biāo)區(qū)藥物的療效,并探討本方法的可行性。方法 以Ⅱ期臨床試驗(yàn)中收集到目標(biāo)藥物的種族信息作為樣本信息,類似藥物或同類藥物的臨床試驗(yàn)收集到的種族信息作為先驗(yàn)信息,構(gòu)建折扣因子D的后驗(yàn)分布,并進(jìn)一步計(jì)算加權(quán)Z檢驗(yàn)統(tǒng)計(jì)量ZW的后驗(yàn)分布,比較先驗(yàn)分布分別為無(wú)信息先驗(yàn)、共軛先驗(yàn)和分層先驗(yàn)時(shí)D后驗(yàn)分布的特點(diǎn),并比較不同類型D的后驗(yàn)分布對(duì)試驗(yàn)檢驗(yàn)效能的影響。結(jié)果 當(dāng)歷史信息的信息量相對(duì)樣本信息很小時(shí),則后驗(yàn)均值主要由樣本信息決定,后驗(yàn)分布的信息量基本接近樣本信息的量,當(dāng)歷史信息的量逐漸增大時(shí),后驗(yàn)均值逐漸向歷史信息均值靠攏,后驗(yàn)分布的信息量也逐漸增大。檢驗(yàn)效能由D的后驗(yàn)均值決定,與D的變異程度無(wú)關(guān)。結(jié)論 本研究提出的貝葉斯方法可以較好地模擬實(shí)際情況,具有良好的實(shí)際意義和可操作性。
某藥物在國(guó)外注冊(cè)上市后,由于種族差異對(duì)藥物有效性和安全性的潛在影響,并不能直接在國(guó)內(nèi)注冊(cè)上市。若忽略該藥物在國(guó)外積累的臨床試驗(yàn)資料則需要在國(guó)內(nèi)完整重復(fù)整個(gè)藥物研發(fā)過(guò)程,不僅會(huì)造成大量的資源浪費(fèi),而且會(huì)使國(guó)內(nèi)患者不能及時(shí)得到有效藥物的治療[1-2]。多區(qū)域臨床試驗(yàn)(multi-regional clinical trial,MRCT)是目前解決上述問(wèn)題的主要方法,即全球各個(gè)國(guó)家或地區(qū)在同一個(gè)臨床試驗(yàn)方案的指導(dǎo)下,同步進(jìn)行臨床試驗(yàn),試驗(yàn)結(jié)束后可同時(shí)對(duì)各國(guó)家或地區(qū)的藥物療效和安全性作出評(píng)價(jià),達(dá)到同期注冊(cè)上市的目的。然而考慮到MRCT中各參與國(guó)家或地區(qū)的種族差異問(wèn)題,MRCT整體得出有效結(jié)論后如何將MRCT的結(jié)果推廣至各參與國(guó)家或地區(qū),尚缺乏權(quán)威、公認(rèn)的統(tǒng)計(jì)學(xué)方法,各參與國(guó)家或地區(qū)的審評(píng)機(jī)構(gòu)對(duì)MRCT的接受程度和審批要求也不盡相同。國(guó)內(nèi)外生物統(tǒng)計(jì)學(xué)家就上述問(wèn)題提出了不同的方法[3-6]。
鑒于上述問(wèn)題,本研究擬采用貝葉斯方法,賦予D更具體的實(shí)際意義,擬合Ⅲ期臨床試驗(yàn)前積累的種族信息,構(gòu)建相對(duì)客觀的D后驗(yàn)分布,并同時(shí)體現(xiàn)其集中趨勢(shì)和離散趨勢(shì),進(jìn)一步評(píng)價(jià)TE區(qū)藥物療效。結(jié)合公式推導(dǎo)和Monte Carlo模擬,研究不同D的先驗(yàn)分布對(duì)其后驗(yàn)分布的影響以及不同D的后驗(yàn)分布對(duì)試驗(yàn)檢驗(yàn)效能的影響,探討該方法的可行性。
1.試驗(yàn)設(shè)計(jì)
假定MRCT階段的樣本量為NMRCT,其中包括NNTE個(gè)NTE受試者,NTEM個(gè)TE受試者,LCT階段包括NTEL個(gè)TE受試者。D的原定義是NNTE個(gè)NTE受試者可打折成D×NNTE個(gè)TE受試者進(jìn)行了試驗(yàn)。本研究在Wang的基礎(chǔ)上賦予D更具體的實(shí)際意義:假定部分NTE區(qū)受試者和TE區(qū)受試者種族相似程度高,這部分受試者可直接視為目標(biāo)區(qū)受試者進(jìn)行了試驗(yàn),該部分受試者所占的比例為D,其它NTE區(qū)受試者和TE區(qū)受試者種族相似程度低,這部分受試者不能提供信息給TE區(qū)受試者,其所占比例為1-D。則D的定義可轉(zhuǎn)換為在虛擬實(shí)驗(yàn)中,NTE區(qū)的受試者相當(dāng)于TE區(qū)受試者進(jìn)行了試驗(yàn)的比例,在這種定義下,NNTE個(gè)NTE受試者仍可打折成D×NNTE個(gè)TE受試者進(jìn)行了試驗(yàn)。如此估計(jì)D就轉(zhuǎn)換為估計(jì)在虛擬試驗(yàn)中NTE區(qū)某個(gè)受試者是否可以等價(jià)于TE區(qū)的受試者進(jìn)行了試驗(yàn),可以從個(gè)體的角度來(lái)評(píng)價(jià)種族相似性。基于這種實(shí)際意義,本研究通過(guò)貝葉斯方法擬合樣本信息和歷史信息,在Ⅲ期臨床試驗(yàn)開(kāi)展前構(gòu)建D的后驗(yàn)分布,得到Ⅲ期臨床試驗(yàn)數(shù)據(jù)后構(gòu)建ZW的后驗(yàn)分布。若P(ZW>1.96)>C,則認(rèn)為目標(biāo)區(qū)的藥物有效,C為某預(yù)先設(shè)定的界值。
2.構(gòu)建D的后驗(yàn)分布
(1)樣本信息
由于Ⅲ期臨床試驗(yàn)的目的主要是評(píng)價(jià)藥物的療效,對(duì)不同區(qū)域受試者的種族方面信息收集較少,且D應(yīng)在Ⅲ期臨床試驗(yàn)前確定,而Ⅱ期臨床試驗(yàn)會(huì)對(duì)受試者進(jìn)行藥代動(dòng)力學(xué)和藥效動(dòng)力學(xué)研究,對(duì)受試者的種族信息研究相對(duì)深入,故本研究提出可在原有Ⅱ期臨床試驗(yàn)基礎(chǔ)上,更進(jìn)一步收集Ⅱ期臨床試驗(yàn)受試者的種族信息,成立專家組,評(píng)定N個(gè)NTE區(qū)受試者中,可視為TE區(qū)受試者的人數(shù)X,以此可構(gòu)建D的似然函數(shù):
(2)歷史信息
本研究中以已完成的與目標(biāo)藥物類似或相同種類的藥物臨床試驗(yàn)所積累的種族信息作為先驗(yàn)信息,先驗(yàn)分布可分為以下三種情況。
①無(wú)信息先驗(yàn)
本研究中的似然函數(shù)形式,不能直接確定無(wú)信息先驗(yàn)。采用Jeffreys提出的方法[16],用Fisher信息陣行列式的平方根作為D的無(wú)信息先驗(yàn)。求解步驟如下:
參數(shù)的對(duì)數(shù)似然函數(shù)
a.Fisher信息陣
b.D的無(wú)信息先驗(yàn)密度
事實(shí)上,先驗(yàn)分布并不是唯一的,當(dāng)先驗(yàn)分布取Be(1,1),即取0~1之間的均勻分布時(shí),對(duì)結(jié)果的影響也不大。
②共軛先驗(yàn)分布
假定D的先驗(yàn)分布為π(D)~Be(α,β),則后驗(yàn)分布為:
由此可知,當(dāng)先驗(yàn)分布取貝塔分布時(shí),D的后驗(yàn)分布仍為貝塔分布,故D的共軛先驗(yàn)密度形式為Be(α,β)。
假定在類似或同類藥物的臨床試驗(yàn)中,收集到較全面的種族信息的NTE區(qū)受試者例數(shù)為N0,其中可視為TE區(qū)受試者的例數(shù)為X0,則構(gòu)建的共軛先驗(yàn)中α=X0,β=N0-X0。
③分層先驗(yàn)
在利用類似或同類的藥物所積累的種族信息數(shù)據(jù)構(gòu)建共軛先驗(yàn)時(shí),經(jīng)專家評(píng)定,NTE區(qū)受試者可視為TE區(qū)受試者的例數(shù)X0可能不是一固定的值,而是在某個(gè)范圍內(nèi)以某種形式分布。故我們引入貝葉斯層次模型,賦予α一先驗(yàn)分布,即超先驗(yàn),則先驗(yàn)分布由原來(lái)的貝塔分布形式的共軛先驗(yàn)變成了分層先驗(yàn)。
(3)擬合D的后驗(yàn)分布
①無(wú)信息先驗(yàn)和共軛先驗(yàn)時(shí)的后驗(yàn)分布
②分層先驗(yàn)時(shí)的后驗(yàn)分布
由于采用分層先驗(yàn)時(shí),先驗(yàn)分布的函數(shù)形式比較復(fù)雜,積分計(jì)算困難,難以得到后驗(yàn)分布的函數(shù)形式,故利用馬爾科夫鏈蒙特卡洛(markov chain monte carlo,MCMC)方法進(jìn)行模擬得出采用分層先驗(yàn)時(shí)D的后驗(yàn)分布。在本部分中,我們用α代表對(duì)歷史信息的不確定性,α的均值相同,波動(dòng)范圍越大,對(duì)歷史信息就越不確定。先驗(yàn)分布取Be(α,40-α),其中α按α=12、α~uniform(10,14)、α~uniform(8,16)、α~uniform(6,18)四種情況進(jìn)行模擬。Ⅱ期臨床試驗(yàn)中N=40,X=20。比較α取不同超先驗(yàn)時(shí),對(duì)后驗(yàn)分布的影響。
利用SAS 9.4 MCMC過(guò)程步模擬生成分層先驗(yàn)時(shí)D的后驗(yàn)分布的流程如圖1所示:
圖1 分層先驗(yàn)條件下的后驗(yàn)分布生成流程圖
3.D的后驗(yàn)分布對(duì)檢驗(yàn)效能的影響
參數(shù)設(shè)置:當(dāng)先驗(yàn)信息為無(wú)信息先驗(yàn)或共軛先驗(yàn)時(shí),D的后驗(yàn)分布仍為貝塔分布Be(a,b);當(dāng)先驗(yàn)信息取分層先驗(yàn)時(shí),D的后驗(yàn)分布難以用具體的函數(shù)形式表示,可通過(guò)MCMC模擬得出。本部分取NMRCT=500,NNTE=400,NTEM=100,NTEL=46,C=0.5、0.6。分以下幾種情況模擬:
情況3:分層先驗(yàn)的后驗(yàn)分布:
情況4:采用經(jīng)典頻率學(xué)派方法,若ZW>1.96,則判定目標(biāo)藥物有效,D=0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9。
模擬流程圖如圖2所示:
其中SZNTE、SZTE為NTE區(qū)和TE區(qū)Z檢驗(yàn)統(tǒng)計(jì)量的樣本值,ZNTE、ZTE為NTE區(qū)和TE區(qū)Z檢驗(yàn)統(tǒng)計(jì)量的總體值。
1.無(wú)信息先驗(yàn)和不同形式的貝塔先驗(yàn)對(duì)D后驗(yàn)分布的影響
當(dāng)取無(wú)信息先驗(yàn)時(shí),后驗(yàn)均值為0.5,后驗(yàn)方差為0.002451,這與樣本信息中D的均值和方差基本是一致的。
以N0為橫軸,后驗(yàn)均值和后驗(yàn)方差為縱軸,繪制散點(diǎn)圖后發(fā)現(xiàn),當(dāng)N0比較小時(shí),D的后驗(yàn)均值接近于0.5,即樣本信息的均值,隨著N0逐漸增大,D的后驗(yàn)均值逐漸向0.3靠攏,即逐漸接近歷史信息的均值。當(dāng)N0=N=100時(shí),后驗(yàn)均值=0.4,為樣本信息和歷史信息的均值。隨著N0增大,D后驗(yàn)方差逐漸減小,見(jiàn)圖3。
圖2 檢驗(yàn)效能計(jì)算流程圖
圖3 不同形式的貝塔先驗(yàn)對(duì)后驗(yàn)均值的影響
2.不同形式的分層先驗(yàn)對(duì)D后驗(yàn)分布的影響
隨著α波動(dòng)范圍逐漸增大時(shí),先驗(yàn)均值基本不變,先驗(yàn)標(biāo)準(zhǔn)差逐漸增大,后驗(yàn)均值逐漸向樣本均值0.5靠攏,后驗(yàn)標(biāo)準(zhǔn)差逐漸增大,見(jiàn)表1。
表1 不同形式的分層先驗(yàn)對(duì)后驗(yàn)均值和方差的影響
3.不同D的后驗(yàn)分布對(duì)試驗(yàn)檢驗(yàn)效能的影響
當(dāng)C取值相同時(shí),情況1、情況2、情況3中檢驗(yàn)效能隨后驗(yàn)均值變化的曲線基本重合,檢驗(yàn)效能均隨后驗(yàn)均值增大并逐漸趨于平穩(wěn)。相同的后驗(yàn)均值條件下,檢驗(yàn)效能在C=0.6相對(duì)C=0.5時(shí)相對(duì)較低。情況4為采用經(jīng)典頻率學(xué)派計(jì)算檢驗(yàn)效能,C=0.5時(shí),情況1、情況2、情況3和情況4的曲線基本重合,見(jiàn)圖4。
圖4 不同后驗(yàn)分布的后驗(yàn)均值對(duì)檢驗(yàn)效能的影響
本研究在Wang提出折扣因子D的基礎(chǔ)上賦予D更具體的實(shí)際意義,進(jìn)一步提出了一種MRCT中評(píng)價(jià)TE區(qū)藥物療效的貝葉斯方法,并結(jié)合公式推導(dǎo)和Monte Carlo模擬研究了不同D的先驗(yàn)分布對(duì)其后驗(yàn)分布的影響以及不同D的后驗(yàn)分布對(duì)試驗(yàn)檢驗(yàn)效能的影響,探討了該方法的可行性。
在本研究中,N0、N的大小分別表示歷史信息和樣本信息信息量的大小,收集到的受試者例數(shù)越多,表明收集到的種族信息越全面,信息量越大。在模型上先驗(yàn)分布、似然函數(shù)和后驗(yàn)分布的標(biāo)準(zhǔn)差代表信息量的大小,標(biāo)準(zhǔn)差越小,表明對(duì)D的分布范圍越確定,信息量越大。當(dāng)α取一定范圍內(nèi)的均勻分布時(shí),代表研究者對(duì)前期收集到的種族信息不太確定,信息量小,且均勻分布波動(dòng)范圍越大,信息量越小,用分層先驗(yàn)擬合這種情況時(shí),正好體現(xiàn)了這一結(jié)果。綜合結(jié)果可以看出,當(dāng)歷史信息的信息量相對(duì)樣本信息很小時(shí),則后驗(yàn)均值主要由樣本信息決定,后驗(yàn)分布的信息量基本接近樣本信息的量,當(dāng)歷史信息的量逐漸增大時(shí),后驗(yàn)均值逐漸向歷史信息均值靠攏,后驗(yàn)分布的信息量也逐漸增大,模型可以較好地模擬實(shí)際情況。
本方法中,用情況1、情況2、情況3可以不失一般性地代表D可能出現(xiàn)的所有后驗(yàn)分布情況。本研究提出的貝葉斯方法中D的后驗(yàn)均值即對(duì)應(yīng)原頻率學(xué)派方法[13]中的D值,而D的后驗(yàn)標(biāo)準(zhǔn)差則可反映D的變異程度,由結(jié)果可以看出:試驗(yàn)的檢驗(yàn)效能主要受D后驗(yàn)均值或D值影響,而與D的變異程度關(guān)系不大,即只要D的后驗(yàn)均值固定,無(wú)論收集到多少受試者評(píng)價(jià)D都對(duì)檢驗(yàn)效能沒(méi)有影響,但是在構(gòu)建后驗(yàn)分布時(shí),應(yīng)盡可能全面地收集樣本信息和歷史信息,收集信息的多少雖然不能直接影響檢驗(yàn)效能,但是可能會(huì)影響后驗(yàn)均值估計(jì)的準(zhǔn)確性,即如果收集信息過(guò)少,可能會(huì)導(dǎo)致D后驗(yàn)均值估計(jì)不準(zhǔn)確。本研究提出的貝葉斯方法較原頻率學(xué)派方法[13]的優(yōu)勢(shì)在于可將D的變異程度納入考慮,假定兩種不同的情況:一種情況是沒(méi)有收集到任何有用信息來(lái)評(píng)價(jià)D,D的后驗(yàn)分布為Be(1,1),另一種情況是假定收集到100名NTE區(qū)受試者的詳細(xì)種族相關(guān)信息,其中50名可等價(jià)于TE區(qū)受試者進(jìn)行了試驗(yàn),D的后驗(yàn)分布為Be(100,100),雖然兩種假定情況下D的后驗(yàn)均值均為0.5,但是第二種假定情況把握更大,D的變異更小,對(duì)應(yīng)更大的檢驗(yàn)效能較為合理。若采用原頻率學(xué)派方法[13],不考慮D的變異,兩種假定情況D均為0.5,檢驗(yàn)效能相同,不符合實(shí)際情況,而本研究提出的貝葉斯方法則為考慮D的變異對(duì)檢驗(yàn)效能的影響提供了基礎(chǔ),可在本研究提出的貝葉斯方法基礎(chǔ)上進(jìn)一步利用D的后驗(yàn)標(biāo)準(zhǔn)差對(duì)ZW進(jìn)行調(diào)整,從而使D的變異程度較大時(shí)對(duì)應(yīng)較小的檢驗(yàn)效能。
本研究提出了一種根據(jù)Ⅱ期臨床試驗(yàn)種族信息和歷史種族信息確定折扣因子D,并進(jìn)一步評(píng)價(jià)TE區(qū)藥物療效的貝葉斯方法。本方法允許研究者從生物個(gè)體的角度對(duì)種族差異作出評(píng)定,對(duì)種族差異的評(píng)價(jià)更加客觀,并且既能體現(xiàn)D的集中趨勢(shì),又能體現(xiàn)D的離散趨勢(shì),具有良好的實(shí)際意義。不足之處在于沒(méi)有給出一個(gè)NTE區(qū)受試者可以等價(jià)于一個(gè)TE區(qū)受試者的量化標(biāo)準(zhǔn),本研究建議主要通過(guò)藥代動(dòng)力學(xué)、藥效動(dòng)力學(xué)和療效數(shù)據(jù)進(jìn)行判斷,兼顧可能導(dǎo)致區(qū)域間藥物療效差異的其他因素,這將會(huì)在以后的工作中結(jié)合實(shí)踐予以補(bǔ)充。