黃慧瑤 劉梅若 李喜艷 孟鑫雨 崔丹丹 冷燁 唐玉 李寧
貝葉斯學(xué)派和頻率論學(xué)派是統(tǒng)計(jì)學(xué)的兩個(gè)重要派系,均可用于對(duì)不確定結(jié)果進(jìn)行估計(jì)和統(tǒng)計(jì)推斷,但兩者的統(tǒng)計(jì)思想存在明顯差異[1,2]。頻率學(xué)派認(rèn)為世界是確定的,總體參數(shù)是一個(gè)固定常數(shù),樣本信息是隨機(jī)的;貝葉斯學(xué)派則認(rèn)為世界是不確定的,總體參數(shù)是隨機(jī)變量,樣本信息是固定的。因此,兩者在信息整合、統(tǒng)計(jì)推斷和概率解釋方面也不相同。以II期單臂試驗(yàn)為例,旨在探索新藥A治療晚期卵巢癌的客觀緩解率(objective response rate,ORR)是否高于20%。
頻率學(xué)派將首先建立假設(shè)-新藥ORR等于20%,然后完全依托試驗(yàn)數(shù)據(jù),以證偽演繹的思路,求出觀察到試驗(yàn)數(shù)據(jù)或更極端數(shù)據(jù)的可能性(P值);如果單側(cè)P值小于2.5%,則拒絕假設(shè),認(rèn)為新藥ORR高于20%。貝葉斯學(xué)派將首先基于先驗(yàn)信息建立總體參數(shù)的概率分布,然后整合試驗(yàn)數(shù)據(jù),求出總體參數(shù)的后驗(yàn)分布,判斷該參數(shù)高于20%的后驗(yàn)概率是否高于預(yù)先設(shè)定的閾值,如95%顯著水平或50%相關(guān)水平。
與頻率統(tǒng)計(jì)相比,貝葉斯統(tǒng)計(jì)的概率更易于理解,可直接解釋為對(duì)研究假設(shè)發(fā)生的相信程度[3,4]。此外,貝葉斯的主要優(yōu)勢(shì)在于允許將專家或既往研究提供的先驗(yàn)信息與試驗(yàn)數(shù)據(jù)進(jìn)行整合,每次形成的后驗(yàn)信息又可以作為下一次推斷的先驗(yàn)信息,并利用信息進(jìn)行序貫的自適應(yīng)決策,因此決策更加高效、更加穩(wěn)健[5,6]。因?yàn)樨惾~斯統(tǒng)計(jì)需要建立模型,計(jì)算及統(tǒng)計(jì)過(guò)程更復(fù)雜;結(jié)果準(zhǔn)確性依賴于先驗(yàn)信息的可靠性和可交換性,在確證性試驗(yàn)中的應(yīng)用受到監(jiān)管的限制[7]。
近些年來(lái),全球腫瘤新藥研發(fā)依然如火如荼,但依然存在高失敗率的風(fēng)險(xiǎn),尤其是腫瘤早期研發(fā)[8,9]。隨著研發(fā)進(jìn)展,腫瘤治療手段不斷增加,腫瘤新藥研發(fā)也逐步從細(xì)胞毒藥時(shí)代過(guò)渡為靶向藥和免疫藥時(shí)代,由單藥治療向聯(lián)合治療為主轉(zhuǎn)變[10,11];以I期/II期無(wú)縫研究、擴(kuò)展隊(duì)列研究、平臺(tái)研究等為代表的更高效、更靈活的適應(yīng)性設(shè)計(jì)也備受青睞[12,13]。掌握新形勢(shì)下腫瘤早期開(kāi)發(fā)的新需求,采用科學(xué)有效的設(shè)計(jì)和方法提升腫瘤新藥早期研發(fā)成功率,是醫(yī)藥企業(yè)共同關(guān)注的熱點(diǎn)和難點(diǎn)。
2.1 腫瘤新藥研發(fā)從細(xì)胞毒藥時(shí)代過(guò)渡為靶向藥和免疫藥時(shí)代 ①與細(xì)胞毒藥的間歇毒性不同,非細(xì)胞毒藥通常是每天服用,呈現(xiàn)連續(xù)毒性,因此對(duì)毒性容忍度可能不同,依據(jù)毒性特點(diǎn)及臨床需求等特點(diǎn),對(duì)毒性容忍度進(jìn)行更靈活的設(shè)置是腫瘤早期研究的實(shí)際需求之一;②非細(xì)胞毒藥常見(jiàn)延遲毒性、延遲反應(yīng),因此在執(zhí)行期中監(jiān)測(cè)時(shí),無(wú)法通過(guò)已觀測(cè)數(shù)據(jù)進(jìn)行期中決策,為避免暫停入組直到所有患者觀測(cè)到反應(yīng)所致的試驗(yàn)周期延長(zhǎng),基于貝葉斯方法使用已觀測(cè)數(shù)據(jù)提高期中分析決策效率是腫瘤早期試驗(yàn)的實(shí)際需求之二;③非細(xì)胞毒藥物可能無(wú)法達(dá)到最大耐受劑量(maximal tolerable dose, MTD),有效率也不再呈現(xiàn)細(xì)胞毒藥的單調(diào)遞增性,既往將毒性和有效性分別考慮、先I期再II期的傳統(tǒng)設(shè)計(jì)不再適用;基于風(fēng)險(xiǎn)獲益原則,開(kāi)展I期/II期無(wú)縫設(shè)計(jì),構(gòu)建貝葉斯決策模型以同時(shí)權(quán)衡有效性-毒性,進(jìn)而提高早期研發(fā)效率是腫瘤早期試驗(yàn)的實(shí)際需求之三(圖1)。
圖 1 不同劑量水平下腫瘤靶向新藥A的毒性和有效性變化Fig 1 Changes in toxicity and efficacy of anticancer new drug at different dose levels
2.2 腫瘤新藥研發(fā)由單藥治療向聯(lián)合治療轉(zhuǎn)變 聯(lián)合治療劑量探索面臨諸多挑戰(zhàn),劑量探索范圍成倍增加。更為重要的是,與單藥治療毒性完全有序相比,聯(lián)合治療毒性率和反應(yīng)率在劑量組合矩陣中通常僅局部有序。舉例來(lái)說(shuō),AmBn代表藥物A劑量水平m和藥物B劑量水平n的組合,我們無(wú)法知道A3B2、A2B3、A1B4的毒性和有效性的大小關(guān)系,組合矩陣中可能存在MTD等高線的情形。基于貝葉斯框架不斷更新劑量-毒性曲線后驗(yàn)估計(jì),指導(dǎo)后續(xù)患者劑量分配提高早期研發(fā)效率是實(shí)際需求之四。
表 1 貝葉斯方法和頻率論方法的比較Tab 1 Bayesian versus frequentist paradigms
2.3 傳統(tǒng)研究研發(fā)模式向現(xiàn)代研發(fā)模式的轉(zhuǎn)變 相對(duì)而言,傳統(tǒng)研發(fā)存在高投入、長(zhǎng)周期、低效率等不足,采用科學(xué)合理的統(tǒng)計(jì)設(shè)計(jì),實(shí)現(xiàn)向現(xiàn)代研發(fā)模式轉(zhuǎn)變—低投入、短周期、高效率,得到工業(yè)界和監(jiān)管方等全行業(yè)越來(lái)越廣泛地重視。腫瘤新藥早期試驗(yàn)設(shè)計(jì)中,也越來(lái)越常用基于模型或模型輔助的劑量探索設(shè)計(jì)、I期/II期無(wú)縫設(shè)計(jì)、多隊(duì)列擴(kuò)展、主方案設(shè)計(jì)等[13-16]。借用專家信息、歷史數(shù)據(jù)、早期試驗(yàn)信息,幫助試驗(yàn)決策、減少資源浪費(fèi)、加速新藥研發(fā)進(jìn)程,已成為現(xiàn)代研發(fā)模式的共同需求和實(shí)踐。
基于上述腫瘤新藥早期研發(fā)的新趨勢(shì)和新需求,隨著計(jì)算機(jī)技術(shù)的發(fā)展,以信息借用、靈活高效為特點(diǎn)的貝葉斯設(shè)計(jì)方法逐步被學(xué)術(shù)界提出。隨著全球主要監(jiān)管對(duì)藥物早期研發(fā)的態(tài)度開(kāi)放,貝葉斯方法在腫瘤新藥早期研發(fā)中的應(yīng)用也得到工業(yè)界的廣泛青睞,尤其是在腫瘤新藥的劑量探索、療效探索及主方案設(shè)計(jì)等領(lǐng)域。
3.1 貝葉斯方法助力腫瘤新藥劑量探索 基于算法的爬坡設(shè)計(jì)由于非常簡(jiǎn)單、易于實(shí)施和理解,廣泛應(yīng)用于腫瘤新藥劑量探索,以“3+3”為代表;但是該類設(shè)計(jì)存在最優(yōu)劑量準(zhǔn)確性不佳、低劑量暴露人數(shù)多、統(tǒng)計(jì)性能低等諸多弊端,無(wú)法滿足腫瘤新藥早期研發(fā)新形勢(shì)下的新需求。為提高正確選擇MTD的概率,借用信息、建立劑量毒性曲線關(guān)系模型,進(jìn)而更好地幫助劑量爬坡及決策可優(yōu)效提高研發(fā)效率,保護(hù)受試者安全。近些年來(lái),以mTPI、BOIN設(shè)計(jì)為代表貝葉斯模型輔助設(shè)計(jì)和以持續(xù)再評(píng)估法為代表的貝葉斯模型設(shè)計(jì)逐步得到應(yīng)用[17-19]。模型輔助決策因?yàn)榧狭四P驮O(shè)計(jì)優(yōu)良的統(tǒng)計(jì)性能和基于算法設(shè)計(jì)簡(jiǎn)單易行的優(yōu)點(diǎn),應(yīng)用越來(lái)越廣泛。針對(duì)聯(lián)合用藥試驗(yàn)、延遲毒性、同時(shí)考慮藥物毒性和有效性等新需求,基于貝葉斯方法的BOIN拓展設(shè)計(jì)及其工具近些年也得到了工業(yè)界的追捧[19,20]。
3.2 貝葉斯方法助力腫瘤新藥療效探索 建立新藥在目標(biāo)人群總體療效參數(shù)的先驗(yàn)分布;實(shí)時(shí)監(jiān)測(cè)試驗(yàn)數(shù)據(jù),根據(jù)試驗(yàn)觀察到的數(shù)據(jù),計(jì)算藥物達(dá)到與目標(biāo)療效的后驗(yàn)概率;基于預(yù)設(shè)標(biāo)準(zhǔn),及時(shí)終止無(wú)效隊(duì)列,結(jié)束優(yōu)效隊(duì)列進(jìn)入下一階段,可有效減少資源浪費(fèi)、加速新藥研發(fā)進(jìn)程。由于操作簡(jiǎn)單,基于頻率派的Simon兩階段已被廣泛應(yīng)用于II期腫瘤藥物臨床試驗(yàn)中,但該設(shè)計(jì)也存在一些局限性[21]。通常,Simon兩階段僅允許一次期中分析、僅適用于二分類結(jié)局研究、無(wú)法借用歷史數(shù)據(jù)和先驗(yàn)信息。更加靈活和高效的基于貝葉斯的II期試驗(yàn)設(shè)計(jì)方法也被提出,可以實(shí)現(xiàn)組間信息借用,更穩(wěn)健地進(jìn)行早期療效的實(shí)時(shí)監(jiān)測(cè)、預(yù)測(cè)和決策,包括MUCE隊(duì)列拓展、貝葉斯最優(yōu)II期設(shè)計(jì)、針對(duì)有延遲反應(yīng)多重填補(bǔ)貝葉斯設(shè)計(jì)等[14,22,23]。
3.3 貝葉斯方法助力主方案設(shè)計(jì) 平臺(tái)設(shè)計(jì)是一類能夠同時(shí)評(píng)估多種候選藥物、多種腫瘤或分子亞型療效的設(shè)計(jì),包括籃子試驗(yàn)、傘式試驗(yàn)和平臺(tái)試驗(yàn)[24,25],研究集中管理、統(tǒng)一決策。基于貝葉斯方法科學(xué)借用各試驗(yàn)組間信息,可有效節(jié)省樣本量,學(xué)術(shù)界先后提出了貝葉斯分層模型(Bayesian Hierarchical Model, BHM),實(shí)現(xiàn)在籃子間自適應(yīng)地借用信息、允許多次期中分析[26,27];MIDAS(multicandidate iterative design with adaptive selection)貝葉斯II期試驗(yàn)設(shè)計(jì),允許共用對(duì)照組,借用組間信息,以高效、無(wú)縫地方式持續(xù)篩選大量候選藥物;貝葉斯藥物組合平臺(tái)設(shè)計(jì),實(shí)現(xiàn)自適應(yīng)跨組合的信息借用以高效識(shí)別有效組合。
近年來(lái),我國(guó)臨床試驗(yàn)的實(shí)施和監(jiān)管已實(shí)現(xiàn)與國(guó)際規(guī)范的逐步接軌,對(duì)前沿理念和設(shè)計(jì)方法在新藥、新技術(shù)早期研發(fā)中應(yīng)用的態(tài)度也更加的開(kāi)放,尤其是在醫(yī)療器械產(chǎn)品開(kāi)發(fā)中[28]。在腫瘤新藥研發(fā)高風(fēng)險(xiǎn)、高收益的雙重背景下,面向腫瘤新藥早期研發(fā)新形勢(shì)下的難點(diǎn)問(wèn)題和新的需求,貝葉斯臨床試驗(yàn)設(shè)計(jì)因其高效性和靈活性得到工業(yè)界和學(xué)術(shù)界的廣泛重視,尤其是在國(guó)外已經(jīng)有較多的實(shí)踐應(yīng)用。
值得注意的是,基于貝葉斯方法的后驗(yàn)概率均值本質(zhì)上是先驗(yàn)期望和觀測(cè)數(shù)據(jù)期望的加權(quán)平均。隨著觀測(cè)數(shù)據(jù)樣本量不斷增加,基于貝葉斯方法所得概率會(huì)和頻率派方法趨于一致。也就是說(shuō),在大樣本研究中,貝葉斯方法借用信息使得結(jié)果更加穩(wěn)健的優(yōu)勢(shì)將消失;由于貝葉斯方法的計(jì)算和建模更加復(fù)雜,因此,不推薦在確證性試驗(yàn)等大樣本研究中使用貝葉斯方法。再者,在確證性研究中,監(jiān)管更加重視多重性問(wèn)題和I類錯(cuò)誤控制,尚未有監(jiān)管在新藥確證性試驗(yàn)中接受企業(yè)采用貝葉斯方法。早期小樣本研究是目前貝葉斯方法的主要適宜場(chǎng)景。
貝葉斯方法通過(guò)借用先驗(yàn)信息使得早期試驗(yàn)及其決策更加高效。先驗(yàn)信息的可交換性至關(guān)重要,即歷史數(shù)據(jù)、專家判定的信息適用于本研究決策參考的程度。舉例來(lái)說(shuō),籃子試驗(yàn)是一類在具有相同突變、不同組織類型的患者中評(píng)估一種藥物的設(shè)計(jì),多為II期早期療效探索研究。該類設(shè)計(jì)的實(shí)際挑戰(zhàn)是盡管患者具有相同突變,但療效反應(yīng)有所不同。完全借用組間信息無(wú)疑會(huì)提高統(tǒng)計(jì)檢驗(yàn)效能,但也會(huì)導(dǎo)致I類錯(cuò)誤的膨脹;完全不借用信息,能很好的控制I類錯(cuò)誤,但統(tǒng)計(jì)效能會(huì)降低。采用BHM等方法,基于數(shù)據(jù)觀測(cè)到的組間異質(zhì)性,自適應(yīng)地確定借用信息的程度對(duì)準(zhǔn)確估計(jì)療效至關(guān)重要。
研究存在一些不足。限于篇幅,研究對(duì)腫瘤早期研發(fā)的新趨勢(shì)與新需求、貝葉斯方法應(yīng)用概況不夠詳盡,比如貝葉斯方法在生物標(biāo)志物富集設(shè)計(jì)、個(gè)性化劑量探索方面的應(yīng)用??傮w來(lái)說(shuō),本研究以腫瘤新藥早期研發(fā)的新趨勢(shì)、新需求為導(dǎo)向,科學(xué)闡述了貝葉斯方法的進(jìn)展及應(yīng)用價(jià)值,并與頻率派的理念、應(yīng)用場(chǎng)景進(jìn)行了比較分析,可為醫(yī)藥研發(fā)的所有從業(yè)人員提供宏觀、系統(tǒng)的參考。