吳昌金,李汶檀,陶紅宇,章溪妍,辛 雨,宋若萌,王凱歌,左 玲,蔡源益,惠 文
1中國醫(yī)科大學(xué)健康管理學(xué)院,遼寧沈陽,110122;2中國醫(yī)學(xué)科學(xué)院醫(yī)藥生物技術(shù)研究所,北京,100050;3四川大學(xué)華西醫(yī)院科技部,四川成都,610041;4四川大學(xué)華西醫(yī)院呼吸與危重癥醫(yī)學(xué)科,四川成都,610041;5四川大學(xué)華西醫(yī)院門診部全程管理中心,四川成都,610041
肺癌是全球死亡率最高的癌癥[1]。非小細(xì)胞肺癌(non-small cell lung cancer,NSCLC)是最常見的病理分型,約占全部肺癌的85%[2]。由于NSCLC早期癥狀不明顯,50%-70%的患者在確診時已為晚期肺癌,采用傳統(tǒng)化療方案的總生存期(overall survival, OS)不足1年,治療效果不佳[3]。隨著腫瘤免疫治療的深入研究和臨床應(yīng)用,與傳統(tǒng)放化療相比,免疫藥物治療顯著地延長了患者的無進(jìn)展生存期(progression-free survival, PFS)和OS,同時能降低治療相關(guān)不良反應(yīng)的發(fā)生風(fēng)險,成為國內(nèi)外晚期NSCLC一線治療方案[4]。然而,免疫藥物的創(chuàng)新程度高、臨床急需以及藥物可替代性弱等因素,導(dǎo)致免疫藥物價格昂貴,支出預(yù)算占比高。因此,醫(yī)療服務(wù)購買方、醫(yī)療機構(gòu)和醫(yī)生等決策者在實際選擇免疫藥物時不僅需要考慮藥物本身的安全性和有效性,同時需兼顧經(jīng)濟性。
藥物經(jīng)濟學(xué)研究采用一系列評價方法比較和分析不同方案的經(jīng)濟成本和健康產(chǎn)出,以期用較低的成本實現(xiàn)醫(yī)療保健收益的最大化[5]。近些年,隨著腫瘤免疫藥物的臨床療效不斷被證實,相關(guān)藥物納入醫(yī)保報銷目錄以及藥品采購目錄的決策需求增加,藥物經(jīng)濟學(xué)研究也隨之增加。然而,藥物經(jīng)濟學(xué)研究在研究角度、模型、參數(shù)來源途徑和敏感性分析等方面的選擇和設(shè)置,均會影響結(jié)果的真實性和可靠性。據(jù)研究,國內(nèi)60%以上的藥物經(jīng)濟學(xué)研究質(zhì)量欠佳,難以直接指導(dǎo)決策[6-7]。既往研究納入的免疫藥物數(shù)量有限,最多僅納入4種,未能展現(xiàn)NSCLC免疫治療的藥物經(jīng)濟學(xué)研究全貌。同時,由于伊匹木單抗、卡瑞利珠單抗、西米普利單抗和信迪利單抗等新興免疫藥物的涌現(xiàn),亟需更新現(xiàn)有系統(tǒng)評價證據(jù)。并且,既往研究在開展質(zhì)量評價時,往往采用報告質(zhì)量評價工具,而非方法學(xué)質(zhì)量評價工具,造成質(zhì)量評價結(jié)果存在一定偏倚[8-11]。鑒于此,本研究在更全面、系統(tǒng)檢索國內(nèi)外免疫藥物一線治療NSCLC的藥物經(jīng)濟學(xué)研究的基礎(chǔ)上,使用方法學(xué)質(zhì)量評價工具,對比和總結(jié)國內(nèi)外現(xiàn)有研究的主要特征和方法學(xué)局限性,為我國研究人員開展相關(guān)藥物經(jīng)濟學(xué)研究以及決策者利用相關(guān)研究證據(jù)提供參考。
檢索PubMed、Embase、Cochrane、Health Technology Assessment Database、National Health Service Economic Evaluation Database等英文數(shù)據(jù)庫,以及中國生物醫(yī)學(xué)文獻(xiàn)服務(wù)系統(tǒng)、中國知網(wǎng)、萬方和維普等中文數(shù)據(jù)庫,檢索時限為建庫至2022年8月24日。采用主題詞和自由詞結(jié)合的方式進(jìn)行檢索,檢索詞包括非小細(xì)胞肺癌、免疫治療、免疫藥物、免疫檢查點抑制劑、成本-效果分析、成本-效用分析、衛(wèi)生經(jīng)濟評價、藥物經(jīng)濟學(xué)等。
文獻(xiàn)納入標(biāo)準(zhǔn):研究對象為NSCLC首次治療患者;干預(yù)措施或?qū)φ沾胧┌痪€免疫藥物治療;主要結(jié)局指標(biāo)包含成本、質(zhì)量調(diào)整生命年(quality-adjusted life years,QALYs)、增量成本效果比(incremental cost-effectiveness ratio,ICER);研究設(shè)計為成本-效果分析和成本-效用分析。
文獻(xiàn)排除標(biāo)準(zhǔn):研究設(shè)計僅為成本-效益分析、成本分析或預(yù)算影響分析;重復(fù)發(fā)表文獻(xiàn)、無全文或未公開發(fā)表文獻(xiàn);摘要、個案報告、綜述、評論、學(xué)位論文等文獻(xiàn);非中、英文文獻(xiàn)。
依據(jù)納入和排除標(biāo)準(zhǔn)分別進(jìn)行題目和摘要、全文篩選。提取納入研究的基本情況和藥物經(jīng)濟學(xué)評價內(nèi)容(研究角度、成本分類、貼現(xiàn)率等)。以上過程均由4名研究者分成兩組背靠背獨立進(jìn)行,若遇分歧則通過協(xié)商或由第三方判斷后達(dá)成一致。
由4名研究者分成兩組獨立使用衛(wèi)生經(jīng)濟學(xué)研究質(zhì)量評價量表(quality of health economic studies, QHES)進(jìn)行質(zhì)量評價[12],若遇分歧則通過協(xié)商或由第三方判斷后達(dá)成一致。QHES量表根據(jù)文獻(xiàn)的目的、方法、結(jié)果、討論、資金來源等方面逐一判斷,完全符合標(biāo)準(zhǔn)判斷為“是”,否則為“否”,根據(jù)每個條目所占的相對比例賦值為百分制得到最終分?jǐn)?shù)。根據(jù)分值將研究質(zhì)量劃分為4個等級:極低質(zhì)量(0-24分)、低質(zhì)量(25-49分)、中等質(zhì)量(50-74分)和高質(zhì)量(75-100分)[13]。
初檢相關(guān)文獻(xiàn)1206篇,經(jīng)逐層篩選后,最終納入61篇文獻(xiàn),其中10篇中文文獻(xiàn)和51篇英文文獻(xiàn)。文獻(xiàn)檢索及篩選結(jié)果見圖1,納入的文獻(xiàn)見表1。
表1 納入研究及參考文獻(xiàn)
圖1 文獻(xiàn)檢索及篩選結(jié)果
納入文獻(xiàn)的發(fā)表時間為2017-2022年,且呈現(xiàn)逐年遞增趨勢。從治療方案的選擇上看,31篇(50.8%)文獻(xiàn)為免疫藥物單用方案對比化療方案,28篇(45.9%)文獻(xiàn)為免疫藥物聯(lián)合化療方案對比化療方案。從免疫藥物的納入情況上看,帕博利珠單抗的研究最多(n=32,52.5%),其次是阿替利珠單抗(n=12,19.7%)和納武利尤單抗(n=11,18.0%)。所有納入文獻(xiàn)均進(jìn)行了成本-效用分析,其中1篇(10%)中文文獻(xiàn)和23篇(45.1%)英文文獻(xiàn)同時進(jìn)行了成本-效果分析。成本-效果分析均采用生命年(life years, LY)作為臨床結(jié)局指標(biāo)。見表2。
表2 納入文獻(xiàn)部分內(nèi)容情況(篇,%)
從研究的國別來看,中文文獻(xiàn)全部基于中國單一視角。英文文獻(xiàn)以美國(n=26,50.9%)視角最多,其次是中國(n=14, 27.4%)視角。最常用的評價角度是衛(wèi)生體系角度(n=24,39.3%)和醫(yī)療保障支付方角度(n=24,39.3%),其次是醫(yī)療機構(gòu)角度(n=7,11.5%),全社會角度(n=4,6.6%)和患者角度(n=1,1.6%)。80%的中文文獻(xiàn)采用衛(wèi)生體系角度。
98.4%的研究測算了直接醫(yī)療成本,主要涉及藥品費、藥品管理費、疾病管理費、不良反應(yīng)處置費和臨終關(guān)懷費等。在基于全社會視角的4篇(6.6%)文獻(xiàn)中,僅1篇(25%)文獻(xiàn)計算了直接非醫(yī)療成本(含交通費、食宿費等)和間接成本(因疾病造成的勞動時間和生產(chǎn)率損失等)。
所有研究均使用模型進(jìn)行了長期模擬。馬爾科夫(Markov)模型是最常用的模型(n=39,63.9%),其中6篇(9.8%)文獻(xiàn)同時使用決策樹和Markov模型。20篇(32.8%)文獻(xiàn)使用了分區(qū)生存(partitioned survival, PS)模型,2篇(3.3%)文獻(xiàn)采用了微觀模擬模型。
最常用的健康狀態(tài)為三狀態(tài),即疾病無進(jìn)展期,疾病進(jìn)展期和死亡。54篇(88.5%)文獻(xiàn)使用了經(jīng)典三狀態(tài)建立模型,其中中文文獻(xiàn)全部使用三狀態(tài)模型。5篇(8.2%)文獻(xiàn)在三狀態(tài)的基礎(chǔ)上進(jìn)行了細(xì)化,其中4篇(6.6%)文獻(xiàn)將PFS狀態(tài)細(xì)化為穩(wěn)定狀態(tài)、因毒副反應(yīng)暫停一線治療而接受二線治療狀態(tài);2篇(3.3%)文獻(xiàn)增加了健康終末期的最佳支持治療狀態(tài)。
42篇(68.9%)文獻(xiàn)報告了模型模擬的研究時限,其中18篇(29.5%)為20年,16篇(26.2%)為10年,19篇(31.1%)文獻(xiàn)未明確具體研究時限。在循環(huán)周期的設(shè)定上,41篇(67.2%)文獻(xiàn)使用3周作為模型的循環(huán)周期。
2.5.1 效果參數(shù)來源。納入研究均為基于模型的藥物經(jīng)濟學(xué)評價,療效數(shù)據(jù)均來自于已發(fā)表的大型臨床隨機對照試驗(randomized controlled trials, RCTs),主要結(jié)局指標(biāo)為PFS和OS。除此之外,6篇(9.8%)文獻(xiàn)在RCTs的基礎(chǔ)上,利用了既有數(shù)據(jù)庫等真實世界數(shù)據(jù)(real world data, RWD)對臨近死亡階段的療效數(shù)據(jù)進(jìn)行了補充,2篇(3.3%)研究使用數(shù)據(jù)庫對長期效果進(jìn)行驗證。
2.5.2 參數(shù)模擬。在使用臨床試驗的生存曲線重建患者個體療效數(shù)據(jù)時,54篇(88.5%)文獻(xiàn)清晰報告了擬合生存曲線的參數(shù)分布,其中42篇(68.9%)報告了最佳參數(shù)擬合的判斷方法,常用的方法依次為赤池信息準(zhǔn)則(n=42,68.9%)、貝葉斯信息準(zhǔn)則(n=26,42.6%)和視覺判斷(n=23,37.7%)。其中,19篇(31.1%)同時使用以上3種方法,12篇(19.6%)使用以上兩種方法判斷最佳擬合的參數(shù)分布。
2.5.3 健康效用值來源。46篇(75.4%)文獻(xiàn)的健康效用值來源于已發(fā)表的藥物經(jīng)濟學(xué)評價或橫斷面研究,15篇(24.6%)來源于臨床試驗。此外,由于腫瘤藥物的副作用,3級以上的不良反應(yīng)會影響效用值,26篇(42.6%)文獻(xiàn)報告了不良反應(yīng)的負(fù)效用值,且均來自于已發(fā)表的文獻(xiàn),其中以引用NSCLC效用值的國際多中心研究結(jié)果最多(n=20,76.9%)。
20篇(32.8%)文獻(xiàn)同時進(jìn)行了敏感性分析和情境分析。57篇(93.4%)進(jìn)行了確定型和概率敏感性分析,3篇(4.9%)未進(jìn)行概率敏感性分析。在使用確定型敏感性分析的文獻(xiàn)中,以單因素分析為主(n=60,98.4%)。概率敏感性分析以蒙特卡洛模擬為主(n=58,95.1%)。
使用QHES工具進(jìn)行研究質(zhì)量評價,最高95分,最低45分,平均74.3分。其中,中文文獻(xiàn)得分范圍為45-82分,平均60.1分;英文文獻(xiàn)得分范圍為53-95分,平均77.0分。75-100分高質(zhì)量研究共有28篇(45.9%),其中中文文獻(xiàn)1篇,英文文獻(xiàn)27篇。其余33篇文獻(xiàn)(54.1%)均為中低質(zhì)量。從各條目得分情況來看,所有納入研究在研究目的、不確定性分析、增量分析、結(jié)果測量和研究結(jié)論等條目中均獲得高分,而在研究角度及選擇原因、模型假設(shè)及驗證和偏倚大小及方向等條目中得分較低,分別僅有1篇(1.6%),3篇(4.9%)和1篇(1.6%)文獻(xiàn)獲得高分。與英文文獻(xiàn)相比,中文文獻(xiàn)在模型結(jié)構(gòu)及方法條目中普遍得分較低,僅1篇(1.6%)獲得高分。研究質(zhì)量評價結(jié)果見圖2。
研究角度是藥物經(jīng)濟學(xué)評價方法的基本要點之一。《中國藥物經(jīng)濟學(xué)評價指南導(dǎo)讀2022》推薦采用全社會角度和衛(wèi)生體系角度進(jìn)行評價,從社會福利的觀點出發(fā),最理想的藥物經(jīng)濟學(xué)評價角度是全社會角度[14]。英國國家健康與臨床卓越研究所、加拿大藥品和衛(wèi)生技術(shù)評估機構(gòu)等機構(gòu)推薦采用醫(yī)療保障支付方和全社會兩個角度進(jìn)行評價[15]。然而,在本研究納入的文獻(xiàn)中,僅1篇采用了兩種研究角度進(jìn)行分析。此外,成本的確認(rèn)范圍需要和選擇的研究角度一致。本研究發(fā)現(xiàn),4篇從社會角度開展的藥物經(jīng)濟學(xué)研究中,僅1篇分析了全社會角度下的直接非醫(yī)療成本和間接成本,其余均只計算了直接醫(yī)療成本。直接非醫(yī)療成本是指患者因?qū)で筢t(yī)療服務(wù)而直接消耗的醫(yī)療資源以外的資源,例如營養(yǎng)費、交通食宿費等[14]。盡管與直接醫(yī)療費用相比,直接非醫(yī)療成本可能在疾病經(jīng)濟負(fù)擔(dān)中占比相對較小,但是由于新興的免疫、靶向等腫瘤治療手段延長了患者的預(yù)期壽命,患者需要增加周期性隨訪治療。因此,患者及家屬將負(fù)擔(dān)頻繁治療活動相關(guān)的大量直接非醫(yī)療成本[16-17]。此外,間接成本是指疾病、傷殘或死亡造成的患者及其家庭的勞動時間及生產(chǎn)力的損失[14]。據(jù)研究,生產(chǎn)力損失帶來的成本可能會超過直接醫(yī)療成本[18-19]。通過納入間接成本,可以更加全面地分析非小細(xì)胞肺癌對患者家屬和整個社會帶來的影響。因此,研究角度與成本界定的不一致,勢必導(dǎo)致研究結(jié)果的真實性不足。
藥物經(jīng)濟學(xué)評價推薦使用QALYs作為效果指標(biāo),該指標(biāo)需要結(jié)合患者生存時間和健康效用值來確定。本研究納入的NSCLC免疫藥物經(jīng)濟學(xué)研究文獻(xiàn)的療效數(shù)據(jù)雖然均來自于RCTs或既有數(shù)據(jù)庫,但仍為基于二次文獻(xiàn)數(shù)據(jù)的藥物經(jīng)濟學(xué)研究,與基于個體水平數(shù)據(jù)的藥物經(jīng)濟學(xué)研究在納排標(biāo)準(zhǔn)、數(shù)據(jù)分析方法、疾病研究的選擇、成本的評估范圍、時間范圍偏差等方面具有顯著差別[20]。一般而言,基于個體水平數(shù)據(jù)的藥物經(jīng)濟學(xué)臨床療效數(shù)據(jù)可以通過RCTs或者真實世界研究兩種方式獲得。真實世界研究通過收集患者日常診療環(huán)境下的數(shù)據(jù),可以有效彌補RCTs納排標(biāo)準(zhǔn)嚴(yán)格、隨訪周期短等局限性,同時能夠避免模擬RCTs生存曲線獲得長期療效數(shù)據(jù)時帶來的潛在不確定性,成為未來基于個體水平數(shù)據(jù)的藥物經(jīng)濟學(xué)研究的主要數(shù)據(jù)來源[21]。效用值反映了患者對健康結(jié)果的偏好程度。本研究納入文獻(xiàn)的效用值主要為直接引用Nafees等人的研究結(jié)果,該研究采用健康效用值直接測量法中的時間權(quán)衡法,調(diào)查了中國、英國和澳大利亞等國轉(zhuǎn)移性NSCLC患者一線化療后的健康效用值,便于不同國家間效用值的比較[22]。然而,由于每個國家只納入約75例自愿參加研究的患者,樣本代表性較差且具有選擇偏倚。因此,該研究結(jié)果運用至單一國家角度的藥物經(jīng)濟學(xué)研究時應(yīng)該謹(jǐn)慎。2018年,我國學(xué)者報告了基于232例NSCLC本土人群的健康效用值[23],建議在進(jìn)行中國角度的藥物經(jīng)濟學(xué)研究時,對以上兩項健康效用值結(jié)果進(jìn)行敏感性分析,減少研究結(jié)果的偏差。
在納入的文獻(xiàn)中,NSCLC免疫藥物經(jīng)濟學(xué)研究的長期模擬主要采用Markov模型和PS模型兩種模型,其中Markov模型的使用率高于PS模型。Markov模型能夠反映疾病的發(fā)生發(fā)展過程,不良反應(yīng)等多個狀態(tài),但需要設(shè)定不同狀態(tài)的轉(zhuǎn)移概率,而這種概率實際上會隨著時間發(fā)生變化,在實際估計模型時,若使用固定概率會對結(jié)果和結(jié)論產(chǎn)生偏差[24]。相較于Markov模型,PS模型不需要轉(zhuǎn)移概率因而計算更簡便,但是過分依賴生存曲線,導(dǎo)致在預(yù)測時可能產(chǎn)生誤差,因為PFS和OS曲線實際上并不是相互獨立的[25]。研究中,對于選擇Markov模型還是PS模型除了需要考慮不同模型對結(jié)果的影響外,還需要考慮模型與研究疾病的適配度,療效數(shù)據(jù)的成熟度等方面因素。PS模型相較于Markov模型更能夠解釋臨床試驗的常用終點指標(biāo)(例如OS、PFS),然而當(dāng)需要考慮疾病復(fù)發(fā)、轉(zhuǎn)移等更為復(fù)雜的情況或數(shù)據(jù)完整度不高時,選擇Markov模型更為恰當(dāng),但同時需要考慮是否能得到合理的轉(zhuǎn)移概率數(shù)據(jù)[26]。
模型結(jié)構(gòu)由研究目的和干預(yù)方案共同決定。過于簡單的模型可能失去建模的有效性,因為損失了現(xiàn)實必須考慮的因素,而復(fù)雜的模型又會因構(gòu)建過程繁瑣、理解分析困難等導(dǎo)致難以獲取相關(guān)參數(shù)或者科學(xué)性較弱而難以開展相應(yīng)研究[27]。本研究發(fā)現(xiàn)5項研究在經(jīng)典三狀態(tài)(無進(jìn)展生存期、疾病進(jìn)展期和死亡)的基礎(chǔ)上增加了停止治療、進(jìn)展方案治療等狀態(tài)。盡管這些研究結(jié)合研究目的和實際疾病進(jìn)展情況對經(jīng)典模型結(jié)構(gòu)進(jìn)行了優(yōu)化,但是文中僅對增加的狀態(tài)進(jìn)行了簡單描述,證據(jù)使用者難以判斷模型是否正確。構(gòu)建模型時應(yīng)組織相關(guān)領(lǐng)域?qū)<液脱芯空邔δP偷谋砻嫘Ф?、?nèi)部效度、外部效度、交叉效度和預(yù)測效度進(jìn)行相關(guān)驗證,確保模型特別是不同于某領(lǐng)域經(jīng)典模型的可靠性[28]。
本研究尚存在一定的局限。①Q(mào)HES工具條目的評價以“是”“否”為評價結(jié)果,并且研究者尚未提供對每一條目權(quán)威的解讀,評價者在使用時會帶有一定的主觀性。雖然本研究在開展質(zhì)量評價之前對評價者進(jìn)行了統(tǒng)一培訓(xùn),但仍難以避免評價者由于對各條目理解的差異而導(dǎo)致評價結(jié)果的偏差。②本研究只納入了公開發(fā)表的期刊文獻(xiàn),其他諸如加拿大藥品和衛(wèi)生技術(shù)評估機構(gòu)等部門發(fā)表的藥物經(jīng)濟學(xué)研究報告并未納入,使結(jié)果具有一定的偏倚。今后,可進(jìn)一步開展對藥物經(jīng)濟學(xué)研究報告的方法學(xué)質(zhì)量評價以彌補該局限性。③本研究未納入其他語言的研究,研究結(jié)果可能存在一定偏倚。
綜上所述,NSCLC免疫藥物的經(jīng)濟學(xué)評價是藥物經(jīng)濟學(xué)應(yīng)用的重要領(lǐng)域之一,在我國醫(yī)保藥品目錄管理、醫(yī)院藥品采購及成本管理以及臨床合理用藥等方面發(fā)揮了積極的決策支持作用。然而,從全球現(xiàn)有的NSCLC免疫藥物經(jīng)濟學(xué)方法學(xué)質(zhì)量來看,總體上仍有較大的提升空間。本研究建議今后研究可主要從以下3個方面加以改進(jìn)。第一,目前對于NSCLC長期療效數(shù)據(jù)獲得的主流方法是模擬RCTs的生存曲線,盡管在模擬過程中使用了相應(yīng)的方法驗證模擬后數(shù)據(jù)的可靠性,但使用RWD研究結(jié)果進(jìn)一步驗證模擬的長期療效能夠增加結(jié)果的可靠性。第二,模型的穩(wěn)定性是基于模型的藥物經(jīng)濟學(xué)評價的重要方法學(xué)之一。在使用該領(lǐng)域非經(jīng)典評價模型時應(yīng)該對模型進(jìn)行相應(yīng)驗證。第三,保持研究角度與成本分類的一致性。根據(jù)不同的決策需求,藥物經(jīng)濟學(xué)評價的目的不同,研究角度亦不相同。無論采用何種角度,均應(yīng)該保證研究角度與成本分類一致。