劉雪瑩, 司雨琦, 潘治森, 沈創(chuàng)鵬, 吳浩祥
(1. 廣州中醫(yī)藥大學第一臨床醫(yī)學院,廣東廣州 510405;2. 廣州中醫(yī)藥大學第一附屬醫(yī)院,廣東廣州 510405)
單病例隨機對照試驗(single case randomized controlled trails,N-of-1 trials)是一種基于單個患者進行的多周期(至少2個周期/4個階段)、交叉試驗,用于比較單個患者中的兩種或多種治療方法。 與平行組隨機對照試驗研究方法不同,N-of-1 試驗可用于直接評估個體治療效果,為個體治療決策提供最有力的循證醫(yī)學證據(jù)[1]。該方法與中醫(yī)藥辨證論治高度個體化的特點十分相似,因此被運用于中醫(yī)藥的臨床研究,取得較好的成果,但目前尚未見相關(guān)質(zhì)量評價的報道。本研究基于2019 年Shang Hong-cai 教授團隊制定的關(guān)于中醫(yī)藥的N-of-1 試驗指南(TCM-CENT )中的條目[2],評估中醫(yī)藥N-of-1試驗報告質(zhì)量,分析目前存在的問題,以期為今后提高中醫(yī)藥N-of-1 試驗質(zhì)量提供參考。
1. 1檢索策略以 “N-of-1”“單病例”“交叉研究”“隨機對照”“中醫(yī)藥” 為主題詞,在中文數(shù)據(jù)庫如中國知網(wǎng)(CNKI)、中國生物醫(yī)學文獻數(shù)據(jù)庫(CBM)、中文期刊數(shù)據(jù)庫(維普)、萬方數(shù)據(jù)庫(萬方及萬方會議論文、學位論文數(shù)據(jù)庫)、超星期刊等各個數(shù)據(jù)庫進行檢索;以 “single case studies”“N-of-1 trial”“randomized controlled trial in individual patient”“crossover”“TCM”“traditional Chinese medicine” 為主題詞,在外文數(shù)據(jù)庫如PubMed、Web of Science核心合集中進行檢索。
1. 2文獻納入及排除標準文獻納入標準:1987年1 月至2019 年12 月期間發(fā)表的中醫(yī)藥N-of-1 試驗報告,包括期刊論文、會議論文、學位論文,語言限制為中文及英文,對試驗?zāi)繕思按胧┎患酉拗?。文獻排除標準:(1)綜述類文獻、病例報告、方法學介紹類文獻等均不納入;(2)文章雖描述為“單病例隨機對照”,但仔細閱讀后發(fā)現(xiàn)只有實施了一周期(或二階段)的干預(yù)措施,或不涉及中醫(yī)藥臨床應(yīng)用的隨機對照試驗的文獻。
1. 3試驗報告的質(zhì)量評價由兩位評審員參照適用于TCM-CENT 聲明中的條目進行試驗報告的質(zhì)量評價。TCM-CENT 聲明中共涉及45 個條目,對其進行翻譯及討論后,獨立提取數(shù)據(jù)并評分,符合條目內(nèi)容的計1分,不符合條目的計0分,異議較大的進行再次討論協(xié)商。
1. 4統(tǒng)計分析運用SPSS 21.0統(tǒng)計分析軟件對兩名評審員的評分進行Kappa值的計算。如果兩者判斷趨于一致時,Kappa 值為正數(shù),完全一致時Kappa值等于1。本研究的Kappa值在0~1之間。一致性程度分類為:Kappa ≤0.2 表示兩者一致性非常低,0.2<Kappa ≤0.4 表示一致性較低,0.4<Kappa ≤0.6表示一致性中等,0.6<Kappa ≤0.8表示一致性尚可,0.8<Kappa<1 表示一致性高。數(shù)據(jù)采用得分(n)及率(p/%)的方式表示,并用非參數(shù)Bootstrap 統(tǒng)計分析,檢驗水準α = 0.05,計算95%置信區(qū)間。
2. 1文獻檢索結(jié)果共納入有關(guān)中醫(yī)藥N-of-1試驗的文獻24篇[3-26],中文試驗報告20篇,英文文獻4篇。其中有3篇為單一N-of-1試驗,21篇為系列N-of-1試驗。
2. 2納入試驗報告的基本信息納入的24篇試驗報告[3-26]中,發(fā)表年份分布情況如下:2010年3篇,2012 年2 篇,2013 年4 篇,2014 年2 篇,2015 年3 篇,2016 年2 篇,2018 年4 篇,2019 年4 篇。24 篇試驗報告的通訊作者的第一單位所在城市分布情況為:一線城市19 篇,二線城市3 篇,三線和四線城市各1篇。采用國際疾病分類方法進行分類[27],24篇試驗報告涉及的疾病系統(tǒng)分類如下:呼吸系統(tǒng)5篇,生殖系統(tǒng)4篇,消化系統(tǒng)、血液系統(tǒng)及內(nèi)分泌系統(tǒng)各3篇,骨骼肌系統(tǒng)2篇,循環(huán)系統(tǒng)及神經(jīng)精神系統(tǒng)各1篇,另有采用中醫(yī)證型作為診斷標準的試驗報告2篇。
2. 3評審員評審一致性結(jié)果兩位評審員評價的一致性較高,Kappa 值的平均值為93%,其中有27 個條目判斷一致,Kappa值的最低值為65%,為第16和第21個條目。
2. 4試驗報告質(zhì)量評價結(jié)果根據(jù)TCM-CENT聲明的6個部分45個條目(單個病例的N-of-1試驗為42 個條目)評價。TCM-CENT 聲明的6 個部分包括標題、摘要及關(guān)鍵詞、前言、方法、結(jié)果、討論、其他信息。
本研究的條目報告率平均為61%,其中報告率為1 的有9 個,未進行報告的有4 個(見圖1、表1)。6 大部分中討論部分的平均報告率為64%,第5 部分(討論部分)報告率最高(92%),第6 部分(其他信息如是否進行了試驗注冊、能否能獲取試驗方案及試驗是否獲得資助)平均報告率最低(25%)。24 篇中醫(yī)藥N-of-1 試驗對條目的整體報告率平均值為62%。其中單一N-of-1 試驗平均報告率為64%;系列N-of-1 試驗的整體報告率最高為79%,最低為40%,平均報告率為60%。
圖1 24篇中醫(yī)藥N-of-1試驗報告的條目報告率Figure 1 Item report rate of the 24 TCM N-of-1 trials
由圖1及表1可知,報告率為100%的9個條目分別為:摘要部分的條目1b(摘要呈現(xiàn)結(jié)構(gòu)式);前言部分的2b(具體的目的或假設(shè));方法部分中的條目3a(合理試驗設(shè)計方法描述)、5[詳細描述各期干預(yù)措施(包括安慰劑):具體使用的草藥配方,針灸手法及穴位)]、6a1[預(yù)先設(shè)定結(jié)局指標(包括中醫(yī)證型)]、6a2[結(jié)果評估工具和方法的描述及特性(效度和信度)]、12a(用于匯總數(shù)據(jù)、比較各組主要和次要結(jié)局指標的統(tǒng)計學方法);結(jié)果部分中的條目13a1(完成的階段數(shù)量和階段序列,任何不同于原計劃的變化及原因)、13a2(系列N-of-1試驗:納入、接受干預(yù)及結(jié)果分析的參與者人數(shù))。
未進行報告的有4個條目,分別是方法部分的條目6b(試驗開始后對結(jié)局指標是否有任何變動及其原因);結(jié)果部分的條目17b(對于二分類指標,建議同時提供絕對效應(yīng)值和相對效應(yīng)值);其他信息中的條目23(臨床試驗的注冊號和注冊機構(gòu)名稱)和條目24(如果有,哪里可以獲取完整的試驗方案)。
報告率低于50%的條目(包括50%)為3b(試驗開始后對試驗方法所作的重要改變)、4c(是否通過醫(yī)學倫理委員會審核)、7a(如何確定樣本量)7b(必要時,解釋中期分析和中止原則)、8c(完整的,預(yù)先設(shè)定的階段序列)、9(用于執(zhí)行隨機分配序列的機制)、10(誰產(chǎn)生隨機分配序列,誰招募受試者,誰給受試者分配干預(yù)措施)、12b(系列Nof-1 試驗:描述合并的統(tǒng)計分析方法)、12c(說明殘留效應(yīng)、階段效應(yīng)和個體間相關(guān)的統(tǒng)計方法)、16(干預(yù)措施納入分析的階段數(shù)量,系列N-of-1試驗:合成數(shù)據(jù)的試驗例數(shù))、17a2(效應(yīng)估計值及其精度)、18[其他分析的結(jié)果(殘留/階段效應(yīng),個體間的相關(guān)性分析);N-of-1試驗:亞組敏感性分析]、19(各種干預(yù)出現(xiàn)的所有危害或意外影響)。
報告率在50% ~70%之間(不包括兩端值)的條目為1a(標題能識別是 “中醫(yī)藥的N-of-1試驗” 或“中醫(yī)藥的系列N-of-1 試驗”)、1c[關(guān)鍵詞包括“中 醫(yī) 藥” 和 “N-of-1 試 驗”(或 “系 列N-of-1 試驗”)]、2a1[科學背景和原理解釋(包括中醫(yī)辯證理論解釋)]、2a2(使用 “N-of-1試驗” 的理由)、11a(實施盲法的步驟及說明針對誰設(shè)計了盲法,若不設(shè)盲,說明原因)、11b(描述包括安慰劑在內(nèi)的干預(yù)措施的相似之處)、13b(系列N-of-1試驗:描述試驗脫落/排除的受試者、具體階段數(shù)及其原因)、14b(階段/總試驗提前結(jié)束的原因)。
報告率在70% ~90%(不包括兩端值)的條目為8a(生成隨機序列的方法)、8b(隨機方法類型)、14a(確定招募和隨訪的具體日期)、15(表格描述受試者人口學及臨床特征)、20(試驗局限性,潛在偏倚及不精確性的來源;如果相關(guān),多樣性的分析結(jié)果)、25(資助和其他支持)。
報告率在90%以上(包括90%)的條目為4a[受試者納入和排除標準(疾病的西醫(yī)診斷標準及中醫(yī)辨證分型標準)]、4b(資料收集的場所和地點)、17a1(描述每個主要/次要結(jié)果,每個時期的結(jié)果;推薦一個顯示試驗數(shù)據(jù)的附圖)、21[試驗結(jié)果的可推廣性(適用性)及原因]、22(權(quán)衡試驗結(jié)果利弊)。
表1 24篇中醫(yī)藥N-of-1試驗的條目報告率評價結(jié)果Table 1 Evaluation of the item report rate of the 24 TCM N-of-1 trials
(續(xù)表1)
1994 年國內(nèi)學者將N-of-1 試驗作為研究方法引入我國,認為其與祖國醫(yī)學強調(diào) “個體化診療” 的觀點相吻合[28],隨后N-of-1試驗在中藥(湯劑、顆粒劑)、針灸治療高血壓、糖尿病并發(fā)癥、腎病等領(lǐng)域運用。此方法應(yīng)用于中醫(yī)藥臨床試驗的優(yōu)勢在于適用性較廣(相當一部分的中醫(yī)藥治療針對慢性疾病,且療效得到認可),且可最大限度地展示中醫(yī)藥 “辨證論治” 的重要思想,提供最高循證醫(yī)學證據(jù)。但是目前有關(guān)中醫(yī)藥的N-of-1試驗也存在著良莠不齊的情況。
本研究運用2019 年Shang Hong-cai 教授團隊制定的關(guān)于TCM-CENT 指南中的條目進行質(zhì)量評估,結(jié)果顯示N-of-1 試驗應(yīng)用于中醫(yī)藥領(lǐng)域存在以下問題:(1)中醫(yī)藥雖強調(diào) “個體化”,但疾病治療過程中使用該方法時,辨證論治的動態(tài)化及盲法之間難以做到兩全,進而可能影響結(jié)局指標的可信度;(2)中藥成分復(fù)雜、針灸(或其他傳統(tǒng)療法)及藥代動力學(在人體內(nèi)的作用方式及代謝途徑)尚未明確,半衰期難以確定,干預(yù)措施及洗脫期的時長設(shè)定多借鑒前人經(jīng)驗,僅有少數(shù)的試驗報告提及進行預(yù)實驗來確定干預(yù)措施及洗脫期的時長;(3)單一N-of-1試驗的樣本量值及進行干預(yù)措施的階段數(shù)量,以及系列單病例(包括普通的系列N-of-1試驗和貝葉斯單病例隨機對照試驗)中的樣本量值受試者的數(shù)量的報告率不到10%;(4)試驗開展前極少數(shù)能做到在線注冊(有1 篇文獻為純試驗方案,故未納入),整個試驗方案的獲取變得困難,不利于信息的公開、推廣和共享;(5)從試驗報告的年份分布及地區(qū)分布情況可以看出,目前N-of-1 試驗應(yīng)用于中醫(yī)藥領(lǐng)域的發(fā)展速度依然緩慢,大部分集中在科研資源及能力較好的一、二線城市,這或許與科研能力和水平以及Nof-1試驗的推廣力度不足等有關(guān)。
基于以上問題,筆者提出以下幾點建議:(1)中醫(yī)藥治療過程中,可以通過及時調(diào)整復(fù)方或者配穴,以有利于疾病的治療;在對盲法的設(shè)定方面,可以讓第三方(如藥劑師等)對干預(yù)措施知情和實施,而統(tǒng)計者只在最終數(shù)據(jù)統(tǒng)計環(huán)節(jié)關(guān)聯(lián),這樣可以保證統(tǒng)計者盲法的設(shè)計。(2)建議通過預(yù)實驗來確定各期時長,另外可以補充實施相關(guān)復(fù)方或成藥、針灸方法等治療措施的動物體外、體內(nèi)實驗,觀察其半衰期及其他代謝動力學特點。(3)由于N-of-1試驗原理的特殊性,很多樣本量的估計軟件都無法估算。國內(nèi)學者通過樣本量估算原理建立了N-of-1 試驗的模型及假設(shè),而隨機模型更加符合現(xiàn)實情況。根據(jù)Ⅰ類錯誤0.05 及80%功效的原理,開展3 ~4個周期(即6 ~8個階段)的觀察,需要納入的病例數(shù)量為16 ~12 例,通過減少周期數(shù)量,有利于樣本量的節(jié)約,減少病例脫落等問題而更利于試驗的順利開展。另一方面,在固定效應(yīng)中,隨著試驗的周期變長,需要的周期總數(shù)基本穩(wěn)定,即約為48 個周期[29],可供研究者參考。(4)建議課題組或研究者在開展試驗之前在相關(guān)網(wǎng)站注冊試驗方案,規(guī)范試驗的流程(如倫理審核等)。(5)可通過學術(shù)會議、線上培訓等多元化方式來加大該方法對基層醫(yī)院及院校等科研及臨床工作者的推廣力度。
綜上,本研究首次基于適用于TCM-CENT的聲明進行了相關(guān)文獻報告的質(zhì)量評估,發(fā)現(xiàn)目前有關(guān)中醫(yī)藥應(yīng)用的N-of-1 試驗報告質(zhì)量普遍不高,且發(fā)展緩慢,建議從盲法設(shè)計、增加預(yù)實驗、完善動物實驗、確定試驗?zāi)P汀⒁?guī)范試驗流程、推廣宣傳及培訓力度等方面,以提高中醫(yī)藥研究者使用N-of-1 試驗的水平及報告質(zhì)量。就本研究檢索范圍而言,語言限制為中、英文,且外文數(shù)據(jù)庫僅檢索了兩大數(shù)據(jù)庫,可能導(dǎo)致文獻漏檢的風險。另外,由于該聲明的部分條目對設(shè)計方案改動、病例脫落等問題的描述,未得分或得分低不一定說明試驗質(zhì)量不佳,如方法部分的條目3b(試驗開始后對試驗方法所作的重要改變)、6b(試驗開始后對結(jié)局指標是否有任何變動及其原因)等。試驗本身的質(zhì)量及試驗報告質(zhì)量之間的差異需謹慎對待。
(廣州中醫(yī)藥大學基礎(chǔ)醫(yī)學院陳新林副教授對本研究做了悉心指導(dǎo),特此致謝?。?/p>