楊亦含,胡元會,陳 婷,賈秋蕾,袁果真,段城林,杜宜航
(1.中國中醫(yī)科學(xué)院廣安門醫(yī)院,北京 100053; 2.北京中醫(yī)藥大學(xué),北京 100029)
隨機(jī)對照試驗(randomized controlled trial, RCT)為臨床實踐指南的制定提供了基礎(chǔ),但RCT的納排標(biāo)準(zhǔn)嚴(yán)苛,無法全面評估藥物或干預(yù)措施在真實臨床環(huán)境下帶給患者的影響。為補充其不足,效果試驗的概念被提出和應(yīng)用。其中,開展真實世界研究(real-world study, RWS)以獲取更符合臨床實際的證據(jù)被提出和廣泛認(rèn)可。2010年,RWS概念被引入中國[1]。RWS更符合中醫(yī)的“整體觀念”“辨證論治”“因人制宜”的特點,可以更好地評價中醫(yī)藥治療的安全性和有效性。
真實世界中醫(yī)臨床科研范式的核心是臨床科研一體化[2]。但是真實世界數(shù)據(jù)龐大,內(nèi)容繁雜,為促進(jìn)真實世界研究,更好地利用真實世界數(shù)據(jù),將中醫(yī)藥真實世界信息數(shù)字化是十分必要的。之前的中醫(yī)科研信息化平臺多圍繞著中醫(yī)藥標(biāo)準(zhǔn)化[3]、文獻(xiàn)知識庫查詢[4]及科研共享平臺[5]建立,缺少信息化、數(shù)字化的針對臨床研究的大數(shù)據(jù)平臺。為補充這一不足,許多研究者投身于中醫(yī)臨床科研大數(shù)據(jù)平臺的研究,并有了一定的成果。
中國中醫(yī)科學(xué)院劉保延等引入系統(tǒng)生物學(xué)濕干研究模式[6],提出“從臨床中來到臨床中去”的中醫(yī)臨床科研模式,建立了臨床與科研一體化的技術(shù)平臺。該平臺由中國中醫(yī)科學(xué)院牽頭創(chuàng)建,注重對臨床數(shù)據(jù)的轉(zhuǎn)換、儲存和挖掘,側(cè)重于中醫(yī)臨床科研。
該平臺的建設(shè)分為應(yīng)用層和基礎(chǔ)層[7]。平臺由“醫(yī)療業(yè)務(wù)平臺”“數(shù)據(jù)管理平臺”與“臨床研究平臺”三部分組成。“醫(yī)療業(yè)務(wù)平臺”以全結(jié)構(gòu)化的電子病歷作為應(yīng)用,其基礎(chǔ)是數(shù)字化中醫(yī)臨床術(shù)語應(yīng)用系統(tǒng)。該系統(tǒng)用以規(guī)范臨床語義,提高數(shù)據(jù)質(zhì)量?!皵?shù)據(jù)管理平臺”主要應(yīng)用數(shù)據(jù)倉庫技術(shù)(data warehouse,DW),以進(jìn)行大量的臨床數(shù)據(jù)儲存?!芭R床研究平臺”以中醫(yī)臨床數(shù)據(jù)預(yù)處理系統(tǒng)(extract transform load,ETL)和中醫(yī)臨床數(shù)據(jù)模型與數(shù)據(jù)倉庫為基礎(chǔ)層,支持臨床數(shù)據(jù)整理分析與展示平臺(online analytical processing,OLAP)和數(shù)據(jù)統(tǒng)計分析與平臺數(shù)據(jù)挖掘(Data Mining)兩種數(shù)據(jù)挖掘方式[8]。
該平臺建立后應(yīng)用于全國多地。目前已成功建設(shè)了中西醫(yī)結(jié)合中風(fēng)、冠心病、糖尿病、傳染病等數(shù)個結(jié)構(gòu)化電子病歷平臺[9]~[13],在兒童肺炎、多囊卵巢綜合征、腎病、頸椎病[14-17]等疾病的研究中亦有應(yīng)用。在針灸治療上,賈文等[18]也進(jìn)行了探索。利用該科研平臺,大量的專病組方用藥挖掘、臨床名老中醫(yī)經(jīng)驗挖掘和古籍文獻(xiàn)數(shù)據(jù)挖掘研究得到了發(fā)表。該平臺可以很好地進(jìn)行名老中醫(yī)經(jīng)驗傳承、重大疾病的診療分析,實質(zhì)性地提高中醫(yī)臨床研究水平和臨床研究能力,更好的指導(dǎo)臨床診療。
廣東省中醫(yī)院自2009年起建設(shè)的臨床科研一體化平臺,偏重在臨床工作正常運行的前提下進(jìn)行開發(fā)。該臨床科研一體化平臺以電子病歷為核心,在醫(yī)院已成熟的檢驗系統(tǒng)(laborary information system,LIS)、影像系統(tǒng)(picture archiving and communication systems,PACS)、信息系統(tǒng)(hospital information system,HIS)等基礎(chǔ)上進(jìn)行開發(fā)建設(shè)。該平臺的核心系統(tǒng)有三個,分別是科研整合共享倉庫、臨床業(yè)務(wù)集成平臺和企業(yè)資源管理。
以廣東省中醫(yī)院為代表、由醫(yī)院作為核心進(jìn)行平臺開發(fā)和建設(shè)的臨床科研一體化平臺,強調(diào)平臺除了要滿足醫(yī)院的科研工作外,更需支持醫(yī)院的日常臨床診療工作和行政管理工作。在平臺建設(shè)的調(diào)度上,強調(diào)主要院領(lǐng)導(dǎo)要對平臺建設(shè)和醫(yī)院各部門的組織協(xié)調(diào)重視和親自參與。
隨著科技發(fā)展及臨床診療及研究的需求不斷增加,已有大量的科研工作者投身于中醫(yī)藥臨床大數(shù)據(jù)平臺建設(shè)的研究中。王蘋等[20]提出應(yīng)用基于Hadoop進(jìn)行平臺基礎(chǔ)架構(gòu),從技術(shù)層面上保障平臺的穩(wěn)定運行。吳燎等[21]從平臺構(gòu)建和功能應(yīng)用上進(jìn)行了討論,尤其是從中醫(yī)藥數(shù)據(jù)的獨特性、中醫(yī)藥數(shù)據(jù)獲取方式及數(shù)據(jù)的質(zhì)量評估上進(jìn)行了探討,從而保證數(shù)據(jù)來源與質(zhì)量,方便進(jìn)一步的臨床及科研研究。王甜宇等[22]也提出基于區(qū)塊鏈的中醫(yī)藥大數(shù)據(jù)云存儲共享模型,該模型可解決數(shù)據(jù)存儲與共享時的安全和流通問題,可為大數(shù)據(jù)平臺建設(shè)和運行提供有力的技術(shù)保障。在平臺的具體應(yīng)用上,已有關(guān)于糖尿病病證結(jié)合、電子病歷服務(wù)和醫(yī)聯(lián)體大數(shù)據(jù)管理等需求的平臺設(shè)計和研究的報道[23-25]。
以上科研平臺只能對已有的臨床信息進(jìn)行回顧性或橫斷面研究,難以進(jìn)行前瞻性的循證醫(yī)學(xué)研究,難以達(dá)到對疾病進(jìn)行監(jiān)測預(yù)警、輔助臨床決策和評價中醫(yī)藥治療療效的目的。雖然國內(nèi)外已有一定數(shù)量基于真實世界的前瞻性臨床研究的文獻(xiàn)報道,也有針對真實世界循證醫(yī)學(xué)研究標(biāo)準(zhǔn)制定的探討[26],但是現(xiàn)在還未出現(xiàn)針對前瞻性研究的臨床科研平臺建設(shè)構(gòu)想的探討或報道。
目前建成的中醫(yī)專病數(shù)據(jù)庫數(shù)量依舊有限?;诂F(xiàn)有的科研臨床一體化平臺,已有一定數(shù)量的中醫(yī)疾病庫建成并能在一定程度上實際指導(dǎo)臨床應(yīng)用,但是還有相當(dāng)數(shù)量的疾病未能建成專病疾病庫?;诂F(xiàn)有文獻(xiàn)我們發(fā)現(xiàn),還缺少中醫(yī)皮科、中醫(yī)外科等專病數(shù)據(jù)庫建設(shè)的探討或?qū)嵺`的報道。
在全國各地中醫(yī)藥研究人員的努力下,已有大量的中醫(yī)藥專病數(shù)據(jù)庫建成,且大部分?jǐn)?shù)據(jù)庫都是基于上百上千份的臨床數(shù)據(jù)完成的。謝雁鳴等[27]也根據(jù)大數(shù)據(jù)特點,對真實世界中使用醒腦靜注射液53075位患者的臨床用藥特征進(jìn)行分析。而隨著大數(shù)據(jù)時代的來臨,臨床研究將不再滿足于上百上千上萬份的數(shù)據(jù),而可能一下子擴(kuò)為幾十萬上千萬級別的數(shù)據(jù)資料。不僅如此,不同省份、不同醫(yī)院、不同醫(yī)生臨床用語習(xí)慣不同,都會給臨床數(shù)據(jù)的提取和應(yīng)用造成困難。
以上平臺雖可以調(diào)取醫(yī)院的臨床數(shù)據(jù),但臨床數(shù)據(jù)來源豐富,部分病人紙質(zhì)化信息或媒體信息(如舌診、脈診、聞診信息)不能錄入平臺并進(jìn)行相應(yīng)的分析。同時也缺失了患者在社區(qū)、醫(yī)院外的重要疾病信息的收集。
因為臨床數(shù)據(jù)來源廣,臨床醫(yī)生工作任務(wù)重,導(dǎo)致部分臨床信息不能自動化、信息化、結(jié)構(gòu)化的錄入臨床科研一體化平臺中。為了解決該問題,已有基于ios系統(tǒng)的多媒體醫(yī)案采集移動平臺的建成[28]。但是該系統(tǒng)只能應(yīng)用于ios系統(tǒng),在其他系統(tǒng)中的應(yīng)用還需進(jìn)一步開發(fā)。另外該系統(tǒng)所錄入的臨床醫(yī)療信息有限,信息不能直接進(jìn)行數(shù)據(jù)分析,這都需要進(jìn)一步的研發(fā)。
目前的平臺研究結(jié)果已經(jīng)對臨床醫(yī)生在疾病的認(rèn)識、診斷、用藥和愈后有了一定的指導(dǎo)。許玲[29]也探討了如何應(yīng)用科研平臺對腫瘤病人進(jìn)行健康管理。但研究成果尤其是對病人的臨床結(jié)局預(yù)測,還不能完全再返回臨床、應(yīng)用于臨床、具體指導(dǎo)醫(yī)生臨床日常工作,最終完成“臨床-科研-臨床”的臨床研究模式的建設(shè)。
搭建可支持前瞻性研究和輔助進(jìn)行臨床決策的中醫(yī)大數(shù)據(jù)平臺是十分必要的。平臺設(shè)計不僅要符合循證醫(yī)學(xué)實驗設(shè)計要求與規(guī)范,還要利用科學(xué)技術(shù)手段減少重復(fù)性工作,更要符合中醫(yī)藥臨床研究特點。基于此,我們構(gòu)想了一個人工智能為技術(shù)支持、真實世界為數(shù)據(jù)管理方式、單病例隨機(jī)對照試驗為臨床研究方法的中醫(yī)大數(shù)據(jù)平臺。
機(jī)器學(xué)習(xí)等人工智能技術(shù)的發(fā)展和成熟為建設(shè)大數(shù)據(jù)平臺提供了技術(shù)保障。目前,自然語言處理、機(jī)器學(xué)習(xí)等人工智能分析海量臨床數(shù)據(jù)[30]~[31]已逐步應(yīng)用至臨床研究中來。在數(shù)據(jù)挖掘上,隨著技術(shù)的發(fā)展,更多模型、算法也被應(yīng)用于醫(yī)學(xué)臨床數(shù)據(jù)挖掘。如戴國華等[32]借助HanLP分詞系統(tǒng)、隱馬爾可夫模型(hidden markov model,HMM)分詞算法和python醫(yī)案信息提取提高數(shù)據(jù)庫的構(gòu)建效率和數(shù)據(jù)挖掘質(zhì)量。
真實世界數(shù)據(jù)管理方式,即平臺抽取數(shù)據(jù)都直接來自于真實世界,來自于日常所收集的各種與患者健康狀況和(或)診療及保健有關(guān)的數(shù)據(jù),常見的來源包括HIS、醫(yī)保系統(tǒng)、疾病登記系統(tǒng)、自然人群隊列等[33,34],這不僅會大大減少研究人員整理實驗資料的工作量,也可以保障實驗研究的真實性。
在平臺的臨床研究方法上,單病例隨機(jī)對照試驗既滿足大數(shù)據(jù)平臺功能需求,又符合中醫(yī)藥真實世界循證醫(yī)學(xué)研究特點。單病例隨機(jī)對照試驗是針對單個患者開展的試驗。從真實世界中,每個單病例隨機(jī)對照試驗一般由2個用藥期組成一個治療輪次,一般需進(jìn)行3個及3個以上治療輪次。用藥期內(nèi)患者隨機(jī)接受試驗藥或?qū)φ账幍闹委?,?個用藥期間需間隔1個洗脫期用于消除一個治療期的延遲效應(yīng)。單病例隨機(jī)對照試驗是一種前瞻性、循證醫(yī)學(xué)研究,更關(guān)注在真實環(huán)境下干預(yù)患者的療效結(jié)果短時間內(nèi)從多種治療中選出最有效者,符合RWS的需求?;颊邚脑囼炛锌芍苯荧@益,易被患者接受且失訪率低。2011年,牛津循證醫(yī)學(xué)中心(the Oxford Centre for Evidence-Based Medicine)將單病例隨機(jī)對照試驗列為評估臨床治療效果的“一級”證據(jù)[35],這種研究方法也符合中醫(yī)診療中強調(diào)的辨證論治、因人制宜的特點。雖然,現(xiàn)在國內(nèi)外已有研究者進(jìn)行了相應(yīng)的研究,但單病例隨機(jī)對照試驗的相關(guān)文獻(xiàn)報道數(shù)量較少、質(zhì)量良莠不齊,無法滿足進(jìn)一步醫(yī)學(xué)研究的需求。單病例隨機(jī)對照試驗操作本身也有困難,其過程復(fù)雜易出現(xiàn)多基線和易混淆的數(shù)據(jù)[36],造成試驗結(jié)果偏倚、實驗結(jié)論不客觀。這就需要一個大數(shù)據(jù)平臺對實驗整體流程進(jìn)行統(tǒng)一的規(guī)范化操作和管理,提高實驗的嚴(yán)謹(jǐn)性和客觀性,增強實驗的可操作性,以便更好地評價中醫(yī)藥治療療效。
除了可以對前瞻性研究進(jìn)行設(shè)計和管理外,平臺也可以參考或結(jié)合已有的科研共享平臺的功能,如輔助倫理審查、臨床試驗注冊登記和完善基礎(chǔ)實驗技術(shù)支持等。此外,中醫(yī)藥循證研究證據(jù)庫系統(tǒng)(evidence database system,EVDS)[37]的研發(fā)也為我們提供了一個思路,平臺也可以開發(fā)已完成的臨床實驗的循證證據(jù)評價的功能。
綜上,中醫(yī)臨床科研大數(shù)據(jù)平臺的設(shè)計需要既符合中醫(yī)藥循證醫(yī)學(xué)特點,又兼顧個體精準(zhǔn)施治方案的臨床療效評價。
正如前文提到的,隨著大數(shù)據(jù)時代到來,數(shù)據(jù)資料規(guī)模和種類將顯著提升[38]。
在大數(shù)據(jù)平臺中,數(shù)據(jù)規(guī)模可從原先的以MB、GB單位上漲到以TG、PB為基本處理單位。在醫(yī)療大數(shù)據(jù)平臺中,平臺數(shù)據(jù)除了來自醫(yī)療系統(tǒng)中的病人資料,科研人員也可以通過患者自愿安裝在手機(jī)上的隨訪APP、小程序,在進(jìn)行病程和隨訪管理的同時遠(yuǎn)程收集患者院外信息[39],完善臨床資料,保障研究質(zhì)量。
大數(shù)據(jù)平臺中涉及的數(shù)據(jù)類型也從原先的一種或少數(shù)幾種增加為數(shù)以千計,數(shù)據(jù)資料也從原先以結(jié)構(gòu)化為主資料,變化成包含更多半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的資料。如林一凡等[40]設(shè)計了中醫(yī)智能脈診系統(tǒng)與家庭醫(yī)生平臺,醫(yī)生可以遠(yuǎn)程獲得病人的舌象和通過儀器智能分析后的病人脈象,以便于病人四診信息的采集。病人的舌象脈象都屬于非結(jié)構(gòu)化資料,這些資料不僅數(shù)據(jù)量大,還需要專業(yè)人員應(yīng)用新技術(shù)、新方法進(jìn)行數(shù)據(jù)分析解釋。科研人員可結(jié)合近年來的計算機(jī)輔助智能舌象診斷成果完善在平臺中中醫(yī)舌診信息[41],為臨床科研提供客觀研究指標(biāo)。
建設(shè)科研臨床一體化平臺的最終目的,也是要將科研成果即時返回臨床輔助臨床決策。囿于技術(shù)發(fā)展,之前的平臺只能對已有臨床數(shù)據(jù)進(jìn)行分析。隨更多的技術(shù)被應(yīng)用和補充進(jìn)來,分散在不同系統(tǒng)、媒介中的臨床數(shù)據(jù)資料可以被大數(shù)據(jù)平臺實時抽取、集成,再根據(jù)已有算法對數(shù)據(jù)進(jìn)行分析解釋,得到結(jié)果可輔助臨床工作者作出決策。這樣的平臺,不僅能基于真實世界進(jìn)行臨床科研,還能對海量真實世界數(shù)據(jù)進(jìn)行統(tǒng)計、挖掘和分析,并利用自然語義、知識圖譜等技術(shù)對疾病發(fā)病人群、人群發(fā)病特點和病人結(jié)局進(jìn)行預(yù)測和管理。
目前首都醫(yī)科大學(xué)附屬北京天壇醫(yī)院[31]建立了以神經(jīng)介入專病庫為核心的臨床科研一體化研究模式。該平臺可利用全過程診療時間軸及智能預(yù)測引擎對取栓后患者顱內(nèi)出血的發(fā)生風(fēng)險進(jìn)行預(yù)測。胡萍[42]等研發(fā)了基于機(jī)器學(xué)習(xí)的耳鼻喉科專病科研大數(shù)據(jù)平臺,并以甲狀腺疾病為例,展示了該平臺如何應(yīng)用多種方法對篩選出的臨床樣本進(jìn)行建模分析并選擇出最優(yōu)機(jī)器學(xué)習(xí)算法進(jìn)行診斷預(yù)測。以上研究模式和研究方法為我們提供一個思路,我們可以借鑒其已有成果,探索和建設(shè)具有中醫(yī)特色的“臨床-科研-臨床”研究模式。
真實世界研究是符合中醫(yī)藥內(nèi)在規(guī)律的臨床研究模式。中醫(yī)臨床科研一體化是中醫(yī)真實世界研究的核心,建設(shè)中醫(yī)臨床科研大數(shù)據(jù)平臺是實現(xiàn)方法。目前中醫(yī)臨床科研一體化平臺完成了建設(shè)并投入應(yīng)用,其成果很好地推動了中醫(yī)藥臨床科研的發(fā)展。隨著技術(shù)的發(fā)展,中醫(yī)臨床科研大數(shù)據(jù)平臺也將會被開發(fā)和應(yīng)用,這不僅能夠促進(jìn)中醫(yī)臨床研究的深入,也可以促進(jìn)中醫(yī)藥現(xiàn)代化發(fā)展,推動中醫(yī)藥走向世界。