印冠錦 張夢(mèng)陽 吳惠庶
(神州醫(yī)療科技股份有限公司 北京 100080) (中國政法大學(xué)中加法律研究中心 北京 100088)
洪 娜 弓孟春
(神州醫(yī)療科技股份有限公司 北京 100080) (南方醫(yī)科大學(xué)衛(wèi)生與健康管理研究院 廣州 510515)
為了指導(dǎo)和規(guī)范申辦者利用真實(shí)世界數(shù)據(jù)生成真實(shí)世界證據(jù)從而支持藥物研發(fā),國家藥品監(jiān)督管理局食品藥品審核查驗(yàn)中心于2021年4月15日頒布《用于產(chǎn)生真實(shí)世界證據(jù)的真實(shí)世界數(shù)據(jù)指導(dǎo)原則(試行)》(以下簡稱《指導(dǎo)原則》)[1]?!吨笇?dǎo)原則》對(duì)真實(shí)世界數(shù)據(jù)(Real World Data,RWD)給出定義,即來源于日常所收集的各種與患者健康狀況和/或診療及保健有關(guān)的數(shù)據(jù)。真實(shí)世界證據(jù)(Real World Evidence, RWE)則是在RWD滿足適用性條件下,經(jīng)過科學(xué)、充分的分析產(chǎn)生的。目前我國真實(shí)世界數(shù)據(jù)主要分為醫(yī)院信息系統(tǒng)數(shù)據(jù)、死亡登記數(shù)據(jù)、醫(yī)保數(shù)據(jù)、藥品安全性主動(dòng)監(jiān)測(cè)數(shù)據(jù)、組學(xué)數(shù)據(jù)、登記研究數(shù)據(jù)、患者報(bào)告數(shù)據(jù)、自然人群隊(duì)列數(shù)據(jù)、個(gè)體健康監(jiān)測(cè)數(shù)據(jù)以及其他特定功能數(shù)據(jù)等。
建立統(tǒng)一的RWD標(biāo)準(zhǔn)將有利于解決數(shù)據(jù)來源相對(duì)獨(dú)立、封閉,數(shù)據(jù)系統(tǒng)種類繁多,存儲(chǔ)分散、標(biāo)準(zhǔn)不一,數(shù)據(jù)整合、交換困難,數(shù)據(jù)碎片化、信息孤島現(xiàn)象等問題,因此推動(dòng)RWD在更大范圍和更深層次上傳播、共享和使用具有重要意義[2],這一過程主要包括制定實(shí)施醫(yī)學(xué)術(shù)語定義、使用指導(dǎo)性規(guī)范以及建立術(shù)語規(guī)范化體系,如術(shù)語表、敘詞表、分類表、編碼、本體等。
目前各國政府機(jī)構(gòu),如中國國家藥品監(jiān)督管理局(National Medical Products Administration,NMPA),歐洲藥品管理局(European Medicines Agency,EMA),美國食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA),都已經(jīng)發(fā)布RWD標(biāo)準(zhǔn)框架相關(guān)文件,旨在評(píng)估RWD適應(yīng)性,使RWD轉(zhuǎn)化為真實(shí)可用的RWE相關(guān)標(biāo)準(zhǔn),為醫(yī)療器械審批和監(jiān)管決策提供指導(dǎo)和建議。例如美國國會(huì)公布的《21世紀(jì)治愈法案》,美國FDA的《美國聯(lián)邦食品、藥品和化妝品法案》以及《用于藥品和生物制品提交的真實(shí)世界數(shù)據(jù)標(biāo)準(zhǔn)行業(yè)指南》,EMA的MINERVA項(xiàng)目定義和收集真實(shí)世界數(shù)據(jù)源的元數(shù)據(jù)等。
從數(shù)據(jù)來源看,相較于傳統(tǒng)的隨機(jī)對(duì)照試驗(yàn)(Randomized Controlled Trial, RCT),RWD在記錄、采集以及數(shù)據(jù)存儲(chǔ)環(huán)節(jié)尚缺乏強(qiáng)有力的質(zhì)量控制,易導(dǎo)致數(shù)據(jù)缺失、記錄不準(zhǔn)確等問題,這將在很大程度上影響后續(xù)的數(shù)據(jù)治理、應(yīng)用以及可追溯性,研究者也難以發(fā)現(xiàn)問題并進(jìn)行核對(duì)和修正。我國系統(tǒng)性RWD研究相較于歐美國家起步較晚,目前我國系統(tǒng)性RWD研究尚無成熟標(biāo)準(zhǔn)和規(guī)范借鑒。由于缺乏統(tǒng)一標(biāo)準(zhǔn),RWD研究存在數(shù)據(jù)來源相對(duì)獨(dú)立、封閉,數(shù)據(jù)系統(tǒng)種類繁多,存儲(chǔ)分散、標(biāo)準(zhǔn)不一,數(shù)據(jù)整合、交換困難,數(shù)據(jù)碎片化、信息孤島現(xiàn)象等問題。電子病歷數(shù)據(jù)還可能因記錄者對(duì)文字類型的主觀性差異,影響對(duì)臨床結(jié)局的客觀評(píng)價(jià)[1]。
2.1.1 CDISC CDASH 美國臨床數(shù)據(jù)交換標(biāo)準(zhǔn)協(xié)會(huì)(Clinical Data Interchange Standards Consortium,CDISC)就數(shù)據(jù)收集、數(shù)據(jù)類型、數(shù)據(jù)提交建立以下5套標(biāo)準(zhǔn)[3-4]:基礎(chǔ)標(biāo)準(zhǔn)(Foundational Standards)、數(shù)據(jù)交換標(biāo)準(zhǔn)(Data Exchange Standards)、治療領(lǐng)域標(biāo)準(zhǔn)(Therapeutic Areas)、術(shù)語集(Terminology)和SHARE(Shared Health and Research Electronic Library)。CDISC在組織RWD方面的調(diào)研和研究時(shí)發(fā)現(xiàn),RWD標(biāo)準(zhǔn)框架構(gòu)建將有助于加速數(shù)據(jù)共享、提升數(shù)據(jù)治理能力、提高數(shù)據(jù)一致性、加快新療法的開發(fā)、強(qiáng)化隱私保護(hù)[5]。2018年CDISC制定臨床數(shù)據(jù)獲取協(xié)調(diào)標(biāo)準(zhǔn)(Clinical Data Acquisition Standards Harmonization,CDASH),為簡化和規(guī)范臨床試驗(yàn)的數(shù)據(jù)收集和病例報(bào)告表(Case Report Form,CRF)提供設(shè)計(jì)標(biāo)準(zhǔn)[6-7]。定義一組基本數(shù)據(jù)采集字段并且這些字段會(huì)出現(xiàn)在CRF需要采集的信息上。基于CDASH設(shè)計(jì)CRF字段能夠保持?jǐn)?shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一與數(shù)據(jù)的可追溯性,可以直接從CRF中抽取出大量符合研究數(shù)據(jù)表格模型的數(shù)據(jù)集,從而減少后期繁雜的映射轉(zhuǎn)換。近期美國FDA發(fā)布《用于藥品和生物制品提交的真實(shí)世界數(shù)據(jù)標(biāo)準(zhǔn)行業(yè)指南》,建議在提交包含真實(shí)世界數(shù)據(jù)的文件時(shí)應(yīng)使用恰當(dāng)?shù)腃DISC標(biāo)準(zhǔn)以確保完成數(shù)據(jù)提交[8]。
2.1.2 OHDSI/OMOP CDM 觀察性健康醫(yī)療數(shù)據(jù)科學(xué)與信息學(xué)(Observational Health Data Sciences and Informatics,OHDSI)項(xiàng)目是由美國哥倫比亞大學(xué)領(lǐng)導(dǎo)的全球非營利研究聯(lián)盟,主要研究醫(yī)學(xué)大數(shù)據(jù)分析解決方案,通過各組織間合作收集和分析數(shù)據(jù)結(jié)果,進(jìn)而促進(jìn)更好的決策和醫(yī)療。擁有超過6億人口的臨床數(shù)據(jù)規(guī)模,累計(jì)協(xié)作研究發(fā)表了上百篇論文[1,9]。OHDSI采用觀察性醫(yī)療結(jié)果合作組織(The Observational Medical Outcomes Partnership,OMOP)的通用數(shù)據(jù)模型(Common Data Model,CDM)。CDM是一套具有統(tǒng)一標(biāo)準(zhǔn)的數(shù)據(jù)模型,將觀察性數(shù)據(jù)的格式和內(nèi)容規(guī)范化,目的是將不同數(shù)據(jù)庫包含的數(shù)據(jù)轉(zhuǎn)換為通用格式,然后使用標(biāo)準(zhǔn)化數(shù)據(jù)庫進(jìn)行系統(tǒng)分析[10-11]。
2.1.3 FHIR 快速醫(yī)療互操作性資源(Fast Health Interoperable Resources,F(xiàn)HIR)概念于2011年提出,其建立在一系列被稱為“資源”的模塊化組件之上,可以任意組配用于對(duì)應(yīng)工作系統(tǒng)。其特點(diǎn)包括注重實(shí)施、代碼庫豐富、即開即用的互操作性等[12-13]。
2.2.1 概述 將醫(yī)學(xué)術(shù)語標(biāo)準(zhǔn)化,可以解決表述與理解不一致的問題,繼而對(duì)臨床診療與醫(yī)學(xué)科研中所用到的語言進(jìn)行統(tǒng)一命名起到重要作用,協(xié)助不同醫(yī)療信息系統(tǒng)之間互聯(lián)互通及數(shù)據(jù)共享。目前應(yīng)用較多的醫(yī)學(xué)術(shù)語標(biāo)準(zhǔn)包括綜合性臨床醫(yī)學(xué)術(shù)語、疾病分類與編碼、觀測(cè)指標(biāo)等,見表2。
表2 常用術(shù)語標(biāo)準(zhǔn)
2.2.2 SNOMED CT 醫(yī)學(xué)系統(tǒng)命名法-臨床術(shù)語(Systematized Nomenclature of Medicine Clinical Terms,SNOMED CT),是當(dāng)前國際上使用范圍最廣的臨床醫(yī)學(xué)術(shù)語標(biāo)準(zhǔn),包含19個(gè)層級(jí)體系,概念表、描述表和語義關(guān)系表是其最基本的組成單元。SNOMED CT目前已應(yīng)用于80多個(gè)國家和地區(qū),在美國、加拿大、新西蘭、英國和澳大利亞等國家SNOMED CT被認(rèn)可為國家標(biāo)準(zhǔn)[2,14]。
2.2.3 ICD 國際疾病分類(International Classification of Diseases,ICD)是疾病分類統(tǒng)計(jì)術(shù)語集合。主要用于死亡和重要疾病的歸類統(tǒng)計(jì),以便于健康系統(tǒng)資源規(guī)劃。國際上70%的健康資源都是通過該系統(tǒng)的統(tǒng)計(jì)結(jié)果加以分配使用的。目前全球通用的是第10次修訂本,統(tǒng)稱為ICD-10。ICD-11中文版于2018年編寫完成,自2019年3月起實(shí)施[15]。
2.2.4 LOINC 觀測(cè)指標(biāo)標(biāo)識(shí)符邏輯命名與編碼系統(tǒng)(Logical Observation Identifiers Names and Codes,LOINC)是一套包含實(shí)驗(yàn)室結(jié)果和影像結(jié)果的檢驗(yàn)代碼系統(tǒng)。涵蓋血清學(xué)、毒物、微生物、放射醫(yī)學(xué)報(bào)告等指標(biāo)。成份與分析物名稱、時(shí)間、檢查與檢驗(yàn)屬性類型、標(biāo)尺與檢測(cè)方法、體系/樣本類型是目前LOINC的重要組成部分[4,13]。
RWD質(zhì)量控制的關(guān)鍵是確保數(shù)據(jù)的完整性、準(zhǔn)確性和透明性。多個(gè)國家的監(jiān)管機(jī)構(gòu)在發(fā)布的指導(dǎo)原則中提到將數(shù)據(jù)完整性標(biāo)準(zhǔn)作為臨床試驗(yàn)數(shù)據(jù)質(zhì)量的國際通行原則。此外臨床試驗(yàn)數(shù)據(jù)管理應(yīng)嚴(yán)格遵循國家藥監(jiān)部門發(fā)布的《臨床試驗(yàn)數(shù)據(jù)管理工作技術(shù)指南》《臨床試驗(yàn)的電子數(shù)據(jù)采集技術(shù)指導(dǎo)原則》《藥品臨床試驗(yàn)質(zhì)量管理規(guī)范》,其均為傳統(tǒng)藥物或醫(yī)療器械的臨床試驗(yàn)遵循的標(biāo)準(zhǔn),對(duì)于RWD質(zhì)量控制具有借鑒意義。我國在RWD質(zhì)量控制方面出臺(tái)了一系列指導(dǎo)性文件,包括《真實(shí)世界數(shù)據(jù)用于醫(yī)療器械臨床評(píng)價(jià)技術(shù)指導(dǎo)原則》《用于產(chǎn)生真實(shí)世界證據(jù)的真實(shí)世界數(shù)據(jù)指導(dǎo)原則(試行)》《2018真實(shí)世界研究指南》《真實(shí)世界證據(jù)支持藥物研發(fā)與審評(píng)的指導(dǎo)原則(試行)》,其中均提出一些指導(dǎo)性原則。
2.4.1 國外標(biāo)準(zhǔn) 患者個(gè)人隱私與健康數(shù)據(jù)在真實(shí)世界數(shù)據(jù)的處理與應(yīng)用中需要被重點(diǎn)關(guān)注與保護(hù)。國外數(shù)據(jù)安全與隱私保護(hù)所依托的標(biāo)準(zhǔn)主要有《健康保險(xiǎn)流通與責(zé)任法案》(Health Insurance Portability and Accountability Act,HIPPA)涉及的隱私控制方面的內(nèi)容,以及歐洲《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,GDPR)。其中HIPAA對(duì)于數(shù)據(jù)安全的要求可以分為技術(shù)層面、物理層面、行政層面和基本安全基線4個(gè)層次,對(duì)于個(gè)人信息的保護(hù)則是基于對(duì)患者隱私權(quán)利來設(shè)計(jì)的[7]。不同于歐洲的頂層制度設(shè)計(jì),GDPR所認(rèn)為的個(gè)人信息權(quán)屬于人權(quán)的一部分,因此對(duì)可攜帶權(quán)、最小目的限制等方面均做出詳細(xì)規(guī)制。
2.4.2 國內(nèi)標(biāo)準(zhǔn) 近年來隨著法律體系的逐步完善,我國對(duì)于數(shù)據(jù)保護(hù)的監(jiān)管體系向縱深發(fā)展并逐步細(xì)化。隨著《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》相繼出臺(tái),數(shù)據(jù)分類分級(jí)、關(guān)鍵基礎(chǔ)設(shè)施認(rèn)定等一系列政策法規(guī)及制度體系落地,各數(shù)據(jù)權(quán)利主體的權(quán)益有了法律層面的有效保障。
真實(shí)世界研究(Real World Study,RWS)是臨床研究的一種,目前在我國遵循一般臨床試驗(yàn)的注冊(cè)要求。中國臨床試驗(yàn)注冊(cè)中心(Chinese Clinical Trial Registry,ChiCTR)加入了世界衛(wèi)生組織國際臨床試驗(yàn)注冊(cè)中心平臺(tái)。平臺(tái)規(guī)定了所有的在人體中和采用取自人體的標(biāo)本進(jìn)行的研究,包括各種干預(yù)措施療效和安全性的有對(duì)照或無對(duì)照試驗(yàn)(如RCT、病例-對(duì)照研究、隊(duì)列研究及非對(duì)照研究)、預(yù)后研究、病因?qū)W研究和診斷技術(shù)、試劑、設(shè)備等的診斷性試驗(yàn),均需注冊(cè)并公告。關(guān)于數(shù)據(jù)報(bào)告,要求注冊(cè)表中提供臨床試驗(yàn)計(jì)劃使用的數(shù)據(jù)收集和管理系統(tǒng)信息。中國臨床試驗(yàn)注冊(cè)中心于2016年3月14日起要求在填注冊(cè)申請(qǐng)表時(shí)填入公開原始數(shù)據(jù)計(jì)劃[6,11]。
通用數(shù)據(jù)模型(CDASH、OMOP CDM、FHIR)和語義標(biāo)準(zhǔn)(SNOMED CT、ICD、LOINC)均來源于國外,由于其自身特點(diǎn)和應(yīng)用場景不同,國內(nèi)各類機(jī)構(gòu)中仍呈現(xiàn)出多種語義標(biāo)準(zhǔn)和數(shù)據(jù)模型共存的現(xiàn)象。借鑒國外現(xiàn)有成果與先進(jìn)經(jīng)驗(yàn),建設(shè)具有自主知識(shí)產(chǎn)權(quán)的中文醫(yī)學(xué)數(shù)據(jù)模型與術(shù)語體系,推動(dòng)中文醫(yī)學(xué)數(shù)據(jù)標(biāo)準(zhǔn)化任重而道遠(yuǎn)。
盡管近年來我國對(duì)于數(shù)據(jù)保護(hù)的監(jiān)管體系逐步向縱深發(fā)展細(xì)化,但是對(duì)于個(gè)人數(shù)據(jù)的保護(hù)仍處于前期探索階段,對(duì)于個(gè)人數(shù)據(jù)的使用、調(diào)用和相關(guān)管理仍基于管理框架和控制點(diǎn)等比較粗獷的管理方式,沒有細(xì)化到字段層面[16]。同時(shí)對(duì)于脫敏技術(shù)、隱私計(jì)算技術(shù)等新技術(shù)的使用尚缺乏相關(guān)法律法規(guī)標(biāo)準(zhǔn),給實(shí)踐過程的合規(guī)性帶來很大挑戰(zhàn)。如“匿名化”是法律概念,不能僅通過技術(shù)上的判斷得到認(rèn)定,再識(shí)別風(fēng)險(xiǎn)仍然存在[17];如果合規(guī)架構(gòu)建立在對(duì)特定匿名化技術(shù)的信任之上,則需結(jié)合現(xiàn)有案例并綜合考慮法律上所有客觀場景因素,對(duì)技術(shù)是否足以在法律上認(rèn)定為匿名化做出論證。此外“透明化原則到底需要做到什么程度算是法律所接受的”等問題都需要在真實(shí)世界研究中進(jìn)一步加以考慮以切實(shí)保護(hù)患者隱私。
針對(duì)質(zhì)量控制及報(bào)告體系我國已出臺(tái)相關(guān)指導(dǎo)性文件。中國針灸學(xué)會(huì)編制了《真實(shí)世界臨床研究數(shù)據(jù)管理規(guī)范(征求意見稿)》,較為詳細(xì)地闡述了數(shù)據(jù)管理相關(guān)人員資質(zhì)、培訓(xùn)、數(shù)據(jù)管理流程等具體要求。但截至目前尚未形成明確的評(píng)價(jià)工具用以報(bào)告真實(shí)世界研究中RWD質(zhì)量。盡管目前RWS注冊(cè)仍按照傳統(tǒng)臨床試驗(yàn)要求進(jìn)行,但由于其研究設(shè)計(jì)等方面具有獨(dú)特性,因此有必要制定單獨(dú)的注冊(cè)標(biāo)準(zhǔn)。
3.4.1 針對(duì)語義標(biāo)準(zhǔn)和數(shù)據(jù)模型缺失問題 建議行業(yè)內(nèi)整體全面規(guī)劃醫(yī)學(xué)語義標(biāo)準(zhǔn)和數(shù)據(jù)模型,例如建立以SNOMED CT為核心的醫(yī)學(xué)語義標(biāo)準(zhǔn),中文數(shù)據(jù)模型的建立參照OMOP CDM;創(chuàng)造良好標(biāo)準(zhǔn)和數(shù)據(jù)實(shí)施環(huán)境,加強(qiáng)院內(nèi)數(shù)據(jù)治理,打通系統(tǒng)間的信息“孤島”,促進(jìn)科研合作、共享;加強(qiáng)與OHDSI、CDISC等國際機(jī)構(gòu)的合作;加強(qiáng)行業(yè)間交流合作與創(chuàng)新。
3.4.2 針對(duì)個(gè)人信息保護(hù)粗放問題 建議進(jìn)一步細(xì)化個(gè)人數(shù)據(jù)使用和調(diào)用的管理方式,例如數(shù)據(jù)方對(duì)數(shù)據(jù)進(jìn)行加密、脫敏,在物理層面和系統(tǒng)層面對(duì)訪問權(quán)限進(jìn)行管控,計(jì)算方數(shù)據(jù)計(jì)算時(shí)使用聯(lián)邦學(xué)習(xí)等隱私保護(hù)技術(shù);政策制定方應(yīng)完善新技術(shù)相關(guān)法律法規(guī)標(biāo)準(zhǔn),積極建立統(tǒng)一完備的行業(yè)標(biāo)準(zhǔn),在實(shí)踐中對(duì)個(gè)人信息保護(hù)技術(shù)進(jìn)行充分論證;政策監(jiān)管方應(yīng)與申請(qǐng)方及時(shí)溝通交流,保證研究符合相關(guān)法律法規(guī)標(biāo)準(zhǔn),保障個(gè)人隱私安全。
3.4.3 針對(duì)質(zhì)量控制及報(bào)告體系欠缺問題 建議完善RWD質(zhì)量管理體系;制定RWD標(biāo)準(zhǔn)操作流程;定期培訓(xùn)專業(yè)人員;學(xué)習(xí)國外先進(jìn)注冊(cè)標(biāo)準(zhǔn),結(jié)合國情制定我國注冊(cè)標(biāo)準(zhǔn)。例如建立RWS透明化制度,在研究方案預(yù)注冊(cè)發(fā)表,統(tǒng)計(jì)分析計(jì)劃(Statistical Analysis Plan,SAP)制定,數(shù)據(jù)清洗方案等方面接受監(jiān)督。積極融入中國真實(shí)世界數(shù)據(jù)與研究聯(lián)盟(China Real World Data and Studies Alliance,ChinaREAL),通過科學(xué)且嚴(yán)密的頂層設(shè)計(jì)建立系列RWD與RWS技術(shù)規(guī)范體系,促進(jìn)高質(zhì)量RWE的產(chǎn)生。
總體來看我國RWD標(biāo)準(zhǔn)研究體系尚缺乏整體規(guī)劃,存在條塊分割問題。一些標(biāo)準(zhǔn)在一定范圍、地域、系統(tǒng)內(nèi)適用,但不足以成為行業(yè)認(rèn)可的公共準(zhǔn)則。目前尚未有涵蓋臨床癥狀、實(shí)驗(yàn)室檢查、診斷、藥物、疾病分類、臨床實(shí)踐的術(shù)語標(biāo)準(zhǔn),現(xiàn)有中文臨床術(shù)語存在術(shù)語范圍局限、體系不完整、結(jié)構(gòu)不合理等問題[18]。在未來RWD支持的RWE研究框架下,安全機(jī)制下的多方合作、基于高通量多組學(xué)RWD的RWE研究成為必然趨勢(shì)。來自政府、學(xué)術(shù)界、產(chǎn)業(yè)界等多方合作的RWD標(biāo)準(zhǔn)化框架有助于臨床隊(duì)列數(shù)據(jù)的有效整合與共享,在多方共識(shí)的基礎(chǔ)上基于大規(guī)模真實(shí)世界數(shù)據(jù)開展高質(zhì)量研究[19]。此外全自動(dòng)高通量表型化技術(shù)與臨床表型組建設(shè)、基于多組學(xué)RWD的RWE研究,可對(duì)生命過程、疾病等集合大量影響因子的復(fù)雜生命現(xiàn)象進(jìn)行高層次的分析、解讀,將大力推動(dòng)新型疾病相關(guān)生物標(biāo)志物的發(fā)現(xiàn)以及精準(zhǔn)醫(yī)學(xué)的高速發(fā)展。