艾 超,冀召帥,張雅鑫,劉 岸,周學(xué)思,陳忠昊,吳 及#(.清華大學(xué)附屬北京清華長庚醫(yī)院/清華大學(xué)臨床醫(yī)學(xué)院藥學(xué)部,北京 08;.清華大學(xué)電子工程系,北京 00084)
藥物性肝損傷(drug-induced liver injury,DILI)是臨床常見的藥物不良反應(yīng)之一;嚴(yán)重的DILI可進(jìn)展至急性肝衰竭,甚至發(fā)生死亡[1],是藥物研發(fā)失敗、增加警示和撤市的重要原因,受到醫(yī)藥行業(yè)的高度重視[2—3]。據(jù)2019 年的一項(xiàng)國內(nèi)多中心研究顯示,我國DILI 的發(fā)生率為23.80/10 萬[4],且近年來呈上漲趨勢,漏診、誤診對(duì)患者原疾病治療和預(yù)后均會(huì)帶來多種不良影響。早期肝損傷信號(hào)主動(dòng)預(yù)警、精準(zhǔn)診斷、及時(shí)停用懷疑藥物并采取干預(yù)措施,是DILI診治的關(guān)鍵[5]。隨著人工智能技術(shù)的發(fā)展,自然語言處理技術(shù)能夠模仿人類理解病歷中的語義知識(shí)從而解決病歷文本數(shù)據(jù)識(shí)別處理難題[6—7]。本研究利用自然語言處理技術(shù)結(jié)合Roussel Uclaf因果關(guān)系評(píng)價(jià)法(Roussel Uclaf causality assessment method,RUCAM)[8]建立藥物性肝損傷自動(dòng)監(jiān)測與評(píng)估系統(tǒng)(drug-induced liver injury surveillance and assessment system,DILI-SAS),對(duì)臨床全部住院病歷開展主動(dòng)性監(jiān)測,以期提升DILI的監(jiān)測與評(píng)價(jià)效率。
DILI-SAS是利用自然語言處理技術(shù)結(jié)合DILI評(píng)價(jià)方法,實(shí)現(xiàn)對(duì)全部住院病歷數(shù)據(jù)(實(shí)驗(yàn)室檢查等數(shù)值型、病程記錄/護(hù)理記錄等文本型數(shù)據(jù))的有效信息挖掘和利用,通過設(shè)定肝損傷信號(hào)識(shí)別條件,當(dāng)滿足判斷條件的肝損傷信號(hào)被識(shí)別時(shí),啟動(dòng)目標(biāo)藥物判斷、肝損傷類型判斷以及關(guān)聯(lián)性評(píng)估等。圖1 為本系統(tǒng)開展DILI 信號(hào)監(jiān)測及因果關(guān)系評(píng)估技術(shù)路線圖。
圖1 DILI-SAS技術(shù)路線設(shè)計(jì)流程圖
DILI-SAS 系統(tǒng)實(shí)現(xiàn)自動(dòng)評(píng)分的技術(shù)步驟包括2 個(gè)步驟。步驟1——全部住院病歷信息挖掘和利用。主要包括3個(gè)部分內(nèi)容:(1)重要指征類,基于自然語言處理技術(shù)對(duì)全部住院病歷資料解析及判斷患者有無某體征,基于通用中文語料進(jìn)行預(yù)訓(xùn)練,然后在此基礎(chǔ)上,針對(duì)重要指征匹配任務(wù)構(gòu)建新的數(shù)據(jù)集,對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào),得到適應(yīng)該任務(wù)的相似度計(jì)算模型,尤其是實(shí)現(xiàn)對(duì)別名、簡寫、口語等情況的有效識(shí)別;(2)用藥序列,提取目標(biāo)藥囑并合并為連續(xù)用藥序列;(3)檢驗(yàn)序列插值與趨勢分析,提取檢驗(yàn)項(xiàng)并基于插值補(bǔ)全患者住院期間檢驗(yàn)數(shù)據(jù),基于循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行趨勢分析。步驟2——DILI 分析。以步驟1 結(jié)果作為自變量,采用RUCAM 量化評(píng)分表為依據(jù),從服藥至發(fā)病時(shí)間、病程、危險(xiǎn)因素、伴隨用藥、非藥物性肝損傷因素、藥物既往肝損傷毒性、再用藥反應(yīng)7個(gè)維度點(diǎn)評(píng)用藥與肝損傷之間的關(guān)聯(lián)性,匯總各個(gè)角度分?jǐn)?shù)并按照可能性排序,判斷DILI可能性及懷疑藥物。
肝損傷識(shí)別信號(hào)的設(shè)定是啟動(dòng)本系統(tǒng)初始環(huán)節(jié),需同時(shí)兼顧結(jié)果的準(zhǔn)確率、靈敏度等方面。本研究經(jīng)過多次的測試,暫定肝損傷識(shí)別信號(hào)條件見表1。
表1 肝損傷信號(hào)識(shí)別條件
參照《藥物性肝損傷基層診療指南(2019 年)》[9],根據(jù)R值對(duì)DILI 的損傷類型進(jìn)行劃分,R=[ALT/ULN]÷[ALP/ULN]。肝細(xì)胞損傷型:ALT≥3 ULN,且R≥5;膽汁淤積型:ALP≥2 ULN,且R≤2;混合型:ALT≥3 ULN,ALP≥2 ULN,且2<R<5。根據(jù)DILI國內(nèi)外多項(xiàng)指南推薦[9—10],本研究采用RUCAM 量化評(píng)分表對(duì)藥物與DILI 的因果關(guān)系進(jìn)行判斷。根據(jù)總分,將DILI 的可能性分為排除(<1 分)、不太可能(1~2 分)、可能(3~5分)、很可能(6~8分)或極有可能(>8分)。
參照中國藥物性肝損傷專業(yè)網(wǎng)Hepatox(http://www.hepatox.org/enTypeDrug)、美國藥物性肝損傷專業(yè)網(wǎng)Livertox(http://livertox.nih.gov/)以及藥品說明書和文獻(xiàn)報(bào)道等建立DILI藥品目錄。根據(jù)證據(jù)來源不同,按照證據(jù)來源對(duì)藥品進(jìn)行風(fēng)險(xiǎn)分級(jí),并與RUCAM量化評(píng)分表中“伴隨用藥”和“藥物既往肝損傷”2項(xiàng)評(píng)分標(biāo)準(zhǔn)進(jìn)行比照及賦分。DILI 風(fēng)險(xiǎn)分級(jí)標(biāo)準(zhǔn)及RUCAM 評(píng)分如表2所示。
表2 DILI風(fēng)險(xiǎn)分級(jí)標(biāo)準(zhǔn)及RUCAM評(píng)分
為了驗(yàn)證和評(píng)價(jià)該系統(tǒng)在真實(shí)醫(yī)療環(huán)境中的應(yīng)用效果,本研究調(diào)取了清華大學(xué)附屬北京清華長庚醫(yī)院(以下稱為我院)2022 年8 月—2023 年1 月期間出院的19 445 份住院病歷數(shù)據(jù)。先使用DILI-SAS 對(duì)全部病歷進(jìn)行測試,篩選出全部DILI病歷再經(jīng)過臨床藥師人工復(fù)評(píng)(假設(shè)人工點(diǎn)評(píng)的結(jié)果均為100% 正確),收集RUCAM 評(píng)分≥3 分的所有病例,如同一病例被檢出僅有1 種懷疑藥物則記為1 例DILI 事件,如果同一病例存在2 種懷疑藥物(各藥物的RUCAM 評(píng)分≥3)時(shí)按照2例DILI 事件處理,以此類推。記錄每個(gè)DILI 事件的基本資料、懷疑藥物、發(fā)生時(shí)間、肝損傷類型、肝損傷評(píng)分等資料。以RUCAM評(píng)分大小來確定第一懷疑藥物,當(dāng)RUCAM 評(píng)分一致時(shí)以藥物風(fēng)險(xiǎn)級(jí)別、用藥療程結(jié)合人工評(píng)價(jià)來判定第一懷疑藥物。
2.2.1 評(píng)價(jià)指標(biāo)定義
從準(zhǔn)確度和召回率2 個(gè)指標(biāo)對(duì)系統(tǒng)的性能進(jìn)行評(píng)價(jià);準(zhǔn)確度定義為A(系統(tǒng)正確檢出的DILI 例數(shù))/B(系統(tǒng)檢出的DILI總例數(shù))×100%;召回率定義為A/C(真實(shí)世界DILI總例數(shù))×100%。其中需要特別說明:真實(shí)世界DILI的總例數(shù)確定相對(duì)比較困難,需要人工對(duì)全部病歷均開展評(píng)估后獲得,本研究在執(zhí)行時(shí)采用了一種近似評(píng)估的模式,即將系統(tǒng)正確檢出的DILI例數(shù)和系統(tǒng)未檢出的DILI例數(shù)按照10%進(jìn)行抽樣,由5名臨床藥師開展人工評(píng)估后檢出的DILI 總例數(shù)來估算全部住院病歷的漏檢例數(shù),兩者取總數(shù)。
2.2.2 性能測試
使用DILI-SAS 對(duì)19 445 份病歷數(shù)據(jù)進(jìn)行監(jiān)測,共檢出DILI 病例75 例,發(fā)生率為385.70/10 萬人;共發(fā)現(xiàn)DILI事件149例;再經(jīng)過人工復(fù)核后正確檢出DILI事件為137 例,真實(shí)世界檢出的DILI 事件為147 例。系統(tǒng)整體準(zhǔn)確率為91.95%,召回率為93.20%;RUCAM>8分的準(zhǔn)確率和召回率均為100%,具體見表3。
表3 系統(tǒng)性能驗(yàn)證分析結(jié)果
2.2.3 時(shí)效性分析
采用人機(jī)耦合的方式對(duì)19 445 份病歷進(jìn)行篩選和評(píng)估,即先使用本系統(tǒng)進(jìn)行全部住院病歷篩選和評(píng)估,篩選149 例DILI 事件再由5 名臨床藥師復(fù)核,耗時(shí)4.91 h,平均每份病歷耗時(shí)0.075 min;而同期5名臨床藥師對(duì)100 份隨機(jī)抽取的病歷開展純?nèi)斯ぴu(píng)分時(shí),共耗時(shí)1.55 h,測算開展全部住院病歷(19 445 例)數(shù)據(jù)需耗用301.40 h?;诒鞠到y(tǒng)采用人機(jī)耦合的方式開展DILI監(jiān)測的效率比人工監(jiān)測提升約60倍。
75 例發(fā)生DILI 患者中男性46 人(61.33%);60 歲以上年齡患者42 人(56.00%);肝細(xì)胞損傷型52 例,占比69.33%,詳見表4。按照《中國醫(yī)師藥師臨床用藥指南》對(duì)第一懷疑藥物進(jìn)行藥理分類,其中發(fā)生頻次大于2例的藥理分類有14 種,主要為二氫吡啶類7 例、羥甲基戊二酸單酰輔酶A(HMG CoA)還原酶抑制劑6例、質(zhì)子泵抑制劑6 例;從具體藥物來看,主要為阿托伐他汀6 例、奧美拉唑6例、頭孢曲松5例、甲硝唑5例,具體見表5。
表4 75例DILI患者基本資料
表5 75例DILI第一懷疑藥物藥理分布
無特異性生物標(biāo)志物和低發(fā)病率是導(dǎo)致DILI 診斷困難的主要原因,臨床診斷DILI 時(shí)通常需要根據(jù)既往史、病程、功能化驗(yàn)、肝臟相關(guān)檢查排除其他可能的肝損傷原因以及結(jié)合用藥史等因素綜合評(píng)判。目前可用于DILI的診斷方法主要有《中草藥相關(guān)肝損傷臨床診療指南》[11]推薦的整合證據(jù)鏈(integrated evidence chain,IEC)、RUCAM和美國胃腸病學(xué)會(huì)指南推薦的結(jié)構(gòu)化專家 觀 點(diǎn) 程 序(structured expert opinion procedure,SEOP)[12]。其中RUCAM 因其客觀性、診斷準(zhǔn)確性以及易操作性[13—14],被國內(nèi)外指南和研究推薦使用。RUCAM量表分為服藥至發(fā)病時(shí)間、病程、危險(xiǎn)因素、伴隨用藥、非藥物性肝損傷因素、藥物既往肝損傷毒性、再用藥反應(yīng)7項(xiàng),其中服藥至發(fā)病時(shí)間、伴隨用藥2項(xiàng)評(píng)分?jǐn)?shù)據(jù)來源相對(duì)簡單、客觀,但其他5項(xiàng)評(píng)分的開展均需要對(duì)全部住院病歷數(shù)據(jù)資料進(jìn)行檢索,且存在遺漏和主觀判斷差異,最終影響RUCAM 的客觀性和準(zhǔn)確率。此外,人工利用RUCAM 開展DILI 的監(jiān)測工作,也面臨著時(shí)效性差和人力成本高的問題,這也制約著臨床DILI的早期診斷和治療。
本研究利用自然語言處理技術(shù)及醫(yī)學(xué)/藥學(xué)知識(shí)庫技術(shù),實(shí)現(xiàn)對(duì)全部住院病歷數(shù)據(jù)挖掘和利用,基于RUCAM 開發(fā)首套DILI-SAS。本研究采用人機(jī)耦合的方式對(duì)19 445例住院病歷進(jìn)行監(jiān)測和系統(tǒng)性能驗(yàn)證,準(zhǔn)確率為91.95%,召回率為93.20%。按照RUCAM 評(píng)分進(jìn)行分層后,發(fā)現(xiàn)系統(tǒng)共監(jiān)測出4 例RUCAM>8 分的DILI事件,準(zhǔn)確率和召回率均為100%,表明系統(tǒng)對(duì)于臨床證據(jù)確切、干擾因素較少的DILI事件的監(jiān)測和評(píng)估能力與人工一致,但目前只有4例,數(shù)據(jù)量較少,有待后續(xù)驗(yàn)證及完善。此外,采用人機(jī)耦合的方式開展全部住院病歷監(jiān)測的效率僅為0.075 min/(份·人),較人工獨(dú)立評(píng)審的效率提升約60倍。這是因?yàn)樽≡翰v內(nèi)容復(fù)雜,人工獨(dú)立評(píng)審需要查閱所有病歷資料再進(jìn)行逐項(xiàng)評(píng)判,其工作量巨大;而相反,如果先通過系統(tǒng)預(yù)先評(píng)審,再由藥師有目的地進(jìn)行問題確認(rèn),其工作相對(duì)而言會(huì)簡化很多,可以極大提高審核效率。采用人機(jī)耦合的方式開展全部住院病歷DILI 的監(jiān)測工作,在保證準(zhǔn)確率、召回率的基礎(chǔ)上,同時(shí)也提升了時(shí)效性,有助于DILI 的早期確診和干預(yù)。
19 445 例住院病歷共檢出DILI 病例75 例,DILI 的發(fā)生率為385.70/10 萬人,而據(jù)2019 年的一項(xiàng)多中心研究結(jié)果顯示,我國DILI 的發(fā)生率為23.80/10 萬人[4]。兩者差異較大,分析原因可能為:(1)人工監(jiān)測通常是在肝損傷中后期才會(huì)發(fā)現(xiàn),而本系統(tǒng)可以對(duì)全部住院病歷數(shù)據(jù)進(jìn)行主動(dòng)監(jiān)測,尤其是對(duì)肝損傷早期的信號(hào)識(shí)別更及時(shí),提升了DILI早期診斷率;(2)通過制定高風(fēng)險(xiǎn)藥品目錄,系統(tǒng)可以同時(shí)對(duì)目錄內(nèi)全部藥物開展DILI的評(píng)價(jià)并進(jìn)行對(duì)比;(3)目前藥物不良反應(yīng)包括DILI 的上報(bào)主要以醫(yī)師/護(hù)士主動(dòng)上報(bào)為主,存在人為漏報(bào)的可能性。
75例DILI患者中,以男性為主(61.33%);60歲以上年齡患者多見(56.00%);臨床分型以肝細(xì)胞損傷型為主(69.33%),其次為膽汁淤積型(28.00%),混合型相對(duì)少見(2.67%);潛伏期主要集中在5~90 d(62.67%),<5 d次之(36.00%),>90 d 僅有1 例。RUCAM 評(píng)分在3~5分 之 間 的 最 多(66.67%),6~8 分 之 間 的 次 之(28.00%),>8 分僅有4 例(5.33%)。75 例DILI 中第一懷疑藥物的藥理分類主要為二氫吡啶類、HMG CoA 還原酶抑制劑、質(zhì)子泵抑制劑等,主要藥物有阿托伐他汀、奧美拉唑、頭孢曲松、甲硝唑等,這提醒醫(yī)師/臨床藥師使用此類藥物時(shí)應(yīng)關(guān)注DILI的發(fā)生,及早發(fā)現(xiàn)、及早干預(yù)。
本研究也有一定的局限性,比如系統(tǒng)早期的肝損傷信號(hào)識(shí)別主要靠轉(zhuǎn)氨酶等指標(biāo)異常提升來響應(yīng),而對(duì)于肝功能檢查、臨床癥狀表現(xiàn)上已存在肝損傷表現(xiàn)的病例的識(shí)別存在一定的延遲;此外本系統(tǒng)目前的數(shù)據(jù)主要來源于同一家醫(yī)院6個(gè)月的住院病歷,尚未開展多中心數(shù)據(jù)的測試。以上問題,本研究團(tuán)隊(duì)會(huì)繼續(xù)完善并積極開展多中心測試,期望協(xié)助臨床進(jìn)行DILI 的早監(jiān)測、早診斷、早干預(yù)。
DILI是臨床常見的藥物不良反應(yīng)之一,但缺乏特異性標(biāo)志物以及開展人工獨(dú)立監(jiān)測效率低等因素是導(dǎo)致臨床DILI 診斷困難的主要原因。通過醫(yī)學(xué)自然語言技術(shù)開發(fā)DILI 監(jiān)測與評(píng)價(jià)系統(tǒng),以人機(jī)耦合的方式開展DILI的監(jiān)測和藥物關(guān)聯(lián)性評(píng)價(jià),有助于發(fā)掘真實(shí)世界下的DILI 事件,在保障準(zhǔn)確率和召回率的基礎(chǔ)上,同時(shí)提升了工作效率。DILI-SAS的研發(fā)為臨床DILI的早期識(shí)別、診斷、評(píng)價(jià)提供了解決方案。