國際肝膽胰協(xié)會中國分會 全國肝病和肝癌大數(shù)據(jù)聯(lián)盟
原發(fā)性肝癌居我國惡性腫瘤發(fā)病率第4位,腫瘤死亡率第2位[1],每年全球新發(fā)病例約一半在中國[2],嚴重威脅人民的生命和健康。如何利用大數(shù)據(jù)及其相關技術如人工智能、機器學習等提升肝癌診療水平、實現(xiàn)肝癌精準防治是當前領域內的研究熱點[3]。目前國際上已經(jīng)形成類似美國監(jiān)測、流行病學和結果數(shù)據(jù)庫(Surveillance,Epidemiology,and End Results,SEER)、美國國家癌癥數(shù)據(jù)庫(National Cancer Database,NCDB)等疾病數(shù)據(jù)中心,但我國在肝癌領域尚沒有一個全國性的數(shù)據(jù)庫。
經(jīng)過多年信息化建設發(fā)展,國內醫(yī)療機構在臨床工作中已經(jīng)積累了大量寶貴的肝癌診療數(shù)據(jù)資源,但是大規(guī)模醫(yī)療數(shù)據(jù)不等于醫(yī)療大數(shù)據(jù),如何實現(xiàn)轉化仍存在諸多問題:(1)數(shù)據(jù)孤島普遍存在,病人疾病數(shù)據(jù)分散在各醫(yī)療機構內部,彼此間信息相互隔離,甚至同一家單位內各系統(tǒng)都無法互聯(lián)互通;(2)數(shù)據(jù)缺乏統(tǒng)一標準,包括存儲格式不統(tǒng)一,數(shù)據(jù)在匯聚和轉換過程中可能丟失,各信息系統(tǒng)對醫(yī)療概念的定義、描述不盡相同,導致數(shù)據(jù)融合困難。這些問題是健康醫(yī)療大數(shù)據(jù)領域普遍面臨的問題,不僅制約了肝癌臨床科研多中心數(shù)據(jù)的有效融合,而且嚴重限制了大數(shù)據(jù)人工智能等新技術在肝癌領域的應用推廣[4]。
有鑒于此,吳孟超院士聯(lián)合國內多位著名院士專家,于2017年2月共同發(fā)起成立了全國肝病和肝癌大數(shù)據(jù)聯(lián)盟,打破數(shù)據(jù)孤島,將全國肝病和肝癌大數(shù)據(jù)匯聚到福州,目前已匯聚海軍軍醫(yī)大學第三附屬醫(yī)院、福建醫(yī)科大學孟超肝膽醫(yī)院及福建省肝病醫(yī)聯(lián)體多家單位的臨床科研數(shù)據(jù)。數(shù)據(jù)來源于醫(yī)院內EMR、HIS、LIS、PACS、隨訪等主要信息化系統(tǒng),覆蓋病人整個疾病周期的全部數(shù)據(jù),形成目前國內外最大規(guī)模病例數(shù)的肝癌大數(shù)據(jù)平臺[5]。
根據(jù)《大數(shù)據(jù)標準化白皮書(2018版)》[6],術語標準化是實現(xiàn)開放共享環(huán)境下異構系統(tǒng)之間信息共享、業(yè)務協(xié)同的基礎,是多中心數(shù)據(jù)有效融合的重要依據(jù),也是實現(xiàn)醫(yī)療數(shù)據(jù)向醫(yī)療大數(shù)據(jù)轉化的基礎[7-8]。因此,我們在國際肝膽胰協(xié)會中國分會的指導幫助下,基于肝癌大數(shù)據(jù)平臺的數(shù)據(jù)基礎,結合臨床科研需求及人工智能發(fā)展需求,組織福建醫(yī)科大學孟超肝膽醫(yī)院、海軍軍醫(yī)大學第三附屬醫(yī)院醫(yī)學專家及臨床醫(yī)學術語領域專家,充分收集、規(guī)范定義肝癌臨床科研相關概念,根據(jù)語義關聯(lián)對概念進行重組和分類,最終編制形成國內第一部系統(tǒng)性的原發(fā)性肝癌臨床標準化術語。
首先,由醫(yī)學專家根據(jù)臨床經(jīng)驗和科研實踐,參考醫(yī)學系統(tǒng)化命名-臨床術語(Systematized Nomenclature of Medicine-Clinical Term,SNOMED-CT)、醫(yī)學主題詞表(Medical Subject Heading,MeSH)、國際疾病分類與代碼(International Classification of Diseases,ICD)等國際醫(yī)學術語標準[9-11],根據(jù)國家衛(wèi)健委電子病歷基本數(shù)據(jù)集及中華醫(yī)學會、中國醫(yī)師協(xié)會、中國抗癌協(xié)會等出版的相關診療規(guī)范、臨床指南、教科書等資料[12-17],將肝癌臨床診療過程中產(chǎn)生的各種信息進行劃分,并經(jīng)各領域專家研討調整,最終確定將原發(fā)性肝癌臨床標準化術語劃分為18個部分:(1)人口信息學;(2)病史;(3)體征;(4)診斷;(5)檢驗;(6)超聲檢查;(7)電子計算機斷層掃描(computerized tomography,CT)檢查;(8)磁共振成像(magnetic resonance imaging,MRI)檢查;(9)手術及操作;(10)圍手術期治療;(11)病理;(12)介入治療;(13)局部消融治療;(14)125I放射性粒子植入治療;(15)放射治療;(16)綜合治療;(17)隨訪信息;(18)樣本庫。見圖1。
然后,依據(jù)每個概念的特點和內涵,并參考SNOMED-CT、MeSH等國際醫(yī)學術語標準的組織結構,將概念分為一、二、三、四、五共5個上下位概念關系層級:其中一級概念為肝癌的頂層核心概念,為構建術語標準必須包含的內容,包括人口信息、主訴、原發(fā)性肝癌、手術基本信息、病理診斷等;二級概念主要為一級概念的細化;三、四、五級概念主要為一、二級概念的拓展。標準化術語包括每個概念的中英文名稱、解釋說明及相對應的內部標識碼,并附相應標準化來源。我們以原發(fā)性肝癌手術及操作為例展示本術語標準中所含上下位關系及相應內部標識符。見圖2。
原發(fā)性肝癌臨床標準化術語的建立將有利于實現(xiàn):(1)多中心原發(fā)性肝癌數(shù)據(jù)的加速融合;(2)全國性肝病和肝癌數(shù)據(jù)中心的建設;(3)多中心、大規(guī)模、高質量、可溯源肝癌臨床科研數(shù)據(jù)的產(chǎn)生;(4)大數(shù)據(jù)人工智能在肝癌領域的研發(fā)及應用。方便進一步對肝癌醫(yī)療大數(shù)據(jù)進行規(guī)范治理、深度挖掘、定向應用,助力肝癌規(guī)范化診療和精準治療。
指 導:吳孟超 劉允怡 陳孝平
執(zhí) 筆 人:劉景豐 周偉平 劉紅枝
評審專家名單(按姓氏拼音為序):
陳麗紅(福建醫(yī)科大學孟超肝膽醫(yī)院)、程樹群(海軍軍醫(yī)大學第三附屬醫(yī)院)、 叢文銘(海軍軍醫(yī)大學第三附屬醫(yī)院)、董輝(海軍軍醫(yī)大學第三附屬醫(yī)院)、方馳華(南方醫(yī)科大學珠江醫(yī)院)、郭武華(福建醫(yī)科大學孟超肝膽醫(yī)院)、黃堯(福建醫(yī)科大學孟超肝膽醫(yī)院)、黃耀(海軍軍醫(yī)大學第三附屬醫(yī)院)、江瑞(清華大學自動化系)、李姣(中國醫(yī)學科學院醫(yī)學信息研究所)、李岳峰(國家衛(wèi)生健康委統(tǒng)計信息中心)、廖祥文(福州大學數(shù)學與計算機科學學院)、林健玲(福建醫(yī)科大學孟超肝膽醫(yī)院)、林科燦(福建醫(yī)科大學孟超肝膽醫(yī)院)、林明華(福建醫(yī)科大學孟超肝膽醫(yī)院)、林展(福建醫(yī)科大學孟超肝膽醫(yī)院)、林征宇(福建醫(yī)科大學附屬第一醫(yī)院)、柳麗娟(福建醫(yī)科大學孟超肝膽醫(yī)院)、羅順峰(福建醫(yī)科大學孟超肝膽醫(yī)院)、閭海榮(清華大學自動化系)、馬費成(武漢大學信息管理學院)、孟巖(海軍軍醫(yī)大學第三附屬醫(yī)院)、駢文景(福州大學經(jīng)濟與管理學院)、錢國軍(海軍軍醫(yī)大學第三附屬醫(yī)院)、錢慶(中國醫(yī)學科學院醫(yī)學信息研究所)、吳燕斌(福建醫(yī)科大學孟超肝膽醫(yī)院)、徐雷(武漢大學信息管理學院)、閆振林(海軍軍醫(yī)大學第三附屬醫(yī)院)、 楊業(yè)發(fā)(海軍軍醫(yī)大學第三附屬醫(yī)院)、楊遠(海軍軍醫(yī)大學第三附屬醫(yī)院)、葉真(福建醫(yī)科大學附屬第一醫(yī)院)、游茂(國家衛(wèi)生健康委衛(wèi)生發(fā)展研究中心)、袁振剛(海軍軍醫(yī)大學第三附屬醫(yī)院)、曾永毅(福建醫(yī)科大學孟超肝膽醫(yī)院)、曾昭沖(復旦大學中山醫(yī)院)、周偉平(海軍軍醫(yī)大學第三附屬醫(yī)院)
編寫秘書:張翔 郭鵬飛 劉紅枝 陳振偉