喬幸潮,陳超,李宗友,朱彥
(中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所,北京100700)
近年來(lái),隨著精準(zhǔn)醫(yī)學(xué)、大數(shù)據(jù)及以患者為中心的醫(yī)療健康管理等領(lǐng)域迅速發(fā)展,我國(guó)已經(jīng)著手從國(guó)家到地方建立起各級(jí)健康信息交流平臺(tái),在醫(yī)院、藥店等醫(yī)療場(chǎng)所中廣泛地開(kāi)發(fā)和部署醫(yī)學(xué)信息技術(shù)[1]。藥物信息數(shù)據(jù)是醫(yī)療數(shù)據(jù)的重要組成部分,面對(duì)龐雜的藥物信息數(shù)據(jù),藥物術(shù)語(yǔ)集對(duì)其標(biāo)準(zhǔn)化和共享化起到了非常重要的作用,是推進(jìn)醫(yī)藥信息化過(guò)程的重要內(nèi)容。藥物術(shù)語(yǔ)集不僅可以用于不同系統(tǒng)間藥物信息的交換、電子健康檔案系統(tǒng)中藥物信息的捕獲、藥物臨床試驗(yàn)數(shù)據(jù)的研究及藥品上市后不良反應(yīng)的監(jiān)測(cè),還可有助于更安全藥物的研發(fā),以及在不同藥物術(shù)語(yǔ)之間進(jìn)行映射(例如,在醫(yī)院藥品系統(tǒng)與醫(yī)療保險(xiǎn)藥品清單中的藥物術(shù)語(yǔ)間進(jìn)行映射)[2]。但我國(guó)藥學(xué)領(lǐng)域信息化程度與發(fā)達(dá)國(guó)家相比尚有一定差距,且缺乏完整可用的藥物術(shù)語(yǔ)集,只有一些藥品目錄、數(shù)據(jù)庫(kù)或藥物辭典可供參考。當(dāng)前世界上主流的三大藥物術(shù)語(yǔ)集,分別是臨床藥品標(biāo)準(zhǔn)命名術(shù)語(yǔ)表(RxNorm)、世界衛(wèi)生組織藥物詞典(World Health Organization Drug Dictionaries,WHODrug)和醫(yī)學(xué)系統(tǒng)命名法-臨床術(shù)語(yǔ)(Systematized Nomenclature of Medicine:Clinical Terms,SNOMED CT),均在國(guó)際上有較大的影響力。本文簡(jiǎn)述了這三大藥物術(shù)語(yǔ)集的構(gòu)建目的、命名原則、術(shù)語(yǔ)類型、術(shù)語(yǔ)關(guān)系及應(yīng)用情況,并對(duì)其特定藥物模型進(jìn)行了比較,旨在為我國(guó)藥物術(shù)語(yǔ)集的構(gòu)建提供參考。
RxNorm由美國(guó)國(guó)立醫(yī)學(xué)圖書(shū)館(The National Library of Medicine,NLM)編制,是美國(guó)聯(lián)邦政府臨床醫(yī)學(xué)信息電子交換系統(tǒng)指定使用的標(biāo)準(zhǔn)之一。該術(shù)語(yǔ)集每周三更新,添加來(lái)自美國(guó)FDA新批準(zhǔn)的藥品信息。2001年,NLM開(kāi)始在一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)中對(duì)臨床藥品進(jìn)行建模試驗(yàn),擬開(kāi)發(fā)一種新模型以使采用不同藥品命名法的不同系統(tǒng)能有效共享和交換數(shù)據(jù),改善藥物術(shù)語(yǔ)的互操作性;該模型基于醫(yī)師或藥房的實(shí)際應(yīng)用場(chǎng)景,遴選了美國(guó)藥房管理和藥物相互作用系統(tǒng)中常用的詞表作為藥物名稱來(lái)源。目前,RxNorm已包含了FDA結(jié)構(gòu)化產(chǎn)品標(biāo)簽(FDA Structured Product Labels)、“金標(biāo)準(zhǔn)”藥物數(shù)據(jù)庫(kù)(Gold Standard Drug Database)、醫(yī)學(xué)主題詞表(MeSH)等17個(gè)來(lái)源詞表,其收錄范圍覆蓋了美國(guó)境內(nèi)的處方藥以及大部分的非處方藥;同時(shí),新藥品一旦投入美國(guó)市場(chǎng),即會(huì)被添加進(jìn)入詞表;此外,如果信息來(lái)源可靠,也會(huì)收錄來(lái)自其他國(guó)家的處方藥[3-4]。
NLM在接收到藥品信息后,以標(biāo)準(zhǔn)數(shù)據(jù)格式將這些源數(shù)據(jù)輸出到RxNorm文件中,并進(jìn)行分組,組成同義詞集合,稱為“概念”。每個(gè)概念被分配一個(gè)RxNorm概念唯一標(biāo)識(shí)符(RXCUI),但RXCUI并無(wú)內(nèi)在意義。每個(gè)概念還具有一個(gè)RxNorm標(biāo)準(zhǔn)化名稱,這些標(biāo)準(zhǔn)化名稱計(jì)為“SAB=RXNORM”。每個(gè)“SAB=RXNORM”標(biāo)準(zhǔn)化名稱遵循以下格式:
通用藥品:活性成分+含量規(guī)格+劑型
品牌藥品:活性成分+含量規(guī)格+劑型[品牌名稱]
通用藥品組合包:{#(活性成分+含量規(guī)格+劑型)/#(活性成分+含量規(guī)格+劑型)}Pack
品牌藥品組合包:{#(活性成分+含量規(guī)格+劑型)/#(活性成分+含量規(guī)格+劑型)}Pack[品牌名稱]
SAB=RXNORM使用不同形式的術(shù)語(yǔ)類型(Term types)來(lái)表示通用藥品和品牌藥品名稱,詳見(jiàn)表1。
表1 RxNorm術(shù)語(yǔ)類型格式Tab 1 RxNorm terminology type format
上述語(yǔ)義通過(guò)“關(guān)系”相互聯(lián)系,例如“has tradename”“part of”“has dose form”“dose form of”等,構(gòu)成語(yǔ)義網(wǎng)。語(yǔ)義網(wǎng)可以通過(guò)RxNorm的各種終端從任意一種形式的術(shù)語(yǔ)類型來(lái)檢索到該藥物的其他各種術(shù)語(yǔ)類型信息,通過(guò)關(guān)系傳遞實(shí)現(xiàn)不同表達(dá)水平、同種化學(xué)成分的藥物信息交互[5]。以酒石酸美托洛爾(Metoprolol tartrate)為例,其語(yǔ)義網(wǎng)詳見(jiàn)圖1。
圖1 Metoprolol tartrate的語(yǔ)義網(wǎng)Fig 1 Semantic web of metoprolol tartrate
RxNorm的應(yīng)用包括:1)利用RxNorm標(biāo)準(zhǔn)名稱和代碼在電子健康檔案系統(tǒng)中捕獲藥品信息。例如,Rx-Norm是美國(guó)醫(yī)療保險(xiǎn)和醫(yī)療補(bǔ)助服務(wù)中心(Centers for Medicare and Medicaid Services,CMS)指定的參考文件,可替代美國(guó)國(guó)家藥品代碼(U.S.National Drug Code,NDC)表示藥品名稱,使得藥品處方提交流程更為合理。2)RxNorm可用于個(gè)人健康管理系統(tǒng)(Personal health record system,PHR)或電子健康檔案(Electronic health record,EHR)中。例如,將RxNorm用于動(dòng)態(tài)EHR系統(tǒng)中,以捕獲患者的藥物治療歷史數(shù)據(jù);同時(shí),Rx-Norm與美國(guó)國(guó)家藥品文件-參考術(shù)語(yǔ)(The National Drug File-Reference Terminology,NDF-RT)結(jié)合使用可對(duì)EHR藥品數(shù)據(jù)進(jìn)行分類。3)RxNorm在多個(gè)離散的藥物術(shù)語(yǔ)表之間交叉映射,可使與藥物相關(guān)的臨床決策更加便捷、合理。4)RxNorm提供一系列應(yīng)用終端,公眾可以免費(fèi)從終端中獲取藥物信息[5-6]。
WHODrug是WHO國(guó)際藥物監(jiān)測(cè)項(xiàng)目(WHO International Drug Monitoring Programme)的重要組成部分。該術(shù)語(yǔ)集于1968年發(fā)布,由烏普薩拉監(jiān)測(cè)中心(Uppsala Monitoring Centre,UMC)負(fù)責(zé)該術(shù)語(yǔ)集的維護(hù)及更新,每年更新2次。2017年3月1日,UMC已將WHODrug術(shù)語(yǔ)集中的所有產(chǎn)品組合成名為“WHODrug Global”的詞典,成為了世界上非常重要的藥物信息來(lái)源。WHODrug Global是WHODrug增強(qiáng)版(WHODrug Enhanced)和WHO草藥詞典(WHODrug Herbal)的組合。WHODrug Global現(xiàn)已包括147個(gè)國(guó)家的300多萬(wàn)種醫(yī)療產(chǎn)品,數(shù)據(jù)涵蓋了各國(guó)傳統(tǒng)藥物、植物藥和常規(guī)藥物(包括處方藥、非處方藥、藥劑師自制制劑、生物技術(shù)和血液制品、診斷劑和造影劑等),美國(guó)FDA和歐洲藥品管理局(EMA)注冊(cè)的藥品也會(huì)定期記錄。為了充分利用WHODrug的標(biāo)準(zhǔn)化數(shù)據(jù),該術(shù)語(yǔ)集還配套有WHODrug標(biāo)準(zhǔn)化藥物分組工具(WHODrug SDG)、WHODrug瀏覽工具(WHODrug Insight)和WHODrug變化分析工具(WHODrug CAT)[7]。
WHODrug術(shù)語(yǔ)集采用解剖-治療-化學(xué)(Anatomical therapeutic chemical,ATC)分類系統(tǒng)對(duì)藥物進(jìn)行分類。該系統(tǒng)是WHO對(duì)于藥物的官方分類系統(tǒng),由WHO藥物統(tǒng)計(jì)方法整合中心(The WHO Collaborating Centre for Drug Statistics Methodology)制定并定期公布,第1版于1976年發(fā)布[8]。ATC系統(tǒng)將藥物分為5個(gè)級(jí)別,分別為ATC01~ATC05。ATC對(duì)藥物的命名由字母與數(shù)字間隔而成,共有7位數(shù)字,其中:ATC01由1位字母組成,代表藥物作用的解剖學(xué)主族;ATC02由2位數(shù)字組成,代表藥物的治療學(xué)副族;ATC03由1位字母組成,代表藥物的藥理學(xué)副族;ATC04由1位字母組成,代表藥物的化學(xué)副族;ATC05由2位數(shù)字組成,代表化學(xué)物質(zhì)[9]。
ATC分類系統(tǒng)在一些北歐國(guó)家被用作國(guó)家藥物分類系統(tǒng),制造商、批發(fā)商、藥店和監(jiān)管機(jī)構(gòu)均以該系統(tǒng)作為共同標(biāo)準(zhǔn),在北歐國(guó)家銷售的所有醫(yī)藥產(chǎn)品都被分配了ATC編碼,且ATC編碼作為國(guó)家標(biāo)準(zhǔn)也應(yīng)用于國(guó)家藥品目錄中[10]。值得一提的是,我國(guó)《國(guó)家基本醫(yī)療保險(xiǎn)和工傷保險(xiǎn)和生育藥品目錄》等目錄也采用了ATC的分類和編碼。
WHODrug以兩種格式分發(fā)給所有用戶:B格式和C格式,用戶可以自主選擇。2018年9月之后,WHODrug全面升級(jí)到最新的B3/C3格式。其中,B3格式包含商品名、活性成分和ATC編碼信息,唯一標(biāo)識(shí)符是藥物代碼(Drug Code,DC);C3格式包含所有B3格式信息(包括DC),此外,該格式還提供有關(guān)產(chǎn)品的藥名修飾詞、銷售國(guó)家、營(yíng)銷許可證持有者、劑型、含量、規(guī)格等信息,唯一標(biāo)識(shí)符是藥品編號(hào)(Medicinal Product ID,MPID)。C3格式可幫助用戶通過(guò)其他信息準(zhǔn)確找到藥物[11]。
2.4.1 命名 WHODrug術(shù)語(yǔ)集中非專利名的來(lái)源,包括國(guó)家審批機(jī)構(gòu)的國(guó)際非專利名(International non-proprietan name,INN)以及諸如《馬丁代爾大詞典》和《默克索引》等著名參考書(shū)目;而專利名則來(lái)源于WHO國(guó)際藥物監(jiān)測(cè)項(xiàng)目參與國(guó)的國(guó)家藥物清單或國(guó)際參考書(shū)籍[11-12]。
2.4.2 代碼系統(tǒng) WHODrug詞典包含兩種數(shù)字代碼系統(tǒng):11位數(shù)的DC和MPID。其中,DC由藥物記錄碼(Drug record number,DRECNO)+序列號(hào)1(SEQ1)+序列號(hào)2(SEQ2)共11位數(shù)字組成。DRECNO為6位數(shù)字,每個(gè)DRECNO都對(duì)應(yīng)一個(gè)單一組分的化學(xué)基礎(chǔ)物質(zhì)或多組分藥物的所有化學(xué)基礎(chǔ)物質(zhì),化學(xué)底物相同的不同藥物,無(wú)論為鹽或酯,其DRECNO號(hào)碼相同;SEQ1為2位數(shù)字,其中“01”表示不含鹽或酯的基礎(chǔ)物質(zhì),而“01”以上的數(shù)字表示含有鹽或酯;SEQ2為3位數(shù),其中“001”表示首選基礎(chǔ)物質(zhì)藥物名(Preferred base name)或首選帶鹽藥物名(Preferred salt name),而“001”以上的數(shù)字表示具有相同成分的其他通用名或商品名。DC編碼規(guī)則及舉例見(jiàn)圖2。
圖2 DC編碼規(guī)則及舉例Fig 2 Coding rules and examples of DC
MPID是C格式的唯一標(biāo)識(shí)符,這個(gè)編碼僅代表所有藥品信息的唯一編碼。
WHODrug術(shù)語(yǔ)集作為WHO國(guó)際藥物監(jiān)管項(xiàng)目的重要組成部分之一,在藥物警戒的研究中發(fā)揮著重要作用。不良反應(yīng)數(shù)據(jù)庫(kù)中的藥品名稱經(jīng)過(guò)ATC編碼后,可在不同的ATC層級(jí)進(jìn)行數(shù)據(jù)挖掘及安全信號(hào)分析。WHODrug術(shù)語(yǔ)集作為研究工具(特別是使用首選基礎(chǔ)物質(zhì)藥物名研究某類藥物)正在越來(lái)越多地應(yīng)用于藥物流行病學(xué)和藥物安全研究領(lǐng)域[12]。
SNOMED CT是目前國(guó)際上較為通用的一種醫(yī)學(xué)臨床術(shù)語(yǔ)集,目前已經(jīng)在50多個(gè)國(guó)家使用。1965年,美國(guó)病理學(xué)院研發(fā)了病理學(xué)系統(tǒng)命名法(Systematized Nomenclature of Pathology,SNOP),這是SNOMED CT的前身,后經(jīng)過(guò)一系列的改革整合形成了現(xiàn)在的SNOMED CT系統(tǒng)。該系統(tǒng)現(xiàn)在由國(guó)際衛(wèi)生術(shù)語(yǔ)標(biāo)準(zhǔn)制定組織(International Health Terminology Standards Development Organization,IHTSDO)進(jìn)行維護(hù)[13]。
新版SNOMED CT的藥物分類目的是使所有藥物都能在必要和充分條件下被定義。藥物主要分為4類:1)基于傾向(與藥物的作用機(jī)制有關(guān));2)基于化學(xué)結(jié)構(gòu);3)基于預(yù)期給藥部位;4)基于治療作用。
新版SNOMED CT藥物模型主要涉及兩個(gè)層次結(jié)構(gòu)(Hierachy):物質(zhì)類(Substances,包括化學(xué)或生物實(shí)體)和產(chǎn)品類(Products,即人造物)。SNOMED CT中的主要術(shù)語(yǔ)類型及格式見(jiàn)表2。
表2 SNOMED-CT中的主要術(shù)語(yǔ)類型及格式Tab 2 SNOMED-CT main terminology type and format
舊版SNOMED CT藥物模型采用的是“is a”定義關(guān)系,而2018年7月新版SNOMED CT藥物模型則采用了一種新的關(guān)系——“is modification of”來(lái)進(jìn)行定義藥物,以便于描述、信息交流和計(jì)算機(jī)處理數(shù)據(jù)。如“Metoprolol tartrate is modification of Metoprolol”,而不是“Metoprolol tartrate is a Metoprolol”。SNOMED CT中的與藥物相關(guān)的關(guān)系還有“has manufactured dose form”“has active ingredient”等。以Metoprolol tartrate為例,其與其他術(shù)語(yǔ)之間的關(guān)系見(jiàn)圖3[2]。此外,新版SNOMED CT藥物模型中含量規(guī)格強(qiáng)度不是使用字符串(如10 mg)來(lái)表示的,而是使用離散的元素(分子值、分子單位、分母值、分母單位)來(lái)表示。
圖3 在SNOMED CT中“Metoprolol tartrate”與其他術(shù)語(yǔ)之間的關(guān)系Fig 3 Relationship between“Metoprolol tartrate”and other terminologiesin SNOMED CT
SNOMED CT對(duì)藥物的定義基于描述邏輯(Description Logic,DL),重點(diǎn)是用充分必要條件定義藥物概念,其對(duì)于藥物的描述往往是針對(duì)特定需求的。在不同的國(guó)家,藥物的品牌名稱、配方和活性成分含量可能各不相同,且各個(gè)國(guó)家監(jiān)管機(jī)構(gòu)對(duì)藥品的授權(quán)會(huì)有不同的標(biāo)準(zhǔn)。因此,許多國(guó)家開(kāi)發(fā)了自己的藥物術(shù)語(yǔ)集。目前,SNOMED CT是世界上最大的臨床術(shù)語(yǔ)集,但是要收錄整個(gè)世界的藥物處方集,并支持各種各樣的使用案例還是非常困難的,所以SNOMED國(guó)際醫(yī)學(xué)研究中心將其重點(diǎn)應(yīng)用范圍放在以下4個(gè)方面,即促進(jìn)藥物概念的國(guó)際互操作性、為成員國(guó)開(kāi)發(fā)本國(guó)的醫(yī)藥產(chǎn)品術(shù)語(yǔ)集提供基礎(chǔ)、支持藥物分析研究、支持發(fā)展國(guó)際藥物決策[2]。
對(duì)RxNorm、WHODrug、SNOMED CT的藥物模型含有的藥物信息進(jìn)行比較,結(jié)果見(jiàn)表3。
由表3可見(jiàn),(1)在術(shù)語(yǔ)編碼方面:WHODrug采用DC和MPID進(jìn)行編碼,DC攜帶的結(jié)構(gòu)化藥物信息數(shù)據(jù)可有助于進(jìn)行大量數(shù)據(jù)分析,也有利于開(kāi)展國(guó)際間的交流;而RxNorm和SNOMED CT則對(duì)藥物術(shù)語(yǔ)、關(guān)系、活性成分等分別添加編碼,但并不是結(jié)構(gòu)化編碼。(2)在術(shù)語(yǔ)名稱方面:WHODrug和RxNorm的藥物術(shù)語(yǔ)都有藥物的商品名信息,因?yàn)閃HODrug主要服務(wù)于不良反應(yīng)報(bào)告,RxNorm主要服務(wù)于EHR,都需要藥品的商品名的信息;而SNOMED CT沒(méi)有商品名信息,其目的是為了促進(jìn)藥物概念的國(guó)際互操作性。(3)在分類體系方面:只有WHODrug采用了系統(tǒng)的分類體系——ATC,SNOMED CT的分類只是為了更好地定義藥物,而Rx-Norm則沒(méi)有分類體系。
表3 RxNorm、WHODrug、SNOMED CT所包含的藥物信息比較Tab 3 Comparison of information included in Rx-Norm,WHODrug and SNOMED CT
不同的術(shù)語(yǔ)集面向的需求和具體的應(yīng)用場(chǎng)景導(dǎo)致藥品術(shù)語(yǔ)集呈現(xiàn)不同的形式,也會(huì)引領(lǐng)術(shù)語(yǔ)集向不同的方向發(fā)展。例如,當(dāng)前的藥品術(shù)語(yǔ)發(fā)展趨勢(shì)是對(duì)“活性成分”和“精確成分”的明確表達(dá),在新的SNOMED CT藥品模型中,把“精確成分”作為“活性成分”的一種修飾;在WHODrug中藥物的鹽或酯的信息在其DC中就有所體現(xiàn);RxNorm則把“精確成分”作為“活性成分”的形式。這種明確的表達(dá)方式有利于藥物研發(fā)和國(guó)際間數(shù)據(jù)的互操作性。此外,WHODrug和SNOMED CT均通過(guò)商業(yè)授權(quán),而RxNorm則可免費(fèi)從終端中獲取。
隨著近幾年醫(yī)學(xué)信息學(xué)的迅速發(fā)展,各大醫(yī)療數(shù)字平臺(tái)之間的信息共享與互通需求不斷增加,但我國(guó)只有一些藥品目錄、數(shù)據(jù)庫(kù)或藥物辭典(如《國(guó)家基本醫(yī)療保險(xiǎn)和工傷保險(xiǎn)和生育藥品目錄》、2015年版《中國(guó)藥典》)供參考。而且這些數(shù)據(jù),尤其是官方數(shù)據(jù),公開(kāi)的較少,且大部分為非結(jié)構(gòu)化數(shù)據(jù)。從網(wǎng)絡(luò)上可獲取的非官方藥物數(shù)據(jù)[如藥智網(wǎng)(https://www.yaozh.com/)、39健康網(wǎng)(http://www.39.net/)],大多準(zhǔn)確性不高,且更新不及時(shí)。除了數(shù)據(jù)上的缺失,我國(guó)藥品還存在很多特殊性。例如,筆者初步抽樣發(fā)現(xiàn):我國(guó)部分化學(xué)藥的商品名不全;中成藥則因成分復(fù)雜,不好表達(dá),沒(méi)有合適的藥物編碼模型,且大部分中成藥用商標(biāo)代替其品牌名等,這也是導(dǎo)致我國(guó)藥物術(shù)語(yǔ)集發(fā)展緩慢的主要原因。建議我國(guó)藥物術(shù)語(yǔ)集的構(gòu)建可在借鑒國(guó)外先進(jìn)藥物術(shù)語(yǔ)集的設(shè)計(jì)與實(shí)踐經(jīng)驗(yàn)的基礎(chǔ)上,鼓勵(lì)醫(yī)院或醫(yī)藥企業(yè)公開(kāi)和共享數(shù)據(jù),并嘗試構(gòu)建化學(xué)藥和中成藥兼容的藥品模型等,以適應(yīng)我國(guó)藥品的特殊性,滿足國(guó)際交流的需要。