尹梓名 杜方芮 趙紫彤 賈玉嬌 田甜 徐丹
摘? 要: 隨著人工智能的迅猛發(fā)展以及智慧醫(yī)療的提出,具備高關(guān)聯(lián)性,高結(jié)構(gòu)化的醫(yī)學(xué)知識(shí)圖譜成為智慧醫(yī)療的研究熱點(diǎn)。然而基于互聯(lián)網(wǎng)大數(shù)據(jù)構(gòu)建的知識(shí)圖譜,其知識(shí)質(zhì)量難以保證,難以適用于具有高專業(yè)、高要求、高準(zhǔn)確度的臨床輔助診療場(chǎng)景。本文提出一種基于臨床指南的知識(shí)圖譜構(gòu)建方法,著重在知識(shí)源頭進(jìn)行優(yōu)化,主要對(duì)其中包含的陳述性知識(shí)和流程性知識(shí)進(jìn)行建模。最后以非小細(xì)胞肺癌與冠心病兩類(lèi)疾病為例,分別構(gòu)建了疾病知識(shí)圖譜,驗(yàn)證了該方法的可用性。
關(guān)鍵詞: 知識(shí)圖譜;臨床指南;本體;Neo4j
中圖分類(lèi)號(hào): TP391.5? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? DOI:10.3969/j.issn.1003-6970.2020.09.047
本文著錄格式:尹梓名,杜方芮,趙紫彤,等. 基于臨床指南的知識(shí)圖譜構(gòu)建技術(shù)研究[J]. 軟件,2020,41(09):178184+197
【Abstract】: With the rapid development of artificial intelligence and the proposal of intelligent medicine, medical knowledge graph with high relevance and high structure has become the research hotspot. However, the knowledge graph based on Internet big data is difficult to ensure the quality of knowledge, and it is difficult to apply to the clinical auxiliary diagnosis and treatment scene with high professional, high requirements and high accuracy. This paper proposes a construction method of knowledge graph based on clinical guidelines, focusing on knowledge optimization at the source of knowledge, mainly modeling the declarative knowledge and process knowledge. Finally, the knowledge graph of non-small cell lung cancer and coronary heart disease was constructed to verify the availability of this method.
【Key words】: Knowledge graph; Clinical guidelines; Ontology; Neo4j
0? 引言
隨著人工智能的迅速發(fā)展以及智慧醫(yī)療的提出,涉及到知識(shí)抽取、表示、融合、推理、問(wèn)答等內(nèi)容的知識(shí)圖譜成為知識(shí)服務(wù)領(lǐng)域的一個(gè)研究熱點(diǎn)。作為目前人工智能領(lǐng)域最前沿且最重要的一種知識(shí)表示形式,知識(shí)圖譜基于語(yǔ)義網(wǎng)絡(luò),提供從“關(guān)系”的角度去分析問(wèn)題的能力,從而構(gòu)建高關(guān)聯(lián)性,高結(jié)構(gòu)化的知識(shí)模型。目前,現(xiàn)有的面向互聯(lián)網(wǎng)應(yīng)用場(chǎng)景的通用知識(shí)圖譜構(gòu)建技術(shù)[1-5],雖然能夠快速、大量地建立知識(shí)圖譜,但是基于網(wǎng)絡(luò)數(shù)據(jù)建立的知識(shí)圖譜,其準(zhǔn)確性和可靠性存疑,知識(shí)質(zhì)量難以保證,形成的知識(shí)圖譜未必完全正確,難以適用于具有高準(zhǔn)確度的臨床輔助診療場(chǎng)景,且這種方法生成的知識(shí)圖譜冗余度較大[6-7]。所以如何從各種專業(yè)的醫(yī)學(xué)資料中構(gòu)建知識(shí)圖譜是醫(yī)學(xué)知識(shí)圖譜研究的重點(diǎn)內(nèi)容。臨床指南(Clinical Guidelines)是基于循證醫(yī)學(xué)的觀點(diǎn)系統(tǒng)開(kāi)發(fā)的多組臨床指導(dǎo)意見(jiàn),用于幫助醫(yī)生和病人針對(duì)特定的臨床問(wèn)題做出恰當(dāng)?shù)奶幚?,減少醫(yī)療差錯(cuò),避免資源浪費(fèi)[8]。
因此,基于臨床指南構(gòu)建用于輔助臨床決策的醫(yī)學(xué)知識(shí)圖譜是一種值得研究的方法。本論文提出一種基于臨床指南構(gòu)建知識(shí)圖譜技術(shù),圍繞流程性知識(shí)與陳述性知識(shí)兩種臨床指南知識(shí)表達(dá)方式,建立結(jié)構(gòu)化本體庫(kù)和知識(shí)圖譜模型。該方法著重在知識(shí)源頭對(duì)知識(shí)進(jìn)行優(yōu)化,設(shè)計(jì)并調(diào)整概念間的關(guān)系結(jié)構(gòu),對(duì)實(shí)例與實(shí)例間的聯(lián)系進(jìn)行細(xì)化完善,保證數(shù)據(jù)的可用性與可靠性。依據(jù)此方法,本文以美國(guó)NCCN公布的非小細(xì)胞肺癌臨床診療指南和中華醫(yī)學(xué)會(huì)公布的冠心病診療指南為例,構(gòu)建了這兩種疾病的知識(shí)圖譜,并驗(yàn)證了其可行性,為醫(yī)療智能輔助決策提供了一種高質(zhì)量構(gòu)建知識(shí)圖譜的方法。
1? 基于臨床指南的知識(shí)圖譜構(gòu)建
1.1? 概念層(本體層)
臨床指南由大量臨床概念、術(shù)語(yǔ)及邏輯關(guān)系組成。構(gòu)建基于臨床指南的知識(shí)圖譜,首先應(yīng)從指南中抽象出其概念層次,將指南結(jié)構(gòu)化。本體設(shè)計(jì)是知識(shí)表達(dá)的一種方式,相當(dāng)于知識(shí)圖譜的結(jié)構(gòu)層次構(gòu)建,突出強(qiáng)調(diào)概念及概念間的關(guān)系,通過(guò)本體形成的知識(shí)庫(kù)不僅層次結(jié)構(gòu)較強(qiáng),而且冗余度較小,是知識(shí)圖譜概念層構(gòu)建必不可少的環(huán)節(jié)。因此,可通過(guò)對(duì)指南進(jìn)行? 知識(shí)抽取,提取指南的概念層內(nèi)容,進(jìn)而進(jìn)行本體設(shè)計(jì)。
1.1.1? 概念結(jié)構(gòu)表設(shè)計(jì)
文本指南中的知識(shí)主要由陳述性知識(shí)和流程性知識(shí)兩大類(lèi)構(gòu)成[9]。流程性知識(shí)關(guān)注的是陳述性知識(shí)的推理過(guò)程及推理結(jié)果。如何從不同格式的知識(shí)中提取概念層次內(nèi)容,是概念層設(shè)計(jì)的核心部分。從臨床指南的角度來(lái)看,我們關(guān)注概念模型的三個(gè)內(nèi)容:概念內(nèi)容,概念實(shí)例,以及概念間的邏輯關(guān)系。
(1)概念內(nèi)容:概念內(nèi)容是對(duì)指南中屬于同一類(lèi)醫(yī)學(xué)知識(shí)的歸一化過(guò)程。
(2)概念實(shí)例:是概念內(nèi)容的子集,需要通過(guò)命名實(shí)體識(shí)別技術(shù)來(lái)完成。應(yīng)注意,概念實(shí)例的提取可與數(shù)據(jù)層的實(shí)體抽取同步進(jìn)行。
(3)概念間的邏輯關(guān)系:描繪兩個(gè)概念內(nèi)容的關(guān)系,在流程性知識(shí)中通常以有向圖的指向關(guān)系來(lái)表示,在陳述性知識(shí)中需要通過(guò)語(yǔ)句語(yǔ)義來(lái)確認(rèn)概念間的邏輯關(guān)系。
概念層設(shè)計(jì)相當(dāng)于知識(shí)圖譜的架構(gòu)設(shè)計(jì),是知識(shí)圖譜結(jié)構(gòu)化,規(guī)范化的根基。因此,將概念內(nèi)容按上下位關(guān)系,整理成疾病概念結(jié)構(gòu)表,便于知識(shí)圖譜構(gòu)建的理解與運(yùn)用,如表1所示。
1.1.2? 概念關(guān)系表設(shè)計(jì)
要實(shí)現(xiàn)指南結(jié)構(gòu)化的概念整合,更重要的一步是使這些概念層在語(yǔ)義上形成關(guān)聯(lián),以構(gòu)成一個(gè)完整的指南結(jié)構(gòu)體。確定概念層之間的關(guān)系主要通過(guò)兩種手段來(lái)實(shí)現(xiàn):確定同類(lèi)型醫(yī)學(xué)概念關(guān)系,確定不同類(lèi)型醫(yī)學(xué)概念關(guān)系。同類(lèi)型醫(yī)學(xué)概念關(guān)系的確定主要體現(xiàn)在實(shí)體的上下位關(guān)系。概念結(jié)構(gòu)表確定了概念層的上下位關(guān)系后,這一步主要關(guān)心不同類(lèi)型醫(yī)學(xué)概念關(guān)系。
不同類(lèi)型醫(yī)學(xué)概念關(guān)系的確定以類(lèi)與類(lèi)之間的映射關(guān)系為核心,是對(duì)概念間邏輯關(guān)系的歸納。由于疾病的治療普遍包含檢查、評(píng)估、治療、用藥、監(jiān)測(cè)等步驟,我們?cè)O(shè)計(jì)了一張以疾病知識(shí)圖譜為使用對(duì)象的通用概念關(guān)系表,不同疾病知識(shí)圖譜的概念關(guān)系可在此表的基礎(chǔ)上進(jìn)行設(shè)計(jì)使用,也可對(duì)特定關(guān)系進(jìn)行增補(bǔ)。
1.2? 數(shù)據(jù)層(實(shí)體和關(guān)系)
構(gòu)建指南數(shù)據(jù)層的目的是從不同格式的臨床指南中提取醫(yī)學(xué)知識(shí),并將醫(yī)學(xué)知識(shí)轉(zhuǎn)換成可被計(jì)算機(jī)處理的數(shù)據(jù)格式。知識(shí)圖譜數(shù)據(jù)應(yīng)用的前提是,這些數(shù)據(jù)具有規(guī)范化的數(shù)據(jù)模型和物理模型。數(shù)據(jù)模型是對(duì)數(shù)據(jù)的有
效表示,是從人的角度對(duì)知識(shí)圖譜的數(shù)據(jù)進(jìn)行描述,包含三元組模型和圖模型兩種模型。物理層面的存儲(chǔ)是從計(jì)算機(jī)的角度對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)[10],包含關(guān)系表存儲(chǔ)和圖存儲(chǔ)兩者存儲(chǔ)方式。數(shù)據(jù)模型和物理模型的合理化構(gòu)建關(guān)系到知識(shí)圖譜的有效性利用。對(duì)于數(shù)據(jù)層的構(gòu)建,我們利用三元組數(shù)據(jù)模型來(lái)描述指南知識(shí),通過(guò)知識(shí)抽取,知識(shí)存儲(chǔ)兩個(gè)內(nèi)容,將指南知識(shí)有效地存儲(chǔ)在圖數(shù)據(jù)庫(kù)管理系統(tǒng)Neo4j中。
1.2.1? 知識(shí)抽取
醫(yī)學(xué)臨床指南中含有大量醫(yī)學(xué)臨床術(shù)語(yǔ)及指南流程,臨床指南的知識(shí)抽取就是從臨床指南中抽取與概念層設(shè)計(jì)相匹配的實(shí)體和關(guān)系,并將其整理成實(shí)體庫(kù)和三元組關(guān)系庫(kù)。知識(shí)抽取主要包括兩方面內(nèi)容:
(1)醫(yī)學(xué)實(shí)體抽?。簭闹改现凶R(shí)別命名實(shí)體,并將其分類(lèi)到定義的類(lèi)別。
(2)醫(yī)學(xué)關(guān)系抽?。簭闹改现凶R(shí)別并抽取實(shí)體和實(shí)體之間的關(guān)系。關(guān)系必須是三元組形式,即實(shí)體-關(guān)系-實(shí)體。整理出的多元關(guān)系如圖所示。
在實(shí)體抽取和關(guān)系抽取時(shí),亦可針對(duì)不同實(shí)體類(lèi)設(shè)定相關(guān)屬性。例如藥品類(lèi)別含有藥品名稱,藥品英文名稱,藥品類(lèi)別等屬性。
1.2.2? 知識(shí)存儲(chǔ)
明確了所有實(shí)體以及實(shí)體的關(guān)系后,需要設(shè)計(jì)數(shù)據(jù)的物理模型,對(duì)知識(shí)進(jìn)行存儲(chǔ),形成知識(shí)圖譜。選擇存儲(chǔ)體系時(shí)需考慮知識(shí)可靠、可融合、可應(yīng)用等問(wèn)題。為表示多樣化,復(fù)雜化的醫(yī)學(xué)實(shí)體關(guān)系,我們選用基于Neo4j圖數(shù)據(jù)庫(kù)作為存儲(chǔ)體系。Neo4j是基于Java開(kāi)發(fā)的開(kāi)源原生數(shù)據(jù)庫(kù),是一個(gè)兼?zhèn)涓咝阅堋⑶度胧?、輕量級(jí)等優(yōu)勢(shì)的NoSQL圖像數(shù)據(jù)庫(kù)?;诔槿〉娜M數(shù)據(jù)模型,設(shè)計(jì)導(dǎo)入的醫(yī)學(xué)節(jié)點(diǎn)和關(guān)系節(jié)點(diǎn),考慮到疾病臨床指南所整理的數(shù)據(jù)為中等規(guī)模以及數(shù)據(jù)可實(shí)時(shí)插入的效果,采用導(dǎo)入Csv文件為主的方式,對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)。
2? 知識(shí)圖譜的應(yīng)用案例
為驗(yàn)證上述方法的可行性,本文以非小細(xì)胞肺癌和冠心病的臨床指南為例,依照本文所述方法分別建立兩種疾病的知識(shí)圖譜。
2.1? 案例一:非小細(xì)胞肺癌知識(shí)圖譜構(gòu)建
近10多年來(lái),惡性腫瘤發(fā)病人數(shù)成增長(zhǎng)趨勢(shì)。美國(guó)癌癥協(xié)會(huì)(ACS)在《2020年癌癥統(tǒng)計(jì)》上預(yù)估了2020年美國(guó)新發(fā)癌癥病例數(shù)和死亡人數(shù),統(tǒng)計(jì)顯示,在所有癌癥死亡中四分之一是由于肺癌所致,高于乳腺癌、前列腺癌和結(jié)直腸癌三者病例。基于上述知識(shí)圖譜構(gòu)建方法,我們構(gòu)建了非小細(xì)胞肺癌臨床本體以及可推理的知識(shí)圖譜,從而實(shí)現(xiàn)非小細(xì)胞肺癌的臨床輔助決策。
在當(dāng)今中國(guó)的腫瘤防治領(lǐng)域,為實(shí)現(xiàn)腫瘤治療的規(guī)范化、科學(xué)化,普遍倡導(dǎo)以美國(guó)國(guó)家綜合癌癥網(wǎng)絡(luò)(NCCN)發(fā)布的臨床實(shí)踐指南為首選的循證學(xué)依據(jù)[11]。該指南以有向流程圖的形式,描述了非小細(xì)胞肺癌的臨床診治過(guò)程,例如根據(jù)各個(gè)疾病分期或臨床表現(xiàn)給出對(duì)應(yīng)的評(píng)估,治療流程,如圖1所示。
2.1.1? 概念層設(shè)計(jì)
首先,對(duì)圖1所示的部分臨床指南進(jìn)行概念層提取。第一步,提取概念內(nèi)容,分別為“臨床表現(xiàn)”,“初始治療”,“輔助治療”和“治療方法”四個(gè)內(nèi)容?!爸委煼椒ā痹谟邢驁D中并未提示,但通過(guò)歸納可知,“手術(shù)”,“化療”,“術(shù)前同步放化療”均為一種“治療方法”。第二步,提取概念實(shí)例,分別為“肺上溝瘤(T3侵犯,N0-1)”,“術(shù)前同步放化療”,“手術(shù)”,“化療”四個(gè)實(shí)例,此步驟要盡可能多的挖掘出臨床指南中高質(zhì)量的醫(yī)學(xué)詞匯。第三步,提取概念間的邏輯關(guān)系,分別為“臨床表現(xiàn)的初始治療是(某一治療方法)”,“臨床表現(xiàn)的輔助治療是(某一治療方法)”。通過(guò)對(duì)臨床指南內(nèi)容的整理歸納(例如由“初始治療”,“輔助治療”,“后續(xù)治療”挖掘出上級(jí)概念層“治療時(shí)期”),整理出非小細(xì)胞肺癌本體的三級(jí)概念結(jié)構(gòu),如表4所示。
其次,進(jìn)行概念關(guān)系層設(shè)計(jì),基于提取的概念間的邏輯關(guān)系,可將語(yǔ)義關(guān)系表設(shè)計(jì)如下表5所示。
2.1.2? 數(shù)據(jù)層設(shè)計(jì)
數(shù)據(jù)層設(shè)計(jì)主要是從臨床指南中挖掘出具有高質(zhì)量的醫(yī)學(xué)實(shí)體(概念實(shí)例)和關(guān)系,并將其整理成三元組的格式,存儲(chǔ)在Neo4j數(shù)據(jù)庫(kù)中。實(shí)體關(guān)系必須以概念層設(shè)計(jì)的關(guān)系表為框架,實(shí)現(xiàn)實(shí)體與實(shí)體之間的關(guān)系連接。
如圖2所示,該部分指南表示的意思為“臨床評(píng)估為IA期(周?chē)?T1abc,N0)分期的病人,需先進(jìn)行治療前評(píng)估,評(píng)估方法有肺功能檢查,支氣管鏡,縱隔淋巴結(jié)病理學(xué)評(píng)估,F(xiàn)DG PET/CT掃描”,故提取實(shí)體“IA期(周?chē)蚑1abc,N0)”為臨床分期,“肺功能檢查”,“支氣管鏡”,“縱隔淋巴結(jié)病理學(xué)評(píng)估”和“FDG PET/CT掃描”為評(píng)估方法,概念內(nèi)容“臨床分期”與“評(píng)估方法”的關(guān)系為“has_assessment”(有…評(píng)估方法),生成表6所示的三元組關(guān)系表。
最后將實(shí)體與關(guān)系整理出Neo4j Load csv 導(dǎo)入格式的實(shí)體與關(guān)系文件(共導(dǎo)入12個(gè)實(shí)體文件與18個(gè)關(guān)系文件),導(dǎo)入Neo4j數(shù)據(jù)庫(kù),形成284個(gè)醫(yī)學(xué)實(shí)體與824個(gè)醫(yī)學(xué)關(guān)系,如圖3、圖4所示。
2.1.3? 臨床實(shí)例驗(yàn)證
非小細(xì)胞肺癌知識(shí)圖譜可應(yīng)用于臨床輔助決策,實(shí)現(xiàn)搜索與推薦功能。隨著圖數(shù)據(jù)規(guī)模的日益增大,大圖上的子圖搜索問(wèn)題變得極為重要[12]。我們可以通過(guò)不同的方法來(lái)實(shí)現(xiàn)搜索功能,例如基于規(guī)則的子圖匹配,基于節(jié)點(diǎn)與結(jié)構(gòu)相似度的子圖匹配等[13]。本文通過(guò)規(guī)則匹配的方法,實(shí)現(xiàn)了非小細(xì)胞肺癌系統(tǒng)的后臺(tái)操作代碼。
效果如下:當(dāng)用戶點(diǎn)擊“II期(T2b,N0)”臨床分期和搜索條件“治療方法”時(shí),系統(tǒng)會(huì)根據(jù)非小細(xì)胞肺癌知識(shí)圖譜接收搜索條件內(nèi)容,通過(guò)規(guī)則匹配,最后將其轉(zhuǎn)換為Cypher語(yǔ)句以在Neo4j中查詢答案。結(jié)果如圖5所示。
非小細(xì)胞肺癌知識(shí)圖譜的應(yīng)用也可體現(xiàn)在病人的診中和診后的環(huán)節(jié),為醫(yī)生提供診斷輔助決策。例如,基于病人主訴,醫(yī)生評(píng)估病人的疾病分期為“A期(周?chē)蚑1abc,N0)”,臨床決策支持系統(tǒng)可查詢知識(shí)圖譜,知識(shí)圖譜會(huì)針對(duì)該疾病分期給出不同的評(píng)估方法,治療方法與監(jiān)測(cè)方法,如圖6所示。
2.2? 案例二:冠心病知識(shí)圖譜構(gòu)建
冠狀動(dòng)脈粥樣硬化性心臟病是冠狀動(dòng)脈血管發(fā)生動(dòng)脈粥樣硬化病變而引起血管腔狹窄或阻塞,造成心肌缺血、缺氧或壞死而導(dǎo)致的心臟病,常常被稱為“冠心病”。冠心病在美國(guó)和許多發(fā)達(dá)國(guó)家排在死亡原因的第一位。參照本文對(duì)流程性知識(shí)的構(gòu)建方法,以《臨床診療指南·心血管分冊(cè)(2017年修訂版)》冠心病臨床指南[14]為基礎(chǔ),對(duì)臨床指南陳述性知識(shí)進(jìn)行分析,構(gòu)建冠心病臨床本體以及知識(shí)圖譜,實(shí)現(xiàn)冠心病領(lǐng)域的臨床輔助決策。
2.2.1? 概念層設(shè)計(jì)
醫(yī)學(xué)知識(shí)關(guān)系錯(cuò)綜復(fù)雜并且醫(yī)學(xué)知識(shí)抽取的精確度要求高,為保證本體構(gòu)建的正確性,參考醫(yī)學(xué)主題詞表(MeSH),對(duì)冠心病領(lǐng)域內(nèi)的基本概念和概念之間的相互關(guān)系進(jìn)行分析,通過(guò)這些關(guān)系和概念完成本體的構(gòu)建。在理解MeSH詞表和臨床診療指南的基礎(chǔ)上,將冠心病知識(shí)本體分為患者病歷、疾病類(lèi)型、檢測(cè)方法、檢測(cè)結(jié)果、治療方法、危險(xiǎn)因素6大類(lèi),知識(shí)層級(jí)結(jié)構(gòu)如圖7所示。
在《臨床診療指南·心血管分冊(cè)(2017年修訂)》的基礎(chǔ)上,結(jié)合MeSH主題詞表,對(duì)構(gòu)建冠心病臨床指南中概念與概念之間的關(guān)系進(jìn)行詳細(xì)的分析,整理出冠心病本體三級(jí)概念結(jié)構(gòu)。具體概念結(jié)構(gòu)如下表7所示。
參考非小細(xì)胞肺癌關(guān)系層設(shè)計(jì)方法,對(duì)相似的部分進(jìn)行整合和復(fù)用,保證兩類(lèi)疾病構(gòu)建知識(shí)圖譜結(jié)構(gòu)上的統(tǒng)一性。確定冠心病同類(lèi)型醫(yī)學(xué)概念實(shí)體的上下位關(guān)系,并根據(jù)指南內(nèi)容,以類(lèi)與類(lèi)之間的映射關(guān)系為核心提取不同類(lèi)型的醫(yī)學(xué)概念關(guān)系,以此整理出8種冠心病臨床指南實(shí)體與實(shí)體之間的關(guān)系,分別為has_class_of、has_treatment、has_assessment、has_detection、assess_result、belong_to、refer_to。冠心病臨床指南的概念關(guān)系圖下表8所示。
2.2.2? 數(shù)據(jù)層構(gòu)建
通過(guò)知識(shí)抽取,對(duì)冠心病概念層和關(guān)系層進(jìn)行詳細(xì)設(shè)計(jì),構(gòu)建冠心病本體,明確了實(shí)體及實(shí)體關(guān)系后,將關(guān)系數(shù)據(jù)和實(shí)體數(shù)據(jù)以三元組的形式導(dǎo)入到Neo4j圖形數(shù)據(jù)庫(kù)中,具體知識(shí)存儲(chǔ)方法參考非小細(xì)胞肺癌的知識(shí)圖譜構(gòu)建知識(shí)存儲(chǔ)部分的詳細(xì)說(shuō)明,冠心病知識(shí)圖譜共包含133個(gè)醫(yī)學(xué)實(shí)體,137條實(shí)體間關(guān)系,可為冠心病臨床醫(yī)學(xué)決策提供參考。圖8為冠心病臨床指南知識(shí)圖譜可視化展示。
2.2.3? 臨床應(yīng)用實(shí)例
冠心病知識(shí)圖譜的構(gòu)建為冠心病臨床決策提供了便捷的查詢方式。例如,醫(yī)學(xué)中藥品種類(lèi)繁多,難以準(zhǔn)確記憶,在脫離臨床指南的情況下,如何在臨床上幫助醫(yī)生了解穩(wěn)定型心絞痛患者進(jìn)行藥物治療時(shí)應(yīng)當(dāng)使用何種藥物。我們借助Cypher語(yǔ)言在冠心病知識(shí)圖譜中查詢這一信息,輸入查詢語(yǔ)句“match data=(na:疾病類(lèi)型{name:'穩(wěn)定型心絞痛'})-[r1]->(nb:相關(guān)信息)-[r2]->(nc:治療方法)-[r3]->(nd:藥物治療) return data”對(duì)藥品信息進(jìn)行查詢,查詢結(jié)果如圖9所示。從查詢結(jié)果可看出對(duì)穩(wěn)定型心絞痛患者進(jìn)行藥物治療時(shí),通??刹捎孟跛狨ヮ?lèi)藥物、抗凝藥物等。藥品信息通過(guò)冠心病知識(shí)圖譜被及時(shí)獲取,減輕了醫(yī)生記憶海量醫(yī)學(xué)知識(shí)和錯(cuò)綜復(fù)雜醫(yī)學(xué)關(guān)系的難度,在臨床醫(yī)學(xué)決策上起到至關(guān)重要的作用。
3? 討論
基于臨床指南的知識(shí)圖譜構(gòu)建方法是一種專注單一疾病,追求高質(zhì)量醫(yī)學(xué)知識(shí)表達(dá)的圖譜構(gòu)建方法,可以根據(jù)患者癥狀以及指標(biāo)數(shù)據(jù),為專業(yè)領(lǐng)域的醫(yī)生提供診前、診中、診后的輔助性臨床決策方案。但此種方法仍有不足之處,首先,此種方法雖然可以保證錄入知識(shí)圖譜的數(shù)據(jù)質(zhì)量,但是需要由知識(shí)工程師和臨床醫(yī)生共同對(duì)臨床指南進(jìn)行整理與歸納,需要消耗一定的人力和時(shí)間。其次,文本指南中存在確定性知識(shí)和不確定性知識(shí)兩種類(lèi)型,對(duì)不確定知識(shí)的取舍與分割亦是該方法的難點(diǎn)之一,較好的辦法是引入多種知識(shí)表達(dá)方式,增強(qiáng)知識(shí)圖譜的語(yǔ)義表達(dá)能力。綜上,本文所提出的方法只適用于專業(yè)領(lǐng)域的醫(yī)學(xué)知識(shí)圖譜構(gòu)建,對(duì)于通用醫(yī)學(xué)知識(shí)圖譜的構(gòu)建還需要依靠大數(shù)據(jù)技術(shù)來(lái)獲取實(shí)體,或是由多個(gè)專業(yè)領(lǐng)域圖譜融合來(lái)完成。
4? 總結(jié)
本文提出了一種基于臨床指南的知識(shí)圖譜搭建方法,并針對(duì)陳述性知識(shí)和流程性知識(shí)兩種文本指南進(jìn)行知識(shí)圖譜搭建,實(shí)現(xiàn)了非小細(xì)胞肺癌和冠心病兩種疾病的知識(shí)圖譜。疾病知識(shí)圖譜的構(gòu)建為醫(yī)學(xué)臨床決策中查找和整合醫(yī)學(xué)知識(shí),進(jìn)而進(jìn)行臨床輔助決策奠定了基礎(chǔ)。下一步工作將基于知識(shí)圖譜開(kāi)發(fā)智能臨床輔助決策系統(tǒng),實(shí)現(xiàn)知識(shí)圖譜的語(yǔ)義搜索與智能問(wèn)答,幫助臨床醫(yī)生提高臨床決策的效率和質(zhì)量。
參考文獻(xiàn)
[1]楊美潔, 熊相超. 基于爬蟲(chóng)技術(shù)和電子病歷的糖尿病知識(shí)圖譜的構(gòu)建[J]. 中國(guó)數(shù)字醫(yī)學(xué), 2020, 2(2): 6-8.
[2]廖浚斌, 周欣, 何小海, 等. 面向涉恐領(lǐng)域的知識(shí)圖譜構(gòu)建方法[J]. 信息技術(shù)與網(wǎng)絡(luò)安全, 2019, 38(9): 34-38.
[3]康準(zhǔn), 王德軍. 基于知識(shí)圖譜的生物學(xué)科知識(shí)問(wèn)答系統(tǒng)[J]. 軟件, 2018, 39(2): 07-11.
[4]王寧. 基于Web的領(lǐng)域知識(shí)圖譜構(gòu)建平臺(tái)的研究與實(shí)現(xiàn)[D]. 北京市: 北京郵電大學(xué), 2019.
[5]Xin-Hong Jia, Wen-Ai song, Wei-Yan li, etc. Semi-automatic Construction Method Of Chronic Obstructive Pulmonary Disease Knowledge Graph[R]. Wisconsin, United States: IEEE 43rd Annual Computer Software and Applications Conference, 2019.
[6]崔潔, 陳德華, 樂(lè)嘉錦. 基于EMR的乳腺腫瘤知識(shí)圖譜構(gòu)建研究[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2017, 34(12): 122-126.
[7]孫鄭煜, 鄂海紅, 宋美娜, 等. 基于大數(shù)據(jù)技術(shù)的醫(yī)學(xué)知識(shí)圖譜構(gòu)建方法[J]. 軟件, 2020, 41(1): 13-17.
[8]曹紅霞, 梁萬(wàn)年. 循證臨床指南的開(kāi)發(fā)程序[J]. 中國(guó)全科醫(yī)學(xué), 2003, 6(4): 342-344.
[9]吳彬飛. 臨床指南知識(shí)表達(dá)與應(yīng)用方法研究[D]. 浙江大學(xué). 2010.
[10]肖仰化等. 知識(shí)圖譜: 概念與技術(shù)[M]. 北京: 電子工業(yè)出版社, 2020. 1: [286].
[11]王書(shū)航, 王潔. 2018年V3版NCCN非小細(xì)胞肺癌指南更新要點(diǎn)解讀[J]. 華西醫(yī)學(xué), 2018, 33(4): 388-392.
[12]胡一然, 宋中山, 孫翀, 等. NVSA: 一種具有可變節(jié)點(diǎn)值的查詢圖搜索算法[J]. 軟件, 2018, 39(3): 16-21.
[13]張玲玉, 尹鴻峰. 基于OAN的知識(shí)圖譜查詢研究[J]. 軟件, 2018, 39(1): 54-59.
[14]中華醫(yī)學(xué)會(huì). 臨床診療指南. 心血管分冊(cè)[M]. 人民衛(wèi)生出版社, 2017.