萬(wàn)潤(rùn)之 孫麗平 王延博 李雅馨
1.長(zhǎng)春中醫(yī)藥大學(xué)醫(yī)藥信息學(xué)院,吉林長(zhǎng)春 130117;2.長(zhǎng)春中醫(yī)藥大學(xué)附屬醫(yī)院兒童診療中心,吉林長(zhǎng)春 130021;3.長(zhǎng)春中醫(yī)藥大學(xué)中西醫(yī)結(jié)合學(xué)院,吉林長(zhǎng)春 130117
20 世紀(jì)90 年代本體概念被引入人工智能、圖書(shū)情報(bào)和知識(shí)工程等領(lǐng)域,一度成為這些領(lǐng)域的熱門(mén)研究課題。近年來(lái),關(guān)于本體理論和技術(shù)的應(yīng)用逐漸擴(kuò)大到醫(yī)學(xué)領(lǐng)域,其關(guān)注度也不斷提升[1]。如朱玲等[2]構(gòu)建了哮喘疾病本體和功能性胃腸病領(lǐng)域本體,對(duì)哮喘領(lǐng)域知識(shí)體系和腸胃病知識(shí)庫(kù)進(jìn)行重新組織和表示,王明強(qiáng)等[3]利用Neo4j 存儲(chǔ)資源描述框架模型,實(shí)現(xiàn)中醫(yī)皮膚病“疾病-證候-治療”領(lǐng)域本體的具體認(rèn)識(shí)及規(guī)范化表達(dá),郭夢(mèng)瑩等[4]利用“領(lǐng)域本體七步法”探討中醫(yī)辨證論治知識(shí)庫(kù)構(gòu)建的應(yīng)用。本體在醫(yī)學(xué)領(lǐng)域的發(fā)展為疾病本體構(gòu)建提供了方法基礎(chǔ)[5-6],對(duì)于不同疾病的病因病機(jī)、發(fā)病機(jī)制、辨證論治、治療方法等的理解與學(xué)習(xí)具有積極意義。
肺炎喘嗽是小兒時(shí)期常見(jiàn)的肺系疾病之一,以發(fā)熱、咳嗽、痰壅、氣急、鼻煽為主要癥狀。清代汪昂《湯頭歌訣·瀉白散》首次提出“肺炎喘嗽”之名[7],對(duì)比西醫(yī)治法,中醫(yī)治法同樣有很好的效果[8]。本研究基于本體構(gòu)建方法構(gòu)建肺炎喘嗽本體知識(shí)庫(kù),并進(jìn)行推理驗(yàn)證,實(shí)現(xiàn)了可視化查詢。
資料來(lái)源包括中醫(yī)兒科學(xué)教材、小兒肺炎喘嗽中醫(yī)診療指南[9]、小兒病毒性肺炎中醫(yī)診療指南[10]、兒童肺炎支原體肺炎中西醫(yī)結(jié)合診治專家共識(shí)[11]以及名老中醫(yī)醫(yī)案[12],術(shù)語(yǔ)的標(biāo)準(zhǔn)化參考中國(guó)中醫(yī)藥學(xué)主題詞表[13]。
使用Protégé 5.5.0 對(duì)網(wǎng)絡(luò)本體語(yǔ)言(ontology web language,OWL)進(jìn)行完整闡述,采用本體構(gòu)建七步法[14]構(gòu)建本體,并使用推理機(jī)Pellet 進(jìn)行一致性檢驗(yàn)。見(jiàn)圖1。
圖1 構(gòu)建肺炎喘嗽本體流程
1.2.1 類和類目 類是本體的核心。圖2 為知識(shí)庫(kù)中抽取的可以用于本體構(gòu)建的肺炎喘嗽的類和類目,該統(tǒng)計(jì)共分為四級(jí)類目,一共7 個(gè)一級(jí)類目,并按從上而下的方法構(gòu)建類和類之間的關(guān)系。
圖2 小兒肺炎喘嗽類目圖
1.2.2 類的屬性 構(gòu)建類的屬性需要區(qū)分類的對(duì)象屬性和數(shù)據(jù)屬性。對(duì)象屬性使用英文表示,并在注釋中添加中文注釋,如“肺part_of(是…的部分)患者”。創(chuàng)建與其相關(guān)的逆屬性(inverse of),如“表現(xiàn)出”(show)和“是...的表現(xiàn)”(reflect),同時(shí)限定其定義域(domain)和值域(range)。構(gòu)建的對(duì)象屬性如表1 所示,在Protégé 中構(gòu)建對(duì)象屬性。數(shù)據(jù)屬性是一個(gè)類或?qū)嵗臄?shù)據(jù)值,如“某兒童的年齡為4 歲,體重17 kg,體溫38℃,血氧飽和度>0.96?!逼渲械膫€(gè)體兒童、體重、身高、脈搏血氧飽和度為實(shí)例的數(shù)據(jù)屬性。圖3 展示了在Protégé 中創(chuàng)建的數(shù)據(jù)屬性、其定義域與數(shù)據(jù)類型,并為其添加備注與定義域、字符串類型標(biāo)識(shí)。
圖3 Protégé 構(gòu)建的數(shù)據(jù)屬性
表1 小兒肺炎喘嗽本體對(duì)象屬性
1.2.3 實(shí)例 實(shí)例也稱個(gè)體,是指類的成員個(gè)體。例如圖4 在對(duì)象屬性欄中選擇“has component”(由…組成)與每一項(xiàng)組成方劑的中藥相聯(lián)系,在數(shù)據(jù)屬性欄選擇“method of foumula”(方劑使用方法)和“strength of recommand”(推薦度)兩個(gè)屬性,并為其添加“日1 劑,水煎服,早晚分服,每次25~40 ml”和“強(qiáng)推薦”的屬性,在注釋欄添加加減情況,這樣就構(gòu)成了“銀翹散合麻杏石甘湯”的實(shí)例。
1.2.4 一致性檢驗(yàn) 本體推理檢驗(yàn)是判斷類的從屬關(guān)系是否正確,實(shí)例是否屬于該類,如本體具有一致性,則會(huì)根據(jù)語(yǔ)義關(guān)系推理出“中藥”沒(méi)有設(shè)置的屬性,如果不具有內(nèi)在邏輯的一致性,則會(huì)報(bào)錯(cuò)。使用推理機(jī)插件Pellet 進(jìn)行推理檢驗(yàn),根據(jù)推理得出,中藥類中的實(shí)例“連翹”組成了“三拗湯合蔥豉湯”和“銀翹散合麻杏石甘湯”,該本體通過(guò)了內(nèi)部的一致性檢驗(yàn)。見(jiàn)圖5。
1.3.1 工具 Protégé 自帶的可視化功能易造成圖像重疊[15],并且不適合復(fù)雜網(wǎng)絡(luò)的可視化,數(shù)據(jù)驅(qū)動(dòng)文檔(data-driven documents,D3.js)庫(kù)是一個(gè)基于數(shù)據(jù)的JavaScript 庫(kù)[16],能高效地操作基于數(shù)據(jù)的Web 文檔,實(shí)現(xiàn)數(shù)據(jù)可視化。WebVOWL 是一款本體可視化編輯器[17],本研究使用D3.js 庫(kù),并將本體通過(guò)WebVOWL展示。
1.3.2 可視化方法 使用Java 開(kāi)發(fā)工具包并為其配置環(huán)境變量,將Protégé 中構(gòu)建的本體文件導(dǎo)出為OWL文件格式[18-20],使用Java 項(xiàng)目管理工具M(jìn)aven[21-22]構(gòu)建肺炎喘嗽本體項(xiàng)目的Jar 包。最后,在命令中部署好D3.js[23-24]包,將json 的本體文件導(dǎo)入WebVOWL 中完成可視化。
1.3.3 可視化結(jié)果 肺炎喘嗽本體類和類目可視化的結(jié)果如圖6 所示,圖中肺炎喘嗽為中心,線段上的注釋為本體的對(duì)象屬性,灰色圖塊的注釋為數(shù)據(jù)屬性和數(shù)據(jù)類型,“Thing”為實(shí)例的集合。部分肺炎喘嗽本體實(shí)例的可視化結(jié)果如圖7 所示,圖中可以清晰看出類、實(shí)例的關(guān)系,如中醫(yī)證型-常證-風(fēng)熱閉肺證、方劑-銀翹散合麻杏石甘湯、中成藥-小兒肺熱咳喘顆粒之中,可看出證型和方劑、中成藥的聯(lián)系。
圖6 肺炎喘嗽本體類和類目可視化圖譜
圖7 肺炎喘嗽實(shí)例可視化圖
在兒科領(lǐng)域乃至中醫(yī)領(lǐng)域都較缺乏本體技術(shù)、計(jì)算機(jī)語(yǔ)言等新興應(yīng)用的研究。構(gòu)建小兒肺炎喘嗽本體知識(shí)庫(kù)難點(diǎn)在于對(duì)眾多權(quán)威診療資料、多版本教材中信息的提取,在如何利用本體和計(jì)算機(jī)技術(shù)相結(jié)合上提供技術(shù)支持。
本研究采用本體工具Protégé,使用OWL 語(yǔ)言定義、整理小兒肺炎喘嗽專家診療指南等權(quán)威資料提取出的31 個(gè)類、17 個(gè)對(duì)象屬性和6 個(gè)數(shù)據(jù)屬性,并可以自主的為其添加實(shí)例,類和實(shí)例都有明確的定義,并通過(guò)本體一致性檢驗(yàn),使用Java 程序語(yǔ)言的D3.js 庫(kù)實(shí)現(xiàn)可視化功能和交互功能,通過(guò)創(chuàng)建的本體規(guī)則進(jìn)行本體推理或?yàn)槠涮砑有碌膶?shí)例,可以通過(guò)推理得出新的規(guī)則。
本研究在實(shí)現(xiàn)知識(shí)數(shù)據(jù)結(jié)構(gòu)的標(biāo)準(zhǔn)化和規(guī)范化的基礎(chǔ)上展望未來(lái),將來(lái)可以發(fā)展成為檢索、推薦、問(wèn)答和決策服務(wù)等各種語(yǔ)義服務(wù)的主要知識(shí)庫(kù),并在未來(lái)形成兒科系統(tǒng)疾病本體、兒科疾病專家診療系統(tǒng)等。