国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

ISO技術(shù)規(guī)范“中醫(yī)藥學(xué)語言系統(tǒng)語義網(wǎng)絡(luò)框架”的應(yīng)用研究

2016-11-19 23:47于彤崔蒙李海燕
中國醫(yī)藥導(dǎo)報(bào) 2016年4期
關(guān)鍵詞:本體標(biāo)準(zhǔn)化

于彤 崔蒙 李海燕 等

[摘要] 中醫(yī)藥學(xué)語言系統(tǒng)是一個(gè)采用本體方法構(gòu)建的大型術(shù)語系統(tǒng)?!爸嗅t(yī)藥學(xué)語言系統(tǒng)語義網(wǎng)絡(luò)框架”已于2014年成為國際標(biāo)準(zhǔn)化組織(ISO)的一項(xiàng)正式的技術(shù)規(guī)范,如何實(shí)施這一技術(shù)規(guī)范成為一個(gè)重要的問題。本研究采用語義網(wǎng)技術(shù),根據(jù)該技術(shù)規(guī)范構(gòu)建中醫(yī)藥領(lǐng)域的頂層本體,并進(jìn)一步實(shí)現(xiàn)了用于本體發(fā)布的網(wǎng)絡(luò)服務(wù)。該本體對(duì)中醫(yī)藥領(lǐng)域最基本的語義類型和語義關(guān)系進(jìn)行了精確描述,可被用于構(gòu)建符合規(guī)范的術(shù)語系統(tǒng)和知識(shí)庫,為ISO技術(shù)規(guī)范的推廣應(yīng)用提供了一種便捷、可靠的方式。

[關(guān)鍵詞] 中醫(yī)藥學(xué)語言系統(tǒng);本體;標(biāo)準(zhǔn)化;語義網(wǎng)

[中圖分類號(hào)] R2-03 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673-7210(2016)02(a)-0089-04

Research on the application of ISO technical specification “semantic network framework of traditional Chinese medicine language system”

YU Tong CUI Meng LI Haiyan LIU Jing YANG Shuo JIA Lirong

Information Institute of Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China

[Abstract] Traditional Chinese medicine language system is a large-scale ontology for traditional Chinese medicine (TCM) domain. In 2014, international organization for standardization (ISO) published a technical specification named “semantic network framework of traditional Chinese medicine language system”, how to implement this technical specification remains to be an important problem. This study utilizes semantic web technologies, to translate the content of this specification into an upper-level ontology, and to establish a web service for the ontology. This ontology accurately describes the fundamental semantic types and semantic relations in TCM domain, which can be used to construct standardized language systems and knowledge bases, and provides a convenient and reliable way for the application of this technical specification.

[Key words] Traditional Chinese medicine language system; Ontology; Standardization; Semantic web

近年來,本體(ontology)因其強(qiáng)大的知識(shí)表示和推理能力成為構(gòu)建中醫(yī)藥術(shù)語系統(tǒng)的一項(xiàng)新興技術(shù)[1]。作為一項(xiàng)代表性工作,中醫(yī)藥學(xué)語言系統(tǒng)(traditional Chinese medicine language system,TCMLS)是根據(jù)中醫(yī)藥領(lǐng)域的語言特點(diǎn)及學(xué)科體系特色,采用本體的設(shè)計(jì)理念和方法研制而成的大型術(shù)語系統(tǒng)[2]。TCMLS的語義網(wǎng)絡(luò)框架(以下簡稱“TCMLS-SN”)定義了中醫(yī)藥領(lǐng)域最基本的語義類型(semantic type)和語義關(guān)系(semantic relation),為TCMLS的構(gòu)建提供了必要的參考和約束[3]。

經(jīng)過中醫(yī)藥工作者的反復(fù)論證與修改,TCMLS-SN已于2014年7月成為國際標(biāo)準(zhǔn)化組織(ISO)的一項(xiàng)正式的技術(shù)規(guī)范:“ISO/TS17938 health informatics-semantic network framework of traditional Chinese medicine language system(中醫(yī)藥學(xué)語言系統(tǒng)語義網(wǎng)絡(luò)框架)”[4]。它為TCMLS中的所有概念提供了一體化的概念框架,對(duì)于TCMLS的規(guī)范化和國際化具有重要意義[5]。新興的語義網(wǎng)(semantic web)技術(shù)[6]為該規(guī)范的實(shí)施提供了理想的技術(shù)平臺(tái)。下面討論ISO技術(shù)規(guī)范在語義網(wǎng)環(huán)境中的實(shí)施方法,闡述本體的構(gòu)建過程以及配套的網(wǎng)絡(luò)服務(wù)。

1 ISO技術(shù)規(guī)范在語義網(wǎng)環(huán)境中的實(shí)施

在這一ISO技術(shù)規(guī)范中,列舉了中醫(yī)藥領(lǐng)域中的96種語義類型和58種語義關(guān)系,并對(duì)它們進(jìn)行了定義和說明。其中,“中醫(yī)藥語義類型”[7]是在語義層面上對(duì)中醫(yī)藥領(lǐng)域概念進(jìn)行分類的語義類型系統(tǒng),它為中醫(yī)藥領(lǐng)域概念提供了一個(gè)系統(tǒng)性的分類架構(gòu);“中醫(yī)藥語義關(guān)系”[8]則是對(duì)中醫(yī)藥概念之間的語義相關(guān)性的表征,它用于將中醫(yī)藥領(lǐng)域概念關(guān)聯(lián)起來,構(gòu)成一張大型的復(fù)雜語義網(wǎng)絡(luò)。ISO技術(shù)規(guī)范為中醫(yī)藥術(shù)語系統(tǒng)的規(guī)范化加工和處理提供了依據(jù),將在中醫(yī)藥術(shù)語系統(tǒng)的質(zhì)量保證和國際推廣工作中發(fā)揮關(guān)鍵作用。

在ISO技術(shù)規(guī)范發(fā)布之后,如何實(shí)施該技術(shù)規(guī)范成為一個(gè)重要的問題。在中醫(yī)藥領(lǐng)域,已建成了TCMLS、中醫(yī)臨床術(shù)語系統(tǒng)[9]、中醫(yī)古籍語言系統(tǒng)[10]等許多大型的術(shù)語系統(tǒng),它們都不完全符合ISO技術(shù)規(guī)范。為了實(shí)現(xiàn)這些系統(tǒng)的規(guī)范化,需要對(duì)它們進(jìn)行審校和修訂。單靠領(lǐng)域?qū)<疫M(jìn)行人工作業(yè),工作量很大且難免出現(xiàn)疏漏,術(shù)語系統(tǒng)規(guī)范化的操作成本很高。若能基于機(jī)器推理等技術(shù)手段,實(shí)現(xiàn)半自動(dòng)甚至自動(dòng)化的規(guī)范性檢測和規(guī)范化工具,輔助領(lǐng)域?qū)<疫M(jìn)行審校和修訂工作,則可顯著提升術(shù)語系統(tǒng)規(guī)范化的效率。本體能使計(jì)算機(jī)“理解”領(lǐng)域知識(shí)并具備一定的推理能力[11],為實(shí)現(xiàn)上述技術(shù)策略奠定了基礎(chǔ)。

ISO技術(shù)規(guī)范有利于中醫(yī)藥領(lǐng)域的術(shù)語系統(tǒng)的規(guī)范化,使術(shù)語系統(tǒng)可以彼此兼容。然而,ISO技術(shù)規(guī)范以自然語言描述,機(jī)器無法直接識(shí)別和處理。為解決這個(gè)問題,可將ISO技術(shù)規(guī)范“翻譯”為一個(gè)計(jì)算機(jī)可理解的頂層本體,再基于本體推理方法實(shí)現(xiàn)半自動(dòng)的規(guī)范性檢測機(jī)制,并將這套機(jī)制嵌入術(shù)語加工系統(tǒng)中發(fā)揮實(shí)際作用?;诒倔w的技術(shù)方案可提升術(shù)語審校工作的自動(dòng)化水平,縮短術(shù)語系統(tǒng)的更新周期,提升術(shù)語系統(tǒng)之間的兼容性。

語義網(wǎng)為實(shí)現(xiàn)上述思路提供了理想的技術(shù)手段[6]。萬維網(wǎng)之父Tim Berners-Lee于2001年提出了語義網(wǎng)的理念,認(rèn)為它將是一部人類與機(jī)器都能理解的“數(shù)據(jù)百科全書”,其中蘊(yùn)含著極其豐富且相互關(guān)聯(lián)的數(shù)據(jù)資源,能顯著提升機(jī)器的數(shù)據(jù)處理能力[12]。經(jīng)過十余年的發(fā)展,語義網(wǎng)建設(shè)取得了長足發(fā)展,制訂了RDF、OWL、SPARQL等一系列基礎(chǔ)性規(guī)范,使語義網(wǎng)從一個(gè)構(gòu)想發(fā)展為一套完整的技術(shù)體系[13]。語義網(wǎng)在生物醫(yī)學(xué)領(lǐng)域的本體工程、數(shù)據(jù)集成和知識(shí)管理中發(fā)揮了積極的作用[14]。語義網(wǎng)在中醫(yī)藥領(lǐng)域中也得到了成功的應(yīng)用,為知識(shí)建模、知識(shí)融合和知識(shí)發(fā)現(xiàn)提供了有效的技術(shù)手段[15]。

萬維網(wǎng)本體語言(web ontology language,OWL)是語義網(wǎng)中的一項(xiàng)核心技術(shù),旨在構(gòu)建內(nèi)容豐富、邏輯嚴(yán)謹(jǐn)且能在萬維網(wǎng)上共享的領(lǐng)域本體[16]。在生物醫(yī)學(xué)領(lǐng)域,將傳統(tǒng)的本體或術(shù)語系統(tǒng)轉(zhuǎn)換為OWL形式的本體并在語義網(wǎng)上發(fā)布,已成為本體工程的一個(gè)重要趨勢(shì)[17]。OWL在中醫(yī)藥領(lǐng)域也得到了成功應(yīng)用,為表達(dá)復(fù)雜的中醫(yī)藥知識(shí)體系提供了解決方案[18]。語義網(wǎng)為本體工程提供了表示語言、編輯工具及強(qiáng)大的推理機(jī)制,能有效支持對(duì)本體進(jìn)行一致性檢測,減少本體的冗余,改進(jìn)本體的質(zhì)量。鑒于此,本研究采用語義網(wǎng)技術(shù),根據(jù)ISO技術(shù)規(guī)范構(gòu)建了中醫(yī)藥領(lǐng)域的頂層本體。該本體可被用于構(gòu)建符合ISO技術(shù)規(guī)范的術(shù)語系統(tǒng)和知識(shí)庫,為建立網(wǎng)絡(luò)化的中醫(yī)藥術(shù)語服務(wù)平臺(tái)奠定基礎(chǔ)。

2 中醫(yī)藥頂層本體

近年來,本體技術(shù)在中醫(yī)藥領(lǐng)域中得到了成功的應(yīng)用[1]。本體的構(gòu)建實(shí)質(zhì)上是針對(duì)中醫(yī)藥領(lǐng)域的概念化過程。本研究采用OWL語言來構(gòu)建中醫(yī)藥頂層本體,從而對(duì)ISO技術(shù)規(guī)范中規(guī)定的頂層概念模型進(jìn)行形式化表達(dá)。通過與領(lǐng)域?qū)<业慕涣髋c合作,獲取ISO技術(shù)規(guī)范的確切解釋和相關(guān)領(lǐng)域知識(shí),解決本體構(gòu)建中涉及的知識(shí)建模問題,從而建成符合ISO技術(shù)規(guī)范以及中醫(yī)藥領(lǐng)域?qū)嶋H情況的頂層本體。

這個(gè)頂層本體對(duì)中醫(yī)藥領(lǐng)域中最基本的語義類型和語義關(guān)系進(jìn)行定義、描述和限定。其中,語義類型對(duì)應(yīng)于OWL語言中的類型(class);語義關(guān)系對(duì)應(yīng)于OWL語言中的屬性(property)。該本體的主要內(nèi)容包括:①對(duì)類型和屬性進(jìn)行定義和描述;②建立類型的層次結(jié)構(gòu),對(duì)類型之間的關(guān)系進(jìn)行描述和限定;③明確屬性之間的互逆關(guān)系,詮釋屬性的傳遞性、函數(shù)性、反函數(shù)性等性質(zhì);④對(duì)屬性的定義域和值域進(jìn)行約束。

本研究采用Protégé[19]本體編輯工具構(gòu)建這個(gè)頂層本體。Protégé是一個(gè)被廣泛使用的開源本體編輯工具,對(duì)OWL等語義網(wǎng)語言提供了完整的支持。如圖1所示,采用Protégé本體編輯工具,將技術(shù)規(guī)范的核心內(nèi)容都寫入一個(gè)OWL本體之中。該過程分如下步驟:①將ISO規(guī)范中定義的語義類型加入OWL本體,并建立它們之間的層次關(guān)系。將“syndrome(證候)”等語義類型聲明為OWL class,并通過sub class of聲明父子類關(guān)系。②將ISO規(guī)范中定義的語義關(guān)系加入OWL本體,建立它們之間的層次關(guān)系。將“l(fā)ocation of(位于...)”等語義關(guān)系定義為OWL本體中的object property,并通過sub property of定義父子屬性關(guān)系。③按照ISO規(guī)范文本添加類型和屬性的中、英文標(biāo)簽和說明。④在語義類型之下建立實(shí)例(例如“中藥”下的“人參”),再使用本體中定義的語義關(guān)系將這些實(shí)例關(guān)聯(lián)起來。

在本體建成后,由領(lǐng)域?qū)<以u(píng)估該頂層本體的邏輯嚴(yán)謹(jǐn)性,從而保證本體的質(zhì)量??捎肞rotégé等工具對(duì)該本體進(jìn)行瀏覽和編輯,查看類型、屬性和實(shí)例的信息;可用OntoGraf等[20]本體可視化工具查看類型以及實(shí)體之間的語義關(guān)系;也可用Pellet等[21]推理機(jī)進(jìn)行本體推理實(shí)驗(yàn)??苫谠摫倔w,進(jìn)行術(shù)語系統(tǒng)以及領(lǐng)域知識(shí)庫的加工工作,所得的系統(tǒng)將符合ISO規(guī)范。由于ISO規(guī)范的內(nèi)容體現(xiàn)在了OWL本體中,Protégé的工作機(jī)制就保證了數(shù)據(jù)的規(guī)范性。各方可基于該本體分別進(jìn)行數(shù)據(jù)加工,并將做出的系統(tǒng)在網(wǎng)上發(fā)布。這些系統(tǒng)將彼此兼容,可被任何支持該ISO規(guī)范的程序“理解”和使用。

3 本體網(wǎng)絡(luò)服務(wù)

為促進(jìn)ISO技術(shù)規(guī)范和本體的推廣使用,采用PHP編程語言搭建了本體服務(wù)網(wǎng)站,部署于Apache萬維網(wǎng)服務(wù)器中[22]。該網(wǎng)站包括內(nèi)容概覽、本體描述、更新和擴(kuò)展、主要模塊、相關(guān)標(biāo)準(zhǔn)、類和屬性列表、例子、相關(guān)參考文獻(xiàn)等內(nèi)容,還實(shí)現(xiàn)了本體文件下載、語義類型展示、語義關(guān)系展示以及實(shí)例展示等功能。下面進(jìn)行具體介紹:①語義類型展示:列出ISO技術(shù)規(guī)范中定義的語義類型,給出語義類型的中英文標(biāo)簽、中英文定義、中英文注釋、父類、子類、實(shí)例等。②語義關(guān)系展示:列出ISO技術(shù)規(guī)范中定義的語義關(guān)系,給出語義關(guān)系的中英文標(biāo)簽、中英文定義、中英文注釋、父屬性、子屬性、定義域、值域等。③實(shí)例展示:提供一個(gè)示例性知識(shí)庫,它定義了四君子湯、人參、白術(shù)等一些實(shí)例,并描述了這些實(shí)例的中英文標(biāo)簽、類型、語義關(guān)系等信息,用于演示該本體的應(yīng)用。

該網(wǎng)站面向中醫(yī)藥工作者以及信息標(biāo)準(zhǔn)研制人員提供術(shù)語和本體的訪問服務(wù),便于用戶瀏覽TCMLS-SN的內(nèi)容,并獲取中醫(yī)藥領(lǐng)域的頂層本體。任何人只要從網(wǎng)站上下載本體,用Protégé等工具打開,即可開始編輯符合ISO技術(shù)規(guī)范的語義數(shù)據(jù);也可利用語義網(wǎng)上的其他工具來處理該本體,實(shí)施ISO技術(shù)規(guī)范。

4 小結(jié)

術(shù)語系統(tǒng)的研制是中醫(yī)藥信息標(biāo)準(zhǔn)化工作的重點(diǎn)之一。TCMLS是采用本體方法構(gòu)建大型術(shù)語系統(tǒng)的一個(gè)成功范例,其設(shè)計(jì)理念和方法具有國際推廣價(jià)值。TCMLS的語義網(wǎng)絡(luò)框架已于2014年成為ISO的一項(xiàng)正式的技術(shù)規(guī)范。該技術(shù)規(guī)范不僅規(guī)范和支持了TCMLS的建設(shè),還為中醫(yī)藥學(xué)術(shù)語系統(tǒng)和本體創(chuàng)建提供了語義標(biāo)準(zhǔn),對(duì)中醫(yī)藥學(xué)術(shù)語信息的交換具有重要意義。本研究實(shí)質(zhì)上是將ISO技術(shù)規(guī)范轉(zhuǎn)換為可計(jì)算模型的過程,其結(jié)果是一個(gè)規(guī)范化的中醫(yī)藥頂層本體。該本體及與之配套的網(wǎng)絡(luò)服務(wù),為ISO規(guī)范的推廣使用提供了一種便捷、可靠的方式。

[參考文獻(xiàn)]

[1] 于彤,崔蒙,李敬華,等.中醫(yī)藥本體工程研究現(xiàn)狀[J].中國中醫(yī)藥信息雜志,2013,20(7):110-112.

[2] 賈李蓉,于彤,崔蒙,等.中醫(yī)藥學(xué)語言系統(tǒng)研究進(jìn)展[J].中國數(shù)字醫(yī)學(xué),2014,9(10):57-59,62.

[3] Cui M,Jia LR,Yu T,et al. Current status of traditional Chinese medicine language system [C]// International Symposium on IT in Medicine and Education(ITME2013),Xining,China,July 1921. Berlin Heidelberg:Springer,2013: 413-420.

[4] 于彤,崔蒙,李海燕,等.中醫(yī)藥學(xué)語言系統(tǒng)的語義網(wǎng)絡(luò)框架:一個(gè)面向中醫(yī)藥領(lǐng)域的規(guī)范化頂層本體[J].中國數(shù)字醫(yī)學(xué),2014,9(1):44-47.

[5] 賈李蓉,于彤,李海燕,等.中醫(yī)藥語義網(wǎng)絡(luò)的頂層框架研究[J].中國數(shù)字醫(yī)學(xué),2015,10(3):54-57.

[6] Horrocks I. Ontologies and the semantic web [J]. Communications of the ACM,2008,51(12):58-67.

[7] 賈李蓉,董燕,田野,等.中醫(yī)藥學(xué)語言系統(tǒng)中的語義類型分析[J].世界中醫(yī)藥,2013,8(5):563-565.

[8] 于彤,賈李蓉,張竹綠,等.面向中醫(yī)藥文獻(xiàn)的語義關(guān)系發(fā)現(xiàn)方法研究[J].中國中醫(yī)藥圖書情報(bào)雜志,2014,38(12):1-5.

[9] 董燕,李海燕,崔蒙,等.中醫(yī)臨床術(shù)語系統(tǒng)建設(shè)概況與改進(jìn)措施[J].醫(yī)學(xué)信息學(xué)雜志,2014,35(8):43-48.

[10] 朱玲,尹愛寧,崔蒙,等.中醫(yī)古籍語言系統(tǒng)構(gòu)建的關(guān)鍵問題與對(duì)策[J].中國中醫(yī)藥信息雜志,2010,17(4):98-99.

[11] Gruber TR. A translation approach to portable ontology specifications [J]. Knowledge Acquisition,1993,5(2):199-220.

[12] Berners-Lee T,Hendler J,Lassila O. The semantic web [J]. Scientific American,2001,284(5):28-37.

[13] Feigenbaum L,Herman I,Hongsermeier T,et al. The semantic web in action [J]. Scientific American,2007,297(6):90-97.

[14] Chen H,Ding L,Wu Z,et al. Semantic web for integrated network analysis in biomedicine [J]. Briefings in Bioinformatics,2009,10(2):177-192.

[15] 于彤,崔蒙,李敬華.語義Web在中醫(yī)藥領(lǐng)域的應(yīng)用研究綜述[J].世界中醫(yī)藥,2013,8(1):107-109.

[16] Horrocks I,Patel-Schneider PF,Harmelen F. From SHIQ and RDF to OWL:the making of a web ontology language [J]. Web Semantics:Science,Services and Agents on the World Wide Web,2003,1(1):7-26.

[17] 于彤,崔蒙,楊碩,等.生物醫(yī)學(xué)本體工程進(jìn)展[J].中國數(shù)字醫(yī)學(xué),2012,7(11):3-6.

[18] 于彤,楊碩,賈李蓉,等.基于OWL的中醫(yī)證候知識(shí)建模方法研究[J].中國數(shù)字醫(yī)學(xué),2014,9(10):76-78,81.

[19] Knublauch H,F(xiàn)ergerson RW,Noy NF,et al. The Protégé OWL plugin:an open development environment for semantic web applications[C]// McIlraith SA,Plexousakis D,Harmelen F. Third International Semantic Web Conference. Berlin Heidelberg:Springer,2004:229-243.

[20] Sean Falconer. OntoGraf [EB/OL]. Stanford,California,USA:Stanford University,2010 [2015-7-23]. http://protegewiki.stanford.edu/wiki/OntoGraf.

[21] Sirin E,Parsia B,Grau BC,et al. Pellet:a practical OWL-DL reasoned [J]. Web Semantics:Science,Services and Agents on the World Wide Web,2007,5(2):51-53.

[22] The Apache Software Foundation. The Apache HTTP Server Project [EB/OL]. Los Angeles,USA:The Apache Software Foundation,1999.[2015-07-20]. http://httpd.apache.org/.

(收稿日期:2015-07-28 本文編輯:張瑜杰)

猜你喜歡
本體標(biāo)準(zhǔn)化
Abstracts and Key Words
標(biāo)準(zhǔn)化簡述
對(duì)姜夔自度曲音樂本體的現(xiàn)代解讀
企業(yè)標(biāo)準(zhǔn)化管理信息系統(tǒng)
標(biāo)準(zhǔn)化是綜合交通運(yùn)輸?shù)谋U稀庾x《交通運(yùn)輸標(biāo)準(zhǔn)化體系》
基于本體的機(jī)械產(chǎn)品工藝知識(shí)表示
《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
以標(biāo)準(zhǔn)化引領(lǐng)科技創(chuàng)新
論汽車維修診斷標(biāo)準(zhǔn)化(上)
交通運(yùn)輸標(biāo)準(zhǔn)化
墨竹工卡县| 泽普县| 吴江市| 滦南县| 崇州市| 克什克腾旗| 华池县| 桐乡市| 晴隆县| 托克逊县| 苏尼特右旗| 崇义县| 从化市| 甘洛县| 枣强县| 青浦区| 吉林省| 阜南县| 长治市| 外汇| 呼图壁县| 托克逊县| 永川市| 垦利县| 桦甸市| 麦盖提县| 台前县| 嘉义县| 威海市| 突泉县| 宁津县| 吴忠市| 肥东县| 靖边县| 赤城县| 蚌埠市| 霍邱县| 德庆县| 三明市| 乌兰察布市| 博兴县|