帕爾哈提·吐尼牙孜
摘要:隨著科學(xué)技術(shù)的快速發(fā)展,知識圖譜的構(gòu)建也受到了越來越人的重視,并為廣泛應(yīng)用到了各行各業(yè),取得了非常優(yōu)異的成果。然而,通過對實(shí)際情況進(jìn)行分析可以發(fā)現(xiàn),知識圖譜在醫(yī)學(xué)領(lǐng)域方面的應(yīng)用卻還存在著像是拓展性差、限制多以及效率多等問題,對其作用發(fā)揮造成了非常大的消極影響。在這種背景下,要想將知識圖譜的作用更大程度地發(fā)揮出來,為醫(yī)學(xué)事業(yè)的發(fā)展提供更有力的支持和保障,相關(guān)人員必須要跟上時(shí)代發(fā)展的腳步,采用自上而下的方式展開對相關(guān)技術(shù)的全面解析,這樣才可以構(gòu)建出一個(gè)更為科學(xué)合理的醫(yī)學(xué)領(lǐng)域知識圖譜,為相關(guān)工作的順利展開提供更有力的支持和保障。鑒于這種情況,該文首先詳細(xì)分析了醫(yī)學(xué)知識圖譜構(gòu)建的方法,最后以此為基礎(chǔ)提出了幾點(diǎn)有效應(yīng)用醫(yī)學(xué)知識圖譜的策略。
關(guān)鍵詞:醫(yī)學(xué)領(lǐng)域;知識圖譜;構(gòu)建技術(shù)
中圖分類號:TP399 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2020)08-0201-03
自從2012年知識圖譜被提出以后開始就獲得了突飛猛進(jìn)的發(fā)展,并被廣泛應(yīng)用到了各個(gè)領(lǐng)域當(dāng)中,取得了非常優(yōu)異的成果。但是,到現(xiàn)在為止,知識圖譜在醫(yī)學(xué)領(lǐng)域當(dāng)中應(yīng)用卻還有一定問題存在。并且隨著信息技術(shù)的快速發(fā)展,各種和醫(yī)學(xué)相關(guān)的網(wǎng)絡(luò)非結(jié)構(gòu)化數(shù)據(jù)更是正在以指數(shù)級的速度快速增加,這里面更是包涵了非常多還沒有被挖掘出來的醫(yī)學(xué)方面知識。在當(dāng)前這個(gè)新的發(fā)展時(shí)代,通過人工智能技術(shù)的有效利用以及借鑒專家經(jīng)驗(yàn)進(jìn)行知識圖譜構(gòu)建,可以將醫(yī)學(xué)實(shí)體之間存在的潛在聯(lián)系更為充分的挖掘出來,切實(shí)做好數(shù)據(jù)反哺工作,為臨床決策以及循證醫(yī)學(xué)的進(jìn)一步發(fā)展和醫(yī)患人員工作效率提高起到更大的推動作用。所以,本文展開基于醫(yī)學(xué)領(lǐng)域的知識圖譜探究有著重要的現(xiàn)實(shí)意義。
1 醫(yī)學(xué)知識圖譜構(gòu)建的方法
1.1醫(yī)學(xué)知識表示
所謂知識表示實(shí)際上指的就是相關(guān)人員為了對世界進(jìn)行描述所做出的約定,屬于一個(gè)推動知識模式化、形式化以及符號化發(fā)展的重要過程。其表示方式會對系統(tǒng)的知識獲得、儲存以及運(yùn)用效率都造成非常大的影響[1]。但是,醫(yī)學(xué)數(shù)據(jù)擁有儲存方式不同、電子病歷標(biāo)準(zhǔn)和格式不同、會頻繁遇到交叉領(lǐng)域以及種類繁雜等特征,造成了其和其余領(lǐng)域的知識表示出現(xiàn)了比較大的差異,給知識表示工作的順利展開帶去了非常大的挑戰(zhàn)。在早期階段,在進(jìn)行醫(yī)學(xué)知識圖譜構(gòu)建的時(shí)候,常用的知識表示方法主要有框架表示法、語義網(wǎng)表示法、產(chǎn)生式表示法以及謂詞邏輯表示法等幾種。但是,隨著時(shí)代的快速發(fā)展[2],知識圖譜中所蘊(yùn)含的知識量也越來越龐大,關(guān)系相對來講也更加復(fù)雜,這也就造成了其表示能力極度缺少靈活性,并且能力非常有限,只能用作醫(yī)學(xué)知識的補(bǔ)充和輔助,并不屬于最主要的知識表示方法。同時(shí),知識圖譜所蘊(yùn)含的節(jié)點(diǎn)數(shù)量情況更是對推理工作的難度效率以及網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜程度都有著非常密切的聯(lián)系[3]。通過機(jī)器的有效利用進(jìn)行知表示學(xué)習(xí)不僅僅可以使數(shù)據(jù)稀疏問題得到有效解決,提高推理性能以及知識融合度,更好地完成人腦模仿,從更多的維度完成對象語義信息的展示。除此之外,知識表示學(xué)習(xí)中的代表模型主要有隱變量模型[4]、單層神經(jīng)網(wǎng)絡(luò)模型以及結(jié)構(gòu)表示法等幾種。這些模型充分考慮到了實(shí)體之間的計(jì)算開銷以及協(xié)同性,并且可以使用向量對實(shí)體進(jìn)行表示,而且還可以完成實(shí)體關(guān)系以及向量矩陣變換的有效表示,得出實(shí)體之間所存在的相關(guān)性口],從而為后續(xù)的推理以及知識補(bǔ)全提供更有力的支持和保障。
1.2醫(yī)學(xué)知識抽取
所謂醫(yī)學(xué)知識圖譜構(gòu)建實(shí)際上指的就是通過人工或者自動等方式在非結(jié)構(gòu)化數(shù)據(jù)當(dāng)中進(jìn)行實(shí)體、關(guān)系以及屬性的提取。其中,人工提取指的就是相關(guān)工作人員以相關(guān)規(guī)則為依據(jù)進(jìn)行信息知識的提取[6],現(xiàn)在常見的以人工方式構(gòu)建的醫(yī)學(xué)知識庫主要包涵了臨床醫(yī)學(xué)知識庫以及ICD-10等幾種。而自動提取指的則是相關(guān)工作人員通過機(jī)器、數(shù)據(jù)挖掘以及人工智能等技術(shù)展開信息抽取,并在數(shù)據(jù)源里面完成知識圖譜所具備基礎(chǔ)組成元素的自動提取以及醫(yī)學(xué)知識庫的自動構(gòu)建,最典型的例子就是UMLS這個(gè)一體化的醫(yī)學(xué)語言系統(tǒng)。和自動提取相比,人工提取需要花費(fèi)更多的時(shí)間、成本以及精力[7]。所以,自動提取已經(jīng)成了人們展開研究的重點(diǎn)方向。也正是因?yàn)槿绱?,相關(guān)工作人員應(yīng)該從實(shí)體、關(guān)系以及屬性等多個(gè)方面展開數(shù)據(jù)的自動抽取,這樣才可以更加高效地完成醫(yī)學(xué)知識抽取工作,為醫(yī)學(xué)知識圖譜的構(gòu)建夯實(shí)根基。
1.3醫(yī)學(xué)知識融合
知識融合屬于層次非常高的知識組織,可以把來源不同的知識放在相同框架規(guī)范當(dāng)中完成數(shù)據(jù)的整合、消歧、更新、加工以及推理驗(yàn)證等工作。推動醫(yī)學(xué)知識融合的主要目標(biāo)就是有效解決知識復(fù)用所存在的問題,以此來提高知識庫內(nèi)部當(dāng)中所存在的表達(dá)能力以及邏輯性。同時(shí),根據(jù)知識圖譜里面知識對象的粒度不同,知識融合可以分成知識庫融合以及實(shí)體對齊等兩種[8];首先,在醫(yī)療知識圖譜當(dāng)中,知識來源非常多樣化,這也就造成了知識出現(xiàn)了關(guān)聯(lián)模糊、質(zhì)量參差不齊以及重復(fù)等問題。并且在不同數(shù)據(jù)源里面醫(yī)學(xué)實(shí)體更是有著極為惡劣的多元指代問題存在?,F(xiàn)在當(dāng)今世界常用的對齊算法主要有成對以及實(shí)體兩種。其中前者考慮的只有實(shí)例及其屬性的相似度[9],雖然擁有比較客觀的運(yùn)行速度以及召回率,但是精確度卻相對較差。而后者則可以利用不同的匹配決策對實(shí)體相似度進(jìn)行調(diào)整,更加符合大規(guī)模知識庫的實(shí)際需要。然而,要想將其作用充分發(fā)揮出來,必須要展開人工干預(yù)[10];其次,在推動知識庫融合的過程中。由于實(shí)際需要以及設(shè)計(jì)理念有區(qū)別存在,這也就造成了知識庫里面的數(shù)據(jù)有異構(gòu)性以及多樣性存在。同時(shí),又因?yàn)獒t(yī)療知識非常龐雜[11],絕大多數(shù)的知識庫都是以某類疾病、藥物以及科室進(jìn)行構(gòu)建的,需要進(jìn)行不斷地更新優(yōu)化,并以此為基礎(chǔ)推動知識圖譜的不斷更新迭代。
1.4 醫(yī)學(xué)知識推理
推理實(shí)際上指的就是從現(xiàn)有知識當(dāng)中進(jìn)行隱含信息的深入挖掘。而知識推理實(shí)際上更為重視知識方法的運(yùn)用以及選擇[12],應(yīng)該盡可能降低人工參與的頻率,并完成缺失事實(shí)的準(zhǔn)確推出,提升問題解決質(zhì)量[13]。特別是在進(jìn)行醫(yī)學(xué)知識圖譜構(gòu)建的時(shí)候,通過知識推理的有效利用可以幫助醫(yī)生更好地完成病患數(shù)據(jù)收集、分析以及總結(jié)工作,完成醫(yī)療差錯率的準(zhǔn)確控制。但是,即便是同一種疾病,醫(yī)生也需要按照病人的實(shí)際情況做出存在差異的判斷[14],這也就代表了醫(yī)學(xué)知識圖譜必須要完成大量重復(fù)矛盾信息的有效處理[15],極大地提高醫(yī)學(xué)推理構(gòu)建模型的復(fù)雜性。然而,通過傳統(tǒng)方法卻沒有辦法有效完成推理工作,而利用基于圖的推理方法則可以切實(shí)解決這些問題,為醫(yī)學(xué)知識圖譜的構(gòu)建起到更大的推動作用。所以,相關(guān)人員必須要提升對醫(yī)學(xué)知識推理的重視,采用更新更為多樣化的方法展開工作。
1.5質(zhì)量評估
數(shù)據(jù)質(zhì)量對其運(yùn)用有著決定性影響。所以,質(zhì)量評估更是提升數(shù)據(jù)準(zhǔn)確性的最主要方法,完成數(shù)據(jù)質(zhì)量的有效量化,完成可信度更高數(shù)據(jù)的篩選。也正是因?yàn)槿绱?,相關(guān)工作人員必須要明確認(rèn)識到質(zhì)量評估對醫(yī)學(xué)知識圖譜構(gòu)建的重要影響,并清楚了解現(xiàn)在所用方法存在的缺陷和不足,綜合利用更加符合實(shí)際需要的方法展開質(zhì)量評估,這樣才可以為知識圖譜的構(gòu)建貢獻(xiàn)更大的力量。
2 醫(yī)學(xué)知識圖譜的實(shí)際應(yīng)用探究
2.1 醫(yī)療信息搜索引擎
過去我國常用的醫(yī)療搜索引擎需要展開對高達(dá)上百億的醫(yī)療相關(guān)網(wǎng)頁展開檢索、儲存以及處理工作。然而,其卻沒有辦法完成用戶語義的有效查詢。而以醫(yī)學(xué)知識圖譜為依據(jù)展開搜索工作[16],不單單需要為用戶提供網(wǎng)頁間的超鏈接文檔關(guān)系,還需要推動類型不同實(shí)體間語義關(guān)系變得更加豐富。同時(shí),應(yīng)用知識圖譜對醫(yī)療信息搜索引擎進(jìn)行優(yōu)化還可以有效提高查詢擴(kuò)展質(zhì)量,為用戶的查詢理解工作提供更有力的支持和保障。除此之外,隨著時(shí)代的快速發(fā)展,以醫(yī)學(xué)知識圖譜為核心的搜索引擎已經(jīng)成為當(dāng)今世界最主要的醫(yī)學(xué)搜索引擎,其技術(shù)框架也在不斷改進(jìn),并逐漸變得更加完善[17]?,F(xiàn)在影響醫(yī)療搜索引擎質(zhì)量的主要問題就是醫(yī)學(xué)知識圖譜當(dāng)中的質(zhì)量以及數(shù)量,只有構(gòu)建更為健全完善的醫(yī)學(xué)知識圖譜才可以為醫(yī)療信息搜索引擎的發(fā)展以及作用發(fā)揮做出更大的貢獻(xiàn)。
2.2 醫(yī)療問答系統(tǒng)
隨著科學(xué)技術(shù)的快速發(fā)展,問答系統(tǒng)也慢慢變成了知識圖譜應(yīng)用的最典型場景。到現(xiàn)在為止,基于信息提取的方法、基于語義解析的方法以及基于向量空間建模的方法是最常用的知識圖譜在問答系統(tǒng)中的應(yīng)用方法。早期相關(guān)人員在進(jìn)行醫(yī)療問答系統(tǒng)研究的時(shí)候,更多的還是將重心放在了信息檢索[18]、提取以及摘要方法。而知識圖譜的有效應(yīng)用則推動問答系統(tǒng)研究重心的轉(zhuǎn)移,基于知識圖譜的問答系統(tǒng)研究也受到了越來越多人的重視。在這種背景下,人們完全可以把圖譜里面所儲存的數(shù)據(jù)自動轉(zhuǎn)化成為適用于推理引擎的規(guī)則,然后再綜合考慮工作站所傳遞出的病人實(shí)際情況當(dāng)作輔助完成對醫(yī)生的輔助,為后續(xù)開方工作的順利展開提供更有力的支持和保障。除此之外,目前由于醫(yī)學(xué)知識表達(dá)的復(fù)雜性以及現(xiàn)有醫(yī)學(xué)知識圖譜推理能力不足等原因的限制,相應(yīng)的問答系統(tǒng)還沒有得到明顯的突破。但是,在開放領(lǐng)域則出現(xiàn)了小冰等非常成功的優(yōu)秀案例。
2.3 醫(yī)療決策支持系統(tǒng)
通過醫(yī)療知識圖譜的有效利用,醫(yī)療決策支持系統(tǒng)的功能也隨之得到了有效增強(qiáng)。醫(yī)生完全可以通過決策支持系統(tǒng)的有效利用按照病人的癥狀表現(xiàn)以及檢查所得數(shù)據(jù)做出更加智能化的診斷工作以及更具針對性的治療方法[19],而且還可以給出轉(zhuǎn)診指南。甚至通過醫(yī)療決策支持系統(tǒng)的有效利用還可以完成對醫(yī)生所制定診療方案的全面分析,做好查漏補(bǔ)缺工作,降低誤診發(fā)生的可能性,為治療工作的順利展開以及用藥合理性提供更有力的支持和保障。同時(shí),隨著時(shí)代的快速發(fā)展,應(yīng)用知識圖譜展開醫(yī)療決策工作已經(jīng)逐漸成為現(xiàn)在人們的研究重點(diǎn)。然而,在實(shí)際應(yīng)用過程中依舊還存在全科醫(yī)學(xué)圖譜不完備以及醫(yī)療決策可靠性等方面的問題。像是在決策方面,以醫(yī)學(xué)知識圖譜為基礎(chǔ)的決策系統(tǒng)主要針對的更多還是特定疾病種類,應(yīng)用范圍相對比較狹窄[20]。而在決策方面,醫(yī)療決策工作對治療效果以及患者身體健康有著非常直接的影響。所以,決策工作必須要擁有足夠的可靠性以及準(zhǔn)確性。但是,到目前為止,基于知識圖譜的醫(yī)療決策所起到的更多的還僅僅是輔助以及支持的角色,根本沒有將其作用充分發(fā)揮出來,只有對其展開進(jìn)一步研究優(yōu)化才可以醫(yī)療事業(yè)的發(fā)展做出更大的貢獻(xiàn)。
3 結(jié)束語
總而言之,隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,醫(yī)療事業(yè)的信息化發(fā)展已經(jīng)成為時(shí)代發(fā)展的必然趨勢,各種醫(yī)學(xué)電子數(shù)據(jù)量也隨之得到了顯著提升。通過這些數(shù)據(jù)的有效利用以及提煉可以為醫(yī)療領(lǐng)域知識圖譜的構(gòu)建提供更有力的支持和保障,并更加高效合理的完成共享以及管理工作,推動醫(yī)療事業(yè)的進(jìn)一步發(fā)展。所以,為了更好地完成醫(yī)療知識圖譜的構(gòu)建,醫(yī)療從業(yè)人員必須要跟上時(shí)代發(fā)展的腳步,綜合考慮現(xiàn)在知識圖譜在醫(yī)學(xué)領(lǐng)域方面應(yīng)用上存在的拓展性差、限制多以及效率多等問題,應(yīng)用信息技術(shù)展開相關(guān)數(shù)據(jù)的統(tǒng)計(jì)分析以及自動智能處理,這樣才可以將其作用更大程度地發(fā)揮出來,從而為人們的醫(yī)療事業(yè)發(fā)展以及身體健康提供更有力的支持和保障。然而,到現(xiàn)在為止,我國在這種方面的研究以及應(yīng)用卻依舊還有一定的缺陷和不足存在,必須要展開更進(jìn)一步地深入研究,進(jìn)而為我國的發(fā)展建設(shè)以及人們的身體健康提供更有力的支持和保障。
參考文獻(xiàn):
[1]盛明,陳玉思,張勇,等.一種面向醫(yī)療健康領(lǐng)域知識圖譜的可擴(kuò)展系統(tǒng)架構(gòu)的研究[J].小型微型計(jì)算機(jī)系統(tǒng),2019,40(10):2150-2154.
[2]賀夢琪.基于MeSH的生物醫(yī)學(xué)知識圖譜構(gòu)建及其在組學(xué)數(shù)據(jù)分析的應(yīng)用[D].北京:軍事科學(xué)院,2019.
[3]劉路.基于醫(yī)學(xué)知識圖譜的疾病智能診斷研究[D].長沙:湖南大學(xué),2018.
[4]魏偉,徐莎,葛杰,等,基于多維尺度分析的我國災(zāi)害救援醫(yī)學(xué)領(lǐng)域知識圖譜研究[J],中國衛(wèi)生事業(yè)管理,2018,35(2): 86-88,93.
[5]袁凱琦,鄧揚(yáng),陳道源,等.醫(yī)學(xué)知識圖譜構(gòu)建技術(shù)與研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用研究,2018,35(7):1929-1936.
[6]侯夢薇,衛(wèi)榮,陸亮,等.知識圖譜研究綜述及其在醫(yī)療領(lǐng)域的應(yīng)用[J].計(jì)算機(jī)研究與發(fā)展,2018,55(12):2585-2599.
[7]聶莉莉,李傳富,許曉倩,等,人工智能在醫(yī)學(xué)診斷知識圖譜構(gòu)建中的應(yīng)用研究[J].醫(yī)學(xué)信息學(xué)雜志,2018,39(6):7-12.
[8]石習(xí)敏,陳娟,楊均雪,等.基于知識圖譜的國內(nèi)外醫(yī)學(xué)數(shù)據(jù)挖掘研究可視化探析[J].中國全科醫(yī)學(xué),2017,20(21):2623-2628.
[9]奧德瑪,楊云飛,穗志方,等.中文醫(yī)學(xué)知識圖譜CMeKG構(gòu)建初探[J].中文信息學(xué)報(bào),2019,33(10):1-9.
[10]李昊迪.醫(yī)學(xué)領(lǐng)域知識抽取方法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2018.
[11]阮彤,孫程琳,王吳奮,等,中醫(yī)藥知識圖譜構(gòu)建與應(yīng)用[J].醫(yī)學(xué)信息學(xué)雜志,2016,37(4):8-13.
[12]賈李蓉,劉靜,于彤,等.中醫(yī)藥知識圖譜構(gòu)建[J].醫(yī)學(xué)信息學(xué)雜志,2015,36(8):51-53,59.
[13]曹明宇,李青青,楊志豪,等.基于知識圖譜的原發(fā)性肝癌知識問答系統(tǒng)[J].中文信息學(xué)報(bào),2019,33(6):88-93.
[14]朱木易潔,鮑秉坤,徐常勝.知識圖譜發(fā)展與構(gòu)建的研究進(jìn)展[J].南京信息工程大學(xué)學(xué)報(bào):自然科學(xué)版,2017,9(6):575-582.
[15]史紀(jì)元.基于CiteSpaceⅢ輸血醫(yī)學(xué)研究領(lǐng)域知識圖譜分析[D].西安:第四軍醫(yī)大學(xué),2015.
[16]趙蓉英,王菊.圖書館學(xué)知識圖譜分析[J].中國圖書館學(xué)報(bào),2011,37(2):40-50.
[17]葉磊,龍偉.國內(nèi)智慧物流研究的知識圖譜分析[J].現(xiàn)代商貿(mào)工業(yè),2019,31(20):31-34.
[18]王森,胡福金.基于Citespace的中國少數(shù)民族傳統(tǒng)體育知識圖譜分析[C]//第七屆中國體育博士高層論壇論文集.新鄉(xiāng),2018:73.
[19]李文鵬,王建彬,林澤琦,等.面向開源軟件項(xiàng)目的軟件知識圖譜構(gòu)建方法[J].計(jì)算機(jī)科學(xué)與探索,2017,11(6):851-862.
[20]廖浚斌,周欣,何小海,等.面向涉恐領(lǐng)域的知識圖譜構(gòu)建方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2019,38(9):34-38.
【通聯(lián)編輯:唐一東】