李磊 魯興河 康警予 陳忠 朱峰
摘要:在現(xiàn)有的數(shù)據(jù)基礎(chǔ)上通過本體構(gòu)建工具建立起包括組織、人員及設(shè)施等本體概念,通過對本體間建立關(guān)系,利用本體概念下的參數(shù)關(guān)系構(gòu)建實體知識圖譜,為信息系統(tǒng)的數(shù)據(jù)資源利用提供技術(shù)保障。同時對需要支持檢索的本體模型建立索引,并利用圖譜間的關(guān)聯(lián)關(guān)系,直觀、高效地向用戶展現(xiàn)檢索結(jié)果,滿足檢索結(jié)果的個性化和智能化,從而更好地為決策提供支撐。
關(guān)鍵詞:知識圖譜;本體模型;數(shù)據(jù)可視化
中圖分類號:TP391文獻標志碼:A文章編號:1008-1739(2020)05-61-4
0引言
知識圖譜是在傳統(tǒng)知識工程的基礎(chǔ)上以及語義Web的發(fā)展中孕育并發(fā)展而來的知識表示技術(shù)[1],旨在描述客觀世界的概念、實體[2-3]、事件及其之間的關(guān)系。知識圖譜亦可被看作是一張巨大的圖,圖中的節(jié)點表示實體或概念,而圖中的邊則由屬性或關(guān)系構(gòu)成[4]。知識圖譜已被用來泛指各種大規(guī)模的知識庫,知識圖譜技術(shù)逐步滲透到各個領(lǐng)域[5-6]。同時,隨著作戰(zhàn)保障和業(yè)務處理系統(tǒng)穩(wěn)步發(fā)展,各類數(shù)據(jù)資源逐漸豐富,各領(lǐng)域軍事應用需求的不斷增長,作戰(zhàn)指揮、作戰(zhàn)保障和日常業(yè)務處理信息系統(tǒng)建設(shè)投入不斷加大,各類作戰(zhàn)保障和業(yè)務處理信息系統(tǒng)規(guī)模逐步擴展,積累形成了一批可用、實用的信息資源,成為構(gòu)建知識圖譜的重要支撐。
1知識圖譜構(gòu)建方法
基于本體模型構(gòu)建知識圖譜方法流程圖如圖1所示。
首先將存儲在關(guān)系型數(shù)據(jù)庫內(nèi)數(shù)據(jù)構(gòu)建成多個本體模型,然后利用原有數(shù)據(jù)庫表內(nèi)字段之間的關(guān)系構(gòu)建本體模型間關(guān)系,完成現(xiàn)有數(shù)據(jù)架構(gòu)下的數(shù)據(jù)關(guān)系圖譜構(gòu)建,接著獲取本體模型下所有的實體數(shù)據(jù),利用本體模型關(guān)聯(lián)參數(shù)構(gòu)建實體數(shù)據(jù)關(guān)系,形成實體數(shù)據(jù)關(guān)系網(wǎng),最終將本體模型、實體數(shù)據(jù)和關(guān)系按照鄰接表的方式存入到圖數(shù)據(jù)庫中,并實現(xiàn)基于圖結(jié)構(gòu)的索引技術(shù),提高對圖數(shù)據(jù)庫中節(jié)點和關(guān)系的查找速度。
1.1本體模型構(gòu)建方法
存在于數(shù)據(jù)庫中的各基礎(chǔ)和業(yè)務數(shù)據(jù)通常包含各種本體模型,如人員、設(shè)施及地名等,這些本體多以表為單位進行存儲,本體之間的關(guān)系通過主外鍵進行關(guān)聯(lián)。本文提供了一種配置化的本體模型構(gòu)建工具,此工具首先獲取數(shù)據(jù)庫用戶空間下的所有表結(jié)構(gòu),用戶根據(jù)表的存儲信息構(gòu)建本體模型,再通過字段關(guān)聯(lián)將關(guān)聯(lián)信息加入到本體模型中,形成了多個獨立的本體模型,使數(shù)據(jù)庫使用人員能夠迅速獲取到數(shù)據(jù)庫內(nèi)的數(shù)據(jù)結(jié)構(gòu)信息,然后根據(jù)需求進行數(shù)據(jù)訪問。
1.2本體模型關(guān)系構(gòu)建方法
人員本體與組織本體模型關(guān)系如圖2所示。
本體模型構(gòu)建完成后會形成多個獨立的本體,這些本體之間存在諸多關(guān)系,這些關(guān)系在數(shù)據(jù)庫中一般通過關(guān)聯(lián)表實現(xiàn),如建立一張人員與組織的關(guān)系表,表結(jié)構(gòu)為人員內(nèi)碼和組織內(nèi)碼,一行數(shù)據(jù)就表示了某個人員的所屬組織。本文提出了一種基于知識圖譜的本體模型關(guān)系構(gòu)建方法,步驟如下所示:
步驟1:選擇需要建立關(guān)系的多個數(shù)據(jù)模型,模型的數(shù)量不定,如M1,M2,M3,……M。
步驟2:選擇每個模型的關(guān)聯(lián)字段,建立字段之間的關(guān)系,此關(guān)系可以是相等關(guān)系,如內(nèi)碼相等,也可以是其他復雜關(guān)系,如子字符串、取模計算等。
步驟3:將本體模型關(guān)系存入圖數(shù)據(jù)庫中,存入的信息包括本體模型的字段信息、參與關(guān)聯(lián)的模型名稱、關(guān)聯(lián)的參數(shù)。
1.3實體關(guān)系構(gòu)建方法
在本體模型關(guān)系構(gòu)建之后,就可以根據(jù)關(guān)系參數(shù)構(gòu)建實體關(guān)系,構(gòu)建方法如下:
步驟1:對參與構(gòu)建關(guān)系的每個本體模型通過統(tǒng)一的數(shù)據(jù)訪問接口獲取所有的數(shù)據(jù)。
步驟2:由數(shù)據(jù)庫表中對于表的注釋和對于表中字段的注釋,將實體數(shù)據(jù)由英文屬性名轉(zhuǎn)為中文屬性名,如組織實體中英文字段“zzmc”轉(zhuǎn)為中文字段名稱“組織名稱”,使所有數(shù)據(jù)表現(xiàn)更為直觀。
步驟3:將所有本體模型的實體數(shù)據(jù)存入圖數(shù)據(jù)庫中。
步驟4:利用本體模型的關(guān)聯(lián)參數(shù)構(gòu)建實體關(guān)系,例如對于組織、人員組織關(guān)系和人員這3個本體,如果某個組織實體的組織內(nèi)碼等于人員組織關(guān)系實體的組織內(nèi)碼且此人員組織關(guān)系實體的人員內(nèi)碼等于某個人員實體的人員內(nèi)碼,則在此組織實體和人員實體之間構(gòu)建組織下屬人員關(guān)系。
步驟5:重復步驟1~步驟4,直至所有的本體模型關(guān)系都完成對應實體關(guān)系的構(gòu)建。
2數(shù)據(jù)檢索與可視化方法
基于知識圖譜的數(shù)據(jù)檢索[7-8]是指通過語義檢索[9],對大量數(shù)據(jù)進行過濾、分析和管理,實現(xiàn)搜索數(shù)據(jù)的結(jié)構(gòu)化并且提供詳細的主題相關(guān)信息,有利于建立數(shù)據(jù)間知識體系,理解各種實體概念以及它們的關(guān)聯(lián)。本文創(chuàng)新之處在于構(gòu)建了一套完整的從知識圖譜構(gòu)建到檢索展現(xiàn)的系統(tǒng),實現(xiàn)了對結(jié)構(gòu)化數(shù)據(jù)進行本體構(gòu)建、實體抽取、索引構(gòu)建和檢索結(jié)果展現(xiàn)的全流程可視化操作。
2.1方法體系架構(gòu)
數(shù)據(jù)檢索與可視化方法體系架構(gòu)如圖3所示,自底向上可分為數(shù)據(jù)源層、圖譜及索引構(gòu)建層和外部應用層。