国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)架構(gòu)研究

2021-02-24 03:02:36孫雨生
中國科技資源導(dǎo)刊 2021年1期
關(guān)鍵詞:知識庫本體語義

袁 芳 孫雨生

(1.中國科學(xué)技術(shù)信息研究所,北京 100038;2.湖北工業(yè)大學(xué)經(jīng)濟與管理學(xué)院,湖北武漢 430068)

0 引言

大數(shù)據(jù)、人工智能、社交媒體、數(shù)字人文等新理念和技術(shù)的興起加速了知識驅(qū)動下各行各業(yè)智能化、智慧化變革[1]和知識社會[2]到來,知識管理、知識服務(wù)已大勢所趨[1]。在這種形勢下,檔案領(lǐng)域積極探索靈活化、系統(tǒng)化、個性化[3]檔案知識服務(wù)模式并取得了一定成效:在檔案館公共服務(wù)領(lǐng)域,國家檔案館的公共知識服務(wù)管理知識庫實踐探索了更加便捷、優(yōu)質(zhì)檔案館知識服務(wù)發(fā)展途徑;在軍工檔案領(lǐng)域,中國艦船研究設(shè)計中心基于集中、集成、集智的總體發(fā)展思路,策劃并構(gòu)建了知識服務(wù)型科技檔案管理系統(tǒng),于2014年在全中心推廣使用[4]。

而隨著數(shù)字檔案資源量的急劇增長,與用戶有限認(rèn)知及處理能力間矛盾日益加劇,如何借助基于新型IT技術(shù)的知識服務(wù)系統(tǒng)有效描述、處理、存儲、分析和利用海量異構(gòu)數(shù)字檔案資源,實現(xiàn)電子文件與數(shù)字檔案一體化管理[2],進而個性化、智能化提供數(shù)字檔案知識服務(wù)成為亟待解決的問題。傳統(tǒng)數(shù)字檔案知識服務(wù)系統(tǒng)[5]雖然能夠基于用戶信息、行為等部分預(yù)測其興趣及需求并利用單一服務(wù)機制[6]提供數(shù)字檔案及其隱含知識檢索、知識瀏覽、知識推薦、知識問答等服務(wù),但是由于缺乏語義技術(shù)支持,存在著檔案知識利用率低、服務(wù)針對性弱、異構(gòu)檔案資源難以機讀化[6]存儲和共享等缺陷[5],反饋評價機制的缺失[2]也嚴(yán)重影響了數(shù)字檔案知識服務(wù)質(zhì)量及用戶體驗[6],降低了決策效率[2]。在這種形勢下,基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)應(yīng)運而生。其依托本體技術(shù)語義關(guān)聯(lián)數(shù)字檔案知識單元構(gòu)建并可視化檔案知識網(wǎng)絡(luò),降低用戶認(rèn)知負(fù)荷,再依托本體推理機制深挖用戶潛在興趣,以精確獲取、形式化描述、動態(tài)進化[6]用戶個性檔案需求,利用本體特性描述、組織數(shù)字檔案知識進而構(gòu)建知識服務(wù)系統(tǒng)及交互式服務(wù)模式、策略[7],以智能匹配、整合知識服務(wù)機制。其基于本體描述數(shù)字檔案資源以有效解決檔案資源語義歧義、異構(gòu)問題并充分發(fā)揮其價值,基于數(shù)字檔案本體知識庫及數(shù)據(jù)挖掘、機器學(xué)習(xí)等技術(shù)推理隱性知識實現(xiàn)數(shù)字檔案知識增值并推動用戶知識創(chuàng)新[8],最終提升數(shù)字檔案知識服務(wù)易用性、針對性、共享性、集成性、智能性[5],并服務(wù)于創(chuàng)新活動。因此,研究基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)具有現(xiàn)實意義。

本文將從體系結(jié)構(gòu)、功能模塊、運行機理3個方面設(shè)計基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)架構(gòu),以供相關(guān)的研究者與系統(tǒng)實踐者參考。

1 數(shù)字檔案知識服務(wù)系統(tǒng)與本體技術(shù)

1.1 數(shù)字檔案知識服務(wù)系統(tǒng)

目前,數(shù)字檔案知識服務(wù)系統(tǒng)定義、內(nèi)涵尚未達成共識。分析現(xiàn)有數(shù)字檔案知識服務(wù)、知識服務(wù)系統(tǒng)文獻,筆者認(rèn)為,數(shù)字檔案知識服務(wù)系統(tǒng)是基于數(shù)字化知識管理和檔案后保管范式[1]、人本管理[8]等理論和檔案的知識、服務(wù)價值取向[3],面向數(shù)字檔案領(lǐng)域,以檔案知識資源為對象,以檔案機構(gòu)、電子文件為中心,以檔案業(yè)務(wù)部門工作及用戶獲取特定問題解決方法[9]需求為導(dǎo)向,以知識服務(wù)流程為核心,以實現(xiàn)文檔一體化管理[2]、挖掘和發(fā)揮檔案部門及檔案資源智力支撐作用為目標(biāo),遵循面向用戶、輔助決策、注重全時空[2]服務(wù)[1]、嚴(yán)格執(zhí)行標(biāo)準(zhǔn)規(guī)范、保障檔案資源安全、動態(tài)擴展知識服務(wù)[2]的原則,基于數(shù)字檔案知識庫、數(shù)字檔案門戶[8]、數(shù)字檔案管理規(guī)范及標(biāo)準(zhǔn)(包括技術(shù)領(lǐng)域各項參數(shù)指標(biāo)、信息處理環(huán)節(jié)制度標(biāo)準(zhǔn)及相應(yīng)評估體系[3])、數(shù)字檔案硬件設(shè)備及裝備(涉及常規(guī)設(shè)備、檔案處理設(shè)備、網(wǎng)絡(luò)設(shè)備[3]),充分利用新型IT技術(shù)(用戶畫像、本體、語義網(wǎng)、關(guān)聯(lián)數(shù)據(jù)[2]、知識推薦、知識挖掘、知識地圖[8]、信息安全[9]等)以及檔案著錄標(biāo)引、檔案數(shù)據(jù)庫、檔案數(shù)字化、檔案發(fā)布、檔案信息安全[3]等專業(yè)技術(shù)整合數(shù)字檔案顯性知識并分析挖掘數(shù)字檔案知識資源隱性知識[9],形成新的知識創(chuàng)造,并通過智能化方法、新型運作模式[3]和服務(wù)理念、服務(wù)方式(知識檢索、知識咨詢、知識推薦等[10])、服務(wù)機制、服務(wù)思維[1]以及檔案工作者智慧分析、診斷、解決特定問題并重構(gòu)服務(wù)流程[3],進而提供深層次、高質(zhì)量數(shù)字檔案知識或知識產(chǎn)品、知識結(jié)構(gòu)[9]、新型檔案利用形式[3],并能夠深度挖掘檔案價值、按用戶反饋及相關(guān)評估動態(tài)調(diào)整[3]的集成性知識服務(wù)系統(tǒng)。

就內(nèi)涵而言,數(shù)字檔案知識服務(wù)系統(tǒng)基于檔案知識采集、組織、分析、重組、可視化等過程和數(shù)字檔案規(guī)范,根據(jù)用戶問題和環(huán)境將檔案知識融入用戶解決問題的全過程[7],實現(xiàn)檔案增值并降低用戶認(rèn)知負(fù)荷。數(shù)字檔案知識服務(wù)系統(tǒng)主要由信息采集、知識抽取、知識組織、知識存儲、知識推理、知識服務(wù)等功能模塊組成,基于本體、知識地圖、知識推薦、知識引擎、知識可視化等技術(shù)構(gòu)建數(shù)字檔案知識網(wǎng)絡(luò)以集成數(shù)字檔案領(lǐng)域內(nèi)概念、主題、機構(gòu)、事件、地點、人員、實物、關(guān)系等知識對象,并結(jié)合知識服務(wù)策略與機制為用戶提供知識服務(wù),以構(gòu)建連接知識提供者與用戶的知識供應(yīng)鏈,促進數(shù)字檔案知識生產(chǎn)、存儲、加工、傳播、交流、學(xué)習(xí)、應(yīng)用、共享、評估及創(chuàng)新,進而使數(shù)字檔案知識效用最大化。

1.2 本體技術(shù)

作為知識表示和分析手段[7]、語義網(wǎng)基礎(chǔ)[11]的本體技術(shù)最早是哲學(xué)術(shù)語,是關(guān)于事物存在及其本質(zhì)和規(guī)律的理論。計算機科學(xué)、人工智能領(lǐng)域本體是領(lǐng)域概念的結(jié)構(gòu)化規(guī)范和形式,定義領(lǐng)域內(nèi)概念間關(guān)系,可以在人及信息系統(tǒng)間形成對領(lǐng)域概念的共享和共同理解,實現(xiàn)知識共享和重用[7]。本體通用概念是Gruber于1993年提出,并經(jīng)Borst完善、Studer系統(tǒng)化的“共享概念模型的明確的形式化規(guī)范說明”。其中,概念模型是指抽象客觀世界現(xiàn)象相關(guān)概念所得模型;明確是指所用概念及其使用約束都有清楚的定義;形式化是指計算機可處理;共享是指體現(xiàn)共同認(rèn)可知識,揭示相關(guān)領(lǐng)域中公認(rèn)概念集[12]。本體常常被作為通用知識庫支持信息資源及服務(wù)的語義化表示及智能整合、知識推理以提升知識服務(wù)質(zhì)量及用戶體驗。

1.3 基于本體的數(shù)字檔案知識服務(wù)

基于本體的數(shù)字檔案知識服務(wù)是網(wǎng)絡(luò)環(huán)境下面向用戶特定實踐應(yīng)用及問題[7]、旨在形成解決方案、動態(tài)增值的智能化、一體化(涉及知識采集、表示、析取/分析、組織/重組、創(chuàng)新、存儲、集成到應(yīng)用等過程[7]并服務(wù)于用戶解決問題全程以實現(xiàn)知識個人化,支持知識協(xié)作、知識創(chuàng)新)交互式服務(wù)。其通過在檔案知識體系中引入本體形式化描述、關(guān)聯(lián)數(shù)字檔案單元間知識關(guān)聯(lián)關(guān)系,界定檔案主題框架及主題間等級、上下位和語義等關(guān)系,以滿足用戶多元化需求,其將用戶、數(shù)字檔案資源統(tǒng)一在虛擬語義環(huán)境中以便計算機處理[10];通過推理機制調(diào)用知識庫中規(guī)則及約束以支持智能決策[12];通過知識可視化、知識映射等技術(shù)挖掘、分析、構(gòu)建、繪制和顯式圖形化表達數(shù)字檔案知識內(nèi)在結(jié)構(gòu)關(guān)系,進而創(chuàng)造知識共享環(huán)境以實現(xiàn)數(shù)字檔案知識交流和深化。

具體而言,基于檔案本體知識庫、本體知識表示機制、本體映射機制構(gòu)建用戶本體,結(jié)合用戶基本信息及行為、偏好信息構(gòu)建并動態(tài)進化語義用戶興趣模型,以形式化精準(zhǔn)表示用戶需求,并基于本體語義表示、邏輯推理特性智能拓展用戶潛在知識需求;基于本體語義描述數(shù)字檔案知識服務(wù)機制,根據(jù)語義用戶興趣模型智能匹配、動態(tài)集成所需數(shù)字檔案知識服務(wù)機制,以合適的渠道、方式[12]為用戶提供最優(yōu)數(shù)字檔案知識解決方案[9]及相應(yīng)知識資源并融入其解決問題全程;用本體形式化描述檔案領(lǐng)域知識體系、結(jié)構(gòu)化采集檔案領(lǐng)域知識資源,基于語義標(biāo)注關(guān)聯(lián)本體與檔案領(lǐng)域知識資源以高效采集、精準(zhǔn)表示、智能發(fā)現(xiàn)、動態(tài)集成數(shù)字檔案知識資源,最終高效協(xié)同用戶、服務(wù)機制、數(shù)字檔案資源、IT技術(shù)及信息裝備、專家資源[9]實現(xiàn)數(shù)字檔案用戶體驗、服務(wù)質(zhì)量及性能、知識資源配置及管理最優(yōu)化[6],智能輔助用戶決策以提升用戶解決問題能力、數(shù)字檔案價值,實現(xiàn)系統(tǒng)集成、業(yè)務(wù)集成、功能集成[8]、服務(wù)集成和團隊協(xié)同[9],同時提高用戶學(xué)習(xí)和工作效率(語義化分布式原始資料形成系統(tǒng)知識結(jié)構(gòu),將領(lǐng)域本體深化成知識產(chǎn)品直接提供用戶所需知識和資源)[13]。

2 基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)架構(gòu)的總體設(shè)計

構(gòu)建基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)就是用本體、語義檢索[13]、知識導(dǎo)航、知識推薦等技術(shù)和方法構(gòu)建數(shù)字檔案知識庫、數(shù)字檔案本體庫,用本體重組、整合數(shù)字檔案所含知識單元,以機讀模式組織、存儲、檢索數(shù)字檔案信息,通過資源語義關(guān)聯(lián)及知識導(dǎo)航能夠更加精細(xì)化、規(guī)范化、自動化地揭示數(shù)字檔案資源,并根據(jù)用戶習(xí)慣采集用戶行為和知識偏好,推斷用戶需求,構(gòu)建用戶服務(wù)匹配和知識發(fā)現(xiàn)機制,結(jié)合本體映射技術(shù)分析相關(guān)知識[7],實現(xiàn)數(shù)字檔案知識跨資源類型、跨庫檢索及推薦,提供個性化、全方位知識服務(wù),追蹤用戶需求變化進行服務(wù)優(yōu)化[11]?;诒倔w的數(shù)字檔案知識服務(wù)系統(tǒng)總體架構(gòu)如圖1所示。

2.1 體系結(jié)構(gòu)

基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)體系結(jié)構(gòu)分為表示層、應(yīng)用層、業(yè)務(wù)層、數(shù)據(jù)層,且各層次業(yè)務(wù)聯(lián)系緊密、構(gòu)建邏輯相對獨立[2,5],基于功能模塊調(diào)用進行層間交互,基于本體操作接口(支持?jǐn)?shù)字檔案專家構(gòu)建、維護本體)、用戶操作接口(向用戶反饋數(shù)字檔案知識服務(wù)系統(tǒng)所推薦知識并接受反饋)傳遞數(shù)字檔案知識及資源[5]。具體如圖2所示。

2.1.1 表示層

表示層又稱用戶界面層,通常體現(xiàn)為檔案知識門戶(為用戶獲取和輸出信息接口,集成多種接入方式以便用戶與系統(tǒng)交互[10])、知識社區(qū)(支持問題中心、專家問答、知識論壇等)、專家黃頁(以列表形式揭示專家知識、技能和專長[8])、個人知識中心、平臺管理(監(jiān)控知識服務(wù)系統(tǒng)以操作知識庫及數(shù)據(jù)庫[11])等,充當(dāng)數(shù)字檔案知識服務(wù)系統(tǒng)界面呈現(xiàn)載體及用戶界面邏輯角色,通過在Web頁面中編寫用戶界面控制邏輯代碼(用于讀取、設(shè)置服務(wù)器控件及知識服務(wù)事件處理等)并結(jié)合業(yè)務(wù)層知識服務(wù)機制實現(xiàn)服務(wù)器控件與數(shù)字檔案知識綁定,支持用戶訪問(包括注冊登錄、知識瀏覽、知識檢索、反饋評價等)[5]及其知識需求學(xué)習(xí)(基于知識使用情況、業(yè)務(wù)等動態(tài)進化用戶興趣模型、用戶本體)、知識服務(wù)展示[5]。

圖1 基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)總體架構(gòu)

圖2 基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)體系結(jié)構(gòu)

2.1.2 應(yīng)用層

應(yīng)用又稱知識服務(wù)層[13]、功能層,提供基于本體的數(shù)字檔案知識服務(wù)引擎[12],基于大數(shù)據(jù)處理分析、人工智能(AI)、知識可視化、知識圖譜等技術(shù),通過用戶需求分析和本體推理實現(xiàn)應(yīng)用管理模塊中系統(tǒng)功能,主要包括知識服務(wù)應(yīng)用[2],如專題知識庫、知識導(dǎo)航[11]、知識檢索[13]、知識發(fā)現(xiàn)、知識推薦、知識地圖、知識問答、參考咨詢服務(wù)、智庫情報服務(wù)[2]、(統(tǒng)計)數(shù)據(jù)產(chǎn)品[13]等,并應(yīng)用解析接口預(yù)分類、細(xì)化和分析用戶請求[2],調(diào)用知識服務(wù)程序與業(yè)務(wù)層交互,將知識服務(wù)結(jié)果反饋給表示層,再由其通過人機界面顯示給用戶。

2.1.3 業(yè)務(wù)層

業(yè)務(wù)層又稱業(yè)務(wù)邏輯層,通常接收應(yīng)用層轉(zhuǎn)交的用戶請求,基于元數(shù)據(jù)收割、信息抽取、Mashup等技術(shù)[2],與數(shù)據(jù)層交互處理數(shù)字檔案業(yè)務(wù)并反饋結(jié)果給應(yīng)用層[5],實現(xiàn)數(shù)字檔案知識服務(wù)系統(tǒng)所需通用業(yè)務(wù)過程,如知識檢索、知識過濾(按用戶檢索請求進行語義匹配、需求分析、語義推理后篩選檔案)、知識推薦(基于推薦策略、用戶需求本體和用戶資料庫,用推薦算法、情景推理[11]篩選檔案資源及知識)、知識集成(采集數(shù)字檔案資源,基于本體規(guī)則層次化、有序化數(shù)字檔案知識元素以構(gòu)建知識網(wǎng)絡(luò)、揭示檔案知識脈絡(luò)[13])、知識抽取、知識標(biāo)注(分析數(shù)據(jù)內(nèi)容、關(guān)聯(lián)特點,基于領(lǐng)域本體、本體推理對數(shù)字檔案知識庫中信息進行標(biāo)注[11])、語義索引[13]、知識發(fā)現(xiàn)、知識組織(依托多維知識體系[8],關(guān)聯(lián)形成相關(guān)主題的關(guān)聯(lián)數(shù)據(jù)、推理規(guī)則、專家智慧等知識[2])、知識推理(涉及推理規(guī)則、推理約束[11])等,業(yè)務(wù)層專注數(shù)字檔案知識服務(wù)業(yè)務(wù)邏輯算法實現(xiàn),包括對數(shù)字檔案業(yè)務(wù)實體建模的對象模型及表達用戶知識服務(wù)策略和需求的業(yè)務(wù)規(guī)則,處理流程涉及用戶興趣建模、知識需求建模、知識檢索、知識推薦[5]等。

2.1.4 數(shù)據(jù)層

數(shù)據(jù)層又稱數(shù)據(jù)存儲層、知識資源層,與數(shù)據(jù)庫相連并響應(yīng)業(yè)務(wù)請求[10],通?;跀?shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、信息抽取、元數(shù)據(jù)收割、自然語言處理、信息聚類、圖像識別、分布式存儲、云計算等技術(shù)[2],利用數(shù)字檔案標(biāo)準(zhǔn)規(guī)范和信息裝備為數(shù)字檔案提供元數(shù)據(jù)收割、編目及維護、密級管理、權(quán)限設(shè)定、XML封裝等,形成數(shù)字檔案知識元、構(gòu)建領(lǐng)域知識架構(gòu)[13],實現(xiàn)數(shù)據(jù)持久化功能。通常按照業(yè)務(wù)層請求通過統(tǒng)一數(shù)據(jù)訪問引擎[2]存取檔案數(shù)據(jù),包括事務(wù)處理、并發(fā)控制等,主要涉及數(shù)字檔案知識庫(用本體庫的元知識標(biāo)注從數(shù)字檔案數(shù)據(jù)庫、作者及其機構(gòu)主頁采集[11]的數(shù)字檔案及相關(guān)信息,并以XML文檔[12]存為數(shù)字檔案資料庫[11]),為領(lǐng)域本體庫構(gòu)建(提取易理解、共識性檔案知識元素并以機讀模式組織、存儲、查詢數(shù)據(jù)得到概念特征集并與領(lǐng)域本體映射以關(guān)聯(lián)數(shù)字檔案知識與領(lǐng)域知識[11])及知識檢索、知識推薦等服務(wù)提供數(shù)據(jù)保障。存儲對數(shù)字檔案資源進行知識采集所得的數(shù)字檔案相關(guān)信息(用本體形式化經(jīng)語義標(biāo)注、擴展、合成的結(jié)果并通過語義推理挖掘隱含語義[11]),以便高效檢索[11]用戶需求[11]本體庫(存儲用戶基本信息、需求、興趣偏好、操作行為[2]如日志流[11]、設(shè)備使用信息等,經(jīng)概念特征提取[11]、本體映射構(gòu)建)、數(shù)字檔案本體庫(基于數(shù)據(jù)倉庫、AI、RDF、本體建模、本體語言等技術(shù)[2,13]和數(shù)字檔案標(biāo)準(zhǔn)規(guī)范、資源特性,經(jīng)機讀采集數(shù)字檔案知識資源、處理數(shù)字檔案、標(biāo)注語義[5]、知識推理和演化[2]等構(gòu)建,存儲應(yīng)用本體描述數(shù)字檔案知識內(nèi)容的概念及其關(guān)系集[12])、領(lǐng)域本體庫(輔助表示領(lǐng)域性數(shù)字檔案資源中語義關(guān)系且概念層次結(jié)構(gòu)良好、支持邏輯推理以語義化數(shù)字檔案、方便檔案知識組織與檢索)、推理規(guī)則庫(存儲數(shù)字檔案知識推理規(guī)則和約束條件以支持語義推理[5]、本體智能拓展和管理[2])、關(guān)系數(shù)據(jù)庫[5](存儲數(shù)字檔案資源、自建專題檔案數(shù)據(jù)等[2])、專家?guī)臁㈦娮游募行?、容?zāi)備份中心[2]等。

2.2 功能模塊

基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)就是基于數(shù)字檔案知識語義表示、智能關(guān)聯(lián)滿足檔案管理員應(yīng)用和智能管理檔案知識需求,滿足系統(tǒng)管理員管理數(shù)字檔案知識服務(wù)系統(tǒng)運行維護需求,滿足普通用戶智能獲取數(shù)字檔案知識及資源需求,最終知識化管理數(shù)字檔案。主要包括應(yīng)用管理、知識庫管理、知識源管理、文檔一體化管理、系統(tǒng)維護管理等模塊。

2.2.1 應(yīng)用管理模塊

應(yīng)用管理模塊又稱知識服務(wù)平臺及接口[10],通?;谥R門戶圍繞服務(wù)目標(biāo)與用戶直接接觸,支持知識服務(wù)應(yīng)用可視化顯示、評價、反饋[5]。其主要涉及基于Web發(fā)布常規(guī)信息、檔案資源,專題知識庫(圍繞專題重組、整合各部門檔案資源建設(shè)或完善的專題數(shù)據(jù)庫以提升知識服務(wù)深度和用戶體驗),語義(知識)檢索(基于本體實現(xiàn)概念匹配和知識推理),數(shù)據(jù)挖掘(包括提供數(shù)據(jù)統(tǒng)計、關(guān)聯(lián)分析、報(圖)表輸出、工具共享等),知識地圖(包括可視化知識跨域?qū)Ш健⒅R圖譜等),個人知識中心(包括吸引用戶參與系統(tǒng)開發(fā)、參考咨詢服務(wù)提供等,激勵用戶參與檔案標(biāo)注和更新,構(gòu)建用戶社區(qū)和個人主頁以根據(jù)用戶訂閱收藏、歷史瀏覽、社交好友等構(gòu)建用戶本體進而推薦知識),參考咨詢服務(wù)(包括推薦服務(wù)無法滿足用戶需求時由專業(yè)人員借助平臺提供咨詢服務(wù)),智庫情報服務(wù)(包括基于決策支持系統(tǒng)挖掘檔案資源隱性知識,提供情報和輔助決策建議[2]),檔案管理專家系統(tǒng)以及檔案生產(chǎn)加工指導(dǎo)服務(wù)、用戶興趣建模、知識推薦[5]等。

2.2.2 知識庫管理模塊

知識庫管理模塊支持其他模塊[10],其水準(zhǔn)的高低決定了整個系統(tǒng)知識服務(wù)能力的大小[2],通常針對問題求解需求,提取數(shù)字檔案蘊含知識并歸納成有用知識[2]、梳理數(shù)字檔案知識單元關(guān)系[5],進而按專題或系列構(gòu)建基于特定知識表示方式的關(guān)聯(lián)知識集[8],涉及用戶需求本體庫、本體庫、數(shù)據(jù)庫[10],功能主要包括知識條目維護和管理、一致性檢驗、知識元關(guān)聯(lián)和推理規(guī)則管理、知識分類編碼等元數(shù)據(jù)管理、本體構(gòu)建和管理等[2]。

2.2.3 知識源管理模塊

知識源管理模塊整合各檔案部門資源,提供設(shè)計各系統(tǒng)檔案資源集成接口、檔案資源收集和注冊、分類管理、密級管理(保障檔案資源公開且安全,常用強化ID登錄管理、版權(quán)隱私聲明等防止信息泄露、版權(quán)竊取、惡意篡改等)、XML封裝功能等[2],涉及數(shù)字檔案解析(支持DOC、PDF、XML等格式檔案)、數(shù)字檔案語義索引(基于分詞器預(yù)處理并用高頻主題詞集標(biāo)引數(shù)字檔案)、數(shù)字檔案檢索[13]、數(shù)字檔案知識加工、數(shù)字檔案知識審核、數(shù)字檔案知識標(biāo)注[5]。

2.2.4 文檔一體化管理模塊

文檔一體化管理模塊按前端控制思想設(shè)計在線歸檔檔案部門尚未歸檔的文件、電子公文等,功能包括構(gòu)建電子文件中心、設(shè)計與OA系統(tǒng)接口、自動采集數(shù)字檔案及元數(shù)據(jù)、自動匹配紙質(zhì)檔案與數(shù)字檔案、自動分配(合成)檔案號、在線移交檔案、接收和歸檔管理檔案等[2]。

2.2.5 系統(tǒng)維護管理模塊

系統(tǒng)維護管理模塊完成檔案機構(gòu)管理、用戶賬戶與用戶組管理、檔案密級及公開權(quán)限管理、門戶后臺管理、檔案容災(zāi)備份[2]、報表模板管理、檔案知識體系管理、檔案知識采集模板管理、結(jié)構(gòu)化檔案模板管理、知識庫管理[8]、日志管理、菜單管理、檔案門類管理等[2]。

2.3 運行機理

基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)服務(wù)流程:首先,構(gòu)建數(shù)字檔案知識庫。通過數(shù)字檔案知識資源采集、數(shù)字檔案處理(用自然語言處理工具[7]對數(shù)字檔案進行過濾、分詞、特征詞及關(guān)系提取并映射為領(lǐng)域本體,進行概念推理獲取相關(guān)知識[7])、語義標(biāo)注、語義索引構(gòu)建結(jié)構(gòu)化、機讀式[13]的數(shù)字檔案知識庫[5],進而基于面向知識服務(wù)的信息資源組織方法[13]結(jié)合數(shù)字檔案本體[5]按知識結(jié)構(gòu)和語義特征[13]集成[5]數(shù)字檔案資源(分析數(shù)字檔案知識結(jié)構(gòu)及異構(gòu)知識源[5],用本體描述數(shù)字檔案知識并語義關(guān)聯(lián)以集成數(shù)字檔案知識并存入數(shù)字檔案知識庫[5],形成面向多類應(yīng)用需求及層次、較豐富完善的數(shù)字檔案知識產(chǎn)品[13])并關(guān)聯(lián)本體層與數(shù)字檔案知識。其次,構(gòu)建語義用戶興趣模型。提取挖掘用戶興趣、行為特征存入用戶本體庫,基于本體[10]構(gòu)建語義用戶興趣模型。然后,處理數(shù)字檔案知識并展示結(jié)果,基于用戶本體庫[5]、本體解析工具、語義擴展算法[13]分析用戶知識檢索請求、歷史需求[2]、用戶興趣模型,以精準(zhǔn)獲取、推理其知識需求,并據(jù)此檢索知識庫、調(diào)用本體獲取相關(guān)知識、制定服務(wù)策略[2]、處理檢索結(jié)果(匹配、分類[2]、排序),生成個性化檢索、推薦列表[5],知識地圖及相關(guān)知識語義鏈接、相關(guān)分析工具[2]展示給用戶并動態(tài)跟蹤其應(yīng)用情況。最后,優(yōu)化數(shù)字檔案知識服務(wù)。動態(tài)收集反饋信息(如系統(tǒng)使用情況[2])并存儲數(shù)字檔案知識服務(wù)準(zhǔn)確率不高、不完善的信息,進化數(shù)字檔案領(lǐng)域本體和用戶興趣模型及知識需求模型[5]。

3 結(jié)語

綜上所述,本文從體系結(jié)構(gòu)、功能模塊、運行機理3 個方面研究了基于本體的數(shù)字檔案知識服務(wù)系統(tǒng)架構(gòu),旨在基于數(shù)字檔案規(guī)范、數(shù)字檔案知識庫、數(shù)字檔案本體庫、語義技術(shù)、信息裝備來深度揭示、有機鏈接異構(gòu)數(shù)字檔案信息資源,挖掘數(shù)字檔案知識間邏輯關(guān)系及隱性知識以解決檔案信息分散封閉問題,實現(xiàn)數(shù)字檔案資源高度精細(xì)化、深度結(jié)構(gòu)化和廣泛語義化,支持更高效、智能數(shù)字檔案知識服務(wù)。具體而言,體系結(jié)構(gòu)分表示層、應(yīng)用層、業(yè)務(wù)層、數(shù)據(jù)層;功能模塊分應(yīng)用管理、知識庫管理、知識源管理、文檔一體化管理、系統(tǒng)維護管理模塊;運行機理是構(gòu)建數(shù)字檔案知識庫以集成數(shù)字檔案并關(guān)聯(lián)本體與數(shù)字檔案資源、構(gòu)建語義用戶興趣模型、處理數(shù)字檔案知識并展示結(jié)果、優(yōu)化數(shù)字檔案知識服務(wù)。今后,筆者將進一步系統(tǒng)分析基于本體的數(shù)字檔案知識服務(wù)模式及實現(xiàn)路徑,繼續(xù)開展數(shù)字檔案知識服務(wù)系統(tǒng)的研究,為相關(guān)研究與實踐提供參考。

猜你喜歡
知識庫本體語義
Abstracts and Key Words
對姜夔自度曲音樂本體的現(xiàn)代解讀
語言與語義
基于TRIZ與知識庫的創(chuàng)新模型構(gòu)建及在注塑機設(shè)計中的應(yīng)用
高速公路信息系統(tǒng)維護知識庫的建立和應(yīng)用
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
基于Drupal發(fā)布學(xué)者知識庫關(guān)聯(lián)數(shù)據(jù)的研究
圖書館研究(2015年5期)2015-12-07 04:05:48
認(rèn)知范疇模糊與語義模糊
Care about the virtue moral education
卷宗(2013年6期)2013-10-21 21:07:52
青冈县| 潜江市| 普宁市| 惠州市| 巴彦县| 扶绥县| 原平市| 公安县| 泾源县| 永修县| 横峰县| 黄冈市| 柳州市| 奉节县| 托克逊县| 木兰县| 潞城市| 伽师县| 绵竹市| 乐昌市| 建瓯市| 东平县| 安泽县| 合阳县| 高唐县| 太保市| 灌阳县| 永年县| 北碚区| 乌海市| 荣昌县| 奈曼旗| 上虞市| 五指山市| 太白县| 康乐县| 土默特左旗| 辽宁省| 交城县| 西宁市| 上饶市|