常大偉 溫芳芳
[摘要]基于信息融合的檔案知識服務(wù),是借助信息融合的理念和技術(shù),對檔案信息資源、用戶需求信息等進(jìn)行綜合處理與協(xié)同利用,推動(dòng)檔案信息資源在數(shù)據(jù)層面的關(guān)聯(lián)和知識層面的重構(gòu),實(shí)現(xiàn)面向用戶需求的檔案知識發(fā)現(xiàn)和知識服務(wù)的過程。論文構(gòu)建了由一個(gè)目標(biāo)、兩種資源、三個(gè)模塊、四個(gè)環(huán)節(jié)構(gòu)成的基于信息融合的檔案知識服務(wù)框架,并從多源信息獲取、信息綜合處理、信息融合和檔案知識服務(wù)方面,探討了基于信息融合的檔案知識服務(wù)實(shí)現(xiàn)流程。
[關(guān)鍵詞]檔案服務(wù)知識服務(wù)檔案信息資源信息融合用戶需求
[分類號]G270
The Research on Archives Knowledge Service Based on Information Fusion
Chang Dawei, Wen Fangfang
(School of Information Management of Wuhan University, Wuhan, Hebei, 430072)
Abstract: Archives knowledge service based on information fusion is a process of realizing useroriented archives knowledge discovery and knowledge service. It relies on information fusion ideas and technologies to synthesize, cooperate archives information resources and user demands, promote association of archives information resources at the data layer and its reconstruction at the knowledge level. This paper constructed a framework of archives knowledge service consisting one goal, two kinds of resources, three modules and four links, discussed flow chart of it from the aspect of multisource information acquiring, information synthesizing, information integration and archives knowledge service.
Keywords: Archive Service;Archives Knowledge Service;Archive Information Resources;Infor? mation Fusion
服務(wù)是檔案工作的生命線,也是檔案工作的出發(fā)點(diǎn)和落腳點(diǎn)[1]。2016年,《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》出臺,要求到2020年“檔案利用服務(wù)模式創(chuàng)新和檔案信息開放取得實(shí)質(zhì)性進(jìn)展;檔案信息整合共享程度明顯提升,檔案利用服務(wù)更加便捷普惠,方便人民群眾的檔案利用體系更加完善”[2],進(jìn)一步明確了檔案服務(wù)工作的目標(biāo)和要求。在此背景下,如何通過檔案服務(wù)理念創(chuàng)新、服務(wù)手段優(yōu)化和服務(wù)模式變革,推動(dòng)檔案服務(wù)內(nèi)容由實(shí)體服務(wù)向數(shù)字化服務(wù)發(fā)展,服務(wù)職能由行政服務(wù)向社會化服務(wù)過渡,服務(wù)模式由信息服務(wù)向知識服務(wù)轉(zhuǎn)型[3],就成為檔案界需要重點(diǎn)關(guān)注的內(nèi)容之一。鑒于此,本文以檔案知識服務(wù)為主線,以信息融合為切入點(diǎn),在明晰基于信息融合的檔案知識服務(wù)內(nèi)涵的基礎(chǔ)上,構(gòu)建了基于信息融合的檔案知識服務(wù)的理論框架,探討了基于信息融合的檔案知識服務(wù)的實(shí)現(xiàn)流程,以期推動(dòng)檔案知識服務(wù)的實(shí)踐應(yīng)用。
1基于信息融合的檔案知識服務(wù)的提出
信息融合是綜合利用多種信息處理技術(shù),對多源信息資源進(jìn)行加工和協(xié)同利用,使不同形式的信息相互補(bǔ)充,以獲得對同一事物或目標(biāo)更客觀、更本質(zhì)認(rèn)識的過程[4]。信息融合借助加權(quán)平均法、卡爾曼濾波、貝葉斯估計(jì)法和基于神經(jīng)網(wǎng)絡(luò)、模糊邏輯、距離熵、隨機(jī)理論等融合算法,在聚類分析、數(shù)據(jù)關(guān)聯(lián)、本體構(gòu)建、語義分析、數(shù)據(jù)挖掘等技術(shù)的支持下,對多源、多模態(tài)信息進(jìn)行綜合處理,將大量多源、異構(gòu)、動(dòng)態(tài)、碎片化、不確定及稀疏的數(shù)據(jù)源、信息源、知識源相融合,挖掘出隱含的、有價(jià)值的、尚未被發(fā)現(xiàn)的新知識[5]。信息融合在多源信息處理和深層知識發(fā)現(xiàn)方面具有一定的優(yōu)勢,已被廣泛應(yīng)用于農(nóng)業(yè)知識服務(wù)、數(shù)字參考咨詢知識融合、集群知識融合與創(chuàng)新、知識庫構(gòu)建等具體領(lǐng)域。
結(jié)合信息融合與檔案知識服務(wù)的相關(guān)理論,筆者認(rèn)為基于信息融合的檔案知識服務(wù),是借助信息融合的理念和技術(shù),對檔案信息資源、用戶需求信息等進(jìn)行綜合處理與協(xié)同利用,推動(dòng)檔案信息資源在數(shù)據(jù)層面的關(guān)聯(lián)和知識層面的重構(gòu),實(shí)現(xiàn)面向用戶需求的檔案知識發(fā)現(xiàn)和知識服務(wù)的過程。具體來講,基于信息融合的檔案知識服務(wù),首先借助信息整合、信息聚類、關(guān)聯(lián)分析等信息融合技術(shù),對多源異構(gòu)的檔案信息資源進(jìn)行協(xié)同開發(fā),挖掘和發(fā)現(xiàn)其蘊(yùn)含的知識要素,形成檔案知識空間,實(shí)現(xiàn)檔案信息資源的融合;其次,對分散多元的用戶需求信息進(jìn)行獲取、組織和分析,構(gòu)建用戶需求模型,揭示用戶檔案知識需求的特征、偏好和趨勢等,實(shí)現(xiàn)用戶需求信息的融合;最后,將基于檔案信息資源融合的檔案知識空間和基于用戶需求信息融合的用戶需求模型進(jìn)行匹配,實(shí)現(xiàn)檔案知識服務(wù)的應(yīng)用融合,推動(dòng)面向需求的檔案知識服務(wù)的發(fā)展。
2基于信息融合的檔案知識服務(wù)的框架構(gòu)建
檔案知識服務(wù)的實(shí)質(zhì)是通過采集、整合、挖掘檔案信息資源,為用戶提供知識內(nèi)容和問題解決方案[6]。可以看出,檔案知識服務(wù)主要由檔案知識發(fā)現(xiàn)、用戶需求揭示和檔案知識服務(wù)提供三個(gè)核心要素組成。據(jù)此,本文構(gòu)建了由一個(gè)目標(biāo)(檔案知識服務(wù))、兩種資源(檔案信息資源和用戶需求信息)、三個(gè)模塊(檔案信息資源融合、用戶需求信息融合和檔案知識服務(wù)應(yīng)用融合)、四個(gè)環(huán)節(jié)(多源信息獲取、信息綜合處理、信息融合和檔案知識服務(wù))構(gòu)成的基于信息融合的檔案知識服務(wù)框架。
其中,檔案信息資源是檔案知識發(fā)現(xiàn)的資源基礎(chǔ),代表著檔案知識服務(wù)的資源供給;用戶需求信息是知識需求揭示的重要依據(jù),代表著檔案知識服務(wù)的社會需求;檔案信息資源融合是對檔案信息資源的再組織,是檔案知識發(fā)現(xiàn)的重要手段,其結(jié)果是形成檔案知識空間;用戶需求信息融合是對用戶需求信息進(jìn)行綜合處理,揭示用戶的檔案知識需求,其結(jié)果是形成用戶需求模型;檔案知識服務(wù)應(yīng)用融合是在檔案信息資源融合和用戶需求信息融合的基礎(chǔ)上,以社會需求為導(dǎo)向、以資源供給為基礎(chǔ)、以實(shí)際應(yīng)用為依據(jù)進(jìn)行的二次融合,其結(jié)果是形成檔案知識內(nèi)容和問題解決方案;多源信息獲取、信息綜合處理、信息融合、檔案知識服務(wù)四個(gè)環(huán)節(jié),是基于信息融合的檔案知識服務(wù)實(shí)現(xiàn)的具體流程;檔案知識服務(wù)是整個(gè)框架的出發(fā)點(diǎn)和落腳點(diǎn),通過一定的方式將檔案知識服務(wù)應(yīng)用融合形成的檔案知識內(nèi)容和問題解決方案提供給檔案用戶,滿足檔案用戶的知識需求。如圖1所示。
3基于信息融合的檔案知識服務(wù)的實(shí)現(xiàn)流程
圍繞多源信息獲取、信息綜合處理、信息融合和檔案知識服務(wù)四個(gè)環(huán)節(jié),從檔案信息資源獲取、用戶需求信息獲取、檔案信息資源綜合處理、用戶需求信息綜合處理、檔案信息資源融合、用戶需求信息融合、檔案知識服務(wù)應(yīng)用融合、檔案知識服務(wù)八個(gè)方面,詳細(xì)解析基于信息融合的檔案知識服務(wù)的實(shí)現(xiàn)流程。
3.1多源信息獲取
(1)檔案信息資源獲取
在基于信息融合的檔案知識服務(wù)中,檔案信息資源獲取就是結(jié)合我國檔案事業(yè)體制條塊分割的現(xiàn)狀和檔案信息資源存在形態(tài)的發(fā)展趨勢,通過機(jī)制體制的設(shè)計(jì)、技術(shù)方法的應(yīng)用等多種方式,對多源異構(gòu)的檔案信息資源進(jìn)行匯集,形成檔案信息資源集合。為增強(qiáng)多源異構(gòu)檔案信息資源的獲取能力,首先要加強(qiáng)國家數(shù)字檔案資源整合與服務(wù)機(jī)制的頂層設(shè)計(jì),建立由“國家數(shù)字檔案資源調(diào)查方案、整合模式、服務(wù)機(jī)制、保障體系”所組成的、具有普適性的國家數(shù)字檔案資源整合與服務(wù)的框架[7],推動(dòng)館際合作視閾下的檔案信息資源整合,構(gòu)建檔案信息資源跨機(jī)構(gòu)獲取的路徑[8];其次,拓展檔案信息資源獲取的資源范圍,加強(qiáng)網(wǎng)站、社交媒體等生成的新媒體文件的歸檔和整理工作;再次,推動(dòng)檔案信息資源獲取和整合的技術(shù)研究,探索元數(shù)據(jù)技術(shù)、跨庫存取技術(shù)、數(shù)據(jù)庫整合技術(shù)等在檔案信息資源整合中的應(yīng)用;最后,在檔案信息資源的獲取過程中,還應(yīng)該考慮到檔案信息資源的知識產(chǎn)權(quán)和信息安全保護(hù)等內(nèi)容。
(2)用戶需求信息獲取
網(wǎng)絡(luò)環(huán)境下檔案用戶的活動(dòng)空間、分布特征及利用需求都發(fā)生了極大的變化。檔案用戶的泛在性及需求的多元性[9],增加了檔案機(jī)構(gòu)進(jìn)行用戶需求信息獲取、用戶需求研究和檔案知識服務(wù)的難度。根據(jù)檔案知識服務(wù)對象性質(zhì)的不同,檔案知識服務(wù)可大致劃分為面向黨政機(jī)構(gòu)和面向社會公眾兩種類型。從目前檔案知識服務(wù)的實(shí)際來看,面向黨政機(jī)構(gòu)的檔案知識服務(wù)占據(jù)主導(dǎo)地位,面向社會公眾的檔案知識服務(wù)處于從屬地位,但對于社會公眾檔案知識服務(wù)的潛在需求也需要給予重視。為黨政機(jī)構(gòu)提供檔案知識服務(wù)是檔案機(jī)構(gòu)工作的重要內(nèi)容,在長期的檔案知識服務(wù)過程中形成了關(guān)于黨政機(jī)構(gòu)檔案知識需求的系統(tǒng)信息記錄,可將這一部分需求信息進(jìn)行收集、整理、開發(fā)和存儲,構(gòu)建檔案需求信息數(shù)據(jù)庫;而社會公眾的檔案知識需求,表現(xiàn)得較為零碎和分散,這一部分檔案需求信息的獲取難度較大,但可通過收集用戶在檔案服務(wù)平臺上的檢索記錄和瀏覽足跡等信息,開展檔案用戶需求調(diào)查、鼓勵(lì)用戶利用社交媒體進(jìn)行檔案需求表達(dá)等方式,獲取社會公眾的相關(guān)需求信息,并將其補(bǔ)充到前述檔案需求信息數(shù)據(jù)庫中。需要注意的是,檔案用戶知識需求信息的獲取是一個(gè)動(dòng)態(tài)持續(xù)的過程,需要在提供檔案知識服務(wù)的同時(shí)不斷收集和整理新的需求信息,為構(gòu)建用戶需求模型提供條件。
3.2信息綜合處理
(1)檔案信息資源綜合處理
檔案信息資源綜合處理的目的,是為檔案信息資源融合以及檔案知識管理系統(tǒng)、檔案知識庫等檔案知識空間的構(gòu)建,提供有序化、綜合性的信息資源。檔案信息資源綜合處理就需要針對檔案信息資源多源、多結(jié)構(gòu)、多模態(tài)等特點(diǎn),利用數(shù)據(jù)歸一、數(shù)據(jù)映射、異構(gòu)數(shù)據(jù)加權(quán)、數(shù)據(jù)過濾等方式對檔案信息資源進(jìn)行數(shù)據(jù)預(yù)處理,規(guī)范檔案信息資源的描述和組織方式;通過關(guān)聯(lián)揭示、領(lǐng)域本體構(gòu)建和語義標(biāo)注等,建立檔案信息資源底層特征與高層語義之間的映射關(guān)系,形成新的具有多重關(guān)聯(lián)的信息集合。通過檔案信息資源的綜合處理,推動(dòng)信息資源從淺層次的信息組織向深層次的知識化組織轉(zhuǎn)向,從單維的、孤立的、不成體系的信息資源集合向多維的、內(nèi)容關(guān)聯(lián)的、系統(tǒng)化的知識空間轉(zhuǎn)變[10],為檔案信息資源融合的實(shí)現(xiàn)提供支持。
(2)用戶需求信息綜合處理
用戶需求信息綜合處理的目的,是對用戶需求信息的特征進(jìn)行抽取、組織和關(guān)聯(lián),構(gòu)建用戶需求模型。首先,在用戶需求信息獲取和預(yù)處理的基礎(chǔ)上,識別和分析能夠反映用戶需求的信息,如檔案用戶類型、檔案利用頻次、利用時(shí)段、利用主題、利用內(nèi)容、利用領(lǐng)域等,抽取具有典型特征的關(guān)鍵詞或主題詞,構(gòu)建基于檔案用戶信息需求的領(lǐng)域詞典;其次,將前文構(gòu)建的檔案需求信息數(shù)據(jù)庫或用戶檢索記錄文本等,與基于檔案用戶信息需求的領(lǐng)域詞典進(jìn)行匹配,提取用戶需求特征,構(gòu)建用戶需求特征向量空間;最后,在用戶需求特征向量空間構(gòu)建的基礎(chǔ)上,進(jìn)一步對用戶需求特征進(jìn)行聚類和分析,揭示檔案用戶知識需求的深層次規(guī)律和利用需求的整體發(fā)展特點(diǎn)與趨勢。
3.3信息融合
(1)檔案信息資源融合
經(jīng)過對檔案信息資源的綜合處理,已經(jīng)初步形成檔案知識化利用的資源支撐體系。在檔案信息融合階段,更加注重利用多種信息技術(shù)對檔案信息資源進(jìn)行多方面、多層次的綜合處理,促進(jìn)檔案信息資源的協(xié)同利用、知識重構(gòu)和知識發(fā)現(xiàn)。在協(xié)同利用方面,圍繞特定的檔案知識服務(wù)內(nèi)容,通過檔案信息資源的聚類和關(guān)聯(lián),實(shí)現(xiàn)多源檔案信息資源的相互補(bǔ)充和印證,提高檔案知識挖掘和服務(wù)的精確性與完整性;在知識重構(gòu)方面,利用聚類分析、知識關(guān)聯(lián)、知識聚合等方法,對在內(nèi)容、特征、屬性等方面具有關(guān)聯(lián)關(guān)系的檔案信息資源進(jìn)行知識化組織,形成圍繞服務(wù)主題的各類檔案知識類型和檔案知識網(wǎng)絡(luò);在知識發(fā)現(xiàn)方面,借助數(shù)據(jù)挖掘、語義分析等信息技術(shù),挖掘檔案信息資源蘊(yùn)含的深層次的知識因子和價(jià)值要素,構(gòu)建檔案知識空間。
(2)用戶需求信息融合
用戶需求信息融合在信息融合思想和信息處理流程方面,與檔案信息資源融合具有很大的一致性,相關(guān)技術(shù)處理手段就不再累述。相對而言,用戶需求信息融合的側(cè)重點(diǎn)主要集中在如何在用戶需求特征向量空間的支持下,準(zhǔn)確地抽取和揭示用戶需求的內(nèi)容、特點(diǎn)等信息,并通過用戶需求信息的組織和建模,構(gòu)建能夠反映用戶需求主題、需求層次、需求領(lǐng)域等的用戶需求模型。用戶需求模型是有效開展檔案知識服務(wù)的重要依據(jù),可以為檔案知識服務(wù)方案的制定和策略的實(shí)施提供指引,改善當(dāng)前檔案知識服務(wù)目標(biāo)不明確、內(nèi)容不清晰的狀況。
(3)檔案知識服務(wù)應(yīng)用融合
在一定的規(guī)則支持下,通過檔案知識空間與用戶需求模型的對接和匹配,建立起檔案知識與用戶需求的數(shù)據(jù)關(guān)聯(lián),并圍繞用戶需求進(jìn)行檔案知識要素的抽取、聚類、挖掘和知識方案的生成,實(shí)現(xiàn)檔案知識服務(wù)的應(yīng)用融合,進(jìn)而實(shí)現(xiàn)了用戶需求引導(dǎo)下的檔案知識開發(fā)與服務(wù),推動(dòng)了檔案用戶需求與檔案信息資源供給之間的良性互動(dòng),提升檔案知識服務(wù)的效能。
3.4檔案知識服務(wù)
通過信息融合,檔案信息資源在數(shù)據(jù)層面改變了以往相互孤立的狀態(tài),在知識層面形成了較為完整的檔案知識體系,為檔案知識服務(wù)的開展提供了更為充分的條件。這就需要進(jìn)一步創(chuàng)新檔案知識服務(wù)的模式,優(yōu)化檔案知識服務(wù)的內(nèi)容,完善檔案知識服務(wù)的策略,以提升檔案知識服務(wù)能力。在檔案知識服務(wù)模式創(chuàng)新方面,目前已經(jīng)形成了基于新興技術(shù)的個(gè)性化檔案知識服務(wù)模式、基于內(nèi)容管理與開發(fā)的檔案知識服務(wù)模式、基于流程優(yōu)化的全方位檔案知識服務(wù)模式和依托管理機(jī)制的檔案知識服務(wù)模式等四種模式[11],為基于信息融合的檔案知識服務(wù)模式的創(chuàng)新提供了重要借鑒。這就要求在綜合分析不同模式優(yōu)缺點(diǎn)和適用性的基礎(chǔ)上,結(jié)合具體的需求環(huán)境和服務(wù)場景,探索基于信息融合的檔案知識服務(wù)的應(yīng)用問題;在檔案知識服務(wù)內(nèi)容優(yōu)化方面,可利用基于信息融合的檔案知識服務(wù)在檔案用戶需求與檔案信息資源融合方面的優(yōu)勢,根據(jù)用戶需求模型發(fā)掘出的常規(guī)性需求提供結(jié)構(gòu)化檔案知識服務(wù),也可以根據(jù)不同用戶的個(gè)性化需求提供即時(shí)性檔案知識服務(wù);在檔案知識服務(wù)策略完善方面,通過構(gòu)建檔案知識庫、檔案知識管理系統(tǒng)、檔案知識服務(wù)平臺等,提供檔案知識問答、檔案知識檢索、檔案知識導(dǎo)航、檔案知識推送等自助式檔案知識服務(wù),或檔案知識制定、檔案知識決策支持等協(xié)助式檔案知識服務(wù)。
4總結(jié)
檔案知識服務(wù)是深化檔案服務(wù)內(nèi)涵,提升檔案服務(wù)價(jià)值的重要方式。為推動(dòng)檔案知識服務(wù)的發(fā)展,本文以信息融合為研究的切入點(diǎn),在探討基于信息融合的檔案知識服務(wù)的內(nèi)涵和研究的需求與條件的基礎(chǔ)上,構(gòu)建了基于信息融合的檔案知識服務(wù)框架,并從多源信息獲取、信息綜合處理、信息融合和檔案知識服務(wù)方面重點(diǎn)探討了基于信息融合的檔案知識服務(wù)的實(shí)現(xiàn)流程。整體來講,目前基于信息融合的檔案知識服務(wù)在理論研究和技術(shù)實(shí)現(xiàn)方面尚處于探索階段,其實(shí)踐應(yīng)用還面臨著一系列的問題。這就要求,一方面加強(qiáng)基于信息融合的檔案知識服務(wù)的理論研究,充分借鑒不同學(xué)科、不同領(lǐng)域的信息融合理論和方法,探索適合多源異構(gòu)檔案信息資源融合的模式和策略;另一方面,強(qiáng)化信息技術(shù)在檔案知識服務(wù)中的應(yīng)用創(chuàng)新,加大信息集成、多模態(tài)信息融合、本體構(gòu)建、數(shù)據(jù)挖掘等技術(shù)在檔案信息資源融合與檔案知識服務(wù)中的應(yīng)用研究。
參考文獻(xiàn)
[1]李明華.在全國檔案局長館長會議上的工作報(bào)告[J].中國檔案,2017(1):16-24.
[2]全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要[EB/OL].[2017-10-14](2016-04-07). http://www.saac.gov.cn/news/2016-04/07/content_136280.htm.
[3]周鑫,倪麗娟,陳媛媛.國內(nèi)檔案服務(wù)研究進(jìn)程探析[J].檔案學(xué)研究,2017(2):68-73.
[4]化柏林.多源信息融合方法研究[J].情報(bào)理論與實(shí)踐,2013(11):16-19.
[5]祝振媛,李廣建.“數(shù)據(jù)—信息—知識”整體視角下的知識融合初探——數(shù)據(jù)融合、信息融合、知識融合的關(guān)聯(lián)與比較[J].情報(bào)理論與實(shí)踐,2017(2):12-18.
[6]畢建新,鄭建明.用戶目標(biāo)驅(qū)動(dòng)的檔案知識服務(wù)模型研究[J].浙江檔案,2014(8): 16-19.
[7]孫俐麗,吳建華.關(guān)于國家數(shù)字檔案資源整合與服務(wù)機(jī)制頂層設(shè)計(jì)的初步思考[J].檔案學(xué)研究,2016(1):57-61.
[8]張衛(wèi)東,孫振嘉.館際合作視閾下我國檔案文化資源整合路徑研究[J].檔案學(xué)通訊,2017(4):63-67.
[9]張衛(wèi)東.基層化與網(wǎng)絡(luò)化:新環(huán)境下檔案用戶資源整合與培育策略[J].檔案學(xué)研究,2017(1):42-46.
[10]陳蘭杰,侯鵬娟.數(shù)字文獻(xiàn)資源關(guān)聯(lián)關(guān)系揭示方法研究[J].圖書館,2015(2):41-45.
[11]牛力,袁亞月,韓小汀.對檔案信息知識化利用的幾點(diǎn)思考[J].檔案學(xué)研究,2017(3):26-33.