□文/李睿繹
(云南大學(xué)歷史與檔案學(xué)院 云南·昆明)
[提要]本文利用VOSviewer軟件,構(gòu)建2013~2023年國內(nèi)檔案信息化研究領(lǐng)域相關(guān)知識圖譜;利用NoteExpress軟件導(dǎo)出核心主題詞詞頻權(quán)重表與詞頻共現(xiàn)矩陣,并用Origin軟件對導(dǎo)出的數(shù)據(jù)進(jìn)行共詞分析,從而探明該領(lǐng)域熱點(diǎn)主題和發(fā)展趨勢,以期為我國檔案信息化建設(shè)工作拓展新的研究路徑。
2015 年,國務(wù)院辦公廳發(fā)布《國家標(biāo)準(zhǔn)化體系建設(shè)發(fā)展規(guī)劃(2016-2020 年)》,提出了推進(jìn)檔案信息化與電子檔案管理標(biāo)準(zhǔn)體系建設(shè)的部署和要求:針對檔案信息化標(biāo)準(zhǔn)跨行業(yè)、跨領(lǐng)域、跨專業(yè)的特點(diǎn),立足國內(nèi)需求,兼顧國際標(biāo)準(zhǔn)體系,建立涵蓋基礎(chǔ)共性、資源建設(shè)、信息服務(wù)、信息保障和應(yīng)用五部分的檔案信息化標(biāo)準(zhǔn)體系,實(shí)現(xiàn)我國檔案信息化建設(shè)全面、可持續(xù)、協(xié)調(diào)發(fā)展。由此可見,在社會信息化迅猛發(fā)展的大背景下,為扎實(shí)推進(jìn)國家信息化建設(shè),充分促進(jìn)國家信息化戰(zhàn)略的實(shí)施,我國政府早在2015 年就依據(jù)社會信息化的新形勢做出科學(xué)判斷,決定建立檔案信息化標(biāo)準(zhǔn)體系,并做出周密部署,以助推檔案管理工作向數(shù)字化和信息化方向轉(zhuǎn)型升級。2020 年,我國進(jìn)一步推行政府?dāng)?shù)據(jù)開放工作,決定建立“數(shù)字政府”,以適應(yīng)信息技術(shù)發(fā)展的高速度,而這也將檔案管理抬升到社會治理和公共服務(wù)的重要位置,檔案信息化建設(shè)被賦予了極為重要的戰(zhàn)略地位。
我國對檔案信息化的研究早在1997 年就已開始,2013 年時(shí)初具規(guī)模,2017 年后臻于成熟。國內(nèi)學(xué)者對該領(lǐng)域研究現(xiàn)狀及趨勢的總結(jié)和分析多集中于某一專題檔案,較少有對檔案信息化事業(yè)的綜合性、全面性分析,且大多以文獻(xiàn)概述或運(yùn)用基礎(chǔ)性圖表進(jìn)行統(tǒng)計(jì)分析的方式撰寫。
基于我國在該領(lǐng)域的研究現(xiàn)狀,筆者對2013~2023 年間檔案信息化研究領(lǐng)域的熱點(diǎn)關(guān)鍵詞進(jìn)行知識圖譜可視化及共詞分析,探析該領(lǐng)域的研究熱點(diǎn)與發(fā)展趨勢,以期為我國未來的相關(guān)研究提出創(chuàng)新型對策。
(一)研究方法。本文所采用的研究方法為知識圖譜可視化研究與共詞分析。筆者將使用VOSviewer 軟件,構(gòu)建相關(guān)知識圖譜,探析該領(lǐng)域的研究熱點(diǎn);使用NoteExpress 軟件導(dǎo)出核心主題詞詞頻權(quán)重表與詞頻共現(xiàn)矩陣,并用Origin 軟件對導(dǎo)出的數(shù)據(jù)表進(jìn)行皮爾遜相關(guān)系數(shù)計(jì)算,利用相關(guān)系數(shù)矩陣進(jìn)行共詞分析,繪制表征關(guān)鍵詞重合強(qiáng)度與聚類譜系的相關(guān)性聚類熱力圖,得出相關(guān)結(jié)論。
(二)數(shù)據(jù)來源。本文數(shù)據(jù)來源為CNKI 數(shù)據(jù)庫,以主題=“檔案信息化”或者篇關(guān)摘=“檔案信息化”進(jìn)行檢索,文獻(xiàn)發(fā)表時(shí)間為2013 年1 月1 日至2023 年9 月30 日,期刊類別為CSSCI、CSCD、北大核心期刊、NSSD、AMI、武大RCCSE 核心期刊等,剔除報(bào)紙、新聞報(bào)道與會議記錄等無關(guān)文獻(xiàn),用NoteExpress 進(jìn)行數(shù)據(jù)清洗去重,經(jīng)過最終整合,共收集到期刊文獻(xiàn)2,200 篇,歷年文獻(xiàn)數(shù)量與發(fā)布年度統(tǒng)計(jì)如圖1 所示,以此為樣本進(jìn)行分析。(圖1)
圖1 檔案信息化研究領(lǐng)域相關(guān)文獻(xiàn)發(fā)文量分布統(tǒng)計(jì)圖
利用VOSviewer 軟件進(jìn)行關(guān)鍵詞共現(xiàn)聚類分析,將關(guān)鍵詞出現(xiàn)的最小頻次設(shè)置為4,最終顯現(xiàn)了圖2 所示的208 個(gè)節(jié)點(diǎn)與1,638 條連線。每個(gè)節(jié)點(diǎn)代表一個(gè)關(guān)鍵詞,節(jié)點(diǎn)形狀大小與關(guān)鍵詞出現(xiàn)頻次呈正相關(guān),節(jié)點(diǎn)間連線表征其間的關(guān)聯(lián)程度與傳承程度。由圖2 可見,2005 年以來,該領(lǐng)域圍繞著“信息化戰(zhàn)略下的檔案治理思路”“檔案數(shù)字化管理模式與安全保障體系”“數(shù)字時(shí)代下企事業(yè)單位檔案信息資源與法規(guī)標(biāo)準(zhǔn)建設(shè)”“應(yīng)對檔案信息化新挑戰(zhàn)的創(chuàng)新策略”等主題進(jìn)行探討,基礎(chǔ)理論研究與實(shí)用技術(shù)研究并重,學(xué)科建設(shè)與工作實(shí)踐緊密結(jié)合。詞頻不低于48 次的關(guān)鍵詞信息如表1 所示,其中“檔案管理(0.48)”“信息化(0.3)”“信息化建設(shè)(0.12)”“信息化管理(0.13)”“事業(yè)單位(0.1)”“大數(shù)據(jù)(0.1)”“高校(0.1)”7 個(gè)關(guān)鍵詞的中介中心度均不低于0.1,說明此7 者為共現(xiàn)網(wǎng)絡(luò)的中心節(jié)點(diǎn),具有較大的影響力,在后續(xù)的相關(guān)研究中或?qū)⒊蔀橹髁?。(圖2、表1)
表1 檔案信息化研究領(lǐng)域高頻關(guān)鍵詞共現(xiàn)信息表(不少于28次)
圖2 檔案信息化研究領(lǐng)域關(guān)鍵詞共現(xiàn)聚類圖譜
皮爾遜相關(guān)系數(shù)是用于度量兩個(gè)變量之間線性相關(guān)程度的指標(biāo),其值介于-1 和1 之間,是最常被使用的相關(guān)系數(shù)之一,具有較好的科學(xué)性。筆者將文獻(xiàn)題錄導(dǎo)入NoteExpress 軟件進(jìn)行數(shù)據(jù)分析,導(dǎo)出關(guān)鍵詞詞頻矩陣,篩選出頻次不低于7 次的詞共現(xiàn)次數(shù)矩陣,如表2 所示,并合并同義詞,剔除無意義的主題詞,之后將其導(dǎo)入Origin,利用Correlation Plot 插件計(jì)算出表3 所示的皮爾遜相關(guān)系數(shù)矩陣,而后使用Heat Map with Dendrogram 插件,以組間平均距離法進(jìn)行系統(tǒng)聚類,距離類型選擇Euclidean,最終得出圖3 所示的相關(guān)性聚類熱力圖。(表2、表3、圖3)
表2 檔案信息化研究領(lǐng)域核心詞共現(xiàn)次數(shù)矩陣(部分)
表3 檔案信息化研究領(lǐng)域核心詞皮爾遜相關(guān)系數(shù)矩陣(部分)
圖3 檔案信息化研究領(lǐng)域核心詞相關(guān)性聚類熱力圖
高頻關(guān)鍵詞間兩兩組合,每個(gè)組合對應(yīng)一個(gè)矩形色塊,色塊顏色按相關(guān)系數(shù)值的大小從淺到深過渡,色塊的顏色越深,說明組合內(nèi)部兩關(guān)鍵詞的相關(guān)性越小,兩主題研究內(nèi)容間的重合度也就越低;反之,色塊越淺,相關(guān)性越大。由圖3 可見,重合度較高的詞簇主要有如下五組:第一,“檔案管理”與“現(xiàn)狀”“信息化”“問題”“信息化建設(shè)”“事業(yè)單位”“優(yōu)化策略”等詞均具有較高的關(guān)聯(lián)度,說明檔案管理模式與數(shù)字化、信息化方法融合發(fā)展的趨勢凸顯。第二,“檔案事業(yè)”與“高質(zhì)量發(fā)展”重合度較高,這與我國現(xiàn)階段檔案事業(yè)發(fā)展的政策背景緊密相關(guān)。2021 年,中共中央辦公廳、國務(wù)院辦公廳印發(fā)《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》指出:“‘十四五’時(shí)期,檔案工作對黨和國家各項(xiàng)事業(yè)的基礎(chǔ)性、支撐性作用更加突出。隨著新一代信息技術(shù)的廣泛應(yīng)用,檔案工作環(huán)境、對象、內(nèi)容發(fā)生巨大變化,迫切要求創(chuàng)新檔案工作理念、方法、模式,加快全面數(shù)字轉(zhuǎn)型和智能升級”。因此,檔案事業(yè)高質(zhì)量發(fā)展的相關(guān)部署被迅速提上日程。第三,“大數(shù)據(jù)背景”與“檔案管理人員”“檔案數(shù)據(jù)”緊密相關(guān)。第四,“區(qū)塊鏈技術(shù)”與“應(yīng)用”高度重合。第五,“智慧檔案”與“數(shù)字檔案館”“檔案管理系統(tǒng)”聯(lián)系密切。這三組熱點(diǎn)詞簇的研究趨向均與智慧檔案館建設(shè)與服務(wù)緊密相關(guān)。智慧檔案館是在采用云計(jì)算、大數(shù)據(jù)、區(qū)塊鏈等新技術(shù)的基礎(chǔ)上,對多元檔案資源實(shí)施智能化管理,并為用戶提供智慧化泛在服務(wù)的新型檔案館模式。
智慧檔案館建設(shè)成為研究熱點(diǎn)的原因在于:首先,在政策層面,國家政策的支持為智慧檔案館建設(shè)提供了堅(jiān)實(shí)的制度保障。2014 年,中共中央辦公廳、國務(wù)院辦公廳印發(fā)的《關(guān)于加強(qiáng)和改進(jìn)新形勢下檔案工作的意見》中指出,各級國家檔案館“要以實(shí)現(xiàn)檔案信息資源社會共享為目標(biāo),統(tǒng)籌協(xié)調(diào),充分利用已有的信息傳輸網(wǎng)絡(luò)和平臺,積極推進(jìn)檔案信息資源共享,開展遠(yuǎn)程利用”。由此可見,國家宏觀戰(zhàn)略要求檔案館構(gòu)建全國性檔案資源云存儲平臺,滿足用戶不斷變化的差異性信息需求,提供智慧化服務(wù)。其次,在技術(shù)層面,數(shù)字技術(shù)的交互性使得多媒體、元數(shù)據(jù)與靜態(tài)環(huán)境可以實(shí)現(xiàn)有機(jī)的融合。在社會數(shù)字化、智能化轉(zhuǎn)型背景下,數(shù)字人文專業(yè)應(yīng)運(yùn)而生,其將數(shù)字技術(shù)與人文知識緊密地結(jié)合在一起,不僅提升了人文學(xué)科相關(guān)研究的工作效率,拓寬了研究空間,還為人文學(xué)科注入了智能化研究方法與多元化研究范式,突破了傳統(tǒng)研究方法的邏輯局限與思維定式,檔案文本探勘、檔案信息可視化與數(shù)字化檔案策展則是數(shù)字人文領(lǐng)域的重點(diǎn)研究方向,極具創(chuàng)新性和前沿性。此外,移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新興技術(shù)的運(yùn)用,為智慧檔案館建設(shè)提供了有力支撐,實(shí)現(xiàn)跨時(shí)空的檔案信息資源共享和跨平臺的信息服務(wù)集成,使用戶可以一站式獲取所需的檔案信息資源。最后,在應(yīng)用層面,實(shí)踐成果的探索為智慧檔案館建設(shè)提供了絕佳的參考范例。例如,2012 年初中國聯(lián)通初步完成了數(shù)字檔案云平臺的搭建;北京量子偉業(yè)信息技術(shù)有限公司研發(fā)了國內(nèi)首款智慧檔案管理軟件——“PDE”數(shù)字檔案管理系統(tǒng);2014 年青島市智慧檔案館項(xiàng)目一期建設(shè)完成。這些工作成果均為智慧檔案館建設(shè)研究提供了極佳的經(jīng)驗(yàn)參考。
組間平均距離法,又稱為類平均法,是用兩個(gè)類別間各個(gè)數(shù)據(jù)點(diǎn)兩兩之間距離的平均來表示兩個(gè)類別之間的距離,大量實(shí)驗(yàn)結(jié)果表明,該方法是一種較為優(yōu)異和穩(wěn)健的方法,在多數(shù)情況下表現(xiàn)最佳。由圖3 可見,該領(lǐng)域核心詞自上而下可以劃分為6 個(gè)類團(tuán)。類團(tuán)1 包含“檔案法”“高質(zhì)量發(fā)展”“檔案事業(yè)”3 個(gè)主題詞,其主題可以歸納為新時(shí)代檔案事業(yè)高質(zhì)量發(fā)展的要求,該類團(tuán)僅反映了法治化的要求,此外還應(yīng)包括均衡化、創(chuàng)新化、綠色化、普惠化、智慧化等多方面的要求;類團(tuán)2 包括“數(shù)字轉(zhuǎn)型”“數(shù)字檔案室”“數(shù)字檔案館”3 個(gè)成員,其主題可歸納為數(shù)字檔案館(室)建設(shè);類團(tuán)3 涵括了“智慧檔案”“檔案管理系統(tǒng)”“互聯(lián)網(wǎng)時(shí)代”“數(shù)字檔案”4 個(gè)主題詞,其研究主題的具體性、微觀性和專業(yè)性特征明顯,即智慧化檔案管理系統(tǒng)設(shè)計(jì)與開發(fā);類團(tuán)4 包含“檔案治理”“檔案服務(wù)”“新《檔案法》”“檔案館”等8 個(gè)關(guān)鍵詞,其聚類主題為檔案事業(yè)的數(shù)字化轉(zhuǎn)型進(jìn)程,此處著重強(qiáng)調(diào)了數(shù)字化時(shí)代的檔案事業(yè)包括檔案信息資源管理、檔案利用服務(wù)與檔案安全保障體系建設(shè)等諸多重要方面;類團(tuán)5 包括“大數(shù)據(jù)技術(shù)”“檔案數(shù)據(jù)”“大數(shù)據(jù)背景”等6 個(gè)關(guān)鍵詞,該類團(tuán)的研究主題更為精細(xì),專注于大數(shù)據(jù)技術(shù)在檔案信息化管理中的應(yīng)用;類團(tuán)6 所含關(guān)鍵詞最多,說明該主題研究的熱度最高,研究成果的綜合性與應(yīng)用性最強(qiáng),可以概括為數(shù)字化時(shí)代企事業(yè)單位檔案信息化建設(shè)的實(shí)施路徑與優(yōu)化策略。
綜上所述,2013~2023 年間檔案信息化建設(shè)已成為我國檔案學(xué)界的熱點(diǎn)研究問題,研究進(jìn)度迅猛推進(jìn),發(fā)文量總體呈持續(xù)上升趨勢,并逐漸趨于基數(shù)較大的穩(wěn)定狀態(tài),且研究質(zhì)量不斷走向高質(zhì)化和成熟化。新興研究熱點(diǎn)集中在數(shù)字檔案館建設(shè)領(lǐng)域、信息安全維護(hù)領(lǐng)域、醫(yī)療衛(wèi)生系統(tǒng)應(yīng)用領(lǐng)域、電子政務(wù)結(jié)合領(lǐng)域,具有極強(qiáng)的國家政策契合性。研究特征可以總結(jié)為:研究視角廣博、研究方向多元、研究主體豐富、研究對象新穎、研究規(guī)模精細(xì)、研究層次深化。但是,國內(nèi)檔案學(xué)界對檔案信息化標(biāo)準(zhǔn)體系特征與內(nèi)容的研究有待進(jìn)一步完善;與“互聯(lián)網(wǎng)+”“云服務(wù)”“元宇宙”等新興概念以及文本挖掘和知識圖譜等新興技術(shù)的融合較少,其研究邊界有待進(jìn)一步開拓;與“圖情檔”一體化趨向的融合建設(shè)也未形成規(guī)?;难芯考海源M(jìn)一步探討。