■王明杰
2000-2016年我國數(shù)字檔案館研究現(xiàn)狀及熱點分析
■王明杰
本文以CNKI中有關(guān)“數(shù)字檔案館”的期刊論文作為樣本數(shù)據(jù),借助SATI和Ucinet等統(tǒng)計分析軟件,抽取文獻關(guān)鍵詞,對合作者進行社會網(wǎng)絡(luò)分析,對關(guān)鍵詞進行共現(xiàn)分析,繪制了我國數(shù)字檔案館研究的熱點知識圖譜。對數(shù)字檔案館當(dāng)前研究現(xiàn)狀進行計量分析,多角度揭示數(shù)字檔案館的發(fā)展現(xiàn)狀及研究熱點。
數(shù)字檔案館社會網(wǎng)絡(luò)分析關(guān)鍵詞共現(xiàn)分析文獻計量
(二)研究方法
主要使用SATI(StatisticalAnalysisToolfor Informetrics)和UCINET(universityofCalifornia atIrvineNETwork)等統(tǒng)計軟件,對關(guān)鍵詞進行共現(xiàn)分析。關(guān)鍵詞共現(xiàn)分析方法,是指抽取樣本文獻庫的高頻關(guān)鍵詞,構(gòu)造關(guān)鍵詞共詞矩陣,對關(guān)鍵詞共詞矩陣進行知識圖譜繪制,進而揭示熱點主題。[5]SATI主要對字段信息進行抽取,統(tǒng)計所得文獻的字段信息并構(gòu)建共現(xiàn)矩陣,包括作者、年度、期刊、地址、關(guān)鍵詞詞頻及關(guān)鍵詞共現(xiàn)矩陣、作者共現(xiàn)矩陣等。UCINET則對這些類項之間的關(guān)系進行具體的分析。UCINET以處理社會網(wǎng)絡(luò)數(shù)據(jù)及其他相似性數(shù)據(jù)為長,可以進行社會網(wǎng)絡(luò)量化分析。同時筆者使用嵌入的NetDraw,繪制了數(shù)字檔案館研究圖譜,以便清晰地展示社會網(wǎng)絡(luò)關(guān)系及熱點研究。
(一)文獻發(fā)表年度分析
根據(jù)SATI統(tǒng)計結(jié)果,2000-2016年數(shù)字檔案館研究相關(guān)的論文發(fā)表數(shù)量及時間關(guān)系如圖1所示,整體呈現(xiàn)增長態(tài)勢??煞譃閮蓚€階段:①快速起步階段(2000-2005)。1999年我國開始實施“政府上網(wǎng)工程”,檔案部門隨之開始進行檔案信息化,這一階段的研究成果呈現(xiàn)出迅速增長的態(tài)勢,并在2005年達到一個高峰,這說明在新世紀(jì),人們對數(shù)字檔案館的研究激情非常高漲,這是數(shù)字檔案館研究的起步階段;②穩(wěn)速發(fā)展階段(2006至今)。研究成果呈曲折發(fā)展態(tài)勢,這一階段的文獻變化幅度比較大,一直處于起伏狀態(tài),但總體仍呈上升趨勢。2008、2011年又出現(xiàn)了高峰期,并在2013年達到最高峰。但由圖可見,核刊文獻數(shù)量所占比重一直較低,但發(fā)文量很穩(wěn)定。
圖12000 -2016年發(fā)文量
(二)來源及作者分析
1.文獻期刊來源分析
根據(jù)SATI統(tǒng)計,1239篇論文來源于214種不同的期刊,本文選取≥17篇文獻的期刊,即每年至少發(fā)一篇論文的期刊進行統(tǒng)計分析,按照核刊與非核刊的分類標(biāo)準(zhǔn)生成圖2。由圖可見,刊載論文較多的期刊有:《蘭臺世界》《黑龍江檔案》《浙江檔案》《中國檔案》《檔案學(xué)通訊》《檔案學(xué)研究》《檔案管理》《檔案與建設(shè)》《檔案》《北京檔案》《云南檔案》《湖北檔案》《辦公室業(yè)務(wù)》《蘭臺內(nèi)外》《機電兵船檔案》《山東檔案》《辦公自動化》等21種期刊。檔案學(xué)科的期刊種類占總期刊11%,共發(fā)表論文870篇,其中≥17篇論文期刊中檔案學(xué)科的期刊占80%,共825篇論文。這說明數(shù)字檔案館研究的主體范圍非常廣泛,但檔案學(xué)科是數(shù)字檔案館研究的核心。
2.高產(chǎn)作者分析
圖2 文獻來源期刊分布
在2000-2016年,1239篇論文中共1293名作者,1.04人/篇,第一作者共945名,人均發(fā)文1.31篇。其中≥6篇的作者如表1所示,可見,潘連根、程妍妍、唐艷芳和薛四新等是近16年來的高產(chǎn)作者,也是數(shù)字檔案館研究的核心作者。潘連根[6][7][8]主要研究了數(shù)字檔案館的定義及特征,并對數(shù)字檔案館的建設(shè)進行了前期研究;傅榮校[9]、金更達[10]、程妍妍[11]等對數(shù)字檔案館建設(shè)模式及相關(guān)網(wǎng)絡(luò)技術(shù)和規(guī)范標(biāo)準(zhǔn)進行了深入研究;唐艷芳[12]、管先海[13]等在信息咨詢服務(wù)方面進行了探討;此外薛四新[14]、周楓[15]等對云計算和大數(shù)據(jù)環(huán)境下數(shù)字檔案館的應(yīng)對進行了相關(guān)研究。
表1 高產(chǎn)作者頻次表
本文選取≥9篇的高產(chǎn)作者進行具體分析,如圖3所示,下圖中的諸位作者都是在數(shù)字檔案館開展過深入研究,并發(fā)表了一系列相關(guān)文章;圖3為我們呈現(xiàn)了數(shù)字檔案館研究學(xué)者的主要研究特征:引領(lǐng)性研究,潘連根在2002年發(fā)表了兩篇關(guān)于數(shù)字檔案館的研究后,在2004年到2007年進行了深入研究,發(fā)表了18篇文章,引領(lǐng)了數(shù)字檔案館研究的浪潮;階段性研究,唐艷芳分別在2002-2003年、2006年、2010-2011年三個階段對數(shù)字檔案館進行了研究和探討;持續(xù)性研究,金更達在2004-2008年持續(xù)關(guān)注并對數(shù)字檔案館進行了體系性的研究。不同的作者在不同時期都曾在數(shù)字檔案館領(lǐng)域內(nèi)進行過深入研究,但持續(xù)性與連續(xù)性不強。
圖3 高產(chǎn)作者發(fā)文量
3.合作者社會網(wǎng)絡(luò)分析
選取發(fā)表論文≥2的作者(230名),通過SATI生成作者共現(xiàn)矩陣,然后導(dǎo)入專門處理社會網(wǎng)絡(luò)數(shù)據(jù)的Ucinet,生成圖4高產(chǎn)作者合作網(wǎng)絡(luò)。節(jié)點的大小表示該節(jié)點的中心性,與該節(jié)點作者合作人數(shù)越多,節(jié)點就會越大,中心性越高。圖4中,作者被聚類為20個學(xué)術(shù)合作群,分為以下三種類型:①最主要的是2人組的學(xué)術(shù)合作組,這種組合作方式占總學(xué)術(shù)合作組的75%,②3人組的學(xué)術(shù)合作群占13.3%,兩組分別為高校內(nèi)部和高校間合作。③4人組的學(xué)術(shù)合作網(wǎng)占20%,均為高校與企業(yè)合作。
重點討論以兩人組的學(xué)術(shù)合作,他們的主要合作方式有以下三種:高校內(nèi)部合作53.3%,如唐艷芳和溫獻英同屬于湘潭大學(xué);企業(yè)內(nèi)部合作26.7%,如段文和袁向陽同屬于西北核技術(shù)研究所;高校與企業(yè)合作20%,如楊智勇和周楓,分別來自上海大學(xué)和中國商用飛機有限責(zé)任公司。由上可知,2人組且同單位的合作率最高;高校是數(shù)字檔案館研究的主要陣地,主要分布于京津和江浙滬;同時高校與企業(yè)數(shù)字檔案館研究者相互支持,共同發(fā)展。
表2 高頻關(guān)鍵詞
圖4 高產(chǎn)作者合作網(wǎng)絡(luò)
(三)高頻關(guān)鍵詞頻率分析
關(guān)鍵詞是從論文中提取出能夠反映論文主題內(nèi)容的詞條,通過分析高頻詞能夠得出期間研究熱點內(nèi)容。1239篇論文中共抽取出2502個不同的關(guān)鍵詞,結(jié)合關(guān)鍵詞的代表性和知識圖譜清晰顯示對關(guān)鍵詞數(shù)量的限制,本文將頻率閾值設(shè)置為≥30,即選取出頻數(shù)前30的高頻關(guān)鍵詞(見表2)進行歸納分析。由表可見,關(guān)鍵詞頻次之間的差異非常大,數(shù)字檔案館的頻率高達926次,其次數(shù)字檔案館建設(shè)、信息服務(wù)、檔案數(shù)字化、信息資源、云計算、信息技術(shù)、知識管理、檔案網(wǎng)站的頻率也非常高,以上都是數(shù)字檔案館研究的熱點內(nèi)容。
(四)關(guān)鍵詞共現(xiàn)分析
關(guān)鍵詞不是孤立存在的,關(guān)鍵詞共現(xiàn)矩陣能夠直觀得展現(xiàn)出關(guān)鍵詞與關(guān)鍵詞之間的聯(lián)系,進一步揭示數(shù)字檔案館研究內(nèi)容的內(nèi)在相關(guān)性及其內(nèi)部微觀結(jié)構(gòu)。本文選取頻率≥10的關(guān)鍵詞,生成高頻關(guān)鍵詞共現(xiàn)矩陣(表3)和高頻關(guān)鍵詞歸一矩陣(表4)。
關(guān)鍵詞矩陣中的共現(xiàn)變化范圍是0-1,數(shù)值越大,相互之間的相似性就越大,也就是這兩個關(guān)鍵詞之間的關(guān)聯(lián)性越大。如表4所示,數(shù)字檔案館建設(shè)與檔案數(shù)字化的相似度為0.1616,是關(guān)鍵詞中聯(lián)系最緊密的,誠然,檔案數(shù)字化是數(shù)字檔案館研究中不可避開的部分。而數(shù)字檔案館與信息服務(wù)之間的相似性為0,則可能是系統(tǒng)在提取字段、分析字段時的不規(guī)范設(shè)置造成的。
表3 高頻關(guān)鍵詞共現(xiàn)矩陣(部分)
表4 高頻關(guān)鍵詞歸一矩陣(部分)
圖5 研究熱點知識圖譜
圖6 高頻詞研究熱點知識圖譜
(五)研究熱點脈絡(luò)分析
利用Ucinet和Netdraw對關(guān)鍵詞共現(xiàn)矩陣進行可視化分析,根據(jù)關(guān)鍵詞頻次分析,筆者將關(guān)鍵詞共現(xiàn)矩陣設(shè)為“100*100”,可以得出數(shù)字檔案館研究熱點及其交互關(guān)系,見圖5。藍色方框代表該領(lǐng)域的研究點,連接研究點的雙向箭頭表示這兩個研究點存在共現(xiàn)關(guān)系。該研究點的箭頭越多,表示其與越多的研究點交叉相關(guān),是數(shù)字檔案館研究領(lǐng)域的核心,反之表示該研究點受到的關(guān)注度較低,參與人員較少。箭頭交叉形成黑色陰影,陰影越重,代表該研究熱度越高,反之代表該研究點的關(guān)注度越低,發(fā)表的相關(guān)論文也越少。
依據(jù)圖6可將數(shù)字檔案館研究的核心研究領(lǐng)域鎖定為以下3層區(qū)域:
數(shù)字化檔案、館藏檔案、檔案信息、數(shù)字檔案館建設(shè)、檔案事業(yè)是核心層。1999年,政府實施“政府上網(wǎng)工程”,我國開始進行檔案數(shù)字化,2002年《全國檔案信息化建設(shè)實施綱要》提出要加快檔案資源數(shù)字化的進程,我國檔案館全面開始檔案數(shù)字化工程,同時在摸索中開始了數(shù)字檔案館的建設(shè),此后,我國學(xué)者對數(shù)字檔案館建設(shè)的背景、條件、功能、模式、技術(shù)、風(fēng)險對策及標(biāo)準(zhǔn)體系等進行了全面深入的研究;信息服務(wù)、用戶需求、信息資源、資源共享、檔案網(wǎng)站、檔案管理系統(tǒng)、網(wǎng)絡(luò)技術(shù)是第二層。數(shù)字檔案館服務(wù)是數(shù)字檔案館價值的最終體現(xiàn),也是檢驗數(shù)字檔案館是否成功的重要標(biāo)志之一。[16]檔案信息資源怎樣實現(xiàn)共享、如何為用戶提供更好的信息咨詢服務(wù),怎樣保障數(shù)字檔案館高效、平衡建設(shè)是這一層主要探討的問題;高校數(shù)字檔案館、云計算、大數(shù)據(jù)、知識產(chǎn)權(quán)、網(wǎng)絡(luò)安全、知識服務(wù)、元數(shù)據(jù)、生態(tài)系統(tǒng)是最外層。在信息時代的背景下,數(shù)字檔案館的研究步入了新領(lǐng)域,我國學(xué)者積極探索了基于大數(shù)據(jù)、云計算的數(shù)字檔案館建設(shè)與管理。
綜上所述,新世紀(jì)以來國內(nèi)數(shù)字檔案館的研究和實踐受到信息技術(shù)、網(wǎng)絡(luò)通訊及國家政策的重大影響,數(shù)字檔案館的研究始終是檔案學(xué)界的研究重點,近17年來,數(shù)字檔案館研究主體不斷多元,研究內(nèi)容不斷深入,研究主題不斷細(xì)化,數(shù)字化檔案、數(shù)字檔案館建設(shè)、資源建設(shè)、信息服務(wù)、資源共享、知識管理、云計算、大數(shù)據(jù)等都是數(shù)字檔案館研究領(lǐng)域主要學(xué)術(shù)合作群研究的重要內(nèi)容,但合作者社會網(wǎng)絡(luò)過于零散,該領(lǐng)域研究者的合作規(guī)模較小,且學(xué)者研究的持續(xù)性和連續(xù)性需要繼續(xù)加強。
[1]金波等.數(shù)字檔案館生態(tài)系統(tǒng)研究[M].北京:學(xué)習(xí)出版社,2014:6.
[2]朱小怡等.數(shù)字檔案館建設(shè)理論與實踐[M].上海:華東師范大學(xué)出版社,2007:1.
[3]戴維·比爾曼:虛擬檔案[A].第十三屆國際檔案大會文件報告集[C].中國檔案出版社,1997: 120.
[4]馮惠玲.無紙收藏《擁有新記憶——電子文件管理研究》摘要之二[J].檔案學(xué)通訊,1998(2): 47-50.
[5]郭樹行,談斯奇.關(guān)鍵詞共現(xiàn)研究趨勢分析[J].科技資訊,2011(32):204-205.
[6]潘連根.數(shù)字檔案館的定義及特征——數(shù)字檔案館研究之二[J].浙江檔案,2004(4):7-9.
[7]潘連根.數(shù)字檔案館的功能及類型——數(shù)字檔案館研究之三[J].浙江檔案,2004(5):7-8+18.
[8]潘連根.數(shù)字檔案館的組織形式、系統(tǒng)模式和運作方式——數(shù)字檔案館研究之四[J].浙江檔案,2004(6):4-6+28.
[9]傅榮校,陳榮紅.數(shù)字檔案館模式研究(二)——現(xiàn)階段綜合性數(shù)字檔案館建設(shè)模式初步介紹[J].檔案學(xué)通訊,2005(5):59-62.
[10]金更達.基于OAIS的數(shù)字檔案館系統(tǒng)框架研究[J].浙江檔案,2007(4):38-41+45.
[11]程妍妍,李圓圓.我國數(shù)字檔案館標(biāo)準(zhǔn)規(guī)范體系研究[J].檔案學(xué)通訊,2014(6):53-57.
[12]唐艷芳.數(shù)字檔案館檔案信息服務(wù)平臺的構(gòu)建[J].檔案學(xué)研究,2006(5):44-48.
[13]管先海.數(shù)字檔案館用戶研究[J].湖北檔案,2004(12):11-13.
[14]薛四新,陶水龍,崔偉.數(shù)字檔案館云計算建設(shè)模式的思考——以北京市區(qū)域性數(shù)字檔案館為例[J].檔案學(xué)研究,2012(3):62-64.
[15]周楓,楊智勇.基于大數(shù)據(jù)的數(shù)字檔案館信息服務(wù)模型構(gòu)建[J].北京檔案,2015(8):26-29.
[16]陳忠海,崔曉惠.數(shù)字檔案館信息服務(wù)研究綜述[J].檔案管理,2008(6):21-23.
作者單位:上海大學(xué)圖書情報檔案系
一、數(shù)據(jù)來源和研究方法
國學(xué)術(shù)期刊
總庫為平臺,以“數(shù)字檔案館”為檢索詞,篇名為檢索項,選取2000.1.1-2016.11.30為時間界限,共檢索出1347篇文獻,手動剔除動態(tài)、消息、會議摘要、報告等非學(xué)術(shù)性文獻,共計1239篇。
20世紀(jì)90年代,在技術(shù)推動下的“信息社會”與改革開放推動下的“轉(zhuǎn)型社會”共同作用下,社會數(shù)字化發(fā)展受到社會的高度重視,[1]1994年瑪格麗特·海茲喬姆(MargaretHedstrom)率先提出“電子檔案館”的概念,[2]1996年戴維·比爾曼(DavidBearman)提出“虛擬檔案館”,[3]1998年馮惠玲進一步提出“電子檔案館”亦可稱為“數(shù)字檔案館”、“虛擬檔案館”或“無墻檔案館”,[4]2000年5月第一個數(shù)字檔案館研究項目——“深圳數(shù)字檔案館系統(tǒng)工程的研究與開發(fā)”正式立項,由此,我國開始了比較系統(tǒng)的數(shù)字檔案館研究。自新世紀(jì)以來,數(shù)字檔案館研究受到了更多學(xué)者的關(guān)注與研究,已取得諸多研究成果,也已成為我國檔案事業(yè)建設(shè)研究的熱點領(lǐng)域。本文針對CNKI中2000年以來的期刊論文進行統(tǒng)計分析,以期梳理并總結(jié)新世紀(jì)以來我國數(shù)字檔案館研究的現(xiàn)狀及研究熱點。
(一)數(shù)據(jù)來源