李曉明
摘 要:為系統(tǒng)總結(jié)我國檔案學文獻定量研究的發(fā)展現(xiàn)狀,分析近年的研究熱點,依據(jù)從中國知網(wǎng)檢索獲取的相關文獻及其增長的數(shù)量變化,將檔案學文獻定量研究近30年的發(fā)展劃分為三個階段,分析了各階段的主要特征;結(jié)合使用CiteSpace繪制的關鍵詞共現(xiàn)網(wǎng)絡知識圖譜,從三個層面梳理了近五年檔案學文獻定量研究的熱點。
關鍵詞:檔案學;文獻定量研究;文獻計量;研究熱點;知識圖譜;CNKI;CiteSpace
Abstract: In order to systematically summarize the development situation of literature quantitative research on archival science, and analyze the research hotspots in China in recent years, this paper divided the 30 years research into 3 stages and analyzed the main features of the different stages, based on the relevant literatures obtained from CNKI by the range of the literature growth. The hotspots of literature quantitative research on archival science in recent five years are analyzed from three aspects, with the help of the network knowledge map of keywords drawn by the CiteSpace software.
Keywords: archival science; literature quantitative research; bibliometrics; research hotspots; mapping knowledge domains; CNKI;CiteSpace
1 引言
文獻定量研究是指運用文獻計量、科學計量、情報計量、社會網(wǎng)絡分析等定量分析方法,從文獻及其有關計量元素的數(shù)量及其關系和變化等角度來分析學科或主題領域發(fā)展變化的一種研究方法,旨在通過定量化的研究來揭示學科或主題領域的現(xiàn)象、過程和規(guī)律。文獻計量是最早使用并沿用至今的文獻定量研究方法,在我國的研究運用始于上世紀70年代末[1]??茖W計量、情報計量、信息計量等也隨著技術和科學的發(fā)展,在文獻計量的基礎上發(fā)展起來,成為關系緊密而又難分難解的鄰近學科,也一并成為文獻定量研究的幾類主要方法。近年來社會網(wǎng)絡分析、知識圖譜和可視化等隨著計算機技術而成熟起來的方法,為文獻定量研究注入了新的活力。
文獻定量研究原本是圖書館學科的研究方法,檔案學作為同屬一個專業(yè)類的學科,在學科發(fā)展過程中注重借鑒這種方法而使之在檔案學研究中得到越來越多的運用。從中國知網(wǎng)(CNKI)檢索到的最早的檔案學文獻定量研究論文發(fā)表于1989年,至今已有近30年的歷史?;仡櫤褪崂磉@近30年的歷程,總結(jié)發(fā)展過程中的經(jīng)驗,分析其中的問題及不足并尋求解決之道,對于促進檔案學文獻定量研究具有現(xiàn)實意義。2014年,王新才等[2]以CNKI期刊導航中的27本檔案學期刊為統(tǒng)計源,對運用計量法研究的學術論文進行統(tǒng)計;2016年,陳忠海等[3]統(tǒng)計分析了2004-2015年《檔案學通訊》《檔案學研究》刊載應用定量研究方法的論文,其中涉及文獻調(diào)查、h指數(shù)等文獻定量研究的幾類方法。盡管已有少量的相關研究,但這些研究有的分析的樣本范圍不夠全面,有的分析的視角超出了文獻定量研究的范疇。因此,有必要以種類更多、數(shù)量更大的樣本為依據(jù),進行深入的總結(jié)和分析。
2 研究依據(jù)與方法
本研究以從中國知網(wǎng)檢索獲取的檔案學文獻定量研究的期刊、會議、學位論文作為分析依據(jù);以文獻計量和知識圖譜分析為主要研究方法;以CiteSpace[4]及自編軟件為數(shù)據(jù)處理和分析工具。
2.1樣本文獻檢索。為確保樣本數(shù)量盡可能接近總體,采用了分次檢索的方法,經(jīng)反復調(diào)試后,限定檢索年限為1989-2016年。第一次以“計量、知識圖譜”等28個定量研究相關詞匯為檢索詞對期刊、博士、碩士、特色期刊、學術輯刊和國內(nèi)會議共六個數(shù)據(jù)庫進行篇名檢索,再以“檔案、依法治檔”等23個檔案專業(yè)詞匯在結(jié)果中檢索篇名;第二次先以28個文獻定量研究相關詞匯對期刊、特色期刊和學術輯刊三個期刊類數(shù)據(jù)庫進行篇名檢索,再以“檔案學研究”等29種檔案期刊刊名(含曾用刊名)在結(jié)果中檢索來源期刊,檢索時間是2017年4月26日,兩次檢索的結(jié)果分別為3249篇和2001篇,作為初選的樣本數(shù)據(jù)。
2.2 樣本數(shù)據(jù)處理。由于兩次檢索結(jié)果會有部分期刊類的重復數(shù)據(jù),同時為提高查全也勢必造成較多的誤檢,必須進行細致的數(shù)據(jù)處理。數(shù)據(jù)處理由以下幾個過程完成:將兩次檢索的結(jié)果分別保存為電子表格格式后,用WPS表格轉(zhuǎn)換成數(shù)據(jù)表格式(DBF);利用自編的數(shù)據(jù)庫軟件進行作者、關鍵詞和機構(gòu)的拆分;合并兩次檢索數(shù)據(jù)并自動刪除重復數(shù)據(jù);通過逐一核對原文,剔除無關數(shù)據(jù),修正了擬作為有效樣本的題錄數(shù)據(jù),一稿多投的保留一篇,同時對擬作為樣本的數(shù)據(jù)進行了進一步加工(從正文中抽取了研究主題、方法等文獻題錄外的部分計量元素);利用自編的機構(gòu)字典,統(tǒng)一了機構(gòu)名稱,區(qū)分了同名作者,清除了CNKI的機標關鍵詞,并對部分關鍵詞進行了規(guī)范。完成以上處理后,得到有效樣本496篇,其中期刊論文473篇、學位論文20篇、會議論文3篇。
文獻被引和下載數(shù)據(jù)也檢索自CNKI,由自編軟件處理后合并到統(tǒng)計分析用的數(shù)據(jù)表中,本研究中用到了文獻被引頻次。endprint