国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CiteSpaceⅢ的檔案資源研究文獻可視化分析

2018-09-10 03:08:34
山西檔案 2018年5期
關(guān)鍵詞:圖譜聚類軟件

檔案作為信息的承載體,天生具有資源屬性。檔案由于原始性﹑真實性,發(fā)揮了其他形式信息資源不可替代的作用。在檔案學界,關(guān)于檔案資源方面的文獻在不斷增長,具體包括檔案資源的整合建設(shè)﹑開發(fā)利用﹑評估體系﹑服務(wù)模式等方面。在這些研究中,馬伏秋[1]采用計量分析的方法,從論文作者﹑引文﹑內(nèi)容三個方面,對2000—2014年間在檔案學兩種CSSCI來源期刊《檔案學通訊》《檔案學研究》上發(fā)表的關(guān)于檔案信息資源開發(fā)與利用的論文進行統(tǒng)計分析;周耀林[2]對2000—2009年間檔案信息資源建設(shè)相關(guān)論文的數(shù)量﹑研究主體﹑核心高頻詞匯等進行了分析。本文旨在通過可視化知識圖譜軟件CiteSpaceⅢ,對CSSCI(中文社會科學引文索引)數(shù)據(jù)庫中收錄的檔案資源方面相關(guān)文獻進行分析。

一、數(shù)據(jù)來源和分析工具

(一)數(shù)據(jù)來源

CSSCI(中文社會科學引文索引)作為一個專門的引文數(shù)據(jù)庫,可以檢索從1998年到目前為止的來源期刊論文及其被引用情況。眾所周知,CSSCI來源期刊是經(jīng)過嚴格選擇的,收錄的文獻質(zhì)量較高,且數(shù)據(jù)庫收錄文獻引用情況完備,界面簡潔明了,檢索結(jié)果精確。[3]本文以CSSCI(中文社會科學引文索引)數(shù)據(jù)庫中的文獻資料為數(shù)據(jù)來源,檢索時間段為1998年—2017年,分別以“關(guān)鍵詞=檔案資源”“所有字段=檔案資源”“篇名=檔案資源”為檢索式進行檢索,分別返回119﹑141﹑96條記錄,為了保證查全文獻,最終以“篇名=檔案AND篇名=資源”為檢索式進行檢索,共得到323條文獻記錄。

(二)分析工具

本文選取美國德雷賽爾大學陳超美教授及其團隊研發(fā)的可視化軟件CiteSpaceⅢ作為分析工具。CiteSpace工具自從2005年被引入國內(nèi)學術(shù)界,就得到了學術(shù)界的廣泛關(guān)注。CiteSpace軟件可以分析合作﹑共現(xiàn)﹑共引﹑耦合這四種關(guān)聯(lián)數(shù)據(jù)。本文具體用到的功能主要有:共被引文獻分析﹑合著作者分析﹑關(guān)鍵詞分析。通過這些分析,探查檔案資源領(lǐng)域有影響力的文章及作者,分析檔案資源領(lǐng)域研究內(nèi)容及熱點。

二、檔案資源研究引文分析

在CiteSpaceⅢ軟件界面,時間范圍選擇從1998年到2017年,時間分區(qū)(Year Per Slice)設(shè)定為1,即共分為20個時間區(qū);主題詞來源選擇文獻標題(Title)﹑摘要(Abstract)﹑作者關(guān)鍵詞(Authour Keywords)﹑附加關(guān)鍵詞(Keywords Plus);網(wǎng)絡(luò)節(jié)點選擇引用文獻(Cited Reference),數(shù)據(jù)抽取對象為top20,即設(shè)置每一時間區(qū)取前20條記錄;“剪枝算法”選擇路徑搜索(pathfinder)算法,選擇此算法是為了使構(gòu)建的圖譜結(jié)構(gòu)更加明顯。運行軟件,得到檔案資源研究的作者共被引網(wǎng)絡(luò)圖譜,見圖1。

圖1 檔案資源研究的作者共被引網(wǎng)絡(luò)圖譜

圖1體現(xiàn)了各研究者與他人之間的共被引關(guān)系以及這種聯(lián)系的強度。圖譜中的圓形代表高被引作者,節(jié)點的大小和被引頻次成正相關(guān)關(guān)系。兩節(jié)點之間有連線代表節(jié)點作者之間存在共被引關(guān)系,連線的粗細表示作者共被引次數(shù)的多少,連線越粗表示兩位作者多次被共同引用,表示研究領(lǐng)域相一致或有交叉。節(jié)點圈的厚度表明了被引作者的中心性。

被引頻次和中心性并不是正相關(guān)的,這是因為中心性刻畫的是點在整個網(wǎng)絡(luò)中的重要程度。有些文章被引頻次可能很高,但是與網(wǎng)路中其他節(jié)點之間聯(lián)系并不緊密,其中心性就會比較低。一般來說,高被引頻次文章及高中心性文章共同構(gòu)成了研究領(lǐng)域的關(guān)鍵性文獻。馮惠玲從宏觀的角度認為,數(shù)字資源是當那資源的重要組成,建議構(gòu)建“中國記憶”大型數(shù)字資源庫。[4]何振等從組織機構(gòu)角度構(gòu)想了國家檔案資源整合與共享工程。[5]錢毅從技術(shù)角度探討了數(shù)字檔案館系統(tǒng)管理策略。[6]呂元智就具體數(shù)字檔案資源語義描述工作進行了探討。[7]肖希明則研究了國外三館(圖書館﹑檔案館和博物館)數(shù)字資源整合研究進展。[8]需要說明的是,Burst表示引文次數(shù)激增,對應(yīng)文章為胡小琳的《論檔案資源的社會共享》,主要論述了實現(xiàn)檔案資源社會共享的策略和途徑。[9]

三、檔案資源研究關(guān)鍵詞共現(xiàn)分析

共詞分析主要是指通過分析兩個詞在同一篇文獻中共同出現(xiàn)的頻率來反映相關(guān)領(lǐng)域的研究情況。如果兩個詞反復在同一篇文獻中共同出現(xiàn),那么說明它們之間的聯(lián)系很緊密,在相關(guān)領(lǐng)域中具有一定的意義。運用CiteSpaceⅢ可以對被研究文獻的關(guān)鍵詞進行共詞分析,關(guān)鍵詞是對文章的高度概括,幾個關(guān)鍵詞共同反映了文獻的主題。

在CiteSpaceⅢ中選擇關(guān)鍵詞作為節(jié)點類型,運行軟件,對得到的知識圖譜進行調(diào)整,包括手動對某些節(jié)點的位置進行調(diào)整,以及刪去不重要的節(jié)點及連線,盡量使得到的圖譜結(jié)構(gòu)較為明顯,見圖2。

圖2 CiteSpaceⅢ中以關(guān)鍵詞為節(jié)點類型的知識圖譜

在與檔案資源相關(guān)的文獻中,在一定時間段內(nèi)反復出現(xiàn)的關(guān)鍵詞,被稱為高頻關(guān)鍵詞。它們在一定程度上體現(xiàn)了研究領(lǐng)域的研究熱點。

中心性越高的關(guān)鍵詞在整個網(wǎng)絡(luò)圖中與其他關(guān)鍵詞之間的聯(lián)系越多,在圖譜中的位置越重要?!皺n案信息資源”“檔案館”“數(shù)字檔案資源”的中心性較高,表明在檔案資源領(lǐng)域這三個關(guān)鍵詞有著至關(guān)重要的作用。同時,中心性在0.01以上的關(guān)鍵詞主要有“檔案信息資源”“數(shù)字檔案資源”“檔案信息”“檔案管理”,可以將它們分為兩類,一類是主要熱點理論,一類是主要熱點應(yīng)用。

在用CiteSpaceⅢ軟件繪制聚類知識圖譜的過程中,會自動將一些高頻關(guān)鍵詞歸類在一個研究領(lǐng)域中,從而更生動地展示研究成果。通過軟件聚類分析,可以得到圖3:

圖3 CiteSpaceⅢ軟件繪制的高頻關(guān)鍵詞聚類知識圖譜

圖3中左上角中的Q值和S值兩個指標,反映了圖譜繪制效果。一般來說,Q值>0.3就意味著分析出來的聚類團組是顯著的;當S值在0.5以上,一般認為聚類是合理的。本文中的聚類分析S值為0.6929,Q值為0.4754,表示聚類形成的類別是顯著的,但是聚類的合理性有待加強。

根據(jù)圖3,同時結(jié)合CiteSpaceⅢ軟件中Cluster explore對關(guān)鍵詞按聚類進行的列舉,不同階段對于檔案資源所關(guān)注的研究熱點不一樣。聚類0企業(yè)檔案主要包括企業(yè)檔案﹑檔案利用﹑檔案信息資源﹑檔案管理等關(guān)鍵詞,企業(yè)檔案資源如何管理﹑利用也一直是檔案資源領(lǐng)域關(guān)注的熱點。聚類1數(shù)字檔案資源包括的關(guān)鍵詞主要有資源建設(shè)﹑資源整合﹑資源共享﹑數(shù)字檔案資源服務(wù)﹑國家數(shù)字檔案資源等,數(shù)字檔案資源整合建設(shè)的方式﹑途徑等也是近幾年檔案資源開發(fā)所需要解決的問題。聚類2檔案館主要包括館藏建設(shè)﹑信息服務(wù)﹑檔案編研﹑關(guān)聯(lián)數(shù)據(jù)|檔案信息資源開發(fā)等,相關(guān)檔案資源主要來源于各級檔案館,因此館藏建設(shè)﹑編研及提供服務(wù)等內(nèi)容也是各級檔案館一直在思考的問題。聚類3信息資源包括的關(guān)鍵詞主要有檔案網(wǎng)站﹑信息組織﹑政府主體﹑政府信息資源﹑管理服務(wù)|資源整合等,說明在檔案資源領(lǐng)域,政府也是不可或缺的角色。聚類4檔案學包括的關(guān)鍵詞有檔案學教育﹑本科教育﹑圖書館學﹑課程資源建設(shè)等,說明在檔案學教育中檔案資源也是一個重要內(nèi)容。

四、結(jié)論

本文運用CiteSpaceⅢ軟件對CSSCI數(shù)據(jù)庫檔案資源相關(guān)文獻進行可視化分析,主要分析了共被引文獻及關(guān)鍵詞共現(xiàn)現(xiàn)象。通過對共被引文獻的分析,找到了檔案資源領(lǐng)域關(guān)鍵性的文章,從而發(fā)現(xiàn)了領(lǐng)域內(nèi)有較大影響力的重要作者;通過對關(guān)鍵詞共現(xiàn)的分析,將檔案資源領(lǐng)域研究內(nèi)容大致進行了聚類劃分。在研究的過程中,也發(fā)現(xiàn)了相關(guān)問題,對于檔案資源和檔案信息資源的表述,有研究者認為兩個詞語外延不同,不能混淆使用。但在實際情況中,很多學者在文章中并不區(qū)分二者的不同,因此這兩個關(guān)鍵詞在分析中也可以合二為一。此外,關(guān)鍵詞共現(xiàn)聚類效果并不是很好。究其原因,主要是有些文章關(guān)鍵詞的選取并不能完整地表達文章主題,有些文章關(guān)鍵詞太少,且較為“一般”,對于文章關(guān)鍵性的特點不能很好地展示,于是對關(guān)鍵詞進行共詞分析時可以考慮對關(guān)鍵詞先行處理,使分析結(jié)果能盡量符合現(xiàn)實情況。

猜你喜歡
圖譜聚類軟件
禪宗軟件
英語文摘(2021年10期)2021-11-22 08:02:26
繪一張成長圖譜
軟件對對碰
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
補腎強身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
主動對接你思維的知識圖譜
基于改進的遺傳算法的模糊聚類算法
一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
談軟件的破解與保護
精品(2015年9期)2015-01-23 01:36:01
自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
伊宁县| 上饶县| 方山县| 沙洋县| 临泉县| 玛沁县| 岳西县| 洛浦县| 湖北省| 五原县| 九龙坡区| 台安县| 孟津县| 银川市| 随州市| 沙坪坝区| 新源县| 科技| 屯门区| 阳高县| 乌拉特中旗| 永城市| 沁阳市| 自治县| 荣成市| 长海县| 宜兰县| 九龙县| 本溪市| 金昌市| 泰兴市| 德阳市| 三都| 萝北县| 仁布县| 晋州市| 汝阳县| 昆明市| 喀喇沁旗| 绥宁县| 安庆市|