国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于GEPHI的共詞可視化分析:以文獻(xiàn)計(jì)量學(xué)作者合作關(guān)系為例

2014-05-21 21:47李國棟
新媒體研究 2014年7期
關(guān)鍵詞:文獻(xiàn)計(jì)量學(xué)可視化分析

摘 要 通過使用共詞分析法對文獻(xiàn)計(jì)量學(xué)研究領(lǐng)域作者的合作關(guān)系進(jìn)行分析,可以揭示該學(xué)科領(lǐng)域合作團(tuán)隊(duì)的內(nèi)部和相互之間的聯(lián)系。文章在對文獻(xiàn)計(jì)量學(xué)進(jìn)行一般文獻(xiàn)計(jì)量分析的基礎(chǔ)上,通過使用復(fù)雜網(wǎng)絡(luò)分析軟件GEPHI對文獻(xiàn)計(jì)量學(xué)對作者合作關(guān)系網(wǎng)絡(luò)進(jìn)行定量分析和繪制可視化圖譜,為研究該學(xué)科領(lǐng)域的作者合作群體狀況以及跟蹤學(xué)科研究進(jìn)展提供直觀的分析參考。

關(guān)鍵詞 可視化分析;共詞;GEPHI;文獻(xiàn)計(jì)量學(xué)

中圖分類號:G202 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-7597(2014)07-0104-02

共詞分析法已經(jīng)被深入應(yīng)用于對各個(gè)學(xué)科領(lǐng)域的文獻(xiàn)分析研究中,通過共詞分析方法對文獻(xiàn)信息中共同出現(xiàn)的內(nèi)容進(jìn)行聚類分析,應(yīng)用可視化分析軟件繪制關(guān)鍵詞共現(xiàn)關(guān)系網(wǎng)絡(luò)圖譜,能夠揭示出學(xué)科的研究現(xiàn)狀和發(fā)展趨勢。近年來隨著統(tǒng)計(jì)學(xué)和社會網(wǎng)絡(luò)可視化分析方法的進(jìn)展,各種方便直觀的社會網(wǎng)絡(luò)分析(Social Network Analysis,SNA)軟件不斷出現(xiàn),應(yīng)用于科學(xué)文獻(xiàn)的分析中,使文獻(xiàn)定量分析的結(jié)果以圖形的形式呈現(xiàn)出來,把定量分析向定性結(jié)果轉(zhuǎn)化,成為學(xué)科領(lǐng)域現(xiàn)狀和前沿?zé)狳c(diǎn)預(yù)測的有力分析工具。[1]

1 GEPHI軟件簡介

GEPHI是一款基于JVM(JAVA虛擬機(jī))免費(fèi)開源的復(fù)雜網(wǎng)絡(luò)可視化分析軟件,可用于探索性數(shù)據(jù)分析,鏈接分析,社交網(wǎng)絡(luò)分析,生物網(wǎng)絡(luò)分析等[2]。本文通過對文獻(xiàn)計(jì)量學(xué)研究領(lǐng)域期刊文獻(xiàn)的題錄數(shù)據(jù)處理,得到作者共現(xiàn)矩陣,用EXCEL的數(shù)據(jù)透視表功能進(jìn)行數(shù)據(jù)轉(zhuǎn)換后導(dǎo)入GEPHI軟件進(jìn)行運(yùn)算,繪制出該研究領(lǐng)域的作者合作關(guān)系圖譜,對文獻(xiàn)計(jì)量學(xué)研究領(lǐng)域的合作關(guān)系進(jìn)行研究。

2 文獻(xiàn)計(jì)量學(xué)發(fā)展?fàn)顩r的數(shù)據(jù)統(tǒng)計(jì)

2.1 數(shù)據(jù)來源及預(yù)處理

本文使用的數(shù)據(jù)來源于中國知網(wǎng)提供的中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫,包含從1980年開始到2013年8月的有關(guān)文獻(xiàn)計(jì)量學(xué)的學(xué)術(shù)期刊文獻(xiàn)信息,題錄下載時(shí)間為2013年8月19日,去除了無效文獻(xiàn)和重復(fù)文獻(xiàn)以后,得到文獻(xiàn)計(jì)量學(xué)研究領(lǐng)域的國內(nèi)期刊文獻(xiàn)共6254篇。對題錄中作者、關(guān)鍵詞、刊發(fā)時(shí)間、來源機(jī)構(gòu)等字段進(jìn)行統(tǒng)計(jì),抽取高頻詞進(jìn)行排序,進(jìn)行初步的數(shù)據(jù)分析[2]。

2.2 初步數(shù)據(jù)統(tǒng)計(jì)

2.2.1 各年發(fā)表數(shù)據(jù)統(tǒng)計(jì)

對發(fā)表時(shí)間統(tǒng)計(jì)和排序處理,得到從20世紀(jì)80年代以來國內(nèi)文獻(xiàn)計(jì)量學(xué)理論和應(yīng)用研究的學(xué)術(shù)論文數(shù)量統(tǒng)計(jì)結(jié)果。結(jié)果顯示對文獻(xiàn)計(jì)量學(xué)的研究開始以來學(xué)術(shù)文獻(xiàn)數(shù)量在不斷地增加,特別是進(jìn)入本世紀(jì)以后的十幾年中,這一領(lǐng)域研究的學(xué)術(shù)論文數(shù)量增速更快。

2.2.2 期刊統(tǒng)計(jì)

通過統(tǒng)計(jì),歷年來我國文獻(xiàn)計(jì)量學(xué)研究的學(xué)術(shù)論文發(fā)表期刊共有1874種,發(fā)表該研究領(lǐng)域?qū)W術(shù)論文數(shù)量在10篇以上的共有75種,發(fā)表數(shù)量為3021篇,占總數(shù)的48.32%,其中以《農(nóng)業(yè)圖書情報(bào)學(xué)刊》、《情報(bào)科學(xué)》、《現(xiàn)代情報(bào)》、《情報(bào)雜志》等刊物發(fā)表數(shù)量最多。

圖1 各年發(fā)表數(shù)量統(tǒng)計(jì)

表2.2.3 作者統(tǒng)計(jì)

國內(nèi)在各學(xué)術(shù)期刊發(fā)表文獻(xiàn)計(jì)量學(xué)研究領(lǐng)域論文的第一作者人數(shù)為4276人,其中發(fā)表數(shù)量超過2篇的有971人,發(fā)表文章總數(shù)為2699篇。根據(jù)普賴斯文獻(xiàn)分布定律,將發(fā)文量超過6篇的作者定為核心作者,符合條件的作者共有60人,發(fā)表數(shù)為632篇,發(fā)表論文20篇以上的共有6人,其中邱均平教授以52篇居首位。

2.2.4 關(guān)鍵詞統(tǒng)計(jì)

本文所統(tǒng)計(jì)文獻(xiàn)共有5356個(gè)關(guān)鍵詞,其中只出現(xiàn)一次的有3931個(gè),占總數(shù)的73.3%,詞頻在10次以上的有163個(gè),占總數(shù)的3%,詞頻在40次以上的有32個(gè),占總數(shù)的0.5%(表2)。其中“引文分析”、“核心期刊”、“統(tǒng)計(jì)分析”、“文獻(xiàn)計(jì)量”等關(guān)鍵詞的使用頻率遠(yuǎn)遠(yuǎn)高于其他關(guān)鍵詞。

2.3 統(tǒng)計(jì)結(jié)果分析

根據(jù)統(tǒng)計(jì)結(jié)果,文獻(xiàn)計(jì)量學(xué)研究的學(xué)術(shù)論文在逐年不斷增加,特別是在進(jìn)入本世紀(jì)以后文獻(xiàn)數(shù)據(jù)量增速明顯,這說明文獻(xiàn)計(jì)量學(xué)在各個(gè)學(xué)科的研究工作中逐步受到重視和應(yīng)用,形成了以《農(nóng)業(yè)圖書情報(bào)學(xué)刊》、《情報(bào)科學(xué)》、《現(xiàn)代情報(bào)》、《情報(bào)雜志》等學(xué)術(shù)期刊為代表的專業(yè)學(xué)術(shù)交流平臺,逐步形成了核心研究隊(duì)伍,以武漢大學(xué)邱均平教授為首的60名核心作者撰寫的論文數(shù)量占總論文數(shù)量的15%,他們的研究成果基本上代表了國內(nèi)文獻(xiàn)計(jì)量學(xué)研究的方向。對關(guān)鍵詞詞頻的統(tǒng)計(jì)結(jié)果顯示,文獻(xiàn)計(jì)量學(xué)領(lǐng)域的研究熱點(diǎn)集中于“引文分析”、“期刊”、“科學(xué)計(jì)量”、“影響因子”、“定量分析”等主題上。

3 GEPHI可視化分析

3.1 數(shù)據(jù)類型

對文獻(xiàn)信息數(shù)據(jù)處理后,用Excel生成包含數(shù)據(jù)節(jié)點(diǎn)和連接關(guān)系的.CSV文件,導(dǎo)入GEPHI,軟件將會自動(dòng)合并相同節(jié)點(diǎn),并對數(shù)據(jù)節(jié)點(diǎn)連接的次數(shù)進(jìn)行計(jì)算。

3.2 數(shù)據(jù)分析

將文獻(xiàn)計(jì)量學(xué)研究領(lǐng)域有文獻(xiàn)創(chuàng)作合作關(guān)系的前60位作者的合作關(guān)系共詞矩陣用EXCEL進(jìn)行處理后導(dǎo)入GEPHI,然后對作者合作關(guān)系網(wǎng)絡(luò)進(jìn)行網(wǎng)絡(luò)密度、直徑和模塊化分析,并繪制出合作關(guān)系圖譜,將本研究領(lǐng)域的研究合作關(guān)系直觀地呈現(xiàn)出來。

3.2.1 網(wǎng)絡(luò)密度分析

網(wǎng)絡(luò)密度反映網(wǎng)絡(luò)的完整性,如果一個(gè)復(fù)雜關(guān)系網(wǎng)絡(luò)中任意的節(jié)點(diǎn)之間都有邊連接,那么這個(gè)網(wǎng)絡(luò)的密度為1,這種網(wǎng)絡(luò)的可到達(dá)性是最好的,反之如果網(wǎng)絡(luò)密度越小,那么網(wǎng)絡(luò)的完整性越差。文獻(xiàn)計(jì)量學(xué)研究領(lǐng)域的合作網(wǎng)絡(luò)的密度計(jì)算結(jié)果為0.002,與完整網(wǎng)絡(luò)的差距較大,這說明文獻(xiàn)計(jì)量學(xué)研究領(lǐng)域作者合作較少。

3.2.2 網(wǎng)絡(luò)直徑分析

網(wǎng)絡(luò)直徑是指網(wǎng)絡(luò)內(nèi)最長的兩個(gè)節(jié)點(diǎn)之間的連接數(shù)(直接連接的兩個(gè)節(jié)點(diǎn)之間的距離為1),文獻(xiàn)計(jì)量學(xué)領(lǐng)域作者合作網(wǎng)絡(luò)的直徑和平均連接長度,結(jié)果顯示網(wǎng)絡(luò)直徑為4,平均連接長度約為1.57,最短長度連接個(gè)數(shù)為886,從這個(gè)結(jié)果來看,該合作網(wǎng)絡(luò)的網(wǎng)絡(luò)群體內(nèi)的連接較為緊密,但是對一個(gè)擁有60個(gè)節(jié)點(diǎn)的關(guān)系網(wǎng)絡(luò)來說,連接數(shù)目還是比較小的。endprint

3.2.3 網(wǎng)絡(luò)模塊化分析

文獻(xiàn)計(jì)量研究領(lǐng)域的合作關(guān)系網(wǎng)絡(luò)的模塊化分析結(jié)果顯示模塊度系統(tǒng)為0.917,接近于最大值1,社區(qū)數(shù)量為45。模塊度系數(shù)越高說明合作群體的組內(nèi)連接越緊密,但是合作群體之間的連接越少,表明文獻(xiàn)計(jì)量學(xué)研究領(lǐng)域的45個(gè)合作群體在學(xué)科領(lǐng)域跨單位或者跨機(jī)構(gòu)的合作比較少。[4]

3.3 繪制圖譜

使用“ForceAtlas 2”算法插件生成文獻(xiàn)定量分析研究領(lǐng)域的作者合作關(guān)系圖譜(圖2),可以看到研究領(lǐng)域的的合作群體邊界清晰,核心人物地位顯著,在這些群體中規(guī)模比較大的群體核心人物有李成建、邱均平、柯銀花、文庭孝、楊華等,但是在這45個(gè)合作群體中與其他群體發(fā)生合作關(guān)系連接的只有8個(gè),合作關(guān)系連接數(shù)量只有李成建組與柯銀花組較多,達(dá)到7個(gè)連接,而其余組與其他群體的合作關(guān)系連接數(shù)目都是1到2個(gè)。

圖2 作者合作網(wǎng)絡(luò)圖譜

4 結(jié)論

GEPHI對關(guān)系網(wǎng)絡(luò)的分析功能使它完全能夠滿足文獻(xiàn)計(jì)量分析工作的基本需求,特別是其強(qiáng)大的可視化計(jì)算功能使它能夠?qū)⑽墨I(xiàn)定量分析的結(jié)果直觀地以圖譜的形式呈現(xiàn)出來,是繪制文獻(xiàn)作者合作網(wǎng)絡(luò)和文獻(xiàn)共現(xiàn)關(guān)系網(wǎng)絡(luò)的得力工作。本文通過對文獻(xiàn)計(jì)量學(xué)方法對文獻(xiàn)的發(fā)表數(shù)量、來源刊物、作者、關(guān)鍵詞等進(jìn)行了基本的頻次統(tǒng)計(jì),揭示出該學(xué)科研究領(lǐng)域的研究現(xiàn)狀和發(fā)展規(guī)律。對文獻(xiàn)計(jì)量學(xué)研究領(lǐng)域的作者合作關(guān)系網(wǎng)絡(luò)進(jìn)行了網(wǎng)絡(luò)點(diǎn)度中心度、網(wǎng)絡(luò)密度和網(wǎng)絡(luò)直徑測量,并基于網(wǎng)絡(luò)模塊化分析結(jié)果繪制出了作者合作關(guān)系網(wǎng)絡(luò)圖譜,直觀地反映出本學(xué)科合作群體內(nèi)部與之間的合作關(guān)系特點(diǎn),揭示出了文獻(xiàn)計(jì)量學(xué)研究速度加快、規(guī)模擴(kuò)大以前沿?zé)狳c(diǎn)不斷出現(xiàn)等特點(diǎn),也提出了研究領(lǐng)域內(nèi)的合作群體內(nèi)部關(guān)系緊密、但是之間的合作很少,影響了學(xué)科交叉融合與發(fā)展,是目前需要解決的問題。

基金項(xiàng)目

南陽市科技發(fā)展規(guī)劃項(xiàng)目,編號:2013RK008。

參考文獻(xiàn)

[1]裴雷,馬費(fèi)成.社會網(wǎng)絡(luò)分析在情報(bào)學(xué)中的應(yīng)用和發(fā)展[J].圖書館論壇,2006,26(6):40-45.DOI:10.3969/j.issn.1002-1167.2006.06.010.

[2]Mathieu Bastian,Sebastien Heymann,Mathieu Jacomy et al.Gephi: An Open Source Software for Exploring and Manipulating Networks[C].//Proceedigns of the Third International AAAI Conference on Weblogs and Social Media.2009:361-362.

[3]劉啟元,葉鷹.文獻(xiàn)題錄信息挖掘技術(shù)方法及其軟件SATI的實(shí)現(xiàn)—以中外圖書情報(bào)學(xué)為例[J].信息資源管理學(xué)報(bào),2012(01):50-58.

[4]張聰,沈惠璋.基于譜方法的復(fù)雜網(wǎng)絡(luò)中社團(tuán)結(jié)構(gòu)的模塊度[J].系統(tǒng)工程理論與實(shí)踐,2013,33(5):1231-1239.

作者簡介

李國棟(1972-),男,河南南陽人,館員,碩士,主要研究文獻(xiàn)為文獻(xiàn)情報(bào)信息服務(wù)創(chuàng)新以及數(shù)字資源開發(fā)建設(shè)。endprint

猜你喜歡
文獻(xiàn)計(jì)量學(xué)可視化分析
《現(xiàn)代泌尿外科雜志》2011~2013年文獻(xiàn)計(jì)量學(xué)指標(biāo)分析
《廣西民族研究》創(chuàng)辦30年來刊發(fā)文章的回顧與展望
高校學(xué)生管理法治化研究:基于CiteSpace的可視化分析
我國職業(yè)教育師資研究熱點(diǎn)可視化分析
中文圖書評價(jià)體系研究
聲波吹灰技術(shù)在SCR中的應(yīng)用研究
可視化分析技術(shù)在網(wǎng)絡(luò)輿情研究中的應(yīng)用
國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢