田 恬 孫悅淇
基于關(guān)鍵詞詞頻分析的情報(bào)學(xué)研究熱點(diǎn)解析
田 恬 孫悅淇
本文以《情報(bào)理論與實(shí)踐》為數(shù)據(jù)源,運(yùn)用文獻(xiàn)計(jì)量學(xué)的關(guān)鍵詞分析方法,對(duì)2010-2015年該刊的關(guān)鍵詞進(jìn)行統(tǒng)計(jì),從關(guān)鍵詞數(shù)量分析,關(guān)鍵詞詞頻分析,核心關(guān)鍵詞分析描述該刊載文學(xué)者學(xué)術(shù)研究現(xiàn)狀,進(jìn)而揭示圖書館學(xué)情報(bào)學(xué)的研究熱點(diǎn)和發(fā)展趨勢(shì)。
情報(bào)學(xué) 關(guān)鍵詞 詞頻分析 研究熱點(diǎn)
《情報(bào)理論與實(shí)踐》是我國(guó)情報(bào)學(xué)領(lǐng)域的核心期刊,是情報(bào)理論與實(shí)踐工作前沿性指導(dǎo)性學(xué)術(shù)期刊。它全面、系統(tǒng)、及時(shí)、準(zhǔn)確報(bào)道國(guó)內(nèi)外圖書館學(xué)情報(bào)學(xué)與信息技術(shù)發(fā)展動(dòng)態(tài),在國(guó)內(nèi)外享有較高聲譽(yù)且具有廣泛影響。關(guān)鍵詞分析作為文獻(xiàn)計(jì)量的一個(gè)重要方法,本文針對(duì)《情報(bào)理論與實(shí)踐》2010~2016的有效載文關(guān)鍵詞進(jìn)行詞頻分析和共詞分析,試總結(jié)出圖書館學(xué)情報(bào)學(xué)領(lǐng)域近七年來(lái)的研究熱點(diǎn)和趨勢(shì)[1]。
(一)圖書館學(xué)情報(bào)學(xué)
情報(bào)學(xué)的發(fā)展具有一百多年的歷史,通常情況下認(rèn)為情報(bào)學(xué)與圖書館學(xué)、文獻(xiàn)學(xué)以及信息系統(tǒng)學(xué)的研究都有著密切的關(guān)系[2]。因此情報(bào)學(xué)研究?jī)?nèi)容涉及“數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)”研究、語(yǔ)義網(wǎng)研究、3G(Great Global Grid)研究、信息構(gòu)建、知識(shí)管理研究、數(shù)字圖書館研究、信息技術(shù)應(yīng)用、小世界現(xiàn)象研究等前沿領(lǐng)域[3]。將情報(bào)看作是一種知識(shí),中國(guó)的情報(bào)研究基于美國(guó)范式、歐洲范式、蘇聯(lián)范式進(jìn)行綜合集成,并創(chuàng)造了以科技情報(bào)研究為特色的情報(bào)學(xué),后拓展到對(duì)其他領(lǐng)域的情報(bào)研究[2]。
(二)關(guān)鍵詞分析
關(guān)鍵詞是表達(dá)文獻(xiàn)主題概念的自然語(yǔ)言詞匯,他們能夠反映研究成果的核心內(nèi)容。通過(guò)對(duì)一個(gè)期刊一段時(shí)期內(nèi)關(guān)鍵詞變化的分析,可以全面把握該刊在此時(shí)間段內(nèi)載文的研究熱點(diǎn)集中情況,而對(duì)某一領(lǐng)域頂級(jí)核心期刊的關(guān)鍵詞分析則能折射出該學(xué)科發(fā)展的動(dòng)態(tài)過(guò)程,反映科研的研究熱點(diǎn)和發(fā)展動(dòng)向[1]。
本項(xiàng)研究以中文社會(huì)科學(xué)引文索引(cSScI)和中國(guó)知網(wǎng)作為數(shù)據(jù)來(lái)源,從cSScI中按條件檢索2010-2015年所有發(fā)表在《情報(bào)理論與實(shí)踐》,文獻(xiàn)類型為論文的記錄共1946條。接著在cNKI上通過(guò)期刊名稱檢索取得2016年1月至今發(fā)表在《情報(bào)理論與實(shí)踐》雜志上的所有論文,并排除篇名中包含“情報(bào)理論與實(shí)踐”,“投稿”,“征稿”等與關(guān)鍵詞分析無(wú)關(guān)的文獻(xiàn)記錄共195條,以包含關(guān)鍵詞信息的Refworks格式導(dǎo)出。
下載好包含關(guān)鍵詞的文獻(xiàn)記錄之后,利用Python代碼編寫程序自動(dòng)對(duì)記錄中的關(guān)鍵詞進(jìn)行提取,并對(duì)一行關(guān)鍵詞記錄進(jìn)行分詞保存到eхcel中;同時(shí)利用Python對(duì)關(guān)鍵詞詞頻進(jìn)行逐年統(tǒng)計(jì),分別保存到eхcel中。
(一)關(guān)鍵詞數(shù)量分析
《情報(bào)理論與實(shí)踐》2010-2015年刊載論文cSScI檢索共1946篇,所有論文有標(biāo)引有關(guān)鍵詞,共標(biāo)引關(guān)鍵詞4918個(gè),平均每篇文章標(biāo)引關(guān)鍵詞2-3個(gè)。截止至2016年 7月該刊當(dāng)年載文cNKI檢索共195篇,共標(biāo)引關(guān)鍵詞592個(gè),其中86.67%文獻(xiàn)文標(biāo)注有關(guān)鍵詞,平均每篇關(guān)鍵詞約3個(gè)。單從篇平均標(biāo)引關(guān)鍵詞來(lái)看,其數(shù)量是在上升的,說(shuō)明越來(lái)越多的作者規(guī)范自己的寫作格式,并有意識(shí)通過(guò)關(guān)鍵字的提煉來(lái)概括文章信息。需要說(shuō)明的是cSScI與cNKI不同的數(shù)據(jù)來(lái)源出現(xiàn)統(tǒng)計(jì)差異,不僅說(shuō)明了cSScI與cNKI收錄文獻(xiàn)質(zhì)量的標(biāo)準(zhǔn)不同,也說(shuō)明了關(guān)鍵詞是高質(zhì)量的文章的衡量標(biāo)準(zhǔn)之一,同時(shí)也說(shuō)明不同文獻(xiàn)類型對(duì)關(guān)鍵詞的要求不同,論文屬于對(duì)關(guān)鍵詞要求較高的文獻(xiàn)類型[4]。
表1 2010-2016年《情報(bào)理論與實(shí)踐》論文關(guān)鍵詞統(tǒng)計(jì)情況
(二)關(guān)鍵詞詞頻分析
在本次研究中,通過(guò)詞頻分析法,即利用能夠揭示或表達(dá)文獻(xiàn)核心內(nèi)容的關(guān)鍵詞在《情報(bào)理論與實(shí)踐》刊載論文上出現(xiàn)的頻次高低來(lái)確定圖書館學(xué)情報(bào)學(xué)研究熱點(diǎn)和發(fā)展動(dòng)向。關(guān)鍵詞不僅可以通過(guò)詞頻高低反映出圖書館學(xué)情報(bào)學(xué)領(lǐng)域的研究熱點(diǎn)問(wèn)題和主要研究方向,其分布特征還可以分析出當(dāng)前研究領(lǐng)域的集散程度[5]。
通過(guò)人工觀察,將該刊上關(guān)鍵詞出現(xiàn)的詞頻分為三個(gè)等級(jí),低頻區(qū):詞頻(0-5);中頻區(qū):詞頻(6-14);高頻區(qū):詞頻(15及以上)[5]。在此基礎(chǔ)上,利用eхcel對(duì)2010-2015年該刊載文關(guān)鍵詞在不同詞頻區(qū)間的數(shù)量關(guān)系。由下表可以看出,該刊關(guān)鍵詞詞頻分布呈現(xiàn)出嚴(yán)重的偏態(tài)分布,這也說(shuō)明在圖書館學(xué)情報(bào)學(xué)領(lǐng)域研究方向廣泛,在傳統(tǒng)圖書館學(xué)情報(bào)學(xué)研究方向的基礎(chǔ)上,學(xué)者有多種研究方向可選。從側(cè)面上也說(shuō)明《情報(bào)理論與實(shí)踐》載文內(nèi)容發(fā)散性強(qiáng),不局限與某一專題。
表2 2010-2015年關(guān)鍵詞詞頻分布表
2011年781 17 6 2012年811 19 4 2013年795 15 3 2014年857 14 3 2015年790 6 0
(三)核心關(guān)鍵詞分析
高頻關(guān)鍵詞數(shù)量少,但出現(xiàn)頻率都極高,反映著《情報(bào)理論與實(shí)踐》載文的研究熱點(diǎn)集中情況。結(jié)合后臺(tái)數(shù)據(jù)以及下表可以看出該刊2010到2015年的核心關(guān)鍵詞及其詞頻的變化情況,我們可以總結(jié)出該刊甚至是圖書館學(xué)情報(bào)學(xué)領(lǐng)域一直持續(xù)的研究熱點(diǎn)主要有四個(gè)方面:大專院校的圖書館管理、企業(yè)的競(jìng)爭(zhēng)情報(bào)管理、知識(shí)與信息資源管理,以及情報(bào)研究模型。2015年和2016年的數(shù)據(jù)顯示并沒(méi)有像前幾年一樣高頻出現(xiàn)的核心關(guān)鍵詞,但是在互聯(lián)網(wǎng)加速發(fā)展背景下“大數(shù)據(jù)”、“數(shù)字圖書館”、“云計(jì)算”、“專利分析”等成為新的研究熱點(diǎn)。[6]
表3 2010-2015年《情報(bào)理論與實(shí)踐》高頻關(guān)鍵詞
關(guān)鍵詞使用規(guī)范化問(wèn)題至關(guān)重要,這是我們無(wú)法避免的問(wèn)題。在此次研究過(guò)程中,本文對(duì)《情報(bào)理論與實(shí)踐》刊登過(guò)的相同或者相近的研究課題論文,因不同作者使用的關(guān)鍵詞不同而導(dǎo)致對(duì)關(guān)鍵詞熱點(diǎn)研究領(lǐng)域出現(xiàn)細(xì)微偏差[7]。關(guān)鍵詞分析作為一種統(tǒng)計(jì)分析方法,無(wú)法避免地遇到精確性受到著者標(biāo)引關(guān)鍵詞的人為影響,但這也應(yīng)該是情報(bào)學(xué)研究的一個(gè)方向之一,對(duì)語(yǔ)義集合的歸納,同時(shí)也提醒像《情報(bào)理論與實(shí)踐》這類極具影響力的核心期刊對(duì)來(lái)稿關(guān)鍵詞的標(biāo)引進(jìn)行適當(dāng)?shù)囊?guī)范[8]。
[1]倪麗娟,于淑麗.檔案學(xué)研究熱點(diǎn)分析基于2004省略檔案學(xué)通訊論文關(guān)鍵詞的詞頻分析[J].檔案學(xué)通訊,2010(1).
[2]馬費(fèi)成.情報(bào)學(xué)發(fā)展的歷史回顧及前沿課題[J].圖書情報(bào)知識(shí),2013(02):4~12.
[3]黃麗霞.情報(bào)學(xué)核心研究?jī)?nèi)容與未來(lái)發(fā)展前景[J].情報(bào)資料工作,2004(05):8~10.
[4]楊小華,王翩翩,秦峰.廣西植物關(guān)鍵詞分析[J].安徽農(nóng)業(yè)科學(xué),2011(20):12601~12602.
[5]李?yuàn)檴?,張?guó)強(qiáng),徐桂芬.基于關(guān)鍵詞分析的ERP系統(tǒng)研究熱點(diǎn)評(píng)述[J].情報(bào)科學(xué),2012(08):1272~1276.
[6]李靜,董良廣,游蘇寧.中國(guó)科技期刊研究2006年至2011年載文關(guān)鍵詞分析[J].中國(guó)科技期刊研究,2012(03):404~407.
[7]楊小華.生物工程進(jìn)展論文關(guān)鍵詞的特征研究[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2002(02):37~39.
[8]雷曉慶,劉曉雁.圖書情報(bào)工作論文關(guān)鍵詞特征的統(tǒng)計(jì)分析[J].圖書情報(bào)工作,1998(05):20~21.
(作者單位:河海大學(xué)商學(xué)院)