陳文娟
(河南財經(jīng)政法大學(xué),河南 鄭州 450002)
基于CNKI的關(guān)聯(lián)數(shù)據(jù)研究進展計量分析
陳文娟
(河南財經(jīng)政法大學(xué),河南 鄭州 450002)
本文以CNKI中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫為文獻來源,借助CNKI分析功能和Excel軟件,針對2008-2013年我國關(guān)聯(lián)數(shù)據(jù)學(xué)術(shù)研究進展,從年載文量、文獻來源、著者、關(guān)鍵詞、引文等多方面進行計量分析,從而揭示我國近年來關(guān)聯(lián)數(shù)據(jù)的研究特點。
關(guān)聯(lián)數(shù)據(jù);計量分析;CNKI
關(guān)聯(lián)數(shù)據(jù)概念的提出最初緣于互聯(lián)網(wǎng)上普遍存在的信息異構(gòu)、信息孤島等問題,2006年萬維網(wǎng)的發(fā)明者Tim Berners-Lee[1]在語義網(wǎng)的基礎(chǔ)上提出發(fā)展關(guān)聯(lián)數(shù)據(jù)之網(wǎng)的構(gòu)想,并指出其核心和關(guān)鍵是關(guān)聯(lián)數(shù)據(jù)。此后,關(guān)聯(lián)數(shù)據(jù)迅速得到了圖書情報界、信息界、政府機構(gòu)及相關(guān)企業(yè)的廣泛關(guān)注和重視,自2008年引入我國以來,國內(nèi)學(xué)者對其研究熱情也逐漸高漲。
2.1 數(shù)據(jù)來源與分析方法
本文以中國知網(wǎng)(CNKI)的中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫為來源,借助于CNKI數(shù)據(jù)分析和Excel統(tǒng)計功能,截取2008—2013年6年內(nèi)有關(guān)關(guān)聯(lián)數(shù)據(jù)的文獻進行計量分析,以期揭示出我國關(guān)聯(lián)數(shù)據(jù)研究的演變態(tài)勢。具體檢索策略是在“篇名”為“關(guān)聯(lián)數(shù)據(jù)”,時間從2008年到2013年,在CNKI中共檢索到文獻153篇,去除一些會議通知、重復(fù)等錯檢項后,得到文獻147篇。
2.2 年代分布與來源期刊分布
通過對一段時期內(nèi)某主題領(lǐng)域的年發(fā)文量的統(tǒng)計分析可以了解該領(lǐng)域的發(fā)展態(tài)勢。通過統(tǒng)計,2008年篇名為關(guān)聯(lián)數(shù)據(jù)的文獻僅有4篇,從2010年開始,關(guān)聯(lián)數(shù)據(jù)的研究有了較快的發(fā)展,文獻量逐年遞增,到2013年論文達到58篇。我國2008—2013年關(guān)聯(lián)數(shù)據(jù)的年代分布如圖1所示。
圖 1 關(guān)聯(lián)數(shù)據(jù)文獻年代分布
根據(jù)統(tǒng)計,刊載關(guān)聯(lián)數(shù)據(jù)相關(guān)文獻的來源期刊分布也相對集中,近75%的文獻分布于圖書情報領(lǐng)域的9種期刊中。其中,刊載量最多的是《現(xiàn)代圖書情報技術(shù)》,載文21篇,其次是《圖書情報工作》,載文19篇,隨后依次是《中國圖書館學(xué)報》(載文10篇)、《圖書館學(xué)研究》(載文10篇)、《圖書與情報》(載文6篇)等,上述幾種期刊均為中文社會科學(xué)引文索引CSSCI來源期刊,反映了關(guān)聯(lián)數(shù)據(jù)領(lǐng)域高質(zhì)量的研究成果較多。根據(jù)布拉德福定律的描述,《現(xiàn)代圖書情報技術(shù)》、《圖書情報工作》是目前我國關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的核心期刊。圖2顯示了關(guān)聯(lián)數(shù)據(jù)來源期刊的分布情況。
圖 2 關(guān)聯(lián)數(shù)據(jù)來源期刊分布
2.3 著者及研究機構(gòu)、基金分布
伴隨著關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域著者的集中與分散的分布特點,研究機構(gòu)也呈現(xiàn)出集中與分散的趨勢。根據(jù)CNKI的統(tǒng)計,關(guān)聯(lián)數(shù)據(jù)的學(xué)科研究隊伍主要分布在中國科學(xué)院國家科學(xué)圖書館(13篇)、上海圖書館(7篇)、武漢大學(xué)(7篇)、中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所(5篇)、浙江大學(xué)(5篇)。這些也是在信息界、圖書情報界具有較大影響力的學(xué)術(shù)機構(gòu),具有較強的科研實力,足見關(guān)聯(lián)數(shù)據(jù)這一新興概念自引入國內(nèi)以來便受到了極大的重視,成為圖書情報研究領(lǐng)域一個新的研究陣地,相關(guān)的研究成果具有較高的學(xué)術(shù)水平和社會影響力。
2.4 關(guān)鍵詞分析
通過對關(guān)鍵詞及其詞頻的統(tǒng)計分析,能夠揭示該領(lǐng)域現(xiàn)階段的研究熱點和發(fā)展趨勢。根據(jù)CNKI統(tǒng)計,得出147篇關(guān)聯(lián)數(shù)據(jù)論文中頻次大于5的關(guān)鍵詞共計10個,如表2所示。關(guān)聯(lián)數(shù)據(jù)作為一個新興的研究領(lǐng)域,在國內(nèi)尚未形成清晰的脈絡(luò)和學(xué)術(shù)派別。研究主題大致可概括為四個方面:關(guān)聯(lián)數(shù)據(jù)的基礎(chǔ)理論、語義網(wǎng)、關(guān)聯(lián)數(shù)據(jù)技術(shù)、關(guān)聯(lián)數(shù)據(jù)應(yīng)用等。目前,對于關(guān)聯(lián)數(shù)據(jù)的概念、研究進展、研究意義等基礎(chǔ)理論所做的研究最多;語義網(wǎng)、數(shù)據(jù)網(wǎng)絡(luò)作為關(guān)聯(lián)數(shù)據(jù)的發(fā)展環(huán)境和發(fā)展目標(biāo),與關(guān)聯(lián)數(shù)據(jù)的研究密不可分;關(guān)聯(lián)數(shù)據(jù)的發(fā)展又依賴于技術(shù)的發(fā)展,RDF、知識組織、知識發(fā)現(xiàn)等關(guān)聯(lián)數(shù)據(jù)相關(guān)技術(shù)逐漸受到關(guān)注,將成為未來關(guān)聯(lián)數(shù)據(jù)的研究重點;圖書館和網(wǎng)絡(luò)是關(guān)聯(lián)數(shù)據(jù)應(yīng)用的主要陣地,也是未來關(guān)聯(lián)數(shù)據(jù)研究的前沿和重點。
表 2 關(guān)聯(lián)數(shù)據(jù)關(guān)鍵詞分布
2.5 引文分析
根據(jù)“H指數(shù)”理論[4],某研究領(lǐng)域文獻中至少有N篇文獻被引頻次不少于N次,該領(lǐng)域文獻的H指數(shù)就是N。通過對147篇文獻進行統(tǒng)計,得知關(guān)聯(lián)數(shù)據(jù)文獻的H指數(shù)為14,這個數(shù)值并不高,進一步說明了國內(nèi)關(guān)聯(lián)數(shù)據(jù)的研究還處于初級階段,學(xué)術(shù)產(chǎn)出還不豐富,學(xué)術(shù)影響力也有待提高。
這14篇文獻中,引用頻次最高的是黃永文的《關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述》(被引50次),其次是劉煒的《關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望》(被引46次),以及沈志宏的《關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述》(被引42次),其余文獻被引頻率均在30次以下。內(nèi)容主要集中在關(guān)聯(lián)數(shù)據(jù)的基礎(chǔ)理論、語義關(guān)聯(lián)以及應(yīng)用展望等方面。這些文獻的作者大都是我國關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的核心著者,進一步體現(xiàn)了這些作者在關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的影響力和核心地位。
通過借助CNKI分析功能和Excel軟件,對關(guān)聯(lián)數(shù)據(jù)相關(guān)研究成果的統(tǒng)計和分析,可以看出關(guān)聯(lián)數(shù)據(jù)自引入國內(nèi)以來迅速引起了圖書情報學(xué)界的重視,目前已經(jīng)取得了一定的學(xué)術(shù)成果,涌現(xiàn)出了一批核心領(lǐng)軍研究學(xué)者,但總體上還處于學(xué)科誕生起,尚未形成清晰的研究脈絡(luò)和學(xué)術(shù)派別,研究內(nèi)容主要體現(xiàn)在基礎(chǔ)理論方面,有關(guān)技術(shù)和應(yīng)用方面的研究將會是未來的研究熱點和發(fā)展趨勢。
[1]Berners-Lee T.Linked Data-Design Issues[EB/OL].[2014-03-14].http//www.w3c.org/DesignIssues/LinkedData.htm l.
[2]劉煒.關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J].大學(xué)圖書館學(xué)報,2011(2):5-12.
[3]邱均平.信息計量學(xué)[M].武漢:武漢大學(xué)出版社,2007:191-195.
[4]Hirsch,Jorge E.An index to quantify an individual's scientific research output:PNAS,2005:102(46):16569-1657.
G353.1
A
1671-0037(2014)05-42-1.5
陳文娟(1988.3-),女,碩士,助理館員,研究方向:信息資源管理與服務(wù)。