張詩博
(嶺南師范學(xué)院 信息科學(xué)與技術(shù)學(xué)院,廣東湛江524048)
2004-2013年國內(nèi)開放存取研究高被引論文的多維度分析
張詩博
(嶺南師范學(xué)院 信息科學(xué)與技術(shù)學(xué)院,廣東湛江524048)
摘要:為了探討近年來國內(nèi)開放存取的研究特征與發(fā)展軌跡,利用中國知網(wǎng)(CNKI)的《中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫》和《中國引文數(shù)據(jù)庫》,參考維普信息資源系統(tǒng)的《中文科技期刊數(shù)據(jù)庫》和《萬方數(shù)據(jù)知識服務(wù)平臺》的數(shù)據(jù),采用文獻計量學(xué)方法,對國內(nèi)2004-2013年開放存取研究的高被引論文的基本數(shù)據(jù)進行了統(tǒng)計梳理,對其年代分布、核心作者、高載期刊、發(fā)文機構(gòu)以及基金論文比例等構(gòu)成要素做了深入的剖析,并以高被引論文關(guān)鍵詞及詞頻為切入點,探討了開放存取的研究主題及研究進程中的短板.
關(guān)鍵詞:開放存??;文獻計量:高被引論文
2003年《開放存取與促進學(xué)術(shù)出版”國際研討會綜述》[1]發(fā)表以來,開放存取運動引起學(xué)界的廣泛關(guān)注,開放存取研究取得了不菲的成果.本文利用中國知網(wǎng)《中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫》,參考維普信息資源系統(tǒng)的《中文科技期刊數(shù)據(jù)庫》和《萬方數(shù)據(jù)知識服務(wù)平臺》的數(shù)據(jù),采用文獻計量學(xué)方法,對國內(nèi)2004-2013年發(fā)表的開放存取研究的高被引論文進行多維度分析,努力發(fā)現(xiàn)研究特征和發(fā)展規(guī)律,促進開放存取研究的深入發(fā)展.
本文以中國知網(wǎng)(CNKI)期刊全文數(shù)據(jù)庫為數(shù)據(jù)源,參考維普信息資源系統(tǒng)的《中文科技期刊數(shù)據(jù)庫》和《萬方數(shù)據(jù)知識服務(wù)平臺》的數(shù)據(jù),對篇名、摘要或者關(guān)鍵詞中含有“開放存取”、“開放存儲”、“OPen Access”的論文依次進行檢索,檢索論文發(fā)表的時間為2004-2013年,檢索時間為2015-04-30,共檢索出研究論文757篇,其中有被引記錄的568篇,被引頻次≥17次的論文84篇.本文把被引頻次≥17次的84篇論文定義為高被引論文(占全部發(fā)文量的1.1%),并以它們?yōu)榛緦ο笳归_研究.
2.1發(fā)文數(shù)量和被引率
2004-2013年共發(fā)表開放存取研究論文757篇,年均76篇.但是,年份的論文產(chǎn)出量差異明顯∶2004-2008年,論文的產(chǎn)出量逐年增長,2009-2010年達到高峰,2011年之后逐漸下降.這個變化曲線清晰表明,國內(nèi)開放存取研究的高峰期在2009-2010年,2011年之后的研究進入穩(wěn)定狀態(tài),詳見表1.
表1 2004-2013年開放存取研究論文數(shù)量及被引用情況
根據(jù)表1統(tǒng)計,2004-2013年共發(fā)表開放存取研究論文757篇,其中568篇被引用,被引率為75%;2004-2009年論文的被引率達80%以上,2009年之后論文的被引率逐年下降;568篇論文總計被引用5 496 次,篇均被引9.68次;2004-2008年為文獻引用的高峰期.
2004年發(fā)文2篇,被引率為100%,2013年發(fā)文88篇,被引率為28.40%.這種被引率逐年降低的趨勢體現(xiàn)了文獻被引次數(shù)與發(fā)表的時間長短成正比的規(guī)律.
2.2單篇論文的被引頻次
568篇論文的被引頻次分為兩個層面∶第一層面,被引頻次為1~16次的中低被引頻次論文.這一層面的論文總計484篇,占被引用論文總數(shù)的85.21%;總被引頻次2 480次,占被引用論文總被引頻次的45.12%.第二層面,被引頻次為17次以上的高被引頻次論文.這一層面的論文總計84篇,占被引用論文總數(shù)的14.79%;總被引頻次3 016次,占被引用論文總被引頻次的54.88%,見表2.
在高被引頻次論文中,吳建中先生2005年發(fā)表在《國家圖書館學(xué)刊》的《開放存取環(huán)境下的信息共享空間》被引頻次最高,8年間被引用266次,年均被引用33次.
微生物對原油組分降解的先后是有選擇性的,姥鮫烷植烷(分別用Pr、Ph表示)屬于支鏈烷烴,從表2可以看出,在14天的實驗周期內(nèi),原油的Pr/Ph比值前期基本不變,中后期迅速升高,這可能是由于前期原油中正構(gòu)烷烴含量高,支鏈烷烴在正構(gòu)烷烴含量高時基本不降解;而中后期正構(gòu)烷烴含量比較低,支鏈烷烴才開始被微生物降解.
單篇論文的被引頻次是論文質(zhì)量與學(xué)術(shù)影響力的重要測度,這種少量論文擁有較高的被引次數(shù)現(xiàn)象是長尾理論在開放存取研究中的反映.
表2 單篇論文的被引頻次及其分布
3.1高被引論文的高載期刊分布
84篇論文分別刊載于29種期刊,其中刊載3篇以上的期刊12種,這12種期刊發(fā)表的高被引論文60篇,占全部高被引論文總量的71.4%,總被引頻次2 271次,占全部高被引論文總被引頻次的75%,見表3.這組數(shù)據(jù)表明,這12種期刊是國內(nèi)開放存取研究中的高被引論文的高載期刊,它們是國內(nèi)開放存取研究的重要平臺.
表3進一步顯示,46%的高被引論文發(fā)表在 《圖書情報工作》、《中國圖書館學(xué)報》、《中國科技期刊研究》、《國家圖書館學(xué)刊》、《圖書館學(xué)研究》和《情報雜志》等6種期刊上,這6種期刊已經(jīng)成為開放存取研究的權(quán)威性期刊.
表3 高被引論文的高載期刊
3.2高被引論文的核心作者以及機構(gòu)分布與研究重點
根據(jù)普賴斯定律m=0.749(N max1/2),N max=統(tǒng)計年限中單個作者的最高發(fā)文數(shù),m=核心作者的最低發(fā)文數(shù),結(jié)合表中數(shù)據(jù)
得出m=0.749×51/2=1.67.因此,發(fā)文2篇以上高被引論文的作者應(yīng)為核心作者.表4顯示,2004-2013年期間84篇高被引論文的第1作者共計61位,其中核心作者12位.12位作者共發(fā)表高被引論文35篇,占高被引論文總數(shù)的41.7%.其中,李武和秦珂發(fā)表的高被引論文最多,均為5篇,分別占高被引論文總數(shù)的5.9%;王應(yīng)寬和劉海霞兩位作者各發(fā)表高被引論文4篇;以上4位作者總計發(fā)表高被引論文18篇,占高被引論文總數(shù)的21.4%.另外,吳建中發(fā)表高被引論文1篇,但其被引頻次達到266次,領(lǐng)先于所有作者.統(tǒng)計結(jié)果顯示,84篇高被引論文中62%為獨著,38%為合著,合作組合以2~3人為主.
表4 發(fā)文2篇以上的核心作者
3.3高被引論文的產(chǎn)出機構(gòu)布局
本文設(shè)定,發(fā)文量≥2篇的作者機構(gòu)為開放存取研究的核心發(fā)文機構(gòu).表5統(tǒng)計結(jié)果顯示,開放存取研究的核心發(fā)文機構(gòu)有9個,其中北京大學(xué)、武漢大學(xué)、中南大學(xué)和平原大學(xué)等4所高校,它們的高被引論文產(chǎn)出量分別是10.9%、10.9%、7.1%和5.9%.
公共圖書館和信息出版機構(gòu)的開放存取研究也取得了一定成績,中國國家圖書館的發(fā)文量為4篇,《農(nóng)業(yè)工程學(xué)報》編輯部的發(fā)文量為3篇,它們也是開放存取研究的重要機構(gòu).
表5 高被引論文的核心發(fā)文機構(gòu)
3.4高被引論文的基金論文分布
在高被引論文中,省部級相關(guān)部門對開放存取研究資助的項目最多,秦珂的《開放存取的版權(quán)及其構(gòu)建》、陳傳夫的《開放存取期刊的分布及獲取策略研究》、喻文的《開放存取對高校圖書館的影響及對策研究》等15篇高被引論文就是省部級基金項目的研究成果.國家層面的資助位居第二,胡德華、劉海霞與其研究團隊的《開放存取期刊論文質(zhì)量和影響力評價研究》、李映兵的《開放存取的思索—高校圖書館面臨的挑戰(zhàn)及應(yīng)對策略》、李麟、初景利的《開放存取出版模式及發(fā)展策略》等10篇高被引論文是國家級基金項目成果.
2006-2011年國內(nèi)開放存取研究論文中基金論文的比例為25.6%[2],而2004-2013年84篇高被引論文中32篇為基金論文,占高被引論文總數(shù)38.1%,高被引論文的基金論文比率比普通論文高出12.5%.這種現(xiàn)象反映了開放存取研究高被引論文吸納基金能力強,論文的學(xué)術(shù)水平較高.
關(guān)鍵詞是論文主題思想和重要觀點的精煉概括,關(guān)鍵詞詞頻直接反映學(xué)科的研究主題.通過對84篇高被引論文關(guān)鍵詞的詞頻統(tǒng)計、歸并、整理,篩選出8個詞頻大于6次的高頻關(guān)鍵詞∶開放存取與開放倉儲、開放存取期刊、數(shù)字資源、圖書館、學(xué)術(shù)信息與學(xué)術(shù)交流、學(xué)術(shù)期刊、對策、出版模式.以8個高頻關(guān)鍵詞為基點,審讀84篇高被引論文,2004-2013年國內(nèi)開放存取高被引論文的研究主題有7個大類.
(1)開放存取期刊的出版模式研究.開放存取的出版模式一直是近年來的研究熱點.研究者對開放存取出版模式的概念、產(chǎn)生的背景以及存在的主要問題進行了探討,論述了開放存取期刊和開放倉儲的內(nèi)涵,對開放存取期刊和開放倉儲兩種途徑進行了比較[3-5].開放存取期刊是互聯(lián)網(wǎng)上的免費在線出版物,它的出現(xiàn)給傳統(tǒng)紙質(zhì)期刊帶來了巨大的沖擊,開放存取期刊的出現(xiàn)改變了學(xué)術(shù)交流體系.研究者認為,開放存取期刊目前出現(xiàn)了良好的發(fā)展態(tài)勢,規(guī)模不斷擴大,影響力日益增強[5-6].開放倉儲是開放存取出版的途徑之一,知識庫的建設(shè)、版權(quán)、資金、管理維護等的內(nèi)容引起了學(xué)者們高度關(guān)注,對基于學(xué)科開放倉儲學(xué)科知識庫和基于機構(gòu)開放倉儲機構(gòu)知識庫進行了有益的探討[7].
(2)開放存取期刊的評價和質(zhì)量控制研究.開放存取期刊的評價和質(zhì)量控制直接關(guān)系到開放存取期刊的發(fā)展前景,因此一直是期刊編輯出版部門和學(xué)術(shù)界研究的熱點,研究者繼承和發(fā)展了傳統(tǒng)文獻計量學(xué)評價方法,認為影響因子、即年指標、被引頻次同樣適應(yīng)于開放存取期刊學(xué)術(shù)影響力的評價.同時,基于開放存取期刊的特殊性,Web引文量、網(wǎng)絡(luò)影響因子和下載量等網(wǎng)絡(luò)文獻計量指標也是評價開放存取期刊的學(xué)術(shù)影響力不可或缺的指標[8-9].
還有研究者對相同學(xué)科領(lǐng)域影響因子相近的完全開放存取期刊和非開放存取期刊的平均被引頻次、被引頻次的極差、平均作者數(shù)、論文合著率等4個評價指標進行了比較,認為開放存取論文的影響力已經(jīng)達到甚至超過非開放存取論文[8].
(3)開放存取對圖書館影響的研究.圖書館作為學(xué)術(shù)信息集散中心必將受到開放存取發(fā)展的沖擊.研究者認為開放存取對圖書館的影響主要集中在信息獲取、信息組織、服務(wù)模式和讀者信息獲取方式等方面,重點是圖書館如何在開放存取背景下改變服務(wù)模式和拓展信息共享空間[10-11].
(4)開放存取對學(xué)術(shù)交流的影響研究.開放存取適應(yīng)了網(wǎng)絡(luò)時代信息交流的特點,開創(chuàng)了一種全新、高效的學(xué)術(shù)交流模式.因此開放存取對學(xué)術(shù)交流的影響也進入了研究者視野.研究者認為,開放存取為人們提供一個可以即時進行學(xué)術(shù)信息交流的新平臺,這個平臺的主要特征是信息承載豐富,交流渠道快捷通暢,交流成本低廉,是開展學(xué)術(shù)對話,掌握最新學(xué)術(shù)動態(tài),加速成果轉(zhuǎn)化的新通道[12-13].
(5)開放存取期刊的版權(quán)問題研究.近年開放存取的版權(quán)政策和知識產(chǎn)權(quán)保護受到研究者的重視.開放存取是以現(xiàn)行法律為基礎(chǔ),在許可協(xié)議框架內(nèi)作者自愿讓渡部分版權(quán),使用戶得到免費訪問權(quán)、獲取權(quán)和自由利用權(quán)的版權(quán)交易模式.研究者認為,這種新的出版模式應(yīng)該通過協(xié)議獲得法律保護,建立國家許可證制度,構(gòu)筑網(wǎng)絡(luò)資源認證體系,完善開放存取的授權(quán)模式等方式實施開放存取資源的版權(quán)管理[14].
(6)開放存取資源的長期保存問題研究.數(shù)字資源的長期保存是開放存取發(fā)展成敗的關(guān)鍵.研究者就開放存取中不同類型的數(shù)字資源長期保存的技術(shù)策略、系統(tǒng)和框架等問題作了有意義分析[15].還有研究者研究了國際上著名的數(shù)字保存領(lǐng)域相關(guān)的政策指南中關(guān)于開放存取資源長期保存的有關(guān)條款,調(diào)查了長期保存現(xiàn)狀和發(fā)展策略,研究了開放存取資源長期保存的目標、開放存取資源的選擇與評價、合作保存與多備份保存的方式等相關(guān)問題[16].
(7)開放存取的發(fā)展現(xiàn)狀與對策研究.目前,開放存取期刊已經(jīng)覆蓋了自然科學(xué)和社會科學(xué)眾多的學(xué)科領(lǐng)域,開放存取期刊的被引用率和影響因子在不斷提升,開放存取期刊和開放倉儲數(shù)量經(jīng)過數(shù)年的積累已經(jīng)進入了發(fā)展平緩期.研究者認為,把開放存取的期刊與論文納入科研評價體系,建立相應(yīng)的機制,強化開放存取論文的質(zhì)量控制,是促進開放存取的健康發(fā)展基本對策[17].
通過對開放存取研究高被引論文的多維度分析,研究結(jié)論如下∶開放存取的發(fā)文量和文獻被引率變化呈現(xiàn)出由初期的少量研究發(fā)展到鼎盛時期,再從巔峰到平緩的正態(tài)分布曲線,這個變化軌跡表明開放存取研究發(fā)展處于正常狀態(tài).高被引論文中的基金論文明顯高于非高被引論文,表明高被引論文吸納基金能力強,而強大的基金資助是支持高被引論文學(xué)術(shù)質(zhì)量的基石.開放存取研究成績很大,但由于開放存取研究內(nèi)涵的特殊性和跨學(xué)科的特殊要求,仍然存在著諸多的薄弱環(huán)節(jié).
第一,高被引論文的核心作者群尚未形成,研究團隊弱化.高被引論文的核心作者是學(xué)科研究領(lǐng)域中最有學(xué)術(shù)影響力的作者,這個群體狀況是一個學(xué)科研究發(fā)展的縮影.通過作者群體研究,不僅可以掌握學(xué)科科研發(fā)展的深度和廣度,而且對于學(xué)科研究的管理、組織、協(xié)調(diào)和引導(dǎo)都有積極地意義[18].本文的統(tǒng)計結(jié)果顯示∶12位核心作者發(fā)表的高被引論文共35篇,僅占高被引論文總量的41.7%,還未達到普賴斯定律規(guī)定的“只有核心作者發(fā)文量約占總發(fā)文量的50%時,學(xué)科的高產(chǎn)作者群才可形成”的標準[19].這表明開放存取研究領(lǐng)域穩(wěn)定的核心作者群尚未形成.核心作者群的發(fā)育程度是學(xué)科發(fā)展成熟度的折射,開放存取研究核心作者群發(fā)育不足是學(xué)科發(fā)展不足的反映.
第二,高載期刊集中,其他學(xué)術(shù)期刊響應(yīng)不足.開放存取研究涉及到多個學(xué)科,其研究的長足發(fā)展需要相關(guān)學(xué)科期刊的相應(yīng)和支持.開放存取研究高被引論文刊載的期刊有《圖書情報工作》、《中國圖書館學(xué)報》等12種期刊高載期刊,其中11種是圖書情報類期刊,1種是信息出版類期刊.這也就是說,國內(nèi)的開放存取研究發(fā)布的平臺集中于圖書情報期刊,其他相關(guān)學(xué)術(shù)期刊響應(yīng)不足.這種現(xiàn)象意味著開放存取研究沒有得到其他相關(guān)學(xué)科的支持,而相關(guān)學(xué)科支持的缺位必將影響到開放存取研究的深度、廣度和開放存取運動的普及展開.
第三,高被引論文產(chǎn)出機構(gòu)數(shù)量有限,覆蓋面偏小.高被引論文產(chǎn)出機構(gòu)的數(shù)量和分布,是考量學(xué)科研究深度和廣度的尺度之一.開放存取研究高被引論文的作者機構(gòu)來自北京大學(xué)、武漢大學(xué)、中南大學(xué)和平原大學(xué)、國家科學(xué)圖書館和《農(nóng)業(yè)工程學(xué)報》編輯部等部門,但機構(gòu)分布主要集中在高校及其附屬機構(gòu),數(shù)量有限,布點稀疏.這種產(chǎn)出機構(gòu)布局表明開放存取研究的點少面小,研究的普及性不足.
第四,研究短板明顯.開放存取研究高被引論文的主題清晰,基本上涵蓋了該課題的主要內(nèi)容,但是研究中短板還是非常明顯的,例如對開放存取技術(shù)支持研究、開放存取應(yīng)用性研究、開放存取資源的長期保存的研究等重要內(nèi)容沒有受到足夠的關(guān)注,這些方面的研究短板勢必成為制約開放存取理論研究深入進行和實際應(yīng)用充分發(fā)展的不利因素.
國內(nèi)開放存取研究從初期開放存取期刊的出版運作的基礎(chǔ)研究,到開放倉儲、信息共享空間、開放存取對圖書館的影響、開放存取期刊和論文的評價與質(zhì)量控制等方面研究的充分展開,研究層次日益深化,研究高度不斷攀升,但研究進程中的局限性仍然明顯.
參考文獻:
[1]郭書菊.我國“開放存取”研究的文獻計量分析[J].圖書館學(xué)刊,2008(4):22-25.
[2]張立.近年來我國開放存取研究的文獻計量分析[J].情報科學(xué),2014,32(1):138-142.
[3]李武,劉茲恒.一種全新的學(xué)術(shù)出版模式∶開放存取出版模式探析[J].中國圖書館學(xué)報,2004,30(6)∶66-69.
[4]李武.開放存取出版的兩種主要實現(xiàn)途徑[J].大學(xué)圖書館學(xué)報,2005(4)∶58-63.
[5]李麟,初景利.開放存取出版模式及發(fā)展策略[J].中國科技期刊研究,2006,17(3)∶341-347.
[6]程維紅,任勝利.中國科技期刊開放存取出版現(xiàn)狀[J].編輯學(xué)報,2007,19(3)∶196-198.
[7]楊帆,詹德優(yōu).開放存取及其實現(xiàn)方式分析[J].圖書館論壇,2006,26(1)∶186-189.
[8]胡德華,常小婉.開放存取期刊論文質(zhì)量和影響力的評價研究[J].圖書情報工作,2008,52(2)∶61-64.
[9]陶雯,胡德華,曲艷吉,等.開放存取期刊質(zhì)量評價方法研究[J].圖書情報工作,2006,50(10)∶72-75.
[10]林敏.試論開放存取對圖書館的影響和對策[J].圖書情報工作,2005,49(12)∶130-136.
[11]喻雯.開放存取對高校圖書館的影響及對策思考[J].圖書館,2008(8)∶50-52.
[12]吳建中.開放存取環(huán)境下的信息共享空間[J].國家圖書館學(xué)刊,2005(3)∶7-10.
[13]李春旺.網(wǎng)絡(luò)環(huán)境下學(xué)術(shù)信息的開放存?。跩].中國圖書館學(xué)報,2005,31(1)∶33-37.
[14]秦珂.開放存取的版權(quán)政策及其構(gòu)建[J].圖書館工作與研究,2008(1)∶7-10.
[15]孫紅娣.論開放存取中數(shù)字資源長期保存問題[J].圖書館學(xué)研究,2005(11)∶15-18.
[16]黃如花,胡文琴.開放存取資源長期保存政策的調(diào)查和分析[J].圖書與情報,2009(5)∶70-74.
[17]何琳.我國開放存取發(fā)展現(xiàn)狀和建設(shè)策略研究[J].圖書情報工作,2009,53(1)∶52-55.
[18]邱均平,馬瑞敬.基于CSSCI的圖書館、情報與檔案管理一級學(xué)科文獻計量評價研究[J].中國圖書館學(xué)報,2006,32(1)∶24-29.
[19]D·普賴斯.小科學(xué)、大科學(xué)[M].宋劍耕,戴振超,譯.北京∶世界科學(xué)出版社,1982.
(責任編輯∶邵曉軍)
中圖分類號:G236
文獻標識碼:A
文章編號:1007-5348(2015)10-0069-06
[收稿日期]2015-07-06
[基金項目]湛江師范學(xué)院人文社科研究青年項目(QW1110);湛江市科技攻關(guān)計劃項目(2012C3106037).
[作者簡介]張詩博(1984-),女,河南洛陽人,嶺南師范學(xué)院信息科學(xué)與技術(shù)學(xué)院館員,碩士;研究方向∶圖書情報學(xué).
M ultl-d lmenslonal Analysls of Dom estlc H lgh Clted PaPers on OPen Access Research ln 2004-2013
ZHANG Shi-bo
(Schoo1of Information Science and Techno1ogy,Lingnan Norma1Co11ege,Zhanjiang 524048,Guangdong,China)
Key words:oPen access;bib1iometrics;high1y cited PaPers
Abstract:To exP1ore the research features and the deve1oPment track of domestic oPen access in recent years, it uses methods of 1itera1 methodo1ogy and resources of″Pub1ication database of China academic journa1 network″and″Chinese Science Citation Database″in CNKI,referring to the data in the Chinese science and techno1ogy Periodica1 database of VIP information resources system and“WANFANG DATE”,to statistica11y sorts the basic data of high1y cited PaPers on the toPic of domestic oPen access in 2004-2013,Particu1ar1y to ana1yze e1ements on the time distribution,core authors,high1y cited journa1s,Pub1ishing organizations and distribution of high1y 1oaded PaPers with funds.W ith key words and word frequency in high1y cited PaPers as a breakthrough,it discusses the shortcomings of theme and Process of researches on oPen access.