高蘊(yùn)梅 陳子豪 張文韜
摘 要:Altmetrics作為一種新型科研產(chǎn)出評(píng)價(jià)方法,涌現(xiàn)了大量相關(guān)理論、方法、應(yīng)用和工具的研究成果。梳理與總結(jié)這些成果,可為后續(xù)研究提供一定的參考和借鑒。使用文獻(xiàn)計(jì)量學(xué)方法、BibExcel +Pajek等工具,分析作者機(jī)構(gòu)數(shù)和發(fā)文量、作者數(shù)和發(fā)文量、期刊載文數(shù)和發(fā)文量的“二八規(guī)律”;采用關(guān)鍵詞的Louvain社區(qū)發(fā)現(xiàn)方法,通過聚類分析挖掘出4類研究熱點(diǎn)。
關(guān)鍵詞:Altmetrics;BibExcel ;引用分析;共現(xiàn)網(wǎng)絡(luò); 聚類分析
DOI:10. 11907/rjdk. 192026 開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2020)005-0178-03
0 引言
Altmetrics 是Alternative Metrics的縮寫,中文稱為補(bǔ)充計(jì)量學(xué),又稱替代計(jì)量學(xué)、選擇計(jì)量學(xué),是一種基于社會(huì)媒體的新型評(píng)價(jià)方法,通過測(cè)量研究成果受到網(wǎng)絡(luò)的關(guān)注程度評(píng)估計(jì)算其影響力[1]。自2010 年P(guān)riem建立Altmetrics.com 網(wǎng)站以來,各界對(duì)Altmetrics廣泛關(guān)注,產(chǎn)生了大量相關(guān)理論、方法、應(yīng)用以及工具成果。因此,對(duì)Altmetrics領(lǐng)域研究現(xiàn)狀進(jìn)行梳理與總結(jié)十分必要。
基于中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)收錄的文獻(xiàn)梳理國(guó)內(nèi)Altmetrics研究成果如下:武澎[2]分析了2012-2015年關(guān)于Altmetrics的內(nèi)涵界定、國(guó)內(nèi)理論與實(shí)證研究、相關(guān)科研機(jī)構(gòu)應(yīng)用;龔佳劍[3]分析了 2008-2018年Altmetrics研究文獻(xiàn)的時(shí)間分布、機(jī)構(gòu)分布、作者分布和研究熱點(diǎn);鄧進(jìn)[4]分析了2012-2017年Altmetrics研究的時(shí)間分布、期刊分布、高引用分布、作者分布、機(jī)構(gòu)分布及研究熱點(diǎn)?;赪eb of Science核心合集數(shù)據(jù)庫(kù)梳理國(guó)際Altmetrics研究成果:齊世杰[5]分析了2010-2016年Altmetrics研究文獻(xiàn)的學(xué)科領(lǐng)域分布、國(guó)家及機(jī)構(gòu)分布、核心作者分布和研究熱點(diǎn);楊思洛[6]分析了2012-2014年Altmetrics研究的發(fā)展階段、內(nèi)容歸納、優(yōu)勢(shì)與劣勢(shì)和發(fā)展趨勢(shì);田文燦[7]分析了2012-2018年Altmetrics領(lǐng)域知識(shí)概念生長(zhǎng)與凋亡。這些研究成果較好地總結(jié)了Altmetrics領(lǐng)域研究現(xiàn)狀,但是缺乏對(duì)國(guó)際Altmetrics研究成果的作者機(jī)構(gòu)數(shù)、作者數(shù)、期刊載文數(shù)與發(fā)文量的規(guī)律分析和總結(jié),缺乏關(guān)鍵詞聚類結(jié)果的文獻(xiàn)內(nèi)容分析。
本文在借鑒上述研究成果基礎(chǔ)上,利用Pajek和VOSViewer等工具,分析作者機(jī)構(gòu)數(shù)和發(fā)文量、作者數(shù)和發(fā)文量、期刊載文數(shù)和發(fā)文量的“二八規(guī)律”,基于關(guān)鍵詞的Louvain社區(qū)發(fā)現(xiàn)聚類結(jié)果分析文獻(xiàn)內(nèi)容,期望能為Altmetrics領(lǐng)域的發(fā)展以及學(xué)者后續(xù)研究提供參考和借鑒。
1 數(shù)據(jù)來源與處理
研究數(shù)據(jù)來源于Web of Science數(shù)據(jù)庫(kù)。檢索式為:主題=“Altmetric”,檢索年限限定為2012-2019年,選擇Web of Science核心數(shù)據(jù)庫(kù),檢索時(shí)間:2019年3月6日,共得到327條數(shù)據(jù)。
利用文獻(xiàn)計(jì)量法對(duì)相關(guān)文獻(xiàn)進(jìn)行統(tǒng)計(jì)分析、數(shù)據(jù)描述,解釋文獻(xiàn)特征和變化規(guī)律,通過繪制科學(xué)知識(shí)圖譜,揭示與解讀相關(guān)文獻(xiàn)。結(jié)合各軟件的優(yōu)勢(shì),選取BibExcel 、Pajek、VOSViewer、EXCEL、NotePad等軟件進(jìn)行整理、編輯、統(tǒng)計(jì)、挖據(jù)和可視化等工作。
2 文獻(xiàn)“二八”特征分析
2012年P(guān)riem提出傳統(tǒng)引文文獻(xiàn)計(jì)量分析缺乏數(shù)據(jù)庫(kù)、軟件、博客等來源的引用問題,學(xué)者可在正式引用文獻(xiàn)出現(xiàn)之前討論、標(biāo)注、推薦、駁斥、評(píng)論、閱讀相關(guān)內(nèi)容,提出利用Altmetrics統(tǒng)計(jì)分析、度量評(píng)價(jià)、科學(xué)發(fā)現(xiàn)或推薦評(píng)價(jià)、在線工具和環(huán)境的定性研究,Altmetrics理論及其學(xué)術(shù)影響等研究,這些研究解決了Altmetrics數(shù)據(jù)平臺(tái)、指導(dǎo)思想、基本思路、應(yīng)用范圍等一些基本問題。
2.1 機(jī)構(gòu)數(shù)與發(fā)文量特征
327篇Altmetrics 論文作者機(jī)構(gòu)共403個(gè)(包括非第一作者機(jī)構(gòu)),403個(gè)機(jī)構(gòu)在327篇論文中出現(xiàn)了1 110次。發(fā)表1篇論文的機(jī)構(gòu)有202個(gè),占比50%,發(fā)表2篇論文的機(jī)構(gòu)有93個(gè),占比23.02%,發(fā)表3篇論文的機(jī)構(gòu)有31個(gè),占比7.67%,發(fā)表4篇論文的機(jī)構(gòu)有28個(gè),占比6.93%,發(fā)表5篇及以上論文的機(jī)構(gòu)50個(gè),占比12.38%。
Altmetrics機(jī)構(gòu)發(fā)文量分布的“二八特征”,即80%的機(jī)構(gòu)只發(fā)表了1~2篇論文,共計(jì)出現(xiàn)了388次(占總次數(shù)的35%);20%的機(jī)構(gòu)發(fā)表了3篇及以上論文,共計(jì)出現(xiàn)了722次(占總次數(shù)的65%)。
高產(chǎn)機(jī)構(gòu)有Wolverhampton Univ(53篇)、Dalian Univ Technol(30篇)、Nanyang Technol Univ(29篇)、Univ Cordoba(28篇)、 Univ Alberta(23篇)、 Univ Montreal(22篇)、Univ Toronto(18篇)、Wuhan Univ(18篇)、Max Planck Inst Solid State Res(16篇)、Reina Sofia Univ Hosp(16篇)、 Max Planck Gesell(16篇)、Univ Maryland(16篇)、Leiden Univ(15篇)。13家機(jī)構(gòu)(不足機(jī)構(gòu)總數(shù)的4%)出現(xiàn)了300余次,占總數(shù)的27%。
2.2 作者數(shù)與發(fā)文量特征
從作者的產(chǎn)出數(shù)量可以識(shí)別主要作者、該領(lǐng)域的研究者規(guī)模及活躍程度。327篇論文共有501名作者(包括非第一作者),501名作者在327篇論文中出現(xiàn)了758人次。發(fā)表1篇論文的作者有397人,占作者總數(shù)的79.24%,占總?cè)舜蔚?2.7%;發(fā)表2篇論文的作者63人,占作者總數(shù)的12.57%,共計(jì)出現(xiàn)了126次,占總?cè)舜蔚?6.62%;發(fā)表3篇論文的作者16人,占作者總數(shù)的3.2%,共計(jì)出現(xiàn)了48次,占總?cè)舜蔚?.3%;發(fā)表4篇及以上論文的作者24人,占作者總數(shù)的4.8%,共計(jì)出現(xiàn)了187次,占總?cè)舜蔚?4.7%。
Altmetrics作者數(shù)和發(fā)文量分布的“二八規(guī)律”,即80%的作者只出現(xiàn)了1次,20%的作者發(fā)表論文大于等于2篇,共計(jì)出現(xiàn)了361次,占總次數(shù)的47.6%。
高產(chǎn)作者有Thelwall(31篇)、Bornmann(20篇)、 Haunschild(15篇)、 Haustein(10篇)、Lariviere(8篇)、Holmberg(8篇)、Costas(7篇)、Ortega(7篇)、Gorraiz(6篇)、Bowman(6篇)、Sugimoto(6篇)、Owen(6篇)。
高產(chǎn)作者的發(fā)文特征:12名作者(占作者總數(shù)的2.4%)發(fā)文130篇(占論文總數(shù)的39.8%)。
2.3 載文期刊數(shù)與發(fā)文量特征
327篇文章發(fā)表在105種期刊上,分布在計(jì)量學(xué)、信息學(xué)、化學(xué)、醫(yī)學(xué)等多個(gè)學(xué)科期刊上,包括《NATURE》,《ACS CENTRAL SCIENCE》等多個(gè)世界頂級(jí)期刊,表明Altmetrics研究引起了眾多學(xué)科領(lǐng)域注意,且取得了較高層次成果。
75種期刊只發(fā)表了1篇論文,占期刊數(shù)的71.4%,占論文數(shù)的22.9%。發(fā)文量在2篇及以上期刊30個(gè),占期刊數(shù)的28.6%,占論文數(shù)的77.1%。
載文期刊數(shù)和發(fā)文量呈“二八規(guī)律”:大約80%的論文發(fā)表在20%的期刊上,20%的論文發(fā)表在80%的期刊上(每個(gè)期刊只發(fā)表了1篇)。
大于5篇的高產(chǎn)期刊有:SCIENTOMETRICS(87篇)、JOURNAL OF THE ASSOCIATION FOR INFORMATION SCIENCE AND TECHNOLOGY(24篇)、PLOS ONE(20篇)、JOURNAL OF INFORMETRICS(17篇)、ELIFE(15篇)、ONLINE INFORMATION REVIEW(13篇)、ASLIB JOURNAL OF INFORMATION MANAGEMENT(12篇)、ABSTRACTS OF PAPERS OF THE AMERICAN CHEMICAL SOCIETY(8篇)。
高產(chǎn)期刊數(shù)和發(fā)文量特征:8個(gè)期刊(占期刊數(shù)的7.6%)發(fā)文196篇,占論文總數(shù)的60%。
3 基于Louvain社區(qū)發(fā)現(xiàn)聚類的內(nèi)容分析
關(guān)鍵詞是對(duì)論文主題的高度概括和凝練,是學(xué)術(shù)論文的核心與精髓。統(tǒng)計(jì)分析Altmetrics研究發(fā)表論文中關(guān)鍵詞出現(xiàn)頻次及其相互關(guān)系,可以揭示該領(lǐng)域的知識(shí)結(jié)構(gòu)演變和研究熱點(diǎn)分布。使用BibExcel 提取頻次大于4的關(guān)鍵詞生成關(guān)鍵詞共現(xiàn)矩陣,Pajek生成共現(xiàn)網(wǎng)絡(luò)并用Louvain社區(qū)發(fā)現(xiàn)算法聚類分析,VOSViewer可視化結(jié)果得到4類研究主題及熱點(diǎn)。
第1個(gè)聚類的關(guān)鍵詞包括Facebook、Tweets、Twitter、Researchgate等社會(huì)媒體(Social Media),使用Altmetrics、Plumx等平臺(tái)和工具,獲得Research Evaluation、Webometrics、Article-Level Metrics等指標(biāo)的度量、影響因子、數(shù)據(jù)背景等主題。Zhang[8]基于生態(tài)學(xué)領(lǐng)域的40 000篇文獻(xiàn)的計(jì)量學(xué)和Altmetrics數(shù)據(jù),分析了科學(xué)論文在社交媒體上的傳播模式,特別是高Tweet和高引用論文,發(fā)現(xiàn)Tweet時(shí)間和用戶類型影響了科學(xué)出版物在社交媒體上的關(guān)注度。具有大量Tweet用戶的文章能及時(shí)被社會(huì)媒體曝光,通常是期刊相關(guān)機(jī)構(gòu)用戶或有很多粉絲的用戶。一般高引用論文既不是及時(shí)推送也不是期刊用戶推動(dòng)的結(jié)果;Vainio[9]研究是誰(shuí)推送了農(nóng)業(yè)、工程技術(shù)、醫(yī)學(xué)、自然和人文社科等4個(gè)學(xué)科的論文,通過定性和定量的關(guān)鍵詞分類、共詞分析和內(nèi)容分析研究,結(jié)果發(fā)現(xiàn)Twitter 用戶推送學(xué)術(shù)文章的原因更多強(qiáng)調(diào)的是他們的職業(yè)專長(zhǎng)而非個(gè)人興趣;Yu[10]研究了Altmetrics 數(shù)據(jù)的上下文背景,包括計(jì)數(shù)類型和用戶類別,不同twitter用戶類別數(shù)據(jù)表明,一般發(fā)到Twitter的信息對(duì)公眾用戶影響很大,研究者用戶比其他類別用戶具有更多的引用相關(guān)性。
第2個(gè)聚類關(guān)鍵詞包括Citation analysis、Impact factor、 Medndeley、H-index等,研究?jī)?nèi)容主要針對(duì)臨床實(shí)驗(yàn)(Clinical Trials)等領(lǐng)域的傳統(tǒng)引文H指數(shù)和基于Mendeley等文獻(xiàn)工具的Altmetrics指數(shù)之間的對(duì)比分析、引用分析、引用特征、引用源等主題。Haustein[11]分析了37位天體物理學(xué)家的Twitter用戶推文行為,并比較了他們的出版行為和引用關(guān)系,結(jié)果發(fā)現(xiàn)他們的推文與出版數(shù)呈中度負(fù)相關(guān),轉(zhuǎn)發(fā)與引用率不相關(guān),推文和摘要的相似性很低;Costas(2017)分析了文獻(xiàn)工具M(jìn)endeley的讀者數(shù)分布與跨領(lǐng)域引用之間的不同和相似之處。通過特征分布和尺度方法分析兩者的分布形狀,解決兩者差異引出的標(biāo)準(zhǔn)化問題度量框架,結(jié)果發(fā)現(xiàn)Mendeley閱讀分布與各個(gè)領(lǐng)域的歪斜度高度相關(guān),使用領(lǐng)域讀者數(shù)的均值作為標(biāo)準(zhǔn)化因子可以得到較好結(jié)果,引用數(shù)量是度量產(chǎn)出的重要指標(biāo);Luo(2018)從實(shí)引論文和來自有名機(jī)構(gòu)的引用源兩個(gè)方面探究影響引用數(shù)量的因子,結(jié)果發(fā)現(xiàn)引用了有名機(jī)構(gòu)的論文比無(wú)名機(jī)構(gòu)的論文具有更高的引用數(shù)量,有名機(jī)構(gòu)引用的論文作者和期刊具有更高的H指數(shù)、期刊影響因子、更高的Altmetric 分?jǐn)?shù)和其它指標(biāo)。
第3個(gè)聚類關(guān)鍵詞包括Open Access、Peer Review、Research、Blogging等,主要研究?jī)?nèi)容包括Altmetrics開放獲取、同行評(píng)審的相互影響和應(yīng)用。Snijder(2016)從2009年就開始了一個(gè)實(shí)驗(yàn),驗(yàn)證開放獲取對(duì)引文數(shù)量和推文專著關(guān)注量是否有相關(guān)影響。2014年獲取了引文和推文測(cè)試數(shù)據(jù),結(jié)果表明開放獲取略有優(yōu)勢(shì),但是也應(yīng)該考慮語(yǔ)言和主題的影響,Twitter的使用和引用行為很難有交集。在社交媒體、開放獲取、Altmetrics和大數(shù)據(jù)的影響下,同行評(píng)審越來越開放;Tattersall(2015)討論了公開同行評(píng)審意見的促進(jìn)和障礙因素,鼓勵(lì)在出版前后公開同行意見。平臺(tái)(F1000 Research,Open Review,Peer J, Peerage of Science, PLOS ONE,PubMed Commons,Publons,PubPeer,ScienceOpen,The Winnower)可應(yīng)用Altmetrics、雪球度量(Snowball Metrics)或其它類似的系統(tǒng),公開和盲審出版前后的評(píng)審意見。
第4個(gè)聚類關(guān)鍵詞包括 Journal、Metrics, Correlations, Indicators, Citation Index, 主要研究Altmetrics的期刊度量、引用指標(biāo)和相關(guān)性分析等主題。Markusova(2018)分析了2015年俄羅斯國(guó)內(nèi)37 200條SCIE論文,使用兩個(gè)指標(biāo)180天的使用數(shù)(記為U1),以及自2013年2月以來的使用數(shù)(記為U2),識(shí)別引用指標(biāo)和論文級(jí)度量的Kendall相關(guān)系數(shù),結(jié)果表明時(shí)間較長(zhǎng)的U2比時(shí)間短的U1具有更強(qiáng)的相關(guān)性,U1的使用量和傳統(tǒng)期刊度量的被引半衰期呈弱相關(guān)。DOI是多數(shù)網(wǎng)站或Altmetrics 工具檢索、識(shí)別論文的關(guān)鍵元素,Boudry(2017)評(píng)估了在PubMed數(shù)據(jù)庫(kù)中生物醫(yī)學(xué)類期刊論文具有DOI的情況。使用出版商期刊的國(guó)家地理分析,結(jié)果發(fā)現(xiàn)1966-2015期間只有40.48%的期刊有DOI ,2000開始逐漸增加,到2015年86.42%的論文有DOI,但是仍有部分國(guó)家(如俄羅斯、泰國(guó)、烏克蘭)很少有DOIs。
4 結(jié)語(yǔ)
Altmetrics研究從無(wú)到有、由點(diǎn)及面,從備受質(zhì)疑到廣為接受,并廣泛作為論文、專利、圖書、機(jī)構(gòu)、期刊等評(píng)價(jià)的參考因素,進(jìn)度和成果超出預(yù)期,相關(guān)研究成果豐碩。社交媒體平臺(tái)為科研工作者和科學(xué)愛好者提供了豐富的資源、廣闊的研究空間和研究前景。可以預(yù)見,有關(guān)Altmetrics的研究必將呈現(xiàn)蓬勃發(fā)展之勢(shì),研究成果將持續(xù)增長(zhǎng)。
參考文獻(xiàn):
[1] 余厚強(qiáng),任全娥,張洋,等. Altmetrics的譯名分歧:困擾、影響及其辨析[J]. 中國(guó)圖書館學(xué)報(bào), 2019(1):47-59.
[2] 武澎,李田田,王開陽(yáng),等. 我國(guó)Altmetrics研究現(xiàn)狀與熱點(diǎn)分析[J]. 科研管理,2018(5):122-130.
[3] 龔佳劍,孟群. 補(bǔ)充計(jì)量學(xué)研究可視化分析[J]. 首都醫(yī)科大學(xué)學(xué)報(bào),2019(1):106-111.
[4] 鄧進(jìn). 基于科學(xué)計(jì)量學(xué)的國(guó)內(nèi)Altmetrics研究文獻(xiàn)的分析[J]. 西南民族大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2018 (5): 236-240.
[5] 齊世杰,鄭軍衛(wèi). 基于文獻(xiàn)大數(shù)據(jù)的國(guó)際Altmetrics研究力量與熱點(diǎn)分析[J]. 現(xiàn)代情報(bào),2017(10):130-138.
[6] 楊思洛,程愛娟. 社交網(wǎng)絡(luò)環(huán)境下的計(jì)量學(xué):Altmetrics研究進(jìn)展綜述[J]. 情報(bào)資料工作,2015(4) :33-37.
[7] 田文燦,胡志剛,王賢文.科學(xué)計(jì)量學(xué)視角下的Altmetrics發(fā)展歷程分析[J]. 圖書情報(bào)知識(shí),2019(2):5-11.
[8] ZHANG L,WANG J. Why highly cited articles are not highly tweeted? a biology case[J]. Scientometrics, 2018(1):495-509.
[9] VAINIO J,HOLMBERG K. Highly tweeted science articles: who tweets them?an analysis of Twitter user profile descriptions[J]. Scientometrics, 2017(1):345-366.
[10] YU, H. Context of altmetrics data matters: an investigation of count type and user category[J]. Scientometrics, 2017 (1):267-283.
[11] HAUSTEIN S,BOWMAN T D,HOLMBERG K,et al. Astrophysicists on twitter: an in-depth analysis of tweeting and scientific publication behavior[J]. Aslib Journal of Information Management,2014 (3):279-296.
(責(zé)任編輯:杜能鋼)