莊紀林 莊紀林
摘要給出一定條件,實現(xiàn)了SJR算法向特征因子算法的轉(zhuǎn)化。選取CSSCI收錄的圖書情報學期刊2007年互引矩陣,分別計算被引量、EF、SJR、IF、AI、SJRQ,并分成兩類進行相關(guān)度分析。結(jié)果表明,在一定條件下,SJR算法可轉(zhuǎn)化成特征因子算法,并且期刊評價指標EF與SJR指標顯著相關(guān),它們完全可以作為被引頻次與IF的參考、補充甚至替代。
關(guān)鍵詞特征因子文章影響分值SJRSJRQ影響因子期刊評價引文分析
分類號G35
1引言
期刊評價是文獻計量學的重要應(yīng)用領(lǐng)域,主要用于反映學術(shù)期刊的質(zhì)量和水平。期刊評價的理論和方法經(jīng)過長期的研究與發(fā)展,已經(jīng)取得了眾多成果,在實際應(yīng)用方面也取得了長足進展。文獻計量指標從傳統(tǒng)的載文量、被引量、影響因子(Impact Factor,以下簡稱IF)[1,2]、到后來提出的h指數(shù)[3]、g指數(shù)[4]、A指數(shù)、r指數(shù)等類h指數(shù)[5,6]。隨著谷歌的頁面排名(PageRank)算法出世,2008年Scopus推出了基于自身數(shù)據(jù)庫的評價指標SCIMAGO 期刊排名(SCImago journal rank,以下簡稱SJR)[7]與每篇論文的參考源標準影響引子(Source Normalized Impact per Paper,以下簡稱SNIP)[8]。作為回應(yīng),湯姆森路透科技集團也推出了期刊評價指標特征因子(Eigenfactor,EF)[9]作為JCR的增強功能,并于2009年初正式采用。2012年SJR和SNIP對各自的算法進行修正與改進,發(fā)表了修正指標SJR2[10]與SNIP2[11] 。2015年湯姆森路透科技集團也發(fā)布了兩個新的文獻計量學指標,一個是標準特征因子(Normalized Eigenfactor,以下簡稱NEI)[12],一個是期刊影響因子百分位(Journal Impact Factor Percentile,以下簡稱JIFP)[13] 。而作為新型期刊評價指標的代表SJR和EF,兩者都采用了類PageRank算法模型來評價科技期刊的質(zhì)量與影響力,是當前期刊評價指標的研究熱點。
幾十年來,IF得到了廣泛的認可和應(yīng)用,然而近年來學者們把更多注意力投入到SJR和EF等類PageRank算法中,究其原因,是因為IF存在著以下幾點問題[14]:
1)IF在計算過程中并沒有考慮引用質(zhì)量,只有對引文數(shù)量的統(tǒng)計。一篇學術(shù)權(quán)威發(fā)表的文章中引用的參考文獻顯然應(yīng)該具有更高的價值。
2)在計算過程中未能排除期刊的自引行為,這使得期刊可以通過增加自引來提高影響因子。
3)IF計算方法采用的時間段為兩年,由于研究領(lǐng)域差異性導致不同領(lǐng)域的論文的被引頻次有較大差異。那些科研周期較長、發(fā)表周期也相對較長的領(lǐng)域,有可能出現(xiàn)引用行為因超出兩年的時限不能被計入被引量,進而影響IF的計算結(jié)果。
4)SCI收錄的不同學科的期刊數(shù)目差別很大,這種差別不僅反映在論文數(shù)量上,而且反映在引文數(shù)量上。而相同或相近研究領(lǐng)域的論文傾向于相互引證,這又反過來加大了不同學科間刊物的影響因子的差異。
5)基于少量期刊刊載大量有重大意義和影響的科研成果的研究結(jié)果,SCIE收錄期刊只占全世界期刊總量的3.6%,而且語種大多為英文,非常有利于以英語為母語的國家的刊物獲得高影響因子。
自從SJR和EF算法問世以來,由于這類算法不僅考慮了引文的數(shù)量,而且考慮了引文的質(zhì)量,能夠很容易地去除自引,其統(tǒng)計年限窗口也分別擴大為3年和5年,因此受到了廣大學者的逐步關(guān)注與認可,國內(nèi)也有很多學者對其進行了研究。《特征因子原理及實證研究》[15]一文以18種CSSCI收錄圖書情報學期刊為例,計算出它們的特征因子分值和論文影響分值,在此基礎(chǔ)上對這兩項指標同其他期刊評價指標的關(guān)系進行了探討,得出了特征因子分值、論文影響分值和期刊綜合指數(shù)、h指數(shù)、影響因子之間存在較強的皮爾遜相關(guān)性的結(jié)論;《SJR指數(shù)研究及其與影響因子的比較分析》[14]一文將SJR指數(shù)與影響因子各方面的特征進行了比較,并通過2007年的實際數(shù)據(jù)對這兩項指標的實際效果進行了比對分析,總結(jié)了兩者在期刊評價中的優(yōu)勢以及不足之處;《評價期刊影響力的三項指標比較研究》[16]一文以JCR中信息科學與圖書館學中影響因子排名前20的期刊為樣本,對影響因子、5年影響因子、SJR以及特征因子的排名進行比較分析,得出SJR與其他三者之間沒有發(fā)現(xiàn)顯著相關(guān)性的結(jié)論。以上文章或者是實現(xiàn)了某種期刊評價算法并試圖對評價結(jié)果進行分析,或者是對研究機構(gòu)發(fā)布的多個期刊評價指標直接分析相關(guān)性。
3實證檢驗
從以上分析可以看出,EF算法與SJR算法存在著高度的相似性,而且在滿足一定條件下,兩者的迭代過程是完全一樣的。可以預見EF算法與SJR算法在進行期刊評價時其結(jié)果具有高度的相關(guān)性。為此,筆者選取2008-2009年CSSCI收錄圖書情報學期刊2007年度互引矩陣[15],并實現(xiàn)了EF和SJR算法,在相同統(tǒng)計年限窗口內(nèi)分別統(tǒng)計被引量、IF、EF、AI、SJR、以及SJRQ指標,并分類驗證指標間的相關(guān)度。從第4小節(jié)的分析可知,從指標間的對應(yīng)關(guān)系上來看,被引量與EF、SJR相對應(yīng),IF與AI、SJRQ相對應(yīng),下面分別對這兩組指標考察其相關(guān)性。
表2共包含18種期刊的互引數(shù)據(jù),由于SJR算法中計算某期刊的引用總數(shù)時不僅包含對統(tǒng)計源期刊的引用數(shù),還包含對統(tǒng)計源期刊外的引用數(shù),所以這里把表2中前12種期刊作為統(tǒng)計源期刊,后6種期刊作為統(tǒng)計源外期刊。經(jīng)過整理可得以下表。
需要說明的是,這里的各指標值都是在相同的統(tǒng)計源期刊和相同的統(tǒng)計年限窗口下計算的,實際上它們之間的統(tǒng)計源期刊和統(tǒng)計年限窗口不盡相同,本文統(tǒng)一了統(tǒng)計源期刊和統(tǒng)計年限窗口的目的是為了盡可能探索這些期刊評價指標之間的相關(guān)度。
通過表4與表5的排名來看,被引量、π*、EF及SJR之間具有極強的相關(guān)性,IF、AI及SJRQ之間也具有極強的相關(guān)性。為了進一步說明它們之間的相關(guān)性,筆者利用SPSS統(tǒng)計分析軟件,進行相關(guān)度分析(Spearman相關(guān)系數(shù)),其結(jié)果如表6、7、8、9所示。
從表6、7、8、9可以清楚地看出被引量、π*、EF及SJR兩兩之間無論是數(shù)值還是排名的相關(guān)度都在0.9以上,是顯著相關(guān)的;IF、AI與SJRQ兩兩之間無論是數(shù)值還是排名的相關(guān)度也都在0.9以上,也是顯著相關(guān)的。通過相關(guān)度分析,從另一側(cè)面說明了基于PageRank算法的EF算法與SJR算法大同小異,存在著高度的相似性。
4討論與小結(jié)
經(jīng)由前面的理論分析及算法推導,如果在計算SJR指標時:
1)調(diào)整權(quán)重令α+β=d+e=1。
2)期刊j的參考文獻數(shù)只包含對統(tǒng)計源期刊的引用數(shù),而不是其所有的引用數(shù)。
3)去除自引因素的影響。
那么,計算EF指標的迭代表達式(1)和計算SJR指標的迭代表達式(18)從形式和意義上是完全一樣的。
同時,根據(jù)表1所列EF算法與SJR算法之間的差別,如果再滿足以下兩個條件:
4)統(tǒng)計年限窗口一樣。
5)統(tǒng)計源期刊一樣。
那么計算EF和計算SJR的迭代過程和結(jié)果是完全一樣的。當然,只是“迭代”的過程和結(jié)果完全一樣,并不是最終的EF和SJR值完全一樣。從SJR算法的定義得SJR=π*,而EF定義成(2)式EF=100Hπ*∑i[Hπ*]i。
那么,為什么EF算法不像SJR一樣直接采用π*呢?應(yīng)該是出于以下幾點考慮:
1)EF算法的迭代過程中用文章向量替代H′矩陣懸點列放大了懸點的作用,H是替代前的包含懸點的規(guī)范化互引矩陣,讓H點乘π*可部分抵消這種替代的影響。
2)同樣,(2)式分子中沒有加上文章向量貢獻的權(quán)重(1-α)a也是出于部分抵消迭代過程中文章向量所給予的初始值的影響。
3)(2)式中等式右邊乘以100是為了換算成百分值;(2)式中分母的引入是出于規(guī)范化的目的:由于∑i[Hπ*]i=1-dπ*,d為懸點向量,所以,如果存在懸點,則∑i[Hπ*]i<1。分母的引入保證了∑iEF=100。
當然,EF算法中在得出π*后從π*到EF轉(zhuǎn)換相較于SJR算法直接采用π*,這兩者究竟哪個更合理,則超出了本文的討論范圍,有興趣的研究者可以繼續(xù)研究下去。
因此,雖然期刊評價指標EF和SJR之間存在著一些區(qū)別,這些區(qū)別主要表現(xiàn)在計算方法與來源數(shù)據(jù)兩個方面:從計算方法上看,主要涉及引用關(guān)系的權(quán)重、處理自引的方式以及引用論文的統(tǒng)計方式;從來源數(shù)據(jù)上看,SJR指標以Scopus數(shù)據(jù)庫的數(shù)據(jù)為基礎(chǔ),EF以Web of Science的數(shù)據(jù)為基礎(chǔ),SJR指標的統(tǒng)計窗口年限為3年,EF指標的統(tǒng)計窗口年限為5年。但是,由于EF和SJR都是基于PageRank算法,兩者是一脈相承的,在滿足一定的條件下,SJR算法的迭代式與EF算法的迭代式從形式和意義上完全一樣的。
通過實證研究,發(fā)現(xiàn)被引量、π*、EF及SJR兩兩之間是顯著相關(guān)的,IF、AI與SJRQ兩兩之間也是顯著相關(guān)的。傳統(tǒng)期刊指標被引量與影響因子雖然存在著一些缺陷,但在實踐上仍存在著相當?shù)暮侠硇浴F算法、SJR算法作為新興算法,克服了被引量與影響因子只考慮引文數(shù)量忽略引文質(zhì)量的缺陷,也完全可以作為被引量與影響因子的參考、補充甚至替代。
參考文獻
1Garfield E. Citation analysis as a tool in journal evaluation[J]. Science, 1972, 178(4060): 471-479.
2Henk F, Moed. Citation analysis of scientific journals and journal impact measures[J]. Current Science, 2005, 98(12): 1990-1996.
3Hirsch J E. An index to quantify an individuals scientific output[J]. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(46): 16569-16572.
4Egghe L. How to improve the hindex[J]. Scientist, 2006, 20(3):15-15.
5Jin B H et al. The R-and ARindices: Complementing the hindex[J]. Chinese Science Bulletin, 2007, 52(6):855-863.
6葉鷹. H指數(shù)和類h指數(shù)的機理分析與實證研究導引[J]. 大學圖書館學報, 2007(5): 2-5.
7Butler D. Free Journalranking Tool Enters Citation Market[J]. Nature, 2008, 451(7174): 6.
8Henk F Moed. Measuring Contextual Citation Impact of Scientific Journals[J]. Journal of Informetrics, 2010(4): 265-277.
9Bergstrom C T., West J D. et al. The Eigenfactor Metrics[J]. The Journal of Neuroscience, 2008, 28(45): 11433-11433.
10GuerreroBote V P, MoyaAnegón F. A further step forward in measuring journals scientific prestige: The SJR2 indicator[J]. Journal of Informetrics, 2012, 6(4): 674-688.
11Ludo Waltman, Nees Jan van Eck, Thed N.van Leeuwen. et al.Some modifications to the SNIP journal impact indicator[J]. Journal of Informetrics, 2013, 7 (2): 272-285.
12Thomson Reuters. Normalized eigenfactor score[EB/OL]. [2017-11-03] http://ipsciencehelp.thomsonreuters.com/incitesLiveJCR/glossaryAZgroup/g9/9709TRS.html.
13Thomson Reuters. Journal impact factor percentile[EB/OL]. [2017-11-03] http://ipsciencehelp.thomsonreuters.com/incitesLiveJCR/glossaryAZgroup/g8/9586TRS.html.
14楊康,劉明政,張旭. SJR指數(shù)研究及其與影響因子的比較分析[J]. 情報雜志,2009,28(11):27-30.
15米佳,濮德敏. 特征因子原理及實證研究[J]. 大學圖書館學報,2009,27(6):63-68.
16田質(zhì)兵. 評價期刊影響力的三項指標比較研究[J]. 現(xiàn)代情報,2010,30(9):141-143,146.
17EIGENFACTOR.org. EigenfactorTM score and article influenceTM score: detailed methods[EB/OL]. [2017-11-03] http://www.eigenfactor.org/methods.pdf.
18SCImago Research Group. Description of scimago journal rank indicator[EB/OL]. [2017-11-03] http://www.scimagojr.com/SCImagoJournalRank.pdf.