国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于特征因子算法改進(jìn)的作者影響力評(píng)價(jià)研究

2015-02-01 06:29馬瑞敏韓小林
關(guān)鍵詞:改進(jìn)

馬瑞敏,韓小林

(山西大學(xué)a.管理與決策研究所; b.科學(xué)評(píng)價(jià)研究中心,山西太原 030006)

?

基于特征因子算法改進(jìn)的作者影響力評(píng)價(jià)研究

馬瑞敏a,b,韓小林a,b

(山西大學(xué)a.管理與決策研究所; b.科學(xué)評(píng)價(jià)研究中心,山西太原030006)

摘要:特征因子算法是評(píng)價(jià)期刊質(zhì)量的一種重要方法,文章在特征因子算法基礎(chǔ)上通過(guò)改進(jìn)構(gòu)造出一種作者影響力評(píng)價(jià)的新算法。首先對(duì)特征因子算法原理進(jìn)行簡(jiǎn)單介紹。然后通過(guò)分析作者引用相較期刊引用的特殊性,對(duì)特征因子算法進(jìn)行了改進(jìn),并對(duì)其實(shí)現(xiàn)步驟進(jìn)行了詳細(xì)說(shuō)明。最后,選擇國(guó)內(nèi)圖情學(xué)作者引用網(wǎng)絡(luò)進(jìn)行應(yīng)用研究,得到了這些作者的影響力排名,并與傳統(tǒng)的被引次數(shù)進(jìn)行了比較。

關(guān)鍵詞:作者影響力;特征因子算法;改進(jìn)

修回日期:2014 -09 -25

隨著信息經(jīng)濟(jì)時(shí)代向知識(shí)經(jīng)濟(jì)時(shí)代的發(fā)展,知識(shí)溝通顯得尤為重要,文獻(xiàn)是知識(shí)傳播的主要載體,而作者是文獻(xiàn)的創(chuàng)作者,所以作者已經(jīng)成為知識(shí)創(chuàng)造的力量源泉和知識(shí)傳播的主要承載者。作者影響力的評(píng)價(jià)一直是科研管理界和學(xué)者們關(guān)注的焦點(diǎn)問(wèn)題,不少學(xué)者對(duì)此進(jìn)行了一系列研究,產(chǎn)生了眾多影響力較大的成果,主要集中在如下三個(gè)方面:一是被引次數(shù)。美國(guó)信息學(xué)家E. Garfield曾編制《科學(xué)引文索引》,首次系統(tǒng)化地對(duì)作者之間的引用進(jìn)行研究,并提出用被引次數(shù)對(duì)作者的影響力進(jìn)行評(píng)估[1];二是h指數(shù)。美國(guó)物理學(xué)家J. E. Hirsch將作者的發(fā)文量和被引次數(shù)進(jìn)行綜合考量,提出h指數(shù)對(duì)作者進(jìn)行評(píng)價(jià)研究[2];三是改進(jìn)的page-rank算法。如美國(guó)印地安那大學(xué)的Ying Ding考慮到作者引用與網(wǎng)頁(yè)鏈接之間的相關(guān)性,于是提出對(duì)page-rank算法進(jìn)行改進(jìn)以對(duì)作者影響力進(jìn)行評(píng)價(jià)[3]。以上研究中前兩方面都是僅圍繞作者的絕對(duì)被引次數(shù)展開(kāi),第三個(gè)方面的研究雖然在考慮作者被引次數(shù)的同時(shí)也將施引作者的影響力考慮進(jìn)去,但對(duì)一些參數(shù)的處理方面還有可改進(jìn)之處。隨著對(duì)期刊評(píng)價(jià)的一種新算法——特征因子算法的提出,該算法在考慮期刊引用之間的被引次數(shù)和施引期刊的影響力之外,將其引用的方向性和多次引用情況都考慮進(jìn)去[4],這樣對(duì)于評(píng)價(jià)期刊的影響力更具有科學(xué)性和說(shuō)服力。D. Jevin考慮到期刊評(píng)價(jià)與作者評(píng)價(jià)之間有非常明顯的相似性,開(kāi)始嘗試將該算法運(yùn)用到對(duì)作者影響力評(píng)價(jià)中[5],而國(guó)內(nèi)有不少學(xué)者只是針對(duì)特征因子算法自身的原理等進(jìn)行探究[6 -8],目前尚未有學(xué)者將該算法應(yīng)用到對(duì)作者的評(píng)價(jià)研究中。

本文試圖將特征因子算法拓展到對(duì)作者影響力的評(píng)價(jià)研究中,并且根據(jù)作者影響力評(píng)價(jià)研究自身的特殊性對(duì)該算法進(jìn)行改進(jìn),提出一種對(duì)作者影響力評(píng)價(jià)的新算法,這樣不僅是對(duì)作者影響力評(píng)價(jià)研究領(lǐng)域的補(bǔ)充,也為該方面的研究提供了一個(gè)新的視角。

一、特征因子的基本算法

影響因子在計(jì)算期刊的引用次數(shù)時(shí),對(duì)于不同期刊的引用都平等對(duì)待,只統(tǒng)計(jì)引用次數(shù),而事實(shí)上,不同期刊的價(jià)值有很大的差別,如Nature和Science這樣影響力非常大的期刊,顯然不能和一些普通期刊的引用份量同等對(duì)待,兩篇文章分別被Nature引用和被一個(gè)不知名的期刊引用,則這兩篇文章的質(zhì)量相差很大?;谶@樣的現(xiàn)實(shí)情況,于是就引入特征因子( Eigen-factor)這個(gè)指標(biāo),該指標(biāo)的制定考慮了引用該期刊的期刊源的權(quán)重,通過(guò)期刊之間的引用情況構(gòu)建期刊引用網(wǎng)絡(luò),從而對(duì)期刊的重要性進(jìn)行評(píng)價(jià)。特征因子算法工作原理具體如下:首先選擇一個(gè)期刊,并任意選擇該期刊中一個(gè)參考文獻(xiàn)鏈接到另一個(gè)期刊,然后在之前鏈接到的那個(gè)期刊中再任意選出一個(gè)參考文獻(xiàn),再繼續(xù)鏈接到對(duì)應(yīng)的下一個(gè)期刊,依此類(lèi)推,不停地重復(fù)這個(gè)

行為,于是發(fā)現(xiàn)被鏈接到次數(shù)越多的期刊,其影響力越大,鏈接到該期刊的概率值的百分位數(shù)就是該期刊的特征因子值。

二、改進(jìn)的特征因子算法

作者之間的引用與期刊之間的引用情況非常相似,但兩者也有一定的區(qū)別。通常,一個(gè)期刊的被引用情況與其所承載的論文數(shù)量有很大關(guān)系,承載論文數(shù)量越多的期刊越有機(jī)會(huì)得到其他期刊的引用,而作者之間的引用受作者自身被引次數(shù)的多少影響較大,受作者的發(fā)文量的影響相對(duì)較小。因此在如下兩方面進(jìn)行改進(jìn):第一,將特征因子算法中的A改進(jìn)為作者被引次數(shù)向量對(duì)應(yīng)的單位向量;第二,在構(gòu)建隨機(jī)矩陣M'時(shí),用作者被引次數(shù)向量代替懸點(diǎn)向量,從而對(duì)矩陣M進(jìn)行改進(jìn)后的懸點(diǎn)處理。改進(jìn)后作者影響力算法的具體步驟如下。

( 1)構(gòu)建作者引用網(wǎng)絡(luò)矩陣??紤]作者引用與期刊引用的相似性,可以根據(jù)特征因子對(duì)期刊評(píng)價(jià)的原理與思路,模仿期刊引用網(wǎng)絡(luò)矩陣構(gòu)建的方法來(lái)構(gòu)建作者引用網(wǎng)絡(luò)矩陣。矩陣中第一行的作者表示被引作者,第一列的作者表示引用作者,矩陣中的元素表示被引次數(shù)。由于排除了自引,所以矩陣對(duì)角線(xiàn)上全為0,矩陣Z即為n個(gè)作者的作者引用網(wǎng)絡(luò)矩陣,元素Ci,j表示矩陣中作者之間的引用次數(shù)。

( 3)懸點(diǎn)的處理。由于發(fā)現(xiàn)有些作者從來(lái)沒(méi)有引用過(guò)其他作者,因此在所構(gòu)建的作者引用網(wǎng)絡(luò)矩陣中就會(huì)有這些作者對(duì)應(yīng)的列全為0的現(xiàn)象出現(xiàn),于是稱(chēng)之為懸點(diǎn)。用1對(duì)應(yīng)該矩陣中懸點(diǎn)所在的列,用0對(duì)應(yīng)該矩陣中非懸點(diǎn)所在的列,則由1和0組成的行向量就可以表示該矩陣。假設(shè)第二個(gè)作者從來(lái)沒(méi)有引用過(guò)其他作者,則在作者引用矩陣中第二列的值全為0,如下所示的向量d即可以表示該作者引用矩陣: d = ( 010…0)。

( 6)構(gòu)建過(guò)渡矩陣。定義過(guò)渡矩陣P =αM' + ( 1 -α) A,即P =αM' + ( 1 -α) a?eT,其中α為阻尼系數(shù),仍然取0. 85,M'為第( 5)步中構(gòu)建出的隨機(jī)矩陣,a為第( 4)步中的作者被引次數(shù)向量。在此基礎(chǔ)上,再定義π*為作者影響力向量,π*由過(guò)渡矩陣的最大特征值所對(duì)應(yīng)的那個(gè)向量表示。

( 7)計(jì)算作者影響力值。作者影響力值向量的計(jì)算與特征因子值向量的計(jì)算相似,是對(duì)應(yīng)作者引用網(wǎng)絡(luò)矩陣和第( 6)步中π*的點(diǎn)積,經(jīng)過(guò)規(guī)范化處理后乘以100,換算為百分值所得。

( 8)用Matlab軟件編寫(xiě)程序進(jìn)行迭代計(jì)算,計(jì)算出最終結(jié)果。

三、應(yīng)用研究

(一)數(shù)據(jù)的收集與處理

本文選擇中國(guó)圖書(shū)情報(bào)領(lǐng)域內(nèi)的所有作者在2010 - 2012年的引用情況作為研究對(duì)象。為了保證收集

數(shù)據(jù)的可靠性與科學(xué)性,我們選擇中國(guó)社會(huì)科學(xué)引文索引( CSSCI)數(shù)據(jù)庫(kù)作為本次研究的數(shù)據(jù)來(lái)源。另外,在高級(jí)檢索處,選擇發(fā)文年代:2010 -2012年;文獻(xiàn)類(lèi)型:論文;學(xué)科類(lèi)別:圖書(shū)館、情報(bào)與文獻(xiàn)學(xué);學(xué)位類(lèi)別:圖書(shū)館、情報(bào)與檔案管理(一級(jí)),其他都為默認(rèn)的選擇。最終得到文獻(xiàn)記錄為24 041條,作者數(shù)為27 036個(gè)。構(gòu)建27036×27036矩陣,然后利用Matlab自編程序進(jìn)行數(shù)據(jù)清理和計(jì)算。

(二)結(jié)果分析

基于改進(jìn)算法,得到這27 036位作者的影響力得分。首先,對(duì)所有作者的影響力的分布進(jìn)行分析,結(jié)果呈現(xiàn)出非常明顯的偏斜現(xiàn)象(圖1),符合長(zhǎng)尾分布特征。

圖1 作者影響力的偏斜分布圖

從圖1中可以看出,只有極少數(shù)作者的影響力較高,大部分作者的影響力都很低,并且有不少作者的影響力為0。另外,從圖中作者影響力的偏斜程度看,影響力較高的作者之間波動(dòng)也相對(duì)較大,呈現(xiàn)出明顯的下滑趨勢(shì),可見(jiàn)該領(lǐng)域內(nèi)高影響力的學(xué)者偏少,作者間影響力強(qiáng)弱差距較大。也從一個(gè)側(cè)面可以看出本文所提出的方法能夠較好地區(qū)分作者之間的影響力。

為了更好地觀(guān)察結(jié)果,下面對(duì)前50名作者進(jìn)行研究。被引次數(shù)是當(dāng)前評(píng)價(jià)作者影響力非常重要的指標(biāo),雖然h指數(shù)提出這么多年,但是仍然不能取代被引次數(shù)在作者影響力評(píng)價(jià)中的獨(dú)特地位。下面就本文所提方法結(jié)果和被引次數(shù)進(jìn)行比較,表1給出的是前50名作者的影響力與作者被引次數(shù)的具體分布情況。

表1 前50名作者的影響力和作者被引次數(shù)分布情況表

對(duì)作者影響力排名和作者被引次數(shù)排名做Spearman等級(jí)相關(guān)分析,發(fā)現(xiàn)這兩個(gè)指標(biāo)之間的相關(guān)系數(shù)為0. 896,可以看出運(yùn)用新算法所得的作者影響力評(píng)價(jià)結(jié)果的排名與作者被引次數(shù)的排名呈現(xiàn)非常明顯的正相關(guān)性。從表1中也可以看出運(yùn)用新算法評(píng)價(jià)出的作者影響力排名中前3名作者的被引次數(shù)排名完全相同,其余大部分作者運(yùn)用新算法所得的排名和被引次數(shù)排名的差距也基本在±5名內(nèi)。由此可見(jiàn),本文提出的方法所得結(jié)果和被引次數(shù)很相關(guān),是被引次數(shù)的有益補(bǔ)充。

另外,從原理看,改進(jìn)的特征因子算法不僅考慮了作者的絕對(duì)被引次數(shù),而且將施引作者的影響力也考

慮進(jìn)去,使對(duì)作者影響力的評(píng)價(jià)更有說(shuō)服力,這在對(duì)圖情學(xué)學(xué)者的評(píng)價(jià)中也有所體現(xiàn)。如邱冠華、賴(lài)茂生、孟廣均等作者,他們都是該學(xué)科領(lǐng)域內(nèi)的精英或者某個(gè)方面的帶頭人,通過(guò)查閱原始數(shù)據(jù)發(fā)現(xiàn)他們的被引次數(shù)相對(duì)不是很高,排名稍靠后,但是施引作者的影響力都相對(duì)較強(qiáng),那么這些作者的影響力排名靠前是可以解釋通的。從這點(diǎn)出發(fā),本文提出的方法在原理上有一定的優(yōu)越性,得到的結(jié)果也符合實(shí)際。

四、結(jié)語(yǔ)

作者影響力評(píng)價(jià)是當(dāng)前科學(xué)計(jì)量學(xué)研究的熱點(diǎn),不同學(xué)者提出了不同的解決方案。本文受特征因子這一期刊質(zhì)量評(píng)價(jià)方法的啟迪,對(duì)其進(jìn)行了改進(jìn),使其更符合作者引用網(wǎng)絡(luò)的特征。文章詳細(xì)介紹了實(shí)現(xiàn)新算法的步驟,并將該方法應(yīng)用在中國(guó)圖情學(xué)學(xué)者影響力評(píng)價(jià)上,發(fā)現(xiàn)該方法能夠較好地區(qū)分作者的影響力,其分布符合長(zhǎng)尾分布特征。與作者引用次數(shù)——一種經(jīng)典的作者影響力評(píng)價(jià)指標(biāo)相比,本文提出的新方法不僅原理上較為科學(xué),而且在結(jié)果呈現(xiàn)上和作者被引次數(shù)所得排序高度等級(jí)相關(guān),但兩者也有一定差別。通過(guò)實(shí)例分析可證實(shí)本方法較符合實(shí)際,切實(shí)可行,能夠成為作者影響力評(píng)價(jià)方法的有益補(bǔ)充。

參考文獻(xiàn):

[1]邱均平.信息計(jì)量學(xué)[M].武漢:武漢大學(xué)出版社,2007.

[2]HIRSCH J E. An index to quantify an individual’s scientific output[J]. Proceedings of the National Academy of Sciences of the United States of America,2005,102 ( 46) :16569 -16572.

[3]YING D. Applying weighted rage-rank to author citation networks[J]. Journal of the American Society for Information Science and Technology,2011,62( 2) :236 -245.

[4]BERGSTROM C T,WEST J D,et al. The eigen-factor metrics[J]. The Journal of Neuroscience,2008,28( 45) :11433 -11434.

[5]JEVIN D W. Author-level eigen-factor metrics: Evaluating the influence of authors,institutions,and countries within the social science research network community[J]. Journal of the American Society for Information Science and Technology,2013 ( 4) :787 -801.

[6]劉艷華,華薇娜.期刊評(píng)價(jià)新指標(biāo)——特征因子[J].情報(bào)雜志,2010( 7) :122 -126.

[7]米佳,濮德敏.特征因子原理及實(shí)證研究[J].大學(xué)圖書(shū)館學(xué)報(bào),2009( 6) :63 -68.

[8]任勝利.特征因子( Eigen-factor) :基于引證網(wǎng)絡(luò)分析期刊和論文的重要性[J].中國(guó)科技期刊研究,2009,20( 3) :415 -418.

(責(zé)任編輯傅旭東)

An Evaluation Research of Author Influence Based on the Improvement of the Eigen-factor Algorithm

MA Ruimina,b,HAN Xiaolina,b

( a. Institute of Management and Decision-making; b. Center for Science Evaluation,Shanxi University,Taiyuan 030006,P. R. China)

Abstract:The Eigen-factor algorithm is an important method for journal quality evaluation. This paper constructs a new algorithm to evaluate the author influence based on the improvement of the Eigen-factor algorithm. This paper first introduces the basic principle of the Eigen-factor algorithm,and then improves the Eigen-factor algorithm by analyzing the particularity of author citation compared with journal citation. Next it introduces the basic steps of the new algorithm. Finally it makes an empirical research based on author citation network of library and information science in China and the ranking of the authors is obtained. At the same time,the ranking result is compared with traditional citation counts.

Key words:author influence; eigen-factor algorithm; improvement

作者簡(jiǎn)介:馬瑞敏( 1983 - ),男,山西榆次人,山西大學(xué)科學(xué)評(píng)價(jià)研究中心執(zhí)行主任,副教授,碩士研究生導(dǎo)師,主要從事信息計(jì)量與科學(xué)評(píng)價(jià)研究。

基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金青年項(xiàng)目“作者引用網(wǎng)絡(luò)模式與功效研究”( 12CTQ026)

doi:10. 11835/j. issn. 1008 -5831. 2015. 02. 014

中圖分類(lèi)號(hào):G350

文獻(xiàn)標(biāo)志碼:A

文章編號(hào):1008-5831( 2015) 02-0106-04

猜你喜歡
改進(jìn)
蝙蝠算法的研究進(jìn)展
現(xiàn)代化教學(xué)手段在語(yǔ)文教學(xué)中的運(yùn)用
國(guó)有企業(yè)思想政治工作運(yùn)行方式的幾點(diǎn)思考
淺析國(guó)有企業(yè)思想政治工作的改進(jìn)與創(chuàng)新
論離婚損害賠償制度的不足與完善
高校安全隱患與安全設(shè)施改進(jìn)研究
“慕課”教學(xué)的“八年之癢”
淺析秦二廠(chǎng)設(shè)計(jì)基準(zhǔn)洪水位提升對(duì)聯(lián)合泵房的影響
某型飛機(jī)靜止變頻器干擾電臺(tái)通話(huà)故障分析及改進(jìn)措施
信息化時(shí)代如何加強(qiáng)統(tǒng)計(jì)信息化管理
黄大仙区| 车险| 焦作市| 桃园县| 高陵县| 武平县| 宜良县| 政和县| 三原县| 莆田市| 华阴市| 敖汉旗| 玉山县| 雷波县| 商洛市| 松溪县| 濮阳县| 垫江县| 白朗县| 遂宁市| 嘉善县| 奎屯市| 黑水县| 诸城市| 巨鹿县| 靖州| 巫山县| 铜山县| 永登县| 讷河市| 营山县| 峨边| 芜湖市| 江华| 友谊县| 黄石市| 若尔盖县| 军事| 车险| 富蕴县| 泊头市|