許恩平,賈 娜,李 敏,余以勝
(華南師范大學a.科技處;b.經(jīng)濟與管理學院,廣東 廣州 510000)
眾所周知,學者所進行的科學研究及成果傳播在科學進步及社會發(fā)展中發(fā)揮著重要作用[1],其成果形式多以學術(shù)論文、著作和專利為主。事實上,高校和科研單位的人才引進、職稱評定也愈加倚重學術(shù)論文在個人學術(shù)影響力評價中的作用。2018年教育部聯(lián)合多個部門,開展清理“唯論文、唯帽子、唯職稱、唯學歷、唯獎項”(以下簡稱“五唯”)專項行動。需要注意的是,在破“五唯”過程中,尤其是破“唯論文”現(xiàn)象時,尚應(yīng)充分考慮我國科研發(fā)展的不同階段及其具體情況,“一步到位”既不現(xiàn)實也無必要,筆者以為應(yīng)著力于扭轉(zhuǎn)不科學的教育評價導(dǎo)向,進而對學者進行合理的學術(shù)影響力評價。
目前,國際上廣泛應(yīng)用的學術(shù)影響力評價指標,如被引次數(shù)、h指數(shù)、g指數(shù)等均是用于評估單作者影響力的方法。但隨著信息技術(shù)的發(fā)展,科學合作與知識交流普遍常態(tài)化,多著者合作的形式可以顯著提高學術(shù)研究水平[2],科學研究的進步需要多領(lǐng)域研究人員之間的合作[3]。在理工科領(lǐng)域,物理學論文的合作者可達上百人,目前共同作者數(shù)量有增加的趨勢,文章由不止一位作者撰寫成為越來越正常的現(xiàn)象[4]。但近年來,客座作者[5]、禮物作者[6]、非學術(shù)合作者[7]等署名資格問題[8]已經(jīng)成為影響科研誠信的重要議題。相關(guān)研究也發(fā)現(xiàn),合著者人數(shù)的增多,卻未必能提高研究成果的影響力,如被引頻次、下載量等[9]。因此,學術(shù)期刊大多要求每位合著者都要作出相應(yīng)的努力和貢獻[10-12],基于此,D.Gnana Bharathi提出了一種多作者聚合分析算法指標,即aggregating metrics for multiple authors’ analysis,簡稱ammaa算法[13]。
2005年,Hirsch[14]提出綜合考慮學者發(fā)文數(shù)量和發(fā)文質(zhì)量的h指數(shù)影響力評價指標,并得到學術(shù)界的認可和推廣應(yīng)用。同年,即被Nature文章[15]評論道,h指數(shù)的魅力在于它能凸顯那些有持久重大貢獻卻未得到與其聲望相稱榮譽的研究者。自h指數(shù)提出以來,國內(nèi)外學者對其做了很多研究。隨著研究的不斷深入,h指數(shù)的固有缺點也不斷暴露,如:(1)虛假合作,不能區(qū)分作者貢獻[16];(2)對論文數(shù)量不敏感,只考慮h核內(nèi)的論文數(shù)量和被引頻次,忽略h核以外的論文;(3)無法跨領(lǐng)域評價作者影響力[17];(4)無法對學者近期影響力進行評價[18]等。至今,對h指數(shù)的修正研究擴展指數(shù)已不下30余種[19]。2006年,L.Egghhe從論文被引頻次的累計貢獻角度,提出g指數(shù)[14],同樣側(cè)重論文被引頻次角度的還有R指數(shù)及Hr指數(shù)[20]。2010年,Prathap G.提出p指數(shù),優(yōu)化了h指數(shù)的靈敏度和區(qū)分度[21]。從作者合作角度進行修正的改進則包括均等共享和差異分享論文影響力兩種。差異分享論文影響力研究包括考慮主要貢獻作者和計算合作者權(quán)重。其中,考慮主要貢獻作者是在計算h指數(shù)時,只納入該作者作為主要貢獻作者的論文,如hmaj指數(shù)[22];計算合作者權(quán)重則基于作者排序和合著者數(shù)量的榮譽分配法[23]。均等共享論文影響力研究包括直接對h指數(shù)進行平均和對論文數(shù)或被引次數(shù)進行平均,前者如hI指數(shù)[24],后者如hm指數(shù)[25]、pf指數(shù)[22]等。2016年,學者Shaon Sahoo針對合著論文個人貢獻率問題提出I指數(shù),使得各合著者隨著論文作者數(shù)量的增加而減小,在一定程度上降低了沒有實質(zhì)貢獻的“論文掛名”的影響[26]。2019年,學者D.Gnana Bharathi提出多作者聚合分析算法指標,即ammaa算法[13],該算法實現(xiàn)了通過對論文影響力的評價進而對學者影響力進行評價的目的。
綜合以上研究,雖然都在一定程度上對h指數(shù)的缺點有所彌補或改進,但依然沒有一種綜合有效的方法應(yīng)用于學者影響力評價中。為此,筆者期待在D.Gnana Bharathi提出的ammaa算法基礎(chǔ)上考慮到時間異質(zhì)性,提出一種融入時間因素的改進算法,即t_ammaa算法,并嘗試通過數(shù)據(jù)實證,與h指數(shù)進行對比和相關(guān)性分析,證明t_ammaa算法對學者影響力評價結(jié)果更全面、公平和精細。
ammaa算法引入一種閾值變量T,也就是合著者數(shù)量的乘數(shù)。對任一論文而言,從以下公式(1)(2)(3)不難看出,若論文為單作者獨著成果,則該文ammaa值就是其被引頻次;當作者人數(shù)大于1時,其ammaa值是總引文量的平方除以閾值T和作者數(shù)量,再加上按著者數(shù)平分總引文量的值,使得每篇論文的影響力都隨著引文數(shù)的增加而增加,直至該值達到由合著者數(shù)量和閾值設(shè)定的引文限制(即aT-T),其ammaa值才等于文章的總引文量,如以下公式(2)所示,這時,每個著者才可以算是獲得了該文章所有的引文影響力。這種所有作者平均共享被引次數(shù),每增加1次引用,其影響力的值就會同等份額逐漸增加的度量方法,原理類似于為工人生產(chǎn)率的每一次增長都提供同等的績效激勵,直至達到目標要求,團隊的所有成員都可以得到全額獎勵。這樣既不會由所有作者平分引文總數(shù)那樣弱化實際作者貢獻值,降低合著者的積極性,也不會夸大沒有實際貢獻合著者的影響力。
一篇論文的ammaa值計算公式如下:
對于單作者的文章,ammaa值等于總被引次數(shù),即:
當a=1時,AMMAA=c
(1)
對于其他任何形式多作者合著文章,即:
當a>1,且c (2) 當a>1,且c≥aT-T時,AMMAA=c (3) 式中,c為被引次數(shù),a為作者人數(shù),T為閾值變量。 在衡量同一學科的多作者論文影響力時,T值是相同的,所有合著者都享有的全部引文量閾值(aT-T)就會隨著合著者人數(shù)的增多而變大,如圖1所示。在達到閾值前,引文量相同的情況下,ammaa值會隨著合著者人數(shù)a的增多而變小,如圖2所示。由此,ammaa算法同時考慮了作者人數(shù)及論文被引頻次兩個因素,實現(xiàn)了既可以對單作者論文評價,也可以對多作者論文進行評價的創(chuàng)新融合。 圖1 當T值固定時(此處等于10),不同數(shù)量合著者的ammaa值,以及與單個作者ammaa值合并時的引文數(shù) 圖2 當T值固定時(此處等于100),合著者人數(shù)越多,每個作者的ammaa值與(c +c2/T)的距離越大 T的賦值可通過普遍共識或由特定國家、團體或組織來確定。傳統(tǒng)上被引用次數(shù)較少的學科,如地質(zhì)學、數(shù)學,其T值較低。被引用次數(shù)較多的學科,如生物醫(yī)學、生物化學,其T值較高。T的其他任何值也可以在科學合理的基礎(chǔ)上設(shè)置,通用情況下,作者建議將T值暫設(shè)為100,一旦設(shè)置了T,就可以為每篇合著文章計算其ammaa值,也就是衡量每篇論文為合著者中的每位學者帶來的影響力。T值的設(shè)定是根據(jù)學科性質(zhì)確定的,所以,當出現(xiàn)普遍低被引學科的作者與普遍高被引學科的作者跨學科合作時,T值的設(shè)定還可以平衡由學科差異帶來的影響。 在論文影響力評價過程中,統(tǒng)計評價指標時常常忽略時間軸不統(tǒng)一的問題[27],從而降低評價的有效性。ammaa算法綜合考慮了論文被引次數(shù)、作者人數(shù)兩方面因素,卻忽視了時間因素對評價效果的影響。論文被引時間的異質(zhì)性體現(xiàn)論文成果傳播的時間差異性,被引時刻才是知識傳播和交流、發(fā)揮效用的時間,發(fā)文與被引的時間差反映了論文的知識流動性和影響力的大小[28]。兩篇不同論文的發(fā)表時間不同,總被引頻次相同時,發(fā)表時間更短的論文有更大的影響力;發(fā)表時間相同,總被引頻次相同,引文量逐年上升和引文量逐年下降的論文學術(shù)價值也是不同的[29]。因此,筆者在分析ammaa算法忽略時間維度的情況下,力求基于發(fā)文時間和被引時間的異質(zhì)性對ammaa算法進行優(yōu)化。 加權(quán)是為平衡某一要素在整個要素體系中,因重要程度不同而分別賦予該要素不同權(quán)值的過程[30]。本優(yōu)化方法對論文發(fā)表后每年的ammaa值賦予不同的權(quán)重,計算論文的加權(quán)ammaa。這樣,一篇論文的t_ammaa值就是對它每年的ammaa值賦予不同權(quán)重后之和,作者的t_ammaa值就等于其所有論文t_ammaa值之和。 對于每篇論文而言: t_ammaa=(1*ammaa1+2*ammaa2+3*ammaa3……+n*ammaan)/n (4) 式中,n=(數(shù)據(jù)采集時間-論文發(fā)表時間)/年;ammaa1、ammaa2……ammaan表示論文發(fā)表后第一年、第二年……第n年的ammaa值,每年的ammaa值利用作者所發(fā)文章在這一年的被引頻次c計算。 對于每個作者而言: t_ammaa=t_ammaa1+t_ammaa2+t_ammaa3……+t_ammaan (5) 式中n為某作者的第n篇論文;t_ammaa1、t_ammaa2、t_ammaa3……t_ammaan為該作者的第一篇、第二篇……第n篇論文的t_ammaa值。 本文以國內(nèi)圖情領(lǐng)域?qū)W者為研究對象,選取Web of Science核心合集(以下簡稱為WOS)作為實驗數(shù)據(jù)來源,檢索策略為:SU=(Information science and library science);檢索時間跨度為2010年至2019年,限定語言類型為英文;精煉限定:國家/地區(qū)為(“PEOPLES R China”) OR (“China”),文獻類型為ARTICLE,結(jié)果顯示共有21 279條文獻記錄。 為保證所得數(shù)據(jù)的可靠性,剔除標注為“被撤回的出版物”以及無作者記錄12條,考慮數(shù)據(jù)的可操作性,刪除年均被引頻次小于1的論文記錄6 528條,剩余14 739條可用記錄。通過Python程序分詞統(tǒng)計得到60 342位作者,及每位作者的全部發(fā)文和被引詳情。并采取前文所述中的作者建議,暫把T值設(shè)為100。根據(jù)公式(1)(2)(3)和公式(4)(5),分別計算每位作者的ammaa值和t_ammaa值,并排序。 本文嘗試從兩個角度進行數(shù)據(jù)梳理,然后再綜合進行分析討論。 第一個角度,從發(fā)文量和引用量出發(fā),比較分析ammaa算法及t_ammaa算法和h指數(shù)的區(qū)別和相關(guān)性。為保證實驗可操作性,設(shè)定(1)年均被引頻次40次以上,在2010—2019年所發(fā)論文總被引頻次不少于400次,和(2)在(1)的基礎(chǔ)上,年均發(fā)文3篇以上,在2010—2019年期間總發(fā)文量不少于30篇的作者兩個篩選條件,最終篩選出52位符合以上條件的作者,并對52名作者進行核查,排除同名同姓的情況。因篇幅有限,摘錄發(fā)文總數(shù)前25位作者發(fā)文及引用情況記錄(表1)。 h指數(shù)為現(xiàn)行國際上使用的評價指標,故本文先通過ammaa算法與作者h值排名比較(即排名1-排名2),證明ammaa算法的調(diào)節(jié)力和區(qū)分度,再通過作者ammaa值排名減去t_ammaa值排名比較(即排名2-排名3),對比分析ammaa算法和t_ammaa算法。各位學者的h值是在WOS核心庫中通過設(shè)定與數(shù)據(jù)源同一限定條件加上作者姓名檢索獲得。兩排名比較中均采用正數(shù)表示作者排名上升,負數(shù)相反,數(shù)值絕對值表示作者排名變化量。因篇幅有限,現(xiàn)摘錄部分學者結(jié)果,如表2所示。 第二個角度,從ammaa值出發(fā),分析討論ammaa值排名靠前的學者發(fā)文及被引頻次情況。參考前文數(shù)據(jù),故保留前52位作者并進行核查,排除同名同姓情況?,F(xiàn)摘錄部分數(shù)據(jù)如表3所示。 綜合全部導(dǎo)出數(shù)據(jù)及表1可見,被調(diào)查的14 739篇論文中獨著論文157篇,僅占1.07%。其中,發(fā)文數(shù)大于30篇,總被引頻次大于400次的52位學者中,僅有7位學者在2010—2019年各發(fā)表了1篇獨著論文,表明論文合著的形式已被普遍接受,并可通過科學合作以提高科研成果影響力[2]。該結(jié)果與國家科學技術(shù)評估中心-科睿唯安分析結(jié)果及國內(nèi)外學者的研究結(jié)論吻合[31-33]。 表1 發(fā)文數(shù)前25位作者總被引及每年被引頻次詳情 如表3所示,經(jīng)計算ammaa值排名前52的學者中,發(fā)文數(shù)小于10篇的有21位,發(fā)文數(shù)介于10到30篇之間的學者有26位,占比50%,大于30篇的有5位,占比不到10%。學者Law Rob獨著數(shù)1篇,學者Zhou Tao獨著數(shù)10篇。其中,發(fā)文數(shù)與總被引頻次均相同的學者有三組,分別為Csordas Attila和Ternent Tobias;del-Toro Noemi和Dianes Jose A;Tang Zefang和Li Chenwei。經(jīng)調(diào)查詳細數(shù)據(jù)發(fā)現(xiàn),Csordas Attila和Ternent Tobias、del-Toro Noemi和Dianes Jose A參與合著1篇論文被引頻次高達2 023次,Tang Zefang和Li Chenwei參與合著1篇論文被引頻次為1 720次,且三組學者第一組僅有2篇論文發(fā)表,后兩組僅有1篇。假若綜合考慮發(fā)文數(shù),排除發(fā)文數(shù)少于10篇的學者記錄,且以年均發(fā)文至少1篇為限制條件,則ammaa算法既可以突出發(fā)文能力較強如獨著較多的學者,也能篩選出文章質(zhì)量較高的學者。 本研究中,我們保留ammaa值排名前52且發(fā)文至少10篇的學者各指標值,用與前文相同的條件查詢各位學者的H值并排名(表4),綜合第一角度一并做以下分析與討論。 1.ammaa算法與t_ammaa算法調(diào)節(jié)能力結(jié)果與討論 由表2和表4可知,兩種算法的計算結(jié)果中,均未出現(xiàn)ammaa值、t_ammaa值相同的情況,而表2中H值查詢結(jié)果中相同的學者有Law,Rob 等12組,共48位學者,占比92.3%;表4中H值相同的有Zhang,Lei等6組,共19位學者,占比86.4%。分別對H值、ammaa值和t_ammaa值三者排名進行歸一化處理,并按照H值排序,如圖3、圖4所示,ammaa算法和t_ammaa算法排名較H指數(shù)排名總體趨勢一致,二者均圍繞H值排名上下浮動,且幅度較大;加入時間權(quán)重因素后,與ammaa值相比,表2中52位作者有40位學者的t_ammaa值名次發(fā)生變化,名次變化學者占比76.9%,表4中22位學者有21位學者名次發(fā)生變化,名次變化學者占比95.5%。說明ammaa算法和t_ammaa算法識別效果都較H指數(shù)好,且t_ammaa算法較ammaa對學者影響力評價更敏感,調(diào)節(jié)作用更明顯。 表2 部分作者各指標排名及排名變化表 表3 ammaa值排名前30學者各指標情況 表4 ammaa值排名前52位發(fā)文數(shù)大于等于10的學者各指標詳情 續(xù)表4 圖3 52位作者ammaa值排名、t_ammaa值排名和H值排名歸一化比較 圖4 22位作者ammaa值排名、t_ammaa值排名和H值排名歸一化比較 需要說明的是,圖3、圖4、圖5、圖6因版面所限,圖面文字不夠清晰,有興趣者可與筆者線上交流。 圖5 52位作者ammaa值排名和t_ammaa值排名變化 圖6 22位作者ammaa值排名和t_ammaa值排名變化 首先分析比較ammaa算法與h指數(shù)。在表2中,兩種評價方法下除Wang Yi和Zhang Jie兩位學者名次未發(fā)生變化外,其余學者排名均產(chǎn)生變動,變化最多的是學者Wang Yu和Zhao Jing,變化值均為38。表4中,除學者Wang Rui名次未發(fā)生變化外,其余21位學者名次均發(fā)生變化,其中變化最大的是學者Liu Yang,變化值為16。 下面就表2中名次變化最大的學者Wang Yu分析原因,除各位學者原本h值排名并列的情況外,結(jié)合每位作者的所有發(fā)文和被引頻次及合著者人數(shù),對比分析下降名次最多的Wang Yu和與其h值相同排名卻未發(fā)生變化的Zhang Lin,及排名上升最多的Zhang Lei(上升8個名次)三位作者,均取其被引頻次大于10的論文,發(fā)現(xiàn)學者Wang Yu平均每篇論文的合著者人數(shù)為8.62,最高被引頻次為41次,且該篇合著者人數(shù)為9人。而學者Zhang Lei和Zhang Lin,平均每篇論文的合著者人數(shù)分別為6.39和6.04,單篇最高被引頻次分別為1 219次和389次,且兩位學者該篇合著者人數(shù)均為3人,故學者Wang Yu的ammaa值排名明顯下降。以上對比分析說明,考慮合著者人數(shù)的ammaa算法對合著論文的評價調(diào)節(jié)作用明顯,且對高被引頻次文章具有敏感的識別力。 2.t_ammaa算法與ammaa比較 觀察表2的計算結(jié)果,有三組作者的ammaa值幾乎相同,分別是Li Xia(588.96)和Zhang Jie(588.94),Liu Xin(212.77)和Lin Hongfei(212.28),Wang Jing(179.90)和Zhang Jian(179.38),進一步觀察三組作者的t_ammaa值分別為236.17 和190.16,64.73 和91.01 ,78.38 和71.02 ,其差值分別為46.01,26.28和7.36。觀察表4的計算結(jié)果,Tao Dacheng 和Xu Wei、Ge Shuzhi和Huang Lei兩組學者的ammaa值分別為2 223.68和2 222.12、1 303.80和1 307.4,差值分別為1.56和3.6,進一步觀察兩組作者的t_ammaa值分別為641.44和1 313.58、424.68 和530.79,差值分別為672.13和106.11??梢姡啾萢mmaa算法,t_ammaa算法的區(qū)分效果更加顯著。 由表2和圖5可知,加入時間權(quán)重后,t_ammaa值名次下降最多的是作者Liu Xin,下降11個名次,居第43位;而總被引頻次和ammaa值都比其小的學者Lin Hongfei卻沒有變化,仍居第33位。觀察表4和圖6可知,考慮時間因素后,t_ammaa值名次下降最多的是學者Tao Dacheng,下降5個名次,上升最多的是學者Zhang Lei和Sun Jian,均上升4個名次。這是在作者數(shù)量較少的情況下,如果作者數(shù)量較多,排名變化可能更大。 下面就學者Liu Xin和Lin Hongfei名次變化分析其原因。由表1及兩位學者發(fā)文、每年被引次數(shù)可知:(1)在2010—2019年,兩位學者均發(fā)文30篇,總被引次數(shù)分別為829和722次。(2)學者Liu Xin年被引頻次在2015年較前一年下降,其余年份均較前一年有所增加,而學者Lin Hongfei年被引頻次均保持逐年增加狀態(tài)(圖7)。(3)兩位學者的ammaa值總體呈上升狀態(tài),學者Liu Xin僅在2013和2016年ammaa值略高于Lin Hongfei,其余年份與后者持平或遠低于后者。以2015年為界,學者Liu Xin的ammaa值從2015年的8上升至2019年的22,而Lin Hongfei則從12上升到42,后者增幅較大(圖8)。說明學者Lin Hongfei影響力在2015—2019年間已逐漸超過學者Liu Xin。故引入時間權(quán)值,越靠近統(tǒng)計時間的因素占比越重,學者Liu Xin的t_ammaa值排名較Lin Hongfei下降越明顯。 圖7 Liu Xin和Lin Hongfei每年被引頻次走勢圖 圖8 Liu Xin和Lin Hongfei每年ammaa值曲線圖 另外,結(jié)合表2和圖5可以看出,分別由ammaa算法和t_ammaa算法得出的排名中,前三名均是Tao Dacheng、Law Rob和Zhang Lei三位學者,后三名均是Li Li、Wang Yu和Wang Tao三位學者。結(jié)合表4和圖6可以看出,ammaa算法和t_ammaa算法前三名均是Xu Xin 、Thong J和Venkatesh Viswanath,說明兩種算法在描述作者學術(shù)影響力上的趨勢是同步的,均能較準確識別高影響力學者。 3.各指標相關(guān)性分析 如果某一算法改進后與原算法的計算結(jié)果相差太大,則認為對原算法的改進是不合理的[34]。引入時間因素的t_ammaa算法對學者影響力有一定的調(diào)節(jié)作用,但這種調(diào)節(jié)作用對ammaa算法的改善并不是顛覆性的。由此,我們將表2中52位作者的t_ammaa值、ammaa值、h值、總被引次數(shù)和年均被引次數(shù),進行斯皮爾曼相關(guān)性分析,證明t_ammaa算法更具合理性(表5)。由分析數(shù)據(jù)可見,作者的t_ammaa值與其他指標均呈極顯著相關(guān)關(guān)系,其中與ammaa值、h值、總被引次數(shù)和年均被引次數(shù)的相關(guān)系數(shù)分別為0.956、0.552、0.907及0.762。h值、總被引次數(shù)和年均被引頻次均可用于對作者影響力進行評價[14,35-36],說明與h指數(shù)呈極顯著正相關(guān)的ammaa算法和t_ammaa算法也適用于對作者影響力進行評價,且后者對前者的優(yōu)化是合理的。 表5 各指標相關(guān)性檢驗 相對于h指數(shù),筆者在ammaa算法的基礎(chǔ)上,提出一種基于時間維度的ammaa優(yōu)化方法——t_ammaa算法,通過對國內(nèi)圖情領(lǐng)域?qū)W者在WOS核心數(shù)據(jù)庫中發(fā)文情況分析發(fā)現(xiàn):(1)針對h指數(shù)無法識別高影響力論文,對合著論文評價不靈敏,以及無法涉及作者全部論文的缺陷,ammaa算法和t_ammaa算法對h值排名相同的情況有明顯調(diào)節(jié)作用,通過設(shè)置閾值變量T和被引次數(shù)的平均共享,使合著論文的所有作者均等增加影響力的激勵方法,不僅能更好地挖掘出高影響力和引用價值的科研文獻,還能有效避免客座作者[5]、禮物作者[6]、非學術(shù)合作者[7]較多出現(xiàn)在論文署名中,從而影響評價結(jié)果的公平性,使得作者影響力評價方法更為合理和客觀。(2)與ammaa算法相比,t_ammaa算法考慮時間因素,能有效識別領(lǐng)域內(nèi)長時間保持高活躍度,影響力持續(xù)發(fā)揮或不斷上升的學者。由此,t_ammaa算法綜合考慮了作者發(fā)文數(shù)量、作者人數(shù)、被引頻次、被引頻次的闕值限制及被引時間異質(zhì)性,解決了作者影響力評價方法中多作者署名問題,無法識別高影響力論文,被引次數(shù)受論文發(fā)表時間長短影響,以及跨領(lǐng)域合作學者影響力評價等需要解決的問題。(3)在圖情人文社會科學領(lǐng)域中,合著已成為普遍現(xiàn)象,獨著論文占比極少,且存在學者一篇論文被引頻次極高、總發(fā)文數(shù)極少,但ammaa值和t_ammaa值排名居前的現(xiàn)象。建議在人文社科類評價過程中,可考慮設(shè)置學者必須在近些年,比如近3年或5年內(nèi)必須有若干論文或獨著成果產(chǎn)出,以削弱虛假合作者在評價中的影響力。 由以上研究結(jié)論可以看出,通過論文影響力來間接揭示作者學術(shù)影響力,并非簡單通過影響因子來評價,論文引用數(shù)據(jù)等僅可作為評價參考,尤其在2021年人社部、教育部印發(fā)《關(guān)于深化高等學校教師職稱制度改革的指導(dǎo)意見》中特別強調(diào),不得以SCI或SSCI等論文相關(guān)指標作為前置條件和判斷的直接依據(jù),必須考慮學術(shù)論文的實際內(nèi)容,特別是真正具有高影響力和引用價值的代表性論文,本研究通過時間要素的引入,可以有效解決僅憑論文“數(shù)量”和引用次數(shù)評價的局限,在對有持續(xù)學術(shù)貢獻力學者的甄別中,可以設(shè)置近1年或3年內(nèi)發(fā)表論文的數(shù)量作為學者持續(xù)影響力的重要評價手段,解決了部分學者突擊或集中于某個階段發(fā)文,或在獲得一定職稱或榮譽后長期處于“學術(shù)休眠”狀態(tài)的問題;最后,對于多作者的署名問題,本文提出的被引次數(shù)平均共享和T值,可以有效解決掛名作者、客座作者或通訊作者等問題,通過優(yōu)化算法,使得真正有持續(xù)貢獻力的學者可以被有效識別出來,提高論文或?qū)W者貢獻度評價的客觀性。 本研究也存在一些不足之處,一方面,本文僅選擇圖書情報領(lǐng)域?qū)W者在WOS中的發(fā)文數(shù)據(jù)對t_ammaa算法進行實證分析,樣本涉及領(lǐng)域單一;另一方面,本文閾值T的設(shè)置采取原作者對通用領(lǐng)域的取值建議,今后可進一步研究科學設(shè)置T值的學科和條件。(二)ammaa算法的不足
三、t_ammaa算法的提出
四、t_ammaa算法實證研究
(一)數(shù)據(jù)來源及處理
(二)實驗過程
(三)結(jié)果與分析
五、結(jié)論和建議