■李軍
Hirsch教授于2005年提出的h指數(shù)在國內(nèi)外信息計(jì)量和科學(xué)評(píng)價(jià)領(lǐng)域引起了很大的反響。它不僅用于對(duì)科學(xué)家個(gè)人或群體學(xué)術(shù)績(jī)效的評(píng)價(jià),同時(shí)也應(yīng)用于對(duì)學(xué)術(shù)期刊影響力及專利信息的評(píng)價(jià)研究。本文旨在通過對(duì)h指數(shù)的相關(guān)介紹,分析了h指數(shù)評(píng)價(jià)科研人員學(xué)術(shù)產(chǎn)出時(shí)的影響因素,最后提出了若干修正及校正方法和建議,對(duì)于h指數(shù)在國內(nèi)的準(zhǔn)確應(yīng)用具有重要的意義。
如何評(píng)價(jià)科研人員的學(xué)術(shù)成就和學(xué)術(shù)影響,是人們一直在努力探索的課題。多數(shù)科研人員認(rèn)為同行評(píng)議是評(píng)價(jià)一個(gè)科研人員學(xué)術(shù)成就的最基本的方法,如果同行評(píng)議機(jī)制嚴(yán)格、得當(dāng)、評(píng)審專家作風(fēng)正派、了解情況全面,能夠得出客觀公正的定性評(píng)價(jià)結(jié)果。但在評(píng)議機(jī)制不夠嚴(yán)格和信譽(yù)制度不夠完善的情況下,往往存在重人情拉關(guān)系、本位主義等現(xiàn)象,影響到評(píng)價(jià)工作的客觀公正性。因此,一些文獻(xiàn)計(jì)量學(xué)家開始采用引文量、期刊影響因子等指標(biāo)來對(duì)學(xué)術(shù)成就進(jìn)行定量評(píng)價(jià),然而研究發(fā)現(xiàn),這些傳統(tǒng)的文獻(xiàn)計(jì)量指標(biāo)有微觀層次上,特別是對(duì)科學(xué)家個(gè)人進(jìn)行學(xué)術(shù)評(píng)價(jià)時(shí)存在很多問題。
2005年,美國加州大學(xué)圣地亞哥分校物理學(xué)家J.E.Hirsch提出了一種新的文獻(xiàn)計(jì)量方法—h指數(shù)(h-index)用以評(píng)價(jià)科學(xué)家個(gè)人的學(xué)術(shù)成就。該指數(shù)創(chuàng)新性地將科學(xué)家學(xué)術(shù)論文的產(chǎn)出量(論文數(shù))和質(zhì)量(引文數(shù))結(jié)合為一個(gè)單一指標(biāo),意在用于衡量科研人員個(gè)人學(xué)術(shù)成就。h指數(shù)剛一公布就引起了廣泛的關(guān)注,Nature和Science都相繼進(jìn)行了報(bào)道。h指數(shù)不僅用于對(duì)科學(xué)家個(gè)人或群體學(xué)術(shù)績(jī)效的評(píng)價(jià),同時(shí)也應(yīng)用于對(duì)學(xué)術(shù)期刊影響力的評(píng)價(jià)研究及專利信息中專利權(quán)人的研究。因此,本文旨在通過對(duì)h指數(shù)的相關(guān)介紹,指出并分析h指數(shù)在評(píng)價(jià)科研人員學(xué)術(shù)產(chǎn)出時(shí)的影響因素,并提出了若干修正及校正方法和建議,對(duì)于h指數(shù)在國內(nèi)的準(zhǔn)確應(yīng)用具有重要的意義。
Hirsch將科學(xué)家個(gè)人h指數(shù)定義為:當(dāng)且僅當(dāng)某科學(xué)家發(fā)表的NP篇論文中有h篇論文每篇至少獲得了h次的引文數(shù),其余的NP-h篇論文中各篇論文的引文數(shù)都小于或等于h時(shí),此h值就是該科學(xué)家的h指數(shù)。他認(rèn)為h指數(shù)能夠準(zhǔn)確地反映出科研人員的學(xué)術(shù)成就,一個(gè)人的h指數(shù)越高,則表明他的論文及學(xué)術(shù)影響力就越大。h指數(shù)把文章的被引用率作為衡量研究工作的內(nèi)在指標(biāo),而論文數(shù)量作為參考指標(biāo),這在一定程度上反應(yīng)了科研工作者的個(gè)人成就,但它也可以用于評(píng)價(jià)工作者的群體和學(xué)術(shù)期刊。
Hirsch提出h指數(shù)的初衷就是用于對(duì)科學(xué)家個(gè)人總體學(xué)術(shù)成就的評(píng)價(jià)。h指數(shù)巧妙地將數(shù)量指標(biāo)(發(fā)表的論文數(shù)量)和質(zhì)量指標(biāo)(被引頻次)結(jié)合在一起,同時(shí)對(duì)論文產(chǎn)出力和論文影響力進(jìn)行測(cè)量,克服了以往各類單項(xiàng)指標(biāo)的缺點(diǎn)與不足。h指數(shù)高不僅表明評(píng)價(jià)對(duì)象發(fā)表的論文質(zhì)量高,而且表明高質(zhì)量論文的數(shù)量多,因而相比傳統(tǒng)文獻(xiàn)計(jì)量單項(xiàng)指標(biāo)只能體現(xiàn)數(shù)量的缺憾有明顯優(yōu)勢(shì),是近年文獻(xiàn)計(jì)量學(xué)指標(biāo)研究的一項(xiàng)重要成果和進(jìn)展。
據(jù)Hirsch的定義:“一個(gè)科學(xué)家的分值為h,當(dāng)且僅當(dāng)他/她所發(fā)表的N篇論文中有h篇論文每篇至少被引用了h次,而其余論文每篇至多被引用了h次”。h指數(shù)的基本應(yīng)用是基于引文分析的個(gè)人學(xué)術(shù)產(chǎn)出和影響力,然而h指數(shù)的準(zhǔn)確應(yīng)用受到諸多因素影響。如定義中所指“作者所發(fā)表N篇論文”這一說法就存在很大爭(zhēng)議,因定義對(duì)N篇論文的歸屬權(quán)問題沒有做進(jìn)一步的闡釋,這N篇指的是所有參與的N篇(包括本人作為第一作者、通訊作者等),還是作為第一作者的N篇或作為通訊作者的N篇,還有作者重名、學(xué)科、數(shù)據(jù)庫及自引等問題。這些因素都將影響其h指數(shù)計(jì)算的準(zhǔn)確性。
國內(nèi)外各數(shù)據(jù)庫中作者重名問題一直影響著學(xué)術(shù)評(píng)價(jià)指標(biāo)的準(zhǔn)確性,h指數(shù)也不例外。根據(jù)Hirsch的定義及數(shù)據(jù)模型推理可以看出,h指數(shù)代表四層意思:h篇論文;每篇至少被引h次;總被引至少h2次;總被引大約為(3~5)h2。h指數(shù)相差1,總被引大約相差3~5倍(2h一1),h指數(shù)的增加體現(xiàn)的是作者論文數(shù)量變化過程中的部分質(zhì)變。因次,作者h(yuǎn)指數(shù)測(cè)算的準(zhǔn)確性至關(guān)重要。
在我國,重名問題尤為嚴(yán)重??茖W(xué)引文索引等一些國外權(quán)威數(shù)據(jù)庫中,我國科學(xué)家的名字只取漢語拼音的首字母,更加混淆了作者身份。部分?jǐn)?shù)據(jù)庫公司己經(jīng)意識(shí)到這一問難的嚴(yán)重性,并在這方便做了很多技術(shù)方面的嘗試,如Scopus數(shù)據(jù)庫的作者身份標(biāo)示系統(tǒng) (author identifloation),為每個(gè)作者分配一個(gè)固定 ID(Ideniification,身份識(shí)別碼),且支持中國作者名字的漢語拼音全拼檢索。此外,每個(gè)ID均有明確的單位標(biāo)示,這在很大程度上緩解了重名問題對(duì)作者h(yuǎn)指數(shù)的影響。然而,還有很多數(shù)據(jù)庫目前還沒有能力實(shí)現(xiàn)或正在實(shí)現(xiàn)以上技術(shù)。如何利用這些數(shù)據(jù)庫自身檢索特點(diǎn)結(jié)合相關(guān)手動(dòng)檢索技術(shù)更好地減少重名問題對(duì)于作者h(yuǎn)指數(shù)的影響,對(duì)h指數(shù)準(zhǔn)確應(yīng)用具有重要意義。
根據(jù)Hirsch的定義,h指數(shù)適用的前提條件是作者應(yīng)發(fā)表一定數(shù)量的論文,且這些論文要被相關(guān)數(shù)據(jù)庫收錄。其適用范圍總體上應(yīng)以從事理論研究及基礎(chǔ)研究的科研人員為主?;A(chǔ)研究成果多強(qiáng)調(diào)學(xué)術(shù)價(jià)值,其績(jī)效表現(xiàn)多以科學(xué)論文和學(xué)術(shù)專著為主。應(yīng)用研究成果以應(yīng)用前景為評(píng)價(jià)標(biāo)準(zhǔn),績(jī)效表現(xiàn)形式以技術(shù)論文、技術(shù)專著和專利為主,專利形式比論文形式更能體現(xiàn)其技術(shù)特征。但這并不妨礙h指數(shù)的應(yīng)用,因從事技術(shù)研究開發(fā)的科學(xué)家,也有論文發(fā)表,甚至比從事基礎(chǔ)研究的科學(xué)家還要多,且從事基礎(chǔ)研究的科學(xué)家,同樣也有專利產(chǎn)出等等。科學(xué)家所從事科研工作的性質(zhì)通過其所在學(xué)科得以反映,因此,可以通過學(xué)科進(jìn)行科研工作類型分類。
學(xué)科間規(guī)模、發(fā)展階段、發(fā)展速度、活躍程度等特征不同,學(xué)科間科研人論文產(chǎn)出及引文規(guī)律也不盡相同,甚至學(xué)科內(nèi)也是如此,因此,學(xué)科間學(xué)科內(nèi)研人員之間h指數(shù)也應(yīng)不同。Hirsch對(duì)各個(gè)領(lǐng)域的科學(xué)家進(jìn)行了統(tǒng)計(jì)分析,發(fā)各學(xué)科有成就的科學(xué)家確實(shí)有相對(duì)較高的h指數(shù)值,且各學(xué)科間h指數(shù)存在很差異。物理領(lǐng)域h指數(shù)最高的E.Witten,h=110;生物學(xué)家當(dāng)中h指數(shù)最高SolomonH.Snyder,高達(dá)191,其次為加州理工學(xué)院生物學(xué)家David Baltimore,其h值為160。Hirsch通過測(cè)算發(fā)現(xiàn)生命科學(xué)領(lǐng)域科學(xué)家的h指數(shù)要明顯高于理學(xué)領(lǐng)域科學(xué)家的h指數(shù)。這表明h指數(shù)像其他指標(biāo)一樣,不太適合直接用于科間科學(xué)家之間的比較。
各學(xué)科間科學(xué)家個(gè)人h指數(shù)的不可比性,在宏觀層面上應(yīng)表現(xiàn)為學(xué)科間h指數(shù)的差異。仿照Hirsch的定義,將學(xué)科h指數(shù)界定為“某學(xué)科的h指數(shù)是指該學(xué)科有h篇最低被引為h次的論文”。由于學(xué)科劃分的相對(duì)性和層次性,同屬醫(yī)學(xué)一級(jí)學(xué)科的各二級(jí)學(xué)科間也應(yīng)具備學(xué)科h指數(shù)的差異。通過系統(tǒng)分析醫(yī)學(xué)一級(jí)學(xué)科的各二級(jí)學(xué)科間h指數(shù)的差異,進(jìn)一步說明學(xué)科對(duì)于科研人員h指數(shù)的影響,并提出可行的校正方法,以使得學(xué)科間科研人員h指數(shù)具有可比性。
h指數(shù)是基于引文分析的評(píng)價(jià)指標(biāo),基于引文分析指標(biāo)多少會(huì)受到作者自引的影響。自引要分別對(duì)待惡性自引和良性自引,惡性自引近乎炫耀家底,良性自引可以見出研究的系列性、漸進(jìn)性,體現(xiàn)學(xué)術(shù)成長歷程和延續(xù)性,是正常學(xué)術(shù)規(guī)范,無可厚非。然而,當(dāng)引文指標(biāo)用于評(píng)價(jià)科學(xué)家個(gè)人學(xué)術(shù)成就時(shí),類似論文作者自引部分理應(yīng)排除,因自引并不能體現(xiàn)該文章學(xué)術(shù)影響力。自引又包括作者本人自引和合作者的引用。當(dāng)然,自引會(huì)增大作者h(yuǎn)指數(shù),但Hirsch在文章中說作者自引對(duì)于h指數(shù)的影響很小,即使需要校正也是少數(shù)。有人分析了一組生物進(jìn)化學(xué)領(lǐng)域科學(xué)家的h指數(shù),發(fā)現(xiàn)排除自引后h指數(shù)平均降低了12.3%,信息科學(xué)高影響力科學(xué)家自引排出后h指數(shù)最多的下降了3,平均下降了0.9%或6.6%。本文則分別以國內(nèi)化學(xué)部有效增選院士和ISI生物與生物化學(xué)及化學(xué)領(lǐng)域高被引科學(xué)家為例進(jìn)一步探討自引對(duì)于作者h(yuǎn)指數(shù)影響,以及自引校正必要性。
以上針對(duì)文獻(xiàn)計(jì)量新指標(biāo)h指數(shù)定義及評(píng)價(jià)科學(xué)家個(gè)人學(xué)術(shù)成就過程中所存在的主要影響因素進(jìn)行了研究,其中包括數(shù)據(jù)庫選擇、作者重名、科研工作性質(zhì)、學(xué)科及作者自引等問題。分析這些影響因素對(duì)于h指數(shù)影響的基礎(chǔ)上,提出了若干修正及校正方法和建議,其中包括:
(1)針對(duì)作者重名問題對(duì)于國內(nèi)科學(xué)家h指數(shù)影響,提出了組合檢索策略并對(duì)作者單位組合檢索進(jìn)行了深入研究。針對(duì)科學(xué)家經(jīng)常變遷單位問題,提出測(cè)算頻繁變遷工作的科研人員的h指數(shù)時(shí),應(yīng)充分調(diào)查其工作履歷,進(jìn)行多機(jī)構(gòu)復(fù)合檢索,以便提高查全率;針對(duì)大學(xué)及機(jī)構(gòu)因合并、建制、擴(kuò)充等因素更換單位名稱而相應(yīng)數(shù)據(jù)庫沒有及時(shí)進(jìn)行相應(yīng)修改等問題,提出檢索這類作者論文應(yīng)格外注意,應(yīng)進(jìn)行單位改名前后多機(jī)構(gòu)組合檢索;針對(duì)機(jī)構(gòu)名稱變更或書寫不規(guī)范等因素所引起的檢索不全等問題,可通過單位郵編組合進(jìn)行檢索。
(2)針對(duì)科研工作性質(zhì)對(duì)作者h(yuǎn)指數(shù)的影響,理論結(jié)合檢索實(shí)踐對(duì)h指數(shù)適用性進(jìn)行了初步分類:從事基礎(chǔ)理論類性質(zhì)研究工作的科研人員適用性較高;從事技術(shù)應(yīng)用開發(fā)類性質(zhì)研究工作適用性一般;從事保密性質(zhì)類研究工作的科研人員基本上不適用。
(3)針對(duì)學(xué)科因素對(duì)作者h(yuǎn)指數(shù)的影響,提出將不同學(xué)科科技人員個(gè)人的h指數(shù)進(jìn)行標(biāo)化后比較或分學(xué)科比較,標(biāo)化方法:將科學(xué)家個(gè)人h指數(shù)除以其學(xué)科h指數(shù),再乘上100。
(4)針對(duì)國內(nèi)外作者自引比例差異,不同學(xué)科作者自引比例差異,提出用排除自引后h指數(shù)后進(jìn)行評(píng)價(jià)會(huì)更準(zhǔn)確。
然而,準(zhǔn)確評(píng)價(jià)科學(xué)家個(gè)人學(xué)術(shù)成就是個(gè)很復(fù)雜的工程,其中除以上述涉及的問題外,還包括其年齡、從事科研時(shí)間、性別、國家語種差別、“馬太效應(yīng)”、論文“友情互引”及“論文反引”等問題,這些問題的存在在很大程度上限制了基于引文分析指標(biāo)潛能的發(fā)揮。單純就文獻(xiàn)計(jì)量指標(biāo)而言,h指數(shù)、論文總數(shù)、引文總數(shù)、篇均被引次數(shù)、高被引論文次數(shù)等均不同程度存在以上問題,因此,應(yīng)用時(shí)均需綜合全面考慮。基于以上分析,作者h(yuǎn)指數(shù)相對(duì)較適用于國內(nèi)科學(xué)精英的學(xué)術(shù)產(chǎn)出和學(xué)術(shù)影響力評(píng)價(jià),且應(yīng)遵守“同庫同行同單位同性同年齡段相比”原則。
評(píng)價(jià)科研人員的學(xué)術(shù)成就,僅憑其發(fā)表的論文總數(shù)并不妥,還要看這些論文的質(zhì)量。但將期刊的影響因子等同論文的質(zhì)量指標(biāo)也是不妥的,必須具體地看其論文的情況,總體地衡量其論文的被引用情況。Hirsch提出的h指數(shù)巧妙地將數(shù)量指標(biāo)(發(fā)表的論文數(shù)量)和質(zhì)量指標(biāo)(被引頻次)結(jié)合在一起,同時(shí)對(duì)論文產(chǎn)出力和論文影響力進(jìn)行測(cè)量,克服了以往各種單項(xiàng)指標(biāo)的缺點(diǎn)與不足。盡管文獻(xiàn)計(jì)量學(xué)家一再告誡,用文獻(xiàn)計(jì)量學(xué)方法評(píng)價(jià)科研績(jī)效的最小單位應(yīng)該是科研小組,對(duì)科研人員個(gè)人進(jìn)行績(jī)效評(píng)價(jià)意義不大,甚至是危險(xiǎn)的。但是,在現(xiàn)實(shí)的科研管理中,經(jīng)常會(huì)有對(duì)個(gè)人績(jī)效進(jìn)行評(píng)價(jià)的需求,因此,不能回避這一問題,而是采取措施,不斷地改進(jìn)和完善個(gè)人層面的績(jī)效評(píng)價(jià)工作。
[1]趙基明,邱均平,黃凱,劉兵紅.一種新的科學(xué)計(jì)量指標(biāo).中國科學(xué)基金[J].2008(2).
[2]趙明基,舒明全.基于CSSCI的《中國圖書館學(xué)報(bào)》h指數(shù)及核心作者測(cè)定[J].中國圖書館學(xué)報(bào),2008(2).
[3]劉合艷,房俊民,苑彬成.h指數(shù)研究及應(yīng)用概述[J].情報(bào)理論與實(shí)踐,2009(11).