馬 崢
(1. 中國(guó)科學(xué)技術(shù)信息研究所,北京 100038;2. 南京大學(xué)信息管理學(xué)院,南京 210023)
學(xué)術(shù)期刊是記錄科學(xué)研究人員創(chuàng)新性科研成果的主要載體,針對(duì)學(xué)術(shù)期刊設(shè)計(jì)合理、科學(xué)和準(zhǔn)確的評(píng)價(jià)方法具有非常重要的研究意義和實(shí)踐意義[1]。在早期,對(duì)學(xué)術(shù)期刊的評(píng)價(jià)主要還是依靠同行評(píng)議的方式。目前,學(xué)術(shù)期刊的評(píng)價(jià)方法越來(lái)越偏重于定量方法,主要分為基于傳統(tǒng)計(jì)量學(xué)和替代計(jì)量學(xué)兩種方式。
在早期學(xué)術(shù)期刊品種總體數(shù)量比較少,在各個(gè)學(xué)科中分布的數(shù)量也不多,因此對(duì)學(xué)術(shù)期刊評(píng)價(jià)的需求和必要性相對(duì)較弱。各個(gè)領(lǐng)域科學(xué)家對(duì)相關(guān)期刊的情況比較了解,且期刊出版活動(dòng)和發(fā)展變化的節(jié)奏相對(duì)較慢,期刊所發(fā)表的文獻(xiàn)數(shù)量也相對(duì)較少,所以當(dāng)科學(xué)家評(píng)價(jià)和擇優(yōu)選擇適合發(fā)表論文的期刊時(shí),有可能實(shí)現(xiàn)對(duì)同學(xué)科或同類型期刊的遍歷,因而采取同行評(píng)議的方式,就是可以實(shí)現(xiàn)最高效率、最準(zhǔn)確結(jié)果的最優(yōu)選擇。目前,同行評(píng)議仍是很多期刊評(píng)價(jià)活動(dòng)中不可缺失的組成部分[2-3]。隨著全球社會(huì)經(jīng)濟(jì)的發(fā)展,工業(yè)革命引領(lǐng)下出版行業(yè)和傳播行業(yè)的繁榮,以及以信息科學(xué)技術(shù)為代表的科技研究活動(dòng)日新月異的進(jìn)步,學(xué)術(shù)期刊種類以及所承載的文獻(xiàn)量急劇增長(zhǎng),同行評(píng)議制度的適用性受到了不斷的沖擊,任何科學(xué)家都難以對(duì)學(xué)科領(lǐng)域的所有期刊情況和所有發(fā)表論文有全面和深入的了解,也難以完全客觀地對(duì)眾多學(xué)術(shù)期刊的學(xué)術(shù)質(zhì)量和影響力水平都有準(zhǔn)確認(rèn)知[4],以及從中篩選出學(xué)術(shù)影響力大、知識(shí)傳播效率高的高質(zhì)量期刊。同行評(píng)議評(píng)價(jià)方式所暴露的方方面面的問(wèn)題在學(xué)科評(píng)價(jià)領(lǐng)域也都逐漸有所體現(xiàn)[5]。例如,同行評(píng)議專家的主觀性問(wèn)題、隨意性問(wèn)題、意見(jiàn)過(guò)于分散的問(wèn)題、出于個(gè)人及小團(tuán)體利益的考慮而產(chǎn)生的學(xué)術(shù)道德與誠(chéng)信問(wèn)題,等等[6]。
隨著文獻(xiàn)數(shù)量的累計(jì)和文獻(xiàn)學(xué)研究的發(fā)展,對(duì)學(xué)術(shù)期刊評(píng)價(jià)方法的研究主要繼承了文獻(xiàn)學(xué)[7]研究思路。錢榮貴[8]、邱均平等[9]和賴茂生等[10]對(duì)期刊評(píng)價(jià)活動(dòng)源起的時(shí)間分別進(jìn)行了研究,普遍認(rèn)為20世紀(jì)30 年代開始,隨著工業(yè)技術(shù)發(fā)展和學(xué)術(shù)傳播活動(dòng)的快速興起,學(xué)術(shù)文獻(xiàn)的體量和總品種數(shù)量快速提升,需要通過(guò)評(píng)價(jià)從中篩選出應(yīng)當(dāng)優(yōu)先使用的重要期刊,于是歐洲開始出現(xiàn)了對(duì)期刊的評(píng)價(jià)活動(dòng)和方法探索。1934 年,布拉德福歸納了“文獻(xiàn)離散定律”,發(fā)現(xiàn)各學(xué)科都存在“核心區(qū)”期刊刊載本學(xué)科絕大部分主要文獻(xiàn)的現(xiàn)象。學(xué)術(shù)期刊評(píng)價(jià)理論起源于布拉德福定律對(duì)學(xué)術(shù)期刊分層的定義。20 世紀(jì)60 年代,美國(guó)著名的情報(bào)學(xué)家尤金·加菲爾德探究建立引文分析體系,逐步構(gòu)建了系列引文數(shù)據(jù)庫(kù),并在實(shí)踐中不斷擴(kuò)展應(yīng)用范圍,衍生新的分析體系和方法,形成了廣泛的影響。經(jīng)過(guò)長(zhǎng)期以來(lái)的研究和實(shí)踐,國(guó)內(nèi)外圍繞科技學(xué)術(shù)期刊評(píng)價(jià)逐漸形成了應(yīng)用廣泛的、基于科學(xué)計(jì)量學(xué)指標(biāo)的評(píng)價(jià)方法和指標(biāo)體系[11]。典型的研究成果包括1955 年加菲爾德發(fā)明的“影響因子”[12],2005 年美國(guó)物理學(xué)家喬治·赫施發(fā)明的“h 指數(shù)”[13]等。應(yīng)用基于引文分析的傳統(tǒng)計(jì)量學(xué)指標(biāo)也存在顯著問(wèn)題[14]。例如,基于引文分析理論的傳統(tǒng)科學(xué)計(jì)量指標(biāo)評(píng)價(jià)所需后置時(shí)間較長(zhǎng),通常需要數(shù)年才能相對(duì)完整地評(píng)價(jià)期刊學(xué)術(shù)影響力,不能及時(shí)體現(xiàn)期刊學(xué)術(shù)影響力的變化;傳統(tǒng)科學(xué)計(jì)量指標(biāo)的評(píng)價(jià)數(shù)據(jù)來(lái)源主要偏重期刊論文等文獻(xiàn)形式,沒(méi)有統(tǒng)籌考慮被評(píng)價(jià)期刊在學(xué)術(shù)交流、產(chǎn)業(yè)發(fā)展、學(xué)科建設(shè)、人才培養(yǎng)等方面所發(fā)揮的作用和取得的影響;引文分析的基礎(chǔ)假設(shè)是:引用反映出學(xué)術(shù)成果產(chǎn)生了積極效果,但是現(xiàn)實(shí)中引文動(dòng)機(jī)比較多樣化[15],引用某篇論文未必就說(shuō)明引用者認(rèn)可那篇論文[16]。
2010 年10 月,J. Priem 和D.Taraborelli 等學(xué)者共同發(fā)表了Altmetrics:A manifesto宣言,提出替代計(jì)量學(xué)(Altmetrics)的概念[17]。其主要進(jìn)步在于跳出了以文獻(xiàn)統(tǒng)計(jì)為中心的傳統(tǒng)科學(xué)計(jì)量學(xué)1.0 時(shí)代,跨入以社交媒體內(nèi)容分析所產(chǎn)生的數(shù)據(jù)和網(wǎng)絡(luò)資源標(biāo)簽化結(jié)構(gòu)等Web 2.0 技術(shù)為中心的2.0 時(shí)代[18],能夠更快、更全面、更有效地反映被評(píng)價(jià)對(duì)象的影響力?;谏缃幻襟w數(shù)據(jù)統(tǒng)計(jì)出評(píng)價(jià)對(duì)象的網(wǎng)絡(luò)活動(dòng)數(shù)據(jù)(下載量[19],自媒體發(fā)表學(xué)術(shù)內(nèi)容的引用行為、瀏覽行為、點(diǎn)擊次數(shù)、評(píng)論內(nèi)容、推薦數(shù)、點(diǎn)贊數(shù)、轉(zhuǎn)發(fā)次數(shù)等[20]),可以研制形成新型的計(jì)量指標(biāo)[21-22]。普遍認(rèn)為,科學(xué)有效地應(yīng)用替代計(jì)量學(xué)能夠?qū)崿F(xiàn)更加全面的影響力評(píng)價(jià)[23-25]。在評(píng)價(jià)導(dǎo)向上,替代計(jì)量學(xué)指標(biāo)方法在評(píng)價(jià)方面的應(yīng)用將會(huì)促進(jìn)在互聯(lián)網(wǎng)上開展更豐富多彩、更高效快捷的科學(xué)交流[26],并能推動(dòng)衍生出一系列完善和優(yōu)化現(xiàn)有信息組織與信息發(fā)現(xiàn)的新方法、新工具、新機(jī)制[27-28]。替代計(jì)量學(xué)目前很難完全取代傳統(tǒng)科學(xué)計(jì)量學(xué)評(píng)價(jià)方法[29],但是科學(xué)界和出版?zhèn)鞑ソ缙毡榭春梦磥?lái)替代計(jì)量學(xué)指標(biāo)在學(xué)術(shù)成果評(píng)價(jià)和期刊影響力評(píng)價(jià)方面的潛在重要作用[30]。但是,替代計(jì)量指標(biāo)應(yīng)用于科技期刊評(píng)價(jià)存在一個(gè)顯著的挑戰(zhàn),就是如何避免人為干擾指標(biāo)[31]。與之相關(guān)的問(wèn)題還包括替代計(jì)量指標(biāo)的數(shù)據(jù)嚴(yán)謹(jǐn)性和數(shù)據(jù)一致性問(wèn)題[32]。另一個(gè)受到關(guān)注的問(wèn)題是如何認(rèn)定廣域分散的動(dòng)態(tài)數(shù)據(jù)源是科學(xué)可靠的,統(tǒng)計(jì)分析結(jié)果是科學(xué)可重復(fù)的[33]。
學(xué)術(shù)期刊的核心功能是分享科學(xué)家的研究認(rèn)知和創(chuàng)新技術(shù)突破[34],是學(xué)術(shù)信息的有序和有效傳播途徑[35]。從情報(bào)學(xué)角度看,學(xué)術(shù)期刊的識(shí)別、監(jiān)測(cè)、評(píng)價(jià)和管理等問(wèn)題可以歸結(jié)為學(xué)術(shù)信息集合的靜態(tài)和動(dòng)態(tài)的定量測(cè)度問(wèn)題[36]。信息熵方法正是解決信息度量問(wèn)題的經(jīng)典理論方法。深入信息熵理論層面對(duì)期刊學(xué)術(shù)傳播規(guī)律展開研究,是從本質(zhì)上認(rèn)識(shí)學(xué)術(shù)期刊,探索學(xué)術(shù)期刊在科學(xué)發(fā)展和知識(shí)傳播中發(fā)揮的作用和實(shí)現(xiàn)機(jī)理,對(duì)于情報(bào)學(xué)、信息傳播研究、學(xué)術(shù)出版研究和科技成果研究具有重要理論意義。
本研究假設(shè),科技學(xué)術(shù)期刊的作用之一是減少科學(xué)認(rèn)識(shí)中的不確定因素??茖W(xué)認(rèn)識(shí)中的不確定因素減少的過(guò)程是知識(shí)系統(tǒng)的熵減的過(guò)程。學(xué)術(shù)期刊出版過(guò)程的根本目的是通過(guò)對(duì)科學(xué)發(fā)現(xiàn)和技術(shù)創(chuàng)新成果的傳播推廣,使人們更加準(zhǔn)確地認(rèn)知科學(xué)問(wèn)題和規(guī)律。通過(guò)定量方法,測(cè)度學(xué)術(shù)出版前后知識(shí)系統(tǒng)的信息熵變化量,研制測(cè)度科技學(xué)術(shù)期刊貢獻(xiàn)的評(píng)價(jià)方法。
在經(jīng)典信息論中,對(duì)信息量的測(cè)度不考慮消息的內(nèi)容重要性或內(nèi)在意義。信息量的多少和信息的重要性沒(méi)有必然的聯(lián)系,經(jīng)典信息熵只是在數(shù)量層面計(jì)算出一個(gè)數(shù)值,并非直接表示該信息的重要性。某期刊為知識(shí)系統(tǒng)的信息熵引入了多少負(fù)熵,反映了該期刊為學(xué)科發(fā)展做出多少貢獻(xiàn)。在本研究中,擬基于“反事實(shí)”思想,通過(guò)對(duì)計(jì)算信息熵的“事實(shí)量”和“反事實(shí)量”之間的差距,解決對(duì)信息效用的測(cè)度問(wèn)題。
“反事實(shí)”研究思想是提出反事實(shí)的假定,設(shè)定與事實(shí)相反的條件,根據(jù)反事實(shí)推理形成的結(jié)果,判斷反事實(shí)條件變化與結(jié)果之間的因果關(guān)系。在面對(duì)繁雜評(píng)價(jià)相關(guān)因素的情況下,傳統(tǒng)因果分析是往往假定研究者已經(jīng)控制了解釋因變量的重要因素,并且沒(méi)有遺漏重要自變項(xiàng);但是研究所處的情況和變量經(jīng)常無(wú)法滿足這一假定,或者所觀察的對(duì)象并非隨機(jī)發(fā)生的,因而經(jīng)常會(huì)產(chǎn)生內(nèi)生性或樣本選擇偏誤的問(wèn)題,造成因果分析的不準(zhǔn)確和偏差,甚至是錯(cuò)誤。反事實(shí)分析的優(yōu)點(diǎn)是能明確地找出傳統(tǒng)回歸分析無(wú)法充分掌握的不同樣本群在基準(zhǔn)線上的差異或因果效果的異質(zhì)性,進(jìn)而進(jìn)行準(zhǔn)確的因果分析[37]。
本研究采用萬(wàn)方數(shù)據(jù)資源系統(tǒng)期刊數(shù)據(jù)庫(kù)2016—2019 年所收錄的全部期刊論文和引文數(shù)據(jù)作為主要統(tǒng)計(jì)數(shù)據(jù)來(lái)源??紤]到我國(guó)開展學(xué)術(shù)期刊評(píng)價(jià)的需求,被評(píng)價(jià)期刊大都是中文期刊,因此,采用國(guó)內(nèi)中文文獻(xiàn)為主的數(shù)據(jù)庫(kù)更能保證評(píng)價(jià)結(jié)果的可靠性。該數(shù)據(jù)庫(kù)系統(tǒng)覆蓋了我國(guó)出版的絕大多數(shù)學(xué)術(shù)期刊,其中包括原國(guó)家新聞出版廣電總局2014 年認(rèn)定的3713 種科技類學(xué)術(shù)期刊。
原國(guó)家新聞出版廣電總局采用各主管單位初審上報(bào)、總局審定的方式,認(rèn)定了第一批學(xué)術(shù)期刊名單。本研究用于實(shí)證的樣本采用其中歸屬于科技類的3713 種學(xué)術(shù)期刊。
參照《中國(guó)科技期刊引證報(bào)告(核心版)》《中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)學(xué)科分類與代碼(GB/T 13745—2009)》《中國(guó)圖書資料分類法(第四版)》,設(shè)定112 個(gè)學(xué)科類別。學(xué)科類別的劃分考慮到各個(gè)學(xué)科的隸屬關(guān)系和出版物的規(guī)模,分為自然科學(xué)綜合、理學(xué)、農(nóng)學(xué)、醫(yī)學(xué)、工程技術(shù)、管理等6 大部分。其中第1 部分“自然科學(xué)綜合”類是指報(bào)道綜合性內(nèi)容(發(fā)表多學(xué)科的研究論文)的期刊。由于這部分期刊品種很多,其中大學(xué)學(xué)報(bào)數(shù)量尤其多,為此再細(xì)分為3 個(gè)類別。其余5 大部分按照學(xué)科屬性進(jìn)行劃分。
布拉德福定律指出,大部分學(xué)術(shù)成果文獻(xiàn)向少量重要期刊聚集。在各個(gè)學(xué)科中,少量核心區(qū)期刊就能集中刊載本學(xué)科主要科研成就。為了提高工作效率,同時(shí)也為了減少一般性期刊中大量低水平論文的干擾,本研究采用中國(guó)科學(xué)技術(shù)信息研究所研制的中國(guó)科技論文與引文數(shù)據(jù)庫(kù)(China Scientific and Technical Papers and Citations Database, CST‐PCD)2016 年收錄的論文統(tǒng)計(jì)高頻詞。
CSTPCD 2016 收錄中國(guó)科技核心期刊2008 種,大約占我國(guó)科技期刊總數(shù)的1/3。核心期刊所報(bào)道的研究活動(dòng)是各個(gè)學(xué)科的主流研究領(lǐng)域,覆蓋的作者群體和研究選題能比較集中地反映各個(gè)學(xué)科的核心科研活動(dòng),因而避免了被統(tǒng)計(jì)中的噪音數(shù)據(jù)過(guò)度干擾。
CSTPCD 2016 收錄56.49 萬(wàn)篇論文,使用關(guān)鍵詞149.40 萬(wàn)個(gè)、414.83 萬(wàn)次,平均每篇論文使用7.3個(gè)關(guān)鍵詞,中文詞和英文詞計(jì)為2 個(gè)不同關(guān)鍵詞,以此為基礎(chǔ)計(jì)算各個(gè)學(xué)科使用頻次列在前1%的高頻關(guān)鍵詞。
對(duì)學(xué)術(shù)期刊傳播的特點(diǎn)和屬性進(jìn)行系統(tǒng)思考和重新梳理,可以認(rèn)為科技學(xué)術(shù)期刊具備如下特征,且符合一個(gè)系統(tǒng)的特性。
(1)總體大于部分之和[38]。我國(guó)科技期刊作為一個(gè)整體,不是幾千種科技期刊的簡(jiǎn)單加和。這些科技期刊和對(duì)科技期刊的管理機(jī)制、評(píng)價(jià)、投入等諸多相關(guān)內(nèi)容以及它們之間的聯(lián)系,共同構(gòu)成了科技期刊這一總體系統(tǒng)。對(duì)科技期刊的研究和管理,有必要從總體上進(jìn)行考慮[39]。
(2)多重目標(biāo),多重發(fā)展路徑。科技期刊的發(fā)展目標(biāo)不僅是記載、傳播和積累科技信息、科技理念、科技知識(shí),成為展示科技進(jìn)步的窗口,同時(shí)也應(yīng)成為科技人員進(jìn)行科技成果傳播和學(xué)術(shù)交流的平臺(tái)。科技期刊反映了一國(guó)科技發(fā)展的現(xiàn)狀和水平,承擔(dān)著促進(jìn)科學(xué)創(chuàng)新的公共社會(huì)責(zé)任[40]??萍计诳强茖W(xué)活動(dòng)中的紐帶和橋梁,因此,科技活動(dòng)中的科學(xué)研究、科技管理政策、科技出版管理體制等多方面的相關(guān)因素都會(huì)對(duì)科技期刊發(fā)展和變化產(chǎn)生影響;而這些因素在不同時(shí)期的不同組合,也意味著多種發(fā)展道路和結(jié)果。選擇最優(yōu)方案正是系統(tǒng)思考支持決策的最終目的。
(3)因果互動(dòng)和內(nèi)部反饋。從內(nèi)部而言,科技期刊的政策法規(guī)、體制、人員、產(chǎn)業(yè)、評(píng)價(jià)等子系統(tǒng)和更多相關(guān)因素之間,還有單個(gè)期刊之間,并不是簡(jiǎn)單的單向因果關(guān)系,而是相互影響,互為因果。貝塔朗菲是現(xiàn)代系統(tǒng)研究的開創(chuàng)者,他對(duì)系統(tǒng)的定義就是相互作用的多元素的復(fù)合體[41]??萍计诳沁@樣的一個(gè)復(fù)雜系統(tǒng)。
(4)封閉和開放的統(tǒng)一??萍计诳诳茖W(xué)事業(yè)發(fā)展的大環(huán)境中,是一個(gè)相對(duì)獨(dú)立的系統(tǒng)。但是這個(gè)獨(dú)立系統(tǒng)并非一個(gè)完全孤立的封閉體??萍计诳到y(tǒng)與外界環(huán)境之間的物質(zhì)、能量和信息的交換是其自身發(fā)展和發(fā)揮功能的機(jī)理,而且這種交換在一定的條件下會(huì)形成相對(duì)穩(wěn)定的狀態(tài),即科技期刊系統(tǒng)兼?zhèn)浞忾]性和開放性。
本研究定義的知識(shí)系統(tǒng)是,在確定的邊界內(nèi),基于一定的知識(shí)載體,匯集人類對(duì)客觀世界的顯性認(rèn)知,同時(shí)存在相同和不同的研究觀點(diǎn),并且隨著時(shí)間轉(zhuǎn)移會(huì)出現(xiàn)觀點(diǎn)的變化、增加和消失。這種觀點(diǎn)的構(gòu)成和變化看作知識(shí)系統(tǒng)的不確定性。知識(shí)系統(tǒng)的不確定性可以分解為靜態(tài)層面的不確定性和動(dòng)態(tài)層面的不確定性(圖1)。
圖1 期刊論文構(gòu)建的知識(shí)系統(tǒng)的不確定性分解
1)分布狀態(tài)不確定性(靜態(tài)層面)
分布狀態(tài)不確定性主要從靜態(tài)層面反映一個(gè)知識(shí)系統(tǒng)對(duì)學(xué)術(shù)知識(shí)內(nèi)容的結(jié)論、研究關(guān)注點(diǎn)的趨向性等絕對(duì)指標(biāo)量分布是否顯著呈現(xiàn)出集中或分散的態(tài)勢(shì)。在一個(gè)系統(tǒng)內(nèi),經(jīng)過(guò)一段時(shí)間后,對(duì)知識(shí)觀點(diǎn)、研究熱點(diǎn)、主流發(fā)展方向的判斷越一致、越集中,則這個(gè)知識(shí)系統(tǒng)對(duì)學(xué)術(shù)問(wèn)題的認(rèn)識(shí)越清晰一致,即人類對(duì)客觀世界的認(rèn)識(shí)越趨于完整正確。反之,一個(gè)系統(tǒng)內(nèi)對(duì)知識(shí)的探索和理解更加多樣,且不同方向和結(jié)論的正確可能性(正確概率)彼此差別不大,則說(shuō)明人類對(duì)相關(guān)問(wèn)題的認(rèn)識(shí)還處于不確定、不清晰、不一致的狀態(tài)。
針對(duì)學(xué)術(shù)期刊論文所構(gòu)建的知識(shí)系統(tǒng)之靜態(tài)不確定性的表述可以繼續(xù)分解成3 個(gè)子系統(tǒng)。
A1. 規(guī)模度:指學(xué)術(shù)期刊傳播文獻(xiàn)的容量。學(xué)術(shù)期刊作為發(fā)布和交流平臺(tái),在保證質(zhì)量和效率的前提下,應(yīng)該盡量多地發(fā)表體現(xiàn)科學(xué)發(fā)現(xiàn)和技術(shù)創(chuàng)新成果的論文。
A2. 廣泛性:指期刊學(xué)術(shù)影響的擴(kuò)張能力。學(xué)術(shù)期刊所發(fā)表傳播的內(nèi)容是科研論文,需要有足夠的讀者群空間,才能實(shí)現(xiàn)高效率的成果傳播功能和活躍的學(xué)術(shù)交流功能。
A3. 可持續(xù)性:主要指基金支持論文的數(shù)量和比例,以此來(lái)體現(xiàn)期刊論文與科技投入的匹配程度。
2)關(guān)系狀態(tài)不確定性(動(dòng)態(tài)層面)
關(guān)系狀態(tài)不確定性主要從動(dòng)態(tài)層面反映一個(gè)知識(shí)系統(tǒng)關(guān)于學(xué)術(shù)知識(shí)節(jié)點(diǎn)結(jié)構(gòu)、節(jié)點(diǎn)之間的相互作用、不同節(jié)點(diǎn)之間的關(guān)系類指標(biāo)是否顯著呈現(xiàn)集中還是分散的狀態(tài)[42-43]。在一個(gè)系統(tǒng)內(nèi),不同的節(jié)點(diǎn)層次上(如作者、期刊、關(guān)鍵詞、單篇論文),知識(shí)之間的聯(lián)系形成了節(jié)點(diǎn)網(wǎng)絡(luò)?;诠?jié)點(diǎn)網(wǎng)絡(luò)所表達(dá)的知識(shí)節(jié)點(diǎn)與相關(guān)節(jié)點(diǎn)之間的聯(lián)系,可以反映整個(gè)知識(shí)系統(tǒng)的相對(duì)集中性。與絕對(duì)集中性的含義相同的是,人們對(duì)知識(shí)觀點(diǎn)、研究熱點(diǎn)、主流發(fā)展方向的判斷越一致、越集中,說(shuō)明這個(gè)知識(shí)系統(tǒng)中對(duì)學(xué)術(shù)問(wèn)題的認(rèn)識(shí)越清晰一致,即人類對(duì)客觀世界的認(rèn)識(shí)越趨于完整正確。反之,一個(gè)系統(tǒng)對(duì)知識(shí)的探索和理解更加多樣,且不同方向和結(jié)論的正確可能性(正確概率)彼此差別不大,則說(shuō)明人類對(duì)該問(wèn)題的認(rèn)識(shí)還處于不確定、不清晰、不一致的狀態(tài)。
針對(duì)學(xué)術(shù)期刊論文所構(gòu)建的知識(shí)系統(tǒng)之相對(duì)集中性層面對(duì)系統(tǒng)不確定性的表述可以繼續(xù)分解成4個(gè)子系統(tǒng)。
B1. 開放度:指期刊論文稿源組織的合理性和開放程度。稿源渠道建設(shè)是學(xué)術(shù)期刊建設(shè)的重要組成部分。廣泛充分的高水平稿源是期刊發(fā)揮自身功能的基本保障。如果稿源范圍過(guò)于有限,或者過(guò)于集中,會(huì)降低學(xué)術(shù)期刊的交流活力。
B2. 合作性:指期刊發(fā)表合著論文(包括國(guó)家層面、機(jī)構(gòu)層面合作研究所形成論文)的能力[44]。合作研究往往能實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ),產(chǎn)出高水平研究成果。特別是近年來(lái)逐漸增多的大規(guī)模多邊合作產(chǎn)出的“大科學(xué)”論文成果,往往是全世界均可受益的關(guān)鍵成果[45]。
B3. 競(jìng)爭(zhēng)力:指給定期刊與同學(xué)科或同類型的其他期刊競(jìng)爭(zhēng)取得比較優(yōu)勢(shì)的能力。學(xué)術(shù)期刊大都具有顯著的公益性色彩,但學(xué)術(shù)出版活動(dòng)同時(shí)也是一種商業(yè)行為。在競(jìng)爭(zhēng)中發(fā)展壯大是每個(gè)學(xué)術(shù)期刊不能逃避的任務(wù)。
B4. 影響力:指期刊發(fā)表的論文成果對(duì)其他相關(guān)學(xué)術(shù)研究活動(dòng)的借鑒價(jià)值或爭(zhēng)鳴價(jià)值,主要通過(guò)引文來(lái)測(cè)度。期刊論文被引用可以看作論文產(chǎn)生學(xué)術(shù)影響的典型表現(xiàn)。
正是因?yàn)閷W(xué)科發(fā)展和傳播具有顯著的系統(tǒng)屬性,所以可以把一個(gè)學(xué)科領(lǐng)域發(fā)表在學(xué)術(shù)期刊上的論文集合作為一個(gè)相對(duì)獨(dú)立的系統(tǒng)進(jìn)行研究。在本研究中,知識(shí)系統(tǒng)信息熵定義如下:在期刊研究論文所構(gòu)成的封閉和孤立的知識(shí)系統(tǒng)中,將對(duì)特定科學(xué)問(wèn)題的認(rèn)識(shí)和判斷的不確定性狀態(tài)的測(cè)度量,定義為該知識(shí)系統(tǒng)的信息熵。
對(duì)于信息熵的測(cè)度,可操作性較強(qiáng)的方法是通過(guò)構(gòu)建數(shù)學(xué)模型來(lái)組織和描述反映知識(shí)熵的各項(xiàng)指標(biāo)[46]。
本研究使用各個(gè)學(xué)科的高頻關(guān)鍵詞集合來(lái)定義各個(gè)學(xué)科發(fā)展的可能選項(xiàng)。本研究構(gòu)建的模型在應(yīng)用于各個(gè)學(xué)科領(lǐng)域的期刊評(píng)價(jià)實(shí)踐時(shí),每一個(gè)學(xué)科領(lǐng)域可能包含的研究方向的數(shù)量是不同的,即根據(jù)每個(gè)學(xué)科的規(guī)模和特點(diǎn)不同,存在不同的學(xué)科發(fā)展可能選項(xiàng)(變量)數(shù)量。
關(guān)鍵詞是表述論文所涉及的選題、解題、技術(shù)方法、研究對(duì)象、創(chuàng)新觀點(diǎn)、應(yīng)用價(jià)值等內(nèi)容的若干詞語(yǔ)。按照期刊出版相關(guān)標(biāo)準(zhǔn),學(xué)術(shù)論文都會(huì)著錄關(guān)鍵詞。關(guān)鍵詞具備規(guī)范性和通用性的特征[47]。通常關(guān)鍵詞會(huì)優(yōu)先選用敘詞,也就是從自然語(yǔ)言詞匯中優(yōu)先選出來(lái)語(yǔ)義相關(guān)、族性相關(guān)的科學(xué)術(shù)語(yǔ)。自由詞也可當(dāng)作關(guān)鍵詞,但需要優(yōu)先使用出自詞表或廣泛應(yīng)用的參考書、工具書的詞匯[48]。
論文的關(guān)鍵詞可以體現(xiàn)選題方向、研究方法或主要發(fā)現(xiàn)。在大數(shù)據(jù)技術(shù)基礎(chǔ)上,對(duì)關(guān)鍵詞的研究能夠?qū)崿F(xiàn)對(duì)知識(shí)結(jié)構(gòu)和領(lǐng)域發(fā)展的直觀理解。通過(guò)分析關(guān)鍵詞的數(shù)量關(guān)系之演化情況,還能發(fā)現(xiàn)和監(jiān)測(cè)學(xué)科熱點(diǎn)[49]。
在同一時(shí)間窗口內(nèi),將某學(xué)科全部期刊論文的關(guān)鍵詞按詞頻從大到小排序,處于前1%的關(guān)鍵詞組成高頻關(guān)鍵詞集合。該集合所反映的研究主題代表了特定時(shí)段內(nèi)該學(xué)科的研究熱點(diǎn)。實(shí)踐中,不宜用過(guò)長(zhǎng)的時(shí)間范圍統(tǒng)計(jì)高頻詞,以免研究熱點(diǎn)轉(zhuǎn)移造成統(tǒng)計(jì)誤差。研究熱點(diǎn)的轉(zhuǎn)移速度與各個(gè)學(xué)科演進(jìn)發(fā)展的節(jié)奏相對(duì)應(yīng),但是考慮到可操作性,時(shí)間窗口也不宜過(guò)窄(比如,按季度或月份獲取數(shù)據(jù))[50]。本研究采用高頻關(guān)鍵詞作為變量,而沒(méi)有使用全部關(guān)鍵詞作為變量,主要原因是高頻詞具備代表性,其范圍和結(jié)構(gòu)的變化情況可以比較充分地反映學(xué)科發(fā)展變化的整體情況,使用全部關(guān)鍵詞反而有可能造成過(guò)多噪音數(shù)據(jù)的混入。因此,從可行性角度,經(jīng)過(guò)測(cè)試比較,1%高頻詞的標(biāo)準(zhǔn)兼?zhèn)淇茖W(xué)性和可操作性。
本研究采用CSTPCD 2016 收錄的論文統(tǒng)計(jì)高頻詞。
對(duì)于一個(gè)學(xué)科領(lǐng)域的發(fā)展來(lái)說(shuō),隨著時(shí)間的推移,通過(guò)學(xué)術(shù)傳播發(fā)揮知識(shí)積累和交流功能,人類對(duì)科學(xué)規(guī)律和發(fā)展方向的認(rèn)知會(huì)逐步清晰。如果假設(shè)一個(gè)學(xué)科領(lǐng)域中某一個(gè)未知知識(shí)點(diǎn)存在n個(gè)預(yù)設(shè)可能選項(xiàng),那么在早期,n個(gè)預(yù)設(shè)選項(xiàng)的不確定性會(huì)相對(duì)較顯著,即人們的知識(shí)認(rèn)知較混亂;在后期,n個(gè)預(yù)設(shè)選項(xiàng)的不確定性會(huì)相對(duì)減弱,即人們的知識(shí)認(rèn)知逐漸清晰。這一過(guò)程,就是有效信息加入學(xué)科知識(shí)系統(tǒng)(引入負(fù)熵)的過(guò)程。
在信息熵理論框架下,我們可以把n個(gè)預(yù)設(shè)可能選項(xiàng)看作隨機(jī)選項(xiàng),用m個(gè)指標(biāo)來(lái)描述每一個(gè)預(yù)設(shè)選項(xiàng)的明確性,即表達(dá)每一個(gè)選項(xiàng)的概率Pi。
根據(jù)本研究提出的假設(shè)來(lái)推斷,在這個(gè)學(xué)科系統(tǒng)中,隨著知識(shí)信息的注入,不同預(yù)設(shè)選項(xiàng)成為主流研究方向的可能性的概率在變化。由于這個(gè)領(lǐng)域的未來(lái)方向會(huì)逐漸清晰,不確定性會(huì)降低,所以這個(gè)學(xué)科知識(shí)系統(tǒng)的信息熵狀態(tài)數(shù)值應(yīng)該有所下降。
由此,可以構(gòu)建指標(biāo)矩陣:
其中,n表示n個(gè)學(xué)科方向;m表示m個(gè)測(cè)度指標(biāo)。設(shè)i=1,2,…,n,j=1,2,…,m,則fij為第i個(gè)學(xué)科方向上的第j個(gè)指標(biāo)的數(shù)值。
根據(jù)俞立平等[51]研究歸納,一般常用的指標(biāo)篩選方法包括基于粗糙集理論的遴選、領(lǐng)域內(nèi)專家調(diào)研評(píng)議法、應(yīng)用相關(guān)系數(shù)法和變異系數(shù)法等;盡管在指標(biāo)篩選方面尚未形成統(tǒng)一通用的方法,但是專家評(píng)議在指標(biāo)篩選中所起到的作用仍然是不可替代的。劉麗莉[52]研究提出選取指標(biāo)的原則是目的明確、覆蓋全面、切實(shí)可行。因此在本研究中,采用專家評(píng)議方法選擇指標(biāo)。
指標(biāo)選擇過(guò)程中,主要考慮本研究需要表現(xiàn)不同發(fā)展方向的研究體量、廣泛性、活躍度、增長(zhǎng)能力等方面的因素,結(jié)合指標(biāo)的科學(xué)性、可獲取性,經(jīng)過(guò)多次調(diào)整和實(shí)驗(yàn),結(jié)合同行專家的調(diào)研咨詢意見(jiàn),最終確定選取了7 項(xiàng)指標(biāo)作為期刊評(píng)價(jià)準(zhǔn)則與計(jì)算知識(shí)系統(tǒng)信息熵的指標(biāo),如表1 所示。
表1 期刊評(píng)價(jià)準(zhǔn)則與計(jì)算知識(shí)系統(tǒng)信息熵指標(biāo)對(duì)應(yīng)表
(1)發(fā)表論文數(shù)量:5 年時(shí)間窗口發(fā)表論文數(shù)量。選用5 年是為了減少數(shù)據(jù)跳躍所造成的誤差。
(2)文獻(xiàn)分布廣泛性:文獻(xiàn)計(jì)量學(xué)發(fā)現(xiàn),出版物的秩頻分布存在負(fù)冪函數(shù)關(guān)系[53-54]。在本研究中,我們交換頻率與份額,二者關(guān)系表達(dá)公式為
其中,在某領(lǐng)域中,y表示各個(gè)國(guó)家發(fā)表論文的數(shù)量;x表示各個(gè)國(guó)家論文數(shù)量的排名。對(duì)于一個(gè)領(lǐng)域,a通常是恒定的。如果a的數(shù)值在一個(gè)學(xué)科方向中較低,則意味著這個(gè)學(xué)科方向中,很少的國(guó)家集中發(fā)表了較高比例的論文,文獻(xiàn)分布廣泛性較弱;反之,則可認(rèn)為這個(gè)學(xué)科文獻(xiàn)分布廣泛性較強(qiáng)。
(3)基金論文數(shù)量:1 年時(shí)間窗口有基金項(xiàng)目資助的論文數(shù)。一些文獻(xiàn)計(jì)量學(xué)家發(fā)現(xiàn),科技投入與科技產(chǎn)出之間是存在一定關(guān)聯(lián)性的[55];然而由于科技成果的滯后性,二者又不是簡(jiǎn)單的線性相關(guān)關(guān)系。通常來(lái)說(shuō),如果某一地區(qū)發(fā)表論文數(shù)量比另一地區(qū)多,那就意味著該地區(qū)投入的資源和設(shè)施比其他地區(qū)更多[56]。
(4)篇均機(jī)構(gòu)數(shù):1 年時(shí)間窗口內(nèi)論文作者所屬機(jī)構(gòu)數(shù)的平均值。
(5)國(guó)際合著論文比:1 年時(shí)間窗口內(nèi)國(guó)際合著論文所占的百分比。
(6)論文份額增長(zhǎng)率:論文數(shù)量份額相對(duì)前一年度增長(zhǎng)的百分比。
(7)篇均論文被引用次數(shù):5 年時(shí)間窗口內(nèi)論文篇均被引用次數(shù)。篇均被引用指標(biāo)是分年度統(tǒng)計(jì)和計(jì)算的,即各年度發(fā)表論文篇均被引用次數(shù)雖然存在累計(jì)性差異,但是經(jīng)過(guò)分年度標(biāo)準(zhǔn)化后,得到的數(shù)值是具有可比性的。
由于不同指標(biāo)的量綱、極值等存在顯著差異,必須要對(duì)指標(biāo)矩陣進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)化,形成標(biāo)準(zhǔn)化矩陣A:
其中,設(shè)i=1,2,…,n,j=1,2,…,m,則aij∈[0,1]。標(biāo)準(zhǔn)化公式為
其中,min{f1j,…,fij,…,fnj}表示j指標(biāo)項(xiàng)上,n個(gè)選項(xiàng)的fij的最小值;max{f1j,…,fij,…,fnj}表示j指標(biāo)項(xiàng)上,n個(gè)選項(xiàng)的fij的最大值。
本研究對(duì)于孤立系統(tǒng)各個(gè)單項(xiàng)指標(biāo)的信息熵計(jì)算公式為
其中,i= 1,2,…,n;j= 1,2,…,m。
通過(guò)計(jì)算,可以得出m個(gè)預(yù)設(shè)可能選項(xiàng)各自的信息熵狀態(tài)值,則整個(gè)知識(shí)系統(tǒng)的信息熵就是m個(gè)子系統(tǒng)的信息熵之和:
由于Hi的數(shù)值分布范圍是[0,1],所以H的數(shù)值分布范圍是[0,n]。H= 0,表示系統(tǒng)絕對(duì)有序,即所有子系統(tǒng)都是只有一個(gè)選項(xiàng),且同一個(gè)選項(xiàng)的實(shí)現(xiàn)概率是100%,其他為0;H=n,表示系統(tǒng)絕對(duì)無(wú)序,即所有子系統(tǒng)的所有選項(xiàng)概率都完全相同。
H的數(shù)值大小可以看作一個(gè)孤立系統(tǒng)的信息量和不確定性的體現(xiàn)。例如,在某個(gè)研究領(lǐng)域中,當(dāng)人類對(duì)客觀世界的認(rèn)識(shí)存在兩種或更多種不同觀點(diǎn),或者尚不知道某學(xué)科未來(lái)發(fā)展走向,只是可以預(yù)判幾種可能選項(xiàng)時(shí),可以認(rèn)為,初期各個(gè)選項(xiàng)實(shí)現(xiàn)的可能性比較接近,不確定性較強(qiáng)。隨著科學(xué)研究活動(dòng)的積累,發(fā)展趨向必然是可能選項(xiàng)越來(lái)越少,不確定性越來(lái)越小;還可以認(rèn)為,其中某一部分可能選項(xiàng)的實(shí)現(xiàn)概率持續(xù)增加,另一部分可能選項(xiàng)的實(shí)現(xiàn)概率持續(xù)減少,即不確定性也在減少。不確定性減少意味著知識(shí)系統(tǒng)所表達(dá)的信息在減少,也可以看作不確定性大的事物逐漸得到了確定,即通過(guò)科學(xué)研究成果的傳播,人類實(shí)現(xiàn)了對(duì)客觀世界的更多認(rèn)知。
本研究以各學(xué)科高頻關(guān)鍵詞(出現(xiàn)頻次排名在前1%)作為相應(yīng)學(xué)科的發(fā)展方向。
按照本研究設(shè)計(jì)的計(jì)算模型,各個(gè)學(xué)科的潛在發(fā)展方向就是學(xué)科高頻詞集合所反映的方向。統(tǒng)計(jì)得到學(xué)科內(nèi)n個(gè)高頻關(guān)鍵詞就是n個(gè)潛在學(xué)科方向。
每個(gè)學(xué)科方向的數(shù)據(jù)子集的產(chǎn)生方式是,用關(guān)鍵詞作為檢索詞在萬(wàn)方數(shù)據(jù)中檢索,檢索策略為單詞檢索(各關(guān)鍵詞之間是“或”的關(guān)系)。
信息熵的計(jì)算指標(biāo)仍為發(fā)表論文數(shù)量、文獻(xiàn)分布廣泛性、基金論文數(shù)量、篇均機(jī)構(gòu)數(shù)、國(guó)際合著論文比、論文份額增長(zhǎng)率、篇均論文被引用次數(shù)等7 個(gè)指標(biāo)。利用從萬(wàn)方數(shù)據(jù)中檢索得到的子數(shù)據(jù)集合,對(duì)上述指標(biāo)進(jìn)行統(tǒng)計(jì)計(jì)算。
這樣,每個(gè)學(xué)科可以構(gòu)建形成n×m的指標(biāo)矩陣。其中n是潛在學(xué)科方向數(shù)量,即高頻關(guān)鍵詞數(shù)量;m= 7,即計(jì)算指標(biāo)數(shù)量。參照矩陣A構(gòu)建指標(biāo)矩陣F。
根據(jù)本研究提出的假設(shè)推斷,在這個(gè)學(xué)科系統(tǒng)中,隨著知識(shí)信息的注入,不同預(yù)設(shè)選項(xiàng)成為主流研究方向的概率在變化。由于未來(lái)研究方向會(huì)逐漸清晰,不確定性會(huì)降低,所以在這個(gè)學(xué)科知識(shí)系統(tǒng)中,知識(shí)系統(tǒng)的信息熵?cái)?shù)值應(yīng)該有所下降。
對(duì)于特定的被評(píng)價(jià)期刊,計(jì)算在其對(duì)應(yīng)的學(xué)科體系中,被評(píng)價(jià)期刊缺位情況下知識(shí)系統(tǒng)信息熵的反事實(shí)量H(X)′。
在期刊評(píng)價(jià)活動(dòng)中,假設(shè)該期刊不在對(duì)應(yīng)的學(xué)科中,即將被評(píng)價(jià)期刊從相應(yīng)的期刊論文構(gòu)成的真實(shí)知識(shí)系統(tǒng)中移除,其論文量、參考文獻(xiàn)(即引文)都不列入統(tǒng)計(jì)范圍。在這個(gè)新的虛擬的知識(shí)系統(tǒng)中,重新計(jì)算7 個(gè)指標(biāo):發(fā)表論文數(shù)量、文獻(xiàn)分布廣泛性、基金論文數(shù)量、篇均機(jī)構(gòu)數(shù)、國(guó)際合著論文比、論文份額增長(zhǎng)率、篇均論文被引用次數(shù);并根據(jù)計(jì)算結(jié)果,計(jì)算被評(píng)價(jià)期刊缺位情況下知識(shí)系統(tǒng)的信息熵反事實(shí)量H(X)′。
對(duì)于特定的被評(píng)價(jià)期刊,通過(guò)對(duì)比該刊所屬學(xué)科的知識(shí)系統(tǒng)信息熵的事實(shí)量H(X)與被評(píng)價(jià)期刊缺位情況下的知識(shí)系統(tǒng)的信息熵反事實(shí)量H(X)′之間的數(shù)值變化,反映被評(píng)價(jià)期刊對(duì)知識(shí)系統(tǒng)信息熵降低的貢獻(xiàn),也就是被評(píng)價(jià)學(xué)術(shù)期刊對(duì)知識(shí)系統(tǒng)所貢獻(xiàn)的負(fù)熵,如圖2 所示。
圖2 基于信息熵的學(xué)術(shù)期刊評(píng)價(jià)思路
采用知識(shí)系統(tǒng)信息熵的事實(shí)量H(X)與被評(píng)價(jià)期刊缺位情況下知識(shí)系統(tǒng)信息熵的反事實(shí)量H(X)′之間的差值ΔH,即學(xué)術(shù)期刊為系統(tǒng)所提供的負(fù)熵,測(cè)度該期刊的學(xué)術(shù)貢獻(xiàn):
其中,p代表第p個(gè)學(xué)科,數(shù)值范圍是[1, 112];q代表p學(xué)科全部期刊中的第q種。
CSTPCD 2016 收錄56.49 萬(wàn)篇論文,使用了關(guān)鍵詞149.40 萬(wàn)個(gè)、414.83 萬(wàn)次,平均每篇論文使用7.3 個(gè)關(guān)鍵詞??紤]到兼容中文期刊和英文期刊,將關(guān)鍵詞的中文寫法和英文寫法計(jì)為2個(gè)不同關(guān)鍵詞。
計(jì)算各個(gè)學(xué)科使用頻次列在前1%的高頻關(guān)鍵詞。以感染性疾病學(xué)、傳染病學(xué)為例,2016 年CSTPCD 收錄了8 種期刊,發(fā)表了1093 篇論文,共使用4349 個(gè)關(guān)鍵詞,使用7876 次。將這4349 個(gè)關(guān)鍵詞按出現(xiàn)頻次排序,排在前1%的關(guān)鍵詞有44 個(gè)(4349 個(gè)的1%),組成了該學(xué)科的高頻關(guān)鍵詞集合。各個(gè)學(xué)科高頻詞數(shù)量如表2 所示。
計(jì)算各學(xué)科領(lǐng)域由期刊論文所構(gòu)成的知識(shí)系統(tǒng)的信息熵事實(shí)量。經(jīng)過(guò)構(gòu)造指標(biāo)矩陣、標(biāo)準(zhǔn)化處理,112 個(gè)學(xué)科中的每一個(gè)都可以看作孤立知識(shí)系統(tǒng)。完成各個(gè)學(xué)科知識(shí)系統(tǒng)信息熵的計(jì)算,結(jié)果如表2 所示。
表2 2016年期刊學(xué)科分類及相關(guān)指標(biāo)
續(xù)表
續(xù)表
從圖3 所示的112 個(gè)學(xué)科的核心期刊數(shù)量和知識(shí)系統(tǒng)信息熵的分布情況可以看出,學(xué)科內(nèi)期刊數(shù)量的多少與該知識(shí)系統(tǒng)信息熵?cái)?shù)值的相關(guān)性不是非常明顯。計(jì)算二者之間的線性相關(guān)系數(shù)可以得到R2= 0.7312,也可以看出其不具備顯著相關(guān)性。
圖3 112個(gè)學(xué)科的核心期刊數(shù)量和知識(shí)系統(tǒng)信息熵的分布情況
以天文學(xué)為例,該學(xué)科6 種被評(píng)價(jià)期刊對(duì)知識(shí)系統(tǒng)的貢獻(xiàn)的計(jì)算結(jié)果如表3 所示。
表3 2016年天文學(xué)學(xué)科(k)期刊對(duì)知識(shí)系統(tǒng)的信息熵的影響
采用與6.3 節(jié)相同的方法,并且采用2016 年遴選得到的高頻關(guān)鍵詞列表,在其后的2017—2018 年數(shù)據(jù)庫(kù)中進(jìn)行知識(shí)系統(tǒng)信息熵?cái)?shù)值的運(yùn)算,可以得到各個(gè)知識(shí)系統(tǒng)信息熵?cái)?shù)值變化的量,如表4 所示。
從表4 所示的2016—2019 年各個(gè)學(xué)科知識(shí)系統(tǒng)信息熵的變化情況來(lái)看,大部分學(xué)科的信息熵?cái)?shù)值呈現(xiàn)明顯的減少趨勢(shì)。比較2016 年和2019 年數(shù)值的變化幅度,如圖4 所示,可以發(fā)現(xiàn)在全部112 個(gè)學(xué)科類別中,4 年之間信息熵變化方向?yàn)樵黾拥闹挥?1 個(gè),占比約為9.8%;其余超過(guò)90%的學(xué)科都是向信息熵減少的方向變化。由于各個(gè)學(xué)科之間知識(shí)系統(tǒng)信息熵的數(shù)值比較無(wú)明顯意義,因此,盡管圖4 所示分布狀態(tài)有類似于正態(tài)分布的形式,但本研究數(shù)據(jù)并不支持知識(shí)系統(tǒng)信息熵符合隨機(jī)分布。
圖4 112個(gè)學(xué)科的知識(shí)系統(tǒng)信息熵2016—2019年變化幅度的分布情況
表4 2016—2019年各學(xué)科(知識(shí)系統(tǒng))信息熵變化
續(xù)表
續(xù)表
(1)通過(guò)計(jì)算知識(shí)系統(tǒng)信息熵的事實(shí)量和被評(píng)價(jià)期刊缺位時(shí)知識(shí)系統(tǒng)信息熵的反事實(shí)量的差值ΔH,能夠體現(xiàn)被評(píng)價(jià)期刊對(duì)知識(shí)系統(tǒng)信息熵變化的貢獻(xiàn)。但是由于本研究中,以每個(gè)學(xué)科高頻詞為檢索詞得到的論文集合構(gòu)成的知識(shí)系統(tǒng)是相互獨(dú)立的系統(tǒng),所以不同系統(tǒng)的H狀態(tài)值之間不具備直接可比性,狀態(tài)值變化量ΔH之間也不具備直接可比性,不過(guò)每個(gè)系統(tǒng)ΔH的方向是可以比較的,它反映期刊對(duì)系統(tǒng)做出的是正貢獻(xiàn)還是負(fù)貢獻(xiàn)。從統(tǒng)計(jì)數(shù)據(jù)看,在3713 種期刊中有3578 種期刊(96.4%)的ΔH為正值,這表明絕大部分學(xué)術(shù)期刊對(duì)降低其所屬知識(shí)系統(tǒng)的混亂程度是有所貢獻(xiàn)的,也就是說(shuō),期刊學(xué)術(shù)出版活動(dòng)發(fā)揮了其必要功能。按照信息熵理論,一個(gè)孤立系統(tǒng)中引入的信息量應(yīng)是非負(fù)的,即最極端現(xiàn)象是期刊為系統(tǒng)貢獻(xiàn)的信息量為零,期刊為系統(tǒng)的貢獻(xiàn)不應(yīng)出現(xiàn)負(fù)值。但是在本研究中,部分期刊對(duì)所屬知識(shí)系統(tǒng)的貢獻(xiàn)ΔH為負(fù)值,這也許說(shuō)明,這部分期刊發(fā)表了一些對(duì)學(xué)科發(fā)展和凝聚共識(shí)有負(fù)面作用的文章,增加了系統(tǒng)的混亂程度。
(2)幾乎所有的學(xué)科中,都可以發(fā)現(xiàn)少數(shù)幾個(gè)期刊對(duì)系統(tǒng)的貢獻(xiàn)程度ΔH相比于其他期刊來(lái)說(shuō)要顯著高出許多,而絕大多數(shù)期刊的ΔH數(shù)值處于非常接近0 的水平。也就是說(shuō),在學(xué)科內(nèi),眾多期刊對(duì)知識(shí)系統(tǒng)的信息熵的貢獻(xiàn)數(shù)值分布呈現(xiàn)出貢獻(xiàn)較大的期刊數(shù)量較少、分布曲線長(zhǎng)尾明顯的分布規(guī)律。這表明在學(xué)科當(dāng)中,只有很少一部分期刊能夠充分發(fā)揮學(xué)術(shù)期刊的核心功能,為減少科學(xué)認(rèn)識(shí)中的不確定因素做出相對(duì)顯著的貢獻(xiàn);同時(shí),較多期刊對(duì)減少本學(xué)科認(rèn)識(shí)不確定性的作用十分有限。這一規(guī)律與布拉德福定律非常吻合,即各個(gè)學(xué)科都存在少數(shù)重要的核心區(qū)期刊。本研究發(fā)現(xiàn),能為本學(xué)科知識(shí)系統(tǒng)做出較大貢獻(xiàn)的期刊也是數(shù)量較少的,它們是另一種含義上的“核心期刊”,但是尚未定量描述高貢獻(xiàn)期刊與低貢獻(xiàn)期刊之間的數(shù)量關(guān)系。
(3)就學(xué)科間的差異來(lái)看,期刊數(shù)量規(guī)模和所對(duì)應(yīng)知識(shí)系統(tǒng)的信息熵變化沒(méi)有明顯的相關(guān)性。也就是說(shuō),一個(gè)學(xué)科的期刊品種的數(shù)量與該學(xué)科的個(gè)體期刊對(duì)知識(shí)系統(tǒng)信息熵變化貢獻(xiàn)的大小沒(méi)有直接關(guān)系。一個(gè)期刊對(duì)學(xué)科發(fā)展的貢獻(xiàn),主要取決于自身建設(shè)水平、發(fā)掘組織優(yōu)質(zhì)稿源的能力和精準(zhǔn)高效的傳播能力,與其他競(jìng)爭(zhēng)對(duì)手期刊的數(shù)量多寡關(guān)系不大。與此同時(shí),可以觀察到綜合性期刊的類別,包括自然科學(xué)綜合類、自然科學(xué)綜合大學(xué)學(xué)報(bào)類、自然科學(xué)師范大學(xué)學(xué)報(bào)類等,相對(duì)于其他專業(yè)類別,其2016—2019 年知識(shí)系統(tǒng)信息熵的變化幅度整體比較小,分別是-2.86、-1.41、1.58;其原因可能是綜合性期刊中發(fā)表的論文幾乎覆蓋全部學(xué)科領(lǐng)域,因此其體現(xiàn)學(xué)科發(fā)展變化的功能性較弱。
(4)大部分樣本期刊ΔH為正值,但還有41 種(1.1%)期刊ΔH為負(fù)數(shù),94 種(2.5%)期刊ΔH為0。當(dāng)ΔH為0 或接近于0 的時(shí)候,可以看作這一部分期刊對(duì)學(xué)科發(fā)展的貢獻(xiàn)極小。由于本研究計(jì)算方法是基于關(guān)鍵詞統(tǒng)計(jì),一些關(guān)注內(nèi)容與學(xué)科主題關(guān)系較遠(yuǎn)的期刊,關(guān)鍵詞與學(xué)科高頻詞無(wú)疊加,因此出現(xiàn)了貢獻(xiàn)值為0 的情況。當(dāng)ΔH為負(fù)數(shù)的時(shí)候,還有可能是期刊的學(xué)科分類屬性不夠明確,如果將該刊分到A 類,也許ΔH為正,若分到B 類,ΔH就是負(fù)數(shù)。另一種可能是,期刊刊載內(nèi)容過(guò)于廣泛,分布在多個(gè)學(xué)科當(dāng)中。這樣,它對(duì)任何一個(gè)學(xué)科的貢獻(xiàn)都不會(huì)大。從統(tǒng)計(jì)數(shù)據(jù)來(lái)看,綜合性較顯著的學(xué)科分類中,期刊的ΔH都比較低。
(5)從2016—2019 年各個(gè)學(xué)科知識(shí)系統(tǒng)信息熵的變化情況來(lái)看,在采用與2016 年同一組高頻關(guān)鍵詞的情況下,在時(shí)序系列的概念上是前后可比的。也就是說(shuō),都采用2016 年出現(xiàn)的高頻關(guān)鍵詞集合作為變量,測(cè)算同一知識(shí)領(lǐng)域的系統(tǒng)信息熵變化。從圖4 的數(shù)值關(guān)系可以看到,大部分學(xué)科的信息熵?cái)?shù)值呈現(xiàn)明顯的減少趨勢(shì)。特別是對(duì)比2016 年和2019 年的各個(gè)知識(shí)領(lǐng)域的信息熵,可以發(fā)現(xiàn)在全部112 個(gè)學(xué)科類別中,4 年之間信息熵變化方向?yàn)樵黾拥闹挥?1 個(gè),占比為9.8%;其余90%以上的學(xué)科都是向信息熵減少的方向變化。這意味著絕大多數(shù)學(xué)科的知識(shí)不確定性在逐步減小,也就是固定范圍學(xué)科發(fā)展主題方向逐漸聚焦和清晰,這符合對(duì)一般學(xué)科發(fā)展規(guī)律的認(rèn)知。這一變化過(guò)程中,各個(gè)期刊所發(fā)揮的作用有所差別,也就是各個(gè)期刊貢獻(xiàn)大小有所差別。
科學(xué)領(lǐng)域的學(xué)術(shù)活動(dòng)發(fā)展過(guò)程中,學(xué)術(shù)成果的傳播可以增加人類的知識(shí)積累,科研人員在擴(kuò)充知識(shí)儲(chǔ)備的同時(shí),進(jìn)一步明晰知識(shí)點(diǎn)之間的邏輯、結(jié)構(gòu),從而實(shí)現(xiàn)對(duì)客觀世界更明確的認(rèn)知。這一過(guò)程是信息熵減少的過(guò)程,是認(rèn)知中的不確定性、復(fù)雜性減少的過(guò)程,也是人類知識(shí)系統(tǒng)性、全面性、邏輯性發(fā)展的過(guò)程。在這個(gè)過(guò)程中,學(xué)術(shù)期刊發(fā)揮著重要的作用。對(duì)大部分學(xué)科領(lǐng)域,特別是基礎(chǔ)研究領(lǐng)域,絕大多數(shù)的研究成果和認(rèn)識(shí)是通過(guò)學(xué)術(shù)期刊來(lái)實(shí)現(xiàn)評(píng)價(jià)、加工、記載、傳播和交流的。學(xué)術(shù)期刊的評(píng)價(jià)應(yīng)該首先是對(duì)學(xué)術(shù)期刊應(yīng)具備的核心功能的評(píng)價(jià),也就是對(duì)學(xué)術(shù)期刊在學(xué)科發(fā)展中的價(jià)值的評(píng)價(jià)。
在本研究中,從信息熵的視角進(jìn)行學(xué)術(shù)期刊的評(píng)價(jià),就是觀察學(xué)術(shù)期刊是否通過(guò)自身組稿、審稿、編稿、發(fā)稿、傳播等環(huán)節(jié)的高效率工作,甄選和供給有學(xué)術(shù)意義的研究成果,能否對(duì)學(xué)科的發(fā)展提供支撐,逐漸凝聚科學(xué)問(wèn)題。換句話說(shuō),就是評(píng)價(jià)一個(gè)期刊能否通過(guò)學(xué)術(shù)傳播工作,減少一點(diǎn)學(xué)科體系的信息熵。
本研究假設(shè)被評(píng)價(jià)期刊不在系統(tǒng)內(nèi)進(jìn)而觀察系統(tǒng)變化的思路可以歸為“反事實(shí)”分析方法,即提出反事實(shí)的假定,設(shè)定與事實(shí)相反的條件,再去確定因果關(guān)系。
通過(guò)建立數(shù)學(xué)模型的方式,實(shí)現(xiàn)對(duì)學(xué)科系統(tǒng)信息熵的測(cè)定,這是一個(gè)宏觀層面的研究探索;如果將這一方法體系應(yīng)用到中觀層面,就是對(duì)學(xué)術(shù)期刊出版能力和學(xué)科貢獻(xiàn)的評(píng)價(jià);如果將這一方法體系應(yīng)用到微觀層面,就是對(duì)單篇學(xué)術(shù)論文的評(píng)價(jià)。通過(guò)測(cè)度相關(guān)指標(biāo),發(fā)現(xiàn)哪些單篇論文對(duì)科學(xué)進(jìn)步產(chǎn)生了重要影響。這些成果顯著地提高了人類認(rèn)識(shí)自然的水平,顯著地降低了學(xué)科系統(tǒng)的信息熵。
對(duì)于期刊評(píng)價(jià)來(lái)說(shuō),識(shí)別、發(fā)現(xiàn)這樣的關(guān)鍵性成果既是對(duì)期刊優(yōu)秀稿件組稿能力的認(rèn)定,也為期刊擴(kuò)展組稿工作渠道提供了有效工具[57]。在信息熵視角下,將學(xué)術(shù)期刊的評(píng)價(jià)管理建設(shè)工作與單篇論文的評(píng)價(jià)、優(yōu)秀作者和團(tuán)隊(duì)的識(shí)別工作結(jié)合起來(lái),有助于扭轉(zhuǎn)當(dāng)前較為嚴(yán)重的“以刊評(píng)文”的不當(dāng)評(píng)價(jià)導(dǎo)向,也可以在一定程度上對(duì)當(dāng)前廣泛存在的“濫用影響因子”的情況進(jìn)行糾偏[58]。