陳京蓮
(井岡山大學(xué)圖書館,江西 吉安 343009)
載文量是指某一期刊在一定時(shí)期內(nèi)所刊載的相關(guān)學(xué)科的論文數(shù)量??萍颊撐漠a(chǎn)出數(shù)量是體現(xiàn)科技成果產(chǎn)出的一個(gè)重要量化指標(biāo),在很大程度上說明科研發(fā)展水平[1]。載文量是反映一份期刊信息量的重要指標(biāo),期刊載文量多,在一定程度上表示這種期刊信息量較多,可供學(xué)者選擇的信息較多,因而該刊論文被引的次數(shù)也可能較多。但有不少人對(duì)此持不同觀點(diǎn),認(rèn)為載文量多的期刊,其論文水平并不一定就高;相反,載文量少的期刊,也可能是優(yōu)秀期刊。例如,有的刊物放松對(duì)論文質(zhì)量的控制,提高稿件錄用率,把刊物由季刊改為月刊,其結(jié)果是載文量提高了,刊物的信息量也提高了,但刊物水平反而下降了。當(dāng)前,有不少文獻(xiàn)報(bào)道了載文量與期刊影響因子之間的關(guān)系,但尚無一致的結(jié)論。Hooydonk[2]認(rèn)為載文量與期刊影響因子為線性增長關(guān)系。何榮利[3]和俞立平等[4]的研究發(fā)現(xiàn),期刊影響因子與載文量無關(guān)。于挨福和馬虎兆[5]運(yùn)用模型假設(shè)及實(shí)證檢驗(yàn)的方法,得出期刊的載文量對(duì)影響因子影響不顯著的結(jié)論;黃明睿[6]基于預(yù)防獸醫(yī)學(xué)及相關(guān)學(xué)科科技期刊數(shù)據(jù),對(duì)單刊的影響因子與載文量的關(guān)系進(jìn)行了研究,認(rèn)為二者呈顯著負(fù)相關(guān);劉晨霞等[7]研究了論文載文量增長與期刊影響因子之間的關(guān)系,認(rèn)為期刊的影響因子約31%可由載文量決定。此外,他們還發(fā)現(xiàn):當(dāng)期刊10 年的載文量處于中等(載文量為300~700 篇)時(shí),影響因子隨載文量的增大呈現(xiàn)出減小的趨勢(shì);但當(dāng)期刊10 年的載文量處于較少(載文量為106~300 篇)或較大(載文量為700~1 070 篇)時(shí),期刊影響因子隨載文量的增大有增大的趨勢(shì)。然而,許力琴等[8]對(duì)71 種高校自然科學(xué)學(xué)報(bào)2010—2017 年的載文量進(jìn)行了統(tǒng)計(jì),認(rèn)為載文量下降會(huì)導(dǎo)致期刊影響因子的下降。由此可知,不同期刊或同一期刊不同時(shí)間的選取對(duì)研究其載文量對(duì)期刊影響因子的影響應(yīng)該會(huì)導(dǎo)致不同的研究結(jié)論。
科研工作者在研究載文量和期刊影響因子關(guān)系的同時(shí),也有不少學(xué)者研究主題詞在文獻(xiàn)檢索中的作用以及如何對(duì)主題詞進(jìn)行自動(dòng)提取等問題[9-10]。主題詞是指能體現(xiàn)一篇論文或一部著作的中心概念的詞語,也指檢索資料時(shí)所查內(nèi)容中必須有的詞語[11]。主題詞能夠幫助人們快速地了解、把握文檔主題及內(nèi)容,以便人們高效地管理、檢索及閱讀文檔[12]。當(dāng)前,隨著科學(xué)技術(shù)的迅速發(fā)展尤其是網(wǎng)絡(luò)的普及,各期刊的載文量隨時(shí)間的快速增長、出版周期的減少以及論文的迅速傳播,科技工作者已無法通覽其研究領(lǐng)域內(nèi)的所有文獻(xiàn)。為了快速獲取所需文獻(xiàn),人們通常利用主題詞從Web of Science、Scopus 和CNKI 等數(shù)據(jù)庫中查找到自己所需要的論文。
在自然科學(xué)研究中,有些主題詞橫跨多個(gè)學(xué)科,如物理學(xué)、化學(xué)、文獻(xiàn)計(jì)量學(xué)、環(huán)境科學(xué)、工程學(xué)和醫(yī)學(xué)等,比如半衰期,其在不同的學(xué)科領(lǐng)域意義也不盡相同。在文獻(xiàn)計(jì)量學(xué)中,Gosnell[13]在1944 年提出了文獻(xiàn)老化的半衰期概念。1958 年,Bernal 提出用半衰期來表征文獻(xiàn)情報(bào)老化速度(歷時(shí)半衰期)。1960 年,Burton 和Kebler[14]提出了共時(shí)法半衰期測(cè)度的方法,他們將文獻(xiàn)的半衰期定義為這樣一段時(shí)間:在此時(shí)間內(nèi)已發(fā)表的某一學(xué)科領(lǐng)域內(nèi)正在被利用的全部文獻(xiàn)中較新的一半,或目前所利用的文獻(xiàn)中較新的一半是在多長時(shí)間內(nèi)發(fā)表的。由此可知,雖然半衰期這個(gè)主題詞在不同的學(xué)科中其含義存在差異,但是作為一個(gè)重要的參數(shù)已經(jīng)被廣泛用于定量研究不同學(xué)科中有關(guān)現(xiàn)象的自然規(guī)律中。另一方面,在不同學(xué)科中,含有半衰期的載文量隨時(shí)間的增加符合什么規(guī)律,是線性增加,指數(shù)增加,還是先指數(shù)增加然后負(fù)指數(shù)下降等等,我們尚不清楚不同學(xué)科中含有主題詞半衰期的載文量對(duì)時(shí)間的響應(yīng)遵循什么變化規(guī)律,還有待于進(jìn)一步研究。而這些問題的深入研究對(duì)明晰含有重要主題詞的載文量對(duì)時(shí)間的響應(yīng)規(guī)律具有重要的理論價(jià)值和現(xiàn)實(shí)意義。
因此,文章從含有主題詞的文獻(xiàn)載文量增長和文獻(xiàn)老化的角度出發(fā),利用主題詞半衰期在物理學(xué)、化學(xué)、環(huán)境科學(xué)、生物化學(xué)、工程學(xué)和文獻(xiàn)計(jì)量學(xué)等6 個(gè)學(xué)科領(lǐng)域出現(xiàn)的載文量對(duì)時(shí)間的響應(yīng)規(guī)律,構(gòu)建出特定主題詞載文量對(duì)時(shí)間的響應(yīng)模型,指導(dǎo)學(xué)術(shù)資源建設(shè)和服務(wù),以豐富文獻(xiàn)計(jì)量學(xué)理論和研究方法。
在2020 年3 月23—25 日,利用Web of Science平臺(tái)中所有數(shù)據(jù)庫檢索2000—2019 年間主題詞半衰期在物理學(xué)、化學(xué)、環(huán)境科學(xué)、工程學(xué)、生物化學(xué)和文獻(xiàn)計(jì)量學(xué)等6 個(gè)學(xué)科的載文量對(duì)時(shí)間的響應(yīng)規(guī)律。20 年期間6 個(gè)學(xué)科中含主題詞半衰期的載文量分別為:9 007 篇、27 880 篇、10 400 篇、10 858篇、37 586 篇和432 篇(表1)。
表1 6 個(gè)學(xué)科中含主題詞半衰期的載文量(篇)
為了能真實(shí)地描述主題詞載文量對(duì)時(shí)間的響應(yīng)規(guī)律,構(gòu)建了一個(gè)載文量對(duì)時(shí)間的響應(yīng)模型,即:
式中,N(t)是時(shí)間為t 時(shí)的載文量;t 為時(shí)間(單位:年);t0為起始時(shí)間(單位:年);a、b、c 和d 是4 個(gè)與時(shí)間無關(guān)的系數(shù)。簡(jiǎn)單地對(duì)公式(1)進(jìn)行數(shù)學(xué)分析可知,N(t)隨時(shí)間t 的增加而逐漸增加,達(dá)到極大值后又逐漸下降。
公式(1)的一階導(dǎo)數(shù)為:
如果公式(1)的一階導(dǎo)數(shù)等于0,那么公式(1)就有可能存在極點(diǎn)。假如N′(t)=0,如果用tmax表示
載文量峰值所對(duì)應(yīng)的最大時(shí)間,則有:
如果載文量峰值用Nmax表示,則有:
由此可知,新構(gòu)建的模型不僅可以直接給出載文量的峰值,并且還可以給出載文量峰值所對(duì)應(yīng)的最大時(shí)間。
此外,由(1)式可知,當(dāng)ce-d(t-t0)>1 時(shí),則公式(1)將變?yōu)橹笖?shù)方程,即
如果b=0,則(1)式在形式上就將變?yōu)長ogistic模型。由此可知,Logistic 模型是公式(1)的特例。
邏輯斯蒂(Logistic)模型是比利時(shí)數(shù)學(xué)家Verhulst PF 提出來的一個(gè)數(shù)學(xué)模型,現(xiàn)在該模型已被廣泛用于生物學(xué)和科技文獻(xiàn)增長[15-22]等領(lǐng)域。該模型的具體表達(dá)式為:
其中K 為所允許的最大載文量;N0為t=t0時(shí)的載文量,r 為載文量的增長率。
可以求得公式(6)的一階導(dǎo)數(shù),且其一階導(dǎo)數(shù)恒大于0,因此,該函數(shù)是一個(gè)沒有極點(diǎn)的漸近線,所以無法得到載文量峰值所對(duì)應(yīng)的最大時(shí)間。
文章是利用SPSS 18.5 進(jìn)行數(shù)據(jù)處理,并利用公式(1)和邏輯斯蒂模型分別擬合主題詞半衰期出現(xiàn)在物理學(xué)、化學(xué)、環(huán)境科學(xué)、工程學(xué)、生物化學(xué)和文獻(xiàn)計(jì)量學(xué)等6 個(gè)學(xué)科的載文量對(duì)時(shí)間的響應(yīng)數(shù)據(jù),并進(jìn)行相關(guān)性分析。作圖由Origin 8.5 軟件完成,然后用Adobe Illustrator CS 5 進(jìn)行圖形處理。
圖1 為物理學(xué)、化學(xué)、環(huán)境科學(xué)、工程學(xué)、生物化學(xué)和文獻(xiàn)計(jì)量學(xué)等6 個(gè)學(xué)科的載文量對(duì)時(shí)間的響應(yīng)關(guān)系擬合曲線。由圖1 可知,物理和工程學(xué)中出現(xiàn)半衰期的載文量對(duì)時(shí)間的響應(yīng)曲線類似,載文量隨時(shí)間的增加而逐漸增加,然后快速增加到最大值,最后載文量又隨時(shí)間的增加而快速下降;環(huán)境科學(xué)中出現(xiàn)半衰期的載文量隨時(shí)間的增加而逐漸上升到最大值,上升較為平緩,然后又逐漸下降;化學(xué)、生物化學(xué)和文獻(xiàn)計(jì)量學(xué)中出現(xiàn)半衰期的載文量對(duì)時(shí)間的響應(yīng)趨勢(shì)介于上述兩者之間。此外,由圖1還可知,新構(gòu)建的模型可以較好地反映6 個(gè)學(xué)科出現(xiàn)半衰期的載文量對(duì)時(shí)間的響應(yīng)趨勢(shì),且具有較高的確定系數(shù)(R2)。由圖1 可知,新構(gòu)建的模型擬合化學(xué)學(xué)科中出現(xiàn)半衰期的載文量對(duì)時(shí)間響應(yīng)曲線的擬合度最好,工程學(xué)次之,文獻(xiàn)計(jì)量學(xué)的曲線最差。同樣,邏輯斯蒂模型擬合化學(xué)學(xué)科的載文量對(duì)時(shí)間的響應(yīng)曲線的擬合度最好,環(huán)境科學(xué)次之,生物化學(xué)最差。6 個(gè)學(xué)科中出現(xiàn)半衰期的載文量對(duì)時(shí)間的響應(yīng)曲線與邏輯斯蒂模型的擬合曲線存在較大的差異,且與式(1)相比,其R2也較小。結(jié)果表明:邏輯斯蒂模型不能很好地?cái)M合6 個(gè)學(xué)科出現(xiàn)半衰期載文量對(duì)時(shí)間的變化趨勢(shì),其原因?yàn)檫壿嬎沟倌P褪且粋€(gè)沒有極點(diǎn)的函數(shù),不能真實(shí)地反映本文研究的載文量到達(dá)峰值后會(huì)隨時(shí)間增加而下降這種趨勢(shì)。
圖1 6 個(gè)學(xué)科中出現(xiàn)主題詞半衰期的載文量對(duì)時(shí)間的響應(yīng)曲線
表2 給出了2 個(gè)模型分別擬合6 個(gè)學(xué)科中出現(xiàn)主題詞半衰期的載文量對(duì)時(shí)間的響應(yīng)曲線,得到載文量峰值和對(duì)應(yīng)的峰值時(shí)間2 個(gè)關(guān)鍵參數(shù)。由表2 可知,新構(gòu)建的模型可以得到載文量峰值和對(duì)應(yīng)的峰值時(shí)間2 個(gè)關(guān)鍵參數(shù),而邏輯斯蒂模型只能給出載文量峰值,不能給出峰值時(shí)間。然而,表2 的數(shù)據(jù)表明2 個(gè)模型給出的載文量峰值非常接近。
表2 2 個(gè)模型擬合6 個(gè)學(xué)科中出現(xiàn)主題詞半衰期的載文量對(duì)時(shí)間的響應(yīng)曲線得到的2 個(gè)關(guān)鍵參數(shù)
通過Web of Science 平臺(tái)中所有數(shù)據(jù)庫檢索了2000—2019 年間主題詞半衰期在物理學(xué)、化學(xué)、環(huán)境科學(xué)、工程學(xué)、生物化學(xué)和文獻(xiàn)計(jì)量學(xué)等6 個(gè)學(xué)科載文量并進(jìn)行統(tǒng)計(jì)分析,利用新構(gòu)建的模型和邏輯斯蒂模型分別擬合了它們的載文量對(duì)時(shí)間的響應(yīng)曲線,得出以下結(jié)論。
(1)新模型不僅可以很好地?cái)M合主題詞半衰期在6 個(gè)學(xué)科中的載文量對(duì)時(shí)間的響應(yīng)數(shù)據(jù),而且還可以直接給出它們的載文量峰值和對(duì)應(yīng)的峰值時(shí)間。擬合結(jié)果表明,在2000—2019 年間,主題詞半衰期在文獻(xiàn)計(jì)量學(xué)中的載文量最小,年最大載文量?jī)H為33 篇,而在數(shù)據(jù)庫里檢索到的年最大載文量?jī)H為41 篇;在生物化學(xué)學(xué)科出現(xiàn)該主題詞的載文量最大,年最大載文量達(dá)到2 125 篇,而在數(shù)據(jù)庫里檢索到的年最大載文量達(dá)到2 224 篇。主題詞半衰期出現(xiàn)在其他學(xué)科的最大載文量介于這兩者之間。同時(shí),新模型給出的最大載文量與觀測(cè)值相差很小,給出的峰值時(shí)間與觀測(cè)值非常接近。此外,從表1 可知,雖然主題詞半衰期在文獻(xiàn)計(jì)量學(xué)中尤其在文獻(xiàn)老化中是一個(gè)重要的術(shù)語[23-27],借助于該主題詞,人們可以從載文量或文獻(xiàn)的被引頻次等研究某學(xué)科、某期刊或單篇文獻(xiàn)的老化趨勢(shì)和文獻(xiàn)老化的成因等[28-32],但該主題詞的載文量在文獻(xiàn)計(jì)量學(xué)中并不多,這意味著國內(nèi)外從事文獻(xiàn)老化研究的學(xué)者數(shù)量較少,還有待于進(jìn)一步提高。
(2)從擬合結(jié)果來看,邏輯斯蒂模型只可以給出主題詞半衰期在6 個(gè)學(xué)科中的最大載文量,但擬合曲線與觀測(cè)點(diǎn)之間存在較大的差異,且該模型不能反映該主題詞載文量隨時(shí)間的響應(yīng)變化趨勢(shì)。這是由于該模型是一條沒有極點(diǎn)的漸近線。此外,該模型尚不能給出載文量最大時(shí)的峰值時(shí)間。所以,雖然該模型被廣泛應(yīng)用于文獻(xiàn)增長規(guī)律的研究,但在應(yīng)用邏輯斯蒂模型研究主題詞載文量時(shí)需要注意其適用范圍。
(3)新構(gòu)建的模型比邏輯斯蒂模型和指數(shù)方程更具有普適性。因?yàn)樵谔囟ǖ臈l件下,如當(dāng)ce-d(t-t0)>1時(shí),該模型可以簡(jiǎn)化為指數(shù)方程。此外,如果取b=0,新模型則將退化為Logistic 模型,Logistic 模型是新模型的特例。由此可知,新模型可以為文獻(xiàn)增長和文獻(xiàn)老化的研究提供一個(gè)可供選擇的數(shù)學(xué)工具。