李 幸 曾 文 范 暢 師兵范 望俊成
(1.中國科學(xué)技術(shù)信息研究所,北京 100038;2.武漢大學(xué),湖北武漢 430072;3.中國人民大學(xué),北京 100872)
學(xué)術(shù)期刊是由學(xué)術(shù)論文組成,論文質(zhì)量決定論文價(jià)值,論文的價(jià)值大小直接影響到期刊的質(zhì)量。近年來,對(duì)論文質(zhì)量的衡量研究也逐漸受到研究人員的重視[1-3]。論文的價(jià)值可通過被引行為體現(xiàn),而被引行為隨時(shí)間推移有興衰變更,即論文價(jià)值的大小變化,體現(xiàn)出類似生物體的生命周期現(xiàn)象,論文價(jià)值大小的變化表現(xiàn)為論文的生命周期現(xiàn)象,是論文老化過程的體現(xiàn)[4]。本文將在醫(yī)學(xué)領(lǐng)域已得到廣泛應(yīng)用的生存分析法引入到期刊評(píng)價(jià)中,從論文層面入手映射到期刊層面,以期為期刊評(píng)價(jià)中信息老化理論的研究注入新的研究視角和思路。期刊文獻(xiàn)老化速度或新穎性的測度指標(biāo)是多樣的,但對(duì)時(shí)間維度的納入程度及方式卻不盡相同。從共時(shí)與歷時(shí)的分析角度來看,大部分指標(biāo)屬于共時(shí)分析,如普萊斯指數(shù)、引用半衰期,極少有指標(biāo)采用歷時(shí)分析的,如被引半衰期;從統(tǒng)計(jì)被引信息與時(shí)間的關(guān)系來看,絕大多數(shù)指標(biāo)的方式是統(tǒng)計(jì)某段時(shí)間內(nèi)期刊的被引量,較為宏觀。這些衡量期刊文獻(xiàn)老化、指標(biāo)都只是對(duì)實(shí)際情況的一種理想化、概略性的測度指標(biāo)[5]。這就對(duì)文獻(xiàn)老化理論的研究與發(fā)展提出了迫切的要求。
相對(duì)于已有的這些老化指標(biāo),本研究從歷時(shí)分析入手,微觀統(tǒng)計(jì)在監(jiān)測時(shí)間段內(nèi)期刊單位時(shí)間的被引頻次分布數(shù)據(jù),嘗試性引入生存分析法,初步探究生存函數(shù)在期刊評(píng)價(jià)方面的應(yīng)用,探索期刊文獻(xiàn)的生命規(guī)律,以期為期刊評(píng)價(jià)工作注入新的視角。
生存分析法源于醫(yī)學(xué)領(lǐng)域,由于其在分析時(shí)序數(shù)據(jù)等方面的優(yōu)勢(shì),逐漸被應(yīng)用到多個(gè)行業(yè)領(lǐng)域,如工程學(xué)、金融業(yè)、保險(xiǎn)業(yè)等。近年來,有學(xué)者將生存分析法應(yīng)用于網(wǎng)絡(luò)信息、專利信息等不同類型信息的老化規(guī)律研究[6-9]。這為生存分析在期刊評(píng)價(jià)上的應(yīng)用提供了理論基礎(chǔ)與參照。
生存分析是指將終點(diǎn)事件和出現(xiàn)此事件所經(jīng)歷的時(shí)間結(jié)合起來進(jìn)行分析的一種統(tǒng)計(jì)分析方法,是研究生存現(xiàn)象和現(xiàn)象的相應(yīng)時(shí)間數(shù)據(jù)及其規(guī)律的方法[10]。通俗來說,生存分析是研究一個(gè)或多個(gè)生物,在經(jīng)過某一特定的時(shí)間后,將發(fā)生某種特定事件(稱為終點(diǎn)事件)的概率,是一種動(dòng)態(tài)研究某個(gè)現(xiàn)象或因素隨時(shí)間變化的規(guī)律的統(tǒng)計(jì)方法[11]。生存分析法主要通過構(gòu)建生存模型(生存函數(shù)、概率密度函數(shù)等),計(jì)算出各個(gè)時(shí)間點(diǎn)上的危險(xiǎn)率,即所研究的對(duì)象的生存時(shí)間及其發(fā)生狀態(tài)轉(zhuǎn)變的可能性。
在生存分析法中,生存時(shí)間是指從某點(diǎn)開始到被觀測對(duì)象發(fā)生終點(diǎn)事件所經(jīng)歷的時(shí)間。對(duì)于期刊論文來說,生存時(shí)間可以稱為生命長度,是指論文自見刊之日起至失效(即失去利用價(jià)值)所經(jīng)歷的時(shí)間跨度。判斷信息失效是生存分析法運(yùn)用到期刊評(píng)價(jià)過程中至關(guān)重要的階段。
在大多數(shù)研究中,實(shí)驗(yàn)的時(shí)間檢測窗口是固定的,但研究對(duì)象進(jìn)入檢測窗口的時(shí)間是不同的,并且在檢測時(shí)期內(nèi)生存時(shí)間情況也不盡相同。因此,生存數(shù)據(jù)可以分為完全數(shù)據(jù)和刪失數(shù)據(jù)。
(1)完全數(shù)據(jù):實(shí)驗(yàn)對(duì)象的起點(diǎn)和終點(diǎn)均落在時(shí)間窗口內(nèi)。在本研究中,如論文的發(fā)表時(shí)間及失效的時(shí)間點(diǎn)都在2008年1月至2015年12月,該論文就屬于完全數(shù)據(jù)。
(2)刪失數(shù)據(jù):或稱為結(jié)尾數(shù)據(jù),包括左刪失、右刪失和區(qū)間刪失。左刪失數(shù)據(jù)指檢測窗口起點(diǎn)前樣本中已經(jīng)發(fā)生了研究事件的數(shù)據(jù)。在本研究中,是指發(fā)表時(shí)間早于2008年1月的論文,在本研究的數(shù)據(jù)集中不涉及該類數(shù)據(jù)。右刪失數(shù)據(jù)指在監(jiān)測時(shí)間終點(diǎn)仍未發(fā)生終點(diǎn)事件的樣本。在本研究中,是指在達(dá)到監(jiān)測時(shí)間2015年12月時(shí),仍未失效的期刊論文。區(qū)間刪失數(shù)據(jù)指只能確定事件發(fā)生在某一區(qū)間內(nèi),但無法準(zhǔn)確得知發(fā)生的時(shí)間點(diǎn)。在本研究中,并不涉及該類型刪失數(shù)據(jù)。
在生存分析法中,生存時(shí)間的分布常用下列4個(gè)函數(shù)來描述生存過程,即累積生存函數(shù)、分布函數(shù)、密度函數(shù)、危險(xiǎn)率函數(shù)[11]。這4個(gè)函數(shù)在數(shù)學(xué)上是等價(jià)的,給出其中一個(gè)函數(shù),可以派生出其余3個(gè)函數(shù)。以下從論文角度對(duì)生存函數(shù)進(jìn)行介紹。
累積生存函數(shù),記作S(t),指論文的生命長度T超過時(shí)間t的概率,其函數(shù)表達(dá)式為:
其中,S(t)是時(shí)間t的非增函數(shù),并且具有S(0)=1,S(∞)=0的屬性。
Berkson[12]于1942年提出了S(t)的圖形表示,稱為生存曲線。生存曲線的走勢(shì)表征生存規(guī)律變化情況。一條陡峭的生存曲線,表示較低的生存率或較短的生命長度。一條平緩的生存曲線,表示較高的生存率或較長的生命長度[11]。生存函數(shù)或生存曲線可以用來確定生命長度的四分位數(shù),并且可以用來比較兩個(gè)或多個(gè)數(shù)據(jù)集的生存分布。
累積分布函數(shù)又稱累積死亡率函數(shù)或累積風(fēng)險(xiǎn)率函數(shù),記作F(t),表示論文的生命長度不超過時(shí)間t的概率,其含義與生存函數(shù)相反,其表達(dá)式為:
概率密度函數(shù)又稱作密度函數(shù),記作f(t),指某一特定事件發(fā)生于區(qū)間(t,t+Δt)內(nèi)的概率,它表示事件發(fā)生速度的快慢,其函數(shù)表達(dá)式為:
f(t)的圖像被稱為密度曲線。密度函數(shù)有以下兩個(gè)屬性:一是f(t)為非負(fù)函數(shù):二是密度函數(shù)與t時(shí)間軸之間的面積為1[11]。在任一時(shí)間段內(nèi)的失效個(gè)體比率及失效頻率峰值能夠通過密度函數(shù)得到。
風(fēng)險(xiǎn)函數(shù)又稱瞬時(shí)失效率、條件死亡率或風(fēng)險(xiǎn)率,記作h(t),指當(dāng)個(gè)體在t時(shí)刻存活的條件下,在以后的單位時(shí)間(t,t+Δt)內(nèi)發(fā)生某一特定事件的條件概率,其函數(shù)形式為:
風(fēng)險(xiǎn)函數(shù)也能通過累積分布函數(shù)F(t)與概率密度函數(shù)f(t)進(jìn)行定義[11]:
風(fēng)險(xiǎn)函數(shù)的曲線有多種形式,如遞增、遞減、為常數(shù)等,對(duì)風(fēng)險(xiǎn)函數(shù)唯一的限制是非負(fù)性,即h(t)≥0[11]。
在實(shí)踐中,這4個(gè)函數(shù)可以用于說明數(shù)據(jù)的不同方面。生存數(shù)據(jù)分析的一個(gè)基本研究內(nèi)容就是,使用這4個(gè)函數(shù)中的一個(gè)或多個(gè)對(duì)樣本數(shù)據(jù)集進(jìn)行估計(jì),得出數(shù)據(jù)主題生存規(guī)律的相關(guān)結(jié)論。
在評(píng)價(jià)中應(yīng)用生存分析法時(shí),終點(diǎn)事件即期刊論文“失效”的判定頗為復(fù)雜。本研究認(rèn)為,期刊論文自發(fā)表之日起便擁有了一定的價(jià)值,其價(jià)值體現(xiàn)在被其他文獻(xiàn)引用的行為中,隨著論文發(fā)表時(shí)間的延長,論文將經(jīng)歷單位時(shí)間內(nèi)被引頻次越來越高、在某單位時(shí)間點(diǎn)被引頻次達(dá)到峰值、隨后逐漸降低至很少被人引用甚至不再被引用的生命周期?,F(xiàn)假定某篇論文在連續(xù)T個(gè)單位時(shí)間內(nèi)沒有被引用,可以認(rèn)為該論文在這T個(gè)時(shí)間后被大量關(guān)注或使用的概率不高,以此來判定論文失效,其中連續(xù)零被引時(shí)長T被稱為判定論文失效的有效時(shí)間間隔。因此,定義生命長度為自論文見刊之日起至判定該論文失效的有效時(shí)間間隔T的起始時(shí)刻為止所經(jīng)歷的時(shí)間長度??梢?,T值是判定論文失效與計(jì)算論文生存時(shí)間的關(guān)鍵。為確定T值,引入了雙比例失效法,該方法有以下幾個(gè)主要步驟。
(1)預(yù)設(shè)雙比例閾值P1、P2。經(jīng)驗(yàn)性通常設(shè)為80%、90%。其中,P1規(guī)定失效論文在生存時(shí)間內(nèi)的累積被引頻次占檢測時(shí)間段內(nèi)總被引頻次的比例,即有效累計(jì)被引率應(yīng)達(dá)到的值;P2規(guī)定達(dá)到P1值的論文量應(yīng)達(dá)到的比例。
(2)遞歸判斷。當(dāng)T=i(i=1,2,…)時(shí),判別失效論文,分別計(jì)算每篇失效論文在生存時(shí)間內(nèi)的有效累計(jì)被引率。
(3)判斷每篇失效論文的有效被引率是否達(dá)到P1。
(4)統(tǒng)計(jì)滿足條件(3)的論文數(shù)量,計(jì)算該論文量占樣本總量的百分比,判斷符合P1的論文量是否達(dá)到閾值P2:如果該比例小于P2,則T往后取值,從第二步重新計(jì)算;如果該比例大于等于P2,則將對(duì)應(yīng)T值作為判斷該領(lǐng)域論文失效的時(shí)間間隔。
通常,經(jīng)過雙比例失效法得到的T值有多個(gè),而在本研究中,取最小值作為判定論文失效的有效時(shí)間間隔值T。實(shí)質(zhì)上,T值與雙比例閾值P1、P2之間是相互影響的,由預(yù)設(shè)的P1、P2值,通過雙比例失效法遍歷尋找到的有效T值,并在此閾值對(duì)下確定有效T值的大小及各類型論文的比例情況,可以反向判斷預(yù)設(shè)的雙比例閾值是否合適,從而對(duì)閾值對(duì)進(jìn)行調(diào)整。
表1 論文被引時(shí)序表
評(píng)價(jià)對(duì)象為30種物理學(xué)科中文期刊,數(shù)據(jù)來源于中國科技論文與引文數(shù)據(jù)庫(CSTPCD),以2016年為原點(diǎn),向前追溯收集這些期刊集合在2008一2015年發(fā)表的論文及在被引關(guān)系中涉及的論文信息(共86375條記錄)、30種期刊所發(fā)表論文的被引用關(guān)系記錄(共115248條記錄)及施引和被引期刊的年發(fā)文頻次信息(共1698條信息)。數(shù)據(jù)清洗(去除冗余記錄、重要信息缺失記錄等,補(bǔ)充或修正期刊年發(fā)文頻次信息等)及數(shù)據(jù)表結(jié)構(gòu)轉(zhuǎn)換過程,在此不作贅述。在此需要說明的是,在確定論文出版時(shí)間時(shí),由于CSTPCD不直接提供期刊每期出版具體時(shí)間,并且對(duì)于雙月刊、季刊等類型期刊,不同的期刊選擇發(fā)表的月份是不同的,考慮到研究的可行性問題,統(tǒng)一把出版周期內(nèi)最后一個(gè)月作為出版月。由此得到可用于生存分析的論文被引時(shí)序分布表,如表1所示。其中,-1對(duì)應(yīng)論文見刊前的時(shí)間,0說明論文在該時(shí)間節(jié)點(diǎn)未被引用,正整數(shù)為論文在該時(shí)間節(jié)點(diǎn)處對(duì)應(yīng)的被引用頻次。
CSTPCD收錄的母刊集在2008年1月至2015年12月的發(fā)文量、被引頻次、施引論文數(shù)、施引期刊數(shù)量等信息如表2所示。樣本數(shù)據(jù)集中,《物理學(xué)報(bào)》發(fā)文量最高,其次為《光學(xué)學(xué)報(bào)》,而《光譜學(xué)與光譜分析》的施引期刊數(shù)量最高。
根據(jù)生存數(shù)據(jù)的分類特點(diǎn)及論文在監(jiān)測時(shí)間段內(nèi)的被引和失效情況,現(xiàn)將論文分為三類:第一類為無生命論文;第二類為失效論文;第三類為未失效論文。第一類論文是在發(fā)表后T+De(判定信息失效的時(shí)間間隔T及首次被引時(shí)滯均值De,De是本研究數(shù)據(jù)集物理學(xué)各個(gè)科期刊論文首次被引用的時(shí)間與其見刊時(shí)間的時(shí)間差的算數(shù)平均數(shù))時(shí)間間隔內(nèi)均未被引,這類論文自發(fā)表后就直接失效,無生命長度;第二類論文是根據(jù)前面介紹的方法,判定在監(jiān)測時(shí)間段內(nèi)失效了的論文,生命長度為失效點(diǎn)時(shí)間減去發(fā)表點(diǎn)時(shí)間,屬于完全數(shù)據(jù);第三類論文是自發(fā)表后一直被引,監(jiān)測時(shí)間結(jié)束生命仍在延續(xù),規(guī)定這類論文的生存時(shí)間為監(jiān)測時(shí)間終點(diǎn)減去發(fā)表點(diǎn)時(shí)間,屬于右刪失數(shù)據(jù)。
在利用“雙比例”失效法判定有效時(shí)間間隔T值前,需要首先預(yù)設(shè)雙比例P1、P2閾值對(duì)的值。通常學(xué)者根據(jù)“二八法則”將雙比例閾值定為80%??紤]物理領(lǐng)域的上述學(xué)科論文被引分布特點(diǎn),再根據(jù)閾值對(duì)與T值之間的制約關(guān)系,經(jīng)過多次實(shí)踐調(diào)整最終將雙比例閾值P1和P2均設(shè)定為71%。在此閾值對(duì)P1、P2下采用窮舉法,對(duì)各個(gè)T值的有效性進(jìn)行判定。如圖1所示,在雙比例閾值對(duì)71%一71%的條件下,隨著橫軸時(shí)間間隔T值從小到大變動(dòng),三類論文的數(shù)量也發(fā)生了明顯的變動(dòng)。在此過程中,無生命論文數(shù)量單調(diào)減少后變?yōu)?,失效論文量先上升后下降最后變?yōu)?,未失效論文量單調(diào)增加,最終所有樣本論文都成為未失效論文??梢钥闯?,物理學(xué)科作為基礎(chǔ)學(xué)科,其論文右刪失情況嚴(yán)重,這符合我們對(duì)物理學(xué)科發(fā)展及其老化速度相對(duì)遲緩的認(rèn)知。
表2 母刊發(fā)文及被引情況統(tǒng)計(jì)表(中文版)
表3列出了部分T值下論文類別分布及失效比例情況,其中“失效一P1數(shù)量”是指失效論文在有效生命長度內(nèi)被引頻次占觀測時(shí)間內(nèi)總被引頻次的比例大于P1(71%)的論文數(shù)量;在考慮到物理學(xué)科論文右刪失現(xiàn)象較為顯著的情況下,將“失效一P2占比”定義為失效一P1論文數(shù)量和未失效論文數(shù)量占失效論文數(shù)量和未失效論文總量的比例。實(shí)質(zhì)上,雙比例閾值是不影響遍歷T值時(shí)三類論文的變化規(guī)律的,而是用來確定“失效一P1數(shù)量”與“失效一P2占比”達(dá)到閾值所對(duì)應(yīng)的T值。
根據(jù)表3的統(tǒng)計(jì)數(shù)據(jù),當(dāng)T值取14時(shí)(字體已被加粗的行),被引頻次大于P1的論文數(shù)量所占比例73.2%首次超過P2(71%)。并且,當(dāng)T=14時(shí),失效論文中滿足P1條件的論文量(即失效一P1數(shù)量)達(dá)到最大,并在此后逐漸下降。由此可見,在雙比例71%一71%的判定標(biāo)準(zhǔn)下,T取14滿足判定條件,并且滿足P1條件的論文量達(dá)到最大。因此,本研究判定實(shí)驗(yàn)樣本論文失效的有效時(shí)間間隔的T值為14。
圖1 三類論文隨T值的變化情況
表3 判定T值數(shù)據(jù)節(jié)選
在論文生命長度分布基礎(chǔ)上,本研究依據(jù)論文生命表及生存時(shí)間函數(shù),針對(duì)樣本論文的生存情況進(jìn)行進(jìn)一步的分析。以5個(gè)月為單位區(qū)間跨度,將論文生命長度劃分為19個(gè)時(shí)間段,利用生存曲線、概率密度曲線及風(fēng)險(xiǎn)曲線,對(duì)物理領(lǐng)域樣本論文整體情況進(jìn)行分析。
在本研究中,物理學(xué)科樣本論文集的累積生存曲線如圖2所示,反映了對(duì)應(yīng)時(shí)間仍處于存活狀態(tài)的論文數(shù)量占總體樣本數(shù)量的比例。由于研究領(lǐng)域的單一性,所以選取時(shí)間前后縱向?qū)Ρ确治?,物理學(xué)科論文隨著時(shí)間的增加,累計(jì)生存率整體呈現(xiàn)下降趨勢(shì),前11個(gè)時(shí)間區(qū)間下降顯著,大約有80%的論文生命長度在11個(gè)時(shí)間區(qū)間內(nèi)。突破11個(gè)時(shí)間區(qū)間存活下來的論文累計(jì)生存曲線變緩,失效速度減緩,生存時(shí)間較長。在檢測時(shí)間為結(jié)束時(shí),仍然有將近10%存活率,說明物理學(xué)科論文數(shù)據(jù)的右刪失情況顯著。
圖2 樣本集的累積生存曲線
圖3 樣本集的概率密度曲線
樣本論文集的概率密度曲線,如圖3所示(經(jīng)過平滑后的折線圖),反映了樣本論文在各個(gè)壽命區(qū)間的分布情況,即具有相同壽命的論文在總體中所占的比例。由圖3可見,在前11個(gè)壽命區(qū)間的概率密度數(shù)值較大,隨后曲線呈現(xiàn)下降趨于平穩(wěn)的狀態(tài)。此外,樣本論文見刊后第7個(gè)時(shí)間區(qū)間出現(xiàn)了壽命分布最大值,說明論文見刊后第7個(gè)時(shí)間區(qū)間失效的概率相比于其他時(shí)間要高。見刊第11個(gè)時(shí)間區(qū)間后的論文生命長度分布較為分散。
圖4 樣本集的風(fēng)險(xiǎn)曲線
表4 樣本期刊發(fā)文及被引情況表
表5 樣本期刊在2015年中國科技核心期刊綜合評(píng)價(jià)排名表中的情況
樣本集的風(fēng)險(xiǎn)曲線如圖4所示(經(jīng)過平滑后的折線圖),反映了每個(gè)壽命區(qū)間內(nèi)未失效論文的失效概率,曲線出現(xiàn)多次升落現(xiàn)象,但從整體來看,在前10個(gè)時(shí)間區(qū)間內(nèi),論文在單位時(shí)間內(nèi)的失效風(fēng)險(xiǎn)呈現(xiàn)逐漸增大的趨勢(shì);在第11個(gè)時(shí)間區(qū)間失效風(fēng)險(xiǎn)達(dá)到最大;隨后迅速回落,逐漸趨于平緩。在風(fēng)險(xiǎn)迅速下降的過程中,在第13、15時(shí)間區(qū)間內(nèi)再次迎來失效小高峰。度過失效高峰期的樣本論文失效的概率不斷變小,成為該領(lǐng)域內(nèi)長壽論文。
在分析了數(shù)據(jù)集整體生存規(guī)律的基礎(chǔ)上,將生存分析嘗試性地應(yīng)用在期刊間的對(duì)比上。在此選取《低溫物理學(xué)報(bào)》《紅外與毫米波學(xué)報(bào)》及《應(yīng)用光學(xué)》3種期刊,對(duì)其生存函數(shù)曲線進(jìn)行對(duì)比分析。筆者統(tǒng)計(jì)了這3種期刊的發(fā)文量及被引分布表中的記錄數(shù)(表4),其中發(fā)文被引率是CSTPCD中收錄的被引論文量占發(fā)文量的比值。從2016年版《中國科技期刊引證報(bào)告(核心板)》(自然科學(xué)卷)的2015年中國科技核心期刊綜合評(píng)價(jià)總分排名表中,摘錄出樣本期刊的評(píng)價(jià)數(shù)據(jù)情況(表5),作為利用生存分析法對(duì)比3個(gè)樣本期刊結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn)。
3個(gè)樣本期刊的累計(jì)生存曲線對(duì)比圖如圖5所示。從總體來看,3種刊物的累計(jì)生存曲線下降趨勢(shì)由陡到緩依次為:《低溫物理學(xué)報(bào)》《應(yīng)用光學(xué)》《紅外與毫米波學(xué)報(bào)》。因此,整體上相對(duì)來說,在相同時(shí)刻,《紅外與毫米波學(xué)報(bào)》生存率更高,《低溫物理學(xué)報(bào)》的論文生存率最低。《低溫物理學(xué)報(bào)》的論文生命長度集中在11個(gè)時(shí)間區(qū)間內(nèi),《應(yīng)用光學(xué)》的最長生存時(shí)間能達(dá)到16個(gè)時(shí)間區(qū)間左右,《紅外與毫米波學(xué)報(bào)》在監(jiān)測的末期,還能有接近20%的存活率。
圖5 樣本期刊累計(jì)生存曲線對(duì)比圖
圖6 期刊概率密度曲線對(duì)比圖
3個(gè)樣本期刊的概率密度曲線對(duì)比圖如圖6所示(經(jīng)過平滑后的折線圖)。從圖6中可見,《紅外與毫米波學(xué)報(bào)》的論文壽命分布相對(duì)分散,而《低溫物理學(xué)報(bào)》分別在第6、9、11時(shí)間區(qū)間分別出現(xiàn)論文壽命分布高峰。
3個(gè)樣本期刊的風(fēng)險(xiǎn)曲線對(duì)比圖如圖7所示(經(jīng)過平滑后的折線圖)。從圖7中可見,3家樣本期刊在第10個(gè)時(shí)間區(qū)間內(nèi)論文失效率均達(dá)到最大值,這說明期刊在該時(shí)間區(qū)間內(nèi)失效的論文量都很大,并且《低溫物理學(xué)報(bào)》遠(yuǎn)遠(yuǎn)高于另外兩種期刊。此外,《應(yīng)用光學(xué)》在單位區(qū)間內(nèi)的失效風(fēng)險(xiǎn)普遍高于《紅外與毫米波學(xué)報(bào)》。
從分析結(jié)果可以看出,在這3種期刊中,《低溫物理學(xué)報(bào)》的論文失效率較高,生存時(shí)間比較集中且普遍較短。筆者認(rèn)為這反映了該刊的論文質(zhì)量要普遍低于另外2種期刊;《紅外與毫米波學(xué)報(bào)》因其分散的生命分布、普遍偏低的失效風(fēng)險(xiǎn)及相對(duì)平穩(wěn)降低的生存曲線成為3個(gè)樣本期刊中質(zhì)量最高的期刊;《應(yīng)用光學(xué)》處于上述兩種期刊之間。這個(gè)評(píng)價(jià)結(jié)果與2016年版的《中國科技期刊引證報(bào)告(核心板)》的2015年中國科技核心期刊綜合評(píng)價(jià)排名表的結(jié)果相符合,在一定程度上說明將生存分析法應(yīng)用到期刊論文數(shù)據(jù)上是有一定效用的。
(1)本研究將醫(yī)學(xué)領(lǐng)域的生存分析法移用到學(xué)術(shù)期刊評(píng)價(jià),在此過程中克服了遇到的障礙性問題,從而使得應(yīng)用生存分析法評(píng)價(jià)期刊論文成為可能。首先,對(duì)論文失效進(jìn)行了定義,并利用“雙比例”失效法作出判定;其次,利用期刊的年發(fā)文頻次與論文見刊的年卷期計(jì)算了見刊時(shí)間(精確到月),解決了原始論文被引頻次的分布。
圖7 期刊風(fēng)險(xiǎn)曲線對(duì)比圖
(2)在選用CSTPCD收錄的30種物理學(xué)科中文期刊中,對(duì)整體樣本集進(jìn)行分析后,選取3個(gè)樣本期刊,經(jīng)生命曲線對(duì)比分析表明,《應(yīng)用光學(xué)》的論文質(zhì)量相對(duì)更高些,其次依次為《應(yīng)用光學(xué)》《低溫物理學(xué)報(bào)》,與2016年版的《中國科技期刊引證報(bào)告(核心板)》的評(píng)價(jià)結(jié)果相符。
(3)本研究僅實(shí)現(xiàn)了生存分析法在期刊評(píng)價(jià)上應(yīng)用,并利用生存函數(shù)曲線對(duì)比分析了樣本期刊間的差異,對(duì)計(jì)算結(jié)果進(jìn)行了初步分析,但沒有深入探究在期刊評(píng)價(jià)應(yīng)用方向上的相關(guān)問題,例如指標(biāo)構(gòu)建及評(píng)價(jià)結(jié)果效用性等問題。
(4)生存分析法用于期刊評(píng)價(jià)尚存在許多需要完善與優(yōu)化的地方:在實(shí)證數(shù)據(jù)方面,應(yīng)該延伸時(shí)間檢測窗口,擴(kuò)大樣本數(shù)據(jù)范圍,在更加寬泛的數(shù)據(jù)集上監(jiān)測更長的時(shí)間;在理論方法方面,對(duì)于期刊評(píng)價(jià)上的探究過少,缺乏對(duì)評(píng)價(jià)指標(biāo)及評(píng)價(jià)效用性的探究。
(5)本文為文獻(xiàn)老化視角下的期刊評(píng)價(jià)研究工作提供了新的思路與視角,豐富了文獻(xiàn)信息老化的理論“基石”。通過在理論與實(shí)證兩方面的研究,體現(xiàn)了生存分析法對(duì)被引時(shí)序數(shù)據(jù)具有普遍適用性。筆者認(rèn)為,該方法可以在以論文為評(píng)價(jià)主體的期刊評(píng)價(jià)、學(xué)科信息老化速度評(píng)價(jià)、高??蒲挟a(chǎn)出水平評(píng)價(jià)等方面進(jìn)行推廣與應(yīng)用。
[1]馬費(fèi)成,望俊成.信息生命周期研究述評(píng)(Ⅰ):價(jià)值視角[J].情報(bào)學(xué)報(bào),2010,29(5):939-947.
[2]王偉,胡西厚,黃亞明,等.信息計(jì)量學(xué)及其醫(yī)學(xué)應(yīng)用[M].北京:人民衛(wèi)生出版社,2009:63.
[3]望俊成.網(wǎng)絡(luò)信息生命周期規(guī)律研究[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2014.
[4]周曉丹.基于專利生命周期的企業(yè)技術(shù)競爭力研究:以無線充電領(lǐng)域?yàn)槔齕D].北京:中國科學(xué)技術(shù)信息研究所,2016.
[5]李翔.基于專利生命周期的無線充電技術(shù)創(chuàng)新研究[D].武漢:武漢大學(xué),2015.
[6]邢曉昭.專利信息生命長度測度及規(guī)律研究:以運(yùn)算處理和計(jì)算領(lǐng)域?yàn)槔齕D].北京:中國科學(xué)技術(shù)信息研究所,2013.
[7]蔡夢(mèng).生存分析理論及其應(yīng)用研究綜述[J].價(jià)值工程,2016,35(10):19-21.
[8]張旭堯,張衛(wèi)民.基于生存分析法的財(cái)務(wù)困境預(yù)警研究:以我國農(nóng)業(yè)上市公司為例[J].商業(yè)會(huì)計(jì), 2016(3):38-41.
[9]李文娟.中國ST企業(yè)的生存分析[D].廈門:廈門大學(xué),2008.
[10]BERKSON J.The calculation of survival rates, in carcinoma and other malignant lesions of the stomach[J].American Journal of Clinical Pathology, 1942, 119(8):1534.
[11]LEE E T, WANG J W.Statistical methods for survival data analysis[M].NewJersey: Wiley, 1992.
[12]BERKSON J, GAGE R P.Calculation of survival rates for cancer[J].Proceedings of the Staff Meetings Mayo Clinic,1950,25(11):270-286.