●郭 強,趙 瑾,劉思源,劉新新,王玲玉,譚雙岸
(1.鄭州大學(xué) 信息管理系,鄭州 450001;2.中國人民解放軍炮兵學(xué)院 軍事運籌教研室,合肥 230031)
在對期刊、論文以及作者的學(xué)術(shù)價值或者是學(xué)術(shù)影響力等進行評價的過程中,被引次數(shù)作為一種評價指標與下載次數(shù)相比會有其相對的滯后性,而且如果直接利用被引次數(shù)來對文獻的學(xué)術(shù)價值進行評價,那么對于研究活動中被使用但在最終成果中未被引用的文獻的學(xué)術(shù)價值,是否需要考慮如何來進行衡量,從而使得期刊、論文等評價對象的該類價值也能夠得到體現(xiàn)。盡管可以采取對被引次數(shù)進行某種數(shù)學(xué)修正,使得修正后的被引次數(shù)能夠包含對該類價值的估計,但是描述精確性的提高也往往伴隨著計算復(fù)雜程度的上升,這種復(fù)雜性不僅體現(xiàn)于被引次數(shù)指標自身的量化,還可能會體現(xiàn)在評價指標體系中各指標權(quán)重的確定上。由此,可以考慮將下載次數(shù)引入指標體系,一方面,從直觀上,文獻的下載次數(shù)能夠與該文獻被閱讀的次數(shù)呈高度正相關(guān),從而下載次數(shù)可以用來對文獻的受利用程度進行反映,這樣文獻的被引次數(shù)指標就無需做數(shù)量上的修正,當然前提是在網(wǎng)絡(luò)環(huán)境下;另一方面,文獻的下載次數(shù)也可視為對文獻學(xué)術(shù)價值的先期反映,從而評價可以有所提前。將下載次數(shù)納入指標體系時,需要相應(yīng)地賦予其權(quán)重,對于權(quán)重的確定則需要探討下載次數(shù)自身的性質(zhì),以及與其他指標之間的聯(lián)系,這樣對下載次數(shù)與被引次數(shù)之間的關(guān)系進行考察則有一定的實際意義。另外,下載次數(shù)與被引次數(shù)作為對期刊、論文等的不同側(cè)面反映,同是考察對象的基本屬性,同為計量學(xué)的基本考察指標,所以對兩者之間的相互關(guān)系進行探討也會有一定的理論意義。
對于下載次數(shù)與被引次數(shù)之間的關(guān)系,已有的研究主要包括對下載次數(shù)的布拉德福分布考察,期刊的下載次數(shù)、被引次數(shù)以及影響因子相互之間的等級相關(guān)分析,被引次數(shù)與下載次數(shù)的比較研究,包括對期刊影響因子與下載影響因子所進行的比較研究,[1-3]數(shù)據(jù)來源為《中國學(xué)術(shù)期刊網(wǎng)絡(luò)計量測試報告》與《中國學(xué)術(shù)期刊綜合引證報告》。本文側(cè)重于闡述下載次數(shù)與被引次數(shù)的對立與統(tǒng)一。下載次數(shù)與被引次數(shù)的共性源于對同一評價對象的價值描述,但是老化規(guī)律的不同、用戶的行為與偏好以及網(wǎng)絡(luò)環(huán)境等因素會影響兩者之間的一致性,所造成的這種差異也從總體上反映著種種影響因素之間的相互作用。
可以對下載次數(shù)與被引次數(shù)的關(guān)系進行統(tǒng)計研究,其前提是將下載次數(shù)與被引次數(shù)均視為隨機變量,所以兩者的概率分布是進一步對相互關(guān)系進行討論的基礎(chǔ)。假設(shè)以期刊作為考察對象,由于CNKI鏡像站版對其所有入庫期刊按照學(xué)科屬性進行了分類,并且能夠提供各個期刊的下載次數(shù)與被引次數(shù),所以在這里我們?nèi)詫⑵渥鳛閿?shù)據(jù)來源,并以基礎(chǔ)科學(xué)類期刊為例,得到下載次數(shù)與被引次數(shù)在期刊中的頻次分布,如圖1所示,數(shù)據(jù)統(tǒng)計時間為2009年3月,其中坐標橫軸為期刊評價指標的計量單位的倍數(shù),在此對于下載次數(shù)與被引次數(shù),計量單位分別取為50000次與1000次,盡管兩變量的統(tǒng)計單位有所不同,但是這并不妨礙在圖中對兩變量的頻次變化趨勢分別加以描述。
圖1 基礎(chǔ)科學(xué)類期刊按期刊評價指標的分布圖
從直觀上,下載次數(shù)與被引次數(shù)這兩個隨機變量都不服從正態(tài)分布,而且曲線擬合的結(jié)果分別為y1=79.6365exp(-x/1.7537)-0.1334與y2=42.6188exp(-x/2.1245)+0.7745,判定系數(shù)達到0.9779與0.9702,其中y1和y2分別為與下載次數(shù)和被引次數(shù)相對應(yīng)的期刊比重,x為該兩指標的計量單位數(shù),由此能夠有這樣的經(jīng)驗認識,即下載次數(shù)與被引次數(shù)在期刊中是與負指數(shù)分布較為吻合,這意味著對于下載次數(shù)或者是被引次數(shù)相對較少的期刊,其數(shù)量會相對較多,而且由于負指數(shù)分布的遞減速率在所有初等衰減函數(shù)中為最快,所以僅有很少部分的期刊具有較高的下載頻次或者是被引次數(shù)。例如將期刊按照被引次數(shù)降序排列,所得列表中的前12.31%的期刊與50.21%的被引次數(shù)相對應(yīng),而后67.39%的期刊卻只對應(yīng)19.94%的被引次數(shù),這種下載次數(shù)與被引次數(shù)在期刊中的集中與分散狀況也與傳統(tǒng)布拉德福定律的內(nèi)涵相一致,從而所得負指數(shù)分布也并不違反對文獻計量體系的已有經(jīng)驗認識。另外還需要檢驗所得經(jīng)驗結(jié)果是否具有某種一般性,對鏡像站中其余期刊的經(jīng)驗考察顯示,從直觀上,不同學(xué)科屬性的期刊集合均具有類似的情形。
另外,對于經(jīng)驗認識希望能夠作出一定的理論解釋,從而提高所得結(jié)果的置信度。若不嚴格地,第一,在給定的時間段內(nèi),期刊的下載頻次從直觀上會具有最可幾的居中取值,也即該時段內(nèi)的累積期刊下載次數(shù)過多或過少的概率都會相對較低,而存在概率相對較大的居中取值或者是取值區(qū)間。第二,泊松分布適合于給定尺度(時間或空間)中隨機事件發(fā)生的次數(shù),且參數(shù)λ大于1的泊松分布往往會在變量取值較為居中的時候?qū)?yīng)的概率為極大。第三,泊松分布在社會現(xiàn)象中有其普遍性,從而在這里用泊松分布來對給定考察時段內(nèi)期刊下載次數(shù)的概率分布進行描述,即P(ξ=d)=λde-λ/d!,其中 d=0,1,2, …,且λ為正常數(shù)。
需要指出,泊松分布的產(chǎn)生要求隨機事件流滿足平穩(wěn)、無后效以及普通性。對于期刊而言,新刊用論文能夠在一定程度上抵消由于過刊論文的老化而對期刊下載次數(shù)概率分布的影響,所以平穩(wěn)性能夠近似得到保證。第二,如果考察時長足夠短,那么期刊下載次數(shù)等于或多于兩次可視為小概率事件,所以普通性也可近似成立。第三,由于從直觀上,下載次數(shù)多的期刊會更具吸引力,從而會得到更多的下載次數(shù),會有馬太效應(yīng)的出現(xiàn),所以如果期刊的前期下載次數(shù)較多,則后期得到的下載次數(shù)可能也會相應(yīng)較多,這樣就很難保證無后效性的近似成立,由此需要對下載次數(shù)服從的概率分布進行改進。
由于泊松分布的期望值為λ,該取值應(yīng)與該期刊自身的學(xué)術(shù)價值、期刊論文網(wǎng)絡(luò)獲取的便捷程度以及期刊所屬學(xué)科的發(fā)展階段等客觀因素相對應(yīng),設(shè)λm為所有樣本期刊的下載次數(shù)期望值的最大值,如果考慮后效性,則應(yīng)有期刊的下載次數(shù)為d’=ξ+αexp[-(λm-λi)],其中λi為第i份期刊下載次數(shù)的期望值,且a為正常數(shù),由此,對于下載次數(shù)期望值越大的期刊,其(λm-λi)值也相應(yīng)地越小,于是由后效性所帶來的下載次數(shù)的增加也就越大,從而能夠?qū)︸R太效應(yīng)加以體現(xiàn)。由該式可得d’的數(shù)學(xué)期望為E(d’)=λi+α exp[-(λm-λi)],所以當(λm-λi)很小時,相應(yīng)期刊下載次數(shù)的期望值會很大,而當(λm-λi)增大時,由于負指數(shù)函數(shù)的關(guān)系,期望值會下降得很快,從而會有較多的期刊,其下載次數(shù)的期望值相對較小。
圖2 考慮后效性的期刊下載次數(shù)期望值與(λmλi)的關(guān)系圖
圖2描述了E(d’)隨(λm-λi)的變化情況,各參數(shù)取值分別為λm=24以及a=12,如此取值的目的是使期刊下載次數(shù)的期望值E(d’)能夠與圖1中下載次數(shù)的變化范圍相一致,一方面是由于圖1中的數(shù)據(jù)為下載次數(shù)的實際情況,另一方面也有利于相互比較。在圖2中,從直觀上,較少部分期刊的下載次數(shù)期望值會相對較大,而期望值相對較小的期刊,其數(shù)量則相對較多,而這與圖1中實際的期刊百分比隨期刊下載次數(shù)的變化趨勢是相吻合的,所以對于負指數(shù)分布能夠通過引入馬太效應(yīng)來進行一定程度的解釋。但是應(yīng)當指出,這種建立于圖2的直觀判斷還并不充分,畢竟在曲線的居中部分,其衰減速率并未達至負指數(shù)分布的程度,這意味著還需考慮其他的下載次數(shù)影響因素以作進一步的探討。
另外,下載次數(shù)或是被引次數(shù)等評價指標的分布狀況從直觀上會具有其復(fù)雜性,從而負指數(shù)分布未必會成為這些評價指標的唯一表現(xiàn)形式。盡管經(jīng)驗考察具有直觀性優(yōu)勢,但是所得到的負指數(shù)分布畢竟只是對樣本特征的描述,那么研究總體是否具有相類似的性質(zhì),還需進行顯著性檢驗,更何況經(jīng)驗考察面對普遍性規(guī)律的探求會有其方法上的局限性,下載次數(shù)與被引次數(shù)實際所服從的分布規(guī)律是評價對象自身的學(xué)術(shù)價值、學(xué)科的屬性與進展、用戶行為、網(wǎng)絡(luò)環(huán)境等諸多影響因素相互作用的縮影與反映,對于下載次數(shù)或者是被引次數(shù)等評價指標的規(guī)律性認識,模型的構(gòu)建會是可取的解釋性方法之一。
對于由經(jīng)驗考察所得到的這種負指數(shù)分布尚需做進一步的探討,但是該結(jié)果在一定程度上仍可作為一種依據(jù),來說明如果采用簡單相關(guān)分析來考察評價指標相互之間的統(tǒng)計相關(guān)性,則需要考察方法的適用性,其原因是由于簡單相關(guān)分析往往要求被考察的變量均須服從正態(tài)分布,那么對于非正態(tài)分布的情形而言,等級相關(guān)分析則較為合適。[1,3]
下載次數(shù)與被引次數(shù)之間的關(guān)系是兩者同一性與差異性的對立與統(tǒng)一,為了更好地體現(xiàn)這種同一性,可以考察下載次數(shù)與其他評價指標之間的相關(guān)性,以便作為參照,這樣在圖1中也給出了基礎(chǔ)科學(xué)類期刊的載文量以及期刊影響因子在期刊中的頻次分布,目的也是希望能夠?qū)υ搩芍笜说母怕史植歼M行大致的描述,數(shù)據(jù)統(tǒng)計時間同上,并且對于影響因子以及載文量,計量單位分別取為0.05和360篇。在圖1中,期刊載文量以及期刊影響因子的分布均具有一定的單峰性,且由曲線擬合所得到的方程為y3=11.2178exp[-(x-5.3402)2/24.1304]以及y4=1148.1398/[4(x-4.9697)2+148.6732],判定系數(shù)分別是0.9400與0.9394,其中y3和y4為與載文量以及影響因子這兩個指標相對應(yīng)的期刊百分比,x仍為指標的計量單位數(shù)。對于單峰性的成因,如果從直觀上理解,可以是在一般情況下載文量或是影響因子過大或者過小的期刊,其數(shù)量可能都會相對較少。另外還注意到該兩指標所服從的這種分布在指標取值偏低處,與偏高處相比,期刊的百分比相對較高,這與期刊整體的實際情況也較相符合,而指標值偏高區(qū)域的慢衰減性也在一定程度上反映著期刊整體的發(fā)展以及期刊價值的提升。對于期刊而言,選取以上四個指標進行比較的原因是由于這些指標能夠從外部較為全面地反映期刊的價值或者是影響力,[2]也即這些指標具有一定的完備性,從該角度,其他評價指標可不參與比較。另外,這些指標相互之間也具有明顯的內(nèi)涵差異,從而可以用來進行兩兩比較,以顯現(xiàn)下載次數(shù)與被引次數(shù)的相關(guān)程度。
仍然以CNKI鏡像站版中的入庫期刊作為樣本集。由于各個期刊均有與之對應(yīng)的上述四項指標值,所以可以得到其中任意兩個指標的隨機樣本對,對各變量的取值分別由小到大進行編秩,則能夠計算該兩指標的等級相關(guān)系數(shù)并做直線相關(guān)關(guān)系的顯著性檢驗,所得結(jié)果如圖3所示。
圖3 期刊評價指標的等級相關(guān)系數(shù)(基礎(chǔ)科學(xué)類期刊)
在圖3中1、2、3、4分別代表期刊的載文量、影響因子、被引次數(shù)以及下載次數(shù),星號表示在0.01水平下括號內(nèi)的兩個變量為顯著直線相關(guān)。另外,圖中的指標對如果不包含影響因子,則考察的期刊樣本數(shù)量為739份,否則數(shù)量為676份,這是由于部分期刊的影響因子數(shù)據(jù)未能得到??梢宰⒁獾匠ジ髯兞颗c其自身的相關(guān)性之外,與其余指標對相比,被引次數(shù)與下載次數(shù)之間具有較高的等級相關(guān)系數(shù),但是需要考察這種直觀印象的一般性,以期在一定程度上消除原始數(shù)據(jù)中的隨機因素,況且對于該數(shù)據(jù)集以及所涉及的基礎(chǔ)科學(xué)類期刊而言,影響因子與被引次數(shù)、載文量與下載次數(shù)之間的相關(guān)系數(shù)也都相對較高,為此對各指標的相關(guān)程度按照不同的學(xué)科屬性分別進行了考察,結(jié)果如圖4所示。
圖4 期刊評價指標的等級相關(guān)系數(shù)
在圖4中,各標號的含義與圖3相同,從直觀上,期刊的被引次數(shù)與下載次數(shù)之間較高的相關(guān)系數(shù)在不同的學(xué)科屬性條件下均能得到保持,與其他的指標對相比,其相關(guān)系數(shù)的平均值處于前列,且方差較小。另外,影響因子與被引次數(shù)的相關(guān)程度也相對較高,方差也偏低,畢竟期刊的影響因子是由期刊的被引次數(shù)計算得來的,所以這兩個指標之間的密切相關(guān)是自然的。而對于下載次數(shù)與被引次數(shù),同為對期刊價值的描述是兩者高度相關(guān)的基礎(chǔ),這種變量變化的同步性是兩者同一性的表現(xiàn),從直觀上理解,期刊的下載頻次越高,其受利用的程度也就相對越高,從而在研究活動的最終成果中被引用的可能性也就越大;反之,如果期刊的被引次數(shù)越高,則期刊信息受傳播的范圍可能也就越為廣泛,所以被下載的機會也就相對越多。兩變量之間的這種高度相關(guān)性也是利用下載次數(shù)來研究被引次數(shù)的基礎(chǔ)。既然后者與前者相比有一定的滯后性,那么就可以嘗試通過下載次數(shù)來對被引次數(shù)進行預(yù)測,從而使得科學(xué)評價得以進一步提前。但是事實上往往會面臨著與這種同步性不相符合的情形,例如存在期刊的下載次數(shù)很高但卻僅具有較少的被引頻次,[1]再注意到如果期刊的被引次數(shù)較高,則通常會有較多的下載頻次與該期刊相對應(yīng),那么下載次數(shù)與被引次數(shù)之間的互逆性就可能得不到滿足,這種非同步以及非互逆情形也是兩個指標之間差異性的體現(xiàn)。對于兩者間關(guān)系的探討需要以直觀認識作為基礎(chǔ),但是直觀認識也能夠從側(cè)面反映出兩者之間的關(guān)系可能并不顯然。
對于下載次數(shù)與被引次數(shù)的差異性探討,選取期刊樣本集合同上,將同一學(xué)科屬性的各個期刊按照其被引頻次降序排列,并用下載次數(shù)與被引次數(shù)的比值來表征該兩個指標之間的差異,[1-2]則每份期刊均有與其對應(yīng)的序號與比值,從而對于給定的樣本集能夠得到該比值與期刊序號的關(guān)系,如圖5所示。
圖5 基礎(chǔ)科學(xué)類期刊的下載次數(shù)與被引次數(shù)之比隨期刊序號的變化關(guān)系
圖6 下載次數(shù)與被引次數(shù)之比隨期刊序號的變化關(guān)系(取自圖5)
圖5以基礎(chǔ)科學(xué)類期刊為例,經(jīng)過檢驗,對于其他的學(xué)科屬性也有類似的情形,即在期刊序號偏低或是期刊被引次數(shù)偏高的區(qū)域,下載次數(shù)與被引次數(shù)的比值變化相對較為穩(wěn)定,這意味著隨著被引頻次的增加(降低),期刊的下載次數(shù)也會逐漸增多(減少),從而兩個指標變化的同步性可以較好地得到保證。所以直觀上,當期刊的被引次數(shù)偏高時,期刊下載次數(shù)與被引次數(shù)的相關(guān)性能夠體現(xiàn)。圖6是圖5在期刊序號小于等于300時的截圖,其中比值超過30的期刊比例僅為5%,除了這些少量的特例外,指標比值能夠維持在較平穩(wěn)的狀態(tài),且剔除特例后的均值與標準差分別為12.2886和5.7113。隨著期刊被引次數(shù)的減少,從期刊序號300起直至末尾的733,指標比值的震蕩幅度逐漸變大,且變化趨向不穩(wěn)定,以致在被引次數(shù)偏低的區(qū)域600至700處,被引次數(shù)規(guī)則遞減,但是指標比值卻并不隨之規(guī)則變化,這意味著比值的分子也即期刊的下載次數(shù),其變化亦不規(guī)則,從而能夠有這樣的經(jīng)驗認識:即在期刊序號偏高的區(qū)域,被引次數(shù)與下載次數(shù)之間缺乏變化的同步性,或者是兩者相關(guān)性較弱的一種體現(xiàn),類似地有在期刊序號600至733處,指標比值的均值與標準差分別是485.1708和965.6124。同時也注意到在被引次數(shù)偏高的區(qū)域,指標比值相對較低,而在期刊序號偏高處,指標比值則相對較高,這說明當期刊的被引頻次偏低時,對應(yīng)的下載次數(shù)卻相對較高,從而是從數(shù)值角度反映了期刊下載次數(shù)與被引次數(shù)在后者偏低時的弱相關(guān)。
以上是希望從變量的總量出發(fā)來對下載次數(shù)與被引次數(shù)之間的同一性與差異性進行考察,那么從變量分布的角度,兩變量之間的辯證關(guān)系是否仍然能夠得到體現(xiàn)。首先可以利用圖1來對下載次數(shù)與被引次數(shù)在期刊中的概率分布進行比較,從直觀上,并以其他的指標對作為參照,下載次數(shù)與被引次數(shù)的分布狀況依然能夠保持較高的同步性,經(jīng)過計算,該兩變量概率分布之間的相關(guān)系數(shù)為0.9724,略高于期刊載文量與影響因子之間的0.9156,其余變量對的相關(guān)系數(shù)則均不超過0.5005,這些與圖1的直觀表象相吻合。如前所述,載文量與影響因子間所表現(xiàn)出來的這種強相關(guān)性應(yīng)屬自然,從而能夠從側(cè)面反映期刊下載次數(shù)與被引次數(shù)之間較高的內(nèi)在關(guān)聯(lián)程度。另外還可考察此類相關(guān)系數(shù)隨指標值增加的變化情況,假設(shè)取周期為10個計量單位,則能夠得到下載次數(shù)與被引次數(shù)的移動相關(guān)系數(shù)曲線,如圖7所示。
圖7 下載次數(shù)與被引次數(shù)的移動相關(guān)系數(shù)
在圖7中,坐標的橫軸為各移動周期的起始計量單位數(shù),能夠注意到隨著變量取值的逐漸增加,對于下載次數(shù)與被引次數(shù)的概率分布而言,兩者之間的相關(guān)系數(shù)呈現(xiàn)遞減趨勢,究其原因是由于當變量取值增加時,下載次數(shù)與被引次數(shù)的概率分布或者是期刊百分比的遞減速率會有所不同。與下載次數(shù)相比,被引次數(shù)在期刊中的分布相對較為集中,大量期刊的被引頻次處于較低水平,具有高被引頻次的僅為少量期刊,所以對于被引次數(shù)較低的期刊,其所占的期刊百分比處于較高水平,而下載次數(shù)在期刊中的分布則相對較為分散,會有更多比例的期刊具有相對較高的下載次數(shù)。相應(yīng)地,由于總比例為1,所以下載次數(shù)偏低的期刊也會有所減少,由此期刊百分比隨下載次數(shù)的變化曲線會相對較為平坦,于是隨著被引次數(shù)與下載次數(shù)的逐漸增加,兩組期刊百分比的變化情況也會逐漸顯得不同步,從而相關(guān)系數(shù)呈現(xiàn)為遞減趨勢,特別是在變量取值偏高的區(qū)域,對于按照被引次數(shù)得到的期刊百分比曲線,其變化已不明顯,而按下載次數(shù)的百分比曲線仍然呈下降趨勢,以致在此兩者之間的相關(guān)系數(shù)減至最低。
對于會有更多比例的期刊具有相對較高的下載次數(shù),第一,由于圖6所顯示的下載次數(shù)與被引次數(shù)在低被引頻次區(qū)域處的弱相關(guān)性,原本被引次數(shù)較少的期刊,其下載次數(shù)可能會相對較高;第二,文獻資源的數(shù)字化以及網(wǎng)絡(luò)化所帶來的便捷性使得原本被引次數(shù)較少的期刊能夠獲得更多的關(guān)注;第三,資源的網(wǎng)絡(luò)化使得期刊集合的下載以及被引用的程度都能夠得以提升。作者在調(diào)研過程以及后續(xù)的科研活動中對所需文獻往往會通過基礎(chǔ)文獻的參考文獻來進行追蹤,除非對研究領(lǐng)域有一定的了解,則在傳統(tǒng)環(huán)境下通常會有部分的文獻處于檢索的盲區(qū),資源的數(shù)字化與網(wǎng)絡(luò)化不僅能夠?qū)Υ擞兴倪M,還能夠帶來文獻獲取的便捷性,以及提高對文獻間相互關(guān)系進行考察的效率,由此可以進一步擴大文獻集或是期刊集的下載與被引程度。但是需要指出,下載次數(shù)更多地是與期刊的受利用程度相對應(yīng),而作者在最終成果中所引用的期刊往往只是其在科研活動中利用過的期刊的一部分,所以與被引次數(shù)相比,下載次數(shù)在期刊集合中的分布狀況總是會顯得相對分散,從而與被引次數(shù)相比,下載次數(shù)較多的期刊數(shù)量會相對較多。
還需要說明的是,上述這種比較有其粗糙性,畢竟以上對各指標或變量所選取的計量單位有所不同,如此直接進行比較,只是為了能夠得到大致的經(jīng)驗認識。實際上由這種粗糙性所造成的后果在圖1中已經(jīng)有所顯現(xiàn),例如應(yīng)當是按被引次數(shù)得到的曲線會相對陡峭,而下載次數(shù)曲線則會相對較為平坦。造成該結(jié)果的原因是由于各指標計量單位的選取具有一定的隨意性,或者說還需要對各計量單位相互之間的具體對應(yīng)關(guān)系作進一步的探討,在這里沒有作出修正是因為還沒有妨礙到上述對兩類期刊百分比曲線所進行的定性比較與解釋。
除了概率分布,下載次數(shù)與被引次數(shù)在期刊中的布拉德福分布狀況也可以成為考察兩者對立與統(tǒng)一的組成部分,類似地可以進行差異性與統(tǒng)一性的經(jīng)驗探討,結(jié)合相應(yīng)的期刊累積百分比以及布拉德福常數(shù),能夠使得這類考察更具嚴格性。盡管不同的布拉德福常數(shù)的確有大小之分,但是從統(tǒng)計的角度兩者的差異是否足夠顯著,例如,如果數(shù)值大小的絕對差異是由原始數(shù)據(jù)的隨機性等因素所造成,那么是否可以認為兩者實質(zhì)上并無明顯不同,從而同一性能夠得以體現(xiàn)。由此需要從統(tǒng)計的角度來考察下載次數(shù)與被引次數(shù)之間的關(guān)系,特別是對兩者間同一與差異的程度進行度量。可以首先采取的是將下載次數(shù)與被引次數(shù)的樣本空間分別進行標準化處理,并在此基礎(chǔ)上對隨機變量的特征量包括均值以及標準差等之間的差異分別進行顯著性檢驗,這樣做的目的是希望對下載次數(shù)與被引次數(shù)之間的對立與統(tǒng)一,乃至兩者之間的相互關(guān)系進行量化,從而為期刊以及論文等評價指標體系中指標權(quán)重的確定建立基礎(chǔ)。
[1]張洋.期刊Web下載總頻次的布拉德福分布研究[J].圖書情報知識,2006(6):38-42,60.
[2]萬錦堃,等.期刊論文被引用及其Web全文下載的文獻計量分析[J].現(xiàn)代圖書情報技術(shù),2005(4):58-62.
[3]龐景安.中文科技期刊下載計量指標與引用計量指標的比較研究[J].情報理論與實踐,2006,29(1):44-48.