国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

科技論文學(xué)術(shù)影響力的多屬性描述研究

2012-08-31 11:45:32強(qiáng),趙
圖書館理論與實(shí)踐 2012年7期
關(guān)鍵詞:分值影響力次數(shù)

●郭 強(qiáng),趙 瑾

(1.鄭州大學(xué) 信息管理系,鄭州 450001;2.中國(guó)人民解放軍炮兵學(xué)院 軍事運(yùn)籌教研室,合肥 230031)

在對(duì)科技論文進(jìn)行描述與評(píng)價(jià)的過程中,需要建立相關(guān)的指標(biāo)或指標(biāo)體系來對(duì)論文的某種側(cè)面特征或是其整體特性進(jìn)行衡量,由此來獲得科技論文相關(guān)性質(zhì)的近似表征或度量,如論文的學(xué)術(shù)影響力、研究?jī)?nèi)容的創(chuàng)新性與前沿性等。由于論文的被引次數(shù)具有相對(duì)較高的可靠性、客觀性,同時(shí)引文數(shù)據(jù)的獲取具有其便捷性,使得論文的被引次數(shù)成為較為基本的描述指標(biāo)有了其理論及實(shí)際基礎(chǔ),從而能夠建立基于論文被引次數(shù)的復(fù)合指標(biāo),如期刊的影響因子以及作者的h指數(shù)等。本文希望在被引次數(shù)及其復(fù)合指標(biāo)的基礎(chǔ)上考慮論文的下載次數(shù),并由此來進(jìn)一步探討相應(yīng)的論文影響力的多屬性描述,從而考察在論文被引次數(shù)的基礎(chǔ)上納入下載次數(shù)對(duì)于評(píng)價(jià)指標(biāo)體系差異性以及全面性的影響,進(jìn)而也能夠利用所得到的指標(biāo)體系對(duì)h指數(shù)以及影響因子等進(jìn)行考察,一方面可以對(duì)相關(guān)的復(fù)合指標(biāo)進(jìn)行多屬性的探討,另一方面也可以對(duì)這種多屬性描述的可行性進(jìn)行考察以及對(duì)其有效性進(jìn)行檢驗(yàn)。

1 論文影響力描述指標(biāo)的選取

科技論文多屬性描述的已有研究側(cè)重于論文的學(xué)術(shù)質(zhì)量、論文的學(xué)術(shù)影響力評(píng)價(jià)指標(biāo)體系的建立與應(yīng)用,具體內(nèi)容涉及對(duì)指標(biāo)體系的合理性、可靠性、可用性的考察;對(duì)指標(biāo)權(quán)重的確定,以及對(duì)所建指標(biāo)體系的實(shí)踐檢驗(yàn)等。其中論文的被引次數(shù)以及論文所屬期刊的影響因子往往會(huì)成為指標(biāo)體系構(gòu)建的基礎(chǔ),究其原因是由于利用被引次數(shù)對(duì)學(xué)術(shù)質(zhì)量或是影響力進(jìn)行描述具有其客觀性,同時(shí)經(jīng)驗(yàn)考察的結(jié)果往往會(huì)顯示,期刊的影響因子與論文的學(xué)術(shù)水平以及論文的影響力等也具有較高的正相關(guān)性。

以被引次數(shù)與影響因子為基礎(chǔ)能夠構(gòu)造出相關(guān)的評(píng)價(jià)指標(biāo),用以反映論文質(zhì)量及其影響力的不同側(cè)面特征。在這個(gè)過程中,為了盡可能滿足描述體系的全面性,是否也需要考慮以文獻(xiàn)的被引情況作為判斷依據(jù)的描述指標(biāo),如是否存在能夠作為對(duì)論文影響力以及重要性的側(cè)面反映,而該類指標(biāo)及其取值并不完全或者是直接建立于該論文的被引情況上的。

除了考慮綜合指標(biāo)體系的構(gòu)建外,針對(duì)論文質(zhì)量或者是其影響力的復(fù)合指標(biāo)由于往往不涉及指標(biāo)權(quán)重的確定過程,所以能夠帶來描述體系中的計(jì)算量的減少,如論文引證系數(shù)建立在論文被引情況與期刊影響力之間關(guān)系的考察基礎(chǔ)上。考慮到論文的自引以及不同學(xué)科相互之間的差異,直接使用被引次數(shù)與影響因子進(jìn)行描述可能會(huì)帶來與論文實(shí)際影響力的偏差,由此需要對(duì)被引次數(shù)以及期刊的影響因子進(jìn)行修正或是優(yōu)化,并將修正后的論文被引情況與期刊的影響因子相乘來建立論文實(shí)際影響力的表征,[1]再如利用影響因子分?jǐn)?shù)平均值來對(duì)論文進(jìn)行評(píng)價(jià)時(shí)則是側(cè)重于不同學(xué)科之間論文質(zhì)量或是影響力的可比性。[2]

1.1 必要性考察

如果僅對(duì)論文影響力的多屬性描述進(jìn)行考察,從直觀上,文獻(xiàn)的被引用情況能夠體現(xiàn)出該文獻(xiàn)所具有的學(xué)術(shù)影響力,同時(shí)經(jīng)驗(yàn)考察與同行評(píng)議的結(jié)果也均能表明文獻(xiàn)的被引次數(shù)與其影響力之間的顯著相關(guān),盡管這種相關(guān)性是建立在統(tǒng)計(jì)意義的基礎(chǔ)上,但是并不妨礙利用被引頻次對(duì)文獻(xiàn)的影響力進(jìn)行表征的合理性,而這種合理性也是引文分析具有可行性的基礎(chǔ)。但是如果所考察的論文均具有相近的被引次數(shù),并且各論文所屬期刊的影響因子等期刊影響力指標(biāo)值也能夠較為接近,那么這些論文具有相似的影響力是否也會(huì)是必然。如果不是,那么是否意味著在利用被引情況對(duì)文獻(xiàn)影響力進(jìn)行描述的基礎(chǔ)上還存在著其它的論文影響力評(píng)價(jià)指標(biāo),畢竟從直觀上綜述性論文與一般的研究論文在滿足被引情況與所屬期刊影響力較為相近的情況下,兩類論文的影響力是否也能夠較為相近至少并不顯然。其次,論文的被引情況與影響力之間的高度正相關(guān)也意味著在統(tǒng)計(jì)意義上前者對(duì)論文影響力的變化行為能夠進(jìn)行相當(dāng)部分的解釋。另外,作者在其研究過程中往往并非是將其所閱讀或者是所使用過的文獻(xiàn)全部列入到論文的參考文獻(xiàn)當(dāng)中,那么可以假設(shè)在所有可能被引用的文獻(xiàn)當(dāng)中最終被作者引用的文獻(xiàn)應(yīng)當(dāng)具有某種最優(yōu)性,然而對(duì)于在研究過程中使用但是未獲得最終引用的文獻(xiàn)的影響力應(yīng)該如何來描述,或者說未被引用的文獻(xiàn)的學(xué)術(shù)影響力并沒有完全反映到該類文獻(xiàn)的被引次數(shù)當(dāng)中。因此,對(duì)于文獻(xiàn)被使用但未被引用的情況在目前較難獲取的情況下,能否考慮將文獻(xiàn)的下載次數(shù)作為對(duì)文獻(xiàn)影響力的側(cè)面表征。畢竟從直觀上論文的下載次數(shù)能夠與該論文的被使用情況或者是受利用的程度相對(duì)應(yīng),從而與文獻(xiàn)的被引情況等一起納入到指標(biāo)體系中用以對(duì)論文的影響力進(jìn)行描述。當(dāng)然,前提是要以文獻(xiàn)資源的數(shù)字化以及網(wǎng)絡(luò)環(huán)境作為基礎(chǔ),并且論文的下載數(shù)據(jù)也能夠獲取。將論文的下載次數(shù)作為對(duì)論文的質(zhì)量以及影響力的評(píng)價(jià)指標(biāo)已有研究,已有的研究還包括對(duì)期刊、論文的下載指標(biāo)與被引指標(biāo)的關(guān)系,特別是兩者的不一致性所進(jìn)行的考察等。[3-4]

1.2 差異性考察

下載情況與被引情況具有同一性的基礎(chǔ),兩種類型指標(biāo)均是對(duì)描述對(duì)象的內(nèi)在價(jià)值的側(cè)面反映,已有的研究對(duì)論文或是期刊的被引情況與下載情況之間的差異進(jìn)行了考察,如在考察年度被下載以及被引用的論文的年代分布,下載次數(shù)與被引次數(shù)以及有關(guān)復(fù)合指標(biāo)在期刊中的分布狀況,期刊或者論文按照被引次數(shù)與下載次數(shù)以及有關(guān)復(fù)合指標(biāo)等的排序相關(guān)性。[4]仍將CNKI的鏡像站版作為數(shù)據(jù)來源,并以圖書情報(bào)類的期刊論文為例,假設(shè)圖書情報(bào)類文獻(xiàn)的最大引文年限為3年。由于從直觀上,在最大引文年限之后文獻(xiàn)的受利用程度會(huì)隨著時(shí)間呈現(xiàn)下降的趨勢(shì),那么不嚴(yán)格地,如果選取考察時(shí)長(zhǎng)為5年,則該時(shí)段能夠大致反映文獻(xiàn)被引情況的主要部分,從而對(duì)該文獻(xiàn)的受利用程度進(jìn)行基本的表征,或者說認(rèn)為該時(shí)段足夠長(zhǎng)以至于近似體現(xiàn)論文被引情況的統(tǒng)計(jì)性質(zhì),再考慮文獻(xiàn)的下載情況作為對(duì)文獻(xiàn)影響力的側(cè)面反映,與被引情況相比往往會(huì)具有較短的延時(shí)性,而且從直觀上論文的下載情況隨時(shí)間的衰減速率也會(huì)相對(duì)較高,[4]所以仍然選取上述的考察時(shí)長(zhǎng)來近似體現(xiàn)論文下載情況的統(tǒng)計(jì)性質(zhì)。由此選取2004年與2005年6月份出版的圖書情報(bào)類期刊論文作為考察對(duì)象,同時(shí)需要指出,由于選取的考察時(shí)長(zhǎng)是建立在能夠?qū)ξ墨I(xiàn)的被引情況以及下載情況進(jìn)行近似表征的假設(shè)基礎(chǔ)上,所以在這里忽略由起始考察時(shí)間的不同所帶來的文獻(xiàn)考察時(shí)段的差異,以近似滿足所得原始數(shù)據(jù)之間的可比性要求。

對(duì)于所選取的論文樣本集,由于在上述考察時(shí)段內(nèi)每篇論文均具有與其對(duì)應(yīng)的被引總量與下載總量,所以能夠得到這兩個(gè)指標(biāo)的隨機(jī)樣本對(duì)。將這些論文的被引總量與下載總量分別由小到大進(jìn)行排序,根據(jù)依次得到的各個(gè)指標(biāo)值的等級(jí),能夠給出論文的被引總量與下載總量之間的等級(jí)相關(guān)系數(shù)為0.7011,其中當(dāng)指標(biāo)值相同時(shí)取相應(yīng)的指標(biāo)值等級(jí)為其平均等級(jí),同時(shí)從總體上假設(shè)檢驗(yàn)的結(jié)果為在0.05水平下論文的下載總量與被引總量之間存在等級(jí)相關(guān)關(guān)系,同樣地可以得到論文的年均被引次數(shù)與其年均下載次數(shù)之間的等級(jí)相關(guān)系數(shù)為0.7008,并且在0.05水平下論文的年均被引量與年均下載量之間也存在等級(jí)相關(guān)關(guān)系。進(jìn)一步地,將論文的年均被引量與年均下載量分別除以相同發(fā)表年度的論文的年均被引量與年均下載量的算術(shù)平均值,則可以得到論文的相對(duì)年均被引量以及相對(duì)年均下載量,那么類似地可以得到該兩相對(duì)量之間的等級(jí)相關(guān)系數(shù)為0.7058,而且在0.05水平下論文的相對(duì)年均被引量與相對(duì)年均下載量之間同樣存在等級(jí)相關(guān)關(guān)系。這些從直觀上反映了論文的下載情況與被引情況之間所具有的同一性,同時(shí)也能夠注意到兩者等級(jí)相關(guān)的密切程度均接近于一般意義下的強(qiáng)相關(guān)范圍,其中數(shù)據(jù)統(tǒng)計(jì)的時(shí)間為2011年10月。

圖1 論文指標(biāo)的累積量與論文累積量之間的關(guān)系圖

另外,將論文分別按照被引次數(shù)以及下載次數(shù)進(jìn)行降序排列,則能夠得到論文的被引次數(shù)累積量以及下載次數(shù)累積量與論文累積數(shù)之間的關(guān)系如圖1所示,其中n為論文的累積數(shù),縱軸為論文被引量或是下載量的單位的倍數(shù),在這里單位分別取為6次以及100次,單位的選取是任意的,目的只是為了能夠?qū)⑦@兩個(gè)指標(biāo)的變化情況納入圖中,兩曲線的相對(duì)位置并不絕對(duì)。從直觀上被引次數(shù)與下載次數(shù)在論文中均具有布拉德福分布的特征,假設(shè)取分區(qū)數(shù)為3,對(duì)于論文的被引次數(shù)可以取其核心區(qū)的論文數(shù)為190篇,各分區(qū)的累積被引次數(shù)的平均值為5795,標(biāo)準(zhǔn)差僅約為4,同時(shí)各論文分區(qū)的論文數(shù)相繼比的平均值為3.049,標(biāo)準(zhǔn)差為0.866,如果不嚴(yán)格地,則認(rèn)為論文被引次數(shù)的分布近似滿足布拉德福分布的分區(qū)描述。同樣對(duì)于論文的下載次數(shù),其核心區(qū)論文數(shù)為318篇,各論文分區(qū)的論文數(shù)相繼比的平均值為2.610,標(biāo)準(zhǔn)差僅為0.485,與被引次數(shù)相比,這也是下載次數(shù)在論文中的分布更為分散的側(cè)面反映。由于在末尾分區(qū)處格魯斯下垂的出現(xiàn),那么大量的論文具有相對(duì)較低的指標(biāo)值,從而使得論文數(shù)相繼比會(huì)在末尾分區(qū)處出現(xiàn)異常,而由于下載次數(shù)的分布相對(duì)較為分散,所以與被引次數(shù)相比能夠在一定程度上減弱末尾相繼比偏高的狀況,從而相繼比的標(biāo)準(zhǔn)差也會(huì)相對(duì)較低。在圖1中看出在論文累積數(shù)的末端,對(duì)于下載次數(shù)與被引次數(shù),格魯斯下垂都能夠有所顯現(xiàn),所以在靠后的分區(qū)處均會(huì)出現(xiàn)相繼比的異常,例如取分區(qū)數(shù)等于5,對(duì)于下載次數(shù)與被引次數(shù)分別有各分區(qū)的論文數(shù)的相繼比為1.909,1.625,1.670,2.989以及1.878,1.536,1.546,2.508。同時(shí),被引次數(shù)在論文樣本中的分布也能夠與布魯克斯公式相一致,其核心區(qū)以及非核心區(qū)的擬合方程分別為c=120.03n0.7477與c=4937.7Lnn-20340,判定系數(shù)分別為0.9976以及0.9939,類似地對(duì)于下載次數(shù)在論文中的分布可以得到其擬合方程為d=1567.9n0.7222與d=93582Lnn-452058,判定系數(shù)分別達(dá)到0.9992以及0.9961。從直觀上下載次數(shù)與被引次數(shù)在論文樣本中均具有布拉德福分布的特征,能夠注意到與下載次數(shù)的分布相比,在分區(qū)數(shù)相同的情況下被引次數(shù)具有相對(duì)較少的核心區(qū)論文數(shù),從而在一定程度上反映了下載次數(shù)在論文中的分布可能會(huì)更為分散。

圖2中考察論文指標(biāo)累積值的相對(duì)量,此時(shí)兩指標(biāo)曲線能夠進(jìn)行相互比較,其中橫軸為論文數(shù)的累積比重,縱軸為論文下載次數(shù)與論文被引次數(shù)的累積比重。當(dāng)論文累積百分比由坐標(biāo)原點(diǎn)變化至點(diǎn)A時(shí),下載累積比重均位于被引累積比重的下方,說明在該范圍內(nèi)對(duì)應(yīng)于相同的論文累積比重,被引累積百分比會(huì)相對(duì)較高,從而被引次數(shù)在論文中的分布也會(huì)相對(duì)較為集中。而在點(diǎn)A至點(diǎn)(1,1)的范圍內(nèi)下載曲線位于被引曲線的上方,反映了與下載次數(shù)相比被引次數(shù)更多的集中于排序相對(duì)靠前的論文,而且在該范圍內(nèi)兩曲線之間的相對(duì)位置也是由于兩曲線段具有相同的端點(diǎn) (0,0)與 (1,1)的緣故。

圖2 論文指標(biāo)的累積比重與論文累積比重之間的關(guān)系圖

圖1與圖2是以圖書情報(bào)類的期刊論文作為考察對(duì)象,需要改變學(xué)科的屬性以及時(shí)間范圍以對(duì)所得認(rèn)識(shí)的一般性進(jìn)行檢驗(yàn)。在上述對(duì)論文下載次數(shù)進(jìn)行考察的基礎(chǔ)上,采用在文獻(xiàn)[6]中所建立的論文學(xué)術(shù)影響力評(píng)價(jià)指標(biāo)體系,選取論文影響力的描述指標(biāo)分別為論文截至數(shù)據(jù)統(tǒng)計(jì)時(shí)間的被引總量,論文的年均被引量,論文在發(fā)表后三年中的被引總量,論文在發(fā)表后的最大年度被引次數(shù),論文所屬期刊的影響因子,論文的相對(duì)年均被引量,論文所屬期刊的相對(duì)影響因子;論文在發(fā)表后三年中的相對(duì)被引總量,論文截至數(shù)據(jù)統(tǒng)計(jì)時(shí)間的下載總量,論文的年均下載量,以及論文的相對(duì)年均下載量,其中相對(duì)指標(biāo)的取值是采用絕對(duì)指標(biāo)值與對(duì)應(yīng)絕對(duì)指標(biāo)的算術(shù)平均值相除來得到。

2 論文影響力的描述

仍然采用上述的論文樣本,由于從直觀上所選取的考察時(shí)長(zhǎng)能夠?qū)φ撐牡谋灰闆r與下載情況的主要部分進(jìn)行基本的反映,所以將論文從其發(fā)表到統(tǒng)計(jì)時(shí)間之內(nèi)的被引次數(shù)與下載次數(shù)作為對(duì)論文被引總量與下載總量的大致表征,而且發(fā)表后三年中的論文的被引及下載情況也包含在考察時(shí)段內(nèi)。考察論文的最大年度被引次數(shù)時(shí)需要確定論文的考察時(shí)長(zhǎng),在這里采用論文所屬研究領(lǐng)域的期刊的被引半衰期作為衡量的指標(biāo),其假設(shè)是認(rèn)為在被引半衰期之后論文的被使用次數(shù)會(huì)相對(duì)較少。如果將2011年圖書情報(bào)領(lǐng)域期刊的被引半衰期的平均值取為5年,那么意味著期刊在5年前發(fā)表的文獻(xiàn)在考察年度會(huì)相對(duì)較少的被引用,或者該領(lǐng)域文獻(xiàn)的最大被引年度在通常情況下應(yīng)當(dāng)包含于5年內(nèi),所以仍然選取考察時(shí)間為2011年10月,同時(shí)論文的發(fā)表年度取為2004年與2005年,相應(yīng)地取該6-7年內(nèi)的最大引用年度的被引次數(shù)來近似表征論文自發(fā)表后的最大年度被引次數(shù)。另外,期刊的被引半衰期會(huì)隨時(shí)間發(fā)生變化,由于圖書情報(bào)領(lǐng)域的發(fā)展,所以該領(lǐng)域期刊被引半衰期的逐年增長(zhǎng),但是從直觀上由于是對(duì)期刊的整體反映從而隨時(shí)間具有其相對(duì)的慣性,所以被引半衰期的增長(zhǎng)往往沒有年份增加的速率快,那么對(duì)于所選取的2004年與2005年的文獻(xiàn),在通常情況下,如果將考察時(shí)段進(jìn)行延長(zhǎng),則論文樣本的發(fā)表時(shí)間仍然沒有包含在相應(yīng)考察年度的被引半衰期內(nèi),這也意味著在延后的考察年度中所選取的論文樣本依然會(huì)相對(duì)較少被引用。所以盡管被引半衰期會(huì)有所增加,但是這并不影響將考察時(shí)間取為上述的2011年。進(jìn)一步地,在所得數(shù)據(jù)的基礎(chǔ)上對(duì)論文影響力的描述指標(biāo)進(jìn)行主成分分析,由此對(duì)各指標(biāo)的權(quán)重進(jìn)行確定并對(duì)論文的影響力進(jìn)行描述,同時(shí)根據(jù)影響力的描述值也可以對(duì)上述描述指標(biāo)的全面性進(jìn)行考察。

在指標(biāo)的相關(guān)系數(shù)矩陣中,可以看出期刊的影響因子與期刊的相對(duì)影響因子之間的顯著相關(guān),并且這兩個(gè)指標(biāo)與其余指標(biāo)之間的相關(guān)系數(shù)的變化范圍為0.376至0.396,其余指標(biāo)之間的相關(guān)系數(shù)的最小值為0.566,那么從直觀上僅由指標(biāo)間的相關(guān)系數(shù)出發(fā),可能需要提取兩個(gè)主成分來替代已有的描述指標(biāo),分別對(duì)期刊類與論文類指標(biāo)進(jìn)行反映,前者包括期刊的影響因子以及期刊的相對(duì)影響因子,后者則與其余的指標(biāo)相對(duì)應(yīng),由此主成分的結(jié)構(gòu)關(guān)系以及各指標(biāo)的歸類情況均能夠與已有研究較為吻合。[1]另外,期刊類或論文類指標(biāo)相互之間的顯著相關(guān)性也是在這里進(jìn)行主成分分析的原因。

在總方差解釋表中,由于前兩個(gè)主成分所對(duì)應(yīng)的相關(guān)系數(shù)矩陣的特征值均大于1,分別為7.827與1.598,并且這兩個(gè)主成分所對(duì)應(yīng)的方差累積百分比達(dá)到了85.682%。如果只考慮這兩個(gè)主成分,那么利用成分矩陣中各指標(biāo)與這兩個(gè)主成分之間的簡(jiǎn)單相關(guān)系數(shù)可得各指標(biāo)的公因子方差分別為0.961,0.963,0.912,0.904,0.864,0.962,0.864,0.910,0.700,0.680,0.704,此時(shí)公因子方差的平均值為0.857且標(biāo)準(zhǔn)差僅為0.110,由此提取這兩個(gè)主成分。由于論文下載類指標(biāo)的公因子方差均相對(duì)較小,所以只選取這兩個(gè)主成分時(shí)對(duì)于論文的下載情況的反映可能會(huì)有其不足。在成分矩陣中,論文類指標(biāo)與第一主成分之間的簡(jiǎn)單相關(guān)系數(shù)均相對(duì)較高,變化范圍為0.801至0.956,與第二主成分的相關(guān)系數(shù)的絕對(duì)值均在0.253以下,期刊類指標(biāo)則與第二主成分高度正相關(guān),相關(guān)系數(shù)均為0.760,與第一主成分的相關(guān)系數(shù)均為0.536。由此各指標(biāo)均能按照所提取的兩個(gè)主成分進(jìn)行大致的歸類,主成分的結(jié)構(gòu)與僅從指標(biāo)間相關(guān)系數(shù)出發(fā)得到的認(rèn)識(shí)也相一致。

由這兩個(gè)主成分所對(duì)應(yīng)的矩陣特征值以及在成分矩陣中各指標(biāo)與所提取的主成分之間的相關(guān)系數(shù)可得這兩個(gè)主成分F1與F2的表達(dá)式,分別為F1=0.341z1+0.342z2+0.329z3+0.331z4+0.192z5+0.341z6+0.192z7+0.329z8+0.290z9+0.286z10+0.291z11;F2=-0.177z1-0.176z2-0.199z3-0.170z4+0.601z5-0.177z6+0.601z7-0.200z8+0.160z9+0.156z10+0.161z11,其中zi為Z標(biāo)準(zhǔn)化后的指標(biāo)值,進(jìn)而有論文影響力的得分表達(dá)式為w=0.253z1+0.254z2+0.240z3+0.246z4+0.261z5+0.253z6+0.261z7+0.239z8+0.268z9+0.264z10+0.269z11。

按照該得分表達(dá)式以及指標(biāo)在標(biāo)準(zhǔn)化后的取值能夠得到論文樣本的影響力分值,將論文按照其對(duì)應(yīng)分值進(jìn)行降序排列,則能夠得到論文的累積分值與論文的累積量之間的關(guān)系,從而對(duì)論文分值在論文中的分布狀況進(jìn)行反映。如果不考慮論文的下載總量與論文的年均下載量以及論文的相對(duì)年均下載量來進(jìn)行類似的考察,以前8項(xiàng)指標(biāo)的原始數(shù)據(jù)經(jīng)過標(biāo)準(zhǔn)化后進(jìn)行主成分分析時(shí),所得到的指標(biāo)間的相關(guān)系數(shù)矩陣并不是正定矩陣,從矩陣元素來看,究其原因是由于在所統(tǒng)計(jì)的數(shù)據(jù)的基礎(chǔ)上,部分指標(biāo)之間具有偏高的相關(guān)系數(shù),去除后3項(xiàng)指標(biāo)更增加了矩陣中這些指標(biāo)對(duì)應(yīng)列之間的一致性,從而使得指標(biāo)的相關(guān)系數(shù)矩陣能夠近似為不滿秩,由此導(dǎo)致了該矩陣的非正定。當(dāng)然這并不意味著這部分指標(biāo)之間的絕對(duì)重疊,出現(xiàn)這種情況僅僅是針對(duì)這里的原始數(shù)據(jù)而言,另外所選取的論文樣本數(shù)為3179,也超過了一般情況下所要求的指標(biāo)數(shù)量的5倍。因此可以去除部分相關(guān)程度較高的指標(biāo)使得矩陣為正定,而且去除部分相對(duì)系數(shù)較高的指標(biāo),也能夠在一定程度上避免對(duì)論文影響力的反映的不足。

由剩余的7項(xiàng)指標(biāo)重新進(jìn)行考察,類似地可以得到期刊的影響因子與期刊的相對(duì)影響因子與其余指標(biāo)之間的相關(guān)系數(shù)為0.383至0.391,而這兩個(gè)指標(biāo)之間仍然呈顯著相關(guān),其余指標(biāo)之間的相關(guān)系數(shù)的最小值為0.922。所以按照相關(guān)系數(shù)可能仍然需要提取兩個(gè)主成分分別與期刊類指標(biāo)與論文類指標(biāo)相對(duì)應(yīng),在總方差解釋表中,前兩個(gè)主成分所對(duì)應(yīng)的特征值分別為5.257與1.539,相應(yīng)的方差累積百分比為97.092%,同時(shí)這7個(gè)指標(biāo)的公因子方差分別為0.969,0.970,0.963,0.931,0.999,0.999,0.963,公因子方差的平均值為0.971,標(biāo)準(zhǔn)差僅為0.024。所以提取這兩個(gè)主成分,在成分矩陣中所有的論文類指標(biāo)與第一個(gè)主成分的相關(guān)系數(shù)在0.947至0.965之間進(jìn)行變化,與第二個(gè)主成分之間的相關(guān)系數(shù)的絕對(duì)值則相對(duì)較低,且均在0.202以下,而且兩個(gè)期刊類指標(biāo)與這兩個(gè)主成分的相關(guān)系數(shù)分別均為0.571以及0.821,由此按照成分矩陣各指標(biāo)均能夠進(jìn)行大致的歸類。進(jìn)一步地,由主成分所對(duì)應(yīng)的特征值以及成分矩陣中的相關(guān)系數(shù)可以得到兩個(gè)主成分F3與F4以及論文影響力的得分表達(dá)式,分別為F3=0.421z1+0.421z2+0.419z3+0.413z4+0.249z5+0.249z7+0.419z8;F4=-0.157z1-0.157z2-0.163z3-0.148z4+0.662z5+0.662z7-0.162z8,以及w1=0.290z1+0.290z2+0.287z3+0.286z4+0.342z5+0.342z7+0.287z8。

根據(jù)論文影響力的得分表達(dá)式以及標(biāo)準(zhǔn)化后的數(shù)據(jù)能夠得到每篇論文的影響力描述并得到各論文影響力分值排序的變化情況,如圖3所示。

圖3 論文影響力分值排序的變化情況

將論文按照其w1值進(jìn)行降序排列,能夠得到每篇論文的排序值r1,同時(shí)每篇論文有與其對(duì)應(yīng)的w分值以及相應(yīng)的排序值r,由此可得每篇論文的排序變化為r1-r。在圖3中,橫軸為論文影響力排序值r1的各個(gè)取值區(qū)間,縱軸為對(duì)應(yīng)區(qū)間中論文排序變化的平均值,從整體上能夠注意到排序相對(duì)靠后的論文的影響力會(huì)有所提升,相應(yīng)地則有排序靠前的論文的影響力平均值的下降,從而反映了論文的下載情況對(duì)于論文得分的影響,而這種影響則來源于網(wǎng)絡(luò)及數(shù)字環(huán)境所帶來的論文獲取的便捷性。

3 結(jié)束語

進(jìn)一步地,還可以考察論文影響力的累積分值與論文的累積數(shù)量之間的關(guān)系,如采用兩者的相對(duì)量來反映論文的影響力分值在論文中的集中或是分散程度。由于在經(jīng)過指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化后,部分論文的影響力分值會(huì)取為負(fù)值,所以可以考慮將各論文的分值分別加上常數(shù)以求分值的累積和。需要指出的是,盡管加上常數(shù)不會(huì)改變影響力分值所服從的分布,但是會(huì)影響影響力分值在論文中的集中或是分散的程度,由此需要對(duì)兩種論文分值所加上的常數(shù)分別進(jìn)行選取,使得所加常數(shù)對(duì)于兩種分值在論文中的分布情況的影響盡可能相等,從而能夠在此基礎(chǔ)上對(duì)所得到的兩種分值累積量進(jìn)行比較,或者可以考慮對(duì)指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化方法進(jìn)行調(diào)整,從而使得最終的論文影響力分值為正,由此對(duì)論文的得分情況進(jìn)行進(jìn)一步的考察。

[1]鐘文一,陳云鵬.基于引證系數(shù)的論文影響力評(píng)價(jià)方法研究 [J]. 情報(bào)科學(xué),2011,29(5):706-712.

[2]郭紅,潘云濤.影響因子分?jǐn)?shù)平均值:一個(gè)評(píng)價(jià)學(xué)術(shù)論文質(zhì)量的新指標(biāo)[J].編輯學(xué)報(bào),2006,18(6):475-477.

[3]張玉華,等.科技論文評(píng)估方法研究[J].編輯學(xué)報(bào),2004,16(4):243-244.

[4]萬錦堃,等.期刊論文被引用及其Web全文下載的文獻(xiàn)計(jì)量分析[J].現(xiàn)代圖書情報(bào)技術(shù),2005(4):58-62.

猜你喜歡
分值影響力次數(shù)
一起來看看交通違法記分分值有什么變化
機(jī)場(chǎng)航站樓年雷擊次數(shù)計(jì)算
2020年,我國(guó)汽車召回次數(shù)同比減少10.8%,召回?cái)?shù)量同比增長(zhǎng)3.9%
商用汽車(2021年4期)2021-10-13 07:16:02
一類無界算子的二次數(shù)值域和譜
天才影響力
NBA特刊(2018年14期)2018-08-13 08:51:40
黃艷:最深遠(yuǎn)的影響力
依據(jù)“次數(shù)”求概率
3.15消協(xié)三十年十大影響力事件
傳媒不可估量的影響力
人間(2015年21期)2015-03-11 15:24:39
宿遷城鎮(zhèn)居民醫(yī)保按病種分值結(jié)算初探
新巴尔虎左旗| 安仁县| 浙江省| 韩城市| 罗田县| 刚察县| 赤壁市| 舟曲县| 上虞市| 蓬安县| 玉门市| 靖州| 正蓝旗| 张家界市| 洱源县| 越西县| 米泉市| 庄浪县| 马关县| 冕宁县| 梅州市| 普洱| 宜宾市| 颍上县| 叶城县| 新野县| 东乌珠穆沁旗| 库尔勒市| 乌拉特中旗| 安多县| 涿鹿县| 上犹县| 托里县| 宜春市| 定日县| 通州区| 休宁县| 蓬莱市| 德格县| 株洲县| 德兴市|