国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于引用時(shí)間視角的高被引論文內(nèi)外部特征與其被引量的關(guān)系研究

2021-12-21 11:01:19許林玉楊建林
現(xiàn)代情報(bào) 2021年12期
關(guān)鍵詞:內(nèi)外部方差論文

許林玉 楊建林

DOI.10.3969/j.issn.1008-0821.2021.12.013

[中圖分類號]G250.252 [文獻(xiàn)標(biāo)識碼]A [文章編號]1008-0821(2021)12-0131-13

學(xué)術(shù)界普遍認(rèn)為高被引論文的質(zhì)量較高,對領(lǐng)域知識具有重要的貢獻(xiàn)作用。自2018年以來,中共中央辦公廳、國務(wù)院辦公廳等機(jī)構(gòu)先后印發(fā)了關(guān)于深化項(xiàng)目評審、人才評價(jià)、機(jī)構(gòu)評估等措施及指導(dǎo)意見,其中反復(fù)提到科研領(lǐng)域要關(guān)注“標(biāo)志性、代表性成果”。在這樣的背景下,探索學(xué)科領(lǐng)域高活躍度和高影響力的高被引論文將會是國內(nèi)學(xué)術(shù)界持續(xù)關(guān)注的研究對象。

誠如喬納森所言,“承認(rèn)是科學(xué)王國的基本通貨”,引用行為是學(xué)術(shù)成果被承認(rèn)的體現(xiàn)。在規(guī)范引用前提下,排除負(fù)面或不正當(dāng)?shù)纫眯袨?,學(xué)術(shù)論文的被引頻次越高,代表其科學(xué)影響力越高,其對科學(xué)進(jìn)步、領(lǐng)域知識的貢獻(xiàn)就越大。因此,基于被引頻次的評價(jià)成為學(xué)術(shù)論文影響力最具代表性、最簡單的評價(jià)方式。

為促進(jìn)更多的高被引論文產(chǎn)出,學(xué)界對高被引論文的特征及產(chǎn)出規(guī)律進(jìn)行了研究,研究成果主要集中于此類論文的作者、期刊及機(jī)構(gòu)等屬性的分布特征以及高被引論文的引文模式,部分研究成果被用于科學(xué)評價(jià)與研究熱點(diǎn)預(yù)測。高被引論文具有較長的統(tǒng)計(jì)時(shí)間窗口,體現(xiàn)了被引頻次的累積過程。學(xué)者們提出的“睡美人”“白天鵝”“黑天鵝”等引文模式,揭示了部分高被引論文的引文累積在確定的時(shí)間窗口內(nèi)隨時(shí)間變化的規(guī)律。盡管學(xué)界對高被引論文的特征進(jìn)行了研究,但是沒有進(jìn)一步揭示這些特征對引文累積過程發(fā)揮影響時(shí)所具有的規(guī)律性,而細(xì)化的研究結(jié)果對高被引論文的預(yù)測更具有參考價(jià)值。

1相關(guān)研究

學(xué)界多從論文自身和外部指標(biāo)來探討論文被引頻次的影響因素,本文參考前人研究將高被引論文的特征分為內(nèi)部特征和外部特征:內(nèi)部特征主要包括標(biāo)題、摘要、關(guān)鍵詞、基金資助、合作規(guī)模(作者、國家)、參考文獻(xiàn)、文章長度等指標(biāo);外部特征主要涉及刊載期刊、作者聲譽(yù)及數(shù)據(jù)庫平臺等因素,如發(fā)表期刊質(zhì)量、開放獲取等指標(biāo)。

1.1內(nèi)部特征研究

Aksnes D W研究發(fā)現(xiàn),與非高被引論文相比,高被引論文具有作者數(shù)量較大、跨國合作等特征;Noorhidawati A等通過觀察馬來西亞的ESI高被引論文,發(fā)現(xiàn)這些論文普遍具有國家資助、隸屬于研究型大學(xué)以及跨國合作等特征;Dorta-Gonzalez P等研究發(fā)現(xiàn),高被引論文具有作者數(shù)量較多、篇幅更長、參考文獻(xiàn)較多、標(biāo)題稍短以及摘要較長等特征;張壘以新聞學(xué)與傳播學(xué)領(lǐng)域的高被引論文為研究對象,發(fā)現(xiàn)時(shí)間累積是論文高被引的必要條件,高被引論文具有作者影響力高、首次被引時(shí)間較快、傾向于引用高影響力論文等特征,參考文獻(xiàn)的數(shù)量、研究內(nèi)容的新穎性與高被引之間并不存在明顯的相關(guān)性;Webster G D等研究發(fā)現(xiàn),高被引論文的參考文獻(xiàn)數(shù)量較多;Liang G等提出知識廣度、知識新近度和學(xué)科是影響高被引論文“起飛”時(shí)間的重要因素;馬榮康等運(yùn)用Finan-cial Times TOP 45商學(xué)院數(shù)據(jù),基于論文被引量探索最佳科研合作規(guī)模,發(fā)現(xiàn)多作者合作的論文成為高被引論文的概率更高;Chen S J等深入探索跨學(xué)科性與高被引論文被引量的關(guān)系,認(rèn)為高被引論文具有較高的學(xué)科多樣性和學(xué)科差異性,學(xué)科平衡性較低;Zhang J等以太陽能領(lǐng)域論文為研究對象,基于論文知識元耦合網(wǎng)絡(luò),發(fā)現(xiàn)科學(xué)關(guān)聯(lián)度較低的論文更有可能被高度引用。

1.2外部特征研究

梁春慧等研究發(fā)現(xiàn),高被引論文更傾向于引用聲望高、影響因子高的期刊論文;Wang M等研究發(fā)現(xiàn),期刊聲譽(yù)和第一作者研究能力是高被引論文最相關(guān)的預(yù)測因子:Dorta-Gonzalez P等研究發(fā)現(xiàn),刊載高被引論文期刊的影響因子較高:Wang F等運(yùn)用APS和Nobel數(shù)據(jù)開展研究,發(fā)現(xiàn)第一作者的科學(xué)影響、潛在領(lǐng)袖的科學(xué)影響力、研究團(tuán)隊(duì)的科學(xué)影響、作者現(xiàn)有論文的相關(guān)性這4個(gè)因素與論文的科學(xué)影響力顯著正相關(guān),其中潛在的領(lǐng)導(dǎo)者因素短期內(nèi)發(fā)揮更重要的作用,研究團(tuán)隊(duì)的科學(xué)影響因素長期發(fā)揮更重要的作用。

近年來,研究者開始越來越關(guān)注補(bǔ)充計(jì)量學(xué)指標(biāo)對被引量的影響,如趙婉忻發(fā)現(xiàn)高被引論文被引量與下載量、學(xué)術(shù)型社交媒體閱讀量等呈顯著正相關(guān);Cho J亦認(rèn)為被引量與閱讀量顯著相關(guān);學(xué)者們還發(fā)現(xiàn)高被引論文的其他一些外部特征,如自引率低、多發(fā)表在科學(xué)出版物的前1/4以及研究基礎(chǔ)較扎實(shí)(從引文網(wǎng)絡(luò)中提?。┑?。此外,Newman M E探討了論文的先動優(yōu)勢,研究表明,如果一篇論文是某領(lǐng)域的首篇論文,無論其內(nèi)容如何,其引用率都將高于其后發(fā)表的其他論文?;仡櫱叭说南嚓P(guān)工作可以發(fā)現(xiàn),現(xiàn)有研究主要探討高被引論文的特征與其長期被引量的相關(guān)性,沒有進(jìn)一步揭示這些特征對引文累積過程發(fā)揮影響時(shí)所具有的規(guī)律性。因此,本文基于引用時(shí)間視角對前人的研究工作進(jìn)行深化,主要將引用時(shí)間細(xì)化為初始被引量、長期被引量、歷年引用量及引文累計(jì)速度等,主要研究內(nèi)容包括:①高被引論文的內(nèi)外部特征與其初始被引量、長期被引量的關(guān)系:②高被引論文的內(nèi)外部特征與歷年被引量的關(guān)系:③高被引論文的內(nèi)外部特征與引文累積速度的關(guān)系。

2研究數(shù)據(jù)與方法

2.1數(shù)據(jù)的采集及預(yù)處理

2.1.1數(shù)據(jù)采集

本文參照科睿唯安官網(wǎng),將高被引論文定義為“在10年內(nèi)發(fā)表且其引用頻次處于該研究領(lǐng)域同一出版年前1%的研究成果”。Web of Seience(WOS)數(shù)據(jù)庫是世界范圍內(nèi)較為核心且權(quán)威的數(shù)據(jù)庫,其認(rèn)定的高被引論文在一定程度上具有權(quán)威性,因此,本文選取該數(shù)據(jù)庫的全學(xué)科高被引論文作為研究對象。為了保障研究數(shù)據(jù)的覆蓋率及充足的引用時(shí)間窗口,本文選擇WOS數(shù)據(jù)庫的2010年高被引論文的題錄數(shù)據(jù)和歷年引文數(shù)據(jù)作為研究數(shù)據(jù)。

數(shù)據(jù)下載流程如下:首先選擇WOS核心合集數(shù)據(jù)庫,在高級檢索框中輸入“PY=2010”(出版年為2010年)的檢索條件進(jìn)行搜索,并將文獻(xiàn)類型選定為“ARTICLE(論文)和PROCEEDINGS PA-PER(會議論文)”,選中“領(lǐng)域中的高被引論文”,并以純文本格式導(dǎo)出文獻(xiàn)題錄的全記錄;在導(dǎo)出題錄數(shù)據(jù)的基礎(chǔ)上導(dǎo)出2010年高被引論文的歷年被引頻次數(shù)據(jù)。其中,題錄主要包括Authors(作者)、Article Title(標(biāo)題)、Source Title(期刊名稱)、Key-words(關(guān)鍵詞)、Abstmct(摘要)、Addresses(地址)以及Funding Orgs(資助機(jī)構(gòu))等字段。檢索時(shí)間為2020年7月27日,一共得到8956篇高被引論文的數(shù)據(jù)。

2.1.2數(shù)據(jù)預(yù)處理

1)數(shù)據(jù)刪除

為了保證下文回歸結(jié)果的準(zhǔn)確性,本文剔除少量缺失“標(biāo)題”“作者”“摘要”“關(guān)鍵詞”及“期刊”等關(guān)鍵信息的數(shù)據(jù),這部分?jǐn)?shù)據(jù)總量相對較小,直接刪除幾乎對整體結(jié)果沒有影響,最終得到8 008條研究數(shù)據(jù)。

2)數(shù)據(jù)匹配

為了探討題錄特征與被引量的關(guān)系,需要對題錄和歷年被引頻次數(shù)據(jù)進(jìn)行識別匹配。本文主要根據(jù)“DOI”字段進(jìn)行匹配,匹配率100%。

3)數(shù)據(jù)清洗

直接獲得的研究數(shù)據(jù)具有一定的瑕疵,因此需要對部分研究變量進(jìn)行處理。本文基于“Addres-ses”字段獲取地址中國家信息,清洗、去重后最終獲得作者國家數(shù)量,作為國家合作規(guī)模指標(biāo)值。WOS數(shù)據(jù)庫的期刊影響因子的更新會滯后1年,本文在填充影響因子字段時(shí),根據(jù)期刊名稱匹配論文出版年前一年所對應(yīng)的WOS平臺“Joumal Cita-tion Reports”公布的期刊影響因子,并填充到相應(yīng)字段。

2.2變量的選取及定義

2.2.1因變量

為了進(jìn)一步探究高被引論文內(nèi)外部特征在引文累積過程發(fā)揮影響所具有的規(guī)律性,本文將被引量細(xì)分為初始被引量、長期被引量、2010—2019年各年份的被引量以及引文累積速度,引文累積速度借鑒Wang J的研究,由累積被引量與引文時(shí)間計(jì)算得來。被引量表征的是論文某個(gè)時(shí)間段引文的總體存量,而引文累積速度衡量論文吸引引文的速度。故而本文的因變量為被引量及其基于引用時(shí)間的衍生變量:引文累積速度。

1)被引量

已有研究顯示,外文文獻(xiàn)從出版到被利用的平均時(shí)間大約是兩年,高被引文獻(xiàn)的被引行為一般從第2年開始,到第30年結(jié)束。如表2所示,本文采集的數(shù)據(jù)也表明很多論文在出版年內(nèi)得到的關(guān)注較少(出版年被引量的眾數(shù)為0,占高被引論文的23.4%)。因此,本文使用論文發(fā)表前兩年總被引頻次來表征初始被引量,使用論文出版年到2019年總被引頻次來表征長期被引量:2010—2019年各年被引量即為各年份的當(dāng)年被引量。

為了了解被引量的數(shù)據(jù)分布情況,本文選取初始被引量和長期被引量構(gòu)建兩變量邊緣箱圖,如圖1所示。圖1的兩變量邊緣箱圖由3部分組成:中間是表征變量關(guān)系的散點(diǎn)圖:頂部為初始被引量分布圖;右部分為長期被引量分布圖。由圖1可看出,初始被引量和長期被引量均表現(xiàn)出明顯的偏態(tài)結(jié)構(gòu),即被引量較少的高被引論文所占比例較大,而被引量較多的論文占比較少,這在很多文獻(xiàn)中都有類似的結(jié)論闡述,歷年被引量亦有此偏態(tài)結(jié)構(gòu)。

2)引文累積速度

論文吸引引文的速度存在差異,有些文獻(xiàn)發(fā)表后快速積聚引文,而后引文積聚緩慢:有些文獻(xiàn)前期被引量較少,后期被引量有較大幅度的上升,如“睡美人”文獻(xiàn)等。為刻畫這種現(xiàn)象,Wang J提出了引文累積速度(Citatuin Speed),其取值范圍為區(qū)間[0,1],值越接近1,引文累積越快;反之,引文累積越慢。

其中,n是指出版年到2019年的總時(shí)長(單位:年);C是文獻(xiàn)發(fā)表第i年的累積引文數(shù)量。

本文計(jì)算2010年高被引論文的引文累積速度并作引文累積速度頻數(shù)頻率分布圖,如圖2所示。圖中橫坐標(biāo)表示引文累計(jì)速度,左邊縱坐標(biāo)表示頻數(shù),右邊縱坐標(biāo)為頻率。由圖2折線圖可看出,高被引論文的引文累積速度值大多集中于區(qū)間[0.3,0.5],占總論文篇數(shù)的80.22%,右上角的累積百分比有著相同的結(jié)論。

2.2.2自變量

本文在前人研究的基礎(chǔ)上,基于高被引論文內(nèi)外部特征選取自變量,其中內(nèi)部特征定義為論文本身的因素,即論文在成文之時(shí)便有的特征,主要包括標(biāo)題長度、作者合作規(guī)模、國家合作規(guī)模、關(guān)鍵詞數(shù)量、摘要長度、基金資助、學(xué)科數(shù)量、參考文獻(xiàn)數(shù)量以及文章篇幅:考慮到指標(biāo)的可量化及可得性,本文將外部特征定義為論文發(fā)表期刊和平臺的特征,主要為期刊質(zhì)量、開放獲取,各變量的選取及定義如表1所示。近些年,論文使用數(shù)據(jù)得到學(xué)者們的關(guān)注,部分文章將論文使用量納入論文外部特征來考察其對被引量的影響。然而,論文的使用量與論文的被引量具有正相關(guān)性,且都是一定時(shí)間窗口內(nèi)的累積量,具有動態(tài)性,因此本文認(rèn)為,使用與論文被引量同一時(shí)間節(jié)點(diǎn)的論文使用量來考察論文使用量對高被引效應(yīng)的影響并不合適。故而本文沒有將論文使用量指標(biāo)加入待考察的外部特征集。

2.3統(tǒng)計(jì)方法及模型

2.3.1模型方法選擇:負(fù)二項(xiàng)回歸

高被引論文的被引量屬于離散數(shù)據(jù),不服從正態(tài)分布。以長期被引量為例,構(gòu)建長期被引量各種數(shù)據(jù)變換下的直方圖與正態(tài)分布曲線,如圖3所示。從圖3可看出,長期被引量的自身(identity)、立方(cubic)、平方(square)等變換不服從正態(tài)分布。該種離散數(shù)據(jù)適用于計(jì)數(shù)模型,常用的回歸方法主要為泊松回歸和負(fù)二項(xiàng)回歸,但是泊松回歸要求“均等分散”,即被解釋變量的期望和方差相等,而由表2可知,本文長期被引量的期望為435.0999,方差為256409.5642(標(biāo)準(zhǔn)差為506.369),其方差明顯大于期望,存在“過度分散”,不適用于泊松回歸模型,故而使用負(fù)二項(xiàng)回歸模型更為合理。本文使用Statal5.1對研究數(shù)據(jù)進(jìn)行負(fù)二項(xiàng)回歸分析。

3結(jié)果

3.1描述性統(tǒng)計(jì)

表2為描述性統(tǒng)計(jì)指標(biāo),可以大體反映高被引論文的特征分布情況:標(biāo)題長度為9的高被引論文篇數(shù)最多:3位作者合作模式更易獲得施引者青睞:關(guān)鍵詞數(shù)量為10的論文篇數(shù)最多:摘要長度高發(fā)區(qū)間為[145,154];大部分高被引論文得到基金資助:學(xué)科數(shù)量中單個(gè)學(xué)科的情況更多:參考文獻(xiàn)數(shù)量的高發(fā)區(qū)間為[32,39];高被引論文頁碼的高發(fā)區(qū)間為[4,12];高被引論文中沒有獲得開放獲取的比例較多等。

3.2回歸結(jié)果分析

3.2.1高被引論文的內(nèi)外部特征與其初始及長期被引量的相關(guān)性

1)以長期被引量為因變量的回歸模型

本文以長期被引量為因變量,以高被引論文內(nèi)外部特征為自變量構(gòu)建負(fù)二項(xiàng)回歸模型,考察高被引論文內(nèi)外部特征對長期被引量的影響,如表3模型(1)。以長期被引量為因變量的回歸模型中,除了作者合作規(guī)模、關(guān)鍵詞數(shù)量、摘要長度、基金資助及文章篇幅等特征變量沒有通過顯著性檢驗(yàn),其余特征指標(biāo)均通過了顯著性檢驗(yàn),其中,國家合作規(guī)模、學(xué)科數(shù)量、參考文獻(xiàn)數(shù)量、期刊質(zhì)量以及開放獲取等特征對長期被引量具有顯著的正向影響:而標(biāo)題長度對長期被引量具有顯著的負(fù)向影響。

可見長期引用過程中,施引者更傾向于精煉的標(biāo)題:國家合作規(guī)模對高被引論文具有顯著的正向影響,這與Noorhidawali A等的研究相一致;雖然有文章認(rèn)為跨學(xué)科研究被認(rèn)為專業(yè)度不足,但是本文結(jié)果及大量文章證明跨學(xué)科對被引量的正向影響作用;參考文獻(xiàn)數(shù)量對長期被引量有顯著的正向影響,參考文獻(xiàn)體現(xiàn)了作者的研究廣度,多參考文獻(xiàn)一方面反映該篇文獻(xiàn)較為扎實(shí)的研究基礎(chǔ),另一方面也為施引者開展該領(lǐng)域的相關(guān)研究提供了向前追溯的便利,故受到施引者的追捧:高影響因子對論文長期被引量具有顯著的正向促進(jìn)作用,由表2可得,期刊影響因子的平均值為9.69693,可見高被引論文大多刊載于高影響因子期刊。在目前同行評議審查體系下,論文發(fā)表于高影響因子期刊表征論文質(zhì)量較高。故而一篇論文的質(zhì)量越高,越能發(fā)表在高水平、有聲望的期刊,擁有更高的可見度和閱讀量。由模型(1)的回歸系數(shù)可得,開放獲取是高被引論文長期被引量最重要的特征,開放獲取使得研究者能夠便捷地下載論文,進(jìn)而從全文中把握該篇論文的研究思路、核心觀點(diǎn)、研究假設(shè)、論述依據(jù)、研究結(jié)論等要素。該結(jié)論與xiaJ等的研究具有一致性,他們指出開放獲取將擴(kuò)大論文的可見性,從而為其創(chuàng)造更多被發(fā)現(xiàn)和引用的可能??梢?,在長期引用過程中,高被引論文內(nèi)外部特征共同影響被引量。其中,內(nèi)部特征,如簡潔的標(biāo)題、多國合作、多學(xué)科數(shù)量、參考文獻(xiàn)數(shù)量多等對高被引論文引用具有積極的促進(jìn)作用:高影響因子期刊及開放獲取等外部特征亦對高被引論文長期被引量具有顯著的正向影響。

2)初始與長期被引量回歸模型結(jié)果對比分析

在以長期被引量為因變量回歸模型的基礎(chǔ)上,本文以初始被引量為因變量構(gòu)建負(fù)二項(xiàng)回歸模型,如表3中模型(2)。由表3中模型(1)和模型(2)對比可得,高被引論文內(nèi)外部特征對初始被引量和長期被引量的影響具有顯著的差異性。初始被引量回歸模型中標(biāo)題長度、作者合作規(guī)模、關(guān)鍵詞數(shù)量、摘要長度等特征沒有通過顯著性檢驗(yàn):而在長期被引量回歸模型中,作者合作規(guī)模、關(guān)鍵詞數(shù)量、摘要長度、基金資助及文章篇幅等特征變量沒有通過顯著性檢驗(yàn),可見基金資助對初始被引量具有顯著的正向影響:文章篇幅對初始被引量具有顯著的負(fù)向影響:標(biāo)題長度對長期被引量具有顯著的負(fù)向影響;國家合作規(guī)模、學(xué)科數(shù)量、參考文獻(xiàn)數(shù)量、期刊影響因子以及開放獲取等特征變量對初始被引量和長期被引量均具有顯著的促進(jìn)作用:基金資助是影響高被引論文初始被引量最核心的特征:而開放獲取是高被引論文長期被引量的核心特征。

負(fù)二項(xiàng)回歸模型的解釋能力主要依靠Log Pseudolikelihood值來體現(xiàn),值越大,負(fù)二項(xiàng)回歸模型的解釋能力越強(qiáng)。由表3可得,在樣本觀測值相同的情況下(obs=8008),模型(2)的解釋能力比模型(1)強(qiáng)很多,且具有更多的特征變量通過了顯著性檢驗(yàn),可見論文內(nèi)外部特征對初始被引量的作用更大,而對長期被引量的影響較小。隨著時(shí)間的增長,論文有了一定的被引量和關(guān)注度,獲得了一定的學(xué)術(shù)影響力,施引者對論文的引用偏好已經(jīng)不局限于論文本身、期刊及平臺等特征,而有其他更重要的因素影響施引者的引用偏好。

3.2.2高被引論文內(nèi)外部特征與歷年被引量的相關(guān)性

為了更深入了解高被引論文內(nèi)外部特征對歷年引文時(shí)間窗口的被引量發(fā)揮影響時(shí)所具有的規(guī)律性,本文構(gòu)建了高被引論文內(nèi)外部特征與歷年被引量的負(fù)二項(xiàng)回歸模型,并將其結(jié)果展現(xiàn)如表4所示。

為了更直觀展現(xiàn)高被引論文內(nèi)外部特征對歷年被引量影響的規(guī)律性,本文在表4的基礎(chǔ)上作高被引論文特征與歷年被引量關(guān)系強(qiáng)弱圖,如圖4所示。圖中各個(gè)節(jié)點(diǎn)處紅色點(diǎn)表征該特征在該引文年份通過顯著性檢驗(yàn),黑色點(diǎn)表明未通過顯著性檢驗(yàn),由圖4可看出,大部分特征變量都呈下降趨勢,可見論文本身及平臺特征變量對后期被引量的影響在逐漸減弱,這與上文結(jié)論一致。對被引量影響較大的特征變量是開放獲取、學(xué)科數(shù)量、基金資助、國家合作規(guī)模以及影響因子,其余特征變量折線在0值附近波動,對被引量影響較小,且規(guī)律性不明顯,故而本文不做詳細(xì)闡述。對被引量影響較大的特征變量中,影響因子和國家合作規(guī)模對各個(gè)引文時(shí)間窗口下的被引量始終具有正向的影響,且其影響較為穩(wěn)定:學(xué)科數(shù)量除了對出版年被引量的影響沒有通過顯著性檢驗(yàn),其余年份均對被引量具有顯著的正向影響,且其影響逐年遞增,可見施引者越來越青睞于跨學(xué)科的論文;基金資助特征對初期被引量始終具有顯著的正向影響,且影響較大:但其對被引量的影響一直下降,在引文后期變?yōu)轱@著的負(fù)向影響:開放獲取特征對被引量的影響呈現(xiàn)先下降后上升的“U型”規(guī)律,雖然該特征對被引量的影響總體數(shù)值有些許的下降,但始終是影響歷年被引量最核心的特征變量。這可能因?yàn)檎撐陌l(fā)表初期,基金資助、開放獲取及高影響因子期刊等特征是論文較大的“標(biāo)簽”,這些“標(biāo)簽”極大地增加了論文的可見性,而在論文發(fā)表后期,論文憑借自身的高質(zhì)量有了一定的引文量,獲得一定的學(xué)術(shù)影響力,這些標(biāo)簽的影響力就慢慢減弱,故而基金資助、影響因子對被引量的影響處于下降態(tài)勢:而開放獲取決定論文的可獲得性,只有論文可獲取才可能被引用,故而開放獲取對被引量始終具有重要的影響。

3.2.3高被引論文的內(nèi)外部特征與引文累積速度的相關(guān)性

本文采用多元線性回歸方法探究高被引論文內(nèi)外部特征與引文累積速度的關(guān)系,該方法的有效性建立在變量無異方差及無多重共線性的基礎(chǔ)上,因而需要對變量進(jìn)行異方差與多重共線性的檢驗(yàn)。

1)異方差檢驗(yàn)

殘差圖和懷特檢驗(yàn)(White Test)通常被用來檢驗(yàn)數(shù)據(jù)是否存在異方差。殘差在數(shù)理統(tǒng)計(jì)中指實(shí)際值與估計(jì)值(擬合值)之間的差值,通過構(gòu)建殘差(Fitted Values)與擬合值(Residuals)的散點(diǎn)圖可以了解殘差與因變量擬合值的變化情況,如圖5所示,若殘差隨著擬合值的變化而變化,則認(rèn)為存在異方差:若殘差固定在某個(gè)值上下波動,則認(rèn)為不存在異方差。由圖5可看出,殘差隨著擬合值的波動較為劇烈,故而可直觀判定數(shù)據(jù)存在異方差。

在殘差圖的基礎(chǔ)上,本文通過懷特檢驗(yàn)的方法進(jìn)一步檢驗(yàn)變量是否存在異方差,懷特檢驗(yàn)的原假設(shè)為:變量為同方差。引文累積速度進(jìn)行懷特檢驗(yàn)的結(jié)果P值為0.0000(P=0.0000),該結(jié)論非常顯著地拒絕了同方差的原假設(shè),可判定數(shù)據(jù)存在異方差,故而下文應(yīng)采取穩(wěn)健的標(biāo)準(zhǔn)差對數(shù)據(jù)進(jìn)行多元線性回歸以消除異方差的影響。

2)多重共線性的檢驗(yàn)

統(tǒng)計(jì)學(xué)中多用方差膨脹因子(VIF)來檢驗(yàn)變量之間是否存在多重共線性。方差膨脹因子通常以10作為判斷邊界,當(dāng)VIF<10,認(rèn)為不存在多重共線性;VIF>10,存在多重共線性。本文對該回歸模型進(jìn)行多重共線性檢驗(yàn),得出回歸模型的平均VIF(Mean VIF=1.28)值為1.28,遠(yuǎn)遠(yuǎn)小于合理值10,故而認(rèn)為該回歸模型不存在多重共線性問題。

3)以引文累積速度為因變量的多元線性回歸模型及結(jié)果分析

上文已證明變量存在異方差,因而本文采用穩(wěn)健的標(biāo)準(zhǔn)差對高被引論文內(nèi)外部特征與引文累積速度進(jìn)行多元線性回歸,以克服異方差的影響,回歸結(jié)果如表5所示。

引文累積速度反映研究成果在科學(xué)界傳播的速度,引文累積速度越快,其在科學(xué)界傳播速度越快。由表5回歸結(jié)果可得,除了關(guān)鍵詞數(shù)量和摘要長度,其余特征變量均對引文累積速度具有顯著的影響,其中標(biāo)題長度、作者合作規(guī)模、國家合作規(guī)模、基金資助、參考文獻(xiàn)數(shù)量、影響因子及開放獲取等特征對引文累積速度具有顯著的正向影響:而學(xué)科數(shù)量和文章篇幅對引文累積速度具有顯著的負(fù)向影響。其中,長標(biāo)題、跨國合作、基金資助、高影響因子期刊、開放獲取等特征變量對引文累積速度具有較大的促進(jìn)作用。

4研究結(jié)論

本文以高被引論文為研究對象,運(yùn)用WOS數(shù)據(jù)庫的2010年高被引論文題錄及歷年引文數(shù)據(jù),在對被引量進(jìn)行過度分散檢驗(yàn)的基礎(chǔ)上,選擇負(fù)二項(xiàng)回歸及多元線性回歸方法探究高被引論文內(nèi)外部特征與被引量的關(guān)系,研究結(jié)果表明:

1)高被引論文內(nèi)外部特征共同影響被引量。多國合作、多學(xué)科數(shù)量、參考文獻(xiàn)數(shù)量、高影響因子以及開放獲取等內(nèi)外部特征對高被引論文長期被引量具有顯著的正向影響:論文內(nèi)外部特征對初始被引量的作用更大,而對長期被引量的影響較小:開放獲取是影響高被引論文長期被引量最核心的正向特征指標(biāo)。

2)高被引論文內(nèi)外部特征對歷年被引量的影響具有差異:開放獲取、學(xué)科數(shù)量、基金資助、國家合作規(guī)模以及期刊質(zhì)量等特征變量對歷年被引量具有較大影響,且具有一定的規(guī)律性。引文累積速度快的論文,較早地?fù)碛辛艘欢ǖ谋灰亢完P(guān)注度,研究者可以從跨國合作、基金資助、高影響因子、開放獲取等方面快速提高論文在學(xué)術(shù)界的傳播速度,進(jìn)而提高關(guān)注度和影響力。

隨著時(shí)間的增長,論文有了一定的被引量、關(guān)注度及影響力之后,施引者對論文的引用偏好已經(jīng)不局限于論文本身、期刊及平臺等特征,因而對于高被引論文影響因素的探索不能僅僅限于此類特征因素,識別影響高被引論文其他核心因素是今后探索研究的重點(diǎn):此外,本研究僅就WOS數(shù)據(jù)庫高被引論文全學(xué)科視角的研究分析,而未分學(xué)科對高被引論文特征進(jìn)行差異性探討,不同學(xué)科下高被引論文特征對被引量的影響可能存在差異,留待后續(xù)研究。

(責(zé)任編輯:孫國雷)

猜你喜歡
內(nèi)外部方差論文
方差怎么算
某軍工單位固定資產(chǎn)管理內(nèi)外部環(huán)境分析及啟示
概率與統(tǒng)計(jì)(2)——離散型隨機(jī)變量的期望與方差
油田企業(yè)內(nèi)外部綜合治理及生產(chǎn)要害部位的治安防范
內(nèi)外部因素共同作用下的日元走勢
中國外匯(2019年18期)2019-11-25 01:42:00
計(jì)算方差用哪個(gè)公式
方差生活秀
利用小波包能量區(qū)分變壓器內(nèi)外部故障
下期論文摘要預(yù)登
下期論文摘要預(yù)登
勐海县| 台中市| 乐昌市| 达州市| 陵川县| 青龙| 台中市| 松溪县| 牙克石市| 太谷县| 华宁县| 新营市| 庐江县| 红河县| 青浦区| 肇州县| 肥城市| 五华县| 筠连县| 神农架林区| 卓资县| 屏东市| 九龙县| 洪江市| 鄂州市| 松溪县| 景宁| 个旧市| 万载县| 蛟河市| 新宾| 嘉荫县| 甘谷县| 诸城市| 井陉县| 徐闻县| 英吉沙县| 乌审旗| 丰城市| 庄河市| 长白|