国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于R語(yǔ)言的ESI四組指標(biāo)的可視化*

2020-06-01 08:23:08潤(rùn)
圖書(shū)情報(bào)研究 2020年2期
關(guān)鍵詞:視圖可視化論文

袁 潤(rùn) 韓 曦

(江蘇大學(xué)科技信息研究所 鎮(zhèn)江 212013)

1 引言

2017年國(guó)家公布了“雙一流”建設(shè)高校名單,開(kāi)啟了我國(guó)教育現(xiàn)代化的新時(shí)代,成為高等教育在繼“211/985 工程”后的又一國(guó)家重大戰(zhàn)略決策,勾畫(huà)了中國(guó)統(tǒng)籌推進(jìn)世界一流大學(xué)和一流學(xué)科建設(shè)的宏偉藍(lán)圖[1]?!半p一流”建設(shè)是對(duì)我國(guó)現(xiàn)有高等教育發(fā)展重點(diǎn)支持政策的改革與完善,引發(fā)了重點(diǎn)大學(xué)、非重點(diǎn)大學(xué)、地方性大學(xué)等在內(nèi)的高等學(xué)校的高度關(guān)注和新一輪學(xué)科發(fā)展競(jìng)爭(zhēng)和人才引進(jìn)態(tài)勢(shì)[2],其建設(shè)的標(biāo)準(zhǔn)己成為當(dāng)前高等教育界和學(xué)術(shù)界共同關(guān)注的焦點(diǎn)問(wèn)題[3]。各高校機(jī)構(gòu)及研究人員在不同的排名和評(píng)價(jià)體系中尋找參照標(biāo)準(zhǔn),努力尋求獲得一種能提供學(xué)科發(fā)展、跟蹤、比較、評(píng)價(jià)等服務(wù)的評(píng)價(jià)方法,并且這種評(píng)價(jià)方法或評(píng)價(jià)體系必須公平合理,讓大家都能接受[4]。

美國(guó)科學(xué)指標(biāo)數(shù)據(jù)庫(kù)(Essential Science Indicators,ESI)是當(dāng)前一流學(xué)科評(píng)價(jià)的主要評(píng)價(jià)標(biāo)準(zhǔn)之一,為廣大發(fā)展中國(guó)家所普遍接受,逐漸成為當(dāng)今世界范圍內(nèi)用以評(píng)價(jià)高等學(xué)校、學(xué)術(shù)機(jī)構(gòu)、國(guó)家/地區(qū)國(guó)際學(xué)術(shù)水平及影響力的重要評(píng)價(jià)工具之一[5]。ESI 數(shù)據(jù)庫(kù)分為22 個(gè)學(xué)科,覆蓋全球數(shù)萬(wàn)家不同研究單位的學(xué)科,每?jī)蓚€(gè)月更新一次,數(shù)據(jù)更新覆蓋時(shí)間范圍為10年。近年來(lái),我國(guó)教育部門(mén)和各省市在評(píng)價(jià)高等學(xué)???jī)效時(shí),己越來(lái)越多地采用ESI 學(xué)科分類和評(píng)價(jià)體系[6]。

為了更好地服務(wù)“雙一流”建設(shè),高校圖書(shū)館積極組建學(xué)科服務(wù)團(tuán)隊(duì),開(kāi)展基于ESI 的學(xué)科服務(wù),為學(xué)校的學(xué)科建設(shè)和發(fā)展提供決策支持,為學(xué)校行政部門(mén)及教育主管部門(mén)提供學(xué)科評(píng)價(jià)參考咨詢報(bào)告,例如,“江蘇省高校ESI 學(xué)科發(fā)展監(jiān)測(cè)報(bào)告”(江蘇大學(xué))、“北京科技大學(xué)ESI 學(xué)科排名動(dòng)態(tài)快報(bào)”、“北京郵電大學(xué)ESI 學(xué)科排名動(dòng)態(tài)快報(bào)”、“湖南大學(xué)學(xué)科排名ESI 簡(jiǎn)報(bào)”等。學(xué)科服務(wù)人員在此背景下廣泛使用ESI 數(shù)據(jù)庫(kù)開(kāi)展學(xué)術(shù)成果的分析和評(píng)價(jià)工作,為促進(jìn)學(xué)校學(xué)科發(fā)展和科研工作提供有力的戰(zhàn)略情報(bào)和決策支持。杭州師范大學(xué)圖書(shū)館利用ESI 對(duì)浙江省高校學(xué)科競(jìng)爭(zhēng)力排名進(jìn)行了計(jì)量分析[7],太原理工大學(xué)圖書(shū)館利用ESI 和InCites 對(duì)山西省三所高校的潛勢(shì)學(xué)科(發(fā)展態(tài)勢(shì))進(jìn)行了分析[8],西安電子科技大學(xué)發(fā)展規(guī)劃部等機(jī)構(gòu)利用ESI 對(duì)“雙一流”建設(shè)高校的ESI 學(xué)科排名表現(xiàn)進(jìn)行了分析[9],昆明理工大學(xué)對(duì)其三個(gè)進(jìn)入ESI 國(guó)際排名前1%行列的學(xué)科進(jìn)行排名分析[10]。由此可見(jiàn),目前大多數(shù)學(xué)科服務(wù)部門(mén)普遍關(guān)注的是ESI 的排序(Rank)功能,而對(duì)其指標(biāo)功能的關(guān)注度不高。

ESI 應(yīng)用于高校圖書(shū)館學(xué)科服務(wù)也存在一些問(wèn)題。由于ESI數(shù)據(jù)庫(kù)是一種計(jì)量分析評(píng)價(jià)工具,較傳統(tǒng)的數(shù)據(jù)庫(kù)相比不提供可追溯性,且該數(shù)據(jù)庫(kù)更新周期相對(duì)較短 (每?jī)蓚€(gè)月更新),每次更新將全部覆蓋上次更新后的數(shù)據(jù)[11],學(xué)科館員如果希望利用歷史數(shù)據(jù)開(kāi)展學(xué)科服務(wù),就需要定期下載并保存ESI 數(shù)據(jù)。此外,大多數(shù)ESI 學(xué)科分析是基于ESI 的排序功能開(kāi)展的,顯得過(guò)于重視ESI 的排序功能而忽視了ESI 的指標(biāo)功能。目前,已有機(jī)構(gòu)和研究人員開(kāi)始注意到ESI 指標(biāo)功能的重要性,如天津圖書(shū)館從高被引論文入手,剖析了全球高被引論文的動(dòng)態(tài)變化現(xiàn)象和特征[12]。中國(guó)石油大學(xué)選擇中美2016~2018年的ESI 高被引論文,發(fā)現(xiàn)差距與不足[13]。大連理工大學(xué)等利用Sci2 tool、Pajek、SPSS 等對(duì)不同文獻(xiàn)類型的圖情領(lǐng)域ESI 高被引論文從年代產(chǎn)出、科學(xué)影響力、合作多樣性、研究主題等展開(kāi)比較研究[13]??梢园l(fā)現(xiàn),上述機(jī)構(gòu)均從ESI 的一組指標(biāo)著手開(kāi)展應(yīng)用研究,且大多是高被引論文指標(biāo),但是在分析動(dòng)態(tài)變化現(xiàn)象、比較國(guó)家或機(jī)構(gòu)的學(xué)術(shù)實(shí)力時(shí),僅依據(jù)一組指標(biāo)顯然存在一定的局限性。然而,ESI 檢索平臺(tái)并不能同時(shí)顯示四組指標(biāo),給綜合分析帶來(lái)一定的困難,也導(dǎo)致很多有價(jià)值的信息未能被人注意。筆者通過(guò)文獻(xiàn)調(diào)研,尚未發(fā)現(xiàn)關(guān)于ESI 四組指標(biāo)的功能介紹,具體的應(yīng)用也不多。因此,本文應(yīng)用R 語(yǔ)言實(shí)現(xiàn)ESI 四組指標(biāo)的可視化,將ESI的四組指標(biāo)顯示在同一副圖中,便于圖書(shū)館學(xué)科服務(wù)人員更直觀地分析ESI 指標(biāo)功能,為學(xué)科服務(wù)提供更多更準(zhǔn)的學(xué)科情報(bào)。

2 ESI 的四組指標(biāo)

ESI 根據(jù)論文(Web of Science Documents)的引文(Cites)數(shù)量,人為地設(shè)置了頂級(jí)論文(Top Papers)、高被引論文(Highly Cited Papers)和熱門(mén)論文(Hot Papers),形成了四組指標(biāo),用于描述ESI 分類的22 個(gè)學(xué)科領(lǐng)域(Research Fields)的科研表現(xiàn),如表1所示。

表1 ESI 四組指標(biāo)

可以發(fā)現(xiàn),這四組指標(biāo)類型相同,屬于文獻(xiàn)計(jì)量的均值指標(biāo),由論文數(shù)、引文數(shù)、篇均引文組成,其中,第1 組指標(biāo)代表了分析對(duì)象的學(xué)術(shù)成果產(chǎn)出能力,第2 組指標(biāo)代表了分析對(duì)象學(xué)術(shù)水平的整體質(zhì)量,第3 組指標(biāo)可用于識(shí)別分析對(duì)象的突破性研究,第4 組指標(biāo)可用于識(shí)別分析對(duì)象的研究熱點(diǎn)和前沿。

以高校機(jī)構(gòu)為例,從學(xué)術(shù)競(jìng)爭(zhēng)力來(lái)看,學(xué)術(shù)成果產(chǎn)出能力是高校學(xué)術(shù)實(shí)力的基礎(chǔ)指標(biāo),代表了高校學(xué)術(shù)水平的底蘊(yùn)實(shí)力,但學(xué)術(shù)成果產(chǎn)出能力是“量”的表現(xiàn),不能代表高校機(jī)構(gòu)學(xué)術(shù)水平的“質(zhì)”,因此需要將第1 組指標(biāo)和第2 組指標(biāo)結(jié)合分析;從學(xué)科發(fā)展來(lái)看,高校的傳統(tǒng)強(qiáng)勢(shì)學(xué)科必然擁有較強(qiáng)的軟硬件實(shí)力,有望在短時(shí)間內(nèi)取得突破性研究,而熱點(diǎn)前沿性研究往往預(yù)示著所涉及的學(xué)科在未來(lái)可能擁有較大潛力,影響著高校如何制定學(xué)科發(fā)展策略,因此將第3 組指標(biāo)和第4 組指標(biāo)結(jié)合起來(lái)可綜合分析高校的學(xué)科發(fā)展水平。所以,將4 組指標(biāo)結(jié)合起來(lái)應(yīng)用,可以全面分析研究對(duì)象的綜合實(shí)力,尤其是在比較不同的研究對(duì)象時(shí),逐一比較每組指標(biāo)的論文數(shù)、引文數(shù)、篇均引文,其比較方法更具條理性和科學(xué)性,其比較結(jié)果更具針對(duì)性和客觀性。

因此,本文將這些指標(biāo)數(shù)據(jù)分別下載后組合起來(lái),再通過(guò)R 語(yǔ)言可視化方法將這四組指標(biāo)呈現(xiàn)在同一副圖中,以便于比較分析,充分發(fā)揮ESI的指標(biāo)功能。

3 ESI 數(shù)據(jù)的下載與集成

ESI 以10年為1 個(gè)周期統(tǒng)計(jì)數(shù)據(jù),每?jī)蓚€(gè)月更新一次,即每年的1月、3月、5月、7月、9月、11月更新。每年5月份,ESI 統(tǒng)計(jì)數(shù)據(jù)的變化比較大,因?yàn)?月的更新會(huì)在新增最近2 個(gè)月數(shù)據(jù)的基礎(chǔ)上刪除最早的10 個(gè)月的數(shù)據(jù),其它時(shí)間的更新只是增加最近兩個(gè)月的數(shù)據(jù)。簡(jiǎn)而言之,ESI 數(shù)據(jù)庫(kù)的更新機(jī)制可以概括為:5月保留最近122 個(gè)月的數(shù)據(jù),7月保留最近124 個(gè)月的數(shù)據(jù),9月保留最近126 個(gè)月的數(shù)據(jù),11月保留最近128 個(gè)月的數(shù)據(jù),1月保留最近130 個(gè)月的數(shù)據(jù),3月保留最近132 個(gè)月的數(shù)據(jù)。

3.1 ESI 數(shù)據(jù)的下載

ESI 檢索界面如圖1所示,其中包含3 個(gè)要素:結(jié)果列表(Results List)、結(jié)果過(guò)濾(Filter Results By)、結(jié)果包含(Include Results For)。結(jié)果列表有6 種選擇,選擇不同的結(jié)果列表,可以有不同的過(guò)濾方案,并產(chǎn)生3 種結(jié)果形式,這三個(gè)要素的組合決定了最終檢索結(jié)果,圖2表達(dá)了它們之間的關(guān)系。

本文下載ESI 數(shù)據(jù)的規(guī)則是從整體到局部。由于本文著眼于ESI 的四組指標(biāo),故主要介紹跟四組指標(biāo)有關(guān)的數(shù)據(jù)下載。

圖1 ESI 檢索界面

首先下載指示器(Indicators)中的數(shù)據(jù),從結(jié)果列表(Results List)入手,不過(guò)濾,直接下載研究領(lǐng)域(Research Fields)、作者(Authors)、機(jī)構(gòu)(Institutions)、國(guó)家或地區(qū)(Countries-Territories)、期刊(Journals)、研究前沿(Research Fronts)的數(shù)據(jù),每種數(shù)據(jù)選項(xiàng)分別下載頂尖論 文(Top Papers)、高被引論文(Highly Cited Papers)、熱門(mén)論文(Hot Papers),并且在定制(Customize)選項(xiàng)中選擇Cites to Top Papers(Cites to Highly Cited Papers、Cites to Hot Papers)、Cites/Top Papers(Cites/Highly Cited Papers、Cites/Hot Papers),下載得到18 張表格,表格命名格式如“Authors_highly”,將這18 張表格歸入同一文件夾,文件夾名稱為“Results”。

圖2 ESI 下載框架

作者(Authors)、機(jī)構(gòu)(Institutions)、國(guó)家或地區(qū)(Countries-Territories)、期刊(Journals)四種選項(xiàng)需要與“學(xué)科”配合下載,因方法相同,故以作者(Authors)的下載方法為例簡(jiǎn)要介紹如下。在結(jié)果列表(Results List)中選擇“Authors”,在過(guò)濾器(Add Filter)中選擇“Research Fields”并分別選擇22 個(gè)ESI 學(xué)科,每個(gè)學(xué)科分別選擇頂尖論文(Top Papers)、高被引論文(Highly Cited Papers)、熱門(mén)論文(Hot Papers)進(jìn)行下載,并在定制(Customize)選項(xiàng)中選擇Cites to Top Papers(Cites to Highly Cited Papers、Cites to Hot Papers)、Cites/Top Papers(Cites/Highly Cited Papers、Cites/Hot Papers),得 到22*3 共計(jì)66 張表格,這些表格的命名格式如“Authors_Agricultural Sciences_highly”,將這66 張表格歸入同一文件夾,文件夾名稱為“Authors”。類似地,機(jī)構(gòu)(Institutions)、國(guó)家或地區(qū)(Countries-Territories)、期刊(Journals)下載方法均相同,所下載的文件分別歸入“Institutions”、“Countries”、“Journals”中去。此外,由于若干ESI 學(xué)科名稱中含有“&”等符號(hào),不利于R 語(yǔ)言后期識(shí)別,故將所有的ESI 學(xué)科名稱簡(jiǎn)要規(guī)定,如圖2所示。

綜上,將下載流程簡(jiǎn)要?dú)w納如下:①通過(guò)“結(jié)果列表”確定下載對(duì)象,如作者、機(jī)構(gòu)、期刊等;②通過(guò)“篩選器”選擇學(xué)科,一般情況下將22 個(gè)學(xué)科按順序下載;③通過(guò)“結(jié)果包含”選擇數(shù)據(jù)類型,如頂級(jí)論文、高被引論文、熱門(mén)論文等。

3.2 ESI 數(shù)據(jù)的集成

為將數(shù)據(jù)從ESI 平臺(tái)到轉(zhuǎn)移到R 平臺(tái),以便于在R 環(huán)境下分析和處理數(shù)據(jù),本文用統(tǒng)一的文件夾名稱和相對(duì)一致的文件名稱保存從ESI 平臺(tái)下載的數(shù)據(jù),這樣ESI 數(shù)據(jù)在兩個(gè)月一次的周期性變更時(shí),只需要改變文件夾名稱即可,這樣可以最大程度地減少編程的工作量。

數(shù)據(jù)集成采用的方法是:從ESI 平臺(tái)下載的數(shù)據(jù)是Excel 表格,可以直接對(duì)應(yīng)到R 環(huán)境下的數(shù)據(jù)框(data.frame);對(duì)于多個(gè)同構(gòu)的數(shù)據(jù)表應(yīng)該合并到一個(gè)數(shù)據(jù)框;對(duì)于異構(gòu)數(shù)據(jù)表,需要先分解,再重組;對(duì)于三維表,需要對(duì)應(yīng)到R 環(huán)境下的三維數(shù)組;最后將轉(zhuǎn)換結(jié)果保存為R 環(huán)境下的數(shù)據(jù)格式(.RData)。

由于第1 組指標(biāo)的數(shù)值是始終不變的(不被其他三組標(biāo)影響),故用自編函數(shù)MergeIndicators()合并Top Papers、Highly Cited Papers 和Hot Papers 三組指標(biāo),用到此函數(shù)的分別是“Results”中的“authors”、“countries”、“institutions”、“journals” 和“researchFields”。自編函數(shù)MergeFieldsIndicators()是合并ESI 中22 個(gè)學(xué)科的三組指標(biāo)的函數(shù),順序是先合并三組指標(biāo),再合并“作者-學(xué)科”、“國(guó)家-學(xué)科”、“機(jī)構(gòu)-學(xué)科”、“期刊-學(xué)科”等,用到此函數(shù)的分別是“Authors_Fields”、“Countries_Fields”、“Institutions_Fields”和“Journals_Fields”。

圖3 目標(biāo)文件夾

操作完成后,數(shù)據(jù)保存到目標(biāo)文件夾,如圖3所示,其中文件夾“RData”中會(huì)出現(xiàn)13 個(gè)結(jié)果文件,接下來(lái)的分析可直接調(diào)用RData 數(shù)據(jù)。

4 ESI 四組指標(biāo)的可視化

可視化(Visualization)就是將數(shù)據(jù)以圖的形式表達(dá)。氣泡圖(bubble chart)可以展示三個(gè)變量之間的關(guān)系,X 軸表示第一個(gè)變量(例如論文數(shù)),Y 軸表示第二個(gè)變量(例如引文數(shù)),第三個(gè)變量(例如篇均引文)則用氣泡的大小來(lái)表示。如此,ESI 的每組指標(biāo)都可以在XY 平面上用一副“氣泡”圖來(lái)展示,若干“氣泡”則反映了一個(gè)序列的數(shù)據(jù),ESI 四組數(shù)據(jù)可以分別繪制在四副圖中,這四副圖結(jié)合起來(lái)就是ESI 指標(biāo)的可視化圖。

本文采用R 語(yǔ)言ggplot2 包繪制了3 種類型的ESI 各項(xiàng)指標(biāo)的可視化圖,本文稱之為視圖1、視圖2、視圖3。視圖1如圖4所示,能夠較好地表達(dá)一組指標(biāo)的三個(gè)參數(shù),但是當(dāng)“氣泡”參數(shù)接近時(shí),存在“聚集”現(xiàn)象,區(qū)分度不好。由于每組指標(biāo)僅有2 個(gè)獨(dú)立參數(shù),因此可以用Y 軸代表觀測(cè)對(duì)象(包括,學(xué)科/國(guó)家&地區(qū)/機(jī)構(gòu)/期刊/作者),X 軸代表論文數(shù),氣泡大小代表篇均引文,這樣的可視化效果本文稱為視圖2,如圖5所示。視圖3是為了對(duì)比分析觀測(cè)對(duì)象(國(guó)家&地區(qū)/機(jī)構(gòu)/期刊/作者)在22 個(gè)學(xué)科中的表現(xiàn)而設(shè)計(jì)的可視化圖,X 軸代表論文數(shù),Y軸表示22 個(gè)學(xué)科,氣泡大小代表篇均引文,可視化效果如圖6所示。

根據(jù)ESI 的統(tǒng)計(jì)對(duì)象,包括學(xué)科、國(guó)家/地區(qū)、機(jī)構(gòu)、期刊、作者等,可以組合繪制若干與視圖1~視圖3類似的分析圖形,這些可視化結(jié)果能夠更好地發(fā)揮ESI 的學(xué)科情報(bào)價(jià)值。表2給出了三種視圖的作用,其中記錄數(shù)是ESI 2018年11月份的數(shù)據(jù)。視圖3用“點(diǎn)”的形狀(shape)區(qū)分不同的比較對(duì)象,一般不超過(guò)6 個(gè),2~3 個(gè)對(duì)象的可視化效果較好。

表2 ESI 四組指標(biāo)可視化的三種視圖的作用

視圖1的X 軸代表論文數(shù),Y 軸代表引文數(shù),這兩個(gè)參數(shù)越高,代表研究對(duì)象的氣泡越靠右上角,因此能直觀地比較分析對(duì)象之間的差距。但若比較對(duì)象差距較小,氣泡將會(huì)重疊,比較效果不明顯。因此,視圖1適合分析那些指標(biāo)能拉開(kāi)差距的研究對(duì)象。

視圖2彌補(bǔ)了視圖1的缺陷,論文數(shù)可通過(guò)X 軸看出大小,Y 軸代表各研究對(duì)象,“氣泡”大小由篇均引文數(shù)決定,且直接標(biāo)明數(shù)值,避免了視圖1的氣泡“聚集”現(xiàn)象。此外,視圖2能清晰地反映出三個(gè)參數(shù)在四組指標(biāo)中的變化情況,適合多個(gè)對(duì)象的比較分析。

視圖3適合分析研究對(duì)象的22 個(gè)學(xué)科的表現(xiàn)情況。在比較數(shù)個(gè)研究對(duì)象時(shí),逐一對(duì)比四組指標(biāo)的論文數(shù)、引文數(shù)、篇均引文,比較結(jié)果具有全面性、科學(xué)性的特點(diǎn)。此外,還有利于優(yōu)勢(shì)學(xué)科、潛勢(shì)學(xué)科的挖掘。

5 應(yīng)用舉例

應(yīng)用情景一:可視化國(guó)家&地區(qū)的ESI 綜合指標(biāo)情況。在Excel 表格當(dāng)中列出需要觀測(cè)的國(guó)家&地區(qū)的ESI 名稱,用中文作為其標(biāo)簽,將該Excel 表格導(dǎo)入RStudio 生成analyObject 數(shù)據(jù)框,用dplyr 包的inner_join(analyObject,countries)函數(shù)提取目標(biāo)數(shù)據(jù),用視圖1和視圖2的自編函數(shù)繪制結(jié)果如圖4和圖5所示。

圖4 視圖1(國(guó)家&地區(qū)的ESI 綜合指標(biāo)可視化圖)

圖5 視圖2(國(guó)家&地區(qū)的ESI 綜合指標(biāo)可視化圖)

由圖4、圖5可看出,中國(guó)大陸四組指標(biāo)的論文數(shù)均排在第2 名,僅次于美國(guó),但差距非常明顯。引文數(shù)上,中國(guó)大陸在第1 組指標(biāo)中排第2 位,在第2 組指標(biāo)中排第4 位,在第3 組指標(biāo)中排第4 位,在第4 組指標(biāo)中排第3 位。但是,中國(guó)大陸在篇均引文上的比較結(jié)果并不理想,四組指標(biāo)中的氣泡均較小,在選取的18 個(gè)國(guó)家/地區(qū)中排名靠后,尤其在“Hot Papers”指標(biāo)中,排在最后一名。由此可見(jiàn),中國(guó)大陸近10年發(fā)文數(shù)量確實(shí)較大,逐漸成為一個(gè)學(xué)術(shù)大國(guó),但是篇均引文反應(yīng)出這些論文質(zhì)量并不高。

“Hot Papers”是在過(guò)去兩年內(nèi)發(fā)表的論文,近兩個(gè)月的被引頻次排在該學(xué)科排名前0.1%的論文,這意味著論文必須在很短的一段時(shí)間里得到關(guān)注,可間接反映論文的創(chuàng)新性。經(jīng)過(guò)查詢,以2017年為初始年份,2018年11月更新的近兩年全學(xué)科入圍0.1%的條件是被引頻次達(dá)到53的論文,2019年1月更新的近兩年全學(xué)科入圍0.1%的條件是被引頻次達(dá)到64 的論文,兩期平均要求被引頻次為58.5。圖中,中國(guó)大陸的篇均引文數(shù)為58.18,剛好接近入圍0.1%的門(mén)檻,可見(jiàn)整體論文質(zhì)量確實(shí)不高。反觀美國(guó),論文數(shù)遙遙領(lǐng)先于其他國(guó)家,如此大的基數(shù),篇均引文數(shù)仍然可觀。

應(yīng)用情景二:比較中國(guó)大陸與美國(guó)ESI 學(xué)科指標(biāo)情況。為了繪圖效果,22 個(gè)學(xué)科名稱采用中文簡(jiǎn)稱,圓形點(diǎn)代表美國(guó),三角形點(diǎn)代表中國(guó)大陸。

圖6 視圖3(中國(guó)大陸與美國(guó)ESI 學(xué)科指標(biāo)可視化圖)

從圖6可看出,四組指標(biāo)中同一學(xué)科的圓點(diǎn)大多在三角形點(diǎn)右側(cè),意味著美國(guó)在大部分學(xué)科中的論文數(shù)領(lǐng)先于中國(guó)大陸。從引文數(shù)來(lái)看,前三組指標(biāo)美國(guó)所有學(xué)科均領(lǐng)先于中國(guó)大陸,即使少數(shù)學(xué)科中國(guó)大陸的論文數(shù)超過(guò)美國(guó),引文數(shù)也低于美國(guó)。只有第4 組指標(biāo)中有兩個(gè)學(xué)科的引文數(shù)略高于美國(guó)。從篇均引文來(lái)看,同一學(xué)科兩國(guó)篇均引文差距并不明顯,因?yàn)槊绹?guó)的論文數(shù)基數(shù)過(guò)大。具體分析以論文(Web of Science Documents)為例,在論文數(shù)上,美國(guó)有17 個(gè)學(xué)科領(lǐng)先于中國(guó)。各學(xué)科論文數(shù)差距一般在25 000篇以內(nèi),但值得注意的是,臨床醫(yī)學(xué)學(xué)科差距明顯,達(dá)到60 000 篇左右。筆者分析原因如下:①美國(guó)該學(xué)科門(mén)檻高,人才起點(diǎn)高。美國(guó)本科不設(shè)置臨床醫(yī)學(xué)專業(yè),美國(guó)醫(yī)學(xué)院不招本科生,想入讀醫(yī)學(xué)院的學(xué)生必須是本科畢業(yè)或具有相同學(xué)歷才可以進(jìn)入醫(yī)學(xué)院學(xué)習(xí)。在美國(guó)必須攻讀醫(yī)學(xué)博士學(xué)位才能擁有考取醫(yī)師執(zhí)照的資格。②環(huán)境影響。從大環(huán)境來(lái)講,醫(yī)生這一職業(yè)在美國(guó)是特別受人敬仰的,社會(huì)認(rèn)可度高。從小環(huán)境來(lái)講,美國(guó)醫(yī)院鼓勵(lì)醫(yī)生發(fā)表成果,在經(jīng)濟(jì)和時(shí)間上給予充分支持。③中國(guó)大陸的醫(yī)學(xué)生流失率高。2005年至2015年這十年間,中國(guó)大陸各大學(xué)培養(yǎng)了470 萬(wàn)名醫(yī)學(xué)專業(yè)畢業(yè)生,而醫(yī)生總數(shù)只增加了75 萬(wàn)。由于薪資問(wèn)題、職業(yè)環(huán)境、工作時(shí)間、職業(yè)發(fā)展等因素,目前相當(dāng)一部分醫(yī)學(xué)生選擇赴美攻讀學(xué)位并留美行醫(yī)。

此外,中國(guó)大陸的化學(xué)、工程學(xué)、材料學(xué)等理工類學(xué)科的論文數(shù)和篇均引文在四組指標(biāo)中均領(lǐng)先于美國(guó),說(shuō)明這些學(xué)科是目前國(guó)內(nèi)發(fā)展較為成熟的學(xué)科,事實(shí)上中國(guó)的經(jīng)濟(jì)增長(zhǎng),也確實(shí)依賴于這些學(xué)科,該結(jié)果符合邏輯現(xiàn)實(shí)性。

應(yīng)用情景三:世界一流大學(xué)ESI 綜合指標(biāo)情況。選取了國(guó)內(nèi)“C9 聯(lián)盟”高校及9 所國(guó)際知名大學(xué),結(jié)果如圖7所示。

圖7 世界一流大學(xué)ESI 綜合指標(biāo)情況

從論文數(shù)來(lái)看,四組指標(biāo)中排名前三的均為國(guó)際知名高校,哈佛大學(xué)、多倫多大學(xué)以及劍橋大學(xué)優(yōu)勢(shì)明顯,尤其是哈佛大學(xué),暫時(shí)無(wú)任何學(xué)校能與其媲美。但整體來(lái)看,國(guó)內(nèi)9 所高校實(shí)力不俗。第1 組指標(biāo)中浙江大學(xué)名列第5 位,與劍橋大學(xué)差距不大。其他三組數(shù)據(jù)中,清華大學(xué)均名列第5 位,與劍橋大學(xué)、墨爾本大學(xué)差距不大。從引文數(shù)來(lái)看,四組指標(biāo)中,國(guó)內(nèi)高校均不如國(guó)際知名高校,但近年來(lái)上升勢(shì)頭強(qiáng)勁,如中科大在“頂級(jí)論文”中的引文數(shù)排名已上升至第3 位,說(shuō)明近兩年的優(yōu)秀成果增多。從篇均引文來(lái)看,氣泡大小無(wú)明顯差距,四組數(shù)據(jù)中僅西交大與哈工大氣泡過(guò)小,應(yīng)與其學(xué)科實(shí)力不均衡有關(guān)。

總的來(lái)看,國(guó)內(nèi)高校與國(guó)際知名高校差距較大,如開(kāi)普敦大學(xué)雖然位于非洲,論文數(shù)與國(guó)內(nèi)高校相近,但在四組指標(biāo)中,引文數(shù)及篇均引文絲毫不遜于國(guó)內(nèi)高校。臺(tái)灣大學(xué)、香港大學(xué)同為亞洲知名學(xué)府,四組指標(biāo)的論文數(shù)、引文數(shù)、篇均引文也均領(lǐng)先于大陸高校,值得深思。

應(yīng)用情景四:北大-清華與世界一流大學(xué)的學(xué)科差距。圖8為哈佛大學(xué)、北京大學(xué)、清華大學(xué)的學(xué)科比較圖,從論文數(shù)來(lái)看,四組指標(biāo)中哈佛大學(xué)主要以遺傳學(xué)、臨床醫(yī)學(xué)、生物學(xué)等學(xué)科領(lǐng)先于清華北大,但北京大學(xué)的化學(xué)學(xué)科和清華大學(xué)的材料學(xué)科實(shí)力驚人。清華大學(xué)與北京大學(xué)幾乎沒(méi)有差距,圖形大多數(shù)重疊在一起。從引文數(shù)來(lái)看,與圖7結(jié)果一致,各學(xué)科哈佛大學(xué)均領(lǐng)先于清華北大。從篇均引文來(lái)看,前3 組指標(biāo)中,三個(gè)學(xué)校的圖形大小肉眼幾乎不能區(qū)別差距,但在第4 組數(shù)據(jù)中可以明顯看出,物理學(xué)、地球?qū)W等學(xué)科,清華大學(xué)和北京大學(xué)的圖形大小明顯大于哈佛大學(xué)。

清華大學(xué)和北京大學(xué)代表了中國(guó)的最高學(xué)府,哈佛大學(xué)是美國(guó)的頂級(jí)大學(xué),相比較的結(jié)果與圖6兩國(guó)的學(xué)科比較結(jié)果大致相同,例如哈佛大學(xué)的臨床醫(yī)學(xué)學(xué)科遙遙領(lǐng)先于清華北大。通過(guò)高校之間的學(xué)科對(duì)比,可以發(fā)現(xiàn)高校的優(yōu)勢(shì)學(xué)科和潛勢(shì)學(xué)科。尤其是清華大學(xué)和北京大學(xué)的物理學(xué)、地球?qū)W等學(xué)科在頂尖論文指標(biāo)中甚至超過(guò)哈佛大學(xué),預(yù)示著中國(guó)的通訊衛(wèi)星、納米技術(shù)等領(lǐng)域或已躋身世界一流水平。

圖8 學(xué)科比較:哈佛-北大-清華

6 結(jié)語(yǔ)

本文運(yùn)用R 語(yǔ)言編程實(shí)現(xiàn)了對(duì)ESI 四組指標(biāo)的可視化,利用三種視圖將ESI 四組指標(biāo)呈現(xiàn)在一張平面圖上。研究表明,視圖1、視圖2顯示出中國(guó)大陸地區(qū)學(xué)術(shù)現(xiàn)狀并非如表面那樣樂(lè)觀,論文數(shù)、引文數(shù)成績(jī)確實(shí)不俗,但篇均引文令人擔(dān)憂,這與論文質(zhì)量和大量的論文自引有關(guān)。視圖3直觀地顯示了中國(guó)大陸與美國(guó)相比較的學(xué)術(shù)方面的差距,中國(guó)大陸的四組指標(biāo)均與美國(guó)相差甚遠(yuǎn),但通過(guò)視圖也可看出中國(guó)大陸的強(qiáng)勢(shì)學(xué)科(化學(xué)、材料學(xué)等)和潛勢(shì)學(xué)科(地球?qū)W、物理學(xué)等)。此外,應(yīng)用情景三是各高校的學(xué)科比較,這是目前國(guó)內(nèi)學(xué)科服務(wù)部門(mén)的主要業(yè)務(wù)之一,可視化結(jié)果更加直觀更加清晰,更適合決策人員做戰(zhàn)略調(diào)整。

研究表明,運(yùn)用本文介紹的可視化方法可以高效地采集并保存ESI 數(shù)據(jù),使得高校圖書(shū)館的ESI 數(shù)據(jù)采集更加高效,數(shù)據(jù)分析和結(jié)果展示更為直觀清晰,基于ESI 的學(xué)科情報(bào)服務(wù)更加精準(zhǔn),更具有針對(duì)性,更有利于決策,具有推廣價(jià)值。

猜你喜歡
視圖可視化論文
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
“融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
5.3 視圖與投影
視圖
Y—20重型運(yùn)輸機(jī)多視圖
SA2型76毫米車載高炮多視圖
下期論文摘要預(yù)登
下期論文摘要預(yù)登
安溪县| 杭锦旗| 临清市| 原阳县| 盘锦市| 普定县| 临西县| 建始县| 时尚| 濮阳县| 福泉市| 堆龙德庆县| 新泰市| 屏山县| 涪陵区| 玉田县| 河曲县| 论坛| 宣化县| 常山县| 隆尧县| 平凉市| 韩城市| 沂水县| 阿荣旗| 建水县| 大石桥市| 大化| 衡阳县| 江阴市| 琼结县| 黄山市| 崇信县| 鞍山市| 普安县| 长白| 磐石市| 开封市| 连平县| 巴青县| 弥勒县|