樊利勤+曹紅兵
[摘 要]以廣西大學(xué)工程學(xué)學(xué)科為例,以SCIE數(shù)據(jù)庫為依據(jù),運用Excel對數(shù)據(jù)的排序、篩選、分列、替換以及函數(shù)統(tǒng)計等統(tǒng)計方法,對SCI論文中的機(jī)構(gòu)、作者、學(xué)院等字段進(jìn)行處理,并借助Excel對作者、地區(qū)和機(jī)構(gòu)合作、發(fā)表期刊、論文與年代關(guān)系、學(xué)院貢獻(xiàn)等數(shù)據(jù)進(jìn)行深入分析,為學(xué)校支持學(xué)科發(fā)展和制定學(xué)科建設(shè)規(guī)劃提供參考,同時深化Excel在學(xué)科服務(wù)的應(yīng)用,推動文獻(xiàn)計量學(xué)的普及。
[關(guān)鍵詞]Excel;學(xué)科服務(wù);廣西大學(xué);工程學(xué)
[中圖分類號]G252[文獻(xiàn)標(biāo)志碼]B[文章編號]1005-6041(2017)03-0054-05
1 引 言
教育部2013年工作要點中提出了“推進(jìn)優(yōu)勢學(xué)科創(chuàng)新平臺和特色重點學(xué)科項目建設(shè),加快建設(shè)一流大學(xué)和重點大學(xué)”的高校建設(shè)目標(biāo)與要求。2015年10月,國務(wù)院印發(fā)《統(tǒng)籌推進(jìn)世界一流大學(xué)和一流學(xué)科建設(shè)總體方案》,強(qiáng)調(diào)了堅持“以一流為目標(biāo)、以學(xué)科為基礎(chǔ)、以績效為杠桿、以改革為動力”的基本原則,加快建成一批世界一流大學(xué)和一流學(xué)科[1]。2016年2月,《教育部2016年工作要點》中進(jìn)一步要求,要“加快世界一流大學(xué)和一流學(xué)科建設(shè)”,制訂“雙一流”實施辦法[2]。在這樣的背景下,全國各個高校都非常重視本校的學(xué)科建設(shè),紛紛集中建設(shè)自己的重點學(xué)科,研究合理投入和分配資金,整合和調(diào)節(jié)學(xué)科資源。而這項工作的前提和基礎(chǔ)是必須進(jìn)行學(xué)科評估。于是,學(xué)科評估工作開始在各高校逐漸受到重視并廣泛開展起來。
SCI(Science Citation Index,科學(xué)引文索引)論文及其引用是國際通行的一種對自然科學(xué)基礎(chǔ)研究成果進(jìn)行評價的客觀、定量和易操作的指標(biāo),它在衡量國家、科研機(jī)構(gòu)或大學(xué)的科研實力,評價科研人員學(xué)術(shù)水平等方面發(fā)揮著重要的作用[3]。一所高校被SCI數(shù)據(jù)庫收錄科技論文的數(shù)量和質(zhì)量成為了評價該??蒲兴胶途C合研究能力的重要依據(jù)。而SCI論文的統(tǒng)計非?;ㄙM時間和精力,往往需要借助比較專業(yè)的統(tǒng)計分析工具才能順利完成。本文以廣西大學(xué)工程學(xué)學(xué)科為例,詳細(xì)介紹Excel對SCI論文中的機(jī)構(gòu)、作者等不同字段的程式化處理方法,并從學(xué)科服務(wù)角度對工程學(xué)學(xué)科的作者、地區(qū)和機(jī)構(gòu)合作、發(fā)表期刊、論文與年代關(guān)系、學(xué)院貢獻(xiàn)等關(guān)鍵數(shù)據(jù)進(jìn)行提取和深入分析,有利于學(xué)科服務(wù)評價工作的開展,也為相關(guān)部門支持學(xué)科發(fā)展和制定學(xué)科建設(shè)規(guī)劃提供基礎(chǔ)數(shù)據(jù)。
2 數(shù)據(jù)與方法
2.1 數(shù)據(jù)采集
本文數(shù)據(jù)來源于Web of Science中的SCIE(SCI-Expanded,科學(xué)引文索引擴(kuò)展版)數(shù)據(jù)庫,檢索式為:AD =guangxi univ* and SO=“4OR-A Quarterly Journal of Operations Research”or“ACI STRUCTURAL JOURNAL”or……or“tm-Technisches Messen”等ESI工程學(xué)學(xué)科907種刊物,文獻(xiàn)出版年為2005—2015,文獻(xiàn)類型為Article、Review和Letter,檢出文獻(xiàn)381篇。采用Excel對檢出文獻(xiàn)進(jìn)行統(tǒng)計,根據(jù)作者、通訊作者及地址項,析出第一作者或通訊作者為廣西大學(xué)的數(shù)據(jù)。最后,根據(jù)廣西大學(xué)科研管理系統(tǒng)中列出的論文標(biāo)題,對析出數(shù)據(jù)進(jìn)行清洗,歸并不同英文表達(dá)的第一作者和通訊作者。數(shù)據(jù)檢索日期為2016年1月20日。
在SCIE數(shù)據(jù)庫中,將檢索到的文獻(xiàn)結(jié)果按照被引頻次降序方式進(jìn)行排序,選擇文獻(xiàn)添加到標(biāo)記結(jié)果列表,然后在標(biāo)記結(jié)果列表中選擇輸出選項,導(dǎo)出格式采用“保存為其他文件格式——制表符分隔(Mac,UTF-8)”,將結(jié)果導(dǎo)入Excel表格中進(jìn)行統(tǒng)計。
2.2 數(shù)據(jù)處理和統(tǒng)計方法
2.2.1 文獻(xiàn)第一作者的切分處理。將原始數(shù)據(jù)導(dǎo)入到Excel表格中后,按照下載的文獻(xiàn)排序順序給每篇文獻(xiàn)相應(yīng)的序號,便于后續(xù)統(tǒng)計的對應(yīng)。然后將數(shù)據(jù)的序號和字段標(biāo)識為AF的內(nèi)容復(fù)制到新的Excel表格,利用Excel表格中的分列功能,選用分號分隔符將文獻(xiàn)的第一作者分開,從而得到文獻(xiàn)的第一作者。
2.2.2 廣西大學(xué)機(jī)構(gòu)的切分處理。將數(shù)據(jù)的序號和字段標(biāo)識為C1內(nèi)容復(fù)制到新的Excel表格。以Guangxi Univ為目標(biāo)機(jī)構(gòu),首先使用Excel表格中的替換功能,將C1內(nèi)容中包含有“Guangxi Univ”的檢索記錄全部替換為“!Guangxi Univ”,再利用Excel表格中的分列功能,選用“!”分隔符將Guangxi Univ機(jī)構(gòu)分開,便可得到包含有Guangxi Univ的目標(biāo)機(jī)構(gòu)。在處理數(shù)據(jù)的過程中,添加“!”是為了在分列時區(qū)分于原數(shù)據(jù)中的標(biāo)點符號,更方便于分列。
2.2.3 廣西大學(xué)通訊作者切分處理。將數(shù)據(jù)的序號和字段標(biāo)識為RP內(nèi)容復(fù)制到新的Excel表格。以Guangxi Univ機(jī)構(gòu)的通訊作者為目標(biāo)通訊作者。首先使用Excel表格的查找功能,查找RP內(nèi)容中包含有Guangxi Univ機(jī)構(gòu)的檢索記錄,并將記錄標(biāo)上顏色做記號,然后使用Excel表格的篩選功能,按顏色篩選出沒有標(biāo)上顏色記號的檢索記錄,清除內(nèi)容即可得到包含有Guangxi Univ機(jī)構(gòu)的檢索記錄,最后再Excel表格的分列功能,分別選用“(”和“)”分隔符號分列,就可以將通訊作者和廣西大學(xué)機(jī)構(gòu)分開。
2.2.4 廣西大學(xué)機(jī)構(gòu)第一作者的切分處理。將數(shù)據(jù)的序號和字段標(biāo)識為C1內(nèi)容復(fù)制到新的Excel表格。以Guangxi Univ為目標(biāo)機(jī)構(gòu),使用Excel表格的分列功能,先選用“[”作為分隔符號對C1內(nèi)容進(jìn)行分列,得到2008年以前(含2008年)和2008年以后的分列記錄,然后分別對2008年以前(含2008年)和2008年以后的分列數(shù)據(jù)進(jìn)行處理。由于Web of Science(SCI、SSCI)數(shù)據(jù)庫中2008年以前(含2008年)C1內(nèi)容中的機(jī)構(gòu)沒有帶文獻(xiàn)作者,故需要人工添加作者,通過合并和分列功能處理,得到Guangxi Univ目標(biāo)機(jī)構(gòu)。對2008年以后的分列數(shù)據(jù)進(jìn)行處理,則是對切分出來的2008年以后數(shù)據(jù)的前三列數(shù)據(jù),首先使用Excel表格的查找功能,查找2008年以后的分列數(shù)據(jù)中包含有Guangxi Univ機(jī)構(gòu)的檢索記錄,并標(biāo)上顏色做記號,然后使用Excel表格的篩選功能,按顏色篩選出沒有標(biāo)上顏色記號的檢索記錄,清除內(nèi)容即可得到包含有Guangxi Univ機(jī)構(gòu)的檢索記錄,再利用合并和分列功能將作者和機(jī)構(gòu)分列,對作者進(jìn)行分列,選擇分列后的第一列作者即是Guangxi Univ目標(biāo)機(jī)構(gòu)2008年以后數(shù)據(jù)的第一作者。最后把2008年以前(含2008年)和2008年以后的作者、機(jī)構(gòu)按照序號的對應(yīng)合并,并與文獻(xiàn)第一作者進(jìn)行比對,就是Guangxi Univ目標(biāo)機(jī)構(gòu)第一作者。endprint
2.2.5 通訊作者被引頻次和發(fā)文量的統(tǒng)計方法。將下載的原始數(shù)據(jù)字段標(biāo)識為TC的內(nèi)容復(fù)制到切分好的通訊作者結(jié)果中,然后使用Excel表格的排序功能,按照通訊作者升序或降序排序,將排序后的通訊作者復(fù)制粘貼在同一Excel表格中,使用Excel表格的刪除重復(fù)項功能去除通訊作者中拼寫相同的通訊作者,最后使用sumif函數(shù)統(tǒng)計通訊作者的被引頻次。通訊作者發(fā)文量的統(tǒng)計使用Excel表格的數(shù)據(jù)透視表功能。
2.2.6 廣西大學(xué)第一作者被引頻次和發(fā)文量的統(tǒng)計方法。將下載的原始數(shù)據(jù)字段標(biāo)識為TC的內(nèi)容復(fù)制到切分好的目標(biāo)機(jī)構(gòu)第一作者結(jié)果中,使用Excel表格的排序功能,按照目標(biāo)機(jī)構(gòu)第一作者升序或降序進(jìn)行排序,統(tǒng)一第一作者中同一作者的不同拼寫方式,然后統(tǒng)計目標(biāo)機(jī)構(gòu)第一作者的被引頻次和發(fā)文量,統(tǒng)計方法與通訊作者被引頻次和發(fā)文量的統(tǒng)計方法一樣,故不再重復(fù)。
3 結(jié)果與分析
3.1 高產(chǎn)作者
論文發(fā)文量衡量的是科研人員的“學(xué)術(shù)生產(chǎn)力”[4]。對于從事基礎(chǔ)研究的人員,發(fā)表論文的數(shù)量和質(zhì)量可以反映其個人對學(xué)術(shù)界的貢獻(xiàn)[5]。表1是廣西大學(xué)工程學(xué)發(fā)文數(shù)量最多的10位作者,同時統(tǒng)計了署名廣西大學(xué)第一作者或通訊作者的發(fā)文量,有助于了解廣西大學(xué)自主創(chuàng)新的能力。表中顯示,廣西大學(xué)工程學(xué)學(xué)科個人發(fā)文量在10篇以上的作者有5位,分別是Chen Wuhua、Jian Jinbao、Zhong Xianci、Yang Lufeng、Cui Yaodong。其中發(fā)文貢獻(xiàn)最大為Chen Wuhua,發(fā)文32篇,貢獻(xiàn)率為8.40%,其署名第一作者或通訊作者的發(fā)文量是22篇。第二是Jian Jinbao,發(fā)文20篇,貢獻(xiàn)率5.25%,第一作者或通訊作者的發(fā)文量是9篇。第三是Zhong Xianci,發(fā)文18篇,發(fā)文貢獻(xiàn)率為4.72%,第一作者或通訊作者的發(fā)文量是13篇。再次是Yang Lufeng和Cui Yaodong,發(fā)文量分別是17篇和14篇。表明了這些作者是廣西大學(xué)工程學(xué)科研實力最強(qiáng)的作者。
3.2 高影響力作者分析
科技論文的被引情況是衡量其質(zhì)量和國際影響力的重要標(biāo)準(zhǔn)。對某一研究領(lǐng)域來講,質(zhì)量較高的論文一般都具有較高被引頻次。一定程度上,科技論文被引用頻次的高低不僅揭示論文的學(xué)科走向、背景狀況和發(fā)展軌跡,客觀評價論文質(zhì)量和科研人員的學(xué)術(shù)水平,還在于其可以評價論文在國際上的影響力[5—7]。廣西大學(xué)工程學(xué)學(xué)科在2005—2015年發(fā)表了381篇文獻(xiàn),有277篇被引用至少1次以上,被引用率達(dá)72.7%。表2是廣西大學(xué)工程學(xué)SCI論文被引頻次最多的前10位作者。表中顯示,Chen Wuhua對工程學(xué)學(xué)科的貢獻(xiàn)最大,個人總被引頻次778次,貢獻(xiàn)率為29.68%;其次是Zheng Wei-xing,個人總被引頻次526次,貢獻(xiàn)率20.07%;再次是Lu Xiaomei,個人總被引頻次291次,貢獻(xiàn)率11.10%。表明了這些作者為廣西大學(xué)工程學(xué)學(xué)科進(jìn)入ESI學(xué)科并一直保持ESI優(yōu)勢學(xué)科做了很大的貢獻(xiàn)。
3.3 SCI論文合作情況分析
在科學(xué)研究中,國家間、地區(qū)間、單位間的合作顯得越來越重要。2005—2015年10年間,廣西大學(xué)工程學(xué)學(xué)科被SCI收錄的論文中,合作機(jī)構(gòu)有142個。按照合作論文數(shù)量進(jìn)行統(tǒng)計,合作最為頻繁的科研機(jī)構(gòu)是中國科學(xué)院和西悉尼大學(xué)(17篇),如圖1,其次是廣西民族大學(xué)(15篇)、華中科技大學(xué)(15篇)、華南理工大學(xué)(10篇)、清華大學(xué)(10篇)。前10個合作機(jī)構(gòu)的論文數(shù)量是113篇,占全部合作論文總數(shù)的30.62%。
廣西大學(xué)與國際上20個國家或地區(qū)合作,合作論文139篇,占工程學(xué)學(xué)科發(fā)文量的36.48%。如圖2,其中合作論文數(shù)超過20篇的國家有3個,分別是英國32篇,合作論文占比8.40%,澳大利亞27篇,合作論文占比7.09%,美國26篇,合作論文占比6.82%。
3.4 SCI收錄廣西大學(xué)論文期刊的影響因子分析
影響因子是SCI對科學(xué)期刊進(jìn)行統(tǒng)計、評估的一個參數(shù),決定了各期刊在“期刊引證報告(JCR)”中的排序和級次。某一期刊在某年的影響因子是指該年度引用該期刊前兩年論文的總次數(shù)與前兩年該刊物發(fā)表的論文總數(shù)之比[8]。本文所引用的SCI收錄期刊的影響因子依據(jù)是2015年美國科學(xué)信息研究所公布的數(shù)據(jù)。2005—2015年廣西大學(xué)工程學(xué)學(xué)科SCI論文分布在159種期刊,其中國內(nèi)刊物8種,共收錄22篇,占論文總數(shù)的5.77%;國外刊物151種,共收錄論文359種,占論文總數(shù)的94.23%。期刊影響因子最高的刊物是IEEE TRANSACTIONS ON FUZZY SYSTEMS,影響因子為6.701,發(fā)文量1篇,該期刊在工程學(xué)學(xué)科的期刊影響因子中排名第7位,其次是JOURNAL OF POWER SOURCES,影響因子6.333,發(fā)文量7篇,該期刊在工程學(xué)學(xué)科的期刊影響因子中排名第10位。影響因子最低的刊物為,IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES,影響因子0.236,發(fā)文量1篇。名次居前的10種刊物影響因子平均值為5.142(表3)。但影響因子排位靠前的10種刊物中,僅刊載廣西大學(xué)論文41篇,占SCI論文總數(shù)的10.76%。
2005—2015年SCI所收錄的廣西大學(xué)工程學(xué)學(xué)科381篇論文,其中研究論文379篇,綜述2篇。SCI收錄廣西大學(xué)論文數(shù)量最多的10種刊物統(tǒng)計(表4),全部為國外刊物。這10種刊物的影響因子平均值為3.452。被SCI收錄廣西大學(xué)論文最多的刊物為“MATHEMATICAL PROBLEMS IN ENGINEERING”和“CHEMICAL ENGINEERING JOURNAL”,論文發(fā)文量分別為15篇和13篇;影響因子分別為0.644和5.310。因此,從總體上看SCI收錄廣西大學(xué)論文期刊的影響因子較低,所刊載論文在國際上的影響力也不大。endprint
3.5 SCI論文數(shù)量與年代發(fā)展關(guān)系的統(tǒng)計分析
從論文數(shù)量可以發(fā)現(xiàn)學(xué)校科研論文數(shù)量有了較大幅度提高,表明科研原創(chuàng)能力有了一定提高。廣西大學(xué)工程學(xué)學(xué)科從2014年進(jìn)入ESI全球前1%優(yōu)勢學(xué)科,至今,繼續(xù)保持進(jìn)入世界前1%的行列。圖3顯示,廣西大學(xué)工程學(xué)學(xué)科在2005—2015年10年被SCI所收錄的論文數(shù)量中,2015年被SCI收錄的論文最多,收錄了77篇,是2008年被收錄論文的8倍多,論文的收錄情況與年度發(fā)展發(fā)生了很大的變化,從2005—2008年,論文收錄呈現(xiàn)下降的趨勢,到2008—2015年,收錄出現(xiàn)增長的趨勢,特別是2013-2015年間,論文收錄的增幅都比以往大。這與學(xué)校從教學(xué)型大學(xué)轉(zhuǎn)型研究型大學(xué),以及學(xué)校承擔(dān)的各類科研課題數(shù)量增多、學(xué)??蒲兴胶蛯嵙φw快速發(fā)展是密切相關(guān)的。
3.6 學(xué)院貢獻(xiàn)度分析
學(xué)科貢獻(xiàn)度分析有助于對機(jī)構(gòu)內(nèi)二級單位學(xué)科規(guī)劃與調(diào)整。以廣西大學(xué)工程學(xué)學(xué)科為例,分析各二級單位(包含二級學(xué)院和國家級重點實驗室)對工程學(xué)學(xué)科的SCI論文貢獻(xiàn)度,得到該學(xué)科涉及校內(nèi)15個單位。對工程學(xué)學(xué)科貢獻(xiàn)比較大的單位主要集中7個單位(見表4),其中數(shù)學(xué)與信息科學(xué)學(xué)院貢獻(xiàn)度最大,其發(fā)表論文數(shù)量109篇,貢獻(xiàn)度占比29.54%,其次是土木建筑工程學(xué)院,其發(fā)表論文數(shù)量60篇,貢獻(xiàn)度占比16.26%。
4 總結(jié)與討論
Excel是一種常用的辦公軟件,方法簡單易用,數(shù)據(jù)呈現(xiàn)直觀,深受用戶喜歡,且不需要經(jīng)費購買,為圖書館節(jié)約了經(jīng)費。雖然有文章提到使用Excel對SCI論文及其引用數(shù)據(jù)進(jìn)行處理,但操作方法語焉不詳。本文通過詳細(xì)介紹Excel在學(xué)科服務(wù)統(tǒng)計中的操作步驟和具體應(yīng)用,對于剛剛開展或即將開展學(xué)科服務(wù)的大學(xué)有一定借鑒意義。通過綜合Excel對數(shù)據(jù)排序、篩選、分列、替換以及函數(shù)統(tǒng)計,輕松地把繁瑣的SCI論文字段信息按照要求進(jìn)行切分處理,但在切分處理時要注意以下幾點。
(1)按照下載的文獻(xiàn)排序順序添加記錄序號,并且每次按要求切分處理時都要跟著序號,這樣才能保證論文字段跟切分的字段內(nèi)容不會錯亂,也方便排序。
(2)論文字段內(nèi)容切分處理時最常用的功能是Excel表格的分列功能,那么在分列時要注意選擇相應(yīng)的分隔符。
(3)在使用Excel表格的篩選功能時,需要做相應(yīng)的標(biāo)記,便于把需要的內(nèi)容篩選出來。
(4)作者統(tǒng)計時,歸并同一作者不同的英文表達(dá)方式,便于重復(fù)項的去除。
Excel在處理SCI論文方面具有獨到的優(yōu)勢,如何在學(xué)科服務(wù)中更好地發(fā)揮它的功用,仍需要不斷地學(xué)習(xí)和摸索,今后可以通過研究Excel在共詞分析、聚類分析等復(fù)雜數(shù)據(jù)的分析,獲取研究熱點,同時,還可以通過研究更多的SPSS等常用軟件在學(xué)科服務(wù)中的應(yīng)用,借此推動文獻(xiàn)計量學(xué)的普及和應(yīng)用。
[參考文獻(xiàn)]
[1]國務(wù)院關(guān)于印發(fā)統(tǒng)籌推進(jìn)世界一流大學(xué)和一流學(xué)科建設(shè)總體方案的通知[EB/OL].[2016-11-16].http:∥www.gov.cn/zhengce/content/2015-11/05/content_10269.htm.
[2]中華人民共和國教育部.教育部2016年工作要點[EB/OL].[2016-11-16].http:∥www.moe.edu.cn/jyb_xwfb/moe_164/201602/t20160205_229511.html.
[3]師昌緒,田中卓,黃孝琪,等.科學(xué)引文索引(SCI):國際上評定科研成果的一種方法[J].科學(xué)通報,1997(8):888—894.
[4]賈 潔.基于SCI的學(xué)術(shù)研究發(fā)展分析[J].情報科學(xué),2009(4):581—587.
[5]董政娥,徐惠華,陳惠蘭.基于SCI-E數(shù)據(jù)庫分析東華大學(xué)科研發(fā)展[J].東華大學(xué)學(xué)報(自然科學(xué)版),2009(5):601—608.
[6]張 羽.1958—2003年SCI(科學(xué)引文索引)收錄遼寧大學(xué)論文統(tǒng)計與分析[J].遼寧大學(xué)學(xué)報:自然科學(xué)版,2005(1):82—85.
[7]邱嘉怡.2000—2006年SCI收錄和引用中山大學(xué)論文情況分析[J].科技情報開發(fā)與經(jīng)濟(jì),2008(3):3—5.
[8]匡登輝,王娟萍.從2007年SCI收錄南開大學(xué)論文看學(xué)科發(fā)展[J].圖書館工作與研究,2009(5):74—78.endprint