国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CiteSpace可視化分析的材料信息學(xué)研究進(jìn)展和趨勢

2021-06-28 00:14趙曉慧
現(xiàn)代信息科技 2021年1期
關(guān)鍵詞:文獻(xiàn)計量知識圖譜

摘? 要:材料信息學(xué)是實現(xiàn)新材料快速研發(fā)的重要手段,探明世界范圍內(nèi)材料信息學(xué)研究態(tài)勢可為中國在該領(lǐng)域發(fā)展提供參考。以2014—2020年Web of Science核心合集庫收錄的材料信息學(xué)領(lǐng)域文獻(xiàn)為研究對象,借助CiteSpace軟件繪制知識圖譜,從論文數(shù)量、地域、合作和被引報告等角度,報告了材料信息學(xué)研究現(xiàn)狀、前沿?zé)狳c與演化趨勢,進(jìn)行了材料信息學(xué)國際研究態(tài)勢調(diào)查。

關(guān)鍵詞:材料信息學(xué);知識圖譜;文獻(xiàn)計量;研發(fā)態(tài)勢

中圖分類號:TP391? ? ? 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2021)01-0121-04

Research Progress and Trend in Material Informatics Based on

CiteSpace Visual Analysis

ZHAO Xiaohui

(Library of Xian University of Science and Technology,Xian? 710054,China)

Abstract:Material informatics is an important means to realize the rapid research and development of new materials. Exploring the research trend of materials informatics in the world can provide reference for the development of China in this field. Taking the literatures in material informatics field included by Web of Science core collection library from 2014 to 2020 as research object,using the CiteSpace software to map knowledge graph,it reports the research status,front hotspot,evolutionary trends of material informatics from the angle of the number of papers,region,cooperation and cited reports,etc,and carries out the investigation of international research trend in materials informatics.

Keywords:material informatics;knowledge graph;bibliometrics;research and development trend

0? 引? 言

材料在人類歷史發(fā)展中處于重要地位,它是社會進(jìn)步的基石。尤其在近現(xiàn)代社會,材料科學(xué)研究已跨越了單純依靠經(jīng)驗和直覺的模式,實現(xiàn)了工藝、成分、結(jié)構(gòu)和性能間關(guān)系的模型化。隨著計算機(jī)技術(shù)在近幾十年里被引入材料科學(xué)研究中,以密度泛函理論(DFT)和分子動力學(xué)模擬(MD)為代表的計算方法產(chǎn)生了大量研究成果,但仍然受限于目前計算能力不足,時間成本較大等因素[1,2]。

當(dāng)前,無論實驗方法還是理論計算方法開發(fā)新材料速度均跟不上人們對材料性能的需要。尤其在當(dāng)前,研究方法在面對材料結(jié)構(gòu)與性能間復(fù)雜的非線性關(guān)系時已趨于瓶頸,亟須開發(fā)材料研究的新模式。材料信息學(xué)正是在此背景下出現(xiàn),它將信息學(xué)原理與材料科學(xué)研究有機(jī)結(jié)合在一起,通過對各種材料數(shù)據(jù)快速處理分析,來減少新材料在研發(fā)中所需時間和風(fēng)險。

材料信息學(xué)這一概念于2006年首次被公開提出[3],在概念提出后近8年時間(2006—2014年)里該領(lǐng)域發(fā)展較慢。這一方面因為材料基礎(chǔ)數(shù)據(jù)庫是作為開展材料信息學(xué)研究的保障,其體量巨大且結(jié)構(gòu)煩瑣,需要較長時間的積累和摸索。另一方面,材料信息學(xué)算法不夠成熟,難以對復(fù)雜的材料數(shù)據(jù)關(guān)系做出準(zhǔn)確判斷。近年來,隨著信息技術(shù)在生物、醫(yī)學(xué)、化學(xué)等領(lǐng)域的成功應(yīng)用,為材料信息學(xué)的發(fā)展提供了啟示,其發(fā)展正處于快速擴(kuò)張階段,但缺乏對其研究概況的理性、全面分析[4]。本文作者長期從事圖書信息相關(guān)研究工作,致力于國內(nèi)外新興研究領(lǐng)域的發(fā)展態(tài)勢研究。文中基于CiteSpace軟件[5,6],對材料信息學(xué)全球研究現(xiàn)狀、熱點和前沿進(jìn)行可視化分析,旨在使我國科研界緊抓材料信息學(xué)研究熱潮,鞏固和壯大我國在該領(lǐng)域研究上的國際地位。

1? 資料與方法

本論文研究數(shù)據(jù)取自Web of Science核心合集數(shù)據(jù)庫,限定檢索年限為2014—2020年,檢索主題詞為“materials informatics”,共計獲得836篇該領(lǐng)域的相關(guān)文獻(xiàn),選用其中的706篇“Article”作為進(jìn)一步研究對象。文獻(xiàn)記錄內(nèi)容選擇“全記錄與參考文獻(xiàn)”,選用“純文本”格式導(dǎo)出文獻(xiàn),導(dǎo)出數(shù)據(jù)中包含標(biāo)題、關(guān)鍵詞和參考文獻(xiàn)等相關(guān)信息。

使用CiteSpace v5.7.R5版本導(dǎo)入下載的文獻(xiàn)文件,對國家、機(jī)構(gòu)、關(guān)鍵詞、共被引文獻(xiàn)以及突現(xiàn)詞進(jìn)行分析。時間切片設(shè)置為1年,選擇閾值Top N=50,剪切方式為Prunning pathfinder功能(同時選擇Pruning sliced networks和Pruning the merged network)。利用模塊值(Q值>0.3)和平均輪廓值(S值>0.5)兩個指標(biāo)來評估知識圖譜繪制效果[5]。圖譜中顏色深淺反映年代變化;節(jié)點圓圈大小與其頻次高低呈正相關(guān);連線表示節(jié)點之間共現(xiàn)情況。

2? 結(jié)果與分析

2.1? 年發(fā)文量和發(fā)文國家、機(jī)構(gòu)分析

材料信息學(xué)研究在近7年內(nèi)共發(fā)表研究論文706篇,年發(fā)文量成線性上升趨勢,年均增長速度約22篇/年,如圖1所示??梢钥吹?,材料信息學(xué)研究仍處于發(fā)展的初始階段。其中2017年發(fā)文量有微弱回落,結(jié)合突現(xiàn)詞分析,可以發(fā)現(xiàn)2017年是一個轉(zhuǎn)折年,實現(xiàn)了生物醫(yī)學(xué)應(yīng)用中較成熟的數(shù)據(jù)信息技術(shù)應(yīng)用于材料科學(xué)中,故2017年后材料信息學(xué)主題發(fā)文量迅速恢復(fù)線性上升趨勢。

將國家(地區(qū))與機(jī)構(gòu)合并制作知識圖譜,共計形成308個節(jié)點與1 094根連線,如圖2所示。發(fā)文量前三名國家分別為美國(401篇)、中國(80篇)與日本(76篇);中心度前三名國家分別為中國(0.65)、美國(0.38)與瑞典(0.38)。高產(chǎn)機(jī)構(gòu)前三分別依次為日本國立材料研究所(28篇)、美國洛斯阿拉莫斯國家實驗室(24篇);佐治亞理工學(xué)院(各22篇)。中心度前三名為哈佛大學(xué)(0.65)、布列根和婦女醫(yī)院(0.44)和上海大學(xué)(0.43)。

綜合國家、機(jī)構(gòu)的發(fā)文量和中心度進(jìn)行分析,可以發(fā)現(xiàn)材料信息學(xué)的研究在地域上集中在中國、美國、日本和瑞典4個國家。尤其中國在材料信息學(xué)的研究上中心度居世界第1、發(fā)文量居世界第2,這其中上海大學(xué)的貢獻(xiàn)較為顯著,其于2012年初籌備成立了獨(dú)立的材料基因組工程研究院。應(yīng)該看到,我國在該領(lǐng)域的研究仍落后于美國,美國在2014—2020年期間發(fā)文量是我國發(fā)文量的5倍,且有包括洛斯阿拉莫斯國家實驗室、佐治亞理工學(xué)院、哈佛大學(xué)和布列根和婦女醫(yī)院等多個機(jī)構(gòu)表現(xiàn)突出,展現(xiàn)出雄厚實力。同時發(fā)文量排名第3位的日本與我國之間差距較小,故我國在該領(lǐng)域研究的國際地位并不穩(wěn)固。

2.2? 被引文獻(xiàn)和關(guān)鍵詞分析

高被引文獻(xiàn)和高中介中心性文獻(xiàn)是知識基礎(chǔ)的核心構(gòu)架,被認(rèn)為相關(guān)研究領(lǐng)域發(fā)展的知識拐點。結(jié)合被引文獻(xiàn)分析發(fā)現(xiàn),Jain A等[7]于2013年發(fā)表在APL Materials雜志上的論文被引用2 564次,標(biāo)題為“The Materials Project:A materials genome approach to accelerating materials innovation”。Faber等[8]的研究中介中心性最強(qiáng)(0.39),標(biāo)題為“Crystal structure representations for machine learning models of formation energies”。如圖3所示。

關(guān)鍵詞使用精煉表達(dá)來高度概括和凝練學(xué)術(shù)研究論文內(nèi)容和作者觀點,它是文獻(xiàn)研究內(nèi)容和核心價值的集中體現(xiàn),故關(guān)鍵詞分析是文獻(xiàn)研究的重要組成。關(guān)鍵詞分析產(chǎn)生17個聚類,獲得252個節(jié)點和818條連線,如圖4所示??梢暬治鼋Y(jié)果顯示Q值為0.714 4(>0.3),S值為0.913 3(>0.5),表明聚類效果較好。排名前10位的聚類依次為:醫(yī)學(xué)信息學(xué)、醫(yī)學(xué)信息學(xué)應(yīng)用、健康信息學(xué)、信息論、電子健康紀(jì)錄、材料信息學(xué)、設(shè)計、預(yù)測、近似、信息學(xué)。其中醫(yī)學(xué)信息學(xué)和醫(yī)學(xué)信息學(xué)應(yīng)用屬于同一類可合并,同樣可合并的有健康信息學(xué)和電子健康紀(jì)錄,以及出現(xiàn)了兩個材料信息學(xué)(materials informatics和material informatics),故實際聚類應(yīng)為11個。關(guān)鍵詞出現(xiàn)頻次前十名聚類依次為:材料信息學(xué)(109次)、信息學(xué)(104次)、設(shè)計(65次)、機(jī)器學(xué)習(xí)(60次)、系統(tǒng)(48次)、電子健康紀(jì)錄(37次)、護(hù)理(34次)、醫(yī)學(xué)信息學(xué)(41次)、預(yù)測(36次)、模型(31次)。

上述分析展示了目前材料信息學(xué)研究熱點。一是針對材料信息學(xué)的模型開發(fā),即材料數(shù)據(jù)庫的構(gòu)建和擴(kuò)展。2011年美國加州伯克利大學(xué)勞倫斯實驗室聯(lián)合麻省理工學(xué)院提出了構(gòu)建開源數(shù)據(jù)庫Material Project[7],其集合了各類材料的晶體結(jié)構(gòu)和物性參數(shù)(能帶、彈性模量和壓電張量等),并一直處于動態(tài)擴(kuò)充中。由于材料種類繁多且性能參數(shù)復(fù)雜,且不斷有新材料被開發(fā)出來,故該數(shù)據(jù)庫完善將會是一個長期且繁雜的工作,在擴(kuò)充數(shù)據(jù)庫的同時優(yōu)化數(shù)據(jù)庫結(jié)構(gòu)將在較長一段時間內(nèi)是本領(lǐng)域的研究熱點。

另一個熱點是材料信息學(xué)研究模型開發(fā)和應(yīng)用?;谏镄畔W(xué)發(fā)展經(jīng)驗,將其移植到材料信息學(xué)研究上,這是本領(lǐng)域早期發(fā)展的思路。但考慮到材料科學(xué)研究的獨(dú)特性,如何將材料科學(xué)原理融入數(shù)據(jù)模型中,使模型參數(shù)具有物理、化學(xué)意義,這是當(dāng)前模型開發(fā)的熱點。

2.3? 突現(xiàn)詞分析

突現(xiàn)詞是指關(guān)鍵詞出現(xiàn)頻率變化率高的詞,它在一定程度上能表明某個研究領(lǐng)域的前沿,根據(jù)突現(xiàn)詞的主題與時間跨度可劃分為兩個階段,如圖5所示。在2016年前,突現(xiàn)詞為本體論(ontology)、系統(tǒng)(system)、電子醫(yī)學(xué)記錄(electronic medical record)和未來(future),突現(xiàn)詞與材料科學(xué)間跨度較大;2017年至今,突現(xiàn)詞為回歸(regression)、合金(alloy)、數(shù)據(jù)庫等(database)等,可以看到材料與數(shù)據(jù)處理逐步結(jié)合起來。

基于突現(xiàn)詞結(jié)果分析,發(fā)現(xiàn)合金(alloy)作為一種具體材料出現(xiàn)在關(guān)鍵詞中,表明針對這類較為成熟的材料研究出現(xiàn)了新動向。這一方面可能因為合金材料的結(jié)構(gòu)和物性數(shù)據(jù)庫的完善度較高,利于開展研究;另一方面,使用傳統(tǒng)手段研究合金材料難于創(chuàng)新,迫切需要新研究方法來實現(xiàn)突破,以滿足國防、生產(chǎn)等對合金材料高性能的要求。使用材料信息學(xué)方法研發(fā)非晶態(tài)金屬和高熵合金已獲得較多成果。

3? 結(jié)? 論

基于CiteSpace軟件對材料信息學(xué)相關(guān)主題文獻(xiàn)的可視化分析,從該領(lǐng)域的國際研究趨勢、熱點與前沿,給我國的材料信息學(xué)發(fā)展提供了一定啟發(fā)??梢钥吹?,材料數(shù)據(jù)庫是發(fā)展材料信息學(xué)的基石,但當(dāng)前最大、最全面的材料數(shù)據(jù)庫(Material Project)是由美國科研機(jī)構(gòu)開發(fā)的,我國在這方面缺乏原創(chuàng),基本還處于跟跑階段,這可能會導(dǎo)致發(fā)展后勁不足。另外,當(dāng)代材料科學(xué)家需要拓展思維,有意識地將材料信息學(xué)引入其日常研究中,除了提升自身研究實力外,還可將研究結(jié)果貢獻(xiàn)到材料信息學(xué)數(shù)據(jù)庫中,為其發(fā)展貢獻(xiàn)力量。

盡管近年來材料信息學(xué)研究已取得令人矚目的研究成果,但其仍處于發(fā)展初期,其未來發(fā)展可能主要依賴于以下幾方面的進(jìn)步。一是材料信息學(xué)預(yù)測材料的可靠性需進(jìn)一步提高,這也是科學(xué)家們對其期待較高的原因之一。但在實際過程中往往需處理非正常數(shù)據(jù),這對當(dāng)前研究方法提出了更高挑戰(zhàn)。二是材料數(shù)據(jù)庫完善和共享,可以看到,材料數(shù)據(jù)庫異常龐大,需要全世界的科學(xué)家們長時間共同積累來實現(xiàn)。故其是全世界的財富,全面和未加限制的共享材料數(shù)據(jù)庫是材料信息學(xué)發(fā)展的重要保障。三是針對材料領(lǐng)域大數(shù)據(jù)的先進(jìn)算法開發(fā),這需要具有材料、計算機(jī)、通信等多學(xué)科專業(yè)背景的復(fù)合人才來實現(xiàn)。

本研究僅考慮Web of Science數(shù)據(jù)庫的相關(guān)論文,且未考慮材料學(xué)科與其他學(xué)科的交叉領(lǐng)域,如化學(xué)信息學(xué)、物理信息學(xué)等也會部分涉及材料學(xué)科。建議今后研究可增加國內(nèi)數(shù)據(jù)庫進(jìn)行更為全面的分析,將材料化學(xué)信息(如金屬有機(jī)骨架材料等)和材料物理信息(如基于自旋構(gòu)型的磁性材料等)等結(jié)合到材料信息學(xué)的前沿和熱點研究分析上,獲得更加全面的研究結(jié)果。

參考文獻(xiàn):

[1] 孫蘇陽,王曉哲.數(shù)據(jù)與理論共舞:計算材料學(xué)推動高效體系化新材料設(shè)計——計算材料學(xué)分論壇側(cè)記 [J].中國材料進(jìn)展,2020,39(11):824-825.

[2] ZHENG B,MAURIN G. Mechanical Control of the Kinetic Propylene/Propane Separation by Zeolitic Imidazolate Framework-8 [J].Angewandte Chemie International Edition,2019,58:13734–13738.

[3] RODGERS J R,CEBON D. Materials Informatics [J].MRS Bulletin,2006,31(12):975-977.

[4] 牛程程,李少波,胡建軍,等.機(jī)器學(xué)習(xí)在材料信息學(xué)中的應(yīng)用綜述 [J].材料導(dǎo)報,2020,34(23):23100-23108.

[5] 陳悅,陳超美,劉則淵,等.CiteSpace知識圖譜的方法論功能 [J].科學(xué)學(xué)研究,2015,33(2):242-253.

[6] 胡志剛,陳超美,劉則淵,等.從基于引文到基于引用——一種統(tǒng)計引文總被引次數(shù)的新方法 [J].圖書情報工作,2013,57(21):5-10.

[7] JAIN A,ONG S P,HAUTIER G,et al. Commentary:The Materials Project:A materials genome approach to accelerating materials innovation [J].APL Materials,2013,1(1):[2020-11-05].https://aip.scitation.org/doi/10.1063/1.4812323.DOI:10.1063/1.4812323.

[8] FABER F,LINDMAA A H G,LILIENFELD A V,et al. Crystal structure representations for machine learning models of formation energies [J].International Journal of Quantum Chemistry,2015,115(16):1094-1101.

作者簡介:趙曉慧(1985—),女,漢族,遼寧海城人,圖書館員,研究方向:圖書情報學(xué)。

猜你喜歡
文獻(xiàn)計量知識圖譜
基于文獻(xiàn)計量的數(shù)據(jù)素養(yǎng)及其教育領(lǐng)域研究態(tài)勢分析
國內(nèi)電子商務(wù)學(xué)術(shù)研究進(jìn)展分析
我國醫(yī)學(xué)數(shù)字圖書館研究的文獻(xiàn)計量分析
國內(nèi)外智庫研究態(tài)勢知識圖譜對比分析
國內(nèi)圖書館嵌入式服務(wù)研究主題分析
國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢
基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
基于文獻(xiàn)計量分析我國生物科學(xué)素養(yǎng)研究狀況(2001~2016年)
基于知識圖譜的智慧教育研究熱點與趨勢分析