凌曦 趙志剛 李新剛
中圖分類號(hào) R-1 文獻(xiàn)標(biāo)志碼 A 文章編號(hào) 1001-0408(2019)04-0433-06
DOI 10.6039/j.issn.1001-0408.2019.04.01
摘 要 目的:了解人工智能(AI)技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的研究概況、熱點(diǎn)及前沿進(jìn)展,為我國相關(guān)研究的發(fā)展提供思路。方法:采用文獻(xiàn)計(jì)量學(xué)方法,在Web of Science數(shù)據(jù)庫中檢索1998-2017年發(fā)表的相關(guān)期刊和會(huì)議論文(檢索詞為“Article”和“Proceeding Paper”);利用ISI Web of Knowledge自帶的分析檢索結(jié)果及創(chuàng)建引文報(bào)告功能,結(jié)合CiteSpace 5.2.R1軟件繪制知識(shí)圖譜,對(duì)目標(biāo)文獻(xiàn)進(jìn)行定量統(tǒng)計(jì)和定性分析,對(duì)該領(lǐng)域研究的發(fā)文量、共被引情況、主要研究國家/地區(qū)、主要研究機(jī)構(gòu)、主要研究者、研究熱點(diǎn)及研究前沿進(jìn)行歸納總結(jié)。結(jié)果:共檢索得3 674篇相關(guān)文獻(xiàn)。1998-2017年期間該領(lǐng)域文獻(xiàn)數(shù)量飛速增長(zhǎng);美國、中國、英國和德國因發(fā)文量大而占據(jù)領(lǐng)先地位,但中國的國際合作明顯較少,且缺乏優(yōu)秀核心團(tuán)隊(duì);從研究者角度看,該領(lǐng)域研究處于“部分集中、整體分散”的狀態(tài),缺乏團(tuán)隊(duì)合作。該領(lǐng)域的研究熱點(diǎn)包括AI技術(shù)的重要核心(機(jī)器學(xué)習(xí)算法)以及其在藥學(xué)領(lǐng)域的主要運(yùn)用(藥物發(fā)現(xiàn)及設(shè)計(jì)),還有疾病或不良反應(yīng)診斷分級(jí)、藥學(xué)模型的建立和優(yōu)化、藥物篩選或藥效預(yù)測(cè)、藥學(xué)數(shù)據(jù)庫的建立等;近年來的研究前沿包括“分子對(duì)接”“機(jī)器學(xué)習(xí)”“Meta分析”“精準(zhǔn)用藥” “靶向治療”等。結(jié)論:AI技術(shù)在藥學(xué)領(lǐng)域的應(yīng)用是一個(gè)時(shí)效性極強(qiáng)的熱門研究領(lǐng)域,其應(yīng)用于醫(yī)藥產(chǎn)業(yè)開發(fā)是大勢(shì)所趨,而我國在該領(lǐng)域的研究現(xiàn)狀與國際前沿水平仍存在一定差距。這需要我國藥學(xué)工作者在做好實(shí)驗(yàn)研究和臨床試驗(yàn)等基礎(chǔ)工作的同時(shí),加強(qiáng)與AI領(lǐng)域?qū)<业牡慕涣骱秃献?,以適應(yīng)AI技術(shù)與藥學(xué)緊密結(jié)合發(fā)展的國際趨勢(shì)。
關(guān)鍵詞 人工智能;藥學(xué);知識(shí)圖譜;可視化;文獻(xiàn)計(jì)量分析;研究熱點(diǎn);研究前沿
ABSTRACT OBJECTIVE: To investigate the research status,hotspots and frontiers of the artificial intelligence (AI) technology applicated in pharmaceutical field, and to provide ideas for the development of related research in China. METHODS: Using bibliometric method, relevant journals and proceeding papers from 1998 to 2017 were searched from Web of Science database (“Article” and “Proceeding Paper” as retrieval words). Using analysis and retrieval results of ISI Web of Knowledge and its function of creating citation report, CiteSpace 5.2.R1 software was employed to draw knowledge map; quantitative statistics and qualitative analysis was conducted to summarized the research volume, co-citation, main research countries/areas, main research institutions, main researchers, research hotspots and research frontiers in this field. RESULTS: A total of 3 674 related literatures were retrieved, and the number of global published literatures in this field increased rapidly from 1998 to 2017; the dominant nations included America, China, Britain and Germany because of their large number of publications,but China showd an obvious lack of international cooperation and excellent core teams. From the researcher’s point of view, the research in this field was in a state of “partially concentrated and overall dispersed” and lacked team cooperation. The research hotspots contained important core of AI technology (machine learning algorithms) and its application in pharmaceutical field (drug discovery and design), the classification of disease or adverse drug reaction, the establishment and optimization of pharmaceutical mode, drugs screening or pharmacodynamics prediction, the estbalishment of pharmaceutical database, etc. The recent research frontiers included “molecular docking” “machine learning” “Meta analysis” “precision medicine” “targeted therapy”, etc. CONCLUSIONS: AI applicated in pharmaceutical field is a hot research field with strong timeliness, and its application in the development of pharmaceutical industry is the general trend. However, there is still a gap between the current research level in this field in China and the international frontier research. In order to adapt to the international trend of the combination of AI technology and pharmacy, pharmacists in China should strengthen their cooperation with researchers in AI fields while doing well the basic work of experimental research and clinical trials,etc.
KEYWORDS Artificial intelligence; Pharmacy; Knowledge map; Visualization; Bibliometric analysis; Research hotspots; Research frontiers
隨著信息科技的高速發(fā)展,作為當(dāng)今世界三大尖端技術(shù)之一的人工智能(Artificial intelligence,AI)自1956年提出以來,已獲得廣泛的傳播和發(fā)展,并滲透于各行各業(yè)之中。2018年4月,我國教育部更是積極部署行動(dòng)計(jì)劃促進(jìn)AI的多學(xué)科交叉融合,并計(jì)劃至2020年,實(shí)現(xiàn)AI總體技術(shù)和應(yīng)用與世界先進(jìn)水平持平[1]。AI是以人類智能的相關(guān)理論為基礎(chǔ),運(yùn)用大數(shù)據(jù)和機(jī)器學(xué)習(xí)等方法,模擬和延伸人類智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門邊緣學(xué)科;其分支領(lǐng)域還包括數(shù)據(jù)庫、數(shù)據(jù)挖掘、統(tǒng)計(jì)學(xué)、知識(shí)發(fā)現(xiàn)、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)等[2],目前已被廣泛應(yīng)用于語言識(shí)別、智能終端、移動(dòng)商務(wù)、醫(yī)療健康等諸多領(lǐng)域。其中,醫(yī)療健康領(lǐng)域目前存在優(yōu)質(zhì)資源不足、醫(yī)療成本高、醫(yī)生培養(yǎng)和藥品研發(fā)周期長(zhǎng)等現(xiàn)實(shí)問題,因此AI技術(shù)在該領(lǐng)域尤其展現(xiàn)出巨大潛力和可觀前景[3],世界范圍各大科技巨頭如谷歌、IBM等都爭(zhēng)相布局AI醫(yī)療市場(chǎng)。
藥學(xué)領(lǐng)域作為最早應(yīng)用AI技術(shù)的醫(yī)療健康領(lǐng)域,在健康管理、輔助診療、藥物挖掘、藥品調(diào)配甚至臨床合理用藥等諸多方面,都已經(jīng)實(shí)現(xiàn)了AI技術(shù)的廣泛應(yīng)用和發(fā)展。AI技術(shù)可用于完善對(duì)患者的健康風(fēng)險(xiǎn)識(shí)別(如CaféWell Health健康優(yōu)化平臺(tái)[4])、智能用藥監(jiān)測(cè)及不良反應(yīng)風(fēng)險(xiǎn)評(píng)估(如計(jì)算機(jī)輔助的貝葉斯不良反應(yīng)診斷系統(tǒng)[5])、輔助臨床治療藥物檢測(cè)[6]、臨床用藥咨詢[7]、合理化藥物設(shè)計(jì)(如計(jì)算機(jī)輔助藥物設(shè)計(jì)[8])、提高新藥研發(fā)轉(zhuǎn)化效率[9]、提供新的藥物靶向手段(如飛利浦“蜂群”機(jī)器人[10]),乃至于綜合分析患者各類臨床信息及藥物經(jīng)濟(jì)學(xué)數(shù)據(jù),形成科學(xué)合理的個(gè)體化處方意見[11]?;贏I技術(shù)在藥學(xué)領(lǐng)域中的快速發(fā)展和成果轉(zhuǎn)化,為深入了解其研究現(xiàn)狀及發(fā)展趨勢(shì),本文通過檢索相關(guān)文獻(xiàn),運(yùn)用多元分時(shí)動(dòng)態(tài)的可視化圖譜軟件CiteSpace,對(duì)全球AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的熱點(diǎn)研究及前沿方向等進(jìn)行分析,為相關(guān)技術(shù)的研發(fā)應(yīng)用提供參考。
1 資料來源
本研究數(shù)據(jù)來源于科學(xué)引文索引(Science Citation Index,SCI)網(wǎng)站W(wǎng)eb of Science(簡(jiǎn)稱“WOS數(shù)據(jù)庫”)核心合集中的SCI-EXPANDED數(shù)據(jù)庫[12],該數(shù)據(jù)庫收錄的文獻(xiàn)具有高質(zhì)量、低冗余、易適配的特點(diǎn),廣受學(xué)術(shù)界認(rèn)可[13]。數(shù)據(jù)庫更新時(shí)間為2018年4月9日。本研究檢索策略為“TS=(("artificial intelligence" OR "machine intelligence" OR "machine learn*" OR "neurocomputing" OR "virtual assistan*" OR "robot*" OR "artificial neural network*")AND(medication* OR drug* OR pharm*))”,語種選擇“English”,時(shí)間跨度為1998-2017年,限定文獻(xiàn)類型為“Article”和“Proceeding Paper”(即期刊與會(huì)議論文)。所得文獻(xiàn)以全記錄格式進(jìn)行保存。由兩名研究者對(duì)文獻(xiàn)的題目和摘要逐一閱讀,排除重復(fù)、信息缺損及非相關(guān)性文獻(xiàn),最終保留3 674條文獻(xiàn)記錄。
2 方法
知識(shí)圖譜是一門通過數(shù)據(jù)收集、信息挖掘、科學(xué)計(jì)量和圖形繪制等手段來可視化地展現(xiàn)某個(gè)領(lǐng)域研究基礎(chǔ)和前沿的現(xiàn)代理論[14];繪制知識(shí)圖譜常用的軟件包括CiteSpace、Sci2Tool、Bibexel等。其中,CiteSpace是由美國知名學(xué)者陳超美博士開發(fā)的一款信息可視化分析軟件,可在權(quán)威數(shù)據(jù)庫支持下分析并尋找某一學(xué)科領(lǐng)域的研究熱點(diǎn)及發(fā)展趨勢(shì),是有效的知識(shí)導(dǎo)航工具[15]。本研究利用ISI Web of Knowledge自帶的分析檢索結(jié)果及創(chuàng)建引文報(bào)告功能,結(jié)合CiteSpace 5.2.R1軟件,對(duì)目標(biāo)文獻(xiàn)進(jìn)行定量統(tǒng)計(jì)和定性分析,對(duì)該領(lǐng)域研究的發(fā)文量、共被引情況、主要研究國家/地區(qū)、主要研究機(jī)構(gòu)、主要研究者、研究熱點(diǎn)及研究前沿進(jìn)行歸納總結(jié)。
3 結(jié)果
3.1 AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的研究概況
3.1.1 文獻(xiàn)發(fā)表數(shù)量 AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的第一篇SCI文獻(xiàn)發(fā)表于1992年,彼時(shí)正處于AI研究的低谷期[16],故直至1997年該領(lǐng)域發(fā)文量仍不足50篇。1998-2017年該領(lǐng)域年發(fā)文量和年引文量的分布情況見圖1。由圖1可見,20年內(nèi)該領(lǐng)域發(fā)文量增長(zhǎng)了9倍之多,引文量亦逐年上升,表明這一時(shí)期AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的研究呈現(xiàn)出飛速發(fā)展的態(tài)勢(shì)。20世紀(jì)之后,計(jì)算機(jī)硬件技術(shù)的突破性發(fā)展促成了AI技術(shù)的革新,而后大數(shù)據(jù)和深度學(xué)習(xí)的興起更是帶動(dòng)了AI領(lǐng)域的快速發(fā)展[17]。本研究目標(biāo)文獻(xiàn)發(fā)文量的激增也印證了AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的研究與AI技術(shù)發(fā)展軌跡具有一致性,也提示該領(lǐng)域有良好的發(fā)展前景和研究?jī)r(jià)值。
3.1.2 文獻(xiàn)共被引和知識(shí)基礎(chǔ)分析 文獻(xiàn)之間通過相互引證實(shí)現(xiàn)該領(lǐng)域發(fā)展的積累、連續(xù)和傳承,同被一篇文獻(xiàn)引用的關(guān)系結(jié)構(gòu)可形成共被引網(wǎng)絡(luò)圖譜[18],其中的關(guān)鍵文獻(xiàn)和奠基文獻(xiàn)則構(gòu)成了該領(lǐng)域的知識(shí)基礎(chǔ)[19]。在CiteSpace軟件中選擇網(wǎng)絡(luò)節(jié)點(diǎn)為“Cited Reference”,其余設(shè)置從略,結(jié)果獲得AI技術(shù)與藥學(xué)領(lǐng)域研究的共被引文獻(xiàn)網(wǎng)絡(luò)圖譜(圖2)及其時(shí)間序列分布圖譜(圖3)。
圖2和圖3中每個(gè)圓形節(jié)點(diǎn)代表一篇文獻(xiàn),節(jié)點(diǎn)的大小反映其被引頻次的高低;節(jié)點(diǎn)年輪最外圈的顏色深度則表明該文獻(xiàn)具有較高的中介中心性(中介中心性的高低代表該節(jié)點(diǎn)在聯(lián)系整個(gè)網(wǎng)絡(luò)中發(fā)揮的作用大小,以中心度來表示);而關(guān)鍵節(jié)點(diǎn)一般是被引頻次和中心度均較高的節(jié)點(diǎn),提示該文獻(xiàn)具有重要的學(xué)術(shù)價(jià)值[20]。
圖2中最大的關(guān)鍵節(jié)點(diǎn)是2011年臺(tái)灣大學(xué)Chang CC發(fā)表于《ACM Transactions on Intelligent Systems and Technology》雜志上的關(guān)于支持向量機(jī)(SVM)模式識(shí)別與回歸的軟件一文,共被引70次,中心度為0.45。該文提出的SVM一度被認(rèn)為是在深度學(xué)習(xí)出現(xiàn)之前機(jī)器學(xué)習(xí)最經(jīng)典的算法,至今仍廣泛運(yùn)用于疾病診療、計(jì)算機(jī)輔助藥物設(shè)計(jì)等醫(yī)藥工作中[21]。其他高影響力文獻(xiàn)還有2009年Hall M等發(fā)表的《WEKA數(shù)據(jù)挖掘軟件更新》一文,該文所涉及的軟件可為循證醫(yī)學(xué)、疾病診斷、藥物相互作用及不良反應(yīng)等提供證據(jù)支持;2012年Gaulton A等在《Nucleic Acids Research》雜志上發(fā)表了一篇文章,是關(guān)于建立ChEMBL數(shù)據(jù)庫,而這一數(shù)據(jù)庫通過機(jī)器采集了超過100萬種生物活性物質(zhì)的代謝和功能信息,為藥物研發(fā)等工作提供了極大幫助;2010年Rogers D等發(fā)表的《Extended-Connectivity Fingerprints》一文更是為計(jì)算機(jī)輔助藥物結(jié)構(gòu)-活性設(shè)計(jì)增加了重要助力。
由圖3可見,AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的第一篇奠基性文獻(xiàn)發(fā)表于1990年,是由Buick AR等提出的生物分析實(shí)驗(yàn)的方法學(xué)驗(yàn)證理論,該文為后期藥物濃度的自動(dòng)化檢測(cè)提供了依據(jù)。中心度較高的知識(shí)基礎(chǔ)性文獻(xiàn)還包括90年代關(guān)于神經(jīng)網(wǎng)絡(luò)的著作,神經(jīng)網(wǎng)絡(luò)是仿生學(xué)派建立的機(jī)器學(xué)習(xí)算法,更是深度學(xué)習(xí)的前身。1999年Zupan J 等撰寫有關(guān)神經(jīng)網(wǎng)絡(luò)在化學(xué)和藥物設(shè)計(jì)中的應(yīng)用,為AI在藥學(xué)領(lǐng)域中的延伸奠定又一堅(jiān)實(shí)基礎(chǔ)。圖3中還可見以2009年為界,目標(biāo)文獻(xiàn)的研究方向和主題有了較大的不同,提示2009年后該領(lǐng)域的研究有了突破性進(jìn)展,形成了新的研究成果核心。
3.1.3 主要研究國家/地區(qū)及機(jī)構(gòu)分析 將CiteSpace中節(jié)點(diǎn)類型設(shè)置為“國家和地區(qū)”,其余設(shè)置從略,分析獲知AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的研究共涉及60個(gè)國家/地區(qū)。不同國家/地區(qū)的研究實(shí)力不盡相同,發(fā)文量排名前10位的國家/地區(qū)的發(fā)文量及中心度見表1。由表1可見,美國在該領(lǐng)域的文獻(xiàn)產(chǎn)量明顯高于其他國家/地區(qū),其中心度也遠(yuǎn)高于其他國家/地區(qū),表明其與全球研究機(jī)構(gòu)間聯(lián)系最多,有豐富的合作關(guān)系;中國發(fā)文量位居第2位,但中心度遠(yuǎn)低于其他國家/地區(qū),可見與其他國家/地區(qū)間的學(xué)術(shù)合作或交流較少;此外,英國、德國等歐洲國家在該領(lǐng)域亦發(fā)文較多且合作密切,具有較高的研究地位。
此外,將CiteSpace中節(jié)點(diǎn)類型設(shè)置為“機(jī)構(gòu)”,其余設(shè)置從略,分析獲得研究機(jī)構(gòu)合作網(wǎng)絡(luò)圖譜(圖4),可展示出AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的研究核心機(jī)構(gòu)及合作情況。該圖譜將各機(jī)構(gòu)的文獻(xiàn)數(shù)量及發(fā)表時(shí)間通過節(jié)點(diǎn)年輪的大小和顏色深度直觀呈現(xiàn)出來,字體的大小反映了該機(jī)構(gòu)總發(fā)文量的多少,而節(jié)點(diǎn)間的連線粗細(xì)則反映了機(jī)構(gòu)間合作的強(qiáng)度[22]。由圖4可見,該研究領(lǐng)域影響力最大的機(jī)構(gòu)為美國哈佛大學(xué),其研究時(shí)間最早、發(fā)文量大且合作關(guān)系眾多;同樣具備這些特點(diǎn)的還包括斯坦福大學(xué)、密歇根大學(xué)、中國科學(xué)院等機(jī)構(gòu)。
3.1.4 主要研究者分析 共有14 360位研究者參與了AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的研究。將節(jié)點(diǎn)類型設(shè)置為“作者”,其余設(shè)置從略,通過CiteSpace繪制作者合作網(wǎng)絡(luò)圖譜(圖5),可識(shí)別該領(lǐng)域的核心作者及其之間的合作情況[23]。該圖譜中節(jié)點(diǎn)年輪的顏色深度及其大小反映了文獻(xiàn)發(fā)表的時(shí)間和數(shù)量,字體的深淺也反映出作者的影響力大小。從作者角度看,該領(lǐng)域研究處于“部分集中、整體分散”的狀態(tài),缺乏團(tuán)隊(duì)合作;結(jié)合作者被引頻次結(jié)果(圖表從略),美國馬里蘭大學(xué)的Ekins S、瑞士羅氏公司的Schneider G、日本城西大學(xué)的Takayama K以及中國廣西大學(xué)的Chou KC等作者發(fā)文量大且被引頻次較高,在該領(lǐng)域具有較大影響力;西班牙圣地亞哥綜合大學(xué)的Gonzalez-Diaz H發(fā)文較多、被引頻次較少,但其團(tuán)隊(duì)合作較多,一定程度上也增強(qiáng)了其研究地位。
3.2 AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的研究熱點(diǎn)分析
關(guān)鍵詞是作者用來高度概括核心論點(diǎn)的語句,其分布頻次和特點(diǎn)可體現(xiàn)研究領(lǐng)域的總體特征、研究熱點(diǎn)間的相互聯(lián)系和發(fā)展趨勢(shì)[24]。將CiteSpace中節(jié)點(diǎn)類型設(shè)置為“關(guān)鍵詞”,聚類詞類型設(shè)置為“名詞短語”,分析獲得AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域研究的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜(圖6)。該圖譜中三角形的大小和顏色深度代表該關(guān)鍵詞出現(xiàn)的頻次和時(shí)間,字體的深淺也反映了頻次的高低。采用CiteSpace對(duì)關(guān)鍵詞的出現(xiàn)頻次進(jìn)行統(tǒng)計(jì)分析,結(jié)果出現(xiàn)頻次最高的關(guān)鍵詞為“Neural network”,其次為“Machine-learning”“Discovery”“Prediction”“Classification”“Design”等(表2),分別反映了AI技術(shù)的重要核心(機(jī)器學(xué)習(xí)算法)以及其在藥學(xué)領(lǐng)域的主要運(yùn)用(藥物發(fā)現(xiàn)及設(shè)計(jì));其他研究熱點(diǎn)還包括:疾病或不良反應(yīng)診斷分級(jí)、藥學(xué)模型的建立和優(yōu)化、藥物篩選或藥效預(yù)測(cè)、藥學(xué)數(shù)據(jù)庫的建立等。中心度較高的關(guān)鍵詞如“Discovery”“Design”,則提示有多個(gè)研究領(lǐng)域的研究與藥物的發(fā)現(xiàn)或設(shè)計(jì)有關(guān),即具有一定的學(xué)科交叉性[25]。
3.3 AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的研究前沿進(jìn)展
通過CiteSpace可以發(fā)現(xiàn)時(shí)間軸上頻次變化率高的詞匯,并將其從大量關(guān)題詞中提取出來,進(jìn)行膨脹詞(Burst,表示某個(gè)學(xué)科中研究興趣強(qiáng)度驟然增加的專業(yè)術(shù)語)檢測(cè)。Burst是研究前沿留下的印記,通過分析它們可以發(fā)現(xiàn)該領(lǐng)域研究的前沿領(lǐng)域及發(fā)展趨勢(shì)[26]。研究領(lǐng)域發(fā)展越迅速,其膨脹強(qiáng)度越高。采用CiteSpace對(duì)圖6中的關(guān)題詞進(jìn)行Burst檢測(cè),結(jié)果共發(fā)現(xiàn)了103個(gè)膨脹詞,可見這是一個(gè)復(fù)雜且迅速發(fā)展的領(lǐng)域。膨脹強(qiáng)度排名前4位關(guān)題詞見表3。由表3可見,分子對(duì)接(Molecular docking)的膨脹強(qiáng)度最高。分子對(duì)接屬于計(jì)算機(jī)輔助藥物設(shè)計(jì)領(lǐng)域,有較為長(zhǎng)久的研究歷史,但近兩年又一次備受關(guān)注,可能與Machine-learning(機(jī)器學(xué)習(xí))的新進(jìn)展有關(guān);而Mass spectrometry(質(zhì)譜法)和In silico(計(jì)算機(jī)生物模擬實(shí)驗(yàn))則是早幾年的研究熱點(diǎn)。
采用CiteSpace將圖6中關(guān)鍵詞以時(shí)間序列圖譜的形式展開(見圖7)。該圖譜中,關(guān)鍵詞按出現(xiàn)時(shí)間的先后順序,從左到右、從下到上排列,其字體的大小反映了關(guān)鍵詞出現(xiàn)頻次的高低。由圖7可見,AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域在不同時(shí)期有不同的研究前沿?,F(xiàn)時(shí)期的研究前沿包括乳腺癌、計(jì)分公式、納米粒、數(shù)據(jù)庫、定量構(gòu)效關(guān)系(QSAR)模型、Meta分析等,而精準(zhǔn)用藥和靶向治療無疑是2015年來最重要的研究前沿之一。
4 結(jié)語
筆者依據(jù)文獻(xiàn)計(jì)量學(xué)的相關(guān)理論,借助CiteSpace可視化分析工具,以WOS數(shù)據(jù)庫近20年收錄的AI技術(shù)應(yīng)用于藥學(xué)領(lǐng)域的研究文獻(xiàn)為數(shù)據(jù)來源,用知識(shí)圖譜的方法直觀展現(xiàn)并分析了該領(lǐng)域研究的發(fā)文量及發(fā)文時(shí)間、知識(shí)基礎(chǔ)、研究國家/地區(qū)、研究機(jī)構(gòu)、研究者、研究熱點(diǎn)以及研究前沿。結(jié)果發(fā)現(xiàn),20年來已有越來越多的國家、機(jī)構(gòu)和研究者投身這一領(lǐng)域的研究,發(fā)表的相關(guān)文獻(xiàn)數(shù)量增長(zhǎng)速度越來越快,期間不乏優(yōu)異的研究著作為該領(lǐng)域的發(fā)展打下了堅(jiān)實(shí)的基礎(chǔ)。從世界格局來看,美國、中國、英國和德國因發(fā)文量大而占據(jù)領(lǐng)先地位,但我國相關(guān)研究的中介中心性偏低,以我國和日本等為代表的亞洲國家與歐美國家間的學(xué)術(shù)壁壘亦確實(shí)存在,因此加強(qiáng)國際合作應(yīng)作為我國藥學(xué)研究人員在此領(lǐng)域發(fā)展的重要方針。美國在該領(lǐng)域具有壓倒性的領(lǐng)先優(yōu)勢(shì),哈佛大學(xué)、斯坦福大學(xué)和密歇根大學(xué)等高校均頗有建樹,相比之下我國僅中國科學(xué)院一枝獨(dú)秀,因此亟需更多優(yōu)秀的國內(nèi)核心團(tuán)隊(duì)投入該領(lǐng)域研究中。Ekins S、Schneider G、Takayama K以及Chou KC等都是該領(lǐng)域的優(yōu)秀學(xué)者,但總體來看該領(lǐng)域仍舊缺乏團(tuán)隊(duì)合作。該領(lǐng)域的研究熱點(diǎn)包括機(jī)器學(xué)習(xí)算法、藥物發(fā)現(xiàn)及設(shè)計(jì)、疾病或不良反應(yīng)診斷分級(jí)、藥學(xué)模型的建立和優(yōu)化、藥物篩選或藥效預(yù)測(cè)、藥學(xué)數(shù)據(jù)庫的建立等;近年來研究前沿包括分子對(duì)接、機(jī)器學(xué)習(xí)、乳腺癌、計(jì)分公式、納米粒、數(shù)據(jù)庫、QSAR模型、Meta分析、精準(zhǔn)用藥和靶向治療等。
總而言之,AI是對(duì)人類思維過程的模擬,其應(yīng)用于醫(yī)藥產(chǎn)業(yè)開發(fā)是大勢(shì)所趨,在藥學(xué)領(lǐng)域的研究實(shí)施和決策制定過程中可起到至關(guān)重要的作用,這不僅僅體現(xiàn)在計(jì)算、檢測(cè)、統(tǒng)計(jì)、建模等弱AI技術(shù)的廣泛運(yùn)用,更彰顯于自然語言處理、專家決策系統(tǒng)、醫(yī)學(xué)影像識(shí)別等復(fù)雜算法的快速發(fā)展中。2018年谷歌公司表示,其AlphaFold項(xiàng)目可根據(jù)基因編碼預(yù)測(cè)蛋白質(zhì)的3D結(jié)構(gòu)[27],若該技術(shù)成熟,極可能促進(jìn)藥物分子設(shè)計(jì)、藥理毒理試驗(yàn)、個(gè)體化治療等研究的突破,同時(shí)大大減少研究成本、縮短研究周期。讓計(jì)算機(jī)學(xué)會(huì)“思考”并深入醫(yī)藥衛(wèi)生科學(xué)領(lǐng)域,無疑是藥學(xué)研究人員面臨的一場(chǎng)重大機(jī)遇和挑戰(zhàn)。然而我國在該領(lǐng)域的研究現(xiàn)狀與國際前沿水平仍存在一定差距。這提示我國藥學(xué)工作者應(yīng)時(shí)刻提升自身素養(yǎng),學(xué)習(xí)新的軟硬件技術(shù),在做好實(shí)驗(yàn)研究和臨床試驗(yàn)等基礎(chǔ)工作的同時(shí),加強(qiáng)與AI領(lǐng)域?qū)<业慕涣骱秃献鳎赃m應(yīng)AI技術(shù)與藥學(xué)緊密結(jié)合發(fā)展的國際趨勢(shì)。
參考文獻(xiàn)
[ 1 ] 劉辰.國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》:構(gòu)筑我國人工智能發(fā)展先發(fā)優(yōu)勢(shì)[J].中國科技產(chǎn)業(yè),2017(8):78-79.
[ 2 ] 俞祝良.人工智能技術(shù)發(fā)展概述[J].南京信息工程大學(xué)學(xué)報(bào),2017,9(3):297-304.
[ 3 ] 孔祥溢,王任直.本期專論導(dǎo)讀:人工智能及在醫(yī)療領(lǐng)域的應(yīng)用[J].醫(yī)學(xué)信息學(xué)雜志,2016,37(11):1-5.
[ 4 ] 任彥合.淺談人工智能技術(shù)在醫(yī)療健康領(lǐng)域中的應(yīng)用[J].數(shù)字通信世界,2017(12):175、226.
[ 5 ] 余江南,相秉仁,安登魁.人工智能技術(shù)在臨床藥學(xué)中的應(yīng)用[J].藥學(xué)進(jìn)展,1996,20(2):65-69.
[ 6 ] 劉瑞新,陳鵬舉,李學(xué)林,等.人工智能感官:藥學(xué)領(lǐng)域的新技術(shù)[J].藥物分析雜志,2017,37(4):559-567.
[ 7 ] 李建凱,李莉,焦艷紅.利用“大通醫(yī)藥咨詢軟件V5.0”分析我院11 118例門診處方[J].中國現(xiàn)代應(yīng)用藥學(xué),2008,25(8):727-729.
[ 8 ] 劉景陶,柳耀花.計(jì)算機(jī)分子模擬技術(shù)及人工智能在藥物研發(fā)中的應(yīng)用[J].科技創(chuàng)新與應(yīng)用,2018(2):46-47.
[ 9 ] 顛覆傳統(tǒng)醫(yī)療科研:借助人工智能研發(fā)抗癌藥物[J].智慧健康,2016,2(5):44-47.
[10] 飛利浦研發(fā)出“蜂群”磁性機(jī)器人,可攜帶藥物進(jìn)入人體精準(zhǔn)治療[J].微創(chuàng)醫(yī)學(xué),2017,12(1):156.
[11] 馬云,夏新,劉博,等.基于臨床決策支持系統(tǒng)與知識(shí)庫的臨床數(shù)據(jù)中心的研究與應(yīng)用[J].中國醫(yī)療設(shè)備,2014,29(7):61-63.
[12] 劉太芳,張愛華,張營,等.基于Web of Science的國際老年人慢性病研究的可視化分析[J].現(xiàn)代預(yù)防醫(yī)學(xué),2017,44(3):520-524.
[13] 熊勇,羅斌圣,龍春林.基于Web of Science民族獸藥學(xué)文獻(xiàn)的可視化分析[J].中國獸藥雜志,2018,52(2):62-71.
[14] SHIFFRIN RM,B?RNER K. Mapping knowledge domains[J]. Proc Natl Acad Sci U S A,2004,101(Suppl 1):5183-5185.
[15] CHEN C. CiteSpaceⅡ:detecting and visualizing emerging trends and transient patterns in scientific literature[J]. J Ass Inf Sci Technol,2009,57(3):359-377.
[16] 徐雷.人工智能第三次浪潮以及若干認(rèn)知[J].科學(xué),2017,69(3):1-5.
[17] 余凱,賈磊,陳雨強(qiáng),等.深度學(xué)習(xí)的昨天、今天和明天[J].計(jì)算機(jī)研究與發(fā)展,2013,50(9):1799-1804.
[18] 陳超美,陳悅,侯劍華,等.CiteSpace Ⅱ:科學(xué)文獻(xiàn)中新趨勢(shì)與新動(dòng)態(tài)的識(shí)別與可視化[J].情報(bào)學(xué)報(bào),2009,28(3):401-421.
[19] 趙蓉英,王菊.圖書館學(xué)知識(shí)圖譜分析[J].中國圖書館學(xué)報(bào),2011,37(2):40-50.
[20] 李成,趙軍.基于Web of Science的旅游管理研究信息可視化分析[J].旅游學(xué)刊,2014,29(4):104-113.
[21] 王凱.計(jì)算輔助乙酰膽堿酯酶抑制劑的研究[D].北京:北京化工大學(xué),2012.
[22] 馮雪,吳國春,曹玉昆.基于CiteSpace的中國生物質(zhì)能源研究知識(shí)圖譜分析[J].干旱區(qū)資源與環(huán)境,2018,32(1):35-42.
[23] 胡澤文,孫建軍,武夷山.國內(nèi)知識(shí)圖譜應(yīng)用研究綜述[J].圖書情報(bào)工作,2013,57(3):131-137.
[24] 傅柱,王曰芬,陳必坤.國內(nèi)外知識(shí)流研究熱點(diǎn):基于詞頻的統(tǒng)計(jì)分析[J].圖書館學(xué)研究,2016(14):2-12.
[25] CHEN C. Generalised similarity analysis and pathfinder network scaling[J]. Interact Comput,1998,10(2):107- 128.
[26] 欒春娟,侯海燕,王賢文.國際科技政策研究熱點(diǎn)與前沿的可視化分析[J].科學(xué)學(xué)研究,2009,27(2):240-243.
[27] ANDREW S,JOHN J,DEMIS H. AlphaFold:using AI for scientific discovery[EB/OL].[2018-12-02].https://deepmind.com/blog/alphafold/.
(收稿日期:2018-05-03 修回日期:2018-12-10)
(編輯:段思怡)