苗 豆,祝雅如,齊文娟,吳雅琴
(內(nèi)蒙古醫(yī)科大學(xué)計(jì)算機(jī)信息學(xué)院1,人文學(xué)院2,內(nèi)蒙古 呼和浩特 010110)
隨著醫(yī)療信息技術(shù)的發(fā)展,越來越多的醫(yī)院使用各類醫(yī)療信息系統(tǒng)(如HIS、EMR等)開展醫(yī)療服務(wù)[1]。由此在醫(yī)療領(lǐng)域產(chǎn)生了海量的醫(yī)療數(shù)據(jù),并且健康醫(yī)療大數(shù)據(jù)正在從理論和概念逐步走向應(yīng)用和實(shí)踐[2]。知識(shí)圖譜是以科學(xué)知識(shí)為對(duì)象,顯示科學(xué)知識(shí)的發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一種圖形。借助知識(shí)圖譜,人們可以洞察人類知識(shí)體系的各個(gè)領(lǐng)域和結(jié)構(gòu),構(gòu)建復(fù)雜的知識(shí)網(wǎng)絡(luò),預(yù)測(cè)學(xué)科和知識(shí)前沿的發(fā)展趨勢(shì)與研究熱點(diǎn)。知識(shí)圖譜作為符號(hào)主義發(fā)展的產(chǎn)物,是人工智能技術(shù)和系統(tǒng)中的重要組成部分,其在百科知識(shí)、生物信息、社交網(wǎng)絡(luò)、社交網(wǎng)絡(luò)以及網(wǎng)絡(luò)安全等領(lǐng)域被廣泛運(yùn)用[3,4]。本文使用CiteSpace,VOSviewer對(duì)醫(yī)療大數(shù)據(jù)領(lǐng)域的研究熱點(diǎn)進(jìn)行計(jì)量學(xué)分析,并利用軟件繪制科學(xué)知識(shí)圖譜,以期為醫(yī)療大數(shù)據(jù)領(lǐng)域的相關(guān)研究提供參考。
1.1 數(shù)據(jù)來源 以中國(guó)知網(wǎng)(CNKI)期刊數(shù)據(jù)庫為數(shù)據(jù)來源,檢索主題詞為“醫(yī)療大數(shù)據(jù)”和“medical big data”,檢索時(shí)間限定為2015年~2019年,具體日期為2019年12月29日,共得到3537篇文獻(xiàn)數(shù)據(jù)。納入符合主題的期刊論文,剔除重復(fù)文獻(xiàn)、會(huì)議論文、報(bào)紙、輯刊等與本文主題相關(guān)性較弱的文獻(xiàn),最終得到3123篇有效文獻(xiàn)。
1.2 方法 將CiteSpace設(shè)置時(shí)區(qū)分割年份為2015年~2019年,時(shí)間跨度分段長(zhǎng)度為1年,術(shù)語選擇為突顯術(shù)語,節(jié)點(diǎn)類型可選擇為關(guān)鍵詞、主題,其中關(guān)鍵詞共現(xiàn)數(shù)據(jù)選擇Create→Create a map based on bibliographic data,在T type of analysis選擇Co-occurrence,在Unit of analysis中選擇All keyword,加載自定義的詞集,合并、替換或刪除一些因?qū)懛ú煌ㄐg(shù)語簡(jiǎn)稱、全稱的不同表達(dá)等)造成重復(fù)的關(guān)鍵詞。VOSviewer中,分析類型選擇Co-authorship→Authors,Co-occurrence→All keyword,計(jì)數(shù)方法選擇全計(jì)數(shù)(Full counting),分析醫(yī)療大數(shù)據(jù)的研究熱點(diǎn)。
1.3 數(shù)據(jù)統(tǒng)計(jì)分析 使用CiteSpace.5.6.R3和VOSviewer對(duì)醫(yī)療大數(shù)據(jù)相關(guān)文獻(xiàn)的發(fā)文量及年代分布,學(xué)術(shù)研究核心學(xué)者,以及關(guān)鍵詞頻次、中心性、突現(xiàn)等進(jìn)行可視化分析,全面展示醫(yī)療大數(shù)據(jù)研究的相關(guān)內(nèi)容。
2.1 文獻(xiàn)發(fā)文量 2015年~2018年有關(guān)醫(yī)療大數(shù)據(jù)領(lǐng)域的發(fā)文量呈上升趨勢(shì),2018年發(fā)文量高達(dá)660篇,2019年發(fā)文量略有回落,發(fā)文量分布見圖1。
圖1 2015年~2019年醫(yī)療大數(shù)據(jù)發(fā)文量趨勢(shì)
2.2 作者合作網(wǎng)絡(luò) 對(duì)納入分析的3123篇有效文獻(xiàn)進(jìn)行核心作者合作網(wǎng)絡(luò)制作,見圖2??梢暬Y(jié)果展示所分析文獻(xiàn)的核心作者共分有5大類,每類中發(fā)文量突出的分別是張政波、曹德森、黎檀實(shí)、薛萬國(guó)、劉軍等人。其中,作者張政波是北京市國(guó)際科技合作基地負(fù)責(zé)人,在創(chuàng)新型醫(yī)療器械和裝備研發(fā)、電子健康檔案的二次分析利用等領(lǐng)域有較大貢獻(xiàn);作者曹德森曾與張政波、薛萬國(guó)、黎檀實(shí)共同研究發(fā)表過急救大數(shù)據(jù)與Datathon活動(dòng)等有關(guān)醫(yī)療大數(shù)據(jù)領(lǐng)域的論文;作者黎檀實(shí)在醫(yī)藥衛(wèi)生領(lǐng)域有較大影響力,他主要在醫(yī)療大數(shù)據(jù)和醫(yī)療器械等領(lǐng)域展開研究;作者薛萬國(guó)在醫(yī)療建設(shè)領(lǐng)域有獨(dú)到的見解,從1988年開始從事醫(yī)院信息化方面的研究開發(fā)與推廣應(yīng)用工作,他提出在做好病歷共享的同時(shí),還要注意病人隱私保護(hù)的問題;作者劉軍在醫(yī)學(xué)外科方面較為擅長(zhǎng),曾發(fā)表過腫瘤學(xué)以及外科學(xué)的相關(guān)學(xué)術(shù)論文。
圖2 核心作者合作網(wǎng)絡(luò)
2.3 關(guān)鍵詞共現(xiàn)分析 利用VOSviewer進(jìn)行關(guān)鍵詞共現(xiàn)分析,所有關(guān)鍵詞節(jié)點(diǎn)圍繞“大數(shù)據(jù)”節(jié)點(diǎn)呈放射狀展開,其中較為突出的節(jié)點(diǎn)有“醫(yī)療”“大數(shù)據(jù)時(shí)代”“智慧醫(yī)療”“人工智能”“數(shù)據(jù)挖掘”“云計(jì)算”等,見圖3。
圖3 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)
2.4 高頻關(guān)鍵詞聚類 利用CiteSpace進(jìn)行關(guān)鍵詞聚類分析,醫(yī)療大數(shù)據(jù)研究領(lǐng)域關(guān)鍵詞聚類共聚為10類,分別是“大數(shù)據(jù)”“醫(yī)療大數(shù)據(jù)”“精準(zhǔn)醫(yī)學(xué)”“大數(shù)據(jù)應(yīng)用”“健康醫(yī)療大數(shù)據(jù)”“數(shù)據(jù)共享”“大數(shù)據(jù)時(shí)代”“數(shù)據(jù)挖掘”“移動(dòng)醫(yī)療”和“信息資源共享”,見圖4;每一聚類所包括的聚類標(biāo)簽見表1。
圖4 關(guān)鍵詞聚類分析可視化網(wǎng)絡(luò)
表1 醫(yī)療大數(shù)據(jù)研究領(lǐng)域關(guān)鍵詞聚類分布
2.5 關(guān)鍵詞突現(xiàn)分析 使用CiteSpace得到醫(yī)療大數(shù)據(jù)突現(xiàn)關(guān)鍵詞,主要包括精準(zhǔn)、數(shù)據(jù)資源、移動(dòng)醫(yī)療等,見圖5。
圖5 2015年~2019年醫(yī)療大數(shù)據(jù)突現(xiàn)關(guān)鍵詞
3.1 發(fā)文量分析 從刊載文獻(xiàn)發(fā)文量來看,2015年~2018年發(fā)文量呈上升趨勢(shì),2019年略有回落,分析其中原因之一是本文所用數(shù)據(jù)的檢索時(shí)間為2019年12月29日,很多期刊2019年所發(fā)表文獻(xiàn)還未能在CNKI檢索,故分析數(shù)據(jù)中2019年文獻(xiàn)數(shù)量有所下降。2016年,國(guó)家出臺(tái)《國(guó)務(wù)院辦公廳關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》,文件指出:健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展將帶來健康醫(yī)療模式的深刻變化,有利于激發(fā)深化醫(yī)藥衛(wèi)生體制改革的動(dòng)力和活力,提升健康醫(yī)療服務(wù)效率和質(zhì)量,擴(kuò)大資源供給,不斷滿足人民群眾多層次、多樣化的健康需求,有利于培育新的業(yè)態(tài)和經(jīng)濟(jì)增長(zhǎng)點(diǎn)。相關(guān)文件的出臺(tái)也在一定程度上推動(dòng)了醫(yī)療大數(shù)據(jù)研究、應(yīng)用的進(jìn)一步增長(zhǎng)。
3.2 作者分析 在作者合作網(wǎng)絡(luò)中,每個(gè)節(jié)點(diǎn)代表一位作者,節(jié)點(diǎn)的大小代表作者發(fā)文量,節(jié)點(diǎn)的顏色代表按照默認(rèn)的聚類方法得到的作者所屬類群,網(wǎng)絡(luò)中的連線代表了作者合作關(guān)系,線寬代表合作強(qiáng)度。作者合作網(wǎng)絡(luò)表明,雖然形成了一些合作作者群,但深入分析會(huì)發(fā)現(xiàn),合作作者大多來自同一個(gè)科研機(jī)構(gòu),覆蓋面相對(duì)比較小,國(guó)內(nèi)還未形成較大范圍的醫(yī)療大數(shù)據(jù)研究作者群。為進(jìn)一步促進(jìn)醫(yī)療大數(shù)據(jù)應(yīng)用向縱深發(fā)展,今后亟待加強(qiáng)醫(yī)療大數(shù)據(jù)更廣范圍的合作。
3.3 研究熱點(diǎn)分析 關(guān)鍵詞是文獻(xiàn)分析的重要組成部分,它高度精煉了文章的內(nèi)容,通過分析關(guān)鍵詞可以獲知某領(lǐng)域的研究熱點(diǎn)。根據(jù)關(guān)鍵詞聚類結(jié)果,可將我國(guó)醫(yī)療大數(shù)據(jù)研究熱點(diǎn)分為以下4個(gè)方面:
①基于健康醫(yī)療大數(shù)據(jù)的數(shù)據(jù)應(yīng)用及模型設(shè)計(jì):在經(jīng)過多年的醫(yī)療信息化建設(shè)后,各級(jí)各類醫(yī)療機(jī)構(gòu)的醫(yī)院信息系統(tǒng)存儲(chǔ)了大量的數(shù)據(jù),從規(guī)模上來講形成了健康醫(yī)療大數(shù)據(jù),但在應(yīng)用層面上,這些規(guī)模龐大的數(shù)據(jù)很多處于“沉睡”狀態(tài)?,F(xiàn)代醫(yī)學(xué)越來越依賴于具體數(shù)據(jù)的采集和判斷[5],如何借助于技術(shù)使這些沉睡的數(shù)據(jù)真正服務(wù)于醫(yī)療,服務(wù)于患者,提高醫(yī)療服務(wù)質(zhì)量成為研究者關(guān)注的熱點(diǎn)之一。②健康醫(yī)療大數(shù)據(jù)質(zhì)量、數(shù)據(jù)資源共享及數(shù)據(jù)安全研究:大量的健康醫(yī)療數(shù)據(jù)分散在醫(yī)療機(jī)構(gòu)不同的系統(tǒng)中,如何在保證數(shù)據(jù)安全的前提下,為研究者提供符合研究要求的高質(zhì)量數(shù)據(jù),并且高效共享健康醫(yī)療數(shù)據(jù)也是近些年研究者關(guān)注的熱點(diǎn)。③健康醫(yī)療領(lǐng)域的技術(shù)探究:健康醫(yī)療大數(shù)據(jù)的應(yīng)用離不開相關(guān)的大數(shù)據(jù)技術(shù),如何將在其它領(lǐng)域應(yīng)用成熟的技術(shù)使之在醫(yī)療領(lǐng)域發(fā)揮更大作用,同樣也受到研究者的關(guān)注。④移動(dòng)醫(yī)療應(yīng)用:2015年,移動(dòng)醫(yī)療借助“互聯(lián)網(wǎng)+”東風(fēng),在醫(yī)療行業(yè)大放異彩。從概念到產(chǎn)品落地,再到如何切實(shí)有效的服務(wù)于患者,使患者在就醫(yī)、問診、復(fù)診、轉(zhuǎn)診等各個(gè)環(huán)節(jié)真正體會(huì)到移動(dòng)醫(yī)療的好處,也使得移動(dòng)醫(yī)療成為近幾年研究者關(guān)注的熱點(diǎn)之一。
3.4 研究前沿分析 關(guān)鍵詞突現(xiàn)分析可以了解研究領(lǐng)域的前沿?zé)狳c(diǎn)。“突現(xiàn)”是指一個(gè)變量的值在短期內(nèi)有非常大的波動(dòng)。突現(xiàn)關(guān)鍵詞分析有助于鑒定出某一段時(shí)期內(nèi)最突出的文獻(xiàn)知識(shí),即文獻(xiàn)信息的挖掘與文獻(xiàn)知識(shí)擴(kuò)散、文獻(xiàn)知識(shí)吸收和文獻(xiàn)知識(shí)掃描的發(fā)展進(jìn)程[6]。在本研究所設(shè)定的時(shí)間范圍內(nèi),從時(shí)間序列上來看,2015年~2016年的突現(xiàn)詞為“精準(zhǔn)”“移動(dòng)醫(yī)療”“數(shù)據(jù)資源”“衛(wèi)生醫(yī)療”和“現(xiàn)代醫(yī)學(xué)”,表明在這個(gè)時(shí)期,該領(lǐng)域的學(xué)者對(duì)與之相關(guān)的研究?jī)?nèi)容關(guān)注度較高?!按髷?shù)據(jù)中心”和“分級(jí)診療”的有關(guān)內(nèi)容在本研究時(shí)間段內(nèi),則集中出現(xiàn)在2018年和2019年。分級(jí)診療制度的建立是實(shí)現(xiàn)我國(guó)合理配置醫(yī)療資源、促進(jìn)基本醫(yī)療衛(wèi)生服務(wù)均等化的重要舉措。推進(jìn)分級(jí)診療制度建設(shè)是我國(guó)深化醫(yī)藥衛(wèi)生體制改革的工作重點(diǎn)。國(guó)家計(jì)劃到2020年完成分級(jí)診療的核心目標(biāo),即基本建立符合我國(guó)國(guó)情的分級(jí)診療制度[7]。為實(shí)現(xiàn)此目標(biāo),加快“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展,完善國(guó)家級(jí)全民健康信息平臺(tái)也就同樣成為了工作重點(diǎn),由此醫(yī)療機(jī)構(gòu)大數(shù)據(jù)中心建設(shè)也在近幾年成為學(xué)者關(guān)注和研究的重點(diǎn)之一。
綜上所述,近幾年醫(yī)療健康大數(shù)據(jù)在基礎(chǔ)研究、臨床應(yīng)用等方面發(fā)揮了不可替代的作用??傮w上看,我國(guó)已在醫(yī)療大數(shù)據(jù)的開發(fā)與利用上取得很大進(jìn)展,在該領(lǐng)域研究中處于重要地位。健康醫(yī)療大數(shù)據(jù)成為當(dāng)前該領(lǐng)域?qū)W者研究的一個(gè)重要熱點(diǎn),這為后續(xù)學(xué)者研究和實(shí)驗(yàn)提供了參考。