劉桑雪 何慧敏
摘? 要:對肺癌的分析診斷是人工智能應(yīng)用的重點領(lǐng)域,檢索Web of Science數(shù)據(jù)庫2012年—2021年國內(nèi)外人工智能在肺癌領(lǐng)域應(yīng)用的相關(guān)研究文獻,通過文獻計量軟件CiteSpace對國內(nèi)外人工智能在肺癌領(lǐng)域應(yīng)用的研究現(xiàn)狀、熱點以及前沿趨勢進行可視化分析,為人工智能在癌癥疾病領(lǐng)域的進一步研究提供參考,推動中國人工智能技術(shù)與腫瘤領(lǐng)域的交叉研究。
關(guān)鍵詞:人工智能;肺癌;可視化分析;文獻計量
中圖分類號:TP391;R730.2 文獻標識碼:A 文章編號:2096-4706(2023)03-0110-04
Literature Visual Analysis of Artificial Intelligence Applied in the Field of Lung Cancer
LIU Sangxue, HE Huimin
(Guangxi Medical University, Nanning? 530021, China)
Abstract: The analysis and diagnosis of lung cancer is the key field for the application of artificial intelligence. Search the relevant research literature of the application of artificial intelligence in lung cancer field at home and abroad from 2012 to 2021 in the Web of Science database, and visually analyze the research status, hotspots and frontier trends of the application of artificial intelligence in lung cancer field at home and abroad through the bibliometric software CiteSpace, to provide reference for further research of artificial intelligence in the field of cancer disease, promote the cross research of artificial intelligence technology and tumor field in China.
Keywords: artificial intelligence; lung cancer; visual analysis; bibliometrics
0? 引? 言
人工智能利用計算機模型和算法模擬人類大腦,擁有強大的特征學(xué)習(xí)能力,能夠整合海量數(shù)據(jù)信息,以提高人們分析、處理信息的效率。隨著人工智能技術(shù)的成熟,其在醫(yī)學(xué)領(lǐng)域應(yīng)用逐漸加深,人工智能技術(shù)為癌癥的風(fēng)險評估、臨床診斷、精準治療、生存預(yù)測等方面提供快速、有效的方法手段,可以在某種程度上降低癌癥發(fā)生率和死亡率[1]。肺癌的發(fā)病率很高,是世界范圍內(nèi)致人死亡的主要疾病,準確診斷對肺癌患者的治療至關(guān)重要。本文通過檢索近十年的相關(guān)文獻,通過知識圖譜分析國際人工智能在肺癌領(lǐng)域的應(yīng)用現(xiàn)狀和發(fā)展前沿,為中國的人工智能技術(shù)在癌癥領(lǐng)域的研究和應(yīng)用提供參考。
1? 資料來源與統(tǒng)計方法
1.1? 資料來源
在Web of Science數(shù)據(jù)庫中以Artificial Intelligence、AI、Deep Learning、Machine Learning、Lung Tumors、Lung Cancer等主題詞組成檢索式檢索2012年01月01日—2021年12月31日公開發(fā)表的關(guān)于人工智能在肺癌領(lǐng)域中應(yīng)用的相關(guān)文獻,文獻類型選擇“article”,語種選擇“English”,通過去除重復(fù)性文獻和非學(xué)術(shù)性文獻,共納入1 940篇文獻進行計量分析。
1.2? 統(tǒng)計方法
應(yīng)用CiteSpace 5.8.R3進行統(tǒng)計分析,將時間跨度設(shè)為2012年—2021年,以每一年作為一個時間切片,選擇相應(yīng)的節(jié)點類型分別將總體發(fā)文量、國家和機構(gòu)發(fā)文合作、作者發(fā)文合作、研究熱點和前沿趨勢等方面的統(tǒng)計結(jié)果可視化展示。共現(xiàn)網(wǎng)絡(luò)圖譜節(jié)點的大小表示該節(jié)點發(fā)文量的多少,節(jié)點之間的線條粗細表示合作強度,節(jié)點年輪外圈的顏色深淺代表中心度大小,指示該節(jié)點在聯(lián)系整個網(wǎng)絡(luò)中發(fā)揮的作用大小[2]。國際研究熱點基于高頻詞和高中心性關(guān)鍵詞來分析,研究前沿通過詞頻變化率較高的突現(xiàn)詞來反映。
2? 結(jié)果與分析
2.1? 總體趨勢分析
國際年度發(fā)文量反映該領(lǐng)域知識量增長的情況。根據(jù)檢索結(jié)果,2012年—2021年發(fā)表相關(guān)文獻共1 940篇,呈現(xiàn)逐年增長的趨勢。2012—2017年處于該研究領(lǐng)域發(fā)展的起步階段,發(fā)展平緩;2018—2021年處于快速發(fā)展階段。2012年國際發(fā)文僅21篇,2021年發(fā)文量高達730篇。
2.2? 國家與研究機構(gòu)發(fā)文分析
研究結(jié)果顯示,一共有17個國家發(fā)表關(guān)于人工智能在腫瘤領(lǐng)域的研究超過30篇,中國和美國的發(fā)文量遠遠高于其他國家,發(fā)文量分別達691篇和636篇。韓國發(fā)文126篇,位列第3;印度116篇,位列第4;荷蘭發(fā)文101篇,位列第5。
通過對研究機構(gòu)的分析,發(fā)文量居于首位的是中國科學(xué)院,共52篇;排第2的機構(gòu)有3家,分別是上海交通大學(xué)、復(fù)旦大學(xué)和哈佛醫(yī)學(xué)院,發(fā)文量43篇;斯隆-凱特森癌癥研究中心發(fā)文量位列第3,發(fā)文37篇。發(fā)文量前10的研究機構(gòu)中包括了6家中國研究機構(gòu)。
2.3? 國際合作分析
根據(jù)國家合作網(wǎng)絡(luò)圖譜,國際合作中心度排名前5位的國家分別為英國(0.17)、西班牙(0.14)、德國(0.13)、美國(0.11)、中國(0.10)。英國的中心度最高,表示與其他國家之間的合作關(guān)系最緊密最重要。
機構(gòu)合作中心度排名前5位的機構(gòu)分別為馬斯特里赫特大學(xué)(0.22)、上海交通大學(xué)(0.21)、拉德堡德大學(xué)(0.21)、丹娜法伯癌癥研究院(0.19)、德克薩斯大學(xué)安德森癌癥中心(0.19)。研究機構(gòu)合作網(wǎng)絡(luò)圖譜如圖1所示。
2.4? 作者發(fā)文合作分析
通過作者合作網(wǎng)絡(luò)圖譜尋找對人工智能應(yīng)用于肺癌研究領(lǐng)域有重大貢獻和影響力的核心作者群,如圖2所示。最高產(chǎn)作者是來自美國的Robert Gillies,其合作中心度和文獻被引頻次也較高。發(fā)文量排名前10的作者共有11位,其中中國作者僅有2位,分別是Wei Qian、Ming Li。
2.5? 共被引文獻分析
根據(jù)共被引文獻分析統(tǒng)計,共有22篇文獻被引次數(shù)超過50次,其中最高被引量達157次,表1列出了被引量排名前10位的關(guān)鍵經(jīng)典文獻。高被引文獻內(nèi)容主要集中在利用深度學(xué)習(xí)方法進行醫(yī)學(xué)圖像分析的研究。
2.6? 研究熱點
關(guān)鍵詞共現(xiàn)圖譜結(jié)果顯示,人工智能應(yīng)用于肺癌領(lǐng)域的內(nèi)容主要有分類、診斷、生存分析等,運用人工智能的方法手段主要為深度學(xué)習(xí)、機器學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)等。高頻關(guān)鍵詞和高中心性關(guān)鍵詞如表2所示。
2.7? 研究前沿
突現(xiàn)詞是短時間內(nèi)詞頻變化率較高的關(guān)鍵詞,更適合探測學(xué)科發(fā)展的新興趨勢和突然變化[3]。顯示持續(xù)至今的突現(xiàn)詞有紋理特征、圖像分類、標志物和斷層攝影術(shù),根據(jù)強度排序得到近十年人工智能在肺癌領(lǐng)域Top15的突現(xiàn)詞,如圖3所示。
3? 趨勢與難題
3.1? 人工智能在肺癌中的應(yīng)用仍是當前醫(yī)療領(lǐng)域的研究趨勢
自2012年起,國際間針對人工智能在肺癌領(lǐng)域的研究呈現(xiàn)持續(xù)增長的趨勢。統(tǒng)計發(fā)現(xiàn),肺癌為排名第1的高頻關(guān)鍵詞,說明人工智能在癌癥領(lǐng)域的研究中,肺癌是應(yīng)用較為廣泛和典型的疾病,且通過2021年相關(guān)文獻量達到730篇可知,人工智能在肺癌領(lǐng)域應(yīng)用的熱潮日益高漲。
從國家發(fā)文量和中心度來看,美國和中國均排在前5位,說明這兩個國家針對人工智能在肺癌領(lǐng)域的研究與合作處于世界前列;但由于中國人口基數(shù)大,且發(fā)表文獻篇均被引次數(shù)為15.48次/篇,低于美國的32.86次/篇,而世界發(fā)表文獻的篇均被引次數(shù)為22.43次/篇,說明中國的人均發(fā)文量和發(fā)文影響力均比不上美國,而美國文獻影響力處于世界先進水平。荷蘭的發(fā)文量和國家合作中心度都位居世界前5,且文獻篇均被引高達109.36次/篇,遠遠超出世界水平,表明荷蘭在該領(lǐng)域中具有較突出的貢獻和較強的代表性。當前,AI在醫(yī)學(xué)領(lǐng)域應(yīng)用呈現(xiàn)爆發(fā)式增長的態(tài)勢,人工智能理論與實踐均達到了一定高度。各國爭相出臺有關(guān)政策和方案,以期為人工智能技術(shù)的發(fā)展和創(chuàng)新保駕護航。與中國相比,美國人工智能戰(zhàn)略更加強調(diào)跨學(xué)科交叉和對人工智能產(chǎn)業(yè)的投入[4]。人工智能是新興產(chǎn)業(yè)的核心,中國應(yīng)立足于國務(wù)院《新一代人工智能發(fā)展規(guī)劃》的要求[5],提高投入產(chǎn)出比,加強國際與國內(nèi)研究機構(gòu)和企業(yè)的交流,助力人工智能在醫(yī)療產(chǎn)業(yè)的發(fā)展,輸出有較高影響力的成果。
從作者發(fā)文分析得出,居于前10的中國作者僅有2位,說明中國對人工智能在肺癌領(lǐng)域的研究有突出貢獻的研究者較少,醫(yī)療人工智能涉及多專業(yè)融合,提示中國應(yīng)建立規(guī)范化的復(fù)合型人才培養(yǎng)體系,積極引進高端人才、留住人才,保證人工智能在醫(yī)學(xué)領(lǐng)域的可持續(xù)發(fā)展[6]。
3.2? 人工智能在肺癌領(lǐng)域的研究涉及多方面應(yīng)用
通過關(guān)鍵詞共現(xiàn)分析得出,研究熱點主要集中在兩個方面:(1)利用AI技術(shù)對肺癌預(yù)測、分類和生存分析。其一,研究者重點關(guān)注分析醫(yī)學(xué)影像特征實現(xiàn)肺癌的預(yù)測和分類。肺結(jié)節(jié)是肺癌早期的臨床表現(xiàn),計算機斷層攝影(CT)是早期結(jié)節(jié)良惡性鑒別的有效手段,由于海量數(shù)據(jù)和人工閱片耗時長伴隨著漏診誤診等問題,人工智能輔助實現(xiàn)肺結(jié)節(jié)的篩查診斷是現(xiàn)階段精準醫(yī)療的研究熱點。其二,AI技術(shù)聯(lián)合生物標志物的應(yīng)用[7]。利用機器學(xué)習(xí)方法研究生物標志物對肺癌的診斷、治療選擇和預(yù)后預(yù)測是該領(lǐng)域的重點方向。(2)對人工智能的方法學(xué)研究,主要的方法學(xué)有機器學(xué)習(xí)、深度學(xué)習(xí)等,通過分類器、支持向量機、隨機森林和微陣列等算法結(jié)合大數(shù)據(jù)構(gòu)建模型來預(yù)測分類肺癌,以及研究如何進一步優(yōu)化模型或提高算法對癌癥預(yù)測的靈敏度。
突現(xiàn)詞反映了人工智能在肺癌應(yīng)用研究中的前沿趨勢。根據(jù)統(tǒng)計結(jié)果發(fā)現(xiàn),人工智能對肺癌的影像分析既是研究熱點,也是前沿?;虮磉_、蛋白質(zhì)研究、治療、人工智能的方法學(xué)手段等也是前沿的體現(xiàn)。由于分析工具數(shù)量和數(shù)據(jù)集的增多,醫(yī)學(xué)圖像分析領(lǐng)域呈指數(shù)級增長。圖像識別技術(shù)不僅用于肺癌的診斷篩查,且用于放射治療過程中腫瘤靶區(qū)和危機器官的自動勾畫以及對放療不良反應(yīng)的預(yù)測等[8]。目前應(yīng)用較廣泛的圖像識別技術(shù)可以通過高通量計算從CT、PET等醫(yī)學(xué)影像中快速提取定量特征,分析特征與治療結(jié)果或基因表達的關(guān)系,挖掘圖像中潛在的信息,這一過程也被稱為放射組學(xué)[9]。紋理特征分析是目前的一個研究前沿,它在腫瘤診斷中被要求具有更高的計算標準[10]?;谌斯ぶ悄芗夹g(shù),癌細胞的蛋白質(zhì)研究可以預(yù)測腫瘤發(fā)生、生長、轉(zhuǎn)移、治療等過程,蛋白質(zhì)研究與基因表達息息相關(guān),微陣列基因表達數(shù)據(jù)可用于癌癥類型預(yù)測[11],微陣列技術(shù)為分析基因表達數(shù)據(jù)提供了方法。
近年來,研究者們更多的關(guān)注人工智能在肺癌應(yīng)用領(lǐng)域的方法學(xué)研究,人工智能技術(shù)的創(chuàng)新和發(fā)展為肺癌研究應(yīng)用創(chuàng)造了新可能。機器學(xué)習(xí)是人工智能的核心,高度準確和可靠的機器學(xué)習(xí)方法在整合和分析龐大而復(fù)雜的數(shù)據(jù)集方面發(fā)揮著關(guān)鍵作用。深度學(xué)習(xí)是機器學(xué)習(xí)的一大分支,2015年Lecun Y表示深度學(xué)習(xí)允許計算模型來學(xué)習(xí)具有多個抽象級別的數(shù)據(jù)表示,深度卷積網(wǎng)絡(luò)在處理圖像等方面帶來了突破進展[12],成為受歡迎的特征提取器,已被證明在自然圖像分類方面明顯優(yōu)于經(jīng)典的機器學(xué)習(xí)方法。圖像分類的深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)越來越多樣,VGG系列網(wǎng)絡(luò)、ResNet和U-Net等網(wǎng)絡(luò)的誕生驗證了圖像分類分割的性能在逐步提高。研究者們?yōu)榘┌Y的預(yù)測和診斷不斷提出新的方法和網(wǎng)絡(luò)訓(xùn)練策略以提高模型的準確性,并優(yōu)化改進模型可能出現(xiàn)的過擬合、研究可重復(fù)性和操作性等技術(shù)問題,這些是未來人工智能在肺癌或其他癌癥應(yīng)用中方法學(xué)研究突破的關(guān)鍵。
3.3? 人工智能在醫(yī)學(xué)應(yīng)用領(lǐng)域面臨的難題
隨著個性化決策和精準醫(yī)療的普及,人工智能在肺癌領(lǐng)域的應(yīng)用正在一步步深化。然而在日常臨床實踐中建立可靠的癌癥結(jié)果預(yù)測模型仍是一個挑戰(zhàn)。例如圖像識別、藥物效果預(yù)測等都需要大規(guī)模數(shù)據(jù)來訓(xùn)練模型,過程中消耗大量計算資源,對硬件要求較高;對于醫(yī)學(xué)影像數(shù)據(jù),前期的獲取和手工標注對于研究機構(gòu)來說比較困難。醫(yī)療人工智能涉及法律法規(guī)和倫理道德,特別是AI技術(shù)挖掘分析醫(yī)療大數(shù)據(jù)時,可能會造成個人隱私信息的泄露,而相比其他國家,中國對個人隱私安全保護的法制體系尚不完善,因此需要不斷豐富體系內(nèi)涵來適應(yīng)人工智能的更新迭代?!度斯ぶ悄馨灼?022年)》[13]中表明安全可信的人工智能要朝著一體化的方向發(fā)展,加速推進風(fēng)險防控體系。因此勢必要完善法律法規(guī),推進國家監(jiān)管體系建設(shè),加強人工智能在醫(yī)療應(yīng)用中的技術(shù)保護,明確人工智能與醫(yī)療使用人員之間的責(zé)任,以實現(xiàn)精準醫(yī)療與人工智能戰(zhàn)略目標。
4? 結(jié)? 論
綜上所述,目前人工智能在肺癌領(lǐng)域的研究已成為國際研究熱點。在我國,應(yīng)充分吸收國外的前沿?zé)狳c,加強國際及研究機構(gòu)間的交流合作,并在中國腫瘤防治的基礎(chǔ)上,推動中國人工智能技術(shù)與腫瘤領(lǐng)域的交叉研究。
參考文獻:
[1] 楊文靜,呂章艷,馮小雙,等.人工智能在癌癥研究領(lǐng)域的文獻可視化分析 [J].腫瘤防治研究,2021,48(2):133-139.
[2] 陳悅,陳超美,劉則淵,等.CiteSpace知識圖譜的方法論功能 [J].科學(xué)學(xué)研究,2015,33(2):242-253.
[3] 楊文靜,杜然然,呂章艷,等.人工智能在疾病預(yù)測研究中可視化分析 [J].中國公共衛(wèi)生,2021,37(5):871-874.
[4] 王迎春,李輝,楊丞磊,等.美國人工智能研發(fā)戰(zhàn)略計劃2019更新版重點及啟示 [J].科技導(dǎo)報,2020,38(11):26-30.
[5] 國務(wù)院.國務(wù)院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知 [R/OL].(2017-07-20)[2022-07-19].http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
[6] 董星宇,陳敏.醫(yī)療人工智能發(fā)展存在的問題及對策 [J].醫(yī)學(xué)與社會,2019,32(5):80-82.
[7] HAO X K,LUO H Y,KRAWCZYK M,et al. DNA methylation markers for diagnosis and prognosis of common cancers [J].Proc Natl Acad Sci U S A,2017,114(28):7414-7419.
[8] 甘武田,應(yīng)延辰,全紅,等.肺癌放射治療中人工智能的應(yīng)用進展 [J].中華腫瘤防治雜志,2021,28(18):1428-1432.
[9] GILLIES R J,KINAHAN P E,HRICAK H. Radiomics:Images Are More than Pictures,They Are Data [J].Radiology,2016,278(2):563-577.
[10] WANG H K,ZHOU Z W,LI Y C,et al. Comparison of machine learning methods for classifying mediastinal lymph node metastasis of non-small cell lung cancer from (18)F-FDG PET/CT images [J].EJNMMI research,2017,7(1):11.
[11] YANG Y,XU L,SUN L D,et al. Machine learning application in personalised lung cancer recurrence and survivability prediction [J].Comput Struct Biotechnol J,2022,20:1811-1820.
[12] LECUN Y,BENGIO Y,HINTON G. Deep learning [J].Nature,2015,521(7553):436-444.
[13] 中國信息通信研究院.人工智能白皮書(2022年) [EB/
OL].[2022-07-19].http://scdsjzx.cn/scdsjzx/ziliaoxiazai/2022/
4/18/d03a2d33b67d4c398ddfca504cf410ab/files/43b00b8feccd423ea2e2a4014e9d672a.pdf.
作者簡介:劉桑雪(1997—),女,漢族,廣東汕尾人,碩士研究生在讀,研究方向:醫(yī)學(xué)信息管理、計算機及應(yīng)用等;通訊作者:何慧敏(1973—),女,漢族,湖南岳陽人,研究生導(dǎo)師,博士,研究方向:教育管理、醫(yī)學(xué)信息管理、計算機及應(yīng)用等。
收稿日期:2022-09-15
基金項目:2022年自治區(qū)級新工科、新醫(yī)科、新農(nóng)科、新文科研究與實踐項目(02506222234C)