王嘉良
(杭州師范大學(xué)附屬蕭山醫(yī)院 乳腺外科,浙江 杭州 311200)
人工智能(artificial intelligence,AI)是在計(jì)算機(jī)科學(xué)、神經(jīng)心理學(xué)等多學(xué)科基礎(chǔ)之上發(fā)展起來的一門綜合性交叉學(xué)科[1];換言之,人工智能也指由人工制造出來的系統(tǒng)所表現(xiàn)出來的智能。2016年3月人工智能系統(tǒng)“AlphaGo”打敗職業(yè)九段棋手李世石,2017年5月又相繼打敗世界冠軍柯潔,自此,人工智能不僅在AI領(lǐng)域引起軒然大波,更讓普通大眾意識(shí)到人工智能的快速發(fā)展。人工智能具有高度技術(shù)性和專業(yè)性,各分支領(lǐng)域均非常深入且各不相通,因而涉及范圍極廣[2]。在醫(yī)學(xué)領(lǐng)域,人工智能也發(fā)揮了重要作用,癌癥是人工智能應(yīng)用的主要領(lǐng)域之一[3]。乳腺癌是女性最常見的惡性腫瘤,發(fā)病率占女性腫瘤的20%[4],嚴(yán)重危害女性健康;若可以利用人工智能技術(shù)探索乳腺癌發(fā)生和發(fā)展,為其早期篩查、臨床診斷、精準(zhǔn)治療和生存預(yù)測(cè)等方面提供快速、有效、準(zhǔn)確的方法學(xué)手段,則可在某種程度上降低癌癥發(fā)生率和病死率。為更好地了解國際環(huán)境人工智能在乳腺癌研究領(lǐng)域的現(xiàn)狀和發(fā)展趨勢(shì),本文通過檢索近10 a人工智能在乳腺癌研究領(lǐng)域的文獻(xiàn),繪制科學(xué)知識(shí)圖譜,剖析人工智能在乳腺癌領(lǐng)域的研究熱點(diǎn)和前沿,以期為中國的人工智能在乳腺癌研究中的應(yīng)用提供參考。
1.1 數(shù)據(jù)來源與檢索策略檢索Web of Science核心合集數(shù)據(jù)庫2011―2020年人工智能在乳腺癌領(lǐng)域應(yīng)用的相關(guān)研究。檢索式為:主題[Artificial Intelligence OR AI OR Intelligence,Artificial OR Computational Intelligence OR Machine Intelligence OR Computer Vision System OR Knowledge Acquisition (Computer) OR Representation,Knowledge (Computer)] AND 主題(Breast Neoplasms OR Neoplasm, Breast OR Breast Tumors OR Breast Cancer OR Breast Malignant Neoplasm OR Cancer of Breast OR Breast Carcinoma OR Carcinomas,Breast OR Breast Malignant Tumor)AND 語種(English),文獻(xiàn)類型為article,共檢索到1 187條有效記錄。
1.2 分析方法將納入的文獻(xiàn)以純文本格式導(dǎo)出,導(dǎo)出的文獻(xiàn)記錄包含作者、研究機(jī)構(gòu)、題名、關(guān)鍵詞、摘要、發(fā)表年份、參考文獻(xiàn)等信息。利用VOSviewer文獻(xiàn)計(jì)量學(xué)軟件可視化相關(guān)研究的發(fā)文年份、發(fā)文國家、發(fā)文作者、發(fā)文機(jī)構(gòu)及發(fā)文期刊。
2.1 年發(fā)文量及期刊發(fā)文量依據(jù)檢索結(jié)果,2011―2020年共發(fā)表相關(guān)研究1 187篇,年均發(fā)文量為118.7篇。2011―2017年發(fā)文量呈波動(dòng)上升趨勢(shì),2017年后逐年遞增;相比2011年的70篇發(fā)文量,2020年發(fā)文量高達(dá)256篇。見圖1A。571個(gè)期刊發(fā)表了人工智能與乳腺癌相關(guān)研究;發(fā)文量大于10的期刊僅有17個(gè),其中發(fā)文量排名前3的期刊分別為BreastCancerResearchandTreatment(93篇,7.8%),Breast(42篇,3.5%)和JournalofClinicalOncology(25篇,2.1%),影響因子分別為3.831、3.754及32.956;排名前10位的期刊中,引用次數(shù)最多的期刊為JournalofClinicalOncology,引用次數(shù)高達(dá)2 676次。見圖1B。
A為年發(fā)文量;B為期刊發(fā)文量。
2.2 發(fā)文國家分布共75個(gè)國家發(fā)表了關(guān)于人工智能在乳腺癌領(lǐng)域的應(yīng)用研究,美國發(fā)文量高達(dá)533篇,位列第一,發(fā)文量占文獻(xiàn)總數(shù)的44.9%,遙遙領(lǐng)先于其他國家;中國繼美國之后,發(fā)文量為145篇,位列第二;英國位列第三,發(fā)文量為124篇。見圖2。
圖2 人工智能在乳腺癌領(lǐng)域應(yīng)用研究的發(fā)文國家分布
2.3 發(fā)文機(jī)構(gòu)分布經(jīng)分析,共2 297個(gè)機(jī)構(gòu)從事人工智能與乳腺癌相關(guān)研究,但發(fā)文量大于10的機(jī)構(gòu)僅有46個(gè),如圖3所示。發(fā)文量排名前4的機(jī)構(gòu)分別為美國密歇根大學(xué)(Univ Michigan)、美國梅奧醫(yī)學(xué)中心(Mayo Clin)、癌癥研究所(Inst Canc Res,國家未知)及英國皇家馬斯登癌癥中心(Royal Marsden Hosp)。排名前10位的機(jī)構(gòu)中,尚未有中國機(jī)構(gòu)出現(xiàn)。
圖3 人工智能在乳腺癌領(lǐng)域應(yīng)用研究的發(fā)文機(jī)構(gòu)分布
2.4 發(fā)文作者分布共有7 732位作者從事人工智能與乳腺癌相關(guān)研究,但發(fā)文量大于10篇的作者僅有14位。發(fā)文量前3位的作者為Dowsett Mitch(22篇),Henry N. Lynn(22篇)及Stearns Vered(19篇);排名前10位的作者中,尚未有中國學(xué)者出現(xiàn)。見圖4。
圖4 人工智能在乳腺癌領(lǐng)域應(yīng)用研究的發(fā)文作者分布
2.5 關(guān)鍵詞可視化分析關(guān)鍵詞共現(xiàn)分析共發(fā)現(xiàn)4 932個(gè)關(guān)鍵詞,其中94個(gè)關(guān)鍵詞共現(xiàn)次數(shù)大于 20次;共現(xiàn)頻次排名前20位的關(guān)鍵詞見表1。對(duì)94個(gè)關(guān)鍵詞進(jìn)行聚類共形成4個(gè)熱點(diǎn)研究領(lǐng)域,每種顏色代表一種聚類類別;其中第1類(紅色)包含29個(gè)關(guān)鍵詞,有人工智能(artificial intelligence)、相關(guān)性(association)、乳腺癌(breast cancer)、計(jì)算機(jī)輔助檢測(cè)及診斷(computer-aided detection and diagnosis)、模型(model)、鉬靶X線(mammography)、風(fēng)險(xiǎn)(risk)及生存(survival)等,主要關(guān)注人工智能技術(shù)在乳腺癌領(lǐng)域的應(yīng)用;第2類(綠色)包含28個(gè)關(guān)鍵詞,主要有化療(chemotherapy)、雌激素(estrogen)、表達(dá)(expression)、生長(zhǎng)(growth)、機(jī)制(mechanism)、體外(invitro)等,集中于藥物治療的相關(guān)機(jī)制研究;第3類(藍(lán)色)包含26個(gè)關(guān)鍵詞,主要有他莫昔芬(tamoxifen)、治療(therapy)、試驗(yàn)(trial)、預(yù)防(prevention)、結(jié)局(outcomes)、生活質(zhì)量(quality of life)及發(fā)病率(prevalence)等,主要關(guān)注藥物的治療效果;第4類(黃色)包含11個(gè)關(guān)鍵詞,主要有阿那曲唑(anastrozole)、骨礦物質(zhì)密度(bone mineral density)、骨質(zhì)疏松癥(osteoporosis)、健康(health)及預(yù)防(prevention)等,主要關(guān)注治療后副作用。見圖5A。乳腺癌研究熱門領(lǐng)域主要有他莫昔芬(tamoxifen)、預(yù)防(prevention)、復(fù)發(fā)(recurrence)、風(fēng)險(xiǎn)(risk)等;人工智能熱門領(lǐng)域主要有診斷(diagnosis)、分割(segmentation)及性能(performance)等;人工智能與乳腺癌交叉的熱門領(lǐng)域有疾病(disease)、預(yù)測(cè)(prediction)及模型(model)。僅乳腺癌研究領(lǐng)域側(cè)重治療及疾病控制研究,人工智能領(lǐng)域側(cè)重該技術(shù)的用途及性能,人工智能在乳腺癌領(lǐng)域的研究側(cè)重于構(gòu)建相關(guān)模型預(yù)測(cè)疾病的發(fā)生發(fā)展。見圖5B。
表1 人工智能與乳腺癌研究領(lǐng)域前20位高頻關(guān)鍵詞
A為標(biāo)簽視圖;B為密度視圖。
2.6 共被引文獻(xiàn)分析共發(fā)現(xiàn)37 219篇文獻(xiàn)被引用,其中11篇文獻(xiàn)的被引次數(shù)超過65次。見圖6。高被引論文的主要內(nèi)容集中于乳腺癌領(lǐng)域化療藥物的應(yīng)用及治療效果研究,排名前5位的高被引文獻(xiàn)題名及相關(guān)信息見表2。
圖6 人工智能在乳腺癌領(lǐng)域應(yīng)用研究的共被引文獻(xiàn)分布
表2 排名前5位的高被引論文
自2010年以來,全球圍繞人工智能在癌癥研究應(yīng)用領(lǐng)域的文獻(xiàn)呈現(xiàn)持續(xù)增長(zhǎng)的趨勢(shì),尤其是2017―2019年文章發(fā)表數(shù)激增[5]。本研究初步發(fā)現(xiàn),人工智能在乳腺癌領(lǐng)域的應(yīng)用研究自2017年開始遞增。結(jié)合本研究分析,可看出2017年后乳腺癌領(lǐng)域人工智能研究激增得益于國際環(huán)境下人工智能在癌癥領(lǐng)域的廣泛應(yīng)用。該研究還發(fā)現(xiàn),乳腺癌為繼“癌癥、分類、機(jī)器學(xué)習(xí)”后共現(xiàn)頻次排名第4位的高頻關(guān)鍵詞,且中介中心性位列第一,說明將人工智能技術(shù)應(yīng)用于乳腺癌領(lǐng)域研究的受關(guān)注度最大,研究最為廣泛,已成為國際熱點(diǎn)。相比2017年的94篇發(fā)文量,2020年發(fā)文量高達(dá)256篇,可見近年人工智能技術(shù)在乳腺癌領(lǐng)域應(yīng)用的研究熱度一直呈增長(zhǎng)趨勢(shì)。
國家發(fā)文量分布顯示,美國及中國的發(fā)文量排名位于前列。但美國發(fā)文的引用次數(shù)約為每篇21次,中國發(fā)文引用次數(shù)為每篇10次;排名前10位的國家中,除印度外,其他國家每篇引用次數(shù)均大于10次。從引用頻率比較可發(fā)現(xiàn),美國發(fā)文的被引頻率一直處于世界平均標(biāo)準(zhǔn)以上,而中國文章的被引頻率低于平均標(biāo)準(zhǔn)。以上表明,美國目前是研究人工智能應(yīng)用于乳腺癌研究最活躍的國家,中國在該研究領(lǐng)域也具有突出貢獻(xiàn)。但我國人口基數(shù)大,人均發(fā)文量與美國相距甚遠(yuǎn),因此國內(nèi)研究學(xué)者應(yīng)加大對(duì)該領(lǐng)域研究的投入,吸取國外優(yōu)秀科研經(jīng)驗(yàn),加強(qiáng)與國外權(quán)威科研機(jī)構(gòu)合作,提高我國的學(xué)術(shù)生產(chǎn)力,增強(qiáng)我國的學(xué)術(shù)影響力。此外,排名前10位的機(jī)構(gòu)及作者尚未出現(xiàn)中國機(jī)構(gòu)及學(xué)者,說明國內(nèi)機(jī)構(gòu)及學(xué)者應(yīng)加強(qiáng)國際間合作,輸出有較高影響力的成果,從而提高國際影響力。當(dāng)前,人工智能產(chǎn)業(yè)在醫(yī)學(xué)領(lǐng)域的應(yīng)用正迎來爆發(fā)式增長(zhǎng),而中國在人工智能領(lǐng)域仍處于起步階段,在醫(yī)學(xué)領(lǐng)域的原創(chuàng)性關(guān)鍵技術(shù)創(chuàng)新較少。2017年國務(wù)院總理李克強(qiáng)在《政府工作報(bào)告》中首次提及了“人工智能”,強(qiáng)調(diào)要加快中國人工智能技術(shù)的研發(fā)和轉(zhuǎn)化,可見中國政府對(duì)于人工智能的發(fā)展高度關(guān)注[6]。鑒于中國患者群體龐大,國內(nèi)人工智能技術(shù)和資本應(yīng)積極投入醫(yī)學(xué)領(lǐng)域,造福更多患者和醫(yī)生。
對(duì)關(guān)鍵詞進(jìn)行聚類分析發(fā)現(xiàn),研究焦點(diǎn)主要集中在人工智能技術(shù)在乳腺癌領(lǐng)域的應(yīng)用、藥物機(jī)制、治療效果及治療后副作用。藥物挖掘是人工智能在醫(yī)學(xué)健康領(lǐng)域的主要應(yīng)用模式之一,將深度學(xué)習(xí)技術(shù)應(yīng)用于藥物臨床前研究,快速、準(zhǔn)確挖掘和篩選合適化合物,縮短新藥研發(fā)周期、降低新藥研發(fā)成本、提高新藥研發(fā)成功率。此外,通過計(jì)算機(jī)模擬,人工智能可以對(duì)藥物活性、安全性和副作用進(jìn)行預(yù)測(cè)。此外,人工智能在乳腺癌領(lǐng)域的研究熱點(diǎn)主要集中于人工智能的性能、風(fēng)險(xiǎn)識(shí)別及建立模型預(yù)測(cè)疾病等。2012年,韓國學(xué)者報(bào)道了一種基于SVM的預(yù)測(cè)模型,用于預(yù)測(cè)韓國人群乳腺癌患者術(shù)后5 a內(nèi)復(fù)發(fā)情況[7];2015年,法國學(xué)者開發(fā)了一種基于模糊邏輯選擇的方法,用人工智能篩選乳腺癌的基因特征,成功地將其運(yùn)用于乳腺癌的病理學(xué)分級(jí)以判斷患者的預(yù)后[8]。但如何找到符合醫(yī)學(xué)生物學(xué)原理、具有臨床實(shí)用性的算法,從而提高模型預(yù)測(cè)的準(zhǔn)確性、可重復(fù)性和可操作性是關(guān)鍵[9],因此方法學(xué)研究的突破可能會(huì)為癌癥研究開辟新的空間和帶來新的機(jī)遇。
乳腺癌治療是人工智能發(fā)展的一個(gè)領(lǐng)先領(lǐng)域,其應(yīng)用包括篩查和診斷、風(fēng)險(xiǎn)計(jì)算、預(yù)測(cè)和臨床決策支持、管理規(guī)劃和精準(zhǔn)醫(yī)療[10]。與以往基于計(jì)算機(jī)的方法(即計(jì)算機(jī)輔助檢測(cè)和診斷)相比,人工智能及其子領(lǐng)域的深度學(xué)習(xí)提高了診斷準(zhǔn)確性[11]。將人工智能技術(shù)用于輔助診療中,讓計(jì)算機(jī)“學(xué)習(xí)”專家醫(yī)生的醫(yī)療知識(shí),模擬醫(yī)生的思維和診斷推理,從而給出可靠的診斷和治療方案。輔助診療場(chǎng)景是醫(yī)療領(lǐng)域最重要、最核心的場(chǎng)景。此外,高精準(zhǔn)率電子膠片的推廣、放射科經(jīng)驗(yàn)豐富醫(yī)生的缺乏,使得人工智能技術(shù)在醫(yī)學(xué)影像方面透露出巨大的發(fā)展空間。目前,越來越多的人工智能增強(qiáng)型鉬靶攝影篩查工具進(jìn)入臨床市場(chǎng)[12]。Rodríguez等[13]發(fā)現(xiàn),使用人工智能系統(tǒng)支持后,放射科醫(yī)生不需要額外的閱讀時(shí)間,即可在進(jìn)行鉬靶攝影時(shí)提升癌癥檢測(cè)效率。
盡管人工智能在醫(yī)療領(lǐng)域具有廣闊的應(yīng)用前景,但實(shí)現(xiàn)其應(yīng)用落地仍面臨眾多問題。如對(duì)數(shù)據(jù)總量和質(zhì)量的考量;人工智能需在人的監(jiān)督下完成智能學(xué)習(xí),需人工做好標(biāo)識(shí);但現(xiàn)階段的數(shù)據(jù)在總量和標(biāo)記數(shù)量上均遠(yuǎn)遠(yuǎn)不足,因此靠人工對(duì)數(shù)據(jù)進(jìn)行標(biāo)記,需耗費(fèi)大量人力。其次,數(shù)據(jù)監(jiān)管問題也不容忽視[14];訓(xùn)練人工智能的龐大數(shù)據(jù)必然來自于醫(yī)療機(jī)構(gòu),涉及患者隱私的高度敏感問題必然是政策高度監(jiān)管的地帶,如何制定和完善法規(guī)、合理利用大數(shù)據(jù)優(yōu)勢(shì)又確?;颊咝畔踩玔15],是需要解決的矛盾點(diǎn)。再者,人工智能的真正普及更需要跨越觀念問題?;谌宋膫惱淼膫鹘y(tǒng)觀念影響,大眾并不認(rèn)為人工智能可以比人類做得更好,因此,接受人工智能應(yīng)用于醫(yī)療這一過程可能比想象中更艱難。
綜上,目前人工智能在乳腺癌領(lǐng)域的研究已成為國際研究熱點(diǎn)。國內(nèi)研究可充分借鑒國外研究的熱點(diǎn)與前沿,并結(jié)合自身特點(diǎn)發(fā)揮中國在癌癥防治方面的優(yōu)勢(shì),借助人工智能手段,注重國際合作與國家級(jí)機(jī)構(gòu)間合作,加強(qiáng)交叉學(xué)科研究,有效促進(jìn)中國的人工智能技術(shù)在癌癥研究方面的發(fā)展。