佟佳益, 鄭改改, 王 宇, 楊巧芳
(1. 河南中醫(yī)藥大學(xué) 護理學(xué)院, 河南 鄭州, 450000; 阜外華中心血管病醫(yī)院, 2. 心力衰竭科,3. 護理部, 河南 鄭州, 451464; 4. 鄭州市心血管疾病護理重點實驗室, 河南 鄭州, 451464)
人工智能(AI)是一種通過編程設(shè)定系統(tǒng)指令來模擬并增強人類智力的智能化系統(tǒng),能夠從數(shù)據(jù)中提取知識并應(yīng)用知識來解決問題[1]。目前,國際醫(yī)學(xué)AI領(lǐng)域的相關(guān)研究高速發(fā)展, AI在突發(fā)衛(wèi)生事件和遺傳類疾病預(yù)防和控制方面展現(xiàn)出至關(guān)重要的輔助作用,且相較于傳統(tǒng)方法更精確、及時。隨著數(shù)字經(jīng)濟和互聯(lián)網(wǎng)產(chǎn)業(yè)的深入發(fā)展, AI技術(shù)在醫(yī)療大數(shù)據(jù)統(tǒng)計、智能交互和圖像處理等領(lǐng)域展現(xiàn)出巨大的潛力和優(yōu)勢[2-4], 但其存在的社會倫理復(fù)雜性以及臨床應(yīng)用的精確性還有待進一步考量[5]。近年來,醫(yī)學(xué)AI領(lǐng)域的研究正蓬勃發(fā)展。然而,現(xiàn)有關(guān)于醫(yī)學(xué)AI領(lǐng)域的文獻計量學(xué)研究[6-7]大多發(fā)表時間較早,對于該領(lǐng)域的研究熱點及其未來發(fā)展趨勢存在一定的滯后性,且鮮有通過雙聚類方法深入探討AI在醫(yī)學(xué)領(lǐng)域研究熱點屬性之間相關(guān)性的研究。因此,本研究采用雙聚類方法對醫(yī)學(xué)領(lǐng)域中AI技術(shù)的應(yīng)用研究進行分析,旨在為未來中國醫(yī)學(xué)AI領(lǐng)域的縱深研究提供參考依據(jù)。
本研究以Web of Science核心合集[8]作為數(shù)據(jù)來源,采用主題式檢索方式,檢索式如下: “TS=(artificial intelligence OR AI AND Medicine OR Medical)”, 檢索年限為建庫至2022年12月31日。為了消除誤差,采用數(shù)據(jù)庫中的篩選功能,將語言限定為英語,“文獻類型”類別選擇article和review,“研究方向”類別中對非醫(yī)學(xué)相關(guān)的文獻進行人工剔除后得到文獻9 076篇。將上述文獻以純文本的全記錄與引用格式導(dǎo)出至NoteExpress, 排除重復(fù)發(fā)表文獻,并使用Co-Occurrence13.4[9]提取文獻的關(guān)鍵詞字段,去除缺失關(guān)鍵詞的文獻,最終納入有效文獻7 803篇。
使用Co-Occurrence13.4對納入文獻的關(guān)鍵詞進行頻次統(tǒng)計,選擇排名前30位高頻關(guān)鍵詞生成詞篇矩陣,將詞篇矩陣導(dǎo)入gCluto進行雙向聚類,聚類方法(Cluster Method)選擇Regeated Bisection, 相似性(Similarty Function)選擇Cosine, 聚類數(shù)量及效果由類內(nèi)相似度、類間相似度結(jié)果及專業(yè)知識結(jié)合分析確定。根據(jù)gCluto聚類結(jié)果繪制戰(zhàn)略坐標(biāo)圖,圖中縱坐標(biāo)為密度,代表每一類別內(nèi)主題詞之間的緊密程度,橫坐標(biāo)為向心度,代表不同類別主題詞之間的緊密程度,類別內(nèi)的研究之間聯(lián)系越密切,則密度越大,一類研究與別類研究之間的聯(lián)系越密切,則向心度越大[10]。
2.1.1 發(fā)文時間分布: 自1991年以來,AI在醫(yī)學(xué)領(lǐng)域應(yīng)用的發(fā)文量呈逐年上升趨勢。第1階段(1991—2008 年): 初步探索階段; 第2階段(2009—2022年): 加速發(fā)展階段,其中受新型冠狀病毒感染疫情的影響,2020—2022年AI在醫(yī)學(xué)研究領(lǐng)域的發(fā)文量呈爆發(fā)式增長,見圖1。
圖1 AI在醫(yī)學(xué)研究領(lǐng)域的年發(fā)文量變化情況
2.1.2 發(fā)文期刊和國家、機構(gòu)分布: 分析結(jié)果顯示,主題領(lǐng)域內(nèi)發(fā)文分布排名前5位的期刊分別為:PlosOne(184篇)、ScientificReports(166篇)、Diagnostics(111篇)、JournalofMedicalInternetResearch(94篇)、Cancers(66篇); 發(fā)文量累計最多的國家為美國(2 966篇,占比38.00%), 其次為中國(1 223篇,占比15.67%)和英國(777篇,占比9.96%)。發(fā)文研究機構(gòu)分析顯示,共有10 072個機構(gòu)參與醫(yī)學(xué)AI研究,其中發(fā)達(dá)國家發(fā)文量首位的機構(gòu)為Harvard Med Sch(148篇),其次是Univ Washington(140篇)、Mayo Clin(108篇)。發(fā)展中國家發(fā)文量首位的機構(gòu)為上海交通大學(xué)(76篇),其次是中山大學(xué)(73篇)、華中科技大學(xué)(65篇)。
使用Co-Occurrence13.4對納入文獻的關(guān)鍵詞按照詞頻分界法確定頻次,將高頻同義詞進行合并后最終形成17 777個關(guān)鍵詞,根據(jù)主題領(lǐng)域特定背景信息設(shè)置關(guān)鍵詞頻次>124次,最終共得到高頻關(guān)鍵詞30個,并形成雙聚類高頻詞表,見表1。
表1 AI在醫(yī)學(xué)研究領(lǐng)域的雙聚類高頻關(guān)鍵詞
gCluto聚類工具包提供了一種可以生成高頻關(guān)鍵詞雙向聚類及山丘圖(圖2)的可視化方法,可用于探索主題領(lǐng)域內(nèi)的研究熱點及趨勢[11]。本研究中,代表高頻關(guān)鍵詞共生成6個類屬,分別為AI與衛(wèi)生保健應(yīng)用的研究(類屬0)、AI與疾病轉(zhuǎn)歸關(guān)系的研究(類屬1)、AI與疾病全程監(jiān)測應(yīng)用的研究(類屬2)、AI輔助癌癥診斷鑒別的研究(類屬3)、AI與預(yù)測模型構(gòu)建及效驗的研究(類屬4)、AI與生物標(biāo)志物鑒別診斷的研究(類屬5),聚類結(jié)果見圖3。聚類山丘中,峰頂顏色與聚類內(nèi)標(biāo)準(zhǔn)差呈相關(guān)性[12], 由紅色、綠色、藍(lán)色,依次代表標(biāo)準(zhǔn)差低、適中、高。結(jié)果顯示, 2、5聚類山丘呈現(xiàn)紅色,表明聚類內(nèi)關(guān)鍵詞高度相似; 0、1、3、4聚類山丘呈綠色,表明聚類內(nèi)關(guān)鍵詞相似度適中。山丘圖成像結(jié)合專業(yè)知識對聚類結(jié)果進行分析,所生成的聚類類內(nèi)相似度、類間相似度指標(biāo)合理。聚類0至聚類5的類內(nèi)相似度(ISim)分別為0.327、0.304、0.278、0.247、0.245、0.206, 類間相似度(ESim)分別為0.038、0.033、0.032、0.028、0.029、0.013。根據(jù)高頻詞的聚類結(jié)果繪制出戰(zhàn)略地圖以協(xié)助分析主題領(lǐng)域內(nèi)研究熱點及研究聚合程度,具體結(jié)果見圖4。
圖2 醫(yī)學(xué)AI研究高頻關(guān)鍵詞聚類山丘圖
圖3 醫(yī)學(xué)AI研究高頻關(guān)鍵詞雙聚類分析圖
圖4 醫(yī)學(xué)AI研究趨勢戰(zhàn)略坐標(biāo)圖
醫(yī)學(xué)AI領(lǐng)域研究近3年處于高速發(fā)展階段。中國相繼發(fā)布的“中國制造2025”和“健康中國2030”等系列方針政策和規(guī)劃綱要,將AI列入國家發(fā)展戰(zhàn)略的重要組成部分,大力支持AI在醫(yī)學(xué)領(lǐng)域的發(fā)展[13]。同時,隨著全民健康和科技創(chuàng)新發(fā)展的需要不斷增加,以AI為基礎(chǔ)的智能化醫(yī)療已成為實現(xiàn)這2個目標(biāo)的重要組成部分之一[14]。患者在切身體會AI帶來的精準(zhǔn)、科學(xué)醫(yī)療服務(wù)的同時,也提升了對醫(yī)學(xué)AI的接受程度,進一步推動了AI在各行各業(yè)的廣泛應(yīng)用[15]。本研究結(jié)果可見, AI在醫(yī)學(xué)領(lǐng)域應(yīng)用研究的全球發(fā)文量呈逐年上升趨勢,尤其是近3年主題領(lǐng)域內(nèi)發(fā)文量呈爆發(fā)式增長。其中,研究主題領(lǐng)域內(nèi)發(fā)文量排名靠前的國家多為發(fā)達(dá)國家,中國為發(fā)文量位居首位的發(fā)展中國家,可能與國內(nèi)外相關(guān)政策導(dǎo)向助力推進醫(yī)療技術(shù)信息化、智能化發(fā)展有關(guān)[16]。
聚類分析結(jié)果可見,類別0、1、2研究集中于AI應(yīng)用于公共衛(wèi)生事件的研究,主要涉及流行病學(xué)及衛(wèi)生保健方向,從探索疾病的風(fēng)險因素延伸至轉(zhuǎn)歸、結(jié)局及影響因素等。山丘圖與戰(zhàn)略坐標(biāo)圖結(jié)果可見,該類山丘內(nèi)變異度較小,研究人群相對集中。相關(guān)研究[17]表明,在AI技術(shù)的支持下,醫(yī)療數(shù)據(jù)統(tǒng)計效率及精確度逐步提升,同時優(yōu)化了數(shù)據(jù)的可用性。在新型冠狀病毒感染疫情期間,醫(yī)護人員利用數(shù)字化預(yù)測模型,精確篩查疫情傳播鏈及易感人群[18], 對高危人群進行個體化防控,有效降低了疾病的傳染風(fēng)險,為控制疫情提供了有效保障[19]。此外,利用AI技術(shù)為易感人群制訂個性化電子病歷,在傳統(tǒng)影像學(xué)成像系統(tǒng)的基礎(chǔ)上進行數(shù)字化圖像轉(zhuǎn)換[20], 不僅提高了肺炎類型的檢疫精確度及特異性[21], 而且將感染風(fēng)險及治療轉(zhuǎn)歸進行智能化預(yù)測分析,在優(yōu)化醫(yī)療資源分配的基礎(chǔ)上,改善了患者疾病轉(zhuǎn)歸及臨床預(yù)后[22-23]。由此可見, AI技術(shù)的遠(yuǎn)程可控及信息擴展屬性在預(yù)防和控制公共衛(wèi)生突發(fā)事件中發(fā)揮了至關(guān)重要的作用。
戰(zhàn)略坐標(biāo)圖分析結(jié)果顯示,類別5研究在密度和向心度上表現(xiàn)最高,表明該類研究與主題領(lǐng)域內(nèi)其他相關(guān)研究之間存在密切關(guān)系。同時,結(jié)合類別內(nèi)關(guān)鍵詞和既往研究[24], 可以推斷類別5與研究人群固定的類別3之間存在緊密關(guān)系。目前,基于AI的檢測技術(shù)已應(yīng)用于基因檢測及早期惡性腫瘤篩查,且在輔助診斷癌癥及分型研究中已取得確切效果[25]。其中,蛋白檢測及基因測定在臨床實踐中同屬于生物標(biāo)志物檢測,該類檢查屬于無創(chuàng)性檢測,對于確定疾病機制、實施個性化管理提供了可行性[26]。YANG D等[27]基于AI算法開發(fā)的GEM基因診斷技術(shù),實現(xiàn)了自動化檢測,提高了遺傳基因亞型的檢測及診斷的檢查效率及精準(zhǔn)性,有效解決了傳統(tǒng)檢驗方法因時間和成本限制引起的相關(guān)風(fēng)險性問題。同時,利用生物檢測模型對中樞基因進行生存分析,鑒定靶基因與腫瘤免疫力之間的關(guān)系,為惡性腫瘤的鑒別診斷提供了重要依據(jù),提高了對惡性腫瘤患者生存預(yù)測的精準(zhǔn)性[28-29], 為早期惡性腫瘤的篩查和個性化管理提供了新思路和方法。此外,癌癥的分子分型決定了治療方式的選擇。MITSALA A等[30]利用AI技術(shù)開發(fā)出結(jié)腸癌分型系統(tǒng),確定了不同類型結(jié)腸癌的基因表達(dá),進一步證實了結(jié)腸癌細(xì)胞異質(zhì)性及生物學(xué)分型指標(biāo),為精確癌癥分型及鑒別診斷提供了有力支持[31]。
類別4屬于基于AI的預(yù)測模型構(gòu)建及檢驗,結(jié)合山丘圖和戰(zhàn)略坐標(biāo)圖可見,此類別類內(nèi)差異較大,且密度最低,提示相關(guān)研究相對較少,未來應(yīng)加強該類研究,為醫(yī)學(xué)領(lǐng)域內(nèi)疾病預(yù)測模型的構(gòu)建及檢驗提供參考。相關(guān)研究[32]已證實,基于AI算法的疾病預(yù)測模型能夠為臨床提供決策支持,提高醫(yī)學(xué)診斷的特異性及敏感性。相較于傳統(tǒng)的疾病預(yù)測方式, YE S Y等[33]構(gòu)建了基于AI的心肌梗死風(fēng)險預(yù)測模型,具備更高的準(zhǔn)確性和及時性,能夠有效降低院內(nèi)心肌梗死的風(fēng)險,改善患者的臨床結(jié)局。此外,對于早期癌癥患者而言,通過疾病預(yù)警模型篩查和管理影響其生存質(zhì)量的高危因素及癌病變風(fēng)險,能夠指導(dǎo)臨床醫(yī)生為患者制訂個性化的管理及治療策略[34], 尤其胰腺癌這類早期無明顯癥狀且生存率較低的惡性腫瘤的診斷尤其受益?;贏I的疾病預(yù)測模型不僅為胰腺癌早期診斷提供了更準(zhǔn)確的結(jié)果,同時降低了因篩查遺失率所導(dǎo)致的風(fēng)險[35-37]。因此,加強基于AI的疾病預(yù)測模型構(gòu)建及驗證,對提高患者的臨床預(yù)后具有非常重要的意義。
目前,國外醫(yī)學(xué)研究由AI向深度機器學(xué)習(xí)、納米機器人等輔助臨床診斷和治療技術(shù)逐步發(fā)展,但其因涉及倫理問題,還需要各國研究者結(jié)合實際國情進行深入探討。中國在順應(yīng)國情及政策支持的前提下,未來應(yīng)增加多學(xué)科、機構(gòu)間的交流合作,推動AI技術(shù)在醫(yī)學(xué)診斷以及疾病預(yù)測模型構(gòu)建等領(lǐng)域的發(fā)展。此外,本研究僅納入Web of science核心合集數(shù)據(jù)庫文獻,因此可能存在文獻范圍有限和語言限制的問題。下一步研究擬增加納入數(shù)據(jù)庫數(shù)量,并通過專家論證的方法獲得更為全面和可靠的結(jié)果。