張宏娜綜述 程艷麗審校
人工智能(artificial intelligence,AI),廣義上是指關(guān)于人造物的智能行為,智能行為包括知覺、推理、學(xué)習、交流和在復(fù)雜環(huán)境中的行為,自從該定義被首次提出之后就逐漸被應(yīng)用于各個領(lǐng)域并不斷擴大,其中就包括在醫(yī)學(xué)領(lǐng)域的應(yīng)用[1]。機器學(xué)習是一種實現(xiàn)AI的方法,可分為手工算法和深度學(xué)習算法,其中深度學(xué)習算法是當前機器學(xué)習領(lǐng)域一個研究熱點。深度學(xué)習網(wǎng)絡(luò)包括:深度神經(jīng)網(wǎng)絡(luò)(deep neural network, DNN)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)等,其中 CNN是研究最多的。近年來AI技術(shù)的發(fā)展取得了一些進步,各種影像和視覺技術(shù)在這個領(lǐng)域中至關(guān)重要,一些檢查模型也隨之出現(xiàn),其中以計算機輔助決策系統(tǒng)(computer aided diagnosis,CAD)應(yīng)用最為廣泛。以下著重對AI技術(shù)發(fā)展及在消化道內(nèi)鏡檢查中的應(yīng)用進行綜述。
1.1 AI產(chǎn)生與發(fā)展 AI是研究如何通過機器模擬和擴展人類認知能力的新興科學(xué)技術(shù),屬于計算機科學(xué)中的一個分支。1956年,在美國達特茅斯學(xué)院召開的討論會中,約翰·麥卡錫首次提出“人工智能”的概念,并將其視為一門新興學(xué)科。經(jīng)過數(shù)年艱難的發(fā)展,至20世紀90年代人工智能算法被逐步應(yīng)用于解決實際問題,涉及了包括機器人學(xué)、 語音識別、 自然語言識別與處理、 圖像識別與處理、 機器學(xué)習等在內(nèi)的眾多學(xué)科和技術(shù)[2]。人工神經(jīng)網(wǎng)絡(luò)是人工智能的基石,通過模仿人體大腦神經(jīng)元之間信息傳遞和處理方法而產(chǎn)生。神經(jīng)網(wǎng)絡(luò)在經(jīng)歷了單層神經(jīng)網(wǎng)絡(luò)、雙層神經(jīng)網(wǎng)絡(luò)及多層神經(jīng)網(wǎng)絡(luò)的發(fā)展,終于通過深度學(xué)習技術(shù)在語音識別、圖片識別等領(lǐng)域有所突破[3]。
1.2 深度學(xué)習法 伴隨著深度學(xué)習算法的出現(xiàn),機器學(xué)習完全擺脫了人工提取數(shù)據(jù)低效和不精確的局限性,給AI的研究和發(fā)展帶來了革命性的進步。深度學(xué)習是一種數(shù)據(jù)提取方法,特別適合大數(shù)據(jù)的信息提取。深度學(xué)習技術(shù)基于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),是一系列計算方法,通過深層非線性網(wǎng)絡(luò)結(jié)構(gòu)無限接近復(fù)雜函數(shù),從而實現(xiàn)機器的自主編程,而無需明確指定規(guī)則。自2006年來深度學(xué)習已成為圖像處理和計算機視覺領(lǐng)域的主導(dǎo)工具,其通過直接從大數(shù)據(jù)中抓取處理對象特征使得其對圖像識別的準確度大大提高,常用于圖像識別的模型包括CNN模型及深度信念網(wǎng)絡(luò)模型,其中 CNN 算法分類效果好、適應(yīng)性強、可以有效識別圖像并進行圖像分割而被更多地應(yīng)用于醫(yī)學(xué)圖像的識別[4]。目前,基于深度學(xué)習的圖像識別技術(shù)已發(fā)展的較為成熟,在影像學(xué)領(lǐng)域,特別是CT、磁共振、超聲、PET 等輔助讀片系統(tǒng)已得到較為廣泛的認可,且為藥物開發(fā)也提供了新的研究方向,另外當今機器人技術(shù)也是一項具有重大前景的新技術(shù)。
2.1 AI在食管疾病中的應(yīng)用 在食管疾病中,Barrett食管是食管癌的高危因素,但在內(nèi)鏡檢查中常被誤診,有研究利用CAD對Barrett食管在白光內(nèi)鏡下顏色、紋理特征的訓(xùn)練學(xué)習,結(jié)果顯示準確率、敏感度和特異度為92%、95%、85%[5]。復(fù)旦大學(xué)附屬中山醫(yī)院的研究應(yīng)用深度學(xué)習的輔助技術(shù)對食管早癌診斷的敏感度及特異度均較高[6]。有研究表明[7],精準定位活檢診斷高級別上皮內(nèi)瘤變和食管腺癌的敏感度和特異度為90%、80%,陰性預(yù)測值為98%。另有大樣本的研究顯示[8],基于CNN構(gòu)建了AI模型,對食管癌檢測的敏感度和陽性預(yù)測值為98%、40%。AI電子染色模式也有研究,有學(xué)者收集了70例患者的臨床資料,結(jié)果顯示AI電子染色內(nèi)鏡模式檢測結(jié)果與病理結(jié)果一致性滿意,電子染色內(nèi)鏡模式診斷食管癌的準確度為94.29%,陰性預(yù)測值為93.10%,優(yōu)于白光內(nèi)鏡,有助于鑒別食管黏膜的微小病變[9]。
2.2 AI在胃部疾病中的應(yīng)用 在胃部疾病中,胃癌一直嚴重威脅著人類健康,早期內(nèi)鏡診斷并治療是降低胃癌病死率、提高患者生存率的主要方法,AI技術(shù)輔助胃癌癌前病變及早癌診斷的研究眾多,其中一項研究采用CNN模型[10],從數(shù)據(jù)庫選取了5 159張胃鏡圖像,其中包括早期胃癌1 000張、良性病變及正常圖像4 159張,選取4 449張圖像用于深度學(xué)習模型的訓(xùn)練,剩余的710張圖像用于模型的驗證,同時再交給4名內(nèi)鏡醫(yī)師進行診斷,最后統(tǒng)計結(jié)果證實深度學(xué)習模型可在胃鏡檢查中輔助內(nèi)鏡醫(yī)師進行實時診斷,對早期胃癌診斷的準確率、敏感度和特異度為89.4%、88.8%、89.7%,每張圖像的診斷時間為(0.30±0.02)s,均優(yōu)于相比較的4名內(nèi)鏡醫(yī)師。另有研究證實[11],AI技術(shù)可進一步確定早期胃癌的浸潤深度,來源于黏膜層或黏膜下層,AI技術(shù)對黏膜下早期胃癌的敏感度和特異度分別為76%、96%,明顯高于內(nèi)鏡下直視的檢查,可見利用AI技術(shù)對目標進行識別,可彌補人類視覺捕捉不全的缺點,可在胃鏡檢查中輔助內(nèi)鏡醫(yī)師進行實時診斷,有望改善醫(yī)師的檢測能力。在識別圖像方面,有研究利用 CNN 模型對66例已確診的胃癌圖像識別,確診率達94.1%,檢測中位時間為1 s,提示深度學(xué)習技術(shù)可提供準確和快速的自動檢測結(jié)果[12]。有研究采用深度學(xué)習技術(shù)檢測早期胃癌,將13 584 張傳統(tǒng)內(nèi)鏡圖像用于訓(xùn)練 CNN,并從連續(xù)77處胃癌病變中收集2 296張圖像,結(jié)果顯示該模型準確診斷71處胃癌病變僅需77 s,總體敏感度為92.2%,該研究構(gòu)建的CNN可用于短時間內(nèi)處理大量內(nèi)鏡圖像來診斷胃癌,且具有實時臨床診斷能力,但陽性預(yù)測值較低,只有30.6%,推測提高陽性預(yù)測值可能是后續(xù)研究重點[13]。另外幽門螺桿菌(Hp)感染與消化性潰瘍、慢性胃炎、胃癌等密切相關(guān),且我國Hp感染率較高,但內(nèi)鏡醫(yī)生對Hp的識別存在較大的主觀差異,有研究利用CNN模型,對內(nèi)鏡下胃Hp感染診斷敏感度和特異度均達到86.7%,優(yōu)于內(nèi)鏡醫(yī)生的直接判斷[14]。胃鏡檢查中病灶的定位研究也較多,一項大樣本研究[15]應(yīng)用機器學(xué)習方法將胃鏡圖像分為喉部、食管、胃、十二指腸4個部位進行模型訓(xùn)練,結(jié)果顯示辨別解剖部位的準確度為97%,該研究表明機器學(xué)習方法可能會自動識別消化道解剖部位,在胃鏡實際操作過程中提醒內(nèi)鏡醫(yī)師可能存在的檢查盲區(qū),以提高胃鏡檢查質(zhì)量,具有較高的應(yīng)用價值。
2.3 AI在大腸疾病中的應(yīng)用 結(jié)直腸癌是美國癌癥相關(guān)死亡的第二大原因,研究表明,大約95%胃腸道腫瘤由腺瘤發(fā)展而來,所以早發(fā)現(xiàn)至關(guān)重要,結(jié)腸腺瘤的檢出可使患者發(fā)生結(jié)腸癌的風險大大降低,腺瘤檢出率在美國已經(jīng)成為衡量內(nèi)窺鏡醫(yī)師能力的重要標準[16]。腺瘤檢出率增加1%,結(jié)直腸癌發(fā)病率降低3%[17],影響這一比率的因素有兩個:盲點和人為錯誤。盲點可利用廣角鏡可進一步解決,但人為誤差不易克服,作為一種解決人為錯誤的方法,AI一直很受關(guān)注[18]。近幾年更多的研究將模型用于提取更具鑒別性的信息特性,息肉的鑒別是最受關(guān)注的。AI研究結(jié)果顯示,深度學(xué)習所提取的息肉特征明顯優(yōu)于其他手工提取方式,更適合于臨床實踐中結(jié)直腸息肉的智能檢出[19]。CAD-CNN結(jié)腸鏡檢查模型可以幫助內(nèi)窺鏡醫(yī)師用于息肉的檢測和光學(xué)診斷。最近一項涉及8 641張結(jié)腸鏡圖像的大型研究顯示,該系統(tǒng)識別息肉的準確率96.4%[20],另有研究使用CAD系統(tǒng),發(fā)現(xiàn)息肉的敏感度為88%,從發(fā)現(xiàn)息肉到診斷息肉僅0.3 s[21]。在窄帶成像放大內(nèi)鏡檢查中,有研究表明CAD系統(tǒng)能夠正確分類息肉的敏感度和特異性分別為95%、93.3%[22]。還有研究識別腫瘤和增生性息肉的敏感度和特異度為96.3%、78.1%,陽性預(yù)測值和陰性預(yù)測值為89.6%、91.5%,且用時比醫(yī)師短,并且可鑒別腫瘤或小于5 mm增生大腸息肉[23]。
在腸鏡檢查中,除息肉的研究外,還有其他病變的研究。當前炎癥性腸病的發(fā)病率日益增高,AI 的應(yīng)用也成為該領(lǐng)域的研究熱點。一項研究[24]建立腸道炎性反應(yīng)識別 CAD系統(tǒng),發(fā)現(xiàn)該系統(tǒng)對正常和炎性反應(yīng)黏膜的辨識度很高,增加潰瘍性結(jié)腸炎腸道炎性反應(yīng)評估的客觀性,可減少因內(nèi)鏡醫(yī)生水平不同所造成的觀察者間差異。有報道利用AI技術(shù)對早期腸道黏膜炎性反應(yīng)識別的敏感度和特異度為74%、97%,準確率91%,有效加強早期黏膜管理[25]。一項對60萬余幅的結(jié)腸鏡圖像分析數(shù)據(jù)的研究顯示[26],在臨床結(jié)腸鏡操作中,該模型對結(jié)腸息肉的敏感度為98.30%,特異度為88.10%,診斷結(jié)腸息肉的總體準確率為92.92%,對潰瘍性結(jié)腸炎的敏感度為78.32%,特異度為 67.06%,單張圖像的診斷時長為(0.50±0.03)s。多項研究表明,當前的AI技術(shù)幾乎可輔助完成結(jié)腸鏡檢查過程中從腸腔探查、病灶定性的全部工作。
2.4 AI在小腸疾病中的應(yīng)用 膠囊內(nèi)鏡在小腸疾病的研究和診斷中起著革命性的作用。但每個患者可以收集約6萬張圖像,可能需要集中精力30~120 min來分析[27],耗時較長,且受不同級別醫(yī)生診斷水平和主觀性影響。小腸病變類型多樣,糜爛和潰瘍是常見類型。有研究應(yīng)用CNN方法,研發(fā)了一個膠囊內(nèi)鏡AI診斷系統(tǒng)用于糜爛和潰瘍的診斷,采用5 360張黏膜損傷和潰瘍圖片作為訓(xùn)練集,并用獨立的10 440張小腸圖片作為獨立驗證集,結(jié)果顯示診斷敏感度為88.2%,特異度為90.9%,準確率為90.8%,且僅用時233 s。在一項小腸克羅恩病的研究中[28],診斷潰瘍的準確性由95.4%~96.7%不等。在出血方面的檢測,顏色特征可作為識別的主要指標,有研究發(fā)現(xiàn)膠囊內(nèi)鏡發(fā)現(xiàn)消化道出血的敏感度和特異度高達 99%[29]。另有報道應(yīng)用AI技術(shù)對乳糜瀉診斷敏感度和特異度均達100%[30],可見AI技術(shù)正在逐漸被應(yīng)用于少見病的診斷中。
2.5 AI在其他消化系統(tǒng)疾病中的應(yīng)用 近年來的新技術(shù),如超聲內(nèi)鏡、胰膽管鏡的出現(xiàn)為消化系統(tǒng)疾病的診斷及治療提供了新方向,一項研究發(fā)現(xiàn)[31],以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的超聲內(nèi)鏡彈性成像系統(tǒng)對11例假腫瘤性胰腺炎和32例胰腺癌的鑒別診斷價值較高,其訓(xùn)練準確率達97%,測試準確率達90%。AI在內(nèi)鏡逆行胰膽管造影及胰膽管鏡中的文獻報道較少,卷積神經(jīng)網(wǎng)絡(luò)在這些領(lǐng)域運用尚屬空白,未來的探索性研究值得期待。
我國消化內(nèi)鏡技術(shù)發(fā)展迅猛,消化內(nèi)鏡發(fā)展至今取得了顯著成就。目前人工智能在醫(yī)學(xué)內(nèi)窺鏡診斷中已取得較好效果,但仍面臨一些問題,我國人口基礎(chǔ)大、需求量大,所以一些輔助技術(shù)和設(shè)備正在研發(fā)中,其中AI技術(shù)將給消化內(nèi)鏡帶來一種全新的診療體系,但消化內(nèi)鏡AI技術(shù)不同于其他醫(yī)學(xué)影像技術(shù),因其多為非標準化動態(tài)圖像,數(shù)據(jù)量大,影響因素多,所以研發(fā)難度較大,我國有大量的醫(yī)療數(shù)據(jù),但人工智能輔助診斷系統(tǒng)的訓(xùn)練與模型建立需要大量、高質(zhì)量結(jié)果可靠的數(shù)據(jù)集,因此目前可供研究使用的數(shù)據(jù)集相對缺乏。其次,不同醫(yī)院采集數(shù)據(jù)的醫(yī)療器械之間的差異使得采集的圖像質(zhì)量有所差異,造成機器學(xué)習的不兼容,所以目前適用于臨床的產(chǎn)品仍需進一步研究。但在不久的將來,隨著科技的進步,AI技術(shù)有望實現(xiàn)消化道疾病的早診斷早治療,有望提升不同級別病變診斷的準確度,尤其是對低度病變和高度病變的區(qū)分。在實現(xiàn)方式上可以著重增加異常病變數(shù)據(jù)的訓(xùn)練且要對異常病變的數(shù)據(jù)進行質(zhì)量控制。總之,在AI技術(shù)的幫助下,消化道內(nèi)鏡檢查或許會變得非常簡單,醫(yī)師僅需按要求采集相應(yīng)圖像或錄制檢查影像,AI系統(tǒng)即能迅速作出相應(yīng)診斷。因此,積極優(yōu)化AI的應(yīng)用,將現(xiàn)代科學(xué)技術(shù)的研究成果與醫(yī)學(xué)檢查和診斷有效結(jié)合,造?;颊?,是醫(yī)生和患者的共同期望,期待早日與AI技術(shù)攜手步入“AI+醫(yī)療”時代。