王靜文,徐 雯
隨著大數(shù)據(jù)的發(fā)展和算法結(jié)構(gòu)的完善,人工智能(artificial intelligence,AI)技術(shù)在醫(yī)療保健領(lǐng)域得到了長足的發(fā)展,在皮膚[1]、心臟[2]、放射[3-4]和腫瘤學(xué)[5]等領(lǐng)域取得了重大突破。在眼科領(lǐng)域,大多數(shù)研究最初集中于眼后段疾病的診療,包括糖尿病視網(wǎng)膜病變[6]、年齡相關(guān)性黃斑變性[7]、青光眼[8]以及早產(chǎn)兒視網(wǎng)膜病變[9]等。近年來,AI在角膜炎、圓錐角膜、白內(nèi)障、閉角型青光眼等眼前段疾病診治方面也取得了很大進(jìn)展。本文在對現(xiàn)有的研究成果進(jìn)行深入分析后,總結(jié)了AI在眼前段疾病診療方面的應(yīng)用進(jìn)展與不足,并對未來的潛在發(fā)展方向進(jìn)行展望。
自1955年麥肯錫及其同事提出AI的概念以來,AI在過去60a里發(fā)展迅速[10]。AI的核心是理解和構(gòu)建智能實體,利用軟件程序模擬人腦,從而實現(xiàn)智能化的操作或決策[11]。機(jī)器學(xué)習(xí)(machine learning,ML)是AI的一種重要技術(shù),旨在利用預(yù)先寫入機(jī)器的算法實現(xiàn)自動化與智能化。ML通過學(xué)習(xí)已被標(biāo)記特征的訓(xùn)練數(shù)據(jù)集,預(yù)測新的未知變量,并通過內(nèi)部循環(huán)進(jìn)行反饋訓(xùn)練,在學(xué)習(xí)的過程中對算法進(jìn)行調(diào)整,從而改進(jìn)其性能,其精度隨著訓(xùn)練集的數(shù)量和質(zhì)量提高而提高[12]。正如亞瑟·塞繆爾所定義的,ML賦予了計算機(jī)無需明確編程就能學(xué)習(xí)的能力[13]。根據(jù)訓(xùn)練集的不同,ML可以分為有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。有監(jiān)督機(jī)器學(xué)習(xí)在訓(xùn)練階段識別輸入與輸出的相關(guān)性,從而預(yù)測新案例的正確輸出。該算法通常是一個具有分類輸出的分類器或具有持續(xù)輸出的回歸算法。在無監(jiān)督學(xué)習(xí)中,模型從沒有標(biāo)記輸出的訓(xùn)練數(shù)據(jù)集中學(xué)習(xí),識別其潛在的模式或結(jié)構(gòu)。無監(jiān)督學(xué)習(xí)側(cè)重于探索性地對數(shù)據(jù)進(jìn)行分析,用于發(fā)現(xiàn)先前未知但可能存在的相關(guān)性。強(qiáng)化學(xué)習(xí)是一個基于獎勵系統(tǒng)的決策過程,有助于智能體之間的交互建模,但在生物醫(yī)學(xué)領(lǐng)域應(yīng)用較少。常用的ML算法有線性回歸、邏輯回歸、分類回歸樹(classification and regression trees,CART)、支持向量機(jī)(support vector machines,SVM)、決策樹(decision tree,DT)、隨機(jī)森林(random forests,RF)等[14]。傳統(tǒng)的ML技術(shù)在處理原始數(shù)據(jù)方面能力有限,構(gòu)建ML系統(tǒng)需要由具備豐富經(jīng)驗和專業(yè)領(lǐng)域知識的工程師設(shè)計特征提取器,將原始數(shù)據(jù)轉(zhuǎn)換成合適的特征向量。深度學(xué)習(xí)(deep learning,DL)是機(jī)器學(xué)習(xí)的進(jìn)一步細(xì)分,主要應(yīng)用于圖像識別、語音識別和自然語言處理等方面。DL不需手動標(biāo)記特征,通過模擬人腦的統(tǒng)計模型,根據(jù)互聯(lián)節(jié)點層間連接的權(quán)重來處理輸入,使用表征學(xué)習(xí)方法自動提取所需的特征,并對復(fù)雜的數(shù)據(jù)集進(jìn)行分類[15],大大減少了算法結(jié)構(gòu)對人力的依賴。常用的DL算法包括人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)和遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)[16]。
2.1角膜炎角膜混濁是全球第五大致盲原因,主要由角膜炎引起[17]。角膜炎臨床表現(xiàn)為視物模糊、疼痛、畏光以及流淚等刺激癥狀,眼科檢查可見角膜透明度減低、潰瘍等,嚴(yán)重者可繼發(fā)角膜穿孔、眼內(nèi)感染,甚至失明。早期發(fā)現(xiàn)并及時干預(yù)可以有效控制疾病的發(fā)展,達(dá)到更好的預(yù)后[18]。大量研究利用AI學(xué)習(xí)角膜圖像對角膜炎進(jìn)行早期診斷,取得了較高的靈敏度和特異度[19-25]。
Saini等[20]將已確診為感染性角膜炎患者的病史或?qū)嶒炇覚z查結(jié)果整合為40個輸入變量,用于訓(xùn)練3層前饋神經(jīng)網(wǎng)絡(luò),評估ANN對感染性角膜炎分類的有效性。結(jié)果顯示,該系統(tǒng)對細(xì)菌性角膜炎和真菌性角膜炎的特異性分別為76.47%和100%,準(zhǔn)確性為90.7%,遠(yuǎn)遠(yuǎn)高于人類專家(62.8%)。Li等[21]采用DenseNet121、Inception-v3和ResNet50算法學(xué)習(xí)裂隙燈照片,用于區(qū)分角膜炎、角膜其他異常和正常角膜。該系統(tǒng)曲線下面積(area under curve,AUC)均大于0.96,靈敏度和特異度與人類專家相當(dāng),且在不同類型的數(shù)碼裂隙燈相機(jī)和智能手機(jī)拍攝的角膜圖像中都表現(xiàn)良好。Wang等[22]采用Inception-v3算法學(xué)習(xí)5673張裂隙燈下拍攝的角膜照片,根據(jù)既往的臨床資料,將其分為正常組、細(xì)菌性角膜炎組、真菌性角膜炎組和單純皰疹病毒基質(zhì)性角膜炎(herpes simplex virus stromal keratitis,HSK)組。該系統(tǒng)在獨立測試集中顯示角膜全局圖像、區(qū)域圖像和智能手機(jī)圖像的二次加權(quán)kappa(quadratic weighted kappa,QWK)分別為0.9130、0.8872和0.5379,相應(yīng)的AUC均大于0.85,提示DL可以準(zhǔn)確地對裂隙燈照片上的角膜進(jìn)行分類,基于角膜全局圖像訓(xùn)練的算法具有更好地分類性能,在處理智能手機(jī)照片方面具有巨大潛力。Liu等[23]提出了一種全新的基于數(shù)據(jù)增強(qiáng)和圖像融合的CNN自動診斷真菌性角膜炎方法。在通過基于子區(qū)域?qū)Ρ榷壤斓膱D像預(yù)處理算法,突出圖像中的關(guān)鍵結(jié)構(gòu),濾除無關(guān)信息后,將預(yù)處理后的圖像與原始圖像進(jìn)行融合,形成新的算法框架和數(shù)據(jù)庫。最后,將傳統(tǒng)的CNN集成到新的算法框架中進(jìn)行實驗。結(jié)果表明,基于直方圖匹配融合的AlexNet和VGGNet的準(zhǔn)確率分別為99.95%和99.89%,均高于傳統(tǒng)算法,且降低了計算的復(fù)雜程度。Wu等[24]對比了基于圖像識別的自動菌絲檢測方法與角膜涂片法診斷真菌性角膜炎的準(zhǔn)確性,結(jié)果顯示菌絲自動檢測技術(shù)對圖像識別的敏感性為89.29%,特異性為95.65%,AUC為0.94,其對真菌性角膜炎的嚴(yán)重程度分級與臨床分級的相關(guān)系數(shù)為0.87,與傳統(tǒng)的人工識別共焦顯微鏡角膜圖像相比,該技術(shù)可以客觀準(zhǔn)確地可以對菌絲密度進(jìn)行量化和分級,提示了AI在真菌性角膜炎無創(chuàng)診斷中的潛在適用性。Loo等[25]開發(fā)了基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)SLIT-Net,對裂隙燈攝影圖像上感染性角膜炎的眼部結(jié)構(gòu)和生物標(biāo)志進(jìn)行自動分割,以識別基質(zhì)浸潤、前房積膿、白細(xì)胞邊界、角膜水腫、上皮缺損等特征。該算法在各個特征變量的表現(xiàn)均良好,骰子相似系數(shù)(dice similarity coefficient,DSC)在0.62~0.95之間,提示DL有望實現(xiàn)對角膜疾病生理和病理學(xué)改變的量化。
2.2圓錐角膜圓錐角膜(keratoconus,KC)是一種常見的角膜疾病,主要表現(xiàn)為角膜進(jìn)行性變薄和突出,導(dǎo)致近視、不規(guī)則散光,嚴(yán)重時造成視力損害。圓錐角膜早期可以通過框架眼鏡或硬性接觸鏡進(jìn)行矯正,進(jìn)展期可行交聯(lián)手術(shù)控制,晚期則需要角膜移植。圓錐角膜是全球角膜移植最常見的適應(yīng)證[26],早期識別并干預(yù)對預(yù)防圓錐角膜的進(jìn)展有重大意義。
Smadja等[27]采用Scheimpflug分析儀對372眼進(jìn)行成像,使用自動決策樹分類對每眼的前后角膜測量的55個參數(shù)進(jìn)行分析,該系統(tǒng)對圓錐角膜分類的敏感性為100%,特異性為99.5%,對亞臨床圓錐角膜分類的敏感性為93.6%,特異性為97.2%,表現(xiàn)出了較高的性能。Kamiya等[28]通過算法分析眼前節(jié)光學(xué)相干斷層掃描儀(anterior segment optical coherence tomography,AS-OCT)上獲得的6種彩色編碼圖,用于區(qū)分圓錐角膜和正常角膜。在單圖分析中,后高度圖的準(zhǔn)確性最高為99.3%,其它各圖的準(zhǔn)確率在97.6%到99.1%范圍內(nèi)。針對圓錐角膜嚴(yán)重程度的分級,該系統(tǒng)準(zhǔn)確性為87.4%,后曲率圖的準(zhǔn)確性為86.9%,其它各圖的準(zhǔn)確率在82%到84.5%之間。Cao等[29]使用8種常用的機(jī)器學(xué)習(xí)算法對49只亞臨床圓錐角膜眼和39只對照眼的角膜參數(shù)進(jìn)行研究,并對臨床和人口學(xué)參數(shù)進(jìn)行分析,評估了不同算法對亞臨床圓錐角膜的診斷性能。結(jié)果表明,RF、SVM和K-近鄰表現(xiàn)較為優(yōu)異,AUC最高為0.97(RF),敏感度最高為94%(SVM),特異度最高為90%(K-近鄰)。Mahmoud等[30]提出了一種借助二維正側(cè)面眼部圖像構(gòu)建3D角膜模型,全自動檢測圓錐角膜的技術(shù)。結(jié)果表明,該方法對圓錐角膜的診斷準(zhǔn)確率高達(dá)97.8%,與醫(yī)學(xué)專家的人工診斷結(jié)果相比有顯著性差異。圓錐角膜最初表現(xiàn)為單側(cè)角膜擴(kuò)張,50%的對側(cè)眼會在未來十幾年內(nèi)逐漸起病[31]。Kovács等[32]比較了單側(cè)圓錐角膜患者臨床正常對側(cè)眼細(xì)微形態(tài)變化的特點,通過描述其角膜地形和斷層特征,評價DL在鑒別健康角膜和正常對側(cè)角膜中的準(zhǔn)確性,AUC為0.96,與單一參數(shù)分類器相比,基于雙側(cè)數(shù)據(jù)訓(xùn)練的自動分類器具有更高的準(zhǔn)確率。
自1998年Seiler等[33]首次報道準(zhǔn)分子激光角膜原位磨鑲(lasiklaserinsitukeratomileusis,LASIK)術(shù)后角膜醫(yī)源性擴(kuò)張的病例以來,識別角膜醫(yī)源性擴(kuò)張的風(fēng)險一直是屈光手術(shù)前篩查的主要問題。盡管其發(fā)病率不高,但是一種不可逆的并發(fā)癥,影響視力預(yù)后,最終可能導(dǎo)致角膜移植[34]。Yoo等[35]綜合大量術(shù)前數(shù)據(jù),以10561眼構(gòu)建了一個ML模型,用于預(yù)測屈光手術(shù)的適用性。結(jié)果表明,其外部驗證的準(zhǔn)確率為93.4%,AUC為0.97,具有較為準(zhǔn)確的預(yù)測性能。Xie等[36]收集了1385例患者的6465張角膜斷層圖像,建立了Pentacam-InceptionResNetV2篩查分類系統(tǒng)(PIRSS),用于篩選屈光手術(shù)的潛在對象。該模型在驗證數(shù)據(jù)集上的總體檢測準(zhǔn)確率為94.7%。在獨立的測試數(shù)據(jù)集上,識別率為95.0%,與資深眼科醫(yī)生(92.8%)相當(dāng)。以上研究提示了AI用于臨床屈光手術(shù)前篩查的潛在可能性。
2.3白內(nèi)障白內(nèi)障是由于眼內(nèi)晶狀體混濁,光線無法直接投射在視網(wǎng)膜上,可導(dǎo)致視物模糊、視力下降甚至失明。據(jù)世界衛(wèi)生組織報告,全球33%的視力損害和51%的失明主要原因是白內(nèi)障[37]。隨著人口老齡化的趨勢加重,白內(nèi)障的患病率將逐年增加。早期診斷和及時治療對于提高白內(nèi)障患者的生活質(zhì)量并減輕醫(yī)療負(fù)擔(dān)至關(guān)重要。
許多研究探討了AI通過裂隙燈圖片和眼底照片實現(xiàn)對白內(nèi)障的自動診斷和嚴(yán)重程度分級。Xu等[38]通過開發(fā)了一種基于CNN的集成算法(AlexNet和VisualDN),通過學(xué)習(xí)8030張眼底圖像,實現(xiàn)對白內(nèi)障的診斷和分級,準(zhǔn)確率達(dá)86.2%。Wu等[39]使用預(yù)先訓(xùn)練的ResNet算法,學(xué)習(xí)37638張正常、白內(nèi)障患者和白內(nèi)障術(shù)后患者的眼前節(jié)裂隙燈照片。該算法在識別正確的捕獲模式、晶狀體狀態(tài)和需治療病例方面具有良好的診斷性能(AUC都大于0.9)。此外,作者將AI與遠(yuǎn)程醫(yī)療平臺相結(jié)合,提出了一種基于人工智能的醫(yī)療轉(zhuǎn)診模式,用于篩查和轉(zhuǎn)診白內(nèi)障患者,包括家庭自我監(jiān)測、初級保健和專業(yè)醫(yī)院服務(wù),提高了協(xié)作效率和醫(yī)療資源覆蓋率。
再者,AI也被廣泛用于預(yù)測白內(nèi)障患者術(shù)后的屈光狀態(tài)和晶狀體位置。Debellemaniere等[40]通過XG-Boost算法學(xué)習(xí)2022眼的術(shù)前臨床和生物學(xué)信息、植入晶狀體類型和度數(shù)以及術(shù)后屈光值的內(nèi)在關(guān)系,并與SRK-T公式和Haigis公式相比較。結(jié)果顯示三者均方根誤差分別為0.53、0.58和0.62,該算法可以更準(zhǔn)確地預(yù)測白內(nèi)障患者術(shù)后屈光狀態(tài)。Sramka等[41]從電子病歷系統(tǒng)獲得2194眼的數(shù)據(jù)集,采用支持向量機(jī)回歸模型(SVM-RM)和多層神經(jīng)網(wǎng)絡(luò)集成模型(MLNN-EM)進(jìn)行學(xué)習(xí),比較兩模型平均屈光預(yù)測誤差及其分布,并與Barrett Universal Ⅱ formula公式比較。結(jié)果發(fā)現(xiàn),兩種模型在大多數(shù)評估參數(shù)上的表現(xiàn)都很好,兩者之間沒有明顯差異。在±0.50D屈光誤差范圍內(nèi),SVM-RM和MLNN-EM均略優(yōu)于Barrett Universal Ⅱ公式,表明AI在改善臨床白內(nèi)障屈光效果方面具有很大的潛力。Li等[42]構(gòu)建了由847例患者的4137個樣本組成的數(shù)據(jù)集,利用梯度增強(qiáng)決策樹算法,預(yù)測白內(nèi)障術(shù)后人工晶狀體的位置,并與Haigis、Hoffer Q、Holladay 1、Olsen和SRK/T公式相比,平均預(yù)測誤差為0.106±0.098D,顯著低于其他五個公式(P<0.01)。
此外,AI在白內(nèi)障手術(shù)視頻的評估中也有著較為普遍的應(yīng)用。Yu等[43]將白內(nèi)障手術(shù)視頻分成側(cè)切口、主切口、撕囊、水分離、超聲乳化、皮質(zhì)吸除、IOL植入、吸除黏彈劑、水密切口、縫合等10個階段,評估不同算法對視頻相位自動識別的能力。結(jié)果發(fā)現(xiàn),五種算法準(zhǔn)確率為91.5%~95.9%,特異性為87.7%~99.9%,AUC為0.712~0.773,利用DL技術(shù)對視頻圖像進(jìn)行時間序列建模,有助于白內(nèi)障手術(shù)過程中相位的自動檢測。Morita等[44]提出了一種實時量化手術(shù)技術(shù)的方法,通過卷積神經(jīng)網(wǎng)絡(luò)InceptionV3模型自動識別連續(xù)環(huán)形撕囊(continuous curvilinear capsulorrhexis,CCC)和娩核,通過致密塊構(gòu)建的分割神經(jīng)網(wǎng)絡(luò)scSE-FC-DenseNet在CCC期檢測角膜區(qū)域,切口位置和撕囊鑷的尖端,檢測手術(shù)問題的發(fā)生,AUC為0.97,對角膜、鉗尖和切口部位的檢出率分別為99.7%、86.9%和94.9%。該方法有望成為實現(xiàn)外科技術(shù)水平標(biāo)準(zhǔn)化的基本技術(shù)之一。
2.4青光眼青光眼是一組以視乳頭萎縮及凹陷、視野缺損及視力下降為共同特征的疾病,病理性眼壓增高、視神經(jīng)供血不足是其原發(fā)危險因素[45]。根據(jù)世界衛(wèi)生組織的報告,青光眼是全世界致盲的第二大原因,也是不可逆盲的首要原因[46]。以前房角狹窄為主要特征的原發(fā)性閉角型青光眼(primary angle-closure glaucoma,PACG)是亞洲青光眼的主要類型[47]。及時診斷PACG對早期治療和視力保護(hù)具有重要意義。以往AI在青光眼的應(yīng)用主要集中在青光眼輔助診斷圖像,如眼底照相、視野、眼底OCT等。最近的研究表明,將AI技術(shù)應(yīng)用于AS-OCT及UBM圖像的識別分割和預(yù)測,同樣具有良好的診斷性能。
Xu等[48]開發(fā)并測試了基于3396張AS-OCT圖像自動分析的分類器,用于檢測前房角是否關(guān)閉。其中ResNet-18分類器在交叉驗證數(shù)據(jù)集上的AUC為0.933,在測試數(shù)據(jù)集上的AUC為0.928,取得了優(yōu)異的結(jié)果。Niwas等[49]提出了一種基于AS-OCT圖像對PACG不同機(jī)制進(jìn)行全自動分類的方法。采用復(fù)合圖像變換,直接從原始AS-OCT圖像中提取一組完整的形態(tài)學(xué)特征,從中選取一組冗余度最小的信息性特征,并將其輸入到貝葉斯分類器,準(zhǔn)確度達(dá)89.2%。Li等[50]將InceptionV3網(wǎng)絡(luò)和遷移學(xué)習(xí)技術(shù)先后應(yīng)用于UBM和AS-OCT圖像的學(xué)習(xí),用于評估前房角的開合情況。InceptionV3網(wǎng)絡(luò)由Szegedy等[51]于2015年提出,其在卷積算子和參數(shù)正則兩方面對以往用于計算機(jī)視覺任務(wù)的主流VGG[52]網(wǎng)絡(luò)做出改進(jìn),在降低模型復(fù)雜度的同時,也獲得了性能的提升。以UBM圖像為數(shù)據(jù)集系統(tǒng)的分類準(zhǔn)確率可達(dá)97.2%,AUC為0.988。以前節(jié)OCT為數(shù)據(jù)集的系統(tǒng)區(qū)分開角型、閉角型青光眼的敏感性達(dá)98.9%,特異性達(dá)99.5%,實現(xiàn)了對前房角的高精度分類。以上研究均體現(xiàn)了AI在前房角閉合的自動檢測及機(jī)制中的潛力。
以上的研究表明,AI在眼前段疾病的診治方面具有較強(qiáng)的預(yù)測能力,但其在臨床應(yīng)用中也存在著局限性:(1)黑盒性質(zhì)使AI在醫(yī)學(xué)中的應(yīng)用易受到質(zhì)疑。AI模型關(guān)注輸入輸出之間的相關(guān)性,但無法定量解釋該模型的推理過程,在出現(xiàn)一些離群值時無法判斷是AI的準(zhǔn)確預(yù)測,還是其錯誤評估了混雜因素。因此,需要一些可解釋的算法模型,幫助人們理解其中的處理過程,從而更好地進(jìn)行臨床決策。(2)理想情況下,AI模型應(yīng)該在不同條件下不同患者隊列的較大數(shù)據(jù)集中進(jìn)行驗證。目前多數(shù)研究的算法數(shù)據(jù)集來自從同質(zhì)人群中收集的小樣本。當(dāng)在現(xiàn)實環(huán)境中進(jìn)行測試時,患者的異質(zhì)性可能導(dǎo)致AI算法的準(zhǔn)確性降低。因此,需要建立包含不同種族不同地區(qū)人群的公共數(shù)據(jù)集。(3)日常眼科診療過程中產(chǎn)生了大量的數(shù)據(jù),但在將其納入可用的數(shù)據(jù)集之前,需要專業(yè)人員來完成標(biāo)簽、注釋、分割和質(zhì)量監(jiān)督,比較耗費時間和人力成本。因此,需要開發(fā)能夠用較少數(shù)據(jù)進(jìn)行學(xué)習(xí)的算法。此外,目前的研究傾向于根據(jù)檢查圖片局限性地識別單一的眼病,已有研究表明通過SVM算法,白內(nèi)障和角膜老年環(huán)可以同時在一張裂隙燈圖像中檢測出,這種多任務(wù)AI系統(tǒng)的效率和適用性要高于傳統(tǒng)的二進(jìn)制分類模型,也是該領(lǐng)域的未來發(fā)展方向[53]。
綜上所述,現(xiàn)有的研究顯示AI在眼前段疾病的診治中有著巨大的應(yīng)用潛力,但也存在著黑箱過程難以解釋、缺少公共數(shù)據(jù)集、算法標(biāo)注過于復(fù)雜等問題,未來可能會推出更易于理解、簡化、多任務(wù)的算法模型,同時完成多種疾病的診斷分級任務(wù),更好地服務(wù)于臨床診療。