韓亞波 綜述 易全勇 審校
1寧波大學(xué)醫(yī)學(xué)院附屬陽明醫(yī)院,寧波 315040;2寧波市眼科醫(yī)院,寧波 315040
瞼板腺功能障礙(meibomian gland dysfunction,MGD)是蒸發(fā)過強型干眼的主要原因,也是眼科常見病[1]。MGD相關(guān)干眼可對人們的生活質(zhì)量產(chǎn)生影響,并可能造成直接或間接公共衛(wèi)生成本升高以及個人經(jīng)濟負擔(dān)加重??焖?、準確的診斷可以免除不必要的費用及過度治療引起的潛在不良反應(yīng)。瞼緣和瞼板腺開口異常、瞼酯分泌異常出現(xiàn)任意一種體征再結(jié)合眼部癥狀可診斷為MGD[2]。由于MGD相關(guān)干眼患者癥狀常表現(xiàn)各異,甚至癥狀體征分離,因此臨床上常聯(lián)合使用多項測試,包括淚膜破裂時間(tear break-up time,TBUT)、淚腺分泌測試、淚液滲透壓和淚河高度、眼表染色、角膜敏感性、瞬目頻率、角膜地形圖、干涉測量和裂隙燈顯微鏡圖像、紅外瞼板腺成像技術(shù)、活體共聚焦顯微鏡(invivoconfocal microscopy,IVCM)、問卷記錄等[3],這些測試需要在臨床上投入大量的時間和資源。人工智能(artificial intelligence,AI)利用機器學(xué)習(xí)(machine learning,ML)和深度學(xué)習(xí)(deep learning,DL)技術(shù)在醫(yī)療領(lǐng)域獲得廣泛的應(yīng)用[4]。ML是在算法的基礎(chǔ)上,學(xué)習(xí)大量的歷史數(shù)據(jù),從而得出預(yù)測模型及對應(yīng)結(jié)果[5]。ML包括:(1)監(jiān)督學(xué)習(xí) 監(jiān)督學(xué)習(xí)算法可以執(zhí)行回歸和分類,其中回歸涉及預(yù)測數(shù)據(jù)實例的數(shù)值,而分類涉及將數(shù)據(jù)實例分配給預(yù)定義的類別。(2)無監(jiān)督學(xué)習(xí) 無監(jiān)督學(xué)習(xí)包括聚類算法和降維算法,這種類型的ML通常用于將觀察結(jié)果分組在一起,檢測輸入變量之間的關(guān)系,以及降維。(3)強化學(xué)習(xí) DL是ML研究的一個新領(lǐng)域,很多結(jié)構(gòu)模型都曾應(yīng)用于醫(yī)學(xué)影像的研究,如卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、棧式自編碼器、受限玻爾茲曼機、深度信念網(wǎng)絡(luò)等[6-7](圖1)。基于DL的影像模型可以提高檢查的準確性并節(jié)省時間,可用于MGD的臨床輔助診斷和篩查[8]。AI在眼部疾病中的應(yīng)用較多,包括糖尿病視網(wǎng)膜病變的篩查、年齡相關(guān)性黃斑變性的檢測、青光眼和早產(chǎn)兒視網(wǎng)膜病變的診斷等[7,9-11]。AI輔助診斷、評估、隨訪MGD可節(jié)省大量的時間和資源成本,具有重要價值。本文就AI在MGD相關(guān)干眼中的應(yīng)用現(xiàn)狀及進展進行綜述。
圖1 ML具體算法
TBUT越短,淚膜越不穩(wěn)定,發(fā)生干眼的概率就越高。TBUT影像中的干燥區(qū)域和TBUT可以使用ML來估測[12-14]。與驗光師的評估結(jié)果相比,利用萊文伯格-馬夸特算法探測干燥區(qū)域的準確率達到91%[12]。應(yīng)用馬爾可夫隨機場,根據(jù)視頻中淚膜形態(tài)的立體變化同時結(jié)合多圖切割算法來標記估測TBUT,可清晰直觀地顯示淚膜干燥度隨著時間的延長而增加,演算結(jié)果較臨床醫(yī)生評估相差2.34 s[14],并充分體現(xiàn)了該算法的可靠性和穩(wěn)定性。多項式函數(shù)也被用來確定干燥區(qū),并在估測TBUT之前對閾值進行微調(diào)。基于特異性和敏感性標準,該方法與4位專家的手工測量值進行分析比較,發(fā)現(xiàn)90%以上的測量值偏離在±2.5 s的范圍內(nèi)[13]。總之,這些研究表明,與專家相比,使用自動方法獲得的TBUT值在可接受范圍內(nèi)。但目前所做研究僅包含少量研究對象,仍需進一步研究來驗證相關(guān)結(jié)果。
干涉技術(shù)是一種高效實用的工具,可以提供淚膜脂質(zhì)層狀態(tài)的快照,幫助MGD相關(guān)干眼的診斷。ML系統(tǒng)已應(yīng)用于干涉測量和裂隙燈顯微鏡圖像中,根據(jù)瞼脂形態(tài)進行瞼脂分類、脂質(zhì)層厚度估計、眼紅分析和淚河高度的測量[15-24]。
干眼的診斷可以基于以下淚膜的形態(tài)特征,如開放網(wǎng)格、閉合網(wǎng)格、波浪、無定形和彩色條紋,大多數(shù)研究通過這些特性來使用ML自動分類干涉儀脂質(zhì)層圖像。Remeseiro等[15-16]發(fā)現(xiàn)了用于最終分類的各種支持向量機(support vector machine,SVM)模型。使用SVM可分析淚膜脂質(zhì)干涉儀圖像[25]。由于淚膜向上運動的不足,過量的脂質(zhì)可能聚集在角膜表面的下側(cè)。因此,當由于脂質(zhì)成分分泌過多和/或水成分不足等條件導(dǎo)致平衡失調(diào)時,干涉條紋將呈現(xiàn)出多彩而復(fù)雜的外觀,從圖像中提取的特征被傳遞到SVM模型,SVM模型將圖像分類為健康、水液缺乏型干眼或蒸發(fā)過強型干眼。該模型與經(jīng)驗豐富的眼科醫(yī)生之間的一致性很高,報告的Kappa值為0.82。一個簡單的神經(jīng)網(wǎng)絡(luò)以96%的精度取得了整體最佳的性能。但是,由于該模型采用留一交叉驗證,可能對訓(xùn)練數(shù)據(jù)擬合過度[26]。da Cruz等[18-19]比較了SVM、隨機森林、樸素貝葉斯、多層感知器、隨機樹和徑向基函數(shù)網(wǎng)絡(luò)算法6種不同的ML模型,發(fā)現(xiàn)無論采用何種預(yù)處理步驟,隨機森林都是最好的分類器,獲得了高于99%的準確率,標準偏差為0.843%,受試者工作特征曲線下面積為0.999,Kappa值為0.995。在圖像預(yù)處理階段研究發(fā)現(xiàn)應(yīng)用Ripley K函數(shù)取得了最佳性能,并且Greedy Stepwise技術(shù)與ML模型可以同時用于特征選擇[19]。由于所有模型都是通過交叉驗證來評估的,因此在臨床常規(guī)使用之前,系統(tǒng)應(yīng)該在新圖像上進行外部評估。
Hwang等[20]研究了淚膜脂質(zhì)層厚度能否用于區(qū)分MGD嚴重程度。該研究利用ML方法對Lipiscanner眼表分析儀和裂隙燈顯微鏡影像的厚度進行估算,通過對圖像進行預(yù)處理,并采用泛光填充算法和canny邊緣檢測從瞳孔中定位和提取虹膜,發(fā)現(xiàn)2種MGD嚴重程度組間差異有統(tǒng)計學(xué)意義,提示該技術(shù)可用于MGD的評估。眼表淚膜分析儀也可用于測定淚膜脂質(zhì)層厚度,通過眼表淚膜分析儀可觀察眼表的白光和流動脂質(zhì)淚膜的干涉顏色,并聚焦于受試者的脂質(zhì)膠片獲得合格的干涉圖像,圖像分為分割和未分割圖像。Fu等[21]采用ImageJ處理圖像來確定脂質(zhì)層厚度,發(fā)現(xiàn)估計的淚膜脂質(zhì)層厚度具有很好的重復(fù)性;利用廣義線性模型對2種不同的圖像分析方法進行比較,發(fā)現(xiàn)2種技術(shù)之間存在較高的相關(guān)性。該研究結(jié)果表明,通過對未分割圖像分析足以評價淚膜脂質(zhì)層厚度,但該研究僅納入了28個研究對象,有待擴大樣本量進一步驗證。
眼紅是干眼的一個重要指標。Rodriguez等[22]進行的回顧性研究描述了用于評估與干眼相關(guān)的眼紅的自動匹配系統(tǒng)。該研究對26例有干眼病史的受試者采集裂隙燈顯微鏡圖像,采用Sobel算子提取代表眼紅強度和水平血管成分的特征,基于提取的特征,訓(xùn)練多元線性回歸模型來預(yù)測眼紅,該系統(tǒng)達到了100%的準確度。
淚河包含75%~90%的淚液,淚河高度可作為蒸發(fā)過強型干眼的定量指標。Yang等[23]將新的自動識別軟件與ImageJ預(yù)測的淚河高度進行比較,結(jié)果顯示二者相似,兩者之間的相關(guān)性很高,相關(guān)系數(shù)為0.626~0.847,顯示出較高的準確性和有效性,表明該自動淚河高度測量平臺有可能成為干眼篩查和隨訪的有效工具。
近年來的研究發(fā)現(xiàn),IVCM可以在活體內(nèi)觀察瞼板腺的微觀形態(tài)[27-28],且可用于研究MGD的病理生理過程,對MGD的診斷具有重要意義。梁慶豐等[29]采用IVCM觀察結(jié)果顯示,MGD患者瞼板腺開口形狀不規(guī)則、瞼板腺腺泡囊樣擴張或萎縮、腺泡間炎癥細胞浸潤及纖維化改變,對MGD的診斷具有潛在的應(yīng)用價值。高分辨率IVCM圖像可用于評估阻塞性MGD[30]。使用五折交叉驗證對9個不同CNN的組合進行訓(xùn)練并在圖像上進行測試,將模型分類與3位眼瞼專家的診斷進行比較,結(jié)果顯示VGG16、DenseNet-169、DenseNet-201、InceptionV3 4種不同模型組合效果最好,曲線下面積、靈敏度和特異性均較高,分別為0.981、92.1%和98.8%,表明該模型可以用來區(qū)分健康的瞼板腺圖像和阻塞性MGD圖像,具有很高的準確性,未來可以對患者進行自動阻塞性MGD診斷。CNN的優(yōu)點是不需要在分析之前從圖像中提取特征,由模型自動執(zhí)行即可。雖然使用ML來解釋IVCM圖像的結(jié)果很有前景,但仍需更大規(guī)模的臨床研究來驗證這些結(jié)果。
瞼板腺成像是診斷MGD的常用技術(shù)[31]。在評估圖像時,重要的是將像素區(qū)分為3類,即屬于腺體、腺體間區(qū)域(即沒有腺體的健康組織)和組織丟失區(qū)域。Koh等[32]針對從圖像中提取的特征訓(xùn)練SVM,預(yù)處理包括圖像灰度轉(zhuǎn)換、中值濾波、去除不均勻光照和歸一化,結(jié)果顯示模型的敏感性為0.979,特異性為0.961。然而,與其他圖像分析方法相比,該方法在圖像傳遞到系統(tǒng)之前需要手動操作。將大津(Otsu)方法與骨架化和分水嶺算法相結(jié)合,可以自動量化瞼板腺,該方法比眼科醫(yī)生的診斷速度更快,靈敏度為0.993,特異性為0.975[33]。Xiao等[34]先后應(yīng)用Prewitt算子、Graham掃描、碎片化和骨架化算法進行圖像分析以量化瞼板腺腺體,模型預(yù)測結(jié)果與眼科醫(yī)生的一致性較高,Kappa值大于0.8,假陽性率低(<0.06),假陰性率為0.19,提示該方法遺漏了部分腺體,但同時由于樣本量小使研究結(jié)果可信度欠佳。另一項研究采用Sobel算子、多項式函數(shù)、碎片化算法和Otsu方法對MGD的嚴重程度進行自動分級,雖然該方法速度更快,但結(jié)果與臨床醫(yī)生的評估結(jié)果明顯不同,需要進一步的臨床研究驗證[35]。
Wang等[36]采用SqueezeNet、resnet 18、resnet 34、resnet 50 4種不同的CNN算法來測定瞼板腺萎縮,結(jié)果顯示resnet50在評價數(shù)據(jù)集上具有最佳的算法性能。CNN可以用來識別瞼板腺萎縮的區(qū)域,并在一組圖像中估計萎縮的百分比,同時具有高精度、可重復(fù)性和低可變性,在很大程度上優(yōu)于臨床醫(yī)生。在國內(nèi)一項應(yīng)用Mask RCNN構(gòu)建模型的臨床研究中,模型評價每幅圖像僅需0.499 s,與臨床醫(yī)師的評估結(jié)果無顯著差異,可用于MGD相關(guān)疾病的臨床輔助診斷和篩查[7]。Yeh等[37]開發(fā)了一種評估瞼板腺萎縮的方法,在應(yīng)用K-nearest neighbors模型分配瞼板評分之前,使用一種特殊類型的無監(jiān)督CNN從瞼板圖像中提取特征,該系統(tǒng)達到了80.9%的準確性,優(yōu)于臨床團隊的評估。此外,提取的CNN特征的層次聚類可以顯示瞼板腺圖像之間的關(guān)系。Khan等[38]使用GAN結(jié)構(gòu)對瞼板腺的紅外3D圖像進行測試,以評估MGD,模型輸出與真實標簽比較結(jié)果顯示,其性能得分優(yōu)于現(xiàn)有的分割方法,新自動化方法與2名臨床醫(yī)生的相關(guān)系數(shù)分別為0.962和0.968。
Grus等[39]報道了結(jié)合判別分析檢測最重要的蛋白質(zhì)和深度神經(jīng)網(wǎng)絡(luò)進行分類的方法,結(jié)果顯示其有較高的準確性、敏感性和特異性。Gonzlez等[40]也采用判別分析方法對淚液蛋白質(zhì)組進行了分析,該研究選取最重要的蛋白質(zhì)檢測人工神經(jīng)網(wǎng)絡(luò),將淚液樣本分類為水液缺乏型干眼、MGD和健康對照,結(jié)果顯示該模型總體精度為89.3%;主成分分析顯示,健康對照、水液缺乏型干眼和MGD數(shù)據(jù)點分離良好,表明蛋白質(zhì)是分類這3種對象的良好候選者,該系統(tǒng)達到了所有已綜述的蛋白質(zhì)組學(xué)研究的較高準確率。
鑒于我國人口老齡化和醫(yī)療保健支出比例的不斷增加,改善人口的總體健康狀況、降低醫(yī)療費用和改善患者就醫(yī)體驗成為目前醫(yī)療衛(wèi)生建設(shè)的主要目標。AI是解決這些問題有潛力的解決方案之一,可能會給我們的生活方式和醫(yī)療模式帶來革命性的改變。盡管目前要在醫(yī)療領(lǐng)域增加AI的應(yīng)用還有不少亟待攻克的問題,如模型開發(fā)和評估的執(zhí)行、不同模型間的比較、不同類型績效分數(shù)的比較等,但仍可能會在未來幾十年迅速改變這一領(lǐng)域。此外,數(shù)據(jù)和代碼共享的缺失使得結(jié)果具有不可重復(fù)性。因此,未來重點應(yīng)該放在建立數(shù)據(jù)和代碼共享作為一個標準程序上??傊?在模型開發(fā)、臨床測試和標準化方面還有很多工作要做,不同研究ML模型的結(jié)果表明其很有潛力。AI在與MGD相關(guān)干眼的許多不同應(yīng)用中均有很大潛力,包括MGD自動檢測和分類、MGD相關(guān)干眼的病因和危險因素研究,以及潛在的生物標志物檢測。應(yīng)當努力為模型開發(fā)過程,特別是模型評價,制定共同的指導(dǎo)方針。
利益沖突所有作者均聲明不存在任何利益沖突