劉雨佳 瞿小妹
[1.復(fù)旦大學(xué)附屬眼耳鼻喉科醫(yī)院眼科 上海 200031;2.國家衛(wèi)健委近視眼重點(diǎn)實(shí)驗室(復(fù)旦大學(xué)) 上海 200031;3.上海市眼視光學(xué)研究中心 上海 200031]
近視是視覺障礙的主要原因之一[1],其患病率逐年攀升[2],極大地加重了社會經(jīng)濟(jì)負(fù)擔(dān)[3]。王寧利等[4]提出了近視防控的三級預(yù)防措施:預(yù)防近視發(fā)生、控制近視加重、防止發(fā)展為病理性近視。近視防控工作高度依賴操作人員和檢查設(shè)備,而欠發(fā)達(dá)地區(qū)的醫(yī)療資源和人民健康意識相對薄弱,初級眼保健服務(wù)體系尚未成熟[5],亟待投入可靠的新技術(shù)以降低成本,實(shí)現(xiàn)可持續(xù)性。
人工智能(artificial intelligence,AI)是一種賦予計算機(jī)類似人類的思維和行為方式的計算機(jī)科學(xué)。近年來,AI 技術(shù)發(fā)展迅速,已廣泛應(yīng)用于醫(yī)學(xué)領(lǐng)域,如糖尿病性視網(wǎng)膜病變的篩查[6],且準(zhǔn)確度和穩(wěn)定性較好[7]。AI 在近視防控領(lǐng)域也逐漸嶄露頭角。本文對人工智能在近視防控中的應(yīng)用研究進(jìn)行綜述。
人工智能的概念在1956 年的達(dá)特茅斯會議上被首次提出。1963 年,西洋跳棋程序戰(zhàn)勝了美國的人類跳棋大師。但AI 技術(shù)在進(jìn)一步研究中遇到了許多實(shí)際問題,其發(fā)展一度停滯。20 世紀(jì)80 年代初,專家系統(tǒng)興起,大大提高了產(chǎn)業(yè)效益,但其通用性較差且維修成本高昂,AI 的發(fā)展又一次受到阻礙。1997 年,“深藍(lán)”機(jī)器人擊敗世界象棋冠軍,AI 的發(fā)展重被提上日程。經(jīng)歷了三起兩落,隨著算力的增加和大數(shù)據(jù)儲存的實(shí)現(xiàn),AI 正處于第三次浪潮中[8]。
機(jī)器學(xué)習(xí)(machine learning,ML)是基于某一給定的算法或網(wǎng)絡(luò)架構(gòu),給予計算機(jī)一定數(shù)量的數(shù)據(jù)樣本進(jìn)行認(rèn)知學(xué)習(xí),從而對新的同質(zhì)樣本實(shí)現(xiàn)自動化識別分類和預(yù)測,但其中間過程并不明確。與傳統(tǒng)統(tǒng)計學(xué)方法(如相關(guān)性分析、線性回歸模型)相比,機(jī)器學(xué)習(xí)不僅能夠分析和總結(jié)復(fù)雜的非線性數(shù)據(jù),還能分析潛在的變量、提供數(shù)據(jù)預(yù)測模型[9]。
深度學(xué)習(xí)(deep learning,DL)是機(jī)器學(xué)習(xí)的分支和發(fā)展。深度學(xué)習(xí)的基礎(chǔ)是人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)。DL 神經(jīng)網(wǎng)絡(luò)既是分類器,也是特征提取器,可以實(shí)現(xiàn)端到端的學(xué)習(xí),即輸入大量的原始數(shù)據(jù),無需人工編碼便可直接輸出類別。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)被認(rèn)為是最適合進(jìn)行圖像識別的深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),已廣泛應(yīng)用于與圖像相關(guān)的診斷和預(yù)測。DL 的質(zhì)量受到訓(xùn)練集的大小影響[10]。
此外,目前較熱門的隨機(jī)森林(random forest,RF)、支持向量機(jī)(support vector machine,SVM)、極端梯度提升(extreme gradient boosting,XGBoost)、多元自適應(yīng)回歸樣條(multivariate adaptive regression splines,MARS)等也屬于ML的范疇[8]。
在近視防控領(lǐng)域,屈光數(shù)據(jù)等大數(shù)據(jù)樣本以及眼科本身高度依賴圖像的特點(diǎn),使AI 在預(yù)測近視發(fā)生、近視進(jìn)展及預(yù)警高度近視及病理性近視方面具有極大潛力。
2.1 人工智能在預(yù)測近視發(fā)生中的應(yīng)用 近視篩查是近視防控的第一道關(guān)口。近視篩查工作的開展受到專業(yè)人員數(shù)量和設(shè)備條件的限制,普及性較差。AI 有望為大規(guī)模近視篩查提供新的出路。
Yang等[11]研發(fā)出通過眼表照片篩查青少年是否近視的DL 模型,受試者工作特征曲線(receiver operating characteristic curve,ROC 曲線)下面積(area under the curve,AUC)達(dá)80%以上,實(shí)現(xiàn)了對青少年屈光狀態(tài)的遠(yuǎn)程監(jiān)測。Ma等[12]基于DL 開發(fā)了一款在暗室中使用智能手機(jī)自動測量瞳距、屈光度范圍等數(shù)據(jù)的應(yīng)用程序,結(jié)合其他個人信息,可推算兒童斜視、近視和屈光參差的風(fēng)險。黃峻嘉等[13]選取了RF、自適應(yīng)提升(AdaBoost)、裝袋(bagging)、梯度提升(gradient boosting)和XGBoost 5 種算法分析兒童、青少年屈光數(shù)據(jù),通過同一對象2 個時間點(diǎn)的檢查數(shù)據(jù)訓(xùn)練模型,預(yù)測后一時間點(diǎn)是否近視。其中RF 模型表現(xiàn)最佳,預(yù)測準(zhǔn)確度可達(dá)92.8%。
2.2 人工智能在預(yù)測近視進(jìn)展中的應(yīng)用 對處于近視進(jìn)展期的患兒,現(xiàn)有檢查手段只能了解其現(xiàn)階段的屈光狀況,無法準(zhǔn)確判斷近視的中遠(yuǎn)期發(fā)展趨勢。因此,往往需要密集的定期隨訪,以監(jiān)測近視度數(shù)和相關(guān)眼部光學(xué)參數(shù)的變化。探尋眼部生物學(xué)特征與近視度數(shù)的相關(guān)性,可以簡化近視監(jiān)測的流程,深化眼科醫(yī)師對近視發(fā)展的認(rèn)識,揭示近視潛在的發(fā)生、發(fā)展機(jī)制。
2.2.1 對未來時間點(diǎn)近視度數(shù)的預(yù)測 Lin等[14]匯總了8 家眼科中心電子病歷中的學(xué)齡期兒童屈光數(shù)據(jù),利用年齡、等效球鏡度數(shù)(spherical equivalent refraction,SER)和過去的年進(jìn)展率訓(xùn)練RF 模型,預(yù)測10 年內(nèi)的近視度數(shù)變化和高度近視風(fēng)險,為近視的精準(zhǔn)干預(yù)提供了可能性。Chen等[15]比較不同類型的ML 模型預(yù)測隨訪隊列1 年后和7 年后近視發(fā)展的表現(xiàn),發(fā)現(xiàn)RF 模型不適合預(yù)測兒童近視發(fā)展,而SVM 或MARS 表現(xiàn)出較高的可靠性和準(zhǔn)確性。這一研究提示,算法模型的選擇仍需更深入的研究。
2.2.2 基于眼部生物學(xué)特征對近視度數(shù)的預(yù)測 眼軸(axial length,AL)是監(jiān)測近視發(fā)展的重要指標(biāo),但其與屈光度變化的定量關(guān)系尚不明確。唐濤等[16]收集了1 011 例青少年的眼部光學(xué)參數(shù)和社會學(xué)信息,采用立方SVM 等6種ML 模型處理多模態(tài)數(shù)據(jù),使用5折交叉驗證法訓(xùn)練和測試模型,預(yù)測不同年齡跨度近視人群眼軸增長1 mm 所對應(yīng)的SER 變化量。結(jié)果發(fā)現(xiàn)SVM 表現(xiàn)最佳,其AUC 達(dá)0.98,準(zhǔn)確率為93%。
已有研究嘗試通過眼底照片、光學(xué)相干層析成像(optical coherence tomography,OCT)等圖像預(yù)測屈光度數(shù)。Varadarajan等[17]率先嘗試訓(xùn)練了一種基于眼底照片預(yù)測屈光度數(shù)的DL 模型,在使用的2 個數(shù)據(jù)集中SER 預(yù)測結(jié)果的平均絕對誤差(mean absolute error,MAE)分別為0.65 D 和0.91 D。石征錦等[18]利用數(shù)字圖像處理技術(shù)以及DL 中的稠密連接卷積網(wǎng)絡(luò)(densely connected convolutional networks,DenseNet)模型自動提取廣角激光眼底圖像中的近視性眼底改變特征,進(jìn)行回歸預(yù)測,得出屈光度的預(yù)測值。Yoo等[19]開發(fā)并驗證了基于后段OCT 圖像的DL 模型以預(yù)測SER 及檢測高度近視,并使用梯度類加權(quán)激活映射(gradient-weighted class activation mapping,Grad-CAM)技術(shù)實(shí)現(xiàn)特征可視化。該模型預(yù)測SER 的MAE 為2.66 D,檢測高度近視的AUC為0.813,準(zhǔn)確率為71.4%。Li等[20]開發(fā)了基于眼底照片自動識別和分割視盤旁萎縮(parapapillary atrophy,PPA)的算法,并與眼科醫(yī)師的標(biāo)注進(jìn)行比較,準(zhǔn)確率達(dá)90.78%,還觀察到了PPA 與近視進(jìn)展之間的強(qiáng)關(guān)聯(lián)。
使用波前像差數(shù)據(jù)預(yù)測主覺屈光度數(shù)也已產(chǎn)生一些成果。Rampat等[21]使用基于新型多項式分解的波前像差數(shù)據(jù)訓(xùn)練XGBoost 模型,預(yù)測轉(zhuǎn)換為向量(M,J0,J45)的主覺驗光結(jié)果,其MAE 在0.094~0.301 D 之間。Leube等[22]基于37 個維度(36 個Zernike 系數(shù)+瞳孔直徑)的特征向量訓(xùn)練DL 網(wǎng)絡(luò),能夠可靠地預(yù)測主覺屈光度向量。
2.3 人工智能在預(yù)警病理性近視中的應(yīng)用 病理性近視是視力損害的主要原因,患者伴有典型的眼底并發(fā)癥。目前尚不清楚病理性近視是否與近視本身并行進(jìn)展,其機(jī)制也尚未明了。對近視人群開展病理性近視的早期預(yù)警,在預(yù)防低視力和防盲工作中具有重大意義[23]。
脈絡(luò)膜厚度(choroidal thickness,ChT)是預(yù)測高度近視和病理性近視的重要指標(biāo)[24]。Sun等[25]通過視盤及周圍區(qū)域早期變化的成像信息,構(gòu)建了與ChT 顯著相關(guān)的ML 定量模型,探索將其作為年輕近視患者ChT 的早期指標(biāo)。
現(xiàn)已有較多基于眼底照片預(yù)測病理性近視的研究。Wan等[26]提出了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)的輔助診斷算法,可將眼底圖像自動分為正常眼底、低危高度近視、高危高度近視三類,其表現(xiàn)優(yōu)于眼科醫(yī)師,低危高度近視AUC 為0.996 8,高危高度近視AUC 為0.996 4。Rauf等[27]使用CNN 模型識別眼底照片是否為病理性近視,AUC 為0.984 5。Kim等[28]使用眼底照片的中央凹、視盤和眼最深點(diǎn)(deepest point of the eye,DPE)作為關(guān)鍵指標(biāo)來量化后鞏膜斷層提升(tomographic elevation of the posterior sclera,TEPS),建立SVM模型預(yù)測病理性近視。Hemelings等[29]基于眼底照片使用CNN 檢測病理性近視并進(jìn)行相關(guān)病變分割,AUC 達(dá)0.9867。
OCT 圖像也被用作算法的訓(xùn)練數(shù)據(jù)集。Sogawa等[30]基于掃描源光學(xué)相干層析成像(swept-source OCT,SS-OCT)圖像建立DL 模型識別有無近視性黃斑病變(myopic macular degeneration,MMD)。Li等[31]基于黃斑OCT 圖像訓(xùn)練4 個獨(dú)立的CNN 模型,以識別視網(wǎng)膜裂孔、黃斑裂孔、視網(wǎng)膜脫離和病理性近視脈絡(luò)膜新生血管形成(pathological myopia choroidal neovascularization,PMCNV)4 種威脅視力的疾病,AUC 達(dá)0.961~0.999,靈敏度略優(yōu)于視網(wǎng)膜專家,且具有高特異性。此外,該模型允許精確可視化病變位置和顯著特征,可為眼科醫(yī)師提供熱圖以促進(jìn)目標(biāo)診斷。Tan等[32]開發(fā)了基于眼底照片的DL 算法檢測MMD,使用新加坡的數(shù)據(jù)集完成訓(xùn)練和內(nèi)部驗證,使用來自中國、印度、俄羅斯和英國的數(shù)據(jù)集進(jìn)行外部測試,將其結(jié)果與6 位眼科專家的分級進(jìn)行了比較,并展示了其安全性和實(shí)際應(yīng)用效果,有望成為全球大規(guī)模MMD 篩查和病理性近視風(fēng)險分層的有效工具。
2.4 人工智能在近視控制手段中的應(yīng)用 對于被識別為高風(fēng)險的兒童青少年,應(yīng)及時給予個性化近視控制方案。現(xiàn)已被證實(shí)有效的控制手段有低濃度阿托品滴眼液、角膜塑形鏡和周邊離焦框架眼鏡等[33]。
Wu等[34]使用5 種ML 模型評估使用阿托品時可能影響眼壓(intraocular pressure,IOP)的19 個重要因素,結(jié)果顯示XGBoost 是最佳預(yù)測模型,基準(zhǔn)IOP 是最準(zhǔn)確的預(yù)測因子。Fan等[35]構(gòu)建了基于角膜前表面高地圖的ML 模型,以預(yù)測不同年齡、性別和眼部參數(shù)組合的反轉(zhuǎn)弧深度(return zone depth,RZD)和著陸角(landing zone angle,LZA)值,可行性和有效性較好。Fan 的團(tuán)隊[36]又構(gòu)建了用于估計角膜塑形鏡驗配中定位弧(alignment curve,AC)曲率的ML 模型,以期最大限度地減少試鏡次數(shù),降低試戴引起交叉感染的可能性,結(jié)果顯示線性SVM 學(xué)習(xí)模型性能較優(yōu)。
屈光數(shù)據(jù)及眼部生物學(xué)資料中蘊(yùn)含近視發(fā)生、進(jìn)展及其相關(guān)病變的潛在信息,機(jī)器學(xué)習(xí)可以通過創(chuàng)建特征從現(xiàn)有的變量中推導(dǎo)出新的變量,揭示數(shù)據(jù)集的隱含關(guān)系,并能填補(bǔ)數(shù)據(jù)的缺失項。通過選擇特征、調(diào)試參數(shù)、比較運(yùn)用多種模型及交叉驗證數(shù)據(jù)集,可以提高預(yù)測模型的準(zhǔn)確性,獲得更可靠的性能。深度學(xué)習(xí),尤其是CNN,在病理性近視診斷和眼底病變識別方面表現(xiàn)優(yōu)異。
上述研究雖然展現(xiàn)出了良好的性能,但仍有一些潛在的問題。其一,多數(shù)算法模型是基于單一種族小樣本數(shù)據(jù)集的訓(xùn)練,在真實(shí)臨床環(huán)境里更具異質(zhì)性的數(shù)據(jù)集中,算法準(zhǔn)確性可能會降低。其二,現(xiàn)有模型多為單模態(tài)學(xué)習(xí)模式,基于單一信息建立,缺乏社會學(xué)信息、家族遺傳史等。其三,現(xiàn)階段AI 模型多為“黑箱式推理”,而醫(yī)學(xué)決策要求具備可解釋性[37]。若能提供可解釋的依據(jù),如通過DL 輔助診斷中的遮擋實(shí)驗、軟注意力提取等方法生成熱圖將增加算法的可信度,提高專業(yè)醫(yī)師和大眾對AI 輔助醫(yī)療的接受度[38]。此外,過程透明化也有望提示潛在的重要指標(biāo),揭示近視進(jìn)展的內(nèi)在機(jī)制。其四,預(yù)測模型從“是否”“有無”的定性預(yù)測走向精確的定量預(yù)測、病變亞型的精準(zhǔn)分類,還面臨著諸多算法網(wǎng)絡(luò)結(jié)構(gòu)和邏輯方面的難題,有賴于AI 技術(shù)的進(jìn)一步發(fā)展。
對于未來人工智能在近視防控領(lǐng)域的應(yīng)用,應(yīng)制定標(biāo)準(zhǔn)化流程,建立開放的專業(yè)數(shù)據(jù)集,提升數(shù)據(jù)量級,建議研究者使用多種算法模型并進(jìn)行比較評估,選擇出性能最優(yōu)的模型進(jìn)行臨床轉(zhuǎn)化。鼓勵大規(guī)模前瞻性的臨床資料采集,加強(qiáng)全球合作,納入不同地區(qū)不同種族的異質(zhì)性數(shù)據(jù),強(qiáng)化模型的驗證步驟(內(nèi)部驗證與外部驗證相結(jié)合,預(yù)測結(jié)果與人類專家的結(jié)論相比較),提高模型的適用性和可靠性。數(shù)據(jù)安全性問題也值得關(guān)注,研究者應(yīng)注意加強(qiáng)隱私保護(hù)和信息管理。目前,AI 在探索近視防控措施的療效方面應(yīng)用較少,如預(yù)測患者接受治療后的近視進(jìn)展情況。療效的預(yù)測需要以兒童、青少年本身動態(tài)變化的屈光狀態(tài)為基礎(chǔ),但目前不同治療模式的效果和適用范圍仍尚未明了,實(shí)現(xiàn)準(zhǔn)確預(yù)測難度較大,AI 在該領(lǐng)域應(yīng)大有可為。
人工智能技術(shù)已成為近視防控及管理的潛在輔助手段。AI 可以助力近視的早期識別、持續(xù)監(jiān)測,實(shí)現(xiàn)風(fēng)險分層、定位高危個體,開展以患者為中心的個體化精準(zhǔn)治療。AI 的參與大大提高了篩查和監(jiān)測流程的自動化程度,且兼具精確度,可以降低對操作者的依賴性,實(shí)現(xiàn)對基層和醫(yī)療欠發(fā)達(dá)地區(qū)的遠(yuǎn)程監(jiān)控,節(jié)省大量人力物力,擁有更優(yōu)的可持續(xù)性,有望補(bǔ)充現(xiàn)有醫(yī)療保健體系的不足,實(shí)現(xiàn)近視的三級預(yù)防。