董秀清 杜紹林 劉華秀 鄒江鳳 劉明慧
東莞東華醫(yī)院眼科,東莞 523000
目前,糖尿病患病率日益升高,預(yù)計到2040年,全球?qū)⒂?.42億糖尿病患者[1]。糖尿病視網(wǎng)膜病變(diabetic retinopathy,DR)作為其主要并發(fā)癥之一,已成為我國工作年齡人群盲和低視力的主要原因[2-3],給個人、家庭及社會造成巨大的經(jīng)濟負擔(dān)。DR引起的嚴重視力喪失可通過早期診斷、及時干預(yù)避免[4],因此對糖尿病患者進行早期DR篩查尤為重要。在我國,分級診療模式的實施使大量糖尿病患者被分流至社區(qū)醫(yī)院進行慢性病管理[5]。由于缺乏專業(yè)眼科人才,社區(qū)醫(yī)院無法對其管理的糖尿病患者進行早期診斷及定期DR篩查。許多社區(qū)醫(yī)院目前仍依賴傳統(tǒng)的遠程閱片模式,面臨著人工閱片效率低、結(jié)果反饋滯后及轉(zhuǎn)診不及時等問題[6]。因此,提高社區(qū)糖尿病患者彩色眼底照片的判讀效率及準(zhǔn)確性成為亟需解決的問題。近年來,深度學(xué)習(xí)算法的快速進展使人工智能(artificial intelligence,AI)檢測DR的敏感性及特異度均得到顯著提升[7-8]。但關(guān)于AI在社區(qū)臨床應(yīng)用場景中的實際效能及其與社區(qū)醫(yī)生相比在DR診斷及轉(zhuǎn)診方面的效能差異尚缺乏深入探索。因此,本研究擬通過比較AI及社區(qū)醫(yī)生診斷、轉(zhuǎn)診DR的效能,探索AI在社區(qū)醫(yī)院中應(yīng)用于DR篩查、診斷和轉(zhuǎn)診中的可行性及價值。
采用診斷試驗研究方法,選擇2020年1月1日至2021年12月31日就診于東莞市寮步社區(qū)衛(wèi)生服務(wù)中心、東莞市東城衛(wèi)生服務(wù)中心、東莞橫瀝醫(yī)院的糖尿病患者421例納入本研究,其中30眼因瞳孔無法擴大、屈光介質(zhì)混濁等原因影響圖像質(zhì)量予以排除,最終共812眼納入研究。其中男267例,占63.42%,女154例,占36.58%;年齡18~82歲,平均(51.72±11.28)歲;病程0~30年,平均(4.77±4.77)年。入組患眼均采用單視野眼底照相技術(shù),以黃斑為中心拍攝50°彩色眼底照片,所攝照片的拍攝位置、清晰度需符合我國基于眼底照相的DR人工智能篩查系統(tǒng)應(yīng)用指南[9]要求,并將以上眼底彩色照片建立樣本圖庫。納入標(biāo)準(zhǔn):(1)由內(nèi)科或全科醫(yī)師確診為1型或2型糖尿?。?2)年齡≥18歲;(3)理解并同意研究方案,配合檢查者。排除標(biāo)準(zhǔn):(1)屈光介質(zhì)混濁影響成像質(zhì)量者;(2)合并視網(wǎng)膜靜脈阻塞、年齡相關(guān)性黃斑變性、視神經(jīng)炎等眼底疾病患者;(3)既往有眼底病治療史者,包括眼內(nèi)注藥、視網(wǎng)膜激光光凝、玻璃體切割手術(shù)等;(4)合并高度近視、青光眼、葡萄膜炎等其他眼病者。本研究方案遵循《赫爾辛基宣言》,經(jīng)東莞東華醫(yī)院倫理委員會批準(zhǔn)(批文號:2019DHLL046)。研究涉及患者的一般資料及彩色眼底照片均進行了匿名化處理。
1.2.1診斷標(biāo)準(zhǔn) 研究對象需符合以下糖尿病診斷標(biāo)準(zhǔn)[10]:有多飲、多尿、多食和體質(zhì)量下降的糖尿病典型癥狀,隨機血漿葡萄糖濃度≥11.1 mmol/L;空腹血漿葡萄糖濃度≥7.0 mmol/L;口服葡萄糖耐量試驗2 h血糖≥11.1 mmol/L。人工及AI閱片均根據(jù)DR國際分期標(biāo)準(zhǔn)[11]進行結(jié)果判讀(表1),分為無糖尿病視網(wǎng)膜病變(no diabetic retinopathy,NDR)、輕度非增生性糖尿病視網(wǎng)膜病變(nonproliferative diabetic retinopathy,NPDR)、中度NPDR、重度非增生性糖尿病視網(wǎng)膜病變NPDR和增生性糖尿病視網(wǎng)膜病變(proliferative diabetic retinopathy,PDR)。其中,有轉(zhuǎn)診意義的糖尿病視網(wǎng)膜病變(referable diabetic retinopathy,RDR)定義為中度及重度NPDR、PDR以及有臨床意義的黃斑水腫(clinically significant macular edema,CSME)[12-13]。
表1 DR國際分期及診斷標(biāo)準(zhǔn)[11]Table 1 International grading and diagnostic criteria fordiabetic retinopathy [11]國際分期眼底表現(xiàn)NDR無異常輕度NPDR僅有微動脈瘤中度NPDR微動脈瘤,存在輕于重度NPDR的表現(xiàn)重度NPDR存在以下任一改變但無PDR表現(xiàn):(1)任一象限中有多于20處視網(wǎng)膜內(nèi)出血(2)2個以上象限有靜脈串珠樣改變(3)1個以上象限有顯著的視網(wǎng)膜內(nèi)微血管異常PDR出現(xiàn)以下一種或多種表現(xiàn):新生血管形成、玻璃體積血、視網(wǎng)膜前出血 注:DR:糖尿病視網(wǎng)膜病變;NDR:無糖尿病視網(wǎng)膜病變;NPDR:非增生性糖尿病視網(wǎng)膜病變;PDR:增生性糖尿病視網(wǎng)膜病變 Note:DR:diabetic retinopathy;NDR:no diabetic retinopathy;NPDR:non-proliferative diabetic retinopathy;PDR:proliferative diabetic reti-nopathy
1.2.2分組閱片 (1)眼科專家組 由2名高年資主治以上職稱眼科專科醫(yī)師共同閱片,根據(jù)以上分期標(biāo)準(zhǔn)進行診斷。當(dāng)2人診斷結(jié)果有異則增加第3名高于或等同前2名醫(yī)師職稱的眼科醫(yī)師參與閱片診斷,并綜合3人意見得出最終結(jié)果,作為該彩色眼底照片診斷的金標(biāo)準(zhǔn)。眼科專家組診斷為中度NPDR、重度NPDR或PDR的彩色眼底照片均為RDR。(2)社區(qū)醫(yī)生組 提前由眼科專家對社區(qū)醫(yī)生進行DR彩色眼底照片閱片及診斷培訓(xùn),考核通過后由2名社區(qū)醫(yī)生共同閱片,根據(jù)以上分期標(biāo)準(zhǔn)進行診斷并提出是否建議轉(zhuǎn)診。當(dāng)2人診斷結(jié)果有異則增加第3名通過培訓(xùn)考核的社區(qū)醫(yī)師參與閱片診斷,并綜合3人意見得出最終結(jié)果。(3)AI系統(tǒng)組 采用上海鷹瞳醫(yī)療科技有限公司(Airdoc)的眼底疾病綜合智能診斷軟件(comprehensive artificial intelligence retinal expert,CARE)自動分析并給出診斷結(jié)果及轉(zhuǎn)診意見。CARE系統(tǒng)基于單個卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN),在TensorFlow平臺(版本1.10.1;Google,Mountain View,CA,USA)和Python scikit學(xué)習(xí)包0.22.2上使用Inception-ResNet-V2架構(gòu),對207 228張眼底照片進行訓(xùn)練構(gòu)建而成。CARE系統(tǒng)通過對彩色眼底照片分析,自動識別視網(wǎng)膜出血、滲出及玻璃膜疣的個數(shù)、最大面積及總面積和血管參數(shù)(圖1),并根據(jù)其算法分析獲得DR診斷結(jié)果。該系統(tǒng)已在國內(nèi)進行多中心內(nèi)部驗證及外部測試,其敏感性和特異度分別達到93.8%和87.8%。CARE系統(tǒng)對DR的診斷分期與國際分期一致;AI系統(tǒng)給出的轉(zhuǎn)診意見包括定期檢查、建議觀察、進一步檢查和立即治療4個等級,其中進一步檢查及立即治療定義為AI建議轉(zhuǎn)診。
圖1 CARE系統(tǒng)診斷流程圖 AI:人工智能Figure 1 Diagnosis process of CARE system AI:artificial intelligence
所有彩色眼底照片中,眼科專家組判讀分期結(jié)果中NDR共570眼,輕度NPDR共23眼,中度NPDR共120眼,重度NPDR共60眼,PDR共39眼,RDR共219眼。
眼科專家組與AI系統(tǒng)對所有彩色眼底照片的診斷結(jié)果如表2,3所示。與眼科專家組相比,AI系統(tǒng)診斷有無DR的敏感性為87.60%,特異度為97.89%,PPV為94.64%,NPV為94.90%;診斷有無RDR的敏感性為90.41%,特異度為96.29%,PPV為90.00%,NPV為96.45%。
表2 眼科專家組與AI系統(tǒng)診斷DR結(jié)果(眼數(shù))Table 2 Diagnosis of DR by ophthalmologists and AIsystem (eyes)眼科專家診斷AI診斷DR(+)DR(-)合計DR(+)21230242DR(-)12558570合計224588812 注:AI:人工智能;DR:糖尿病視網(wǎng)膜病變 Note:AI:artificial intelligence;DR:diabetic retinopathy
表3 眼科專家組與AI系統(tǒng)診斷RDR結(jié)果(眼數(shù))Table 3 Diagnosis of RDR by ophthalmologists and AIsystem (eyes)眼科專家診斷AI診斷RDR(+)RDR(-)合計RDR(+)19821219RDR(-)22571593合計220592812 注:AI:人工智能;RDR:有轉(zhuǎn)診意義的糖尿病視網(wǎng)膜病變 Note:AI:artificial intelligence;RDR:referable diabetic retinopathy
與眼科專家組相比,AI系統(tǒng)診斷DR及RDR的Kappa系數(shù)分別為0.87(P<0.001)和0.87(P<0.001);經(jīng)過培訓(xùn)及考核的社區(qū)醫(yī)生組對DR及PDR的診斷結(jié)果如表4,5所示,其Kappa系數(shù)分別為0.93(P<0.001)和0.98(P<0.001)。AI系統(tǒng)和培訓(xùn)后的社區(qū)醫(yī)生均與眼科專家組的診斷結(jié)果具有極強一致性。
表4 眼科專家組與社區(qū)醫(yī)生組診斷DR結(jié)果(眼數(shù))Table 4 Diagnosis of DR by ophthalmologists andcommunity physicians (eyes)眼科專家診斷社區(qū)醫(yī)生診斷DR(+)DR(-)合計RDR(+)22022242RDR(-)0570570合計220592812 注:AI:人工智能;DR:糖尿病視網(wǎng)膜病變 Note:AI:artificial intelligence;DR:diabetic retinopathy
表5 眼科專家組與社區(qū)醫(yī)生組診斷RDR結(jié)果(眼數(shù))Table 5 Diagnosis of RDR by ophthalmologists andcommunity physicians (eyes)眼科專家診斷社區(qū)醫(yī)生診斷RDR(+)RDR(-)合計RDR(+)2145219RDR(-)0593593合計214598812 注:AI:人工智能;RDR:有轉(zhuǎn)診意義的糖尿病視網(wǎng)膜病變 Note:AI:artificial intelligence;DR:referable diabetic retinopathy
在眼科專家建議轉(zhuǎn)診的219眼中,AI系統(tǒng)給出相同建議的有效轉(zhuǎn)診率為90.87%(199/219),高于社區(qū)醫(yī)生組的89.50%(196/219),差異無統(tǒng)計學(xué)意義(P=1.000)。
研究顯示,我國大陸糖尿病人群中DR患病率約為23.0%,其中NPDR和PDR的患病率分別約為19.1%和2.8%[14]。2017美國糖尿病學(xué)會指出通過早期檢查、定期隨訪、及時處理可避免98%由DR造成的視力喪失[15]。在我國,87%的糖尿病患者就診于縣級及以下醫(yī)療機構(gòu),以社區(qū)為中心、社區(qū)-疾控中心-醫(yī)院“三位一體”的管理模式有利于糖尿病慢病管理的持續(xù)進行[16]。然而社區(qū)醫(yī)療衛(wèi)生機構(gòu)中眼科醫(yī)療資源相對有限,使社區(qū)醫(yī)療衛(wèi)生機構(gòu)的DR早期防治工作存在篩查難度大、診斷準(zhǔn)確性及有效轉(zhuǎn)診率低等問題。在確保較高準(zhǔn)確性的前提下提高診斷效率,突破??迫肆Y源限制,實現(xiàn)大規(guī)模、快速的DR早期篩查、診斷和轉(zhuǎn)診,這正是糖尿病患者群體龐大、??迫瞬艆T乏的社區(qū)醫(yī)療衛(wèi)生機構(gòu)所需要實現(xiàn)的。眼底照相機在基層醫(yī)院的普及及其與遠程醫(yī)療相結(jié)合的模式可在一定程度上緩解上述困境,但因人力成本高、效率低下,無法開展大規(guī)模DR篩查[17]。
現(xiàn)代AI技術(shù)高速發(fā)展,已廣泛應(yīng)用于醫(yī)學(xué)檢查及治療,在眼科領(lǐng)域展現(xiàn)出了巨大潛力。自2018年首臺由美國食品和藥品管理局批準(zhǔn)用于DR檢測的AI設(shè)備IDx-DR面世,已有多項研究顯示AI在DR的診斷及病變分級上成效顯著[18-21]。本研究中應(yīng)用我國首個國家藥品監(jiān)督管理局批準(zhǔn)的眼底圖像AI輔助診斷系統(tǒng)CARE,結(jié)果顯示其在診斷DR及RDR上均體現(xiàn)出良好的性能,與專業(yè)眼科醫(yī)師判讀結(jié)果相比,診斷一致性極強,與國內(nèi)多中心真實世界研究結(jié)果相似[22]。該系統(tǒng)在診斷RDR上展現(xiàn)出穩(wěn)定的準(zhǔn)確率,與目前國際成熟的AI系統(tǒng)性能相仿。Ting等[23]以76 370張彩色眼底照片為訓(xùn)練集,訓(xùn)練機器自動學(xué)習(xí)、識別RDR的特征并建立AI系統(tǒng),其訓(xùn)練數(shù)據(jù)集的受試者工作特征曲線下面積(area under subject operating characteristic curve,AUC)達到0.936,靈敏度和特異性分別為90.5%和91.5%;再采用該AI系統(tǒng)對40 752張彩色眼底照片進行驗證診斷,AUC、靈敏度、特異性分別為0.889、91.8%和73.3%。然而該系統(tǒng)對于輕度NPDR的識別性能還有待進一步訓(xùn)練。不同于識別RDR的智能系統(tǒng),Gargeya等[24]建立了基于CNN算法、主要用來區(qū)分NDR和輕度及以上NPDR的AI系統(tǒng),其AUC達到了0.97,靈敏度和特異性分別為94%和98%。Abrmoff等[25]和Takahashi等[26]的研究則致力于探討更為詳細的DR-AI分級。
在實際臨床應(yīng)用場景中,AI系統(tǒng)的使用價值主要體現(xiàn)在眼科醫(yī)療資源相對缺乏的社區(qū)醫(yī)療衛(wèi)生機構(gòu)中,可解決全科醫(yī)生閱片水平參差不齊、讀片時效性低下等問題。現(xiàn)有研究多為比較AI與眼科醫(yī)師診斷DR的效能,少有研究比較AI與全科醫(yī)師在診斷DR效能上的差異。本研究的創(chuàng)新之處在于驗證該AI系統(tǒng)的診斷準(zhǔn)確率后,進一步比較AI系統(tǒng)與社區(qū)醫(yī)生的診斷效能及決策性能。在本研究中,預(yù)先對參與讀片的社區(qū)醫(yī)生進行規(guī)范培訓(xùn),培訓(xùn)方式結(jié)合理論授課及閱片實踐。通過培訓(xùn)及考核后,社區(qū)醫(yī)生診斷DR和RDR的結(jié)果與眼科專家具有極強一致性(Kappa值分別為0.93和0.98),略高于CARE系統(tǒng)(Kappa值分別為0.87和0.87)。以上研究結(jié)果表明,規(guī)范的培訓(xùn)及考核可有效提高社區(qū)DR診療水平,但廣泛化、同質(zhì)化、規(guī)范化的培訓(xùn)工作所耗費的人力、時間成本極高,而依靠于互聯(lián)網(wǎng)、云計算的AI診斷系統(tǒng)則節(jié)省了繁瑣的培訓(xùn)工作。至于AI與未經(jīng)培訓(xùn)的非眼科專業(yè)醫(yī)療人員在DR診斷效能上的高低,國內(nèi)有研究通過比較AI與初級、中級、高級職稱的內(nèi)分泌科醫(yī)生對1 000張?zhí)悄虿』颊卟噬鄣渍掌拈喥Y(jié)果,發(fā)現(xiàn)與AI的診斷符合率為94.7%,高于不同職稱的內(nèi)分泌科醫(yī)生(初級、中級和高級職稱組診斷符合率分別為94.0%、91.4%和93.4%)[27]。本研究結(jié)果顯示,在轉(zhuǎn)診決策性能評估上,CARE系統(tǒng)對RDR患者中90.87%病例做出“進一步檢查”或“立即治療”的建議,轉(zhuǎn)診效率優(yōu)于培訓(xùn)后社區(qū)醫(yī)生的89.50%。此外,研究指出在醫(yī)療衛(wèi)生資源相對缺乏的基層醫(yī)院引入AI輔助篩查、診斷,可提高疾病的診斷效率,延緩疾病進展,節(jié)省疾病治療費用[28]。本研究應(yīng)用CARE系統(tǒng)上傳彩色眼底照片后,可在1 min內(nèi)獲取診斷報告及轉(zhuǎn)診建議,其效率遠高于人工閱片。國內(nèi)一項8 012例的DR AI篩查研究結(jié)果顯示,從圖像上傳至分級報告完成,人工分級耗時為AI的97.5倍[29]。Johansen等[30]采用ophdiat AI系統(tǒng)對3.8萬人進行DR篩查和監(jiān)測,使專業(yè)眼科醫(yī)生節(jié)省了60%的時間。
綜上所述,本研究結(jié)果表明CARE系統(tǒng)應(yīng)用于社區(qū)DR診治工作中具有良好的診斷和決策性能,且時效性強,可為社區(qū)開展大規(guī)模、智能化DR篩查提供新的策略。本研究也存在一些不足,如基于單視野彩色眼底照片評估范圍有限及納入研究的樣本量有限等,今后我們將進一步完善研究設(shè)計,擴大樣本量,并擴展至基于光相干斷層掃描及其血管成像的AI研究,為地區(qū)DR防治體系的建立搭建數(shù)據(jù)平臺。
利益沖突所有作者均聲明不存在利益沖突
作者貢獻聲明董秀清:參與設(shè)計試驗、實施研究、采集數(shù)據(jù)、分析和解釋數(shù)據(jù)、文章撰寫;杜紹林:參與設(shè)計試驗、分析和解釋數(shù)據(jù)、文章審閱及定稿;劉華秀:參與設(shè)計試驗、實施研究及起草文章;鄒江鳳:參與實施研究、采集數(shù)據(jù);劉明慧:參與采集數(shù)據(jù)、分析數(shù)據(jù)