茅 前,江旻珊,魏 靜
(上海理工大學 光電信息與計算機工程學院,上海 200093)
杯盤比是指眼底的視盤和視杯兩者垂直高度的比,可以通過對眼底圖像的視盤和視杯的分割計算獲得。杯盤比是判斷青光眼的重要參考指標,目前杯盤比通常是由眼科醫(yī)生依靠多年的經(jīng)驗并通過觀察彩色眼底照片獲得。然而,人工觀測存在諸多的缺點,如需要有豐富的專業(yè)知識,判斷的一致性差,無法進行客觀定量的分析等。因此,為了提高青光眼篩查和診斷的效率,本文開展了計算機輔助青光眼智能診斷方法的研究。
在研究中我們采用了一個基于U-Net改進的算法來分割視盤和視杯,以此進一步提高算法對于視杯和視盤的準確分割。與現(xiàn)有的一些算法相比,我們所提出的方法在分割結(jié)果上能夠取得一定的提高。
本文視盤視杯分割采用了一個公開數(shù)據(jù)集和一個非公開數(shù)據(jù)集,分別為來自上海市第一人民醫(yī)院的彩色眼底照片以及DRISHTI-GS數(shù)據(jù)集[1]中的彩色眼底照片。其中,非公開數(shù)據(jù)中包含了300張彩色眼底照片,而DRISHTI-GS數(shù)據(jù)集包括了101張彩色眼底照片,彩色眼底照片的分辨率為2 896×1 944。
在使用神經(jīng)網(wǎng)絡進行學習時,為了保證網(wǎng)絡的學習效率以及得到更高的準確率,實驗前先對輸入網(wǎng)絡的圖像進行預處理。首先,針對對比度弱的彩色眼底圖像,使用限制對比度自適應直方圖均衡(CLAHE)技術(shù),該技術(shù)是將每個圖像切割成8×8的64塊,并且對每一塊使用直方圖均衡化處理。其次,調(diào)整圖片大小,將輸入的圖片調(diào)整為512×512。再次,采用數(shù)據(jù)擴增技術(shù)將訓練集中的圖像進行翻轉(zhuǎn)、平移、旋轉(zhuǎn)等操作,使得訓練集中的數(shù)據(jù)量擴大,防止在訓練中出現(xiàn)過擬合、數(shù)據(jù)不平衡等現(xiàn)象。最后,將訓練集中的彩色眼底照片和標簽融合至同一張圖片,如圖1所示,確保彩色眼底照片與標簽一一對應。
圖 1 訓練圖片與標簽相融合Fig. 1 Merge of the label and training image
本文基于傳統(tǒng)U-Net網(wǎng)絡架構(gòu)[2]提出了一種改進型的U-Net網(wǎng)絡架構(gòu)。該架構(gòu)包含了殘差塊,同時采用了卷積、池化等操作,原始的和改進的U-Net網(wǎng)絡結(jié)構(gòu)如圖2、圖3所示。
圖中,每一個長矩形對應著一個圖像或者是圖像的特征圖,長矩形中的數(shù)字代表著圖像的像素,各種顏色的箭頭代表著不同的卷積、反卷積以及池化等操作。在本文所改進的網(wǎng)絡中,原始U-Net中的下采樣部分被殘差塊所代替[3]。此外,我們還對網(wǎng)絡的跳躍連接做了改進,將原始U-Net中的跳躍連接使用一個3×3的卷積層和一個1×1的卷積層所代替。改進后的跳層連接能夠讓下采樣部分的特征信息更加充分地融合至上采樣部分,使得網(wǎng)絡獲得多種維度的圖像特征信息,幫助提高網(wǎng)絡的分割結(jié)果,圖4為本文所采用的跳躍連接。網(wǎng)絡中所使用的損失函數(shù)為二元交叉熵損失函數(shù),其表達式為
圖 2 原始 U-Net的網(wǎng)絡結(jié)構(gòu)圖Fig. 2 Original U-Net
圖 3 改進型的 U-NetFig. 3 Modified U-Net
在訓練過程中,本文網(wǎng)絡使用了adadelta 優(yōu)化器。adadelta優(yōu)化器能夠自動調(diào)節(jié)學習率,通過引入動量來調(diào)節(jié)梯度下降速度,實現(xiàn)快速收斂。在模型訓練階段,選取80%圖片用于每一輪訓練,訓練時將數(shù)據(jù)分批次輸入模型中以減少訓練時長,剩余的20%圖片用作測試。
圖 4 U-Net中跳躍連接結(jié)構(gòu)Fig. 4 Skip connection in the modified U-Net
在硬件環(huán)境上,本文采用了GPU進行訓練。此外,配置了128 G的內(nèi)存以及512 G的固態(tài)硬盤,以滿足深度學習的訓練要求。
在軟件環(huán)境上,本文采用TensorFlow平臺,并輔以python軟件。在深度學習實驗中,用到的庫有CUDA、cudnn、NumPy等。訓練過程中,模型的步長為2,模型一共經(jīng)歷了100輪的訓練,并且每一步的訓練時間都在1 min以內(nèi)。
在進行視杯以及視盤的分割后,采用了兩個衡量指標,即DICE系數(shù)和IOU來評估所提出算法的性能。DICE系數(shù)是一種集合相似度的度量指標,而IOU則是表示目標預測框和真實框的交集和并集的比例。各指標的計算公式如下:
式中:A為目標區(qū)域;B為預測區(qū)域。
圖5為訓練集中的彩色眼底圖和標簽圖。首先使用非公開數(shù)據(jù)集對網(wǎng)絡進行訓練,在視盤分割實驗中,設置實驗輪次為100次,每次步長為2。圖6為視盤訓練的loss曲線圖,從圖中可以看出,網(wǎng)絡在訓練階段,曲線收斂速度較快,表明網(wǎng)絡學習效率較高。隨著訓練輪次的提高,模型曲線的斜率逐漸減小,當訓練輪次達到20時,訓練曲線開始趨于水平,說明網(wǎng)絡的學習能力開始飽和,并且開始呈現(xiàn)微小的波動。圖7為視杯訓練的loss曲線圖,在視杯分割中,同樣把實驗設置為100次,每次步長為2。從圖7中可以看出,曲線在達到30輪次時,開始趨于水平。圖8和圖9分別為視盤和視杯經(jīng)過網(wǎng)絡訓練的準確率曲線圖。
圖 5 訓練集中彩色眼底圖與標簽圖Fig. 5 Label and color fundus image in training dataset
圖像在進行卷積操作時,每一次卷積都能夠提取原始圖像中的一種特征,這些特征除了對我們有用的特征信息之外,還可能包括一些無用的特征信息,例如背景特征、噪聲等。這些無用的特征信息同樣會被當做輸入進入下一層的網(wǎng)絡中去,但是,隨著網(wǎng)絡層數(shù)的加深,我們所需要的特征信息會自動強化,而那些背景信息或噪聲則會被弱化。使用評價指標對訓練后的模型進行評價,評價結(jié)果如表1所示。在視盤分割中,網(wǎng)絡的準確率ACC達到了99.96%,驗證集的DICE系數(shù)達到了97.3%,IOU系數(shù)達到了95.2%;在視杯的分割中,網(wǎng)絡的準確率ACC同樣達到了99.91%,而驗證集的DICE系數(shù)達到了92.6%,IOU系數(shù)達到了87.8%。
圖 6 視盤訓練 loss 曲線圖Fig. 6 Loss curve in the optic disc training
圖 7 視杯 loss 曲線圖Fig. 7 Loss curve in the optic cup training
圖 8 視盤準確率曲線圖Fig. 8 Accuracy curve in the optic disc training
圖 9 視杯準確率曲線圖Fig. 9 Accuracy curve in the optic cup training
表 1 視盤視杯分割評估指標Tab. 1 Evaluation metric of optic disc and cup segmentation
在使用非公開數(shù)據(jù)集完成訓練后,本文使用了DRISHTI-GS數(shù)據(jù)集對網(wǎng)絡進行測試。表2和表3分別是視盤和視杯用不同處理方法得到的分割結(jié)果。將DRISHTI-GS數(shù)據(jù)集中的彩色眼底圖像作為測試集中的輸入,觀察輸出的分割效果圖以及分割指數(shù),并與其他的一些同樣使用本數(shù)據(jù)集的網(wǎng)絡(如FCN、 Small scale U-Net、MNet)進行對比。由表2和表3可以看出,本文提出的方法在DICE和IOU系數(shù)方面均有一定程度的提高。此外,網(wǎng)絡訓練的時間也有一定程度的減少,100輪次花費了110 min左右。其主要原因在于:1)模型中改進了跳躍連接,使得模型在跳躍連接時把有效的分割信息傳遞給上采樣的對應層,增加了模型的準確率;2)本文下采樣部分所使用的殘差18模塊能夠較為有效地減少過擬合現(xiàn)象;3)改進型的U-Net網(wǎng)絡相較于原始的U-Net網(wǎng)絡參數(shù)較小,訓練時間相比原始U-Net耗時更少。圖10為分割成功的視杯圖片,圖11是將OC分割測試結(jié)果與標簽、彩色眼底圖融合后的結(jié)果圖,其中中心黑色圈為標簽,白色圈為測試結(jié)果。圖12為測試集中分割成功的視盤圖片,圖13是將視盤分割測試結(jié)果與標簽、彩色眼底圖融合后的結(jié)果圖,其中中心黑色圈為標簽,白色圈為測試結(jié)果。
表 2 視盤分割比較結(jié)果Tab. 2 Comparison of optic disc segmentation
表 3 視杯分割比較結(jié)果Tab. 3 Comparison of optic cup segmentation
圖 10 在 DRISHTI-GS 數(shù)據(jù)集中視杯分割結(jié)果Fig. 10 Result of the segmentation of the optic cup in DRISHTI-GS datasets
圖 11 視杯 OC 融合后的結(jié)果圖Fig. 11 Result of the merging image of the label, OC segmentation result and color fundus images
圖 12 在 DRISHTI-GS 數(shù)據(jù)集視盤分割結(jié)果Fig. 12 Result of the segmentation of the optic disc in DRISHTI-GS datasets
圖 13 視盤融合后的結(jié)果圖Fig. 13 Result of optic disc fusion
分割彩色眼底照片在計算機輔助醫(yī)學診斷方面具有廣泛的發(fā)展前景,但也面臨著許多的挑戰(zhàn)和不足。本文采用的網(wǎng)絡是在現(xiàn)有的U-Net網(wǎng)絡上對其進行改進實現(xiàn)的,主要改進了U-Net網(wǎng)絡下采樣部分和跳躍連接部分,充分利用了每一層的特征信息。通過與目前主流的網(wǎng)絡結(jié)構(gòu)進行對比,證明了本文網(wǎng)絡能獲得較好的分割效果,減少了分割眼底圖像的時間,可以為青光眼的大規(guī)模篩查提供參考。