摘 要:針對視網(wǎng)膜眼底血管分割結(jié)果存在的斷裂、分割不足等問題,提出局部與全局雙支路分割模型,局部支路先對圖像進(jìn)行平均分割,對分割后的圖片進(jìn)行局部特征信息提取,全局支路則是對全局信息進(jìn)行特征提取,在2 條支路之間通過特征融合模塊(Feature Fusion Module,FFM) 進(jìn)行連接,使得網(wǎng)絡(luò)之間的聯(lián)系更加密切,全局、局部支路信息共享,在局部支路的最底層加入層數(shù)為6 的Transformer 模塊,對底層的抽象通知進(jìn)行高效提取利用,減少特征信息的丟失,提高網(wǎng)絡(luò)的分割精度。提出的模型在公開數(shù)據(jù)集DRIVE、STARE 上的準(zhǔn)確率分別為98. 39% 、98. 76% ,與傳統(tǒng)模型分割精度相比得到了較大的提升。
關(guān)鍵詞:圖像分割;視網(wǎng)膜血管;雙通道模型;特征融合
中圖分類號(hào):TP391. 41 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1003-3106(2024)12-2888-07
0 引言
人類的視網(wǎng)膜是一個(gè)含有非常豐富血管信息的光敏組織,而且具有非入侵和非創(chuàng)傷可視化的性質(zhì)。血管是視網(wǎng)膜最重要的組成部分之一,視網(wǎng)膜血管的結(jié)構(gòu)和形態(tài),如直徑、角度、分支等一直都是冠心病、糖尿病、動(dòng)脈硬化等疾病的重要診斷指標(biāo)之一,對其進(jìn)行分析可以幫助醫(yī)生診斷和治療人體各種系統(tǒng)疾病。目前臨床醫(yī)學(xué)的血管圖像大多是以專家手動(dòng)分割為主,但是因?yàn)橐暰W(wǎng)膜血管較細(xì)且密集,導(dǎo)致人工手動(dòng)分割視網(wǎng)膜血管變得非常繁瑣,并且容易出錯(cuò)。所以需要研究一種高效的視網(wǎng)膜血管自動(dòng)分割算法為眼科醫(yī)生提供有價(jià)值的診斷輔助。
在視網(wǎng)膜血管分割中,基于Transformer 模型的研究并不常見,有些文獻(xiàn)中的模型通過注意力機(jī)制來提高分割的精度,但是這些網(wǎng)絡(luò)的編碼部分和解碼部分均由卷積層構(gòu)成,隨著TransUNet 的提出,這個(gè)模型使用基于Transformer 的編碼器對圖像進(jìn)行操作,并且?guī)в刑S連接解碼器來分割圖像。Transformer的模型在較大數(shù)據(jù)集上的訓(xùn)練效果較好,但是視網(wǎng)膜血管的數(shù)據(jù)集都較小,將Transformer 作用于視網(wǎng)膜血管圖像分割時(shí)的效果往往不會(huì)很好。