劉雪巖,許聿達(dá),雷建昕,周光泉,張為中,周 平*
(1.東南大學(xué) 生物科學(xué)與醫(yī)學(xué)工程學(xué)院,江蘇 南京 210016;2.南京醫(yī)科大學(xué)第一附屬醫(yī)院,江蘇 南京 210029)
腹腔鏡是腹部微創(chuàng)手術(shù)的重要成像工具,在臨床中具有廣泛的應(yīng)用。目前使用的三維腹腔鏡均基于雙目立體視覺(jué)原理設(shè)計(jì),需臨床醫(yī)生佩戴專(zhuān)用眼鏡并自行在頭腦中重建手術(shù)對(duì)象的三維信息。根據(jù)雙目立體視覺(jué)的成像原理可知,這種三維腹腔鏡受使用環(huán)境限制,“雙目”間的基線(xiàn)很短,其三維成像精度較低,難以獨(dú)立滿(mǎn)足臨床中三維測(cè)量的要求。具有獨(dú)立三維測(cè)量功能的三維腹腔鏡是當(dāng)前研究的前沿問(wèn)題。
2017年,Liu等提出了一種基于光場(chǎng)成像原理的三維腹腔鏡[1],為三維腹腔鏡的研究提供了一個(gè)新的思路。但是,Liu等提出的三維光場(chǎng)腹腔鏡僅給出了實(shí)現(xiàn)可能,對(duì)成像模型、標(biāo)定與成像算法等關(guān)鍵問(wèn)題并未給出解決方案,且其成像分辨率僅為54×36,無(wú)法滿(mǎn)足臨床需求。標(biāo)定算法與光場(chǎng)圖像的分辨率是影響三維光場(chǎng)腹腔鏡標(biāo)定精度的重要因素。傳統(tǒng)的光場(chǎng)成像系統(tǒng)標(biāo)定均基于雙平面模型,采用將成像參數(shù)一次標(biāo)定或多次分步標(biāo)定的策略進(jìn)行。通常,一次標(biāo)定的精度較高,如Dansereau等[2-3]提出的標(biāo)定方法,缺點(diǎn)在于成像模型中的參數(shù)物理含義不清晰,不利于對(duì)成像過(guò)程的理解。對(duì)于多次分步標(biāo)定而言,后標(biāo)定的參數(shù)精度受前標(biāo)定精度的影響,如Zhou[4]等提出的標(biāo)定方法,優(yōu)點(diǎn)在于參數(shù)物理意義清晰。但這些光場(chǎng)標(biāo)定方法均應(yīng)用于傳統(tǒng)光場(chǎng)相機(jī),并不適用于光場(chǎng)視差較小的光場(chǎng)腹腔鏡。此外,成像分辨率是影響標(biāo)定精度的重要原因,特別是對(duì)于光場(chǎng)成像,由于受到帶寬積的限制,位置分辨率遠(yuǎn)低于傳統(tǒng)成像分辨率。為解決分辨率低的問(wèn)題,超分辨率算法是近年的研究熱點(diǎn)[5-6]。自卷積神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域取得突破性進(jìn)展后[7],Dong等在2014年提出了首個(gè)基于深度學(xué)習(xí)的圖像超分辨方法[8],實(shí)現(xiàn)了遠(yuǎn)超傳統(tǒng)方法的超分辨重建效果。隨后,一系列基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的方法,如VDSR[9],SR DenseNet[10],SR GAN[11]等,基 于 上 采 樣 的 方 法,如 轉(zhuǎn) 置 卷積[12]、pixel-shuffle[13]等,以及基于損失函數(shù)的方法,如perceptual loss[14]、adversarial loss[11]等,進(jìn)一步提升了深度學(xué)習(xí)超分辨方法的性能。
針對(duì)三維光場(chǎng)腹腔鏡的標(biāo)定問(wèn)題,本文在前期兩步標(biāo)定法工作的基礎(chǔ)上,在第二步標(biāo)定中針對(duì)光場(chǎng)視差較小的問(wèn)題提出了光場(chǎng)視差放大方法。針對(duì)光場(chǎng)三維腹腔鏡的帶寬積問(wèn)題,提出了基于SRDenseNet的改進(jìn)型超分辨率網(wǎng)絡(luò),分別對(duì)位置分辨率與角度分辨率進(jìn)行超分辨率處理。
基于以往研究成果與Dansereau的虛擬物平面理論,三維光場(chǎng)腹腔鏡的標(biāo)定模型可用如圖1的雙平面模型表示?;诠鈭?chǎng)的雙平面理論,虛擬物平面代表方向平面(u,v),微透鏡陣列(Micro Lens Array,MLA)平面代表位置平面(s,t),因此,將三維光場(chǎng)腹腔鏡中的一條光線(xiàn)表示為L(zhǎng)(u,v,s,t)。本文將其標(biāo)定過(guò)程分解為光線(xiàn)成像于MLA平面與傳感器平面兩個(gè)步驟。首先,空間中的一個(gè)物點(diǎn)P(Xw,Yw,Zw)成像于MLA平面 點(diǎn)p(x,y),其成像過(guò)程如式(1)所示:
圖1 三維光場(chǎng)腹腔鏡的雙平面模型Fig.1 Two-parallel-plane model of 3D light field endoscope
其中:以虛擬物平面中心建立坐標(biāo)系,Zc為所得的空間物點(diǎn)坐標(biāo)中的Z方向坐標(biāo)值,dob-ml表示虛擬物平面與MLA平面間的距離,MLA平面與傳感器平面間的距離采用dml-im表示,hm為物方焦平面到虛擬物平面間的距離,d為微透鏡直徑。此外,(U,V)為光線(xiàn)落于方向平面的坐標(biāo),但不是標(biāo)定中必須求取的參數(shù)。根據(jù)光場(chǎng)理論,當(dāng)以中心子孔徑圖像為研究對(duì)象時(shí),(U,V)=(0,0),將式(1)描述的過(guò)程進(jìn)行簡(jiǎn)化,便于完成第一步標(biāo)定。除式(1)所示參數(shù)外,光場(chǎng)腹腔鏡的標(biāo)定需計(jì)算微透鏡陣列與傳感器平面間的距離dml-im,在傳統(tǒng)標(biāo)定中使用單個(gè)特征點(diǎn)的光場(chǎng)視差實(shí)現(xiàn)。因光場(chǎng)腹腔鏡中的光場(chǎng)視差較小,標(biāo)定精度較低,本文提出光場(chǎng)視差放大的方法加以解決。光場(chǎng)視差放大方法通過(guò)分析兩個(gè)特征點(diǎn)在不同光場(chǎng)特征圖像中的投影距離與dml-im間的關(guān)系,克服了單個(gè)特征點(diǎn)光場(chǎng)視差小對(duì)三維光場(chǎng)腹腔鏡標(biāo)定的影響,其原理如圖2所示。
圖2 三維光場(chǎng)腹腔鏡的成像模型Fig.2 Imaging model of 3D light field endoscope
其中:q為傳感器平面的像元尺寸;Ze2是特征點(diǎn)P2所成實(shí)像Pe2在相機(jī)坐標(biāo)系中的Z坐標(biāo),該坐標(biāo)值在第一步標(biāo)定后,可通過(guò)基于EPI的方法計(jì)算得到[15];與單個(gè)特征點(diǎn)的光場(chǎng)視差不同,ΔX與ΔU反映在圖像中,其對(duì)應(yīng)的像素?cái)?shù)值通常大于1個(gè)像素,即實(shí)現(xiàn)了視差放大功能。三維光場(chǎng)腹腔鏡的標(biāo)定即為求取式(1)與式(2)中的參數(shù)。
本文使用棋盤(pán)格標(biāo)定板進(jìn)行光場(chǎng)三維腹腔鏡的標(biāo)定。在標(biāo)定過(guò)程中,使用中心子孔徑圖像進(jìn)行第一步標(biāo)定,其分辨率為354×236;使用元素圖像與中心子孔徑圖像進(jìn)行第二步標(biāo)定,元素圖像分辨率為13×13。子孔徑圖像與元素圖像分別為光場(chǎng)圖像的位置切片與角度切片,本文采用子孔徑圖像與元素圖像分別超分辨的策略,即分別進(jìn)行光場(chǎng)圖像的位置超分辨與角度超分辨運(yùn)算。本文基于SR DenseNet網(wǎng)絡(luò)進(jìn)行改進(jìn),針對(duì)標(biāo)定特征點(diǎn)搜索算法對(duì)邊界屬性的要求,將通道注意力機(jī)制[16]引入超分辨率網(wǎng)絡(luò),總體結(jié)構(gòu)如圖3所示。
圖3 超分辨網(wǎng)絡(luò)的總體結(jié)構(gòu)Fig.3 Overall structure of proposed SR network
該網(wǎng)絡(luò)的基本思想是使用多個(gè)級(jí)聯(lián)的CAD模塊(Channel Attention Dense Block)對(duì)輸入的低分辨率圖像進(jìn)行特征提取,再通過(guò)轉(zhuǎn)置卷積上采樣提升圖像分辨率。網(wǎng)絡(luò)共包含68個(gè)卷積層與16個(gè)全連接層,實(shí)現(xiàn)了輸入二維圖像的寬、高各2倍的超分辨處理。通道注意力機(jī)制體現(xiàn)在CAD模塊中,輸入經(jīng)過(guò)可配置層數(shù)的k個(gè)密集連接卷積層后,再采用通道注意力機(jī)制對(duì)不同通道特征的自適應(yīng)權(quán)重分配使重要特征的權(quán)重提升,進(jìn)而增強(qiáng)特征提取與映射的效果。CAD模塊的結(jié)構(gòu)如圖4所示。
圖4 CAD模塊結(jié)構(gòu)Fig.4 Structure of CAD module
在傳統(tǒng)的卷積操作中,輸入特征的每個(gè)通道權(quán)重是相同的。雖然網(wǎng)絡(luò)可以通過(guò)整體調(diào)整對(duì)應(yīng)卷積核的參數(shù)值來(lái)間接調(diào)整每一通道的權(quán)重,但這種方法無(wú)法實(shí)現(xiàn)對(duì)不同輸入內(nèi)容的自適應(yīng)權(quán)重分配。在對(duì)標(biāo)定板圖像進(jìn)行超分辨處理時(shí),對(duì)于邊界區(qū)域與其他區(qū)域的超分辨率要求不一,反映在網(wǎng)絡(luò)中為不同通道特征的重要程度不同。為實(shí)現(xiàn)通道權(quán)重的自適應(yīng)調(diào)整,本文采用通道注意力先對(duì)輸入特征X的每一通道XC進(jìn)行全局平均池化,得到對(duì)應(yīng)每個(gè)通道的特征值uc:
使用全局池化的目的在于獲取全局視野,利用整個(gè)通道的信息來(lái)提取特征。然后,本文使用兩個(gè)全連接層對(duì)特征值進(jìn)行非線(xiàn)性映射,得到每個(gè)通道的權(quán)重vc=f(uc),最終將通道乘以對(duì)應(yīng)權(quán)重作為輸出,即YC=vC×XC。通過(guò)上述架構(gòu),通道注意力實(shí)現(xiàn)了獨(dú)立于空間特征的通道特征重分配,且這種分配是自適應(yīng)、通過(guò)學(xué)習(xí)得到的。CAD模塊尾部添加的通道注意力部分能夠重新分配密集連接機(jī)制帶來(lái)的多通道特征,兩者的有機(jī)結(jié)合進(jìn)一步提升了網(wǎng)絡(luò)的超分辨性能。
超分辨率網(wǎng)絡(luò)的理想應(yīng)用場(chǎng)景是將現(xiàn)有的子孔徑圖像、元素圖像作為輸入,實(shí)現(xiàn)分辨率的增強(qiáng)。然而,由于我們無(wú)法獲得高于現(xiàn)有光場(chǎng)腹腔鏡圖像分辨率16倍的圖像,因此無(wú)法在有監(jiān)督學(xué)習(xí)的框架下完成網(wǎng)絡(luò)訓(xùn)練??紤]到低、高分辨率標(biāo)定板圖像的結(jié)構(gòu)相似性,本文將原始圖像進(jìn)行降采樣得到低分辨率圖像(LR)[8],將原始圖像作為高分辨率標(biāo)簽圖像(HR),使用此LR-HR圖像組作為訓(xùn)練數(shù)據(jù)完成網(wǎng)絡(luò)訓(xùn)練。網(wǎng)絡(luò)訓(xùn)練完成后,再將原圖作為輸入圖像實(shí)現(xiàn)超分辨率的目標(biāo)。角度、位置超分辨網(wǎng)絡(luò)使用的數(shù)據(jù)集均為實(shí)驗(yàn)室自行拍攝,分別包含4.5萬(wàn)與1.2萬(wàn)組LRHR圖像,按照4∶1的比例隨機(jī)劃分為訓(xùn)練集與驗(yàn)證集。
本文的深度學(xué)習(xí)實(shí)驗(yàn)環(huán)境為:Intel Core i7-8700 CPU,32 GB內(nèi)存,Nvidia GeForce RTX 2080Ti GPU。軟件平臺(tái)為Windows10操作系統(tǒng),Keras 2.2.4深度學(xué)習(xí)框架。兩個(gè)網(wǎng)絡(luò)分別進(jìn)行了150輪訓(xùn)練,使用Adam優(yōu)化器和均方誤差(Mean Square Error,MSE)損失函數(shù),初始學(xué)習(xí)率設(shè)置為10-5。位置、角度超分辨率網(wǎng)絡(luò)在訓(xùn)練集與驗(yàn)證集上的峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)訓(xùn)練曲線(xiàn)如圖5所示,超分辨率處理結(jié)果如圖6所示。在訓(xùn)練中,訓(xùn)練集實(shí)施了在線(xiàn)數(shù)據(jù)增強(qiáng),在訓(xùn)練時(shí)對(duì)每張輸入LR圖像進(jìn)行隨機(jī)的高斯隨機(jī)噪聲疊加,以提升網(wǎng)絡(luò)的穩(wěn)健性與泛化能力。訓(xùn)練進(jìn)行150輪后,位置超分辨率網(wǎng)絡(luò)在進(jìn)行了數(shù)據(jù)增強(qiáng)的訓(xùn)練集與驗(yàn)證集上的PSNR分別達(dá)到約36.6 d B與36.4 d B,角度超分辨率網(wǎng)絡(luò)的PSNR均在32.8 d B左右。
圖5 超分辨率網(wǎng)絡(luò)訓(xùn)練曲線(xiàn)Fig.5 Training curves of super-resolution network
Matlab的光場(chǎng)工具箱在進(jìn)行元素圖像重置時(shí),采用雙三次插值計(jì)算像素值。從獲得“新”像素值的角度出發(fā),雙三次插值是一種基本的超分辨率算法。為評(píng)價(jià)本文提出的超分辨網(wǎng)絡(luò)的性能,這里分別測(cè)試了雙三次插值方法、經(jīng)典SR DenseNet網(wǎng)絡(luò)和本文提出網(wǎng)絡(luò)在原始訓(xùn)練集LR圖像上的超分辨效果。其中,經(jīng)典SR DenseNet的訓(xùn)練輪數(shù)、優(yōu)化方法等與本文提出的網(wǎng)絡(luò)相同。對(duì)比結(jié)果如表1所示。
表1 超分辨率算法的性能對(duì)比Tab.1 Performance comparison between super-resolution methods (dB)
由表1可知,以標(biāo)定板圖像作為輸入圖像時(shí),本文所提網(wǎng)絡(luò)具有更好的超分辨率效果。需要指出的是,位置超分辨與角度超分辨網(wǎng)絡(luò)的訓(xùn)練集不同,因此兩者的PSNR數(shù)值不能用于直接對(duì)比。
本文實(shí)現(xiàn)的三維光場(chǎng)腹腔鏡實(shí)驗(yàn)系統(tǒng)由二維腹腔鏡(沈大)、物鏡(f=50 mm),微透鏡陣列(Pitch=0.063 mm,f=2 mm),中繼鏡與單反相機(jī)(Canon 600D,5 184×3 456 pixel,q=4.2 um)組成。如圖2所示,所有設(shè)備采用籠式結(jié)構(gòu)固定,以保證光軸共軸。根據(jù)微透鏡Pitch與傳感器像元尺寸可知,光場(chǎng)腹腔鏡的角度分辨率為13×13,子孔徑圖像分辨率為354×236 pixel。
本文使用棋盤(pán)格標(biāo)定板完成三維光場(chǎng)腹腔鏡的標(biāo)定。光場(chǎng)腹腔鏡拍攝棋盤(pán)格標(biāo)定板,其中心子孔徑圖像如圖6(a)所示。采用本文提出的位置超分辨率網(wǎng)絡(luò),將子孔徑圖像的分辨率提高至原始圖像的4倍,即708×472 pixel,所得結(jié)果如圖6(b)所示。在對(duì)式(1)所含參數(shù)進(jìn)行標(biāo)定時(shí),選擇棋盤(pán)格的角點(diǎn)作為標(biāo)定特征點(diǎn)。如圖6(b)所示,子孔徑圖像分辨率增加,角點(diǎn)鄰域內(nèi)的黑白區(qū)域邊界更加銳利,這些變化有利于提高角點(diǎn)檢測(cè)的準(zhǔn)確性,進(jìn)而提高標(biāo)定精度。
圖6 標(biāo)定圖像超分辨率結(jié)果Fig.6 Super-resolution results of calibration images
基于圖2原理進(jìn)行參數(shù)dml-im標(biāo)定,需要在元素圖像中搜索特征點(diǎn),因此在位置超分辨率之后,采用本文提出的角度超分辨率網(wǎng)絡(luò),將元素圖像的分辨率,即角度分辨率從13×13提高至26×26。如圖6(c)~6(d)所示,元素圖像的細(xì)節(jié)更加清晰,有助于提升特征點(diǎn)的搜索精度。
與經(jīng)典標(biāo)定方法相似,本文使用中心子孔徑圖像實(shí)現(xiàn)標(biāo)定,選擇棋盤(pán)格標(biāo)定板的角點(diǎn)作為特征點(diǎn),采用張正友標(biāo)定法完成式(1)所含參數(shù)的標(biāo)定。針對(duì)dml-im,本文選擇元素圖像的中心點(diǎn)作為圖2所示的特征點(diǎn)P1的像點(diǎn)Pim1,選擇元素圖像中像點(diǎn)垂直于黑白交界的垂足作為特征點(diǎn)P2的像點(diǎn)Pim2。為實(shí)現(xiàn)dml-im的標(biāo)定,如圖2所示,需分別確定特征點(diǎn)P1,P2在MLA平面的像點(diǎn)Pml1,Pml2。采用中心子孔徑圖像,根據(jù)光場(chǎng)成像原理,微透鏡在微透鏡陣列中的位置索引即為該微透鏡對(duì)應(yīng)的元素圖像中心點(diǎn)在中心子孔徑圖像中的坐標(biāo),因此,與特征點(diǎn)P1的像點(diǎn)Pim1對(duì)應(yīng)的像點(diǎn)Pml1在中心子孔徑圖像的坐標(biāo),即為Pim1對(duì)應(yīng)的微透鏡在微透鏡陣列中的索引。對(duì)于Pml2的確定,依據(jù)光場(chǎng)成像原理,元素圖像可視為微透鏡拍攝主透鏡所成的像,因此元素圖像中特征點(diǎn)間的幾何關(guān)系在中心子孔徑圖像中仍成立,即特征點(diǎn)P2在中心子孔徑圖像中的像點(diǎn)Pml2應(yīng)為Pml1垂直于黑白交界的垂足,如圖7所示。
圖7 d ml-im標(biāo)定特征點(diǎn)Fig.7 Calibration feature points d ml-im
本文采用27幅位置、角度不一的標(biāo)定板圖像完成第一步標(biāo)定,在元素圖像、中心子孔徑圖像中選擇300對(duì)特征點(diǎn)完成第二步標(biāo)定。經(jīng)優(yōu)化,使用與不使用超分辨率網(wǎng)絡(luò)的三維光場(chǎng)腹腔鏡的標(biāo)定結(jié)果如表2所示。
表2 超分辨率前后三維光場(chǎng)腹腔鏡的標(biāo)定結(jié)果Tab.2 Calibration results of 3D LFE with&without super-resolation
本文采用超分辨率前后的反投影誤差與直線(xiàn)擬合的確定系數(shù)(R 2)評(píng)價(jià)標(biāo)定結(jié)果以及超分辨率處理對(duì)標(biāo)定性能的提升效果,如圖8所示。可見(jiàn)第一步標(biāo)定中27張圖像超分辨前有個(gè)別圖像的誤差顯著高于平均值,超分辨處理后這些圖像的誤差明顯降低;使用與不使用超分辨的平均重投影誤差分別為0.058 pixel和0.050 pixel,使用超分辨網(wǎng)絡(luò)后的平均重投影誤差降低了約16%。
圖8 標(biāo)定反投影誤差和R-SquareFig.8 Re-projection error and R-square of calibration
第二步標(biāo)定中,使用與不使用超分辨網(wǎng)絡(luò)的直線(xiàn)擬合R 2系數(shù)分別為0.86和0.91??梢?jiàn)超分辨后的R 2提升了約6%,數(shù)據(jù)點(diǎn)在回歸直線(xiàn)附近的分布更加密集,說(shuō)明超分辨網(wǎng)絡(luò)能夠降低第二步標(biāo)定的隨機(jī)誤差,提升直線(xiàn)擬合的準(zhǔn)確度。
綜上所述,本文提出的超分辨網(wǎng)絡(luò)能夠提升光場(chǎng)腹腔鏡標(biāo)定圖像的清晰度,降低光場(chǎng)腹腔鏡第一步和第二步標(biāo)定過(guò)程的隨機(jī)誤差,幫助計(jì)算得到更精準(zhǔn)的標(biāo)定參數(shù)。
影響三維光場(chǎng)腹腔鏡標(biāo)定精度的主要原因在于較小的光場(chǎng)視差與較低的圖像分辨率。針對(duì)第一個(gè)問(wèn)題,本文提出了一種光場(chǎng)視差放大的方法,將標(biāo)定中單個(gè)特征點(diǎn)的光場(chǎng)視差計(jì)算,轉(zhuǎn)變?yōu)閮蓚€(gè)特征點(diǎn)在不同特征圖像中的距離計(jì)算,從根本上避免了小視差帶來(lái)的系統(tǒng)誤差;針對(duì)第二個(gè)問(wèn)題,本文提出了一種適用于光場(chǎng)圖像的超分辨網(wǎng)絡(luò),實(shí)現(xiàn)了比經(jīng)典SRDenseNet更清晰、準(zhǔn)確的超分辨重建效果,能夠有效提升光場(chǎng)腹腔鏡圖像的角度分辨率與位置分辨率。實(shí)驗(yàn)結(jié)果表明,光場(chǎng)腹腔鏡的角度分辨率從13×13提高至26×26,位置分辨率從354×236提高至708×472,光場(chǎng)腹腔鏡的整體分辨率提高了16倍。此外,使用本文方法后,光場(chǎng)腹腔鏡標(biāo)定的反投影誤差下降了約16%,直線(xiàn)擬合確定系數(shù)提升了約6%。使用超分辨率圖像后,在標(biāo)定方法不變的情況下,標(biāo)定精度的提高進(jìn)一步驗(yàn)證了本文超分辨率網(wǎng)絡(luò)的有效性。在今后的工作中,會(huì)考慮在網(wǎng)絡(luò)中加入3D或4D卷積結(jié)構(gòu),以獲得更好的重建效果。