萬(wàn)志勇, 周小安
(深圳大學(xué) 信息工程學(xué)院, 廣東 深圳 518000)
膽道閉鎖是嬰兒期常見(jiàn)的嚴(yán)重的肝疾病之一,如治療不及時(shí)將會(huì)危及生命。患有該疾病的嬰兒會(huì)有如下3種臨床癥狀:蒼白色素大便、長(zhǎng)期性黃疸和尿液呈黑色狀[1]。目前,肝門空腸吻合手術(shù)(Kasai手術(shù))是膽道閉鎖的首要治療方法。(引用大便比色卡)手術(shù)的時(shí)間非常關(guān)鍵,在患病嬰兒2個(gè)月前進(jìn)行手術(shù)要比2個(gè)月后進(jìn)行手術(shù)的成功概率要高。為了提高嬰兒膽道閉鎖的存活率,早期膽道閉鎖的篩查就很有必要了。
目前主要是應(yīng)用大便比色卡進(jìn)行膽道閉鎖篩查,這是在1994年日本Matsui醫(yī)生首先提出通過(guò)大便顏色來(lái)早期篩查膽道閉鎖,通過(guò)讓嬰兒的母親每天觀察嬰兒大便的顏色,為早期診斷膽道閉鎖提供了可靠及有效的線索[2]。通過(guò)觀察患病嬰兒和健康嬰兒的大便顏色,來(lái)制作大便比色卡。將比色卡分為2類:正常組和異常組。圖1中的(1~3)是屬于異常組,大便的顏色包括白陶土色至淺黃色;圖1中的(4~6)為正常組,大便的顏色包括黃色至綠色[3]。家長(zhǎng)每天通過(guò)對(duì)比大便比色卡上的圖片來(lái)觀察嬰兒大便的顏色,當(dāng)觀察到嬰兒大便顏色對(duì)應(yīng)異常組,則需要警惕嬰兒患膽道閉鎖的可能,應(yīng)該及時(shí)到醫(yī)院進(jìn)行相關(guān)的檢查。利用大便比色卡進(jìn)行膽道閉鎖的篩查,這使得膽道閉鎖患兒的手術(shù)時(shí)間提前,提高了嬰兒的生存率。
圖1 大便比色卡
目前,卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別分類任務(wù)中的應(yīng)用越來(lái)越廣泛。研究中常見(jiàn)的模型種類與特征可分述如下。
(1)變積分自動(dòng)編碼器(VAE)。具體來(lái)說(shuō),其特殊之處在于設(shè)計(jì)中試圖將編碼的潛在向量構(gòu)建為均值和方差的高斯概率分布。
(2)GoogleNet模型。這是有9個(gè)相同的并行卷積神經(jīng)網(wǎng)絡(luò),具有下采樣功能。其執(zhí)行時(shí)間比商用硬件上的VGG或ResNet好。
(3)ResNet50模型。是Microsoft研究發(fā)布的高度準(zhǔn)確的模型。但其準(zhǔn)確性的增加卻是以計(jì)算開(kāi)支為代價(jià)的。而且在模型內(nèi)存成本和執(zhí)行時(shí)間上都超過(guò)了GoogleNet。模型的優(yōu)點(diǎn)是精度高,缺點(diǎn)是模型相對(duì)復(fù)雜。
(4)VGG16模型。主要用于大規(guī)模圖像識(shí)別的深層次卷積網(wǎng)絡(luò)。VGG由牛津大學(xué)的研究人員出版。推介亮點(diǎn)在于其簡(jiǎn)潔的結(jié)構(gòu)風(fēng)格。大多數(shù)網(wǎng)絡(luò)由簡(jiǎn)單級(jí)聯(lián)方式的卷積層和丟失層組成。設(shè)計(jì)優(yōu)勢(shì)是簡(jiǎn)單性,缺點(diǎn)是高內(nèi)存和計(jì)算成本。
本文中用到的分類模型是GoogleNet InceptionV3。
本論文實(shí)驗(yàn)的數(shù)據(jù)來(lái)自深圳市兒童醫(yī)院。其中包括16名患有膽道閉鎖的嬰兒和20名正常的嬰兒。在每天的早晨通過(guò)照相機(jī)拍照獲得患病和正常嬰兒的大便圖像。被收集到的圖像先經(jīng)過(guò)初步的篩選,而后每張照片再經(jīng)過(guò)醫(yī)生的檢查,從而來(lái)標(biāo)定這張圖像是屬于正常、還是異常。在本文的實(shí)驗(yàn)中,研究一共收集到了2 524張圖像,1 120張是正常的,1 404張圖像是異常的。在數(shù)據(jù)訓(xùn)練和測(cè)試的時(shí)候,將正常的圖像標(biāo)簽設(shè)定為1,異常的圖像標(biāo)簽設(shè)定為0。視像標(biāo)定結(jié)果即如圖2所示。同時(shí),又把這些數(shù)據(jù)按7:3的比例劃分訓(xùn)練集和測(cè)試集。
(a)異常(0) (b)正常(1)
本文的組織結(jié)構(gòu)如圖3所示。首先是圖像的獲取,然后是對(duì)圖像進(jìn)行預(yù)處理,使得圖像的大小符合模型的輸入特征,接下來(lái)調(diào)整一系列的參考,讓模型更加擬合真實(shí)值。最后即是分類結(jié)果預(yù)測(cè)。
圖3文章整體結(jié)構(gòu)
Fig.3Overallstructureofarticles
本次論文中用到的卷積神經(jīng)網(wǎng)絡(luò)的模型是GoogleNet的InceptionV3。網(wǎng)絡(luò)的結(jié)果如圖4所示。由圖4可見(jiàn),網(wǎng)絡(luò)是從上至下運(yùn)行的,上一個(gè)的輸出作為下一個(gè)的輸入[4]。經(jīng)過(guò)預(yù)處理模型的輸入層大小為64641。使用64個(gè)55的卷積核對(duì)輸入做卷積,然后再使用大小為33、步幅為3的池化。此時(shí)得到圖像的輸出大小為202064。接下來(lái),圖像要經(jīng)過(guò)7個(gè)inception單元,經(jīng)過(guò)每個(gè)單元處理后圖像的特征逐漸增加,運(yùn)行得到600個(gè)33圖像,將這33600的圖像展開(kāi)為一維圖像,同時(shí)又連接一個(gè)大小為4 096的全連接層,最后再連接一個(gè)Softmax回歸。
本文的所有試驗(yàn)過(guò)程都是在tensorflow平臺(tái)上運(yùn)行的,Adam算法的學(xué)習(xí)速率設(shè)置為0.001。在模型訓(xùn)練過(guò)程中,研究將數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,通過(guò)不斷的迭代和參數(shù)調(diào)整,最終則在訓(xùn)練集上獲得了95.1%的準(zhǔn)確率,在后面的測(cè)試集上又獲得了83.5%的準(zhǔn)確率。同以往其它模型對(duì)嬰兒大便圖像的識(shí)別比較后可知,本文提出的模型方法獲得了最高的準(zhǔn)確率。本文模型與其它模型識(shí)別準(zhǔn)確率的差別對(duì)比詳見(jiàn)表1。
表1 與其它模型相比較結(jié)果
本次研究提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)中GoogleNet InceptionV3模型來(lái)識(shí)別嬰兒大便圖像的方法,從而對(duì)早期嬰兒膽道閉鎖疾病進(jìn)行篩查,獲得了不錯(cuò)的效果。在此過(guò)程中,卻仍有亟待改進(jìn)之處。首先,數(shù)據(jù)集的數(shù)目不足可能會(huì)影響到實(shí)驗(yàn)結(jié)果的準(zhǔn)確性。再就是,未能在不同的卷積神經(jīng)網(wǎng)絡(luò)的模型下對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試。在后續(xù)的工作中將進(jìn)一步獲得更多的數(shù)據(jù)來(lái)保障訓(xùn)練需要,而且也將選用不同的卷積神經(jīng)網(wǎng)絡(luò)模型來(lái)對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,如變積分自編碼(VAE)、VGG16、殘差網(wǎng)絡(luò)(Resnet)。
圖4 卷積網(wǎng)絡(luò)模型結(jié)構(gòu)
本文基于卷積神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別嬰兒的大便圖像,從而對(duì)膽道閉鎖進(jìn)行早期的篩查。通過(guò)GoogleNet網(wǎng)絡(luò)InceptionV3模型來(lái)訓(xùn)練數(shù)據(jù),對(duì)模型的參數(shù)進(jìn)行適當(dāng)?shù)男薷?,觀察擬合帶的程度,從而確定最佳的模型參數(shù)。相較之前對(duì)大便圖像的識(shí)別分類,本文提出的方法獲得了較高的準(zhǔn)確率。卷積神經(jīng)網(wǎng)絡(luò)在圖像的分類識(shí)別領(lǐng)域有很大的優(yōu)勢(shì),利用卷積神經(jīng)網(wǎng)絡(luò)中的模型來(lái)對(duì)嬰兒大便圖像進(jìn)行識(shí)別分類,有助于患兒早期膽道閉鎖的診斷,提高了患病嬰兒的存活率[5]。