圣文順 孫艷文
摘? 要:隨著醫(yī)學(xué)成像技術(shù)的不斷發(fā)展,病理識別在醫(yī)學(xué)診斷過程中的作用越來越重要。人工智能領(lǐng)域的機器學(xué)習(xí)可以幫助完成醫(yī)學(xué)圖像診斷的自動識別,數(shù)字化地輔助醫(yī)學(xué)診斷過程,同時降低醫(yī)務(wù)工作者的工作量。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是近年發(fā)展起來的一種非常有效的機器學(xué)習(xí)方法,屬于深度學(xué)習(xí)的范疇,它能夠完整地模擬人類的圖像識別過程,并且已經(jīng)在圖像識別領(lǐng)域取得了優(yōu)異的成績。本文將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于病理圖像的識別中,同時對病理圖片進行了采集、整理和智能學(xué)習(xí),完成并分析了算法對比實驗,最終實現(xiàn)了對病理圖像的優(yōu)化識別,提高了病理圖像的識別率,驗證了算法的有效性。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);病理圖像;深度學(xué)習(xí);醫(yī)學(xué)成像
中圖分類號:TP391.4? ? ?文獻標識碼:A
Application of Convolutional Neural Network in Image Recognition
SHENG Wenshun,SUN Yanwen
(Pujiang Institute,Nanjing Tech University,Nanjing 211222,China)
Abstract:With the continuous development of medical imaging technology,pathological identification plays an increasingly important role in the process of medical diagnosis.Machine learning in the field of artificial intelligence can help complete the automatic recognition of medical image diagnosis,digitally assisting the process of medical diagnosis,and reducing the workload of medical workers.Convolutional neural network (CNN) is a very effective machine learning method developed in recent years.It belongs to the category of deep learning.It can completely simulate the human image recognition process,and has achieved excellent results in the field of image recognition.In this paper,the convolutional neural network is applied to the recognition of pathological images.At the same time,the pathological images are collected,sorted and intelligently learned.The comparative experiments of the algorithms are completed and analyzed.Finally,the optimal recognition of pathological images is realized,the recognition rate of pathological images is improved,and the validity of the algorithm is verified.
Keywords:convolution neural network;pathological image;deep learning;medical imaging
1? ?引言(Introduction)
圖像識別技術(shù)是人工智能的一個重要領(lǐng)域。在導(dǎo)航、地圖與地形配準、自然資源分析、天氣預(yù)報、環(huán)境監(jiān)測、生理病變研究等許多領(lǐng)域有著重要的研究和應(yīng)用價值。
醫(yī)生以前通過自己的肉眼來觀察病人的病理圖像,消耗人力、財力,再加上外界因素的影響,判斷的準確性也會受到影響。隨著計算機的數(shù)據(jù)吞吐能力與計算能力不斷增長,科研工作者對人類視覺模式的研究不斷深入。依靠高效的算法設(shè)計,借助大量數(shù)據(jù)進行學(xué)習(xí)訓(xùn)練,因此將機器學(xué)習(xí)算法與病理圖像結(jié)合成為可能。自從深度學(xué)習(xí)算法的提出后,給圖像識別帶來了新活力。卷積神經(jīng)網(wǎng)絡(luò)的研究及其在圖像識別領(lǐng)域的應(yīng)用,就是將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于病理圖像識別[1]中,以期望能夠通過機器學(xué)習(xí)的方式自動化識別,從而減少病理醫(yī)生的任務(wù)量,同時為臨床醫(yī)生提供更加客觀的分析結(jié)果。
2? ?相關(guān)理論(Correlated theory)
在圖像識別中,對圖像的處理尤為關(guān)鍵。采用深度學(xué)習(xí)算法[2],可以減少人為因素的影響。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)作為深度學(xué)習(xí)算法的代表之一,結(jié)構(gòu)較為簡單,適用性比較強。在這幾年的發(fā)展中,應(yīng)用范圍較廣,尤其在圖像處理和模式識別中。
圖像識別的常用方法有:貝葉斯分類法、模板匹配法、核方法等。這幾種方法在處理圖像時會帶來不同的麻煩。自引進深度學(xué)習(xí)算法之后,使復(fù)雜的特征提取工作簡單化、抽象化,具有學(xué)習(xí)速度快、耗時小、識別率高的優(yōu)點。
3? ?卷積神經(jīng)網(wǎng)絡(luò)原理(CNN principle)
卷積神經(jīng)網(wǎng)絡(luò)是對貓的視覺皮層電生理研究啟發(fā)而開始的一個研究,由Hubel和Wiesel最早在實驗中發(fā)現(xiàn)。這幾年來,卷積神經(jīng)網(wǎng)絡(luò)作為最重要的網(wǎng)絡(luò)模型之一,已經(jīng)在多個領(lǐng)域被廣泛應(yīng)用,比如光學(xué)字符識別、人臉識別、圖像分類、身份識別、交通標志識別、飛行器圖像識別甚至圖譜特征分析等。
相對于淺層網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)屬于深層結(jié)構(gòu),其基本組成包括輸入層、卷積層、池化層、全連接層,其中卷積層、池化層、全連接層可以是多個,如圖1所示。
3.1? ?輸入層
卷積神經(jīng)網(wǎng)絡(luò)的輸入層可以直接處理多維數(shù)據(jù)。它的主要任務(wù)是讀取圖像信息,該層的神經(jīng)元個數(shù)與圖像的維度[3]緊密相關(guān)。與其他神經(jīng)網(wǎng)絡(luò)算法類似,卷積神經(jīng)網(wǎng)絡(luò)的輸入特征需要進行標準化處理。輸入特征的標準化可以提高算法的運行效率和學(xué)習(xí)表現(xiàn)。
3.2? ?卷積層
卷積層在卷積神經(jīng)網(wǎng)絡(luò)中用于特征提取。由于卷積神經(jīng)網(wǎng)絡(luò)是通過每次對圖像中的一個特征首先進行局部感知,然后更高層次地對局部特征進行綜合的操作,從而得到想要的全局信息。卷積神經(jīng)網(wǎng)絡(luò)中的卷積層是由多個卷積單元組成的,目的就是為了實現(xiàn)卷積操作。
同時為了提高計算效率,卷積神經(jīng)網(wǎng)絡(luò)引入了局部感知和參數(shù)共享兩個操作。
(1)局部感知
局部感知就是網(wǎng)絡(luò)的部分連通。每個神經(jīng)元只與上一層的部分神經(jīng)元相連,只感知局部,而不是整幅圖像。局部像素關(guān)系密切,較遠像素相關(guān)性弱。因此只需要局部感知,在更高層將局部信息綜合起來就得到了全局的信息。
(2)權(quán)值共享
權(quán)值共享[5]即是從一個局部區(qū)域?qū)W習(xí)到的信息,應(yīng)用到圖像的其他地方去。即用一個相同的卷積核去卷積整幅圖像,相當于對圖像做一個全圖濾波。一個卷積核對應(yīng)的特征比如邊緣,那么用該卷積核去對圖像做全圖濾波,即使將圖像各個位置的邊緣都濾出來。不同的特征靠不同的卷積核實現(xiàn)。
3.3? ?池化層
對輸入的特征圖進行壓縮,一方面使特征圖變小,簡化網(wǎng)絡(luò)計算復(fù)雜度;一方面進行特征壓縮,提取主要特征。在某些方面,比如:平移、旋轉(zhuǎn)、尺度,可以保持某種特征不變。常用的有mean-pooling和max-pooling。池化層的輸入來源于卷積層,該操作即可減少數(shù)據(jù)量,同時也能保留有效信息,減少計算時間。
例如對一小塊取最大值,假設(shè)pooling的窗大小為2×2的,如果對不重疊的4個2×2區(qū)域分別max-pooling,則運算過程如圖3所示。
3.4? ?全連接層
在CNN結(jié)構(gòu)中,經(jīng)過多個卷積層和池化層后,連接著1個或1個以上的全鏈接層。全連接層中的每個神經(jīng)元與其前一層的所有神經(jīng)元進行全連接。全連接層可以整合卷積層或者池化層具有類別區(qū)分性的局部信息。全連接層是連接所有特征,將輸出值送給分類器[6](如softmax分類器),如圖4所示。
其中,x1、x2、x3為全連接層的輸入,a1、a2、a3為輸出,則全連接層的核心運算就是矩陣向量乘積:
a1=W11*x1+W12*x2+W13*x3+b1? ? ? ? ?(2)
a2=W21*x1+W22*x2+W23*x3+b2? ? ? ? ?(3)
a3=W31*x1+W32*x2+W33*x3+b3? ? ? ? ?(4)
4? ?實驗數(shù)據(jù)分析(Experimental data analysis)
4.1? ?實驗數(shù)據(jù)
在進行此次實驗前,為了有一個標準的訓(xùn)練及檢測數(shù)據(jù)集,且本實驗的應(yīng)用背景是將深度學(xué)習(xí)算法應(yīng)用于病理醫(yī)學(xué)中,所以提前在醫(yī)院完成了采集甲狀腺淋巴結(jié)轉(zhuǎn)移癌癥病理樣本工作。全部圖像為全掃描文件,全部數(shù)據(jù)都為顯微鏡下40倍數(shù)據(jù),并且將樣本分為正常和癌變細胞兩類。如圖5和圖6所示。
本文運用卷積神經(jīng)網(wǎng)絡(luò)的算法,實現(xiàn)圖像的識別。在處理過程中,通過讀取圖片、樣本隨機分配、網(wǎng)絡(luò)設(shè)計、訓(xùn)練和驗證四個步驟實現(xiàn)該算法。
pool4=tf.layers.max_pooling2d(inputs=conv4,pool_size=[2,2],strides=2)
re1=tf.reshape(pool4,[-1,6*6*128])
dense1=tf.layers.dense(inputs=re1,units=1024,activation=tf.nn.relu,
kernel_initializer=tf.truncated_normal_initializer(stddev=0.01),
kernel_regularizer=tf.contrib.layers.l2_regularizer(0.003))
dense2=tf.layers.dense(inputs=dense1,units=512,activation=tf.nn.relu,
kernel_initializer=tf.truncated_normal_initializer(stddev=0.01),kernel_regularizer=tf.contrib.layers.l2_regularizer(0.003))
logits=tf.layers.dense(inputs=dense2,units=2,activation=None,
kernel_initializer=tf.truncated_normal_initializer(stddev=0.01),kernel_regularizer=tf.contrib.layers.l2_regularizer(0.003))
4.2? ?數(shù)據(jù)結(jié)果與分析
本次實驗的實驗環(huán)境為Ubuntu系統(tǒng)[7]+TensorFlow+
python3.6+Anaconda+spyder,為了體現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)的有效性,所以引用了同為深度學(xué)習(xí)算法的深度置信網(wǎng)絡(luò)算法(DBN)進行了對比試驗。在實驗中,兩種算法的層數(shù)一致,并分別做了10次實驗取平均值作為實驗結(jié)果,如表1所示。
通過對比實驗,可以看出卷積神經(jīng)網(wǎng)絡(luò)的識別性能高于深度置信網(wǎng)絡(luò)算法,顯示了算法的優(yōu)越性。因此采用卷積神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于病理醫(yī)學(xué)的圖像處理中。
5? ?結(jié)論(Conclusion)
在此次實驗中,運用卷積神經(jīng)網(wǎng)絡(luò)在圖像中的識別功能,對病理醫(yī)學(xué)圖像進行有效的處理。通過研究表明,只要通過大量的數(shù)據(jù)學(xué)習(xí)訓(xùn)練,卷積神經(jīng)網(wǎng)絡(luò)對病理圖像的識別效率高,準確度高。
本文針對病理醫(yī)學(xué)圖像處理效率過低,采用了卷積神經(jīng)網(wǎng)絡(luò)進行病理特征的判斷,且準確率與效率高于傳統(tǒng)方法的平均準確率和平均效率。本文對卷積神經(jīng)網(wǎng)絡(luò)的原理進行了深入的研究,對網(wǎng)絡(luò)的參數(shù)進行了深刻的學(xué)習(xí),并將其應(yīng)用于甲狀腺的病理圖像識別中。由于時間有限,本文只是完成了卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)研究,后續(xù)期望能夠?qū)矸e神經(jīng)網(wǎng)絡(luò)進行改進,并能夠進一步提高網(wǎng)絡(luò)的識別率。
參考文獻(References)
[1] 薛迪秀.基于卷積神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像癌變識別研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2017.
[2] 蔣濤.深度學(xué)習(xí)在醫(yī)學(xué)圖像分析中的應(yīng)用[D].成都:電子科技大學(xué),2017.
[3] 魏存超.基于卷積神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像分類的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2017.
[4] H Chen,Q Dou,X Wang.Mitosis Detection in Breast Cancer Histology Images via Deep Cascaded Networks[C].Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence 2016:1160-1166.
[5] Janowczyk A,Doyle S,Gilmore H,et al.A resolution adaptive deep hierarchical learning scheme applied to nuclear segmentation of digital pathology images[J].Computer Methods in Biomechanics and Biomedical Engineering:Imaging & Visualization,2016:1-7.
[6] Janowczyk A,Madabhushi A.Deep learning for digital pathology image analysis:A comprehensive tutorial with selected use cases[J].Journal of Pathology Informatics,2016,7(1):29.
[7] 李雪燕.緊耦合Ubuntu系統(tǒng)的衛(wèi)星導(dǎo)航接收機設(shè)計[D].石家莊:河北科技大學(xué),2016.