徐 偉,鄭 威,錢 煒,劉 健
(江蘇科技大學(xué) 電子信息學(xué)院,江蘇 鎮(zhèn)江 212000)
深度學(xué)習(xí)在過(guò)去的十余年得到快速發(fā)展,受到了越來(lái)越多研究學(xué)者的關(guān)注。深度學(xué)習(xí)最大的特點(diǎn)是善于從原始數(shù)據(jù)中提取高級(jí)的抽象特征,具有良好的泛化能力,因此被廣泛應(yīng)用于與特征提取相關(guān)的科學(xué)研究領(lǐng)域。在傳統(tǒng)的機(jī)器學(xué)習(xí)算法中,需要大量的工程領(lǐng)域相關(guān)知識(shí),存在的問(wèn)題是設(shè)計(jì)特征提取的方法受到限制,而深度學(xué)習(xí)的誕生有效地解決了機(jī)器學(xué)習(xí)存在的不足[1]。目前訓(xùn)練數(shù)據(jù)的快速增長(zhǎng)以及計(jì)算機(jī)芯片處理數(shù)據(jù)能力的增強(qiáng),使得深度學(xué)習(xí)在自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)領(lǐng)域應(yīng)用前景廣闊,促進(jìn)了人工智能領(lǐng)域的發(fā)展。深度學(xué)習(xí)的模型主要有卷積神經(jīng)網(wǎng)絡(luò)、深度置信網(wǎng)絡(luò)和自動(dòng)編碼器[2]。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的一種經(jīng)典且應(yīng)用廣泛的模型結(jié)構(gòu),它是由機(jī)器學(xué)習(xí)中的人工神經(jīng)網(wǎng)絡(luò)發(fā)展而來(lái)。近年來(lái),卷積神經(jīng)網(wǎng)絡(luò)發(fā)展迅速,已經(jīng)成為深度學(xué)習(xí)研究領(lǐng)域中的熱點(diǎn)。1962年,生理學(xué)家Hubel和Wiesel通過(guò)對(duì)貓腦視覺(jué)皮層的研究,發(fā)現(xiàn)生物的視覺(jué)皮層細(xì)胞只對(duì)輸入圖像的局部區(qū)域很敏感,首次提出了感受野的概念。1980年,F(xiàn)ukushima根據(jù)Hubel和Wiesel的層級(jí)模型提出了與之類似的結(jié)構(gòu)—神經(jīng)認(rèn)知機(jī)。1998年,Yann LeCun及其合作人員構(gòu)建了一個(gè)典型的卷積神經(jīng)網(wǎng)絡(luò)模型—LeNet-5,并且在手寫數(shù)字字符識(shí)別中取得成功[3]。經(jīng)過(guò)多年的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)從最初的手寫數(shù)字字符識(shí)別應(yīng)用,逐漸擴(kuò)展到其他更復(fù)雜的領(lǐng)域,例如人臉識(shí)別[4]、手勢(shì)動(dòng)作識(shí)別[5]、交通標(biāo)志識(shí)別[6];再應(yīng)用到熱門的人工智能領(lǐng)域,例如情感分析[7]、語(yǔ)音識(shí)別[8]、心電信號(hào)分類和檢測(cè)[9]等。
非侵入性胎兒心電信號(hào)是檢測(cè)胎心率的研究重點(diǎn),研究胎心率的重要指標(biāo)就是檢測(cè)胎兒心電周期中的QRS波群。文中在研究信號(hào)與信息處理的基礎(chǔ)上,針對(duì)從孕婦腹璧信號(hào)里提取胎兒心電信號(hào)的困難性,提出采用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)方法結(jié)合短時(shí)傅里葉變換檢測(cè)胎兒QRS波群。該方法突破了傳統(tǒng)胎心率檢測(cè)時(shí)需要將母體與胎兒心電信號(hào)分離的限制,可以在不去除母體心電信號(hào)的情況下直接檢測(cè)胎兒QRS波群,最終獲得可靠的胎兒QRS波群檢測(cè)性能。
卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)主要有輸入層、卷積層、池化層(降采樣層)、全連接層和輸出層。卷積層和池化層會(huì)設(shè)置多個(gè)交替連接,互相配合逐層進(jìn)行特征提取,最后通過(guò)全連接層傳遞給輸出層。
1.1.1 卷積層
卷積層是卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的核心,它由多個(gè)特征面組成,其作用是特征提取。卷積層通過(guò)卷積核以固定的滑動(dòng)步長(zhǎng)對(duì)輸入信號(hào)進(jìn)行特征提取,第一個(gè)卷積層提取的是初級(jí)特征例如線條、邊緣、輪廓,高層的提取更高級(jí)的抽象特征[10]。卷積層的特點(diǎn)是局部連接和權(quán)值共享。局部連接指的是卷積層中的神經(jīng)元與前一層輸入單元的部分神經(jīng)元連接,這部分區(qū)域稱為該神經(jīng)元的局部感受域。輸入特征面采用一組相同的權(quán)值與輸出特征面進(jìn)行局部連接,這就是權(quán)值共享,作用是通過(guò)減少網(wǎng)絡(luò)中訓(xùn)練參數(shù)使網(wǎng)絡(luò)模型的復(fù)雜度降低,也可以達(dá)到減輕網(wǎng)絡(luò)過(guò)擬合的目的。
卷積核是卷積層進(jìn)行卷積操作的重要部分,其本質(zhì)為權(quán)值矩陣[11],卷積核以固定的滑動(dòng)步長(zhǎng)在前一層輸入單元上移動(dòng),然后與局部感受域上的值進(jìn)行卷積操作,最后得到輸入單元的特征圖。卷積核的參數(shù)包括個(gè)數(shù)、大小、滑動(dòng)步長(zhǎng)和零填充大小。在實(shí)際應(yīng)用中,往往需要多個(gè)卷積核得到多個(gè)特征面。卷積核進(jìn)行卷積運(yùn)算的表達(dá)式為:
(1)
f(x)=max(0,x)
(2)
1.1.2 池化層
池化層也稱為降采樣層或特征映射層,和卷積層一樣是由多個(gè)特征面組成,但每層池化的特征面唯一對(duì)應(yīng)卷積層的輸出特征面,特征面的個(gè)數(shù)不會(huì)發(fā)生改變。池化層也采用局部連接且神經(jīng)元不同時(shí)局部感受域不會(huì)出現(xiàn)重疊。因?yàn)榫矸e層的輸出是高維特征,直接使用進(jìn)行分類會(huì)增加計(jì)算量和復(fù)雜程度。所以池化層的作用是降低卷積層輸出特征的維數(shù),得到的特征具有空間不變性,相當(dāng)于二次特征提取。常用的池化方法包括最大池化法、均值池化法和隨機(jī)池化法[12]。池化表達(dá)式為:
(3)
1.1.3 全連接層
在多個(gè)卷積層和池化層交替連接后會(huì)連接一個(gè)或多個(gè)全連接層,全連接層的作用是整合卷積層和池化層的特征得到全局特征進(jìn)行分類[13]。全連接層和多層感知器相似,其中每一個(gè)神經(jīng)元與其前一層進(jìn)行全連接,同一層內(nèi)神經(jīng)元相互不連接。全連接層的輸出值被傳遞給Softmax分類器,經(jīng)過(guò)Softmax分類器后得到一系列的概率值,這些概率值相加為1。輸出的概率值個(gè)數(shù)對(duì)應(yīng)網(wǎng)絡(luò)訓(xùn)練輸入的類別個(gè)數(shù),測(cè)試時(shí)輸入被檢測(cè)為概率值最大的類別。Softmax分類器的數(shù)學(xué)表達(dá)式為:
(4)
其中,N為輸入矢量x的長(zhǎng)度。
非平穩(wěn)信號(hào)例如氣溫、血壓、心電信號(hào)等,它們的統(tǒng)計(jì)特征隨時(shí)間變化發(fā)生改變。短時(shí)傅里葉變換(STFT)是分析非平穩(wěn)信號(hào)不可或缺的工具,它的主要思想是將非平穩(wěn)信號(hào)進(jìn)行加窗處理,然后再進(jìn)行傅里葉變換,得到信號(hào)在窗函數(shù)一個(gè)窄區(qū)間內(nèi)近似平穩(wěn)信號(hào)的頻譜,窗函數(shù)可以根據(jù)時(shí)間變化進(jìn)行平移,通過(guò)窗函數(shù)可以得到任意時(shí)間段的頻譜圖,在時(shí)域上實(shí)現(xiàn)信號(hào)的局部化[14]。假設(shè)非平穩(wěn)信號(hào)為x(t),窗函數(shù)為s(t),則非平穩(wěn)信號(hào)的短時(shí)傅里葉變換的數(shù)學(xué)表達(dá)式為:
(5)
其中,*表示復(fù)數(shù)共軛。
實(shí)驗(yàn)中使用的數(shù)據(jù)集是PhysioNet/CinC競(jìng)賽中提供的數(shù)據(jù)集Challenge 2013 Training Set A。set-a組數(shù)據(jù)集包含七十五條腹部心電圖(AECG)記錄(a01-a75),每條持續(xù)1分鐘。每條記錄包括四個(gè)通道,每個(gè)通道的采樣頻率為1 000 Hz,分辨率為16位。文獻(xiàn)[15]通過(guò)研究發(fā)現(xiàn)有七條記錄(a33、a38、a47、a52、a54、a71和a74)由于參考注釋不準(zhǔn)確,本實(shí)驗(yàn)將不使用。實(shí)驗(yàn)將前15條記錄用于卷積神經(jīng)網(wǎng)絡(luò)測(cè)試,其他都用于網(wǎng)絡(luò)訓(xùn)練,實(shí)驗(yàn)保證訓(xùn)練和測(cè)試之間沒(méi)有相同的數(shù)據(jù)集。
信號(hào)質(zhì)量評(píng)估在檢測(cè)胎兒QRS波群中起到重要作用,文中采用樣本熵(SampEn)方法對(duì)心電信號(hào)進(jìn)行分析,確定數(shù)據(jù)集中是否含有過(guò)多的噪聲成分。樣本熵公式為:
(6)
其中,m表示向量序列的維數(shù),r表示閾值,N表示數(shù)據(jù)的長(zhǎng)度。在本實(shí)驗(yàn)中,向量序列的維數(shù)設(shè)置為2,閾值設(shè)定為1.5,數(shù)據(jù)長(zhǎng)度設(shè)置為500。
通過(guò)將四個(gè)通道的樣本熵值與閾值進(jìn)行比較,小于1.5的可判斷為良好的心電信號(hào),并選擇樣本熵值最小的通道在實(shí)驗(yàn)中使用。圖1顯示了來(lái)自set-a組a61號(hào)數(shù)據(jù)的10秒信號(hào)質(zhì)量評(píng)估示例。
圖1 set-a組a61號(hào)數(shù)據(jù)10秒信號(hào)質(zhì)量評(píng)估
非侵入性的胎兒心電信號(hào)的主要噪聲來(lái)源于電力線干擾和基線漂移。首先,使用陷波濾波器來(lái)消除電力線干擾噪聲。其次,使用基于小波變換的低通濾波器去除基線漂移干擾。圖2和圖3顯示了去除兩種噪聲的對(duì)比。
圖2 濾除電力線干擾
圖3 濾除基線漂移干擾
本實(shí)驗(yàn)的QRS波群檢測(cè)研究實(shí)際上是一項(xiàng)分類研究,預(yù)處理后的心電信號(hào)以100毫秒進(jìn)行分段,分段后的胎兒心電信號(hào)通過(guò)短時(shí)傅里葉變換轉(zhuǎn)化成二維時(shí)頻圖,再通過(guò)卷積神經(jīng)網(wǎng)絡(luò)被檢測(cè)成兩類:有QRS波群和沒(méi)有QRS波群。根據(jù)PhysioNet提供的參考注釋,每100毫秒的心電信號(hào)被參考注釋標(biāo)記的分類為胎兒QRS波群,未被參考注釋標(biāo)記的分類為非胎兒QRS波群針對(duì)本實(shí)驗(yàn)分段后的心電信號(hào),計(jì)算短時(shí)傅里葉變換采用Hanning窗,窗口大小為64,將每100個(gè)采樣點(diǎn)的心電信號(hào)進(jìn)行短時(shí)傅里葉變換,最終轉(zhuǎn)化為33×37的二維時(shí)頻圖。
圖4顯示了文中設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)??傮w來(lái)看,網(wǎng)絡(luò)結(jié)構(gòu)包含三個(gè)卷積塊和一個(gè)密集層。第一個(gè)卷積塊包含卷積層、批量標(biāo)準(zhǔn)化層和激活功能層,批量標(biāo)準(zhǔn)化的使用使卷積神經(jīng)網(wǎng)絡(luò)模型更容易優(yōu)化和處理。第二個(gè)卷積塊包含卷積層、批量標(biāo)準(zhǔn)化層、激活功能層和最大池化層,在卷積層和池化層之間應(yīng)用Dropout技術(shù)以防止網(wǎng)絡(luò)結(jié)構(gòu)出現(xiàn)過(guò)擬合現(xiàn)象。第三個(gè)卷積塊和第二個(gè)類似,以構(gòu)成深度卷積神經(jīng)網(wǎng)絡(luò)模型。密集層包含兩個(gè)全連接層,最終通過(guò)Softmax產(chǎn)生了兩類的輸出。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的具體參數(shù)設(shè)置如表1所示。
圖4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
表1 卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置
2.6.1 損失、準(zhǔn)確率和訓(xùn)練次數(shù)的關(guān)系
由圖5可以看出,準(zhǔn)確率隨訓(xùn)練次數(shù)迅速上升,最終訓(xùn)練300次達(dá)到77%左右。影響準(zhǔn)確率的主要因素是母體心電信號(hào)比胎兒強(qiáng)以及存在高頻肌電噪聲干擾,致使卷積神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值優(yōu)化陷入局部最優(yōu),從而對(duì)后續(xù)分類性能造成影響。實(shí)驗(yàn)中損失函數(shù)選擇交叉熵函數(shù)作為優(yōu)化目標(biāo),由圖6可以看出損失先持續(xù)下降,然后出現(xiàn)波動(dòng),訓(xùn)練結(jié)束時(shí)穩(wěn)定在0.3左右。
圖5 訓(xùn)練次數(shù)和準(zhǔn)確率變化的關(guān)系
圖6 訓(xùn)練次數(shù)和損失變化的關(guān)系
2.6.2 測(cè)試結(jié)果評(píng)價(jià)指標(biāo)
實(shí)驗(yàn)評(píng)價(jià)檢測(cè)方法有效性的三個(gè)指標(biāo)分別是靈敏度(Sen)、陽(yáng)性預(yù)測(cè)值(PPV)和準(zhǔn)確率(Acc),分別通過(guò)下式計(jì)算:
(7)
(8)
(9)
其中,TP表示胎兒QRS波群被正確檢測(cè)為胎兒QRS波群的樣本,F(xiàn)P表示非胎兒QRS波群被錯(cuò)誤檢測(cè)為胎兒QRS波群的樣本,F(xiàn)N表示胎兒QRS波群被錯(cuò)誤檢測(cè)為非胎兒QRS波群的樣本,TN表示非胎兒QRS波群被正確檢測(cè)為非胎兒QRS波群的樣本。
實(shí)驗(yàn)測(cè)試結(jié)果如表2所示,QRS波群檢測(cè)的靈敏度、陽(yáng)性預(yù)測(cè)值和準(zhǔn)確率分別為86.98%、88.35%和78.03%。影響準(zhǔn)確率的主要原因有:數(shù)據(jù)存在高頻肌電干擾,其形態(tài)與胎兒QRS波群相似,導(dǎo)致高頻肌電噪聲被錯(cuò)誤識(shí)別成胎兒QRS波群;數(shù)據(jù)集中存在10%左右的胎兒QRS波群與母體重合,最終未被正確識(shí)別。
表2 針對(duì)15條數(shù)據(jù)檢測(cè)結(jié)果統(tǒng)計(jì)
2.7.1 不同激活函數(shù)對(duì)比
激活函數(shù)會(huì)影響卷積神經(jīng)網(wǎng)絡(luò)的分類性能,文中進(jìn)一步研究了不同激活函數(shù)對(duì)胎兒QRS波群檢測(cè)性能的影響。測(cè)試了三種不同的激活函數(shù)分別是Sigmoid、Tanh和ReLU,分類準(zhǔn)確率分別為62.47%、70.28%和78.03%。從實(shí)驗(yàn)結(jié)果可以得出ReLU的檢測(cè)效果優(yōu)于其他兩種激活函數(shù)。原因是在誤差反向傳播過(guò)程中計(jì)算梯度時(shí),Sigmoid和Tanh計(jì)算導(dǎo)函數(shù)復(fù)雜,而ReLU的導(dǎo)函數(shù)固定為1;Sigmoid和Tanh存在飽和區(qū),容易出現(xiàn)梯度消失的現(xiàn)象;ReLU將網(wǎng)絡(luò)中部分神經(jīng)元輸出置0,增加網(wǎng)絡(luò)稀疏度,減少過(guò)擬合現(xiàn)象。
2.7.2 不同信號(hào)長(zhǎng)度分段對(duì)比
根據(jù)PhysioNet提供的參考注釋顯示,一個(gè)胎兒QRS波群時(shí)限為50毫秒左右,為了覆蓋一個(gè)完整的心跳周期每段信號(hào)至少50毫秒。文中進(jìn)一步研究了不同信號(hào)長(zhǎng)度對(duì)胎兒QRS波群檢測(cè)性能的影響,即50毫秒、100毫秒、150毫秒和200毫秒,研究結(jié)果顯示準(zhǔn)確率分別為76.26%、78.03%、75.87%和68.27%。從實(shí)驗(yàn)結(jié)果可以得出分段為100毫秒時(shí)檢測(cè)準(zhǔn)確率最高。分段長(zhǎng)度太短不能包含完整心跳周期,太長(zhǎng)含有冗余信息。分段長(zhǎng)度不能超過(guò)200毫秒,否則胎兒和母體QRS波群會(huì)出現(xiàn)在同一段信號(hào)中,失去分類意義。
為了驗(yàn)證卷積神經(jīng)網(wǎng)絡(luò)的有效性,文中選取支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)做不同方法對(duì)比,對(duì)比結(jié)果見(jiàn)表3。支持向量機(jī)作為機(jī)器學(xué)習(xí)中的傳統(tǒng)分類算法,通過(guò)內(nèi)核函數(shù)映射至高維特征空間實(shí)現(xiàn)非線性分類;文中采用高斯徑向基函數(shù)作為核函數(shù),分類準(zhǔn)確率達(dá)到70.65%。BP神經(jīng)網(wǎng)絡(luò)作為人工神經(jīng)網(wǎng)絡(luò)中的經(jīng)典算法,非線性映射能力強(qiáng)大;文中采用了兩個(gè)隱含層以及非線性激活函數(shù)Sigmoid,分類準(zhǔn)確率達(dá)到75.21%。最終對(duì)比三種分類器的準(zhǔn)確率,實(shí)驗(yàn)結(jié)果表明卷積神經(jīng)網(wǎng)絡(luò)具有更好的分類能力,可以有效檢測(cè)胎兒QRS波群。
表3 與其他方法對(duì)比
文中成功將二維卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于胎心率檢測(cè)課題中,結(jié)合了批量標(biāo)準(zhǔn)化和Dropout技術(shù),提高了卷積神經(jīng)網(wǎng)絡(luò)性能。由于卷積神經(jīng)網(wǎng)絡(luò)具有局部連接和權(quán)值共享等特性,能夠通過(guò)有監(jiān)督訓(xùn)練自動(dòng)獲取胎兒QRS波群特征,而且特征對(duì)微小平移具備不變性,從而能夠解決胎心率檢測(cè)任務(wù)。最終在不去除母體心電信號(hào)的基礎(chǔ)上使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行檢測(cè),經(jīng)過(guò)數(shù)據(jù)集的測(cè)試分別得到了較高的靈敏度、陽(yáng)性預(yù)測(cè)值和準(zhǔn)確率。但是由于心電信號(hào)的一維性,導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)能夠提取的時(shí)頻特征較少,最終在測(cè)試時(shí)出現(xiàn)誤差,分類結(jié)果受到局限。在接下來(lái)研究中一方面應(yīng)提高對(duì)數(shù)據(jù)集的處理,例如研究如何去除高頻肌電噪聲的干擾;另一方面繼續(xù)對(duì)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,發(fā)揮卷積神經(jīng)網(wǎng)絡(luò)對(duì)大數(shù)據(jù)處理的優(yōu)勢(shì)。