穆建秋
(貴州師范大學(xué)大數(shù)據(jù)與計(jì)算機(jī)科學(xué)學(xué)院,貴陽550000)
根據(jù)世界衛(wèi)生組織(WHO)報(bào)道[1],全世界約有5000 萬人患有癲癇癥。癲癇是一種由大腦局部放電異常并向周圍擴(kuò)散引起的慢性腦部疾病,具有反復(fù)性和突發(fā)性。癲癇病的臨床表現(xiàn)具有多樣性,不同患者的癲癇發(fā)作持續(xù)時(shí)間和表現(xiàn)各有不同。目前,近30%的患者患有醫(yī)學(xué)上的頑固性癲癇,他們不能徹底避免癲癇發(fā)作,使用藥物只能減少癲癇發(fā)作的次數(shù),不能徹底根除。腦電信號(hào)(Electroencephalogram,EEG)分析是檢測癲癇發(fā)作的主要方法,經(jīng)驗(yàn)豐富的專家可以從患者腦電信號(hào)的波形判斷患者的大腦狀態(tài),但是這樣的人工觀察存在一些弊端,例如:長時(shí)間觀察腦電信號(hào)會(huì)使人身心疲憊,使得效率變低、誤差變大。此外,醫(yī)生對癲癇患者的診斷往往是通過對腦電信號(hào)的觀察并結(jié)合患者是否出現(xiàn)異常抽搐,進(jìn)而判斷癲癇是否發(fā)作。人工判斷是一個(gè)主觀過程,不同的專家對同一段腦電信號(hào)的診斷可能不同,導(dǎo)致得出的結(jié)果不同。因此,有必要尋找一種實(shí)時(shí)、準(zhǔn)確的自動(dòng)檢測技術(shù)對患者腦電信號(hào)進(jìn)行智能檢測,這對癲癇病患者和患者家屬具有十分重要的現(xiàn)實(shí)意義。
基于腦電信號(hào)的研究方向諸多,例如Manzano[2]使用深度學(xué)對睡眠狀態(tài)分類;Alhagry[3]使用長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)進(jìn)行情感識(shí)別;林偉成[4]對認(rèn)知任務(wù)模式分類;Hajinoroozi[5]預(yù)測司機(jī)睡意和警覺狀態(tài)等等,本文涉及的癲癇檢測只是其中之一。由于以上研究的本質(zhì)都是對腦電信號(hào)進(jìn)行某種處理,所以即便研究方向不同,它們之間的研究方法卻存在著可互用、相似之處。
前期的腦電信號(hào)相關(guān)研究主要使用非深度學(xué)習(xí)模型[4,6-11],而近些年深度學(xué)習(xí)逐漸成為主流,研究人員越來越多的使用深度學(xué)習(xí)進(jìn)行腦電信號(hào)處理。本文將從數(shù)據(jù)預(yù)處理,特征提取、模型選擇和訓(xùn)練對目前基于深度學(xué)習(xí)的腦電信號(hào)處理現(xiàn)狀進(jìn)行介紹:
(1)數(shù)據(jù)預(yù)處理
腦電信號(hào)的數(shù)據(jù)預(yù)處理通常包括下采樣和高通濾波等。Hefron 等人[12]指出使用深度學(xué)習(xí)處理腦電信號(hào)時(shí),需要經(jīng)過“大量的數(shù)據(jù)預(yù)處理”。作者將數(shù)據(jù)下采樣至512Hz、計(jì)算64 個(gè)電極的平均參考值、對數(shù)據(jù)頻率由低到高的進(jìn)行高通濾波。Koelstra[13]在DEAP 數(shù)據(jù)集上進(jìn)行情緒識(shí)別的研究中將腦電信號(hào)下采樣至256Hz,并對頻率為2Hz 的腦電信號(hào)進(jìn)行高通濾波。
有一種技術(shù)叫“偽影處理”[11],用于消除特定類型的噪音,例如眼部和肌肉偽影,YANG 等人[14]認(rèn)為去除偽影對于腦電信號(hào)實(shí)現(xiàn)良好的解碼性能至關(guān)重要。Nolan[15]提出偽影處理需要專家參與,即便沒有專家去除偽影,較少的人為干預(yù)也可以取得更好的結(jié)果,例如Sun 等人[16]利用獨(dú)立成分分析從腦電信號(hào)中分離出眼部活動(dòng)信號(hào)。
(2)特征提取
Zhang 等人[17]提出特征提取是腦電信號(hào)處理中最苛刻的步驟之一,甚至Patanaik 等人[18]的主要目的之一就是通過深度學(xué)習(xí)自動(dòng)學(xué)習(xí)有效特征。除了使用深度學(xué)習(xí)自動(dòng)學(xué)習(xí)有效特征之外,Pouya 等人[19]使用手工設(shè)計(jì)的特征作為深度學(xué)習(xí)模型的輸入,作者將腦電信號(hào)轉(zhuǎn)換成一系列保留拓?fù)浣Y(jié)構(gòu)的多光譜圖像,這樣能夠最大程度的保留原始腦電信號(hào)中的空間和時(shí)間結(jié)構(gòu)。Wulsin[20]在深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)使用未處理過的腦電信號(hào)和手工設(shè)計(jì)的特征作為輸入,比較了兩者在分類和異常檢測任務(wù)上的性能。結(jié)果表明,在深度信念網(wǎng)絡(luò)中使用原始腦電信號(hào)能取得更好的結(jié)果。Tsiouris 等人[21]發(fā)現(xiàn)LSTM 網(wǎng)絡(luò)無法從原始腦電信號(hào)中獲得有效特征,而使用手工設(shè)計(jì)的特征作為模型輸入時(shí)效果良好。田曉彬等人[22]提出了一種融合深度和淺層特征的多視角癲癇檢測算法。該算法首先使用快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)和小波包分解(Wavelet Packet Decomposition,WPD)來獲取腦電信號(hào)頻域和時(shí)頻域的淺層特征;然后使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)學(xué)習(xí)并得到頻域和時(shí)頻域的深層特征。
(3)模型的選擇
在2014 年前,研究人員進(jìn)行腦電信號(hào)處理使用的主要是深度信念網(wǎng)絡(luò)。Wulsin 等人[20]使用深度信念網(wǎng)絡(luò)對臨床腦電信號(hào)進(jìn)行快速分類和異常檢測;Zheng 等人[23]從多通道腦電信號(hào)中提取特征作為模型輸入,使用深度信念網(wǎng)絡(luò)進(jìn)行情感分類;Turner[24]使用深度信念網(wǎng)絡(luò)在高分辨率多通道腦電信號(hào)中進(jìn)行癲癇檢測。
從2015 年開始,由于CNN 在計(jì)算機(jī)視覺上的優(yōu)異表現(xiàn),許多研究人員開始使用CNN 進(jìn)行腦電信號(hào)處理。Yang 等人[25]利用卷積神經(jīng)網(wǎng)絡(luò)和增廣特征對多類運(yùn)動(dòng)圖像進(jìn)行腦電信號(hào)分類;Tsinalis 等人[26]使用CNN對單通道腦電信號(hào)的睡眠階段進(jìn)行自動(dòng)評分;Wei 等人[27]基于多通道腦電信號(hào)使用三維CNN 進(jìn)行癲癇自動(dòng)檢測。同時(shí),由于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Net?work,RNN)在處理時(shí)間序列上的優(yōu)勢,RNN 的使用率也不斷提高。Kuanar 等人[28]使用RNN 來學(xué)習(xí)特征和預(yù)測腦電信號(hào)中記錄的認(rèn)知負(fù)荷水平;Talathi[29]基于RNN 設(shè)計(jì)了一個(gè)針對癲癇發(fā)作前的癲癇檢測系統(tǒng)。
一些文章專門研究了模型層數(shù)對性能的影響。Zhang 等人[30]評估了層數(shù)從2 到10 的模型在基于腦電信號(hào)的精神負(fù)荷分類任務(wù)中的表現(xiàn),結(jié)果表明層數(shù)為7層的模型優(yōu)于層數(shù)較淺的模型(兩層和四層),也優(yōu)于層數(shù)較深的模型(10 層)。Kwak 等人[31]在動(dòng)態(tài)條件下對基于腦電信號(hào)的穩(wěn)態(tài)視覺誘發(fā)電位(Steady State Vi?sual Evoked Potential,SSVEP)進(jìn)行分類,并研究了模型層數(shù)對CNN 性能的影響,文中設(shè)計(jì)了三個(gè)模型,它們分別為:①由兩層CNN 和輸入輸出層組成的模型1;②由兩層CNN 和一層全連接層和輸入輸出層組成的模型2;③兩個(gè)全連接層和輸入輸出層組成的模型3。結(jié)果表明,在提供足夠的訓(xùn)練數(shù)據(jù)(均為已標(biāo)注數(shù)據(jù))時(shí),三種模型都表現(xiàn)出很好的性能,但是在訓(xùn)練數(shù)據(jù)不充分的情況下,層數(shù)較少的模型1 則表現(xiàn)得更加優(yōu)秀。
(4)模型訓(xùn)練
不同的訓(xùn)練方法和超參數(shù)的選擇會(huì)極大的影響模型的性能,本節(jié)主要討論以下三個(gè)方面:正則化、優(yōu)化器和超參數(shù)。
正則化是一種為了減少測試誤差的行為(有時(shí)候也會(huì)增加訓(xùn)練誤差),目的是讓模型在面對新的數(shù)據(jù)時(shí)可以有很好的表現(xiàn)。其中最常見的是權(quán)重衰減(L1 和L2 正則化)、Early Stopping(提前停止)、Dropout 和La?bel Smoothing(標(biāo)簽平滑)。目前關(guān)于腦電信號(hào)的研究中,超過一半的文章采用了至少一種正則化方法。例如,Hefron 等人[32]使用Dropout、L1&L2 正則化的組合來學(xué)習(xí)不同參與者的時(shí)域和頻域特征。Lngkvist 等人[33]在睡眠階段分類中使用權(quán)重衰減和稀疏性懲罰兩種正則化結(jié)合,還增加了一個(gè)懲罰項(xiàng)來鼓勵(lì)權(quán)重稀疏性,定義為所有訓(xùn)練樣本中每個(gè)隱藏單元的平均激活量與超參數(shù)之間的KL 散度。
通常,調(diào)整超參數(shù)會(huì)占用大量的訓(xùn)練時(shí)間。為了減少尋找最佳超參數(shù)花費(fèi)的時(shí)間,常用的方法有網(wǎng)格搜索和貝葉斯優(yōu)化。網(wǎng)格搜索為每個(gè)要優(yōu)化的參數(shù)確定一個(gè)取值范圍,選擇該范圍內(nèi)的值,并評估模型。網(wǎng)格搜索的一個(gè)優(yōu)點(diǎn)是它具有高度的并行性,每個(gè)超參數(shù)集都是相互獨(dú)立的。貝葉斯優(yōu)化通過目標(biāo)函數(shù)的評估結(jié)果建立替代函數(shù)(概率模型),來找到最小化目標(biāo)函數(shù)的值。貝葉斯方法與網(wǎng)格搜索的不同之處在于,它在嘗試下一組超參數(shù)時(shí),會(huì)參考之前的評估結(jié)果,因此可以省去很多無用功。
癲癇檢測的研究工作由來已久,傳統(tǒng)方法多使用“淺”模型[6-10,34],如支持向量機(jī)(Support Vector Machine,SVM)等。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,如CNN、RNN 等“深度”模型開始廣泛應(yīng)用于癲癇檢測[21,22,24,27,29,35],并且取得不錯(cuò)的效果,但仍然存在著一些問題:①已標(biāo)注腦電信號(hào)數(shù)據(jù)有限。深度學(xué)習(xí)應(yīng)用于癲癇檢測需要大量的已標(biāo)注數(shù)據(jù),目前可獲取的腦電信號(hào)大部分為未標(biāo)注數(shù)據(jù),有些文章使用的甚至是未公開的數(shù)據(jù)集。②存在不確定性。眾所周知,深度學(xué)習(xí)模型可能存在過擬合現(xiàn)象,模型可能在訓(xùn)練數(shù)據(jù)集上表現(xiàn)非常好,在其他數(shù)據(jù)集上表現(xiàn)一般。在已標(biāo)記數(shù)據(jù)不足的情況下,我們沒有更多的數(shù)據(jù)來驗(yàn)證模型的泛化性能;③部分相關(guān)研究無法重現(xiàn)。未公開代碼、使用私有數(shù)據(jù)集等,都會(huì)導(dǎo)致所做研究別人無法重現(xiàn)。而重現(xiàn)性是推動(dòng)該領(lǐng)域前進(jìn)的基礎(chǔ),尤其是在深度學(xué)習(xí)等新思想迅速傳播的領(lǐng)域;④腦電信號(hào)的研究方向諸多,如何更有針對性的對腦電信號(hào)進(jìn)行特征提取,目前尚未完全解決;⑤實(shí)際上,學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)參數(shù)是一個(gè)優(yōu)化問題,找到解決該問題的最佳方法仍然是許多研究人員的研究方向。