李倩云,夏斌
(上海海事大學(xué) 上?!?01306)
基于EEG的睡眠數(shù)據(jù)的分類
李倩云,夏斌
(上海海事大學(xué) 上海201306)
睡眠研究對(duì)于人的身心健康和工作生活有著重要的意義。睡眠過(guò)程中不同狀態(tài)的標(biāo)注,是睡眠研究的一個(gè)基礎(chǔ)工作。本文采用單通道的腦電信號(hào)數(shù)據(jù),將數(shù)據(jù)輸入到深度置信網(wǎng)絡(luò)中進(jìn)行特征表達(dá)和分類學(xué)習(xí)。通過(guò)利用39個(gè)晚上的睡眠數(shù)據(jù)進(jìn)行測(cè)試,達(dá)到了82.26%的平均分類準(zhǔn)確率。
睡眠;深度學(xué)習(xí);EEG;DBN
睡眠是人類不可或缺的一項(xiàng)生理活動(dòng),人的睡眠時(shí)間占到了人類生命的1/3。正常人每天的平均睡眠時(shí)間是7.5小時(shí)。良好的睡眠是保證人類身心健康和工作生活的基礎(chǔ)。睡眠障礙會(huì)導(dǎo)致人產(chǎn)生焦慮,抑郁等精神問(wèn)題,還會(huì)引起心血管、內(nèi)分泌等疾病進(jìn)而影響工作能力,甚至導(dǎo)致車禍等嚴(yán)重事件的發(fā)生[1]。目前在醫(yī)學(xué)領(lǐng)域、生物工程領(lǐng)域甚至是交通運(yùn)輸、軍事安全、航空航天等領(lǐng)域,睡眠研究已然成為一個(gè)熱點(diǎn)[2-3]。本項(xiàng)目旨在對(duì)睡眠階段的分類進(jìn)行研究,這對(duì)于臨床上疾病的預(yù)測(cè)、診斷和治療的意義最為重大。
1953年,N.kleinllan和Aserinasky把睡眠狀態(tài)劃分為兩種:非眼球快速運(yùn)動(dòng)睡眠狀態(tài)(non-Rapid Eye Movements,NREMS)、眼球快速運(yùn)動(dòng)睡眠狀態(tài)(Rapid Eye Movements,REMS)。后來(lái),為了方便研究,進(jìn)一步將NREMS細(xì)分為4個(gè)周期(淺睡眠期S1、S2,深睡眠期S3、S4),而REMS作為一個(gè)周期[4]。在睡眠過(guò)程中,這幾個(gè)周期相繼出現(xiàn),周而復(fù)始。睡眠分類的研究是正確認(rèn)知睡眠狀態(tài)和診斷各種睡眠相關(guān)疾病的基礎(chǔ)性工作。
睡眠腦電是睡眠進(jìn)行分期研究的重要工具。傳統(tǒng)的睡眠數(shù)據(jù)分類方法基于1968年Rechtschaffen和Kales的R&K準(zhǔn)則以及2007年美國(guó)睡眠醫(yī)學(xué)會(huì)的AASM準(zhǔn)則,主要是由專家對(duì)連續(xù)的整夜數(shù)據(jù)進(jìn)行目測(cè)分析,然后在對(duì)各個(gè)睡眠階段進(jìn)行劃分。這種方法耗時(shí)、繁瑣,并且需要大量數(shù)據(jù)。相對(duì)來(lái)說(shuō)后期的自動(dòng)分類方法則顯現(xiàn)出較大的優(yōu)勢(shì)。
深度學(xué)習(xí)根源于神經(jīng)網(wǎng)絡(luò)算法,“深度”源于其含有多層網(wǎng)。深度學(xué)習(xí)的方法是受到大腦的分層處理機(jī)制的啟發(fā)發(fā)展而來(lái)的。典型的淺層的機(jī)器學(xué)習(xí)算法包括應(yīng)馬爾科夫模型、最大熵模型、支持向量機(jī)等,均為單層結(jié)構(gòu)。因?yàn)槠渥陨泶嬖诘木窒扌裕?],從而激發(fā)了利用深度網(wǎng)絡(luò)的動(dòng)機(jī)。
Hinton等人在2006年提出的深度信念網(wǎng)絡(luò)(DBN)[6]解決了BP算法訓(xùn)練多層網(wǎng)絡(luò)時(shí)需要大量含標(biāo)簽的樣本、收斂速度慢以及容易陷入局部最優(yōu)的難題。自此以后,深度學(xué)習(xí)成為學(xué)術(shù)界關(guān)注的熱點(diǎn),在應(yīng)用領(lǐng)域顯示出巨大的優(yōu)勢(shì)。除了圖像和語(yǔ)言方面,深度學(xué)習(xí)還應(yīng)用在自然語(yǔ)言處理,搜索廣告預(yù)測(cè)等方面。將深度學(xué)習(xí)算法用于時(shí)序信號(hào)的處理方面的成果相對(duì)較少。Kang Li等人[7]利用了DBN模型對(duì)不同情緒下的腦電數(shù)據(jù)進(jìn)行分類研究,作者是將不同的通道分別建立DBN模型,得到低維的特征表達(dá)后再進(jìn)行一個(gè)有監(jiān)督的RBM的訓(xùn)練。DrausinWulsin等人[8]使用半監(jiān)督的DBN方法,對(duì)不同病人的腦電數(shù)據(jù)進(jìn)行分類,利用大量的無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行非監(jiān)督預(yù)訓(xùn)練,然后利用有標(biāo)簽數(shù)據(jù)進(jìn)行微調(diào)。
1.1原始睡眠數(shù)據(jù)
本文所使用的睡眠數(shù)據(jù)來(lái)自。這個(gè)睡眠數(shù)據(jù)庫(kù)共包括39組數(shù)據(jù),每組都是一個(gè)整夜的睡眠數(shù)據(jù),來(lái)自于20個(gè)受試,其中一個(gè)受試一夜數(shù)據(jù)丟書,因此有39組數(shù)據(jù)。我們選擇了Pz-Oz這個(gè)通道的信號(hào)來(lái)進(jìn)行睡眠分類研究,這個(gè)信號(hào)的采樣率是100 Hz。每個(gè)樣本是30秒的數(shù)據(jù),樣本標(biāo)簽是由睡眠專家標(biāo)定,本文中是對(duì)數(shù)據(jù)做6類分析,因此只保留樣本中的AWAKE,S1,S2,S3,S4和REM階段的所有樣本。此時(shí)個(gè)子類樣本比例如表1所示,由于清醒狀態(tài)樣本過(guò)多,去掉一些清醒狀態(tài)的樣本和狀態(tài)轉(zhuǎn)換樣本,處理后的睡眠數(shù)據(jù)各子類樣本比例如表2所示。表3展示的20個(gè)受試的睡眠數(shù)據(jù)的樣本數(shù),第13個(gè)受試只有一夜的數(shù)據(jù),因此樣本數(shù)較少。
表1 原睡眠數(shù)據(jù)各子類樣本比例Tab.1 Ratio of samples for each sleep state of original data
表2 處理后睡眠數(shù)據(jù)各子類樣本比例Tab.2 Ratio of samples for each sleep state after pre-processing
表3 每個(gè)受試睡眠數(shù)據(jù)樣本數(shù)Tab.3 The number of samples of each subject
1.2數(shù)據(jù)處理
在本文中只選用了Pz-Oz通道的信號(hào),圖1展示了Pz-Oz通道6個(gè)睡眠階段的時(shí)域圖。圖2中展示了與圖1的6個(gè)睡眠階段對(duì)應(yīng)的0.5~25 Hz的頻域圖。經(jīng)過(guò)計(jì)算可得,清醒狀態(tài)能量比較高,S1狀態(tài)信號(hào)能量下降,從S1狀態(tài)一直到S4狀態(tài),信號(hào)能量越來(lái)越高,而從S4狀態(tài)到REM狀態(tài),信號(hào)的能量有所下降。不同狀態(tài)下,信號(hào)的能量不同。由于各個(gè)睡眠狀態(tài)的主要體現(xiàn)在頻域上,因此我們首先對(duì)原始時(shí)域數(shù)據(jù)進(jìn)行了快速傅里葉變換(FFT),然后取0.5~35 Hz之間的頻域數(shù)據(jù),最后進(jìn)行數(shù)據(jù)歸一化,得到的數(shù)據(jù)就是即將用于訓(xùn)練DBN的頻域數(shù)據(jù)。
圖1 EEG通道6個(gè)睡眠階段的時(shí)域信號(hào)圖Fig.1 Timedomain signal of EEG channel of 6 sleep stages
圖2 EEG通道6個(gè)睡眠階段的頻域信號(hào)圖Fig.2 Frequency domain signal of EEG channel of 6 sleep stages
DBN是由多層網(wǎng)絡(luò)組成的的概率生成模型,每層包括一個(gè)限制玻爾茲曼機(jī)(RBM),其中DBN無(wú)監(jiān)督訓(xùn)練的過(guò)程是通過(guò)逐層訓(xùn)練RBM來(lái)實(shí)現(xiàn)的。RBM限制型玻爾茲曼機(jī),是由一個(gè)顯示層(v)和一個(gè)隱層來(lái)(h)組成的,如圖3所示為一個(gè)RBM,同一層之間的單元之間沒(méi)有連接,也就是說(shuō)顯層各單元之間沒(méi)有連接,隱層個(gè)各單元之間也沒(méi)有連接,但是不在同一層(也就是顯層和隱層)的單元之間通過(guò)一個(gè)權(quán)重矩陣W連接。DBN包括多個(gè)RBM,如圖4展示了一個(gè)典型的DBN模型,上一個(gè)RBM的輸出是下一個(gè)RBM輸入,逐層來(lái)訓(xùn)練RBM,直到所有的RBM訓(xùn)練完。所有的RBM連接在一起,頂層是標(biāo)簽層。無(wú)監(jiān)督的預(yù)訓(xùn)練完成后,通過(guò)微調(diào)就可以完成DBN的訓(xùn)練過(guò)程??偨Y(jié)來(lái)說(shuō),DBN訓(xùn)練過(guò)程包括:無(wú)監(jiān)督的預(yù)訓(xùn)練,無(wú)監(jiān)督的微調(diào)過(guò)程和有監(jiān)督的微調(diào)過(guò)程。
3.1方法
在本文中我們每次選用19個(gè)受試的睡眠數(shù)據(jù)作為訓(xùn)練集,剩下的一個(gè)受試的數(shù)據(jù)作為測(cè)試數(shù)據(jù),這樣可以得到每個(gè)受試睡眠數(shù)據(jù)的分類情況,同時(shí)我們還可以得到歌手是之間的睡眠數(shù)據(jù)之間的差異情況。我們使用的DBN網(wǎng)絡(luò)共有5層,一個(gè)輸入層,3個(gè)隱層和一個(gè)輸出層,各個(gè)隱層單元數(shù)為500-200-100。首先,選擇出訓(xùn)練集和測(cè)試集,然后分別隨機(jī)化樣本的順序,將訓(xùn)練集分成包含50個(gè)樣本的小批量數(shù)據(jù)進(jìn)行訓(xùn)練,預(yù)訓(xùn)練階段的參數(shù)設(shè)置:epoch=10,minibachsize= 1 000。預(yù)訓(xùn)練完成后,對(duì)整個(gè)DBN網(wǎng)絡(luò)進(jìn)行無(wú)監(jiān)督的微調(diào)和有監(jiān)督的微調(diào),這個(gè)過(guò)程epoch=30。此時(shí)完成了整個(gè)訓(xùn)練過(guò)程,得到了DBN模型,最后就可以得到預(yù)測(cè)結(jié)果。
3.2結(jié)果
DBN分類結(jié)果見(jiàn)表4和圖5,從圖中可以看出,不同受試之間的準(zhǔn)確率還是一定的差異的,這也間接提現(xiàn)了人與人之間睡眠的差異性,大部分受試的平均準(zhǔn)確率在80%—95%之間,也說(shuō)明DBN具有一定的穩(wěn)定性。表4顯示,所有受試的預(yù)測(cè)準(zhǔn)確率均高于70%,最低為72.80%,最高為89.23%。DBN模型預(yù)測(cè)的平均準(zhǔn)確率為82.26%。
圖3 RBM結(jié)構(gòu)圖Fig.3 The structure of RBM
圖4 DBN結(jié)構(gòu)圖Fig.4 The structure of DBN
表4 分類準(zhǔn)確率Tab.4 Classification accuracy
圖5 分類準(zhǔn)確率柱狀圖Fig.5 Histogram of classification accuracy
表5 DBN分類結(jié)果的混淆矩陣Tab.5 Confusion matrix for DBN
表5展示了DBN分類結(jié)果的混淆矩陣,從表中可以看出AWAKE,S2和REM狀態(tài)的分類準(zhǔn)確率比較高,相對(duì)來(lái)說(shuō),S4的分類準(zhǔn)確率為69.75%,但是S1和S3這兩個(gè)狀態(tài)的分類準(zhǔn)確率卻比較低。其中AWAKE、S2和REM狀態(tài)最容易區(qū)分,大多能夠預(yù)測(cè)準(zhǔn)確說(shuō)明EEG信號(hào)中存有這3個(gè)狀態(tài)的信息,而相對(duì)來(lái)說(shuō) S1、S3、S4容易和其他睡眠狀態(tài)混淆。S1
容易錯(cuò)分到REM狀態(tài)和S1狀態(tài),S3容易錯(cuò)分到S2狀態(tài)和S4狀態(tài),S4有部分錯(cuò)分到S2和S3狀態(tài)。這說(shuō)明各睡眠狀態(tài)之間的分界不是很明顯,在EEG信號(hào)中有相似特征的存在這就使得一些睡眠狀態(tài)不容易區(qū)分出來(lái)。
通過(guò)前文的結(jié)果分析,說(shuō)明DBN能夠很好地提取到睡眠數(shù)據(jù)的特征,這個(gè)結(jié)果和淺層網(wǎng)絡(luò)中經(jīng)過(guò)特征提取后得到的結(jié)果是可以相比較的,但是本文中的方法不用經(jīng)過(guò)手動(dòng)的特征提取,直接將得到頻域數(shù)據(jù)放到網(wǎng)絡(luò)中,最大的優(yōu)勢(shì)就是省去了手動(dòng)進(jìn)行特征提取的步驟,這對(duì)于剛剛開(kāi)始對(duì)睡眠數(shù)據(jù)進(jìn)行研究的人來(lái)說(shuō)是有很大的益處的。
[1]Breslau N,Roth T,Rosenthal L,et al.Sleep disturbance and psychiatric disorders:a longitudinal epidemiological study of young adults[J].Biological psychiatry,1996,39(6):411-418.
[2]Thorpy M J.Approach to the patient with a sleep complaint [C]//Seminars in neurology.2004,24(3):225-235.
[3]Lockley S W,Barger L K,Ayas N T,et al.Effects of health care provider work hours and sleep deprivation on safety andperformance[J].Joint Commission Journal on Quality and Patient Safety,2007,33(Supplement 1):7-18.
[4]Rechtschaffen A,Kales A.A manual of standardized terminology,techniques and scoring system for sleep stages of human subjects[S].1968.
[5]Hinton G E.Learning distributed representations of concepts [C]//Proceedings of the eighth annual conference of the cognitive science society,1986(1):12.
[6]Hinton G,Osindero S,Teh Y W.A fast learning algorithm for deep belief nets[J].Neural computation,2006,18(7):1527-1554.
[7]Li K,Li X,Zhang Y,et al.Affective state recognition from EEG with deep belief networks[C]//Proceedings of the IEEE International Conference on Bioinformatics and Biomedicine. 2013.
[8]Wulsin D,Blanco J,Mani R,et al.Semi-supervised anomaly detection for EEG waveforms using deep belief nets[C]// Machine Learning and Applications(ICMLA),2010 Ninth International Conference on.IEEE,2010:436-441.
Sleep classification based on EEG
LI Qian-yun,XIA Bin
(Shanghai Maritime University,Shanghai 201306,China)
The research of sleeping is important for our people′s healthy,work and life.Labeling different stages of sleep data is the basic job in the study of sleep.In this paper,we used a single channel of EEG,and put the data into the deep brief networks to represent features and do the classification,the average accuracy is 82.86%based on 39 datasets.
sleeping;deep learning;EEG;DBN
TN0
A
1674-6236(2016)05-0026-03
2015-04-20稿件編號(hào):201504229
上海海事大學(xué)基金支持(20120067)
李倩云(1989—),女,河北安國(guó)人,碩士。研究方向:信號(hào)與信息處理。