翟延祥,薄 華
(上海海事大學 信息工程學院院,上海 201306)
基于小波變換和AR模型的腦電信號注意力狀態(tài)識別
翟延祥,薄 華
(上海海事大學 信息工程學院院,上海201306)
針對神經(jīng)反饋訓練研究中注意力狀態(tài)識別精度不高的特點,建立了一種基于離散小波變換和AR模型的方法用于提高注意力識別的精度。利用dbN小波函數(shù)對腦電數(shù)據(jù)樣本進行多層小波分解,提取小波變換系數(shù)的三種統(tǒng)計特征;同時采用Brug算法得到AR模型系數(shù);用這兩種參數(shù)相結(jié)合后使用支持向量機進行識別。與只采用小波變換或AR模型等特征提取方法相比,本文方法有更高的識別率。
注意力識別;小波變換;AR模型;支持向量機
腦電信號(ElectroEncephaloGram,EEG)產(chǎn)生于大腦皮層的神經(jīng)活動,它是采用非侵入式方式記錄從頭皮采集到的大腦皮層信號,一定程度上反映了大腦活動狀態(tài)[1]。腦電注意力狀態(tài)識別是腦電生物反饋的重要組成部分,在臨床醫(yī)療方面有著許多的應(yīng)用,比如治療注意缺陷多動障礙(Attention Deficit Hyperactive Disorder,ADHD)、自閉癥(Autistic Specturm Disorder,ASD)、癲癇等。
目前采用頻譜分析方法識別大腦狀態(tài)的注意水平主要有兩種算法,一種是計算θ/β比率得出大腦注意水平狀態(tài);另一種是將腦電信號分解為δ波(≤4 Hz)、θ波(4~8 Hz)、α波(8~15 Hz)、β波(12~30 Hz)和其他波(≥30 Hz),把每個波段的能量或者功率譜作為反饋信息,比如維格納-費利分布、匹配追蹤法等[2]。然而腦電屬于非線性隨機信號,僅僅采用腦電的頻譜特征并不能完全真實地反映實際狀況,從而影響訓練效果。因此本文利用小波低頻變化緩慢、高頻變化較快的特點提出一種將離散小波系數(shù)和AR模型系數(shù)兩者相結(jié)合的特征提取方法。將采集數(shù)據(jù)小波分解至7層,提取與注意力有關(guān)的4種波段。將小波系數(shù)的能量均值、方差、均值與8階AR模型系數(shù)用作支持向量機的輸入。
1.1小波變換
信號f(t)的連續(xù)小波(Continuous Wavelet Transform, CWT)變換[3]定義為:
(1)
連續(xù)小波變化就是由小波基函數(shù)Ψτ,a(t)做平移尺度變換得到的一種分析方法。其中a為尺度因子,τ為平移因子。當a增大時(agt;1),表示用伸展的Ψ(t)去觀察整個f(t);反之當a減小時(alt;1),表示用壓縮的Ψ(t)去觀察整個f(t)的局部。盡管連續(xù)小波變換具有自動調(diào)節(jié)信號的帶寬等一系列優(yōu)點,但其計算復雜、冗余性大,因此常采用Mallat快速算法。
(2)
其中⊕表示直和。如果原始信號x(t)的信號空間為V0,首先V0被分解為相互獨立的V1和高頻空間W1,第j步時將Vj-1分解為類似低頻空間Vj和高頻空間Wj,其本質(zhì)就是劃分空間。
Mallat的算法表達如下:
(1)分解算法
根據(jù)不同的尺度把原始信號分解為細節(jié)信號與逼近信號,其分解過程如圖1所示。
圖1 Mallat算法分解過程
(2)重建算法
重建算法就是分解算法的逆過程,其核心就是由分解后的細節(jié)與逼近信號相結(jié)合還原為初始信號,如圖2所示。
圖3 7級小波分解
圖2 Mallat算法重建過程
1.2AR模型
自回歸模型(Auto Regressive Model,AR)[4]是一種線性組合了前期若干時刻的隨機變量來描述后期某段時刻隨機變量的線形回歸模型,本質(zhì)是一種線形預(yù)測,表示如下:
圖4 原始腦電信號
(3)
其中ε(n)是方差為σ2,均值為零的白噪聲序列,p表示AR模型的階數(shù)。因此腦電信號序列x(n)可以看作白噪聲序列ε(n)通過AR模型H(z)的輸出。建立AR模型時,首要問題就是階數(shù)為多少時比較合適。模型的階數(shù)在遞推過程中實現(xiàn),使用Levinson-Durbin遞推方法時,可以給出低階到高階的每一組參數(shù),當模型的最小預(yù)測誤差功率P不再發(fā)生變化時,即是所需要的正確階數(shù)。文獻[5]以及實驗表明腦電處理效果最好的模型階數(shù)為6~8。在采用Brug算法求解8階AR模型系數(shù)的之前,需要通過適當?shù)淖儞Q去掉不平穩(wěn)的趨勢得到平穩(wěn)、服從正態(tài)分布的平穩(wěn)時間序列。
本文把小波7層分解后得到α、β、θ、δ四個波段,小波變換系數(shù)各有三種統(tǒng)計特征加上提取的8階AR模型系數(shù)共計20個特征值作為SVM的輸入。此次采集的樣本數(shù)據(jù)共160組,將其中存在明顯漂移較大的15組數(shù)據(jù)去除后,選取120組作為訓練樣本,另外的25組作為測試樣本。SVM的核函數(shù)的選擇是首要考慮的問題,這里選用線形核函數(shù)。然后利用訓練樣本計算SVM的參數(shù)(如拉格朗日乘子a,具有超平面的發(fā)向量w和偏置b等)并確定判別函數(shù)f(x),最后輸入測試樣本,根據(jù)sgn(f(x))的值輸出類別,如果sgn(f(x))為1,則為注意力腦電信號;如果為-1,則為非注意力腦電信號。
根據(jù)上述小波分解的原理和步驟,對原始腦電信號采用Mallat快速算法,用db4小波進行7層分解。其小波分解過程如圖3所示。Sn表示待分解的原始信號。其中An(n=1,2,3…)表示分解后得到的低頻部分即逼近信號;Dn(n=1,2,3…)表示高頻部分即細節(jié)信號。
圖4為實驗中記錄到的4 s時間內(nèi)FP1通道的注意和非注意狀態(tài)的腦電信號。
注意力腦電信號分解時,隨著分解層數(shù)的增加,各節(jié)點信號的范圍逐漸縮小,也更容易得到所需的信號。本文采集儀器的采樣頻率為512 Hz,將信號分解到第6層發(fā)現(xiàn)肌電干擾信號主要分布在D3(頻率33~64 Hz),腦電β節(jié)律表現(xiàn)在尺度A5、A6、A7(頻率17~24 Hz,25~28 Hz,29~30 Hz)中,α節(jié)律集中在尺度D8中(頻率8.9~15.6 Hz),θ節(jié)律集中在尺度D9(頻率4.8~8.2 Hz)中,δ節(jié)律集中在尺度A8上(頻率1~4 Hz)。通過多分辨小波將原始信號分解到不同頻帶上,本文選取A5、A6、A7、D8、A9、D9以做進一步研究。為了計算方便,此處將同屬于β波形的A5、A6、A7合并。
圖5表示提取到的四種腦電波形,圖6為各節(jié)律對應(yīng)的頻譜。
圖5 小波提取的四種分量
圖6 對應(yīng)的頻譜圖
由圖5、圖6可知,小波分解提取的與注意力有關(guān)的四種波形效果較好,為了提高識別精度,本文提取了小波系數(shù)的能量均值、均方差、均值作為特征向量。
本文另一部分特征向量的獲得是采用8階AR模型提取的8個系數(shù)。常用的AR模型的系數(shù)求解法有自相關(guān)法、Brug算法以及改進的協(xié)方差法等。由于Brug算法是令前后向預(yù)測誤差功率之和ρfb為最小,此處采用Brug算法。
(3)
前向預(yù)測誤差ρf和后向預(yù)測誤差ρb的求和范圍是ρ~N-1,這時有:
(4)
(5)
Brug算法又叫最大熵法(MEM),它是通過最大化觀測序列的熵與改進的協(xié)方差方法相比求解AR模型的過程,具有相當穩(wěn)定且分辨率較高的優(yōu)點。此處選取0~8 s之間的腦電數(shù)據(jù),每隔0.4 s做一次AR功率譜估計,并將這0.4 s內(nèi)的功率譜相加得到20個數(shù)據(jù),如圖7和圖8所示。
圖7 非注意狀態(tài)的功率譜密度
圖8 注意狀態(tài)的功率譜密度
為了確保上述方法的有效性,本文設(shè)計如下實驗采集不同狀態(tài)的注意力腦電信號作為數(shù)據(jù)樣本。實驗選取的受試者為16名健康的研究生,8男8女,年齡在 24~28 歲之間,右利手,均在頭腦清醒,頭皮和額頭被清潔過的情況下接受測試。測試前,用酒精清潔儀器電級,受試者坐于一個較為舒適的帶靠背的椅子上,心情愉悅放松,無任何肌肉緊張與運動。
(1)非注意任務(wù)。受試者坐在電腦前,安靜地觀望屏幕,使自己處于放松狀態(tài),屏幕上呈現(xiàn)游戲畫面。
(2)注意任務(wù)。受試者進行貪吃蛇的游戲,不小心結(jié)束游戲了則重新開始,時間為3 min。
貪吃蛇是一種休閑益智類手機游戲,該游戲通過控制舌頭方向吃蛋,從而使自己變長,其中不能碰到其他蛇、墻壁,也不能碰到自己的身體,總的來說,非常有利于集中注意力。
本文采用美國神念公司生產(chǎn)的腦電采集裝置,采集點放在Fp1電極處,采樣率為512 Hz,在進行特征提取之前,首先對數(shù)據(jù)進行一些必要的預(yù)處理。比如去除眼電(EOG)和工頻干擾信號,將采集后的數(shù)據(jù)通過一個低通濾波器,過濾掉大于50 Hz的其他工頻干擾。為了解決EEG信號異常更正,對由受試者采集的原始EEG樣本點,把大于樣本均值95%的點或小于樣本均值5%的點分別用樣本均值乘以0.95及樣本均值乘以0.05替代,完成異常點更正。為了進行更好的分類,盡量選取較多的數(shù)據(jù)段,從每個被試者采集到的信號中截取5段長度為4 s的數(shù)據(jù)段,即每段長度為2 048個點,16個被試者每人每類截取5段長度,得到16×5=80個注意狀態(tài)數(shù)據(jù)段和16×5=80個非注意狀態(tài)數(shù)據(jù)段,數(shù)據(jù)集合的尺寸為2 048×160。
通過觀察采集到的160組數(shù)據(jù),將其中存在明顯漂移狀況的15組數(shù)據(jù)去除。選取75組作為訓練樣本,另外的70組作為測試樣本。此處把小波7層分解后得到α,β,θ,δ四種波段,小波變換系數(shù)各有三種統(tǒng)計特征,加上提取的8階AR模型系數(shù)共計20個特征值作為SVM的輸入。用SVM進行腦電注意力識別時,先由訓練樣本求出Lagrange乘子a,偏置值b,再確定判別函數(shù)f(x)。然后根據(jù)測試樣本確定sgn(f(x)的值,若sgn(f(x)為1,則為注意力狀態(tài),若sgn(f(x)為-1,則為非注意力狀態(tài),為確保實驗準確性,多次重復實驗,分類結(jié)果如表1所示。
表1 采用SVM注意力分類結(jié)果
從表1中可以看出,采用文獻[6]和文獻[7]測試的小波變換和AR模型方法的最高正確識別率僅有82.20%和75%,而本文提出的小波變化和AR模型相結(jié)合的方法得到的最高識別率可達91.43%,遠高于單獨的分析方法。同時與文獻[8]中提出的改進的樣本熵方法相比優(yōu)勢也較為明顯,其正確識別率為87.80%。因此,在神經(jīng)反饋訓練研究中,本文提出的特征提取方法由于較好的正確識別率可作進一步研究。
本文通過結(jié)合小波變換系數(shù)和AR模型的方法提高了注意力狀態(tài)的識別精度。然而不可避免地會存在一些不足,希望能在未來的研究中能做進一步的改進:
(1)設(shè)計實驗時可以調(diào)整受試者的男女比例,年齡分布以及適當?shù)脑黾尤藬?shù)。數(shù)據(jù)采集時測試者所處環(huán)境的聲音干擾以及集中程度都會造成很大影響,應(yīng)盡量避免。
(2)腦電信號屬于非線性非平穩(wěn)信號,節(jié)律多,隨機性強。目前為止,人類對腦電信號的探索從目視觀察到時域、頻域分析以及非線性分析,對其認識也更加深刻。對于腦電信號的分析還有許多其他分析方法,譬如動力學分析、因果性分析以及同步性分析等,在下一步做進一步研究。
[1] NUNEZ P L,SRINIVASAN R. Electric fields of the brain[M].New York:Oxford University Press,2006.
[2] 白東梅.腦電信號的特性分析與特征提取[D].大連:大連理工大學,2006.
[3] 小波分析在圖像降噪中的應(yīng)用[J].微型機與應(yīng)用,2013,32(12):68-70.
[4] 張德豐.MATLAB 小波分析[M].北京:機械工業(yè)出版社,2009.
[5] 胡廣樹.數(shù)學信號處理:理論、算法與實踐[M].北京:清華大學出版社,2003.
[6] 李穎潔 ,邱意弘.腦電信號分析方法及器應(yīng)用[M].北京:科學出版社,2009.
[7] 徐愛國,宋愛國.單次運動想象腦電的特征提取和分類[J].東南大學學報(自然科學版),2011,39(s2):103-106.
[8] 周鵬,葛家怡,曹紅寶,等,基于樣本熵的運動想象分類研究[J].信息與控制,2008,37(2):191-196.
2017-04-25)
翟延祥(1992-),男,碩士,主要研究方向:模式識別,信號處理。
薄華(1971-),女,博士,副教授,主要研究方向:模式識別,機器學習。
Attention state recognition of EEG based on wavelet transform and AR model
Zhai Yanxiang, Bo Hua
( College of Information Engineering, Shanghai Maritime University, Shanghai 201306, China)
As the accuracy of attention state recognition is not high in neural feedback training, this paper established a method based on discrete wavelet transform and AR model to improve the accuracy of attention state recognition. This paper uses dbN wavelet function to do EEG data samples multi-layer wavelet decomposition and extract three kinds of statistical characteristics of wavelet transform coefficients. At the same time it adops Brug algorithms to get AR model coefficient. By combining these two kinds of parameters, it uses Support Vector Machine (SVM) for identification. Compared to the feature extraction methods which only use the wavelet transform and AR model, the method proposed in this paper has higher recognition rate.
attention state recognition; wavelet transform; Auto Regressive model; Support Vector Mache (SVM)
TP212.3
A
10.19358/j.issn.1674- 7720.2017.22.024
翟延祥,薄華.基于小波變換和AR模型的腦電信號注意力狀態(tài)識別J.微型機與應(yīng)用,2017,36(22):91-94,98.