【作者】應(yīng)俊,陳廣飛,何史林
解放軍總醫(yī)院生物醫(yī)學(xué)工程研究室,北京,100853
盲信源分離(Blind Source Separation, BSS)是信號(hào)處理領(lǐng)域中的一個(gè)重要研究方向,在近些年來(lái)得到了飛速的發(fā)展,成為了研究的熱點(diǎn)。對(duì)于盲信源分離,方法之一就是基于統(tǒng)計(jì)獨(dú)立性的獨(dú)立分量分析(Independent Component Analysis, ICA)方法,以高階統(tǒng)計(jì)量為基礎(chǔ),是一種自適應(yīng)優(yōu)化算法,主要用于揭示和提取多維信號(hào)中的潛在部分,基本思路從多維觀(guān)測(cè)信號(hào)中提取統(tǒng)計(jì)獨(dú)立的成分。與傳統(tǒng)的多維信號(hào)分析方法截然不同的是,經(jīng)處理得到的各個(gè)分量不僅去除了相關(guān)性,還是相互統(tǒng)計(jì)獨(dú)立的,并且是非高斯分布的信號(hào)。獨(dú)立分量分析是一種性能優(yōu)良的盲信源分離技術(shù),在知道很少的信號(hào)先驗(yàn)知識(shí)的前提下,能有效地把信號(hào)的獨(dú)立成分分離出來(lái)。
腦電(EEG)是一種反映大腦活動(dòng)的微弱生物電信號(hào),由于腦電采集系統(tǒng)具有很高的時(shí)變敏感性,在腦電信號(hào)采集的過(guò)程中,極易收到外界干擾,幾乎所有的導(dǎo)聯(lián)都能記錄到一些偽跡信號(hào)如工頻干擾、EOG、ECG、肌電等。傳統(tǒng)的腦電偽跡分析方法是從測(cè)量信號(hào)中去掉具有明顯偽跡特征的記錄(比如幅度的峰值、頻率分析、方差和傾斜度等指標(biāo)超過(guò)了給定的閾值)。這種簡(jiǎn)單方法可能導(dǎo)致大量數(shù)據(jù)丟失,特別是無(wú)法進(jìn)行強(qiáng)眼動(dòng)過(guò)程中的大腦活動(dòng)的研究[1]。理論上認(rèn)為腦電信號(hào)中的眼動(dòng)偽跡、心動(dòng)偽跡、肌電信號(hào)以及其他干擾源所產(chǎn)生的干擾信號(hào)都是由相互獨(dú)立的信源產(chǎn)生的[2]。而通過(guò)ICA 分解便可以去除偽跡而保留有用的腦電信號(hào),ICA方法的應(yīng)用是將腦電信號(hào)和偽跡信號(hào)分解成一系列相互獨(dú)立的分量,通過(guò)一定的判斷準(zhǔn)則,去除偽跡干擾,再經(jīng)過(guò)逆運(yùn)算還原成腦電信號(hào)。
圖1 ICA問(wèn)題示意圖Fig.1 Schematic diagram of ICA issue
設(shè)向量X=[x1(t),x2(t),…,xN(t)]T是用t時(shí)刻N(yùn)個(gè)腦電頭皮電極陣列測(cè)得的N維觀(guān)測(cè)信號(hào),S=[s1(t),s2(t),…,sN(t)]T是產(chǎn)生觀(guān)測(cè)信號(hào)的N個(gè)相互統(tǒng)計(jì)獨(dú)立的源信號(hào),在采集的原始腦電信號(hào)中,源信號(hào)除了包括真實(shí)腦電信號(hào)與各種偽跡,則觀(guān)測(cè)信號(hào)向量X是S通過(guò)未知系統(tǒng)混合矩陣A線(xiàn)性混合產(chǎn)生,即X=AS。ICA所要解決的問(wèn)題是在S和A未知的情況下,尋找M×N維解混合矩陣W,得到M維向量Y=WX,使得Y逼近源信號(hào)S。要應(yīng)用上述ICA問(wèn)題模型,采集的腦電信號(hào)必須滿(mǎn)足如下條件:
(1) 腦電信號(hào)與偽跡均為平穩(wěn)隨機(jī)過(guò)程,且相互獨(dú)立。腦電信號(hào)是由大腦皮層神經(jīng)元活動(dòng)產(chǎn)生,而眼活動(dòng)、肌肉活動(dòng)、工頻干擾等信號(hào)是通常不受腦活動(dòng)限制,所以認(rèn)為是相互獨(dú)立的信號(hào)源;
(2) 混合矩陣A是列滿(mǎn)秩,即采集過(guò)程中保證所有傳感器采集的信號(hào)均是源信號(hào)的線(xiàn)性混合;
(3) 源信號(hào)的數(shù)目不大于傳感器的數(shù)目,即M≤N。在多導(dǎo)腦電中,主要偽跡信號(hào)源少于傳感器個(gè)數(shù),為便于計(jì)算,一般ICA算法都假設(shè)M=N;
(4) 信號(hào)混合不考慮噪聲影響,腦電偽跡分析中暫不考慮采集過(guò)程中的噪聲。
ICA的思路來(lái)自于中心極限定理,根據(jù)中心極限定理,一組均值和方差為同一數(shù)量級(jí)的隨機(jī)變量共同作用的結(jié)果必接近于高斯分布。因此獨(dú)立分量的線(xiàn)性疊加的分布,如以高斯分布為參考,則觀(guān)測(cè)信號(hào)往往比原始分量的分布更接近高斯分布,或者說(shuō)源信號(hào)的非高斯性比觀(guān)測(cè)信號(hào)的非高斯性要更強(qiáng),可將分量的非高斯性作為獨(dú)立性的判據(jù),各分量越接近獨(dú)立,非高斯性越強(qiáng),因此,可以對(duì)分離結(jié)果的非高斯性進(jìn)行度量,當(dāng)其非高斯性達(dá)到最大時(shí),就可以認(rèn)為實(shí)現(xiàn)了最佳分離。獨(dú)立分量分析中采用的非高斯量度主要有峭度及負(fù)熵。在腦電偽跡分析中,我們以最大負(fù)熵作為分量評(píng)判準(zhǔn)則,采用固定點(diǎn)算法(又稱(chēng)Fast ICA)順序?qū)崿F(xiàn)獨(dú)立源分量的提出。
Fast ICA是一種基于非高斯性極大化原理[3]的算法,采用批處理的方法,在每一步迭代中大量樣本數(shù)據(jù)參與運(yùn)算,F(xiàn)ast ICA在眾多ICA算法中具有收斂更快速、穩(wěn)健的特點(diǎn)。Fast ICA目標(biāo)在于尋找一個(gè)合適的解混合矩陣W使得各自的負(fù)熵最大,由于負(fù)熵的計(jì)算較為復(fù)雜,難以直接獲得。Hyvarinen[4]給出了負(fù)熵的近似表達(dá)式(隨機(jī)變量假設(shè)為零均值且具有單位方差):
式中,v是具有零均值且與y具有相同單位方差的高斯隨機(jī)變量,G(●)是非二次函數(shù),通常取logcosha1y(其中1≤a1≤2),等非線(xiàn)性函數(shù)?;谌缟系慕坪瘮?shù),Hyvarinen[3][5]給出Fast ICA迭代公式:
式中,g(●)是G(●)的一階導(dǎo)函數(shù),z是對(duì)數(shù)據(jù)進(jìn)行白化預(yù)處理后的結(jié)果,W是解混合矩陣。
腦電偽跡分離的過(guò)程首先要通過(guò)Fast ICA來(lái)對(duì)腦電信號(hào)進(jìn)行獨(dú)立成分的分離,再通過(guò)多種特征的綜合分析,判斷出偽跡分量,最后將偽跡消除后,重新恢復(fù)腦電信號(hào)。算法的核心在于ICA分離獨(dú)立成分,設(shè)計(jì)Fast ICA算法流程如圖2:
圖2 單次分離Fast ICA算法流程圖Fig.2 Flow chart of single separation in Fast ICA arithmetic
算法最后得出的權(quán)值向量wi意味著分離了混合信號(hào)xi中的一個(gè)非高斯信號(hào),(i =1,2,…)等于分離出的一個(gè)獨(dú)立成分。該算法的一個(gè)顯著的特性是它的收斂速度非??欤话愕?~10次即可收斂。為了估計(jì)n個(gè)獨(dú)立成分,必須運(yùn)行上面的算法n次,依次迭代出權(quán)值向量,從而求出了ICA的分離矩陣W的行向量。每次迭代提取一個(gè)新的獨(dú)立分量時(shí),為避免新迭代出的wi+1,與已求出的前i個(gè)權(quán)值向量收斂到相同的方向,必須保證新獨(dú)立分量所對(duì)應(yīng)的分離矩陣行向量與已求出的分離矩陣其它行向量相互正交。因此,在迭代新向量wi+1時(shí),必須為其進(jìn)行去相關(guān)處理。相應(yīng)的計(jì)算公式如下:
通過(guò)Fast ICA算法求得各獨(dú)立分量之后, 消除偽跡干擾的方法是將干擾成分獨(dú)立分量置零, 其他分量保持不變,再由W-1映射到各電極處得到不含偽跡干擾的腦電信號(hào)。
3.2.1 Fast ICA分離結(jié)果
眼電偽跡一般都會(huì)隨機(jī)地出現(xiàn)在腦電信號(hào)中,且幅度比正常腦電信號(hào)大,腦電信號(hào)因?yàn)檠垭妭污E的干擾而影響分析。本實(shí)驗(yàn)采用的腦電數(shù)據(jù)來(lái)源于解放軍總醫(yī)院腦電圖室提供的臨床實(shí)測(cè)國(guó)際標(biāo)準(zhǔn)32導(dǎo)腦電圖數(shù)據(jù),測(cè)量對(duì)象處于安靜閉目狀態(tài),測(cè)試過(guò)程中我們要求受試者做動(dòng)眼運(yùn)動(dòng)。數(shù)據(jù)采樣率512 Hz,采樣時(shí)間為10 min,從中截取200 s作為ICA分析的樣本。原始腦電圖如圖3所示,發(fā)生眼動(dòng)時(shí),所有信號(hào)均受到不同程度的影響。腦電信號(hào)經(jīng)過(guò)Fast ICA分離,所得32個(gè)獨(dú)立分量如圖4所示。
圖3 含有眼動(dòng)偽跡的腦電圖Fig.3 EEG signal with EOG
圖4 含有眼動(dòng)偽跡的腦電圖Fast ICA分離結(jié)果Fig.4 Result of separated EEG with EOG by Fast ICA
3.2.2 偽跡分析
判斷偽跡需要大量的臨床經(jīng)驗(yàn),通常的標(biāo)準(zhǔn)為以下幾個(gè)方面:在獨(dú)立分量地形圖的位置屬于腦相關(guān)的活動(dòng)區(qū)域;功率譜分布上,符合典型的腦電信號(hào)特征;時(shí)域波形特征?;谝陨?點(diǎn),我們分析得出圖4中,第3分量為眼電偽跡,理由如下:
(1) 從時(shí)域上判斷,第3獨(dú)立分量波形一般比較平緩,其他分量均呈現(xiàn)腦電特征的正弦樣波動(dòng),在原始信號(hào)出現(xiàn)明顯眼動(dòng)干擾的時(shí)間點(diǎn)附近,第3獨(dú)立分量出現(xiàn)幅度較大峰值。
(2) 從功率譜上判斷,由于測(cè)試對(duì)象處于平靜清醒閉眼狀態(tài)下,整個(gè)皮層均產(chǎn)生8-13 Hz左右的α波,從其他分量頻譜分析,在8-13 Hz表現(xiàn)出明顯的峰值,而第3獨(dú)立分量頻譜在相應(yīng)區(qū)域未出現(xiàn)明顯的峰值,比較符合眼動(dòng)偽跡的功率譜特征。
圖5 眼電偽跡分量與正常腦電分量功率譜圖Fig.5 Power spectrum chart of EOG artifacts and normal EEG
(3) Fast ICA運(yùn)算過(guò)程中所得的逆矩陣W-1的列向量表示各獨(dú)立分量在頭皮電極處的投影強(qiáng)度。根據(jù)W-1的列向量繪制的腦地形圖提供我們關(guān)于源信號(hào)位置的信息,其也可以用于檢查生物學(xué)方面的合理性。第3獨(dú)立分量的腦地形圖如圖6,其信號(hào)源能量主要集中于腦的前額部位,符合眼活動(dòng)生理特性。
圖6 眼電偽跡分量腦電地形圖Fig.6 Brain electrical activity mapping of EOG component
3.2.3 偽跡分離與腦電信號(hào)復(fù)原
確定第3分量為眼電偽跡后,將該分量數(shù)值全部置零,再由W-1映射到各電極處,復(fù)原腦電信號(hào)。該做法的實(shí)質(zhì)是從觀(guān)測(cè)信號(hào)中取消眼電偽跡源對(duì)各個(gè)電極處的貢獻(xiàn),這一思想在腦電的其它各種偽跡去除中也廣泛適用。如圖7所示,將消除眼電偽跡的腦電信號(hào)(紅色)與原始信號(hào)(黑色)進(jìn)行對(duì)比,使得信號(hào)從時(shí)域上觀(guān)察更加平滑。
隨著EEG中高頻信號(hào)在評(píng)估認(rèn)知功能中的應(yīng)用,重疊了50Hz 工頻噪聲的腦電信號(hào)也不能簡(jiǎn)單地用線(xiàn)性濾波器去除,ICA算法可實(shí)現(xiàn)將工頻干擾作為獨(dú)立分量從腦電信號(hào)中分離。本實(shí)驗(yàn)采用的腦電數(shù)據(jù)來(lái)源于自行研發(fā)的腦電信號(hào)采集系統(tǒng)采集的16導(dǎo)腦電圖數(shù)據(jù),測(cè)量對(duì)象處于安靜閉目狀態(tài),數(shù)據(jù)采樣率512 Hz,以其中200 s作為ICA分析的樣本。原始信號(hào)如圖8所示,從時(shí)域上看,原始信號(hào)受到50 Hz工頻干擾,出現(xiàn)大量規(guī)則的正弦波形。通過(guò)對(duì)信號(hào)進(jìn)行功率譜分析,在50 Hz左右出現(xiàn)峰值,高于腦電中α波的幅度。
圖7 消除眼電偽跡后的腦電圖Fig.7 Result of removing EOG artifacts from EEG
圖8 部分含有工頻干擾腦電波形圖與功率譜圖Fig.8 Partial EEG signal with power line interference and power spectrum chart
通過(guò)Fast ICA分離之后,通過(guò)時(shí)域波形、功率譜與腦電地形圖的分析,判斷得出其中第2分量為50 Hz工頻干擾。時(shí)域波形如圖9所示,第2分量明顯呈現(xiàn)規(guī)則的50 Hz交流信號(hào)。通過(guò)對(duì)第2分量進(jìn)行功率譜分析,發(fā)現(xiàn)其在50 Hz的峰值接近于原始腦電信號(hào)功率譜中50 Hz左右峰值的大小。由于工頻干擾的引入受到環(huán)境信號(hào)源與采集系統(tǒng)本身的影響,每個(gè)腦電傳感器受到工頻干擾的影響程度沒(méi)有明顯差別,所以在第2分量的腦電地形圖上沒(méi)有表現(xiàn)出信號(hào)源位置的差異性,如圖10所示,50 Hz在整個(gè)腦部皮層的影響均很大。確定第3分量為工頻干擾后,按照消除眼電干擾的方法,我們將第3分量清零,重新復(fù)原腦電信號(hào)。如圖11所示,腦電波形圖中,深色表示分離之后復(fù)原的腦電信號(hào),淺色表示原始信號(hào),消除工頻干擾之后的腦電信號(hào)細(xì)節(jié)較好的保留下來(lái),這點(diǎn)在功率譜分析中得到證實(shí)。消除偽跡前后功率譜分析中50 Hz左右的幅度顯著減少,8~13 Hz左右的腦電α波功率譜沒(méi)有變化。
圖9 含有工頻干擾的腦電圖Fast ICA分離結(jié)果Fig.9 Result of separated EEG with power line interference by Fast ICA
圖10 工頻干擾分量腦地形圖Fig.10 Brain electrical activity mapping of power line interference component
圖11 消除工頻干擾后的腦電波形圖與功率譜圖Fig.11 EEG signal and power spectrum chart after removing power line interference
獨(dú)立分量分析技術(shù)作為一項(xiàng)新的信號(hào)分解技術(shù),經(jīng)歷10余年的發(fā)展,其在生物醫(yī)學(xué)、模式識(shí)別、雷達(dá)信號(hào)處理等眾多領(lǐng)域引起人們的關(guān)注。實(shí)驗(yàn)證明,ICA 算法的分離技術(shù)在腦電偽跡分離問(wèn)題上有著很好的解決方法,具有獨(dú)特的優(yōu)越性,特別在分離含有顯著獨(dú)立分量干擾的混合信號(hào)。但隨著ICA 算法理論的不斷完善與推廣,ICA方法將成為腦電信號(hào)增強(qiáng)及腦電特征提取的有效的分析工具。
[1]周宗潭, 董國(guó)華,徐昕, 等.獨(dú)立成分分析[M].北京:電子工業(yè)出版社,2007:286-287.
[2]杜曉燕,李穎潔,朱貽盛,等.腦電信號(hào)偽跡去除的研究進(jìn)展[J].生物醫(yī)學(xué)工程學(xué)雜志.2008.25(2).465-466.
[3]Hyvarinen A, Oja E.Independent component analysis: algorithms and applications[J].Neural Networks.2000,(13):411430.
[4]Hyvarinen A.Fast and Robust Fixed-Point Algorithms for Independent Component Analysis [J].IEEE Trans Neural Networks, 1999, 10(3): 626-634.
[5]Hyvarinen A.New approximations of differential entropy for independent component analysis and project pursuit[J].Advances in Neural Information Processing System, vol.MIT Press,1998.10, :273-279.