鄧趙紅 陳俊勇 劉解放 王士同
?
面向癲癇腦電圖信號識別的徑向基最小最大概率分類樹
鄧趙紅*陳俊勇 劉解放 王士同
(江南大學(xué)數(shù)字媒體學(xué)院 無錫 214122)
腦電圖(EEG)信號檢測和識別是癲癇病的重要診斷手段。徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)具有出色的逼近能力和泛化性能,能直接識別出不同狀態(tài)的腦電信號,但其透明性和可解釋性差,忽視了不同類別數(shù)據(jù)間可分性的不同。對此,該文提出一種基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和最小最大概率決策技術(shù)的分類樹,采用一對一策略和排除法,更多考慮了類間可分性的不同。針對腦電信號識別的實驗表明,所提方法結(jié)構(gòu)清晰,分類能力強,可解釋性更好。
腦電信號;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò);最小最大概率;分類樹
癲癇是由大腦神經(jīng)元突發(fā)性異常過度放電引發(fā)的大腦短暫性功能障礙,年發(fā)病率較高。腦電圖信號的檢測和識別是診斷癲癇病最為重要的手段。多種特征提取和智能識別的方法已被應(yīng)用于癲癇腦電信號的識別,主要包括傅里葉變換[1,2]、小波分解等特征抽取方法和決策樹[2]、模糊系統(tǒng)[3]、人工神經(jīng)網(wǎng)絡(luò)等分類方法。
文獻[9]將徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)用在癲癇(ElectroEncephaloGram, EEG)信號的分類識別中。徑向基函數(shù)(Radial Basis Function, RBF)神經(jīng)網(wǎng)絡(luò)具有一般神經(jīng)網(wǎng)絡(luò)的優(yōu)點,如很強的非線性擬合能力及魯棒性,此外,它還具有全局最佳逼近特性,不存在局部極小問題。但徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的不足是其可解釋性差,不易解釋其推理過程和依據(jù),因而不夠透明。在處理多分類問題時,徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)一般不考慮各類之間不同的可分性,利用回歸的方法直接進行多分類,從而導(dǎo)致分界面也過于復(fù)雜、難以描述。
文獻[2]采用基于決策樹和快速傅里葉變換的混合模型來對EEG信號進行分類。決策樹分類器的優(yōu)勢正在于其可解釋性和透明性,易于理解。然而,決策樹是層次結(jié)構(gòu)的,不可避免地存在自上而下的“誤差積累”[10],即如果在某個節(jié)點上發(fā)生了分類錯誤,則會把錯誤延續(xù)到后續(xù)節(jié)點上。為了降低積累的誤差,應(yīng)當(dāng)優(yōu)先使用可分性強的分類器,即先做把握大性的決策。
本文針對上述癲癇腦電信號識別方法存在的不足,通過引入最小最大概率學(xué)習(xí)機制來探討相應(yīng)的改進方法。文獻[11,12]中提出的最小最大概率機在完成模型參數(shù)學(xué)習(xí)的同時,可實現(xiàn)錯分概率上界的最小化。理論上說,此錯分概率上界的指標(biāo)越小,表明兩類數(shù)據(jù)間的可分性越強,分類模型的可靠性越好,即更有把握得到正確的分類結(jié)果。文獻[13]將之用于TSK型模糊系統(tǒng)分類器的學(xué)習(xí),得到了透明性、可解釋性更好的分類模型??紤]到RBF神經(jīng)網(wǎng)絡(luò)與模糊推理系統(tǒng)在一定的條件下存在等價性[14],可采用一對一的策略和排除法,將最小最大概率機用于RBF神經(jīng)網(wǎng)絡(luò)分類器的學(xué)習(xí),進而基于錯分概率上界可構(gòu)建更為透明和可靠的分類樹。
本文首先介紹了RBF神經(jīng)網(wǎng)絡(luò),最小最大概率機和分類決策樹的相關(guān)知識,而后提出了一種基于RBF神經(jīng)網(wǎng)絡(luò)和最小最大概率決策技術(shù)的多分類決策樹,并將之用于癲癇EEG信號的分類與識別。實驗部分,通過3組不同分類目標(biāo)的對比實驗,證實了所提方法有著更好的可靠性和可解釋性。
2.1 RBF神經(jīng)網(wǎng)絡(luò)
RBF神經(jīng)網(wǎng)絡(luò)(Radial Basis Function Neural Network, RBFNN)[9]能夠以任意精度逼近任一連續(xù)函數(shù),具有良好的泛化能力。一個最簡單的RBF神經(jīng)網(wǎng)絡(luò)是具有單隱層、單輸出的3層結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),如圖1所示。對于分類問題,通過隱層的非線性映射,通??蓪⒃继卣骺臻g上線性不可分的問題變換為高維特征空間上易于線性可分的問題。RBFNN的輸出可用隱節(jié)點輸出的線性組合來表示。
圖1 單隱層單輸出RBF神經(jīng)網(wǎng)絡(luò)
2.2 最小最大概率機
最小最大概率機(Minimax Probability Machine, MPM)[11,12]是基于錯分概率上界最小化而設(shè)計的二分類模型。設(shè)有兩類服從均值和協(xié)方差分別為和分布的維向量和。最小最大概率機定義了如式(5)的優(yōu)化目標(biāo)來確定一個分類超平面。
進一步,為了便于求解式(5)對應(yīng)的優(yōu)化問題,文獻[11,12]推出了如下的定理。
圖2 最小最大概率機的幾何解釋
此外,由于線性的最小最大概率機的分類性能有限,文獻[11,12]通過引入核技巧,給出了核化版本的最小最大概率機來實現(xiàn)非線性分類,求解過程和線性版本大致相同。
2.3 分類決策樹
決策樹(Decision Tree, DT)[2,10]是一種非度量方法,結(jié)構(gòu)形如一棵倒置的樹,其由節(jié)點和有向邊組成,其中節(jié)點又分作內(nèi)部節(jié)點和葉節(jié)點。內(nèi)部節(jié)點表示一次查詢操作,葉節(jié)點代表一個結(jié)果。決策樹被用來分類時,數(shù)據(jù)由根節(jié)點出發(fā),通過對一系列問題的回答,最終到達葉節(jié)點,得到葉節(jié)點所代表的類標(biāo)記。其中,后一個問題的提法依賴于前一個問題的回答。
相較于神經(jīng)網(wǎng)絡(luò)等度量方法,分類樹的優(yōu)點是可解釋性強,分類速度快,通過有限的查詢,即可確定數(shù)據(jù)所屬類別。
文獻[13]采用最小最大概率機來訓(xùn)練TSK型模糊系統(tǒng)分類器,得到了透明性、可解釋性更好的分類模型??紤]到RBF神經(jīng)網(wǎng)絡(luò)與TSK型模糊系統(tǒng)在一定的條件下存在等價性[14],基于最小最大概率機和RBF神經(jīng)網(wǎng)絡(luò),本文定義了如下形式的優(yōu)化目標(biāo)來學(xué)習(xí)一個可進行二分類的最小最大概率RBF神經(jīng)網(wǎng)絡(luò)(Minimax Probability RBF Neural Network, MP-RBFNN)。
如此便可用文獻[12]中的方法來求解。
4.1 多分類問題
經(jīng)典的RBF神經(jīng)網(wǎng)絡(luò)通常利用回歸的方式進行多分類,例如,對于3類分類問題,訓(xùn)練時期望的輸出可表示為,和,測試時則把實際輸出分量最大的下標(biāo)作為判定的類別,相當(dāng)于用到了3個“一對多”(One-Against-Rest, OAR)的二元分類器。而文獻[17,18]指出多數(shù)情況下“一對一”(One-Against-One, OAO)策略要優(yōu)于OAR,因為OAR策略將余下的類別混為一類,易造成分類界面的復(fù)雜化。
OAO策略可將一個完整的多分類問題化解成多個二分類子問題,最終訓(xùn)練得到個二元分類器,相較于OAR策略,每一個二分類子問題難度小些,易于找到簡單有效的分界面,也易于解釋。利用OAO策略進行測試時,一般配合采用的是“投票法”。然而,投票法的問題是會出現(xiàn)多個類的票數(shù)相同的情況(拒分現(xiàn)象),且對每一個輸入數(shù)據(jù)都需要次比較。
4.2 徑向基最小最大概率分類樹
在OAO策略下,為了避免投票法的拒分問題和提升分類模型的效率,本文采用排除法來構(gòu)建分類決策樹,樹的每個內(nèi)部節(jié)點都是一個二元分類器。即沿著樹生長的方向做排除法,只需次比較,即可獲得分類結(jié)果。同時,為了降低樹形結(jié)構(gòu)固有的“誤差積累”,本文將充分利用最小最大概率技術(shù)所提供的指標(biāo),優(yōu)先選用指標(biāo)大的二元分類器,即先做把握性大的分類。
本文提出的徑向基最小最大概率分類樹(Radial Basis Minimax Probability Classification Tree, RB-MP-CT),訓(xùn)練和測試過程可如表1所示。
表1 RB-MP-CT的訓(xùn)練和測試過程
在余下的分類器中選擇子節(jié)點時,通常不會出現(xiàn)兩個二元分類器的指標(biāo)大小相等的情況。而如果出現(xiàn)這樣的小概率事件,一般可以簡單處理,任選其中一個分類器作為子節(jié)點。
為了直觀地解釋多分類決策樹,現(xiàn)舉例如下進行說明:設(shè)有4類數(shù)據(jù),利用OAO策略共得到6個二元分類器,之間的大小關(guān)系為>>>>>,那么先被選為分類樹的根節(jié)點。再按照訓(xùn)練步驟5,先向左分支,認(rèn)為樣本不屬于第4類,那么接下來子節(jié)點待選的分類器為,和,從中選擇與第1類有關(guān)的指標(biāo)最大者,即為。再進1層,若排除樣本屬于第3類的可能,則最終選擇作為左側(cè)的子節(jié)點。如此重復(fù),得到的即是一個4層的完全二叉樹(如圖3)。
5.1 實驗數(shù)據(jù)
本部分針對德國波恩大學(xué)提供的癲癇EEG信號數(shù)據(jù)設(shè)計實驗。該數(shù)據(jù)集分為5組,每組數(shù)據(jù)包含100個23.6 s長度,采樣頻率為173.61 Hz的EEG信號片段(4097個采樣點)。各組數(shù)據(jù)的具體情況如表2所示。圖4表示的是各組數(shù)據(jù)中第1個EEG信號的波形(即A001, B001, C001, D001和E001),更多細節(jié)可參見文獻[19]。
圖3 RB-MP-CT
圖4 各組首個EEG信號的波形
表2 EEG數(shù)據(jù)集的組成和描述
5.2 特征提取
為了有效地識別EEG信號,通常需要對原始信號做一些變換來提取特征[20]。這里部分借鑒了文獻[3,8]的特征提取方法,通過離散小波變換(Discrete Wavelet Transform, DWT)和統(tǒng)計方法來提取特征量。采用了二階Daubechies小波[21],將長為4097的EEG信號分解成了4層(如圖5)。首先,分解得到第1層小波的近似系數(shù)(低頻分量)和細節(jié)系數(shù)(高頻分量),然后,進一步分解,得到和,以此類推,即得到5個子帶,如圖6所示。設(shè),各層系數(shù)的長度為
在此基礎(chǔ)上,每個子帶的最大值、最小值、均值和標(biāo)準(zhǔn)差被統(tǒng)計出來,得到20維的特征向量。實驗中,這些特征被統(tǒng)一地歸一化到區(qū)間。
5.3 實驗設(shè)置
從表1,圖4和圖6中可以看到,E組信號變化最為強烈,A組信號波形與B組相似,C, D組信號表現(xiàn)得比A, B組信號弱。不同的場景下,會有不同的分類目標(biāo),本文設(shè)計了3組實驗:Expt-1將健康和患病的EEG信號分作2類,Expt-2將健康、患病間隙期和患病發(fā)作期的EEG信號分作3類,Expt-3將每一組EEG信號分作一類。
圖5 DWT分解EEG信號過程
圖6 各組首個EEG信號的小波系數(shù)帶
實驗以MATLAB 8.1為平臺,以線性和核化的MPM,文獻[4,8]中多層感知器神經(jīng)網(wǎng)絡(luò)(MLPNN),以及MATLAB工具箱中的RBFNN, DT為對比算法,與本文提出的RB-MP-CT進行了比較。其中MPM(linear)和MPM(kernel)用于多分類時采用了OAO策略和投票法,RBFNN采用多輸出回歸進行直接多分類。各組實驗都采用了5折交叉驗證的策略進行參數(shù)選優(yōu)。
實驗以“均值±標(biāo)準(zhǔn)差”的形式給出各算法對數(shù)據(jù)集分類的測試精度、敏感度和特異度[3,8],以及MPM相關(guān)算法對相關(guān)模型訓(xùn)練所得的指標(biāo)。
5.4 結(jié)果分析
各組實驗結(jié)果如表3~表5,圖7所示。從結(jié)果來看,各組實驗中,本文方法都有很好的表現(xiàn),在Expt-1和Expt-2中的分類精度達到0.95以上,在Expt-3中的分類精度能達到0.81。Expt-1和Expt-2中,分類任務(wù)較為簡單,MLPNN和RBFNN同本文方法的分類精度是相當(dāng)?shù)?。但在Expt-3中,分類的類別數(shù)為5,這時RBFNN沒有找到最佳的分界面,而本文方法采用OAO策略則比較容易找到多個簡單有效的分界面。
同MLPNN的結(jié)果相比,本文方法在同等條件下體現(xiàn)出了更好的有效性和可靠性。對AB-CDE的分類,本文方法實驗所得分類精度為0.9680,略高于MLPNN。文獻[8]中MLPNN對AB-CDE的分類精度高達98.8%,文獻[4]同樣使用了MLPNN對AB-CDE的分類精度則為93.2%,主要因為特征提取和實驗方案存在不同。對AB-CD-E的分類,本文方法實驗所得分類精度與文獻[8]中取得的95.6%的分類精度是相近的,而在敏感性上好于文獻[8]中的結(jié)果。在分5類時,本文方法取得的結(jié)果略好于MLPNN,明顯好于DT等。
由于決策階段采用了分類樹結(jié)構(gòu),所以本文方法顯得簡潔高效,圖7顯示只需4次比較即可判定類別,而投票法則需10次比較,并可能存在拒分現(xiàn)象。相比傳統(tǒng)的DT算法,本文方法結(jié)合了RBF神經(jīng)網(wǎng)絡(luò),因而擁有更好的非線性逼近能力和泛化性能。由于優(yōu)先選用指標(biāo)大的分類器,最大程度降低了積累誤差。
圖7 Expt-3中RB-MP-CT訓(xùn)練所得模型
針對癲癇EEG信號識別,結(jié)合已有研究成果,本文提出了新的解決方案。為充分利用不同組信號之間的可分性,本文采用最小最大概率技術(shù)來學(xué)習(xí)RBF神經(jīng)網(wǎng)絡(luò)的權(quán)值參數(shù),進一步在OAO策略和排除法下,利用學(xué)習(xí)得到的指標(biāo)構(gòu)造可靠的分類樹,得到簡潔高效的多分類模型。實驗結(jié)果證實了本文方法有很強的非線性分類能力,同時其可解釋性更好,推理過程清晰。然而,由于采用了一對一策略,類別數(shù)多的時候,模型訓(xùn)練工作會比較繁重,這是需要改進的地方。在余下的分類器中選擇子節(jié)點時,如果出現(xiàn)兩個分類器的指標(biāo)大小相等的情況,是否有更好的處理方式,這在未來工作中也有待深入探討。
表3 Expt-1中各算法性能指標(biāo)
表4 Expt-2中各算法性能指標(biāo)
表5 Expt-3中各算法性能指標(biāo)
[1] VENEMA V, AMENT F, and SIMMER C. A stochastic iterative amplitude adjusted Fourier transform algorithm with improved accuracy[J]., 2006, 13(3): 321-328. doi: 10.5194/npg-13- 321-2006.
[2] POLAT K and GüNES? S. Classification of epileptiform EEG using a hybrid system based on decision tree classifier and fast Fourier transform[J].&, 2007, 187(2): 1017-1026. doi: 10.1016/j.amc. 2006.09.022.
[3] INAN G and ELIF DERYA U. Adaptive neuro-fuzzy inference system for classification of EEG signals using wavelet coefficients[J]., 2005, 148(2): 113-121. doi: 10.1016/j.jneumeth.2005.04.013.
[4] SUBASI A. EEG signal classification using wavelet feature extraction and a mixture of expert model[J]., 2007, 32(4): 1084-1093. doi: 10.1016/ j.eswa.2006.02.005.
[5] 王登, 苗奪謙, 王睿智. 一種新的基于小波包分解的EEG特征抽取與識別方法研究[J]. 電子學(xué)報, 2013, 41(1): 193-198. doi: 10.3969/j.issn.0372-2112.2013.01.33.
WANG Deng, MIAO Duoqian, and WANG Ruizhi. A new method of EEG classification with feature extraction based on wavelet packet decomposition[J]., 2013, 41(1): 193-198. doi: 10.3969/j.issn.0372-2112.2013. 01.33.
[6] SRINIVASAN V, ESWARAN C, and SRIRAAM A N. Artificial neural network based epileptic detection using time-domain and frequency-domain features[J]., 2005, 29(6): 647-660. doi: 10.1007/ s10916-005-6133-1.
[7] VAIRAVAN S, CHIKKANNAN E, and NATARAJAN S. Approximate entropy-based epileptic EEG detection using artificial neural networks[J]., 2007, 11(3): 288-295. doi: 10.1109/TITB.2006.884369.
[8] Orhan U, Hekim M, and Ozer M. EEG signals classification using the K-means clustering and a multilayer perceptron neural network model[J]., 2011, 38(10): 13475-13481. doi: 10.1016/ j.eswa.2011.04.149.
[9] ASLAN K and HSAHIN B. A radial basis function neural network model for classification of epilepsy using EEG signals[J]., 2008, 32(5): 403-408. doi: 10.1007/s10916-008-9145-9.
[10] 連可, 陳世杰, 周建明, 等. 基于遺傳算法的SVM多分類決策樹優(yōu)化算法研究[J]. 控制與決策, 2009, 24(1): 7-12. doi: 10.3321/j.issn:1001-0920.2009.01.002.
LIAN Ke, CHEN Shijie, ZHOU Jianming ,. Study on GA-based SVM multi-class classification decision-tree optimization agorithm[J]., 2009, 24(1): 7-12. doi: 10.3321/j.issn:1001-0920.2009.01.002.
[11] LANCKRIET G, GHAOUI L E, BHATTACHARYYA C,. Minimax probability machine[C]. Advances in Neural Information Processing Systems, Vancouver, British Columbia, Canada. 2001: 801-807.
[12] LANCKRIET G R G, GHAOUI L E, BHATTACHARYYA C,. A robust minimax approach to classification[J]., 2002, 3(Dec): 555-582. doi: 10.1162/153244303321897726.
[13] DENG Z, CAO L, JIANG Y,. Minimax probability TSK fuzzy system classifier: A more transparent and highly interpretable classification model[J]., 2015, 23(4):813-826. doi:10.1109/TFUZZ. 2014.2328014.
[14] Rubio-Solis A and Panoutsos G. Interval type-2 radial basis function neural network: A modeling framework[J]., 2015, 23(2): 457-473. doi: 10.1109/TFUZZ.2014.2315656.
[15] 陳聰, 王士同. 基于模糊分組和監(jiān)督聚類的RBF回歸性能改進[J]. 電子與信息學(xué)報, 2009, 31(5): 1157-1160.
CHEN Cong and WANG Shitong. Improved RBF regression using fuzzy partition and supervised fuzzy custering[J].&, 2009, 31(5): 1157-1160.
[16] ROTH P M, HIRZER M, K?STINGER M,. Mahalanobis Distance Learning for Person Re-identification [M]. London: Person Re-Identification, 2014: 247-267. doi: 10.1007/978-1-4471-6296-4_12.
[17] Kang S, Cho S, and Kang P. Constructing a multi-class classifier using one-against-one approach with different binary classifiers[J]., 2014, 149, Part B(PB): 677-682. doi: 10.1016/j.neucom.2014.08.006.
[18] Galar M, Fernández A, and Barrenechea E. An overview of ensemble methods for binary classifiers in multi-class problems: Experimental study on one-vs-one and one-vs-all schemes[J]., 2011, 44(8): 1761-1776. doi: 10.1016/j.patcog.2011.01.017.
[19] ANDRZEJAK R G, LEHNERTZ K, MORMANN F,. Indications of nonlinear deterministic and finite-dimensional structures in time series of brain electrical activity: Dependence on recording region and brain state[J]., 2001, 64(6): 061907. doi: 10.1103/PhysRevE.64. 061907.
[20] Parvez M Z and Paul M. Epileptic seizure detection by analyzing EEG signals using different transformation techniques[J]., 2014, 145(18): 190-200. doi: 10.1016/j.neucom.2014.05.044.
[21] ROY V and Shukla S. Automatic removal of artifacts from EEG signal based on spatially constrained ICA using daubechies wavelet[J].(), 2014, 6(7): 31-39. doi: 10.5815/ijmecs.2014.07.05.
Radial Basis Minimax Probability Classification Tree for Epilepsy ElectroEncephaloGram Signal Recognition
DENG Zhaohong CHEN Junyong LIU Jiefang WANG Shitong
(,,214122,)
ElectroEncephaloGram (EEG) signal detection and recognition is an important diagnostic method for the epilepsy. Radial Basis Function (RBF) neural network has excellent performance on approximation and generalization, and can directly recognize EEG signals in different states. However, its transparency and interpretability are low, and it also ignore the different separabilities between different classes of data. In this paper, a classification tree based on RBF neural networks and minimax probability decision technique is proposed, using one-against-one and exclusive method and paying much attention to the different separabilities among classes. Experiments on EEG signals show that the proposed method has clear structure, strong classification ability and better interpretability.
ElectroEncephaloGram (EEG) signal; Radial basis function neural network; Minimax probability; Classification tree
R741.044; TP183
A
1009-5896(2016)11-2848-08
10.11999/JEIT160082
2016-01-19;改回日期:2016-06-08;
2016-09-01
鄧趙紅 dengzhaohong@jiangnan.edu.cn
江蘇省杰出青年基金(BK20140001),上海市科學(xué)技術(shù)委員會揚帆項目(14YF1411000),上海市教委創(chuàng)新項目(14YZ131)
The Youth Fund of Jiangsu Province (BK20140001), YangFan Project of Shanghai Municipal Science and Technology Commission(Grant No. 14YF1411000), The Innovation Program of Shanghai Municipal Education Commission (Grant No. 14YZ131)
鄧趙紅: 男,1981年生,教授,博士,從事人工智能和神經(jīng)模糊計算的研究.
陳俊勇: 男,1990年生,碩士生,研究方向為人工智能和神經(jīng)模糊計算.
劉解放: 男,1982年生,博士生,研究方向為人工智能和模式識別的研究.
王士同: 男,1964年生,教授,博士生導(dǎo)師,從事人工智能和模式識別.