蔣賢海,謝存禧
(1.廣東水利電力職業(yè)技術(shù)學(xué)院 機(jī)械工程系,廣東 廣州 501635;2.華南理工大學(xué) 機(jī)械與汽車工程學(xué)院,廣東 廣州 510640)
生理參數(shù)是一弱非平穩(wěn)的時(shí)間序列,基于統(tǒng)計(jì)理論的預(yù)報(bào)方法雖然在數(shù)值預(yù)報(bào)中發(fā)揮了重要作用,但它們都是建立在線性相關(guān)基礎(chǔ)上的[1,2],在實(shí)際應(yīng)用中存在一定的局限性。具有非線性能力的神經(jīng)網(wǎng)絡(luò)也取得較大進(jìn)展[3,4],然后由于神經(jīng)網(wǎng)絡(luò)的過學(xué)習(xí)問題,所得到的值往往是局部最優(yōu),預(yù)報(bào)效果不夠理想。隨著計(jì)算機(jī)技術(shù)的發(fā)展和智能技術(shù)的進(jìn)步,智能機(jī)器識(shí)別技能得到很好的發(fā)展。支持向量機(jī)(SVM)[5]是一種新的小樣本機(jī)器學(xué)習(xí)方法,具有從海量信息中自動(dòng)識(shí)別并提取關(guān)鍵信息,它借助于最優(yōu)化方法來解決機(jī)器學(xué)習(xí)問題。已成為克服維數(shù)災(zāi)難和過學(xué)習(xí)等傳統(tǒng)問題的有力手段,適用于處理本質(zhì)上的非線性問題。
針對(duì)生理信號(hào)預(yù)報(bào)問題,本章提出小波分解與最小二乘支持向量機(jī)(WD-LSSVM)的綜合預(yù)報(bào)方法。利用小波分解將原參數(shù)序列分解為逼近信號(hào)和細(xì)節(jié)信號(hào),然后采用LS-SVM算法,分別建立逼近信號(hào)和細(xì)節(jié)信號(hào)的預(yù)報(bào)模型,得到逼近信號(hào)和細(xì)節(jié)信號(hào)的預(yù)報(bào)值,最后將各部分預(yù)報(bào)值利用小波逆變換進(jìn)而得到最終預(yù)報(bào)結(jié)果,并推廣到生理參數(shù)時(shí)間序列的N步預(yù)報(bào)??芍苯訉?duì)N步預(yù)報(bào)值進(jìn)行異常判斷,無需等到N步實(shí)際值出現(xiàn)就可實(shí)現(xiàn)狀態(tài)預(yù)報(bào)。
本文研究的監(jiān)護(hù)信息是典型的時(shí)間序列數(shù)據(jù)。時(shí)間序列是按時(shí)間順序產(chǎn)生和排列的,隨時(shí)間變化且相互關(guān)聯(lián)的觀察數(shù)據(jù)序列[6,7]。時(shí)間序列分析主要對(duì)時(shí)間序列建立預(yù)報(bào)模型,并根據(jù)變量本身的變化規(guī)律來預(yù)報(bào)未來的變化,描述如下。
設(shè)一時(shí)間序列{x(1),x(2),…,x(N)},時(shí)間序列預(yù)報(bào)就是根據(jù)時(shí)間序列的歷史數(shù)據(jù){x(t),x(t-1),…,x(t-m+1)}預(yù)報(bào)未來t+k時(shí)刻值x(t+k),即尋找x(t+k)與歷史數(shù)據(jù){x(t),x(t-1),…,x(t-m+1)}間的關(guān)系。當(dāng)k=1時(shí),為一步預(yù)報(bào);當(dāng)k>1時(shí),為多步預(yù)報(bào)。m參數(shù)為嵌入維數(shù)。
預(yù)報(bào)是利用各個(gè)時(shí)刻監(jiān)護(hù)數(shù)據(jù),將時(shí)間作為自變量,監(jiān)護(hù)數(shù)據(jù)作為因變量,通過回歸分析,建立監(jiān)護(hù)信息與時(shí)間的函數(shù)關(guān)系,用此模型函數(shù)作為進(jìn)行未來生理參數(shù)數(shù)據(jù)的預(yù)報(bào)根據(jù)。由于現(xiàn)有監(jiān)護(hù)信息預(yù)報(bào)方法存在的不足,本文根據(jù)小波分解特點(diǎn)及支持向量機(jī)具有小樣本、非線性、高維數(shù)、避免局部最小點(diǎn)以及過學(xué)習(xí)現(xiàn)象等優(yōu)點(diǎn),以及最小二乘支持向量機(jī)用等式約束代替了不等式約束,其算法可轉(zhuǎn)化為解線性方程組,比標(biāo)準(zhǔn)支持向量機(jī)法待選的參數(shù)少,不再需要指定收斂判據(jù)的精度,具有運(yùn)行簡(jiǎn)單、求解速度快、精度高的優(yōu)點(diǎn),采用小波分解與最小二乘支持向量回歸相結(jié)合的方法,構(gòu)造一小波分解與PSO[8]優(yōu)化LSSVM監(jiān)護(hù)信號(hào)預(yù)報(bào)數(shù)學(xué)模型逼近真實(shí)的監(jiān)護(hù)信號(hào),然后用這一模型對(duì)監(jiān)護(hù)信號(hào)進(jìn)行預(yù)報(bào)。
基于小波分解與PSO優(yōu)化LS-SVM的監(jiān)護(hù)信息預(yù)報(bào)算法流程如圖1所示?;舅悸肥峭ㄟ^小波分解將原參數(shù)序列分解為逼近信號(hào)和細(xì)節(jié)信號(hào),然后采用PSO優(yōu)化的LS-SVM算法,分別建立逼近信號(hào)和細(xì)節(jié)信號(hào)的預(yù)報(bào)模型,得到逼近信號(hào)和細(xì)節(jié)信號(hào)的預(yù)報(bào)值,即和(i=1,2,…,j),最后將各部分預(yù)報(bào)值利用小波逆變換進(jìn)而得到最終預(yù)報(bào)結(jié)果,即:
流程描述如下:
(1)監(jiān)護(hù)數(shù)據(jù)歸一化。在進(jìn)行建模預(yù)報(bào)前,首先要對(duì)監(jiān)護(hù)數(shù)據(jù)進(jìn)行歸一化處理,以減少訓(xùn)練過程中數(shù)值計(jì)算的復(fù)雜度。
式中xi—樣本數(shù)據(jù);xmax和xmin分別為樣本數(shù)據(jù)中的最大值和最小值;xi'—?dú)w一化后的數(shù)據(jù)。
(2)監(jiān)護(hù)數(shù)據(jù)小波分解。對(duì)歸一化后的監(jiān)護(hù)數(shù)據(jù)序列進(jìn)行小波分解,得到各層分解序列。
(3)構(gòu)建訓(xùn)練樣本。對(duì)經(jīng)小波分解的各層數(shù)據(jù),分別構(gòu)建訓(xùn)練樣本。當(dāng)訓(xùn)練回歸模型時(shí),樣本對(duì)可以表示為:輸入向量{x(t),x(t-1),…,x(t-m+1)},對(duì)應(yīng)的輸出值為x(t+1),輸入向量{x(t+1),x(t),…,x(t-m+2)},對(duì)應(yīng)的輸出值為x(t+2),并依此類推,由n個(gè)訓(xùn)練樣本就可以構(gòu)建n-m個(gè)訓(xùn)練樣本對(duì)。假定第i層數(shù)據(jù)序列的前n個(gè)數(shù)據(jù)用于模型的建立,其余N-n個(gè)數(shù)據(jù)用于驗(yàn)證所建立模型,下面的矩陣作為預(yù)報(bào)模型的輸入輸出(xi,yi)(i= 1,2,…,n):
(4)計(jì)算LS-SVM預(yù)報(bào)模型參數(shù)。
(5)用(3)建立的訓(xùn)練樣本和(4)優(yōu)化參數(shù)對(duì)模型進(jìn)行訓(xùn)練。即找出輸入X和輸出Y間的函數(shù)f,使得yi=f(xi)(i=1,2,…,n)。
(6)用訓(xùn)練好的預(yù)報(bào)模型,對(duì)小波分解的各層數(shù)據(jù)進(jìn)行預(yù)報(bào)。
(7)對(duì)各層的預(yù)報(bào)結(jié)果進(jìn)行小波逆變換。
(8)數(shù)據(jù)反歸一化。最后對(duì)預(yù)報(bào)模型的輸出數(shù)據(jù)進(jìn)行反歸一操作,以恢復(fù)數(shù)據(jù)為監(jiān)護(hù)數(shù)據(jù)實(shí)際預(yù)報(bào)值。xi=xi'(xmax-xmin)+xmin。
(1)實(shí)驗(yàn)數(shù)據(jù)。實(shí)驗(yàn)數(shù)據(jù)采用PhysiNet生物醫(yī)學(xué)信號(hào)研究資源中的數(shù)據(jù),PhysiNet是一個(gè)基于web的復(fù)雜生理參數(shù)和生物醫(yī)學(xué)研究資源[9]。實(shí)驗(yàn)中使用心率生理參數(shù)數(shù)據(jù)集合。心率數(shù)據(jù)取自于Santa Fe Time Series Competition數(shù)據(jù)庫。以上實(shí)驗(yàn)數(shù)據(jù)均由Boston Beth Israel醫(yī)院的睡眠實(shí)驗(yàn)室對(duì)監(jiān)護(hù)對(duì)象在睡眠狀態(tài)下進(jìn)行連續(xù)監(jiān)測(cè)獲得。下面將分別采用小波分解與最小二乘支持向量回歸法,直接采用最小二乘支持向量回歸法和BP神經(jīng)網(wǎng)絡(luò)對(duì)上數(shù)據(jù)集進(jìn)行訓(xùn)練和預(yù)報(bào),以驗(yàn)證本預(yù)報(bào)方法的有效性。
(2)實(shí)驗(yàn)步驟:①選擇好訓(xùn)練樣本及測(cè)試樣本后,采用db6小波基對(duì)訓(xùn)練樣本進(jìn)行3層小波分解;②對(duì)小波分解后的低頻序列和高頻序列分別進(jìn)行基于PSO的LSSVM預(yù)報(bào);③最后,合成各分解序列的預(yù)報(bào)結(jié)果,并對(duì)合成的第3層低頻系數(shù)及第1~3層高頻系數(shù)分別進(jìn)行小波重構(gòu),得到最終的預(yù)報(bào)結(jié)果。
(3)實(shí)驗(yàn)結(jié)果:本文選擇徑向基函數(shù)作為監(jiān)護(hù)信息預(yù)報(bào)模型的核函數(shù)。選擇100個(gè)心率樣本,前80個(gè)作為訓(xùn)練樣本,后20個(gè)作為預(yù)測(cè)樣本,分別采用最小二乘支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)及小波分解與最小二乘支持向量機(jī)方法進(jìn)行預(yù)報(bào),實(shí)驗(yàn)結(jié)果如下。圖2~4是分別采用LS-SVM、神經(jīng)網(wǎng)絡(luò)及WD-LSSVM對(duì)心率信號(hào)預(yù)報(bào)結(jié)果。三種預(yù)報(bào)方法的心率預(yù)報(bào)誤差如圖5所示。
為了對(duì)實(shí)驗(yàn)做進(jìn)一步說明,引入均方差對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行定量分析。不同方法預(yù)報(bào)均方差結(jié)果見表1(其中經(jīng)PSO得到的參數(shù)為gam=790.6295,sig2=3.736199)。
圖2 心率LS-SVM預(yù)報(bào)結(jié)果
圖3 心率神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)結(jié)果
圖4 心率WD與LS-SVM綜合法預(yù)報(bào)結(jié)果
圖5 心率預(yù)報(bào)誤差曲線
(4)實(shí)驗(yàn)結(jié)果分析。從表1可得出,最小二乘支持向量機(jī)預(yù)報(bào)方法較神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)好,原因是最小二乘支持向量機(jī)較神經(jīng)網(wǎng)絡(luò)的推廣能力強(qiáng),善于從小樣本中學(xué)習(xí),既考慮經(jīng)驗(yàn)風(fēng)險(xiǎn)最小又考慮泛化能力最大,從中找到一平衡點(diǎn),所以預(yù)報(bào)效果優(yōu)于神經(jīng)網(wǎng)絡(luò)。而本文提出的小波分解與最小二乘支持向量機(jī)綜合預(yù)報(bào)方法明顯優(yōu)于其他方法,是因?yàn)楸疚姆椒▽?duì)經(jīng)小波分解的監(jiān)護(hù)信息各層信號(hào)進(jìn)行預(yù)報(bào),然后再將各層預(yù)報(bào)結(jié)果進(jìn)行小波逆變換得到最終預(yù)報(bào)結(jié)果,效果顯然優(yōu)于對(duì)監(jiān)護(hù)信號(hào)直接采用最小二乘支持向量機(jī)預(yù)報(bào)方法。實(shí)驗(yàn)結(jié)果說明小波分解與最小二乘支持向量機(jī)預(yù)報(bào)方法更適合對(duì)監(jiān)護(hù)信息的預(yù)報(bào)。
表1 心率信號(hào)不同預(yù)報(bào)方法均方差
本文提出了小波分解與最小二乘支持向量機(jī)的監(jiān)護(hù)信息預(yù)報(bào)方法,建立監(jiān)護(hù)信息小波分解、重構(gòu)模型及監(jiān)護(hù)信息各層分解信息LS-SVM模型。給出了監(jiān)護(hù)信息預(yù)報(bào)方法流程。對(duì)美國MITBIH標(biāo)準(zhǔn)數(shù)據(jù)庫中的心率信號(hào)數(shù)據(jù)進(jìn)行了仿真驗(yàn)證,并分別與最小二乘支持向量機(jī)方法、小波神經(jīng)網(wǎng)絡(luò)方法進(jìn)行了比較,得出本文方法預(yù)報(bào)的均方根誤差分別為0.0359。明顯優(yōu)于其他方法,驗(yàn)證了本文提出的監(jiān)護(hù)信息預(yù)報(bào)方法的有效性。
[1]Vapnik V.N.An overview of statistical learning theory[J].IEEE Trans Neural Network,1999,5.
[2]Christensen,R.and Pearson,L.M.Prediction diagnostics for spatial linear models.Biometrika.1992,79.
[3]Zhang Zhengdao,Hu Shousong.Fault prediction of fighter based on nonparametric density estimation[J].Journal of Systems Engineering and Electronics, 2005,4.
[4]Xu K,Xie M,etc.Application of Neural Networks in forecasting Engine Systems Reliability[J],Applied Soft Computing.2003,2.
[5]HANBAY D.An expert system based on least square support vector machines for diagnosis of the valvular heart disease[J].Expert Systems with Applications,2008.
[6]Box and Jenkins;顧嵐,范金城(譯).時(shí)間序列分析預(yù)測(cè)與控制[M].中國統(tǒng)計(jì)出版社,2003.
[7]Policker S,Geva A.B.A New Algorithm for Time Series Prediction by Temporal Fuzzy Clustering[A].Proceedings of 15th International Conference on Pattern Recognition[C],ICPR.2000.
[8]邵信光,楊慧中,陳剛.基于粒子群優(yōu)化算法的支持向量機(jī)參數(shù)選擇及其應(yīng)用[J].控制理論與應(yīng)用,2006,5.
[9]Moody G B,Mark R G,Goldberger A L.PhysioNet:a web-based resource for the study of physiologic signals[J].IEEE Engineering in Medicine and Biology Society,2001,3.
[10]何仁斌.MATLAB6工程計(jì)算及應(yīng)用[M].重慶大學(xué)出版社,2001.
機(jī)電產(chǎn)品開發(fā)與創(chuàng)新2013年2期