馬亮亮
(攀枝花學(xué)院數(shù)學(xué)與計(jì)算機(jī)學(xué)院,四川攀枝花617000)
一種基于Hilbert-Huang 變換和ARM A 模型的時(shí)間序列預(yù)測(cè)方法
馬亮亮
(攀枝花學(xué)院數(shù)學(xué)與計(jì)算機(jī)學(xué)院,四川攀枝花617000)
提出了一種基于Hilbert-Huang變換和ARMA模型的時(shí)間序列預(yù)測(cè)方法。采用Hilbert-Huang變換將原時(shí)間序列分解成若干個(gè)平穩(wěn)的固有模態(tài)函數(shù)分量,求出每一個(gè)固有模態(tài)函數(shù)分量的瞬時(shí)頻率和瞬時(shí)幅值,然后對(duì)每一個(gè)固有模態(tài)函數(shù)分量的瞬時(shí)頻率和瞬時(shí)幅值序列建立ARMA模型,最后通過合成得到原時(shí)間序列的ARMA預(yù)測(cè)模型。實(shí)驗(yàn)結(jié)果表明,此方法可有效地應(yīng)用于非平穩(wěn)時(shí)間序列的預(yù)測(cè)。
Hilbert-Huang變換;ARMA模型;瞬時(shí)頻率;瞬時(shí)幅值;固有模態(tài)函數(shù)
長(zhǎng)期以來非平穩(wěn)時(shí)間序列囿于理論的發(fā)展,只能轉(zhuǎn)化為平穩(wěn)的時(shí)間序列來處理。近年來,隨著短時(shí)Fourier變換(Short Time Fourier Trans?form,STFT)[1]、W igner-Ville分布[2]、小波分析等[1-3]新方法的出現(xiàn),人們對(duì)于非平穩(wěn)時(shí)間序列的認(rèn)識(shí)和研究取得了較大的成就。短時(shí)Fourier變換依賴于傳統(tǒng)的Fourier譜分析,操作時(shí)需假設(shè)待分析的數(shù)據(jù)是分段平穩(wěn)的;W igner-Ville分布則改進(jìn)和優(yōu)化了短時(shí)Fourier變換的部分缺點(diǎn)和性能;小波分析是目前比較流行的非平穩(wěn)時(shí)間序列分析方法[4]。
ARMA模型是一種新型的時(shí)間序列分析方法,能比較深刻和集中地表達(dá)動(dòng)態(tài)系統(tǒng)的客觀規(guī)律。但是,ARMA模型只適用于平穩(wěn)時(shí)間序列的分析,而實(shí)際中的時(shí)間序列本質(zhì)上是非平穩(wěn)的,因此,直接采用ARMA模型對(duì)動(dòng)態(tài)系統(tǒng)的客觀規(guī)律進(jìn)行分析效果不佳。如果采用非線性ARMA預(yù)測(cè)模型(如時(shí)變參數(shù)NARMA等模型),則會(huì)導(dǎo)致計(jì)算量顯著增加[5-6]。
Hilbert-Huang變換是由Huang等[7]提出的一種較新的非平穩(wěn)時(shí)間序列分析方法。該方法兼容了小波分析的所有優(yōu)點(diǎn),在分辨率上消除了小波分析的模糊性和不清晰性,且有更準(zhǔn)確的譜結(jié)構(gòu)。Hilbert-Huang變換的算法分析過程為:首先采用經(jīng)驗(yàn)?zāi)J椒纸猓‥mpiricalMode Decomposi?tion,EMD)方法將非平穩(wěn)的時(shí)間序列分解為若干個(gè)固有模態(tài)函數(shù)(Intrinsic Mode Function,IMF)之和,然后再對(duì)各個(gè)固有模態(tài)函數(shù)(IMF)分量進(jìn)行Hilbert變換,得到各個(gè)固有模態(tài)函數(shù)分量的瞬時(shí)頻率和瞬時(shí)幅值,最后將瞬時(shí)頻率和瞬時(shí)幅值組合得到原序列完整的Hilbert譜。由于固有模態(tài)函數(shù)分量的瞬時(shí)頻率和瞬時(shí)幅值均是平穩(wěn)的時(shí)間序列,且包含了原序列的所有信息,因此,通過對(duì)這些瞬時(shí)頻率和瞬時(shí)幅值序列進(jìn)行分析可有效提取原序列的信息[8]。本文在Hilbert變換的基礎(chǔ)上,對(duì)各個(gè)固有模態(tài)函數(shù)分量的瞬時(shí)頻率和瞬時(shí)幅值序列分別建立ARMA模型,并以此對(duì)研究對(duì)象進(jìn)行分析。
Hilbert-Huang變換包括經(jīng)驗(yàn)?zāi)J椒纸夂虷il?bert變換兩個(gè)部分,其中經(jīng)驗(yàn)?zāi)J椒纸馐瞧浜诵牟糠帧?/p>
1.1 經(jīng)驗(yàn)?zāi)J椒纸?/p>
假設(shè)所研究的時(shí)間序列由簡(jiǎn)單的固有模態(tài)函數(shù)組成,將原時(shí)間序列分解為一系列表征時(shí)間尺度的固有模態(tài)函數(shù)分量,此過程也稱為篩選過程(The Shifting Processing)[4]。
對(duì)于給定的原時(shí)間序列y(t),其篩選過程如下:
1)分別找出原序列y(t)的所有極大值點(diǎn)和極小值點(diǎn),然后擬合序列的上、下包絡(luò)線ymax(t)和ymin(t),并計(jì)算其平均值x1(t):
2)用y(t)減去x1(t)得到z1(t),將z1(t)視為新的y(t),重復(fù)上述步驟;
3)重復(fù)k次直到均值趨于0,此時(shí)所得z1k(t)符合固有模態(tài)函數(shù)的定義要求,便得到了第1個(gè)固有模態(tài)函數(shù)分量c1(t);
4)從原時(shí)間序列中減去c1(t),得到
5)將r1(t)作為原時(shí)間序列,重復(fù)步驟1)至4),得到第2個(gè)固有模態(tài)函數(shù)分量c2(t),重復(fù)n次,得到n個(gè)固有模態(tài)函數(shù)分量。
最終原時(shí)間序列可表示為
1.2 Hilbert變換
經(jīng)驗(yàn)?zāi)J椒纸鈱⒃瓡r(shí)間序列自適應(yīng)地分解為若干個(gè)固有模態(tài)函數(shù)分量之和,使瞬時(shí)頻率具有物理意義。因此可以通過Hilbert變換計(jì)算出每個(gè)固有模態(tài)函數(shù)分量的瞬時(shí)頻率和瞬時(shí)幅值。
對(duì)(3)式中的ci(t)(i=1,2,…,n)分別進(jìn)行Hilbert變換
其中P為柯西主值。
由ci(t)和H[ci(t)]構(gòu)造解析序列時(shí)變幅值ai(t)的時(shí)頻分布定義為分量ci(t)的Hil?bert譜,記為
假設(shè)采用經(jīng)驗(yàn)?zāi)J椒纸夥椒▽?duì)原時(shí)間序列進(jìn)行分解得到了n個(gè)固有模態(tài)函數(shù)分量ci(t) (i=1,2,…,n),對(duì)所有的固有模態(tài)函數(shù)分量進(jìn)行Hilbert變換后得到瞬時(shí)頻率fi(t)(i=1,2,…,n)和瞬時(shí)幅值ai(t)(i=1,2,…,n),其中fi(t)和ai(t)分別表示第i個(gè)固有模態(tài)函數(shù)分量ci(t)的瞬時(shí)頻率和瞬時(shí)幅值。這樣,通過Hilbert-Huang變換,原時(shí)間序列y(t)的信息就完全可以由這些瞬時(shí)頻率和瞬時(shí)幅值來刻畫,因此通過提取所有瞬時(shí)頻率fi(t)和瞬時(shí)幅值ai(t)的信息,可以得到原時(shí)間序列y(t)的信息。
對(duì)任意的平穩(wěn)時(shí)間序列x(t)建立如下的自回歸移動(dòng)平均模型ARMA(p,q)[10-13]其中φi(i=1,2,…,p)、φj(j=1,2,…,q)分別是序列x(t)的自回歸模型AR(p)和移動(dòng)平均模型MA(q)的模型參數(shù);ε(t)是模型的殘差,是均值為零、方差為σ2的白噪聲序列。
基于Hilbert-Huang變換和ARMA模型的時(shí)間序列預(yù)測(cè)方法如下:
1)對(duì)原時(shí)間序列y(t)進(jìn)行經(jīng)驗(yàn)?zāi)J椒纸?,假設(shè)得到n個(gè)固有模態(tài)函數(shù)分量ci(t)(i=1,2,…,n);
2)由式(4)~(9)求出每一個(gè)固有模態(tài)函數(shù)分量ci(t)的瞬時(shí)頻率序列fi(t)和瞬時(shí)幅值序列ai(t);
3)為消除原時(shí)間序列的幅值對(duì)模型殘差方差的影響,對(duì)fi(t)和ai(t)分別進(jìn)行歸一化處理,得到新的時(shí)間序列f^i(t)和a^i(t):
其中φ^i和φ^j分別為模型的預(yù)測(cè)參數(shù)值。
原時(shí)間序列數(shù)據(jù)取自青海海西州第一人民醫(yī)院的糖尿病發(fā)病率,對(duì)應(yīng)的時(shí)間序列圖如圖1所示。其中橫坐標(biāo)表示2001年1月至2007年12月的84個(gè)月份數(shù)據(jù),縱坐標(biāo)表示糖尿病發(fā)病率(百分比)。從圖1可以看出,原發(fā)病率數(shù)據(jù)y(t)的均值、相關(guān)函數(shù)隨著時(shí)間的改變而上下劇烈振動(dòng),是非平穩(wěn)的時(shí)間序列。
圖1 糖尿病發(fā)病率時(shí)間序列圖Fig.1 Tim e seriesof diabetes incidence rate
將原發(fā)病率數(shù)據(jù)分為兩個(gè)部分,用2001年1月至2006年12月的前72個(gè)數(shù)據(jù)來預(yù)測(cè)2007年1月至12月的后12個(gè)數(shù)據(jù)。采用經(jīng)驗(yàn)?zāi)J椒纸夥椒▽?duì)原序列進(jìn)行分解,得到1個(gè)固有模態(tài)函數(shù)分量c1(t)和1個(gè)殘余函數(shù)r1(t)。對(duì)固有模態(tài)函數(shù)分量c1(t)進(jìn)行Hilbert變換,得到瞬時(shí)頻率和瞬時(shí)幅值(見圖2)。
圖2 固有模態(tài)函數(shù)分量的瞬時(shí)頻率和瞬時(shí)幅值Fig.2 Inslantaneous frequency and am p litude for intrinsicm ode function com ponent
對(duì)瞬時(shí)頻率f1(t)和瞬時(shí)幅值a1(t)進(jìn)行歸一化處理,得到f1^(t)和a^1(t)。對(duì)序列f1^(t)和a^1(t)分別建立ARMA模型:
合成f^i(t)和a^i(t),便得到原時(shí)間序列y(t)的預(yù)測(cè)模型:
利用(19)式對(duì)2007年1月至12月的測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè)檢驗(yàn),結(jié)果如圖3所示。從圖3可以清楚地看出,模型的預(yù)測(cè)值與實(shí)際的糖尿病發(fā)病率值很接近(除極少數(shù)點(diǎn)外),變換趨勢(shì)基本吻合,且整體的預(yù)測(cè)精度較高,表明本文所建立的基于Hilbert-Huang變換和ARMA模型的時(shí)間序列預(yù)測(cè)方法是正確、合理的。
對(duì)于非平穩(wěn)時(shí)間序列,本文提出了基于Hil?bert-Huang變換和ARMA模型的時(shí)間序列預(yù)測(cè)方法。該方法在對(duì)原非平穩(wěn)數(shù)據(jù)建立ARMA模型之前,先采用Hilbert-Huang變換對(duì)原時(shí)間序列進(jìn)行預(yù)處理,得到瞬時(shí)頻率和瞬時(shí)幅值均是平穩(wěn)的時(shí)間序列(它們包含了原時(shí)間序列的最主要信息),然后對(duì)每個(gè)瞬時(shí)頻率和瞬時(shí)幅值序列分別建立ARMA模型,最后通過合成得到原時(shí)間序列的ARMA預(yù)測(cè)模型。通過對(duì)實(shí)驗(yàn)數(shù)據(jù)的分析,所得預(yù)測(cè)結(jié)果與真實(shí)值基本吻合,預(yù)測(cè)精度較高,驗(yàn)證了本文提出的方法能夠應(yīng)用于非平穩(wěn)時(shí)間序列的預(yù)測(cè)。
圖3 糖尿病發(fā)病率預(yù)測(cè)值Fig.3 Pred iction value of diabetes incidence rate
[1]張賢達(dá).現(xiàn)代信號(hào)處理[M].北京:清華大學(xué)出版社,1995.
[2]COHEN L.時(shí)頻分析:理論與應(yīng)用[M].白居憲,譯.西安:西安交通大學(xué)出版社,1998:50-65.
[3]李建平.小波分析與信號(hào)處理——理論、應(yīng)用及軟件實(shí)現(xiàn)[M].重慶:重慶大學(xué)出版社,1997.
[4]王海濤,宋藝.基于Hilbert-Huang變換的非平穩(wěn)隨機(jī)信號(hào)處理[J].網(wǎng)絡(luò)與信息,2009,23(7):17-18.
[5]程軍圣,于德介,楊宇.一種基于Hilbert-Huang變換和AR模型的滾動(dòng)軸承故障診斷方法[J].系統(tǒng)工程理論與實(shí)踐,2004,24(10):92-97.
[6]王文華,王宏禹.一種非平穩(wěn)隨機(jī)信號(hào)模型的時(shí)變參數(shù)估計(jì)算法性能研究[J].大連理工大學(xué)學(xué)報(bào),1997,37(1):97-102.
[7]HUANG N E,SHEN Z,LONG S R.The empirical mode decomposition and the Hilbert spectrum for non?linear and non-stationary time series analysis[J].Pro?ceedings of The Royal Society A:Mathematical,Physi?caland Engineering Sciences,1998,454:903-995.
[8]程軍圣,于德介,楊宇.基于支持矢量回歸機(jī)的Hil?bert-Huang變換端點(diǎn)效應(yīng)問題的處理方法[J].機(jī)械工程學(xué)報(bào),2006,42(4):23-31.
[9]HUANGN E,SHEN Z,LONG SR.A new view ofnon?linear water waves:The Hilbert spectrum[J].Annu Rev Fluid Mech,1999,31:417-457.
[10]馬亮亮.基于因子BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的胃潰瘍發(fā)病率預(yù)測(cè)[J].北京聯(lián)合大學(xué)學(xué)報(bào):自然科學(xué)版,2012,26(3):73-76.
[11]馬亮亮.基于粗糙集和RBF神經(jīng)網(wǎng)絡(luò)的腦梗塞發(fā)病率預(yù)測(cè)[J].西北民族大學(xué)學(xué)報(bào):自然科學(xué)版,2012,33(3):17-21.
[12]馬亮亮.基于PCA-ARIMA模型的高血壓發(fā)病率預(yù)測(cè)[J].河北北方學(xué)院學(xué)報(bào):自然科學(xué)版,2013,29(2):26-29.
[13]易丹輝.數(shù)據(jù)分析與EViews應(yīng)用[M].北京:中國統(tǒng)計(jì)出版社,2005.
A Prediction M ethod for Tim e Series Based on Hilbert-Huang Transform and ARM A M odel
MA Liang-liang
(College ofMathematicsand Computer,Panzhihua University,Panzhihua 617000,Sichuan,China)
A prediction method for time series based on Hilbert-Huang transform and ARMA model is proposed.The Hilbert-Huang transform is used to decompose the original time series into a number of intrinsic mode function components and the instantaneous frequencies and amplitudes of each intrinsic mode function component are obtained.Then the ARMA model of each instantaneous frequency and amplitude sequence is established.Finally,ARMA prediction model of the original sequence is obtained through compounding.Experimental examples demonstrate that the method based on Hilbert-Huang transform and ARMA model can be applied to predict non-stationary time series effectively.
Hilbert-Huang transform;ARMA model;instantaneous frequency;instanta?neousamplitude;intrinsicmode function
O29
A
1673-0143(2014)01-0028-04
(責(zé)任編輯:強(qiáng)士端)
2013-06-28
國家自然科學(xué)基金資助項(xiàng)目(60673192);四川省科技廳資助項(xiàng)目(2013JY0125);攀枝花學(xué)院校級(jí)培育項(xiàng)目(2012PY08);攀枝花學(xué)院校級(jí)科研項(xiàng)目(2012YB21);攀枝花學(xué)院院級(jí)科研創(chuàng)新項(xiàng)目(Y2013-04)
馬亮亮(1986—),男,講師,碩士,研究方向:數(shù)學(xué)模型和模型優(yōu)化。