蔡赟姝, 盧志明
(上海大學(xué)上海市應(yīng)用數(shù)學(xué)和力學(xué)研究所,上海200072)
中國的證券市場,以1990年12月上海證券交易所和1991年4月深圳證券交易所開始營業(yè)為標(biāo)志,已走過了20多年的發(fā)展歷程.作為一個新興的發(fā)展中市場,其市場結(jié)構(gòu)、市場規(guī)則等方面還不夠成熟、規(guī)范.證券市場的穩(wěn)定對于金融市場乃至整個國民經(jīng)濟(jì)的平穩(wěn)運(yùn)行都具有非常重要的意義,因此,研究股票指數(shù)的變化規(guī)律及波動特性,無論是對政府部門還是對投資者都具有重要意義.股票指數(shù)是非線性、非平穩(wěn)的時間序列.我國股市數(shù)據(jù)具有時間序列短、隨機(jī)因素多、價格波動變化劇烈等特點(diǎn)[1].這些特點(diǎn)對金融時間序列的分析提出了較高的要求,在其實(shí)證研究中需要一種更為有效的方法或工具.
近年來,金融領(lǐng)域的跨學(xué)科研究受到了廣泛關(guān)注,許多學(xué)者將數(shù)學(xué)、物理學(xué)以及工程等領(lǐng)域的理論、方法、技術(shù)等運(yùn)用于金融時間序列的研究,并取得了豐碩的成果[2-3].信號分析技術(shù)作為其中的一種有力工具,已被運(yùn)用于金融時間序列的分析中.經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)方法是Huang等[4]于1998年首次提出的一種新的信號處理方法.1999年,Huang等[5]又對該方法進(jìn)行了改進(jìn).與以往的信號分析方法不同,EMD方法并不預(yù)設(shè)基函數(shù),而是預(yù)先選擇好判據(jù),基于信號本身所包含的特征尺度進(jìn)行分解,得到有限階內(nèi)模函數(shù)(intrinsic mode functions,IMFs).EMD方法對數(shù)據(jù)沒有平穩(wěn)性和線性的要求,具有自適應(yīng)性的特點(diǎn),能更好地保留原有信號的特征.該方法是對傳統(tǒng)信號分析方法的發(fā)展和突破,已在自然科學(xué)、工程等領(lǐng)域引起了廣泛的關(guān)注[5-7],并在非線性、非平穩(wěn)數(shù)據(jù)處理中得到了更符合物理實(shí)際的解釋和說明.2003年,Huang等[8]首次將該方法引入金融時序的分析.此后,國內(nèi)外一些學(xué)者也陸續(xù)嘗試將該方法用于石油價格預(yù)測[9]、經(jīng)濟(jì)增長波動[10]、股指日收益率[11]等金融領(lǐng)域的研究,取得了較好的效果.本研究主要將該方法用于上證綜合指數(shù)(Shanghai composite index,SCI)時間序列的分析.對于上證綜合指數(shù)已有較多的研究,如自回歸(autoregressive,AR)模型,自回歸滑動平均(autoregressive moving average,ARMA)模型、單位根在內(nèi)的差分模型以及自回歸條件異方差(autoregressive conditional heteroskedasticity,ARCH)模型、廣義自回歸條件異方差(generalised autoregressive conditional heteroskedasticity,GARCH)模型等[12-13],也獲得了較好的波動特點(diǎn)和統(tǒng)計(jì)結(jié)果,但這些分析方法往往是在單一尺度上進(jìn)行的,而基于EMD方法的多尺度分析更能捕捉到上證綜合指數(shù)不同尺度的波動特點(diǎn)和統(tǒng)計(jì)特性.
內(nèi)模函數(shù)描述性定義[4-5]由以下 2點(diǎn)給出:①極值點(diǎn)的個數(shù)和過零點(diǎn)的數(shù)目相等,或者最多相差為1;②在任意一點(diǎn),由極大值和極小值構(gòu)成的包絡(luò)的平均值為0.為了從原始信號中分解出內(nèi)模函數(shù),Huang等[4]給出了經(jīng)驗(yàn)?zāi)B(tài)分解方法,過程如下:①找到信號x(t)所有的極值點(diǎn);②用3次樣條曲線擬合出上下極值點(diǎn)的包絡(luò)線emax(t)和emin(t),并求出上下包絡(luò)線的平均值,即m(t)=(emax(t)+ emin(t))/2,并在x(t)中減去它,即h(t)=x(t)-m(t);③根據(jù)預(yù)設(shè)判據(jù),判斷h(t)是否為IMFs,如果不是,則以h(t)代替x(t),重復(fù)步驟①和步驟②,直到h(t)滿足判據(jù),則h(t)即為需要提取的內(nèi)模函數(shù)Ck(t);④每得到一階IMFs,就從原信號中將其扣除,重復(fù)以步驟①~步驟③,直到信號最后剩余部分rn(t)為單調(diào)序列或者常值序列.
經(jīng)過EMD方法分解,將原始信號x(t)分解成了一系列IMFs以及剩余部分的線性疊加,即
式中,Ci(t)為第i階IMF.Huang等[4]將這樣的處理過程形象地比喻為“篩”過程(sifting process).最后,原始數(shù)據(jù)序列可用這些IMFs分量以及一個均值或趨勢來表示.由于每一個IMFs分量代表一組特征尺度的數(shù)據(jù)序列,“篩”過程實(shí)際上是將原始數(shù)據(jù)序列分解為各種不同特征波形的疊加,每一個IMFs分量既可以是線性的也可以是非線性的.圖1為IMFs例子.
圖1 IMFs例子Fig.1 Example of IMFs
股票指數(shù)是典型的非線性、非平穩(wěn)的金融時間序列,尤其是處于成長期的我國股市數(shù)據(jù),更具有時間序列短、隨機(jī)因素多、價格波動變化劇烈等特點(diǎn).股票指數(shù)時間序列分析方法應(yīng)與普通的信號處理方法有所不同.因此,本研究嘗試將EMD方法用于上證綜合指數(shù)日收盤價數(shù)據(jù)的處理和分析.
本研究數(shù)據(jù)主要采用上證綜合指數(shù)(000001).該指數(shù)從總體上反映了上海證券交易所上市股票的價格變動情況.數(shù)據(jù)來源于新浪財(cái)經(jīng),主要針對1994年之后上證綜合指數(shù)日收盤價數(shù)據(jù)、典型的上漲和下跌時間段的日收盤價數(shù)據(jù)進(jìn)行EMD分解及分析.
對1994年1月3日—2010年9月30日上證綜合指數(shù),共4 074個交易日的日收盤價格數(shù)據(jù)進(jìn)行EMD分解,共得到了9階內(nèi)模函數(shù)和剩余項(xiàng),如圖2所示.可以發(fā)現(xiàn),IMFs按頻率由高到低排列,分解得到的剩余部分是單調(diào)的趨勢項(xiàng).因此,用EMD方法對金融時間序列進(jìn)行處理,可以將原時間序列分解為不同尺度的分量,進(jìn)而通過對分量的研究達(dá)到研究原序列的目的.
圖2 上證綜合指數(shù)4 074個交易日收盤價格數(shù)據(jù)的EMD分解結(jié)果Fig.2 EMD results of closing price data of SCI(4 074 trading days)
IMF1的高頻振蕩能很好地刻畫上證綜合指數(shù)的波動細(xì)節(jié).直觀上可以看出,原序列的波動都能從IMF1中找到.可見,IMF1反映的是上證綜合指數(shù)日線的波動細(xì)節(jié).IMF2,IMF3能刻畫上證綜合指數(shù)日線頻率較高的波動.IMF4,IMF5能刻畫上證綜合指數(shù)日線中的高頻波動,但與IMF1~I(xiàn)MF4相比,其反映的波動細(xì)節(jié)要少.同時發(fā)現(xiàn),在2006年下半年附近的波動幅度比之前的波動要明顯.IMF6~I(xiàn)MF9各模態(tài)的波動頻率低于IMF1~I(xiàn)MF5,其波動尺度也較大,在2007年底2008年初附近有較大幅度的波動.觀察剩余項(xiàng),發(fā)現(xiàn)其并不反映上證綜合指數(shù)日線的波動,而是一條反映大體上升趨勢的曲線.
1994年1月3日—2010年9月30日上證綜合指數(shù)日收盤價數(shù)據(jù),經(jīng)EMD分解重構(gòu)后的波動和波動率如圖3所示.可見,在1994—1996年,波動幅度比較大,其原因主要是當(dāng)時我國股市正處于起步階段,市場較不穩(wěn)定,加之我國證券市場現(xiàn)行的漲跌停板制度是從1996年12月26日才開始實(shí)施的.這在先前僅僅通過模態(tài)重構(gòu)的絕對波動圖中是無法發(fā)現(xiàn)的.在2006—2009年期間,波動幅度也比較大.在這期間,中國股市經(jīng)歷了從未有過的大漲和大跌,2007年10月中旬一度達(dá)到6 000多點(diǎn)的高位.這一過程無論在波動率的圖中還是在各階模態(tài)中都有所體現(xiàn),在此期間,股市具有較大的能量.
對上證綜合指數(shù)1994年1月3日—2010年9月30日的日收盤價格數(shù)據(jù)進(jìn)行EMD分解,并對分解后的各階IMFs進(jìn)行白噪聲顯著性檢驗(yàn)[14],以判斷是否存在只包含噪聲而無其他信息的模態(tài),結(jié)果如圖4所示,其中虛線為白噪聲理論線,實(shí)線為95%置信水平線,9個點(diǎn)分別代表實(shí)證數(shù)據(jù)IMF1~I(xiàn)MF9的檢驗(yàn)值.可見,這些值均在實(shí)線上方,表明在95%置信水平下,各階IMFs與白噪聲相比是顯著的,上證綜合日指數(shù)經(jīng)EMD分解后得到的各階IMFs都不是白噪聲,包含有一定的實(shí)際物理(經(jīng)濟(jì)學(xué))信息.
圖3 上證綜合指數(shù)日收盤價格數(shù)據(jù)經(jīng)EMD分解重構(gòu)后的IMF1~I(xiàn)MF2的波動和波動率Fig.3 Volatility and variability of closing price data of SCI based on the IMF1~I(xiàn)MF2
圖4 各階IMFs的白噪聲顯著性檢驗(yàn)Fig.4 Significance test of IMFs of white noise
對各階IMFs進(jìn)行基本統(tǒng)計(jì)分析,發(fā)現(xiàn)樣本偏斜度基本對稱,峰度絕大部分均大于3.與正態(tài)分布相比,各階模態(tài)呈現(xiàn)“尖峰厚尾”的現(xiàn)象.這一結(jié)果的意義在于,大致確定了上證綜合指數(shù)各不同頻率數(shù)據(jù)的分布形狀.
由于t分布的概率密度函數(shù)比正態(tài)分布具有更厚的尾部,因此,嘗試用t分布來描述各階IMFs的厚尾特性.自由度為n的t分布的概率密度函數(shù)為
繪制Quantiles-Quantiles(Q-Q)圖對數(shù)據(jù)進(jìn)行擬合,實(shí)證數(shù)據(jù)根據(jù)理論分布繪制出的點(diǎn)應(yīng)近似為一條直線,任何偏離這條直線的點(diǎn)都是偏離了該規(guī)定的分布.圖5為用正態(tài)分布繪制的IMF1和IMF2的Q-Q圖,可見明顯不在一條直線上.圖6為自由度n=3的t分布(記為t(3))的Q-Q圖,可見,除了端部,幾乎都在一條直線上.其他各階IMFs也有類似結(jié)果.通過對比Q-Q圖可以發(fā)現(xiàn),用t(3)分布擬合好于用正態(tài)分布擬合.
圖5 基于正態(tài)分布的上證綜合日指數(shù)IMF1和IMF2的Q-Q圖Fig.5 Q-Q plot of IMF1 and IMF2 of SCI based on normal distribution
通過觀察上證綜合指數(shù)的EMD分解結(jié)果,可以發(fā)現(xiàn),上證綜合指數(shù)及其IMFs的變動有一定的周期性,并且不同的IMFs反映了不同時間尺度上的波動信息.例如,對上證綜合日指數(shù)收盤價數(shù)據(jù)經(jīng)EMD分解后的各階IMFs進(jìn)行重構(gòu),通過IMF3+IMF4+ IMF5+IMF6+IMF7+IMF8+IMF9+RES所得的曲線(見圖7(a))與計(jì)算得到的周平均指數(shù)曲線(見圖7(b))相似;通過 IMF5+IMF6+IMF7+IMF8+ IMF9+RES所得的曲線與計(jì)算所得的月平均指數(shù)曲線類似.這表明,EMD方法能夠提取金融時序中不同波動周期的分量.研究股市波動的各個周期,了解上證綜合指數(shù)的各種周期特征,無論是對于投資者還是政府部門都具有非常大的現(xiàn)實(shí)意義.
圖6 基于t(3)分布的上證綜合日指數(shù)IMF1和IMF2的Q-Q圖Fig.6 Q-Q plot of IMF1 and IMF2 of SCI based on t(3)distribution
圖7 重構(gòu)的IMF3~RES所得曲線和周平均指數(shù)曲線Fig.7 Curves of reconstruction of the data from the sum of IMF3~RES and weekly averaged index
本研究運(yùn)用平均周期法來計(jì)算上證綜合指數(shù)經(jīng)EMD分解后的各階IMFs的周期.平均周期法是根據(jù)波峰和波谷的數(shù)目給出上證綜合指數(shù)的震蕩周期,即
式中,N1為時間序列中的數(shù)據(jù)點(diǎn)個數(shù),N2為極大值點(diǎn)個數(shù)或極小值點(diǎn)個數(shù).
通過計(jì)算1994年1月3日—2010年9月30日上證綜合日指數(shù)經(jīng)EMD分解后的各階IMFs的周期(見表1),發(fā)現(xiàn)各時間尺度依次遞增,其中IMF2,IMF4和IMF6的平均周期分別為6.870,33.950和162.960 d,表明這3個模態(tài)大致反映了周、月和半年尺度上的波動.
表1 上證綜合指數(shù)各階IMFs的周期Table 1 Periods of the IMFs of SCI
此外,通過對上證綜合指數(shù)上漲階段(2005年12月12日—2007年10月15日)和下跌階段(2007年10月24日—2008年10月16日)的日收盤價數(shù)據(jù)進(jìn)行周期性分析,發(fā)現(xiàn)在上漲和下跌過程中,各階IMFs具有較好的周期性特征,具體結(jié)果如表2所示.為進(jìn)一步觀察典型的上漲和下跌過程的波動特點(diǎn),繪制了這兩個階段的波動率圖(見圖8).可以看到,上漲初期的波動幅度比較小,隨著上漲過程的推進(jìn),幅度逐漸增大;下跌過程則表現(xiàn)出更為明顯的震蕩,且幅度大于上漲過程.結(jié)合各階IMFs的周期、標(biāo)準(zhǔn)差(見表3)及波動率等結(jié)果,從整體指數(shù)走勢來看,指數(shù)下跌過程快于上漲過程,且下跌時間段各階IMFs的周期、波幅均大于上漲時間段,其差值也隨著IMFs階數(shù)的增大逐漸增大.
表2 上證綜合指數(shù)典型上漲和下跌階段各階IMFs的周期Table 2 Periods of the IMFs on typical rising and dropping processes of SCI
表3 上證綜合指數(shù)典型上漲和下跌階段各階IMFs的標(biāo)準(zhǔn)差Table 3 Standard deviations of the IMFs on typical rising and dropping processes of SCI
圖8 上證綜合指數(shù)典型上漲和下跌階段的指數(shù)和波動率Fig.8 Index and variability on typical rising and dropping processes of SCI
EMD方法基于信號本身所包含的尺度進(jìn)行分解,具有良好的自適應(yīng)性,對數(shù)據(jù)沒有線性和平穩(wěn)性的要求.本研究將EMD方法用于非線性、非平穩(wěn)特性的金融時間序列分析,將上證綜合日收盤價指數(shù)分解為多個不同尺度的IMFs和剩余項(xiàng).研究結(jié)果表明,通過對分解后各階IMFs進(jìn)行白噪聲顯著性檢驗(yàn),發(fā)現(xiàn)并不存在白噪聲的模態(tài),各模態(tài)包含著一定的實(shí)際物理(經(jīng)濟(jì)學(xué))信息.隨后,對各模態(tài)進(jìn)行基本統(tǒng)計(jì)分析和分布擬合,發(fā)現(xiàn)其“尖峰厚尾”的特點(diǎn)基本服從自由度為3的t分布.通過對各階IMFs進(jìn)行周期性分析,運(yùn)用平均周期法計(jì)算各階IMFs的周期,揭示了各階模態(tài)間不同的波動信息,并得到了周、月、半年等相關(guān)時間尺度的波動特點(diǎn),這表明EMD方法可以有效地提取金融時序中不同波動周期的分量.此外,對典型上漲和下跌階段的周期性進(jìn)行了分析,發(fā)現(xiàn)不同尺度的模態(tài)在這兩個階段都具有較好的周期性特點(diǎn),上漲初期的波動幅度比較小,隨著上漲過程的推進(jìn),幅度逐漸增大.從整體指數(shù)走勢來看,指數(shù)下跌過程快于上漲過程,且下跌時間段各階IMFs的周期、波幅均大于上漲時間段.
[1] 韓仙華,蔣敏.金融系統(tǒng)復(fù)雜性與經(jīng)濟(jì)物理學(xué)模型——物理-經(jīng)濟(jì)-股市:股市波動的經(jīng)濟(jì)物理學(xué)分析[J].系統(tǒng)辯證學(xué)學(xué)報(bào),2002,10(3):35-39.
[2] GABAIXX,GOPIKRISHNANP,PLEROUV,et al.A theory of power-law distributions in financial market fluctuations[J].Nature,2003,423(6937):267-270.
[3] PLEROU V, GOPIKRISHNAN P,STANLEY H E.Econophysics:two-phase behaviour of financial markets[J].Nature,2003,421(6919):130.
[4] HUANGN E,SHENZ,LONGS R,et al.The empirical mode decomposition and the Hilbertspectrum for nonlinear and non-stationary time series analysis[J].Proceedings:Mathematical,Physical and Engineering Sciences,1998,454(1971):903-995.
[5] HUANGN E,SHENZ,LONGS R.A new view of nonlinear water waves:the Hilbert spectrum[J].Annual Review of Fluid Mechanics,1999,31(1):417-457.
[6] DUFFYD G.The application of Hilbert-Huang transforms to meteorological datasets[J].Journal of Atmospheric and Oceanic Technology,2004,21(4):599-611.
[7] HUANGY X,SCHMITTF G,LUZ M,et al.An amplitude-frequency study of turbulent scaling intermittency using empirical mode decomposition and Hilbert spectral analysis[J].Europhysics Letters,2008,84(4):40010.
[8] HUANGN E,WUM L,QUW,et al.Applications of Hilbert-Huang transform to non-stationary financial time series analysis[J].Applied Stochastic Models in Business and Industry,2003,19(3):245-268.
[9] YUL,LAIK,WANGS,et al.Oil price forecasting with an EMD-based multiscale neuralnetwork learning paradigm[C]∥ The InternationalConference on Computational Science.2007:925-932.
[10] 秦賢宏,段學(xué)軍,李慧.基于EMD的我國經(jīng)濟(jì)增長波動多尺度分析[J].地理與地理信息科學(xué),2008,24 (2):44-47.
[11] 丁志宏,謝國權(quán).金融時間序列多分辨率實(shí)證研究的EMD方法[J].經(jīng)濟(jì)研究導(dǎo)刊,2009(6):61-63.
[12] 陳志娟.上證指數(shù)收益率的ARCH族型的實(shí)證分析[J].統(tǒng)計(jì)與決策,2010(17):141-143.
[13] 孔祥芝,王延清.基于ARIMA-GARCH模型和極值理論的中國股市[J].中國管理信息化,2010(9):57-60.
[14] WUZ H,HUANGN E.A study of the characteristics of white noise using the empirical mode decomposition method[J].Proceedings of the Royal Society of London SeriesA:Mathematical,Physicaland Engineering Sciences,2004,460(2046):1597-1611.