李旭姣,張克勇
(中北大學(xué),山西太原030051)
隨著金融大數(shù)據(jù)時(shí)代的到來(lái),我國(guó)金融市場(chǎng)也日益發(fā)展和完善,如何準(zhǔn)確地測(cè)量和估計(jì)金融市場(chǎng)風(fēng)險(xiǎn)顯得非常重要。近年,由于數(shù)據(jù)存儲(chǔ)與處理技術(shù)的進(jìn)步,獲取高頻數(shù)據(jù)更加容易。與傳統(tǒng)的以日、月為頻度記錄的低頻數(shù)據(jù)相比,高頻數(shù)據(jù)中包含更全面的市場(chǎng)信息,有利于更加準(zhǔn)確地估計(jì)波動(dòng)率。由于從統(tǒng)計(jì)學(xué)的角度出發(fā),處理高頻數(shù)據(jù)非常困難,這方面的研究一直未能很好地進(jìn)行。直到Anderson和Bollerslev(2011)[1]提出了已實(shí)現(xiàn)波動(dòng)率(Realized Volatility,RV)這種能夠較好度量高頻數(shù)據(jù)波動(dòng)變化的方法,掀起了學(xué)者們對(duì)高頻數(shù)據(jù)研究的熱潮。
Anderson等人在研究中不斷對(duì)已實(shí)現(xiàn)波動(dòng)率進(jìn)行改進(jìn)與完善,在對(duì)西方國(guó)家發(fā)達(dá)的金融市場(chǎng)高頻數(shù)據(jù)研究過(guò)程中,發(fā)現(xiàn)已實(shí)現(xiàn)波動(dòng)率具有顯著的長(zhǎng)記憶性和非對(duì)稱性[2],并將已實(shí)現(xiàn)波動(dòng)率與條件協(xié)方差矩陣結(jié)合起來(lái)進(jìn)行實(shí)證分析[3],證明了已實(shí)現(xiàn)波動(dòng)率的長(zhǎng)記憶高峰VaR模型在波動(dòng)率的預(yù)測(cè)上優(yōu)于GARCH模型?;贛üller的異質(zhì)市場(chǎng)假說(shuō)理論,Corsi(2009)[4]提出了HAR-RV模型,通過(guò)日、月、周的已實(shí)現(xiàn)波動(dòng)率的自回歸過(guò)程,刻畫市場(chǎng)交易者的異質(zhì)性行為。后來(lái),多位學(xué)者對(duì)該模型進(jìn)行了多方面的擴(kuò)展。在國(guó)內(nèi),徐正國(guó)和張世英(2004)[5]從調(diào)整的(已實(shí)現(xiàn)波動(dòng)率)的長(zhǎng)記憶性與杠桿效應(yīng)的角度,建立了ARFIMAX模型,還將一維的高頻數(shù)據(jù)RV模型擴(kuò)展到多維的高頻數(shù)據(jù)中。魏宇(2010)[6]利用滬深300股指期貨的仿真交易數(shù)據(jù),通過(guò)對(duì)股市波動(dòng)預(yù)測(cè)模型的對(duì)比分析,得到ARFIMA-lnRV與SV-RV模型的預(yù)測(cè)能力都優(yōu)于GARCH模型。張波等(2009)[7]用已實(shí)現(xiàn)波動(dòng)率對(duì)滬指波動(dòng)的相關(guān)特性進(jìn)行實(shí)證研究,發(fā)現(xiàn) HAR-RV模型比ARFIMA模型能更有效地刻畫滬指波動(dòng)的長(zhǎng)記憶性,且其樣本外預(yù)測(cè)能力也更強(qiáng)。陳浪南、楊科(2013)[8]構(gòu)建了不對(duì)稱性HAR-CJ-DFIGARCH模型,并對(duì)中國(guó)股市高頻波動(dòng)率進(jìn)行了預(yù)測(cè)。
國(guó)內(nèi)外對(duì)最優(yōu)抽樣頻率的研究不多,一般都是基于“已實(shí)現(xiàn)”波動(dòng)估計(jì)量的具體形式來(lái)進(jìn)行的。最優(yōu)抽樣頻率的選擇方法大致可分為三種,波動(dòng)率特征圖法、利用日內(nèi)收益序列相關(guān)性確定f和基于最小化MSE準(zhǔn)則確定f[9]。Torben等學(xué)者(1999)[10]使用波動(dòng)率特征圖的方法,以平均已實(shí)現(xiàn)波動(dòng)率和對(duì)應(yīng)的頻率描點(diǎn),對(duì)最優(yōu)頻率進(jìn)行選擇。Bandi和Russell[11]在文中指出,應(yīng)當(dāng)首先建立已實(shí)現(xiàn)方差估計(jì)量的條件均方誤差(MSE)表達(dá)式,作為采樣頻率的函數(shù),再對(duì)采樣頻率選擇的最低條件MSE進(jìn)行優(yōu)化。Christensen等人(2014)[12]在研究中指出,近年來(lái),高頻數(shù)據(jù)多使用五分鐘作為采樣頻率,然而,在五分鐘頻率下,脈沖波動(dòng)很容易被誤認(rèn)為是跳躍,使得人們對(duì)跳的普遍性存在產(chǎn)生誤解。國(guó)外對(duì)高頻數(shù)據(jù)抽樣頻率擇優(yōu)方面的研究越來(lái)越深入,方法也越來(lái)越精確,而國(guó)內(nèi)對(duì)這方面的研究還停留在列舉幾個(gè)常見(jiàn)頻率再進(jìn)行對(duì)比選擇的階段,如李勝歌、張世英(2008)[13]采用列舉法,以已實(shí)現(xiàn)波動(dòng)率的均方誤差作為標(biāo)準(zhǔn)對(duì)最優(yōu)抽樣頻率的選擇進(jìn)行研究。這無(wú)形中就損失了很多有效信息,造成對(duì)波動(dòng)率的估計(jì)不準(zhǔn)確,進(jìn)而無(wú)法更好地測(cè)量金融風(fēng)險(xiǎn)。本文首先以1到240分鐘作橫軸、以含跳的已實(shí)現(xiàn)平均波動(dòng)率[14]作為縱軸描散點(diǎn)圖,畫出波動(dòng)率特征圖(BSP),結(jié)合均方誤差MSE最小化,求出最優(yōu)抽樣頻率(分鐘);再構(gòu)建BSPHAR-RV模型,在最優(yōu)頻率下對(duì)高頻數(shù)據(jù)時(shí)間序列波動(dòng)率進(jìn)行估計(jì),并與常用的5min、10min抽樣頻率下的估計(jì)結(jié)果進(jìn)行對(duì)比,驗(yàn)證結(jié)論。
1.異質(zhì)市場(chǎng)假說(shuō)理論
異質(zhì)市場(chǎng)假說(shuō)理論(Muller,1993)指出,市場(chǎng)中存在不同類型的交易者,他們?cè)陲L(fēng)險(xiǎn)偏好、信息獲取、理性程度等各個(gè)方面存在著差異,這些差異的存在最終導(dǎo)致交易行為的差異。與傳統(tǒng)的時(shí)間序列處理方法基于有效市場(chǎng)假說(shuō)理論相比,已實(shí)現(xiàn)波動(dòng)率模型基于異質(zhì)市場(chǎng)假說(shuō),即不再把市場(chǎng)的參與者看成是同質(zhì)的和理性的,而認(rèn)為市場(chǎng)交易者存在差異,如小企業(yè)效應(yīng)、季節(jié)效應(yīng)等。
2.已實(shí)現(xiàn)波動(dòng)率 (Realized Volatility,RV)
定義P(t)是金融資產(chǎn)在t時(shí)刻的價(jià)格,則在Δ時(shí)段上,金融資產(chǎn)的對(duì)數(shù)收益率可定義為:r(t,Δ)=lnP(t,Δ)-lnP(t)。其中,Δ>0表示時(shí)間間隔。例如,當(dāng)Δ=1時(shí),r(t,1)=lnP(t,1)-lnP(t)表示日間對(duì)數(shù)收益率。
在收益率均值為零的條件下,第t天的已實(shí)現(xiàn)波動(dòng)率RV定義為:
其中,Δ是兩次采樣的時(shí)間間隔,1/Δ是采樣頻率。當(dāng)Δ無(wú)限小趨于零時(shí),即意味著取樣是連續(xù)的,此時(shí)的已實(shí)現(xiàn)波動(dòng)率收斂于積分波動(dòng)率(Integrated
3.HAR-RV模型 (Heterogeneous Autoregressive model for Realized volatility,HAR-RV)
在異質(zhì)市場(chǎng)假說(shuō)框架下,HAR-RV模型將市場(chǎng)交易者分為短期交易者、中期交易者和長(zhǎng)期交易者,短期交易不僅會(huì)受滯后期的影響,還會(huì)受同期中期交易的影響,中期交易也是如此。為了簡(jiǎn)便,分別把這三類交易者定義為日交易者、周交易者和月交易者。它們的已實(shí)現(xiàn)波動(dòng)率定義如下(一周交易日為5天,一個(gè)月交易日為22天):
短期、中期和長(zhǎng)期交易的已實(shí)現(xiàn)波動(dòng)率如下:
整理得到HAR-RV模型:
金融高頻時(shí)間序列的精確性受到兩種誤差的干擾:測(cè)量誤差和微觀結(jié)構(gòu)誤差。因此,最優(yōu)頻率的選擇至關(guān)重要,抽樣頻率越高,測(cè)量誤差越小,微觀結(jié)構(gòu)誤差越大。一方面,選擇過(guò)高的抽樣頻率,可減小測(cè)量誤差,卻會(huì)導(dǎo)致市場(chǎng)微觀結(jié)構(gòu)誤差的影響增大;別一方面,降低抽樣頻率,有效降低了微觀結(jié)構(gòu)誤差的影響,卻使測(cè)量誤差成為主要干擾因素。最優(yōu)頻率的選擇必須使得以上兩類誤差的總和取得平衡。另外,我國(guó)股市市場(chǎng)一天的交易時(shí)長(zhǎng)為240分鐘,于國(guó)外市場(chǎng)一天390分鐘交易時(shí)長(zhǎng)相比較短,所以我國(guó)的金融高頻數(shù)據(jù)抽樣頻率取值范圍要小,如果抽樣頻率取1分鐘間隔以下的數(shù)值,對(duì)實(shí)際應(yīng)用的價(jià)值不大,因此,取最短抽樣間隔為1分鐘,最大抽樣頻率為240分鐘。選取收益率序列的雙冪變差已實(shí)現(xiàn)波動(dòng)率(BiPowe realized volatility)作為指標(biāo):
以抽樣頻率f(分鐘)為橫軸,以平均雙冪變差已實(shí)現(xiàn)波動(dòng)率為縱軸,作出平均雙冪變差已實(shí)現(xiàn)波動(dòng)率散點(diǎn)圖(BiPowe realized volatility Signature Plot,BSP),并選取使得平均雙冪變差已實(shí)現(xiàn)波動(dòng)率序列的均方誤差值(MSE)最小的頻率作為最優(yōu)抽樣頻率。
本文選擇TCL集團(tuán)2013年5月2日至2014年6月20日的每分鐘股票價(jià)格作為樣本,共有67035條記錄,去除空值,得到TCL集團(tuán)股票價(jià)格序列。
將TCL集團(tuán)股票的價(jià)格序列進(jìn)行對(duì)數(shù)化處理,得到對(duì)數(shù)收益率序列。從表1中可以看出,價(jià)格、成交量和收益率序列的偏度系數(shù)均不為0,峰度系數(shù)都大于3,這說(shuō)明時(shí)間序列存在尖峰厚尾的現(xiàn)象。
表1 TCL集團(tuán)股票價(jià)格、成交量、收益率的基本統(tǒng)計(jì)特征
1.最優(yōu)頻率的選擇
為了得到更準(zhǔn)確的波動(dòng)率估計(jì)值,獲得最優(yōu)抽樣頻率是前提。作出TCL集團(tuán)股票價(jià)格的平均含跳已實(shí)現(xiàn)波動(dòng)率散點(diǎn)圖 (BiPowe realized volatility Signature Plot,BSP)(如圖1),通過(guò)R軟件,得到不同頻率下的平均含跳已實(shí)現(xiàn)波動(dòng)率序列的均方誤差值(MSE)序列的基本統(tǒng)計(jì)特征如圖2。選取使得平均含跳已實(shí)現(xiàn)波動(dòng)率序列的均方誤差值 (MSE)最小的頻率作為最優(yōu)抽樣頻率,模型返回最優(yōu)抽樣頻率為11分鐘。
圖1 TCL集團(tuán)股票價(jià)格的波動(dòng)率特征圖
圖2 均方誤差值(MSE)序列的基本統(tǒng)計(jì)特征
2.BSP-HAR-RV模型預(yù)測(cè)分析和參數(shù)估計(jì)
用R軟件的highfrequency軟件包,對(duì)11分鐘抽樣頻率下的對(duì)數(shù)收益率序列進(jìn)行建模分析。在HAR-RV模型中,我們得到如下模型的參數(shù)估計(jì)結(jié)果:
RV1=beta0+beta1*RV1+beta2*RV5+beta3*RV22
表2 BSP-HAR-RV模型預(yù)測(cè)分析和參數(shù)估計(jì)結(jié)果分析
模型預(yù)測(cè)擬合圖如下:
圖3 HAR-RV模型預(yù)測(cè)分析圖
從圖中可以直觀地看出,在最優(yōu)抽樣頻率下,BSP-HAR-RV模型能夠較好地預(yù)測(cè)波動(dòng)率趨勢(shì)。其中,殘差標(biāo)準(zhǔn)誤差為0.0004895處于較低水平,每一個(gè)參數(shù)估計(jì)值都達(dá)到了99%以上的顯著性水平。
3.BSP-HAR-RV模型比較分析
以往學(xué)者廣泛采用5min和10min作為抽樣時(shí)間間隔來(lái)獲取高頻數(shù)據(jù),本文對(duì)選取了這兩種頻率下的時(shí)間序列進(jìn)行模型估計(jì),結(jié)果如下:
表3 5min抽樣頻率的模型參數(shù)估計(jì)結(jié)果
注:其中,殘差標(biāo)準(zhǔn)誤差為0.0005147;“***”和“**”分別代表顯著性水平為0和0.001。
表4 10min抽樣頻率的模型參數(shù)估計(jì)結(jié)果
通過(guò)對(duì)比分析可得,5min抽樣頻率下,有參數(shù)beta2的P值為0.10043,大于 0.5,同時(shí)該抽樣頻率下的殘差標(biāo)準(zhǔn)誤差也高于最優(yōu)頻率11分鐘下的殘差標(biāo)準(zhǔn)誤差;10min抽樣頻率下,雖然各個(gè)參數(shù)的顯著性均符合要求,且相對(duì)來(lái)說(shuō)比最優(yōu)頻率11分鐘下的結(jié)果更好,但是其殘差標(biāo)準(zhǔn)誤差為0.0005662,更大。顯然,BSP-HAR-RV模型在對(duì)抽樣頻率進(jìn)行優(yōu)化后得出了更精確的模型總體估計(jì)結(jié)果,具有可行性。
本文基于已實(shí)現(xiàn)波動(dòng)率,充分考慮時(shí)間序列的長(zhǎng)記憶性和市場(chǎng)交易的異質(zhì)性,通過(guò)選擇最優(yōu)抽樣頻率,對(duì)HAR-RV模型進(jìn)行優(yōu)化。選取TCL集團(tuán)個(gè)股進(jìn)行實(shí)證分析,驗(yàn)證了模型的可行性。然而本文在選取樣本的過(guò)程中,并未對(duì)不同特征(如流動(dòng)性)的高頻金融時(shí)間序列進(jìn)行對(duì)比研究,無(wú)法確定BSP模型的適用條件,需要今后進(jìn)一步研究。
[1]Andersen T G,Bollerslev T,Diebold F X,et al.The distribution of realized exchange rate volatility[J].Journal of the American Statistical Association,2001,96:42-55.
[2]Andersen T G,Bollerslev T,et al.Exchange rate returns standardized by realized volatility are(nearly)gaussian[J].Multinational Finance Journal,2000,(4):159-179.
[3] Andersen T G, Bollerslev T, Diebold F X, et al.Modeling and forecasting realized volatility[J].Econometrica,2003,71(2):579-625.
[4]Corsi F.A Simple Long Memory Model of Realized Volatility[R].Journal of Financial Econometrics,2009,(7):174-196.
[5]徐正國(guó),張世英.調(diào)整“已實(shí)現(xiàn)波動(dòng)率”與GARCH及SV模型對(duì)波動(dòng)的預(yù)測(cè)能力的比較研究[J].系統(tǒng)工程,2004,22(8):60-63.
[6]魏宇.滬深300股指期貨的波動(dòng)率預(yù)測(cè)模型研究[J].管理科學(xué)學(xué)報(bào).2010,13(2):66-76.
[7]張波,鐘玉潔,田金方.基于高頻數(shù)據(jù)的滬指波動(dòng)的長(zhǎng)記憶性驅(qū)動(dòng)因素分析[J].統(tǒng)計(jì)與信息論壇,2009,24(6):21-26.
[8]陳浪南,楊科.中國(guó)股市高頻波動(dòng)率的特征、預(yù)測(cè)模型以及預(yù)測(cè)精度比較[J].系統(tǒng)工程理論與實(shí)踐,2013,33(2):296-307.
[9]閔素芹,柳會(huì)珍.已實(shí)現(xiàn)波動(dòng)率中最優(yōu)抽樣頻率的選擇[J].理論新探,2009,(13):13-15.
[10]Andersena T G,Bollerslevb T,Dieboldc F X,et al.Realized Volatility and Correlation[J].1999.
[11]Bandi F M,Russell J R.Microstructure Noise,Realized Variance,and Optimal Sampling[J].Review of Economic Studies,2008,(75):339-369.
[12]Christensen K,Oomen R,Podolskij M.Fact or friction:Jumps at ultra high frequency[J].Journal of Financial Economics,2014,114(3):576-599.
[13]李勝歌,張世英.金融高頻數(shù)據(jù)的最優(yōu)抽樣頻率研究[J].管理學(xué)報(bào),2008,5(6):801-840.
[14]Andersen T G,Dobrev D,Schaumburg E.Jump-robust volatility estimation using nearest neighbor truncation[J].Journal of Econometrics,2012,169(1):75-93.