陳梓榮 周瑤
摘 要:論文研究了閾值數(shù)量和大小對已實(shí)現(xiàn)波動(dòng)率預(yù)測的影響,并提出了偏方差已實(shí)現(xiàn)波動(dòng)率預(yù)測模型——HAR-PV(G),該模型進(jìn)一步提高了已實(shí)現(xiàn)波動(dòng)率的預(yù)測效果。考慮到不同大小收益對已實(shí)現(xiàn)波動(dòng)率的影響具有非對稱性,以HAR-RS模型為基礎(chǔ),選取不同數(shù)量和不同大小的閾值組合對日內(nèi)收益進(jìn)行分割,并計(jì)算對應(yīng)的偏方差,從而構(gòu)建HAR-PV(G)模型。論文以滬深300指數(shù)為研究對象,比較了不同HAR-PV(G)模型的樣本外預(yù)測能力。樣本外分析表明,閾值數(shù)量為3的平分偏方差模型具有比傳統(tǒng)HAR、HAR-RS以及其他閾值組合的偏方差模型更好的預(yù)測能力。全樣本的參數(shù)分析也顯示閾值數(shù)量為3的平分偏方差模型對數(shù)據(jù)的擬合效果更出眾。
關(guān)鍵詞:偏方差;已實(shí)現(xiàn)波動(dòng)率;日內(nèi)收益;高頻數(shù)據(jù)
中圖分類號:F 830.9
文獻(xiàn)標(biāo)志碼:A
Partial Variance Volatility Forecasting Model
CHEN Zirong ZHOU Yao
(Antai College of Economic and Management, Shanghai Jiao Tong University, Shanghai 200030, China)
Abstract:This paper proposes a partial variance prediction model, HAR-PV(G), which can test the effects of different quantities and different sizes of thresholds on the prediction of realized volatility, aiming at improving the predicting effect of realized volatility. Due to the asymmetric effects of different intraday returns on the realized volatility, this paper selects threshold combinations of different quantities and sizes to segment intraday returns based on HAR-RS model. Then, this paper calculates the corresponding partial variance to construct HAR-PV(G) model. This paper uses 5-minute high-frequency trading data of CSI 300 index to compare in-sample and out-of-sample performances of HAR-PV(G) model. The results show an equal division of partial variance model with 3 thresholds could achieve a better out-of-sample performance compared with traditional HAR, HAR-RS and other HAR-PV(G) models with different threshold combinations. Meanwhile, this equal division of partial variance model with 3 thresholds also has an excellent fitting effect in the in-sample analysis.
Key words:partial variance; realized volatility; intraday return; high-frequency data
0 引言
金融市場中,資產(chǎn)具有波動(dòng)性是一種被普遍認(rèn)可的金融事實(shí)。用于衡量資產(chǎn)風(fēng)險(xiǎn)情況的波動(dòng)率在投資組合構(gòu)建、資產(chǎn)定價(jià)以及風(fēng)險(xiǎn)管理等金融領(lǐng)域扮演著極其重要的角色,因此對波動(dòng)率的統(tǒng)計(jì)分析和建模預(yù)測一直都是金融計(jì)量領(lǐng)域關(guān)注的熱點(diǎn)問題。隨著我國衍生品市場快速發(fā)展,市場對衍生品定價(jià)的準(zhǔn)確性要求強(qiáng)調(diào)了波動(dòng)率預(yù)測研究的重要性。此外,宏觀政策層面的波動(dòng)必然帶來微觀個(gè)體的變動(dòng),進(jìn)而引起金融市場的波動(dòng);微觀市場層面的波動(dòng)與金融環(huán)境和實(shí)體經(jīng)濟(jì)的穩(wěn)定密切相關(guān),正確預(yù)測波動(dòng)率對市場從業(yè)人員和監(jiān)管者都有著不可忽視的作用。
波動(dòng)率通常具有較為復(fù)雜的特性,Bollerslev和Taylor提出的廣義自回歸條件異方差(GARCH) 模型和隨機(jī)波動(dòng)率(SV) 模型是傳統(tǒng)的兩類刻畫波動(dòng)率的模型。隨著數(shù)據(jù)存儲技術(shù)的進(jìn)步,日內(nèi)高頻數(shù)據(jù)的獲取成本也大幅降低,因此包含豐富信息的日內(nèi)高頻數(shù)據(jù)為波動(dòng)率的估計(jì)和預(yù)測提供了新的手段。Andersen等首次提出將已實(shí)現(xiàn)波動(dòng)率(Realized Volatility, RV)作為日內(nèi)波動(dòng)率的估計(jì)量,相較于傳統(tǒng)的GARCH和SV等模型,已實(shí)現(xiàn)波動(dòng)率不僅不需要復(fù)雜的模型計(jì)算和數(shù)理推導(dǎo),而且能夠充分利用日內(nèi)高頻交易數(shù)據(jù)所包含的信息,更精確地刻畫金融市場波動(dòng)率,因此已實(shí)現(xiàn)波動(dòng)率一經(jīng)提出便得到了廣泛的研究和應(yīng)用。
在已實(shí)現(xiàn)波動(dòng)率預(yù)測的研究中,最具代表性的是Corsi提出的HAR模型。Corsi以“異質(zhì)市場假說”為理論基礎(chǔ),將波動(dòng)率劃分為短期波動(dòng)、中期波動(dòng)和長期波動(dòng),提出了異質(zhì)自回歸已實(shí)現(xiàn)波動(dòng)率預(yù)測模型(Heterogeneous Autoregressive,HAR)。HAR模型不僅降低了傳統(tǒng)模型的估計(jì)復(fù)雜度,也具有很強(qiáng)的擴(kuò)展性和明確的經(jīng)濟(jì)含義,因此逐漸成為已實(shí)現(xiàn)波動(dòng)率預(yù)測的基準(zhǔn)模型。Andersen等將已實(shí)現(xiàn)波動(dòng)率分解成連續(xù)波動(dòng)(Continuous Volatility, CV)和跳躍波動(dòng)(Jump Volatility,JV),并分別考慮這兩種波動(dòng)對未來已實(shí)現(xiàn)波動(dòng)率的影響,提出了HAR-RV-J和HAR-CJ模型。作者通過實(shí)證發(fā)現(xiàn)分解波動(dòng)率可以顯著提高已實(shí)現(xiàn)波動(dòng)率的預(yù)測能力。Chen和Ghysels發(fā)現(xiàn)好消息和壞消息對波動(dòng)率的影響是非對稱的,因此把已實(shí)現(xiàn)波動(dòng)率分解為好消息驅(qū)動(dòng)的波動(dòng)率成分和壞消息驅(qū)動(dòng)的波動(dòng)率成分可以提高已實(shí)現(xiàn)波動(dòng)率的預(yù)測能力。遵循這一思路,Patton和Sheppard將日內(nèi)收益按照正負(fù)進(jìn)行劃分,分別平方求和得到已實(shí)現(xiàn)半變方差(Realized Semi-Variance,RS)和符號跳躍變差(Signed Jump Variation, SJV),在此基礎(chǔ)上提出了HAR-RS、HAR-RV-SJV和HAR-RV-SJVd等模型,實(shí)證發(fā)現(xiàn)這三種模型的預(yù)測能力都優(yōu)于傳統(tǒng)的HAR模型。
國內(nèi)對已實(shí)現(xiàn)波動(dòng)率預(yù)測的研究起步較晚。文鳳華、劉曉群、唐海如等在HAR模型的基礎(chǔ)上考慮市場波動(dòng)的杠桿效應(yīng)和量價(jià)關(guān)系,提出了LHAR-RV-V模型,并使用滬深300指數(shù)的高頻數(shù)據(jù)進(jìn)行實(shí)證分析,證明該模型可以提高傳統(tǒng)HAR模型的預(yù)測能力。馬鋒、魏宇、黃登仕等將符號跳躍變差應(yīng)用到中國市場,比較了HAR、HAR-RV-J、HAR-RV-CJ和HAR-RV-TCJ等已實(shí)現(xiàn)波動(dòng)率預(yù)測模型在加入符號變差后的預(yù)測能力。陳聲利、關(guān)濤和李一軍將百度指數(shù)引入HAR模型中,實(shí)證發(fā)現(xiàn)新模型可以提高對滬深300股指期貨波動(dòng)率的預(yù)測能力。李俊儒、汪壽陽和魏云捷考慮波動(dòng)率 的測量誤差,發(fā)現(xiàn)加入波動(dòng)率測量誤差后的HAR模型預(yù)測能力的持續(xù)性有所提高,且其預(yù)測效果優(yōu)于傳統(tǒng)的HAR模型。龔旭、曹杰、文鳳華等在4個(gè)經(jīng)典的HAR族模型的基礎(chǔ)上,探究了杠桿效應(yīng)和結(jié)構(gòu)突變因素對已實(shí)現(xiàn)波動(dòng)率的預(yù)測能力。
盡管上述HAR族模型對已實(shí)現(xiàn)波動(dòng)率已有較強(qiáng)的預(yù)測能力,但是考慮到波動(dòng)率在金融市場的重要作用,進(jìn)一步探究如何提高已實(shí)現(xiàn)波動(dòng)率的預(yù)測能力仍有必要。因此,本文基于Patton和Sheppard提出的HAR-RS模型,提出偏方差已實(shí)現(xiàn)波動(dòng)率預(yù)測模型——HAR-PV(G),并研究了不同閾值組合對已實(shí)現(xiàn)波動(dòng)率模型預(yù)測能力的影響。
在HAR-RS模型中,作者對日內(nèi)收益以0作為閾值進(jìn)行分割,將已實(shí)現(xiàn)波動(dòng)率分為上行波動(dòng)率和下行波動(dòng)率并加入HAR模型,最終發(fā)現(xiàn)HAR-RS模型比傳統(tǒng)的HAR模型有更強(qiáng)的預(yù)測能力。基于HAR-RS的研究,本文進(jìn)一步探究以下兩個(gè)具體問題:第一,在中國金融市場,選取非0的閾值對日內(nèi)收益進(jìn)行分割,然后計(jì)算對應(yīng)的波動(dòng)率成分且加入HAR模型中,新的模型是否比HAR-RS模型有更好的預(yù)測能力;第二,如果閾值數(shù)量大于1,即將日內(nèi)收益率分成三段或者更多,然后計(jì)算對應(yīng)的波動(dòng)率成分并加入HAR模型中,新的模型對已實(shí)現(xiàn)波動(dòng)率的預(yù)測能力是否會得到進(jìn)一步提升。
1 計(jì)量模型
1.1 已實(shí)現(xiàn)波動(dòng)率預(yù)測模型
假設(shè)金融資產(chǎn)在交易日t的對數(shù)價(jià)格p=log (P),服從以下擴(kuò)散模型:
p=∫ μ ds+∫ σ dW+J.??? (1)
其中:μ是有限方差的連續(xù)跳躍過程;σ代表瞬時(shí)波動(dòng)率,且是一個(gè)嚴(yán)格為正的càdlaàg過程;J是跳躍過程。如果用Δp=pp代表s時(shí)點(diǎn)的跳躍大小,那么p的二次變差為[p,p]=∫ σ ds+∑(Δp) 。其中:∫ σ ds為積分波動(dòng)率,又叫作連續(xù)波動(dòng)率;∑(Δp)為跳躍波動(dòng)。
假設(shè)在交易日t,擁有間隔相等的M+1個(gè)觀察值p,p,…,p。令r代表交易日t內(nèi)第i時(shí)段的對數(shù)收益率,r=pp,i=1,…,M。Andersen等提出可以使用日內(nèi)收益率的平方和作為二次變差的估計(jì)量,該估計(jì)量又被叫作已實(shí)現(xiàn)波動(dòng)率,其計(jì)算方法如下:
在眾多已實(shí)現(xiàn)波動(dòng)率預(yù)測模型中,Corsi等提出的HAR模型因能夠刻畫已實(shí)現(xiàn)波動(dòng)率的長尾效應(yīng)獲得最為廣泛的應(yīng)用。HAR模型的形式非常簡潔,只需使用上一天、上一周以及上一個(gè)月的平均已實(shí)現(xiàn)波動(dòng)率作為預(yù)測下一期已實(shí)現(xiàn)波動(dòng)率的預(yù)測變量:
其中,RV是t-4到t日的平均已實(shí)現(xiàn)波動(dòng)率,RV是t-19到t日的平均已實(shí)現(xiàn)波動(dòng)率。
Patton和Sheppard考慮了波動(dòng)率的杠桿效應(yīng),提出以0為閾值對日內(nèi)收益進(jìn)行分割,并將已實(shí)現(xiàn)波動(dòng)率分解成上行已實(shí)現(xiàn)半方差RS=∑ r I{r>0}和下行已實(shí)現(xiàn)半方差RS= ∑ r I{r<0},并在此基礎(chǔ)之上提出了HAR-RS模型:
在Patton和Sheppard、馬鋒、魏宇、黃登仕等的研究中,下行已實(shí)現(xiàn)波動(dòng)率和上行已實(shí)現(xiàn)波動(dòng)率對未來已實(shí)現(xiàn)波動(dòng)率的影響具有顯著的非對稱性,下行已實(shí)現(xiàn)波動(dòng)率的影響更為顯著,且HAR-RS模型擁有比HAR模型更好的預(yù)測能力。
1.2 偏方差波動(dòng)率預(yù)測模型
HAR-RS的研究表明正負(fù)收益對未來已實(shí)現(xiàn)波動(dòng)率的影響是不同的。既然不同大小的收益對未來已實(shí)現(xiàn)波動(dòng)率的影響是不同的,那么是否可以通過對日內(nèi)收益進(jìn)行更細(xì)致的劃分來獲得更好的預(yù)測效果將是本文試圖回答的問題。
在Patton和Sheppard的研究中,周(RV)和月(RV)已實(shí)現(xiàn)波動(dòng)率的分解對預(yù)測效果的影響較小,因此本文的研究集中在日已實(shí)現(xiàn)波動(dòng)率(RV)的分解對波動(dòng)率預(yù)測的影響上。
從公式(5)中可以發(fā)現(xiàn),偏方差預(yù)測模型中閾值的選擇面臨兩個(gè)問題:閾值數(shù)量和閾值大小。為了探究如何選取合適的閾值組合進(jìn)行預(yù)測,本文擬從實(shí)證的角度來研究閾值的大小和數(shù)量對波動(dòng)率預(yù)測的影響。本文將通過比較不同閾值組合的樣本外表現(xiàn),最終對閾值組合的選擇提出建議。
2 數(shù)據(jù)
本文選取滬深300股票指數(shù)高頻交易數(shù)據(jù)作為研究對象,數(shù)據(jù)來源于微盛投資數(shù)據(jù)庫。為了盡可能多地運(yùn)用高頻數(shù)據(jù)包含的信息,同時(shí)避免因?yàn)槭袌鼋Y(jié)構(gòu)噪聲帶來的影響,本文采用5分鐘頻率的日內(nèi)收益數(shù)據(jù)。數(shù)據(jù)樣本時(shí)間跨度為2011年1月4日至2021年5月17日(數(shù)據(jù)庫時(shí)間截至2021年5月17日)。
從圖1的已實(shí)現(xiàn)波動(dòng)率時(shí)序圖來看,波動(dòng)率在2015年出現(xiàn)了一個(gè)高峰時(shí)期,其正好對應(yīng)了2015年的股災(zāi)時(shí)期,符合金融事實(shí)。此外,從表1的描述性統(tǒng)計(jì)來看,已實(shí)現(xiàn)波動(dòng)率的偏度和峰度都很高,說明已實(shí)現(xiàn)波動(dòng)率存在右偏和尖峰厚尾等特征。
3 實(shí)證分析
為了進(jìn)一步深入研究閾值組合對已實(shí)現(xiàn)波動(dòng)率預(yù)測的影響,本節(jié)將從以下四個(gè)角度具體展開研究:
1)閾值數(shù)量固定時(shí),不同閾值組合下的偏方差模型的預(yù)測能力比較。
2)放開閾值數(shù)量固定的限制,不同閾值數(shù)量的偏方差模型的預(yù)測能力比較。
3)放開閾值數(shù)量和組合的限制,允許閾值的數(shù)量和大小在每一期都發(fā)生變化,并和其他偏方差預(yù)測模型的預(yù)測能力進(jìn)行比較。
4)通過全樣本的參數(shù)估計(jì)分析不同大小收益對未來已實(shí)現(xiàn)波動(dòng)率的影響。
前三個(gè)分析使用樣本外表現(xiàn)來比較不同模型的預(yù)測能力,第四個(gè)分析使用樣本內(nèi)分析探究不同大小收益對未來波動(dòng)率的影響。
在實(shí)際選取閾值時(shí),考慮到每天的已實(shí)現(xiàn)波動(dòng)率的變化是不同的且波動(dòng)較大,本文并不直接選取固定的數(shù)值作為閾值,而是選取一些特定的分位點(diǎn)作為閾值:
其中,Q(z;q)是z序列的q分位點(diǎn)。同時(shí),本文將用HAR-PV()代表當(dāng)閾值數(shù)量為G且分位點(diǎn)將日內(nèi)收益率進(jìn)行平分的偏方差預(yù)測模型。
本文主要通過樣本外分析對不同偏方差模型的預(yù)測能力進(jìn)行比較。樣本外預(yù)測采用一步向前滾動(dòng)窗估計(jì),估計(jì)樣本窗口設(shè)定為1000個(gè)交易日,即預(yù)測從第1001個(gè)交易日開始。由于文章篇幅的限制,本文的實(shí)證分析主要集中于預(yù)測下一天的已實(shí)現(xiàn)波動(dòng)率RV。
對于樣本外預(yù)測能力的評判標(biāo)準(zhǔn),現(xiàn)有研究并未對損失函數(shù)的選擇達(dá)成共識。在傳統(tǒng)的HAR模型研究中,不少文獻(xiàn)同時(shí)采用多個(gè)損失函數(shù)來比較不同模型的樣本外表現(xiàn)。本文遵循Audrino和Hu的做法,選取兩個(gè)常用的損失函數(shù):
其中,RV是已實(shí)現(xiàn)波動(dòng)率的預(yù)測值,RV是已實(shí)現(xiàn)波動(dòng)率的真實(shí)值,n代表預(yù)測樣本數(shù)量。預(yù)測模型的損失函數(shù)值越小,表明模型的預(yù)測能力越強(qiáng)。
然而,通過比較不同損失函數(shù)值的大小可以直接比較不同模型預(yù)測的精度,但是無法判斷一個(gè)模型的預(yù)測能力是否顯著優(yōu)于另一個(gè)或另一組模型,因此本文還將采用模型可信集(MCS)檢驗(yàn)方法來對比不同模型的預(yù)測能力。模型可信集檢驗(yàn)是由Hansen等基于Hansen改進(jìn)之后提出的用于對不同模型的預(yù)測能力優(yōu)劣進(jìn)行排序的檢驗(yàn)方法。MCS檢驗(yàn)統(tǒng)計(jì)量的構(gòu)造和比較過程非常復(fù)雜,由于篇幅原因在此不過多展開,詳細(xì)步驟可參考Hansen等。
在后續(xù)的結(jié)果里,本文將重點(diǎn)報(bào)告MCS檢驗(yàn)中的P值,根據(jù)Hansen等論文里的解釋,該P(yáng)值可以簡單理解為在所有進(jìn)行檢測的模型中,該模型擁有最好預(yù)測能力的概率。本文的MCS檢驗(yàn)采用較為常用的范圍統(tǒng)計(jì)量(Range)作為檢驗(yàn)統(tǒng)計(jì)量,窗口長度為25,重復(fù)抽樣次數(shù)為5000,臨界值的選擇為0.1(置信度為90%)。實(shí)證中如果模型的Range統(tǒng)計(jì)量對應(yīng)的檢驗(yàn)P值大于0.1,說明該模型具有較好的預(yù)測能力;P值越大,表明該模型具有較好預(yù)測能力的概率越高。
3.1 固定數(shù)量不同閾值組合的預(yù)測效果比較
本節(jié)先從比較簡單的情形入手,比較閾值數(shù)量固定的閾值組合對下一期已實(shí)現(xiàn)波動(dòng)率的預(yù)測效果。在下文的分析中,閾值分位點(diǎn)的選擇區(qū)間為0.05至0.95,步長為0.05。
首先,在給定一個(gè)閾值的情況下,圖2繪制了該情形下的樣本外表現(xiàn)。其中,橫軸代表了不同的閾值分位點(diǎn),縱軸代表了對應(yīng)模型的樣本外平均MSE的值。兩條虛線HAR-RV和HAR-RS分別代表了傳統(tǒng)的HAR-RV模型和HAR-RS模型的樣本外平均MSE的值。從圖2中可以發(fā)現(xiàn),HAR-PV(1)模型在閾值分位點(diǎn)處于0.5附近時(shí)取到最小值,即是說,已實(shí)現(xiàn)波動(dòng)率處在中值水平時(shí)取得最小值,此時(shí)已實(shí)現(xiàn)波動(dòng)率的中值非常接近于0,因此閾值分位點(diǎn)為0.5的偏方差模型非常接近于HAR-RS模型。該結(jié)果表明當(dāng)閾值數(shù)量只有1個(gè)的時(shí)候,在樣本外表現(xiàn)上擊敗HAR-RS模型是非常困難的。
此外,從圖2所顯示的兩側(cè)尾部的表現(xiàn)來看,當(dāng)閾值分位點(diǎn)非常偏左時(shí),預(yù)測的樣本外效果表現(xiàn)并不理想,不僅弱于傳統(tǒng)的HAR-RV模型,也遠(yuǎn)比不上在右側(cè)極端分位點(diǎn)上進(jìn)行分割后的表現(xiàn),該結(jié)果類似于Bollerslev等對美國S&P500的研究結(jié)果,但并不符合通常的認(rèn)知。在傳統(tǒng)的金融研究里,一般認(rèn)為左側(cè)的極端收益對未來波動(dòng)率的影響相較于右側(cè)收益更大,因此單獨(dú)考慮左側(cè)極端風(fēng)險(xiǎn)通常能夠提高對未來波動(dòng)率的預(yù)測能力?;诖?,本文將在3.4節(jié)中進(jìn)一步深入探討不同大小的收益對未來波動(dòng)率的影響。
接著,本文繼續(xù)考慮兩個(gè)閾值的情況,這里閾值分位點(diǎn)同樣選擇從0.05至0.95,步長為0.05。這里有兩個(gè)閾值,因此共有171個(gè)不同的閾值組合。
圖3刻畫了給定兩個(gè)閾值下的樣本外表現(xiàn)。兩個(gè)橫軸分別代表了兩個(gè)閾值的選擇,縱軸代表了不同模型樣本外的平均MSE值。從圖3中可以發(fā)現(xiàn),圖形中存在兩個(gè)相對低點(diǎn),而低點(diǎn)的位置非常接近于[0.35,0.65]的閾值組合,說明 HAR-PV(2)模型在閾值組合為[0.35,0.65]附近的樣本外表現(xiàn)相對較好。
綜合圖3和圖4可知,在閾值數(shù)量固定為1或者2的兩種情況下,具有最好的樣本外表現(xiàn)的模型都接近于對日內(nèi)收益進(jìn)行平分后的偏方差模型,即HAR-PV()模型。因此,本文進(jìn)一步推測當(dāng)閾值數(shù)量固定時(shí),平分日內(nèi)收益率的偏方差模型具有相對較好的預(yù)測能力。
為了進(jìn)一步驗(yàn)證這一推測,下文繼續(xù)考慮給定閾值數(shù)量更多的情況。這一部分一共對5種不同閾值數(shù)量的情況進(jìn)行考慮,即閾值數(shù)量為1、2、3、4、5的情況。當(dāng)閾值數(shù)量大于2時(shí),其樣本外的平均MSE的值的分布難以通過繪圖的方式表現(xiàn)出來,為了讓閾值組合的結(jié)果可視化,在每個(gè)閾值數(shù)量下選取了三組有代表性的閾值組合,表2給出了具體的閾值選擇的情況。從表2中不難發(fā)現(xiàn),組合1是對日內(nèi)收益平分的閾值組合;當(dāng)閾值數(shù)量大于等于2時(shí),組合2側(cè)重考慮兩側(cè)尾部風(fēng)險(xiǎn);組合3側(cè)重考慮左側(cè)尾部風(fēng)險(xiǎn)。不對右側(cè)尾部風(fēng)險(xiǎn)單獨(dú)考慮,主要是因?yàn)樵趥鹘y(tǒng)的金融風(fēng)險(xiǎn)研究中,左側(cè)風(fēng)險(xiǎn)對波動(dòng)率預(yù)測、資產(chǎn)配置等有更為顯著的影響。本節(jié)將分別計(jì)算每一種閾值分位點(diǎn)組合的樣本外平均MSE和QLIKE的值,并對每一個(gè)閾值數(shù)量確定下的三種組合進(jìn)行MCS檢驗(yàn),進(jìn)而判斷哪一種閾值組合是較好的預(yù)測模型。
表3報(bào)告了不同組合下的樣本外平均MSE和QLIKE的值,其中MSE列的值乘以了10。MCS列報(bào)告了置信水平為90%的MCS檢驗(yàn)的P值,N代表了閾值的數(shù)量。從表3的結(jié)果可以看出,在絕大多數(shù)情況下,無論損失函數(shù)選擇MSE 還是QLIKE,平分閾值都有著最小的平均損失值。MCS的結(jié)果也更進(jìn)一步驗(yàn)證了這一點(diǎn),除去閾值數(shù)量是4個(gè),且損失函數(shù)采用QLIKE的情況,其他情況下,平分閾值模型的MCS檢驗(yàn)下的P值都是1.000,該結(jié)果說明平分閾值模型是三種模型中預(yù)測能力相對較好的模型。
3.2 不同數(shù)量閾值的預(yù)測效果比較
上節(jié)比較了在閾值數(shù)量固定時(shí),不同閾值組合的樣本外表現(xiàn)。本節(jié)將比較不同閾值數(shù)量的樣本外表現(xiàn)。為了方便比較,本節(jié)直接應(yīng)用3.1中觀察到的結(jié)果,直接對比不同數(shù)量閾值下的平分閾值組合的偏方差模型的樣本外表現(xiàn)。同樣閾值數(shù)量的選擇為1到5,每種閾值數(shù)量下都采用平分日內(nèi)收益率的方法來計(jì)算對應(yīng)的偏方差波動(dòng)率,即HAR-PV()模型。
圖4繪制了不同閾值數(shù)量下的樣本外表現(xiàn)。其中,橫軸代表了閾值的數(shù)量,縱軸代表了預(yù)測模型的樣本外的平均MSE的值,兩條虛線HAR-RV和HAR-RS,分別代表了傳統(tǒng)HAR-RV和HAR-RS模型的樣本外平均MSE的值。從圖4中可以清晰地看到,樣本外表現(xiàn)和閾值數(shù)量呈現(xiàn)一個(gè)正“U”形,樣本外表現(xiàn)在閾值數(shù)量取到3的時(shí)候取到最小值,MSE為3.9E-08。與傳統(tǒng)的HAR-RV模型相比,所有對日內(nèi)波動(dòng)率進(jìn)行平均分割的偏方差模型的樣本外表現(xiàn)都遠(yuǎn)好于傳統(tǒng)的HAR-RV模型。由此可見,對日內(nèi)收益率的分割是必要的,這也足以說明偏方差模型可以顯著提高對已實(shí)現(xiàn)波動(dòng)率的預(yù)測能力。
為了進(jìn)一步驗(yàn)證上述結(jié)論,表4統(tǒng)計(jì)了不同閾值數(shù)量下不同模型的樣本外表現(xiàn)。從表中不難發(fā)現(xiàn),不管損失函數(shù)采用MSE還是QLIKE,HAR-PV(3)的樣本外損失函數(shù)值都是最好的之一,這也與圖5一致。此外,在MCS檢驗(yàn)中,HAR-PV(3)的MCS檢驗(yàn)P值都是1.000,說明HAR-PV(3)模型是擁有最好預(yù)測能力的模型集合中的一個(gè)。綜上所述,在不固定閾值數(shù)量的不同組合中,三個(gè)閾值數(shù)量的偏方差模型具有較好的波動(dòng)率預(yù)測效果。
3.3 閾值動(dòng)態(tài)模型
從上述兩節(jié)的分析中可知,閾值的數(shù)量和大小都會對已實(shí)現(xiàn)波動(dòng)率的預(yù)測產(chǎn)生影響。本節(jié)將繼續(xù)探究一個(gè)問題:如果允許閾值的數(shù)量和大小都隨時(shí)間的變化而變化,或者稱為閾值動(dòng)態(tài)模型,該模型是否具有更好的波動(dòng)率預(yù)測能力。本文將用HAR-PV()代表閾值數(shù)量和組合均可隨時(shí)間變化而變化的閾值動(dòng)態(tài)模型。
本節(jié)通過交叉驗(yàn)證的方法來確定每一期的閾值組合;具體方法操作如下:
首先,選取1000個(gè)交易日的數(shù)據(jù)作為訓(xùn)練集。具體地,假設(shè)在交易日t,選取t-1000到t日的交易數(shù)據(jù)作為訓(xùn)練集。
其次,從訓(xùn)練集中隨機(jī)選取600個(gè)連續(xù)交易日。
接著,將隨機(jī)選取的600個(gè)連續(xù)交易日分為400和200兩個(gè)區(qū)間。
然后,對于每一種閾值組合,利用上文提到的滾動(dòng)預(yù)測的方差預(yù)測200個(gè)交易日的已實(shí)現(xiàn)波動(dòng)率。
隨后,根據(jù)預(yù)測的已實(shí)現(xiàn)波動(dòng)率計(jì)算每一種閾值組合的樣本外MSE值,作為評估閾值組合的標(biāo)準(zhǔn)。
重復(fù)步驟2至步驟5五次。
最后,選取5次平均MSE值最小的閾值組合對應(yīng)的偏方差模型作為預(yù)測t+1日的偏方差模型。
為了節(jié)省計(jì)算能力且不失一般性,本節(jié)的閾值分位點(diǎn)選取為0.1至0.9,步長為0.1。
表5報(bào)告了HAR-PV()閾值動(dòng)態(tài)模型的樣本外表現(xiàn)。這里將HAR-PV()模型和其他HAR-PV()模型進(jìn)行了比較,便于發(fā)現(xiàn)最優(yōu)的波動(dòng)率預(yù)測模型。首先,將HAR-PV()模型和傳統(tǒng)的HAR模型的樣本外表現(xiàn)進(jìn)行比較,HAR-PV()的MSE值為4.061,低于HAR模型的4.693,但其QLIKE值為0.201,略高于HAR的0.195,因此,結(jié)合兩種損失函數(shù)的結(jié)果,并不能得出HAR-PV()完全優(yōu)于傳統(tǒng)的HAR模型。接著,將HAR-PV()模型和前兩節(jié)得到論證的日內(nèi)收益率平均模型HAR-PV()進(jìn)行比較,類似地,并不能說明HAR-PV()比HAR-PV(3)有更好的樣本外表現(xiàn)。此外,雖然HAR-PV()的MCS檢驗(yàn)P值均為1.000,但是從平均損失值的角度來看,并不能認(rèn)為HAR-PV()是比HAR-PV(3)更好的預(yù)測模型。
綜合3.1、3.2和3.3的分析,可以得到以下三個(gè)結(jié)論:第一,在固定閾值數(shù)量的情況下,平分日內(nèi)收益的偏方差模型往往具有更好的預(yù)測能力。第二,偏方差模型的預(yù)測能力和閾值數(shù)量呈現(xiàn)一個(gè)倒“U”形的關(guān)系,模型的預(yù)測能力在閾值數(shù)量為3附近達(dá)到最優(yōu)。第三,即便放開閾值數(shù)量和組合的限制,閾值動(dòng)態(tài)模型的預(yù)測能力并未優(yōu)于HAR-PV(3)。綜上所述,閾值數(shù)量為3的平分偏方差模型可以擊敗傳統(tǒng)的HAR-RS模型和其他偏方差模型,具有更好的預(yù)測能力。
3.4 參數(shù)分析
正如前三節(jié)所分析的,日內(nèi)收益率的狀況會對波動(dòng)率產(chǎn)生影響,為了進(jìn)一步理解不同大小的收益率對下一期已實(shí)現(xiàn)波動(dòng)率的影響,本節(jié)通過分析模型的回歸系數(shù)研究不同的偏方差對下一期已實(shí)現(xiàn)波動(dòng)率的具體影響。
同樣,本節(jié)采用HAR-PV()模型作為研究對象。因?yàn)椴煌钠讲钕嗖钶^大,本文對所有的回歸變量進(jìn)行歸一處理,從而可以更好地在不同變量的參數(shù)之間進(jìn)行比較。與上文一致,本節(jié)依舊只考慮預(yù)測下一天的已實(shí)現(xiàn)波動(dòng)率。
表6報(bào)告了全樣本內(nèi)不同HAR-PV()模型的估計(jì)結(jié)果,括號中是對應(yīng)參數(shù)的Newey-West調(diào)整后的t檢驗(yàn)值(West),表中的PV(i)對應(yīng)了不同模型下的第i段偏方差的回歸系數(shù)。因?yàn)榉治霾簧婕俺?shù)項(xiàng),因此表中忽略了常數(shù)項(xiàng)。
首先,關(guān)注HAR-PV(1)模型的結(jié)果。在HAR-PV(1)模型中,負(fù)的偏方差的系數(shù)為0.519,而對應(yīng)的正偏方差只有-0.154,且負(fù)偏方差的t值達(dá)到了4.332,遠(yuǎn)高于正偏方差的2.190??梢娫陬A(yù)測下一天的已實(shí)現(xiàn)波動(dòng)率時(shí),負(fù)日內(nèi)收益包含了比正日內(nèi)收益更多的信息,且其對下一期已實(shí)現(xiàn)波動(dòng)率的影響幾乎是正偏方差的四倍。該結(jié)果進(jìn)一步驗(yàn)證了龔旭、曹杰、文鳳華等的研究結(jié)果,即中國股票市場的波動(dòng)率具有杠桿效應(yīng)。
HAR-PV(2)模型類似于Andersen等提出的HAR-J模型。HAR-J模型將已實(shí)現(xiàn)波動(dòng)率分解為連續(xù)波動(dòng)和跳躍波動(dòng),不同于HAR-J模型中考慮極端收益的影響,HAR-PV(2)模型重點(diǎn)考慮兩側(cè)較大的尾部收益的影響。HAR-PV(2)模型的回歸結(jié)果顯示,三段偏方差都是顯著的。右側(cè)尾部收益的影響和左側(cè)尾部收益的影響相反,左側(cè)尾部收益對下一期已實(shí)現(xiàn)波動(dòng)率的影響為正,而右側(cè)影響為負(fù)。
從HAR-PV(3)至HAR-PV(5)的參數(shù)估計(jì)中可以總結(jié)出兩個(gè)主要結(jié)論。第一,中位偏方差在預(yù)測波動(dòng)率中占據(jù)主導(dǎo)地位。從估計(jì)參數(shù)的符號和顯著性情況可以看到,在零附近的偏方差的系數(shù)始終是正向且顯著的,該結(jié)果說明常規(guī)收益對下一期已實(shí)現(xiàn)波動(dòng)率的影響是要大于極端收益的。第二,左側(cè)極端收益對下一期已實(shí)現(xiàn)波動(dòng)率的影響通常高于右側(cè)極端收益,但右側(cè)較大收益對下一期已實(shí)現(xiàn)波動(dòng)率的影響通常大于左側(cè)較大收益。從HAR-PV(5)的回歸結(jié)果可以看出,在兩側(cè)極端的偏方差中,PV(1)的系數(shù)為0.159,t值為1.822,而對應(yīng)的PV(6)的系數(shù)僅為-0.091,t值為-1.399。可見左側(cè)的極端風(fēng)險(xiǎn)對預(yù)測下一期已實(shí)現(xiàn)波動(dòng)率的作用更大。這也符合金融市場的風(fēng)險(xiǎn)認(rèn)知,在傳統(tǒng)的金融研究里,左側(cè)風(fēng)險(xiǎn)確實(shí)是更為重要的一種。但是,這種情況在考慮兩側(cè)較大的收益時(shí)發(fā)生了反轉(zhuǎn)。同樣在PV(5)模型的回歸結(jié)果中,PV(5)的系數(shù)為-0.306,t值為-2.824,而PV(2)的系數(shù)僅為0.216,t值為1.547。 可見如果考慮較大的收益對下一期已實(shí)現(xiàn)波動(dòng)率的影響,右側(cè)收益的影響要大于左側(cè)收益。
最后,從回歸結(jié)果調(diào)整后的R看,HAR-PV(4)模型對數(shù)據(jù)的擬合效果最好,其調(diào)整后的R值為0.651。此外,與傳統(tǒng)HAR模型相比,對已實(shí)現(xiàn)波動(dòng)率進(jìn)行分割后對數(shù)據(jù)的擬合效果都更好(高于0.536),該結(jié)果進(jìn)一步驗(yàn)證了對已實(shí)現(xiàn)波動(dòng)率進(jìn)行分割的必要性。
4 結(jié)語
本文研究了在HAR-RS模型中,是否可以通過改變閾值的選取提高已實(shí)現(xiàn)波動(dòng)率的預(yù)測能力的問題。本文以HAR-RS模型為基礎(chǔ),構(gòu)造了HAR-PV(G)模型,并使用滬深300股票指數(shù)5分鐘高頻交易數(shù)據(jù)進(jìn)行實(shí)證分析,結(jié)果表明恰當(dāng)選取合適的閾值確實(shí)能夠提高對已實(shí)現(xiàn)波動(dòng)率的預(yù)測能力。
本文對不同模型的樣本外表現(xiàn)進(jìn)行比較,發(fā)現(xiàn)閾值數(shù)量固定時(shí),平分閾值組合的偏方差模型樣本外表現(xiàn)最優(yōu)。在閾值數(shù)量可以變動(dòng)的情況下,偏方差模型的樣本外表現(xiàn)和閾值數(shù)量的關(guān)系呈現(xiàn)一個(gè)“U”形,閾值數(shù)量為3的偏方差模型的樣本外表現(xiàn)最好。隨后,本文進(jìn)一步考慮了時(shí)變閾值模型即閾值動(dòng)態(tài)模型,利用交叉檢驗(yàn)的方法在每一期選出最優(yōu)的閾值組合用以預(yù)測下一期已實(shí)現(xiàn)波動(dòng)率,并將最終的預(yù)測效果和平分閾值模型進(jìn)行比較后發(fā)現(xiàn),閾值動(dòng)態(tài)模型并不能顯著擊敗閾值數(shù)量為3的平分偏方差模型。
為了進(jìn)一步探究不同大小的收益對下一期已實(shí)現(xiàn)波動(dòng)率的影響,本文通過平分模型的樣本內(nèi)估計(jì)發(fā)現(xiàn)負(fù)收益對下一期已實(shí)現(xiàn)波動(dòng)率的影響更大且更顯著。除此之外,0附近的收益在波動(dòng)率預(yù)測中占據(jù)主導(dǎo)地位。同時(shí),在極端的收益中,左側(cè)極端收益對預(yù)測的影響強(qiáng)于右側(cè)的極端收益;但在較大的收益中,右側(cè)較大的收益的影響卻強(qiáng)于左側(cè)較大的收益。
雖然本文取得了一些創(chuàng)新型的結(jié)果,但還存在一些問題需要進(jìn)一步拓展研究。具體表現(xiàn)在三個(gè)方面。第一,本文的研究主要局限在股票市場,文中的結(jié)論能否應(yīng)用于其他金融市場,比如期貨、大宗商品等,有待進(jìn)一步驗(yàn)證。第二,本文的研究主要局限在預(yù)測下一天的已實(shí)現(xiàn)波動(dòng)率,在預(yù)測下一周甚至下個(gè)月的已實(shí)現(xiàn)波動(dòng)率時(shí),是否發(fā)生閾值選擇的變化有待考證。第三,本文僅研究了波動(dòng)率預(yù)測的問題,后續(xù)可以將偏方差模型運(yùn)用到資產(chǎn)配置、期權(quán)定價(jià)和風(fēng)險(xiǎn)管理等實(shí)際問題中。
參考文獻(xiàn):
[1]BOLLERSLEV T. Generalized autoregressive conditional heteroskedasticity[J]. Journal of Econometrics, 1986, 31(3):307-27.
[2]TAYLOR S J. Modeling stochastic volatility:a review and comparative study[J]. Mathematical Finance, 1994, 4(2):183-204.
[3]ANDERSEN T G, BOLLERSLEV T, DIEBOLD F X, et al. Modeling and forecasting realized volatility[J]. Econometrica, 2003, 71(2):579-625.
[4]CORSI F. A Simple approximate long-memory model of realized volatility[J]. Journal of Financial Econometrics, 2009, 7(2):174-196.
[5]ANDERSEN T G, BOLLERSLEV T, DIEBOLD F X. Roughing it up:including jump components in the measurement, modeling, and forecasting of return volatility[J]. The Review of Economics and Statistics, 2007, 89(4):701-720.
[6]CHEN X, GHYSELS E. News—good or bad—and its impact on volatility predictions over multiple horizons[J]. The Review of Financial Studies, 2010, 24(1):46-81.
[7]PATTON A J, SHEPPARD K. Good volatility, bad volatility:signed jumps and the persistence of volatility[J]. The Review of Economics and Statistics, 2015, 97(3):683-697.
[8]文鳳華, 劉曉群, 唐海如,等.基于LHAR-RV-V模型的中國股市波動(dòng)性研究 [J]. 管理科學(xué)學(xué)報(bào), 2012(15):59-67.
[9]馬鋒, 魏宇, 黃登仕,等.基于跳躍和符號跳躍變差的HAR-RV預(yù)測模型及其MCS檢驗(yàn) [J]. 系統(tǒng)管理學(xué)報(bào), 2015, 24:700-710.
[10]陳聲利, 關(guān)濤,李一軍.基于跳躍、好壞波動(dòng)率與百度指數(shù)的股指期貨波動(dòng)率預(yù)測 [J]. 系統(tǒng)工程理論與實(shí)踐, 2018(38):299-316.
[11]李俊儒, 汪壽陽,魏云捷.基于波動(dòng)率測量誤差的波動(dòng)率預(yù)測模型 [J]. 系統(tǒng)工程理論與實(shí)踐, 2018(38):1905-1918.
[12]龔旭, 曹杰, 文鳳華,等.基于杠桿效應(yīng)和結(jié)構(gòu)突變的HAR族模型及其對股市波動(dòng)率的預(yù)測研究 [J]. 系統(tǒng)工程理論與實(shí)踐, 2020(40):1113-1133.
[13]CORSI F, PIRINO D, RENò R. Threshold bipower variation and the impact of jumps on volatility forecasting [J]. Journal of Econometrics, 2010, 159(2):276-288.
[14]AUDRINO F, HU Y. Volatility forecasting:downside risk, jumps and leverage effect[J]. Econometrics, 2016, 4(1):8.
[15]HANSEN P R, LUNDE A, NASON J M. The model confidence set[J]. Econometrica, 2011, 79(2):453-497.
[16]HANSEN P R. A test for superior predictive ability[J]. Journal of Business & Economic Statistics, 2005, 23(4):365-380.
[17]BOLLERSLEV T, MEDEIROS M C, PATTON A J, et al. From zero to hero:realized partial (co)variances[J]. Journal of Econometrics, 2021.
[18]WEST N. A simple, positive semi-definite, heteroskedasticity and autocorrelation consistent covariance matrix[J]. Econometrica, 1987, 55(3):703-708.