李 荃,唐亞勇
(四川大學(xué),四川 成都 610065)
基于RASV模型和HMC算法的滬深300指數(shù)分析
李 荃,唐亞勇
(四川大學(xué),四川 成都 610065)
嘗試使用Takahashietal.在2009年提出的RASV模型[1],對滬深300指數(shù)的波動率進行建模分析。在確定模型參數(shù)時,使用貝葉斯統(tǒng)計推斷,并創(chuàng)新性地使用結(jié)合了Gibbs抽樣思想的HMC算法來模擬生成參數(shù)樣本。使用的數(shù)據(jù)是2016年全年的滬深300指數(shù)一分鐘高頻數(shù)據(jù),并對得到的模型參數(shù)進行了經(jīng)濟學(xué)意義分析。
RASV模型;貝葉斯統(tǒng)計推斷;Gibbs抽樣思想;HMC算法;滬深300指數(shù)波動率分析
長期以來,對于波動率的估計一直都是眾多研究者所密切關(guān)注的問題。由于波動性是金融市場最主要的特征之一,因此對于波動率動態(tài)的建模與分析等一系列工作變得日益重要,是進行資產(chǎn)定價、風(fēng)險管理等金融行為的核心工作。
對于波動率的研究可以追溯到三十多年前,在那些年代,對于波動率的研究主要基于日收益率,比如GARCH模型或者SV模型。近年來,由于計算機技術(shù)的發(fā)展,日內(nèi)高頻收益率數(shù)據(jù)的獲取變得很容易,因此研究者的目光逐漸轉(zhuǎn)向如何利用日內(nèi)高頻收益率來對波動率進行估計。已實現(xiàn)波動率(Realized Volatility)就是其中一類重要研究方法。然而,由于非交易時間、微觀市場噪聲等因素的存在,已實現(xiàn)波動率對于真實波動率的估計仍存在一定的偏差,如何糾正這種偏差成為國內(nèi)外研究者關(guān)注的熱點問題。Takahashi et al.提出的基于SV模型的RASV模型為解決該問題提供了一種思路,該模型將日收益率和已實現(xiàn)波動率統(tǒng)一在一個模型中進行估計,嘗試使用日收益率中蘊含的信息來糾正已實現(xiàn)波動率對真實波動率估計中的偏差。
如何對于SV類模型的參數(shù)進行有效的估計一直是一個難點問題,直到隨著MCMC方法的提出和不斷發(fā)展,Jacquier et al.(1994)將基于現(xiàn)代貝葉斯分析方法的MCMC方法引入了SV模型的參數(shù)估計中,從此MCMC方法成為研究者對于SV類模型的參數(shù)估計的主要方法[2]。此后,針對不同情況的參數(shù)估計,統(tǒng)計學(xué)家們開發(fā)了多類MCMC算法。其中Neal(2010)提出的HMC算法[3]利用了局部的幾何結(jié)構(gòu)采更快的生成建議值,對于高維分布的模擬效率有顯著提高。
考慮到RASV模型中形式復(fù)雜的待估計參數(shù),本文嘗試在MH框架下結(jié)合Gibbs抽樣和HMC算法,得到了適用于模擬復(fù)雜高維分布的Gibbs-HMC算法。利用Gibbs-HMC算法,對RASV模型的參數(shù)進行了模擬抽樣。模擬次數(shù)為50000次,去掉10000次burn-in后,得到了40000個樣本。本文將模擬抽樣得到的樣本的平均值作為參數(shù)估計值,并對參數(shù)估計結(jié)果做出了分析。分析結(jié)果表明,RASV模型可以比較準確的描述中國股市的統(tǒng)計特征。
Takahashi et al.于2009年提出了RASV模型,其核心思想是同時利用包含日內(nèi)高頻收益率數(shù)據(jù)信息的已實現(xiàn)波動率和日收益率數(shù)據(jù)來建立模型。利用日收益率中受微觀市場噪音影響較小的真實波動率的潛在信息,校正己實現(xiàn)波動率的偏差,使得該模型對真實波動率的估計準確程度大大上升。同時,由于日收益率和已實現(xiàn)波動率在同一模型中的相互制約,使得研究者在使用該模型時無需額外地去計算最佳抽樣頻率。此外,該模型由于引進了日收益率的參數(shù)模型,最終除了得到一個真實波動率的估計之外,還可以得到日收益率的一個模擬分布,因此可以輕易地通過日收益率的模擬分布去計算VAR、預(yù)期短缺等常見金融風(fēng)險測度量。
其統(tǒng)計結(jié)構(gòu)如下所示:
y1,t=exp(ht/2)t,
t=1,2,…,T,
y2,t=ξ+ht+ut,
t=1,2,…,T,
ht+1=μ+φ(ht-μ)+ηt,
t=1,2,…,T,
t=1,2,…,T.
其中y1,t是日收益率時間序列,y2,t則是已實現(xiàn)波動率序列。ht是潛在的真實波動率,參數(shù)μ表示其均值,可以衡量整個系統(tǒng)波動率的平均水平。參數(shù)φ則表示其一階自相關(guān)性,用以刻畫波動率的持續(xù)性效應(yīng)。參數(shù)ξ是偏差校正項,用以校正已實現(xiàn)波動率對真實波動率估計的偏差。t、ut和ηt則是波動項,而參數(shù)ρ代表了y1,t與ht+1之間的波動相關(guān)性,用以刻畫市場中可能存在的非對稱效應(yīng)。
貝葉斯統(tǒng)計推斷是用以估計參數(shù)的常用方法。其基本思路是,假定要估計的模型參數(shù)是服從某一分布的隨機變量,首先根據(jù)經(jīng)驗或者主觀判斷給出待估計參數(shù)的一個先驗密度函數(shù)π(θ),關(guān)于該先驗分布的信息被稱作先驗信息:然后根據(jù)已知的樣本信息給出的似然函數(shù)L(X|θ),應(yīng)用貝葉斯定理,得到待估計參數(shù)的后驗密度函數(shù)P(θ|X),進而得到后驗分布。然后利用得到的后驗分布的統(tǒng)計性質(zhì)來估計參數(shù)。貝葉斯統(tǒng)計推斷通常結(jié)合MCMC方法使用,使用MCMC方法可以由后驗密度函數(shù)直接模擬得到一個符合后驗分布的參數(shù)樣本,然后利用模擬得到的樣本的性質(zhì)來估計模型參數(shù)。
為了貝葉斯統(tǒng)計推斷時的便利性,本文首先對RASV模型進行等價變形,主要是對真實波動率做一個中心化的處理,然后將波動項標準化。
令σ=exp(μ/2),αt=ht-μ,c=ξ+μ,則 RASV模型的等價形式為:
y1,t=σexp(αt/2)t,
t=1,2,…,T,
y2,t=c+αt+σuut,
t=1,2,…,T,
αt+1=φαt+σηηt,
t=1,2,…,T,
t=1,2,…,T.
接下來對上述形式的RASC模型進行貝葉斯統(tǒng)計推斷。
首先憑經(jīng)驗給出參數(shù)θ1=(c,σu,σ,φ,ση,ρ)的先驗分布:
由此可以得到θ1的先驗密度函數(shù):
而α=(α1,α2,α3,…,αT)的先驗密度函數(shù)
接下來計算θ1和α的似然函數(shù)L(θ1,α|y1,y2)
由上可以計算θ1和α的后驗密度函數(shù),本文給出的是其對數(shù)形式:lnP(θ1,α|y1,y2) =lnp(θ1,α)+lnL(θ1,α|y1,t,y2,t)
在t時刻,θ(t)=θ,設(shè)θ=(θd1,θd2,…θdk),結(jié)合Gibbs抽樣的HMC算法(Gibbs-HMC)生成θ(t+1)時依次更新θd1,θd2,…θdk,同時每步更新都引入一個隨機變量p,其中更新θdi的步驟為:
·生成隨機數(shù)p~N(0,Indi),V~π(θdi|θ-di),r=1,其中ndi是θdi的維數(shù),且
θ-d1=(θd2,θd3,…θdk)
θ-di=(θd1,…θdi-1,θdi+1…θdk),i=2,3…k
·依據(jù)以下映射生成建議值:
Τdi:[θ,V,p,r]→[ξ,W,p′,r′]
其中由于HMC中每一步Metropolis更新包含L步廣義leapfrog迭代,設(shè)映射Τdi表示包含一步廣文leapfrog迭代的更新:
Tdi:[θ,V,p,r]→[ξ,W,p′,r′]
ξ-di=θ-di
W=θdi
r′=-r
·計算接受概率:
其中|JTdi(θdi,V)|是映射Tdi的雅可比行列式在(θdi,V)點處的取值。由于Gibbs抽樣和HMC算法中的映射都是自逆的,因此映射Tdi作為這兩者的復(fù)合映射也是自逆的,所以|JTdi(θ,V,p,r)|=1。
同時有
π(ξ,W,p′) =π(ξdi,p′|ξ-di,W)π(ξ-di,W)
=π(ξdi,p′|θ-di,θdi)π(θ-di,θdi)
=π(ξdi,p′|θ)π(θ)
=π(ξdi,p′|π(θ)
π(θ,V,p) =π(V,p|θ)π(θ)
=π(V,p)π(θ)
于是有接受概率
=min{1,exp[H(V,p)-H(ξdi,p′)]}
(一)數(shù)據(jù)處理
(二)應(yīng)用Gibbs-HMC算法
設(shè)θ1=(c,σu,σ,φ,ση,ρ),為了應(yīng)用Gibbs-HMC算法對θ=(θ1,α)的聯(lián)合后驗分布進行模擬抽樣,我們首先把隨機向量θ分為5部分,即θ=(α,φ,(σ,ση,ρ),σu,c),設(shè)θ(1)=α,θ(2)=φ,θ(3)=(σ,ση,ρ),θ(4)=σu,θ(5)=c,然后依次更新θ(1),θ(2),…θ(5)。
(三)參數(shù)估計結(jié)果
將處理過的滬深300指數(shù)數(shù)據(jù)代入RASV模型,然后對其參數(shù)的后驗密度函數(shù)應(yīng)用Gibbs-HMC算法。對參數(shù)進行了50000次模擬,去掉10000次burn-in,每個參數(shù)均得到40000個樣本。
參數(shù)c,σu,σ,φ,ση,ρ的樣本頻數(shù)直方圖見圖(1)
圖1
取得到的參數(shù)樣本的均值作為估計值,如(表1)所示。
表1
(四)參數(shù)樣本的生成效率檢驗
首先,還是計算生成的參數(shù)樣本的自相關(guān)系數(shù),考察其收斂性。
α,c,σu,σ,φ,ση,ρ的1000階自相關(guān)系數(shù)如下圖所示(2):
從下圖中可以看出,生成的樣本,自相關(guān)系數(shù)下降同樣非常迅速,表明Markov鏈收斂到目標分布的收斂速度比較快。
圖2
同樣的,我們繼續(xù)計算樣本的無效因子IP值,IP取值越小樣本的有效性越強。
計算α,c,σu,σ,φ,ση,ρ的10000階無效因子IF,結(jié)果如圖(3)所示。
圖3
可以看出,φ和ση的無效因子IF值開始較高,但最終在接近10000階時都穩(wěn)定在了0附近,說明生成的樣本的有效性比較高。
(五)參數(shù)估計結(jié)果分析
參數(shù)的估計值θ′,如下表所示(表2)。
表2
由σ=exp(μ/2),c=ξ+μ,可以反解出μ和ξ。
μ=2lnσ,
ξ=c-μ.
計算可得μ的估計值為-0.921,ξ的估計值為0.953。因此,可以得到變形前的RASV模型的參數(shù)估計值,如下表所示(表3):
表3
其中,參數(shù)ξ的估計值反映的是滬深300指數(shù)數(shù)據(jù)中,微觀市場噪聲和非交易時間對已實現(xiàn)波動估計真實波動率時的影響。由于ξ的估計值0.953>0,說明日內(nèi)1分鐘高頻數(shù)據(jù)得到的已實現(xiàn)波動率對真實波動率來說是一個偏高估計。這表明在2016年的滬深300股票市場中,已實現(xiàn)波動率對真實波動率估計的偏差主要來源于微觀市場噪聲的影響,而非非交易時間的影響,而參數(shù)ση的估計值表明了已實現(xiàn)波動率對真實波動率估計的擾動水平,其值為0.57。
參數(shù)μ的估計值為-0.921,反映的是滬深300指數(shù)波動率的波動水平。參數(shù)φ的估計值反映的則是波動率的持續(xù)性參數(shù),由于其估計值0.369較高,可以看出我國2016年的股市具有較強的波動持續(xù)性。參數(shù)σu的估計值表明了滬深300指數(shù)波動率的擾動水平,其值為0.894。
參數(shù)ρ的估計值則反映了y1,t與ht+1之間的相關(guān)性。其估計值-0.052<0,說明t日收益率與t+1日的波動率之間是負相關(guān)的,因此證明我國2016年股票市場上存在非對稱效應(yīng)。
本文使用了2016年1月1日至2016年12月31日的滬深300指數(shù)數(shù)據(jù),利用RASV模型對我國股市的收益率特征進行建模模擬,其中已實現(xiàn)波動率數(shù)據(jù)使用了該時段的1分鐘高頻數(shù)據(jù)。隨后使用Gibbs-HMC算法對RASV模型的參數(shù)進行了模擬抽樣,模擬次數(shù)為50000次,去掉10000次burn-in后,得到了40000個樣本。最后,將模擬抽樣得到的樣本的平均值作為參數(shù)估計值,并對參數(shù)估計結(jié)果做出了分析。分析結(jié)果表明,RASV模型可以比較準確的描述中國股市的統(tǒng)計特征。
[1]Takahashi M,Omori Y,Watanabe T,(2009).Estimating stochastic volatility models using daily returns and realized volatility simultaneously.Comput Stat Data Anal 53:2404-2426.
[2]Jacquier,E.,Polson,N.G.,Rossi,P.E.(1994).Bayesianan alysis of stochastic volatility models(with discussion).J.Business Econom.Statist.12,371-417.
[3]Neal,R.M.(2010).MCMC using Hamiltonian dynamics.In Handbook of Markov Chain Monte Carlo(eds S.Brooks,A.Gelman,G.Jones and X.-L.Meng).BocaRaton:Chapman and Hall-CRC Press.
2017-05-20
李荃(1993-),男,山東濱州人,四川大學(xué)數(shù)學(xué)碩士,從事MCMC算法及其應(yīng)用研究。 唐亞勇(1974-),男,四川成都人,博士,副教授,碩士研究生導(dǎo)師,主要研究方向為金融數(shù)學(xué)及應(yīng)用統(tǒng)計學(xué)。
O24
A
1008—3340(2017)03—0084—05