包 悅 妍
(南京審計大學 統(tǒng)計與數(shù)據(jù)科學學院,南京 211815)
協(xié)方差矩陣建模在風險管理、投資組合管理和資產(chǎn)定價方面有著重要的應用。同時,馬科維茨[1]投資組合理論的提出進一步推動了協(xié)方差矩陣的一系列研究。新時代下大量數(shù)據(jù)帶來了更多新的挑戰(zhàn),比如維數(shù)問題導致的估計的一致性、預測的精度等。目前,使用高頻日內(nèi)數(shù)據(jù)獲得更可靠的低頻收益率協(xié)方差矩陣是較為主流的方法。
Merton[2]最早提出基于日內(nèi)收益平方和估計波動率的方法——已實現(xiàn)方差(Realized Variance,RV)。隨后“已實現(xiàn)”方法也被運用到協(xié)方差估計上,得到了已實現(xiàn)協(xié)方差;Dong等[3]基于HAR思想和Engle(2002)的動態(tài)條件相關(guān)系數(shù)模型(Dynamic Conditional Correlation,DCC)方法,構(gòu)造了HAR-DRD波動率矩陣預測模型;Callot等[4]提出VAR-LASSO模型,他們對波動率矩陣做了對數(shù)化處理,然后使用向量自回歸模型建模,結(jié)合LASSO方法對系數(shù)矩陣進行降維,估計出具有稀疏特性的系數(shù)矩陣;Bollerslev等[5]在已實現(xiàn)協(xié)方差矩陣的基礎(chǔ)上,將其分解成3部分:正部、負部和混合已實現(xiàn)半?yún)f(xié)方差矩陣,結(jié)果表明半?yún)f(xié)方差方法對經(jīng)濟信息反應更敏銳,有效提升了投資組合波動率的預測精度。深度學習因為其能處理更多種類的信息被廣泛應用于波動率的預測上,如長短記憶神經(jīng)網(wǎng)絡模型(LSTM)、循環(huán)神經(jīng)網(wǎng)絡模型(RNN)、卷積神經(jīng)網(wǎng)絡(CNN)等方法。現(xiàn)有的研究一般將深度學習用來預測股票指數(shù)的波動率,如Zhou等[6]使用CSI300和百度每日28個搜索關(guān)鍵詞作為LSTM模型的輸入來預測指數(shù)波動率。另外,還有一些學者嘗試將深度學習方法和傳統(tǒng)時間序列方法結(jié)合來預測波動率,如Psaradellis等[7]提出一種將異質(zhì)自回歸模型(HAR)[8]和遺傳算法支持向量機模型(GASVR)相結(jié)合的方法(HAR-GASVR)對波動率進行預測。許多研究表明深度學習模型在波動率預測與應用方面有著優(yōu)秀的表現(xiàn),但僅限于一維情況,對于預測多維協(xié)方差矩陣方面的研究幾乎沒有,深度學習模型的運行過程是個“黑匣子”,模型的解釋度差。與深度學習模型相反,時間序列模型雖然對高維數(shù)據(jù)的處理能力差,但它能夠?qū)Σ▌勇侍赜械男再|(zhì),如長期記憶性、聚集性、杠桿性進行刻畫,因此模型的可解釋性強。
針對以上問題,提出了基于LSTM模型、DRD分解、半?yún)f(xié)方差思想和HAR模型的協(xié)方差矩陣預測模型(LSTM-SDRD-HAR)。半?yún)f(xié)方差方法和HAR模型可以反映協(xié)方差矩陣存在的長期記憶性和杠桿性,讓模型更好理解,LSTM模型則可以提高預測精度,通過模型結(jié)合實現(xiàn)預測模型的強解釋性和高預測準確度。本文先介紹了關(guān)于模型LSTM-SDRD-HAR的構(gòu)建原理,然后對其進行統(tǒng)計評價和經(jīng)濟效益評價,結(jié)果表明協(xié)方差矩陣預測模型LSTM-SDRD-HAR的預測精度高,在投資組合中表現(xiàn)優(yōu)秀。
Andersen等[9]于1998年提出了已實現(xiàn)波動率的概念,使得波動率變成“可觀測值”,就有了已實現(xiàn)協(xié)方差的定義:
其中,RCOVij,t是第i個資產(chǎn)與第j個資產(chǎn)在第t天的已實現(xiàn)協(xié)方差,ri,t,k/M為第i個資產(chǎn)第t天的第k個對數(shù)收益率,則n個資產(chǎn)的已實現(xiàn)協(xié)方差矩陣為
∑t=(RCOVij,t)n×n
Bollerslev等在2020年進一步提出了已實現(xiàn)半?yún)f(xié)方差的概念。首先,定義函數(shù)p(x)≡max {x,0},n(x)≡min {x,0},然后將已實現(xiàn)協(xié)方差矩陣分成3個部分,分別是正部、負部和混合部,假設(shè)考慮n個資產(chǎn),定義分別如下:
HAR模型可用于描述波動率的長期記憶性,鑒于該模型結(jié)構(gòu)簡單且預測效果好,被廣泛使用。Chiriac等[10]將HAR模型從一維情形推廣到高維情形,得到向量形式的HAR。他們對已實現(xiàn)協(xié)方差矩陣∑t進行拉直向量化,由于∑t為對稱矩陣,可只將其下三角部分進行向量化Ht=vech(∑t),則Ht為n*=n(n+1)/2維向量,向量形式HAR模型為
Ht=θ0+θ1Ht-1+θ2Ht-5|t-1+θ3Ht-22|t-1+εt
LSTM網(wǎng)絡是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(RNN),它與RNN的區(qū)別在于中間狀態(tài)的更新方式不同,這讓LSTM能夠解決梯度消失和梯度爆炸問題。不僅如此,在處理一些需要長期記憶問題,即當研究的序列較長時,LSTM的表現(xiàn)優(yōu)于RNN。因此,LSTM模型十分適合用來預測波動率,LSTM模型構(gòu)建如下:
ft=σ(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
Ot=σ(WO·[ht-1,xt]+bO)
ht=Ot°tanh(Ct)。
LSTM-SDRD-HAR模型就是通過整合DRD分解、半?yún)f(xié)方差、LSTM模型和HAR模型來構(gòu)建的,具體實施步驟:
步驟2 對Rt作拉直向量化處理,由于Rt為對稱矩陣且主對角線恒為1,只需對其下三角矩陣進行拉直向量化,令yt=vech(Rt),利用HAR模型對yt進行建模,再返回至矩陣形式。
LSTM-SDRD-HAR模型通過LSTM模型和HAR模型刻畫數(shù)據(jù)的長期記憶性,半?yún)f(xié)方差方法刻畫數(shù)據(jù)的杠桿性,讓模型更容易挖掘數(shù)據(jù)的特征,并且針對波動規(guī)律不同的部分Dt和Rt分別建模,具體問題具體分析,有利于找尋各自規(guī)律,提高模型的預測精度。
實證采用上證50成分股中10只股票的5 min交易數(shù)據(jù),這10只股票的選取方法是將成分股的股票代碼從小到大排序,取排在前10的股票。5 min高頻收益率數(shù)據(jù)來源于銳思數(shù)據(jù)庫,時間跨度為2004-01-02—2019-12-31,將整個數(shù)據(jù)樣本分為樣本內(nèi)數(shù)據(jù)和樣本外數(shù)據(jù),樣本內(nèi)數(shù)據(jù)為2004-01-02—2016-02-05期間數(shù)據(jù),共2 850個交易日,樣本外數(shù)據(jù)為2016-02-06—2019-12-31期間數(shù)據(jù),共943個交易日。
根據(jù)10只股票的5 min高頻收益率計算已實現(xiàn)協(xié)方差矩陣。計算已實現(xiàn)協(xié)方差矩陣時,若某只股票缺失數(shù)據(jù)很多,將會出現(xiàn)已實現(xiàn)協(xié)方差矩陣不正定的情況,會給估計和預測帶來較大誤差,所以對交易日進行剔除處理,刪去數(shù)據(jù)缺失率達到25%的交易日,剔除后剩余3 793個交易日。對于數(shù)據(jù)缺失量少于25%的交易日內(nèi)數(shù)據(jù),進行缺失值填補,填補規(guī)則為采用上一個時間段的收盤價價格,作為該時間段的收盤價格,計算出該5 min收益率。
表1展示了分解后10只股票已實現(xiàn)波動率Dt的均值與標準差,還有相關(guān)系數(shù)矩陣Rt的平均水平。從表1可知:10只股票的已實現(xiàn)波動率均值在0.02附近,且不同股票的已實現(xiàn)波動率相對差異較大,體現(xiàn)了已實現(xiàn)波動率的相對獨立特性。此外,這10只股票對應的已實現(xiàn)波動率標準差相近,一定程度上反應了10只股票的流動性和上證50市場的特性,即當市場報價集中在一個共同價格水平附近,市場的買方和賣方都愿意在當前價格附近,以較小的價差執(zhí)行股票交易,波動率會較低且保持穩(wěn)定。流動性強的市場會有更多的機遇,投資者通過合理制定投資策略就可以實現(xiàn)獲利。在研究相關(guān)關(guān)系時,相關(guān)系數(shù)大于等于0.3,就可以認為數(shù)據(jù)存在相關(guān)關(guān)系,從表1相關(guān)系數(shù)矩陣Rt的均值可以看出,同一市場內(nèi)一些股票之間的相關(guān)性很小,但其他股票之間有相關(guān)關(guān)系,研究清楚其中的關(guān)系,有利于對已實現(xiàn)協(xié)方差矩陣更準確地預測并做出投資計劃。在此,研究上證50的這10只股票是有意義和價值的。
表1 描述性統(tǒng)計
經(jīng)過比較每一只股票的已實現(xiàn)波動率RDi,t和已實現(xiàn)相關(guān)系數(shù)Rt(i,j)時間序列圖,發(fā)現(xiàn)已實現(xiàn)波動率RDi,t和已實現(xiàn)相關(guān)系數(shù)Rt(i,j)的變化規(guī)律不同,限于篇幅,下文僅以浦發(fā)銀行為例。圖1描繪的是第一只股票浦發(fā)銀行的已實現(xiàn)波動率RD1,t,大致在2008年和2016年,RD1,t波動得比較劇烈,整體上波動幅度不大,較為穩(wěn)定;圖2描繪的是浦發(fā)銀行與第二只股票東風汽車的已實現(xiàn)相關(guān)系數(shù)Rt(1,2),其波動幅度大,說明已實現(xiàn)相關(guān)系數(shù)Rt(1,2)反映了一定時間內(nèi)市場情況的變化。比較圖1和圖2,可以直觀地看到:已實現(xiàn)波動率Dt和相關(guān)系數(shù)Rt兩者的形態(tài)是不同的,已實現(xiàn)波動率Dt的時間序列圖有明顯的波峰,變化值小且穩(wěn)定;而相關(guān)系數(shù)Rt波峰不明顯,波動大且頻繁,因此有必要對Dt和Rt分別進行研究。
圖1 已實現(xiàn)波動率RD1,t時間序列圖
圖2 相關(guān)系數(shù)Rt(1,2)時間序列圖
選取均方根誤差,F(xiàn)RMSE和均方誤差FMAE這兩個指標來評價已實現(xiàn)協(xié)方差矩陣預測模型的預測能力,指標定義如下:
在實證研究中,n=10,T=943。
為了展示構(gòu)建的已實現(xiàn)協(xié)方差矩陣的預測效果,在此將其與HAR、EWMAQ、HAR-DRD、LASSO-VAR、LASSO-DRD、LSTM-DRD-HAR模型進行比較。
表2展示了7個模型在樣本外的預測誤差,可以看到HAR模型存在的明顯問題就是預測效果差。EWMAQ模型是在指數(shù)移動平均模型(EWMA)的基礎(chǔ)上將估計誤差考慮進模型的調(diào)參過程,結(jié)果顯示這個做法確實帶來了預測效果的提升,結(jié)果與HAR-DRD模型相差無幾,但EWMAQ在計算過程中會涉及四階矩,計算較為復雜且耗時久。與EWMAQ相比,剩下6個模型的計算過程簡便且耗時短。表2結(jié)論主要如下:對比HAR和HAR-DRD、LASSO-VAR和LASSO-DRD模型發(fā)現(xiàn),經(jīng)過DRD分解再建模比不分解直接建模預測結(jié)果更準確,這說明事先進行DRD分解是有必要的,它將不同結(jié)構(gòu)的組成部分分離開來,對不同部分建模找尋各自的規(guī)律可以提高準確性,所以考慮的模型中大部分都采用了DRD分解;表中預測效果最好的是LSTM類模型,LSTM算法比LASSO算法的模型精度提升至少8%,LSTM-SDRD-HAR的樣本外預測結(jié)果僅次于LSTM-DRD-HAR。總體來說,DRD分解和LSTM模型能有效改進模型預測精度,并且不會增加計算復雜度。
表2 已實現(xiàn)協(xié)方差矩陣樣本外預測結(jié)果
為了評估波動率矩陣預測的經(jīng)濟價值,考慮馬科維茨有效前沿。假定投資者是風險厭惡型的,則在相同的年化預期收益率μp下,他們會選擇風險更小的資產(chǎn);同樣地,如果風險水平相同,投資者們就會選擇高收益資產(chǎn)。在這里,最優(yōu)投資組合就是下面這個問題的解:
圖3中“Oracle”代表的是理想情況,在所有有效前沿的上方,很明顯它是最優(yōu)的。星標的位置表示全局最小方差組合,從圖3可以看出:HAR模型的全局最小方差組合風險最大,收益僅高于EWMAQ模型;而EWMAQ模型的全局最小方差組合的收益最低。在經(jīng)濟評價中也有著和統(tǒng)計評價相一致的結(jié)果:LSTM類模型的全局最小方差組合風險最小,因為模型LSTM-DRD-HAR精準的預測,所以其有效前沿曲線與理想情況相近,而模型LSTM-SDRD-HAR因為對重大事件敏感,所以能有效規(guī)避風險,在同等的風險水平下獲得更高的收益;LSTM類優(yōu)于LASSO類模型,LASSO類又優(yōu)于HAR、EWMAQ和HAR-DRD類;考慮DRD分解的模型,它們的有效前沿曲線在沒有考慮DRD分解模型的上方,說明DRD分解也有利于改善經(jīng)濟評價。綜上,LSTM算法和DRD分解不僅可以提高預測精度,在投資組合優(yōu)化方面也起到了積極作用,其中模型LSTM-SDRD-HAR的綜合評價最高。
圖3 馬科維茨有效前沿圖
近年來,深度學習在預測低維時間序列時表現(xiàn)出很好的預測效果,如何利用深度學習預測優(yōu)勢,結(jié)合傳統(tǒng)時間序列模型的特征優(yōu)勢,從而提升協(xié)方差矩陣的預測能力,值得深入分析與研究。