呂永健,符廷鑾,胡穎毅,戴丹苗
(1.西南財經大學金融學院,四川 成都 611130;2.西南財經大學中國金融研究中心,四川 成都 611130;3.國信證券博士后工作站,廣東 深圳 518001)
目前主流的市場風險測度指標是由J. P. Morgan 投資銀行在Risk Metrics系統(tǒng)中提出的風險價值VaR(Value at Risk),VaR的測度方法可以分為歷史模擬法、蒙特卡羅模擬法和參數化方法等三類體系。在實務界,絕大部分商業(yè)銀行采用原理簡易、操作性強的歷史模擬法作為VaR的風險測度工具。例如Pérignon和Smith[1]指出,傳統(tǒng)歷史模擬法(Traditional historical simulation;THS)和濾波歷史模擬法(Filtered historical simulation;FHS)在各國際商業(yè)銀行之間使用率最高,約73%的銀行直接采用THS方法。
從現有的研究文獻來看,絕大多數關于VaR測度方法的研究工作都集中在了參數化方法上,而針對原理簡易、操作性較強的歷史模擬法的研究則較為缺乏。比如,很多學者將參數化的GARCH族模型及其衍生模型(如Copula—GARCH模型,以及半參數GARCH模型等)應用于風險測度建模[2-7],或者基于EVT理論進行風險測度研究[8-10]。在有限的關于歷史模擬法研究文獻中,Boudoukh等[11]認為對于預測未來的市場風險,近期的歷史收益率應當被賦予更大的概率權重,并基于上述思路提出了BRW歷史模擬法。Barone-Adesi等[12-13]通過結合參數化方法和THS方法提出了FHS方法,研究發(fā)現FHS方法比THS方法具有更好的風險測度精確性。Hull和White[14]也在參數化方法和THS方法的基礎上,提出了另一種形式的FHS方法——HW濾波歷史模擬法,并在其后的研究中發(fā)現HW方法的風險測度精確性要優(yōu)于THS方法和BRW方法。Dowd[15]指出拔靴法(Bootstrap)可以提高THS方法風險測度精確性。Costello等[16]發(fā)現基于半參數化方法的GARCH模型計算出VaR值的精確性要優(yōu)于基于歷史模擬的ARMA模型。Daníelsson等[17]研究指出基于THS方法計算出的VaR值在某些情況下容易違反次可加性(Subadditivity),尤其在極端損失(Extreme losses)不斷增加和小樣本的情況下。國內學者葉五一[18]也認為拔靴法可以有效改進THS方法的風險預測能力。黃劍[19]在實證研究中發(fā)現,BHS方法的風險預測能力要優(yōu)于THS方法,而BRW方法又優(yōu)于BHS方法。李孝華和宋敏[20]發(fā)現THS方法的VaR風險測度能力要優(yōu)于蒙特卡羅模擬法,但卻低于參數化方法。
上述文獻為本文研究工作的開展提供了良好的思路啟發(fā)和方法借鑒,但同時也存在以下幾點亟需改進之處:第一,樣本規(guī)模(Sample size)會對歷史模擬法的風險預測能力產生不同程度的影響[21],但在上述關于歷史模擬法的研究中并沒有充分考慮到這一因素;第二,后驗分析(Backtesting analysis)是風險測度模型研究中至關重要的組成部分,然而每一種后驗分析方法的檢驗能力都具有一定的局限性,所以Dumitrescu等[22]建議在研究中應盡可能采用多種不同類型的后驗分析方法來保證結論的可靠性,然而上述文獻所使用的后驗分析方法往往過少或者過于單一,顯然這對于全面甄別各模型的風險測度能力是極不充分的;第三,絕大部分關于VaR風險測度方法的研究工作都是圍繞著參數化方法,而從不同分位數水平以及不同類型風險測度方法的對比角度來針研究歷史模擬法風險測度能力的研究仍然較為缺乏。
另外,Efron[23]提出的拔靴法(Bootstrap)不僅給統(tǒng)計理論帶來了巨大的影響,同時也在金融風險管理領域內得到了充分的重視。例如,很多學者研究發(fā)現拔靴法可以改進并提高THS方法的風險測度精確性[15,18,19],還被應用于估計VaR和ES(Excepted Shortfall)等風險測度指標的置信區(qū)間,并在 ES后驗分析方法中得到了一定的應用[8]。根據上述認識,論文在充分借鑒以往研究成果的基礎上,將HW濾波歷史模擬法和拔靴法結合,構造了BHW(Bootstraped HW)方法。然后基于兩個不同的滾動樣本(125天和250天),采用6種后驗分析方法,對BHW方法和其余4種主流的風險測度方法(THS方法、BRW方法、HW方法以及參數化GARCH模型方法)的VaR測度精確性進行了對比分析。
論文的研究樣本為上海黃金交易所中Au99.99和Au99.95兩種現貨交易品種。目前,黃金已成為了與股票、債券平行的投資工具,而和股票市場、債券市場相比,黃金市場的風險因素又具有一定的獨特性。例如,黃金價格和美元匯率之間具有極強的聯動關系;通貨膨脹因素會對黃金價格產生直接的影響;金融危機可以助漲黃金的價格等[24]。次貸危機爆發(fā)之后,受量化寬松(Quantitative Easing)政策的影響,黃金市場的價格波動性進一步放大,市場風險也引起了越來越多的關注。但就作者掌握的文獻范圍來看,關于國內黃金市場風險測度的研究尚還比較缺乏(在極為有限的文獻中,周茂華等[25]對比了不同GARCH族模型在國內外黃金市場風險測度中表現出的精確性差異)。
綜上所述,本文的研究特色主要體現在以下幾點:第一,論文構建的BHW方法在實證研究中具有較好的精確性,尤其在樣本規(guī)模較小的情形下;第二,為進一步考察樣本規(guī)模因素對歷史模擬法風險預測能力的影響,論文分別基于兩個不同的滾動樣本規(guī)模對各風險測度方法展開對比分析;第三,考慮到每種后驗分析方法的診斷能力都具有一定的局限性[22],論文同時運用6種后驗分析方法全面甄別各個風險測度方法的精確性。
論文以上海黃金交易所中的黃金現貨日交易價格數據為樣本,具體包括Au99.95和Au99.99兩個現貨品種(后文稱為“黃金9999”和“黃金9995”)。樣本區(qū)間為2004年1月1日至2014年6月30日(各約2700個樣本數據),數據來源于CSMAR數據庫。圖1介紹了兩個黃金市場價格變化和收益率波動情況,具體如下:
圖1 黃金市場價格變化和收益率波動
表1報告了樣本數據的描述性統(tǒng)計結果,具體如下:
表1 樣本數據的描述性統(tǒng)計結果
注:表中,J-B為檢驗收益率是Jarque-Bera統(tǒng)計量;ADF是Augmented Dickey-Fuller單位根檢驗統(tǒng)計量;Q1(20)為滯后階數為20的收益率Ljung-BoxQ統(tǒng)計量;Q2(20)為滯后階數為20的平方收益率Ljung-BoxQ統(tǒng)計量;“*”代表在5%水平下顯著。
根據圖1的圖形結果和表1的描述性統(tǒng)計結果,可以得出如下結論:第一,從基于滯后20階的Ljung-BoxQ統(tǒng)計量來看,在5%的顯著性水平下,兩個樣本收益波動的長記憶性特征十分顯著;第二,所有J-B檢驗值在5%的水平下均十分顯著,說明兩個樣本非條件收益均不服從標準正態(tài)分布,再從偏度值和峰度值來看,收益分布呈現出明顯的“尖峰厚尾”(Leptokurtic and Fat tailed)和“有偏”(Skewed)形態(tài);最后,從ADF單位根檢驗結果來看,在5%顯著水平下,兩個收益序列是平穩(wěn)的。
VaR是指在100α%最壞情況下,某一資產(或者資產組合)所面臨的最小潛在損失,其中α∈(0,1),如下式:
(1)
上式中,Rt為t期某一資產(或者資產組合)的收益率,Prt-1表示基于第t-1期信息的條件概率。
在本文的研究中,我們首先采用了非參數化的THS方法、BRW方法和半參數化的HW方法等3種主流歷史模擬法。限于篇幅,下文僅對HW方法進行闡述,關于THS方法和BRW方法的步驟參見Boudoukh等[11]。
Hull和White[14]結合參數化方法和歷史模擬法,提出了HW方法,該方法是一種半參數方法。假定有N個樣本{r1,r2,…,rN},HW方法計算VaR序列值的步驟如下:
(1)基于GARCH類模型估計出波動率序列{σ1,σ2,…,σN};
(2)設定滾動窗口期T,T≤N;
(3)根據第(1)步中估算出的波動率,對歷史數據進行濾波更新,rt是第t(t (2) (5)以T為樣本規(guī)模,按照上述步驟分別計算出第2期到第T+1期樣本{r2,r3,…,rT+1},第3期到第T+2期樣本{r3,r4,…,rT+2},…,第N-T+1到第N期樣本{rN-T+1,rN-T+2,…,rN}的VaR值,即可得到 HW方法計算出的VaR序列值。 為更全面地比較不同類型風險測度方法的精確性,除了采用歷史模擬法外,論文還選擇基參數化方法來建立風險測度模型。鑒于Hansen和Lunde[26]在對比了330種波動模型后認為,模型結構較為簡單的GARCH(1,1)具有極為良好的波動率預測能力,所以我們直接采用了GARCH(1,1)模型來建立風險測度模型。相關的計算步驟如下: (1)假定有N個樣本{r1,r2,…,rN},設定滾動窗口期T,T≤N; (3) (3)以T為樣本規(guī)模,按照上述步驟分別計算出第2期到第T+1期樣本{r2,r3,…,rT+1},第3期到第T+2期樣本{r3,r4,…,rT+2},…,第N-T+1到第N期樣本{rN-T+1,rN-T+2,…,rN}的VaR值,即可得到基于GARCH模型方法計算出的VaR序列值。 在風險管理領域內,有學者結合拔靴法設計出了新的風險測度方法,其中最具代表性的風險測度方法為拔靴歷史模擬法(Bootstrap Historical Simulation;BHS)。很多研究指出BHS方法的風險測度精確性要優(yōu)于THS方法(Dowd[15];葉五一[18];黃劍[19])。不過需要指出的是,拔靴法要求樣本數據具有獨立同分布(i.i.d)特性,而資產收益普遍具有“波動聚集性”(Volatility Clustering),即收益序列之間可能存在一定的相關性,那么此時拔靴法對THS方法的改進效果將會受到一定的限制。 在借鑒以往對歷史模擬法研究思路的基礎上(Hull和White[14];Dowd[15];Daníelsson等[17];葉五一[18];黃劍[19];李孝華和宋敏[20]),論文將拔靴法與Hull和White[14]的HW濾波歷史模擬法相結合構造了BHW方法(Bootstrap HW)。區(qū)別于BHS方法利用拔靴法對原始收益序列進行隨機抽樣的做法,BHW 方法則針對更趨近獨立同分布(Approximatelyi.i.d)特征的HW濾波樣本。BHW方法的設計思路如下: (2)設定滾動窗口期T,T≤N; (4) (6)以T為樣本規(guī)模,重復步驟(2)到步驟(5),分別計算出第2期到第T+1期,第3期到第T+2期,…,第N-T+1到第N期的VaR值,即可得到BHW方法計算出的VaR序列值。 在后驗分析部分中,我們總共采用了6種嚴謹系統(tǒng)的后驗分析方法,具體包括Kupiec[27]的非條件覆蓋檢驗(Unconditional Coverage Test),Christoffersen[28]的獨立性檢驗(Independence Test)和條件覆蓋檢驗(Conditional Coverage Test),Engle和Manganelli[29]的動態(tài)分位數檢驗(Dynamic Quantile Test),以及Dumitrescu等[22]的兩種動態(tài)二進制檢驗(Dynamic Binary Test)。 第一種后驗分析方法為Kupiec[27]的非條件覆蓋檢驗(Unconditional coverage test)。首先定義一個α分位數水平下和VaR測度“失敗事件”(Violation)相關的二元變量(Binary variable)序列It(α): (5) 如果t時刻的實際損失超出VaR值,記為“失敗事件”,此時該序列在t時刻取值為1,否則為0。如果用于計算VaR值的風險測度模型足夠準確,則該二元變量序列應該服從概率為α的伯努利(Bernoulli)分布。當原假設成立時,可以證明以下似然函數比值(Likehood Ratio)LRuc滿足: LRuc=-2ln{(1-α)T0αT1/[(1-T1/T)T0(T1/T)T1]}~χ2(1) (6) 上式中,T為碰撞序列的總長度,T1是序列中取值為1時發(fā)生次數的總和,T0是序列當中取值為0時發(fā)生次數的總和。在分位數水平α上,如果所計算的LRcc統(tǒng)計量大于該水平上自由度為1的χ2分布的臨界值,則我們應該拒絕原假設H0;反之,則應該接受原假設,即認為所采用的風險測度模型是足夠準確的。 第二種后驗分析方法為獨立性檢驗。Christoffersen[28]指出實際中的“失敗事件”可能會彼此相關而非獨立,而非條件覆蓋檢驗卻只關注了“失敗事件”的次數,并未對其獨立性進行考察。基于此認識,Christoffersen[28]構造出了獨立性檢,該檢驗的原假設H0為:本次“失敗事件”與前一次是獨立的。在原假設成立的情況下,可以證明似然函數比值LRind滿足: LRind=-2{ln[(1-P2)n00 + n10P2n01 + n11]-ln[(1-P01)n00P01n01(1-P11)n10P11n11]}~χ2(1) (7) 上式中,P01=n01/(n00+n01),P11=n11/(n10+n11),P2=(n01+n11)/(n00+n01+n10+n11),n00表示模型本期測度成功(即本期的實際損失并未超出VaR值),且前一期也成功的觀察期數;相應的n10表示模型本期測度失敗,但是前一期測度成功;n01表示模型本次測度成功,但是前一次失?。籲11表示模型本次測度失敗,前一次也失敗。如果所計算出的LRind統(tǒng)計量大于該水平上自由度為1的χ2分布臨界值,則拒絕原假設H0;反之,則接受原假設,即認為所采用的風險測度模型是足夠準確的。 第三種后驗分析方法為條件覆蓋檢驗。Christoffersen[28]在非條件覆蓋檢驗和獨立性檢驗基礎上設計出了條件覆蓋檢驗。它可以同時考察“失敗事件”次數是否在合理范圍之內,以及“失敗事件”之間是否獨立。在原假設成立的情況下,可以證明似然函數比值LRcc滿足: LRcc=LRuc+LRind~χ2(2) (8) 如果計算出的LRcc統(tǒng)計量大于該分位數水平上自由度為1的χ2分布的臨界值,則拒絕原假設H0;反之,接受原假設,即認為所采用的風險測度模型是足夠準確的。 第四種后驗分析方法為動態(tài)分位數檢驗。Engle和 Manganelli[29]認為對于檢驗風險測度模型的精確性,除了關注VaR的失敗率外,還應該觀察“失敗事件”之間是否具有一定的聯系,據此提出了動態(tài)分位數檢驗。該檢驗的具體步驟包括: 第一,建立如下“碰撞序列”: Hitt(α)=It(α)-α (9) 上式中,It(α)為式(8)中的二元變量序列。 第二,在得到“碰撞序列”之后,再對下式進行線性回歸: Hitt=Xλ+εt (10) 其中,X為T×K的矩陣。矩陣第一列的值為1,接下來的k列分別為Hitt-1,Hitt-2…Hitt-k。最后K-k-1列為附加解釋變量,可設為VaR值。Engle和Manganelli[29]證明在原假設成立的情況下,DQ統(tǒng)計值應該滿足: (11) 在α分位數下,DQ服從自由度為K的χ2分布。如果所計算出的DQ統(tǒng)計值大于χ2分布的臨界值,那么就應該拒絕原假設;反之,則接受原假設,即認為所采用的風險測度模型是足夠準確的。 最后兩種后驗分析方法為Dumitrescu等[22]的兩種動態(tài)二進制檢驗。Dumitrescu等[22]指出動態(tài)分位數檢驗是建立在線性回歸的基礎上,然而考慮到回歸方程中的變量是二分依變量(Dichotomous Dependent Variable),其殘差服從離散分布,此時最合適的方式為采用非線性回歸模型。鑒于此,Dumitrescu等[22]采用二元模型(Dichotomous Model)重新對因變量和解釋變量建立聯系,并據此提出了動態(tài)二進制檢驗。該檢驗步驟包括: 第一,建立二元動態(tài)反應模型(Dynamic Binary Response Model),在t時刻“失敗事件”的條件概率可由下式給出: Pr[It(α)=1|Ft-1]=E[It(α)|Ft-1]=F(πt) (12) 其中,F(·)為累計概率分布函數(Cumulative Distribution Function),Ft-1表示第t-1期已有的信息。我們再假設πt滿足如下兩種二元動態(tài)反應模型: πt=c+β1πt-1+ψ1VaRt-1 (13) πt=c+β1πt-1+δ1It-1(α)+ψ1VaRt-1+γ1VaRt-1It-1 (14) 兩個檢驗的原假設H0為: H0:β=0,ψ=0,c=F-1(α) (15) H0:β=0,δ=0,ψ=0,γ=0,c=F-1(α) (16) 原來假設成立時,可以證明似然函數比值DB滿足以下條件: (17) 如果所計算的DB統(tǒng)計量大于該分位數水平下自由度為dim(Zt)的χ2分布臨界值時,則拒絕原假設H0;反之,接受原假設,即認為所采用的風險測度模型是足夠準確的。 按照第2部分中各個風險測度方法的計算步驟,我們分別基于125個滾動樣本和250個滾動樣本計算出了黃金9999市場和黃金9995市場的VaR序列值。限于篇幅,我們僅報告了1%分位數下基于250個樣本規(guī)模的黃金9999市場VaR測算結果,圖形清晰起見,隨機截取了第500至第700個VaR測算值進行展示。具體如下: 從圖2的圖形結果來看,相對于THS方法和BRW方法,基于GARCH模型方法,HW方法和BHW方法計算出的VaR值能更適時的捕捉風險狀況變化,當然關于更為嚴謹的結論,則需要通過下一步的后驗分析而得出。 采用第3部分的6種后驗分析方法,論文基于兩個不同的滾動樣本規(guī)模(125天和250天),對包括BHW方法等在內的5種風險測度方法進行了后驗分析。表2和表3分別展示了兩個樣本規(guī)模下的后驗分析結果: 圖2 黃金9999市場的各風險測度模型的VaR測算值 表2 基于125個滾動樣本規(guī)模的各模型后驗分析結果 分位數FRUC-pIND-pCC-pDQ-pDB1-pDB2-p黃金9999THS1%0.0060.0761.0000.2080.5890.0800.038BRW1%0.0060.0761.0000.2080.5890.1020.052HW1%0.0090.0191.0000.0640.3370.1360.083GARCH-N1%0.0120.5751.0000.8540.2520.0820.040BHW1%0.0090.6411.0000.8970.9620.0870.143THS2.5%0.0220.4570.3000.4430.1150.0010.003BRW2.5%0.0180.0610.1470.0600.0920.0010.000HW2.5%0.0190.0871.0000.2320.4820.0020.001GARCH-N2.5%0.0220.5440.6800.7640.2270.0010.000BHW2.5%0.0220.3681.0000.6660.5590.0110.022THS5%0.0440.2390.7770.4810.2480.0010.007BRW5%0.0420.1290.6620.2880.3930.0010.008HW5%0.0460.4660.2810.4290.6250.0640.073GARCH-N5%0.0460.4010.6740.6430.2180.0010.000BHW5%0.0510.8840.8540.9730.8330.0890.049黃金9995THS1%0.0060.0801.0000.2160.5990.1030.125BRW1%0.0060.0801.0000.2160.5990.1090.142HW1%0.0060.0421.0000.1270.4700.0010.129GARCH-N1%0.0100.9681.0000.9990.3870.0780.033BHW1%0.0100.8421.0000.9800.9610.0870.181THS2.5%0.0220.4800.3030.4580.1500.0020.030BRW2.5%0.0170.0290.1160.0270.0820.0020.001HW2.5%0.0210.3061.0000.5930.4530.0000.001GARCH-N2.5%0.0220.4801.0000.7790.0270.0000.000BHW2.5%0.0230.5831.0000.8600.6370.0030.002THS5%0.0450.3690.8640.6580.1310.0010.007BRW5%0.0400.0700.5270.1590.0980.0270.060HW5%0.0470.5720.5980.7420.2850.1590.114GARCH-N5%0.0430.1770.4140.2880.3160.0080.003BHW5%0.0490.8150.5040.7780.1780.2000.147 注:在表中,表頭黑體部分為7種后驗分析指標,FR為失敗率值,UC-p代表非條件覆蓋檢驗的p值,IND-p代表獨立性檢驗的p值,CC-p代表條件覆蓋檢驗的p值,DQ-p代表動態(tài)分位數檢驗的p值,DB1-p代表第一種形式的動態(tài)二進制檢驗p值,DB1-p代表第二種形式的動態(tài)二進制檢驗p值;p值越大,則模型所估計的VaR值越精確;為便于觀察,我們在對比不同分位數下5種模型的p值之后,對每種后驗指標中最大的p值用粗體標識,并從5個模型中選出擁有粗體p值最多的風險測度模型,并再用粗體標識。 表3 基于250個樣本規(guī)模的各模型后驗分析結果 注:同上表。 根據圖1以及表2—表3,我們得出了以下主要結論: (1)綜合以上兩個滾動樣本規(guī)模的后驗分析結果來看,相對于其余4種風險測度方法,BHW方法表現出了相對最高的精確性,而在實務界被廣泛使用的THS方法的精確性最差。 首先,在兩個市場3個分位數下7個后驗分析指標的共84次后驗分析對比中,相對其余4種風險測度方法,BHW方法擁有最大后驗分析p值和最優(yōu)失敗率值的次數最多,有45次(為便于觀察,表中將該p值和失敗率值用粗體顯示),然后是HW方法,有28次,而實務界中使用最多的THS方法卻僅有9次; 其次,我們再從每個分位數水平下的 5種方法中選出擁有最大后驗分析p值和最優(yōu)失敗率值(表中的粗體p值和粗體失敗率值)最多的方法,作為該分位數水平下精確性最高的風險測度方法,在兩個樣本規(guī)模的兩個市場3個分位數水平下的共12次對比中,BHW方法有8次表現出了最高的精確性(為便于觀察,表中將該分位數下具有最高風險測度精確性的模型名稱用粗體顯示),僅次于BHW方法的是HW方法,有4次表現出了最高的精確性,GARCH-N模型有3次。 (2)從表2中基于125天滾動樣本規(guī)模的后驗分析結果來看,BHW方法的風險測度精確性優(yōu)于其余4個風險測度方法,而且優(yōu)勢極為顯著。 首先,在3個分位數下7個后驗分析指標的共42次后驗分析量化對比中,相對其余4種模型,BHW方法擁有最大后驗分析p值和最優(yōu)失敗率值的次數為34次(為便于觀察,表中將該p值和失敗率值加粗顯示),僅次于BHW方法的是GARCH-N方法,有6次,HW方法和THS方法有4次; 其次,我們再從每個分位數水平下的 5個風險測度方法中選出擁有最大后驗分析p值和最優(yōu)失敗率值(表中的粗體p值和粗體失敗率值)最多的方法,作為該分位數下精確性最高的風險測度方法,在兩個市場3個分位數水平的共6次對比中,BHW方法有6次,僅次于BHW方法的為GARCH-N方法,有1次。由上可以看出,BHW方法表現出的精確性相比其余的風險測度模型具有絕對的優(yōu)勢。 (3)從表3中基于250個滾動樣本規(guī)模的后驗分析結果來看,HW,BHW,GARCH-N三種方法都表現出了較好的精確性,其中HW方法表現出的精確性最高。 首先,在3個分位數下7個后驗分析指標的共42次后驗分析量化對比中,相對其余4種風險測度方法,HW方法擁有最大后驗分析p值和最優(yōu)失敗率值的次數為23次(為便于觀察,表中將該p值和失敗率值加粗顯示),BHW方法有11次,GARCH-N方法有10次,而THS方法僅有5次; 其次,我們再從每個分位數下的 5個風險測度方法中選出擁有最大后驗分析p值和最優(yōu)失敗率值(表中的粗體p值和粗體失敗率值)最多的方法,作為該分位數下精確性最高的風險測度方法,在兩個市場3個分位數水平的共6次對比中,HW方法有4次,BHW方法和GARCH-N方法各有2次。 (4)不同的歷史模擬法受樣本規(guī)模因素影響的程度也顯著不同。通過對比每種風險測度方法在兩個不同樣本規(guī)模下的后驗分析p值,我們發(fā)現,HW方法在基于250個樣本規(guī)模時所計算出的VaR值精確性更高,如在兩個市場3個分位數下6種后驗分析方法的36個后驗分析p值對比中,基于250天樣本規(guī)模的后驗分析p值有26個大于基于125天樣本規(guī)模的后驗分析p值;THS方法則在基于125個樣本規(guī)模時表現出了更高的風險測度精確性,如在36次后驗分析p值對比中,有30個大于基于250個樣本規(guī)模的后驗分析p值;而論文提出的BHW方法在兩個不同樣本規(guī)模下并沒有表現出明顯的精確性差異。 (6)總體來看,在黃金市場的風險測度研究中,論文所提出的BHW方法表現出了相對較好的風險測度精確性,尤其在樣本規(guī)模較少的情況下,BHW方法的風險測度精確性顯著的優(yōu)于現有的各歷史模擬法(THS方法,BRW方法和HW方法)和參數化的GARCH模型方法。此外,HW方法雖然在125個樣本規(guī)模下表現出的精確性較弱,但在250個樣本規(guī)模的風險測度中表現出了較高的風險測度精確性。最后,通過綜合對比不同風險測度方法在黃金市場風險測度中表現出的精確性差異,我們認為BHW方法可以作為測度黃金市場相對合理的模型選擇之一。 除了以上海黃金交易所中黃金9999和黃金9995兩個市場作為研究樣本外,論文還基于其它黃金現貨市場的交易數據,如倫敦金屬交易所(London Metal Exchange)中黃金現貨市場等,運用上述研究方法進行實證分析;另外,論文還從空頭頭寸角度展開了分析,所得結論也基本支持了上述結論,對于以上未展示的實證結果,可向作者索取。 在計算VaR的三種方法體系中,歷史模擬法原理相對簡易,操作性強,并且在實務界具有極高的使用率。論文主要圍繞著幾種歷史模擬法展開了實證分析,得出的主要結論包括:(1)綜合以上兩個不同滾動樣本規(guī)模的后驗分析結果來看,BHW方法表現出了相對較好的精確性,而在實務界廣泛使用的THS方法表現出的精確性最差;(2)從基于125天滾動樣本規(guī)模的后驗分析結果來看,BHW方法的風險測度精確性優(yōu)于其余4個風險測度方法;(3)從基于250個滾動樣本規(guī)模的后驗分析結果來看,HW方法、BHW方法和GARCH-N三種方法都表現出了較好的精確性,其中HW方法表現出的精確性略高于其余方法;(4)不同的歷史模擬法受樣本規(guī)模因素影響的程度也顯著不同。 論文的研究成果為金融機構采用歷史模擬法進行風險測度,提供了有價值的參考。另外,BHW方法在小樣本情況下具有極高的精確性,這在某些特別情況下(如新交易品種推出以及交易品種數據量較少),BHW方法無疑是一個比較合理的選擇。當然,論文的研究工作也存在一定的局限性。比如,考慮到篇幅限制,論文沒有將BHW方法和更多的參數化方法(如極值理論等)進行對比,也沒有考察其在預測其它風險指標(如ES等)中的精確性等。對于以上所述的問題,將是我們下一步的研究內容。2.2 基于GARCH模型的VaR風險測度方法
2.3 拔靴濾波歷史模擬法
3 后驗分析方法
4 實證結果
4.1 VaR估計結果
4.2 后驗分析結果
4.3 其它實證結果
5 結語