戴秀菊, 舒志彪
(福州大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院, 福建 福州 350116)
金融衍生品的隱含波動(dòng)率能夠衡量未來某一段時(shí)間內(nèi)對(duì)應(yīng)的標(biāo)的資產(chǎn)價(jià)格的變動(dòng)程度, 市場參與者可以據(jù)此作出交易決策. 期權(quán)隱含波動(dòng)率是將期權(quán)價(jià)格代入Black-Scholes期權(quán)定價(jià)公式[1], 反推得到的標(biāo)的資產(chǎn)波動(dòng)率數(shù)值. 傳統(tǒng)的Black-Scholes公式將隱含波動(dòng)率σ當(dāng)做一個(gè)恒定常數(shù). 但是, 很多實(shí)證分析表明,σ并非一個(gè)恒定的常數(shù), 而是與期權(quán)的剩余期限和執(zhí)行價(jià)格有著顯著相關(guān)性的變量[2-3]. 據(jù)此, Dumas等[4]構(gòu)建了隱含波動(dòng)率參數(shù)模型. 該模型假設(shè)隱含波動(dòng)率σ與執(zhí)行價(jià)格K和剩余期限T之間的相關(guān)性可以用如下的雙二次函數(shù)來描述:
lnσ=α0+α1K+α2K2+α3T+α4T2+α5KT+ε
(1)
這種參數(shù)模型被廣泛研究且擴(kuò)展[5-7]. 但是參數(shù)模型往往需要預(yù)先假設(shè)波動(dòng)率與執(zhí)行價(jià)格、 到期日存在某種線性或非線性關(guān)系, 這種假設(shè)可能會(huì)導(dǎo)致較大偏差. 相比之下, 非參數(shù)模型顯得更加靈活, 它不需要預(yù)判因素之間的相關(guān)關(guān)系, 而只需要做一個(gè)最優(yōu)化擬合. 例如, 毛娟等[8]考慮隱含波動(dòng)率與剩余期限、 執(zhí)行價(jià)格相關(guān)的模型, 采用非參數(shù)估計(jì)的局部多項(xiàng)式方法來擬合隱含波動(dòng)率; Borovkova等[9]使用非參數(shù)Bourke插值公式構(gòu)建隱含波動(dòng)率模型.
基于隱含波動(dòng)率與期權(quán)的剩余期限和執(zhí)行價(jià)格顯著相關(guān)的假設(shè), 考慮原有的參數(shù)模型及Bourke非參數(shù)模型的優(yōu)缺點(diǎn), 提出兩種基于非參數(shù)核回歸的隱含波動(dòng)率預(yù)測模型: 雙窗寬Nadaraya-Watson高斯核回歸模型與Parzen-窗均勻核回歸模型. 選取AAPL期權(quán)數(shù)據(jù)樣本對(duì)已有模型與新構(gòu)建的隱含波動(dòng)率模型進(jìn)行實(shí)證分析, 并進(jìn)行預(yù)測能力分析. 實(shí)驗(yàn)結(jié)果表明, 研究提出的基于非參數(shù)核回歸模型的隱含波動(dòng)率預(yù)測效果更好.
所謂回歸分析是通過建立回歸模型來研究相關(guān)變量的關(guān)系并作出相應(yīng)估計(jì)和預(yù)測的一種統(tǒng)計(jì)方法.
定義1(回歸模型[10]): 假設(shè)有兩個(gè)隨機(jī)變量X,Y, 其中X為解釋變量,Y為響應(yīng)變量, 由于變量之間的相關(guān)性, 當(dāng)給定X=x, 響應(yīng)變量Y不能唯一確定, 仍然為隨機(jī)變量. 響應(yīng)變量Y的估計(jì)或預(yù)測值通常取其條件數(shù)學(xué)期望E(Y|X=x), 它是解釋變量X的函數(shù), 稱為回歸函數(shù), 記為f(x)=E(Y|X=x), 則回歸模型一般形式為:
(2)
其中:f(·)為Y的回歸函數(shù);ε為隨機(jī)誤差, 表示除解釋變量之外的因素對(duì)響應(yīng)變量的影響.
回歸函數(shù)f(x)的估計(jì)方法一般有參數(shù)估計(jì)、 非參數(shù)估計(jì)兩種方法. 參數(shù)估計(jì)預(yù)先設(shè)置一個(gè)模型, 結(jié)果的好壞直接取決于模型的預(yù)先假設(shè). 而非參數(shù)估計(jì)不需要進(jìn)行任何預(yù)先設(shè)置, 只通過數(shù)據(jù)決定. 所以相對(duì)于參數(shù)回歸模型, 非參數(shù)回歸模型的應(yīng)用范圍更廣, 性能更穩(wěn)健.
目前利用非參數(shù)估計(jì)構(gòu)建隱含波動(dòng)率預(yù)測模型的方法有很多, 如Borovkova等[9]用非參數(shù)插值公式建立隱含波動(dòng)率模型(簡稱Bourke模型):
(3)
這個(gè)模型基于了一個(gè)重要假設(shè): 彼此間距離近的數(shù)據(jù)點(diǎn)應(yīng)該有更大的概率成為近鄰. 沿用這種思路, 研究將數(shù)據(jù)之間的相關(guān)信息和原有的Nadaraya-Watson核估計(jì)與Parzen-窗表示方法相結(jié)合, 以此構(gòu)建兩個(gè)非參數(shù)估計(jì)的隱含波動(dòng)率預(yù)測模型. 假設(shè)概率大的數(shù)據(jù)點(diǎn)可以分配到更大的權(quán)值, 即對(duì)預(yù)測樣本點(diǎn)的貢獻(xiàn)更顯著.
2.1.1 Nadaraya-Watson核估計(jì)[11-16]
定義2假設(shè)Xi∈d,i=1, …,N,d為維數(shù),yi∈,i=1, …,N, 存在映射函數(shù)f:d→, 使得f(Xi)=yi,i=1, 2, …,N. 又可積函數(shù)k(x):→+且k(x)dx=1, 對(duì)于任意參數(shù)hq>0,q=1, …,d, 有khq(x)=hq-1k(xhq-1), 對(duì)h=(h1,h2, …,hd)∈(0, ∞)d, 定義函數(shù)kh:d→,kh=kh1?kh2?…?khd, 也就是:
kh(x)≡kh(x1, …,xd)=kh1(x1)…khd(xd)
(4)
(5)
Nadaraya-Watson估計(jì)可以看作是一種簡單的加權(quán)平均, 即:
(6)
(7)
上述光滑參數(shù)hq是一個(gè)與N有關(guān)的正常數(shù), 滿足N趨于無窮時(shí),hq趨于0,k(·)為已知核函數(shù). 光滑參數(shù)hq的選取會(huì)直接影響到模型的估計(jì)精度. 光滑參數(shù)hq太小, 則有用信息和干擾信息無法分離, 擬合方差較大, 容易導(dǎo)致除樣本點(diǎn)外, 其它點(diǎn)處均為零. 反之, 光滑參數(shù)hq太大, 則會(huì)導(dǎo)致估計(jì)過度平均化, 偏差和殘差較大. 估計(jì)隱含波動(dòng)率時(shí), 一般希望有較高精度和較小的偏差, 因此光滑參數(shù)hq的選取尤為重要. 光滑參數(shù)的處理見節(jié)3.2.
2.1.2 雙窗寬Nadaraya-Watson高斯核回歸隱含波動(dòng)率預(yù)測模型
Bourke模型的權(quán)重使用的是距離的倒數(shù), 距離越近權(quán)重越大. 但是, 當(dāng)待測點(diǎn)的剩余期限和執(zhí)行價(jià)格與某一已知樣本點(diǎn)的剩余期限和執(zhí)行價(jià)格相等時(shí), 該點(diǎn)的權(quán)重為無窮. 為了避免這個(gè)問題, 研究使用非參數(shù)雙窗寬Nadaraya-Watson高斯核回歸模型. 即核函數(shù)k(·)取用高斯核函數(shù):
(8)
在隱含波動(dòng)率預(yù)測模型中, (8)式中x={K,T}. 根據(jù)定義及式(4)、 (5)和(8), 隱含波動(dòng)率估計(jì)公式為:
(9)
2.2.1 Parzen-窗估計(jì)[17-18]
(10)
其中:N為樣本個(gè)數(shù);m為落入小艙中的樣本個(gè)數(shù);V為艙體積.
假設(shè)x是d維空間中任意一點(diǎn), 每個(gè)小艙是一個(gè)超立方體, 它在每一維的棱長表示為hq,q=1, 2, …,d, 則小艙的體積是V=h1,h2, …,hd. 要計(jì)算落入以x為中心的小艙內(nèi)的樣本數(shù)目, 可以定義如下的d維核函數(shù):
(11)
因此,X落入以x為中心的超立方體內(nèi)的樣本數(shù):
(12)
2.2.2 Parzen-窗均勻核回歸隱含波動(dòng)率預(yù)測模型
雙窗寬Nadaraya-Watson高斯核回歸模型使用所有的樣本點(diǎn), 而樣本點(diǎn)對(duì)應(yīng)的隱含波動(dòng)率差異較大, 導(dǎo)致某些點(diǎn)雖然權(quán)重很小, 但是對(duì)結(jié)果貢獻(xiàn)仍然很大. Bourke模型也存在同樣問題.
針對(duì)以上問題, 研究進(jìn)一步提出使用Parzen-窗均勻核密度估計(jì)法, 公式如下:
(13)
同理, 在隱含波動(dòng)率預(yù)測模型中, (13)式中x={K,T}, 所以得到隱含波動(dòng)率估計(jì):
(14)
也就是說, 單個(gè)待測點(diǎn)不是和全部樣本點(diǎn)都有關(guān)系, 而是只跟待測點(diǎn)附近的少量樣本點(diǎn)有關(guān), 而且它們的權(quán)重是相等的.
實(shí)際生活中的數(shù)據(jù)彼此之間往往存在著或多或少的相關(guān)性. 在研究某事物時(shí), 為了能夠更全面、 準(zhǔn)確地表述它, 應(yīng)考慮更多與該事物相關(guān)的變量. 期權(quán)數(shù)據(jù)也不例外, 經(jīng)過大量實(shí)證分析, 期權(quán)隱含波動(dòng)率與執(zhí)行價(jià)格、 剩余期限有著較強(qiáng)的相關(guān)性. 根據(jù)不同執(zhí)行價(jià)格和剩余期限兩個(gè)變量彼此間各自的距離遠(yuǎn)近來表示隱含波動(dòng)率之間的相關(guān)性強(qiáng)弱, 用非參數(shù)核回歸的方法反映隱含波動(dòng)率之間的相關(guān)性. 在Bourke模型(3)與本研究提出的雙窗寬Nadaraya-Watson高斯核回歸隱含波動(dòng)率預(yù)測模型(9)、 Parzen-窗均勻核回歸隱含波動(dòng)率預(yù)測模型(14)等3個(gè)模型中, 根據(jù)K、T的距離遠(yuǎn)近, 給定不同的核密度估計(jì)表示它們的相關(guān)性, 如圖1所示. 為了更直觀明了, 這里只給出K方向的剖面, 同理,T方向樣本點(diǎn)隱含波動(dòng)率的相關(guān)性也可由相同的剖面表示.
圖1 3種模型的樣本相關(guān)性示意圖Fig.1 Sample correlation diagram of the three models
從圖1可以直觀地看出Borovkova等的Bourke模型和雙窗寬Nadaraya-Watson高斯核模型都考慮了全部的樣本點(diǎn), 導(dǎo)致某些樣本點(diǎn)雖然相關(guān)性很小, 但是由于自身取值較大, 所以對(duì)預(yù)測結(jié)果的貢獻(xiàn)仍然很大. 而且Bourke模型會(huì)出現(xiàn)奇異點(diǎn), 導(dǎo)致結(jié)果會(huì)出現(xiàn)奇異, 不如高斯核模型. 與這兩種模型相比, Parzen-窗均勻核模型只考慮局部樣本點(diǎn), 數(shù)據(jù)相關(guān)性表示更合理, 預(yù)測更準(zhǔn)確, 具體可由以下實(shí)驗(yàn)得證.
將雙窗寬Nadaraya-Watson高斯核回歸模型(9)和Parzen-窗均勻核回歸模型(14)與已有的參數(shù)模型(1)、 Bourke模型(3)進(jìn)行對(duì)比實(shí)驗(yàn). 從預(yù)測精確度的角度進(jìn)行分析, 分別給出4種模型的預(yù)測誤差.
實(shí)驗(yàn)使用從雅虎網(wǎng)站(http://finance.yahoo.com/q/op?s=AAPL+Options)下載的AAPL期權(quán)數(shù)據(jù). 實(shí)驗(yàn)分為大樣本測試和小樣本測試. 小樣本點(diǎn)集來自2015年11月25日至2015年12月09日兩周的數(shù)據(jù), 測試數(shù)據(jù)來自2015年12月14日當(dāng)天的數(shù)據(jù). 大樣本點(diǎn)集來自2015年12月26日至2016年2月29日3個(gè)月全部的數(shù)據(jù), 測試數(shù)據(jù)來自2016年3月1日和2016年3月2日兩天的數(shù)據(jù). 小樣本點(diǎn)集有3 018個(gè)數(shù)據(jù), 大樣本集有2萬個(gè)左右數(shù)據(jù). 這里只給出預(yù)測集2016年3月1日當(dāng)天的部分?jǐn)?shù)據(jù). 數(shù)據(jù)集整理如表1所示.
表1 2016年3月1日AAPL期權(quán)待測樣本數(shù)據(jù)集
窗寬hd與樣本容量大小有關(guān), 窗寬的選取直接影響到估計(jì)精度. 在實(shí)踐中, 采用Silverman[19]的經(jīng)驗(yàn)法則計(jì)算最優(yōu)窗寬, 計(jì)算公式為:
(15)
預(yù)測實(shí)驗(yàn)誤差的計(jì)算公式為:
圖2 AAPL期權(quán)隱含波動(dòng)率預(yù)測誤差分布圖(2015—12—14)Fig.2 Implied volatility prediction error distribution of AAPL options on December 14, 2015
表2的實(shí)驗(yàn)數(shù)據(jù)樣本點(diǎn)來自2015年11月26日—2015年12月9日剩余期限小于100 d的3 018個(gè)數(shù)據(jù), 測試數(shù)據(jù)來自2015年12月14日剩余期限小于100的340個(gè)數(shù)據(jù). 圖2為2015年12月14日4種模型的隱含波動(dòng)率預(yù)測誤差分布圖.
表2 4種模型預(yù)測誤差對(duì)比(2015—12—14)
表3、 4的實(shí)驗(yàn)數(shù)據(jù)樣本點(diǎn)來自2015年12月26日—2016年2月29日3個(gè)月全部的數(shù)據(jù), 測試數(shù)據(jù)分別來自2016年3月1日和2016年3月2日當(dāng)天的數(shù)據(jù). 圖3、 4分別為2016年3月1日與2016年3月2日的真實(shí)隱含波動(dòng)率與模型隱含波動(dòng)率的誤差分布圖.
表3 4種模型預(yù)測誤差對(duì)比(2016—03—01)
表4 4種模型預(yù)測誤差對(duì)比(2016—03—02)
圖3 AAPL期權(quán)隱含波動(dòng)率預(yù)測誤差分布圖(2016—03—01)Fig.3 Implied volatility prediction error distribution of AAPL options on March 01, 2016
圖4 AAPL期權(quán)隱含波動(dòng)率預(yù)測誤差分布圖(2016—03—02)Fig.4 Implied volatility prediction error distribution of AAPL options on March 02, 2016
實(shí)例研究表明, 與參數(shù)模型相比, 非參數(shù)模型不需要預(yù)先假定回歸函數(shù)形式, 對(duì)數(shù)據(jù)的分布一般不做任何要求, 所以模型精度較高, 且在大樣本的情況下效果更好. 與Dumas的參數(shù)模型、 Bourke模型、 雙窗寬Nadaraya-Watson高斯核回歸模型相比, Parzen-窗均勻核隱含波動(dòng)率模型能夠較好地篩選掉與待測點(diǎn)無關(guān)的樣本點(diǎn), 在不同的樣本容量下預(yù)測誤差較小, 整體預(yù)測效果更好.
Parzen-窗均勻核模型與雙窗寬Nadaraya-Watson高斯核回歸模型是非參數(shù)核回歸模型. 這兩個(gè)模型采用了Bourke模型權(quán)重的思想, 克服了參數(shù)模型預(yù)先假設(shè)變量間關(guān)系導(dǎo)致較大偏差的缺點(diǎn), 此外, 還克服了Bourke模型的某些點(diǎn)的權(quán)重為無窮的缺點(diǎn). 雙窗寬Nadaraya-Watson高斯核回歸模型認(rèn)為對(duì)于單個(gè)待測點(diǎn)的預(yù)測與全部的樣本點(diǎn)都有關(guān)系. 而Parzen-窗均勻核回歸模型待測點(diǎn)只與附近的樣本點(diǎn)有關(guān), 這種局部思想更符合實(shí)際且實(shí)驗(yàn)效果更好. 不過, 本研究的模型僅考慮了隱含波動(dòng)率與期權(quán)的剩余期限和執(zhí)行價(jià)格的關(guān)系, 今后的研究將進(jìn)一步考慮期權(quán)的交易頻率、 數(shù)量及標(biāo)的資產(chǎn)價(jià)格服從跳躍過程等因素對(duì)隱含波動(dòng)率的影響.
參考文獻(xiàn):
[1] BLACK F, SCHOLES M. The pricing of options and corporate liabilities[J]. Journal of Political Economy, 1973, 81(3): 637-654.
[2] NCUBE M. Modelling implied volatility with OLS and panel data models[J]. Journal of Banking & Finance, 1996, 20(1): 71-84.
[3] FENGLER M R. Option data and modeling BSM implied volatility[M]. Berlin: Springer, 2012.
[4] DUMAS B, FLEMING J, WHALEY R E. Implied volatility functions: empirical tests[J]. Journal of Finance, 1998, 53(6): 2 059-2 106.
[5] 莫旭華. 基于香港股票期權(quán)的隱含波動(dòng)率建模[D]. 廣州: 華南理工大學(xué), 2012.
[6] ZHAO B, HODGES S D. Parametric modeling of implied smile functions: a generalized SVI model[J]. Review of Derivatives Research, 2013, 16(1): 53-77.
[7] GATHERAL J, JACQUIER A. Arbitrage-free SVI volatility surfaces[J]. Quantitative Finance, 2013, 14(1): 59-71.
[8] 毛娟, 王建華. 隱含波動(dòng)率曲面的非參數(shù)擬合[J]. 武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版), 2009, 31(2): 197-199.
[9] BOROVKOVA S, PERMANA F J. Implied volatility in oil markets[J]. Computational Statistics & Data Analysis, 2009, 53(6): 2 022-2 039.
[10] JOHNSON R A, WICHERN D W. 實(shí)用多元統(tǒng)計(jì)分析[M]. 6版. 陳旋, 等譯. 北京: 清華大學(xué)出版社, 2008.
[11] NADARAYA E A. On estimating regression[J]. Theory of Probability & Its Applications, 1964, 9(1): 141-142.
[12] WATSON G S. Smooth regression analysis[J]. Sankhyā: The Indian Journal of Statistics, Series A, 1964, 26(4): 359-372.
[13] KENMOE R N, SANFELICI S. An application of nonparametric volatility estimators to option pricing[J]. Decisions in Economics and Finance, 2014, 37(2): 393-412.
[14] TSYBAKOV A B. Introduction to nonparametric estimation[M]. New York: Springer-Verlag, 2009.
[15] HOLCAPEK M, TICHY T. An application of ann-dimensional fuzzy smoothing filter in financial modeling[C]//Business Engineering and Industrial Applications Colloquium. Kuala Lumpur: IEEE, 2012: 226-231.
[16] KUNG J J. A nonparametric kernel regression approach for pricing options on stock market index[J]. Applied Economics, 2016, 48(10): 902-913.
[17] 張學(xué)工. 模式識(shí)別[M]. 3版. 北京: 清華大學(xué)出版社, 2010.
[18] MUSSA H Y, MITCHELL J B O, AFZAL A M. The Parzen window method: in terms of two vectors and one matrix[J]. Pattern Recognition Letters, 2015, 63: 30-35.
[19] SILVERMAN B W. Density estimation for statistics and data analysis[M]. London: CRC press, 1986.