孫有發(fā) ,邱梓杰 ,姚宇航 ,劉彩燕
(廣東工業(yè)大學(xué)a.經(jīng)濟(jì)與貿(mào)易學(xué)院;b.管理學(xué)院,廣州 510520)
行為資產(chǎn)定價(jià)模型(Behavioral Asset Pricing Model,BAPM)是理性交易者和有限理性交易者交互的必然產(chǎn)物,是行為金融理論的核心,近年來受到眾多學(xué)者的關(guān)注[1-3]。在BAPM 中,理性交易者遵循市場有效性假說,被預(yù)設(shè)為具有良好認(rèn)知與專業(yè)技術(shù)、均值方差偏好者;有限理性交易者則秉承行為金融學(xué)精髓,被預(yù)設(shè)為僅具有限認(rèn)知、有限控制力和有限自利[4-6]。BAPM 在解釋金融資產(chǎn)價(jià)格異象方面獲得極大成功[7]。如針對中國A 股市場經(jīng)常表現(xiàn)出“個(gè)股同漲落以及股指走勢脫離基本面實(shí)際狀況”等異象,行為金融學(xué)認(rèn)為這是因?yàn)橹袊鳤 股市場受政策因素影響極大,投資者面臨相同的政策變化,容易做出趨同性的投資行為調(diào)整,這種趨同性又在自激勵(lì)反饋?zhàn)饔孟峦鶎?dǎo)致股價(jià)暴漲暴跌[8-11]。
盡管BAPM 相關(guān)研究已經(jīng)取得豐富的成果,但是到目前為止,BAPM 下的期權(quán)定價(jià)相關(guān)研究卻不多見[13-16],遠(yuǎn)未匯成系統(tǒng)化的研究成果。從現(xiàn)有文獻(xiàn)可歸納出,當(dāng)前行為期權(quán)定價(jià)有兩個(gè)主要研究分支:其一,標(biāo)的資產(chǎn)行為價(jià)格模型下的期權(quán)定價(jià)研究,著眼于標(biāo)的風(fēng)險(xiǎn)資產(chǎn)的行為價(jià)格建模,依據(jù)期權(quán)定價(jià)理論,推導(dǎo)出相應(yīng)的期權(quán)定價(jià)公式或給出數(shù)值定價(jià)結(jié)果[11-18]。其二,基于投資者心理和行為的期權(quán)交易價(jià)格研究,假設(shè)期權(quán)市場交易者遵從行為金融學(xué)說中的有限理性、有限認(rèn)知、有限控制力以及有限自利等,依據(jù)期權(quán)市場交易機(jī)制,推理、推導(dǎo)或計(jì)算相應(yīng)的期權(quán)價(jià)格。如期權(quán)市場上的追漲殺跌現(xiàn)象,上漲時(shí)投資者追入認(rèn)購期權(quán),推高認(rèn)購期權(quán)的隱含波動率;下跌時(shí)瘋狂追入認(rèn)沽期權(quán),造成認(rèn)沽期權(quán)的隱含波動率的非理性上升[14,16,19]。也有從期權(quán)市場的流動性直接推導(dǎo)期權(quán)價(jià)格[13]等。
本文沿襲第1個(gè)研究分支,在前期已有基礎(chǔ)上,應(yīng)用深度學(xué)習(xí)算法,給出行為期權(quán)的數(shù)值定價(jià)。考慮到投資者的有限理性預(yù)期、羊群效應(yīng)以及投資者類型自適應(yīng)遷移等因素,孫有發(fā)[11]構(gòu)建了一類行為資產(chǎn)定價(jià)模型,推導(dǎo)出該模型下的歐式期權(quán)定價(jià)偏微分方程。遺憾的是,限于技術(shù)手段,文獻(xiàn)[11]中暫未得到期權(quán)價(jià)格的解析表達(dá)式。
針對文獻(xiàn)[11]中推導(dǎo)出的期權(quán)定價(jià)偏微分方程,盡管傳統(tǒng)數(shù)值方法,如有限差分法、有限元法等,都可得到期權(quán)的數(shù)值定價(jià)結(jié)果;但對于高維資產(chǎn)情形的期權(quán)定價(jià),偏微分方程的計(jì)算時(shí)間和記憶容量隨著資產(chǎn)數(shù)量的增加呈指數(shù)級增長,使得這些數(shù)值方法并未表現(xiàn)出特別的優(yōu)勢。應(yīng)用蒙特卡羅方法對高維資產(chǎn)情形下的期權(quán)進(jìn)行定價(jià)是一個(gè)活躍且不斷發(fā)展的研究領(lǐng)域。Gestel等[20]提出了基于迭代的共軛梯度(CG)法來解決維數(shù)大規(guī)模問題。盡管蒙特卡羅方法能夠最終有效地逼近理論值,然而,隨著資產(chǎn)數(shù)量的增加,其所需時(shí)間也急劇增加,這也限制了它在高維情景中的應(yīng)用。
近年來,機(jī)器學(xué)習(xí)方法在金融領(lǐng)域得到了廣泛應(yīng)用。由此建立了一種算法模型,可通過輸入經(jīng)濟(jì)變量后預(yù)測期權(quán)價(jià)格,輸入和輸出之間的復(fù)雜關(guān)系由算法本身對大量數(shù)據(jù)的學(xué)習(xí)得到。在這類模型的運(yùn)用方面,Yang 等[21]通過對基礎(chǔ)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的不斷改進(jìn),最終提出了一種含門控單元的神經(jīng)網(wǎng)絡(luò)方法對歐式看漲期權(quán)進(jìn)行定價(jià),使模型對期權(quán)價(jià)格的預(yù)測更加精確、穩(wěn)健。在行為期權(quán)價(jià)格預(yù)測方面,林焰等[22]提出了一種考慮投資者情緒的基于改進(jìn)粒子群算法優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò),結(jié)合GARCH 模型用于預(yù)測歐式期權(quán)價(jià)格,并將其作為改進(jìn)神經(jīng)網(wǎng)絡(luò)模型的輸入變量之一,模型最終輸出期權(quán)價(jià)格的估計(jì)值。普通的機(jī)器學(xué)習(xí)算法在高維期權(quán)定價(jià)方面的運(yùn)用相對較少,對現(xiàn)實(shí)市場中存在高維資產(chǎn)的情況,如場外期權(quán),這些方法很難得到運(yùn)用。
作為機(jī)器學(xué)習(xí)的重要組成部分,深度學(xué)習(xí)方法比傳統(tǒng)機(jī)器學(xué)習(xí)方法更加適應(yīng)高維、非線性的復(fù)雜數(shù)據(jù)。由于深度學(xué)習(xí)近幾年才興起且算法本身極為復(fù)雜,從已有文獻(xiàn)來看,深度學(xué)習(xí)在金融領(lǐng)域的應(yīng)用研究文獻(xiàn)還很少,尤其是高維行為資產(chǎn)定價(jià)方面,更多是運(yùn)用在對指數(shù)、期貨價(jià)格的預(yù)測。關(guān)于期權(quán)定價(jià)方面,Culkin等[23]訓(xùn)練了一個(gè)全連接的前饋深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),準(zhǔn)確地重現(xiàn)了Black-Scholes期權(quán)定價(jià)公式的結(jié)果,并分析了在期權(quán)定價(jià)模型上運(yùn)用深度學(xué)習(xí)方法的可行性,提出了可利用深度學(xué)習(xí)方法來學(xué)習(xí)真實(shí)市場期權(quán)定價(jià)模型的建議,但其并未將深度學(xué)習(xí)運(yùn)用到具體的期權(quán)定價(jià)中。Weinan等[24]提出了一種求解拋物型偏微分方程和后向高維隨機(jī)微分方程的算法,通過深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)逼近策略函數(shù),構(gòu)建網(wǎng)絡(luò)并求解Allen-Cahn 方程等問題。其雖然沒有對期權(quán)定價(jià)方面進(jìn)行深入研究,但提出的方法證明了深度學(xué)習(xí)求解高維偏微分方程的有效性?;谏鲜鑫墨I(xiàn)成果,本文將深度學(xué)習(xí)方法運(yùn)用在行為資產(chǎn)模型期權(quán)定價(jià),解決行為資產(chǎn)模型高維復(fù)雜偏微分方程“無法求解解析式”的難題。
為了解決高維復(fù)雜BAPM 期權(quán)定價(jià)方面的難題,首先基于費(fèi)曼卡茲公式推導(dǎo)出行為期權(quán)價(jià)格的迭代方程,然后用神經(jīng)網(wǎng)絡(luò)來逼近迭代方程中的期權(quán)價(jià)格關(guān)于標(biāo)的模型空間變量的梯度,最后通過深度神經(jīng)網(wǎng)絡(luò)參數(shù)尋優(yōu)得到期權(quán)價(jià)格。數(shù)值實(shí)驗(yàn)可用于測試該深度學(xué)習(xí)方法在BAPM 期權(quán)定價(jià)的精度和性能,與傳統(tǒng)的蒙特卡洛方法進(jìn)行比較,證明了該方法的有效性及其運(yùn)用價(jià)值。本研究可望為現(xiàn)實(shí)金融市場上高維標(biāo)的資產(chǎn)的期權(quán)定價(jià)提供模型和方法層面上的參考。
為使本文內(nèi)容自洽、便于理解,本節(jié)對文獻(xiàn)[11]中有關(guān)行為資產(chǎn)定價(jià)模型構(gòu)建的過程進(jìn)行概述。
1.1.1 市場微觀結(jié)構(gòu) 假設(shè)市場上投資者數(shù)量N(N∈Z+)在考察期內(nèi)基本保持不變,且在tk(k=1,2,…)時(shí)刻的理性投資者數(shù)量為,有限理性和非理性投資者數(shù)量合計(jì)為,進(jìn)而假設(shè)有限理性和非理性投資者合計(jì)占比為χk,即χk=
假設(shè)在tk+1時(shí)刻,χk+1僅有3種取值狀態(tài),分別對應(yīng)3 種情形:①一個(gè)理性投資者轉(zhuǎn)變?yōu)橛邢蘩硇?或非理性)投資者;②投資者類型不發(fā)生任何變化;③一個(gè)有限理性(或非理性)投資者轉(zhuǎn)變?yōu)槔硇酝顿Y者。情形①、③分別假設(shè)轉(zhuǎn)變概率為:
式中:a為投資者結(jié)構(gòu)趨于穩(wěn)定時(shí)有限理性(和非理性)投資者占比;b為投資者結(jié)構(gòu)趨于穩(wěn)定的速度;c為羊群效應(yīng)程度;N(1-χ)和Nχ分別表示理性投資者和非理性投資者在獨(dú)立決策后的成效;和b(1-a)分別為在時(shí)間段內(nèi)相應(yīng)的轉(zhuǎn)變概率和分別為有限理性(及非理性)和理性投資者釋放的羊群效應(yīng)。為使概率空間完備,情形②將ρ(χk+1=概率假設(shè)為適當(dāng)值。
1.1.2 投資者需求 假設(shè)所有投資者在tk+1時(shí)刻的超額需求函數(shù)在形式上統(tǒng)一表達(dá)為
1.1.3 投資者預(yù)期收益 進(jìn)一步,假設(shè)理性投資者與有限理性(及非理性)投資者對tk+1時(shí)刻的資產(chǎn)未來收益有如下預(yù)期形式:
式中:γ為非理性(情緒)程度,γ∈[0,1];μk表示投資者的理性預(yù)期部分。
文獻(xiàn)[11]中依據(jù)市場出清條件以及極限定理,在前面假設(shè)基礎(chǔ)上,推導(dǎo)出行為資產(chǎn)價(jià)格模型,即
式中:χt為有限理性和非理性投資者合計(jì)占總投資者的比例;a為投資者結(jié)構(gòu)趨于穩(wěn)定時(shí)有限理性(和非理性)投資者占比;b為投資者結(jié)構(gòu)趨于穩(wěn)定的速度;c為羊群效應(yīng)程度;γ為非理性(情緒)程度,γ∈[0,1]與為獨(dú)立的布朗運(yùn)動,且相關(guān)系數(shù)為ρ。
行為資產(chǎn)價(jià)格模型式(5)雖不同于一般Heston類模型,但卻具有Heston類模型的核心優(yōu)點(diǎn)——能夠較好地捕獲真實(shí)金融市場中資產(chǎn)對數(shù)收益率分布具有的某些重要統(tǒng)計(jì)特征。圖1 所示為行為資產(chǎn)價(jià)格模型式(5)隨機(jī)輸出的一個(gè)對數(shù)收益率時(shí)間序列,表現(xiàn)出了收益率的“波動聚集性”。圖2 中的統(tǒng)計(jì)量表明,該對數(shù)收益率的統(tǒng)計(jì)分布呈現(xiàn)出顯著的“尖峰”“厚尾”“有偏”等特征。
圖1 模型輸出的對數(shù)收益序列
圖2 對數(shù)收益率分布的統(tǒng)計(jì)特性
此外,模型式(5)表明,資產(chǎn)價(jià)格隨機(jī)過程受制于另一隨機(jī)過程,即有限理性和非理性投資者在投資者總體中的比例為。即式(5)中的資產(chǎn)價(jià)格波動項(xiàng)被隨機(jī)放大了倍。這意味著市場中有限理性和非理性投資者比例無須大范圍變化,就可驅(qū)動資產(chǎn)價(jià)格大幅度波動,因此,式(5)較好地刻畫了“真實(shí)市場上的投資者類型在短期內(nèi)具有相對剛性,但資產(chǎn)價(jià)格可以變化很大”的事實(shí)。由于模型的這一特點(diǎn),使其能反映真實(shí)市場的情況,故研究此模型具有現(xiàn)實(shí)意義。
令xt=lnSt,風(fēng)險(xiǎn)中性測度下的行為資產(chǎn)價(jià)格模型式(5)轉(zhuǎn)變?yōu)?
式中:r為無風(fēng)險(xiǎn)利率與為獨(dú)立的布朗運(yùn)動,且相關(guān)系數(shù)為ρ。應(yīng)用Feynman-Kac定理到隨機(jī)波動方程式(6),可知特征函數(shù)?X(ω,T;t0,x0,χ0)是如下偏微分方程的解:
其帶初值條件:G(0,x,χ;ω)=1。
注意到,方程式(7)是一個(gè)(狀態(tài)依賴的)時(shí)變系數(shù)偏微分方程。到目前為止,從現(xiàn)有的偏微分方程解析方法工具書中還沒有找到有效的解決辦法,因此也就得不到標(biāo)的資產(chǎn)到期收益率的密度函數(shù)。這意味著,對于一個(gè)執(zhí)行價(jià)為K、到期日為T的歐式看漲期權(quán),直接由期權(quán)價(jià)格定義
是無法計(jì)算得到期權(quán)價(jià)格的。而根據(jù)經(jīng)典的蒙特卡羅定價(jià)表達(dá)式
可以得到期權(quán)的估計(jì)值。其中,N為總模擬次數(shù),為第i次模擬期末時(shí)刻的資產(chǎn)價(jià)格對數(shù)。雖然該方法可能有效,但是由于蒙特卡羅方法本質(zhì)上屬于數(shù)值解方法,當(dāng)模擬次數(shù)N較小時(shí),得到的定價(jià)結(jié)果方差較大,故通常需要模擬次數(shù)N足夠大才能使得接近理論值。然而,對于一個(gè)高維標(biāo)的資產(chǎn)的期權(quán),需要模擬資產(chǎn)的大量路徑,導(dǎo)致運(yùn)行時(shí)間、內(nèi)存消耗急劇增加。
鑒于蒙特卡羅方法的缺陷,本文在Weinan等[24]的基礎(chǔ)上,提出一種基于深度學(xué)習(xí)數(shù)值解的期權(quán)定價(jià)方法。該方法的核心思路是以期權(quán)的期末支付價(jià)格為最終網(wǎng)絡(luò)輸出,通過深度學(xué)習(xí)進(jìn)行參數(shù)尋優(yōu),進(jìn)而得到初始時(shí)刻的期權(quán)價(jià)格。
為搭建深度神經(jīng)網(wǎng)絡(luò)總體構(gòu)架,下文分別針對單個(gè)行為資產(chǎn)模型和多個(gè)行為資產(chǎn)模型,推導(dǎo)其基于深度神經(jīng)網(wǎng)絡(luò)算法的期權(quán)價(jià)格遞推形式。
2.1.1 單資產(chǎn)期權(quán)價(jià)格的深度學(xué)習(xí)迭代方程 應(yīng)用伊藤引理,推導(dǎo)出期權(quán)價(jià)格的隨機(jī)微分方程(SDE)形式:
根據(jù)費(fèi)曼卡茲公式,可得期權(quán)價(jià)格滿足的偏微分方程(PDE)形式:
分別對式(10)、(11)求時(shí)間上的積分,再經(jīng)過簡單運(yùn)算,可得
最后,通過離散化和化簡可得期權(quán)價(jià)格的迭代方程:
由于xt和χt的梯度項(xiàng)和無法得出精確的表達(dá)式,故采用神經(jīng)網(wǎng)絡(luò)的方法逼近梯度值,在此基礎(chǔ)上構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò)框架,優(yōu)化網(wǎng)絡(luò)以獲得期權(quán)價(jià)格估計(jì)值。
2.1.2 高維資產(chǎn)期權(quán)價(jià)格的深度學(xué)習(xí)迭代方程 現(xiàn)實(shí)市場中同樣存在多個(gè)資產(chǎn)的情形,本文將從低維資產(chǎn)拓展到高維資產(chǎn)。同樣對高維資產(chǎn)情形下行為資產(chǎn)價(jià)格模型的期權(quán)定價(jià)進(jìn)行探討??紤]一個(gè)標(biāo)的為多資產(chǎn)的期權(quán),不同資產(chǎn)的價(jià)格過程均滿足隨機(jī)波動率形式。假設(shè)在風(fēng)險(xiǎn)中性測度下,多資產(chǎn)價(jià)格模型為:
式中:r為無風(fēng)險(xiǎn)利率;j=1,2,…,M,M為資產(chǎn)數(shù)量,同個(gè)資產(chǎn)間相關(guān)性,不同資產(chǎn)間。參考單資產(chǎn)標(biāo)的期權(quán)推導(dǎo)式(10)~(13),可以得到多資產(chǎn)標(biāo)的期權(quán)價(jià)格的迭代方程:
式中,dW x、dWχ、x、χ、和為M維列向量,分別為:
w=[w1,w2,…,wM]T為不同資產(chǎn)的權(quán)重。
同理,采用神經(jīng)網(wǎng)絡(luò)的方法,每個(gè)神經(jīng)網(wǎng)絡(luò)單元以不同對數(shù)資產(chǎn)的價(jià)格和有限理性者占總體投資者的占比作為輸入,輸出對數(shù)資產(chǎn)價(jià)格和有限理性者占總體投資者的占比的梯度項(xiàng)。
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 一個(gè)簡單的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
這是一個(gè)簡單的4層網(wǎng)絡(luò)結(jié)構(gòu)圖,包含輸入層(input layer)、中間隱藏層(hidden layer)和輸出層(output layer),通過神經(jīng)元全連接的方式構(gòu)建起網(wǎng)絡(luò)框架,其中隱藏層和輸出層含有激活函數(shù)(本文運(yùn)用relu函數(shù))。神經(jīng)網(wǎng)絡(luò)通過非線性的方式連接各個(gè)結(jié)構(gòu)單元,運(yùn)用反向傳播和梯度下降的方法自動調(diào)整參數(shù)值以優(yōu)化目標(biāo)函數(shù),目前已在各個(gè)領(lǐng)域得到了廣泛運(yùn)用。本文將基于該網(wǎng)絡(luò)單元構(gòu)建深度神經(jīng)網(wǎng)絡(luò)框架,實(shí)現(xiàn)期權(quán)價(jià)格估計(jì)的功能。
本文以t時(shí)刻的對數(shù)資產(chǎn)價(jià)格和有限理性者占總體投資者的占比作為網(wǎng)絡(luò)單元的輸入項(xiàng),以t時(shí)刻對數(shù)資產(chǎn)價(jià)格和有限理性者占總體投資者的占比的梯度項(xiàng)作為網(wǎng)絡(luò)的輸出項(xiàng)。如本文實(shí)驗(yàn)部分,在單一資產(chǎn)情形下,輸入層神經(jīng)元個(gè)數(shù)為2,隱藏層神經(jīng)元個(gè)數(shù)為12,輸出層相應(yīng)的神經(jīng)元個(gè)數(shù)為2。相對于單資產(chǎn)的情況,高維資產(chǎn)情形下深度神經(jīng)網(wǎng)絡(luò)的框架沒有發(fā)生較大變化。在t時(shí)刻網(wǎng)絡(luò)輸入的數(shù)據(jù)為M個(gè)資產(chǎn)對應(yīng)的xt和χt,輸入層的神經(jīng)元個(gè)數(shù)為2M。在50個(gè)資產(chǎn)的情形下,設(shè)置隱藏層神經(jīng)元個(gè)數(shù)為110,相應(yīng)的t時(shí)刻網(wǎng)絡(luò)單元的輸出是xt和χt的梯度項(xiàng)和,輸出層的神經(jīng)元個(gè)數(shù)也是100。
假設(shè)在初始時(shí)刻x0、χ0,通過式(6)或式(14)可仿真生成(單資產(chǎn)或多資產(chǎn))每一時(shí)刻的對數(shù)資產(chǎn)價(jià)格xt和有限理性者占總體投資者的占比χt,通過神經(jīng)網(wǎng)絡(luò)單元去逼近每一個(gè)時(shí)刻xt和χt的梯度項(xiàng)。通過上述說明,在每一時(shí)刻均有一個(gè)對應(yīng)的相同結(jié)構(gòu)的網(wǎng)絡(luò)單元來逼近梯度項(xiàng),并以此作為深度網(wǎng)絡(luò)框架的基本單元。進(jìn)而,神經(jīng)網(wǎng)絡(luò)單元通過式(13)或式(15)(單資產(chǎn)或多資產(chǎn))將每一時(shí)刻的網(wǎng)絡(luò)單元連接起來,構(gòu)成深度神經(jīng)網(wǎng)絡(luò)的最終框架,使得網(wǎng)絡(luò)的最終輸出為T時(shí)刻的期權(quán)價(jià)格。最后,通過輸出的期權(quán)價(jià)格和支付價(jià)格進(jìn)行對比和梯度反向傳播,優(yōu)化網(wǎng)絡(luò)。整體的深度神經(jīng)網(wǎng)絡(luò)框架如圖4所示。
圖4 深度神經(jīng)網(wǎng)絡(luò)整體結(jié)構(gòu)
在T和dt確定的情況下,本文整體網(wǎng)絡(luò)由T-1個(gè)結(jié)構(gòu)相同的神經(jīng)網(wǎng)絡(luò)單元構(gòu)建(t=0,t=T時(shí)刻的f(tT)不需要訓(xùn)練和。在理論上,期末時(shí)刻的期末價(jià)格應(yīng)該等于支付價(jià)格。據(jù)此,可構(gòu)建單個(gè)資產(chǎn)模型及多資產(chǎn)情形下神經(jīng)網(wǎng)絡(luò)的損失函數(shù)分別為:
式中,wj為第j個(gè)資產(chǎn)對應(yīng)的權(quán)重。在實(shí)驗(yàn)中,為簡便起見,參考亞式期權(quán)定義,采取等權(quán)重處理。
大體網(wǎng)絡(luò)框架構(gòu)建完成后,令初始時(shí)刻的期權(quán)價(jià)格為神經(jīng)網(wǎng)絡(luò)的一個(gè)參數(shù)(隨機(jī)初始化),通過反向傳播對神經(jīng)網(wǎng)絡(luò)整體權(quán)重進(jìn)行優(yōu)化,在最小化損失函數(shù)的同時(shí),可得初始時(shí)刻的期權(quán)價(jià)格理論估計(jì)值。
在參數(shù)優(yōu)化過程中,采用Adam 梯度優(yōu)化算法,該算法不僅具有自適應(yīng)學(xué)習(xí)率的特點(diǎn),同時(shí)能夠使迭代過程更具有動量特點(diǎn),可以跳出局部最優(yōu)點(diǎn),因而在參數(shù)尋優(yōu)過程中得到廣泛運(yùn)用。為了對輸入數(shù)據(jù)進(jìn)行無量綱化、避免反向傳播時(shí)神經(jīng)網(wǎng)絡(luò)出現(xiàn)梯度消失,在輸入層及每一層數(shù)據(jù)輸入激活函數(shù)之前,需對數(shù)據(jù)進(jìn)行批標(biāo)準(zhǔn)化處理,該方法已經(jīng)被證明其有效性和重要性[25]。
(1)考察深度神經(jīng)網(wǎng)絡(luò)方法在高維資產(chǎn)期權(quán)定價(jià)上的性能。當(dāng)仿真路徑數(shù)趨于無窮大時(shí),蒙特卡洛的估計(jì)值趨于理論值,故選取500 000條仿真路徑數(shù)下的蒙特卡羅估計(jì)值作為基準(zhǔn)。為了檢驗(yàn)深度學(xué)習(xí)方法能否在精度和效率上優(yōu)于蒙特卡羅方法,本文保持不同方法采用相同的模型參數(shù),設(shè)計(jì)如下實(shí)驗(yàn):
①在單資產(chǎn)情形下,選取一個(gè)資產(chǎn)作為標(biāo)的,基于相同的10 000條仿真路徑數(shù),分別采用蒙特卡洛方法和深度網(wǎng)絡(luò)估計(jì)期權(quán)價(jià)格。重復(fù)實(shí)驗(yàn)10次,記錄兩種方法每次的估計(jì)值。
②在多個(gè)資產(chǎn)情形下,選取50個(gè)資產(chǎn)作為標(biāo)的,為了簡化計(jì)算,設(shè)定每個(gè)資產(chǎn)在組合中的權(quán)重相同,對每個(gè)資產(chǎn)的路徑分別模擬10 000次;再分別采用蒙特卡洛方法和深度網(wǎng)絡(luò)估計(jì)期權(quán)價(jià)格。重復(fù)實(shí)驗(yàn)10次,記錄兩種方法每次的估計(jì)值。
③為了考察深度神經(jīng)網(wǎng)絡(luò)在不同資產(chǎn)維度上的表現(xiàn),實(shí)驗(yàn)從單資產(chǎn)情形過渡到多個(gè)資產(chǎn)情形,分別選取5個(gè)、10個(gè)直至50個(gè)資產(chǎn),分別記錄蒙特卡洛方法(500 000 條路徑)與深度神經(jīng)網(wǎng)絡(luò)(10 000條路徑)下每次的估計(jì)值和運(yùn)行時(shí)間。
(2)考察行為因子(投資者微觀結(jié)構(gòu)趨于穩(wěn)定速度、羊群效應(yīng)和投資者非理性程度)對不同成熟度市場上的期權(quán)價(jià)格的影響?;诒?中的參數(shù)集1、2(參數(shù)集1、2分別反映的是有限理性和非理性投資者在總體投資者中占絕對優(yōu)勢比例的市場(如中國股票市場)和相對較為成熟的股票市場),考察模型式(5)中相關(guān)變量或參數(shù)對期權(quán)價(jià)格的影響。
表1 參數(shù)表
本文所有數(shù)值實(shí)驗(yàn),均在google colab提供的內(nèi)存25.51 GB(RAM)、Tensorflow 2.3.0、python 3.6環(huán)境下運(yùn)行。
3.2.1 單資產(chǎn)情形 設(shè)置深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率為3×10-4,批量數(shù)據(jù)(batch)大小為128,驗(yàn)證集大小為256,仿真10 000條路徑?;诒?(a)中關(guān)于深度神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)據(jù),在單資產(chǎn)情形下,利用式(13)構(gòu)建如圖4所示的神經(jīng)網(wǎng)絡(luò)框架,最小化損失函數(shù)式(16),最終得到期權(quán)價(jià)格。
為了直觀地展示深度學(xué)習(xí)的收斂過程,繪制其中一次運(yùn)行結(jié)果,如圖5所示。通過500 000條路徑進(jìn)行蒙特卡洛求解期權(quán)的近似理論價(jià)格為3.271 9,深度網(wǎng)絡(luò)進(jìn)行3 000 次迭代后,期權(quán)價(jià)格收斂于3.288 0,損失函數(shù)值也收斂,而相同路徑下蒙特卡洛估計(jì)值為3.181 1。
圖5 單資產(chǎn)深度神經(jīng)網(wǎng)絡(luò)優(yōu)化結(jié)果
為了比較蒙特卡洛方法和深度神經(jīng)網(wǎng)絡(luò)在定價(jià)方面的表現(xiàn),本文另外做了10次不同路徑(10 000條)的獨(dú)立實(shí)驗(yàn),記錄蒙特卡洛方法和深度神經(jīng)網(wǎng)絡(luò)在相同路徑下的估計(jì)值,實(shí)驗(yàn)結(jié)果如表2所示。
表2 單資產(chǎn)不同路徑實(shí)驗(yàn)結(jié)果(Benchmark=3.271 9)
數(shù)據(jù)進(jìn)行可視化如圖6 所示。在低維(單資產(chǎn))情形下,深度學(xué)習(xí)的計(jì)算效率低于蒙特卡羅方法,但深度網(wǎng)絡(luò)的估計(jì)值相對于蒙特卡洛更接近于期權(quán)價(jià)格的理論值,而且估計(jì)方差低于蒙特卡洛方法。分析可知,當(dāng)仿真次數(shù)較少時(shí),資產(chǎn)價(jià)格路徑的隨機(jī)性較強(qiáng),蒙特卡羅方法受到的影響較大。深度神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)采用相同的路徑,因此也在一定程度上受到同方向的影響(即深度網(wǎng)絡(luò)的估計(jì)值和蒙特卡洛有類似偏向)。
圖6 單資產(chǎn)不同路徑下蒙特卡洛期權(quán)價(jià)格估計(jì)與深度神經(jīng)網(wǎng)絡(luò)期權(quán)價(jià)格估計(jì)
3.2.2 多資產(chǎn)情形 考察50個(gè)標(biāo)的資產(chǎn)。通過隨機(jī)生成S0和χ0取值范圍內(nèi)均勻分布數(shù),獲得初始x0和χ0的值(見表3),選取表1(b)中一組模型參數(shù)進(jìn)行仿真。對于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)置,批量數(shù)據(jù)(batch)大小為128,驗(yàn)證大小為256,學(xué)習(xí)率為3×10-4,在10 000條仿真路徑的情況下進(jìn)行試驗(yàn)。
表3 50個(gè)資產(chǎn)的初始數(shù)據(jù)
為了展示深度神經(jīng)網(wǎng)絡(luò)的優(yōu)化效果,同樣繪制一次運(yùn)行結(jié)果如圖7 所示。期權(quán)的理論價(jià)格為0.396 9,由于初始化參數(shù)的隨機(jī)性,深度神經(jīng)網(wǎng)絡(luò)進(jìn)行600次迭代(不同初始值迭代次數(shù)不同)后,期權(quán)的估計(jì)價(jià)格收斂于0.396 6,損失函數(shù)值也收斂,而蒙特卡洛估計(jì)值為0.401 1。
圖7 多資產(chǎn)深度神經(jīng)網(wǎng)絡(luò)優(yōu)化結(jié)果
獨(dú)立運(yùn)行實(shí)驗(yàn)10次,記錄蒙特卡洛方法和深度神經(jīng)網(wǎng)絡(luò)在相同路徑下的估計(jì)值,實(shí)驗(yàn)結(jié)果如表4所示。
表4 50個(gè)資產(chǎn)不同路徑實(shí)驗(yàn)結(jié)果(Benchmark=0.396 9)
在50個(gè)資產(chǎn)情形下,深度學(xué)習(xí)的計(jì)算效率和精度,高于相同路徑下的蒙特卡羅方法,估計(jì)方差低于蒙特卡羅方法。分析可知,在仿真次數(shù)較少的情況下,每個(gè)資產(chǎn)價(jià)格路徑的隨機(jī)性疊加,對蒙特卡羅方法的影響進(jìn)一步加大。為了降低估計(jì)方差和逼近理論價(jià)格,需要進(jìn)行大量的蒙特卡洛模擬,隨之帶來的問題是時(shí)間的消耗和內(nèi)存的占用。本文的實(shí)驗(yàn)均在google colab提供的環(huán)境下進(jìn)行,分配的運(yùn)行內(nèi)存為25.51 GB。在分別模擬50個(gè)資產(chǎn)的500 000條路徑時(shí),RAM 占用最高達(dá)到了9.51 GB(其中0.93 GB為其他占用),時(shí)間達(dá)到154.141 s。在更高的維度、更長的到期時(shí)間時(shí),若為了追求精度,需要更大的成本,這是普通個(gè)人電腦所不支持的。而運(yùn)行10 000條路徑的深度神經(jīng)網(wǎng)絡(luò)時(shí)的運(yùn)行內(nèi)存只有1.68 GB,且運(yùn)行時(shí)長為71.384 s,其估計(jì)精度也較高。為了得到較為接近參考值的期權(quán)價(jià)格估計(jì)值,可以通過少量路徑在深度神經(jīng)網(wǎng)絡(luò)上估計(jì)的方式,避免使用大量路徑帶來的時(shí)間和內(nèi)存上的消耗。
通過對表4數(shù)據(jù)的可視化(見圖8),可以清晰地觀察到相同路徑下蒙特卡洛方法和深度神經(jīng)網(wǎng)絡(luò)在期權(quán)價(jià)格估價(jià)方面的表現(xiàn)。
圖8 50個(gè)資產(chǎn)不同路徑下蒙特卡洛期權(quán)價(jià)格估計(jì)與深度神經(jīng)網(wǎng)絡(luò)期權(quán)價(jià)格估計(jì)
3.2.3 從單資產(chǎn)到多資產(chǎn)的情形 利用表3中的初始化數(shù)據(jù),分別選取前5,10,…,50個(gè)資產(chǎn)進(jìn)行分析,記錄神經(jīng)網(wǎng)絡(luò)損失函數(shù)收斂時(shí)期權(quán)價(jià)格估計(jì)值以及運(yùn)行時(shí)間,如表5所示。
表5 不同資產(chǎn)數(shù)量下蒙特卡洛與深度神經(jīng)網(wǎng)絡(luò)期權(quán)價(jià)估計(jì)效果
隨著資產(chǎn)數(shù)量的增加,蒙特卡羅的運(yùn)行時(shí)間呈線性增長,深度學(xué)習(xí)的運(yùn)行時(shí)間變化不大,且估計(jì)值和500 000條仿真數(shù)據(jù)估計(jì)值相近,進(jìn)一步論證了少量數(shù)據(jù)在深度神經(jīng)網(wǎng)絡(luò)上進(jìn)行期權(quán)價(jià)格估價(jià)的有效性和穩(wěn)定性。
綜上實(shí)驗(yàn)結(jié)果表明,在單資產(chǎn)情形下,10 000條仿真路徑時(shí)蒙特卡洛估計(jì)方法的隨機(jī)性較大,深度神經(jīng)網(wǎng)絡(luò)估計(jì)方法的隨機(jī)性相對較小,然而,深度神經(jīng)網(wǎng)絡(luò)由于網(wǎng)絡(luò)框架的構(gòu)建導(dǎo)致其運(yùn)行時(shí)間相對較長。在高維度情形下,為了獲得更準(zhǔn)確的估計(jì)結(jié)果,蒙特卡洛估計(jì)方法需要的路徑數(shù)較多,其占用內(nèi)存、運(yùn)行的時(shí)間(見圖9)也隨之發(fā)生了很大變化。此時(shí),在保證估計(jì)精度的條件下,少量路徑在深度學(xué)習(xí)框架上運(yùn)行,其估計(jì)值接近500 000條仿真路徑的蒙特卡洛估計(jì)方法,而運(yùn)行時(shí)間沒有發(fā)生較大變化,這體現(xiàn)了深度神經(jīng)網(wǎng)絡(luò)在高維期權(quán)定價(jià)方面的優(yōu)勢。
圖9 不同資產(chǎn)數(shù)量下蒙特卡洛與深度神經(jīng)網(wǎng)絡(luò)期權(quán)價(jià)估計(jì)時(shí)的運(yùn)行時(shí)間
為考察行為資產(chǎn)價(jià)格模型式(5)中“具有現(xiàn)實(shí)意義的參數(shù)”的動態(tài)變化對期權(quán)價(jià)格的影響,設(shè)計(jì)如下實(shí)驗(yàn)方案:分別以參數(shù)集為基準(zhǔn),每次實(shí)驗(yàn)只改變感興趣的某個(gè)參數(shù)、而保持剩余參數(shù)值不變,考察模型特征參數(shù)如何影響期權(quán)價(jià)格變化。利用參數(shù)集1和參數(shù)集2,在控制變量的條件下,進(jìn)行10 000條仿真路徑的深度學(xué)習(xí)期權(quán)定價(jià)。其中,γ的變動范圍為[0.1,0.9],a為[0.1,1.0],b為[0.1,4.0],c為[0.1,2.0]。參數(shù)集1和參數(shù)集2的情形分別如圖10、11所示。
通過對比圖10、11,可以清晰地看到,行為資產(chǎn)價(jià)格模型式(5)中行為因子是如何影響期權(quán)價(jià)格的。
概括地說,市場中理性投資者長期穩(wěn)定占比(1-a)越高,期權(quán)價(jià)格越低(見圖10(a)和圖11(a));而市場中有限理性和非理性投資者的情緒程度越嚴(yán)重,期權(quán)價(jià)格越高(見圖10(d)和圖11(d)),且這種相關(guān)關(guān)系不受市場成熟度的影響。
然而,股市微觀結(jié)構(gòu)調(diào)整速度和羊群效應(yīng)對期權(quán)價(jià)格的影響,因市場成熟度的不同而不同。在不成熟市場上(對應(yīng)的是參數(shù)集1),投資者結(jié)構(gòu)回復(fù)長期均衡速度越快(見圖10(b)),投資者的羊群效應(yīng)越嚴(yán)重(見圖10(c)),期權(quán)價(jià)格越高;而對于成熟市場(對應(yīng)的是參數(shù)集2),投資者結(jié)構(gòu)回復(fù)長期均衡速度(見圖11(b))以及投資者的羊群效應(yīng)(見圖11(c)),均起到穩(wěn)定期權(quán)價(jià)格的作用。不同市場、相同因素作用效果存在差異的原因在于:在不成熟市場,非理性是吸引子,股市投資者均衡結(jié)構(gòu)調(diào)整和羊群效應(yīng)都朝向了非理性這一面;而在成熟市場,理性是吸引子,因而股市微觀結(jié)構(gòu)調(diào)整順暢和羊群效應(yīng)加速了市場回歸理性。這一點(diǎn)又可直接從數(shù)學(xué)角度分析模型式(5)得出。
圖10 行為資產(chǎn)價(jià)格模型中特征參數(shù)對期權(quán)價(jià)格的影響:配置參數(shù)1
圖11 行為資產(chǎn)價(jià)格模型中特征參數(shù)對期權(quán)價(jià)格的影響:配置參數(shù)2
本文針對一類考慮了投資者微觀結(jié)構(gòu)隨機(jī)變遷、投資者行為存在羊群效應(yīng)以及非理性情緒的高維行為資產(chǎn)價(jià)格模型,構(gòu)建了基于深度學(xué)習(xí)算法的行為期權(quán)定價(jià)方法。用神經(jīng)網(wǎng)絡(luò)逼近迭代方程中的期權(quán)價(jià)格關(guān)于標(biāo)的模型空間變量的梯度函數(shù),通過深度神經(jīng)網(wǎng)絡(luò)參數(shù)尋優(yōu)得到期權(quán)價(jià)格,是該定價(jià)方法的亮點(diǎn)。這種非線性尋優(yōu)的定價(jià)性能,顯著優(yōu)于傳統(tǒng)的蒙特卡洛方法的“蠻力求均值”定價(jià)性能。此外,研究還發(fā)現(xiàn),投資者的行為因素對于不同成熟度市場上的期權(quán)價(jià)格的影響,存在異質(zhì)性。這是因?yàn)椴煌墒於仁袌龅奈哟嬖诓町?。本研究可望為現(xiàn)實(shí)行為金融市場上高維標(biāo)的資產(chǎn)的行為期權(quán)定價(jià)提供一類模型和方法層面的參考。