鄧曉衛(wèi),章鋮斌
(南京工業(yè)大學(xué)a.數(shù)理科學(xué)學(xué)院;b.海外教育學(xué)院,南京 211800)
統(tǒng)計(jì)套利通過(guò)對(duì)歷史數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從一組資產(chǎn)的定價(jià)偏差中獲利。價(jià)差的波動(dòng)率決定了套利的成本和收益,而套利資產(chǎn)組合價(jià)格收斂是套利策略的基本保證。目前為止,國(guó)內(nèi)外關(guān)于統(tǒng)計(jì)套利的研究,主要針對(duì)于各種期貨產(chǎn)品的套利策略研究[1-4]。隨著機(jī)器學(xué)習(xí)研究的深入,學(xué)者們發(fā)現(xiàn)建立在機(jī)器學(xué)習(xí)方法上的預(yù)測(cè)比一般時(shí)間序列的預(yù)測(cè)模型要更精準(zhǔn)[5-8]。于是有學(xué)者將神經(jīng)網(wǎng)絡(luò)模型運(yùn)用在統(tǒng)計(jì)套利中,如:徐顥華等[9]引入差分BP神經(jīng)網(wǎng)絡(luò)及拓?fù)浣Y(jié)構(gòu)對(duì)股指期貨進(jìn)行預(yù)測(cè),檢驗(yàn)其預(yù)測(cè)結(jié)果好于普通BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè),提出可用于套利;靳朝翔等[10]以焦炭、鐵礦石和螺紋鋼為例,基于NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型研究套利策略;劉陽(yáng)等[11]將神經(jīng)網(wǎng)絡(luò)模型與動(dòng)態(tài)GARCH模型相結(jié)合,提出了一種基于信息更新NN-GARCH模型,對(duì)大連商品交易所的大豆一號(hào)和二號(hào)的統(tǒng)計(jì)套利策略進(jìn)行了研究。
綜上,關(guān)于統(tǒng)計(jì)套利的研究特點(diǎn)是:第一,在研究對(duì)象上,大部分以期貨產(chǎn)品為主,且套利產(chǎn)品一般是基于兩個(gè)產(chǎn)品進(jìn)行;第二,在研究方法上,基本還是采用協(xié)整分析、誤差修正模型等方法。雖然基于神經(jīng)網(wǎng)絡(luò)的統(tǒng)計(jì)套利有初步的研究,但研究的方法和對(duì)象還十分欠缺。如文獻(xiàn)[9]提出的差分BP神經(jīng)網(wǎng)絡(luò)模型可用于套利但并未對(duì)此真正展開(kāi)研究。而且,這些研究都是基于較為基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)模型。本文的創(chuàng)新點(diǎn)在于:第一,就交易對(duì)象而言,選擇國(guó)內(nèi)股票市場(chǎng)進(jìn)行研究,并且考慮多元投資組合的統(tǒng)計(jì)套利策略;第二,基于LSTM和BP神經(jīng)網(wǎng)絡(luò)模型,提出一個(gè)混合神經(jīng)網(wǎng)絡(luò)模型,并應(yīng)用Google公司開(kāi)發(fā)的最新機(jī)器學(xué)習(xí)框架Tensorflow進(jìn)行統(tǒng)計(jì)套利研究。
BP神經(jīng)網(wǎng)絡(luò)是一種多層的前饋神經(jīng)網(wǎng)絡(luò),從激勵(lì)函數(shù)Sigmoid函數(shù)開(kāi)始:
然后通過(guò)隱含層的輸出、輸出層的輸出、誤差的計(jì)算、權(quán)值的更新、偏置的更新等步驟進(jìn)行迭代,最終得到較理想的結(jié)果。
LSTM(Long Short-Term Memory)是一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),由通過(guò)精心設(shè)計(jì)的稱作“門(mén)”的結(jié)構(gòu)來(lái)去除或增加信息到細(xì)胞狀態(tài)的能力,他們包含一個(gè)Sigmoid神經(jīng)網(wǎng)絡(luò)層和一個(gè)Pointwise乘法操作。LSTM擁有三個(gè)門(mén)(遺忘門(mén)、輸入門(mén)、輸出門(mén))來(lái)保護(hù)和控制細(xì)胞狀態(tài)。LSTM神經(jīng)網(wǎng)絡(luò)模型經(jīng)過(guò)眾多學(xué)者和研究人員改進(jìn),目前已被廣泛用于多個(gè)領(lǐng)域,如語(yǔ)言翻譯、圖像識(shí)別、預(yù)測(cè)疾病、點(diǎn)擊率、股票等。
由于LSTM神經(jīng)網(wǎng)絡(luò)在處理和預(yù)測(cè)時(shí)間序列中間隔和延遲相對(duì)較長(zhǎng)的數(shù)據(jù)、學(xué)習(xí)長(zhǎng)期依賴信息方面具有優(yōu)勢(shì),故本文擬將LSTM模型用于統(tǒng)計(jì)套利的前期預(yù)測(cè)。但在對(duì)該模型實(shí)際運(yùn)用時(shí)發(fā)現(xiàn),單純運(yùn)用LSTM神經(jīng)網(wǎng)絡(luò)模型做預(yù)測(cè),預(yù)測(cè)區(qū)間的前段效果并不是十分理想。于是本文提出一種混合神經(jīng)網(wǎng)絡(luò)模型,即在LSTM神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上引入BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)修正,使得預(yù)測(cè)值更精準(zhǔn),最終提高了統(tǒng)計(jì)套利結(jié)果。具體步驟如下:
首先,將所有數(shù)據(jù)集分為訓(xùn)練集、測(cè)試集和預(yù)測(cè)集,用LSTM神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練、測(cè)試和預(yù)測(cè),預(yù)測(cè)值記為yLSTM;然后,將原先的訓(xùn)練集和測(cè)試集的數(shù)據(jù)重新分為新的訓(xùn)練集、測(cè)試集和預(yù)測(cè)集,記為訓(xùn)練集1、測(cè)試集1和預(yù)測(cè)集1,重復(fù)LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)步驟,得到預(yù)測(cè)集1與真實(shí)數(shù)據(jù)誤差的時(shí)間序列;最后,對(duì)該時(shí)間序列進(jìn)行BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),得到預(yù)測(cè)集的誤差項(xiàng)的變化,記為εBP,以此對(duì)yLSTM不太穩(wěn)定的前段進(jìn)行修正,得最終預(yù)測(cè)值為:
式(2)即為一個(gè)混合神經(jīng)網(wǎng)絡(luò)模型。下文將通過(guò)實(shí)證檢驗(yàn)該混合模型的預(yù)測(cè)精度高于單純用BP預(yù)測(cè)的精度。
首先,由長(zhǎng)期協(xié)整關(guān)系選出可能進(jìn)行套利的n個(gè)資產(chǎn),設(shè)為x1t,x2t,…,xnt(此處亦表示各資產(chǎn)的收盤(pán)價(jià));采用文獻(xiàn)[9]的方法,可得該資產(chǎn)組合t時(shí)刻的利潤(rùn)為:
其中,ut=x1t-α1x2t-α2x3t-…-αn-1xnt右端各系數(shù)通過(guò)最小二乘擬合來(lái)確定。在確定各資產(chǎn)權(quán)重αi后,采用本文提出的混合神經(jīng)網(wǎng)絡(luò)模型,按累積疊加的方式用xit的前t個(gè)值去預(yù)測(cè)第t+1個(gè)值,再得到預(yù)測(cè)的利潤(rùn)函數(shù)序列{proft}。
然后,對(duì)時(shí)間序列{proft}進(jìn)一步分析,通過(guò)建立ARMA(p,q)模型,從中分離出隨機(jī)擾動(dòng)項(xiàng)εt(此為白噪聲序列),本文的統(tǒng)計(jì)套利是通過(guò)對(duì)擾動(dòng)項(xiàng)εt的預(yù)測(cè)值來(lái)設(shè)計(jì)套利策略。經(jīng)過(guò)多次嘗試,最后選擇的是ARMA(1,1)模型如式(4)所示:
最后,統(tǒng)計(jì)套利最重要的是分析套利中出現(xiàn)的時(shí)機(jī)和概率。為此,本文先確立套利區(qū)間,使用上述模型計(jì)算得到殘差εt,并且假設(shè)交易閾值為λ1和λ2,則λ1εt和 -λ1εt為交易(買(mǎi)空、賣(mài)空)的上下界。同時(shí)設(shè)立平倉(cāng)的最大區(qū)域,設(shè)置λ2εt和 -λ2εt為平倉(cāng)上下限。這里,λ1,λ2>0 ,且λ2>λ1。
建立套利的頭寸后,當(dāng)價(jià)差序列如期回歸到μ±λi εt(i=1)區(qū)間時(shí)(μ為均值,此處為0)進(jìn)行反向操作獲利,從而完成一次正向或反向的套利。如果沒(méi)有如期回歸至標(biāo)準(zhǔn)差區(qū)間,本文設(shè)定了平倉(cāng)上下限,即當(dāng)價(jià)差觸發(fā)μ±λiεt(i=2)以外的區(qū)域時(shí),多頭頭寸或空頭頭寸立即平倉(cāng)止損。該策略是基于風(fēng)險(xiǎn)管控的交易策略,為了避免過(guò)大的波動(dòng)風(fēng)險(xiǎn)。
根據(jù)統(tǒng)計(jì)套利的相關(guān)理論,先找具有較高相關(guān)性的股票來(lái)作為研究樣本。通過(guò)計(jì)算相關(guān)系數(shù),本文選取了相關(guān)性較高的4只股票:中國(guó)銀行、工商銀行、農(nóng)業(yè)銀行和建設(shè)銀行四大國(guó)有銀行2016年1月1日至2017年9月30日每日開(kāi)盤(pán)價(jià)、收盤(pán)價(jià)、最高價(jià)、最低價(jià)、復(fù)權(quán)價(jià)1、成交量、成交金額、振幅作為研究樣本,用這8個(gè)變量使用混合神經(jīng)網(wǎng)絡(luò)模型對(duì)下一交易日的收盤(pán)價(jià)進(jìn)行預(yù)測(cè)。數(shù)據(jù)來(lái)源于銳思金融數(shù)據(jù)庫(kù)。混合神經(jīng)網(wǎng)絡(luò)模擬所用的程序基于TensorFlow框架,這是谷歌研發(fā)的第二代人工智能學(xué)習(xí)系統(tǒng),并在2015年11月9日宣布開(kāi)源,利用Python語(yǔ)言對(duì)此進(jìn)行控制。統(tǒng)計(jì)軟件使用Eviews10.0。
進(jìn)行套利的組合產(chǎn)品需要滿足協(xié)整關(guān)系。首先,對(duì)樣本數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗(yàn)以確定他們的單整階數(shù)。此處采用ADF檢驗(yàn)。記x1t、x2t、x3t、x4t為工商銀行、建設(shè)銀行、農(nóng)業(yè)銀行、中國(guó)銀行第t天的股票收盤(pán)價(jià)價(jià)格。對(duì)4只股票的收盤(pán)價(jià)及收盤(pán)價(jià)差分序列作ADF檢驗(yàn),結(jié)果顯示①限于篇幅,此處省略了ADF的全部檢驗(yàn)結(jié)果。:四家銀行股票收盤(pán)價(jià)格序列均不平穩(wěn),但其一階差分序列在1%的水平下均是平穩(wěn)序列,即他們具有相同的單整階數(shù):{xit}~I(xiàn)(1),i=1,2,3,4 。
其次,用E-G兩步法對(duì)x1t、x2t、x3t、x4t進(jìn)行協(xié)整關(guān)系檢驗(yàn)。同時(shí)為了分析不同投資組合及不同神經(jīng)網(wǎng)絡(luò)模型在統(tǒng)計(jì)套利中的獲利差異及優(yōu)劣,本文以所選的4只股票為基礎(chǔ)構(gòu)造了四種投資組合(見(jiàn)表1),分別對(duì)他們進(jìn)行協(xié)整檢驗(yàn)。
表1 投資組合列表
先對(duì)Porti,(i=1,2,3,4)進(jìn)行OLS回歸,以獲取殘差項(xiàng)uit,i=1,2,3,4 。再對(duì)該殘差序列分別進(jìn)行單位根檢驗(yàn),結(jié)果如表2所示。
表2 uit的單位根檢驗(yàn)結(jié)果
結(jié)果顯示,四組殘差序列在1%或5%的置信水平下均平穩(wěn),從而所構(gòu)造的四個(gè)組合均存在長(zhǎng)期的協(xié)整關(guān)系。
根據(jù)式(3)定義,該四種組合的套利收益可以表示為:其中,uit,t=1,2,3,4 。由前OLS回歸結(jié)果確定,具體如下:
對(duì)每只股票將其樣本數(shù)據(jù)分為訓(xùn)練集:2016.01.04-2017.04.05;測(cè)試集:2017.04.06-2017.07.06及預(yù)測(cè)集:2017.7.7-2017.9.29。運(yùn)用混合神經(jīng)網(wǎng)絡(luò)模型按前述給定的策略進(jìn)行訓(xùn)練、測(cè)試及預(yù)測(cè)。實(shí)驗(yàn)中設(shè)定訓(xùn)練次數(shù)為10000次,學(xué)習(xí)速率為0.0006,隱藏層為10層。通過(guò)上述訓(xùn)練、測(cè)試,預(yù)測(cè)出2017年7月7日至2017年9月29日的各股票價(jià)格走勢(shì),如圖1所示。
圖1混合神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)曲線與真實(shí)走勢(shì)曲線比較圖
再由式(6)至式(9)根據(jù)投資組合中各產(chǎn)品的權(quán)重計(jì)算出相應(yīng)組合的利潤(rùn)序列值profit。
在得到利潤(rùn)序列{profit}后,建立其ARMA(1,1)模型,得到殘差項(xiàng)εit,之后按設(shè)定套利和平倉(cāng)閾值并進(jìn)行套利,由此完成統(tǒng)計(jì)套利的全過(guò)程。
具體交易策略。如對(duì)投資組合1即Port1,由式(6):一份完整的多頭頭寸交易是買(mǎi)入0.53份中國(guó)銀行股票同時(shí)賣(mài)出1份農(nóng)業(yè)銀行股票;一份完整的空頭頭寸交易則是賣(mài)出0.530份中國(guó)銀行股票同時(shí)買(mǎi)入1份農(nóng)業(yè)銀行股票。同理,Port2、Port3和Port4中,各金融產(chǎn)品的投資比例由式(7)至式(9)確定,分別為:1∶-1.139;-0.927;1∶-1.460∶-0.635以及1∶-0.218∶-0.821∶-0.789。
其中,“-”代表反向操作,當(dāng)然真正購(gòu)買(mǎi)股票不存在小數(shù),但這不影響交易策略的制定,因?yàn)榭梢酝壤糯?,使得交易比例為整?shù)即可實(shí)現(xiàn)真正的套利方案。
為比較BP、LSTM以及混合神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)套利的優(yōu)劣,先采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),發(fā)現(xiàn)預(yù)測(cè)平均誤差超過(guò)1%;然后采用LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),預(yù)測(cè)平均誤差降低到0.7%左右;最后用混合神經(jīng)網(wǎng)絡(luò)預(yù)測(cè),平均誤差在0.5%左右。表3給出了基于BP神經(jīng)網(wǎng)絡(luò)和混合神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)并進(jìn)行套利結(jié)果(鑒于LSTM只在預(yù)測(cè)區(qū)間的前端誤差較大,總體套利結(jié)果只在前段與混合神經(jīng)網(wǎng)絡(luò)模型套利結(jié)果出現(xiàn)差異,故此處省略)。
表3 Port1投資組合套利結(jié)果
從表3中可以發(fā)現(xiàn),無(wú)論是從套利成功率、累計(jì)收益率、最大收益率,還是從最大虧損率和套利次數(shù)來(lái)看,混合神經(jīng)網(wǎng)絡(luò)模型的套利結(jié)果均優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型的套利結(jié)果。由此可見(jiàn),預(yù)測(cè)準(zhǔn)確率是統(tǒng)計(jì)套利成功的重要保證。預(yù)測(cè)越準(zhǔn)確,套利成功率、收益率和套利次數(shù)越高,同時(shí)最大虧損率下降,說(shuō)明提高預(yù)測(cè)準(zhǔn)確率可以顯著減少風(fēng)險(xiǎn)。
接下來(lái)本文探討在原有兩個(gè)組合中增加投資組合產(chǎn)品個(gè)數(shù),再應(yīng)用混合神經(jīng)網(wǎng)絡(luò)模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行統(tǒng)計(jì)套利會(huì)產(chǎn)生什么樣的結(jié)果。仍舊從套利成功率、累計(jì)收益率、最大收益率、最大虧損率和套利次數(shù)這幾個(gè)指標(biāo)研究套利策略效果,結(jié)果見(jiàn)表4。
表4 投資組合Port2—Port4的兩種模型套利結(jié)果比較
結(jié)合表4和表3可以得到:本文提出的混合神經(jīng)網(wǎng)絡(luò)模型的套利成功率及累計(jì)收益率均高于單一BP神經(jīng)網(wǎng)絡(luò)模型的套利結(jié)果;增加投資組合中的產(chǎn)品數(shù),即投資組合的多元化可以有效地增加套利成功率和累計(jì)收益率;基于混合神經(jīng)網(wǎng)絡(luò)模型的最大虧損率低于單一BP神經(jīng)網(wǎng)絡(luò)模型套利的最大虧損率。但從Port2—Port4的結(jié)果發(fā)現(xiàn):基于混合神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)成功的套利次數(shù)與基于BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)成功的套利次數(shù)沒(méi)有顯著提高(但亦沒(méi)有減少);特別是最大收益率指標(biāo),有的組合(如Port3)混合預(yù)測(cè)的結(jié)果低于BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的結(jié)果。具體分析其原因發(fā)現(xiàn):套利結(jié)果的好壞與投資組合中金融產(chǎn)品本身的優(yōu)劣有較大的關(guān)系。事實(shí)上,Port2是在Port1的基礎(chǔ)上增加了工商銀行;Port3是在Port1的基礎(chǔ)上增加了建設(shè)銀行,經(jīng)過(guò)查證,在此預(yù)測(cè)時(shí)間段內(nèi),工商銀行主營(yíng)收入增長(zhǎng)遠(yuǎn)高于建設(shè)銀行。由此可見(jiàn),在投資組合中增加產(chǎn)品,要審慎選擇。增加產(chǎn)品的好壞可能直接影響到統(tǒng)計(jì)套利的成功及獲利大小。怎樣審慎選擇一個(gè)投資組合?這正是下一步研究的問(wèn)題。
本文以LSTM神經(jīng)網(wǎng)絡(luò)模型和BP神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ),提出了一個(gè)混合神經(jīng)網(wǎng)絡(luò)模型,用于統(tǒng)計(jì)套利的預(yù)測(cè),研究不同的投資組合下的統(tǒng)計(jì)套利策略,并用中、工、農(nóng)、建四大國(guó)有銀行2016年1月1日至2017年9月30日的真實(shí)數(shù)據(jù)為樣本進(jìn)行實(shí)證分析。結(jié)果顯示:本文提出的混合神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)準(zhǔn)確率明顯高于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果。帶來(lái)的直接效果就是使得套利收益率顯著提升,即采用本文提出的混合神經(jīng)網(wǎng)絡(luò)的套利策略是十分有效的。不僅如此,混合神經(jīng)網(wǎng)絡(luò)的套利成功率、套利次數(shù)均增加,最大收益率和最大虧損率均得到改善,因此采用混合神經(jīng)網(wǎng)絡(luò)建立預(yù)測(cè)模型,并進(jìn)行套利,會(huì)使預(yù)測(cè)更準(zhǔn)確,套利更精準(zhǔn),收益也更大。之后投資組合的多元化檢驗(yàn),不僅同樣符合上述結(jié)論,也可以有效地增加套利次數(shù)和套利成功率,說(shuō)明投資組合越多元,相對(duì)風(fēng)險(xiǎn)會(huì)更小,換言之套利機(jī)會(huì)越多。但并不是投資組合中的金融產(chǎn)品越多越好,只有對(duì)金融產(chǎn)品作合理篩選,包括數(shù)量和質(zhì)量,才能獲得較好的投資收益。
研究中也存在不足,首先本文只選擇了四個(gè)公司做樣本進(jìn)行研究,樣本較少可能存在一定的實(shí)驗(yàn)誤差。其次,在統(tǒng)計(jì)套利收益的測(cè)算中,沒(méi)有考慮交易所產(chǎn)生的費(fèi)用,如手續(xù)費(fèi)等。當(dāng)考慮相關(guān)費(fèi)用,投資收益會(huì)有所下降,但是對(duì)整體實(shí)驗(yàn)結(jié)果無(wú)較大影響。再次,以什么原則選擇一組投資組合產(chǎn)品,以獲得更多套利機(jī)會(huì)和更高收益?本文還沒(méi)有給出確定的方法。