彭闖
摘要:本文主要介紹了統(tǒng)計套利的基本含義和基于協(xié)整的交易策略,之后選取了國內(nèi)期貨市場中具有代表性的滬銅1907和滬銅1908的的5分鐘的高頻交易數(shù)據(jù)來進行實證研究,其中包括相關(guān)系數(shù)檢驗、平穩(wěn)性檢驗及協(xié)整檢驗等方法,最后根據(jù)檢驗的結(jié)果建立了誤差修正模型并制定了套利策略,并依據(jù)建立的套利策略對歷史數(shù)據(jù)進行了回測,根據(jù)回測結(jié)果對套利策略及模型的有效性給與了評估。
關(guān)鍵詞:統(tǒng)計套利;協(xié)整檢驗;誤差修正模型;高頻數(shù)據(jù)
中圖分類號:F820 ? ?文獻(xiàn)標(biāo)識碼:A
文章編號:1005-913X(2019)09-0051-03
一、研究背景
國內(nèi)對于股指期貨的統(tǒng)計套利大多停留在日間數(shù)據(jù),而對于分鐘數(shù)據(jù)等高頻數(shù)據(jù)的研究較少,而高頻數(shù)據(jù)具有交易次數(shù)多,換手頻率快等特點。相比于人為的投資操作,計算機的自動化操作具有風(fēng)險小、套利機會多等特點。基于此背景,本文選取了上海期貨市場滬銅期貨1907與滬銅1908的5分鐘數(shù)據(jù),希望再期貨合約的高頻交易中使用協(xié)整檢驗和誤差修正模型,獲得協(xié)整檢驗、誤差修正模型在高頻數(shù)據(jù)的自動交易策略。
二、模型及交易策略介紹
(一)建模步驟及模型介紹
1.相關(guān)性檢驗。進行協(xié)整統(tǒng)計套利的投資標(biāo)的物之間必須是有相互關(guān)系,要先進行相關(guān)性分析,這里選用pearson簡單相關(guān)系數(shù)。
設(shè)X,Y是兩個變量,則
其中ρxy為x,y的相關(guān)系數(shù),cov(x,y)為兩者的協(xié)方差,σx,σy為x和y的方差,μX,μY為x,y的均值。
2.平穩(wěn)性檢驗。在進行時間序列建模時必須要求數(shù)據(jù)的時間序列數(shù)據(jù)平穩(wěn),必須先進行平穩(wěn)性檢驗,單位根檢驗是判斷時間序列平穩(wěn)的重要方法,本文采用ADF檢驗,ADF檢驗為判斷時間序列是否存在單位根的重要統(tǒng)計方法之一,如果序列平穩(wěn)則不存在單位根,反之存在單位根。
設(shè)時間序列的p階滯后項回歸方程為
原假設(shè)H0:=0,存在一個單位根,對公式1進行OLS回歸可得估計量及相應(yīng)的t統(tǒng)計量,t統(tǒng)計量又被稱為ADF統(tǒng)計量,如果的ADF值小于其ADF統(tǒng)計量的臨界值,則拒絕原假設(shè),證明原時間序列存在單位根。
3.單整。如果時間序列Xt平穩(wěn),則稱Xt為零階單整,記為Xt-I(0),如時間序列前d-1階差分不平穩(wěn),第t階差分為平穩(wěn)序列,則稱Xt為t階單整,記為Xt-I(t)。
4.協(xié)整。如果兩個時間序列{Xt}和{Yt}是兩個不平穩(wěn)的時間序列,但兩個時間序列是同階單整的,即:Xt-I(t),Yt-I(t),并且這兩個序列的線性組合β1Xt+β2Yt是t-j階單整的,記為β1Xt+β2Yt-I(k-j),則稱{Xt}和{Yt}為(k,j)階協(xié)整。
協(xié)整檢驗鐘最常見的方法便是EG兩步法,假設(shè)存在兩個變量X1t和X2t,需要確定兩個變量是否具有協(xié)整關(guān)系簡要步驟可以表示為:
第一步:確定兩個變量的單整階數(shù)是否一致;
第二步:估計長期均衡關(guān)系。假設(shè)兩個變量X1t、X2t都為1階單整序列,則建立回歸方程:
X1t=β0+β1X2t+εt估計長期均衡關(guān)系。估計的殘差為εt=X1t-β0-β1X2t
第三步:檢驗序列是否平穩(wěn),是偏離長期均衡關(guān)系的利差估計值,如果這些利差估計值是平穩(wěn)的則稱X1t,X2t是(1,1)階協(xié)整。
5.誤差修正模型。如果兩個變量是協(xié)整的,那么兩個變量之間必然存在長期均衡關(guān)系,但由于市場波動及信息不對稱等因素長期均衡中往往存在著短期偏差,這兩個變量短期偏離的不均衡現(xiàn)象可以用誤差修正模型描述。誤差修正模型的常用方法有E-G兩步法和直接估計法:
其中E-G兩步法有:
第一步:根據(jù)協(xié)整檢驗的結(jié)果得到{Xt}和{Yt}的協(xié)整方程:
Yt=α0+α1xt+εt ?(1)
則其殘差序列為:
εt =Yt-α0-α1xt (2)
第二步:設(shè){Xt}和{Yt}的短期不均衡關(guān)系為:
△yt=β1△xt+β2ecmt-1+ut (3)
將(2)得到的εt-1替代(3)中的ecmt-1,得到誤差修正方程
△yt=β1△xt+β2(Yt-1-α0-α1xt-1)+ut
之后根據(jù)OLS估計求出β1、β2的值,β1其中被稱為誤差修正系數(shù)。
直接估計法:
通過以△yt為因變量,△xt,yt-1,xt-1為自變量直接建立回歸方程構(gòu)建誤差修正模型。
(二)交易策略分析
根據(jù)誤差修正模型可以得出交易時兩個期貨商品的對沖比例。計算出兩種投資標(biāo)的物價差的時間序列記為spread,根據(jù)時間序列算出spread的均值μ和σ標(biāo)準(zhǔn)差,根據(jù)價差序列的分布,確定無套利區(qū)間、套利區(qū)間和止損區(qū)間來指導(dǎo)交易。這三個區(qū)間用均值加方差的波動來進行劃分。
基本劃分標(biāo)準(zhǔn)為:
第一步:設(shè)閥值:0<φ1<φ2<φ3
第二步:設(shè)立區(qū)間,其中(μ-φ1σ,μ+φ1σ)為無套利區(qū)間(-∞,μ-φ3σ)及(μ+φ3σ,+∞)為止損區(qū)間,在這兩個區(qū)間中不持有頭寸。μ±φ2σ為建倉點。
第三步:設(shè)立交易步驟,當(dāng)樣本價差序列向上突破μ+φ2σ,或者從止損區(qū)域(μ+φ3σ,+∞)向下?lián)舸│?φ3σ做多價差,帶spread價差序列回歸至μ+φ1σ時獲利止盈離場或者spread擴大至μ+φ3σ時止損離場。當(dāng)樣本價差序列spread向下突破μ-φ2σ,或者從止損區(qū)域(-∞,μ-φ3σ)向上突破μ+φ3σ做多價差,待spread價差序列回歸至μ-φ1σ時獲利止盈離場,或者spread擴大至μ-φ3σ時止損離場。
其中φ1、φ2、φ3是以歷史最大化收益為原則求出的。
三、實證分析
本文選取了從2018年5月1號到2019年5月1號滬銅1907和滬銅1908的一年的5分鐘交易數(shù)據(jù),其中包括交易時間、交易量、買賣價格等變量。并以交易價格作為時間序列進行分析,共計19547個樣本。本文抽取了所有樣本數(shù)據(jù)的前70%的數(shù)據(jù)進行建模,并用后30%的數(shù)據(jù)進行回測。
對期貨進行統(tǒng)計套利的前提是這兩種期貨商品擁有較強的相關(guān)性,本文先選取滬銅1907與滬銅1908都為銅期貨的兩個不同的品種,本文希望先通過兩種數(shù)據(jù)的折現(xiàn)圖和散點圖的分布去探究下兩者的相關(guān)程度,由于高頻數(shù)據(jù)的數(shù)據(jù)量較大,故選取了前200個點進行描述性分析。滬銅1907與1908的折線圖與散點分布圖分別如圖1、圖2所示。
從兩者的散點圖和折現(xiàn)圖可以看出兩種期貨商品之間存在一定的均衡關(guān)系,接著對兩種期貨商品進行相關(guān)性分析:
從相關(guān)分析的表中也可以看出兩種期貨商品的相關(guān)系數(shù)達(dá)到了0.92,具有高度正相關(guān)。
接著對原序列做平穩(wěn)性檢驗,并找出兩種商品的單整系數(shù)。具體的ADF檢驗結(jié)果如表2所示
從表中可以看出兩者的ADF統(tǒng)計量分別為-2.22和-2.23,均大于1%、5%、10%的臨界值,在進行一階差分以后,兩者的ADF統(tǒng)計量分別變?yōu)?19.53和-19.55小于1%的臨界值,說明滬銅1907與滬銅1908均為一階單整序列。接下來采用E-G兩步法進行協(xié)整檢驗,先建立回歸方程,回歸方程結(jié)果如表3所示:
由表得出的回歸方程為cu1807=443.9+0.988cu
1808,接著對回歸方程的殘差進行單位根檢驗,具體結(jié)果如表4所示:
通過協(xié)整檢驗可以知道滬銅1907與滬銅1908具有協(xié)整關(guān)系。接著用直接估計法建立兩者的誤差修正模型,其中以滬銅1907為因變量,具體結(jié)果如表5所示:
得出的誤差修正模型為:
△cu.1907=237.35+0.95△cu.1908-0.533△cu.1907t-1+0.527△cu.1908t-1+εt
=237.35+0.95△cu.1908-0.533(cu.1907t-1-0.988cu.1908t-1)+εt
error.ecm=cu.1907t-1-0.988cu.1908t-1
其中error.ecm為誤差修正項,表明在兩種期貨商品的長期協(xié)整關(guān)系中,當(dāng)滬銅1907偏離均衡值時下一期的波動值不僅和cu.1908的變動值有關(guān)還和兩者的誤差修正項有關(guān),其修正的速度為-0.53,基于此得出的協(xié)整向量位(1,-0.988),表明進行修正時兩種產(chǎn)品的對沖比例為1:0.98,表明在進行統(tǒng)計套利時做多一手滬銅1907時也要做空0.98手滬銅1908,同理做空一手滬銅1907,也要做多0.988手滬銅1908。
從而可以建立兩個期貨品種的樣本內(nèi)對沖價差時間序列spreadt=cu.1907-0.988cu.1908。
根據(jù)樣本內(nèi)的價差序列,得出樣本內(nèi)價差時間序列的均值為0.105,方差為1.33×10-7,根據(jù)樣本內(nèi)價差的均值和方差,按照上面所寫的投資策略制定無套利、套利和止損區(qū)間。抽取了歷史數(shù)據(jù)的后三個月六千樣本作為測試數(shù)據(jù),用r語言自己編寫回測函數(shù),以歷史數(shù)據(jù)的收益最大化為約束條件求出三個區(qū)間的閾值φ1=0.4、φ2=1.5、φ3=3.3,每次交易的交易費用按10元計算,初始資金以滬銅1907與滬銅1908的一手的資金總和計算,前500個數(shù)據(jù)的價差走勢圖及回測總體累計收益數(shù)分別如圖3與圖4所示。
可以看出基于誤差修正模型得出的套利策略在前3000時套機機會較多,隨著時間的推移大約在4000期以后套利的機會開始逐漸降低。最后根據(jù)模型得出的收益數(shù)按照全年240個交易日,得出年化收益率、最大回撤、最長持倉時間等模型回測指標(biāo),具體結(jié)果見回測結(jié)果匯總表。
根據(jù)回測結(jié)果匯總表可以看出基于誤差修正模型得出的套利策略在測試數(shù)據(jù)中得到了29.67%的年收益率,期間共套利360次。
四、結(jié)論與建議
通過本文的實踐證明,在期貨市場上運用誤差修正模型去進行統(tǒng)計套利是可行的,并且相比于股票市場中日交易數(shù)據(jù),統(tǒng)計套利更適用于基于高頻交易數(shù)據(jù)去實現(xiàn)程序化、自動化交易,但是也可以看出高頻數(shù)據(jù)也具有交易次數(shù)頻繁,波動劇烈等特點,并且期貨市場上需要的入市資金過高,更適用于大額資金的投資者。
參考文獻(xiàn):
[1] Engle R F,Granger C W J.Cointegration and error correction:reprensenation,estimation and testing[J].Econometvica, 1987(2).
[2] Burgess A N,Refense A N.1996a.Modelling non-linear cointegration in intenational equity index futrues[C].Netural Networks in Financial Engineering.World Scientific,Singapore,1996:50-63.
[3] 仇中群.基于協(xié)整的股指期貨套利研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2009.
[4] 蔡志成.基于協(xié)整分析的統(tǒng)計套利策略研究[D].杭州:杭州電子科技大學(xué),2014.
[5] 趙 華.時間序列數(shù)據(jù)分析——R軟件應(yīng)用[M].北京:清華大學(xué)出版社,2016.
[責(zé)任編輯:譚志遠(yuǎn)]