徐鳳敏,李雪鵬
(西安交通大學(xué) 經(jīng)濟(jì)與金融學(xué)院,陜西 西安 710061)
統(tǒng)計套利策略作為一種數(shù)量化的投資手段在20世紀(jì)80年代達(dá)到鼎盛,目前廣泛應(yīng)用于對沖基金和投行主營業(yè)務(wù)中。在成熟市場經(jīng)濟(jì)體中,統(tǒng)計套利策略年收益在15%至20%,在中國等新興市場有極大的收益潛力。統(tǒng)計套利根據(jù)資產(chǎn)的歷史價格信息構(gòu)建不依賴經(jīng)濟(jì)含義的數(shù)理模型以發(fā)現(xiàn)具有長期均衡趨勢的兩類資產(chǎn),并利用短期的價格偏離構(gòu)建空頭和多頭投資組合,最終在均值回復(fù)的假設(shè)下當(dāng)價格回復(fù)到均衡的時候反向?qū)_。與無風(fēng)險套利策略相比,統(tǒng)計套利存在價差序列的發(fā)散風(fēng)險,但增加了套利機(jī)會,且應(yīng)用對象范圍更大,操作手段更靈活。常見的類型有配對交易、多因子模型、指數(shù)追蹤、增強型指數(shù)[1-6]。配對交易是應(yīng)用最早、最成熟的統(tǒng)計套利策略,Avellaneda和Lee認(rèn)為配對交易是統(tǒng)計套利的起源,因此統(tǒng)計套利在應(yīng)用中也被稱為配對交易[7]。配對交易是一類市場中性套利策略,包括形成期和交易期。在形成期內(nèi)需要確定可用于交易的資產(chǎn)對象(股票、期權(quán)期貨、外匯及債券),符合交易條件的兩個資產(chǎn)在價格上應(yīng)該有長期一致趨勢;在交易期內(nèi)配對交易者應(yīng)該確定價格偏離時觸發(fā)交易的條件,及具體的交易策略。Avellaneda和Lee擴(kuò)展了配對交易的內(nèi)涵,提出了更一般的多元配對交易(Generalized Pairs Trading,GPT),即研究兩個投資組合間的配對交易[7]。Perlin為某確定資產(chǎn)尋找配對的投資組合,該問題被稱為擬多元配對交易(Quasi-Multivariate Version of Pairs Trading,QMVPT)[8]。
國外學(xué)者關(guān)于配對交易的研究開展較早,主要集中于配對交易理論方法的設(shè)計。Krauss按照建模方法將統(tǒng)計套利中的配對交易策略分為五類:距離法、協(xié)整法、時間序列法、隨機(jī)控制法和其他法[9]。
Gatev等最早給出價差平方和測度(Sum of Euclidean Squared Distance,SSD)用以描述資產(chǎn)價格的一致性趨勢,并給出了配對交易策略的兩步框架,這里稱為距離法(Distance Method,DM)[10]。Pole選擇價差收益率的方差取代SSD,Chen等使用股票收益率的皮爾遜相關(guān)系數(shù)代替SSD,實驗表明可以取得超過一般DM方法一倍的收益[2,11]。Vidyamurthy最早使用協(xié)整方法研究兩個資產(chǎn)的配對交易問題,在APT模型成立假設(shè)下給出了協(xié)整套利一般框架[1]。該框架分為三步,第一步在于選擇具有相關(guān)關(guān)系的配對資產(chǎn);第二步是對價差進(jìn)行交易性測試,和距離法類似;最后使用非參數(shù)信號判斷是否發(fā)生交易。Elliott等用時間序列方法在狀態(tài)空間中為價差建模,將兩個資產(chǎn)的價差視為均值回歸的高斯馬爾可夫鏈和一個高斯噪聲,引入首達(dá)時間理論建立了配對交易分析框架,并得到交易時間和開倉、平倉信號[12]。Do等采用收益率序列差的錯誤定價,和上文的框架類似建立了配對交易框架,不同在于由于引入了APT模型,使得收益序列差的刻畫變得復(fù)雜[13]。Jurek和Yang應(yīng)用隨機(jī)控制理論研究配對交易問題,假設(shè)配對組合的價差滿足Ornstein-Uhlenbeck過程,利用資產(chǎn)價格的動態(tài)變化,考慮預(yù)算約束和資本約束得到Hamilton-Jacobi-Bellman(HJB)方程,并推出最優(yōu)投資策略和價值函數(shù)的閉式表達(dá)解[14]。
自2010年3月推出融資融券業(yè)務(wù)以來,國內(nèi)關(guān)于配對交易的研究逐漸增多,主要關(guān)注配對交易策略在中國市場的應(yīng)用。王春峰等利用DM方法設(shè)計了基于價格差異的配對交易策略,利用滬深300成份股2006—2009年的數(shù)據(jù)研究了兩只股票間的配對交易問題,結(jié)論顯示策略月收益均值在1%[15]。仇中群等利用協(xié)整模型研究了股指期貨的跨期套利問題,利用滬深 300股指期貨模擬數(shù)據(jù)檢驗了有效性[16]。張波等引入了股指期貨跨期套利的EGARCH-M模型并提出期貨合約間的修正協(xié)整關(guān)系,結(jié)果顯示優(yōu)于傳統(tǒng)的GARCH套利模型[17]。胡倫超等結(jié)合協(xié)整和DM方法構(gòu)建了兩階段的配對套利策略,基于上證50的實證顯示該策略在不同費率下均可以獲得超額收益[18]。
從以上文獻(xiàn)可以發(fā)現(xiàn):第一,距離法和協(xié)整方法都需要在形成期內(nèi)確定滿足一致趨勢的配對組合。其中距離法使用相關(guān)測度檢驗相似性,協(xié)整法需要配對資產(chǎn)滿足協(xié)整關(guān)系,并在交易期內(nèi)采用非參數(shù)方法確定交易信號。而時間序列方法和隨機(jī)控制方法都忽略了形成期內(nèi)配對組合的確定,假設(shè)已經(jīng)找到了具有一致性趨勢的股票,主要研究集中在交易期內(nèi)如何確定最優(yōu)的交易信號和交易策略。第二,國內(nèi)外研究兩資產(chǎn)配對交易較多,如股票、期貨合約間,對多元配對交易和擬多元配對交易研究相對較少。
傳統(tǒng)配對交易只涉及兩個資產(chǎn),在形成期內(nèi)確定配對組合是容易的,協(xié)整方法和距離法在多項式時間內(nèi)都可以找到滿足要求的配對組合。當(dāng)考慮GPT或QMVPT問題時,由于維數(shù)爆炸問題,原有的方法不再適用。GPT或者QMVPT的模型刻畫是困難的,預(yù)期收益的不確定性變化同樣使得約束和目標(biāo)難以表達(dá)。為此將資產(chǎn)的收益視為服從某一分布的隨機(jī)變量,通過概率約束刻畫收益的不確定性[5]。此外從成本角度出發(fā),需要限制配對交易組合的資產(chǎn)數(shù)量,通過加入稀疏約束限制配對組合的規(guī)模。
綜上所述,本文聚焦于統(tǒng)計套利中配對組合的確定,擬建立帶有概率約束的稀疏優(yōu)化模型研究GPT和QMVPT問題。對于QMVPT問題,考慮中國市場的賣空限制、配對組合規(guī)模,研究重點在于給定某一資產(chǎn)時,在形成期內(nèi)尋找與其配對的投資組合,包括組合內(nèi)資產(chǎn)的選擇和權(quán)重的確定;對于GPT問題,允許資產(chǎn)賣空,且考慮配對組合規(guī)模,重點研究如何最優(yōu)地確定滿足配對交易條件的兩個套利投資組合。
配對交易意圖尋找長期內(nèi)收益或者價格具有一致變動趨勢的資產(chǎn),并利用資產(chǎn)間的瞬時偏離獲取套利收益。資產(chǎn)間的一致趨勢對于風(fēng)險的抵御至關(guān)重要,是套利機(jī)會最終收斂的必要條件,而交易期內(nèi)資產(chǎn)組合間的偏離程度和出現(xiàn)頻率決定了套利收益的大小。本文從這兩個目標(biāo)出發(fā)建立概率優(yōu)化套利模型,并加入控制組合規(guī)模的稀疏約束,目的是尋找在長期來看具有一致變動趨勢,但短期內(nèi)出現(xiàn)偏離的資產(chǎn)配對組合。在后續(xù)分析中,考慮兩種情景下的配對交易:標(biāo)的指數(shù)和投資組合的擬配對交易問題,以及投資組合間的多元配對交易問題[7-8]。需要明確的是,本文的模型并不局限于對指數(shù)的套利問題,而是可以廣泛應(yīng)用于單一或者同類型資產(chǎn)的套利組合構(gòu)建,從而為套利投資者提供一種主動尋求套利機(jī)會的解決方案。
假設(shè)套利組合A為已知的標(biāo)的指數(shù)(NA=1,ωA=1),下面構(gòu)建一個這樣的套利組合B,即和指數(shù)在一定持有期內(nèi)具有長期穩(wěn)定趨勢,但在交易期內(nèi)某一時刻指數(shù)和套利組合資產(chǎn)收益率序列相較于正常水平具有更大的偏離幅度??紤]到未來收益的不確定性,套利機(jī)會是否出現(xiàn)并不是一個確定事件,因此在約束中考慮套利條件的不確定約束。此外套利組合的規(guī)模不宜過大或出現(xiàn)不可操作的小權(quán)重,因此需要稀疏約束對投資組合規(guī)模加以限制。綜上所述,提出擬多元稀疏統(tǒng)計套利模型(Quasi-Multivariate Sparse Statistical Arbitrage Model),以下記為QM-SSAM模型,如式(1):
s.t.P{rA-(rB)TωB≥d}≥1-ε,d>0,
eTωB=1,L≤ωB≤U,‖ωB‖0≤K
(1)
式(1)中ε∈[0,1]是預(yù)設(shè)參數(shù),隨著ε的減少,指數(shù)能以更高概率達(dá)到預(yù)期偏離[5]。QM-SSAM模型是帶有單概率約束的雙目標(biāo)稀疏優(yōu)化模型,求解該模型可以得到指數(shù)的最優(yōu)套利組合,其中第一層目標(biāo)保證了指數(shù)和套利組合B有一致的變動趨勢,即指數(shù)和套利組合B具有均值回復(fù)特征,稱為追蹤目標(biāo);第二層目標(biāo)使得指數(shù)和套利組合B在套利期內(nèi)收益偏差盡可能大,稱為波動目標(biāo),這使得定義中描述的有效套利機(jī)會更可能出現(xiàn),進(jìn)一步增加了套利的收益能力。稀疏約束保證了套利組合至多只包含K個資產(chǎn);單概率約束刻畫了指數(shù)正向套利機(jī)會出現(xiàn)的不確定性,即只對指數(shù)進(jìn)行賣空操作。資金預(yù)算約束保證了資本全部用于投資,L和U表示買入閾值的上下界。
對于多元配對交易而言,假設(shè)組合A和B內(nèi)包含多個資產(chǎn)且都可以使用融資融券操作,此時可以考慮正向和反向兩類有效套利機(jī)會。類比于QM-SSAM模型,加入稀疏約束,買入閾值約束以及資金預(yù)算約束,提出多元稀疏統(tǒng)計套利模型(Multivariate Sparse Statistical Arbitrage Model),以下記為M-SSAM模型,如式(2):
‖ωA‖0+‖ωB‖0=K1,
U1≤ωA≤L1,U2≤ωB≤L2
(2)
M-SSAM是帶有雙概率約束的雙目標(biāo)稀疏優(yōu)化模型,用于最優(yōu)的確定配對組合A和B。ε1∈[0,1]、ε2∈[0,1]都是預(yù)設(shè)參數(shù);需要滿足1-ε1+1-ε2≤1?ε1+ε2≥1,并且當(dāng)d1=d2時等號成立。組合A和B在交易期內(nèi)賣空操作的難度相仿,出于減少賣空操作難度而只關(guān)注正向套利機(jī)會減少了交易期內(nèi)的套利機(jī)會,故使用雙概率約束刻畫A和B兩類套利機(jī)會。當(dāng)d1≥0且d2≥0,即式(2)中的兩個概率約束都成立,套利者可以在交易期內(nèi)關(guān)注正向或者反向套利機(jī)會。對于式(2),當(dāng)RA只包含一種資產(chǎn),且給定ωA=1時,式(1)是(2)只包含第一類套利的特殊形式;當(dāng)RA=RB,即A和B來自同一個資產(chǎn)池中,令ω=ωA-ωB,可以將式(2)等價寫為關(guān)于變量ω的單變量模型,其中ωA對應(yīng)解的正部,-ωB對應(yīng)解的負(fù)部;當(dāng)RA和RB互斥時,給定ω1=(ωA;ωB),可以將式(2)改寫為關(guān)于ω1的單變量模型。
雙目標(biāo)使得模型求解變得困難,在后文轉(zhuǎn)化和算法設(shè)計中,引入風(fēng)險權(quán)重因子δ,δ1∈[0,]將模型轉(zhuǎn)化為多目標(biāo)的線性加權(quán)和形式,即以及改寫后的單目標(biāo)約束稀疏隨機(jī)優(yōu)化模型涉包含稀疏約束和概率約束,這使得該問題是NP-hard,不存在解決這類問題的多項式時間算法。在下節(jié)中假設(shè)預(yù)期收益率可以由多因子模型表示,利用因子的分布信息給出該問題的近似模型和一般求解算法。
帶有概率約束的稀疏優(yōu)化問題是NP-hard問題,本節(jié)利用因子的矩信息,結(jié)合分布式魯棒的方法將不確定性約束轉(zhuǎn)化為確定性約束,從而將模型(1)和(2)轉(zhuǎn)化為約束稀疏優(yōu)化問題,然后利用量子粒子群算法的思想,設(shè)計了一類新的混合算法。
考慮概率約束P{c(ω,ξ)≤0}≥1-α,其中ω為未知量,ξ是參數(shù)隨機(jī)向量,一般處理思想是將其轉(zhuǎn)化為確定性等價形式或者逼近形式。但實際中,我們并不能確定收益率的具體分布,因此確定性轉(zhuǎn)化是困難的。通過有限的樣本數(shù)據(jù)觀察,可以計算樣本均值、方差,當(dāng)數(shù)據(jù)量足夠大的時候可以近似總體的均值、方差。在無法獲得變量ξ全部分布信息時,Xu等利用分布集合刻畫其不確定性,使用分布式魯棒方法,借助ξ的一階和二階矩信息以及無限對偶理論,將概率約束轉(zhuǎn)化為一系列的錐約束或者半定約束[5]。按照這種方法給出概率約束的近似逼近。
假設(shè)每個資產(chǎn)的收益率都是由k個市場因子(隨機(jī)變量)決定(如單因子CAPM模型、三因子Fama-French模型),則有:
s.t.eTωB=1,L≤ωB≤U,‖ωB‖0=K,d≥0,
(αi+ηi-ξi,si+βi,si-βi)∈L3,i=1,2,…,k,
(αj+η1j-ξ1j+φyj(ωB),Sj+βj,Sj-βj)
∈L3,j=1,2,…,k,
λ,φ∈;α,β,ξ,η,ξ1,η1,s,S∈k;ξ,η,ξ1,
η1,s,S≥0;φ≥0,β<0
(3)
0≤ωA≤L1,0≤ωB≤L2,
∈L3,j=1,2,…,k,
∈L3,j=1,2,…,k,
λ″∈;
φ″≥0,β″<0,
λ′∈;
φ′≥0,β′<0
(4)
QM-SSAM和M-SSAM的安全近似模型(3)、(4)是一類帶有稀疏約束的二次錐規(guī)劃問題。本文根據(jù)近似模型的特殊形式設(shè)計一類新的量子粒子群算法(Quantum-Behaved Particle Swarm Optimization,QPSO),并將其應(yīng)用于約束稀疏優(yōu)化問題的求解。對于單變量稀疏約束和上下界約束,引入0-1整數(shù)變量y∈{0,1}n對其進(jìn)行等價轉(zhuǎn)化,如式(5)所示,其中⊙表示分量相乘。故上節(jié)得到的近似模型等價于一類0-1混合整數(shù)規(guī)劃問題。
‖ω‖0=K,ω∈n
L≤ω≤U?eTy=K,y∈{0,1}n
L⊙y≤ω≤U⊙y
(5)
量子粒子群算法最初用于連續(xù)變量的模型求解,每一次的迭代結(jié)果都帶有小數(shù)部分。國內(nèi)的學(xué)者已經(jīng)成功將量子粒子群算法應(yīng)用于整數(shù)和混合整數(shù)規(guī)劃的求解,研究主要結(jié)合新的迭代公式和整數(shù)截斷方法提出修正算法[19-21]。近似模型兩個變量具有特殊結(jié)構(gòu),當(dāng)y確定后,模型(3)和(4)是二次錐規(guī)劃問題。鑒于凸規(guī)劃問題的求解有許多成熟的優(yōu)化算法,求解難度大大降低。由此本文提出一種基于兩步法確定模型解的混合量子粒子群算法,在每次迭代中使用量子粒子群算法求解0-1變量y(選擇最大的K個分量),將其代入近似模型求解降維后的子問題得到ω并將近似模型中的最優(yōu)目標(biāo)值作為y的評價指標(biāo),即子問題目標(biāo)函數(shù)越小,則對應(yīng)y值評價越高。
混合量子粒子群算法過程如下:
1.輸入
模型參數(shù)及數(shù)據(jù),QPSO算法粒子數(shù)m,最大迭代次數(shù)Max,迭代誤差ν;
2.初始
2.1 令k=0,初始化規(guī)模為m的粒子群X={X1,X2,…Xm},第i個粒子為
Xi(k)=[Xi,1(k),Xi,2(k),…,Xi,n(k)],Xi,1(0)~U(0,1),對X做后續(xù)方案1或2操作。
2.2 更新個體和全局最佳位置
Pi(k)=[Pi,1(k),Pi,2(k),…,Pi,n(k)],G(k)=Pg(k),g∈{1,2,…,m};
更新收縮擴(kuò)張系數(shù),ρ=1-k/(2×Max)
由以下過程,計算f(X(k))=f(P(k))=[f(X1(k)),f(X2(k)),…,f(Xm(k))];
3.QPSO算法迭代
3.1 調(diào)用QPSO算法
pi,j(k)=φj(k)·Pi,j(k)+[1-φj(k)]·
Gj(k),φj(k)~U(0,1)
Xi,j(k+1)=pi,j(k)±ρ·|Cj(k)-Xi,j(k)|·
ln(1/ui,j(k)),uij(k)~U(0,1);
3.2 更新k=k+1;
3.3 按照模型不同使用后續(xù)方案1或方案2,對X(k)進(jìn)行指標(biāo)選擇;
4.子問題求解
4.1 提取X(k)的非零指標(biāo)lX,使用CVX工具箱求解原問題降維后的m個子問題;將子問題的目標(biāo)函數(shù)值記為f(X(k))=[f(X1(k)),f(X2(k)),…,f(Xm(k))];
4.2 則對任意i∈{1,2,…,m},更新個體最優(yōu)位置,
令g=argmin1≤i≤m{f(Pi(k))},更新全局最優(yōu)位置,
5.終止條件
當(dāng)?shù)螖?shù)k≤Max且|f(G(k))-f(G(k-1))|≥ν,返回步3,否則轉(zhuǎn)步6;
6.輸出
粒子群全局最優(yōu)位置G(k),非零指標(biāo)lX,子問題最優(yōu)解和最優(yōu)值。
粒子群X每次更新后對應(yīng)一個實數(shù)矩陣,需要從每個粒子中提取K個位置,對應(yīng)選擇進(jìn)入配對組合的資產(chǎn)。由此在3.3提出針對模型(3)下的方案1,具體而言:對于粒子群X,從每個粒子n個維度中選擇最大的K個,將其數(shù)值令為正數(shù)aq,其余位置為0。對含有雙變量的模型(4),當(dāng)RA≠RB時引入ω∈RNA+NB可以將其改寫為單變量形式,方案1仍然適用。
當(dāng)RA=RB時,考慮到A和B的互異性,需要明確A和B各自包含資產(chǎn)的類別。因此,提出方案2:對于粒子群X,隨機(jī)選擇Ka∈{1,2,…,K},從每個粒子n個維度中最大的Ka個令為正數(shù)bq,最小的K-Ka令為負(fù)數(shù)cq。此時lX包含兩部分,正負(fù)指標(biāo)集分別指代組合A和B所包含資產(chǎn)。
基于國內(nèi)股票市場真實數(shù)據(jù),應(yīng)用提出的混合量子粒子群算法,檢驗QM-SSAM中主要參數(shù)對套利組合的影響;針對不同的交易場景,對指數(shù)的擬配對交易了實證檢驗,并根據(jù)不同的時間窗口驗證每種情境下的套利收益。對于M-SSAM模型,利用行業(yè)信息提供的天然的分組,研究同行業(yè)內(nèi)以及行業(yè)間的統(tǒng)計套利問題。
本文數(shù)據(jù)來自于國泰安金融數(shù)據(jù)庫,包括2012年1月4日至2020年3月26日,基于流通市值計算的Fama-French三因子數(shù)據(jù),以及上證50指數(shù)(000016),深證100指數(shù)(399330),滬深300指數(shù)(000300),中證500(000905)指數(shù)及成份股的日收盤價格數(shù)據(jù),下文稱為data1-data4,其中每個數(shù)據(jù)集包含2000條記錄。
Gatev應(yīng)用DM方法,將套利時期的價差序列的標(biāo)準(zhǔn)差視為開倉信號,并在價差恢復(fù)到零時平倉[10]。本文同樣采用非參數(shù)估計思路,由形成期內(nèi)計算的標(biāo)準(zhǔn)差,即買入投資組合的收益小于賣空投資組合收益的整數(shù)倍標(biāo)準(zhǔn)差時開倉買入;當(dāng)有效套利條件滿足時,套利者進(jìn)行平倉。為了保證套利條件的收斂,在統(tǒng)計套利收益機(jī)會時,只在交易期的前一半時間允許觸發(fā)套利機(jī)會,后面時間作為套利收斂的緩沖期。令單次套利的收斂時間為5天。 在混合粒子群算法中,令量子粒子群數(shù)量為10(data1,data2)或者50(data3,data4),最大迭代次數(shù)100,迭代誤差為1.0e-6,aq=bq=0.01,cq=-0.01。實驗中默認(rèn)參數(shù)設(shè)置,令稀疏度為20,資產(chǎn)下界[0,0,…,0]T,資產(chǎn)的上界為[0.5,0.5,…,0.5]T,顯著性ε為0.05,形成期和交易期長度分別為60天和40天。
考慮單因子(k=1)的CAPM模型和三因子(k=3)的Fama-French模型,將模型(2)的兩種轉(zhuǎn)換形式記為QM-SSAM-CAPM (QSC),以及QM-SSAM-FF3(QSF)。以60天為時間窗,對data1-data4進(jìn)行滾動實驗,其中每個數(shù)據(jù)集上計算32次。
表1 data1-data4下QSC和QSF比較
表1給出了兩類不同模型在不同指數(shù)下波動目標(biāo)的平均值(md),以及波動目標(biāo)為正數(shù)的概率(pd),可以發(fā)現(xiàn)QSF模型以超過90%的概率獲得正的波動目標(biāo),即滿足我們要求的套利條件,并且在上證、深證以及中證三個指數(shù)上都獲得了超過QSC模型的正的波動值。此外形成期和套利期的平均相關(guān)系數(shù)(mtr,mte)也都顯然大于QSC模型,意味著QSC模型求得的套利組合預(yù)期的均值回歸行為很可能不會在交易期內(nèi)出現(xiàn),加劇了配對交易的發(fā)散風(fēng)險。QSF模型形成期相關(guān)系數(shù)較高,這給套利者足夠的信心認(rèn)為模型發(fā)現(xiàn)的組合和指數(shù)的相關(guān)關(guān)系在套利期仍然會延續(xù),而套利期的最小系數(shù)為0.781 5也恰好印證這點。因此后續(xù)的分析中默認(rèn)使用QSF模型。同樣地,將模型(4)的兩種轉(zhuǎn)換形式記為M-SSAM-CAPM(MSC),以及M-SSAM-FF3(MSF),下文中默認(rèn)使用MSF模型求解。
QSF模型一項重要參數(shù)為風(fēng)險因子δ,圖1至圖3給出了對波動目標(biāo),以及不同參數(shù)下套利組合和指數(shù)間的相關(guān)性變化,每條曲線上的數(shù)據(jù)點均由data1~data4滾動實驗的平均值給出。
圖1 風(fēng)險因子對波動的影響圖
圖2 風(fēng)險因子對形成期相關(guān)系數(shù)的影響圖
圖3 風(fēng)險因子對套利期相關(guān)系數(shù)的影響圖
從套利的角度出發(fā),令波動目標(biāo)d>0,形成期和套利期內(nèi)組合和指數(shù)的相關(guān)系數(shù)均在0.7以上,得到了風(fēng)險因子的合適區(qū)間為[1.0e-1,1.0e+1]。
通過應(yīng)用上證50指數(shù)的數(shù)據(jù)(data1,2014/7/21-2014/12/16)研究不同稀疏度下擬配對交易的資產(chǎn)選擇。
圖4 稀疏資產(chǎn)選擇圖
圖4中稀疏度最小取2,最大取82(樣本內(nèi)去除停牌及ST股票)。為了簡化圖表,選擇權(quán)重大于0.05%的資產(chǎn),共計10只股票,縱坐標(biāo)給出了不同稀疏度下的資產(chǎn)選擇及對應(yīng)權(quán)重??梢园l(fā)現(xiàn)在稀疏度小于6時,資產(chǎn)的選擇呈現(xiàn)波動特征,說明稀疏約束對資產(chǎn)選擇影響較大。圖5描述了追蹤目標(biāo)、波動目標(biāo)及加權(quán)目標(biāo)隨著稀疏度的變化,結(jié)合圖5的結(jié)果,當(dāng)稀疏度大于10以后,資產(chǎn)組合的構(gòu)成趨于穩(wěn)定,這也為證明模型及混合量子粒子群算法的有效性提供了實證解釋。
圖5 稀疏度對目標(biāo)函數(shù)的影響圖
通過研究擬多元配對交易的套利收益,給定五個特殊的套利時段,即上升區(qū)間(up-up,2014/7/21-2014/12/16),上升下降區(qū)間(up-down,2015/3/11-2015/8/3),下降區(qū)間(down-down,2018/4/17-2018/9/7),下降上升區(qū)間(down-up,2015/11/1-2016/4/11),及市場震蕩區(qū)間(oscillation,2019/7/8-2019/12/3)。
表2給出了不同數(shù)據(jù)集下模型的年化凈收益(nt)和套利的成功率(sr),其中nt由re復(fù)利計算得到,sr為套利成功次數(shù)和開倉次數(shù)的比率??梢园l(fā)現(xiàn)QSF模型在多種市場情形下均獲得了正的套利收益,其中對于up-up和up-down的情況,均以概率1的條件獲得了正的收益;對于另外三種情形,最后的套利凈收益為正,但在套利期存在套利失敗的行為,其中最高的失敗可能性為20%。
表2 特殊時段下的套利收益比較
通過比較不同市場指數(shù)套利收益的均值和方差,可以發(fā)現(xiàn)深證100和滬深300的套利收益較為穩(wěn)定,而上證50和中證500的套利收益波動較大。滬深300指數(shù)的套利收益較高,深證100的收益區(qū)間較小。
將data3(2014/1/1-2015/5/14)中的股票按照中證行業(yè)分類標(biāo)準(zhǔn)分為十類,其中能源股26只、原材料股49只、工業(yè)股90只、可選消費股59只、主要消費股29只、醫(yī)藥衛(wèi)生股33只、金融地產(chǎn)股72只,信息技術(shù)股45只、電信業(yè)務(wù)股5只,公用事業(yè)股22只,分別記為行業(yè)1到行業(yè)10。本節(jié)研究同行業(yè)以及不同行業(yè)間的多元配對交易。令Data3前240天為形成期,順序的40天為交易期,其中行業(yè)內(nèi)套利行為,稀疏度設(shè)定為行業(yè)內(nèi)股票數(shù)量;行業(yè)間配對交易,稀疏度設(shè)定為20;其他參數(shù)統(tǒng)一設(shè)置為ε1=ε2=0.6,δ1=1.0e+1。
表3中“-”表示沒有獲得正收益,套利失敗。可以發(fā)現(xiàn)總體的套利成功率達(dá)到86%;行業(yè)內(nèi)的配對交易,即RA=RB,均獲得了正的年化收益;值得注意的是,行業(yè)7-金融地產(chǎn)出現(xiàn)失敗的概率最高,且出現(xiàn)損失的數(shù)額巨大,這和金融行業(yè)容易受到市場沖擊有著密切關(guān)系;信息行業(yè)和實業(yè)相對穩(wěn)健,行業(yè)1、3、5、9只出現(xiàn)了一次失敗的情形,行業(yè)8、10在該數(shù)據(jù)下全部成功。
表3 行業(yè)間多元配對交易年化收益統(tǒng)計
傳統(tǒng)配對交易主要研究兩資產(chǎn)套利關(guān)系,建模中主要應(yīng)用距離法、協(xié)整法和時間序列法等,并使用參數(shù)或者非參數(shù)估計方法確定開平倉及止損信號。本文聚焦于多資產(chǎn)的配對交易問題,利用稀疏優(yōu)化的思想,引入概率約束刻畫預(yù)期收益偏離的不確定性,建立了兩個帶有概率約束的稀疏優(yōu)化模型。值得注意的是,在QM-SSAM模型中,考慮到中國市場賣空限制加入單概率約束,只關(guān)注對指數(shù)的賣空操作,增強了實際應(yīng)用性。對于M-SSAM模型,由于資產(chǎn)組合事先完全未知,考慮融券賣空機(jī)制加入雙概率約束研究兩類套利機(jī)會更加貼近實際。
文中建立的QM-SSAM和M-SSAM模型是一類NP-hard問題。本文借助Xu提到的分布式魯棒方法,在預(yù)期收益可以由因子表達(dá)的前提下,利用因子的一階矩和二階矩信息近似初始概率模型。針對轉(zhuǎn)化后的約束稀疏優(yōu)化問題,根據(jù)量子粒子群理論構(gòu)建了一類混合量子粒子群算法,其中每一步子問題等于求解一個凸規(guī)劃問題。
實證部分應(yīng)用上證50,深證100,滬深300,中證500指數(shù)及成份股在2012年1月到2020年3月的歷史數(shù)據(jù)對模型及算法進(jìn)行了檢驗??梢园l(fā)現(xiàn)因子集合包含信息越多,對最后的結(jié)果越有利,文中給出擬配對交易的一組算例說明了在同樣情況下,使用三因子的近似模型會在交易期出現(xiàn)更多的套利機(jī)會。在敏感性分析中,擬多元配對交易模型對風(fēng)險因子較為敏感,隨著δ增加,目標(biāo)中預(yù)期偏離d顯著增大,由此帶來了更多套利可能,但也會加劇收益差的發(fā)散風(fēng)險,結(jié)果表明合理區(qū)間應(yīng)該在[1.0e-1,1.0e+1]。資產(chǎn)的稀疏配置說明了所提出的模型及算法可以獲得穩(wěn)定的稀疏套利組合。為了具體展示模型的泛化能力和適用性,給定了五種復(fù)雜的市場環(huán)境,指數(shù)的擬多元配對交易模型在data1到data4的結(jié)果表明可以獲得正的套利收益。綜合四種指數(shù),可以發(fā)現(xiàn)滬深300的收益性最高,風(fēng)險相對較低。最后,利用滬深300的指數(shù)及成分研究了行業(yè)間的多元配對交易問題,結(jié)果表明在多數(shù)行業(yè)間可以獲得正的套利收益。
綜上所述,本文提出的統(tǒng)計套利模型能夠自適應(yīng)地從資產(chǎn)池中選擇有限數(shù)目的股票用于構(gòu)造配對組合,并確定組合權(quán)重,對金融機(jī)構(gòu)和個人投資者都有著重要的應(yīng)用價值。在以后的研究中將嘗試運用動態(tài)規(guī)劃的思想,建立多階段的配對交易模型,引入交易費用等約束,使得模型更接近真實市場。