吳婉婷 朱燕 黃定江
摘 要:針對傳統(tǒng)投資組合策略的高頻資產(chǎn)配置調(diào)整產(chǎn)生高額交易成本從而導(dǎo)致最終收益不佳這一問題,提出基于機器學(xué)習(xí)與在線學(xué)習(xí)理論的半指數(shù)梯度投資組合(SEG)策略。該策略對投資期進行劃分,通過控制投資期內(nèi)的交易量來降低交易成本。首先,基于僅在每段分割的初始期調(diào)整投資組合而其余時間不進行交易這一投資方式來建立SEG策略模型,并結(jié)合收益損失構(gòu)造目標函數(shù);其次,利用因子圖算法求解投資組合迭代更新的閉式解,并證明該策略累積資產(chǎn)收益的損失上界,從理論上保證算法的收益性能。在紐約交易所等多個數(shù)據(jù)集上進行的仿真實驗表明,該策略在交易成本存在時仍然能夠保持較高的收益,證實了該策略對于交易成本的不敏感性。
關(guān)鍵詞:機器學(xué)習(xí);在線學(xué)習(xí);投資組合選擇;半指數(shù)梯度策略;因子圖
中圖分類號:?TP301.6
文獻標志碼:A
Semi-exponential gradient strategy and empirical analysis for online portfolio selection
WU Wanting1*, ZHU Yan1, HUANG Dingjiang2
1.School of Science, East China University of Science and Technology, Shanghai 200237, China ;
2.School of Data Science and Engineering, East China Normal University, Shanghai 200062, China
Abstract:?Since the high frequency asset allocation adjustment of traditional portfolio strategies in each investment period results in high transaction costs and poor final returns, a Semi-Exponential Gradient portfolio (SEG) strategy based on machine learning and online learning was proposed. Firstly, the SEG strategy model was established by adjusting the portfolio only in the initial period of each segmentation of the investment period and not trading in the rest of the time, then a objective function was constructed by combining income and loss. Secondly, the closed-form solution of the portfolio iterative updating was solved by using the factor graph algorithm, and the theorem and its proof of the upper bound on the cumulative loss of assets accumulated were given, guaranteeing the return performance of the strategy theoretically. The experiments were performed on several datasets such as the New York Stock Exchange. Experimental results show that the proposed strategy can still maintain a high return even with the existence of transaction costs, confirming the insensitivity of this strategy to transaction costs.
Key words:?machine learning; online learning; portfolio selection; semi-exponential gradient strategy; factor graph
0 引言
投資組合選擇即在不確定環(huán)境下作出決策,選擇最優(yōu)的資產(chǎn)組合進行投資,涉及傳統(tǒng)金融理論、量化金融[1-3]、機器學(xué)習(xí)[4-6]和人工智能[7-10]等多個領(lǐng)域。在線投資組合選擇[11-12]是指不考慮價格所遵循的任何模型,僅基于當(dāng)前信息,且對未來信息不作任何統(tǒng)計假設(shè)的前提下,通過設(shè)計合理的在線學(xué)習(xí)算法序貫地構(gòu)造投資組合的在線決策問題。經(jīng)典的投資組合策略大多建立在金融市場不存在交易成本這一假設(shè)下,而交易成本作為市場中的核心因素之一,幾乎存在于所有的金融貿(mào)易當(dāng)中,投資者面對交易成本時的投資策略也會有極大的不同,因此基于這一假設(shè)的策略在實際應(yīng)用中的效果往往并不可觀,而投資者如何在交易成本存在的情況下進行交易決策仍然是一個重要的問題。
為解決交易成本存在時的決策問題,本文基于傳統(tǒng)的指數(shù)梯度(Exponential Gradient, EG)策略,結(jié)合在線算法和競爭分析的思想,提出了半指數(shù)梯度(Semi-Exponential Gradient, SEG)策略,通過權(quán)衡交易所帶來的成本與所獲得的收益,對是否進行交易作出決策;其次,建立收益比例度量投資組合向量的累積損失程度,并在多個金融市場的數(shù)據(jù)集上進行了仿真實驗。
1 相關(guān)工作
投資組合選擇依據(jù)其遵循的根本原則,大致分為以Markowitz均值方差理論[13]為基礎(chǔ)的靜態(tài)情況研究與基于Kelly資本增長理論[14]的動態(tài)情況研究。后者關(guān)注多期或者序列投資組合選擇的在線決策方式與機器學(xué)習(xí)中的在線學(xué)習(xí)一致,因此基于在線學(xué)習(xí)的各種算法在投資組合選擇中得到了廣泛的研究。
盡管基于上述理論的投資組合選擇策略具有不同的適用條件與優(yōu)點,但多數(shù)沒有考慮交易成本的存在。近年來,一些在線投資組合的研究者試圖去解決交易成本[15-17]的問題?,F(xiàn)有的關(guān)注于交易成本的在線投資組合策略大致可以分為以下兩種類型:
1)在每個投資期都進行資產(chǎn)配置調(diào)整,即在每個投資期都對投資組合向量進行調(diào)整。該策略關(guān)于交易成本的處理主要分為兩種:
一種是通過在損失函數(shù)中增加交易損失項,利用范數(shù)正則項來度量交易量的大小,如在線懶惰更新 (Online Lazy Updates, OLU)[18],該策略通過優(yōu)化模型中參數(shù)的稀疏,采用懶惰更新來調(diào)整投資組合向量以控制交易成本。除此之外,還有一些策略采用成比例支付交易成本的方式,依據(jù)資產(chǎn)所占權(quán)重來支付交易成本,如泛化投資組合 (Universal Portfolio, UP)[19-20]。盡管這些算法在一些數(shù)據(jù)集上實現(xiàn)了較好的結(jié)果,但是它們在整個投資期內(nèi)的交易成本總量仍舊很高,這是由于此類策略在每個投資期都進行了資產(chǎn)配置的調(diào)整,而這并不總是必要的。
2)只在有限的投資期內(nèi)進行資產(chǎn)配置調(diào)整,即只在某些選定的時間節(jié)點進行資產(chǎn)配置調(diào)整,在制定交易策略時考慮交易成本的影響,控制交易次數(shù),依據(jù)預(yù)測的交易收益與交易成本對是否交易作出決策,從而有效控制策略的交易成本總量,如半常數(shù)再平衡投資組合(Semi-Constant Rebalanced Portfolios, SCRP)[21-23]、半泛化投資組合(Semi-Universal Portfolios, SUP)[24]。
本文提出的SEG策略采用動態(tài)的投資組合向量更新規(guī)則,與在交易期內(nèi)采用固定不變的向量進行投資的SCRP策略相比,能夠獲得更高的收益,且更加符合變化的金融市場;此外,SEG策略利用指數(shù)函數(shù)進行投資組合向量更新,解決了SUP策略中由于存在積分計算而導(dǎo)致求解困難的問題。
2 半指數(shù)梯度策略問題描述
2.1 基本定義
考慮金融市場中一個具有m類資產(chǎn)、n個交易期的投資任務(wù)。第t個交易期各類資產(chǎn)的價格表示為 p t=(p1t, p2t, …, pmt)∈ R m+, pit代表第i類資產(chǎn)的收盤價格, R m+為m維正實數(shù)向量構(gòu)成的特殊集合。資產(chǎn)價格的變動由相對價格向量 X t=(x1t,x2t,…,xmt)∈ R m+表示,其中xjt=pjt/pjt-1表示第j類資產(chǎn)在第t個交易期的收盤價格與第t-1個交易期的收盤價格的比值。記n個交易期的相對價格序列為 X n=[ X 1, X 2,…, X n]。
第t個交易期初,依據(jù)投資組合向量 b t=(b1t, b2t,…, bmt)∈ R m+在m類資產(chǎn)中分散全部的資本,bjt表示第j類資產(chǎn)的投資比例。本文假設(shè)投資組合滿足 b t∈Δm, Δm= { ?b t: bjt≥0, ∑ m j=1 bjt=1 } ,即投資任務(wù)為自籌資金,且沒有保證金以及賣空的情況出現(xiàn)。記n個交易期的投資組合向量為 B n=[ b 1, b 2,…, b n]。
第t個交易期內(nèi),投資組合 b t的收益增長了st倍,增長比率st= b t· X t=∑ m j=1 bjtxjt。在不考慮交易成本存在的情況下,n個交易期后,投資組合策略 B n得到的累積收益Sn相比初始資產(chǎn)的增長比例為∏ n t=1? b t· X t,即Sn( X n)=S0∏ n t=1? b t· X t,其中S0表示初始資產(chǎn)。
投資者的目標是設(shè)計投資策略 B n以最大化累積收益Sn,通常依據(jù)價格的歷史信息,序貫地進行投資決策。具體來說,在第t個交易期,投資者依據(jù)此前的歷史相對價格向量,決策一個新的投資組合向量 b t,并基于此產(chǎn)生該交易期內(nèi)的收益st,重復(fù)該過程直至交易期結(jié)束,依據(jù)最終的累積收益對策略進行評判。
2.2 交易成本
設(shè)交易成本比率為c(0≤c≤1),即每交易一單位資產(chǎn)的凈收益為1-c。第t個交易期結(jié)束時第i類資產(chǎn)的交易成本Cit=stc | ?it-bit+1 | ,其中 it= bitxit? b t· X t 表示第t個交易期結(jié)束、(t+1)個交易期未開始時第i類資產(chǎn)的比例,?? t=[ 1t, 2t,…, mt]為該時刻對應(yīng)的投資組合向量, b t+1=[b1t+1,b2t+1,…,bmt+1]為第(t+1)個交易期初的投資組合向量。故第t個交易期結(jié)束時的交易成本為Costt= C t· e ,其中 C t=[C1t,C2t,…,Cmt],? e =[1,1,…,1],則該交易期內(nèi)的凈收益為sct=st-Costt。n個交易期后投資組合策略 B n在有交易成本情況下的累積凈收益為Scn( X n)=S0∏ n t=1 sct。
2.3 EG策略
在給出本文的SEG策略之前,先對EG策略[25]進行簡要的介紹。EG策略的核心思想是追蹤前一交易期表現(xiàn)好的投資組合,并通過一個正則項來保持之前投資組合的信息。EG考慮如下優(yōu)化問題:
b t+1=arg maxηlog( b · X t)-R ( b , b t)
其中:R( b , b t)表示正則項;η>0表示學(xué)習(xí)率。第一項的目的是最大化對數(shù)資產(chǎn)收益;
第二項為正則項,趨向于使投資組合向量 b t+1接近于 b t。學(xué)習(xí)率η控制這兩者的相對重要性。
EG策略采用相對熵作為正則項,投資組合向量的更新法則為:
bit+1= 1 Zt? bitexp ?ηxit? b t· X t
其中Zt=∑ m i=1 bitexp ?ηxit? b t· X t? 是一個標準化,保證 b t+1∈Δm。
3 半指數(shù)梯度策略
3.1 策略思想
在介紹SEG策略模型之前,先通過一個虛擬市場的實例來闡述策略的核心思想以及優(yōu)勢。假設(shè)當(dāng)前的金融投資市場由兩只股票組成,考慮其中連續(xù)的5個投資期。在該投資期內(nèi),兩只股票的相對價格向量分別為[3,3,3,1/3,1/3]和[2/3,2/3,2/3,3/2,3/2],交易成本比率c=0.05,初始投資策略 b 0=[1/2,1/2],初始投資金額S0=1。EG策略在每個投資期都會進行資產(chǎn)配置調(diào)整,而SEG策略會對交易成本與交易當(dāng)期所能獲得的收益進行權(quán)衡,當(dāng)交易成本大于收益時避免交易,反之則利用EG策略進行投資組合調(diào)整。這便是離線SUP策略的思想。表1給出了利用Matlab模擬后各個投資期內(nèi)的交易成本與凈收益。
從表1可以觀察到,SEG策略通過避免不必要的交易,能夠獲得更高的累積資產(chǎn)收益。當(dāng)然該計算結(jié)果是在已知完整的市場價格序列情況下求解的離線最優(yōu)值。盡管這是一種能夠“預(yù)知未來”的理想情況,但仍然能夠基于競爭性算法的思想完成在線SEG策略的建模,并結(jié)合因子圖算法對其進行求解,下面將對此作更為詳盡的介紹。
3.2 SEG策略模型建立
本節(jié)給出SEG策略的競爭性算法,該算法基于歷史信息來選擇進行交易的時間節(jié)點,當(dāng)交易成本大于投資收益時不進行交易,即只在有限多個投資期內(nèi)進行投資組合調(diào)整。
首先,考慮將整個投資期劃分為k+1個不同的時間段,只在每個時間段的初始進行一次交易,分割區(qū)間內(nèi)的其余時期均不進行交易。將劃分的k+1個時間段序列和每個時間段初始的投資策略稱為k分割。假設(shè)存在一個特定的k(0≤k { X t0,…, X t1-1},{ X t1,…, X t2-1},…,{ X tk,…, X n} SEG策略只在時間節(jié)點(t1,t2,…,tk)處利用EG策略進行投資組合調(diào)整,得到 b ti(i=1,2,…,k),其余時間點不進行交易。特別地令t0=1,tk+1=n+1,初始投資組合向量 b t0=(1/m,1/m,…,1/m)。 SEG策略第i個時間段的最后一個交易期為ti-1,它在此時間段的累積資產(chǎn)收益為:sti-1=∏ ti-1 t=ti-1 ?b ti· X t(i=1,2,…,k),其中ti點處的投資組合策略 b ti利用下式進行計算: bjti= 1 Zti-1 ?bjti-1exp ?ηxjti-1? b ti-1· X ti-1 其中:Zti-1=∑ m j=1 bjti-1exp ?ηxjti-1? b ti-1· X ti-1 ?為一個標準化;bjti-1= bjti-1∏ ti-1 t=ti-1 xjt? b ti-1· (ti-1 t=ti-1 ?X t ) ?是第ti-1個交易期第j類資產(chǎn)的權(quán)重;表示逐元素相乘。 設(shè)第i個時間段的交易成本為Costti-1,則該時間段內(nèi)的凈收益為scti-1=sti-1-Costti-1, n個交易期后的總凈收益: Sc( X n | ?B k,Tk,n)=∏ k i=0 ?[( ∏ ti+1-1 t=ti? b ti· X t ) -Costti+1-1 ] 它是在路徑Tk,n和投資組合 B k=[ b t1, b t2,…, b tk]條件下的總收益。 為了確定最佳策略,在這個競爭類算法中考慮全部的路徑與投資組合,其中包括基于事先觀測整個相對價格序列而選擇的使得累積資產(chǎn)收益最大的最優(yōu)路徑T*k*,n,即Sc( X n | ?B *k,Tk*,n*)=sup Tk,n ?Sc( X n | ?B k,Tk,n)。本文的優(yōu)化目標即為在此分割框架之下構(gòu)造序列投資組合,使得其累積收益盡可能大,即盡可能地接近最優(yōu)路徑下所實現(xiàn)的收益sup Tk,n ?Sc( X n | ?B k,Tk,n);從另一個角度來看即為序列地構(gòu)造投資組合 B??? ^?? n=(?? 1,?? 2,…,?? n),使得最優(yōu)路徑下的收益與該投資組合收益之間的比值盡可能地小。 因此,優(yōu)化目標為最小化兩者的投資收益比率: Rc B k=sup ?X n? sup Tk,n ?Sc( X n | ?B k,Tk,n) S?? ^?? c( X n | ?B??? ^?? n) 其中,S?? ^?? c( X n | ?B??? ^?? n)= ∏ n t=1 ( b??? ^?? t· X t-Costt)是 b??? ^?? t所實現(xiàn)的累積資產(chǎn)收益。這里 b??? ^?? t是嚴格的序列投資組合,即 b??? ^?? t是 X 1, X 2,…, X t-1的一個函數(shù),它并不取決于未來的相對價格向量。在下文中還將證明, b??? ^?? t不依賴于Tk,n,k,n的先驗知識,即對于任何的Tk,n都可以構(gòu)造一個序列投資組合 B??? ^?? n=( b??? ^?? 1, b??? ^?? 2,…, b??? ^?? n),使得其累積資產(chǎn)收益盡可能地接近最優(yōu)分割下得到的收益。 對投資收益比率Rc B k取對數(shù)得到: Loss=log Sc( X n | ?B k,Tk,n)-log S?? ^?? c( X n | ?B??? ^?? n) 則優(yōu)化目標改寫為在所有的分割中得到使SEG策略累積資產(chǎn)收益損失最小的序列投資組合。損失定義為SEG策略的對數(shù)收益與序列投資組合對數(shù)收益之間的差值。下面對SEG策略進行求解,給出算法的偽代碼,并證明對于一個給定的SEG策略 b ti(i=1,2,…,k),算法的損失為O(klog(n))。 3.3 投資組合序列更新算法 下面考慮如何求解序列投資組合 b??? ^?? t。由于3.2節(jié)定義的SEG策略對于給定的n和k存在Ckn-1個可能的交易路徑Tk,n,然而在不知道關(guān)于未來價格信息的情況下,無法確定最優(yōu)的參數(shù)k。若依次執(zhí)行這2n-1個不同的交易路徑,最后在所有交易路徑中找到最佳的那一個路徑,算法的復(fù)雜度將會很高。因此考慮利用因子圖算法[26-27]進行求解,因子圖是在線學(xué)習(xí)中的一個經(jīng)典算法,它根據(jù)資產(chǎn)的不同狀態(tài)進行劃分,并將資產(chǎn)之間的迭代關(guān)系以遞推關(guān)系圖的形式描述出來,其中,每一條路徑相當(dāng)于是一個專家意見,對這些專家意見采用K-T權(quán)重的集成作為最終結(jié)果的一個近似估計。 由于S?? ^?? c( X n | ?B??? ^?? n)=∏ n t=1? S?? ^?? c( X t | ?B??? ^?? t) S?? ^?? c( X t-1 | ?B??? ^?? t-1) =∏ n t=1 ?b??? ^?? t· X t,故為了求解序列投資組合 b??? ^?? t,先計算比例式 : S?? ^?? c( X t | ?B??? ^?? t) S?? ^?? c( X t-1 | ?B??? ^?? t-1) 。 利用因子圖進行求解的過程如下,如圖1所示,在時刻t將所有可能的路徑Tk,t(k=1,2,…,t-1)看成t交叉集。標記資產(chǎn)最后一次交易的時間狀態(tài)為vt,最后交易時間點相同的資產(chǎn)具有相同的狀態(tài),則對于給定的t,資產(chǎn)最多有t個狀態(tài)vt=1,2,…,t。 定義t時刻狀態(tài)vt下第j類資產(chǎn)的收益為S?? ^?? ct( X t,vt, j)(j=1,2,…,m),則該時刻下所有狀態(tài)對應(yīng)的資產(chǎn)收益之和為總體累積收益。因子圖中的每一個方格即表示某一狀態(tài)vt對應(yīng)的資產(chǎn)S?? ^?? ct( X t,vt, j)(j=1,2,…,m)。由圖1可知,從某一狀態(tài)開始繼續(xù)形成新的路徑僅有兩種轉(zhuǎn)換:橫向的路徑表示上一時刻和該時刻處于同一分割,即沒有進行交易;傾斜的路徑則表示處于不同分割,即發(fā)生了交易。 沒有交易發(fā)生時,在t-1時刻以狀態(tài)vt-1=v結(jié)束的所有路徑,在時刻t仍以該狀態(tài)vt=v結(jié)束。狀態(tài)vt-1=v(v=1,2,…,t-1, j=1,2,…,m)所對應(yīng)的資產(chǎn)收益S?? ^?? ct( X t,v, j)即為S?? ^?? ct-1( X t-1,v, j)乘以相對價格xjt以及狀態(tài)轉(zhuǎn)化概率Pkt(vt=v | vt-1=v)。累積資產(chǎn)收益為: S?? ^?? ct( X t,v, j)= Pkt(vt=v | vt-1=v)S?? ^?? ct-1( X t-1,v, j)xjt (1) 如果在時刻t發(fā)生了交易,即開始了一個新的分割vt=t。由于從t-1時刻的狀態(tài)vt-1=1,…,t-1產(chǎn)生t時刻的新狀態(tài)vt=t存在t-1個可能的交易路徑,即圖1中每條傾斜向上的路徑,且每條路徑上均發(fā)生了投資組合向量調(diào)整,此時S?? ^?? ct( X t,t, j)的計算公式為: S??? ^?? ct( X t,t, j)= ∑ t-1 v=1 ?( ∑ m r=1 S?? ^?? ct-1( X t-1,v,r) ) Pkt(vt=t | vt-1=v)bjtxjt (2) 將全部狀態(tài)的結(jié)果相加得到該時刻下的總體累積收益: S?? ^?? c( X t | ?B??? ^?? t)=∑ Tk,t P(Tk,t)S?? ^?? c( X t | ?B??? ^?? t,Tk,t)= ∑ t v=1 ∑ m j=1 S?? ^?? c( X t,v, j)= ∑ t v=1 ∑ m j=1 S?? ^?? ct-1( X t-1,v, j)(Pkt(vt=v | vt-1=v) e j+ Pkt(vt=t | vt-1=v) b t)· X t 其中 e j=[0,0,…,0,1,0,…,0]。因此可知: S?? ^?? c( X t | ?B??? ^?? t) S?? ^?? c( X t-1 | ?B??? ^?? t-1) = ∑ t v=1 ∑ m j=1 S?? ^?? ct( X t,v, j) ∑ t-1 v=1 ∑ m r=1 S?? ^?? ct-1( X t-1,v,r) = ∑ t-1 v=1 ∑ m j=1 σct-1(v, j)(Pkt(vt=v | vt-1=v) e j+ Pkt(vt=t | vt-1=v) b t)· X t 其中: σct-1(v, j)= S?? ^?? ct-1( X t-1,v, j) ∑ t-1 v=1 ∑ m r=1 S?? ^?? ct-1( X t-1,v,r) 因此: b??? ^?? t= ∑ t-1 v=1 ∑ m j=1 σct-1(v, j)(Pkt(vt=v | vt-1=v) e j+ Pkt(vt=t | vt-1=v) b t) (3) 其中 b t表示EG策略,算法在每個時刻t的復(fù)雜度為O(tm)。 SEG策略如算法1所示。 算法1 SEG策略。 輸入 相對價格向量 X n; 輸出 序列投資組合 b??? ^?? t。 程序前 1) 初始化: b 1=(1/m,1/m,…,1/m),S?? ^?? c0(0,0,:)= b 1 2) fo r t=1 to N 3) 計算該交易期內(nèi)資產(chǎn)收益: ??t· X t 4) fo r v=1 to t-1 5) fo r j=1 to m 6) 式(1)計算沒有交易發(fā)生的資產(chǎn)收益: S?? ^?? ct( X t,v, j) 7) fo r v=1 to t-1 8) fo r j=1 to m 9) 式(2)計算發(fā)生交易的資產(chǎn)收益: S?? ^?? ct( X t,t, j) 10) 式(3)更新序列投資組合向量: ??t 程序后 3.4 SEG策略收益理論保證: 下面給出該策略收益性能的理論保證,即證明對于一個給定的SEG策略 b t(i=1,2,…,k)來說,算法的損失為O(klog(n))。 定理1? 令{ X t}是相對價格向量的任意序列,且滿足xit≥r>0,對于任何的ε>0,交易成本比率c、時間t以及SEG策略投資組合 b t∈Δm,都可以構(gòu)造一個序列投資組合 b??? ^?? t,它在每個交易期內(nèi)關(guān)于t為線性復(fù)雜度,且使得SEG策略的損失上界: Loss=log Sc( X n | ?B k, T*k,n)-logS?? ^?? c( X n | ?B??? ^?? n) 滿足不等式: Loss n ≤ (k+1)? log m 2nr2? +(k+ε) log n n + 1 n? log(1+ε)+k log 1 ε 證明 首先,定義交易路徑Tk,n被選擇的概率P(Tk,n)服從K-T權(quán)重分布,即P(Tk,n)≥0, ∑ n-1 k=0 ∑ Tk,n P(Tk,n)=1。由貝葉斯公式可知: S?? ^?? c( X n | ??B??? ^?? n)=∑ n-1 k=0 ∑ Tk,n P(Tk,n)Sc( X n | ?B??? ^?? n, Tk,n) 則對于最優(yōu)路徑T*k,n,成立不等式: log Sc( X n | ?B??? ^?? n)≥log P(T*k,n)+log Sc( X n | ?B ???^?? n, T*k,n) 其中對于K-T權(quán)重成立不等式: -log P(T*k,n)≤?? (k+ε)log(n)+ log(1+ε)+k log 1 ε 依據(jù)文獻[25]中敘述的定理1推知SEG策略每一段交易期內(nèi)的投資組合累積收益滿足不等式: log ( ∏ ti-1 t=ti-1 ??ct ) ≥ log ( ∏ ti-1 t=ti-1 ?sct ) -? tilog m 2r2 其中sct= b t· X t-Costt, ct= b??? ^?? t· X t-Costt分別為SEG策略的投資組合 b t與構(gòu)造的序列投資組合 b??? ^?? t在第i段分割期內(nèi)的凈收益??紤]上述不等式到k+1段分割中,由于: Sc( X n | ?B k,Tk,n)=∏ k+1 i=1 ∏ ti-1 t=ti-1 sct S?? ^?? c( X n | ?B??? ^?? n,Tk,n)= ∏ k+1 i=1 ∏ ti-1 t=ti-1 ?ct 特別地,對于最優(yōu)路徑T*k,n成立: logS?? ^?? c( X n | ?B??? ^?? n,T*k,n)≥ log Sc( X n | ?B k,T*k,n)-∑ k+1 i=1?? ti log m 2r2 則有: logS?? ^?? c( X n | ?B??? ^?? n)≥log P(T*k,n)+?? log Sc( X n | ?B k,T*k,n)-∑ k+1 i=1?? ti log m 2r2 由于ti≤n,i=1,…,k+1,因此,損失上界滿足不等式: Loss n ≤ (k+1)? log m 2nr2? +(k+ε) log n n + 1 n? log(1+ε)+k log 1 ε 4 實驗結(jié)果與分析 本章通過SEG策略與現(xiàn)有的5個同屬于追蹤高收益策略類的算法進行比較,分別為常數(shù)再平衡投資組合(Constant Rebalanced Portfolios, CRP)策略、半常數(shù)再平衡投資組合(SCRP)策略、泛化投資組合(UP)策略、半泛化投資組合(SUP)策略與指數(shù)梯度投資組合(EG)策略。通過在兩個經(jīng)典數(shù)據(jù)集上的對比實驗,來說明SEG策略的優(yōu)越性。 4.1 度量標準 累積資產(chǎn)收益:整個交易期內(nèi)由策略所實現(xiàn)的總收益,是度量一個策略表現(xiàn)的重要指標之一。累積資產(chǎn)收益越高,說明該策略越優(yōu)。 無交易成本下的標準計算式如下: Sn( X n)=S0∏ n t=1? b t· X t 交易成本下的標準計算式如下: Scn( X n)=S0∏ n t=1 ( b t· X t-Costt) 其中 b t是各策略采用的投資組合向量,依據(jù)上式計算得到各策略最終累計資產(chǎn)收益。各變量數(shù)學(xué)含義上文已作詳細介紹,在此處不再加以贅述。 4.2 實驗數(shù)據(jù)集 實驗中采用的數(shù)據(jù)集分別為NYSE(O)和DJIA。NYSE(O)數(shù)據(jù)集為紐約交易所自1962年7月3日至1984年12月31日,22年間包含的36只股票的歷史數(shù)據(jù)集,在此數(shù)據(jù)集上以每兩天為一個交易期進行實驗;DJIA數(shù)據(jù)集為2001年1月1日至2003年1月14日,包含30只股票的歷史數(shù)據(jù)集,在此數(shù)據(jù)集以每1天為一個交易期進行實驗。 4.3 結(jié)果分析 4.3.1 累積收益 表2、3是在不同交易成本比率c值下的累積收益結(jié)果。其中: 表2為從NYSE(O)數(shù)據(jù)集中隨機選取3只股票,初始投資金額設(shè)置為1,以每兩天為一個交易期進行50次獨立實驗的結(jié)果; 表3為從DJIA數(shù)據(jù)集中隨機選取3只股票,為突出對比數(shù)據(jù)變化,初始投資金額設(shè)置為10,以每一天為一個交易期進行50次獨立實驗的結(jié)果。 從表2、3可以看出,同其他5種策略相比,SEG策略在不同的交易成本比例下都獲得了最大的累積資產(chǎn)收益;而且當(dāng)交易成本比率增大時,SEG策略的累積資產(chǎn)收益并沒有明顯下降。在表3中DJIA數(shù)據(jù)集上的實驗結(jié)果可以看到,隨著交易成本比率的增大,SEG策略累計資產(chǎn)收益在小數(shù)點后第4位開始才略有降低,說明與其他策略相比,SEG策略的累積收益受交易成本影響的下降幅度最小。 4.3.2 交易成本分析 圖2、3分別為SCRP、CRP、EG和SEG四種策略的累積資產(chǎn)收益隨交易成本比率值的變化趨勢,以及在不同交易成本下,累積資產(chǎn)收益隨時間的變化趨勢。 圖2直觀地展示了CRP、SCRP、EG、SEG四種策略受交易成本影響的程度。可以觀察到四種策略的累積收益隨著交易成本比率的增大而減小,但SEG策略的累積收益曲線始終位于其他三種策略之上,且SEG策略對交易成本敏感度較低,累積收益曲線隨著交易成本變化的波動并不明顯,而CRP策略與EG策略受交易成本比率影響較大,當(dāng)交易成本增大時收益急劇下降。因此,可以說明,在相同交易成本比率下,SEG策略能夠獲得最高的累積收益;此外,當(dāng)交易成本增大時,SEG策略仍然能夠維持較高的累積收益。 [12]?HOI S C H, SAHOO D, LU J, et al. Online learning: a comprehensive survey [J]. arXiv E-print, 2018: arXiv:1802.02871.?ACM Computer Surveys, 2018: 1-100. [13]??MARKOWITZ H. Portfolio selection [J]. Journal of Finance, ?1952, 7(1): 77-91. [14]??KELLY J L Jr. A new interpretation of information rate [J]. IRE Transactions on Information Theory, 1956, 2(3): 185-189. [15]?GYRFI L, VAJDA I. Growth optimal investment with transaction costs [C]// Proceedings of the 2008 International Conference on Algorithmic Learning Theory, LNCS 5254. Berlin: Springer, 2008: 108-122. [16]?KOZAT S S, SINGER A C. Universal switching portfolios under transaction costs [C]// Proceedings of the 2008 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway, NJ: IEEE, 2008: 5404-5407. [17]?BEAN A J, SINGER A C. Universal switching and side information portfolios under transaction costs using factor graphs [C]// Proceedings of the 2010 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway, NJ: IEEE, 2010: 1986-1989.?[J]. IEEE Journal of Selected Topics in Signal Processing, 2012:6(4):351-365. [18]?DAS P, JOHNSON N, BANERJEE A. Online lazy updates for portfolio selection with transaction costs [C]// Proceedings of the 27th AAAI Conference on Artificial Intelligence. Pola Alto, CA: AAAI Press, 2013: 202-208. [19]?COVER T M. Universal portfolios [J]. Mathematical Finance, 1991, 1(1): 1-29. [20]?COVER T M, ORDENTLICH E. Universal portfolios with side information [J]. IEEE Transactions on Information Theory, 1996, 42(2): 348-363. [21]?KOZAT S S, SINGER A C. Universal constant rebalanced portfolios with switching [C]// Proceedings of the 2007 IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway, NJ: IEEE, 2007: Ⅲ-1129-Ⅲ-1132. [22]?FAGIUOLI, E, STELLA F, VENTURA A. Constant rebalanced portfolios and side-information [J]. Quantitative Finance, 2007, 7(2): 161-173. [23]?KOZAT S S, SINGER A C. Universal SemiConstant rebalanced portfolios [J]. Mathematical Finance, 2011, 21(2):293-311. [24]?HUANG D, ZHU Y, LI B, et al. Semi-universal portfolio with transaction costs [C]// Proceedings of the 24th International Joint Conference on Artificial Intelligence. Pola Alto, CA: AAAI Press, 2015: 178-184. [25]?HELMBOLD D P, SCHAPIRE R E, SINGER Y, et al. On-line portfolio selection using multiplicative updates [J]. Mathematical Finance, 1998, 8(4): 325-347. [26]?KOSKI T, NOBLE J M. Factor graphs and the sum product algorithm [M/OL]// Bayesian Networks: An Introduction. Wiley Online Library, 2009 [2018-12-06]. https://onlinelibrary.wiley.com/doi/abs/10.1002/9780470684023.ch11.https://doi.org/10.1002/9780470684023.ch11 [27]?BEAN A J, SINGER A C. Factor graph switching portfolios under transaction costs [C]// Processing of the 2011 IEEE International Conference on Acoustics, Speech and Signal. Piscataway, NJ: IEEE, 2011: 5748-5751.