劉麗萍
(貴州財(cái)經(jīng)大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,貴陽(yáng) 550025)
哈里·馬科維茨在1952年提出的均值—方差投資組合模型是最為常用的投資組合模型,是現(xiàn)代投資組合理論的基礎(chǔ),該投資組合模型一經(jīng)提出便得到了廣泛的應(yīng)用。但是,該模型依賴資產(chǎn)間的協(xié)方差陣,當(dāng)資產(chǎn)的維度較高尤其資產(chǎn)的維度大于樣本容量時(shí),協(xié)方差陣的估計(jì)將面臨維數(shù)詛咒等問(wèn)題,協(xié)方差陣的估計(jì)效果較差,從而影響到組合效果。為了解決協(xié)方差陣估計(jì)所面臨的維數(shù)詛咒問(wèn)題,有學(xué)者提出了一些方法來(lái)估計(jì)大維金融資產(chǎn)的協(xié)方差陣。Cai和Zhou(2012),Cai和Liu(2011)等將門限方法應(yīng)用到高維協(xié)方差陣的估計(jì)中,將一些元素壓縮為0來(lái)解決維數(shù)詛咒問(wèn)題[1~2];Fan和Lv(2008)以及Fan和Liao等(2011)將因子分析法應(yīng)用到大維協(xié)方差陣的估計(jì)中,通過(guò)提取少數(shù)共同的因子來(lái)解決維數(shù)詛咒問(wèn)題[3~4];Fan和Liao等(2013)將主成分分析法應(yīng)用到協(xié)方差陣的估計(jì)中[5];Li和 Wang等(2007)將 Cholesky分解法和Lasso方法應(yīng)用到協(xié)方差陣的估計(jì)中,來(lái)提高大維協(xié)方差陣的估計(jì)效率[6];劉麗萍和馬丹等(2015)通過(guò)在DCC模型中引入主成分正交補(bǔ)門限方法,來(lái)估計(jì)高維數(shù)據(jù)的動(dòng)態(tài)條件協(xié)方差陣[7]。這些方法都是單純地從協(xié)方差陣估計(jì)的角度出發(fā),來(lái)解決維數(shù)詛咒問(wèn)題。
另有一些學(xué)者考慮通過(guò)重采樣的方法來(lái)解決協(xié)方差陣估計(jì)的維數(shù)詛咒問(wèn)題,提高投資組合的效率。Michaud(1989)提出,對(duì)資產(chǎn)進(jìn)行抽樣,采用樣本協(xié)方差陣估計(jì)方法來(lái)估計(jì)每次抽取的資產(chǎn)的協(xié)方差陣,然后根據(jù)均值—方差模型來(lái)估計(jì)該樣本資產(chǎn)的權(quán)重,企圖獲得一個(gè)比較穩(wěn)定的資產(chǎn)分配權(quán)重向量[8]。但是,Markowitz和Usmen(2003)以及Wolf(2013)認(rèn)為Michaud的研究是不穩(wěn)定的,并沒(méi)有很好地提高資產(chǎn)組合的效率[9~10]。為此,F(xiàn)an和Han等(2016)又提出將循環(huán)分塊bootstrap方法應(yīng)用到投資組合風(fēng)險(xiǎn)的估計(jì)中,來(lái)提高組合的效率[11]。
本文在前人研究的基礎(chǔ)之上,考慮將子集重采樣方法應(yīng)用到均值—方差投資組合模型中,我們根據(jù)Ding和Engle(2001)提出的標(biāo)量BEKK模型來(lái)估計(jì)每次抽取的子集的協(xié)方差陣[12],而不是全部資產(chǎn)的協(xié)方差陣,所以說(shuō)一定程度上解決了協(xié)方差陣估計(jì)所面臨的維數(shù)詛咒問(wèn)題,提高了協(xié)方差的估計(jì)效率。
協(xié)方差陣在投資組合中扮演著重要角色,一般而言,協(xié)方差陣的估計(jì)越精確,組合的分配越合理。我們以常見(jiàn)的均值—方差投資組合來(lái)說(shuō)明這一問(wèn)題。均值—方差投資組合的形式為:
其中,∑ij表示資產(chǎn)間的協(xié)方差陣,wi表示投資于第i個(gè)資產(chǎn)的權(quán)重??梢?jiàn),投資者購(gòu)買不同資產(chǎn)的比例或者說(shuō)權(quán)重的分配是依賴于資產(chǎn)間的協(xié)方差陣∑ij的。在大維數(shù)據(jù)背景下,如何估計(jì)資產(chǎn)間的協(xié)方差陣,是構(gòu)造投資組合所要解決的關(guān)鍵問(wèn)題。
近年來(lái),隨著信息技術(shù)的發(fā)展,很多企業(yè)和金融機(jī)構(gòu)所考慮的資產(chǎn)維度往往較高,甚至超過(guò)了其樣本容量,此時(shí),高維資產(chǎn)間的樣本協(xié)方差陣不再是總體協(xié)方差陣的一致估計(jì)量。根據(jù)劉麗萍(2016)的研究[13],我們通過(guò)一個(gè)簡(jiǎn)單的模擬來(lái)說(shuō)明這一問(wèn)題:假定向量X是從d維的復(fù)雜高斯分布中隨機(jī)抽取的 n個(gè)點(diǎn),即 X~N(0,∑),∑是總體協(xié)方差陣,∑=Id,Id是d×d的單位矩陣。假定資產(chǎn)的維度d和樣本容量n的關(guān)系為:d/n=2,d/n=1,d/n=0.2 和 d/n=0.1。當(dāng)d=1 000 時(shí),下圖給出了總體協(xié)方差陣的真實(shí)特征值以及樣本協(xié)方差陣的特征值。
樣本協(xié)方差陣S(曲線)和總體協(xié)方差陣(虛線)的有序特征值圖
從上圖可知,較樣本容量n,資產(chǎn)維度d越大,估計(jì)的樣本協(xié)方差陣的特征值偏離真實(shí)的特征值(虛線)越遠(yuǎn),樣本協(xié)方差陣的估計(jì)效果越差。實(shí)際上,當(dāng)我們考慮的資產(chǎn)維度較高時(shí),即便選擇的樣本容量較大,樣本協(xié)方差陣的估計(jì)效果仍不理想。
Ding 和 Engle(2001)提出了標(biāo)量 BEKK 模型[12],該模型是常見(jiàn)的協(xié)方差陣估計(jì)和預(yù)測(cè)模型,較傳統(tǒng)的BEKK模型而言,該模型易于估計(jì),因而被廣泛應(yīng)用。假定資產(chǎn)的維度為k,收益率向量為rt。標(biāo)量BEKK模型的形式為:
其中,向量ut代表收益率的均值,向量εt代表收益率的殘差,It-1代表t-1期的信息集,α、β是標(biāo)量參數(shù),矩陣∑t為k×k的協(xié)方差陣,C為k×k的下三角矩陣。將式(4)兩邊同時(shí)取期望,得:
BEKK是常用的用以估計(jì)和預(yù)測(cè)投資組合協(xié)方差陣的模型。但是當(dāng)我們考慮的資產(chǎn)維度較高時(shí),根據(jù)前文的研究知其估計(jì)效果并不理想。為了提高協(xié)方差陣的估計(jì)和預(yù)測(cè)效率,我們考慮將子集重采樣方法應(yīng)用協(xié)方差陣的估計(jì)中,來(lái)提高組合效率?;谧蛹爻闃拥耐顿Y組合的思想為:
其一,假定我們考慮的資產(chǎn)維度為n,子集重抽樣的思想為:從n個(gè)資產(chǎn)中隨機(jī)抽取b個(gè)資產(chǎn),b是n的子集,b<n。重復(fù)該過(guò)程s次,便可以得到s個(gè)子集。將子集記為Ij,則對(duì)于任意的j=1,…,s,子集的容量。將在第j次抽樣中,對(duì)應(yīng)的b個(gè)資產(chǎn)的收益向量記為Rj,b。n個(gè)資產(chǎn)的收益向量記為R。
其二,采用BEKK模型來(lái)估計(jì)收益向量Rj,b的協(xié)方差陣并根據(jù) Rj,b計(jì)算出該子集的平均收益率
其四,對(duì)于任意的第 i個(gè)資產(chǎn)(i=1,…,n),將其在第 j個(gè)子集分配的權(quán)重向量記為其中sign(·)是示性函數(shù),當(dāng)資產(chǎn)i在子集內(nèi)時(shí)
顯然,子集的容量b以及抽樣的次數(shù)s非常關(guān)鍵,會(huì)直接影響到協(xié)方差陣的估計(jì)效率和資產(chǎn)權(quán)重的分配。在下文的實(shí)證研究中,我們會(huì)詳細(xì)討論b和s的選擇對(duì)于組合效率的影響。但是無(wú)論如何,采用BEKK模型來(lái)估計(jì)和預(yù)測(cè)容量為b的子集的協(xié)方差陣時(shí),要比直接估計(jì)n個(gè)大維資產(chǎn)的協(xié)方差陣的估計(jì)要好得多,因?yàn)閎<n,通過(guò)抽取子集,降低了資產(chǎn)的維度,一定程度上解決了維數(shù)詛咒問(wèn)題,提高了協(xié)方差陣的估計(jì)和預(yù)測(cè)效率。
在本文的實(shí)證研究中,我們采用了時(shí)間區(qū)間為2011年1月4日至2014年9月30日的上證180指數(shù)成分股數(shù)據(jù)。將缺失數(shù)據(jù)剔除后,該區(qū)間內(nèi)共有906個(gè)共有交易數(shù)據(jù)。將長(zhǎng)度為906的全樣本數(shù)據(jù)劃分為估計(jì)和預(yù)測(cè)兩個(gè)部分,其中估計(jì)區(qū)間的長(zhǎng)度為806,則預(yù)測(cè)區(qū)間的長(zhǎng)度為100。
分別采用BEKK模型和基于子集重采樣的BEKK模型(記為BEKKsub)來(lái)估計(jì)和預(yù)測(cè)資產(chǎn)的協(xié)方差陣,我們采用的滾動(dòng)估計(jì)法,第一次估計(jì)時(shí),估計(jì)區(qū)間為t=1,2,…,806,用該區(qū)間內(nèi)的數(shù)據(jù)來(lái)估計(jì)BEKK和BEKKsub模型,并依據(jù)該模型預(yù)測(cè)第807天的協(xié)方差陣,根據(jù)所預(yù)測(cè)的協(xié)方差陣來(lái)構(gòu)造投資組合,得到該天的組合分配權(quán)重和收益。以此類推,最后的估計(jì)區(qū)間為t=101,102,…,906,重新估計(jì)模型并預(yù)測(cè)資產(chǎn)的協(xié)方差陣,進(jìn)一步得到第907天的組合分配權(quán)重和收益。
將采用BEKK模型估計(jì)和預(yù)測(cè)得到的100天的協(xié)方差陣代入到前文所述的均值方差投資組合中,得到組合的平均收益為0.0010,組合波動(dòng)為0.0152,夏普比率值為0.0658。而當(dāng)采用基于子集重采樣BEKK模型,即BEKKsub來(lái)估計(jì)和預(yù)測(cè)資產(chǎn)的協(xié)方差陣時(shí),子集的容量b以及抽樣的次數(shù)S會(huì)影響到協(xié)方差陣的估計(jì)效果,并影響到資產(chǎn)組合的收益。為了詳細(xì)分析b和S對(duì)投資組合的影響,我們分別從180支股票中抽取了資產(chǎn)維度為b=10、20、40、60的情況,抽樣次數(shù)為S=500、1 000、1 500、2 000。下表給出了基于子集重抽樣的投資組合的收益、波動(dòng)以及夏普比率值。
基于子集重抽樣的投資組合的收益、波動(dòng)及夏普比率值
從上頁(yè)表我們可以得出兩條結(jié)論:首先,無(wú)論子集容量和抽樣次數(shù)是多少,基于子集重抽樣的投資組合明顯要優(yōu)于傳統(tǒng)的投資組合,其收益更高、波動(dòng)更小,并且夏普比率值也較高。這是因?yàn)椴捎肂EKK模型來(lái)估計(jì)和預(yù)測(cè)容量為b的子集的協(xié)方差陣時(shí),因?yàn)閎<n,通過(guò)抽取子集,降低了資產(chǎn)的維度,一定程度上解決了維數(shù)詛咒問(wèn)題,提高了投資組合的效率。其次,子集容量b對(duì)投資組合的效率影響較大。一般而言,子集容量越小,所構(gòu)造的投資組合的效率越高。而抽樣次數(shù)對(duì)組合效率的影響并不顯著,當(dāng)抽樣次數(shù)達(dá)到1 000時(shí),便會(huì)形成比較穩(wěn)定的投資組合,在此基礎(chǔ)上繼續(xù)增加抽樣次數(shù),并不能明顯地提高組合效率。
均值—方差投資組合模型是最為常用的投資組合模型,是現(xiàn)代投資組合理論的基礎(chǔ),該投資組合模型一經(jīng)提出便得到了廣泛的應(yīng)用。但是該模型依賴資產(chǎn)間的協(xié)方差陣。在當(dāng)今大數(shù)據(jù)時(shí)代,高維資產(chǎn)對(duì)于很多金融機(jī)構(gòu)非常常見(jiàn),當(dāng)資產(chǎn)的維度較高尤其資產(chǎn)的維度大于樣本容量時(shí),協(xié)方差陣的估計(jì)將面臨維數(shù)詛咒等問(wèn)題,常見(jiàn)的協(xié)方差陣的估計(jì)和預(yù)測(cè)模型——BEKK模型將面臨著諸多挑戰(zhàn),估計(jì)效果并不理想,從而直接影響到投資組合的效率。為了提高投資組合的效率,本文考慮將子集重采樣方法應(yīng)用到投資組合的構(gòu)造中,從所有資產(chǎn)構(gòu)造的集合中抽取若干個(gè)子集,然后再采用BEKK模型來(lái)估計(jì)子集的協(xié)方差陣,進(jìn)一步根據(jù)均值—方差模型構(gòu)造子集的資產(chǎn)組合,最后將若干個(gè)子集的同一個(gè)資產(chǎn)的權(quán)重向量求平均,來(lái)求得每個(gè)資產(chǎn)的權(quán)重。通過(guò)實(shí)證分析我們發(fā)現(xiàn),基于子集重抽樣的投資組合明顯要優(yōu)于傳統(tǒng)的均值—方差投資組合,其收益更高、波動(dòng)更小,并且夏普比率值也較高。