王 熙,吳 非,黃 德 金,陳 儀,向 楨
(1.北京大學 經(jīng)濟學院,北京 100871;2.中信建投證券,北京 100000;3.中國人民大學 數(shù)學學院,北京 100872)
黨的十九大報告指出,深化金融體制改革,一方面要提高直接融資比重,促進多層次資本市場健康發(fā)展,另一方面要守住不發(fā)生系統(tǒng)性金融風險的底線。在過去的30年中,我國股票市場的總市值從1990年23.82億增長到2022年初近90萬億,已成長為了世界第二大股票市場,市值規(guī)模僅次于美國市場。目前,滬深兩市的上市公司數(shù)量已經(jīng)超過了4600家。作為世界最大的股票市場之一,A股市場的系統(tǒng)性風險一直受到監(jiān)管機構(gòu)和投資者的廣泛關(guān)注?;诰赓Y產(chǎn)定價理論,風險總是與收益并存,超額收益是對于投資者承擔相應的系統(tǒng)性風險的補償?;诖?,結(jié)合市場數(shù)據(jù)和金融學理論有效測算A股市場超額收益率,不但可以增強市場價格發(fā)現(xiàn)能力,還有助于實時監(jiān)測市場整體系統(tǒng)性風險,具有豐富的理論內(nèi)涵和實踐價值。
從金融經(jīng)濟學理論角度出發(fā),因子定價理論將風險資產(chǎn)的期望超額收益歸因于資產(chǎn)的系統(tǒng)性風險暴露,從而使各類風險資產(chǎn)的期望收益率能夠通過有限的因子暴露進行刻畫,也解釋了各類風險資產(chǎn)期望收益率之間的相關(guān)性特征。這一方面極大地便利了資產(chǎn)配置與組合管理,另一方面也使我們對風險資產(chǎn)收益率的決定邏輯有了更深入的認識。
因子模型成功與否的關(guān)鍵在于找到能有效解釋風險資產(chǎn)超額收益率的因子指標。以股票為例,現(xiàn)有文獻通常認為,因子變量對股票超額收益率的影響主要來自兩個方面:一是投資該因子所承擔的風險,二是風險溢價,也即對投資該因子所承擔的風險的相應補償。對于市場更在意的風險,投資者往往需要更高的預期超額收益率作為補償。
從因子模型的發(fā)展歷程來看,在經(jīng)典的CAPM理論中,市場超額收益率是驅(qū)動個股超額收益率的唯一因子[1-3]。隨后,研究者發(fā)現(xiàn)市場中還存在其他類型的系統(tǒng)性風險。如Fama和French綜合前人研究發(fā)現(xiàn),包含市場、規(guī)模與價值的三因子模型可以更有效地解釋股票超額收益率的差異[4-5]。但由于市場本身的不完善,或因為研究者的認知不足,傳統(tǒng)多因子模型或多或少地存在定價偏誤。為了提高多因子模型的定價能力,學者們致力于尋找新的對股票超額收益率有解釋力的因子指標。在過去的數(shù)十年里,各種新的定價因子層出不窮,迄今為止,海內(nèi)外文獻中提出的有效定價因子已多達百余個[6-7]。
雖然有效因子數(shù)量龐大,我們卻不宜將所有因子同時納入考量。一方面,根據(jù)傳統(tǒng)資產(chǎn)定價理論,隨機定價核是一個維度較低的隨機變量[8]。因此面對高維度的因子集合,我們需要探究哪些因子包含更多的定價信息[6]。另一方面,根據(jù)有限注意力理論,投資者對資產(chǎn)進行估值時所考慮的風險因素是有限且稀疏的[9]。此外,從統(tǒng)計學和計量經(jīng)濟學的角度來看,維度過高的因子模型既難以進行準確的估計,容易造成樣本內(nèi)的過擬合,且不符合簡要律(Law of Parsimony)。因此,如何從大量因子中篩選出真正有解釋力的因子、實現(xiàn)模型的壓縮,是因子“大數(shù)據(jù)”時代亟需解決的一個重要問題。
我國A股市場經(jīng)過數(shù)十年的發(fā)展已逐步走向成熟,多因子模型也在國內(nèi)學界和業(yè)界的研究和實踐中得到越來越廣泛的應用,被發(fā)現(xiàn)有效的定價因子不斷涌現(xiàn),針對A股市場的有效因子篩選的重要性日益凸顯。與此同時,我國經(jīng)濟和金融結(jié)構(gòu)在過去的數(shù)十年中經(jīng)歷了較大變遷,市場風格也有著較大的時變特性,但鮮有文獻從多因子模型定價的角度討論A股市場的風格變遷。因此,本文針對我國A股市場,創(chuàng)造性地提出“基于市值加權(quán)的自適應LASSO算法”,對A股市場進行了實時定價因子篩選。本文的研究意義體現(xiàn)在理論方法和實踐兩個角度。在方法創(chuàng)新方面,LASSO算法通過在目標函數(shù)中引入回歸系數(shù)的一階模作為懲罰項,最終同時實現(xiàn)了因子選擇和參數(shù)估計。相對于普通LASSO算法,自適應LASSO算法采用了調(diào)整不同參數(shù)的懲罰權(quán)重這一改進思路[10]。本文設(shè)計的市值加權(quán)自適應LASSO算法則是傳統(tǒng)自適應LASSO算法和以市值為權(quán)重的最小二乘法的結(jié)合,既能避免模型被過度壓縮(Shrinkage),又能防止結(jié)果受到小市值股票的影響[11]。在此意義上,本文為因子篩選方法的研究提供了具有啟發(fā)性的新思路。
從實踐角度看,我國A股市場具有鮮明的發(fā)展中國家市場的特點,不同時期的市場風格差異較大,傳統(tǒng)多因子模型的(樣本外)定價表現(xiàn)往往差強人意。因此,我們需要根據(jù)A股市場的特點設(shè)計更科學、更有針對性的時變因子篩選方法。本文的實證分析結(jié)果表明:1)我國A股市場存在顯著的風格變遷特性,不同時期的有效定價因子個數(shù)和具體定價因子有著顯著差異;2)整體而言,在A股市場上平均最為有效的定價因子是市場因子、稅收因子、市盈率因子、規(guī)模因子和速動因子;3)使用市值加權(quán)自適應LASSO算法的多因子模型能有效地從大量因子中篩選出關(guān)鍵因子,精準地識別A股市場的風格變遷,其樣本外定價表現(xiàn)也顯著更優(yōu)。具體而言,基于市值加權(quán)自適應LASSO模型構(gòu)建的多空組合在樣本外的月度平均收益率為1.19%,夏普率為0.963 3,顯著高于參照模型(包括WLS模型、PCA模型、普通LASSO模型與Elastic Net模型,下詳)構(gòu)建的多空組合。在此意義上,本文也為我國資本市場上的投資實踐和市場監(jiān)管提供了有力的新工具。
本文與現(xiàn)有文獻的區(qū)別及邊際貢獻可概括為兩點。第一,不同于以往中外文獻大多直接使用公司特征預測我國個股超額收益率,或者使用因子模型解釋歷史平均收益率的做法,本文針對A股市場構(gòu)建了具有廣泛用途的資產(chǎn)定價因子庫,并首次同時針對多個因子采用了多因子模型來預測個股收益率。第二,在此基礎(chǔ)上,為了找到更符合A股市場實時特征的定價模型,本文創(chuàng)造性地基于市值加權(quán)自適應LASSO方法,率先在多因子模型框架內(nèi)對不同時期主導A股市場風格的定價因子進行了識別,并對基于不同模型構(gòu)造的投資組合進行了樣本外檢驗。我們不但發(fā)現(xiàn)A股有著明顯的風格變遷特點,相較于使用WLS方法、PCA、普通LASSO與Elastic Net方法的定價模型,使用市值加權(quán)自適應LASSO方法的定價模型具有更強的樣本外收益預測能力,基于市值加權(quán)自適應LASSO模型構(gòu)造的投資組合也比基于WLS模型、PCA模型、普通LASSO模型與Elastic Net模型所構(gòu)造的投資組合在短、中以及長期內(nèi)有著更高、更穩(wěn)健的樣本外收益。我們也發(fā)現(xiàn)市值加權(quán)自適應LASSO模型所構(gòu)建的投資組合在短期內(nèi)的投資表現(xiàn)顯著高于中期投資表現(xiàn),也高于長期投資表現(xiàn),這也說明基于本文所提出的預測模型的預測效力在短期預測上更有優(yōu)勢。
后文的安排如下:第二部分對多因子模型和變量選擇的主要文獻進行綜述,第三部分介紹本文使用的模型與算法,第四部分為因子構(gòu)建和實證分析,第五部分總結(jié)。
因子模型方面,自二十世紀90年代以來,F(xiàn)ama & French使用個股的市值和賬面市值比劃分投資組合,據(jù)此構(gòu)造出市值和價值因子,這兩個新因子與原有的市場因子一同構(gòu)成著名的Fama-French三因子定價模型[5]。Carhart在Fama-French三因子模型的基礎(chǔ)上,使用股票前一年的超額收益率構(gòu)造了一個描述股票動量效應的新因子[13]。Fama& French則在其三因子模型的基礎(chǔ)上引入盈利和投資兩個新因子,構(gòu)造出Fama-French五因子模型[14]。類似地,Hou等使用市場、市值、盈利和投資因子構(gòu)造出四因子的q-因子模型[11]。Novy-Marx使用貝塔、賬面市值比、動量和毛利與總資產(chǎn)之比構(gòu)造出另一個四因子模型[14]。Daniel& Hirshleifer& Sun則基于非理性行為構(gòu)造了短期和長期兩個行為金融因子,并結(jié)合市場因子構(gòu)造出新的三因子模型[15]。在多因子模型蓬勃發(fā)展的數(shù)十年里,定價因子或公司特征的種類不斷增加。已有文獻不但總結(jié)出百余個有效的定價因子或公司特征[11,16],還使用了近百個因子對個股超額收益率進行了樣本外預測[17-19]。
LASSO算法方面,Rapach& Strauss& Zhou使用LASSO方法研究了美國股票收益率與國際股票收益率之間的關(guān)系[20]。Goto& Xu使用LASSO方法重新估計了均值-方差框架中的方差協(xié)方差矩陣[21]。Chinco& Clark‐Joseph& Ye從解釋市場異象(market anomalies)的角度來選擇LASSO方法中的最優(yōu)懲罰參數(shù)[22]。Freyberger& Neuhierl& Weber從公司特征出發(fā),使用Group-Adaptive-LASSO方法在眾多公司特征中挑選可以預測個股收益率的(少數(shù))公司特征[19]。
目前,國內(nèi)資產(chǎn)定價文獻著重于考察西方主流因子模型對A股市場的適用性,專門針對A股市場的多因子模型和相應的因子壓縮文獻尚處于起步階段。潘莉和徐建國對A股市場的股票收益橫截面差異進行了分析,指出市場回報率、股票市值和市盈率是影響A股收益率的主要因素[23]。李倩和梅婷研究了Fama-French三因子模型在A股市場不同時期的解釋能力,發(fā)現(xiàn)全樣本內(nèi)市場效應、規(guī)模效應和價值效應較為顯著[24]。韓立巖、蔡立新和尹力博針對A股市場構(gòu)建了一個綠色效率因子,提出了一個四因子模型[25];李少育、張滕和尚玉皇則檢驗了A股市場上的市場摩擦對特質(zhì)性風險定價的影響[26]。這些研究納入考慮的因子數(shù)目較為有限,部分涉及因子篩選的分析也以子集法為主,目前幾乎沒有中文文獻對高維情況下的因子篩選問題進行深入探討。
從統(tǒng)計學習的角度來看,從大量的資產(chǎn)定價因子中尋找數(shù)目有限的有效因子,本質(zhì)上是一個變量選擇(Variable Selection)問題。統(tǒng)計學中處理這一問題的方法主要有三類。第一類是子集法,也即逐個遍歷待選變量的子集,分別進行回歸,并根據(jù)一定的標準(如AIC、BIC等)確定最優(yōu)子集。這一方法耗時較長、復雜度高,在變量數(shù)目較大的情況下不易使用。第二類是降維法,通過將原有變量集投影到低維空間來減少變量的個數(shù),典型的算法有主成分分析法(PCA、PLS)和線性判別分析法(LDA)等。第三類是壓縮法,該方法一般通過(一階模)懲罰回歸的方式實現(xiàn),即求解一個目標函數(shù)為損失函數(shù)加懲罰函數(shù)的優(yōu)化問題,當變量增加、模型復雜度提高時,損失函數(shù)值降低而懲罰函數(shù)值升高,最優(yōu)解即為最佳的變量組合。本文設(shè)計的因子篩選方法屬于第三類方法。
與本文最為相近的文獻有兩篇,Lewellen直接使用多個維度的公司特征對個股收益率進行預測,并設(shè)計了樣本外投資組合以考察模型的預測能力[17]。Jiang& Tang & Zhou則嘗試使用多種數(shù)據(jù)降維技術(shù)(如PCA、PLS)對公司特征維度上的信息進行壓縮,據(jù)以預測A股市場上的個股收益率[27]。本文與上述文獻的不同之處在于,本文更重視系統(tǒng)性風險暴露而非公司特征,為此設(shè)計并使用的市值加權(quán)自適應LASSO方法,能有效篩選出有效市場有效因子:基于本文模型所設(shè)計的股票多空組合相對于基準模型也有更高的樣本外收益率和更穩(wěn)定的投資表現(xiàn)。因而,本文在有效定價因子的同時,也識別了A股市場上不同時期能有效參與定價的系統(tǒng)性風險。
假設(shè)時點t上的股票總數(shù)為N,因子總數(shù)為K,多因子資產(chǎn)定價模型可表示為:
rt=Xt-1θt+t.
其中,rt是N×1的向量,其中每個元素代表單支股票在時點t上的超額收益率;Xt-1是N×K的矩陣,其第i行代表第i只股票分別在K個因子上的風險暴露,即K維的beta,也被稱為因子載荷(Factor Loading);θt是K×1的向量,是K個因子在時點t上的溢價,也被稱為因子收益(Factor Return);t是N×1的向量,是N支股票的特質(zhì)(idiosyncratic)收益率,也即股票超額收益率中不能被因子解釋的部分。在實證分析中,rt是可觀測的變量,θt是待估計參數(shù),t是擾動項,正式回歸前首先需要估計作為解釋變量的因子載荷矩陣Xt-1。
我們按以上步驟估計出的因子載荷具有相同的量綱與合理的經(jīng)濟學含義,能反映出個股收益率對因子收益率的敏感性。
利用歷史數(shù)據(jù)估計出因子載荷矩陣Xt-1后,下一步是在橫截面上將個股的超額收益率rt回歸至Xt-1,所得系數(shù)即是相應因子收益θt的估計值。本文設(shè)計的市值加權(quán)自適應LASSO算法是兩種方法的結(jié)合,一是傳統(tǒng)自適應LASSO算法[10],二是以市值為權(quán)重的最小二乘法[11],以下分別加以介紹。
相對于普通LASSO算法,傳統(tǒng)自適應LASSO算法采用了調(diào)整不同參數(shù)的懲罰權(quán)重這一改進思路。為了節(jié)省空間,以下討論在不影響理解的情況下省去了變量的時間下標。傳統(tǒng)自適應LASSO算法將目標函數(shù)設(shè)為:
但是,為了減輕小市值股票的影響以保證結(jié)果的穩(wěn)健性,本文參考Hou等的做法,將傳統(tǒng)自適應LASSO算法中的OLS回歸替換為以市值為權(quán)重的加權(quán)最小二乘法(WLS)回歸,由此得到的便是市值加權(quán)自適應LASSO算法[11],其目標函數(shù)為:
本文使用A股市場2005-2020年所有個股的月度復權(quán)收盤價、月度流通市值和年度財務報表來構(gòu)造因子指標,最終得到47個因子2008-2020年各月份的收益率序列。相關(guān)數(shù)據(jù)來自國內(nèi)金融數(shù)據(jù)終端Wind和金融數(shù)據(jù)接口Tushare Pro。2005年股權(quán)分置改革以前,我國資本市場的定價機制存在嚴重扭曲[28],流通股股東與非流通股股東的利益存在相當?shù)牟灰恢拢虼吮疚膬H著眼于2005年之后的A股市場。
在后文構(gòu)造投資組合的過程中,為了保證投資組合的可復刻性和流動性,我們在股票池中剔除了風險警示(“ST”)股票、上市120天內(nèi)的次新股以及停牌退市股票。為了避免使用未來信息導致虛高的回測結(jié)果,我們沒有在全樣本范圍內(nèi)剔除股票,而是對股票池進行實時篩選:當月被戴帽“ST”、仍在上市120天內(nèi)的次新股和停牌退市股票被剔除出當月的股票池,而摘帽“ST”、上市超過120天的次新股和復牌的股票則被納入當月的股票池。
在因子選擇方面,由于A股的歷史數(shù)據(jù)較少,為了使用有限的樣本更合理地估計因子載荷,本文總結(jié)了文獻中的常用因子和公司特征[11,18],結(jié)合中美會計準則的差異,構(gòu)造出47個具有不同意義的因子,并匯總于表1中:
表1 因子列表
第一,對于市場因子,我們直接用各月份中證A股指數(shù)的收益率減去上月末中債1月期國債的到期收益率(月度化),以此作為模擬組合的收益率。
第二,對于規(guī)模因子,我們在每年6月末將全市場股票按流通市值從高到低排列,跟蹤買入小市值(排名后50%)并賣空大市值股票(排名前50%)的因子模擬組合,并在每個月記錄該模擬組合的收益率,直到下一年的6月末再次更新組合。
第三,對于其他按年度更新組合的因子(通常為與財務信息相關(guān)的基本面因子),我們在每年6月末根據(jù)前一年的年報數(shù)據(jù)構(gòu)造因子指標,并將股票按指標取值從高到低排列,將排名前20%和后20%的股票組分別記為H與L。與此同時,我們將所有股票按流通市值進行排列,分為小市值和大市值兩組,分別記為S與B,由此得到HS、HB、LS和LB四個組合(這一雙重劃分法可剔除規(guī)模因子對其他因子的影響[13])。模擬組合每月的收益率按如下公式計算:
其中rHS、rHB、rLS和rLB分別代表四個組合按流通市值加權(quán)的收益率。理論上,部分因子應該是指標取值越高、收益率越低,對這些因子來說,按以上公式計算得到的期望收益率可能為負,但不會影響后續(xù)的回歸和變量選擇。此外,對于股本因子,由于雙重分組后數(shù)據(jù)有效的股票數(shù)目過少,我們直接將HS組與HB組合并,將LS組與LB組合并。
第四,對于動量和反轉(zhuǎn)因子等按月度更新組合的因子,構(gòu)造的方法與第三種類似,只不過因子模擬組合需要每月更新。在每月底按照因子指標進行排序后,同樣結(jié)合流通市值分為四組,并按上述方法計算下一月的模擬組合收益率。
本文所得因子模擬組合收益率的描述性統(tǒng)計結(jié)果如表2所示:
表2 因子模擬組合收益率的描述性統(tǒng)計
由描述性統(tǒng)計結(jié)果可見,A股市場整體的波動較大,大多數(shù)因子模擬組合的超額收益率均不顯著,僅規(guī)模因子、現(xiàn)金因子和換手波動因子在5%的水平下具有顯著超額收益,這與相關(guān)國內(nèi)實證資產(chǎn)定價研究的結(jié)果基本相符。
在基于歷史數(shù)據(jù)估算出因子模擬組合的收益率后,本文采用Fama & French的時序回歸方法估計因子載荷。對于每支股票,我們選取各時點前60個月的個股月收益率對因子模擬組合收益率進行回歸,回歸所得系數(shù)即為該股票在該時點的因子載荷。當窗口期內(nèi)的月收益率有效觀測值個數(shù)少于40時,我們將該股票從該時點的樣本中剔除。事實上,進行時序回歸時所用的窗口期如果過長,則不利于反映真實因子載荷的動態(tài)變化,還會減少樣本容量;如果過短則很難對大量因子的參數(shù)進行合理估計。
得到個股因子載荷后,我們將個股未來一個月的收益率回歸到其因子載荷上以估計因子收益。我們同時嘗試了三種模型,分別是(1)以市值為權(quán)重的自適應LASSO模型(以下統(tǒng)稱為“市值加權(quán)自適應LASSO模型”)、(2)以市值為權(quán)重的普通LASSO模型(以下簡稱為“普通LASSO模型”)和(3)包含所有因子的、以市值為權(quán)重的線性回歸模型(以下簡稱為“WLS模型”)。第一個模型是本文的核心模型,后兩者是參照模型。
在使用自適應LASSO和普通LASSO方法進行壓縮估計后,我們再基于每個橫截面上篩選出的有效因子,使用個股收益率對有效因子的載荷進行WLS回歸,并以回歸系數(shù)作為有效因子當期收益率的最終估計結(jié)果。對于壓縮方法未篩選出的因子(亦即無效因子),當期收益率記為0。
圖1展示了市值加權(quán)自適應LASSO回歸的部分結(jié)果,包括各期的調(diào)整R2(左軸)與有效因子的數(shù)目(右軸)。作為對比,我們將WLS回歸和普通LASSO回歸的各期調(diào)整R2一并顯示于圖中,我們可以發(fā)現(xiàn)A股市場有著明顯的時變特性,有效定價因子的個數(shù)隨著時間變化有著顯著波動。
從樣本內(nèi)擬合的角度看,市值加權(quán)自適應LASSO回歸與WLS回歸的R2存在約12個百分點的差距,與普通LASSO回歸的R2則不存在明顯差距。WLS回歸由于未對參數(shù)進行壓縮,容易產(chǎn)生較大的樣本內(nèi)R2,這實際上是一種過擬合的表現(xiàn);而市值加權(quán)自適應LASSO方法篩選出的有效因子雖然數(shù)量有限,卻仍能在相當程度上解釋股票收益率的樣本內(nèi)差異。
此外,從圖1中我們不難發(fā)現(xiàn),在部分時期,即使將所有因子納入回歸,所得的R2也比較低,因此壓縮后很多因子沒有得到保留。例如,2015年上半年A股市場受場外融資等因素影響出現(xiàn)泡沫,部分月份使用47個因子回歸所得的R2尚不足10%,在這些月份中市值加權(quán)自適應LASSO方法得到的系數(shù)估計值大多為0,即僅少數(shù)幾個因子有效。我們發(fā)現(xiàn),整體而言,A股市場有效定價因子的個數(shù)和具體有效定價因子存在著顯著時序差異。
圖1 各模型的調(diào)整R2與市值加權(quán)自適應LASSO算法下的有效因子數(shù)目
平均來看,市值加權(quán)自適應LASSO方法在本文考察時間范圍內(nèi)識別出的有效因子數(shù)目平均約為12個,我們認為這代表了A股投資者長期關(guān)注的風險種類的數(shù)目。從圖1中我們還可以看出,A股市場的定價因子(市場風格)時變性較強,不同時期有效定價因子的個數(shù)存在較大的差異。為了進一步說明這一點,我們將考察期內(nèi)不同因子的有效次數(shù)匯總于表3中:
表3 市值加權(quán)自適應LASSO算法下各因子的有效次數(shù)
由表3可見,市場因子是考察期內(nèi)有效次數(shù)最多的因子(65次),這說明市場整體表現(xiàn)在大部分時候是A股投資者關(guān)注的系統(tǒng)性風險。反映經(jīng)營現(xiàn)金流健康水平的稅收因子(50次)和盈利成長性的市盈率因子(47次)次之,說明企業(yè)的成長性和健康性也是A股市場中投資者重點關(guān)注的因素。規(guī)模因子(38次)再次之,說明A股市場中小市值效應是長期存在的。另外,反映短期和長期償債能力的速動因子(39次)、現(xiàn)金因子(31次)和市場杠桿因子(31次)也在多數(shù)情況下有效。相比之下,質(zhì)量因子(1次)、換手因子(4次)等的有效次數(shù)較為有限。
以上分析表明市值加權(quán)自適應LASSO模型具有較強的樣本內(nèi)數(shù)據(jù)擬合能力。不過眾所周知的是,樣本內(nèi)擬合能力只是評判一個實證資產(chǎn)定價模型優(yōu)秀與否的次要標準,更重要的是考察模型的樣本外定價表現(xiàn)。下一小節(jié)對此進行深入考察。
本小節(jié)旨在對不同模型的樣本外定價表現(xiàn)進行比較,以進一步凸顯市值加權(quán)自適應LASSO模型相對于參照模型的合理性和有效性。我們在每個橫截面上基于三個多因子模型(市值加權(quán)自適應LASSO模型、普通LASSO模型和WLS模型)分別預測下一期的股票收益率,據(jù)以構(gòu)造樣本外預測能力最優(yōu)的投資組合,然后通過比較基于不同模型所構(gòu)造投資組合的樣本外收益率和夏普率(Sharpe Ratio)來判斷模型的優(yōu)劣[17,19]。具體步驟如下:
第一步,在第t期,使用該期以前的數(shù)據(jù)估計第t期的因子收益θt。
第二步,我們使用基于t期數(shù)據(jù)估計的風險溢價參數(shù)θt預測t+1期的風險溢價,并基于第t期的因子載荷和因子收益對第t+1期的個股收益率進行預測。接著根據(jù)預期收益率的高低對股票進行排序,并通過買入高預期收益股票、賣空低預期收益股票的方式構(gòu)造投資組合,記錄該組合在第t+1期的實際收益率。
第三步,在每一期分別構(gòu)造最優(yōu)投資組合(剔除“ST”股票與次新股),從而得到最優(yōu)投資組合收益率的時間序列。通過對這一序列進行業(yè)績分析,便可對模型的樣本外定價表現(xiàn)做出評價。
表4 樣本外多空收益率表現(xiàn)(月度)
1.樣本外的多空組合收益率
在后續(xù)的分析中,我們將市值加權(quán)自適應LASSO模型與四種基準模型進行了比較,分別是WLS模型、普通LASSO模型、PCA模型和ElasticNet彈性網(wǎng)絡模型。具體來說,我們使用2013年1月-2020年11月的模型估計結(jié)果預測2013年2月-2020年12月共83個月的橫截面股票收益率,并通過買入預期收益率前10%、賣空末10%的股票來構(gòu)造投資組合(與已有文獻中的買賣比例相同[19]),并計算不同投資組合的樣本外平均收益率、波動率以及最大回撤,以此來判斷不同模型的樣本外定價表現(xiàn)是否存在差異,我們將不同多種組合的樣本外表現(xiàn)匯報在表4中。
從表4可見,基于市值加權(quán)自適應LASSO模型在樣本外區(qū)間的平均月頻收益率為1.19%,顯著高于基于WLS模型的0.47%和上證指數(shù)的同期月頻超額收益率0.51%。并且,基于市值加權(quán)自適應LASSO模型在樣本外區(qū)間的平均月頻收益率也顯著高于基于普通LASSO模型的0.91%、基于PCA模型的0.72%以及基于彈性網(wǎng)絡模型的1.04%,表現(xiàn)明顯優(yōu)于其他三種降維模型。表現(xiàn)也更為穩(wěn)健,市值加權(quán)自適應LASSO組合樣本外收益標準差為0.045,與傳統(tǒng)LASSO模型的0.045和彈性網(wǎng)絡模型的0.044持平,但低于WLS的0.052、PCA的0.085以及上證指數(shù)的0.065。為了進一步驗證基于市值加權(quán)自適應LASSO更精確地識別了A股市場有效定價因子,我們進一步參考已有文獻,對于所構(gòu)建的投資組合樣本外夏普率進行比較。
2.樣本外夏普率比較
理論上,一個因子模型越接近真實模型,其對樣本外股票收益率刻畫能力就越強(理論上,隨機定價核的投資收益擁有最大的夏普率),根據(jù)其樣本外預測構(gòu)造的投資組合就應該有更好的夏普率表現(xiàn)。我們使用夏普率來衡量投資組合的業(yè)績表現(xiàn),其定義為:
其中SRp代表組合p的夏普率,μp和σp分別代表組合p的超額收益率的期望和標準差,通常用樣本均值和樣本標準差來衡量。在分別使用兩種模型進行樣本外預測并構(gòu)造了投資組合p和q之后,便可以對這兩個投資組合的夏普率進行統(tǒng)計檢驗:如果組合p的夏普率在統(tǒng)計意義上高于投資組合q,即可認為構(gòu)造p的模型更優(yōu)。
與Lewellen和Freyberger等單純比較兩個投資組合的夏普率不同[17,19],我們使用Memmel(2003)中的統(tǒng)計量對兩個投資組合的夏普率進行比較(Jobson-Korkie檢驗)[31]:
其中SRp與SRq分別代表組合p與q的夏普率的樣本估計值,ρpq代表兩個組合超額收益率的相關(guān)系數(shù)的樣本估計值,T為時間長度。這一統(tǒng)計量漸進服從正態(tài)分布。
與上文類似,我們基于不同模型,通過買入預期收益率前10%、賣空末10%的股票來構(gòu)造投資組合(與已有文獻的買賣比例相同[19]),接著計算不同投資組合的夏普率和Jobson-Korkie統(tǒng)計量,以此來判斷不同模型的樣本外定價表現(xiàn)是否存在差異。此外,我們還考察了市場組合的業(yè)績表現(xiàn)以確認多因子模型的整體有效性。我們發(fā)現(xiàn)市值加權(quán)自適應LASSO模型優(yōu)于Elastic Net(彈性網(wǎng)絡)模型,并且顯著優(yōu)于普通LASSO模型、PCA模型和WLS模型,基于WLS模型構(gòu)建的投資組合則顯著優(yōu)于市場組合,詳情如下。
首先是市值加權(quán)自適應LASSO模型與WLS模型的比較。相應投資組合的夏普率及Jobson-Korkie檢驗結(jié)果總結(jié)于表5中。如表所示,基于市值加權(quán)自適應LASSO模型所構(gòu)建組合的夏普率(SRALASSO)約為0.92,而基于WLS模型所構(gòu)建組合的夏普率(SRWLS)約為0.31,前者顯著高于后者,說明市值加權(quán)自適應LASSO模型的樣本外定價能力遠超WLS模型。
表5 Jobson-Korkie檢驗結(jié)果(市值加權(quán)自適應LASSO vs. WLS)
接下來是市值加權(quán)自適應LASSO模型與PCA模型的比較。相應投資組合的夏普率及Jobson-Korkie檢驗結(jié)果總結(jié)于表6中。如表所示,基于市值加權(quán)自適應LASSO模型所構(gòu)建組合的夏普率(SRALASSO)約為0.92,基于PCA模型所構(gòu)建組合的夏普率(SRPCA)約為0.29,前者顯著高于后者,說明市值加權(quán)自適應LASSO模型的樣本外定價能力遠遠優(yōu)于PCA模型。
表6 Jobson-Korkie檢驗結(jié)果(市值加權(quán)自適應LASSO vs. PCA)
其次是市值加權(quán)自適應LASSO模型與普通LASSO模型的比較。相應投資組合的夏普率及Jobson-Korkie檢驗結(jié)果總結(jié)于表7中。如表所示,基于市值加權(quán)自適應LASSO模型所構(gòu)建組合的夏普率(SRALASSO)約為0.92,基于普通LASSO模型所構(gòu)建組合的夏普率(SRLASSO)約為0.70,前者顯著高于后者,說明市值加權(quán)自適應LASSO模型的樣本外定價能力也超過普通LASSO模型。
表7 Jobson-Korkie檢驗結(jié)果(市值加權(quán)自適應LASSO vs. 普通LASSO)
最后是市值加權(quán)自適應LASSO模型與彈性網(wǎng)絡模型的比較。相應投資組合的夏普率及Jobson-Korkie檢驗結(jié)果總結(jié)于表8中。如表8所示,基于市值加權(quán)自適應LASSO模型所構(gòu)建組合的夏普率(SRALASSO)約為0.92,基于普通LASSO模型所構(gòu)建組合的夏普率(SRElasticNet)約為0.81,前者仍然高于后者,說明市值加權(quán)自適應LASSO模型的樣本外定價能力也超過彈性網(wǎng)絡模型。
表8 Jobson-Korkie檢驗結(jié)果(市值加權(quán)自適應LASSO vs. 彈性網(wǎng)絡)
此外我們還估算了同期上證綜合指數(shù)的夏普率(SRSCI),結(jié)果僅為0.27左右,遠低于上述任一多因子模型的相應結(jié)果,這一發(fā)現(xiàn)確認了多因子模型的整體有效性。在表9中,我們匯報了基于WLS模型構(gòu)造的組合與上證指數(shù)的夏普率及Jobson-Korkie檢驗結(jié)果。
表9 Jobson-Korkie檢驗結(jié)果(WLS vs. 上證綜合指數(shù))
為了驗證結(jié)論的穩(wěn)健性,下一小節(jié)重點考察了結(jié)果是否對構(gòu)建投資組合時使用的多空比例敏感。我們發(fā)現(xiàn)在不同的多空比例下,市值加權(quán)自適應LASSO模型始終優(yōu)于彈性網(wǎng)絡模型和普通LASSO模型,而后兩者則始終優(yōu)于PCA模型和WLS模型,這一核心結(jié)論十分穩(wěn)健。
作為穩(wěn)健性分析的一部分,我們在不同的多空比例下重復上一小節(jié)的工作,以確認結(jié)論不受多空比例的影響。我們將市值加權(quán)自適應LASSO模型與WLS模型比較的結(jié)果匯總于表10中。以第三行為例,這一行代表的多空比例為20%,即買入預期收益率前20%、賣空末20%的股票??梢园l(fā)現(xiàn),無論多空比例有多高,市值加權(quán)自適應LASSO模型的樣本外預測能力始終強于WLS模型,表現(xiàn)為投資組合顯著更高的夏普率。
表10 穩(wěn)健性檢驗結(jié)果(市值加權(quán)自適應LASSO vs. WLS)
類似地,我們將市值加權(quán)自適應LASSO模型與PCA模型比較的結(jié)果匯總于表11中??梢园l(fā)現(xiàn),無論多空比例有多高,市值加權(quán)自適應LASSO模型的樣本外預測能力始終顯著強于PCA模型。
表11 穩(wěn)健性檢驗結(jié)果(市值加權(quán)自適應LASSO vs. PCA)
我們將市值加權(quán)自適應LASSO模型與普通LASSO模型比較的結(jié)果匯總于表12中??梢园l(fā)現(xiàn),無論多空比例有多高,市值加權(quán)自適應LASSO模型的樣本外預測能力始終顯著強于普通LASSO模型。
表12 穩(wěn)健性檢驗結(jié)果(市值加權(quán)自適應LASSO vs. 普通LASSO)
我們將市值加權(quán)自適應LASSO模型與普通LASSO模型比較的結(jié)果匯總于表13中??梢园l(fā)現(xiàn),無論多空比例的具體取值為多少,市值加權(quán)自適應LASSO模型的樣本外預測能力始終強于彈性網(wǎng)絡模型。
表13 穩(wěn)健性檢驗結(jié)果(市值加權(quán)自適應LASSO vs. 彈性網(wǎng)絡)
表14顯示的是基于WLS模型構(gòu)造的組合與上證指數(shù)的對比,與我們的預期一致,前者的夏普率穩(wěn)定地高于后者,即多因子模型的整體有效性不受多空比例的影響。
表14 穩(wěn)健性檢驗結(jié)果(WLS vs. 上證綜合指數(shù))
綜上,市值加權(quán)自適應LASSO模型的樣本外預測能力顯著強于其他模型。相對于WLS模型,使用市值加權(quán)自適應LASSO方法后夏普率的提升非常明顯,幅度達到200%。相對于普通LASSO模型,夏普率的提升也頗為可觀,幅度達到30%。相對于基準模型中表現(xiàn)最好的彈性網(wǎng)絡模型,夏普率提升幅度也達到12%。因此,至少從因子篩選的角度看,市值加權(quán)自適應LASSO方法具有明顯的合理性和有效性。
此外,本文將探討市值加權(quán)自適應LASSO模型所選出的有效定價因子在中長期的有效性。本文采用的方法是月頻動態(tài)調(diào)整定價因子并估計了相應的風險溢價,并且證明了在短期的動態(tài)調(diào)整下有較強的樣本外預測能力。本文接下來將測算基于不同方法的多因子模型是否在中期、長期依然有較強的預測能力。我們將中期定為12個月,在篩選出首期的有效定價因子后,未來12個月將延用已篩選因子的因子載荷和因子收益率,并在12個月后重新篩選新的有效定價因子。類似的,我們將長期定為36個月,測算投資組合在短期、中期、長期的夏普率。如表15所示,表中第一列展示了使用實時因子篩選所得到的投資組合對應的樣本外夏普率,SR代表了使用中期或者長期篩選因子對應投資組合的夏普率。我們可以發(fā)現(xiàn)基于本文提出的市值加權(quán)自適應LASSO模型在中期、長期的投資組合夏普率均低于短期夏普率,這也說明加權(quán)自適應LASSO模型可能存在長期預測效力下降的問題。
表15 定價因子的短中長期比較結(jié)果
最后,本文為了驗證在中期、長期預測的過程中市值加權(quán)自適應LASSO模型的樣本外投資表現(xiàn)優(yōu)于基于LASSO和Elastic Net構(gòu)建的投資組合,我們重復了上文之中的比較并將結(jié)果匯總在表16之中,可以發(fā)現(xiàn)不論是在中期還是長期篩選標準下,市值加權(quán)自適應LASSO模型的樣本外投資表現(xiàn)依舊高于LASSO和Elastic Net模型,但是這一差異僅在中期預測上是顯著的。長期投資而言,雖然加權(quán)自適應LASSO方法依舊優(yōu)于WLS方法,但是與PCA、LASSO以及Elastic Net的差異并不顯著,這也側(cè)面說明在長期預測表現(xiàn)上不同的機器學習方法在構(gòu)建樣本外投資組合方面存在收斂趨勢。
表16 中、長期跨模型比較結(jié)果
期望收益率是金融市場價格發(fā)現(xiàn)和預測系統(tǒng)性風險的重要指標。為了實時甄別我國金融市場的驅(qū)動因素,本文采用了在多因子資產(chǎn)定價框架內(nèi),實時識別了A股市場上的有效定價因子的研究角度。為了針對對A股市場估計時變定價模型并且識別被有效定價因子的風險溢價,本文提出了一種基于市值加權(quán)的自適應LASSO算法來對多因子模型進行實時壓縮,并基于我國A股市場的數(shù)據(jù)對該方法的合理性和有效性進行了探討。結(jié)果表明,市值加權(quán)自適應LASSO算法能有效地從大量因子中篩選出關(guān)鍵因子,使用該方法的多因子模型的樣本外定價表現(xiàn)顯著優(yōu)于作為參照模型的彈性網(wǎng)絡(ElasticNet)模型、普通LASSO模型、PCA模型和WLS模型。本文理論上的創(chuàng)新之處在于將傳統(tǒng)自適應LASSO算法和以市值為權(quán)重的最小二乘法進行結(jié)合,設(shè)計出一種既能避免模型被過度壓縮、又能防止結(jié)果受到小市值股票影響的新的因子篩選方法,具有較為豐富的理論內(nèi)涵和啟示。此外,本文還具有較強的現(xiàn)實意義:對投資者而言,本文提出的預測算法能幫助投資者更精準地識別市場風格,根據(jù)該算法構(gòu)造的投資組合也有著更好且更穩(wěn)健的樣本外表現(xiàn);對監(jiān)管者而言,本文提出的算法能加深監(jiān)管者對股市系統(tǒng)性風險的認識,為監(jiān)管部門有效引導市場合理投資,及時發(fā)現(xiàn)市場異常提供助力。
習近平總書記指出:“防范化解金融風險特別是防止發(fā)生系統(tǒng)性金融風險,是金融工作的根本性任務?!边M入新時代,隨著我國金融市場的深化發(fā)展,正確客觀地認識股票市場風險的動態(tài)演化特征、市場驅(qū)動因素,理清各類宏觀經(jīng)濟政策在影響資本市場風險周期中的作用,是防范化解系統(tǒng)性風險、助推經(jīng)濟社會高質(zhì)量發(fā)展必須重視和解決的重要課題。因此,立足我國經(jīng)濟特點,深刻認識驅(qū)動我國資本市場因素的時序特征,探索最優(yōu)資本市場治理的政策組合,對于我國有效預防、處置資本市場劇烈波動所可能帶來的系統(tǒng)性風險具有重要意義。
本文為研究A股市場收益率的決定以及相關(guān)的系統(tǒng)性風險打下了基礎(chǔ),但未來依舊需要從經(jīng)濟周期理論以及我國的經(jīng)濟現(xiàn)實出發(fā),進一步研究本文篩選出的一系列有效定價因子背后的經(jīng)濟學含義,更深入地探討這些因子驅(qū)動A股市場收益率背后的經(jīng)濟學邏輯。