沈宇君
量化投資 多因子模型 夏普比率 年化收益率 IC值
引言
股票市場(chǎng)的誕生以來(lái),人類對(duì)于股票市場(chǎng)波動(dòng)邏輯的認(rèn)識(shí),一直是一個(gè)令所有投資者和研究人員所為之著迷的神秘領(lǐng)域。在世界上,出現(xiàn)了很多有名的投資大師,例如巴菲特,索羅斯,皮特林奇,威廉江恩等。這些投資大師依靠自己獨(dú)特的對(duì)資本市場(chǎng)的認(rèn)知以及人格魅力,取得了令世界矚目的投資收益。其中,威廉江恩還將自己對(duì)投資市場(chǎng)的認(rèn)識(shí)整理成讓世界熟知的江恩理論,讓股票技術(shù)分析聞名,并一直流傳至今。但是,股票市場(chǎng)是一個(gè)極其神秘,無(wú)法很好預(yù)測(cè)出來(lái)的市場(chǎng),雖然前人們總結(jié)整理了很多股票市場(chǎng)的經(jīng)驗(yàn)以及知識(shí),供后來(lái)人所參考。但是,在股票市場(chǎng)上,依然沒(méi)有一個(gè)明確和能夠獲取超額收益的長(zhǎng)期有效的理論觀點(diǎn)。
量化投資的鼻祖一西蒙斯,一位世界頂級(jí)的數(shù)學(xué)家,便嘗試通過(guò)自己對(duì)數(shù)學(xué)的理解,用數(shù)學(xué)和計(jì)算機(jī)程序來(lái)進(jìn)行投資,這就是量化投資。量化投資,是當(dāng)今世界最吸引人目光的一個(gè)行業(yè)。當(dāng)年,西蒙斯用數(shù)學(xué)模型和程序創(chuàng)造了舉世矚目的股票投資收益,由西蒙斯運(yùn)作的大獎(jiǎng)?wù)禄鹪?989年2009年的這二十年期間,平均年化收益率達(dá)到了35%,如果把基金所抽取的44%的收益提成,那么,西蒙斯的基金實(shí)際年化收益率達(dá)到了60%,比同期標(biāo)普500指數(shù)平均回報(bào)率高出了20%以上,而對(duì)于傳統(tǒng)的投資大師巴菲特和索羅斯,也是領(lǐng)先了十~LA'-百分點(diǎn),一舉超越了依靠傳統(tǒng)的投資大師所創(chuàng)造的收益。在2008年這一年的爆發(fā)的由次貸危機(jī)所引起的全球經(jīng)濟(jì)危機(jī)中,西蒙斯的基金投資回報(bào)率依舊能夠穩(wěn)穩(wěn)保持在80%左右,這是何其驚人的水準(zhǔn)。隨著西蒙斯的大獎(jiǎng)?wù)禄皤@得成功,以及計(jì)算機(jī)和大數(shù)據(jù)的發(fā)展,再加上股票數(shù)據(jù)的不斷積累,已經(jīng)讓整個(gè)世界的目光都投向了量化投資的這個(gè)領(lǐng)域,特別是中國(guó)的A股市場(chǎng)。從09年開始,中國(guó)A股市場(chǎng)上開始出現(xiàn)量化投資的身影了,中國(guó)各類的量化基金像雨后春筍那樣不斷發(fā)展,因此研究可行的具有穩(wěn)定收益的量化策略是現(xiàn)在最迫切的要求。
量化投資與量化策略
(1)量化投資
從上述我們提及到,量化投資是利用數(shù)學(xué)以及計(jì)算機(jī)程序來(lái)自主完成投資行為的。量化投資可分為量化選股,量化擇時(shí),股指期貨統(tǒng)計(jì)套利,商品期貨統(tǒng)計(jì)套利,期權(quán)套利,算法交易等等。量化投資說(shuō)白了就是利用是數(shù)學(xué)或統(tǒng)計(jì)學(xué)找出投資標(biāo)的相關(guān)的統(tǒng)計(jì)特點(diǎn),并以此特點(diǎn)來(lái)進(jìn)行交易,這樣,計(jì)算機(jī)就能夠按照所設(shè)定的特點(diǎn)自動(dòng)交易。因此,量化投資具有高效組建有效的投資策略,并能夠克服人性弱點(diǎn)一貪婪和恐懼,嚴(yán)格按照買賣紀(jì)律來(lái)執(zhí)行,從而獲取超額收益。特別在高頻交易中,只要成功率超過(guò)50%以上,那么交易的次數(shù)多了,獲勝的概率是達(dá)到100%的。
(2)多因子選股模型
在低頻量化策略當(dāng)中,量化選股是最常用的策略。而多因子選股模型則是更為常見的策略。多因子模型是量化選股中最重要的模型,它的基礎(chǔ)思想是找出和股票收益最相關(guān)的指標(biāo),并根據(jù)這些指標(biāo)選出符合這些指標(biāo)要求的股票,從而構(gòu)建出一個(gè)股票組合,期望這個(gè)股票組合能夠跑贏或者跑輸指數(shù)。如果跑贏指數(shù),則我們做多這個(gè)股票組合,做空股指期貨。反之,我們做空這個(gè)股票組合,做多股指期貨,從而獲取阿爾法收益。多因子選股模型的核心是選擇合適的因子。選取出合適的因子之后,我們將根據(jù)因子的表現(xiàn)進(jìn)行綜合分析并以此作為判斷。在多因子選股模型中一般有兩種選取因子的方法一打分法和回歸法。
打分法是根據(jù)各個(gè)因子的數(shù)值對(duì)相應(yīng)的股票進(jìn)行打分,然后按照一定的權(quán)重加權(quán)得到該股票的總分,然后通過(guò)總分對(duì)股票進(jìn)行篩選以及權(quán)重的賦值。第二個(gè)是回歸法,因?yàn)樵诠善笔袌?chǎng)上,我們可以知道股票的價(jià)格是對(duì)信息的反映,也就是說(shuō)明,我們可以清楚知道,股票的收益是可以解釋的,因此,我們用過(guò)去的股票收益率對(duì)多因子進(jìn)行回歸,得出相關(guān)的回歸方程及數(shù)值后,再將新的因子值代入回歸方程中得出預(yù)期的股票收益率,并以此收益率作為配置股票的權(quán)重,然后組合成量化策略。
在多因子選股的建立過(guò)程中,我們可以分為5個(gè)步驟,候選因子的選取,選股因子的有效性檢驗(yàn)、有效但冗余因子的剔除,綜合評(píng)分的建立和模型的評(píng)價(jià)及持續(xù)改進(jìn)。候選因子的選擇主要依賴于經(jīng)濟(jì)和市場(chǎng)邏輯,特別是在A股市場(chǎng)。而選股因子的有效性檢驗(yàn)則是一般采用排序方法檢驗(yàn)。有時(shí)候這些因子都是有效的,但是因?yàn)榭赡軆?nèi)在驅(qū)動(dòng)因素大致相等,因此,我們將這些因子剔除,只保留同類因子中收益最好最容易區(qū)分的因子。這樣能夠提高計(jì)算機(jī)運(yùn)行的效率,讓更快的交易動(dòng)作爭(zhēng)取更多的超額收益。
通常,股票市場(chǎng)上分為了9類因子,包括規(guī)模因子,估值因子,成長(zhǎng)因子,盈利因子,動(dòng)量反轉(zhuǎn)因子,交投因子,波動(dòng)率因子,分析師預(yù)測(cè)因子等等。規(guī)模因子包括:總市值,流通市值,自由流通市值。估值類因子包括:市盈率,市凈率,市銷率,成長(zhǎng)類因子包括,營(yíng)業(yè)收入同比增長(zhǎng)率,營(yíng)業(yè)利潤(rùn)同比增長(zhǎng)率,歸屬于母公司的凈利潤(rùn)同比增長(zhǎng)率、經(jīng)營(yíng)活動(dòng)產(chǎn)生的現(xiàn)金流金額的同比增長(zhǎng)率。盈利因子包括:凈資產(chǎn)收益率,總資產(chǎn)收益率動(dòng)量反轉(zhuǎn)因子包括:前一個(gè)月漲跌幅,前2個(gè)月漲跌幅、前三個(gè)月漲跌幅、前6個(gè)月漲跌幅。交投因子包括:前一個(gè)月日均換手率。波動(dòng)因子包括:前一個(gè)月的波動(dòng)率,前一個(gè)月的振幅。股東因子包括:戶均持股比例、戶均持股比例變化、機(jī)構(gòu)持股比例變化。分析師預(yù)測(cè)因子包括:預(yù)測(cè)當(dāng)年凈利潤(rùn)增長(zhǎng)率、主營(yíng)業(yè)務(wù)收入增長(zhǎng)率。
(3)Ic值與IR值
Information Coefficient,即因子Ic值,指的是該期因子對(duì)股票的下期收益的預(yù)測(cè)值和股票下期的實(shí)際回報(bào)值在橫截面上的相關(guān)系數(shù),即:
因子的IR(信息比)值為因子IC的均值和因子IC的標(biāo)準(zhǔn)差的比值,假設(shè)有M個(gè)因子,其Ic的均值向量為
協(xié)方差矩陣為:∑,如果各因子權(quán)重向量為
2.4夏普比率
夏普比率是基金績(jī)效評(píng)價(jià)的標(biāo)準(zhǔn)化指標(biāo),現(xiàn)代投資理論的研究表明,風(fēng)險(xiǎn)的大小在決定組合的表現(xiàn)上具有基礎(chǔ)性的作用。夏普比率就是一個(gè)可以同時(shí)對(duì)收益與風(fēng)險(xiǎn)加以綜合考慮的三大經(jīng)典指標(biāo)之一。夏普比率的公式為:
其中,E(Rp)為投資組合預(yù)期報(bào)酬率,Rf為無(wú)風(fēng)險(xiǎn)利率,σp是投資組合的標(biāo)準(zhǔn)差。這公式代表著投資組合每承受一單位總風(fēng)險(xiǎn),會(huì)產(chǎn)生多少的超額報(bào)酬。若夏普比率為正值,則代表基金報(bào)酬率高過(guò)波動(dòng)風(fēng)險(xiǎn);若為負(fù)值,代表基金操作風(fēng)險(xiǎn)打過(guò)預(yù)期報(bào)酬率。因此夏普比率越高,說(shuō)明投資組合越佳。
基于IC_IR值得多因子選股模型實(shí)證研究
在一段時(shí)間內(nèi),雖然因子的有效性能夠讓策略有著較好的收益,但是考慮到因子可能具有輪動(dòng)性,因此使用IC IR值來(lái)對(duì)因子打分并賦值,在特定的時(shí)期選擇分值高的因子進(jìn)行選股有著較為積極的意義。
因此,根據(jù)IC_IR值的定義和公式,同時(shí)考慮到A股市場(chǎng)上有著大小盤的風(fēng)格輪動(dòng),我進(jìn)行了多因子選股策略的建立:
首先,我單獨(dú)對(duì)因子進(jìn)行回測(cè),發(fā)現(xiàn)市凈率(PB),市銷率(PS)、市現(xiàn)率(PCF)、營(yíng)業(yè)收入增長(zhǎng)率,市值,收入增長(zhǎng)率,63日動(dòng)量反轉(zhuǎn)因子,21日動(dòng)量反轉(zhuǎn)因子,有著較好的表現(xiàn),因此我選擇這些因子作為有效因子。并用歷史數(shù)據(jù)進(jìn)行IC值和IR值的計(jì)算,得出因子分值。然后,我選出中證500作為基準(zhǔn),并且,當(dāng)中證500的5日移動(dòng)平均線或者10日移動(dòng)平均線小于-0.03時(shí),說(shuō)明大盤指數(shù)跑輸指數(shù),應(yīng)當(dāng)換為中小市值股票,并利用市值因子的倒數(shù)以及21日動(dòng)量反轉(zhuǎn)因子來(lái)選取股票。反之,說(shuō)明大盤股表現(xiàn)比小盤股好,因此則利用市現(xiàn)率的倒數(shù),市銷率的倒數(shù),市凈率的倒數(shù),營(yíng)業(yè)收入增長(zhǎng)率,收入增長(zhǎng)率和63日動(dòng)量反轉(zhuǎn)因子來(lái)選取股票。同時(shí),我們剔除剛上市不滿一年的股票以及ST股,組成合適的量化股票策略。
基于以上步驟,我們構(gòu)建出的基于IC_IR值的量化選股模型并在優(yōu)礦平臺(tái)進(jìn)行了相應(yīng)的回測(cè)。策略構(gòu)建出來(lái)后,我們可以得出,年化收益為9.1%,夏普比率為0.32,最大回撤為9.4%。以下為2016年6月以來(lái)策略的每個(gè)月收益和用滬深300指數(shù)收益作為基準(zhǔn)的每月收益對(duì)比。(數(shù)據(jù)來(lái)源:通聯(lián)數(shù)據(jù))
結(jié)合以上理論構(gòu)建出來(lái)的基于IC_IR值的量化策略模型雖然策略收益沒(méi)能夠很好跑贏大市,可能是由于因子具有衰減的性質(zhì),比如,在2015年小市值的股票大幅跑贏大市值的股票,但是在2016年6月后卻跑輸大市值因子,因此,導(dǎo)致這個(gè)多因子模型不能很好地跑贏大市,所以,接下來(lái)的研究是研究如加入能夠測(cè)算因子有效性的代碼,嘗試提高此模型的收益,但在已經(jīng)這段時(shí)間已經(jīng)能夠較為緊緊跟隨大市的走勢(shì),所以基于IC_IR值構(gòu)建的多因子量化模型具有一定的可行性。