摘要:文章選取滬深300指數(shù)的成分股為股票池,構(gòu)建三種網(wǎng)絡(luò)熱度因子,根據(jù)熱度高低進(jìn)行分組,統(tǒng)計每組股票的月度收益率,發(fā)現(xiàn)熱度越高,股票收益率越高,呈明顯線性關(guān)系,表明網(wǎng)絡(luò)熱度因子能在一定程度上解釋股票的收益率。將網(wǎng)絡(luò)熱度因子引入到傳統(tǒng)的Fama-French三因子模型中,構(gòu)建成一種四因子模型的量化策略,并對該量化策略以及Fama-French三因子模型量化策略進(jìn)行模擬回測,實驗結(jié)果表明加入網(wǎng)絡(luò)熱度因子的四因子模型的量化策略具有更好的投資表現(xiàn)。
關(guān)鍵詞:網(wǎng)絡(luò)熱度因子;四因子模型;量化策略
1引言
現(xiàn)有文獻(xiàn)中針對網(wǎng)絡(luò)輿情的研究方法,包含投資者關(guān)注度[1]、多空情緒分析[2]、股市信心指數(shù)[3]等,但這些方法是基于投資者在論壇里發(fā)表的文字,采用相應(yīng)的算法將其識別為利多或利空,算法依賴于對投資者情緒用詞的識別,在很多場景中會出現(xiàn)誤判,因此準(zhǔn)確度有待提升[4]。而針對投資者在網(wǎng)絡(luò)上的關(guān)注度等指標(biāo)構(gòu)建的網(wǎng)絡(luò)熱度因子,具有數(shù)據(jù)準(zhǔn)確性更高、更能反映股票收益率變化等特點[5]。實證發(fā)現(xiàn)網(wǎng)絡(luò)熱度因子的變化會影響股票價格的變動,和網(wǎng)絡(luò)熱度因子較高的股票在未來幾個月會有良好的表現(xiàn),而網(wǎng)絡(luò)熱度因子較低的股票則會出現(xiàn)下跌[6]。因此,本文將重點檢驗網(wǎng)絡(luò)熱度因子是否以及如何影響股市行情,同時將網(wǎng)絡(luò)熱度因子引入到傳統(tǒng)的Fama-French三因子模型[7]中,構(gòu)建成一種四因子模型的量化策略[8],并進(jìn)行模擬回測。
2樣本選擇及模型定義
2.1.網(wǎng)絡(luò)熱度因子的樣本選擇
本文的數(shù)據(jù)來源于雪球網(wǎng),選擇滬深300指數(shù)的成分股作為股票池進(jìn)行分析,通過對用戶在該網(wǎng)站上的股票評論數(shù)以及關(guān)注數(shù)進(jìn)行統(tǒng)計。再根據(jù)股票評論數(shù)及股票關(guān)注度這2種數(shù)據(jù)來構(gòu)建三種網(wǎng)絡(luò)熱度因子,分別記為熱度因子1、熱度因子2和熱度因子3,其中熱度因子1為股票當(dāng)天新增評論數(shù)排名、熱度因子2為股票當(dāng)天新增關(guān)注數(shù)排名、熱度因子3為股票當(dāng)天新增評論數(shù)及關(guān)注數(shù)排名之和的排名。
其中熱度因子1和熱度因子2分別按評論數(shù)量和關(guān)注數(shù)量多少來進(jìn)行排名,再按照排名分為A、B、C、D、E五組,平均每組有60支股票,E組為排名第1-60的股票,D組為排名第61-120的股票,C組為排名第121-180的股票,B組為排名第181-240的股票,A組為排名第241-300的股票,A組熱度最低,E組熱度最高,逐漸遞增。
熱度因子3是將股票當(dāng)天新增評論數(shù)排名的數(shù)字與關(guān)注數(shù)排名的數(shù)字相加,得出股票池中股票新的排名,再按照排名分為A、B、C、D、E五組,平均每組有60支股票,E組為排名第1-60的股票,D組為排名第61-120的股票,C組為排名第121-180的股票,B組為排名第181-240的股票,A組為排名第241-300的股票,A組熱度最低,E組熱度最高,逐漸遞增。
接著統(tǒng)計每組股票的2017年每月的股價漲幅,從而考察網(wǎng)絡(luò)熱度因子與股價之間的動態(tài)關(guān)系。
2.2. Fama-French三因子模型及量化策略
Fama-French三因子模型是一個關(guān)于市值、賬面市值比和股票收益率的理論模型,一般用于解釋股票的超額收益率,這個三因子模型的公式如下:
R_i=a_i+b_i R_M+s_i E(SMB)+h_i E(HML)+ε_i
其中R_i=E(r_i-r_f),是第i只股票相對于無風(fēng)險投資的期望超額收益率。R_M=E(r_M-r_f),是市場相對于無風(fēng)險投資的期望超額收益率,E(SMB)是小市值股票相對大市值股票的期望超額收益率,E(HML)則是高賬面市值比的股票比起低賬面市值比的股票的期望超額收益率,而ε_i是回歸殘差項。
E(SMB)是將股票池中的股票按市值從大到小排序,然后平均分成三組:第一組是在股票池中市值最大的1/3股票,第二組是在股票池中市值中間的1/3股票,第三組是在股票池中市值最小的1/3股票。第一組股票的平均期望收益率為E(r_S),第三組股票的平均期望收益率為E(r_B)。則E(SMB)=E(r_S )-E(r_B)。E(HML)也是類似的。
根據(jù)Fama-French三因子模型可以認(rèn)為通過市值、賬面市值比能夠分析個股的超額收益,那么a_i的長期均值會接近0。則如果如果有某些股票,通過計算得到a_i<0,說明這些股票的股價偏低,而根據(jù)有效市場假設(shè),這些錯誤定價的股票都會最終回到正確的定價上去。
故Fama-French三因子模型量化策略的選股思路如下:
(1)先設(shè)定一個調(diào)倉頻率,每T=10天調(diào)倉一次;
(2)設(shè)定一個樣本長度S=63天;
(3)然后在調(diào)倉日對于過去S天的數(shù)據(jù)進(jìn)行回歸分析,計算出每個股票在過去的S天里面α觀測值;
(4)然后買入α最小的N(N=10)支股票即可。
2.3.網(wǎng)絡(luò)熱度的四因子模型及量化策略
Fama-French三因子模型中認(rèn)為股票的超額收益可以由市值、賬面市值比來進(jìn)行分析,但除了上述因子,還應(yīng)該有其它因子也為個股提供超額收益。本文引入網(wǎng)絡(luò)熱度因子來構(gòu)建一個網(wǎng)絡(luò)熱度的四因子模型,其表達(dá)式為:
R_i=a_i+b_i R_M+s_i E(SMB)+h_i E(HML)+r_i E(RMW)+ε_i
從表達(dá)式看,四因子模型比三因子模型里面多出來了一項:E(RMW)是高/低網(wǎng)絡(luò)熱度股票投資組合的回報之差。這一項就描述了網(wǎng)絡(luò)熱度風(fēng)險。與三因子類似,參數(shù)估計的方法仍然是用多元線性回歸的方法,這里的a_i則是四因子模型里面尚未解釋的超額收益。
通過上述說明可以認(rèn)為市值、賬面市值比、網(wǎng)絡(luò)熱度能夠分析個股的超額收益,那么a_i的長期均值會接近0。則如果如果有某些股票,通過計算得到a_i<0,說明這些股票的股價偏低,而根據(jù)有效市場假設(shè),這些錯誤定價的股票都會最終回到正確的定價上去。
故網(wǎng)絡(luò)熱度的四因子模型模型量化策略的選股思路如下:
(1)先設(shè)定一個調(diào)倉頻率,每T=10天調(diào)倉一次;
(2)設(shè)定一個樣本長度S=63天;
(3)然后在調(diào)倉日對于過去S天的數(shù)據(jù)進(jìn)行回歸分析,計算出每個股票在過去的S天里面α觀測值;
(4)然后買入α最小的N(N=10)支股票即可。
3實證結(jié)果與分析
3.1. 網(wǎng)絡(luò)熱度因子熱度與股票收益率的相關(guān)性分析
選取股票池于2017年1月至12月,在雪球網(wǎng)中熱度因子1、熱度因子2和熱度因子3三種網(wǎng)絡(luò)熱度因子為分析對象,其中熱度因子1為股票當(dāng)天新增評論數(shù)排名、熱度因子2為股票當(dāng)天新增關(guān)注數(shù)排名、熱度因子3為股票當(dāng)天新增評論數(shù)及關(guān)注數(shù)排名之和的排名。
首先將股票按網(wǎng)絡(luò)熱度因子的熱度大小來進(jìn)行排名,再按照排名分為A、B、C、D、E五組,平均每組有60支股票,A組熱度最低,E組熱度最高,并統(tǒng)計其每月平均漲幅來計算其月收益率。
股票月收益率與熱度因子1的線性關(guān)系如圖3.1所示:
由上圖可知,股票當(dāng)天新增評論數(shù)數(shù)量越高的試驗組,相較于評論數(shù)低的組,當(dāng)月的股票收益率越高,呈明顯的線性關(guān)系。其中6月,A組的月收益率為-2.05%,E組卻達(dá)到6.52%;10月,A組的月收益率為3.55%,E組卻達(dá)到12.45%,這說明股民對股票的評論,如買入、賣出、看漲、看跌等對于股票的市場表現(xiàn)具有較明顯的促進(jìn)作用。
股票月收益率與熱度因子2的線性關(guān)系如圖3.2所示:
由上圖可知,股票當(dāng)天新增關(guān)注數(shù)數(shù)量越高的試驗組,相較于評論數(shù)低的組,當(dāng)月的股票收益率越好,呈明顯的線性關(guān)系。其中3月,A組的月收益率為-1.26%,E組卻達(dá)到5.24%;8月,A組的月收益率為-0.73%,E組卻達(dá)到5.26%,這說明股民對股票的關(guān)注,無論看漲、看跌,均對于股票的市場表現(xiàn)具有較明顯的促進(jìn)作用。
股票月收益率與熱度因子3的線性關(guān)系如圖3.3所示:
由上圖可知,熱度因子3熱度越高的試驗組,相較于數(shù)量低的組,當(dāng)月的股票收益率越好,呈明顯的線性關(guān)系。其中1月,A組的月收益率為-6.25%,E組卻達(dá)到5.34%;9月,A組的月收益率為-7.61%,E組卻達(dá)到8.91%,這說明股民對股票的關(guān)注和評論,無論看漲、看跌、買入或者買出,均對于股票的市場表現(xiàn)具有較明顯的促進(jìn)作用。
對比圖1、圖2和圖3,可以看到三種網(wǎng)絡(luò)熱度因子都與股票收益率之間呈一定的線性關(guān)系,即網(wǎng)絡(luò)熱度因子越高的股票,其股票收益率越高,但不同的因子其線性度不同。通過計算每月收益率與分組之間的相關(guān)系數(shù),對比網(wǎng)絡(luò)熱度因子與股票收益率的線性度,得出熱度因子1、熱度因子2、熱度因子3三種網(wǎng)絡(luò)熱度因子與股票月收益率的月平均線性度分為0.668、0.529與0.812。
可知熱度因子3與股票收益率的線性度最高,即可認(rèn)為該熱度因子能夠更好地用來分析股票收益率,并選用熱度因子3為四因子模型的第四個變量。
3.2.網(wǎng)絡(luò)熱度因子的四因子模型
從以上分析可知網(wǎng)絡(luò)熱度因子對股票的收益率具有一定程度的解釋力,但單一因子并不能完全解釋股票的收益率。因此本文引入Fama-French三因子模型策略,并在其基礎(chǔ)上加入當(dāng)天新增評論及關(guān)注數(shù)之和作為網(wǎng)絡(luò)熱度因子構(gòu)建四因子模型策略,并與原來的Fama-French三因子模型策略進(jìn)行對比。滬深300指數(shù)的成分股作為股票池,模擬回測時間為2014年1月1日至2018年1月1日在。實證結(jié)果如圖3.4至圖3.5。(指標(biāo)說明:Backtest是相應(yīng)模型策略的收益走勢,benchmark_returns是滬深300指數(shù)的走勢,即基準(zhǔn)收益)
引入網(wǎng)絡(luò)熱度因子的四因子模型策略收益較經(jīng)典的Fama-French三因子模型策略投資表現(xiàn)有較大的提高。4年的累計收益率從164.52%上漲至190.98%,漲幅提高16.08%。夏普比率從0.794上漲至0.952,說明股票池所獲得的風(fēng)險回報更高。交易獲勝率也從0.596上升至0.660,說明投資策略更容易獲利。最大回測從0.372降至0.32,說明風(fēng)險降低,抗風(fēng)險能力更強。
4結(jié)論
本文通過實證分析驗證了A股市場上網(wǎng)絡(luò)熱度因子是否存在超額收益率。以Fama-French三因子模型為基礎(chǔ),引入網(wǎng)絡(luò)熱度因子構(gòu)建四因子模型,通過2014年1月到2017年12月的歷史回測,檢驗了網(wǎng)絡(luò)熱度的四因子模型量化策略是否能獲得更高的收益。研究結(jié)論如下:
(1) A股市場上網(wǎng)絡(luò)熱度因子確實存在超額收益率。實證分析表明,相比低網(wǎng)絡(luò)熱度因子的股票,高網(wǎng)絡(luò)熱度因子的股票確實存在超額收益率,即證券市場對于高網(wǎng)絡(luò)熱度因子的股票存在激勵。這反映了投資者對高網(wǎng)絡(luò)熱度因子成長性的認(rèn)同和網(wǎng)絡(luò)熱度投資文化的形成。因此在進(jìn)行投資時,投資者可以構(gòu)建高網(wǎng)絡(luò)熱度因子股票的資產(chǎn)組合,以提升投資組合的收益率,但也有相應(yīng)的風(fēng)險存在。
(2)四因子模型量化策略能夠獲得更高的收益。實證分析表明,相比三因子模型量化策略,引入熱度因子構(gòu)建的四因子模型量化策略在相同條件下能夠都得更高的收益率,其中年化收益率上漲11.22%,夏普比率從0.794上漲至0.952,交易獲勝率從0.596上升至0.66,最大回測從0.372降至0.32。但是,網(wǎng)絡(luò)熱度因子能不能持續(xù)有效還需要進(jìn)一步的跟蹤研究。
(3)網(wǎng)絡(luò)熱度因子的構(gòu)建還需要進(jìn)一步完善。四因子模型量化策略的回測結(jié)果支持了A股市場的網(wǎng)絡(luò)熱度因子存在超額收益率。但是實證分析也顯示有部分時間高網(wǎng)絡(luò)熱度因子的股票相對于低網(wǎng)絡(luò)熱度因子的股票并沒有得到更高的超額收益率。其中一個可能的原因是對股票的網(wǎng)絡(luò)熱度因子構(gòu)建并不準(zhǔn)確,因此,完善網(wǎng)絡(luò)熱度因子構(gòu)建是下一步的主要工作。
參考文獻(xiàn)
1. 陳植元, 米雁翔, 厲洋軍, & 鄭君君. (2016). 基于百度指數(shù)的投資者關(guān)注度與股票市場表現(xiàn)的實證分析. 統(tǒng)計與決策(23), 155-157.
2. 張紫瓊, 錢國明, & 李一軍. (2013). 基于觀點在線投票的投資者情緒與中國股市相互影響的實證研究. 軟科學(xué), 27(7), 123-127.
3. 汪迎波. 消費者信心指數(shù)與股票市場收益率關(guān)系研究——基于Granger因果檢驗視角[J]. 順德職業(yè)技術(shù)學(xué)院學(xué)報, 2013(2):12-15.
4. 陳沉, 張軍波, 王磊, & 李哲. (2017). 投資者情緒的一個研究綜述. 現(xiàn)代管理科學(xué)(8).
5. 俞慶進(jìn), & 張兵. (2012). 投資者有限關(guān)注與股票收益——以百度指數(shù)作為關(guān)注度的一項實證研究. 金融研究(8), 152-165.
6. 徐映梅, & 高一銘. (2017). 基于互聯(lián)網(wǎng)大數(shù)據(jù)的cpi熱度指數(shù)構(gòu)建與應(yīng)用——以百度指數(shù)為例. 數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究(1), 94-112.
7. 劉輝, & 黃建山. (2013). 中國a股市場股票收益率風(fēng)險因子分析:基于fama-french三因子模型. 當(dāng)代經(jīng)濟科學(xué), 35(4), 27-31.
8. 韓立巖, 蔡立新, & 尹力博. (2017). 中國證券市場的綠色激勵:一個四因子模型. 金融研究(1), 145-161.
【作者簡介】:王正煒(1993—),男,漢族,湖北洪湖人,碩士研究生,研究方向:大數(shù)據(jù)。