黃宏運(yùn),王 梅,朱家明
(1.安徽財(cái)經(jīng)大學(xué) 金融學(xué)院,安徽 蚌埠 233000;2.安徽財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233000)
?
基于多元回歸分析的多因子選股模型
黃宏運(yùn)1,王 梅,朱家明2
(1.安徽財(cái)經(jīng)大學(xué) 金融學(xué)院,安徽 蚌埠 233000;2.安徽財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233000)
針對(duì)股票選取的多因子問題,利用MATLAB軟件建立股票的基本面指標(biāo)(市凈率、市盈率、資產(chǎn)負(fù)債比率等)、技術(shù)面指標(biāo)(當(dāng)日漲幅、10日漲跌比率ADR、10日相對(duì)強(qiáng)弱指標(biāo)RSI、當(dāng)日K線值、10日乖離率BIAS、當(dāng)日OBV和30日RSV等)對(duì)相對(duì)收益率的多元線性回歸模型,并對(duì)所建立模型的多重共線性和異方差性進(jìn)行了適當(dāng)?shù)臋z驗(yàn)和改進(jìn)以給出一個(gè)更加合理科學(xué)的多因子選股模型.
股票因子;多元回歸分析;廣義逐步回歸;多重共線性;MATLAB
伴隨著我國經(jīng)濟(jì)的高速發(fā)展和資本市場的不斷擴(kuò)展,廣大個(gè)人與機(jī)構(gòu)投資者對(duì)于股票選取方法的需求呈現(xiàn)出日益增長的趨勢.由于股票選取的方法有多種,如結(jié)合基本面分析、結(jié)合技術(shù)指標(biāo)分析等等,為了更多地融入影響股票選取的因子,現(xiàn)今基于因子分析的選股方法越來越受到大家的歡迎.事實(shí)上,多因子選股模型是應(yīng)用比較廣泛的一種選股模型,其基本原理就是采用一系列的因子作為選股標(biāo)準(zhǔn),滿足這些因子的股票則被買入,不滿足的則賣出.通常來說,多因子選股模型有兩種判斷方法,一是打分法,二是回歸法.
本文的數(shù)據(jù)來源主要為上海和深圳證券交易所以及同花順數(shù)據(jù)中心,數(shù)據(jù)的格式為2937行11維,分別代表2937只股票和影響每只股票相對(duì)收益率的10項(xiàng)影響因子(第11列為對(duì)應(yīng)股票的相對(duì)收益率),為了消除數(shù)據(jù)數(shù)量級(jí)與量綱差異對(duì)回歸模型的影響,對(duì)數(shù)據(jù)進(jìn)行了適當(dāng)?shù)臍w一化處理.為了問題和數(shù)據(jù)的處理方便,有以下幾點(diǎn)假設(shè):①假設(shè)所獲取的數(shù)據(jù)真實(shí)、準(zhǔn)確和可靠.②假設(shè)對(duì)數(shù)據(jù)進(jìn)行的四舍五入不會(huì)對(duì)回歸結(jié)果產(chǎn)生影響.③假設(shè)短期選取的股票池對(duì)于市場來說有效.
2.1 研究思路
由于影響股票選取的因子眾多,為了綜合考慮基本面指標(biāo)[1]、技術(shù)面指標(biāo)[2]等一級(jí)指標(biāo)中二級(jí)因子,分別從各項(xiàng)一級(jí)指標(biāo)中選取了幾項(xiàng)具有代表性的二級(jí)因子,具體包括市凈率、市盈率、資產(chǎn)負(fù)債比率、當(dāng)日漲幅、10日漲跌比率ADR、10日相對(duì)強(qiáng)弱指標(biāo)RSI、當(dāng)日K線值,10日乖離率BIAS、當(dāng)日OBV和30日RSV等(后文為了闡述的方便簡稱各項(xiàng)因子為因子1、因子2、因子3等等).為了使收益率的衡量更加具有可比性,引入虛擬的被解釋變量相對(duì)收益率,具體將近期收益率表現(xiàn)出明顯上升趨勢的股票的相對(duì)收益率定義為1,表現(xiàn)出明顯下降趨勢的股票的相對(duì)收益率定義為-1,而表現(xiàn)出橫盤震蕩或整理狀態(tài)的股票的相對(duì)收益率定義為0.
2.2 研究過程
(1)模型建立.首先以相對(duì)收益率為被解釋變量建立十個(gè)影響因子的多元回歸模型[3],具體模型結(jié)果如表1所示.
表1 多元回歸模型
模型的可決系數(shù)R2=81.9%,說明整體股票因子對(duì)相對(duì)收益率[4]的擬合精度并不是太高,由表1可以看出,在置信度為0.05的水平下,因子x1、x4、x5、x6、x7、x10對(duì)于相對(duì)收益率的影響顯著,也進(jìn)一步說明再利用上述十項(xiàng)因子實(shí)現(xiàn)回歸選股時(shí),應(yīng)對(duì)市凈率[5]、當(dāng)日漲幅、10日漲跌比率ADR、10日相對(duì)強(qiáng)弱指標(biāo)RSI、當(dāng)日K線值和30日RSV予以優(yōu)先考慮或賦予較多的權(quán)重計(jì)算相對(duì)收益率的大?。?/p>
從上述回歸模型的結(jié)果可以看出,其他四項(xiàng)因子并沒有通過顯著性檢驗(yàn),但這不表明這些因子對(duì)于相對(duì)收益率的影響不重要,這主要是由于股票因子之間具有相同的變化趨勢,而這無疑會(huì)導(dǎo)致回歸模型存在嚴(yán)重的多重共線性問題.以下首先利用各因子之間的相關(guān)系數(shù)對(duì)變量之間存在的多重共線性進(jìn)行檢驗(yàn),然后利用廣義線性逐步回歸法對(duì)模型中的多重共線性問題進(jìn)行改進(jìn).
(2)模型改進(jìn).利用MATLAB軟件繪制出各因子之間的相關(guān)系數(shù)熱圖如圖1、圖2所示.
圖1 因子相關(guān)系數(shù)矩形
圖2 因子相關(guān)系數(shù)橢圓
從圖1、圖2可以發(fā)現(xiàn),模型的各因子之間存在著較多的多重共線性問題,如x1與x5、x10,x5與x10,x8與x9等.對(duì)于回歸模型中存在的多重共線性問題,通常有如下幾種處理方法:①剔除不顯著變量,此方法可能會(huì)導(dǎo)致剔除顯著變量進(jìn)而導(dǎo)致模型的設(shè)定誤差.②增大樣本容量,此方法適用于樣本數(shù)據(jù)較少的情形.③變換模型形式,如采取差分法、對(duì)數(shù)變換法等重新建立回歸模型,此方法可能會(huì)導(dǎo)致模型的誤差項(xiàng)序列相關(guān),進(jìn)而違背線性回歸模型的相關(guān)假設(shè).④逐步回歸法,此修正方法的基本思想是先用因變量對(duì)每一個(gè)所考慮的自變量作簡單回歸,然后以對(duì)因變量貢獻(xiàn)最大自變量所對(duì)應(yīng)的回歸方程為基礎(chǔ),再逐個(gè)引入其余的自變量.
由于逐步回歸法不僅可以將統(tǒng)計(jì)上不顯著的自變量剔除,最后保留在模型中的自變量之間多重共線性不明顯,而且對(duì)因變量有較好的解釋貢獻(xiàn),所以選擇逐步回歸法對(duì)原有模型進(jìn)行改進(jìn).
為了盡量使模型的擬合精度得到提高,首先將樣本數(shù)據(jù)中的一些異常值與離群點(diǎn)剔除,具體結(jié)果如圖3、圖4所示.
圖3 異常值檢驗(yàn)
圖4 異常值殘值分布圖
將圖2、圖3中異常值剔除后,利用廣義逐步回歸法得到的模型結(jié)果,如表2所示.
表2 廣義逐步回歸模型
改進(jìn)后模型的可決系數(shù)R2=92.5%,說明剔除變量后的剩余股票因子對(duì)相對(duì)收益率的擬合精度得到顯著提高,由表2可以看出,利用廣義逐步回歸法建立模型的t統(tǒng)計(jì)量均通過檢驗(yàn)(置信水平為0.05),說明因子x1、x5、x6、x7、x10對(duì)于相對(duì)收益率的影響顯著,并且給出了上述因子交叉項(xiàng)x1x5、x1x10、x5x10和x6x10對(duì)于相對(duì)收益率的影響關(guān)系.
(3)模型應(yīng)用.利用改進(jìn)后的模型選取部分樣本數(shù)據(jù)進(jìn)行檢驗(yàn)得到回歸結(jié)果殘差分析如圖5、圖6所示.
從圖5可知,以相對(duì)收益率為衡量標(biāo)準(zhǔn)所選股票被明顯地分為三部分,其中位于最上面那一部分的股票即對(duì)應(yīng)相對(duì)收益率最高的個(gè)股,而位于最下面那一部分的股票對(duì)應(yīng)為相對(duì)收益率最低的個(gè)股,位于中間部分的股票即相對(duì)收益率處于最高與最低之間的個(gè)股,可以看出,利用上述建立的多因子選股模型可以很好地根據(jù)因子因素區(qū)分這些股票的相對(duì)收益率高低,這對(duì)投資者在實(shí)際的選股過程中無疑
圖5 回歸預(yù)測結(jié)果
圖6 殘差分析圖
提供了很好的借鑒.從圖6可知,實(shí)際值與預(yù)測值之間的殘差項(xiàng)符合正態(tài)分布,且基本上可以認(rèn)為殘差項(xiàng)滿足無自相關(guān)和同方差假定.
本文利用多元回歸分析理論建立了相對(duì)收益率對(duì)十項(xiàng)股票因子市凈率、市盈率、資產(chǎn)負(fù)債比率、當(dāng)日漲幅、10日漲跌比率ADR、10日相對(duì)強(qiáng)弱指標(biāo)RSI、當(dāng)日K線值、10日乖離率BIAS、當(dāng)日OBV和30日RSV的多因子選股模型,不僅對(duì)現(xiàn)實(shí)中的優(yōu)質(zhì)選股問題提供了一定的借鑒方法,而且可以將上述模型進(jìn)行推廣運(yùn)用到公司財(cái)務(wù)預(yù)警、水質(zhì)污染評(píng)估、土地儲(chǔ)備風(fēng)險(xiǎn)評(píng)估等各個(gè)領(lǐng)域.
[1]張鐵濤,周紅.財(cái)務(wù)報(bào)表分析[M].北京:清華大學(xué)出版社,2012.
[2]康凱彬.從零開始學(xué)操盤[M].北京:中國紡織出版社,2015.
[3]戴明強(qiáng),宋業(yè)新.數(shù)學(xué)模型及其應(yīng)用[M].北京:科學(xué)出版社,2015.
[4]李健.金融學(xué)[M].北京:高等教育出版社,2014.
[5]戴國強(qiáng).貨幣銀行學(xué)[M].上海:上海財(cái)經(jīng)大學(xué)出版社,2012.
(責(zé)任編輯:陳衍峰)
10.13877/j.cnki.cn22-1284.2016.08.014
2016-03-12
國家自然科學(xué)基金資助項(xiàng)目“隨機(jī)動(dòng)力系統(tǒng)的非一致指數(shù)二分性及其數(shù)值模擬”(11301001)
黃宏運(yùn),安徽合肥人,安徽財(cái)經(jīng)大學(xué)金融學(xué)院在讀;李曉杰,女,安徽阜陽人;朱家明,安徽泗縣人,副教授.
F064.1、O129
A
1008-7974(2016)04-0044-03