石好+邢小艷
【摘要】近年來高送轉(zhuǎn)題材受到投資者的追捧,但是對高送轉(zhuǎn)股票的預(yù)測模型多采用主觀性較強(qiáng)的打分排序法。本文深入分析了各主要因素對高送轉(zhuǎn)行為的影響程度,采用Logistic回歸與主成分分析相結(jié)合的方法,構(gòu)建了年報高送轉(zhuǎn)股票的預(yù)測模型,并用2009~2015年高送轉(zhuǎn)股票樣本數(shù)據(jù)對模型進(jìn)行了驗證。實證結(jié)果顯示,模型正確率在55%以上,預(yù)測準(zhǔn)確度最高可達(dá)80.91%。
【關(guān)鍵詞】高送轉(zhuǎn) logistic回歸 主成分分析
一、引言
高送轉(zhuǎn)股票(簡稱—高送轉(zhuǎn))是高比例送股或高比例轉(zhuǎn)股的統(tǒng)稱。一般10股送轉(zhuǎn)合計5股(包括5股)以上才為高送轉(zhuǎn)。
對投資者而言,實施高送轉(zhuǎn)被看作重大利好消息,如果能夠提前介入市場,在分享除權(quán)前的超額收益的同時,也可從除權(quán)后的填權(quán)行情中獲利。因此,為了賺取盡可能高的超額收益,如何準(zhǔn)確預(yù)測可能實施高送轉(zhuǎn)的公司就成為關(guān)鍵。
本文嘗試主成分分析與logistic回歸相結(jié)合的方法構(gòu)建高送轉(zhuǎn)預(yù)測模型,該方法既避免了市場上常用的打分排序法在指標(biāo)選取和權(quán)重分配上的主觀性,又通過降維解決了多元回歸中的多重共線性問題,還可以比較各個主要因素對高送轉(zhuǎn)行為的影響程度,并對未來實施高送轉(zhuǎn)的概率進(jìn)行直接估計。因此,從方法的科學(xué)性和嚴(yán)謹(jǐn)性角度,本文的研究方法更具優(yōu)勢。
二、研究設(shè)計
(一)主成分分析與logistic回歸原理
主成分分析,它通過變量變換的方法把相關(guān)的變量變?yōu)槿舾刹幌嚓P(guān)的綜合指標(biāo)變量[4],從而實現(xiàn)對數(shù)據(jù)集的降維,使得問題得以簡化。
邏輯回歸模型是一個非線性模型[5],但是它本質(zhì)上又是一個線性回歸模型,是二項分類因變量常用的統(tǒng)計分析方法。
(二)影響高送轉(zhuǎn)實施的主要因素
對高送轉(zhuǎn)行為進(jìn)行量化,變量名為gsz,如果公司實施了高送轉(zhuǎn),gsz=1;否則,gsz=0。影響上市公司實施高送轉(zhuǎn)的因素有很多,包括市場環(huán)境、財務(wù)狀態(tài)、股價表現(xiàn)和監(jiān)管層政策等。經(jīng)研究驗證后,本文選取因素如下:每股凈資產(chǎn)(mgjzc)、每股資本公積金(mgzbgj)、每股未分利潤(mgwflr)、每股現(xiàn)金凈流量(mgxjjll)、上市時間(years)、股價(price)、股本(gb)。
(三)高送轉(zhuǎn)預(yù)測模型的構(gòu)建
在線性回歸模型中,若解釋變量之間存在精確相關(guān)關(guān)系或高度相關(guān)關(guān)系,會導(dǎo)致模型估計失真,所以本文采用主成分分析法消除自變量之間的共線性性,以便使模型更加準(zhǔn)確。
首先對上文所述自變量提取主成分,具體形式如下:
其中式中l(wèi)n(.)為自然對數(shù),pi是第i個樣本實施高送轉(zhuǎn)的概率。β0,β1,…,βs是回歸系數(shù),εi為隨機(jī)擾動項。
然后利用pi的大小來判斷樣本股票是否發(fā)生高送轉(zhuǎn)。若pi>0.5,則認(rèn)為該樣本股票實施高送轉(zhuǎn),gsz=1;否則,該樣本股票不實施高送轉(zhuǎn),gsz=0。
三、數(shù)據(jù)來源與處理
(一)數(shù)據(jù)選取
本文擬選取了2009~2015年間所有A股為樣本。上市公司的利潤分配方案包括中期方案和年度方案,從歷年情況來看,中期方案的高送轉(zhuǎn)股票較少,本文只考慮年度方案?;赥年年報做出的送轉(zhuǎn)方案,其對應(yīng)的高送轉(zhuǎn)實施年份一般在T+1年中期,即存在財務(wù)年份和實施年份的區(qū)別,本文統(tǒng)一選取實施年份為高送轉(zhuǎn)年份,即,基于T年年報在T+1年實施的高送轉(zhuǎn)行為定義為T+1年高送轉(zhuǎn)。
假定在T年年末預(yù)測T+1年實施高送轉(zhuǎn)的股票,因為此時T年年報未出,為了保持建模與預(yù)測一致性,每股凈資產(chǎn)等財務(wù)數(shù)據(jù)統(tǒng)一選取T年三季報數(shù)據(jù),股價等非財務(wù)數(shù)據(jù)統(tǒng)一選取T年最后一個交易日數(shù)據(jù)。本文數(shù)據(jù)均來源于TinySoft金融數(shù)據(jù)庫。
(二)數(shù)據(jù)處理
為了消除由于計量單位和數(shù)量級不同對回歸模型產(chǎn)生的影響,本文對變量進(jìn)行了Z值標(biāo)準(zhǔn)化的去量綱處理。
(三)統(tǒng)計量描述
我們把2009~2015年股票按照是否實施高送轉(zhuǎn)分為兩組,分別考察每年每股凈資產(chǎn)、每股資本公積等因子的差異情況,發(fā)現(xiàn)各指標(biāo)存在顯著差異性,表明這些指標(biāo)對高送轉(zhuǎn)行情是有一定識別作用。
四、實證分析
本文以2015年高送轉(zhuǎn)股票的預(yù)測為例,來實證上述模型的有效性,即用2014年高送轉(zhuǎn)股票數(shù)據(jù)預(yù)判2015年高送轉(zhuǎn)股票,其它年份方法類似。
(一)主要變量相關(guān)性分析
我們考察了2014年A股股票各變量之間的相關(guān)系數(shù),發(fā)現(xiàn)每股凈資產(chǎn)與每股資本公積、每股凈資產(chǎn)與每股未分配利潤之間相關(guān)性較高,為了使模型結(jié)果更加準(zhǔn)確,本文通過主成分分析法提取主成分來有效避免多重共線性。
(二)主成分提取
首先對樣本進(jìn)行主成分分析,我們選擇七個變量為主成分分析的對象,分析結(jié)果見表1:
如表1所示,前5個主成分的累計貢獻(xiàn)率為92.68%,說明前5個主成分已經(jīng)反映原來7個指標(biāo)92.68%的信息,因此確定選擇前5個主成分建立模型??梢愿鶕?jù)系數(shù)矩陣B,可以給出主成分的表達(dá)式:
(F1,F(xiàn)2,F(xiàn)3,F(xiàn)4,F(xiàn)5)=(mgjzc,mgzbgj,mgwflr,mgxjjll,years,price,gb)*B (1)
(三)模型建立
對2014年高送轉(zhuǎn)股票的logistic模型,運用SAS9.3對模型參數(shù)進(jìn)行極大似然估計,得到模型估計結(jié)果發(fā)現(xiàn):變量F4的p值為0.1849,即使在顯著性水平為0.1的情況下也不顯著,即F4對gsz(是否高送轉(zhuǎn))并無顯著影響。因此,我們可將F4從模型中剔除,重新建立Logistic回歸模型。
運用SAS9.3對模型參數(shù)進(jìn)行估計,得到模型整體檢驗結(jié)果中似然比、評分及Wald的p值都<0.0001,另外,模型回歸系數(shù)檢驗結(jié)果如表2:
由表2可知,在0.05的顯著水平下,F(xiàn)1、F2、F3和F5對gsz(是否高送轉(zhuǎn))具有顯著影響。根據(jù)表2中的參數(shù)估計值,我們可以把2014年高送轉(zhuǎn)的logistic回歸模型改寫為:
則股票發(fā)生高送轉(zhuǎn)的概率為:
(四)模型結(jié)果
將股票數(shù)據(jù)代入模型中,可預(yù)測出2015年A股股票發(fā)生高送轉(zhuǎn)事件的概率,若p>=0.5則認(rèn)為該只股票實施了高送轉(zhuǎn),否則不實施。預(yù)測出147只股票會發(fā)生高送轉(zhuǎn),與2015年真實實施高送轉(zhuǎn)股票對比,準(zhǔn)確率達(dá)62.80%.
為了模型穩(wěn)健性,下面采用同樣的方法對2010~2014的高送轉(zhuǎn)股票進(jìn)行預(yù)測,預(yù)測準(zhǔn)確率分別為69.77%、80.91%、66.10%、56.94%、55%。
可以看出本文模型對高送轉(zhuǎn)股票的預(yù)測準(zhǔn)確率維持在55%以上,其中2011年的準(zhǔn)確率高達(dá)80.91%。
五、結(jié)論
每股凈資產(chǎn)、每股資本公積、每股未分配利潤、每股現(xiàn)金凈流量和股價對公司實施高送轉(zhuǎn)具有顯著的正面作用,這意味著這些變量越高,公司實施高送轉(zhuǎn)的概率越大。上市年限和股本對公司實施高送轉(zhuǎn)具有顯著的負(fù)作用,意味著這兩變量越高,公司實施高送轉(zhuǎn)概率越小。
作者簡介:石好(1989-),女,漢族,湖北黃石人,就讀于華南理工大學(xué),研究方向:隨機(jī)分析與金融工程;邢小艷(1989-),女,漢族,河南人,畢業(yè)于于華南理工大學(xué),研究方向:隨機(jī)分析與金融工程。