麥繼芳,趙海清
(嶺南師范學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,廣東 湛江 524048)
近年來,我國證券市場的快速發(fā)展催生了一批題材股.其中,“高送轉(zhuǎn)”題材股深受國內(nèi)外眾多學(xué)者關(guān)注.對“高送轉(zhuǎn)”預(yù)測問題的研究,現(xiàn)行的主要研究方法有l(wèi)ogistic 回歸分析方法及l(fā)ogistic 模型與其他模型相結(jié)合的分析方法.文獻[1]采用logistic 回歸模型對創(chuàng)業(yè)板上市公司“高送轉(zhuǎn)”的影響因素進行分析,研究結(jié)果表明:創(chuàng)業(yè)板上市公司“高送轉(zhuǎn)”的主要影響因素是公司總市值及其股價.文獻[2]使用logistic 回歸模型與主成分分析相結(jié)合的方法,構(gòu)建高送轉(zhuǎn)股票的預(yù)測模型,預(yù)測準確度最高可達80.91%.文獻[3]運用logistic 回歸模型和支持向量機集成的方法對上市公司是否實施“高送轉(zhuǎn)”行為進行預(yù)測分析.文獻[4]采用 logistic 回歸和決策樹方法構(gòu)建兩種預(yù)測模型,最后基于損失函數(shù)確定權(quán)重將兩種預(yù)測模型按權(quán)重進行線性組合建立組合模型,預(yù)測準確度最高可達85.19%.筆者在已有的研究基礎(chǔ)上,結(jié)合灰色預(yù)測模型與支持向量回歸模型的優(yōu)勢,混合應(yīng)用灰色預(yù)測模型與支持向量回歸模型對上市公司是否“高送轉(zhuǎn)”進行預(yù)測分析.
Lasso 方法[5]是將參數(shù)估計與變量選擇同時進行的一種正則化方法.它通過構(gòu)造一個懲罰函數(shù),使得一些不顯著變量的系數(shù)壓縮為零的方式進行特征變量選擇,其參數(shù)估計公式為:
其中,X(1)為X(0)進行一次累加得到的序列,序列為X(1)={X(1)(k),k=1,2,…,n},序列X(0)={X(0)(i),i=1,2,…,n}為一非負單調(diào)原始數(shù)據(jù)序列.灰色預(yù)測模型的優(yōu)點是預(yù)測精度高,參數(shù)估計方法簡單.
數(shù)據(jù)源自2012 至2019 年的滬深股市A 股,共3 466 個上市公司的樣本數(shù)據(jù).結(jié)合現(xiàn)有的數(shù)據(jù)特征,筆者挑選20 個特征變量進行研究分析(見表1).
表1 初步篩選的變量
在進行模型構(gòu)建前,若沒有對數(shù)據(jù)進行合理的清洗就直接用于建立模型,會導(dǎo)致模型的擬合結(jié)果出現(xiàn)嚴重偏差,因此在建模之前對數(shù)據(jù)進行清洗就顯得尤為必要.數(shù)據(jù)預(yù)處理過程分3 個步驟完成:(1)缺失數(shù)據(jù)的處理.由于原始數(shù)據(jù)量大,缺失數(shù)據(jù)占比非常少,直接刪除缺失樣本數(shù)據(jù)對后續(xù)問題分析影響不大,因此對缺失樣本數(shù)據(jù)采取直接刪除的處理方式.(2)異常值處理.利用3σ原則對異常值進行處理,將超過上下限的極端值分別用-3*σ或+3*σ替代[9].(3)為了消除數(shù)據(jù)的量綱影響,便于不同量級的指標(biāo)能夠進行加權(quán)和比較,對所有的特征數(shù)據(jù)進行標(biāo)準化處理.
若自變量間存在高度相關(guān)關(guān)系,模型估計的準確性將會降低,甚至?xí)霈F(xiàn)違背經(jīng)濟意義的現(xiàn)象.為了識別自變量間是否存在高度相關(guān)關(guān)系,對自變量進行相關(guān)性分析.由表2 可知,x2和x4、x2和x5的、x4和x5、x6和x7、x6和x8之間的Pearson 相關(guān)系數(shù)分別為0.98、0.64、0.64、0.98、-0.62,表明自變量間存在多重共線性問題.
表2 各自變量間的Pearson 相關(guān)系數(shù)
由相關(guān)性結(jié)果分析可知,自變量間存在多重共線性問題,需對自變量進行篩選處理.利用Lasso 算法進行變量篩選,對公式(1)的中的參數(shù)進行求解,對于每個給定y值,該算法會尋找一個最優(yōu)的λ,使得某些系數(shù)壓縮為零,從而達到特征變量選擇的目的.使用python 編程計算得出自變量的系數(shù) .由計算結(jié)果可知,凈資產(chǎn)收益率(x1)、每股收益(x5)、速動比率(x7)、資產(chǎn)負債率(x8)、流動資產(chǎn)周轉(zhuǎn)率(x11)、凈利潤同比增長(x15)、每股資本公積(x17)和每股未分配利潤(x18)這8 個自變量的系數(shù)表現(xiàn)為非零,其他12 個自變量的系數(shù)全部為零(表現(xiàn)不顯著).因此,剔除系數(shù)為零的自變量.
進一步分析可知,凈資產(chǎn)收益率(x1)、每股資本公積(x17)和每股未分配利潤(x18)可看作為一個公司盈利的一部分,能確保獲得一定的盈利空間,這可作為送轉(zhuǎn)股的前提條件. 從公司管理者的視角分析來看,公司是否能分配到利潤、盈余公積和資本可對公司實施“高送轉(zhuǎn)”方案起到關(guān)鍵性作用.
每股收益(x5)與“高送轉(zhuǎn)”行為之間有著較強的正相關(guān)關(guān)系.王琛[8]在中小板上市公司股票“高送轉(zhuǎn)”市場反應(yīng)及影響因素研究中也證實了當(dāng)中小板上市公司的股價越高,公司實施“高送轉(zhuǎn)”方案的可能性越大.眾所周知,我國證券市場以中小投資者為主,過高的股價會讓他們產(chǎn)生“恐高情緒”,不利于投資者投資,股價過低又會使變現(xiàn)成本高.所以當(dāng)股價過高時,企業(yè)通過拆分股票等行為讓股價降低,從而激發(fā)投資活力.因此,股價越高的公司越容易發(fā)生“高送轉(zhuǎn)”行為.又由于速動比率(x7)=速動資產(chǎn)/流動負債*100%,即速動比率越高,企業(yè)的速動資產(chǎn)越多,更傾向于發(fā)生“高送轉(zhuǎn)”行為.
資產(chǎn)負債率(x8)、流動資產(chǎn)周轉(zhuǎn)率(x11)和凈利潤同比增長(x15)都與企業(yè)實施“高送轉(zhuǎn)”行為成反比,即資產(chǎn)負債率、流動資產(chǎn)周轉(zhuǎn)率和凈利潤同比增長越低,企業(yè)實施“高送轉(zhuǎn)”的可能性越高.綜上,以上結(jié)論與實際情況基本相吻合.
首先,對2012—2018 年的數(shù)據(jù)(本文稱為歷史數(shù)據(jù)集)分別建立logistic 回歸模型和支持向量回歸模型(訓(xùn)練模型);接著,對每個特征因素建立灰色預(yù)測模型,得到各個特征因素2019 年的預(yù)測值;最后,將建立好的訓(xùn)練模型與灰色預(yù)測模型相結(jié)合,對各上市公司2019 年的“高送轉(zhuǎn)”情況進行預(yù)測,并將預(yù)測值與真實值進行對比分析.
基于Lasso 方法挑選出來的特征變量,對2012-2018 年的數(shù)據(jù)分別建立logistic 回歸模型和支持向量回歸模型,所得回歸結(jié)果見表3.由logistic 回歸模型回歸結(jié)果可知,僅有特征變量x5、x7和x17表現(xiàn)顯著,其殘差離差值為:290.74,AIC 值為308.74;由SVR 回歸結(jié)果可知,在3 466 家上市公司中,支持向量數(shù)目達3 277 個,訓(xùn)練誤差率為0.054.
表3 logistic 模型的回歸分析結(jié)果
對2012—2018 年每只股票各影響因素特征值的數(shù)據(jù)建立灰色預(yù)測模型,預(yù)測出2019 年各影響因素的特征值.以下以第一支股票為例,表4 展示了第一支股票2019 年各影響因素特征值的預(yù)測結(jié)果,由于篇幅原因,以下僅展示本文第一支股票x7與x18的真實值與預(yù)測值的對比效果.該只股票所有變量的預(yù)測效果都通過預(yù)測精度檢驗.圖1 顯示了自變量與的預(yù)測值x7與x18真實值較接近,再次驗證了這兩個特征變量的預(yù)測效果良好.
表4 第一支股票2019 年各變量預(yù)測值
將以上各個特征的灰色預(yù)測模型預(yù)測結(jié)果分別代入已構(gòu)建好的logistic 回歸模型和支持向量回歸模型中進行擬合,比較分析以上兩種方法得到的測試結(jié)果(見表5).由表5 可知,混合應(yīng)用灰色預(yù)測模型與支持向量回歸模型預(yù)測的準確率約為94.52%,而混合應(yīng)用灰色預(yù)測模型與logistic 回歸模型預(yù)測的準確率約為71.12%,前者比后者的預(yù)測準確率大約提高了23.40%,表明前者所得預(yù)測效果更加接近真實情況.圖1 為灰色預(yù)測模型與支持向量回歸模型混合應(yīng)用的預(yù)測值與真實值的對比分析結(jié)果.結(jié)果顯示,除了少部分預(yù)測值有所偏離真實值,大部分預(yù)測值與真實值近乎重合,再次證明了混合應(yīng)用灰色預(yù)測模型和支持向量回歸模型相結(jié)合的研究方法更適用于預(yù)測上市公司“高送轉(zhuǎn)”情況.
表5 模型預(yù)測結(jié)果比較
圖1 預(yù)測值與真實值對比圖
筆者通過混合應(yīng)用灰色預(yù)測模型和支持向量回歸模型對上市公司是否實施“高送轉(zhuǎn)”進行研究.首先,使用Pearson 相關(guān)系數(shù)分析方法進行分析,發(fā)現(xiàn)自變量間存在嚴重的多重共線性現(xiàn)象.因此,使用Lasso 變量選擇方法進行變量選擇,得到8 個影響的因子.基于Lasso 方法挑選出來的特征變量,對歷史數(shù)據(jù)分別建立logistic 回歸模型和支持向量回歸模型(訓(xùn)練模型),緊接著建立灰色預(yù)測模型,得到各個影響因素2019 年的預(yù)測值.再將灰色預(yù)測分析的結(jié)果分別代入以上兩個訓(xùn)練模型中,預(yù)測各個上市公司2019年的“高送轉(zhuǎn)”實施情況.通過比較分析預(yù)測值與真實值的結(jié)果,證明了灰色預(yù)測模型和支持向量回歸模型相結(jié)合預(yù)測上市公司是否實施“高送轉(zhuǎn)”更可靠.