国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中國上市公司“高送轉(zhuǎn)”預(yù)測研究
——基于灰色預(yù)測與支持向量回歸模型混合分析

2021-11-22 09:42麥繼芳趙海清
韶關(guān)學(xué)院學(xué)報 2021年9期
關(guān)鍵詞:預(yù)測值灰色向量

麥繼芳,趙海清

(嶺南師范學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,廣東 湛江 524048)

近年來,我國證券市場的快速發(fā)展催生了一批題材股.其中,“高送轉(zhuǎn)”題材股深受國內(nèi)外眾多學(xué)者關(guān)注.對“高送轉(zhuǎn)”預(yù)測問題的研究,現(xiàn)行的主要研究方法有l(wèi)ogistic 回歸分析方法及l(fā)ogistic 模型與其他模型相結(jié)合的分析方法.文獻[1]采用logistic 回歸模型對創(chuàng)業(yè)板上市公司“高送轉(zhuǎn)”的影響因素進行分析,研究結(jié)果表明:創(chuàng)業(yè)板上市公司“高送轉(zhuǎn)”的主要影響因素是公司總市值及其股價.文獻[2]使用logistic 回歸模型與主成分分析相結(jié)合的方法,構(gòu)建高送轉(zhuǎn)股票的預(yù)測模型,預(yù)測準確度最高可達80.91%.文獻[3]運用logistic 回歸模型和支持向量機集成的方法對上市公司是否實施“高送轉(zhuǎn)”行為進行預(yù)測分析.文獻[4]采用 logistic 回歸和決策樹方法構(gòu)建兩種預(yù)測模型,最后基于損失函數(shù)確定權(quán)重將兩種預(yù)測模型按權(quán)重進行線性組合建立組合模型,預(yù)測準確度最高可達85.19%.筆者在已有的研究基礎(chǔ)上,結(jié)合灰色預(yù)測模型與支持向量回歸模型的優(yōu)勢,混合應(yīng)用灰色預(yù)測模型與支持向量回歸模型對上市公司是否“高送轉(zhuǎn)”進行預(yù)測分析.

1 研究方法

1.1 Lasso 方法

Lasso 方法[5]是將參數(shù)估計與變量選擇同時進行的一種正則化方法.它通過構(gòu)造一個懲罰函數(shù),使得一些不顯著變量的系數(shù)壓縮為零的方式進行特征變量選擇,其參數(shù)估計公式為:

1.2 灰色預(yù)測模型

其中,X(1)為X(0)進行一次累加得到的序列,序列為X(1)={X(1)(k),k=1,2,…,n},序列X(0)={X(0)(i),i=1,2,…,n}為一非負單調(diào)原始數(shù)據(jù)序列.灰色預(yù)測模型的優(yōu)點是預(yù)測精度高,參數(shù)估計方法簡單.

1.3 支持向量回歸模型

2 指標(biāo)設(shè)置及數(shù)據(jù)預(yù)處理

數(shù)據(jù)源自2012 至2019 年的滬深股市A 股,共3 466 個上市公司的樣本數(shù)據(jù).結(jié)合現(xiàn)有的數(shù)據(jù)特征,筆者挑選20 個特征變量進行研究分析(見表1).

表1 初步篩選的變量

在進行模型構(gòu)建前,若沒有對數(shù)據(jù)進行合理的清洗就直接用于建立模型,會導(dǎo)致模型的擬合結(jié)果出現(xiàn)嚴重偏差,因此在建模之前對數(shù)據(jù)進行清洗就顯得尤為必要.數(shù)據(jù)預(yù)處理過程分3 個步驟完成:(1)缺失數(shù)據(jù)的處理.由于原始數(shù)據(jù)量大,缺失數(shù)據(jù)占比非常少,直接刪除缺失樣本數(shù)據(jù)對后續(xù)問題分析影響不大,因此對缺失樣本數(shù)據(jù)采取直接刪除的處理方式.(2)異常值處理.利用3σ原則對異常值進行處理,將超過上下限的極端值分別用-3*σ或+3*σ替代[9].(3)為了消除數(shù)據(jù)的量綱影響,便于不同量級的指標(biāo)能夠進行加權(quán)和比較,對所有的特征數(shù)據(jù)進行標(biāo)準化處理.

3 結(jié)果分析與討論

3.1 相關(guān)性分析

若自變量間存在高度相關(guān)關(guān)系,模型估計的準確性將會降低,甚至?xí)霈F(xiàn)違背經(jīng)濟意義的現(xiàn)象.為了識別自變量間是否存在高度相關(guān)關(guān)系,對自變量進行相關(guān)性分析.由表2 可知,x2和x4、x2和x5的、x4和x5、x6和x7、x6和x8之間的Pearson 相關(guān)系數(shù)分別為0.98、0.64、0.64、0.98、-0.62,表明自變量間存在多重共線性問題.

表2 各自變量間的Pearson 相關(guān)系數(shù)

3.2 Lasso 特征變量選擇方法

由相關(guān)性結(jié)果分析可知,自變量間存在多重共線性問題,需對自變量進行篩選處理.利用Lasso 算法進行變量篩選,對公式(1)的中的參數(shù)進行求解,對于每個給定y值,該算法會尋找一個最優(yōu)的λ,使得某些系數(shù)壓縮為零,從而達到特征變量選擇的目的.使用python 編程計算得出自變量的系數(shù) .由計算結(jié)果可知,凈資產(chǎn)收益率(x1)、每股收益(x5)、速動比率(x7)、資產(chǎn)負債率(x8)、流動資產(chǎn)周轉(zhuǎn)率(x11)、凈利潤同比增長(x15)、每股資本公積(x17)和每股未分配利潤(x18)這8 個自變量的系數(shù)表現(xiàn)為非零,其他12 個自變量的系數(shù)全部為零(表現(xiàn)不顯著).因此,剔除系數(shù)為零的自變量.

進一步分析可知,凈資產(chǎn)收益率(x1)、每股資本公積(x17)和每股未分配利潤(x18)可看作為一個公司盈利的一部分,能確保獲得一定的盈利空間,這可作為送轉(zhuǎn)股的前提條件. 從公司管理者的視角分析來看,公司是否能分配到利潤、盈余公積和資本可對公司實施“高送轉(zhuǎn)”方案起到關(guān)鍵性作用.

每股收益(x5)與“高送轉(zhuǎn)”行為之間有著較強的正相關(guān)關(guān)系.王琛[8]在中小板上市公司股票“高送轉(zhuǎn)”市場反應(yīng)及影響因素研究中也證實了當(dāng)中小板上市公司的股價越高,公司實施“高送轉(zhuǎn)”方案的可能性越大.眾所周知,我國證券市場以中小投資者為主,過高的股價會讓他們產(chǎn)生“恐高情緒”,不利于投資者投資,股價過低又會使變現(xiàn)成本高.所以當(dāng)股價過高時,企業(yè)通過拆分股票等行為讓股價降低,從而激發(fā)投資活力.因此,股價越高的公司越容易發(fā)生“高送轉(zhuǎn)”行為.又由于速動比率(x7)=速動資產(chǎn)/流動負債*100%,即速動比率越高,企業(yè)的速動資產(chǎn)越多,更傾向于發(fā)生“高送轉(zhuǎn)”行為.

資產(chǎn)負債率(x8)、流動資產(chǎn)周轉(zhuǎn)率(x11)和凈利潤同比增長(x15)都與企業(yè)實施“高送轉(zhuǎn)”行為成反比,即資產(chǎn)負債率、流動資產(chǎn)周轉(zhuǎn)率和凈利潤同比增長越低,企業(yè)實施“高送轉(zhuǎn)”的可能性越高.綜上,以上結(jié)論與實際情況基本相吻合.

3.3 構(gòu)建預(yù)測模型

首先,對2012—2018 年的數(shù)據(jù)(本文稱為歷史數(shù)據(jù)集)分別建立logistic 回歸模型和支持向量回歸模型(訓(xùn)練模型);接著,對每個特征因素建立灰色預(yù)測模型,得到各個特征因素2019 年的預(yù)測值;最后,將建立好的訓(xùn)練模型與灰色預(yù)測模型相結(jié)合,對各上市公司2019 年的“高送轉(zhuǎn)”情況進行預(yù)測,并將預(yù)測值與真實值進行對比分析.

基于Lasso 方法挑選出來的特征變量,對2012-2018 年的數(shù)據(jù)分別建立logistic 回歸模型和支持向量回歸模型,所得回歸結(jié)果見表3.由logistic 回歸模型回歸結(jié)果可知,僅有特征變量x5、x7和x17表現(xiàn)顯著,其殘差離差值為:290.74,AIC 值為308.74;由SVR 回歸結(jié)果可知,在3 466 家上市公司中,支持向量數(shù)目達3 277 個,訓(xùn)練誤差率為0.054.

表3 logistic 模型的回歸分析結(jié)果

對2012—2018 年每只股票各影響因素特征值的數(shù)據(jù)建立灰色預(yù)測模型,預(yù)測出2019 年各影響因素的特征值.以下以第一支股票為例,表4 展示了第一支股票2019 年各影響因素特征值的預(yù)測結(jié)果,由于篇幅原因,以下僅展示本文第一支股票x7與x18的真實值與預(yù)測值的對比效果.該只股票所有變量的預(yù)測效果都通過預(yù)測精度檢驗.圖1 顯示了自變量與的預(yù)測值x7與x18真實值較接近,再次驗證了這兩個特征變量的預(yù)測效果良好.

表4 第一支股票2019 年各變量預(yù)測值

將以上各個特征的灰色預(yù)測模型預(yù)測結(jié)果分別代入已構(gòu)建好的logistic 回歸模型和支持向量回歸模型中進行擬合,比較分析以上兩種方法得到的測試結(jié)果(見表5).由表5 可知,混合應(yīng)用灰色預(yù)測模型與支持向量回歸模型預(yù)測的準確率約為94.52%,而混合應(yīng)用灰色預(yù)測模型與logistic 回歸模型預(yù)測的準確率約為71.12%,前者比后者的預(yù)測準確率大約提高了23.40%,表明前者所得預(yù)測效果更加接近真實情況.圖1 為灰色預(yù)測模型與支持向量回歸模型混合應(yīng)用的預(yù)測值與真實值的對比分析結(jié)果.結(jié)果顯示,除了少部分預(yù)測值有所偏離真實值,大部分預(yù)測值與真實值近乎重合,再次證明了混合應(yīng)用灰色預(yù)測模型和支持向量回歸模型相結(jié)合的研究方法更適用于預(yù)測上市公司“高送轉(zhuǎn)”情況.

表5 模型預(yù)測結(jié)果比較

圖1 預(yù)測值與真實值對比圖

4 結(jié)語

筆者通過混合應(yīng)用灰色預(yù)測模型和支持向量回歸模型對上市公司是否實施“高送轉(zhuǎn)”進行研究.首先,使用Pearson 相關(guān)系數(shù)分析方法進行分析,發(fā)現(xiàn)自變量間存在嚴重的多重共線性現(xiàn)象.因此,使用Lasso 變量選擇方法進行變量選擇,得到8 個影響的因子.基于Lasso 方法挑選出來的特征變量,對歷史數(shù)據(jù)分別建立logistic 回歸模型和支持向量回歸模型(訓(xùn)練模型),緊接著建立灰色預(yù)測模型,得到各個影響因素2019 年的預(yù)測值.再將灰色預(yù)測分析的結(jié)果分別代入以上兩個訓(xùn)練模型中,預(yù)測各個上市公司2019年的“高送轉(zhuǎn)”實施情況.通過比較分析預(yù)測值與真實值的結(jié)果,證明了灰色預(yù)測模型和支持向量回歸模型相結(jié)合預(yù)測上市公司是否實施“高送轉(zhuǎn)”更可靠.

猜你喜歡
預(yù)測值灰色向量
向量的分解
加拿大農(nóng)業(yè)部下調(diào)2021/22年度油菜籽和小麥產(chǎn)量預(yù)測值
±800kV直流輸電工程合成電場夏季實測值與預(yù)測值比對分析
聚焦“向量與三角”創(chuàng)新題
AI講座:ML的分類方法
淺灰色的小豬
灰色時代
她、它的灰色時髦觀
向量垂直在解析幾何中的應(yīng)用
感覺
宜宾市| 金湖县| 昌邑市| 吉安市| 邢台县| 常德市| 耿马| 雷山县| 池州市| 梅州市| 汉源县| 格尔木市| 沐川县| 临夏市| 临汾市| 乌兰浩特市| 威海市| 邻水| 郁南县| 郓城县| 安阳县| 灌南县| 游戏| 城口县| 湘潭县| 读书| 高青县| 右玉县| 仙桃市| 安塞县| 维西| 二连浩特市| 广南县| 云林县| 上虞市| 应城市| 当雄县| 盐池县| 禄丰县| 泗水县| 阿拉善左旗|