張 紅,高 帥,張 洋
(1.清華大學(xué) 建設(shè)管理系,北京100084;2.北京林業(yè)大學(xué) 經(jīng)濟(jì)管理學(xué)院,北京100083)
基于主成分分析和支持向量機(jī)的企業(yè)盈利能力預(yù)測
張 紅1,高 帥1,張 洋2
(1.清華大學(xué) 建設(shè)管理系,北京100084;2.北京林業(yè)大學(xué) 經(jīng)濟(jì)管理學(xué)院,北京100083)
文章針對中國建筑業(yè)上市公司樣本規(guī)模較小,常規(guī)預(yù)測方法難以奏效的特點(diǎn),嘗試將支持向量機(jī)應(yīng)用于其盈利能力預(yù)測。首先從不同的角度選擇盈利能力單項(xiàng)指標(biāo),以此為基礎(chǔ)構(gòu)建反映公司盈利能力的集成指標(biāo),結(jié)合2001—2014年中國A股建筑業(yè)上市公司的數(shù)據(jù),構(gòu)建基于支持向量的盈利能力預(yù)測模型,對樣本公司的盈利能力進(jìn)行預(yù)測。研究結(jié)果顯示,經(jīng)過訓(xùn)練的支持向量機(jī)模型能較為成功地預(yù)測樣本公司的盈利能力,2003—2014年的預(yù)測準(zhǔn)確率均超過80%;通過與BP神經(jīng)網(wǎng)絡(luò)的對比試驗(yàn)可以發(fā)現(xiàn),在預(yù)測中國建筑業(yè)上市公司盈利能力方面,支持向量機(jī)表現(xiàn)出了較明顯的優(yōu)勢。
盈利能力;預(yù)測;建筑業(yè)上市公司;支持向量機(jī);主成分分析
盈利能力預(yù)測屬于模式識別范疇。目前常用的模式識別方法包括數(shù)據(jù)挖掘、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)[1]。數(shù)據(jù)挖掘是從大量數(shù)據(jù)中自動搜索某種蘊(yùn)含特殊關(guān)系信息的過程,對數(shù)據(jù)量有較高要求。人工神經(jīng)網(wǎng)絡(luò)是一種應(yīng)用類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型,在大樣本條件下能得到較好的識別效果。然而其網(wǎng)絡(luò)結(jié)構(gòu)需事先指定,難以保證網(wǎng)絡(luò)結(jié)構(gòu)的最優(yōu)化,易陷入局部最優(yōu)的困境。支持向量機(jī)是基于統(tǒng)計學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險最小原理的模式識別方法,主要針對小樣本,且通過核函數(shù)可解決局部最優(yōu)的問題。中國建筑業(yè)上市公司的數(shù)量較少(2012年A股建筑業(yè)上市公司有52家,占A股上市公司總數(shù)的2%),難以滿足數(shù)據(jù)挖掘和人工神經(jīng)網(wǎng)絡(luò)大樣本的要求。相比而言,支持向量機(jī)主要對小樣本進(jìn)行模式識別,更適用于中國建筑業(yè)上市公司盈利能力分析。目前該方法被廣泛用于投資風(fēng)險評價和企業(yè)信用評價等評價領(lǐng)域[2]。本文首次將其應(yīng)用于企業(yè)盈利能力預(yù)測,這是對支持向量機(jī)應(yīng)用范圍的拓展,同時也是對盈利能力分析的一種全新嘗試。
盈利能力預(yù)測的前提是選擇合適的反映盈利能力的指標(biāo)。目前常用的指標(biāo)包括“資產(chǎn)收益率”、“凈資產(chǎn)收益率”、“資本利潤率”、“每股收益”、“主營業(yè)務(wù)利潤率”和“銷售利潤率”[3,4]等。上述指標(biāo)從不同的角度反映了企業(yè)的盈利能力。然而不同角度的指標(biāo)在同一時期內(nèi)往往呈現(xiàn)不同的趨勢[5],因此很難憑借單個指標(biāo)對企業(yè)的盈利能力進(jìn)行客觀的評價。為全面、系統(tǒng)地衡量企業(yè)盈利能力,本文將采用主成分分析法創(chuàng)建一個量化盈利能力的集成指標(biāo),以避免單個指標(biāo)相互沖突的問題。
由此,本文以中國建筑業(yè)上市公司為樣本,首先基于既有研究選擇反映盈利能力的單項(xiàng)指標(biāo),并采用主成分分析法創(chuàng)建集成指標(biāo);其次,構(gòu)建盈利能力預(yù)測的支持向量機(jī)模型;最后,選取部分建筑業(yè)上市公司為訓(xùn)練樣本,采用支持向量機(jī)模型對部分樣本進(jìn)行盈利能力預(yù)測訓(xùn)練,并進(jìn)一步對其余樣本的盈利能力進(jìn)行預(yù)測判斷。
1.1 盈利能力單項(xiàng)指標(biāo)的選擇與分析
在既有研究的基礎(chǔ)上,本文分別從資產(chǎn)利用效率、股東權(quán)益、資本利用效率、股票投資回報、主營業(yè)務(wù)收益能力以及銷售收入獲利水平這6個角度選擇反映上市公司盈利能力的單項(xiàng)指標(biāo):資產(chǎn)收益率、凈資產(chǎn)收益率、資本利潤率、每股收益、主營業(yè)務(wù)利潤率和銷售利潤率。各指標(biāo)的涵義與計算公式如表1所示。
表1 盈利能力單項(xiàng)指標(biāo)及其涵義
根據(jù)中國證監(jiān)會制定的《上市公司行業(yè)分類指引》,本文選擇2001—2014年中國A股的建筑業(yè)上市公司為樣本,對其盈利能力單項(xiàng)指標(biāo)進(jìn)行統(tǒng)計分析,結(jié)果如表2所示。
表2 2001—2014年中國建筑業(yè)上市公司盈利能力單項(xiàng)指標(biāo)均值
分析表2可知,(1)當(dāng)以資產(chǎn)收益率衡量盈利能力時,2001—2014年樣本公司總體盈利能力變動較?。唬?)若以凈資產(chǎn)收益率、主營業(yè)務(wù)利潤率和銷售利潤率作為盈利能力代表指標(biāo),則樣本公司總體盈利能力起伏較大;凈資產(chǎn)收益率均值在2006年跌至谷底(-0.161),在2009年攀升至峰頂(0.686),此后又迅速回落;銷售利潤率均值在2007年到達(dá)最低點(diǎn)(-0.094),而2009年出現(xiàn)最大值(0.317);(3)當(dāng)以資本利潤率和每股收益衡量盈利能力時,14年間樣本公司盈利能力總體呈上升趨勢。
由此可見,當(dāng)從不同角度考察建筑業(yè)上市公司的盈利能力時,不同的單項(xiàng)指標(biāo)表現(xiàn)出不同的變化趨勢,很難憑借單個指標(biāo)對盈利能力做出總體判斷。為合理、客觀以及全面地反映中國建筑業(yè)上市公司的盈利能力,有必要構(gòu)建一個集成指標(biāo)。
1.2 盈利能力集成指標(biāo)的構(gòu)建
利用主成分分析法構(gòu)建盈利能力集成指標(biāo),首先須對單項(xiàng)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理,計算因子的特征值及其方差貢獻(xiàn)率;其次,根據(jù)方差貢獻(xiàn)率確定主成分因子;然后,根據(jù)成分矩陣和特征值計算特征向量,并結(jié)合標(biāo)準(zhǔn)化的單項(xiàng)指標(biāo)數(shù)據(jù)確定主成分因子;最后,以方差貢獻(xiàn)率為系數(shù)對主成分因子進(jìn)行線性組合,得到集成指標(biāo)。
本文結(jié)合中國A股建筑業(yè)上市公司2001—2014年的數(shù)據(jù)(共593個樣本),利用SPSS統(tǒng)計分析軟件對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,利用處理后的數(shù)據(jù)進(jìn)行因子分析,得到包含原始指標(biāo)所有信息的因子Yi(i=1,2,…,6)。各因子的特征值和方差貢獻(xiàn)率,如表3所示。各因子對應(yīng)的主成分矩陣如表4所示。
表3 主成分因子的特征值和方差貢獻(xiàn)率
表4 成分矩陣
由表3可知,前3個因子Y1、Y2和Y3的累積方差貢獻(xiàn)率達(dá)到93.7%,滿足累積方差貢獻(xiàn)率超過85%的原則,可將其作為主成分因子。結(jié)合表4的成分矩陣,選取Y1、Y2和Y3的成分向量,利用以下公式計算主成分特征向量。
按照式(1)可計算出主成分Y1、Y2和Y3的特征向量,如表5所示。
表5 主成分特征向量
根據(jù)表5的主成分特征向量,可將每個主成分表達(dá)為原指標(biāo)(標(biāo)準(zhǔn)化后的數(shù)據(jù))的線性函數(shù),如式(2)至式(4)所示。
其中,ZX表示經(jīng)過標(biāo)準(zhǔn)化的單項(xiàng)指標(biāo)數(shù)據(jù)。
結(jié)合表3的方差貢獻(xiàn)率,可構(gòu)造出反映盈利能力的集成指標(biāo)P:
利用樣本公司2001—2014年的數(shù)據(jù),可計算出各年度建筑業(yè)上市公司綜合盈利能力指標(biāo)均值,如表6所示。
表6 中國建筑業(yè)上市公司盈利能力集成指標(biāo)均值
由表6可知,2001—2008年,中國建筑業(yè)上市公司綜合盈利能力指標(biāo)P的均值小于0,而2009-2012年P(guān)均值大于0,這說明2001—2008年樣本公司總體盈利能力較差,而2009—2012年總體盈利能力較好。P均值經(jīng)歷了2001—2005年的下跌,2005—2010年的上漲,2010—2014年的回落,這說明中國建筑業(yè)上市公司總體盈利能力起伏較大。
基于支持向量機(jī)建立建筑業(yè)上市公司盈利能力預(yù)測模型的基本思路是:
第一階段,選擇適當(dāng)?shù)暮撕瘮?shù)和參數(shù)構(gòu)建支持向量機(jī)。上文提到,核函數(shù)是支持向量機(jī)的重要組成部分。常用的核函數(shù)有4類:線性核函數(shù)、多項(xiàng)式核函數(shù)、Sigmoid核函數(shù)和徑向基核函數(shù)(RBF)。目前大部分學(xué)者推薦使用RBF[6]。RBF能有效處理非線性和高維的識別問題。RBF所得的分類器在形式上與神經(jīng)網(wǎng)絡(luò)比較類似,但其網(wǎng)絡(luò)結(jié)構(gòu)、分類器中心以及網(wǎng)絡(luò)權(quán)重由二次優(yōu)化算法自動確定。RBF模型中包括兩個重要的參數(shù),懲罰參數(shù)C和核參數(shù)γ。參數(shù)選擇不當(dāng)將會對最終的分類超平面產(chǎn)生嚴(yán)重的影響,由于這兩個參數(shù)沒有通常的規(guī)律,常使用網(wǎng)格與交叉驗(yàn)證來進(jìn)行選擇。本文利用LIBSVM軟件包完成支持向量機(jī)的參數(shù)選擇工作[7]。
第二階段,建立訓(xùn)練樣本對支持向量機(jī)進(jìn)行預(yù)測訓(xùn)練。以建筑業(yè)上市公司第t年和t+1年的數(shù)據(jù)作為訓(xùn)練樣本。將樣本公司第t年的6個盈利能力單項(xiàng)指標(biāo)作為支持向量機(jī)模型的輸入量;把樣本公司第t+1年的盈利能力劃分為+1(盈利能力集成指標(biāo)P大于0)和-1(盈利能力集成指標(biāo)P小于0)兩類,以+1和-1作為模型的輸出量,形成支持向量機(jī)預(yù)測模型的基本框架。借助LIBSVM軟件包和MATLAB商用軟件對樣本進(jìn)行訓(xùn)練,得到支持向量xi、最優(yōu)解的拉格朗日乘子α*i和分類閾值b*。
第三階段,利用訓(xùn)練好的支持向量機(jī)進(jìn)行建筑業(yè)上市公司盈利能力預(yù)測。將樣本公司第t+1年的6個盈利能力單項(xiàng)指標(biāo)輸入訓(xùn)練好的預(yù)測模型,根據(jù)輸出量對其t+2年的綜合盈利能力進(jìn)行預(yù)測。
這里采用支持向量機(jī)模型進(jìn)行中國建筑業(yè)上市公司盈利能力預(yù)測。首先根據(jù)已有理論與研究建立支持向量機(jī)預(yù)測模型,這一工作由軟件(LIBSVM+MATLAB)實(shí)現(xiàn);其次利用第t年和t+1年的數(shù)據(jù)對訓(xùn)練樣本進(jìn)行訓(xùn)練;最后基于訓(xùn)練完畢的支持向量機(jī)模型預(yù)測中國建筑業(yè)上市公司第t+2年的盈利能力。
3.1 訓(xùn)練樣本的建立
本文利用相鄰兩年的數(shù)據(jù)建立訓(xùn)練樣本對支持向量機(jī)進(jìn)行訓(xùn)練,以經(jīng)過訓(xùn)練的模型預(yù)測中國建筑業(yè)上市公司下一年度的盈利能力。即2001—2013年的13年間,可建立12個訓(xùn)練組,利用這些訓(xùn)練組對模型進(jìn)行訓(xùn)練,可依次預(yù)測中國建筑業(yè)上市公司2003—2014年的盈利能力。這里將以2001年和2002年的數(shù)據(jù)(訓(xùn)練組1)為例,詳細(xì)說明模型的訓(xùn)練過程。
2001年中國A股共有23家建筑業(yè)上市公司,2002年在此基礎(chǔ)上增加了一家公司。為保證樣本的匹配,以2001年的23家公司為訓(xùn)練樣本,將其按照A1-A23編號。利用2001年的6個單項(xiàng)盈利能力指標(biāo)作為輸入向量,擬合2002年的綜合盈利能力狀況,輸出值為+1和-1,分別對應(yīng)2002年綜合盈利能力指標(biāo)P大于0和小于0的情況。訓(xùn)練樣本的原始數(shù)據(jù)和訓(xùn)練結(jié)果如表7所示。
表7 訓(xùn)練樣本的原始數(shù)據(jù)和訓(xùn)練結(jié)果
由表7可知,在2002年23個訓(xùn)練樣本中,盈利能力良好(集成指標(biāo)P大于0)的公司有6家,而盈利能力較差(集成指標(biāo)P大于0)的公司有17家;從訓(xùn)練的結(jié)果來看,23個樣本的模擬結(jié)果均為-1,即模型正確地判斷出了17家公司的盈利能力,說明支持向量機(jī)能對73.9%的訓(xùn)練樣本進(jìn)行正確分類。
以上是第一組訓(xùn)練樣本。類似地,結(jié)合2002年和2003年的數(shù)據(jù)可構(gòu)建第2組訓(xùn)練樣本,2001年到2011年總共可建立10組訓(xùn)練樣本。利用訓(xùn)練樣本即可進(jìn)行公司下一年盈利能力的預(yù)測。
3.2 盈利能力預(yù)測
本文采用訓(xùn)練好的支持向量機(jī)模型對2003—2014年中國建筑業(yè)上市公司盈利能力進(jìn)行預(yù)測。這里沿用2001年和2002年的訓(xùn)練結(jié)果,具體闡述預(yù)測方法。上文提到,根據(jù)第t年和t+1年的數(shù)據(jù)得到的訓(xùn)練結(jié)果,可預(yù)測公司t+ 2年的盈利能力。即利用2001年和2002年的數(shù)據(jù),可預(yù)測23家樣本公司2003年的盈利能力。具體做法是將樣本公司2002年的6個單項(xiàng)盈利能力指標(biāo)作為輸入向量,利用訓(xùn)練好的模型預(yù)測2003年的綜合盈利能力。輸入的原始數(shù)據(jù)和預(yù)測結(jié)果如表8所示。
表8 預(yù)測樣本的原始數(shù)據(jù)和預(yù)測結(jié)果
由表8可以看出,根據(jù)綜合盈利能力指標(biāo)P判斷,在2003年23個訓(xùn)練樣本中,盈利能力良好的公司有4家,而盈利能力較差的公司有19家;從預(yù)測結(jié)果來看,支持向量機(jī)模型預(yù)測23家公司2003年的盈利能力均較差,說明模型預(yù)測的準(zhǔn)確率為82.6%。
類似地,可以逐年預(yù)測2004—2014年建筑業(yè)上市公司的盈利能力。為考察支持向量機(jī)在企業(yè)盈利能力預(yù)測方面是否具備優(yōu)勢,本文建立了BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對比試驗(yàn)。在設(shè)計BP神經(jīng)網(wǎng)絡(luò)時,采用3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):第一層是輸入層,包括6個輸入節(jié)點(diǎn);第二層是隱層,包含20個節(jié)點(diǎn);第三層為輸出層,包含2個輸出節(jié)點(diǎn)。神經(jīng)網(wǎng)絡(luò)的輸出內(nèi)容同樣為+1或-1。支持向量機(jī)與神經(jīng)網(wǎng)絡(luò)對比試驗(yàn)的結(jié)果如表9所示。
表9 支持向量機(jī)與神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果對比
由表9可以看出,利用支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)分別對中國建筑業(yè)上市公司盈利能力進(jìn)行預(yù)測,前者的預(yù)測準(zhǔn)確率明顯高于后者。這說明在小樣本的分類實(shí)驗(yàn)中,支持向量機(jī)可能比神經(jīng)網(wǎng)絡(luò)更具優(yōu)勢。
針對中國建筑業(yè)上市公司樣本規(guī)模較小的特點(diǎn),本文創(chuàng)造性地將支持向量機(jī)應(yīng)用于其盈利能力預(yù)測。首先從不同的角度選擇盈利能力單項(xiàng)指標(biāo),以此為基礎(chǔ)構(gòu)建反映公司盈利能力的集成指標(biāo),結(jié)合2001—2014年中國A股建筑業(yè)上市公司的數(shù)據(jù),構(gòu)建基于支持向量的盈利能力預(yù)測模型,對樣本公司的盈利能力進(jìn)行預(yù)測。研究結(jié)果顯示,經(jīng)過訓(xùn)練的支持向量機(jī)模型能較為成功地預(yù)測樣本公司的盈利能力,2003—2014年的預(yù)測準(zhǔn)確率均超過80%;通過與BP神經(jīng)網(wǎng)絡(luò)的對比試驗(yàn)可以發(fā)現(xiàn),在預(yù)測中國建筑業(yè)上市公司盈利能力方面,支持向量機(jī)表現(xiàn)出了較明顯的優(yōu)勢。
本文嘗試建立基于支持向量機(jī)的中國建筑業(yè)上市公司盈利能力預(yù)測模型。研究結(jié)果證明,支持向量機(jī)憑借堅實(shí)的統(tǒng)計學(xué)習(xí)理論基礎(chǔ),具有較強(qiáng)的逼近能力和泛化能力。支持向量機(jī)不僅具有與神經(jīng)網(wǎng)絡(luò)類似的不斷學(xué)習(xí)、不斷訓(xùn)練的功能,而且解決了神經(jīng)網(wǎng)絡(luò)難以避免的大樣本、網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化以及局部最優(yōu)等問題。其對樣本公司盈利能力較為準(zhǔn)確的預(yù)測,也說明了該方法比較適用于建筑業(yè)上市公司盈利能力預(yù)測。
[1]Peng X.TPMSVM:A Novel Twin Parametric-Margin Support Vector Machine for Pattern Recognition[J].Pattern Recognition,2011,44(10).
[2]Chen J,Jiang F,Huang Z,et al.Performance Evaluation for GEM List?ed Companies Based on Support Vector Machine[J].International Journal of Applied Mathematics and Statistics,2013,45(15).
[3]Hoque Z.Measuring Divisional Performance in the Short-Run[J]. Handbook of Cost&Management Accounting,2012.
[4]Yasser Q R.Corporate Governance and Performance(A Case Study for Pakistani Communication Sector)[J].International Journal of Trade, Economics and Finance,2011,2(3).
[5]張紅,林蔭,劉平.基于主成分分析的房地產(chǎn)上市公司盈利能力分析與預(yù)測[J].清華大學(xué)學(xué)報(自然科學(xué)版),2010,(3).
[6]Hsu C W,Chang C C,Lin C J.A Practical Guide to Support Vector Classification[EB/OL].http://www.csie.ntu.edu.tw/~cjlin.
[7]Chang C C,Lin C J.LIBSVM:A Library for Support Vector Machines [EB/OL].http://www.csie.ntu.edu.tw/~cjlin/libsvm.
(責(zé)任編輯/劉柳青)
F830.2
A
1002-6487(2016)23-0174-04
國家自然科學(xué)基金資助項(xiàng)目(71073096)
張 紅(1970—),女,河北大名人,教授,博士生導(dǎo)師,研究方向:房地產(chǎn)經(jīng)濟(jì)與金融。
(通訊作者)高 帥(1980—),男,陜西榆林人,博士,研究方向:房地產(chǎn)金融。
張 洋(1983—),男,安徽靈璧人,博士,講師,研究方向:房地產(chǎn)經(jīng)濟(jì)學(xué)。