謝凱南
2001年起,國務(wù)院決定在遼寧省啟動個人社保賬戶試點(diǎn),將個人繳費(fèi)工資中占比8%的部分記入個人賬戶。截至2005年底,以遼寧一個省為例,就已經(jīng)累積落實(shí)個人賬戶資金201億元。隨著上述政策在遼寧落地,國務(wù)院決定將試點(diǎn)擴(kuò)大至吉林、黑龍江、天津、山西、上海、江蘇、浙江、山東等13個省份。截至2009年底,以上開展試點(diǎn)的各個省份共積累基本社會養(yǎng)老保險(xiǎn)個人賬戶資金達(dá)1 569億元。隨著個人賬戶的費(fèi)用積累逐步增加,社會養(yǎng)老保險(xiǎn)個人賬戶基金的資金規(guī)模也同步累積擴(kuò)大。面對人口老齡化條件下養(yǎng)老金支付危機(jī),僅僅依靠現(xiàn)有“存銀行,買國債”的投資渠道已不能滿足基金保值增值的要求,這就促使社會養(yǎng)老保險(xiǎn)個人賬戶基金迫切需要拓寬投資渠道,入市投資已成為必然趨勢。
社會養(yǎng)老保險(xiǎn)個人賬戶基金入市后,對股票價(jià)格產(chǎn)生影響的,除了財(cái)政、貨幣、產(chǎn)業(yè)等宏觀經(jīng)濟(jì)因素外,同時(shí)還有財(cái)務(wù)數(shù)據(jù)、整體市場預(yù)期等微觀因素。在以上因素中,公司對外公布的財(cái)務(wù)信息能夠直接或頻繁引用,因此企業(yè)財(cái)務(wù)信息是股票市場信息的主要來源,也是投資決策的重要基礎(chǔ)。鑒于此,本文運(yùn)用SAS軟件,選取反映企業(yè)基本情況的財(cái)務(wù)指標(biāo),對公司進(jìn)行基本面分析。
本文以社?;鹬貍}股為研究對象,從2011年社?;鹨涣阋恢烈涣惆斯?個重倉股組合中,每個組合隨機(jī)抽取5只股票,包含軸研科技、遼通化工等共40只股票即40家上市公司作為研究樣本。對于樣本企業(yè),本文將從三個角度來分析其基本面情況,包括盈利能力、償債能力及成長能力,能夠較為全面客觀地評價(jià)企業(yè)的發(fā)展現(xiàn)狀。其中,評價(jià)盈利能力的指標(biāo)主要包含每股收益、凈資產(chǎn)收益率,評價(jià)償債能力的指標(biāo)主要包含資產(chǎn)負(fù)債率、股東權(quán)益比率,評價(jià)成長能力的指標(biāo)主要包含凈利潤增長率、主營業(yè)務(wù)增長率。選取的各財(cái)務(wù)指標(biāo)數(shù)據(jù)來自和訊網(wǎng),均為企業(yè)2011年前三季度的財(cái)務(wù)報(bào)告數(shù)據(jù)。
1.數(shù)據(jù)的均方根。
本文研究的樣本為軸研科技、遼通化工等40只社保重倉股,即共有40家滬深證券交易所上市的企業(yè),故各個企業(yè)之間的距離有=780個,距離的均方根為4.03。該方法下共有39次聚類,每一類的企業(yè)數(shù)目從2到40不等。
2.偽F統(tǒng)計(jì)量。
偽F統(tǒng)計(jì)量用于評價(jià)分為m類的聚類效果。偽F統(tǒng)計(jì)量數(shù)值越大,表明越可顯著地將n個樣品區(qū)分為m個類。偽F統(tǒng)計(jì)量可以作為確定類個數(shù)的有用指標(biāo)。在本例中,第一次聚類兩者之間的標(biāo)準(zhǔn)化歐幾里得距離最小,偽F統(tǒng)計(jì)量最大值為184,而最后一次聚類的偽F統(tǒng)計(jì)量最小為29.1。
3.偽t2統(tǒng)計(jì)量。
其中D2KL=WM-WK-WL即為合并類GK和GL合并為新類GM后類內(nèi)離差平方和的增量。偽t2統(tǒng)計(jì)量用來評價(jià)合并類GK和GL的效果。偽t2統(tǒng)計(jì)量值大表示GK和GL合并為新類GM后,類內(nèi)離差平方和的增量L相對于原GK和GL的類內(nèi)離差平方和大,這表示被合并的兩個類GK和GL是分得很開的,也即表明上一次聚類的分析結(jié)論是好的。偽t2統(tǒng)計(jì)量是確定類個數(shù)的有用指標(biāo)。本例中,第一次聚類是康力電梯(002367)和通鼎光電(002491)歸為一類,兩者之間的標(biāo)準(zhǔn)化歐幾里得距離最小,偽t2最小。以此類推,最后一次聚類是第2聚類和第3聚類形成了最大的聚類,兩者之間的標(biāo)準(zhǔn)化歐幾里得距離最大,偽t2最大,偽t2為43.7。
類平均聚類方法的統(tǒng)計(jì)量與重心聚類方法、最短距離聚類方法相同,這里不重復(fù)描述。類平均聚類方法、最短距離聚類方法以及重心聚類方法三種譜系聚類分析的結(jié)論圖分別如圖1、圖2和圖3所示。
圖1 類平均聚類方法的譜系聚類圖
圖2 最短距離聚類方法的譜系聚類圖
圖3 重心聚類方法的譜系聚類圖
1.協(xié)方差矩陣特征值(見圖4)。
圖4 離差平方和聚類方法的譜系聚類圖
在本文中特征值為:Eigenvalue=[1099.44…1485.95…1095.96…162.30…112.05…4.55…0.14]T,其中第一類特征值為11099.44,它與后面6個特征值相差懸殊,第一特征值占總方差的79.51%。因此,第一聚類是主要的聚類。
2.復(fù)相關(guān)系數(shù)R2統(tǒng)計(jì)量。
3.半偏R2統(tǒng)計(jì)量。
該統(tǒng)計(jì)量用以評價(jià)合并GK和GL的效果。半偏R2統(tǒng)計(jì)量是上一步R2值與該步R2值的差,因此半偏R2統(tǒng)計(jì)量數(shù)值越小,上一次聚類的效果更加優(yōu)秀。本例中第一次聚類半偏R2統(tǒng)計(jì)量最小為0.0001,聚類效果較好;最后一次聚類半偏R2統(tǒng)計(jì)量為0.5346,聚類效果最差。
從這四種聚類法的樹形圖可以看出,可以把這40家社保重倉股企業(yè)分為兩類,其中三友化工(600409)、中環(huán)股份(002129)、廣東明珠(600382)、凱迪電力(000939)為第一類,其余36家企業(yè)為第二類。
判別分析主要解決的問題是在已知根據(jù)過往經(jīng)驗(yàn)運(yùn)用某些方法已把需要研究的樣品分為若干組的情況下,來判定新的觀察樣品應(yīng)該歸屬的組別?;谏厦?項(xiàng)財(cái)務(wù)指標(biāo)的聚類分析,我們已經(jīng)將社保重倉股中的40家企業(yè)分為兩大類?,F(xiàn)在,我們從其他的社保重倉股中隨機(jī)抽出10只股票,采用判別分析方法分析這10家企業(yè)分別屬于哪一類別。
隨機(jī)抽取的股票如下:辰州礦業(yè)(002155)、國統(tǒng)股份(002205)、華東電腦(600850)、沈陽機(jī)床(000410)、西寧特鋼(600117)、晨光生物(300138)、伊利股份(600887)、遼通化工(000059)、華斯股份(002494)、津勸業(yè)(600821)。
1.分組水平信息。
我們可以得到分組變量的值:兩種類型。各組的頻數(shù)依次為:4、36。各組的權(quán)重依次為:4、36。各組在全部樣本中所占的比例分別為:0.1、0.9。同時(shí),各組先驗(yàn)概率分別為0.5。分組水平信息如圖5所示。
圖5 分組水平信息
2.聯(lián)合協(xié)方差矩陣信息。
協(xié)方差矩陣的秩為6;協(xié)方差矩陣行列式的自然對數(shù)ln(∑)=26.90464。
3.組間廣義平方距離。
圖6 組間廣義平方距離
4.線性判別函數(shù)。
Func1=-499.34001+0.18588X1+7.24876X2+10.39264X3+10.85249X4-0.13626X5-0.04560X6
Func2=-552.86473+0.01611X1+13.66601X2+11.09873X3+11.59233X4-0.09153X5-0.16237X65
回代結(jié)果根據(jù)該部分判別到各組的觀察值及其所占百分比、各組誤判觀測值的估計(jì)得出,以下是SAS得到的回代結(jié)果(見圖7圖8)。
圖7 各組別誤判觀測值估計(jì)結(jié)果
圖8 新樣本組別判別結(jié)果
SAS運(yùn)行結(jié)果顯示,不存在各組中某個觀察值被誤判的情況,說明該判別的可信度很高。
5.前瞻性檢驗(yàn)。
前瞻性預(yù)測采取一般線性判別函數(shù)的交叉實(shí)證進(jìn)行結(jié)果置換。我們將10家上市公司的財(cái)務(wù)比率數(shù)據(jù)代入判別函數(shù)和貝葉斯(Bayes)判別公式,即將10家公司分別歸為各自的組別。
SAS運(yùn)行結(jié)果表明,社保重倉股企業(yè)辰州礦業(yè)(002155)被判為第1類別,其余9家企業(yè)國統(tǒng)股份(002205)、華東電腦(600850)、沈陽機(jī)床(000410)、西寧特鋼(600117)、晨光生物(300138)、伊利股份(600887)、遼通化工(000059)、華斯股份(002494)、津勸業(yè)(600821)均被判為第2類別。
1.多變量統(tǒng)計(jì)量和F值。
對數(shù)據(jù)進(jìn)行SAS運(yùn)行后的結(jié)果如圖9所示。
圖9 多變量統(tǒng)計(jì)結(jié)果
由結(jié)果可知,我們得到:
Wilk’s Lambda=0.2292,F(xiàn)-Value=18.50,P-Value<0.001,拒絕原假設(shè)。同理,Pilla’s Trace,Hotelling-Lawley Trace,Roy’s Greatest Root這三個統(tǒng)計(jì)量都拒絕原假設(shè),應(yīng)用典型判別的可信度很高。
2.E-1B的特征值:典型相關(guān)系數(shù)數(shù)值是0.87797,特征值數(shù)值是3.3636。
3.典型判別函數(shù)。
SAS輸出了原始典型變量系數(shù),如圖10所示。
圖10 原始典型變量系數(shù)
即典型變量和原始變量的關(guān)系表示為:Z=0.028491899X1-1.076976938X2-0.118500147X3-0.124164041X4-0.007505769X5+0.019597028X6+C將各變量的組均值代入上式,即可得出C的值。
典型變量Z作為原始變量的線性組合,已經(jīng)能夠囊括原始變量的大量信息,且同時(shí)兼顧概括各組別之間的差異。典型判別是一種很好的降維技術(shù),它用效率的典型變量代替原始變量,把樣本分組情況直觀表現(xiàn)出來。本例中,我們將社保重倉股的40家上市企業(yè)分成了兩大類別,然后對各個類別中企業(yè)的財(cái)務(wù)數(shù)據(jù)進(jìn)行分析,可以依次將這兩大類企業(yè)區(qū)分為基本面良好和較差兩種類別。這樣就能夠?qū)ζ髽I(yè)的基本面信息做出正確判斷。