◎胡曉陽
模糊聚類分析在股票分類中的應(yīng)用
◎胡曉陽
對事物進行評價首先需要確定參考系,目前對股票進行評價的參考為歷史數(shù)據(jù)以及專家建議。本文評價股票的角度選擇為所選樣本股票,通過選定股票的走勢來預(yù)測與其相似度較高的股票的走勢,獲得相似度的方法是模糊聚類分析技術(shù),數(shù)據(jù)處理工作利用MATLAB軟件來完成。同時創(chuàng)新對指標(biāo)的選取,本文從股票的表現(xiàn)情況與公司的財務(wù)情況兩個角度各選取五個側(cè)重點不同的指標(biāo),能夠較全面地反映股票整體表現(xiàn)情況。
我國可供交易的股票數(shù)量與日俱增。另一方面,評價股票的指標(biāo)側(cè)重點各不相同。模糊聚類分析能夠?qū)Ω鱾€指標(biāo)進行綜合考量,比起只用一類指標(biāo)進行判斷所得到的結(jié)果更加的科學(xué)。同時,模糊聚類分析可以得出股票之間的相似程度,相似程度越大的股票,出現(xiàn)相同走勢的概率越大,又因為個股對影響股市的事件敏感程度是不同的,那么就可以借助已經(jīng)做出反應(yīng)的股票對其相似度較高的股票進行預(yù)測。
本文首先選擇模糊數(shù)學(xué)理論中最適合對股票進行聚類分析的方法,通過上市公司的基本數(shù)據(jù),并選擇兩類側(cè)重點不同的指標(biāo),分別對所選股票進行聚類分析,得到動態(tài)聚類結(jié)果進行分析。
數(shù)據(jù)標(biāo)準(zhǔn)化方法。選擇出所要分類的股票之后,將指標(biāo)寫出構(gòu)造成矩陣的形式即:
本文運用平移·極差變換即令:
模糊相似矩陣的建立。本文選擇倒數(shù)距離法用于建立模糊相似矩陣。
從整體來看,該方法邏輯較為簡單,不需要太多的人為工作,尤其是其具有遞歸調(diào)用的特性,那么在對數(shù)據(jù)進行處理時,所用算法在程序編寫上相對容易些,因此本文采用該方法進行聚類。
股票行情會受到諸多因素的影響,同時對股票價值進行評判的指標(biāo)之間各有利弊。為了能更全面客觀地反映股票的情況,本文從兩個角度出發(fā),選取出了十個指標(biāo)用于對股票的聚類分析。
股票表現(xiàn)指標(biāo)。本文從股票的盈利水平,發(fā)展?jié)摿?,風(fēng)險情況三個方面選取了五個較為常見且具有長期參考價值的指標(biāo)進行分析研究。分別為市盈率、市凈率、凈資產(chǎn)收益率、每股未分配利潤和每股經(jīng)營現(xiàn)金流。
財務(wù)數(shù)據(jù)指標(biāo)。本文從考察公司的盈利能力、成長能力、運營能力和財務(wù)風(fēng)險四個方面分別選取指標(biāo),以對上市公司的整體情況進行比較判別。分別為:凈利率、毛利率、營業(yè)收入增長率、總資本周轉(zhuǎn)率和資產(chǎn)負債率。
表1 表現(xiàn)指標(biāo)動態(tài)聚類
圖1 動態(tài)聚類圖
本文選取的20只股票以中小盤股為主,按所劃分的兩個層次分別進行聚類分析。
表現(xiàn)指標(biāo)動態(tài)聚類。
原始數(shù)據(jù)見表1。
經(jīng)MATLAB處理后得到動態(tài)聚類圖。
財務(wù)數(shù)據(jù)動態(tài)聚類。
原始數(shù)據(jù)見表2。
得到動態(tài)聚類圖。大其準(zhǔn)確度越高。在兩個層面上的聚類結(jié)果越相近其準(zhǔn)確度越高。其中納爾股份與北化股份在股票層面上當(dāng)λ=0.6138時可認為是一類。在財務(wù)層面上當(dāng)λ=0.7562時可認為是一類。兩個層面的λ值都比較大,取平均值后即有68.5%的概率認為納爾股份和北化股份有相同的走勢。
在圖上也可以看到,若想得到有效的分類數(shù),需要選取的值較小,而且大部分股票集中于一類之中。在兩個層次下的分類都存在有不同類別的股票之間差異比較懸殊,各類所包含的股票在數(shù)量上的差異比較明顯的現(xiàn)象。本文猜想可能是由于選取的這20只股票所處類別的情況恰好比較
表2 財務(wù)數(shù)據(jù)動態(tài)聚類
圖2 動態(tài)聚類圖
從兩張圖中λ值的分布情況來看,可以看到在兩個層次下小范圍內(nèi)存在有相似度較高的兩只股票或多只股票。另外,由于股票對各類影響行情的因素的敏感性是不相同的,那么就存在借助其中一只股票的走勢預(yù)測與它相似度較高的另一只或幾只股票的理論基礎(chǔ)。在同一層次下λ值越符合正態(tài)分布的,即大部分股票的表現(xiàn)處于平均水平,表現(xiàn)優(yōu)異的和表現(xiàn)特別差的數(shù)量均比較少所造成的。從本次研究中也可證明股票的表現(xiàn)情況之間差異還是非常大的,各個指標(biāo)完全相似的情況不太可能。
(作者單位:河北省黃驊市北斗星電腦有限公司)