張曉芳,錢 蕊
(蚌埠學(xué)院 經(jīng)濟與管理學(xué)院,安徽 蚌埠 233000)
在以往的證券投資分析中,投資者經(jīng)常使用基本面分析和技術(shù)分析方法去分析股票的價格走勢.基本面分析主要從宏觀經(jīng)濟、行業(yè)和板塊以及公司財務(wù)的角度去幫助投資者對股票的投資價值進行判斷,這種方法主要適合對股票進行價值投資的中長期投資者,但對短線投資者的指導(dǎo)作用較弱.技術(shù)分析法以圖表、形態(tài)為基礎(chǔ),用邏數(shù)學(xué)方法分析股票市場過去和現(xiàn)在的行為,從而達到預(yù)測股價走勢的目的,其多用于短期預(yù)測.但股票市場中的機構(gòu)復(fù)雜,參與者較多,股票的價格走勢因此也受到很多因素的影響,基本分析法和技術(shù)分析法以及傳統(tǒng)的線性分析模型都很難將這眾多的影響因素考慮在內(nèi)對股票價格做出精準的預(yù)測.
支持向量機(SVM)作為一種新興的統(tǒng)計模型,能夠高效率地處理回歸和分類的問題,而與一些機器學(xué)習(xí)方法不同的是,支持向量機通過“增維”的方式來處理分類和回歸問題,即通過使用合適的核函數(shù)向高維空間進行映射來避免陷入“維數(shù)災(zāi)難”的困境.特拉法利斯(Trafalis)和因斯(Ince)用支持向量機模型對股票價格進行預(yù)測,并與其他模型進行比較,結(jié)果表明支持向量機對股價的預(yù)測效果較好[1].金(Kim)基于支持向量機模型對股價指數(shù)的變動趨勢進行預(yù)測,并和其他的模型進行對比之后發(fā)現(xiàn)支持向量機在對股價指數(shù)的預(yù)測精度和性能方面具有顯著的優(yōu)勢[2].黃(Huang)等人采用支持向量機預(yù)測日經(jīng) 225 指數(shù)周線,并分別與其他分類模型進行對比,結(jié)果表明支持向量機在預(yù)測股價指數(shù)走勢上比其他方法具有更高的準確性[3].
國內(nèi)運用機器學(xué)習(xí)方法研究股價變動趨勢比國外晚,早期主要將支持向量機用于選股方面的研究,后期逐漸用于股票價格指數(shù)預(yù)測方面的研究.汪東運用支持向量機回歸算法和分類算法對上證綜合指數(shù)的回歸問題和滬深A(yù)股市場選擇投資組合的問題進行研究[4].萬岑通過選擇上證綜指交易日的最高價、最低價、收盤價、成交量和成交金額等6個指標用支持向量機模型來回歸預(yù)測股市短期內(nèi)的開盤價[5].左飛運用非線性支持向量機對上證50指數(shù)19個技術(shù)指標進行建模,驗證了支持向量機模型對上證50指數(shù)的分類具有較高的準確性[6].李崢嶸選取股票的價格、成交量、技術(shù)指標等信息對上證指數(shù)的收盤價進行預(yù)測,驗證了支持向量機模型在對股價的預(yù)測上具有較高的準確率[7].綜上所述,國內(nèi)關(guān)于應(yīng)用支持向量機預(yù)測股價方面的研究所選用的指標大多是股票市場的交易變量和技術(shù)指標,而未將影響股票價格變化的宏觀經(jīng)濟指標、行業(yè)和板塊因素以及公司財務(wù)狀況考慮在內(nèi),在一定程度上可能會降低模型預(yù)測的準確性.
樣本選取上證180指數(shù)中的成分股股票數(shù)據(jù)作為研究對象,上證180指數(shù)的成分股來自不同行業(yè)具有代表性的樣本股票,樣本數(shù)據(jù)量充足,有效避免了樣本的局限性和實驗結(jié)果的偶然性.上證180指數(shù)成分股分布的行業(yè)較多,有利于行業(yè)和板塊因素對股價預(yù)測的研究.由于上市公司的財務(wù)報表數(shù)據(jù)最短以季度進行披露,為保證實驗數(shù)據(jù)的可得性、時效性與各指標數(shù)據(jù)的統(tǒng)一性,筆者選取2021年第二季度的行業(yè)、公司財務(wù)狀況和股票交易市場的相關(guān)指標信息和數(shù)據(jù),樣本數(shù)據(jù)主要來源于上市公司官網(wǎng)、同花順軟件和大智慧軟件.
通過對影響股價的因素進行分析,大多數(shù)的宏觀經(jīng)濟指標短期內(nèi)對股價的影響不明顯,在總結(jié)以往研究文獻的基礎(chǔ)上,本文主要從股票基本面當中的行業(yè)和公司財務(wù)狀況方面以及股票交易市場信息來選取股票價格預(yù)測的相關(guān)指標.從上市公司行業(yè)方面選取了行業(yè)市場結(jié)構(gòu)、行業(yè)經(jīng)濟周期、行業(yè)生命周期等行業(yè)特征指標.從反映上市公司財務(wù)狀況的償債能力方面選取了流動比率和速動比率;從營運能力方面選取了存貨周轉(zhuǎn)率和應(yīng)收賬款周轉(zhuǎn)率;公司獲利能力方面選取了凈資產(chǎn)收益率和每股凈收益等財務(wù)比率指標.從股票交易市場的趨勢型指標中選取180家上市公司股票的指數(shù)平滑異同移動平均線(MACD)、離差值(DIF)、DIF的n期平滑移動平均線(DEA);從超買超賣指標中選取6日和10日的威廉指標(WMS)、隨機指標中的K值、D值和J值;從人氣型指標中選取心理線指標(PSY),為保證各指標時間上的統(tǒng)一,以上指標均選取季度指標值.所構(gòu)建的股票價格影響因素的指標體系如圖1-1所示.
圖1-1 股票價格預(yù)測指標體系
支持向量機的基本思想是把輸入到空間的樣本通過一種非線性的變換映射到高維特征空間,使得最優(yōu)分類面在高維特征空間中成為線性可分的,并在特征空間中找到能夠把樣本線性分開的最優(yōu)分類面.如圖2-1所示,圖中的樣本集(xi,yi)i=1,2,…,n表示進行股價預(yù)測的n只上市公司的股票,xi∈Rd表示影響每只股票價格的d維基本面和技術(shù)面指標因素.yi∈{-1,1}表示第i只股票價格對應(yīng)的“漲”和“跌”類別標簽.假設(shè)存在超平面x·w+b=0能將n只股票按照股價漲跌分成兩類:類別1和類別-1.類別1表示該季度股價上漲的股票,類別-1表示該季度股價下跌的股票.其中w是權(quán)重向量,表示給影響股價漲跌不同的屬性特征所賦予的權(quán)重,b是模型的參數(shù).
圖2-1 線性可分情況下的最優(yōu)分類線
所有“該季度股價上漲的股票”的樣本數(shù)據(jù)均滿足w·x+b≥1,所有“該季度股價下跌的股票”的樣本數(shù)據(jù)均滿足w·x+b≤-1.通過合并上述兩個不等式可以得到:
yi(w·xi+b)-1≥0(i=1,2,…,n)
(2.1)
分類目標是使兩個平行的側(cè)面H1:w·x+b≥1與H2:w·x+b≤-1的距離2/∥w∥最大,這等價于使∥w∥2/2最小.通過SVM將找到在以下兩個約束條件下的優(yōu)化問題的解(w,b):
(2.2)
s.t.yi(w·xi+b)≥1,i=1,2,…,N
(2.3)
利用拉格朗日的優(yōu)化方法可以將上面的優(yōu)化問題轉(zhuǎn)化成它的對偶問題,在高維特征空間中的最終目標是對λi求解下列函數(shù)的最大值,即:
(2.4)
(2.5)
其中,λi為每個約束條件對應(yīng)的拉格朗日乘子.求解后能夠得到的最優(yōu)的分類函數(shù)為:
(2.6)
2.2.1 數(shù)據(jù)預(yù)處理
在影響股票價格的因素中,行業(yè)因素中的行業(yè)市場結(jié)構(gòu)、行業(yè)經(jīng)濟周期、行業(yè)生命周期所對應(yīng)的指標屬性為有限的文本集,而公司財務(wù)因素和市場因素所對應(yīng)的指標數(shù)據(jù)相互之間差別較大,為了使指標數(shù)據(jù)處于同一個數(shù)據(jù)量綱且易于編碼,采用如下的公式對財務(wù)指標數(shù)據(jù)和市場指標數(shù)據(jù)進行歸一化處理, 即:
(2.7)
其中x為樣本股票的財務(wù)指標或市場指標所對應(yīng)的屬性值,xmin和xmax為該屬性值中所對應(yīng)的最小值和最大值,x′為該指標數(shù)據(jù)經(jīng)過歸一化后的屬性值.經(jīng)過歸一化處理后,樣本股票的所有財務(wù)指標和市場指標對應(yīng)的屬性值都將轉(zhuǎn)換到0—1的范圍內(nèi),不僅使得財務(wù)指標和市場指標的不同屬性值處于同一個量綱中,而且也有利于建模過程中的指標編碼.
2.2.2 算法設(shè)計
首先將影響股價漲跌的18個指標變量分別定義為X1、X2、…、X18,再將樣本的指標數(shù)據(jù)根據(jù)對股價的影響依次進行分類編碼,輸出變量依據(jù)股價的“漲”和“跌”分別編為“1”和“-1”.
運用Clementine 12.0軟件選擇支持向量機模型進行建模,隨機抽取上證180指數(shù)成分股中的90家上市公司的股票作為訓(xùn)練樣本,剩余90家上市公司的股票作為預(yù)測樣本.依次選擇支持向量機模型中的線性核函數(shù)、多項式核函數(shù)、高斯核函數(shù)、核Sigmoid核函數(shù)對數(shù)據(jù)進行擬合,對股票價格的“漲”和“跌”進行分類預(yù)測,具體步驟如下:
步驟1:將180家上市公司股票樣本數(shù)據(jù)組成的Excel文件導(dǎo)入軟件構(gòu)建源節(jié)點,選擇一個Table節(jié)點附在源節(jié)點之后,類型節(jié)點附加到源節(jié)點之后,將類型節(jié)點中的字段值類型改為“集”,類別標簽中的字段值類型改為“flag”,方向全部設(shè)為“output”,剩余字段的方向設(shè)為“input”.
步驟2:將180家上市公司股票樣本隨機抽取90個作為訓(xùn)練樣本,其余90個作為測試樣本,并通過抽樣節(jié)點設(shè)置好訓(xùn)練樣本和測試樣本.
步驟3:在支持向量機模型節(jié)點中選擇不同的核函數(shù)執(zhí)行操作,得到支持向量機模型分別對90個訓(xùn)練樣本分類結(jié)果和90個測試樣本預(yù)測結(jié)果的輸出模型,選擇分類準確率最高的輸出模型class-line和SVM,將輸出模型分別附加到樣本節(jié)點,并將一個Table節(jié)點和Analysis節(jié)點分別附加到兩個輸出模型后面,得到了整個支持向量機模型設(shè)計階段的數(shù)據(jù)流圖,如2-2所示.
圖2-2 SVM模型實施階段數(shù)據(jù)流
步驟4:執(zhí)行數(shù)據(jù)流圖中的Table節(jié)點,得到支持向量機中線性核函數(shù)對每個股票樣本的分類結(jié)果;執(zhí)行Analysis節(jié)點,得到支持向量機模型對于測試樣本和訓(xùn)練樣本數(shù)據(jù)的分類準確率,如表2-1和表2-2所示.
表2-1 訓(xùn)練樣本準確性
表2-2 測試樣本準確性
從表2-1和表2-2中可以看出,運用支持向量機中的線性核函數(shù)執(zhí)行操作,得到支持向量機中線性核函數(shù)對隨機抽取的90個訓(xùn)練樣本的分類準確率為84.44%,而通過訓(xùn)練之后的模型對90個測試樣本的分類準確率則達到了94.44%.
對數(shù)據(jù)流中的輸出模型選擇“瀏覽”選項,得到各變量對股價預(yù)測的影響的權(quán)重圖,如圖2-3所示.
通過對圖2-3中支持向量機模型對樣本進行訓(xùn)練時所得出的各指標的相對重要性數(shù)據(jù)進行統(tǒng)計得到的結(jié)果,如表2-3所示.
圖2-3 訓(xùn)練樣本在訓(xùn)練時各指標的相對重要性
由表2-3中的數(shù)據(jù)可以看出,在短期內(nèi),技術(shù)指標因素對股價漲跌的影響程度較大,如6日的WMS對股價漲跌的影響程度為0.417,其次是10日的WMS影響程度為0.117.DIF、DEA、MACD三個技術(shù)指標對股價的影響程度相同,都為0.035.J和K指標在本次實驗中對股價的漲跌沒有明顯的影響.在市場特征方面,行業(yè)生命周期和行業(yè)經(jīng)濟周期在本次實驗中對股價漲跌的影響程度分別為0.042和0.013,行業(yè)市場結(jié)構(gòu)對股價漲跌沒有明顯的影響.在公司的財務(wù)方面,流動比率、凈資產(chǎn)收益率和速動比率對股價漲跌的影響程度較大,分別為0.044、0.036和0.036,每股凈收益、應(yīng)收賬款周轉(zhuǎn)率和存貨周轉(zhuǎn)率則對股價的影響較小,分別為0.033、0.032和0.027.
表2-3 各指標的相對重要性
根據(jù)以上得出的實驗結(jié)果給出相應(yīng)的建議如下:
(1)投資者在進行短期投資時可以參考技術(shù)指標中的6日威廉指標(WMS)和10日威廉指標(WMS),在運用威廉指標時,可以從威廉指標的數(shù)值信號、背離信號和形態(tài)信號出發(fā)去進行判斷,同時也可以將DIF、DEA、MACD等指標所發(fā)出的買賣信號結(jié)合起來去對股價進行短期預(yù)測.在運用技術(shù)指標進行決策的同時,也不可將技術(shù)指標發(fā)出的信號當成唯一的判斷準則,還需要結(jié)合基本面和股票市場的交易信息去進行判斷.
(2)投資者在對公司的股價進行預(yù)測時,可以通過該上市公司的財務(wù)報表從該公司的償債能力、經(jīng)營能力、盈利能力和成長能力方面分析該上市公司的股票價值,在對上市公司財務(wù)狀況進行分析的同時,可以著重關(guān)注該上市公司的償還債務(wù)的能力和賺取利潤方面的能力.這兩個方面的能力對公司未來的現(xiàn)金流有重要的影響,因而會較大程度地影響該公司未來股票的價值.
(3)在對投資行業(yè)進行選擇時,盡量選擇在行業(yè)生命周期中處于成長期和成熟期的行業(yè).增長型行業(yè)的特點是行業(yè)收入的增長速度快于整個國民經(jīng)濟的增長率,此時投資者對該行業(yè)進行投資能夠享受到經(jīng)濟快速增長所帶來的行業(yè)利潤.生命周期中處于成長期和成熟期的行業(yè)在經(jīng)營過程中有較穩(wěn)定的收入和利潤,在給投資者帶來穩(wěn)定的收益的同時還可以使投資者承擔(dān)較小的投資風(fēng)險.