鹿天宇 都萊娜 王海遠 王吟秋 陶明婉 張雪伍
摘要:股票價格影響因素眾多,且存在復雜的相關關系,傳統(tǒng)股票價格預測模型和神經(jīng)網(wǎng)絡模型無法消除影響因素直接的相關性,從而導致預測精度較低。為提高股票價格預測精度,提出了一種主成分分析與BP神經(jīng)網(wǎng)絡組合模型。利用主成分分析降低股票價格預測影響因素之間存在的冗余信息,降低BP神經(jīng)網(wǎng)絡模型輸入數(shù)據(jù)的維數(shù),簡化神經(jīng)網(wǎng)絡拓撲結構,提高組合模型訓練速度和預測精度。對自科學研究和技術服務業(yè)相關上市企業(yè)周股價進行仿真實驗,結果表明PCA-BP組合模型的訓練速度快,預測精度高,能夠為股票價格預測提供有價值的參考。
關鍵詞:主成分分析;簡單回歸分析;BP神經(jīng)網(wǎng)絡;股票預測
中圖分類號:F830;TP183 文獻標識碼:A 文章編號:1009-3044(2019)06-0170-03
Forecast of Stock Price Trend Based on Time Series Analysis and Neural Network
LU Tian-yu, DU Lai-na, WANG Hai-yuan, WANG Yin-qiu, TAO Ming-Jing, ZHANG Xue-wu
(Jiangsu University of Technology School of Business, Changzhou 213001, China)
Abstract: There are many influencing factors of stock price, and there are complex correlations, and the traditional stock price prediction model and neural network model can not eliminate the direct correlation of influencing factors, which leads to low prediction accuracy. In order to improve the accuracy of stock price prediction, a combination model of principal component analysis and BP neural network is proposed. The principal component analysis is used to reduce the redundant information existing between the influencing factors of stock price prediction, to reduce the dimension of BP neural network model input data, to simplify the topology of neural network, and to improve the training speed and prediction accuracy of combinatorial model. The simulation experiment of weekly stock price of listed enterprises related to scientific research and technology Service industry shows that the training speed of PCA-BP combination model is fast and the prediction precision is high, which can provide valuable reference for stock price forecast.
Key words: principal component analysis; simple regression analysis; back propagation neural networks; stock forecasting
1 引言
隨著我國經(jīng)濟的快速發(fā)展,股市在資源配置的重要性日益突出,對實體經(jīng)濟的發(fā)展起到重要推動作用。改革開放以來,經(jīng)濟發(fā)展帶來人們生活水平的提高和個人財富的增加,同時使得人們投資理財意識漸漸增強。股票作為一種高風險高收益的投資方式,吸引了大量投資者,但其不確定性也會造成投資資金的巨大損失。因此,股票價格的合理預測,可以降低投資風險,提升投資者的決策效率,引導投資者規(guī)避風險、理性投資。
國內外主要采用數(shù)據(jù)挖掘技術對股價變化趨勢進行預測,如,決策樹分類、神經(jīng)網(wǎng)絡模型以及模糊集方法等[1]。人工神經(jīng)網(wǎng)絡(ANN)被廣泛應用于股市預測。Mendelsohn和Stein (1991)用德國市場三年的日交易數(shù)據(jù)訓練人工神經(jīng)網(wǎng)絡來產(chǎn)生買和賣的信號,使用一年的數(shù)據(jù)進行驗證,結果顯示神經(jīng)網(wǎng)絡產(chǎn)生的24個買入信號中一半是正確的,并可以帶來較高的回報[2]?;艚ㄜ奫3]和張秀艷[4]等針對中國股票市場,用神經(jīng)網(wǎng)絡建立了相關的預測模型。孫磊平運用神經(jīng)網(wǎng)絡模型進行實證研究,探討財務比率指標和股票投資價值的內在聯(lián)系,研究影響股票投資價值的主要因素[5]。王剛和許曉兵基于小波分析與神經(jīng)網(wǎng)絡時間序列的股票預測方法[6],把股票每日最高價、最低價以及開盤價進行小波去噪處理,然后把去噪后的數(shù)據(jù)利用BP (Back Propagation)神經(jīng)網(wǎng)絡進行預測分析,結果表明處理后的數(shù)據(jù)比未處理數(shù)據(jù)的預測精準度更高,預測效果更好。張翱翔對原始數(shù)據(jù)進行預處理后訓練神經(jīng)網(wǎng)絡模型,選取上市股票進行股票價格預測實證研究,實證結果表明BP神經(jīng)網(wǎng)絡股指預測系統(tǒng)可以有效地預測股票價格[7]。
神經(jīng)網(wǎng)絡具有很強的非線性逼近能力、自學習和自適應等特性,因此非常適用對股價變化趨勢進行預測[8]。然而,股票價格變動過程是個復雜的非線性系統(tǒng),影響股票價格變動的因素眾多,且相互之間存在高度的相關性,不太適合直接進行神經(jīng)網(wǎng)絡預測。故此,先對股價影響因素進行主成分分析,實施降維,并消除因素之間的相關性,然后利用得到的主成分對BP神經(jīng)網(wǎng)絡模型進行訓練,并用訓練好的BP神經(jīng)網(wǎng)絡模型對股價進行預測[9]。
2 股票價格預測原理
股票價格又叫股票行市,是指股票在證券市場上買賣的價格。它受到開盤價、復權價、成交量,成交金額等多重因素影響。這些影響因素與股價之間存在著一種非線性關系,且影響因素之間也存在一定的信息冗余。影響因素的變化會引起股票價格的變化。股票價格的預測是從微觀層次對相關企業(yè)的股票價格進行預測,與指數(shù)層面的股指預測相比,對投資者更具有指導意義。
1) 主成分分析
主成分分析(principal component analysis,PCA)是一種統(tǒng)計方法,它對多變量表示數(shù)據(jù)點集合尋找盡可能少的正交矢量表征數(shù)據(jù)信息特征,在保證信息數(shù)據(jù)丟失最少的原則下對高維數(shù)據(jù)進行降維,從而消除數(shù)據(jù)的冗余信息。其主要的算法步驟如下:
(1) 對n*p的X原始數(shù)據(jù)矩陣進行標準化處理得到數(shù)據(jù)矩陣Y,消除量綱、正逆指標的影響。
(2) 根據(jù)標準化矩陣 Y 計算其相關系數(shù)矩陣R,R =Y'Y。
(3) 求出相關系數(shù)矩陣的特征根及對應的特征向量。
(4) 確定主成分,并計算各主成分得分。
2) BP神經(jīng)網(wǎng)絡
BP網(wǎng)絡是一種按誤差逆?zhèn)鞑ニ惴ㄓ柧毜亩鄬忧梆伾窠?jīng)網(wǎng)絡,能學習和存儲大量的輸入 -輸出模式映射關系,無需事前揭示這種映射關系的數(shù)學方程[11]。BP網(wǎng)絡的拓撲結構由輸入層、輸出層和隱含層構成[10],其中隱含層可以為一層或多層。典型三層BP神經(jīng)網(wǎng)絡拓撲結構如圖1所示:
3)PCA-BP模型
PCA-BP模型,是將主成分分析與BP神經(jīng)網(wǎng)絡模型相結合,組成聯(lián)合模型。運用PCA對原始輸入數(shù)據(jù)進行降維,減少BP神經(jīng)網(wǎng)絡模型的輸入變量個數(shù),能夠顯著提升模型訓練速度,減少屬性信息之間的相關性,提升模型預測精度。運用PCA-BP組合模型進行股票價格預測的主要步驟如下:
(1) 首先對數(shù)據(jù)進行標準化。
(2) 其次對指標數(shù)據(jù)進行主成分分析,得到各個主成分的因子得分。
(3) 選取適當?shù)闹鞒煞?,將其得分作為BP神經(jīng)網(wǎng)絡的輸入值。
(4) 構建三層的BP神經(jīng)網(wǎng)絡,設定相關參數(shù),并對輸入數(shù)據(jù)進行訓練。
(5) 最后,調整相關參數(shù),反復訓練幾次,得到理性的結果。
(6) 運用訓練好的PCA-BP模型進行股票價格預測。
3 仿真研究
3.1 變量的選取
研究選取來自RESSET金融數(shù)據(jù)庫科學研究和技術服務業(yè)相關上市企業(yè)2017年3月10號到2018年3月30號的周股票資料進行實證研究。以股票的收盤價作為股票的實際價格。參考以往研究資料,選取股票價格影響引入如表1所示。
4 仿真與結果分析
選取來自科學研究和技術服務業(yè)相關上市企業(yè)2017年3月10號到2018年3月30號的周股價格變化影響因子得分作為BP神經(jīng)網(wǎng)絡訓練數(shù)據(jù),BP神經(jīng)網(wǎng)絡的誤差學習目標設置為0.0005,最大迭代次數(shù)為500000次,顯示步長為1000,學習速度設置為0.008,網(wǎng)絡結構為8-31-1,即隱含層為31個神經(jīng)元。利用Matlab提供的神經(jīng)網(wǎng)絡函數(shù)構建BP神經(jīng)網(wǎng)絡模型,利用PCA處理后的8個影響因子得分與股價對模型進行訓練,過程如圖2所示。
由圖2可知,由主成分重構后的神經(jīng)網(wǎng)絡的在誤差學習目標為0.0005,最大迭代次數(shù)為500000次的前提下,誤差精度接近0.001,效果較為理想。
為了使得預測結果具有可比性,分別采用普通多元回歸分析模型和網(wǎng)絡結構為27-31-1,即隱含層為31的普通BP網(wǎng)絡模型對股票價格進行預測,預測結果和誤差分析結果分別如圖4和圖5所示。
由圖3與圖4可知,三種模型均在一定程度上反映了股票價格的變化趨勢,但預測精度差異明顯,其中普通神經(jīng)網(wǎng)絡模型的預測值精度最差,平均誤差為4.1%,一般多遠回歸模型的預測精度次之,平均預測誤差為3.6%,PCA-BP模型的預測誤差最小僅為1.3%。
PCA-BP神經(jīng)網(wǎng)絡模型,對輸入變量進行降維處理,減了預測數(shù)據(jù)的輸入,加快模型的訓練速度,提升模型的預測精度。仿真結果對比可見PCA-BP模型的預測精度遠超其它兩種傳統(tǒng)模型的預測精度,能夠利用其對股票價格進行預測。
5 結束語
股票價格的影響因子眾多,且相互之間存在一定程度上的相關性,BP 神經(jīng)網(wǎng)絡模型無法對這些共線性的數(shù)據(jù)進行處理與剔除。主成分分析法可以對 BP 神經(jīng)網(wǎng)絡模型的輸入數(shù)據(jù)進行降維重構,在保留影響因子最大信息量的前提下,有效地降低輸入數(shù)據(jù)的維數(shù),簡化了網(wǎng)絡結構,很大程度上加快了模型的訓練速度,提高了預測精度??茖W研究和技術服務業(yè)行業(yè)上市企業(yè)股票價格建模與預測結果表明,用PAC-BP 神經(jīng)網(wǎng)絡組合預測模型對股票價格進行預測是有效、可行的。研究為其它領域的多因素預測建模構建提供了新的研究參考。
參考文獻:
[1] 劉海嘯,孟珊珊,杜佳豪.基于數(shù)據(jù)挖掘的股市波動與宏觀經(jīng)濟指標的關聯(lián)性研究[J].燕山大學學報,2018,19(5):89-96
[2] Mendelsohn Stein. Fundamental analysis meets the neural etwork[J].Futures,1991,20(10):22-24.
[3] 霍建軍.基于灰色系統(tǒng)和神經(jīng)網(wǎng)絡的股價指數(shù)預測:[D].哈爾濱工程大學,2006.
[4] 張秀艷,徐立本.基于神經(jīng)網(wǎng)絡集成系統(tǒng)的股市預測模型[J].系統(tǒng)工程理論與實踐,2003,9:67-70.
[5] 孫磊平.數(shù)據(jù)挖掘方法在股票分析中的應用與研究[D].西南財經(jīng)大學,2013.
[6] 王剛,許曉兵.基于小波分析與神經(jīng)網(wǎng)絡時間序列的股票預測方法[J].金融經(jīng)濟,2013(24).
[7] 張翱翔.基于BP神經(jīng)網(wǎng)絡股指預測系統(tǒng)的國內外股市預測研究[D].湖南大學,2017.
[8] 孫彬,李鐵克,王柏琳.基于股票市場靈敏度分析的神經(jīng)網(wǎng)絡預測模型[J].計算機工程與應用,2011,47(1):26-31.
[9] 蘭強太.基于主成分分析與BP神經(jīng)網(wǎng)絡算法[D].暨南大學,2017.
[10] 江建明,柳長青.基于主成分分析法與BP神經(jīng)網(wǎng)絡的股指期貨價格預測[J].金融視線,2015,18.093:176-177.
[11] 韓力群.人工神經(jīng)網(wǎng)絡教程[M].北京郵電大學出版社,2006.
【通聯(lián)編輯:梁書】