白艷萍
摘要:股票市場是個非穩(wěn)定的時間序列,本文將支持向量機(jī)與主成分分析(PCA-SVM)結(jié)合對股票進(jìn)行回歸預(yù)測分析,以奧特迅(002227)為對象進(jìn)行建模和預(yù)測研究。選取奧特迅90天的股票技術(shù)指標(biāo)歷史數(shù)據(jù)作為訓(xùn)練樣本對收盤價進(jìn)行預(yù)測,10天數(shù)據(jù)進(jìn)行檢驗,并通過圖像擬合來驗證神經(jīng)網(wǎng)絡(luò)股票預(yù)測的可行性和準(zhǔn)確性。
關(guān)鍵詞:支持向量機(jī);主成分分析;股票預(yù)測
1.引言
股票是市場經(jīng)濟(jì)的產(chǎn)物,股票的發(fā)行與交易促進(jìn)了市場經(jīng)濟(jì)的發(fā)展。對股票投資者來說,未來股價變化趨勢預(yù)測越準(zhǔn)確,對利潤的獲取及風(fēng)險的規(guī)避就越有把握。傳統(tǒng)的股票技術(shù)分析方法有移動平均線法、點數(shù)圖法、K線圖法等,它們可以預(yù)測一段時間內(nèi)股指變換的大致走勢,但短期股票價格的變化往往是投資者更感興趣的信息。不少研究者將目光投向基于人工神經(jīng)網(wǎng)絡(luò)建立的預(yù)測模型,并取得了較好的預(yù)測效果[1]。SVM對經(jīng)驗的依賴較小,能夠獲得全局最優(yōu)解,具有良好的泛化性能,從而有效地克服了神經(jīng)網(wǎng)絡(luò)等方法無法避免局部極值的問題。由于影響股票預(yù)測的因素很多,這些因素之間存在高度的非線性、存在數(shù)據(jù)冗余等特征。因此,本文用主成分分析法對輸入因子進(jìn)行主成分提取并結(jié)合支持向量機(jī)對股票的開盤數(shù)進(jìn)行預(yù)測。
2.支持向量機(jī)
支持向量機(jī)(SVM)是一種機(jī)器學(xué)習(xí)方法,它的基礎(chǔ)是Vapnik創(chuàng)建的統(tǒng)計學(xué)習(xí)理論,采用了結(jié)構(gòu)風(fēng)險最小化準(zhǔn)則,在最小化樣本點誤差的同時,縮小模型泛化能力。而且它是一個凸二次優(yōu)化問題[2],能保證找到的極值解就是全局最優(yōu)解。支持向量機(jī)可用于模式分類和非線性回歸,它的主要思想是建立一個分類超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。
在SVM算法中,為了使預(yù)測結(jié)果具有更高的精確度,在對樣本進(jìn)行訓(xùn)練之前,則需要對某些參數(shù)進(jìn)行優(yōu)化。本文中支持向量機(jī)算法中的核函數(shù)選取徑向基核函數(shù),本文通過交叉驗證法對寬度參數(shù)σ以及優(yōu)化懲罰參數(shù)C做出尋優(yōu)。SVM模型采用的核函數(shù)是徑向基(RBF)函數(shù):
3.主成分分析(PCA)
主成分分析(PrincipalComponentAnalysis)又稱主分量分析,是由皮爾遜(Pearson)于1901年首先引入,后來由霍特林(Hotelling)于1933年進(jìn)行了發(fā)展。主成分分析的目的就是設(shè)法將原來眾多具有一定相關(guān)性的變量,重新組合為一組新的相互無關(guān)的綜合變量來代替原來變量[3]。其數(shù)學(xué)模型如下:
4.實驗結(jié)果分析
本文中的股票數(shù)據(jù)來自通信達(dá)股票交易軟件,所用軟件為MATLAB(R2014a)仿真軟件。本文基于支持向量機(jī)模型,結(jié)合主成分分析方法,建立了一個股票預(yù)測模型。選取了奧特迅(002227)從2015年8月25日到2016年1月25日這期間內(nèi)102個交易日每日的各種指標(biāo)。引用這期間內(nèi)的今日最高價、今日最低價、今日開盤價、今日收盤價、今日成交量、5日移動平均線、10日移動平均線、30日移動平均線、60日移動平均線、KDJ.K、KDJ.D、和KDJ.J這12個技術(shù)指標(biāo)作為輸入變量,將第二日收盤價作為輸出變量。選擇其中90組作為訓(xùn)練樣本集,12組作為檢驗測試樣本,輸入樣本和測試樣本的數(shù)據(jù)均統(tǒng)一歸一化到(0,1)之間的實數(shù)。
經(jīng)過計算機(jī)的仿真實驗,奧特迅測試的SVM算法和PCA-SVM算法計算結(jié)果見表1。比較表1中各算法的計算結(jié)果可以看出,PCA-SVM算法較SVM算法無論在收斂速度上,還是在誤差及精度上,都取得了更好的效果。由于股價預(yù)測的復(fù)雜性非常高,受各方面的因素影響,隨機(jī)事件也很多,要準(zhǔn)確預(yù)測股價,要想提高投資的獲利能力,可以考慮加入其他方法加以輔助。
5.結(jié)論
股票市場是一個高度復(fù)雜的非線性系統(tǒng),其變化既有內(nèi)在的規(guī)律性,同時也受到了政治事件、宏觀經(jīng)濟(jì)情況、交易員的心理狀況等諸多因素的影響。本文利用PCA-SVM神經(jīng)網(wǎng)絡(luò)模型來進(jìn)行股票價格的預(yù)測,并對國內(nèi)股市的漲跌進(jìn)行了初步的嘗試。此模型融合了主成分分析方法對輸入變量進(jìn)行降維處理,在縮短模型訓(xùn)練時間的同時,又保證了預(yù)測結(jié)果的精確性。從仿真的結(jié)果來看,對股票價格的短期預(yù)測能夠取得較好的效果,將該模型應(yīng)用于股市預(yù)測具有很強(qiáng)的現(xiàn)實意義和推廣價值,但是在SVM核函數(shù)參數(shù)優(yōu)化方面仍有可以改進(jìn)的地方,需要進(jìn)一步地探討。
參考文獻(xiàn):
[1]黃靜.神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測上的應(yīng)用[J].電腦知識與技術(shù)(學(xué)術(shù)交流).2007(07)
[2]馬法堯.模糊SVM在股市預(yù)測中的算法研究與應(yīng)用[J].西南民族大學(xué)學(xué)報(人文社科版).2006(10)
[3]謝中華.MATLAB統(tǒng)計分析與應(yīng)用:40個案例分析[M].北京航空航天大學(xué)出版社.2010:354-373
[4]高惠璇.應(yīng)用多元統(tǒng)計分析[M].北京大學(xué)出版社.2005:265-290.