張柯柯
【摘 要】本文采用支持向量回歸(SVR)對(duì)股票價(jià)格進(jìn)行預(yù)測(cè)分析,以中國(guó)人壽(601628)為對(duì)象進(jìn)行建模和預(yù)測(cè)研究。選取中國(guó)人壽2015-2016Q1的股票技術(shù)指標(biāo)等數(shù)據(jù)作為訓(xùn)練樣本對(duì)下一交易日的開盤價(jià)進(jìn)行預(yù)測(cè),以2016年4月的數(shù)據(jù)進(jìn)行檢驗(yàn),并通過圖像擬合來驗(yàn)證SVR用于股票預(yù)測(cè)的可行性和準(zhǔn)確性。
【關(guān)鍵詞】股票預(yù)測(cè);支持向量機(jī)
1.引言
隨著我國(guó)證券市場(chǎng)的深化發(fā)展,市場(chǎng)參與人數(shù)的增加,如何預(yù)測(cè)股票價(jià)格走勢(shì)受到了廣大投資者的關(guān)注。而股票市場(chǎng)的價(jià)格波動(dòng),一方面受IPO與資金的供求關(guān)系、大小非解禁和減持效應(yīng)的影響;同時(shí)受宏觀經(jīng)濟(jì)周期、貨幣供給、物價(jià)變化、利率水平等宏觀經(jīng)濟(jì)因素和公司經(jīng)營(yíng)管理、治理結(jié)構(gòu)等微觀結(jié)構(gòu)的影響;另一方面股票市場(chǎng)上投資者行為和政策性因素也會(huì)對(duì)股票市場(chǎng)波動(dòng)產(chǎn)生重要影響。
為了保證投資收益降低風(fēng)險(xiǎn),股票價(jià)格預(yù)測(cè)成為投資者關(guān)注的熱點(diǎn),同時(shí)股票市場(chǎng)的波動(dòng)與貨幣政策、財(cái)政政策的變化密不可分,股票市場(chǎng)作為資本市場(chǎng)的重要組成部分,對(duì)推動(dòng)經(jīng)濟(jì)的發(fā)展發(fā)揮重要作用,因而政策制定者也迫切需要了解宏觀調(diào)控對(duì)股票市場(chǎng)的影響,預(yù)測(cè)股票價(jià)格波動(dòng)。國(guó)內(nèi)外學(xué)者們從不同角度,采用各種方法對(duì)股票價(jià)格做仿真實(shí)踐與理論研究,如時(shí)間序列模型模型與神經(jīng)網(wǎng)絡(luò)模型。在時(shí)間序列預(yù)測(cè)模型方面,史書真(2013)[1]介紹了ARMA模型在股票預(yù)測(cè)中的應(yīng)用,對(duì)中國(guó)石油等股票進(jìn)行仿真,得出ARMA模型能較好的預(yù)測(cè)股價(jià);徐楓(2006)[2]則用GARCH模型對(duì)我國(guó)航空業(yè)代表性股票進(jìn)行仿真。在神經(jīng)網(wǎng)絡(luò)應(yīng)用于股票預(yù)測(cè)方面:張?。?997)[3]研究了BP神經(jīng)網(wǎng)絡(luò)在股票價(jià)格預(yù)測(cè)中的應(yīng)用,對(duì)“陸家嘴”等股票的樣本數(shù)據(jù)進(jìn)行學(xué)習(xí)和檢驗(yàn),得出BP神經(jīng)網(wǎng)絡(luò)在股票分析與預(yù)測(cè)中有一定的應(yīng)用前景。陳政等人(2010)[4]利用RBF社交網(wǎng)絡(luò)對(duì)生政綜合指數(shù)進(jìn)行仿真,得到了較好的預(yù)測(cè)效果。然而這些模型有其局限性,如存在局部極小值、欠學(xué)習(xí)、過學(xué)習(xí)等問題,SVM模型則較好的解決了上述問題,被廣泛的應(yīng)用于證券領(lǐng)域,并取得了很好的效果。
2.SVR
支持向量機(jī)(support vector machine, SVM)是美國(guó)Vapnik教授于1990年代提出的一種機(jī)器學(xué)習(xí)方法。SVM的基本思想是將原始非線性訓(xùn)練數(shù)據(jù)集通過非線性途徑映射到一個(gè)高維特征空間,使其變得線性可分,然后在該特征空間中找到一個(gè)具有最大分離距離的超平面[5]。支持向量機(jī)的結(jié)構(gòu)示意圖可以表示如下:
支持向量機(jī)的網(wǎng)絡(luò)結(jié)構(gòu)類似于神經(jīng)網(wǎng)絡(luò),其中輸入層是為了存貯輸入數(shù)據(jù);中間層是通過對(duì)樣本集的學(xué)習(xí)和選擇;其輸出則是若干中間層節(jié)點(diǎn)的線性組合。
支持向量回歸(SVR)是支持向量在函數(shù)回歸領(lǐng)域的應(yīng)用。對(duì)于非線性SVR,其基本思想是通過將輸入向量映射到高維特征空間中,然后在此高維空間中再進(jìn)行線性回歸,從而取得在原空間非線性回歸的效果。使用支持向量回歸(SVR)解決回歸問題,首先應(yīng)選擇合適的核函數(shù).常見的核函數(shù)包括線性核函數(shù)、多項(xiàng)式形式核函數(shù)、RBF(徑向基)核函數(shù)、Sigmoid核函數(shù)等。本文選擇式(1)所示的RBF(徑向基函數(shù))作為核函數(shù).其次要選取合適的 RBF核參數(shù)、懲罰因子C和損失函數(shù)。 (1)
3.實(shí)驗(yàn)仿真
3.1 模型指標(biāo)體系的構(gòu)建
本文以上海證券交易所上市的中國(guó)人壽(601628)的股票數(shù)據(jù)進(jìn)行預(yù)測(cè),數(shù)據(jù)來源于WIND金融數(shù)據(jù)庫。選取中國(guó)人壽(601628)2015年1月5日至2016年4月29日期間323個(gè)交易日的數(shù)據(jù)作為樣本集,其中2016年4月份(后19個(gè)交易日)的數(shù)據(jù)作為預(yù)測(cè)樣本,其余數(shù)據(jù)作為訓(xùn)練樣本。以開盤價(jià)(元),最高價(jià)(元,最低價(jià)(元),收盤價(jià)(元),成交額(百萬),滬深300指數(shù)作為股票價(jià)格預(yù)測(cè)的輸入變量集,數(shù)據(jù)見表1所示;以下一日開盤價(jià)作為輸出變量。
3.2 SVR參數(shù)選擇
SVM的性能很大程度上依賴于核函數(shù)的選擇,但沒有很好的方法指導(dǎo)針對(duì)具體問題的核函數(shù)選擇。SVMcgForRegress函數(shù)的目標(biāo)是為SVM算法尋求一對(duì)最佳的參數(shù)c和g。
3.3實(shí)驗(yàn)結(jié)果分析
本文用SVR對(duì)中國(guó)人壽(601628)股票價(jià)格的預(yù)測(cè)結(jié)果如圖3所示,從圖中可見預(yù)測(cè)值與實(shí)際值的整體趨勢(shì)基本符合實(shí)際數(shù)值的趨勢(shì)。
從仿真的結(jié)果來看,可以看出SVR是可以對(duì)股票價(jià)格進(jìn)行預(yù)測(cè)的,為投資者提供更好的投資依據(jù),但在SVR核函數(shù)的選擇及參數(shù)選定方面需進(jìn)一步 研究。
參考文獻(xiàn):
[1]史書真.股價(jià)時(shí)間序列的分析與預(yù)測(cè)研究[D].大連:大連理工大學(xué),2013.
[2]徐楓. 股票價(jià)格預(yù)測(cè)的GARCH模型[J].統(tǒng)計(jì)與決策, 2006(18):107-109.
[3]張健,陳勇,夏罡,何永保.人工神經(jīng)網(wǎng)絡(luò)之股票預(yù)測(cè)[J].計(jì)算機(jī)工程, 1997(2):52-55.
[4]陳政,楊天奇. 基于RBF神經(jīng)網(wǎng)絡(luò)的股票市場(chǎng)預(yù)測(cè)[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2010, 27(06):108-110.
[5]鐘用祿,李海山,劉發(fā)圣,譚鵬,張尚志,張成.基于PCA-SVR的燃煤鍋爐NO_x排放預(yù)測(cè)[J]. 熱力發(fā)電,2015(1):87-90.
[6]Vladimir Vapnik. The Nature of Statistical Learning Theory(Second Edition)[M]. Springer Verlag, 2000.