国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SVM股票價格預測的核函數(shù)應用研究

2016-04-09 07:28:54黃同愿陳芳芳
關鍵詞:支持向量機

黃同愿,陳芳芳

(重慶理工大學 計算機科學與工程學院,重慶 400054)

?

基于SVM股票價格預測的核函數(shù)應用研究

黃同愿,陳芳芳

(重慶理工大學 計算機科學與工程學院,重慶400054)

摘要:對中國銀行股票價格進行了回歸預測。通過選擇最優(yōu)的徑向基核函數(shù),再利用網(wǎng)格尋參、遺傳算法和粒子群算法對最佳核函數(shù)參數(shù)進行對比尋優(yōu),構建最有效的支持向量機(SVM)模型,最后對中國銀行未來15日的開盤數(shù)變化趨勢進行預測。實驗仿真結果表明:應用構建的 SVM模型預測中國銀行未來15日的股票走勢是可行的。

關鍵詞:支持向量機;回歸預測;開盤數(shù)

股票是金融市場的一個重要組成部分,隨著社會經(jīng)濟的發(fā)展和人們理財意識的提高,越來越多的人開始關心股票市場。如果能對股票進行預測,指導股民做出合理的投資將是十分有價值的[1]。目前,應用于股票研究的傳統(tǒng)機器學習方法有很多,如遺傳算法[2]、決策樹、馬爾科夫鏈、灰色理論[3]等。這些方法都存在一些缺陷,如信息提取困難等,尤其在樣本數(shù)量少、分布不均的情況下會導致預測誤差增大,預測能力降低的問題。股票數(shù)據(jù)波動較強,具有混沌性、非線性和模糊性的特點,傳統(tǒng)的機器學習方法顯然無法較好地預測股票趨勢。

支持向量機(support vector machine,SVM)是新一代機器學習技術,能夠很好地處理小樣本、非線性、高維數(shù)的實際問題[4-5],解決了傳統(tǒng)機器學習方法所面臨的訓練需要大量數(shù)據(jù)樣本、過學習和欠學習等問題。再加上SVM基于VC維理論和結構風險最小化原理,具有更好的泛化能力,因此SVM能夠較好地對股票趨勢進行預測[6-9]。

為了研究SVM對股票的預測效果,本文選擇中國銀行的股票數(shù)據(jù)進行研究,通過最佳核函數(shù)與最優(yōu)核參數(shù)的選擇,構建SVM預測模型,從而使得對股票的預測精度達到最優(yōu)。

1基于徑向基核函數(shù)的SVM股票預測模型

1.1SVM的原理

給定樣本數(shù)據(jù)集:(x1,y1),(x2,y2),…,(xi,yi),…,(xl,yl),xi∈R,yi∈{-1,+1}

約束條件變?yōu)?/p>

引入拉格朗日函數(shù)和對偶變量有

再根據(jù)KKT條件可以得出:

1.2核函數(shù)的設定

SVM方法的基本思想基于1909年Mercer核展開定理,即通過非線性映射φ把樣本空間映射到一個高維乃至于無窮維的特征空間(Hilbert空間),應用線性學習機的方法解決樣本空間中的高度非線性分類和回歸等問題。

核函數(shù)是SVM的核心,其主要思想是將數(shù)據(jù)從低維映射到高維特征空間,將低維特征空間的非線性問題轉換成高維特征空間的最優(yōu)線性問題。特征空間由核函數(shù)來定義。核函數(shù)的學習并不是在高維特征空間進行,而是在相對較小的線性子空間中計算,并沒有增加算法的復雜性。

核函數(shù)的引入減少了運算量,避免了“維數(shù)災難”,輸入樣本特征的維數(shù)不會對核函數(shù)矩陣有影響。

核函數(shù)是SVM的核心組成部分,對于SVM算法的研究主要在于充分地理解核函數(shù),這樣才能更好地開發(fā)SVM訓練算法。核函數(shù)的選擇必須滿足mercer條件。常見的核函數(shù)有[7]:

線性函數(shù)K(xi,x)=xi·x

多項式核函數(shù)K(xi,x)=(xi·x+1)d

多層感知器函數(shù)K(xi,x)=tanh(kxi·x+θ)

1.3特征屬性的選取

常見的技術指標有平滑移動平均線MACD[6]、相對強弱指標RSI[10]、能量潮O(jiān)BV、順勢指標CCI、隨機指標KDJ、乖離率指標BIAS等。這些技術指標都對股票的預測產(chǎn)生一定的影響。本文選擇投資者經(jīng)常使用的、對股票價格影響比較大的幾種技術指標進行實驗研究。選擇中國銀行每日開盤價作為因變量,選擇開盤價、收盤價、最高價、最低價、成交量、平滑移動平均線(MACD)、相對強弱指標(RSI)、能量潮(OBV)和順勢指標(CCI)9個指標作為樣本輸入特征屬性來預測未來15天的股票走向。

1.4評價指標的選取

對股票預測模型的性能評價主要通過預測結果的精度和可靠性來確定。一般采取誤差的形式進行評價,具有科學性。本文采用誤差(error)、相對誤差(relative error)、均方差(Mean squared error)和相關系數(shù)R作為預測結果的精度評判標準。其定義如下:

1.5股票預測分析的步驟

對股票的預測原理進行分析和研究,通過對比Gauss核函數(shù)、Sigmoid核函數(shù)、多項式核函數(shù)構造出來的模型得出最佳核函數(shù)。再通過遺傳算法、網(wǎng)格尋優(yōu)、粒子群算法得出最佳核參數(shù),最后進行股票的預測。預測過程如下:

1) 收集將進行預測的銀行股票的歷史數(shù)據(jù),并將這些數(shù)據(jù)作為訓練集和測試集2個部分。

2) 對股票的原始數(shù)據(jù)進行預處理,將其歸一化以提高模型的收斂速度。

3) 通過遺傳算法、粒子群算法、網(wǎng)格參數(shù)尋優(yōu)的方法找出最優(yōu)參數(shù)。分別用不同方法尋找到的最優(yōu)參數(shù)對股票數(shù)據(jù)進行訓練學習,并確定每個最優(yōu)模型參數(shù)。進行實驗對比,從而確定每個核函數(shù)所確定的最優(yōu)SVM預測模型。

4) 使用訓練出來的最優(yōu)SVM預測模型對中國銀行股票15日數(shù)據(jù)進行預測,得出預測結果。

2仿真實驗

2.1數(shù)據(jù)來源與預處理

本文采用的樣本數(shù)據(jù)主要來自大智慧軟件提供的中國銀行數(shù)據(jù)樣本,為從2014年8月20日到2015年7月15日的數(shù)據(jù),共220組。前205個數(shù)據(jù)作為訓練數(shù)據(jù),用于估算模型的參數(shù);剩余15個數(shù)據(jù)作為預測數(shù)據(jù),對構建的SVM模型的精度進行檢驗。在股票預測中主要是以收盤價作為預測對象。本文主要進行股票短期的預測,將預測未來15天的股票趨勢。在實驗中對中國銀行的開盤數(shù)進行歸一化處理(這里將其歸一化到[0,6]區(qū)間),中國銀行股票的原始數(shù)據(jù)與歸一化后的數(shù)據(jù)如圖1、2所示。

2.2不同SVM預測模型準確度對比

2.2.1不同核函數(shù)預測結果對比

SVM中核函數(shù)的選擇很重要,采用不同的核函數(shù)進行對比(采用[0,6]歸一化),結果如表1所示。

圖1 原始數(shù)據(jù)

圖2 歸一化后的數(shù)據(jù)

核函數(shù)預測結果參數(shù)選項線性核函數(shù)MSE=0.0349327R=98.5823%‘-c64-g1-t0’多項式核函數(shù)MSE=0.000234488R=99.6517%‘-c64-g1-t1’徑向基核函數(shù)MSE=9.77353e-005R=99.9974%‘-c64-g1-t2’

從表1可以看出:徑向基核函數(shù)在股票預測上要比其他2個核函數(shù)預測效果好。因此,本文選擇徑向基核函數(shù)構建SVM模型。

2.2.2不同方法尋找最優(yōu)參數(shù)股票預測對比

在確定徑向基核函數(shù)后,再進一步確定如何選取最佳懲罰參數(shù)c和核參數(shù)g。參數(shù)c和g的選取是研究中國銀行股票預測的重要組成部分。本文通過網(wǎng)格參數(shù)優(yōu)化SVM、遺傳算法優(yōu)化SVM和粒子群優(yōu)化算法選擇最佳的參數(shù)c和g,結果如表2所示。

表2 不同算法尋參對比

從表2可以看出:網(wǎng)格參數(shù)尋優(yōu)得出的結果更有效,更能提高股票的預測精度。因此,本文選取網(wǎng)格參數(shù)尋優(yōu)的方法,從而更有效地構建SVM回歸預測模型,使得預測結果更能接近實際結果。網(wǎng)格參數(shù)法優(yōu)化SVM結果如圖3、4所示。

圖3 網(wǎng)格參數(shù)法優(yōu)化SVM結果(等高線圖)

圖4 網(wǎng)格參數(shù)法優(yōu)化SVM結果(3D視圖)

遺傳算法、粒子群算法優(yōu)化SVM參數(shù)的結果如圖5、6所示。

由圖3~6可以發(fā)現(xiàn):網(wǎng)格尋參的效果更優(yōu)。為此將參數(shù)取整數(shù)進行實驗,選最佳參數(shù)為c=64,g=1。

圖5 遺傳算法優(yōu)化SVM參數(shù)的結果

圖6 粒子群算法優(yōu)化SVM參數(shù)的結果

2.3結果分析

通過不同SVM預測模型對比結果,選擇參數(shù)c=64,g=1。將數(shù)據(jù)歸一化到[0,6],采用最優(yōu)參數(shù)對SVM進行訓練,構建SVM模型,并對中國銀行股票指數(shù)進行預測,得到的預測結果對比如圖7所示。誤差、相對誤差如圖8、9所示。

15日股票價格趨勢預測對比如圖10所示(將15日原始數(shù)據(jù)和預測數(shù)據(jù)處理到[0,1]區(qū)間內(nèi))。

圖7 原始數(shù)據(jù)與預測數(shù)據(jù)結果對比

圖8 預測結果誤差

圖9 預測結果相對誤差

圖10 15日股票價格趨勢預測對比

由對比結果可以清晰地看出:中國銀行股票15日預測走勢同原始走向具有一致性,對反轉點位置的確定很精確,在第3,5,8,11,14這些反轉點都具有高度的一致性,能夠準確地指導股民對股票進行合理的投資。

3結束語

針對傳統(tǒng)股票預測方法存在的過擬合、局部最優(yōu)的缺陷,提出一種基于SVM的股票價格預測模型來預測中國銀行股票數(shù)據(jù)未來15日的走向。仿真實驗結果表明:本研究在預測中國銀行股票未來15日的走勢中具有較高的精度,預測結果可靠性強、誤差小,能夠為股民提供有用的參考信息。

通過分析可以得到如下結論:

1) 預測結果與參數(shù)的選擇有關系,同時也會耗費一定的時間,使計算速度降低。

2) 粒子群算法、遺傳算法和網(wǎng)格算法各有利弊。本文的預測中網(wǎng)格算法效果更佳。

3) 需要針對具體問題對數(shù)據(jù)進行預處理。本文由于各指標數(shù)值相差較大,需要對數(shù)據(jù)進行預處理,提高精準度,同時使運算速度較快。

4) 本文僅對中國銀行股票進行預測,即針對個股進行預測研究,對于大盤數(shù)據(jù)的研究具有指導作用。而對于數(shù)據(jù)的不穩(wěn)定性、高噪聲等問題仍需進行更深入的研究。

參考文獻:

[1]周健,錢凱,盧小廣.基于股票股利超額收益的實證研究[J].重慶理工大學學報(自然科學版),2015,29(5):147-151.

[2]王唯賢,陳利軍.股票價格預測的建模與仿真研究[J].計算機仿真,2012(1):344-347.

[3]楊陽.股票價格預測方法研究[J].經(jīng)營管理者,2011(16):32,24.

[4]顧亞祥,丁世飛.支持向量機研究進展[J].計算機科學,2011,38(2):14-18.

[5]周哲,楊志霞.基于凹凸過程的雙支持向量機[J].重慶理工大學學報(自然科學版),2014,28(10):90-95.

[6]王定成.支持向量機建模與控制[M].北京:氣象出版社,2009:22-41.

[7]楊志民,劉廣利.不確定性支持向量機[M].北京:科學出版社,2012:19-33.

[8]黃朋朋,韓偉力.基于支持向量機的股價反轉點預測[J].計算機系統(tǒng)應用,2010(9):214-218.

[9]張翔宇,王富森.基于支持向量機的上證指數(shù)預測研究[J].商業(yè)經(jīng)濟,2011(3):104-106.

[10]張玉川,張作泉.支持向量機在股票價格預測中的應用[J].北京交通大學學報,2007(6):73-76.

(責任編輯劉舸)

Application of Kernel Function of Stock Price Forecasting Based on SVM

HUANG Tong-yuan,CHEN Fang-fang

(College of Computer Science and Engineering,Chongqing University of Technology,Chongqing 400054,China)

Abstract:The paper conducted a regression forecast of Bank of China stock index. By selecting the optimal radial basis function, and then, for the optimal kernel function, we selected the parameter optimization using grid homing, genetic algorithm and PSO algorithm to build the most effective SVM model, and finally we predicted the opening number of the Bank of China in the next 15 days. The simulation shows that using SVM model to prediction Bank of China shares in the next 15 days the trend is very feasible.

Key words:support vector machine; regression prediction; opening quotation

文章編號:1674-8425(2016)02-0089-06

中圖分類號:TP393

文獻標識碼:A

doi:10.3969/j.issn.1674-8425(z).2016.02.016

作者簡介:黃同愿(1975—),男,湖北人,博士研究生,副教授,主要從事計算機應用研究。

基金項目:重慶市教委科學技術研究項目(KJ1500920);企業(yè)委托項目(2015Q147)

收稿日期:2015-11-28

引用格式:黃同愿,陳芳芳.基于SVM股票價格預測的核函數(shù)應用研究[J].重慶理工大學學報(自然科學版),2016(2):89-94.

Citation format:HUANG Tong-yuan,CHEN Fang-fang.Application of Kernel Function of Stock Price Forecasting Based on SVM[J].Journal of Chongqing University of Technology(Natural Science),2016(2):89-94.

猜你喜歡
支持向量機
基于支持向量回歸機的電能質(zhì)量評估
基于智能優(yōu)化算法選擇特征的網(wǎng)絡入侵檢測
數(shù)據(jù)挖掘技術在電廠經(jīng)濟性分析系統(tǒng)中的應用Q
基于改進支持向量機的船舶縱搖預報模型
中國水運(2016年11期)2017-01-04 12:26:47
基于SVM的煙草銷售量預測
軟件導刊(2016年11期)2016-12-22 21:52:38
動態(tài)場景中的視覺目標識別方法分析
論提高裝備故障預測準確度的方法途徑
價值工程(2016年32期)2016-12-20 20:36:43
基于熵技術的公共事業(yè)費最優(yōu)組合預測
價值工程(2016年29期)2016-11-14 00:13:35
基于支持向量機的金融數(shù)據(jù)分析研究
管理類研究生支持向量機預測決策實驗教學研究
考試周刊(2016年53期)2016-07-15 09:08:21
阿合奇县| 阜新| 香格里拉县| 磐安县| 亳州市| 磐石市| 安康市| 大埔县| 呼和浩特市| 乌什县| 平度市| 泸州市| 石棉县| 石嘴山市| 饶河县| 鲁山县| 溆浦县| 勐海县| 旬邑县| 双牌县| 临沭县| 连州市| 萍乡市| 磴口县| 颍上县| 黑河市| 岳西县| 宝清县| 玉龙| 桃江县| 赤峰市| 当阳市| 安国市| 金川县| 柏乡县| 苍山县| 尼木县| 恭城| 阳泉市| 枣强县| 三江|