国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于離群特征模式的股市波動預測模型

2014-08-04 02:38:48王浩陳娟姚宏亮李俊照
計算機工程與應用 2014年22期
關鍵詞:背離離群馬爾可夫

王浩,陳娟,姚宏亮,李俊照

合肥工業(yè)大學計算機與信息學院,合肥 230009

基于離群特征模式的股市波動預測模型

王浩,陳娟,姚宏亮,李俊照

合肥工業(yè)大學計算機與信息學院,合肥 230009

隨著金融市場的逐步完善,投資理念的逐步深入,股票投資被越來越多的人所接受,但是證券市場是高風險與高收益并存的,因此,有效的預測方法對減少投資風險是很有必要的,關于證券市場的分析和預測也一致為人們所關注。對于股票市場的預測問題國內外很多學者都做了有意義的探索,早期ARIMA技術應用于時間序列預測,但是ARIMA是線性預測的方法。隨著非線性科學的發(fā)展,人們提出了神經網絡方法應用在金融時間序列的分析和預測[1],相對于ARIMA模型神經網絡模型有很大的優(yōu)勢,然而神經網絡方法有很多局限性,神經網絡存在有很多參數如網絡大小、初始權重的選擇問題,而且可能存在過學習的現象,導致泛化能力很低,在訓練過程中存在局部極小問題,且收斂速度慢。

支持向量機(Support Vector Machines,SVM)[2]已經被認為是先進的回歸和分類的技術。最早是由Cortes和Vapnik于1995年提出,以統(tǒng)計學習理論為基礎,其與傳統(tǒng)機器學習理論最大的不同在于,它服從結構風險最小化原理而非經驗風險最小化。SVM綜合考慮經驗風險與置信風險,具有很好的泛化能力。支持向量機可以獲得全局最優(yōu),解決了其他的神經網絡模型陷入局部最優(yōu)的問題,而且支持向量機還能解決過度擬合的問題,很多的實驗結果也表明SVM算法優(yōu)于人工神經網絡的預測[3]。

隨著上市公司越來越多,股票市場的規(guī)模也越來越大,由于一支股票會受到諸多因素的影響,信息量是很龐大的,而且存在冗余,如果不對這些信息進行約減,會導致運算量很大,增加運算的時間。特征選擇[4]是從原始的輸入變量中挑選子集,選擇的子集能更好地表示原數據集的特征,提高預測的精度和有效性。人們一直都在尋找快速、準確的約減算法,出現了很多關于特征選擇的算法,基于核主成分分析作為特征選擇預測股票價格[5],將粗糙集與SVM結合進行特征選擇[6],GA遺傳算法進行特征提取[7]等,但是這些算法有它們的局限性,沒有從整個網絡的角度考慮,目標變量的馬爾可夫毯[8]與其他變量獨立,屏蔽其他變量的影響,能較好地保證信息的獨立性和完整性。

股市波動是一種必然現象,但由于中國股市容易受到的政府政策的影響,波動過于頻繁和劇烈,相比其他成熟市場存在更多的異常波動,頻繁且劇烈的波動會使投資者難以做出正確的投資決策[9]。股市的政策指標分為中長期連續(xù)性政策和短期性的離散政策事件,分析不同的政策對股市的沖擊大小,結果表明連續(xù)性政策與我國股市之間存在正相關關系,但解釋程度較小,股市的波動受短期性的政策時間影響較大,但政策事件對股市的沖擊力在逐步減弱,股票市場也趨于成熟。而股票市場也有其自身的變化趨勢,我們通過描述股票走勢的指標從微觀的角度去研究股票市場內部的波動現象,有很多學者分析技術指標對股票走勢的影響[10-11],離群特征模式針對股票中背離特征,將特征進行一定的組合提取,相比于其他的算法只是將特征作為模型的輸入向量要更加合理、有效。

一種融合離群特征模式的支持向量機模型通過馬爾可夫毯算法找出與目標結點相關的股票,對相關股票建立支持向量機模型,實驗發(fā)現建立的模型對股票的一般波動預測效果比較好,對于異常波動不能得到有效的預測,進一步通過股票的指標特征與走勢背離的現象提取特征模式,通過時序滑動窗口動態(tài)捕捉背離指標,將離群特征模式作為先驗知識[12]加入原SVM模型中,可以減小異常波動帶來的誤差,提高模型的預測精度。

1 馬爾可夫毯的相關概念

在給定的貝葉斯網絡中(Bayesian networks)[13]中一個變量的馬爾可夫毯時,貝葉斯網絡中其他變量與該變量條件獨立,一個變量的馬爾可夫毯能屏蔽其他變量對該變量的影響。

定義1對貝葉斯網絡G=<V,E>和聯(lián)合概率密度P(V),如果G所表示的條件獨立性和P所表示的馬爾可夫條件一一對應,稱G和P是faithful。而在具有忠實性的因果概率網絡中,任何變量的馬爾可夫毯MB(T)是唯一存在的。

定義2 D-分離(D-separation)對于一個有向無環(huán)圖,有三個互不相交的結點子集A、B、C,若A中一個結點X與B中一個結點Y之間的一條通路不滿足以下兩個條件:

(1)每一個具有匯聚結點的箭頭的結點均在C中,或有一個子孫結點C中。

(2)其他所有結點都不在C中,稱結點X和結點Y被集合CD-分離;能D-分離結點X和結點Y的最小結點集稱為結點X和結點Y最小D-分離集。

定義3一個變量的馬爾可夫毯MB(T),是在給定集合時,變量集V中所有其他結點與變量T條件獨立性最小的集合。在具有忠誠性的有向無環(huán)圖中每個結點T的馬爾可夫毯是由T的父結點、子結點、子結點的父結點組成。

圖1是一個貝葉斯網絡,圖中所有結點均為結點X的馬爾可夫毯,U1、Um為X的父結點,Y1、Ym為X的子結點,Z1、Zm為X的子結點的父結點,都是X結點的馬爾可夫毯。

圖1 貝葉斯網絡

2 支持向量機算法介紹

支持向量機方法是建立在統(tǒng)計學習理論的VC維理論和結構風險最小原理基礎上的,在模型的復雜性和學習能力之間尋求最佳的折衷來獲得更好的泛化能力。早期提出這個方法是為了解決模式識別分類問題,現在支持向量機已擴展到解決回歸估計,并在時間序列預測,非線性建模和優(yōu)化控制等問題上都有很好的應用。

支持向量機的基本思想是通過核函數將輸入的變量映射到高維空間中,在新的特征空間進行線性回歸。給定訓練樣本集(x1,y1),(x2,y2),…,(xl,yl),其中xi∈RN為N維特征向量,yi∈{-1,1}或yi∈{1,2,…,k};當yi∈{-1,1}時為最簡單的二分類,當yi∈{1,2,…,k}為k分類問題。

在線性可分的情況下,存在一個超平面方程為w·x+b=0,對它進行歸一化,線性可分的樣本集滿足yi((w·x)+b)-1≥0,i=1,2,…,l;分類間隔為2/||w||,要求最優(yōu)超平面就要是分類間隔最大,εi是松弛變量表示被錯分的程度,C是懲罰因子,表示加載錯分點上的懲罰。原始的求解問題就轉化為求解如下的凸二次規(guī)劃問題:

這是一個凸二次規(guī)劃問題可以求得全局最優(yōu)點,用Lagrange乘子把它轉化成對偶形式來求解。得到最優(yōu)超平面決策函數

對于非線性SVM的情況,是根據核函數將樣本空間映射到高維的特征空間進行線性劃分,為了避免高維特征中的復雜計算,支持向量機采用核函數K(xi·x)來代替高維空間中的內積運算。最優(yōu)超平面的決策函數變?yōu)椋?/p>

3 離群特征模式

一般情況下股票價格變化可以看作為一種光滑、連續(xù)的過程,這時股票市場穩(wěn)定運行,投資者與股票發(fā)行方都可以進行正常的投資與經營活動,獲得各自的收益。但在一些特殊情況(如國家重大經濟政策的調整,各股票相關行業(yè)中發(fā)生突發(fā)事件以及投資者心態(tài)出現劇烈變化等情況)下,股票價格的短期變化將有可能由連續(xù)變化轉化為跳躍式變化,這種由于宏觀政策引起突變性是很難預測到的。

在股市預測中這種突變帶來的尖峰點是造成誤差的很大原因,針對這一情況引入離群特征,所有事情發(fā)生都有其前兆,事后從宏觀方面看這種突變是具有可解釋的,在事件發(fā)生之前從微觀的角度可以發(fā)現某些端倪的。這種離群特征是股市微觀層面的一些指標,像成交量,換手率,包括一些K線指標,這些指標是對股市的一種刻畫,當兩者發(fā)生背離時預測走勢即將發(fā)生改變,根據特征背離的情況提取離群特征模式【14】。

3.1 離群特征模式定義

定義4(離群特征模式)股票指標是運用一些復雜的數學公式,用數據來論證股票趨向、買賣的分析方法的一種工具。背離有兩種情況,一種是指標與走勢發(fā)生背離;一種是指標之間發(fā)生背離。股票數據D={S1,S2,…,Sn},其中Si是第i支股票的數據,Si={Yt,k1,k2,…,km},Yt記錄的是股票的收盤價,k1,k2,…,km記錄股票的一些指標包括成交量、MACD、KDJ等K線指標。

(1)指標k1,k2,…,km,收盤價為Yt,如果f(k1,k2,…,km)*Yt<0指標組合與走勢發(fā)生背離,Yt+1=F(f(k1,k2,…,km),Y),后一天的走勢是指標組合與前面走勢的一個函數。指標與股票的走勢是相關的,如果兩者之間發(fā)生背離,說明走勢即將發(fā)生大的變化。

(2)指標k1,k2,…,km,fi(k1,k2,…,km)*fj(k1,k2,…,km)<0,指標之間發(fā)生背離,也是一種異常情況。

本文主要考慮的是指標與走勢之間的背離關系,根據指標與走勢的背離情況提取的指標組合構成一個模式,稱為離群特征模式。

3.2 離群特征模式提取

根據股票價格時序數據的K線指標分析,根據走勢的異常波動對K線指標的背離情況進行離群特征提取,提取了三種背離特征模式,并且用案例對提取的模式進行了論證。

案例一(房地產板塊)2012年12月24日上漲0.8%,成交量明顯縮量,12月25日上漲4.24%;2012年12月4日上漲縮量,12月5日是長陽,漲幅達3.03%。

案例二(上證指數)2012年1月6日上漲0.7%,成交量縮量,1月7日上漲2.89%;2010年12月10日上漲1.07%成交量縮小,12月11日上漲2.88%。

定義6(MACD背離)在震蕩后期,觀察MACD指標在震蕩期間正能量柱不斷縮短(負能量柱不斷增長),觀察KDJ指標也在下降,尤其是當KDJ出現死叉,MACD指標Mt,KDJ指標Kt、Dt、Jt,當Mt-Mt-1<0 AND((Kt-Dt)<εAND(Jt-Dt)<εAND(Jt-Kt)<ε)),說明后面已經缺乏能量提供股價繼續(xù)上漲,股價下跌。

案例三(房地產板塊)2013年1月4日開始有連續(xù)5天的震蕩,在第五天上漲的時候能量柱還是在下降,指標發(fā)生背離,KDJ指標形成死叉,1月11日跌幅3.38%;2012年9月10日震蕩5天,第四天能量柱開始下降,KDJ形成死叉,第五天小幅上漲跟指標發(fā)生背離,9月17日跌幅3.74%。

案例四(上證指數)2012年8月7日由連續(xù)的小幅漲跌,第四天下跌但MACD能量柱繼續(xù)上漲,KDJ開始下跌,8月31日開始下跌;2011年7月14日開始小幅震蕩,第7天十字星形式的上漲,MACD繼續(xù)下跌,KDJ也一直在下跌,7月25日下跌2.96%。

突變的長實體打破了之前的走勢,影響后面的預測,尤其是長實體之后又出現長實體(雙實體),之前建立的模型很難立即跟上這樣的變化趨勢進行預測,而且這種突變本身就帶有很多的信息,不是每次都可以及時捕捉到有效信息去預測變化,在出現突變之后捕捉有效的特征提取模式。

案例五(房地產板塊)2012年12月28日上漲2.76%,成交量是前一天的1.2倍,12月31日上漲2.18%;2012年6月6日上漲2.13%,成交量是前一天1.2倍,后面連續(xù)小幅上漲3天。

案列六(上證指數)2012年9月27日上漲2.60%,成交量是前一天1.4倍,28日上漲1.45%;2012年2月8日上漲2.43%,成交量是前一天1.3倍,之后連續(xù)小幅上漲兩天。

4 融合離群特征模式的支持向量機

本文提出一種融合離群特征模式的支持向量機算法,由于股票之間是相互關聯(lián)的,相互之間有信息傳遞,也會互相影響,在給定目標變量的馬爾可夫毯的情況下,目標變量和網絡中的其他變量是條件獨立的,從而能得到與目標變量關聯(lián)性較強的局部變量集合,這種局部變量可以屏蔽其他變量的影響,保證信息的完整性;一支股票除了會受到其他股票的影響,自身的一些信息也有一定的意義,根據目標變量的相關數據提取離群特征模式作為先驗知識[15],用時序滑動窗口捕捉離群特征,建立離群特征模型,可以有效地預測由背離引起的異常波動。該算法從兩個角度出發(fā)進行股票的預測,將兩個模型融合在一起,能有效地提高預測精度。

4.1 馬爾可夫毯進行特征選擇

在股票市場中各個股票相互之間是有關聯(lián)的,馬爾可夫毯算法可以屏蔽網絡中其他結點對目標變量的影響。本文用的是HITON_PC/MB算法【16】,這個算法是當前主要學習馬爾可夫毯的算法,首先啟發(fā)式搜索與目標結點T關聯(lián)性最強的結點,用條件獨立性測試得到目標結點T的父結點和子結點的集合PC(T),再次調用算法,可以得到結點T父結點的父結點,父結點的子結點,子結點的父結點,子結點的子結點集合PC(PC(T)),再根據條件依賴的性質尋找配偶結點,剔除與T不互為父子的結點,從而獲得目標結點T的馬爾可夫毯集合MB(T)。

4.2 建立離群特征模型

一支股票不僅受到其他相關股票的影響,股票自身反映走勢的指標也會對股票走勢的預測帶來很多有價值的信息。離群特征模式中定義的三種背離模式,不是直接將這些特征作為輸入變量,而是對特征進行一定的提取。上漲背離主要收集的特征是成交量與前一天成交量的差值,成交量與平均成交量的差值;MACD背離收集的指標是股票漲跌與能量柱上下波動趨勢的對比,計算背離的大小,以及KDJ的變化趨勢,將這些特征k1,k2,…,km進行特征組合后的特征變量f1(k1,k2,…,km),f2(k1,k2,…,km),…,fn(k1,k2,…,km)作為支持向量機的輸入變量,收益率U(i)為輸出變量,建立離群特征模型。

4.3 離群特征模式的引入

使用時序滑動窗口捕捉離群特征,將離群特征模型預測的結果作為先驗知識加入SVM模型中,在支持向量機公式中加入約束條件使預測結果在[U(i)+μ1,U(i)-μ2]范圍之間,μ1、μ2參數通過建立離群特征模型的誤差獲得。

類似標準的支持向量機算法,融合先驗知識的支持向量機表示:

4.4 算法描述

輸入:股票價格數據集Data1,股票特征集Data2

輸出:預測股票收益率結果

步驟1用公式Ri(t)=ln(Ii(t)/Ii(t-1))將股票價格轉化為收益率。

步驟2用HITON_PC/MB算法獲得目標變量T的馬爾可夫毯mb。

步驟3將目標變量T以及馬爾可夫毯mb的收益率作為支持向量機的輸入變量,建立基本的支持向量機模型。

步驟4根據定義的離群特征模式對特征k1,k2,…,km進行組合,將組合后的特征變量f1(k1,k2,…,km),f2(k1,k2,…,km),…,fn(k1,k2,…,km)作為支持向量機的輸入變量,建立離群特征模型,用訓練數據建立的模型去預測訓練數據,求得平均誤差值為μ1、μ2的大小。

步驟5使用時序滑動窗口捕捉離群特征,如果存在離群特征使用離群特征模型預測,將預測結果作為原SVM模型的先驗知識,進行條件約束。

步驟6預測結果評價。

5 實驗數據處理

5.1 本文數據來自大智慧軟件下載的上證行業(yè)板塊指數

第一組數據采用的是30個板塊自2008年12月24日至2012年7月10日交易日股票行業(yè)板塊每日收盤指數,一共是860個數據。

表130 個板塊的名稱

5.2 用馬爾可夫毯進行特征選擇

本文采用收盤指數的日對數收益率作為股市行業(yè)板塊的指標,日對數收益率是指當日的收盤價格比上昨日的收盤價格的值取對數,用Yt表示板塊i在日期t的收盤價格,Ri(t)=lnln(Yt/Yt-1)表示板塊t在日期t的日對數收益率。

以1號結點房地產板塊為目標變量,馬爾可夫毯學習算法——HITON_PC/MB算法目標變量的馬爾可夫毯,1號結點是(房地產)的馬爾可夫毯是5(銀行)、15(旅游酒店)、19(建材)、25(工程建筑)、30(電力)。

圖2 結點1(房地產板塊)的馬爾可夫毯

5.3 對數據預處理

對于一個m維的樣本數據,如果不同分量的數據在不同的數量級上,數量級大的分量就會掩蓋數量級小的分量的影響,所以對原始數據要進行一定的處理。對與不同分量中那個每一個值都減去該分量的最小值,再除以該分量最大值與最小值之差。

5.4 模型參數的選擇

對于內積核函數的選擇,目前最常用的主要有線性核函數,多項式核函數,高斯徑向基核函數,但實驗研究表明采用這三種不同核函數的SVM能得到性能相近的結果,且支持向量的分布差別不大。本文使用的核函數是最常用的徑向基核函數。本文采用交叉驗證和網格搜索方法對參數C,g尋優(yōu),參數C是懲罰參數,參數g是RBF可函數中的參數g,讓C、g在一定范圍內取值,使用交叉驗證的方法,最終取在訓練集上誤差最小的參數值作為最優(yōu)參數,過高的C會導致過學習現象的發(fā)生,搜索到的最小誤差所有的成對C、g中,選擇懲罰參數最小的C作為最佳的對象。

5.5 對比實驗算法

關于對比實驗算法部分使用兩個對比算法,一個使用標準的支持向量機算法,以成交量指標作為算法的輸入向量;另一個使用BP神經網絡算法。

5.6 評價標準

均方誤差:

N表示預測集的樣本個數,y是真實值,y′是預測值,MSE,MAE用來表示預測值偏離實際值的大小,它的值越小表明偏離度越小,說明預測結果的精確度越高。

6 支持向量機預測的結果分析

6.1 數據選擇

表2 收集數據分成四組進行實驗

6.2 離群特征模式SVM算法與以成交量作為輸入變量SVM對比

圖3 數據D-I進行實驗對比圖

圖4 數據D-II進行實驗對比圖

圖5 數據D-III進行實驗對比圖

圖6 數據D-IV進行實驗對比圖

6.3 離群特征模式SVM算法與BP神經網絡對比

圖7 D-I數據進行實驗對比圖

圖8 D-II數據進行實驗對比圖

圖9 D-III數據進行實驗對比圖

6.4 結果分析

根據上面兩個對比算法分析的圖形可以看出,SFSVM算法對于一部分股票走勢的尖峰點有一定的預測,在數據D-I中SFSVM算法對數據中第2,3,18點相對于對比算法有比較好的預測效果,第2,3點出現上漲背離,第2個點前一天的縮量上漲,第3個點前一天大幅上漲成交量上漲不明顯,第18個點出現MACD背離,前一天在下降但MACD指標上升,KDJ指標也在下降;在數據D-II中SFSVM算法對數據中第6,13,14,22點有比較好的預測效果,6,13,22這三個點都是前一天的上漲縮量,第14點是前一天大幅上漲成交量上漲不明顯;在數據D-III中SFSVM算法對數據中4,12,15,17,20這五個點有比較好的預測效果,第4個點是MACD背離,12,20這兩個點是大幅上漲成交量不明顯,15,17這兩個點上漲縮量;在數據D-IV中SFSVM算法對數據中1,2,5,6,30這5個點有比較好的預測結果,1,30是上漲縮量背離,第5點是MACD背離,2,6是大幅上漲出現背離。

表3 誤差結果

圖10 D-IV數據進行實驗對比圖

對這四段數據分別進行預測結果分析,SFSVM算法對于大幅波動的股票走勢預測有一定的效果,雖然SFSVM算法會在某些情況下判斷失誤造成誤差,但根據表3的誤差總體結果可以看出SFSVM在一定程度上優(yōu)于兩種比較算法,能有效減少誤差。

7 結束語

本文提出一種離群模式的支持向量機算法(SFSVM)用馬爾可夫毯進行特征選擇,選擇出與目標板塊相關的其他板塊,再根據股票的內部指標信息提取離群模式作為先驗知識,將不同的方面結合在一起提高整體的性能。從實驗圖形中可以看出該算法對股市中的某些異常突變點是可以提前感知的,但由于中國股市受經濟政策影響比較大,有些突變點很難預測的,預測的結果和實際也是有很大偏差的??傮w來說,根據實驗分析,對比其他算法該算法,有更好的預測效果。

[1]Hill T,O’Connor M,Remus W.Neural network models for time series forecasts[J].Management Science,1996,42:1082-1092.

[2]Vapnik V.The nature of statistic learning theory[M].New York:Springer,1995.

[3]Tay F E H,Cao L.Application of support vector machines in financial time series forecasting[J].Omega:The International Journal of Management Science,2001,29:309-317.

[4]Tsamardinos,Aliferis C F.Towards principled feature selection:Relevancy,filters and wrappers[C]//Ninth International Workshop on Artificial Intelligence and Statistics(AI&Stats 2003),2003.

[5]Cao L J,Chua K S,Guan L K.Combining KPCA with support vector machine for time series forecasting[C]//Proceedings of IEEE International Conference on Computational Intelligence for Financial Engineering,2003:325-329.

[6]Zhang T,Sai Y,Yuan Z.Research of stock index futures prediction model based on rough set and support vector machine[C]//Proceedings of the IEEE International Conference on Granular Computing,Hangzhou,China,2008:797-800.

[7]Huang Shian-Chang,Wu Tung-Kuang.Integrating GA-based time-scale feature extractions with SVMs for stock index forecasting[J].Expert Systems with Applications,2008,35:2080-2088.

[8]Pearl J.Probabilistic Reasoning in Intelligent Systems[M]. [S.l.]:Morgan Kaufmann,1988.

[9]徐君華,李啟亞.宏觀政策對我國股市影響的實證研究[J].經濟研究,2009(9):12-21.

[10]Wang Xiaoyun,Lin Limin.Short-term prediction of Shanghai composite index based on SVM[Z].2010.

[11]常冶衡,袁芳.基于技術分析指標解析中國股市[J].中國證券期貨,2010(10).

[12]Lauer F,Bloch G.Incorporating prior knowledge in support vector machines for classification.A review[J].Neurecomputing,2008,71(7/9):1578-1594.

[13]Ronan D.Learning Bayesian networks:Approaches and issues[J].Knowledge Engineering Review,2011,26(2):99-157.

[14]薛安榮,姚林,鞠時光,等.離群點挖掘方法綜述[J].計算機科學,2008,35(11):13-18.

[15]Lauer F,Bloch G.Incorporating prior knowledge in support vector machines for classification:A review[J].Neurocomputing,2008,71(7):1578-1594.

[16]Aliferis C F,Tsamardinos I,Statnikov A.HITON:A novel Markov blanket algorithm for optimal variable selection[C]// American Medical Informatics Association Annual Symposium,2003.

WANG Hao,CHEN Juan,YAO Hongliang,LI Junzhao

School of Computer and Information,Hefei University of Technology,Hefei 230009,China

Due to the stock price fluctuations have stronger mutation and easily influenced by outside factors,cause it’s difficult to predict stock price movements.A stock market volatility forecasting model based on characteristics of outliers pattern(SFSVM)is presented.Firstly,SFSVM algorithm utilizes Markov Blanket algorithm obtaining local network to shield the effects of other node to the target node;Secondly,analyzing the index of the target node to extract characteristic of outliers pattern from the general behavior;then SFSVM algorithm capture outlier features using sliding window,put characteristic of outliers pattern into original SVM model as a prior knowledge,this method can predict peak point and smooth effect of peak point on the predicted results,it also can improve forecasting model robustness.Experimental results, obtained by running on datasets taken from stock plate index,show that this method performs better than neural network algorithm and the standard SVM algorithm on stock trend projections.

characteristics of outliers model;Support Vector Machines(SVM);Markov Blanket;prior knowledge

由于股票價格波動具有較強的突變性且易受外界因素影響,導致股票價格走勢難以預測。提出基于離群特征模式的股市波動預測模型(SFSVM)。該算法首先利用馬爾可夫毯選取目標結點的局部網絡結構,以屏蔽其他結點對目標結點的影響;對目標結點的指標進行分析,提取異于一般行為的離群特征模式;利用滑動窗口捕捉離群特征,將離群特征模式作為先驗知識加入原SVM模型,預測尖峰點并平滑尖峰點對于預測結果的影響,提高預測模型的穩(wěn)健性。在股票板塊數據上進行實驗結果證明,SFSVM算法相對于神經網絡和標準的SVM算法,在股票的走勢預測方面有更好的預測效果。

離群特征模式;支持向量機;馬爾可夫毯;先驗知識

A

TP18

10.3778/j.issn.1002-8331.1305-0154

WANG Hao,CHEN Juan,YAO Hongliang,et al.Stock market volatility forecasting model based on characteristics of outliers pattern.Computer Engineering and Applications,2014,50(22):243-249.

國家自然科學基金(No.61175051,No.61070131,No.61175033)。

王浩(1962—),教授,中國計算機學會高級會員,研究方向:人工智能;陳娟(1989—),碩士,研究方向:人工智能和知識工程;姚宏亮(1972—),男,博士,副教授,計算機學會會員,研究方向:人工智能和知識工程;李俊照(1975—),博士研究生,講師,研究方向:機器學習與人工智能。

2013-05-14

2013-09-03

1002-8331(2014)22-0243-07

CNKI網絡優(yōu)先出版:2013-09-04.,http://www.cnki.net/kcms/detail/11.2127.TP.20130904.1344.017.html

猜你喜歡
背離離群馬爾可夫
保費隨機且?guī)в屑t利支付的復合馬爾可夫二項模型
離群數據挖掘在發(fā)現房產銷售潛在客戶中的應用
地方政府債務與瓦格納法則的背離
職業(yè)選擇與真實需求的背離——基于職業(yè)錨與工作特征匹配的調查
管理現代化(2016年6期)2016-01-23 02:10:57
基于SOP的核電廠操縱員監(jiān)視過程馬爾可夫模型
離群的小雞
應用馬爾可夫鏈對品牌手機市場占有率進行預測
剖析貨物流與資金流相背離的原因
中國外匯(2015年11期)2015-02-02 01:29:40
應用相似度測量的圖離群點檢測方法
認知無線網絡中基于隱馬爾可夫預測的P-CSMA協(xié)議
電視技術(2014年19期)2014-03-11 15:38:07
金华市| 江源县| 镇平县| 宜宾市| 长沙县| 岳阳县| 浑源县| 寻乌县| 那曲县| 苏尼特右旗| 霍城县| 福鼎市| 宾川县| 尚志市| 新龙县| 库车县| 偏关县| 扎鲁特旗| 昌邑市| 原阳县| 会昌县| 乌拉特中旗| 会同县| 临沂市| 崇礼县| 西充县| 全椒县| 玛多县| 郯城县| 土默特右旗| 乐都县| 江西省| 巴中市| 扎赉特旗| 大同县| 封开县| 苗栗县| 安国市| 中卫市| 葵青区| 格尔木市|