朱磊
摘 要: 本文首先簡(jiǎn)要介紹支持向量機(jī)(SVM)的理論,然后,綜述國(guó)內(nèi)外SVM在股市中的應(yīng)用。論文發(fā)現(xiàn),不論是在股票的價(jià)值投資思路中,還是時(shí)間序列分析思路中,SVM都得到了廣泛的引用,而且,實(shí)證效果均優(yōu)于其他分類算法。
關(guān)鍵詞: 向量機(jī);應(yīng)用綜述
引言
股市每天都產(chǎn)生大量的數(shù)據(jù),國(guó)內(nèi)外研究已經(jīng)表明,股市波動(dòng)的非線性[1],而傳統(tǒng)的計(jì)量統(tǒng)計(jì)方法,大多都是線性回歸的方法。出現(xiàn)問(wèn)題是,使用線性的方法來(lái)研究非線性的問(wèn)題,這使得研究本身就出現(xiàn)了問(wèn)題。隨著計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展以及數(shù)據(jù)存儲(chǔ)容量的大量增加,傳統(tǒng)的統(tǒng)計(jì)回歸方法對(duì)線性系統(tǒng)良好的回歸和預(yù)測(cè)效果,由于股票市場(chǎng)的復(fù)雜性和非線性,傳統(tǒng)線性方法在處理現(xiàn)實(shí)股票數(shù)據(jù)進(jìn)而進(jìn)行預(yù)測(cè)的時(shí)候,往往不能夠得到比較理想的結(jié)果。所以,傳統(tǒng)的線性研究方法開(kāi)始勢(shì)微,非線性的研究方法開(kāi)始勢(shì)顯。其中,人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等等方法給股票時(shí)間序列的研究提供了新的研究問(wèn)題的視角。
在研究股票市場(chǎng)的眾多非線性方法中,本文著重討論支持向量(SVM)機(jī)在股票市場(chǎng)的應(yīng)用。本文選取SVM的原因在于相比于其他的人工神經(jīng)網(wǎng)絡(luò)在進(jìn)行小樣本的統(tǒng)計(jì)學(xué)習(xí)時(shí),不會(huì)出現(xiàn)神經(jīng)網(wǎng)絡(luò)的現(xiàn)欠學(xué)習(xí)問(wèn)題。其次,相比于神經(jīng)網(wǎng)絡(luò),SVM具有更好地?cái)?shù)學(xué)基礎(chǔ)。并且,SVM在工業(yè)界得到了廣泛和實(shí)際上的應(yīng)用。泛化能力較好,也可以收斂到全局最優(yōu)。本文接下來(lái),第一章介紹SVM的相關(guān)理論。第二章介紹SVM在金融中的應(yīng)用。最后,是全文的總結(jié)。
1.支持向量機(jī)理論
支持向量機(jī)(SVM)是與相關(guān)的學(xué)習(xí)算法有關(guān)的監(jiān)督學(xué)習(xí)模型,可以分析數(shù)據(jù),識(shí)別模式,用于分類和回歸分析。給定一組訓(xùn)練樣本,每個(gè)標(biāo)記分為兩類,一個(gè)SVM訓(xùn)練算法建立了一個(gè)模型,分配新的實(shí)例為一類或其他類,使其成為非概率二元線性分類。一個(gè)SVM模型的例子,如在空間中的點(diǎn),映射,使得所述不同的類別的例子是由一個(gè)明顯的差距是盡可能寬劃分的表示。新的實(shí)施例則映射到相同的空間中,并預(yù)測(cè)基于它們落在所述間隙側(cè)上屬于一個(gè)類別。除了進(jìn)行線性分類,支持向量機(jī)可以使用所謂的核技巧,它們的輸入隱含映射成高維特征空間中有效地進(jìn)行非線性分類。支持向量機(jī)將向量映射到一個(gè)更高維的空間里,在這個(gè)空間里建立有一個(gè)最大間隔超平面。在分開(kāi)數(shù)據(jù)的超平面的兩邊建有兩個(gè)互相平行的超平面。建立方向合適的分隔超平面使兩個(gè)與之平行的超平面間的距離最大化。其假定為,平行超平面間的距離或差距越大,分類器的總誤差越小。有關(guān)支持向量機(jī)的嚴(yán)格數(shù)學(xué)理論和相關(guān)的核函數(shù)表達(dá),已經(jīng)超出論文的討論范圍,本論文采取簡(jiǎn)單的文字表述的方式。想深入了解的作者可以,參考相關(guān)文獻(xiàn)。
2.支持向量機(jī)在金融領(lǐng)域的作用
2.1價(jià)值投資思路中SVM的應(yīng)用
李云飛[2]在遵循價(jià)值投資的理念下,選取了500只股票,通過(guò)一些列財(cái)務(wù)指標(biāo),夠造一個(gè)股票的價(jià)值投資特性,然后,使用股票一年之內(nèi)平均月度收益率作為支持向量機(jī)的輸出變量,訓(xùn)練和測(cè)試支持向量機(jī)模型。作為對(duì)比和參照作者同時(shí)還進(jìn)行了BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)的實(shí)驗(yàn)。實(shí)證發(fā)現(xiàn),不管是在分類效果還是泛化能力方面,支持向量機(jī)都是占優(yōu)的。
張玉川[3]作者還是根據(jù)價(jià)值投資理念,選取1999-2005年所有的股票的數(shù)據(jù),并且使用公司的本年度的財(cái)務(wù)指標(biāo)與公司下一年的收益作為SVM訓(xùn)練數(shù)據(jù)。值得注意的是,作者選取的是公司未來(lái)收益,而不是投資者收益,所以投資者在進(jìn)行投資的時(shí)候應(yīng)當(dāng)有所注意。實(shí)證結(jié)果發(fā)現(xiàn),通過(guò)SVM選取股票的平均收益率遠(yuǎn)遠(yuǎn)超過(guò)市場(chǎng)平均收益率。所以,證明SVM方法在選擇優(yōu)質(zhì)股票的方面的能力是值得研究的。
2.2 股市時(shí)間序列分析中SVM應(yīng)用
隋學(xué)深[4]通過(guò)對(duì)股市時(shí)間序列的多尺度時(shí)間特性提取,對(duì)不同尺度系數(shù)進(jìn)行了趨勢(shì)性特征提取,和記憶性特征提取。實(shí)證中,作者使用提取前和提取后數(shù)據(jù)作為SVM的輸入數(shù)組。結(jié)果發(fā)現(xiàn),通過(guò)本方法對(duì)上證指數(shù)的趨勢(shì)進(jìn)行預(yù)測(cè)準(zhǔn)確率達(dá)到50%以上,而SVM的分類準(zhǔn)確率達(dá)到,百分之六七十。實(shí)證表明,此方法是行之有效的。
田靜[5]使用SVM理論,并且選用libsvm工具箱對(duì)上證綜合指數(shù)和四川長(zhǎng)虹的真實(shí)數(shù)據(jù)進(jìn)行了支持向量機(jī)回歸模型的股市預(yù)測(cè)。為了對(duì)比實(shí)證效果,作者還實(shí)證了傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)。通過(guò)作者的對(duì)比發(fā)現(xiàn),支持向量機(jī)具有更優(yōu)的實(shí)證特性,更高的準(zhǔn)確率。
對(duì)于股市反轉(zhuǎn)點(diǎn)的到來(lái),總結(jié)了一系列的技術(shù)指標(biāo),然而這一系列的技術(shù)指標(biāo)怎么綜合到一起來(lái),以便提供給人們更好的參考。黃朋朋[6]使用技術(shù)指標(biāo)組合,然后,使用這些數(shù)據(jù)對(duì)SVM進(jìn)行訓(xùn)練來(lái)預(yù)測(cè)股市的反轉(zhuǎn)點(diǎn),使用SVM對(duì)多個(gè)技術(shù)指標(biāo)組合進(jìn)行數(shù)據(jù)挖掘。實(shí)證對(duì)上證指數(shù)十年的反轉(zhuǎn)點(diǎn)進(jìn)行研究,發(fā)現(xiàn),使用SVM的股價(jià)反轉(zhuǎn)點(diǎn)的預(yù)測(cè)具有更高的準(zhǔn)確率。
kim[7]在2003年使用SVM預(yù)測(cè)韓國(guó)的KOSPI股價(jià)指數(shù)。為了檢驗(yàn)實(shí)證的效果,kim還是對(duì)比了SVM和BP神經(jīng)網(wǎng)絡(luò)以及基于案例的推理(Case based reasoning,CBR)的預(yù)測(cè)能力。他發(fā)現(xiàn),SMV的預(yù)測(cè)能力最優(yōu)。最優(yōu)化的原因是SVM采用個(gè)的是結(jié)構(gòu)風(fēng)險(xiǎn)最小化 的法則。
Wei[8]使用SVM研究日經(jīng)225指數(shù)的周動(dòng)態(tài)趨勢(shì)。為了評(píng)估SVM方法的優(yōu)劣性。作者還同時(shí)使用了下面三種分類算法:線性判別分析(Linear Discriminant Analysis)、二次判別分析法(Quadratic Discriminant Analysis)和Elman神經(jīng)網(wǎng)絡(luò)(Elman Backpropagation Neural Networks)方法。實(shí)證結(jié)果發(fā)現(xiàn),SVM方法在預(yù)測(cè)日經(jīng)225指數(shù)周動(dòng)態(tài)方向上表現(xiàn)是最好的。此外,每一種方法都有自己的優(yōu)點(diǎn)和缺點(diǎn),所以,作者最后使用一種復(fù)合型的方法,把SVM與其他算法相結(jié)合的方法,成為一種混合型的方法。實(shí)證發(fā)現(xiàn),這種混合型的算法表現(xiàn)是最優(yōu)的。
3.結(jié)論
可見(jiàn),不論是在價(jià)值投資思路下的股市研究,還是時(shí)間序列下的技術(shù)分析,SVM方法都得到到了廣泛的引用。說(shuō)明SVM方法是一種值得進(jìn)一步研究的科學(xué)方法。 (作者單位:重慶工商大學(xué))
參考文獻(xiàn):
[1] 徐龍炳,陸蓉.R/S分析探索中國(guó)股票市場(chǎng)的非線性[J].預(yù)測(cè).1999(02): 60-63.
[2] 李云飛,惠曉峰.基于支持向量機(jī)的股票投資價(jià)值分類模型研究[J].中國(guó)軟科學(xué).2008(01): 135-140.
[3] 張玉川,張作泉,黃珍.支持向量機(jī)在選擇優(yōu)質(zhì)股票中的應(yīng)用[J].統(tǒng)計(jì)與決策.2008(04): 163-165.
[4] 隋學(xué)深,齊中英.基于多尺度特征和支持向量機(jī)的股市趨勢(shì)預(yù)測(cè)[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版).2008(04): 77-82.
[5] 田靜.基于支持向量回歸機(jī)模型的股市預(yù)測(cè)研究[D].北京交通大學(xué), 2010.
[6] 黃朋朋,韓偉力.基于支持向量機(jī)的股價(jià)反轉(zhuǎn)點(diǎn)預(yù)測(cè)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用.2010(09): 214-218.
[7] Kim K J.Financial time series forecasting using support vector machines[J].Neurocomputing.2003, 55(1-2): 307-319.
[8] Huang W, Nakamori Y, Wang S.Forecasting stock market movement direction with support vector machine[J].Computers & Operations Research.2005, 32(10): 2513-2522.