李峰+韓祝華
摘 要:金融市場(chǎng)由于其所包含的不可測(cè)因素非常多,所以我們可以將其看作是一個(gè)非線性的、非結(jié)構(gòu)化的復(fù)雜系統(tǒng)。而支持向量機(jī)作為機(jī)器學(xué)習(xí)方法智能信息處理的重要組成部分,在其他領(lǐng)域已經(jīng)被證明可以有效地解決這種非線性問(wèn)題,從而我們很容易聯(lián)想到它能否有效地處理金融數(shù)據(jù)。金融數(shù)據(jù)處理的預(yù)測(cè)問(wèn)題主要是對(duì)金融時(shí)間序列的預(yù)測(cè),本文將介紹一種最下二乘法來(lái)對(duì)此問(wèn)題進(jìn)行說(shuō)明。
關(guān)鍵詞:機(jī)器學(xué)習(xí);支持向量機(jī);金融數(shù)據(jù)
一、研究現(xiàn)狀
金融數(shù)據(jù)處理的預(yù)測(cè)問(wèn)題主要是對(duì)金融時(shí)間序列的預(yù)測(cè),金融時(shí)間序列可以看成是一種特殊的時(shí)間序列,它具有以下三大特點(diǎn):(1)金融時(shí)間序列的產(chǎn)生過(guò)程較為復(fù)雜,并且影響因素較多;(2)多數(shù)金融時(shí)間序列含有大量不可預(yù)知的影響因素;(3)金融時(shí)間序列的各數(shù)據(jù)間的構(gòu)成較為復(fù)雜,通常呈現(xiàn)出非線性性。而神經(jīng)網(wǎng)絡(luò)、混沌理論、遺傳算法等人工智能信息處理方法能很好的適應(yīng)這三大特點(diǎn),這已然成為解決金融數(shù)據(jù)處理問(wèn)題的先進(jìn)方法。1999 Lab.H用遺傳算法對(duì)日本股票市場(chǎng)進(jìn)行了預(yù)測(cè),從中分析出哪一只股票最好,并預(yù)測(cè)應(yīng)該在何時(shí)買或賣多少股票。2005 年Lixin Yu 等人建立了一個(gè)混合神經(jīng)網(wǎng)絡(luò)模型對(duì)金融市場(chǎng)的數(shù)據(jù)進(jìn)行了預(yù)測(cè),并取得了良好的效果長(zhǎng)期以來(lái)專家學(xué)者們都希望能夠找到使誤差更接近零的分析預(yù)測(cè)方法,以使投資目標(biāo)函數(shù)在利益盡量大的時(shí)候風(fēng)險(xiǎn)盡量最小。所以,人們不得不努力的研究更新、更有效、泛化能力更強(qiáng)的數(shù)據(jù)分析預(yù)測(cè)模型。當(dāng)前的金融市場(chǎng)業(yè)務(wù)繁多,和業(yè)務(wù)形成正比關(guān)系的各類信息系統(tǒng)眾多,這些管理系統(tǒng)也產(chǎn)生海量的各類金融數(shù)據(jù),如何對(duì)金融市場(chǎng)進(jìn)行有效地、及時(shí)地預(yù)測(cè)與分析,則成為企業(yè)、銀行和現(xiàn)代投資者所追求的目標(biāo)。然而現(xiàn)行的大量分析方法并不能對(duì)已有的數(shù)據(jù)進(jìn)行大規(guī)模的開發(fā)和利用,所以并不能滿足金融市場(chǎng)投資者的需求。而支持向量機(jī)方法作為智能信息處理的重要組成部分,在其他領(lǐng)域已經(jīng)被證明可以有效地解決這種非線性問(wèn)題。
二、 最小二乘支持向量回歸算法(LSSVM )
最小二乘支持向量機(jī)是由 Suykens 等人提出的,它將支持向量機(jī)中的損失函數(shù)替換成了最小二乘的損失函數(shù),這一替換使得最小二乘支持向量機(jī)在訓(xùn)練過(guò)程中等價(jià)于求解一個(gè)線性方程組,最小二乘支持向量算法是將標(biāo)準(zhǔn)支持向量算法中的不等式約束化成等式約束而得到的。
對(duì)于線性回歸,設(shè)樣本為n維向量,某區(qū)域的l個(gè)樣本及其值表示為:
對(duì)于非線性回歸,同樣使用一個(gè)映射φ把數(shù)據(jù)映射到高維特征空間,再在高維特征空間進(jìn)行線性回歸,關(guān)鍵是選取適當(dāng)?shù)暮撕瘮?shù) k(x,y),使得 k(xi,yi)=Φ(xi)TΦ(xj)。以高斯核函數(shù)為例,它的定義如下:
那么這個(gè)最小二乘支持向量機(jī)的非線性函數(shù)可以表示為:
最后解出參數(shù)a,b的值即可。
三、股票市場(chǎng)預(yù)測(cè)中的應(yīng)用
結(jié)合我國(guó)股票指數(shù)的數(shù)據(jù),利用最小二乘支持向量算法(LSSVM)和AR(n)模型進(jìn)行預(yù)測(cè),采用LSSVM直接建立非線性AR (1)模型,所有數(shù)據(jù)均來(lái)自于金融研究數(shù)據(jù)庫(kù),實(shí)驗(yàn)根據(jù)邏輯性、有效性、客觀性及敏感性,并根據(jù)財(cái)政部出臺(tái)的《國(guó)有資本金績(jī)效評(píng)價(jià)原則》選取了38個(gè)指標(biāo)作為各上市公司的特征以及財(cái)務(wù)指標(biāo),此次實(shí)驗(yàn)同樣采用Matlab軟件和Eviews軟件實(shí)現(xiàn)。
財(cái)務(wù)指標(biāo)及股票信息如下表:
一、研究現(xiàn)狀
金融數(shù)據(jù)處理的預(yù)測(cè)問(wèn)題主要是對(duì)金融時(shí)間序列的預(yù)測(cè),金融時(shí)間序列可以看成是一種特殊的時(shí)間序列,它具有以下三大特點(diǎn):(1)金融時(shí)間序列的產(chǎn)生過(guò)程較為復(fù)雜,并且影響因素較多;(2)多數(shù)金融時(shí)間序列含有大量不可預(yù)知的影響因素;(3)金融時(shí)間序列的各數(shù)據(jù)間的構(gòu)成較為復(fù)雜,通常呈現(xiàn)出非線性性。而神經(jīng)網(wǎng)絡(luò)、混沌理論、遺傳算法等人工智能信息處理方法能很好的適應(yīng)這三大特點(diǎn),這已然成為解決金融數(shù)據(jù)處理問(wèn)題的先進(jìn)方法。1999 Lab.H用遺傳算法對(duì)日本股票市場(chǎng)進(jìn)行了預(yù)測(cè),從中分析出哪一只股票最好,并預(yù)測(cè)應(yīng)該在何時(shí)買或賣多少股票。2005 年Lixin Yu 等人建立了一個(gè)混合神經(jīng)網(wǎng)絡(luò)模型對(duì)金融市場(chǎng)的數(shù)據(jù)進(jìn)行了預(yù)測(cè),并取得了良好的效果長(zhǎng)期以來(lái)專家學(xué)者們都希望能夠找到使誤差更接近零的分析預(yù)測(cè)方法,以使投資目標(biāo)函數(shù)在利益盡量大的時(shí)候風(fēng)險(xiǎn)盡量最小。所以,人們不得不努力的研究更新、更有效、泛化能力更強(qiáng)的數(shù)據(jù)分析預(yù)測(cè)模型。當(dāng)前的金融市場(chǎng)業(yè)務(wù)繁多,和業(yè)務(wù)形成正比關(guān)系的各類信息系統(tǒng)眾多,這些管理系統(tǒng)也產(chǎn)生海量的各類金融數(shù)據(jù),如何對(duì)金融市場(chǎng)進(jìn)行有效地、及時(shí)地預(yù)測(cè)與分析,則成為企業(yè)、銀行和現(xiàn)代投資者所追求的目標(biāo)。然而現(xiàn)行的大量分析方法并不能對(duì)已有的數(shù)據(jù)進(jìn)行大規(guī)模的開發(fā)和利用,所以并不能滿足金融市場(chǎng)投資者的需求。而支持向量機(jī)方法作為智能信息處理的重要組成部分,在其他領(lǐng)域已經(jīng)被證明可以有效地解決這種非線性問(wèn)題。
二、 最小二乘支持向量回歸算法(LSSVM )
最小二乘支持向量機(jī)是由 Suykens 等人提出的,它將支持向量機(jī)中的損失函數(shù)替換成了最小二乘的損失函數(shù),這一替換使得最小二乘支持向量機(jī)在訓(xùn)練過(guò)程中等價(jià)于求解一個(gè)線性方程組,最小二乘支持向量算法是將標(biāo)準(zhǔn)支持向量算法中的不等式約束化成等式約束而得到的。
對(duì)于線性回歸,設(shè)樣本為n維向量,某區(qū)域的l個(gè)樣本及其值表示為:
對(duì)于非線性回歸,同樣使用一個(gè)映射φ把數(shù)據(jù)映射到高維特征空間,再在高維特征空間進(jìn)行線性回歸,關(guān)鍵是選取適當(dāng)?shù)暮撕瘮?shù) k(x,y),使得 k(xi,yi)=Φ(xi)TΦ(xj)。以高斯核函數(shù)為例,它的定義如下:
那么這個(gè)最小二乘支持向量機(jī)的非線性函數(shù)可以表示為:
最后解出參數(shù)a,b的值即可。
三、股票市場(chǎng)預(yù)測(cè)中的應(yīng)用
結(jié)合我國(guó)股票指數(shù)的數(shù)據(jù),利用最小二乘支持向量算法(LSSVM)和AR(n)模型進(jìn)行預(yù)測(cè),采用LSSVM直接建立非線性AR (1)模型,所有數(shù)據(jù)均來(lái)自于金融研究數(shù)據(jù)庫(kù),實(shí)驗(yàn)根據(jù)邏輯性、有效性、客觀性及敏感性,并根據(jù)財(cái)政部出臺(tái)的《國(guó)有資本金績(jī)效評(píng)價(jià)原則》選取了38個(gè)指標(biāo)作為各上市公司的特征以及財(cái)務(wù)指標(biāo),此次實(shí)驗(yàn)同樣采用Matlab軟件和Eviews軟件實(shí)現(xiàn)。
財(cái)務(wù)指標(biāo)及股票信息如下表:
從實(shí)驗(yàn)結(jié)果可以看出 LSSVM模型的預(yù)測(cè)結(jié)果要優(yōu)于單純的時(shí)間序列模型。綜合來(lái)看,如果在支持向量機(jī)的基礎(chǔ)上能夠融合時(shí)間序列模型,那么在金融預(yù)測(cè)中將取得良好的應(yīng)用效果。
參考文獻(xiàn)
[1] 高鐵梅.計(jì)量經(jīng)濟(jì)分析方法與建模.EVIEWS應(yīng)用及實(shí)例.清華大學(xué)出版社,2006.
[2] 謝衷潔,王馳.用時(shí)間序列方法預(yù)測(cè)股票價(jià)格初探.數(shù)理統(tǒng)計(jì)與管理,2004,23(5):68 - 77.
[3] 孫德山.支持向量機(jī)分類與回歸方法研究:(博士學(xué)位論文).長(zhǎng)沙:中南大學(xué),2004.
[4] 鄧乃揚(yáng).數(shù)據(jù)挖掘的新方法—支持向量機(jī).北京:科學(xué)出版社,2004.
[5] 楊一文.基于神經(jīng)網(wǎng)絡(luò)的多變量時(shí)間序列預(yù)測(cè)及其在股市中的應(yīng)用.信息與控制,2001,30(5):413-417.
[6] 王振龍,胡永宏.應(yīng)用時(shí)間序列分析.北京:科學(xué)出版社,2008.
作者簡(jiǎn)介:
李峰(1981-),男,山西陽(yáng)泉人,碩士,現(xiàn)供職于河北金融學(xué)院信息管理與工程系,研究方向數(shù)據(jù)分析.