劉佳祺 劉德紅 林甜甜
摘 要:本文將BP神經(jīng)網(wǎng)絡(luò)模型與主成分分析法和遺傳算法相結(jié)合,建立了預(yù)測(cè)股票價(jià)格變化的動(dòng)態(tài)PCA-GA-BP模型。該模型能改善BP神經(jīng)網(wǎng)絡(luò)模型運(yùn)算速度緩慢和易陷入局部最小值的缺點(diǎn),彌補(bǔ)傳統(tǒng)股票價(jià)格預(yù)測(cè)方法的不足。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò)模型 主成分分析 遺傳算法 PCA-GA-BP模型
中圖分類號(hào):F832 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2018)03(b)-029-02
股票的價(jià)格走勢(shì)不僅可以從一定程度上體現(xiàn)宏觀經(jīng)濟(jì)的發(fā)展?fàn)顩r,而且與每個(gè)投資者的經(jīng)濟(jì)利益相關(guān),因此研究我國股票市場(chǎng)的可預(yù)測(cè)性非常有意義。股票價(jià)格的預(yù)測(cè)方法主要分為兩類:第一類是基于線性模型的傳統(tǒng)統(tǒng)計(jì)經(jīng)濟(jì)學(xué)方法,第二類是采用人工神經(jīng)網(wǎng)絡(luò)模型的非線性方法。然而股票市場(chǎng)是一個(gè)復(fù)雜的系統(tǒng),它具有非結(jié)構(gòu)性、非線性、高噪聲的特性,使用傳統(tǒng)的方法建立精確、有效的模型比較困難。研究結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)模型能有效地考慮到影響股票價(jià)格的各種非線性因素,在股市預(yù)測(cè)方面效率和精準(zhǔn)度相對(duì)較高。
1 BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)是由Rumelhart和McClelland為首的科學(xué)家提出的概念,是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)。
1.1 BP神經(jīng)網(wǎng)絡(luò)模型原理
BP神經(jīng)網(wǎng)絡(luò)模型主要包括三個(gè)部分,分別是輸入層、隱含層和輸出層如圖1所示。學(xué)習(xí)樣本從輸入層經(jīng)各隱含層傳向輸出層,最終在輸出層的各個(gè)神經(jīng)元收到來自輸入層的信息。之后,系統(tǒng)以減少輸出值與期望值的誤差為目標(biāo),從輸出層開始經(jīng)過各個(gè)中間隱含層修正各連接權(quán)值,最后回到輸入層。隨著這種修正傳播的不斷進(jìn)行,網(wǎng)絡(luò)調(diào)整權(quán)值直至誤差達(dá)到理想值。
1.2 BP神經(jīng)網(wǎng)絡(luò)模型優(yōu)缺點(diǎn)
首先,BP神經(jīng)網(wǎng)絡(luò)模型具有非線性映射能力強(qiáng)、自適應(yīng)性和自學(xué)習(xí)能力強(qiáng)、容錯(cuò)能力強(qiáng)等優(yōu)點(diǎn),能通過網(wǎng)絡(luò)訓(xùn)練儲(chǔ)存網(wǎng)絡(luò)權(quán)值中的學(xué)習(xí)內(nèi)容,較好地處理內(nèi)部作用機(jī)制復(fù)雜的非線性函數(shù),從而準(zhǔn)確地預(yù)測(cè)數(shù)據(jù)。
但是在實(shí)際應(yīng)用中,BP神經(jīng)網(wǎng)絡(luò)模型存在著隱含層節(jié)點(diǎn)難確立、變量選擇困難、運(yùn)算速度緩慢等缺點(diǎn)。針對(duì)這些問題,作者對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行了改進(jìn),使其能準(zhǔn)確、高效地預(yù)測(cè)股票價(jià)格。
2 BP神經(jīng)網(wǎng)絡(luò)模型的改進(jìn)
2.1 BP神經(jīng)網(wǎng)絡(luò)與主成分分析結(jié)合
對(duì)股市未來趨勢(shì)進(jìn)行預(yù)測(cè)的基礎(chǔ)是股市大量的歷史數(shù)據(jù),雖然這些數(shù)據(jù)簡單明了,但直接將這些數(shù)據(jù)作為模型的輸入樣本是錯(cuò)誤的,因?yàn)檫@組數(shù)據(jù)之間存在相關(guān)性。而主成分分析法能將一組互相影響的輸入因子轉(zhuǎn)換成兩兩不相關(guān)的、變量數(shù)少的綜合指標(biāo),盡可能反映原指數(shù)信息的實(shí)際需求,揭示影響股價(jià)信息的一般因素和特殊信息。所以應(yīng)先對(duì)數(shù)據(jù)進(jìn)行主成分分析,選取足夠的主成分?jǐn)?shù),從而作為輸入層數(shù)據(jù)代入BP神經(jīng)網(wǎng)絡(luò)模型。
主成分分析對(duì)BP神經(jīng)網(wǎng)絡(luò)的改進(jìn)主要體現(xiàn)在它可以有效地降低輸入變量的維度,提取原指標(biāo)的主要信息,減少模型的訓(xùn)練學(xué)習(xí)時(shí)間。但是,主成分分析不能捕捉股價(jià)因素之間的非線性關(guān)系,不能直接用于股票價(jià)格預(yù)測(cè),而BP神經(jīng)網(wǎng)絡(luò)模型能很好地處理內(nèi)部作用機(jī)制復(fù)雜的非線性關(guān)系。由此可知,主成分分析和BP神經(jīng)網(wǎng)絡(luò)模型的功能可以進(jìn)行互補(bǔ),整合各自的數(shù)據(jù)處理優(yōu)勢(shì),從而對(duì)股價(jià)進(jìn)行準(zhǔn)確預(yù)測(cè)。
2.2 BP神經(jīng)網(wǎng)絡(luò)隱含層單元數(shù)的確定
在BP神經(jīng)網(wǎng)絡(luò)模型中,研究的問題本身已經(jīng)確定了輸入單元數(shù)和輸出單元數(shù)。因此,模型成功的關(guān)鍵在于如何精準(zhǔn)確定隱含層的層數(shù)和相應(yīng)的單元數(shù)。因?yàn)橐粋€(gè)隱含層就可以訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)無限接近某一目標(biāo)非線性函數(shù),所以本文將網(wǎng)絡(luò)層數(shù)確定為3,即只有一個(gè)隱含層。相反,確定隱含層的單元數(shù)是個(gè)十分復(fù)雜的問題。一方面,過多的單元數(shù)會(huì)影響網(wǎng)絡(luò)的概括推理功能,另一方面,過少的單元數(shù)則會(huì)影響模型訓(xùn)練和預(yù)測(cè)的精度,降低實(shí)證效果。本文采用沈花玉等提出的BP神經(jīng)網(wǎng)絡(luò)隱含層單元數(shù)的改進(jìn)方法,該方法基于3種基本確定單元數(shù)途徑,即:
其中為隱含層單元數(shù),n為輸入單元數(shù),m為輸出單元數(shù)。
筆者提出綜合這三種方法來確定最佳隱含層單元數(shù)的邊界值,然后按照單元數(shù)范圍從小到大依次對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,根據(jù)訓(xùn)練誤差和對(duì)應(yīng)的測(cè)試誤差,選擇隱含層的最佳數(shù)目。
2.3 BP神經(jīng)網(wǎng)絡(luò)與遺傳算法結(jié)合
遺傳算法是一種自適應(yīng)優(yōu)化搜索算法,其思想來源于生物遺傳學(xué)和適者生存的自然規(guī)律。遺傳算法以期望的函數(shù)為目標(biāo),評(píng)價(jià)每個(gè)向量的適應(yīng)度,然后根據(jù)該適應(yīng)值實(shí)施變異、交換、選擇等操作。在這過程中,適應(yīng)度高的元素被留下來并傳給下一代新的數(shù)據(jù)組,而適應(yīng)度低的元素則被淘汰。
遺傳算法具有較強(qiáng)的全局搜索能力,能彌補(bǔ)BP神經(jīng)網(wǎng)絡(luò)模型具有易陷入局部最小值的缺陷。將BP神經(jīng)網(wǎng)絡(luò)和遺傳算法結(jié)合,可以充分發(fā)揮兩者的優(yōu)點(diǎn),使新算法既有神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和魯棒性,又有遺傳算法的強(qiáng)全局搜索能力。
3 PCA-GA-BP模型的股票預(yù)測(cè)
采用PCA—GA—BP模型預(yù)測(cè)股票價(jià)格流程如下:首先,選取股票交易的歷史數(shù)據(jù),用主成分分析法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,消除數(shù)據(jù)間的冗余,以達(dá)到降維的目的;其次,利用本文2.2節(jié)所述方法選取合適的隱含層單元數(shù),構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型;再次,將輸入變量分為訓(xùn)練段和預(yù)測(cè)段兩部分,確保訓(xùn)練段數(shù)據(jù)盡量擬合,從而確定遺傳算法相關(guān)參數(shù);最后,訓(xùn)練改進(jìn)后的BP神經(jīng)網(wǎng)絡(luò),并用其預(yù)測(cè)股價(jià)。具體算法,如圖2所示。
4 結(jié)語
PCA—GA—BP模型改進(jìn)了BP神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)難確立、變量選擇困難、運(yùn)算速度緩慢等缺陷,能準(zhǔn)確預(yù)測(cè)具有非線性和隨機(jī)性的股票價(jià)格,使預(yù)測(cè)值的誤差達(dá)到最小值,實(shí)現(xiàn)更好的預(yù)測(cè)效果。
參考文獻(xiàn)
[1] 齊曉娜,程維剛.基于遺傳LMBP神經(jīng)網(wǎng)絡(luò)模型的股票預(yù)測(cè)[J].無線互聯(lián)科技,2016(3).
[2] 黃宏運(yùn),朱家明,李詩爭.基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)在股指預(yù)測(cè)中的應(yīng)用研究[J].云南大學(xué)學(xué)報(bào)(自然科學(xué)版),2017(3).
[3] 劉永福,李建功.利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)上證指數(shù)[J].商務(wù)周刊, 2003(10).
[4] 柏丹,靳鑫,孫方方.BP神經(jīng)網(wǎng)絡(luò)的股票價(jià)格預(yù)測(cè)模型建立[J].科技創(chuàng)業(yè)月刊,2013,26(1).