陳麒吉 許學(xué)軍
摘? ?要:股票市場(chǎng)被視為一個(gè)國(guó)家實(shí)體經(jīng)濟(jì)的重要活動(dòng)指標(biāo)之一,它引導(dǎo)資金并將儲(chǔ)戶與投資者聯(lián)系起來(lái),最終促進(jìn)經(jīng)濟(jì)增長(zhǎng),股票的收益波動(dòng)也逐漸成為眾多機(jī)構(gòu)投資者和散戶投資者最為關(guān)心的事情。從過(guò)往研究來(lái)看,計(jì)量經(jīng)濟(jì)學(xué)所具有的傳統(tǒng)模型并不能夠在長(zhǎng)期過(guò)程中實(shí)現(xiàn)股價(jià)的預(yù)測(cè)?;诖耍瑒?chuàng)新性地從人工神經(jīng)網(wǎng)絡(luò)算法的支持向量機(jī)模型SVM和ARIMA-EGARCH模型出發(fā),選取上市公司A股中遠(yuǎn)海特作為研究對(duì)象,利用python這一流行的編程工具來(lái)進(jìn)行算法和模型的實(shí)現(xiàn),旨在比較新興的人工神經(jīng)網(wǎng)絡(luò)算法與傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)模型在股票收益預(yù)測(cè)方面的優(yōu)劣,并提出相應(yīng)的優(yōu)化改進(jìn)建議。
關(guān)鍵詞:股票收益預(yù)測(cè);人工神經(jīng)網(wǎng)絡(luò)算法;優(yōu)化改進(jìn)
中圖分類號(hào):F832.48? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號(hào):1673-291X(2023)21-0084-03
一、研究背景
近年來(lái),股票收益預(yù)測(cè)這一經(jīng)久不衰的話題越發(fā)火熱,但同時(shí)股票市場(chǎng)出現(xiàn)前所未有的波動(dòng),使得股票收益預(yù)測(cè)越發(fā)艱難?;趥鹘y(tǒng)計(jì)量經(jīng)濟(jì)學(xué)的諸多模型在情況日益復(fù)雜的當(dāng)代雖然仍有其不可替代的一面,但不得不承認(rèn)的是,其諸多模型已經(jīng)很難準(zhǔn)確預(yù)測(cè)股價(jià)。而隨著人工智能技術(shù)的不斷發(fā)展,人工智能的諸多算法具有相當(dāng)強(qiáng)的自主學(xué)習(xí)性,其在系統(tǒng)科學(xué)領(lǐng)域已開(kāi)始嶄露頭角。本文引入了當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域火熱的人工神經(jīng)網(wǎng)絡(luò)算法中的支持向量機(jī)模型,并將其與ARIMA-EGARCH模型進(jìn)行比較,提出改進(jìn)意見(jiàn)。
二、理論介紹
(一)ARIMA-EGARCH
ARIMA模型的建模過(guò)程可具體解析為四個(gè)步驟:第一,是將獲取的時(shí)間序列數(shù)據(jù)進(jìn)行一次嚴(yán)謹(jǐn)?shù)钠椒€(wěn)性檢驗(yàn),如果得到的結(jié)果是非平穩(wěn)的,那么需要考慮通過(guò)差分化或者其他處理方式讓該時(shí)間序列數(shù)據(jù)趨于平穩(wěn),使其滿足平穩(wěn)的基本性條件。第二,確定模型,我們選擇某種統(tǒng)計(jì)量來(lái)描述選定的時(shí)間序列數(shù)據(jù)的特征并將該統(tǒng)計(jì)量完整地計(jì)算出來(lái),結(jié)合BIC準(zhǔn)則來(lái)進(jìn)一步明確ARIMA模型的階數(shù)。第三,利用最小二乘法估計(jì)模型的參數(shù),合理性檢驗(yàn)也是要進(jìn)行的關(guān)鍵一步。最后,進(jìn)行診斷分析,通過(guò)生成的模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),并將實(shí)際數(shù)據(jù)與之進(jìn)行對(duì)比。①
值得一提的是,為了消除異方差性,本次實(shí)驗(yàn)在ARIMA模型后還聯(lián)立建立了EGARCH模型。
(二)SVM(人工神經(jīng)網(wǎng)絡(luò)算法)
支持向量機(jī)模型屬于人工神經(jīng)網(wǎng)絡(luò)算法中較為經(jīng)典的一種,常在系統(tǒng)科學(xué)領(lǐng)域看到關(guān)于SVM模型的身影。在系統(tǒng)科學(xué)領(lǐng)域,信號(hào)具有逆向傳播和正向傳播兩種傳播路徑,同樣地,誤差也有兩種相同的傳播路徑。在實(shí)際操作過(guò)程中,期望輸出和實(shí)際輸出往往會(huì)出現(xiàn)差異過(guò)大的情況,這通常意味著此時(shí)已經(jīng)進(jìn)入了信號(hào)誤差反向傳播階段。在這一過(guò)程中,輸出誤差會(huì)反方向走一遍信號(hào)正向傳播的路徑,實(shí)驗(yàn)者可由此監(jiān)測(cè)每一層中不同節(jié)點(diǎn)的顯示誤差的有關(guān)信號(hào),依據(jù)此信號(hào)修改網(wǎng)絡(luò)的連接權(quán)值。反復(fù)進(jìn)行以上操作,即信號(hào)反復(fù)進(jìn)行正向傳播,誤差逆向反復(fù)進(jìn)行逆向傳播,監(jiān)測(cè)到預(yù)先設(shè)定的閾值在網(wǎng)絡(luò)誤差之上的情形后或者預(yù)先設(shè)置的學(xué)習(xí)次數(shù)已經(jīng)完成或者超額完成時(shí),這意味著可以停止以上操作。②
股票價(jià)格或者收益率序列數(shù)據(jù)由于受眾多人為因素的干擾,因此這種序列數(shù)據(jù)并非是線性的。基于這一基本特點(diǎn),結(jié)合人工神經(jīng)網(wǎng)絡(luò)算法處理非線性序列數(shù)據(jù)的獨(dú)特優(yōu)勢(shì),考慮將人工神經(jīng)網(wǎng)絡(luò)算法引入到股票收益的預(yù)測(cè)之中。本文以上市公司A股中遠(yuǎn)海特為例,結(jié)合人工神經(jīng)網(wǎng)絡(luò)算法,評(píng)測(cè)人工神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)能力。
三、實(shí)證過(guò)程
本次研究主要采用以下兩種處理方式處理數(shù)據(jù):剔除部分缺失值、缺失值均值補(bǔ)充。處理后的數(shù)據(jù)為中遠(yuǎn)海特A股2014年7月23日至2021年10月29日的時(shí)間序列數(shù)據(jù),然后再將獲取的數(shù)據(jù)對(duì)數(shù)化,以便后續(xù)獲得收益率數(shù)據(jù)。
(一)ARIMA-EGARCH模型①
1.數(shù)據(jù)平穩(wěn)性判斷。從數(shù)據(jù)平穩(wěn)性條件來(lái)看,一個(gè)平穩(wěn)的時(shí)間序列數(shù)據(jù)在數(shù)據(jù)時(shí)序圖的表現(xiàn)往往是一個(gè)圍繞它的平均值不斷上下波動(dòng)的具體過(guò)程;與此相反的是,非平穩(wěn)序列數(shù)據(jù)在圖形上的表現(xiàn)便是均值會(huì)隨著時(shí)間段的調(diào)整而上下波動(dòng)(如持續(xù)上升或持續(xù)下降),即并沒(méi)有一個(gè)大致均值可供數(shù)據(jù)圍繞其上下波動(dòng)?;谶@一理論原則,利用所獲數(shù)據(jù)做出數(shù)據(jù)時(shí)序圖,根據(jù)時(shí)序圖判斷,所得數(shù)據(jù)并不平穩(wěn)。
2.平穩(wěn)化結(jié)果。ADF檢驗(yàn)常被用于檢測(cè)時(shí)間序列數(shù)據(jù)的平穩(wěn)性:如果ADF統(tǒng)計(jì)量小于ADF統(tǒng)計(jì)量的臨界值,這意味著可在既定顯著性水平下,拒絕原假設(shè),即認(rèn)為原時(shí)間序列數(shù)據(jù)存在單位根,由此可判斷原時(shí)間序列平穩(wěn)。本次在對(duì)既得時(shí)間序列數(shù)據(jù)的平穩(wěn)化過(guò)程中,經(jīng)過(guò)十六次試驗(yàn),確定了采用一階差分法平穩(wěn)化數(shù)據(jù)是最好的選擇,差分后的數(shù)據(jù)通過(guò)平穩(wěn)性檢驗(yàn)。
3.ACF PACF圖判斷模型。根據(jù)python所繪出的自相關(guān)系數(shù)圖和偏自相關(guān)系數(shù)圖,由于不知道最優(yōu)模型的具體形態(tài),根據(jù)ACF圖和PACF圖可以暫定ARIMA(17,1,1)能夠最好表達(dá)該時(shí)間序列數(shù)據(jù),備選模型為:ARIMA(1,1,1,),ARIMA(2,1,1),ARIMA(3,1,1),ARIMA(4,1,1),ARIMA(5,1,1),……ARIMA(16,1,1)。
4.根據(jù)AIC最小準(zhǔn)則,選取模型ARIMA(1,1,1)。
5.殘差檢驗(yàn)。下面主要針對(duì)殘差進(jìn)行正態(tài)性檢驗(yàn)和自相關(guān)性檢驗(yàn)。殘差滿足正態(tài)性,主要是為了殘差集中于某一個(gè)數(shù)值,如果該值與0很接近,則它實(shí)際服從的分布是正態(tài)分布,均值為0。從這一點(diǎn)出發(fā),可以斷定。
6.ARCH效應(yīng)存在性檢驗(yàn)。從ARCH 效應(yīng)檢驗(yàn)結(jié)果可以看出,F(xiàn)統(tǒng)計(jì)量和Obs*R-squared 統(tǒng)計(jì)量分別為223.5215和197.3857,相對(duì)應(yīng)的概率都為0.000,都小于給定的三種置信水平,所以拒絕原假設(shè),拒絕不存在自相關(guān)條件異方差的現(xiàn)象,這樣才具備了建立GARCH 模型的基礎(chǔ)。
表2? ARCH效應(yīng)檢驗(yàn)結(jié)果
7.ARIMA(1,1,1)-EGARCH(1,1)。分別檢驗(yàn)GARCH(1,1),GARCH-M,TGARCH,EGARCH在t分布和GED分布下的結(jié)果,根據(jù)AIC及SC最小的原則,LL最大的原則,比較可得ARIMA(1,1,1)-EGARCH(1,1)在GED分布下可以較好的擬合。
8.預(yù)測(cè)。利用ARIMA(1,1,1)-EGARCH(1,1)模型預(yù)測(cè)的值和真實(shí)值短期來(lái)看問(wèn)題不大,長(zhǎng)期仍有一定的差距。②
圖1? ARIMA(1,1,1)-EGARCH(1,1)預(yù)測(cè)圖
(二)SVM(人工神經(jīng)網(wǎng)絡(luò)算法)
此算法以中遠(yuǎn)海特的收盤價(jià)為處理對(duì)象。在具體數(shù)據(jù)方面,有4個(gè)在設(shè)置好的預(yù)測(cè)時(shí)段得到的收益率RDP5、RDP10、RDP15、RDP20,同時(shí)結(jié)合轉(zhuǎn)變后的收盤價(jià)EMA15,這五個(gè)變量組成了輸入向量。EMAn通過(guò)當(dāng)天收盤價(jià)減去該天前n天的價(jià)格指數(shù)滑動(dòng)平均值而獲得。輸出變量RDP是首先分別將當(dāng)天與其后第5天的原始收盤價(jià)轉(zhuǎn)換為各自前3天的指數(shù)滑動(dòng)平均值MEA3(i),然后再根據(jù)轉(zhuǎn)換的新值求收益率。
在支持向量機(jī)模型的基礎(chǔ)之上進(jìn)行時(shí)間序列數(shù)據(jù)預(yù)測(cè)的第一步就應(yīng)該合理選擇核函數(shù)的具體種類。在所處理數(shù)據(jù)性質(zhì)不太明朗的前提下,選用高斯核函數(shù)RBF是最優(yōu)的選擇,因?yàn)樵诖蠖鄶?shù)情況下,這種原則通常會(huì)讓實(shí)驗(yàn)者獲得較為理想的結(jié)果,甚至所獲結(jié)果超出預(yù)期。因此本文采用了廣為人知的高斯函數(shù)作為核函數(shù)。
經(jīng)過(guò)訓(xùn)練后,這個(gè)模型的均方誤差(MSE)為1.9618;平均絕對(duì)誤差(MAE)為1.0685。
最后,可以說(shuō)該算法在這一股票的預(yù)測(cè)應(yīng)用具有很強(qiáng)的適應(yīng)性,所得到的結(jié)果同現(xiàn)實(shí)情況基本無(wú)二。
四、結(jié)束語(yǔ)
關(guān)于股票收益率的預(yù)測(cè)是一個(gè)古老的問(wèn)題,不少學(xué)者都已對(duì)其進(jìn)行過(guò)研究,但從來(lái)沒(méi)有一種方法可以完全預(yù)測(cè)股價(jià)的走勢(shì),可見(jiàn)股價(jià)的預(yù)測(cè)是多么復(fù)雜。
本次研究表明,ARIMA-EGARCH模型對(duì)股價(jià)進(jìn)行短期預(yù)測(cè)有不錯(cuò)表現(xiàn),能夠?yàn)楣墒型顿Y者提供些許幫助。但是ARIMA-EGARCH模型相比人工神經(jīng)網(wǎng)絡(luò)算法來(lái)說(shuō),無(wú)論從模型準(zhǔn)度以及預(yù)測(cè)效果等方面,ARIMA-EGARCH模型都明顯劣于人工神經(jīng)網(wǎng)絡(luò)算法中的SVM模型。
并行協(xié)同處理能力并非在所有研究系統(tǒng)中都能實(shí)現(xiàn),但是這在客觀實(shí)際上的確構(gòu)成了人工神經(jīng)網(wǎng)絡(luò)的最大優(yōu)點(diǎn),并且這種處理能力是大規(guī)模的,換句話說(shuō),這一算法可以承載以億計(jì)的數(shù)據(jù)量。同樣對(duì)應(yīng)的,訓(xùn)練集的構(gòu)架也需要大量數(shù)據(jù)。它的每一個(gè)神經(jīng)元具有并不復(fù)雜的結(jié)構(gòu),功能也相對(duì)單一并且簡(jiǎn)單。然而,單一神經(jīng)元匯聚起來(lái),達(dá)成一個(gè)完成的整體體態(tài)時(shí),它擁有超越一般計(jì)量模型的數(shù)據(jù)處理能力。值得一提的是,由于它復(fù)雜的神經(jīng)網(wǎng)絡(luò)并非一環(huán)扣一環(huán),因此某個(gè)神經(jīng)節(jié)點(diǎn)出現(xiàn)問(wèn)題對(duì)結(jié)果的影響微乎其微,這種龐大的容錯(cuò)能力更是使這個(gè)算法脫穎而出,成為新興的研究方法之一。在這個(gè)網(wǎng)絡(luò)中,信息處理和信息儲(chǔ)存并不存在誰(shuí)先誰(shuí)后的爭(zhēng)執(zhí),它實(shí)現(xiàn)了兩種操作的并駕齊驅(qū),即同時(shí)進(jìn)行信息的兩種操作,由此,整個(gè)網(wǎng)絡(luò)遍布著信息的存放和處理結(jié)果。值得一提的是,強(qiáng)大的容錯(cuò)能力迫使網(wǎng)絡(luò)當(dāng)中某些節(jié)點(diǎn)在操作失誤的情況下不幸被破壞時(shí),信息存取的工作并不會(huì)因此而停下腳步。也就是說(shuō),系統(tǒng)的正常工作并不意味著系統(tǒng)是完美的,也有可能系統(tǒng)已經(jīng)遭到未知的某種破壞,只不過(guò)你并不能通過(guò)系統(tǒng)是否正常工作來(lái)判斷這一點(diǎn)。這對(duì)于非線性的股票收益率預(yù)測(cè)來(lái)說(shuō),無(wú)疑是解決了經(jīng)濟(jì)學(xué)家頭疼的一大難題。
誠(chéng)然,系統(tǒng)可以遭受各種破壞不會(huì)影響系統(tǒng)的產(chǎn)出,但是訓(xùn)練好的網(wǎng)絡(luò)并不能隨心所欲地進(jìn)行更改。對(duì)于大部分網(wǎng)絡(luò)來(lái)說(shuō),信息存放的地點(diǎn)并非單一,信息是多點(diǎn)分布的,所以當(dāng)這些網(wǎng)絡(luò)完成了學(xué)習(xí)任務(wù)后再讓它學(xué)習(xí)新的事物,原來(lái)訓(xùn)練好的神經(jīng)元便會(huì)被破壞。換句話說(shuō),過(guò)去學(xué)過(guò)的事物便不復(fù)完整。
人工神經(jīng)網(wǎng)絡(luò)描述了所研究系統(tǒng)的非線性運(yùn)動(dòng),它是非線性動(dòng)力系統(tǒng)中極具代表性的典范,它繼承了非線性動(dòng)力系統(tǒng)所有的共性,比如對(duì)于系統(tǒng)未來(lái)走向的無(wú)法預(yù)測(cè)、耗散性、高維性、不可逆性、廣泛連接性和自適應(yīng)性等優(yōu)點(diǎn),使得它在股票收益預(yù)測(cè)領(lǐng)域脫穎而出,較之ARIMA-EGARCH為代表的傳統(tǒng)計(jì)量模型具有較強(qiáng)的優(yōu)越性。
當(dāng)然,這并不意味著全部否認(rèn)傳統(tǒng)計(jì)量模型,只是在越發(fā)復(fù)雜的現(xiàn)實(shí)因素誘導(dǎo)下,傳統(tǒng)計(jì)量模型并未將現(xiàn)實(shí)因素全盤考慮在內(nèi),故其有一定的局限性。而人工神經(jīng)網(wǎng)絡(luò)算法也并非萬(wàn)能,人工神經(jīng)網(wǎng)絡(luò)算法需要大量的數(shù)據(jù),處理過(guò)程之復(fù)雜遠(yuǎn)勝于傳統(tǒng)計(jì)量模型。以上實(shí)證過(guò)程中,還可以引入波羅的海指數(shù)及原油期貨指數(shù)等影響因素以期獲取更多數(shù)據(jù),來(lái)優(yōu)化模型的主動(dòng)學(xué)習(xí)能力,在此不過(guò)多贅述。
總的來(lái)說(shuō),在日益動(dòng)蕩的A股市場(chǎng),我們完全可以將人工神經(jīng)網(wǎng)絡(luò)算法結(jié)合傳統(tǒng)計(jì)量模型來(lái)進(jìn)行股價(jià)及其風(fēng)險(xiǎn)的預(yù)測(cè)。
參考文獻(xiàn):
[1]? ?李方圓,張濤.基于HMM-XGBoost的股價(jià)預(yù)測(cè)[J].桂林航天工業(yè)學(xué)院學(xué)報(bào),2021,26(4):484-488.
[2]? ?李曉瑜.評(píng)“基于混合量子-經(jīng)典神經(jīng)網(wǎng)絡(luò)模型的股價(jià)預(yù)測(cè)”[J].電子科技大學(xué)學(xué)報(bào),2022,51(1):1.
[3]? ?徐晨萌,方華.運(yùn)用ARMA模型對(duì)股價(jià)預(yù)測(cè)的實(shí)證研究[J].經(jīng)濟(jì)研究導(dǎo)刊,2019(31):77-82.
[4]? ?馮旭日,崔潔.基于灰色Elman神經(jīng)網(wǎng)絡(luò)的股價(jià)預(yù)測(cè)[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2019,21(4):246-252.
[5]? ?林升,綦科,魏楷聰,等.機(jī)器學(xué)習(xí)在股價(jià)預(yù)測(cè)中的研究綜述[J].經(jīng)濟(jì)師,2019(3):71-73.
[6]? ?張曉婷,何朗,黃樟燦,等.基于MFR-GEP的高階常微分方程預(yù)測(cè)模型[J].計(jì)算機(jī)工程與應(yīng)用,2019,55(21):247-253.
[7]? ?楊春靜.基于時(shí)間序列模型的股價(jià)預(yù)測(cè)[J].西部皮革,2018,40(12):98-99.
[8]? ?趙建喜,李雪飛,易丹輝,等.基于曲線段特征匹配的股價(jià)預(yù)測(cè)研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2018,48(1):75-82.
[9]? ?薛倩男,高岳林.基于PSO-BP神經(jīng)網(wǎng)絡(luò)股價(jià)預(yù)測(cè)模型研究[J].智富時(shí)代,2017(8):17.
[10]? ?郭建峰,李玉,安東.基于LM遺傳神經(jīng)網(wǎng)絡(luò)的短期股價(jià)預(yù)測(cè)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2017,27(1):152-155.
[責(zé)任編輯? ?立? ?夏]
經(jīng)濟(jì)研究導(dǎo)刊2023年21期