耿立艷 張占福
摘?要:將自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS)引入到股指期貨合約收益波動(dòng)率預(yù)測中,構(gòu)建基于四維輸入變量的ANFIS股指期貨波動(dòng)率預(yù)測模型。將前一期的收益波動(dòng)率、開盤價(jià)格、最高價(jià)格、收盤價(jià)格作為輸入變量,以當(dāng)期收益波動(dòng)率作為輸出變量。以滬深300指數(shù)高頻期貨合約為例進(jìn)行實(shí)證研究。根據(jù)RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF值,四維輸入變量ANFIS的高頻收益波動(dòng)率預(yù)測性能優(yōu)于RBFNN和一維輸入變量ANFIS。
關(guān)鍵詞:股指期貨;波動(dòng)率;預(yù)測;自適應(yīng)神經(jīng)模糊推理系統(tǒng)
中圖分類號:F830 TP183文獻(xiàn)標(biāo)志碼:A
1引言
隨著人工智能技術(shù)的不斷發(fā)展,人工神經(jīng)網(wǎng)絡(luò)在金融波動(dòng)率預(yù)測領(lǐng)域得到應(yīng)用[1-2]。但在實(shí)際應(yīng)用中,人工神經(jīng)網(wǎng)絡(luò)由于自身的一些缺陷,難以得到推廣。自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS)?[3]是以T-S型模糊推理系統(tǒng)[4]為基礎(chǔ)構(gòu)建的一種自適應(yīng)神經(jīng)網(wǎng)絡(luò)。ANFIS既具有神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)、自適應(yīng)能力,在功能上又與模糊推理系統(tǒng)等效,其隸屬度函數(shù)參數(shù)與結(jié)論參數(shù)均能夠通過數(shù)據(jù)樣本的訓(xùn)練實(shí)現(xiàn)自主確定和更新[5]。因此,ANFIS不需要專家的經(jīng)驗(yàn)與知識建模,更適應(yīng)用于特性難以掌握的復(fù)雜系統(tǒng)建模。此外,ANFIS理論上能夠以任意精度逼近任意非線性連續(xù)函數(shù),充分利用這一優(yōu)勢可實(shí)現(xiàn)高精度的非線性逼近與預(yù)測[6]。考慮到金融市場波動(dòng)的復(fù)雜性與非線性特點(diǎn),本文將ANFIS引入到金融資產(chǎn)收益波動(dòng)率研究中,構(gòu)建波動(dòng)率的ANFIS預(yù)測模型,并通過滬深300指數(shù)期貨的實(shí)證研究檢驗(yàn)ANFIS有效性。
2金融波動(dòng)率的ANFIS預(yù)測模型
構(gòu)建ANFIS時(shí),首先要選取合適的輸入變量和輸出變量。本部分要解決的是金融資產(chǎn)收益波動(dòng)率的預(yù)測問題,所以將ANFIS的輸出變量設(shè)為金融資產(chǎn)收益波動(dòng)率的當(dāng)期值,預(yù)測值則由ANFIS訓(xùn)練出的參數(shù)與規(guī)則外推下一期的收益波動(dòng)率。由于收益波動(dòng)率數(shù)據(jù)無法從金融市場交易數(shù)據(jù)中直接獲得,這里以股指收益平方的當(dāng)期值及前四期的移動(dòng)平均值之和作為收益波動(dòng)率的估計(jì)值。輸入變量的選取應(yīng)當(dāng)包含盡可能多的相關(guān)歷史信息量,以體現(xiàn)不同影響因素對輸出變量產(chǎn)生的作用。進(jìn)行金融資產(chǎn)收益波動(dòng)率預(yù)測時(shí),通常是根據(jù)金融市場的歷史數(shù)據(jù)進(jìn)行建模與預(yù)測,這里將前一期的收益波動(dòng)率、開盤價(jià)格、最高價(jià)格、收盤價(jià)格作為輸入變量?;谒木S輸入變量的ANFIS表達(dá)式如下:
其中,和分別為ANFIS的輸出變量和輸入變量;代表第期的收益波動(dòng)率;代表第期的收益波動(dòng)率;分別為第時(shí)期的開盤價(jià)格、最高價(jià)格和最低價(jià)格;表示輸入變量與輸出變量之間的非線性關(guān)系,即ANFIS通過一些模糊規(guī)則,建立它們之間的非線性映射關(guān)系。
四維輸入變量ANFIS預(yù)測波動(dòng)率的步驟設(shè)計(jì)如下:
步驟1:數(shù)據(jù)預(yù)處理。以開盤價(jià)格、最高價(jià)格、收盤價(jià)格、前一期的收益波動(dòng)率作為輸入變量、當(dāng)期收益波動(dòng)率作為輸出變量,分別對輸入變量和輸出變量的原始數(shù)據(jù)進(jìn)行預(yù)處理;將預(yù)處理后的數(shù)據(jù)樣本分為兩部分:訓(xùn)練樣本集和檢驗(yàn)樣本集,訓(xùn)練樣本集用于構(gòu)建ANFIS,檢驗(yàn)樣本集用于檢驗(yàn)ANFIS-的預(yù)測性能。
步驟2:ANFIS隸屬度函數(shù)選擇。根據(jù)經(jīng)驗(yàn)選擇隸屬度函數(shù)的類型和數(shù)目,生成初始的ANFIS,通過反復(fù)試驗(yàn)選擇最優(yōu)的隸屬度函數(shù)類型和數(shù)目。
步驟3:ANFIS構(gòu)建。利用訓(xùn)練樣本集訓(xùn)練ANFIS,確定隸屬度函數(shù)參數(shù)與結(jié)論參數(shù),根據(jù)獲得的參數(shù)構(gòu)建ANFIS。
步驟4:ANFIS預(yù)測。基于檢驗(yàn)樣本集,利用構(gòu)建的ANFIS預(yù)測波動(dòng)率,并將得到的預(yù)測值反歸一化為原始波動(dòng)率的預(yù)測值。
3實(shí)證研究
3.1 數(shù)據(jù)選取與描述
以中國金融期貨交易所滬深300指數(shù)期貨合約(Hushen 300 index futures contract, HS300IFC)為研究對象,選取時(shí)間跨度為2011年1月31日到2011年3月4日的5分鐘交易數(shù)據(jù),共包括958組觀測值,每組觀測值包括開盤價(jià)格,最高價(jià)格,最低價(jià)格,收盤價(jià)格,成交量五個(gè)觀測量。根據(jù)連續(xù)復(fù)合對數(shù)收益率公式計(jì)算HS300IFC收益,得到957個(gè)數(shù)據(jù)樣本,計(jì)算公式如下:
(2)
其中,為五分鐘收益,和為第個(gè)五分鐘和第個(gè)五分鐘的收盤價(jià)格。
表1為HS300IFC收益序列描述性統(tǒng)計(jì)量。由表1可知,首先,HS300IFC收益序列的均值和中位數(shù)相對較小,僅為0.0077和0.0160,而標(biāo)準(zhǔn)誤差則相對較大,為0.1664,表明HS300IFC收益序列的數(shù)據(jù)趨于集中,偏離均值的程度較大,反映出HS300IFC收益序列具有較大的波動(dòng)性特征;其次,從偏度和峰度可以看出,HS300IFC收益序列的偏度小于零、峰度大于正態(tài)分布的峰度值3,說明HS300IFC收益序列是左偏的,且凸起的程度高于標(biāo)準(zhǔn)正態(tài)分布,同時(shí)J-B統(tǒng)計(jì)量顯示,HS300IFC收益序列在1%、5%和10%水平下都顯著拒絕零假設(shè),可以得出,HS300IFC收益序列呈現(xiàn)出“尖峰厚尾”且向左偏的非正態(tài)分布;第三,HS300IFC收益序列的LB(16)統(tǒng)計(jì)量在1%、5%和10%水平下均顯著拒絕了零假設(shè),說明HS300IFC收益序列不存在線性自相關(guān)性,為白噪聲序列;從LB2(16)統(tǒng)計(jì)量可以看出,HS300IFC收益平方序列在1%、5%和10%水平下顯著拒絕了非自相關(guān)性假設(shè),表明HS300IFC收益序列具有非線性自相關(guān)性;最后,HS300IFC收益序列的LM(16)統(tǒng)計(jì)量在1%、5%和10%水平下均顯著拒絕零假設(shè),這就拒絕了不存在ARCH效應(yīng)的原假設(shè),說明HS300IFC收益序列存在“波動(dòng)聚集性”特征,因此,LM檢驗(yàn)結(jié)果與偏度和峰度的檢驗(yàn)結(jié)果是一致的。
注:J-B表示Jarque-Bera正態(tài)性檢驗(yàn);LB(16)和LB2(16)分別表示對收益序列和收益平方序列作滯后16階的Ljung-Box序列相關(guān)性檢驗(yàn);LM(16)代表對收益平方序列作滯后20階的ARCH檢驗(yàn);*、**和***分別代表統(tǒng)計(jì)量在1%、5%和10%水平下顯著。
3.2 ANFIS學(xué)習(xí)與預(yù)測
首先,將輸入變量和輸出變量的原始數(shù)據(jù)樣本均歸一化到[0,1]區(qū)間,再分為兩個(gè)部分:前600組數(shù)據(jù)作為訓(xùn)練樣本集,后358組數(shù)據(jù)作為檢驗(yàn)樣本集。其次,選擇隸屬度函數(shù)。輸出變量隸屬度函數(shù)的類型只有兩種:常數(shù)和線性函數(shù),這里為輸出變量選擇線性函數(shù);輸入變量隸屬度函數(shù)類型與數(shù)目的選擇,目前尚無統(tǒng)一的方法。研究發(fā)現(xiàn),T-S型模糊推理系統(tǒng)更適合采用非線性隸屬度函數(shù)[7],因而這里為四個(gè)輸入變量選擇非線性隸屬度函數(shù)。經(jīng)過多次試驗(yàn),將輸入變量的隸屬度函數(shù)選為雙邊高斯型隸屬度函數(shù),同時(shí),為輸入變量的模糊集設(shè)置四種模糊變量:低于、等于、中等、高于。輸入變量隸屬度函數(shù)的數(shù)目通常根據(jù)訓(xùn)練數(shù)據(jù)的多少和輸入變量的維數(shù)確定,通過試驗(yàn),選取2個(gè)輸入變量隸屬度函數(shù)。第三,采用模糊聚類法劃分輸入變量空間,生成初始的參數(shù)化ANFIS結(jié)構(gòu)。將訓(xùn)練次數(shù)設(shè)為100次,根據(jù)訓(xùn)練樣本集訓(xùn)練ANFIS,采用誤差最小作為停止收斂準(zhǔn)則,即當(dāng)誤差不再變化時(shí)結(jié)束訓(xùn)練。最后,利用訓(xùn)練好的ANFIS向前一步預(yù)測HS300IFC收益波動(dòng)率,以減少累計(jì)誤差。再將預(yù)測值反歸一化為原始波動(dòng)率的預(yù)測值。
為驗(yàn)證ANFIS的有效性,基于相同的訓(xùn)練樣本集與檢驗(yàn)樣本集,構(gòu)建徑向基神經(jīng)網(wǎng)絡(luò)(RBFNN)預(yù)測HS300IFC收益波動(dòng)率,并將RBFNN的預(yù)測結(jié)果與ANFIS相比較。其中,RBFNN的結(jié)構(gòu)由輸入、輸出變量維數(shù)確定,即輸入層包含4個(gè)結(jié)點(diǎn)、輸出層有1個(gè)結(jié)點(diǎn),隱含層包含2個(gè)結(jié)點(diǎn);自由度設(shè)為5,期望誤差設(shè)為0.00001。
3.3 .結(jié)果分析與比較
以股指收益平方的當(dāng)期值及前四期的移動(dòng)平均值之和作為真實(shí)波動(dòng)率的估計(jì)值,選用選用均方根誤差(RMSE)、平均絕對誤差(MAE)、異方差調(diào)整的均方根誤差(HRMSE)、平均百分比誤差(MPE)、西爾統(tǒng)計(jì)量(Theil)、對數(shù)損失函數(shù)(LLF)和線性指數(shù)損失函數(shù)(LELF)七項(xiàng)指標(biāo)評價(jià)ANFIS和RBFNN模型的預(yù)測性能七項(xiàng)評價(jià)指標(biāo)值越小,表明模型的預(yù)測性能越好。
表2為ANFIS和RBFNN預(yù)測性能比較結(jié)果。由表2可知,在所選擇的樣本期內(nèi),?ANFIS對HS300IFC的RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF均小于RBFNN的對應(yīng)值,因此,根據(jù)所考察的評價(jià)指標(biāo),ANFIS的HS300IFC收益波動(dòng)率預(yù)測性能優(yōu)于RBFNN。
圖1為HS300IFC收益波動(dòng)率預(yù)測值比較曲線圖。由圖1可以看出,ANFIS和RBFNN均較好地預(yù)測出HS300IFC收益波動(dòng)率的變化特征,相比于RBFNN,ANFIS則更準(zhǔn)確地捕捉到了HS300IFC收益波動(dòng)率的某些峰值和谷值。
圖1 HS300IFC收益波動(dòng)率預(yù)測值比較曲線圖
為進(jìn)一步驗(yàn)證ANFIS的有效性,基于相同的訓(xùn)練樣本集與檢驗(yàn)樣本集,將前一期的收益波動(dòng)率作為輸入變量,構(gòu)建基于一維輸入變量的ANFIS預(yù)測當(dāng)期波動(dòng)率。為使預(yù)測結(jié)果具有可比性,將一維輸入變量ANFIS的輸出變量隸屬度函數(shù)、輸入變量隸屬度函數(shù)與數(shù)目、模糊規(guī)則、訓(xùn)練次數(shù)等參數(shù)設(shè)置為與四維變量ANFIS相同。
表3為不同維輸入變量的ANFIS預(yù)測性能比較結(jié)果。由表3可知,在所選擇的樣本期內(nèi),四維輸入變量ANFIS對HS300IFC收益波動(dòng)率預(yù)測性能明顯優(yōu)于一維輸入變量ANFIS,表現(xiàn)在其RMSE、MAE、HRMSE、MPE、Theil、LLF和LELF值均明顯小于一維輸入變量ANFIS的對應(yīng)值。
圖2不同輸入變量ANFIS收益波動(dòng)率預(yù)測值比較曲線圖
圖2為不同維輸入變量ANFIS收益波動(dòng)率預(yù)測值比較曲線圖。由圖2可以看出,基于四維輸入變量的ANFIS獲得了比一維輸入變量的ANFIS更接近于實(shí)際值的預(yù)測值,且更準(zhǔn)確地捕捉到了HS300IFC收益波動(dòng)率的峰值和谷值。因此,從提高波動(dòng)率預(yù)測精度角度出發(fā),本文構(gòu)建的四維輸入變量ANFIS預(yù)測模型更加合理,是一種有效的高頻股指期貨收益波動(dòng)率預(yù)測方法。
四、結(jié)論
本文將ANFIS直接用于高頻股指期貨收益波動(dòng)率預(yù)測。鑒于高頻股指期貨收益波動(dòng)率的復(fù)雜性和非線性特點(diǎn),以前一期的收益波動(dòng)率、開盤價(jià)格、最高價(jià)格、收盤價(jià)格作為輸入變量,構(gòu)建基于四維輸入變量的ANFIS。實(shí)證研究結(jié)果表明,四維輸入變量ANFIS的高頻股指期貨收益波動(dòng)率預(yù)測性能優(yōu)于RBFNN和一維輸入變量ANFIS,獲得了比一維輸入變量的ANFIS更接近于實(shí)際值的預(yù)測值,且更準(zhǔn)確地捕捉到了收益波動(dòng)率的峰值和谷值,為高頻股指期貨波動(dòng)率預(yù)測提供一種新思路。
參考文獻(xiàn)
基金項(xiàng)目:河北省2018年度引進(jìn)留學(xué)人員資助項(xiàng)目(編號:C201820)。
作者簡介:通訊作者:耿立艷(1979-),女,天津?qū)氎嫒?,博士后,教授,碩士生導(dǎo)師,研究方向:金融工程。