張衛(wèi)國++李家銘
摘 要:
針對極限學習機易陷入過度學習和隱層節(jié)點數(shù)目難確定的問題,提出基于雙層差分進化算法的極限學習機(雙層DE-ELM)預測模型,把極限學習機(ELM)的隱層節(jié)點數(shù)目和節(jié)點參數(shù)作為差分進化(DE)算法的外層和內(nèi)層進化個體,利用DE算法通過自然選擇淘汰機制對其進行學習和完善。將該模型應用于上證綜合指數(shù)和標準普爾500指數(shù)的短、中期預測,并與DE-ELM等模型的預測結(jié)果進行對比分析。實證結(jié)果表明:雙層DE-ELM預測模型能夠有效地選擇隱層節(jié)點數(shù)目和參數(shù),具有較強的預測能力和較高的穩(wěn)定性。
關鍵詞:
雙層DE-ELM預測模型;隱層節(jié)點;股票指數(shù);時間序列
中圖分類號: F831 文獻標志碼:A 文章編號:1009-055X(2016)02-0018-09
引 言
股票指數(shù)的預測問題一直以來都是學界和業(yè)界十分關注的話題,指數(shù)平滑預測法[1]、ARMA(自回歸移動平均模型)[2]和ARCH(自回歸條件異方差模型)[3]等傳統(tǒng)的時間序列分析法被學者廣泛研究。然而,這些模型具有較強的使用限制,只有滿足特定的條件時才能使用。為了克服這一問題,以時間序列驅(qū)動的各類人工智能預測模型,特別是人工神經(jīng)網(wǎng)絡模型逐步成為研究的熱點。
1988年,White首次利用神經(jīng)網(wǎng)絡來預測股票每日報酬率,然而預測效果并不理想。White認為神經(jīng)網(wǎng)絡陷入局部極小值而無法跳出,影響了預測效果。[4]Kimoto等利用神經(jīng)網(wǎng)絡對東京證交所股價加權(quán)平均指數(shù)進行預測,指出神經(jīng)網(wǎng)絡模型對報酬率的預測效果優(yōu)于TOPIX加權(quán)平均指數(shù)方法。[5]為了進一步提高神經(jīng)網(wǎng)絡模型的預測能力,許多學者又對人工智能技術(shù)進行了改進,比如說,Hassan等把HMM、ANN和GA進行結(jié)合對金融市場的行為進行預測,他們認為,改進后的模型對金融市場的預測與傳統(tǒng)人工智能技術(shù)相比更加精確。[6]Wang等提出WDBP神經(jīng)網(wǎng)絡來預測上證綜合指數(shù),其結(jié)果表明WDBP神經(jīng)網(wǎng)絡與傳統(tǒng)的BP神經(jīng)網(wǎng)絡相比具有更強的預測能力。[7]常松等利用小波包理論將價格波動序列最優(yōu)地分解為一系列子波動并運用神經(jīng)網(wǎng)絡對子波動進行預測,實證結(jié)果表明小波包與神經(jīng)網(wǎng)絡結(jié)合起來對股票價格的預測效果比單獨的神經(jīng)網(wǎng)絡更好。[8]徐少華等提出一種基于混沌遺傳與帶有動態(tài)慣性因子的粒子群優(yōu)化相結(jié)合的學習方法來優(yōu)化神經(jīng)網(wǎng)絡的訓練問題,以提高神經(jīng)網(wǎng)絡的訓練精度。實證結(jié)果表明該改進算法提供了PNN網(wǎng)絡的訓練精度。[9]楊一等提出一種基于輸出敏感度方差重要性的結(jié)構(gòu)優(yōu)化算法來解決RBF神經(jīng)網(wǎng)絡的結(jié)構(gòu)設計問題。結(jié)果表明該算法可根據(jù)研究對象自適應地調(diào)整RBF的網(wǎng)絡結(jié)構(gòu),提高其泛化能力。[10]
由于傳統(tǒng)人工神經(jīng)網(wǎng)絡存在結(jié)構(gòu)上的缺陷,比如說,學習速度慢、學習率難以確定、易過度訓練等,學者們對人工神經(jīng)網(wǎng)絡的有效性產(chǎn)生質(zhì)疑。為了克服神經(jīng)網(wǎng)絡模型的結(jié)構(gòu)缺陷,Huang等人提出極限學習機(Extreme Learning Machine,ELM)的概念。[11]ELM算法是一種十分簡單快速的單隱層神經(jīng)網(wǎng)絡訓練算法,在網(wǎng)絡參數(shù)的確定過程中隱層節(jié)點參數(shù)(內(nèi)權(quán)和偏置值)隨機設置,且其在網(wǎng)絡學習過程中不再改變,而網(wǎng)絡外權(quán)通過最小化誤差的原理計算得出。ELM的學習機制使其只需進行一次運算即可輸出權(quán)值,與需要進行多次迭代的前饋型神經(jīng)網(wǎng)絡相比大幅度地減少了學習時間、提高了學習效率,近年受到了廣泛的關注。
ELM算法的運算機制使該算法同樣存在結(jié)構(gòu)上的不足,比如說:隱層輸出矩陣易發(fā)生奇異,部分隱層節(jié)點不起作用。為了進一步改善ELM算法的不足,學者提出了一系列改進方案,比如說:Lan等提出了CS-ELM算法,該算法對ELM算法的隱層節(jié)點參數(shù)進行篩選,去除顯著性較弱的隱層節(jié)點來實現(xiàn)網(wǎng)絡結(jié)構(gòu)的優(yōu)化。[12]Wang等提出EELM算法,運用對角占優(yōu)的方法來優(yōu)化隱層節(jié)點參數(shù),進而保證了隱層輸出矩陣的非奇異性,提高了極限學習機的穩(wěn)定性。[13]Toh等通過添加正則項的方式避免了隱層矩陣奇異和接近奇異情況的發(fā)生,有效地提高了ELM算法的學習能力。[14]Huang等提出EI-ELM算法來優(yōu)化隱層節(jié)點參數(shù),簡化了ELM算法的復雜度,提高了其優(yōu)化效率。[15]高光勇等提出CC-ELM算法,運用復合混沌和混沌變尺度算法對極限學習機的參數(shù)進行搜索和優(yōu)化,提高了ELM算法的泛化性能。同時,通過算例指出CC-ELM算法與同類型算法相比更加有效。[16]
然而,上述改進算法均未同時考慮隱層節(jié)點數(shù)目和參數(shù)兩方面。為了克服這一問題,本文提出雙層DE-ELM預測模型。該模型使用雙層差分進化算法(DE)與極限學習機(ELM)結(jié)合,利用差分進化(DE)算法對極限學習機(ELM)的網(wǎng)絡隱層節(jié)點數(shù)目、隱層內(nèi)權(quán)和偏置值進行優(yōu)化。最后,本文利用雙層DE-ELM預測模型對上證綜合指數(shù)和標準普爾500指數(shù)的日度數(shù)據(jù)和月度數(shù)據(jù)進行預測,以討論雙層DE-ELM預測模型的應用價值。
一、模型介紹
股票市場具有復雜性、非線性、多變性等特點,隨著ETF和股指期貨等金融工具的出現(xiàn),股指對股票市場的重要性越發(fā)重要,投資者可以利用股指的衍生品進行套利或套保,對股指走勢進行預測就顯得越發(fā)重要。但股指同樣具有走勢難預測、方向難確定、影響因素多等方面的特點,導致對其進行預測具有很多的困難。
本文利用時間序列的方法,以股指過去n天/月的歷史收盤價作為模型的輸入,以第n+1天/月的收盤價作為輸出函數(shù)進行一步預測。股票價格走勢與近期的歷史信息有關,本文著重考慮單個因素(股價)對自身短中期預測的影響,不考慮其他因素。
[BT4](一)極限學習機(ELM)
Huang等依據(jù)摩爾-彭羅斯(MP)廣義逆矩陣理論[17]提出了極限學習機(ELM)算法。[11]該算法的特點是在網(wǎng)絡參數(shù)的確定過程中,內(nèi)權(quán)和偏置值隨機選取且無需進行二次調(diào)節(jié),而網(wǎng)絡外權(quán)通過最小化損失函數(shù)得到。這種機制使得ELM算法在網(wǎng)絡參數(shù)確定過程中無需進行任何迭代步驟,只需一次計算即可得出最優(yōu)網(wǎng)絡參數(shù)。這樣的處理機制大大降低了運算時間,與需要多次迭代的前饋型神經(jīng)網(wǎng)絡相比具有巨大的優(yōu)勢。