張 瑞
(太原工業(yè)學(xué)院,山西 太原 030008)
消費(fèi)者信心指數(shù) (Consumer Confidence Index, 簡(jiǎn)稱CCI)是反映消費(fèi)者信心強(qiáng)弱的指標(biāo),量化消費(fèi)者對(duì)當(dāng)前及未來的經(jīng)濟(jì)形勢(shì)、收入水平和消費(fèi)心理狀態(tài),是預(yù)測(cè)經(jīng)濟(jì)走勢(shì)和消費(fèi)趨向的一個(gè)先行指標(biāo).故及時(shí)準(zhǔn)確統(tǒng)計(jì)和預(yù)測(cè)消費(fèi)者信心指數(shù)對(duì)預(yù)判我國宏觀經(jīng)濟(jì)形勢(shì)、合理制定宏觀經(jīng)濟(jì)政策、把握消費(fèi)者消費(fèi)信心傾向以及促進(jìn)消費(fèi)升級(jí),都具有重要意義[1].
關(guān)于消費(fèi)者信心指數(shù)預(yù)測(cè)的研究,學(xué)者從不同角度進(jìn)行了探討.如,從經(jīng)典時(shí)序模型方面,通過建立ARIMA乘積季節(jié)模型進(jìn)行預(yù)測(cè)[2];從機(jī)器學(xué)習(xí)方面,基于灰色區(qū)間GM(1,1)模型[3]、BP神經(jīng)網(wǎng)絡(luò)的改進(jìn)等進(jìn)行預(yù)測(cè)[4].隨著深度學(xué)習(xí)技術(shù)的出現(xiàn),它在處理具有非線性特征和復(fù)雜模式的數(shù)據(jù)上展現(xiàn)出顯著優(yōu)勢(shì),其中長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò) (Long Short-Term Memory,簡(jiǎn)稱LSTM) 可用于時(shí)間序列預(yù)測(cè).該方法已用于全球股票指數(shù)[5]、太陽黑子活動(dòng)[6]、北京首都國際機(jī)場(chǎng)路面交通擁堵[7]等預(yù)測(cè),結(jié)果均顯示該模型預(yù)測(cè)精度高,效果穩(wěn)定.
唐曉彬等[1]在LSTM神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上引入網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)消費(fèi)者信心指數(shù)進(jìn)行了預(yù)測(cè).區(qū)別于該文獻(xiàn),本文將引入時(shí)間標(biāo)記指數(shù),從而構(gòu)造多變量LSTM神經(jīng)網(wǎng)絡(luò)模型對(duì)消費(fèi)者信心指數(shù)進(jìn)行預(yù)測(cè),以期提高預(yù)測(cè)精度,為宏觀經(jīng)濟(jì)指標(biāo)預(yù)測(cè)領(lǐng)域提供思路.第一部分為理論部分,主要介紹LSTM神經(jīng)網(wǎng)絡(luò)模型和多變量構(gòu)造法.第二部分基于多變量LSTM神經(jīng)網(wǎng)絡(luò)模型對(duì)消費(fèi)者信心指數(shù)進(jìn)行預(yù)測(cè),并以單變量LSTM神經(jīng)網(wǎng)絡(luò)模型和經(jīng)典時(shí)序模型ARIMA作為基準(zhǔn)模型進(jìn)行比較.第三部分給出相應(yīng)的討論與結(jié)語.
LSTM神經(jīng)網(wǎng)絡(luò)模型最早由Hochreiter等[8]提出,它在一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN) 基礎(chǔ)上做了相對(duì)復(fù)雜的改進(jìn),這些改進(jìn)使得LSTM模型能更好地解決梯度爆炸和梯度消失問題,讓循環(huán)神經(jīng)網(wǎng)絡(luò)具備更強(qiáng)、更好的記憶性能[9].工作單元的內(nèi)部結(jié)構(gòu)如圖1所示,單元接收當(dāng)前層的輸入xt,上一個(gè)單元的隱藏狀態(tài)at-1和單元狀態(tài)ct-1,并由遺忘門、輸入門和控制門實(shí)現(xiàn)信息的持久化和抑制.
圖1 LSTM工作單元
遺忘門接受來自輸入xt和上層的隱藏狀態(tài)at-1的值進(jìn)行合并后再加權(quán)計(jì)算處理,公式如下:
(1)
其中σ(x)為Sigmoid激活函數(shù),ω為權(quán)重,b為截距.其主要作用是決定從記憶細(xì)胞中是否丟棄某些信息.
(2)
(3)
結(jié)合遺忘門、輸入門、上一個(gè)單元狀態(tài)可共同決定和更新當(dāng)前細(xì)胞狀態(tài)ct,即
(4)
LSTM提供了單獨(dú)的輸出門,其計(jì)算公式如下:
(5)
(6)
LSTM神經(jīng)網(wǎng)絡(luò)就是由上述多個(gè)LSTM狀態(tài)單元級(jí)聯(lián)合起來組成,工作原理如圖2所示.
圖2 LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
僅用單一指數(shù)作為輸入數(shù)據(jù)的預(yù)測(cè)方法屬于單變量預(yù)測(cè).考慮某些指數(shù)呈現(xiàn)出周期變化,為提高預(yù)測(cè)精度可構(gòu)造多變量預(yù)測(cè).從1開始標(biāo)記數(shù)據(jù)在所處周期的位置,循環(huán)下去,將該標(biāo)記作為另一個(gè)輸入數(shù)據(jù),從而維度由一維增加到二維.構(gòu)造多變量不僅記錄了觀測(cè)值在周期中的相對(duì)位置,也記錄了該周期的長(zhǎng)度.消費(fèi)者信心指數(shù)大致呈現(xiàn)出周期為一年的波動(dòng),可對(duì)其進(jìn)行多變量構(gòu)造.假設(shè)一年中消費(fèi)者信心指數(shù)的觀測(cè)值為12個(gè),與此對(duì)應(yīng),構(gòu)造一個(gè)以1為開頭到12的序列作為時(shí)間標(biāo)記指數(shù),循環(huán)下去.
本文選擇均方根誤差(Root Mean Squared Error, 簡(jiǎn)稱RMSE)和平均絕對(duì)誤差比(Mean Absolute Percentage Error, 簡(jiǎn)稱MAPE)作為預(yù)測(cè)性能指標(biāo),向前預(yù)測(cè)N步的公式如下:
(7)
(8)
本文采集2011年1月至2020年12月之間的消費(fèi)者信心指數(shù)的數(shù)據(jù),采樣頻率為每月一次,來源于東方財(cái)富網(wǎng)數(shù)據(jù)中心.為了更加細(xì)致刻畫消費(fèi)者信心變化的動(dòng)態(tài)過程,考慮進(jìn)行插值,又注意到近年我國經(jīng)濟(jì)形勢(shì)整體平穩(wěn),消費(fèi)者信心指數(shù)沒有大幅波動(dòng),故對(duì)月度數(shù)據(jù)進(jìn)行三次樣條插值處理,將中國消費(fèi)者信心指數(shù)月度數(shù)據(jù)擴(kuò)充為旬度數(shù)據(jù).插值后,一年中消費(fèi)者信心指數(shù)的觀測(cè)值為36個(gè),與此對(duì)應(yīng),構(gòu)造一個(gè)以1為開頭到36的序列作為時(shí)間標(biāo)記指數(shù),循環(huán)下去,作為另一條輸入數(shù)據(jù).
為消除變量不同量綱與異常值對(duì)模型預(yù)測(cè)性能的干擾,將數(shù)據(jù)進(jìn)行歸一化變換:
(9)
其中,xi為第i個(gè)樣本點(diǎn)的值,xmin和xmax分別為最小值和最大值.歸一化處理后數(shù)值落入[0,1]區(qū)間.
將歸一化后的數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,為檢驗(yàn)預(yù)測(cè)模型預(yù)測(cè)性能的穩(wěn)健性,分別討論測(cè)試集為36期(一年)和18期(半年)兩種情況.運(yùn)用Python 3語言環(huán)境,基于Tensorflow深度學(xué)習(xí)框架建立多變量LSTM預(yù)測(cè)模型.該模型輸入層的維度為2,即消費(fèi)者信心指數(shù)和時(shí)間標(biāo)記指數(shù),輸出層為消費(fèi)者信心指數(shù)預(yù)測(cè)值,隱藏層內(nèi)LSTM神經(jīng)元節(jié)點(diǎn)數(shù)為50個(gè),學(xué)習(xí)率η為0.001,迭代次數(shù)為500次,滯后階數(shù)為5,滑動(dòng)窗口為18,使用Adam優(yōu)化器進(jìn)行訓(xùn)練.預(yù)測(cè)過程結(jié)束后,對(duì)預(yù)測(cè)結(jié)果再通過反歸一化處理進(jìn)而得到預(yù)測(cè)值.
為比較模型性能,選取RMSE和MAPE為衡量指標(biāo),以經(jīng)典時(shí)序模型ARIMA和單變量LSTM神經(jīng)網(wǎng)絡(luò)模型作為基準(zhǔn)模型,與多變量LSTM神經(jīng)網(wǎng)絡(luò)模型進(jìn)行比較.結(jié)果如表1所示.
表1 不同模型預(yù)測(cè)結(jié)果對(duì)比表
由表1可看出,消費(fèi)者信心指數(shù)的各期預(yù)測(cè)中多變量LSTM模型的預(yù)測(cè)精度一致優(yōu)于單變量LSTM模型和ARIMA模型.具體量化來看,以MAPE為預(yù)測(cè)效果的指標(biāo),單變量LSTM模型相較于ARIMA模型,預(yù)測(cè)精度有了明顯提升,36期和18期分別提高1.222%,0.734%;多變量LSTM模型相較于單變量LSTM模型,在不同期上均有不同程度的預(yù)測(cè)精度的提升,各期分別提高了0.046%,0.108%,說明構(gòu)造多變量輸入數(shù)據(jù)有助于預(yù)測(cè)性能的提升.另外對(duì)比可得,多變量LSTM模型在預(yù)測(cè)消費(fèi)者信心指數(shù)時(shí),隨著預(yù)測(cè)期限加長(zhǎng),RMSE和MAPE值略有增加,但不隨預(yù)測(cè)期限而發(fā)生劇烈變化,說明該模型具有較好的穩(wěn)健性和泛化能力.
由于消費(fèi)者信心指數(shù)具有非線性變化特征,本文引入深度學(xué)習(xí)算法中LSTM神經(jīng)網(wǎng)絡(luò)模型,結(jié)合時(shí)間標(biāo)記指數(shù),構(gòu)造了多變量LSTM預(yù)測(cè)模型,分別對(duì)消費(fèi)者信心指數(shù)36期和18期進(jìn)行了預(yù)測(cè)研究.同時(shí)引入ARIMA模型和單變量LSTM模型作為對(duì)照,以RMSE和MAPE為預(yù)測(cè)指標(biāo),系統(tǒng)性對(duì)比分析了各個(gè)預(yù)測(cè)模型.結(jié)果顯示:LSTM模型相較于經(jīng)典時(shí)序ARIMA模型,具有記憶功能和良好的非線性時(shí)間序列預(yù)測(cè)能力;相較于單變量LSTM模型,加入時(shí)間標(biāo)記指數(shù)的多變量LSTM神經(jīng)網(wǎng)絡(luò)模型在消費(fèi)者信心指數(shù)預(yù)測(cè)方面具有更好的預(yù)測(cè)性能和較強(qiáng)的泛化能力.
綜上所述,本文構(gòu)建的多變量LSTM模型能夠?qū)οM(fèi)者信心指數(shù)有較好的預(yù)測(cè),可以較為全面地掌握消費(fèi)者信心動(dòng)態(tài),為相關(guān)部門制定和實(shí)施政策措施提供有效參考.本文基于LSTM模型進(jìn)行預(yù)測(cè)時(shí),僅引入時(shí)間標(biāo)記指數(shù),之后可以引入更多的相關(guān)變量進(jìn)行繼續(xù)改進(jìn)和優(yōu)化,以期進(jìn)一步提高預(yù)測(cè)精度.