国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于投資混頻數(shù)據(jù)的中國(guó)經(jīng)濟(jì)波動(dòng)預(yù)測(cè)

2024-05-26 01:21:54岳金秀
統(tǒng)計(jì)與決策 2024年9期
關(guān)鍵詞:經(jīng)濟(jì)波動(dòng)誤差樣本

岳金秀,陳 堯

(湖北民族大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北 恩施 445000)

0 引言

一直以來(lái),經(jīng)濟(jì)波動(dòng)預(yù)測(cè)對(duì)國(guó)家制定經(jīng)濟(jì)政策和企業(yè)、部門采取相應(yīng)措施至關(guān)重要。而經(jīng)濟(jì)波動(dòng)與各宏觀經(jīng)濟(jì)指標(biāo)密不可分,其中,固定資產(chǎn)投資與經(jīng)濟(jì)增長(zhǎng)之間具有顯著的雙向影響關(guān)系[1]。在現(xiàn)代經(jīng)濟(jì)周期理論中,投資被認(rèn)為是導(dǎo)致經(jīng)濟(jì)波動(dòng)的主要原因。消費(fèi)需求基本保持比較平滑的變化,隨著國(guó)際競(jìng)爭(zhēng)日漸激烈,以及在擴(kuò)大內(nèi)需的大背景下,凈出口對(duì)經(jīng)濟(jì)的驅(qū)動(dòng)作用也在逐漸降低。因此,投資需求是對(duì)經(jīng)濟(jì)波動(dòng)影響較大的成分。投資的變動(dòng)將直接或間接影響經(jīng)濟(jì)波動(dòng):一方面,投資可以作為資本,直接使GDP增加;另一方面,投資還具有乘數(shù)效應(yīng),投資的獲利會(huì)刺激更多的投資,加速消費(fèi)的刺激作用,促進(jìn)居民消費(fèi)。

目前僅根據(jù)投資預(yù)測(cè)經(jīng)濟(jì)波動(dòng)的研究較少,只有少量文獻(xiàn)涉及相關(guān)內(nèi)容。如戴卓爾等(2023)[2]引入外商直接投資(FDI),基于“三駕馬車”對(duì)中國(guó)GDP 增長(zhǎng)率進(jìn)行預(yù)測(cè),發(fā)現(xiàn)引入FDI后不僅預(yù)測(cè)精度更高,而且實(shí)時(shí)預(yù)測(cè)也比未引入FDI的預(yù)測(cè)更精準(zhǔn)。潘雅茹和羅良文(2020)[3]實(shí)證檢驗(yàn)了固定資產(chǎn)投資對(duì)經(jīng)濟(jì)高質(zhì)量發(fā)展的推動(dòng)作用?,F(xiàn)有文獻(xiàn)已經(jīng)證實(shí)了投資與經(jīng)濟(jì)波動(dòng)之間有顯著的相關(guān)性?;诖?,本文從投資角度構(gòu)建中國(guó)的宏觀經(jīng)濟(jì)波動(dòng)預(yù)測(cè)指標(biāo)并進(jìn)行實(shí)證分析。隨著網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,使用網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行預(yù)測(cè)模型修正成為研究熱點(diǎn)。陳衛(wèi)華和徐國(guó)祥(2018)[4]利用股票論壇發(fā)帖數(shù)增長(zhǎng)率預(yù)測(cè)股票指數(shù)波動(dòng),發(fā)現(xiàn)股票論壇數(shù)據(jù)對(duì)預(yù)測(cè)精度的提高有所貢獻(xiàn)。徐映梅和高一銘(2017)[5]根據(jù)百度取詞構(gòu)建了高頻和低頻輿情指數(shù),提高了對(duì)CPI 的預(yù)測(cè)精度。Hochreiter 和Schmidhuber(1997)[6]從經(jīng)濟(jì)學(xué)角度給出了個(gè)體關(guān)注的定義,他認(rèn)為投資者對(duì)資源的認(rèn)知能力是有限的,個(gè)體在單位時(shí)間內(nèi)只能進(jìn)行有限的信息關(guān)注和處理。通常投資者更容易關(guān)注表現(xiàn)突出和自己感興趣的信息。投資者在單位時(shí)間內(nèi)的有限關(guān)注行為,體現(xiàn)了對(duì)當(dāng)前項(xiàng)目的關(guān)注。當(dāng)投資者通過(guò)網(wǎng)絡(luò)搜索行為產(chǎn)生了正向、積極的心理預(yù)期時(shí),就會(huì)轉(zhuǎn)化為投資決策。在整個(gè)過(guò)程中,網(wǎng)絡(luò)搜索數(shù)據(jù)起到了建議和修正的作用。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,長(zhǎng)短期記憶(Long-Short Time Memory,LSTM)神經(jīng)網(wǎng)絡(luò)模型因可以更好地學(xué)習(xí)時(shí)間序列之間的長(zhǎng)期依賴關(guān)系,開始被廣泛應(yīng)用于預(yù)測(cè)模型中。徐映梅和陳堯(2021)[7]將傳統(tǒng)的ARIMA模型與LSTM 模型在我國(guó)經(jīng)濟(jì)波動(dòng)預(yù)測(cè)上比較,發(fā)現(xiàn)LSTM 模型在預(yù)測(cè)復(fù)雜的非線性時(shí)間序列數(shù)據(jù)時(shí),能夠取得更好的效果。梁龍躍和陳玉霞(2023)[8]結(jié)合LSTM模型和小波分析對(duì)季度GDP進(jìn)行預(yù)測(cè),結(jié)果顯示,加入小波分析的LSTM 預(yù)測(cè)模型具有較好的泛化能力,預(yù)測(cè)精度更高。然而傳統(tǒng)的LSTM神經(jīng)網(wǎng)絡(luò)模型在處理混頻數(shù)據(jù)時(shí),模型的學(xué)習(xí)性能也會(huì)受到影響。對(duì)此,Neil 等(2016)[9]提出了一種改進(jìn)的長(zhǎng)短期記憶(Phased-LSTM)網(wǎng)絡(luò)模型,適用于處理異步混頻數(shù)據(jù)的建模。

綜上所述,宏觀經(jīng)濟(jì)波動(dòng)預(yù)測(cè)多采用傳統(tǒng)計(jì)量模型,使用混頻數(shù)據(jù)并利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行經(jīng)濟(jì)波動(dòng)預(yù)測(cè)的研究還比較少。本文旨在更好地利用高頻數(shù)據(jù)的原始信息,同時(shí)實(shí)現(xiàn)變量之間非線性關(guān)系的探討,構(gòu)建多源混頻LSTM模型(Multi Source Mixing LSTM,MM-LSTM),采用政府統(tǒng)計(jì)月度數(shù)據(jù)、網(wǎng)絡(luò)搜索日度數(shù)據(jù)以及GDP 季度數(shù)據(jù)多指標(biāo)聯(lián)合,從投資視角研究和預(yù)測(cè)宏觀經(jīng)濟(jì)波動(dòng)。為了驗(yàn)證本文提出的混頻數(shù)據(jù)預(yù)測(cè)宏觀經(jīng)濟(jì)波動(dòng)的有效性,以及構(gòu)建的MM-LSTM 模型的預(yù)測(cè)效果,將其與傳統(tǒng)的AR模型、MIDAS模型進(jìn)行對(duì)比研究,以評(píng)估不同數(shù)據(jù)以及不同方法的研究結(jié)果。

1 研究設(shè)計(jì)

1.1 統(tǒng)計(jì)數(shù)據(jù)收集與處理

本文基于《中國(guó)統(tǒng)計(jì)年鑒》中公布的相關(guān)數(shù)據(jù),同時(shí)參考與投資相關(guān)的文獻(xiàn),并且兼顧數(shù)據(jù)的可得性,初步挑選出10個(gè)候選指標(biāo)。包括工業(yè)增加值累計(jì)增長(zhǎng)率[10]、發(fā)電量累計(jì)增長(zhǎng)率[11]、房地產(chǎn)投資累計(jì)增長(zhǎng)率[12]、制造業(yè)采購(gòu)經(jīng)理指數(shù)(PMI 指數(shù))[13]、固定資產(chǎn)投資額累計(jì)增長(zhǎng)率[14]等。收集并整理得到上述10 個(gè)指標(biāo)2011 年1 月至2022 年12 月的月度統(tǒng)計(jì)數(shù)據(jù),并收集整理2011—2022 年國(guó)內(nèi)生產(chǎn)總值指數(shù)累計(jì)值(上年同期=100)季度數(shù)據(jù)。對(duì)于政府統(tǒng)計(jì)數(shù)據(jù),進(jìn)行如下處理:

(1)GDP增長(zhǎng)率的構(gòu)建。本文選用反映一定時(shí)期內(nèi)國(guó)內(nèi)生產(chǎn)總值變動(dòng)趨勢(shì)的國(guó)內(nèi)生產(chǎn)總值指數(shù)累計(jì)值(上年同期=100)作為預(yù)測(cè)變量。為了消除各指標(biāo)間的數(shù)量差異,把國(guó)內(nèi)生產(chǎn)總值指數(shù)累計(jì)值(上年同期=100)數(shù)據(jù)轉(zhuǎn)換為增長(zhǎng)率,即GDP 增長(zhǎng)率=國(guó)內(nèi)生產(chǎn)總值指數(shù)累計(jì)值(上年同期=100)-100,記為GDP_IG。

(2)缺失數(shù)據(jù)處理。根據(jù)官方公布的數(shù)據(jù),工業(yè)增加值累計(jì)增長(zhǎng)率、固定資產(chǎn)投資額累計(jì)增長(zhǎng)率、水泥產(chǎn)量累計(jì)增長(zhǎng)率等指標(biāo)缺少各年份1月的數(shù)據(jù),為了數(shù)據(jù)的連續(xù)性,取2月和3月的均值補(bǔ)全1月的數(shù)據(jù)。

(3)投資統(tǒng)計(jì)指標(biāo)篩選。計(jì)算各指標(biāo)數(shù)據(jù)與GDP_IG的皮爾遜相關(guān)系數(shù),篩選出與經(jīng)濟(jì)波動(dòng)相關(guān)性較高的8個(gè)指標(biāo),結(jié)果如表1所示。

(4)投資統(tǒng)計(jì)指數(shù)的構(gòu)建。前文統(tǒng)計(jì)指標(biāo)篩選已經(jīng)確定了各指標(biāo)與因變量的強(qiáng)相關(guān)關(guān)系。但皮爾遜相關(guān)系數(shù)只能衡量?jī)蓚€(gè)變量間的線性關(guān)系,而隨機(jī)森林算法可以有效處理非線性數(shù)據(jù),因此采用隨機(jī)森林算法計(jì)算各指標(biāo)的權(quán)重。利用Python中Sklearn機(jī)器學(xué)習(xí)庫(kù)建立隨機(jī)森林回歸模型,得到各特征的重要性得分。模型輸出特征的重要性得分如表2 所示。把每個(gè)特征的重要性得分作為每個(gè)特征的權(quán)重系數(shù),合成一個(gè)月度時(shí)間序列,記為投資統(tǒng)計(jì)指數(shù)(Investment Statistics Index,ISI)。

表2 各特征重要性得分

1.2 網(wǎng)絡(luò)搜索數(shù)據(jù)指標(biāo)收集及處理

本文選用百度指數(shù)[15]作為網(wǎng)絡(luò)搜索指數(shù)的代表。百度指數(shù)的計(jì)算是以網(wǎng)民的搜索量為基礎(chǔ),以關(guān)鍵詞為統(tǒng)計(jì)對(duì)象。關(guān)鍵詞的選取是合成投資網(wǎng)絡(luò)搜索指數(shù)的重要內(nèi)容。本文選取“投資”作為關(guān)鍵詞,利用文本檢索和篩選,在中國(guó)知網(wǎng)檢索CSSCI期刊,得到5389條記錄。下載這些文獻(xiàn),然后利用中文分詞技術(shù)對(duì)標(biāo)題進(jìn)行分詞,篩選出“投資”“創(chuàng)新”“經(jīng)濟(jì)”等100個(gè)關(guān)鍵詞作為候選關(guān)鍵詞。同時(shí)利用百度指數(shù)需求圖譜相關(guān)詞推薦功能,搜集并整理得到2011 年1 月1 日至2022 年12 月31 日與“投資”“房產(chǎn)”“固定資產(chǎn)”等相關(guān)的28 個(gè)關(guān)鍵詞,將其加入候選關(guān)鍵詞中。另外,根據(jù)經(jīng)驗(yàn)取詞,選取“發(fā)電量”“金融”“GDP”等8 個(gè)關(guān)鍵詞加入候選關(guān)鍵詞中。選取的關(guān)鍵詞還需被百度指數(shù)收錄,因此剔除沒有被收錄的詞,最終整理得到108 個(gè)關(guān)鍵詞的實(shí)時(shí)搜索量數(shù)據(jù)集。對(duì)于投資網(wǎng)絡(luò)搜索數(shù)據(jù),數(shù)據(jù)處理過(guò)程如下:

(1)數(shù)據(jù)預(yù)處理。百度指數(shù)數(shù)據(jù)是以日為頻率的時(shí)間序列,但每月天數(shù)并不相等,將日度數(shù)據(jù)換算成月度、季度等時(shí)間序列會(huì)產(chǎn)生誤差和波動(dòng)。因此,本文參照徐映梅和高一銘(2017)[5]的方法,將各月份轉(zhuǎn)化為相同的天數(shù)。即刪除2月29日及5月、7月、8月、10月、12月中每月31日的數(shù)據(jù),把1月最后一天的數(shù)據(jù)作為2月第一天的數(shù)據(jù),把3月1日的數(shù)據(jù)作為2月最后一天的數(shù)據(jù)。處理后,每年和每月的天數(shù)相等。即每月30天,每年均為360天。

(2)消除網(wǎng)絡(luò)發(fā)展趨勢(shì)。網(wǎng)絡(luò)搜索數(shù)據(jù)不但會(huì)受到網(wǎng)民關(guān)注的影響,而且會(huì)受到互聯(lián)網(wǎng)發(fā)展的影響,例如2013年智能手機(jī)的逐漸普及,致使手機(jī)客戶端搜索數(shù)量增加。因此,在數(shù)據(jù)分析之前還需消除網(wǎng)絡(luò)發(fā)展對(duì)搜索量波動(dòng)的影響。借鑒徐映梅和高一銘(2017)[5]的方法,采用與投資關(guān)鍵詞相關(guān)性較低的中性詞來(lái)消除網(wǎng)絡(luò)社會(huì)發(fā)展對(duì)搜索量的影響。

其中,anum為關(guān)鍵詞搜索量數(shù)據(jù),bnum為中性詞“百度”的搜索量數(shù)據(jù),Anew為處理后的搜索量數(shù)據(jù),記為搜索熱度數(shù)據(jù)。為了防止取對(duì)數(shù)時(shí)出現(xiàn)異常,對(duì)所有搜索量值進(jìn)行加1的平移處理。

(3)篩選核心關(guān)鍵詞。獲得各關(guān)鍵詞的搜索熱度數(shù)據(jù)后,利用時(shí)差相關(guān)分析,求出關(guān)鍵詞搜索熱度序列和房地產(chǎn)投資累計(jì)增長(zhǎng)率的時(shí)差和相關(guān)系數(shù),進(jìn)一步篩選重要的關(guān)鍵詞①根據(jù)各關(guān)鍵詞搜索熱度序列與選取的8個(gè)政府統(tǒng)計(jì)指標(biāo)選擇最優(yōu)時(shí)差相關(guān)分析結(jié)果確定。。利用Python軟件編程計(jì)算,最終選取23個(gè)相關(guān)性大于0.5的關(guān)鍵詞,其中,相同時(shí)差的關(guān)鍵詞有18個(gè),具有領(lǐng)先和滯后階數(shù)的關(guān)鍵詞有5個(gè),將他們調(diào)整為相同時(shí)差。這23個(gè)關(guān)鍵詞將用于投資網(wǎng)絡(luò)搜索指數(shù)的合成。選取關(guān)鍵詞的時(shí)差階數(shù)和最大相關(guān)系數(shù)如表3所示。

表3 投資網(wǎng)絡(luò)搜索指數(shù)關(guān)鍵詞

(4)投資網(wǎng)絡(luò)搜索指數(shù)的構(gòu)建。由于選取的關(guān)鍵詞數(shù)量較多且部分關(guān)鍵詞序列存在較強(qiáng)的相關(guān)性,因此本文利用因子分析法,使用少數(shù)的幾個(gè)變量來(lái)解釋眾多變量,達(dá)到降維的目的,同時(shí)又保持較高的解釋力。在對(duì)關(guān)鍵詞序列進(jìn)行因子分析之前,需要進(jìn)行KMO 值和Bartlett 球形度檢驗(yàn),檢驗(yàn)結(jié)果中KMO值為0.96>0.6,Bartlett球形度檢驗(yàn)的P值小于0.05,兩個(gè)檢驗(yàn)均通過(guò)。利用SPSS分析軟件進(jìn)行因子分析,前兩個(gè)因子的累計(jì)方差貢獻(xiàn)率為85.15%。其中,因子1在商務(wù)部、長(zhǎng)期投資、發(fā)改委、服務(wù)業(yè)、管理者等12 個(gè)成分上有較大載荷,這些關(guān)鍵詞主要體現(xiàn)了投資者對(duì)實(shí)體投資的關(guān)注。因子2 在理財(cái)、投資公司、風(fēng)險(xiǎn)投資、融資等11個(gè)成分上有較大載荷,這些關(guān)鍵詞大部分反映了投資者對(duì)金融投資的關(guān)注。

(5)合成投資網(wǎng)絡(luò)搜索指數(shù)。首先將各因子的成分得分系數(shù)作為關(guān)鍵詞的權(quán)重系數(shù),合成兩個(gè)因子的月度數(shù)據(jù)。然后以兩個(gè)因子的月度數(shù)據(jù)為特征,以房地產(chǎn)投資累計(jì)增長(zhǎng)率月度數(shù)據(jù)為目標(biāo)變量,利用Python建立隨機(jī)森林回歸模型,得到兩個(gè)因子的特征重要性。模型輸出特征的重要性如表4 所示。最后把每個(gè)特征因子的重要性得分作為每個(gè)特征的權(quán)重系數(shù),合成了月度投資網(wǎng)絡(luò)搜索指數(shù)(Investment Network Search Index,INSI)。

表4 各因子重要性得分

1.3 模型建立

LSTM 模型最早由Hochreiter 和Schmidhuber 在1997年提出。由于能更好地記憶時(shí)間序列的長(zhǎng)期依賴關(guān)系,因此被廣泛用于處理序列信息。Phased-LSTM 模型是在基礎(chǔ)模型上添加了新的時(shí)間門kt來(lái)擴(kuò)展LSTM,該門的開啟和關(guān)閉由具有一定頻率范圍的參數(shù)振蕩控制。模型結(jié)構(gòu)如圖1所示,原文中的定義公式如下:

圖1 MM-LSTM模型結(jié)構(gòu)

其中,it、ft、ot分別為輸入門、遺忘門、輸出門的計(jì)算公式;°表示矩陣按元素相乘運(yùn)算;xt和ht分別為輸入特征向量和隱藏輸出向量;σi、σf、σo、σc為激活函數(shù);σh與權(quán)重矩陣W連接不同的輸入門和記憶單元的輸出;b為偏置項(xiàng),是模型訓(xùn)練時(shí)要學(xué)習(xí)的參數(shù)。

與傳統(tǒng)的LSTM 模型相比,Phased-LSTM 模型的更新可以在不規(guī)則的時(shí)間點(diǎn)tj上執(zhí)行。本文用簡(jiǎn)寫的cj=ctj表示儲(chǔ)存記憶單元在tj時(shí)刻的狀態(tài),用cj-1表示儲(chǔ)存記憶單元先前tj-1時(shí)刻的狀態(tài),則式(2)中ct和ht更新的方程為:

其中,cj只有在時(shí)間門打開的時(shí)候才允許更新,從而實(shí)現(xiàn)一個(gè)周期的一部分區(qū)間產(chǎn)生儲(chǔ)存記憶單元的更新,這使得模型具備了處理不同頻率數(shù)據(jù)的能力。本文合成的INSI為日度數(shù)據(jù),ISI為月度數(shù)據(jù),GDP_IG為季度數(shù)據(jù),不同的模型需要的數(shù)據(jù)和數(shù)據(jù)頻率存在差異。AR 模型僅利用GDP_IG自身的滯后性建模。MIDAS 模型雖然可以用多元高頻數(shù)據(jù)來(lái)預(yù)測(cè)低頻數(shù)據(jù),但多元高頻數(shù)據(jù)由于倍差較大,需要調(diào)整為同頻的,本文把INSI降頻為月度數(shù)據(jù),記為INSI_M。MM-LSTM 模型能直接利用月度數(shù)據(jù)、日度數(shù)據(jù)對(duì)季度數(shù)據(jù)進(jìn)行預(yù)測(cè),有效地利用了混頻數(shù)據(jù)的信息。

2 實(shí)證研究

2.1 基于AR模型的實(shí)證

AR 模型通過(guò)利用時(shí)間序列自身的滯后性,對(duì)未來(lái)指標(biāo)的變動(dòng)進(jìn)行預(yù)測(cè)。利用該模型進(jìn)行時(shí)間序列分析時(shí),需要檢驗(yàn)被研究的序列是否為平穩(wěn)序列,以防止偽回歸。本文采用EViews 10.0 對(duì)GDP_IG數(shù)據(jù)進(jìn)行建模,根據(jù)AIC與SC 準(zhǔn)則,其中添加截距項(xiàng)的未進(jìn)行差分的序列通過(guò)平穩(wěn)性檢驗(yàn),拒絕了存在單位根的原假設(shè),序列平穩(wěn)。同時(shí),根據(jù)序列的自相關(guān)圖和偏自相關(guān)圖(圖略)可知,自相關(guān)圖呈現(xiàn)拖尾特征,偏自相關(guān)圖呈現(xiàn)一階截尾特征,因此應(yīng)建立AR 模型。通過(guò)各種模型參數(shù)建模比較,根據(jù)AIC、SC、HQ值和回歸方程各系數(shù)的顯著性,最終確定應(yīng)建立添加截距項(xiàng)的AR(1)模型。為了進(jìn)行擴(kuò)展預(yù)測(cè),將樣本內(nèi)估計(jì)區(qū)間設(shè)置為2011 年第一季度至2020 年第四季度,樣本外預(yù)測(cè)區(qū)間擴(kuò)展到2022年第四季度①本文采用靜態(tài)預(yù)測(cè),每次向前預(yù)測(cè)一個(gè)數(shù)據(jù),并且假設(shè)上一期的預(yù)測(cè)值等于真實(shí)值。。其中,樣本內(nèi)均方根誤差為2.139,樣本外均方根誤差為5.708。

2.2 基于AR-MIDAS模型的實(shí)證

MIDAS 模型最初是由Ghysels 等在2004 年提出的,MIDAS 模型的顯著特點(diǎn)是可以直接使用不同頻率的數(shù)據(jù)進(jìn)行建模。基礎(chǔ)的MIDAS模型主要包括單變量和多變量MIDAS模型,以及加入自回歸項(xiàng)的AR-MIDAS模型和h步向前預(yù)測(cè)的MIDAS 模型。因宏觀經(jīng)濟(jì)運(yùn)行的慣性作用,經(jīng)濟(jì)時(shí)間序列普遍存在自相關(guān)性,因變量的若干期會(huì)對(duì)當(dāng)期產(chǎn)生影響,因此此處采用含有自回歸的AR-MIDAS 模型。為了研究不同類型數(shù)據(jù)和不同MIDAS 模型預(yù)測(cè)差異,本文分別使用ISI和INSI_M數(shù)據(jù)建立單因素AR-MIDAS 模型,并同時(shí)使用以上兩類數(shù)據(jù)建立雙因素AR-MIDAS模型進(jìn)行對(duì)比研究。

前文基于AR 模型的分析已經(jīng)討論了GDP_IG的滯后階數(shù),這里直接令A(yù)R-MIDAS模型的自回歸項(xiàng)滯后階數(shù)p=1。利用EViews 軟件建模時(shí),還需要確定高頻回歸器抽取的樣本數(shù)和高頻數(shù)據(jù)的滯后階數(shù)。本文選取阿爾蒙多項(xiàng)式,軟件可以根據(jù)AIC準(zhǔn)則自動(dòng)尋找高頻回歸器的最佳滯后階數(shù),這里最大滯后階數(shù)設(shè)置為12,即高頻回歸器最多使用前12 個(gè)月的數(shù)據(jù)來(lái)擬合當(dāng)前的GDP_IG數(shù)據(jù)。關(guān)于滯后階數(shù)的選擇,通過(guò)各種模型建模比較,根據(jù)回歸方程各系數(shù)的顯著性和樣本區(qū)間內(nèi)外的預(yù)測(cè)誤差等參數(shù)最終確定。根據(jù)ISI建模得到的模型為AR(1)-MIDAS(4,2),模型的擬合優(yōu)度為0.976,樣本內(nèi)均方根誤差為0.910,樣本外均方根誤差為1.243。根據(jù)INSI_M建模得到的模型為AR(1)-MIDAS(3,0),樣本內(nèi)均方根誤差為2.332,樣本外均方根誤差為5.350。結(jié)合ISI、INSI_M構(gòu)建AR-MIDAS模型,為了保證各模型擬合效果和預(yù)測(cè)結(jié)果具有可比性,此處直接引用上述單因素AR-MIDAS建模的各種參數(shù)設(shè)置進(jìn)行建模,記為AR(1)-MIDAS_tn。模型的樣本內(nèi)均方根誤差為0.763,樣本外均方根誤差為1.212,其樣本內(nèi)外預(yù)測(cè)誤差與單因素AR-MIDAS 模型相比均有所降低。

2.3 基于MM-LSTM模型的實(shí)證

通過(guò)上述AR模型、MIDAS模型可知,合成的ISI、INSI數(shù)據(jù)可以用于中國(guó)經(jīng)濟(jì)波動(dòng)預(yù)測(cè),這使得構(gòu)建的MM-LSTM 模型具有理論基礎(chǔ)。由于GDP_IG與ISI和INSI數(shù)據(jù)存在較大差異,對(duì)模型進(jìn)行訓(xùn)練和測(cè)試之前,先對(duì)數(shù)據(jù)進(jìn)行歸一化處理。歸一化公式如下:

其中,xi表示序列X中的第i個(gè)值,max(X)、min(X)分別表示序列X的最大值、最小值。與前面模型的樣本內(nèi)區(qū)間和樣本外區(qū)間設(shè)置相同,2011—2020 年的數(shù)據(jù)作為訓(xùn)練集,2021—2022年的數(shù)據(jù)作為測(cè)試集。

(1)MM-LSTM模型參數(shù)設(shè)置

通過(guò)設(shè)置合適的參數(shù),可以獲得良好的深度學(xué)習(xí)性能,本文的目標(biāo)是預(yù)測(cè)經(jīng)濟(jì)波動(dòng),故選用均方根誤差(RMSE)作為損失函數(shù)。優(yōu)化器方面,本文采用Adam 優(yōu)化器進(jìn)行優(yōu)化訓(xùn)練。Adam 優(yōu)化器是目前最常用的算法,與其他優(yōu)化器相比,Adam算法收斂速度最快,學(xué)習(xí)效率更高。各網(wǎng)絡(luò)層的激活函數(shù)均采用ReLu 函數(shù),模型的最后一層采用線性linear 函數(shù)。為防止出現(xiàn)過(guò)擬合現(xiàn)象,對(duì)INSI數(shù)據(jù)設(shè)置Dropout層,網(wǎng)絡(luò)節(jié)點(diǎn)的舍棄率設(shè)為0.2。

(2)MM-LSTM模型實(shí)證

為了與上文的MIDAS 模型進(jìn)行對(duì)比研究,分別使用ISI、使用INSI以及同時(shí)使用ISI和INSI數(shù)據(jù)分開建模。三種模型分別記為MM-LSTM_t、MM-LSTM_n、MM-LSTM_tn。反復(fù)修改參數(shù)后,根據(jù)模型的訓(xùn)練集誤差和測(cè)試集誤差得到最優(yōu)參數(shù)設(shè)置值,見表5。

表5 最優(yōu)參數(shù)設(shè)置

表5 中,n_test表示測(cè)試集使用的月份數(shù),epochs和batch_size分別代表模型訓(xùn)練時(shí)的迭代次數(shù)和一次訓(xùn)練所取的樣本數(shù),nodes代表隱藏神經(jīng)元個(gè)數(shù),month_t和month_p分別代表訓(xùn)練時(shí)使用當(dāng)季和上一季的月份數(shù)量,gdp_p代表GDP_IG數(shù)據(jù)的滯后期數(shù)。以MM-LSTM_t模型為例,從表5 中的結(jié)果來(lái)看,其在預(yù)測(cè)當(dāng)季的GDP_IG時(shí),使用當(dāng)季三個(gè)月和上季最后一個(gè)月的數(shù)據(jù)將取得相對(duì)較好的結(jié)果。

根據(jù)表5 還可以發(fā)現(xiàn),使用ISI數(shù)據(jù)建立的模型訓(xùn)練集、測(cè)試集誤差與使用INSI數(shù)據(jù)建立的模型誤差都相對(duì)較小,這與MIDAS 模型的結(jié)果一致。原因可能是,ISI數(shù)據(jù)是由各宏觀經(jīng)濟(jì)指標(biāo)合成的,與經(jīng)濟(jì)波動(dòng)直接相關(guān);而INSI數(shù)據(jù)是根據(jù)與投資相關(guān)指標(biāo)的搜索數(shù)據(jù)建立的聯(lián)系,具有一定的不確定性。

由上述結(jié)果可知,使用混頻數(shù)據(jù)的MM-LSTM模型訓(xùn)練集和預(yù)測(cè)集誤差都最小。為了驗(yàn)證該模型是否具有提前預(yù)測(cè)GDP_IG數(shù)據(jù)的功能,將模型參數(shù)month_t分別設(shè)置為1、2、3。通過(guò)調(diào)整表5中其他參數(shù)得到模型的訓(xùn)練和測(cè)試誤差,如表6所示。

表6 MM-LSTM_tn模型訓(xùn)練和預(yù)測(cè)誤差比較

表6中,30+1表示使用每季度前30天的INSI數(shù)據(jù)和1 個(gè)月的ISI數(shù)據(jù)預(yù)測(cè)該季度的GDP_IG數(shù)據(jù)。對(duì)比發(fā)現(xiàn),僅使用當(dāng)季前30天和1個(gè)月數(shù)據(jù)就可以比國(guó)家統(tǒng)計(jì)局提前約60天預(yù)測(cè)該GDP_IG數(shù)據(jù)。而使用當(dāng)季前60天和2 個(gè)月數(shù)據(jù)預(yù)測(cè)時(shí)其預(yù)測(cè)結(jié)果與AR-MIDAS 模型精度相當(dāng),但其可提前30天預(yù)測(cè)該GDP_IG數(shù)據(jù)。因此,可以利用這一預(yù)測(cè)的先行性,為政府部門制定經(jīng)濟(jì)政策提供決策依據(jù)。

3 模型預(yù)測(cè)效果評(píng)估

3.1 各模型預(yù)測(cè)性能比較

利用實(shí)證分析部分各模型的估計(jì)結(jié)果,計(jì)算各模型樣本內(nèi)擬合誤差和樣本外預(yù)測(cè)誤差,如表7所示。

表7 各模型樣本內(nèi)外預(yù)測(cè)性能比較

第一,根據(jù)投資合成的INSI和ISI數(shù)據(jù)與GDP_IG序列之間存在正向關(guān)系,說(shuō)明自2011年以來(lái),較高的投資率是引起經(jīng)濟(jì)波動(dòng)的重要因素,若想經(jīng)濟(jì)有較大的波動(dòng),則需要用適度的投資刺激我國(guó)經(jīng)濟(jì),但同時(shí)應(yīng)警惕過(guò)高的投資率所帶來(lái)的GDP大幅度波動(dòng)。

第二,從所有模型的估計(jì)結(jié)果來(lái)看,MIDAS 模型與MM-LSTM模型比僅利用GDP_IG數(shù)據(jù)的AR模型預(yù)測(cè)效果有所提高,說(shuō)明本文合成的投資統(tǒng)計(jì)指數(shù)和投資網(wǎng)絡(luò)搜索指數(shù)對(duì)中國(guó)經(jīng)濟(jì)波動(dòng)的預(yù)測(cè)具有優(yōu)化作用。其中,投資統(tǒng)計(jì)指數(shù)數(shù)據(jù)對(duì)經(jīng)濟(jì)波動(dòng)的預(yù)測(cè)優(yōu)化效果更好。但綜合來(lái)看,預(yù)測(cè)經(jīng)濟(jì)波動(dòng)取得了最好的效果。

第三,從使用混頻數(shù)據(jù)估計(jì)結(jié)果來(lái)看,MM-LSTM 模型的樣本內(nèi)擬合誤差和樣本外預(yù)測(cè)誤差比AR(1)-MIDAS模型的預(yù)測(cè)精度分別提高了3.5和38.4個(gè)百分點(diǎn)。究其原因,AR(1)-MIDAS 模型直接使用了月度投資統(tǒng)計(jì)指數(shù)數(shù)據(jù),但把日度投資網(wǎng)絡(luò)搜索指數(shù)數(shù)據(jù)降頻為月度數(shù)據(jù);而MM-LSTM 模型直接使用了月度數(shù)據(jù)和日度數(shù)據(jù)。這說(shuō)明MM-LSTM模型更為有效地利用了樣本信息,得到了更加精確的預(yù)測(cè)結(jié)果,同時(shí)也說(shuō)明了MM-LSTM模型可以更好地?cái)M合我國(guó)宏觀經(jīng)濟(jì)波動(dòng)。

第四,從使用投資網(wǎng)絡(luò)搜索指數(shù)數(shù)據(jù)來(lái)看,MIDAS 模型和MM-LSTM模型在添加了投資網(wǎng)絡(luò)搜索指數(shù)數(shù)據(jù)后,樣本外預(yù)測(cè)誤差分別比僅使用投資統(tǒng)計(jì)數(shù)據(jù)的樣本外預(yù)測(cè)誤差降低了3.1和52.2個(gè)百分點(diǎn)。這說(shuō)明本文添加網(wǎng)絡(luò)搜索數(shù)據(jù)提高了模型的估計(jì)精度?;谶@一特點(diǎn),本文認(rèn)為網(wǎng)絡(luò)搜索數(shù)據(jù)作為反映用戶關(guān)注變化的即時(shí)指標(biāo),為傳統(tǒng)的監(jiān)測(cè)方法提供了有效補(bǔ)充,可以用來(lái)預(yù)測(cè)經(jīng)濟(jì)波動(dòng)。

綜上,從MM-LSTM模型和對(duì)比模型對(duì)中國(guó)宏觀經(jīng)濟(jì)波動(dòng)的預(yù)測(cè)結(jié)果可以看出,MM-LSTM 模型在中國(guó)宏觀經(jīng)濟(jì)波動(dòng)預(yù)測(cè)中的有效性得到了證實(shí)。

3.2 模型預(yù)測(cè)結(jié)果比較

從圖2 來(lái)看,AR 模型對(duì)GDP_IG的估計(jì)結(jié)果類似于將原始值往后平移1 期,當(dāng)GDP_IG出現(xiàn)較大波動(dòng)時(shí),不能及時(shí)預(yù)測(cè)。例如,2020年第一季度、2021年第一季度和2022年第二季度,預(yù)測(cè)結(jié)果出現(xiàn)了很大偏差。從下頁(yè)圖3來(lái)看,與AR模型相比,加入投資統(tǒng)計(jì)、網(wǎng)絡(luò)搜索指數(shù)數(shù)據(jù)后,AR(1)-MIDAS-tn模型準(zhǔn)確預(yù)測(cè)了2020年第一季度、2021 年第一季度和2022 年第二季度的波動(dòng),同時(shí)樣本外短期預(yù)測(cè)效果較好,但2022 年第二季度波動(dòng)預(yù)測(cè)誤差較大。從下頁(yè)圖4 來(lái)看,MM-LSTM_tn 模型短期預(yù)測(cè)比MIDAS 模型更加準(zhǔn)確,中期預(yù)測(cè)誤差也相對(duì)較小,這說(shuō)明本文提出的MM-LSTM 模型提高了樣本外短期和中期的預(yù)測(cè)精度。

圖2 AR模型樣本內(nèi)擬合和樣本外預(yù)測(cè)結(jié)果對(duì)比

圖3 AR(1)-MIDAS_tn模型樣本內(nèi)擬合和樣本外預(yù)測(cè)結(jié)果對(duì)比

圖4 MM-LSTM_tn模型樣本內(nèi)擬合和樣本外預(yù)測(cè)結(jié)果對(duì)比

4 結(jié)論

實(shí)時(shí)、準(zhǔn)確地預(yù)測(cè)我國(guó)經(jīng)濟(jì)波動(dòng)是宏觀經(jīng)濟(jì)研究中的重要課題。本文從宏觀和微觀兩個(gè)層面分析了投資對(duì)中國(guó)經(jīng)濟(jì)增長(zhǎng)的影響??紤]到宏觀經(jīng)濟(jì)指標(biāo)間并不都是同頻數(shù)據(jù),以及大量的網(wǎng)絡(luò)搜索數(shù)據(jù)的有效性已得到學(xué)者們證實(shí),本文構(gòu)建了能夠利用季度數(shù)據(jù)、月度數(shù)據(jù)和日度數(shù)據(jù)的多源MM-LSTM 模型。通過(guò)選擇國(guó)內(nèi)生產(chǎn)總值指數(shù)累計(jì)值(上年同期=100)數(shù)據(jù)和月度統(tǒng)計(jì)指標(biāo)與網(wǎng)絡(luò)搜索日度指標(biāo),本文從投資角度對(duì)我國(guó)2011年1月1日至2022年12月31日的經(jīng)濟(jì)波動(dòng)進(jìn)行了實(shí)證分析。本文的主要結(jié)論如下:

(1)投資相關(guān)指標(biāo)與我國(guó)GDP_IG之間存在正向關(guān)系。加入投資統(tǒng)計(jì)指數(shù)或投資網(wǎng)絡(luò)搜索指數(shù)的兩種模型比基準(zhǔn)模型的預(yù)測(cè)誤差更小。這說(shuō)明了用投資指標(biāo)預(yù)測(cè)我國(guó)經(jīng)濟(jì)波動(dòng)的可行性。

(2)添加投資網(wǎng)絡(luò)搜索數(shù)據(jù)提高了模型的估計(jì)精度。MIDAS 模型和MM-LSTM 模型在加入投資網(wǎng)絡(luò)搜索指數(shù)后,樣本外預(yù)測(cè)誤差分別降低了3.1和52.2個(gè)百分點(diǎn),說(shuō)明網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)經(jīng)濟(jì)預(yù)測(cè)具有積極影響。

(3)MM-LSTM 模型具有更小的預(yù)測(cè)誤差,提高了短期和中期的預(yù)測(cè)精度。本文構(gòu)建的MM-LSTM 模型充分利用了混頻數(shù)據(jù)的信息,與AR 模型、MIDAS 模型的最優(yōu)結(jié)果相比,能夠使樣本內(nèi)擬合誤差降低3.5個(gè)百分點(diǎn),樣本外預(yù)測(cè)誤差降低38.4 個(gè)百分點(diǎn),并且準(zhǔn)確預(yù)測(cè)了2020 年第一季度、2021 年第一季度、2022 年第二季度的波動(dòng),從而驗(yàn)證了模型的有效性。

(4)本文利用混頻數(shù)據(jù)構(gòu)建MM-LSTM模型對(duì)經(jīng)濟(jì)波動(dòng)進(jìn)行預(yù)測(cè)時(shí),僅使用當(dāng)季前30天和1個(gè)月數(shù)據(jù)就可以比國(guó)家統(tǒng)計(jì)局提前約60 天預(yù)測(cè)該季度GDP_IG數(shù)據(jù),其預(yù)測(cè)精度高于AR模型。而使用當(dāng)季前60天和2個(gè)月數(shù)據(jù)預(yù)測(cè)時(shí),其預(yù)測(cè)結(jié)果與AR-MIDAS 模型精度相當(dāng),但其預(yù)測(cè)結(jié)果可提前30天預(yù)測(cè)該季度GDP_IG數(shù)據(jù)。可以利用這一預(yù)測(cè)的先行性,為政府部門制定經(jīng)濟(jì)政策提供決策依據(jù)。

猜你喜歡
經(jīng)濟(jì)波動(dòng)誤差樣本
用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
角接觸球軸承接觸角誤差控制
哈爾濱軸承(2020年2期)2020-11-06 09:22:26
Beidou, le système de navigation par satellite compatible et interopérable
壓力容器制造誤差探究
推動(dòng)醫(yī)改的“直銷樣本”
隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
關(guān)于總供給的理論探討
商情(2016年39期)2016-11-21 08:47:25
房地產(chǎn)經(jīng)濟(jì)波動(dòng)的影響因素及對(duì)策
淺析產(chǎn)業(yè)結(jié)構(gòu)與經(jīng)濟(jì)波動(dòng)之間的關(guān)系
金融沖擊和中國(guó)經(jīng)濟(jì)波動(dòng)研究
商情(2016年11期)2016-04-15 20:02:31
宾川县| 天祝| 武清区| 仁布县| 永安市| 乐亭县| 佛冈县| 新闻| 东平县| 西畴县| 若羌县| 南靖县| 凌云县| 类乌齐县| 曲靖市| 东兰县| 平南县| 紫金县| 长垣县| 灌云县| 永年县| 吴旗县| 雷波县| 宜州市| 昆明市| 响水县| 大关县| 云和县| 莆田市| 唐河县| 讷河市| 西吉县| 宜阳县| 伽师县| 菏泽市| 永德县| 集贤县| 云霄县| 汪清县| 青铜峡市| 江达县|