李立天,鄭曉燕,薛忠賢,張雨濃,邱斌斌
(1.中山大學計算機學院,廣東 廣州 510006; 2.中山大學人工智能學院,廣東 珠海 519082)
政府債務(wù)也叫國債,是指國家按照一定的債務(wù)發(fā)行規(guī)則向社會發(fā)行的債務(wù),當政府的財政收入不足以償還財政支出時,可以通過發(fā)行債務(wù)來平衡收支[1]。日本中央政府債務(wù)發(fā)行的規(guī)模,在一定程度上能夠反映中央政府的財政狀況。在過去的20年里,日本國債總額出現(xiàn)了大幅度增加,從1996年6月的334.130 9萬億日元增長到了2016年12月的1 066.423 4萬億日元。日本財務(wù)省官網(wǎng)公布的數(shù)據(jù)顯示,截至2020年6月底,國債總額已經(jīng)達到1 159.028 9萬億日元[2]。日本國債和國民生產(chǎn)總值(GDP,gross domestic product)的比值已經(jīng)明顯高于其他發(fā)達國家,2018年該比例達到239%,這一數(shù)字遠遠高于在歐債危機蔓延時期發(fā)生債務(wù)危機的五國[2-3]。為了預估未來的財政風險并協(xié)助日本中央政府制定更好的財政政策,需要對日本國債的規(guī)模進行預測。
由于日本國債可參考的樣本數(shù)據(jù)較少,同時影響日本國債的因素也較為復雜,所以使用傳統(tǒng)的數(shù)據(jù)建模方式對其進行預測是不合適的。如使用BP神經(jīng)網(wǎng)絡(luò)[4-5]、RBF神經(jīng)網(wǎng)絡(luò)[6]和最小二乘法[7]進行預測,其要求更加多的訓練數(shù)據(jù)才會有很好的預測結(jié)果。為了較好地對未來日本國債規(guī)模進行預測,研究中使用了權(quán)值和結(jié)構(gòu)確定(WASD,weights and structure determination)算法訓練切比雪夫神經(jīng)網(wǎng)絡(luò)[8-9],并利用訓練效果最好的WASD神經(jīng)網(wǎng)絡(luò)對日本國債規(guī)模進行了短期的預測。從2017年3月—2020年6月一共14個季度的預測結(jié)果與日本財務(wù)省官方公布數(shù)據(jù)的最大相對誤差僅為3.96%,說明WASD神經(jīng)網(wǎng)絡(luò)的預測性能良好并且此方法有效。在此基礎(chǔ)上,利用預測性能最好的神經(jīng)網(wǎng)絡(luò)對2020年9月—2022年12月一共10個季度的日本國債規(guī)模進行預測。
由于神經(jīng)網(wǎng)絡(luò)內(nèi)在的非線性性、自適應(yīng)能力和高容錯性,神經(jīng)網(wǎng)絡(luò)目前已經(jīng)廣泛運用于解決各種現(xiàn)實問題,例如人口預測、股票預測、模式識別等[10-11]。傳統(tǒng)的誤差回傳神經(jīng)網(wǎng)絡(luò)采用過程冗長的迭代方式,在實際的使用中,往往需要耗費大量時間[12-13]。為此,張立等[14]提出利用混沌粒子學算法對BP神經(jīng)網(wǎng)絡(luò)的權(quán)值優(yōu)化。這一方法提高了模型的預測精度,但模型收斂所耗的時間量依舊很大,而WASD神經(jīng)網(wǎng)絡(luò)的權(quán)值是通過求解矩陣偽逆得到的,避免了通過反復迭代才能得到網(wǎng)絡(luò)較優(yōu)權(quán)值的冗長訓練過程。因此我們采用WASD神經(jīng)網(wǎng)絡(luò)[15]對日本中央政府債務(wù)(TCGD,total central government debt)規(guī)模進行預測。
研究中使用的WASD神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)[15]如圖1所示,該神經(jīng)網(wǎng)絡(luò)包括3層:輸入層、隱藏層和輸出層,其中輸入層和輸出層都各有1個由線性恒等函數(shù)激活的神經(jīng)元,隱藏層中有N個由切比雪夫多項式激活的神經(jīng)元[16-17]。為了降低神經(jīng)網(wǎng)絡(luò)訓練和計算的復雜程度,我們將輸入層到隱藏層的連接權(quán)重設(shè)為1,隱藏層到輸出層的連接權(quán)重設(shè)為ωj(j=1,2,…,N),ωj是需要進行調(diào)整的。此外,所有神經(jīng)元的閾值都設(shè)為0。我們只需要關(guān)注如何調(diào)整隱藏層神經(jīng)元的個數(shù)以及連接隱藏層和輸出層之間的神經(jīng)元的權(quán)值。與此同時,以上所有的設(shè)置都需要保證此神經(jīng)網(wǎng)絡(luò)的預測性能。
圖1 3層WASD神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of three-layer WASD neural network
實驗過程中,我們發(fā)現(xiàn)第一類切比雪夫多項式在多項式插值和逼近上有良好的性能[18]。因此,使用第一類切比雪夫多項式作為WASD神經(jīng)網(wǎng)絡(luò)隱藏層的激勵函數(shù)[15]。
定義1第一類切比雪夫多項式
對于一個輸入x(x∈[-1,1]),第一類切比雪夫多項式的表達式定義為
(1)
我們使用的WASD神經(jīng)網(wǎng)絡(luò)利用切比雪夫正交多項式對未知的函數(shù)進行逼近。當輸入x滿足x∈[-1,1]時,對一個未知的函數(shù)y=f(x),有
y=f(x)=ω1φ1(x)+ω2φ2(x)+…+ωNφN(x)=
(2)
用于擬合未知函數(shù)的切比雪夫多項式有N個。
WASD神經(jīng)網(wǎng)絡(luò)主要包括2個算法:權(quán)值直接確定(WDD,weights direct determination)算法和結(jié)構(gòu)選優(yōu)確定(SSD,structure selective determination)算法。在訓練過程中,隱藏層神經(jīng)元的個數(shù)N由SSD確定,神經(jīng)元個數(shù)N的確定過程將在下一節(jié)敘述,而連接隱藏層和輸出層的權(quán)值ωj由WDD得到。對圖1中的3層WASD神經(jīng)網(wǎng)絡(luò),取M對數(shù)據(jù)S={(xi,yi)|i=1,2,…,M}作為訓練數(shù)據(jù)集,則權(quán)值列向量W、輸入受激勵矩陣φ和期望(目標)輸出向量γ的定義分別為
(3)
(4)
(5)
則神經(jīng)網(wǎng)絡(luò)的權(quán)值列向量的最優(yōu)解可確定為
W=(φTφ)-1φTγ,
(6)
其中:(φTφ)-1φT是矩陣φ的偽逆,在MATLAB中可以用pinv(φ)計算得到。
首先我們需要構(gòu)建一個WASD神經(jīng)網(wǎng)絡(luò),然后利用TCGD數(shù)據(jù)集對這個神經(jīng)網(wǎng)絡(luò)進行訓練,并且通過WASD算法確定神經(jīng)網(wǎng)絡(luò)的最優(yōu)結(jié)構(gòu)。最后利用一個校驗數(shù)據(jù)集對神經(jīng)網(wǎng)絡(luò)進行校驗。
日本財務(wù)省每個季度都會在其官網(wǎng)公布債務(wù)數(shù)據(jù)。為了保證此神經(jīng)網(wǎng)絡(luò)預測結(jié)果的真實性,我們把從日本財務(wù)省官網(wǎng)中獲取的數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的樣本數(shù)據(jù)集。研究使用1996年6月—2016年3月的數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)進行訓練,使用2016年6月—12月的數(shù)據(jù)對訓練后的神經(jīng)網(wǎng)絡(luò)進行校驗。這里需要引入神經(jīng)網(wǎng)絡(luò)的均方差(MSE,mean square error)這一概念。
定義2均方差(MSE)
(7)
需要說明的是此神經(jīng)網(wǎng)絡(luò)的輸入是TCGD數(shù)據(jù)中的時間(例如1996年6月),輸出是TCGD數(shù)據(jù)中的債務(wù)總額(例如334.130 9萬億日元)。由上述可知,隱藏層的神經(jīng)元是由第一類切比雪夫多項式激活,而第一類切比雪夫多項式要求輸入的值域為[-1,1]。因此,需要在數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)之前,對輸入的日期進行預處理。
利用位于區(qū)間[-1,1]的無單位歸一化因子α將時間間隔區(qū)間[1996/6,2016/12]歸一化到[-1,α]。在以前的工作中,發(fā)現(xiàn)歸一化因子α對神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)擬合效果有一定的影響[15-17],因此找到一個合適的歸一化因子α也很有必要。我們發(fā)現(xiàn)對每一個具體的α值,可以計算出對應(yīng)的MSEmin以及相應(yīng)的隱藏層神經(jīng)元個數(shù)Nmin。那么當找到最優(yōu)的α值后,也可以找到一個對應(yīng)的MSEmin和最優(yōu)的隱藏層神經(jīng)元個數(shù)Nmin,從而確定神經(jīng)網(wǎng)絡(luò)的最優(yōu)結(jié)構(gòu)。
前面利用訓練數(shù)據(jù)集對神經(jīng)網(wǎng)絡(luò)進行了訓練,接著需要對此神經(jīng)網(wǎng)絡(luò)的預測能力進行校驗,這里使用的是位于時間區(qū)間[2016/6,2016/12]的TCGD數(shù)據(jù)。和之前的訓練一樣,在校驗神經(jīng)網(wǎng)絡(luò)之前,需要對輸入數(shù)據(jù)進行預處理。
定義3校驗誤差
(8)
其中:K表示校驗數(shù)據(jù)集中數(shù)據(jù)對的個數(shù)(K=3);yj和γj分別表示對應(yīng)于輸入xj神經(jīng)網(wǎng)絡(luò)的輸出和期望輸出。
當e的值越小,說明神經(jīng)網(wǎng)絡(luò)的預測能力越好。然后比較所有的歸一化因子α(α∈[-1,1])對應(yīng)的校驗誤差e,從而根據(jù)最小的校驗誤差e確定α,理論上此時神經(jīng)網(wǎng)絡(luò)具有最優(yōu)的預測性能。歸一化因子α和對應(yīng)的具有最優(yōu)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)的校驗誤差之間的關(guān)系如圖2所示。不同的歸一化因子的值,將導致神經(jīng)網(wǎng)絡(luò)具有不同的預測性能。圖2中標記了全局最小點和3個局部最小點。標記的全局最小點和3個局部最小點的歸一化因子α的值以及對應(yīng)的最優(yōu)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的隱藏層神經(jīng)元個數(shù)N和校驗誤差e如表1所列。注意理論上全局最小點對應(yīng)的神經(jīng)網(wǎng)絡(luò)就具有最優(yōu)的預測性能,但每一個局部最小點在周圍的點中有最小的校驗誤差,因此這些局部最小點也值得注意和分析。文獻[15]中對標記的全局最小點和局部最小點進行了分析,并確定了最佳神經(jīng)網(wǎng)絡(luò)對應(yīng)的歸一化因子的值是全局最小點α=-0.999。由表1可知,最佳的神經(jīng)網(wǎng)絡(luò)中隱藏層神經(jīng)元的個數(shù)為4,校驗誤差e=0.005 3為全局最小。
表1 歸一化因子α的全局最小值與局部極小值對應(yīng)的神經(jīng)網(wǎng)絡(luò)的隱藏層神經(jīng)元個數(shù)和校驗誤差
圖2 歸一化因子α與具有最優(yōu)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型的校驗誤差之間的關(guān)系Fig.2 Relationship between normalization factor α and validation error of neural network model with optimal structure
對標記出來的全局最小點和局部最小點進行分析,我們認為全局最小點對應(yīng)的神經(jīng)網(wǎng)絡(luò)具有最佳的預測性能。理論上,全局最小點對應(yīng)的神經(jīng)網(wǎng)絡(luò)的校驗誤差是最小的,數(shù)據(jù)擬合能力是最好的,最有可能得到最準確的預測結(jié)果。利用這個神經(jīng)網(wǎng)絡(luò)預測了2017年3月—2020年6月一共14個季度的日本國債規(guī)模,與日本財務(wù)省官網(wǎng)公布的真實數(shù)據(jù)對比見表2。由表2可以看到從2017年3月—2020年6月,預測數(shù)據(jù)和真實數(shù)據(jù)的相對誤差很小,最大的相對誤差只有3.96%。說明最佳預測模型的預測性能較好,也充分說明了將WASD神經(jīng)網(wǎng)絡(luò)應(yīng)用于日本國債規(guī)模的預測上是十分準確和可靠的,并且預測結(jié)果是有意義的。
表2 理論最佳模型預測數(shù)據(jù)與真實數(shù)據(jù)回顧對比
經(jīng)過與官方公布的2017年3月—2020年6月的數(shù)據(jù)進行比對,確定此神經(jīng)網(wǎng)絡(luò)的預測結(jié)果具有一定的價值,所以用更多的數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)進行訓練。用新訓練出來的理論最佳模型以及原來的理論最佳模型對接下來的10個季度(2020年9月—2022年12月)進行預測,得到的預測結(jié)果如表3所列。
表3 理論最佳模型和新訓練的理論最佳模型對日本中央政府債務(wù)規(guī)模未來預測數(shù)據(jù)及相對差
從日本財務(wù)省官網(wǎng)公布的真實數(shù)據(jù)上來看,除了個別季度(例如2008年6月、2008年9月、2014年9月、2015年9月、2020年6月)比前一個季度的數(shù)據(jù)有所下降或大幅上升以外,日本中央政府的債務(wù)規(guī)??傮w上是緩慢上升的。預測數(shù)據(jù)和真實數(shù)據(jù)的變化趨勢大體是一致的,但在具體的漲幅上有細微的差別,所以導致預測數(shù)據(jù)和真實數(shù)據(jù)之間存在微小的誤差。經(jīng)過對神經(jīng)網(wǎng)絡(luò)更進一步地訓練,新的預測結(jié)果顯示2個模型的預測結(jié)果的數(shù)據(jù)變化趨勢相同,但在具體的數(shù)值上存在微小的相對差。我們認為未來的變化趨勢仍是緩慢上升的,并且具體的數(shù)值可能在2個模型的預測值附近浮動,但仍有可能在個別季度出現(xiàn)輕微的下降。當然也可能因為某些現(xiàn)實因素(例如日本國內(nèi)外金融環(huán)境變化、日本政府有力的財政政策以及重大自然災害等)導致數(shù)據(jù)出現(xiàn)其他的變化趨勢。
在過去的20年間,日本國債規(guī)??焖僭鲩L,其國債與國民生產(chǎn)總值的比值明顯高于其他發(fā)達經(jīng)濟體。為此,評估日本政府債務(wù)風險,對日本國債未來規(guī)模的預測具有一定的意義。利用日本財務(wù)省官方網(wǎng)站公布的1996年6月—2016年12月的日本國債規(guī)模數(shù)據(jù)對WASD神經(jīng)網(wǎng)絡(luò)進行訓練和校驗,并在此基礎(chǔ)上完成了2017年3月—2020年6月共14個季度的日本國債規(guī)模的預測。最佳訓練模型預測結(jié)果表明日本國債規(guī)模未來的變化趨勢為緩慢上升,從2017年3月—2020年6月的預測結(jié)果與真實數(shù)據(jù)的相對誤差在4%以內(nèi),體現(xiàn)了該方法的準確性和有效性。通過更進一步的訓練和預測,結(jié)果表明在短期內(nèi)(2020年9月—2022年12月)日本國債規(guī)模仍將緩慢上升。為此,未來日本政府財政政策應(yīng)會繼續(xù)偏于穩(wěn)健,短期內(nèi)不會出現(xiàn)債務(wù)危機。同時,WASD神經(jīng)網(wǎng)絡(luò)也可繼續(xù)應(yīng)用于未來國債規(guī)模的預測。當日本政府或其他國家政府認識到未來短期可能出現(xiàn)的趨勢時,就可以制定出有效的財政政策規(guī)避風險,控制國債增長率,并做好應(yīng)急準備。