屈波怡,詹冰清,劉博偉
(1.上海理工大學(xué)管理學(xué)院,上海 200093;上海理工大學(xué)出版印刷與藝術(shù)設(shè)計(jì)學(xué)院,上海 200093)
隨著我們踏入智能化生活,我們的消費(fèi)支付方式也由從前的現(xiàn)金支付發(fā)展到現(xiàn)金支付與電子支付并存[1]。電子支付中使用率最高且最便捷的是移動(dòng)支付。移動(dòng)支付并不是我國(guó)所創(chuàng)造,但它卻在我國(guó)得到了前所未有發(fā)展。由于它方便快捷,人們開始越來越依賴這種支付方式,甚至政府也開始數(shù)字人民幣試點(diǎn)。但也有一部分人覺得移動(dòng)支付沒有現(xiàn)金支付實(shí)在,移動(dòng)支付在很多鄉(xiāng)村及偏遠(yuǎn)地區(qū)沒有得到普及,以及很多老年人不會(huì)使用移動(dòng)支付,是否要取消現(xiàn)金支付及數(shù)字人民幣能否取代移動(dòng)支付等都成為一個(gè)個(gè)爭(zhēng)議話題[2]。從表1 中我們可以觀察到中國(guó)移動(dòng)支付交易額呈持續(xù)增長(zhǎng),在面臨種種問題的環(huán)境下,移動(dòng)支付未來尚不明確,所以有必要對(duì)中國(guó)移動(dòng)支付交易額進(jìn)行預(yù)判。
表1 中國(guó)移動(dòng)支付現(xiàn)狀
GM(1,1)模型、ARIMA 模型和LSTM 模型已經(jīng)在預(yù)測(cè)方面有了很好的案例結(jié)果[3-5],本文也使用上述模型對(duì)中國(guó)移動(dòng)支付額進(jìn)行預(yù)測(cè)。希望本文預(yù)測(cè)能為政府決策和企事業(yè)單位管理方式等提供科學(xué)有效的政策建議[6]。
GM(1,1)灰色系統(tǒng)理論模型由鄧聚龍等人在1982 年提出[7]。在面對(duì)數(shù)據(jù)量少且信息不豐富的條件下,GM 模型通過對(duì)數(shù)據(jù)處理,從而建立模型,完成預(yù)測(cè)任務(wù)。GM(1,1)模型參數(shù)意義是該模型方程為一階方程一個(gè)變量。構(gòu)建GM(1,1)模型,過程如下:
為了降低隨機(jī)序列波動(dòng)性和隨機(jī)性影響,我們對(duì)一般序列累加處理,達(dá)到數(shù)據(jù)降噪效果。設(shè)原始數(shù)據(jù)為n 個(gè)樣本X(0)={X(0)(1),X(0)(2),…,X(0)(n)},累加得到灰色序列X(1)={X(1)(1),X(1)(2),…,X(1)(n)}。然后建立灰微分方程,令,建立累加矩陣B,常數(shù)項(xiàng)向量y。
對(duì)其進(jìn)行最小二乘估計(jì),
我們對(duì)結(jié)果數(shù)據(jù)累減操作,得到原數(shù)據(jù)X(0)。最后我們使用精度檢驗(yàn)表對(duì)GM(1,1)模型進(jìn)行評(píng)判,計(jì)算出后驗(yàn)差比或小誤差概率,與表2 進(jìn)行對(duì)照,得到模型精度等級(jí)。
表2 精度檢驗(yàn)等級(jí)參照表
ARIMA 模型[8]是一種較為經(jīng)典的時(shí)間序列預(yù)測(cè)模型,它是自回歸模型(AR)和移動(dòng)平均模型(MA)整合而來。若序列非平穩(wěn)序列,需通過差分轉(zhuǎn)化為平穩(wěn)序列,經(jīng)過幾次差分轉(zhuǎn)化,稱為幾階單整I,下式能夠直觀明了解釋ARIMA 模型:
基本建模步驟為:(1)對(duì)數(shù)據(jù)檢驗(yàn)平穩(wěn)性,如不平穩(wěn)則進(jìn)行差分處理;(2)對(duì)平穩(wěn)后序列進(jìn)行白噪聲檢驗(yàn);(3)對(duì)符合要求的序列定階;(4)對(duì)模型檢驗(yàn)其精度;(5)使用模型預(yù)測(cè)。
Schmidhuber 等人[9]于1997 年提出LSTM 長(zhǎng)短期記憶網(wǎng)絡(luò)。LSTM 能夠避免長(zhǎng)期依賴問題,中心理念是細(xì)胞狀態(tài)。該網(wǎng)絡(luò)由各種各樣結(jié)構(gòu)的門組成。通過Sigmoid 函數(shù)及點(diǎn)乘操作完成一個(gè)門的創(chuàng)建。一個(gè)LSTM 中使用三個(gè)門來控制細(xì)胞狀態(tài),也就是信息傳輸。通過控制全局記憶達(dá)到延緩記憶衰退效果。
圖1 LSTM 結(jié)構(gòu)圖
1.遺忘門:LSTM 要決定刪減掉原始細(xì)胞狀態(tài)的哪一部分信息,信息取舍是通過激活函數(shù)sigmoid函數(shù)決定。
公式(6)中,ft為遺忘門最終輸出,上一個(gè)細(xì)胞狀態(tài)為ht-1,xt為細(xì)胞此時(shí)狀態(tài)。W 是線性關(guān)系系數(shù)參數(shù),b 是偏置參數(shù)。
2.輸入門:為更好確定單元狀態(tài)所要加入的信息,先使用sigmoid 函數(shù)對(duì)信息進(jìn)行選擇,其次使用tanh 函數(shù)創(chuàng)建更新的狀態(tài)量。
對(duì)舊細(xì)胞狀態(tài)進(jìn)行更新,丟棄舊細(xì)胞部分信息并添加新信息。
3.輸出門:通過sigmoid 函數(shù)與tanh 函數(shù)實(shí)現(xiàn)最后輸出值。
表3 中國(guó)移動(dòng)支付額
本文實(shí)驗(yàn)采取前瞻數(shù)據(jù)庫(kù)的中國(guó)移動(dòng)支付額(季度)數(shù)據(jù),選取2013 年3 月—2019 年6 月中國(guó)移動(dòng)支付額(季度)數(shù)據(jù)制作數(shù)據(jù)樣本。分別建立GM(1,1)模型、ARIMA 模型與LSTM 模型對(duì)未來3個(gè)季度中國(guó)移動(dòng)支付額預(yù)測(cè)。本文所建立的三個(gè)模型均是用python 語(yǔ)言實(shí)現(xiàn),同時(shí)下載Pandas,Numpy,Statsmodels,Matplotlib 庫(kù)使用。表3 為2013 年3月—2020 年3 月中國(guó)移動(dòng)支付額(季度)。
使用實(shí)驗(yàn)數(shù)據(jù)集建立時(shí)間序列:X(0)={1.1,2.07,2.9,3.57,3.89,4.92,6.16,7.61,39.78,26.81,18.17,23.46,52.13,29.32,35.33,40.77,60.65,39.24,49.26,53.77,70.82,62.88,65.48,78.22,86.62,79.46,86.11,94.92,90.81}。通過一次累加得到灰色序列:X(1)={1.1,3.17,6.07,9.64,13.53,18.45,24.61,32.22,72,98.81,116.98,140.44,192.57,221.89,257.22,297.99,358.64,397.88,447.08,500.85,571.67,634.55,700.03,778.25,864.87,944.33}。
然后構(gòu)建累加矩陣B 以及常數(shù)項(xiàng)向量y,通過公式(1)(2)(3)得到a=-0.089,μ=11.971。最終得到預(yù)測(cè)模型:X(1)(t+1)=135.546×e0.089t-134.446。經(jīng)計(jì)算,得到其后驗(yàn)差比C=0.135<0.35。與表2 進(jìn)行對(duì)照,模型精度為“好”。使用灰色預(yù)測(cè)模型對(duì)后三個(gè)季度移動(dòng)支付額預(yù)測(cè),結(jié)果如表4 所示。
表4 GM(1,1)模型殘差與相對(duì)殘差
GM(1,1)模型預(yù)測(cè)結(jié)果、中國(guó)移動(dòng)支付金額真實(shí)數(shù)據(jù)及殘差對(duì)比如表4 所示。GM(1,1)模型預(yù)測(cè)的2019 年9 月-2020 年3 月中國(guó)移動(dòng)支付額為11.7、12.8、14。
首先對(duì)數(shù)據(jù)進(jìn)行ADF 平穩(wěn)性檢驗(yàn)[10],計(jì)算pvalue 值,得出結(jié)果是0.993 356,顯著大于0.05,該序列不是平穩(wěn)序列,對(duì)該序列差分處理,對(duì)差分處理(一階)后序列再次ADF 檢驗(yàn),得出p-value 是5.48569*10-15,該值小于0.05,得到平穩(wěn)序列。對(duì)平穩(wěn)后序列進(jìn)行白噪聲檢驗(yàn),得出p-value 是0.021 694 24,p 值小于0.05,為非白噪聲序列。對(duì)ARIMA模型定階,觀察該平穩(wěn)序列的自相關(guān)圖和偏自相關(guān)圖確定,如圖2 所示。
圖2 自相關(guān)圖和偏自相關(guān)圖
根據(jù)AF 圖看出0、1、2 階拖尾,PAF 圖看出0、1階截尾。根據(jù)經(jīng)驗(yàn)法則,嘗試性確定為ARIMA(0,1,1),ARIMA(0,1,2),ARIMA(1,1,0),ARIMA(1,1,1),ARIMA(1,1,2)。模型信息準(zhǔn)則篩選如表5 所示。
表5 信息準(zhǔn)則值
根據(jù)AIC、BIC 和HQ 信息準(zhǔn)則,ARIMA(0,1,1)的AIC、BIC 和HQ 值最小,為最佳模型。其中發(fā)現(xiàn)ARIMA(0,1,2)模型計(jì)算出的初始MA 系數(shù)不可逆,因此,ARIMA(0,1,1)為最合適的模型。最后對(duì)模型殘差進(jìn)行自相關(guān)檢驗(yàn),本文采用DW 德賓-沃森檢驗(yàn)[11],該檢驗(yàn)是一種經(jīng)典且常用的一階自相關(guān)性檢驗(yàn)方法。根據(jù)本文解釋變量數(shù)與樣本容量查表知dL=1.302,dU=1.461,該模型DW 檢驗(yàn)規(guī)則如表6 所示:
表6 DW 檢驗(yàn)規(guī)則
檢驗(yàn)結(jié)果為2.128 117 319 203 272 7,由表6 得出不存在自相關(guān)性。模型通過檢驗(yàn),所以本文建立ARIMA(0,1,1)時(shí)間序列模型作為預(yù)測(cè)移動(dòng)支付額的一種模型。模型確定之后,對(duì)未來3 個(gè)季度數(shù)據(jù)進(jìn)行預(yù)測(cè)。
前26 個(gè)數(shù)據(jù)為測(cè)試數(shù)據(jù),后3 個(gè)為預(yù)測(cè)數(shù)據(jù)。預(yù)測(cè)結(jié)果為84.02、85.42、89.95,較為合理,如圖3所示。
本文對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,為讓尋求最優(yōu)解過程波動(dòng)不會(huì)太大,即訓(xùn)練模型的loss 值下降更快,對(duì)數(shù)據(jù)進(jìn)行min-max 標(biāo)準(zhǔn)化。
圖3 ARIMA 模型預(yù)測(cè)趨勢(shì)圖
設(shè)定時(shí)間步長(zhǎng),制作具有標(biāo)簽監(jiān)督的數(shù)據(jù)集。由于本文數(shù)據(jù)集較小,時(shí)間步長(zhǎng)設(shè)置為1。
表7 標(biāo)簽監(jiān)督數(shù)據(jù)集(部分)
LSTM 模型構(gòu)建中,優(yōu)化器為adam 優(yōu)化,學(xué)習(xí)率lr=0.002,loss 損失函數(shù)為RMSE 函數(shù),預(yù)測(cè)評(píng)價(jià)指標(biāo)為平均絕對(duì)誤差MAE。
根據(jù)上述公式,本文最終模型的RMSE 為0.037 4,模型預(yù)測(cè)結(jié)果為81.35、92.38、93.63,平均相對(duì)殘差為0.037 7。根據(jù)預(yù)測(cè)結(jié)果得出LSTM 模型能夠很好地應(yīng)用于中國(guó)移動(dòng)支付金額(季度)數(shù)據(jù)方面。
將三種模型預(yù)測(cè)值繪制如圖4 所示的三種模型預(yù)測(cè)趨勢(shì)圖。
圖4 三種模型預(yù)測(cè)趨勢(shì)圖
觀察圖4 發(fā)現(xiàn),中國(guó)移動(dòng)支付額整體呈上升趨勢(shì),其中LSTM 模型和ARIMA 模型預(yù)測(cè)趨勢(shì)線與真實(shí)值更貼近。
將GM(1,1)、ARIMA、LSTM 模型預(yù)測(cè)結(jié)果比對(duì)分析,如表8 所示。
表8 殘差對(duì)比
從表8 可知,GM(1,1)模型精度為58.589%,ARIMA 模型精度為95.539%,LSTM 模型精度為96.230%,其中LSTM 模型精度最高,更接近于中國(guó)移動(dòng)支付額真實(shí)值。
在互聯(lián)網(wǎng)金融時(shí)代,一線城市早已普及移動(dòng)支付,二三線城市也在快速發(fā)展,移動(dòng)支付額不斷增長(zhǎng),都印證移動(dòng)支付發(fā)展充滿潛力。本文分別使用GM(1,1)模型、ARIMA 模型及LSTM 模型對(duì)2013—2019 年移動(dòng)支付額數(shù)據(jù)進(jìn)行擬合,預(yù)測(cè)結(jié)果表明GM(1,1)模型精度較差,ARIMA 模型精度較好,LSTN 模型精度最佳。移動(dòng)支付的創(chuàng)新性不僅給我們帶來便利,同時(shí)也帶來問題:移動(dòng)支付平臺(tái)管理、制度規(guī)范、監(jiān)管制度的完善等。