◎ 聶超 常建 王大偉 姜橙華
1.青島港國際股份有限公司;2.深圳市辰卓科技有限公司
集裝箱吞吐量指標對于大型綜合類港口而言,是重要的績效指標。準確預測集裝箱吞吐量,能夠輔助港口運營者管理和決策,保證裝卸和運輸?shù)母咝?;能夠反映一個地區(qū)的進出口貿(mào)易狀況,對經(jīng)濟形式做出合理預測;對于港口物流的供應(yīng)鏈參與者,可以有效降低運營成本,提高供應(yīng)鏈效率;對于地區(qū)環(huán)保政策的制定和實施也具有重要意義。
王鳳武等人在2023年提出了基于多變量LSTM模型的青島港集裝箱吞吐量預測[1]和基于LSTM的上海港集裝箱吞吐量預測[2],采用LSTM模型對大型港口的集裝箱吞吐量進行了較為精準的預測;孫曉聰?shù)热嗽?022年提出了基于RF-雙向LSTM的集裝箱吞吐量預測[3],對LSTM模型進行了優(yōu)化,得出了更高精度的預測結(jié)果;王浩等人在2023年提出了基于LSTM神經(jīng)網(wǎng)絡(luò)的航空公司旅客來電量預測方法[4];高永華在2023年提出了基于LSTM的河北省徑流量預測研究[5],驗證了LSTM模型在徑流量預測中的可行性。
提出一種基于RMSProp算法改進LSTM模型的方法,對某大型綜合類港口吞吐量進行預測。RMSProp是一種自適應(yīng)學習率算法,可以自行調(diào)整學習效率,在面對容易產(chǎn)生梯度消失或者梯度爆炸的深度學習網(wǎng)絡(luò)時,具備較大優(yōu)勢;同時,它能夠避免學習率下降過快、學習過程提前結(jié)束等問題,保證模型充分訓練。通過RMSProp改進LSTM,可以避免LSTM出現(xiàn)梯度消失或梯度爆炸的情況,使訓練過程更加平滑、避免過度震蕩、提高LSTM的性能,同時可以提高算法的穩(wěn)定性。
L S T M 屬于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),相較于傳統(tǒng)的RNN模型只有一個網(wǎng)絡(luò)層,LSTM模型內(nèi)部有4個網(wǎng)絡(luò)層,結(jié)構(gòu)如圖1所示。
圖1 LSTM模型結(jié)構(gòu)圖
圖中灰色矩形框表示一個神經(jīng)網(wǎng)絡(luò)層,由權(quán)重、偏置和激活函數(shù)組成,加號、乘號、tan表示對元素的操作,箭頭表示向量的流向,分叉的箭頭表示向量的復制。
相較于RNN的隱層,LSTM增加了一個細胞狀態(tài)(cell state),在時刻t中間細胞狀態(tài)所發(fā)生的輸入和輸出如圖2所示。
圖2 LSTM模型的細胞狀態(tài)
Ct-1表示t時刻輸入的細胞狀態(tài),Ct表示t時刻的輸出細胞狀態(tài);ht-1表示隱層的輸入狀態(tài),ht表示隱層的輸出狀態(tài),同時還作為t時刻的輸出向量;xt表示t時刻的輸入向量。
細胞狀態(tài)中一個sigmoid層與一個點乘構(gòu)成了一個“門”結(jié)構(gòu),如圖3所示,能有效控制向量的通過和攔截,圖2中包含3個門結(jié)構(gòu),分別為遺忘門、輸入門、輸出門。
圖3 LSTM模型“門”結(jié)構(gòu)
遺忘門決定細胞需要丟棄哪些信息,結(jié)構(gòu)如圖4所示。
圖4 LSTM模型遺忘門
則有:
[ht-1,xt]表示連接兩個向量。
輸入門決定細胞狀態(tài)更新哪些信息,這一過程分為兩個步驟,第一步?jīng)Q定更新哪些信息,結(jié)構(gòu)如圖5所示。
圖5 LSTM模型輸入門
則有:
第二步更新細胞信息,如圖6所示。
圖6 更新細胞信息
基于遺忘門攔截舊細胞信息的一部分,輸入門更新細胞信息的一部分得到新的細胞信息Ct:
輸出門通過sigmoid層執(zhí)行判斷,后將細胞狀態(tài)通過tanh層得到[-1,1]之間值的向量,與判斷條件相乘即可得最終循環(huán)網(wǎng)絡(luò)的輸出向量,過程如圖7所示。
圖7 LSTM模型輸出門
則有:
經(jīng)過以上步驟即可得到t時刻細胞狀態(tài)的輸出。
RMSProp是一種基于梯度下降算法的優(yōu)化算法,通過使用指數(shù)加權(quán)平均來估計梯度平方的移動平均值,將較大的梯度值進行抑制,較小的梯度值進行放大,能夠自適應(yīng)地調(diào)整每個參數(shù)的學習率;具備更快的收斂速度;通過引入衰減系數(shù),對梯度平方進行指數(shù)加權(quán)平均,避免了AdaGrad算法學習率過早衰減的問題;在大多數(shù)情況下更加高效穩(wěn)定。
RMSProp的元素更新規(guī)則如下:
(1)從訓練集中采集m個樣本
對應(yīng)的目標為yi。
(2)計算梯度
其中θ為初始參數(shù)。
(3)積累平方梯度
(4)逐個元素應(yīng)用除和平方根,計算更新
其中ε為全局學習率。
(5)應(yīng)用更新
執(zhí)行以上步驟直到模型達到停止準則。
通過RMSProp改進LSTM模型的關(guān)鍵為初始化RMSProp優(yōu)化器,需指定R MSP rop 參數(shù),包含學習率、衰減系數(shù),并根據(jù)具體情況進行調(diào)整。使用訓練數(shù)據(jù)對LSTM模型進行訓練,需通過RMSProp優(yōu)化器迭代更新LSTM模型的參數(shù)。具體步驟見圖8。
圖8 RMSProp算法改進LSTM模型
采集某大型港口2000年至2022年集裝箱吞吐量數(shù)據(jù),見表1。
表1 某大型港口2000年至2022年集裝箱吞吐量數(shù)據(jù)
集裝箱吞吐量數(shù)據(jù)變化受多種相關(guān)因素影響,單變量訓練往往難以實現(xiàn)準確預測,獲取與集裝箱吞吐量密切相關(guān)的幾個影響因素數(shù)據(jù),包含:GDP、進出口貿(mào)易額、第一產(chǎn)業(yè)產(chǎn)值、第二產(chǎn)業(yè)產(chǎn)值、第三產(chǎn)業(yè)產(chǎn)值,數(shù)據(jù)見表2。
表2 2000年至2022年各影響因素數(shù)據(jù)
對數(shù)據(jù)進行歸一化處理,可以統(tǒng)一特征值的尺度,提升模型的收斂速度;防止特征之間權(quán)重失衡;提高模型的魯棒性;方便不同特征的可視化比較。采用max-min標準化方法對數(shù)據(jù)進行歸一化處理,將數(shù)據(jù)縮小至[0,1]區(qū)間內(nèi),歸一化后的數(shù)據(jù)見表3。
表3 各影響因素數(shù)據(jù)歸一化結(jié)果
以2000年至2016年的集裝箱吞吐量相關(guān)數(shù)據(jù)作為輸入,對2.3構(gòu)建的優(yōu)化模型進行訓練,并對2017年至2022年的數(shù)據(jù)進行預測,預測結(jié)果見圖9。
圖9 RMSProp改進LSTM模型預測結(jié)果
采用A r i m a模型對2017年至2022年的數(shù)據(jù)進行預測,預測結(jié)果見圖10。
圖10 Arima模型預測結(jié)果
預測結(jié)果及誤差見表4。
表4 2017年至2022年預測結(jié)果及誤差
誤差MAPE和RMSE見表5。
表5 誤差MAPE和RMSE指標
結(jié)果表明,R M S P r o p 改進LSTM模型的MAPE和RMSE指標均小于Arima模型,即RMSProp改進LSTM模型對某大型港口吞吐量的預測更加準確。
科學準確預測港口吞吐量,能夠指導港口優(yōu)化資源配置,輔助管理人員決策,指導物流方、貿(mào)易方優(yōu)化供應(yīng)鏈,更好地評估港口對環(huán)境的影響等。采用RMSProp算法改進LSTM的方式構(gòu)建一種多變量輸入的優(yōu)化模型,對某大型綜合類港口集裝箱吞吐量數(shù)據(jù)進行預測,獲得更加準確的預測結(jié)果。模型充分利用RMSprop自適應(yīng)學習率、緩解梯度消失和梯度爆炸、更快收斂等優(yōu)點,改進LSTM模型的訓練過程,實現(xiàn)了更加高效、準確的數(shù)據(jù)預測。