彭 婷,鄧旭東(武漢科技大學(xué),湖北 武漢 430065)
武漢是九省通衢的湖北省省會,是華中地區(qū)的對外貿(mào)易港口,其航空更是長江領(lǐng)域的發(fā)展中心,武漢的航空樞紐網(wǎng)絡(luò)以及航空物流運(yùn)輸系統(tǒng)一直備受當(dāng)?shù)卣推髽I(yè)關(guān)注。武漢天河機(jī)場被定位為八大區(qū)域性樞紐機(jī)場之一,是華中地區(qū)第一門戶機(jī)場和首個4F 機(jī)場。截至2020 年末,武漢天河機(jī)場通航城市航線有200 條,國際航線63 條。2019 年,可滿足貨物的吞吐量為24萬噸、飛機(jī)起降20 萬架次的需要;2020 年末,可滿足年貨郵吞吐量44 萬噸、飛機(jī)起降40 萬架次的需要。面對貨郵量的快速增長,加之因疫情影響下暴露的諸如航空貨運(yùn)效率問題以及航空物流運(yùn)輸體系不完善等問題,研究航空物流對物流服務(wù)的供求平衡以及滿足人民生活的需求有著重要意義。
物流需求預(yù)測是一個經(jīng)久不衰的話題,不同的學(xué)者對此做的研究也是不盡相同。Baisariyev M 等人[1]用Bootstrap 方法對航空備件物流預(yù)測,有助于航空備件物資管理;鄭文儒等人[2]運(yùn)用博弈論和三次指數(shù)平滑法對廈泉兩港聯(lián)盟進(jìn)行探討及集裝箱吞吐量的預(yù)測;潘正桐[3]運(yùn)用機(jī)器學(xué)習(xí)時間序列對中國貨物運(yùn)輸量進(jìn)行了預(yù)測研究;胡小建等人[4]通過構(gòu)建物流需求多元非線性組合回歸預(yù)測模型,優(yōu)化了方法。這些預(yù)測方法最后都有較好的實際運(yùn)用效果。
本文采取機(jī)器學(xué)習(xí)的線性回歸模型對武漢天河機(jī)場2001—2020 的物流數(shù)據(jù)及武漢市的地方生產(chǎn)總值進(jìn)行擬合分析,并與二次指數(shù)平滑模型的預(yù)測結(jié)果進(jìn)行平均絕對百分誤差(MAPE)對比,得到機(jī)器學(xué)習(xí)具有更好的預(yù)測精準(zhǔn)度,從而預(yù)測了未來的天河機(jī)場貨郵吞吐量,可為相關(guān)企業(yè)制定規(guī)劃方案及對未來的發(fā)展趨勢提供一定參考。
1.1.1 機(jī)器學(xué)習(xí)模型建模過程
機(jī)器學(xué)習(xí)是當(dāng)前發(fā)展最熱的人工智能的重心,學(xué)習(xí)是人類發(fā)展進(jìn)步的源泉,機(jī)器學(xué)習(xí)指通過一定程序使得計算機(jī)可以像人類一樣進(jìn)行學(xué)習(xí),它模擬并實現(xiàn)人類的學(xué)習(xí)行為[5],使得計算機(jī)可以在已有的知識結(jié)構(gòu)與思維深度上不斷學(xué)習(xí)新的知識與技能,實現(xiàn)更多對應(yīng)問題的解決方案,自身的性能不斷優(yōu)化。機(jī)器學(xué)習(xí)的學(xué)習(xí)算法多種多樣,現(xiàn)有研究將其分為兩種算法——監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí);從字面上理解,監(jiān)督學(xué)習(xí)即指計算機(jī)是在教導(dǎo)和引領(lǐng)下完成相應(yīng)的任務(wù),而無監(jiān)督學(xué)習(xí)是指讓計算機(jī)自主學(xué)習(xí)。本文的線性回歸模型則屬于機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí),具體建模過程將在本節(jié)闡述。
通過尋求兩個或多個變量之間的相互聯(lián)系依存關(guān)系,并運(yùn)用數(shù)學(xué)統(tǒng)計學(xué)中的回歸分析,這種方法稱為線性回歸(Linear Regression),即是使用類似y=ax+b 的擬合方式對輸入變量和輸出變量之間的關(guān)系進(jìn)行映射,這種方法可以對一個及多個自變因素與因變因素之間的相互關(guān)系進(jìn)行建模處理,最小平方函數(shù)指由單個或多個回歸系數(shù)中的模型參數(shù)組成的線性組合,這種線性回歸利用由特定的線性回歸方程的最小平方函數(shù)來實現(xiàn)。線性回歸的擬合處理映射如圖1 所示。
圖1 線性回歸的擬合處理映射
機(jī)器學(xué)習(xí)中的這種線性回歸模型問題是對于每一個輸入的數(shù)據(jù)都有一個對應(yīng)的輸出值,這也是它被稱為監(jiān)督學(xué)習(xí)的原因。對于“回歸”的解釋是指通過對以往數(shù)據(jù)的擬合分析,可以得一個關(guān)于這組數(shù)據(jù)確切的預(yù)測值。對于本文的研究問題來說輸出值就是航空貨郵的吞吐量。
圖2 展示的工作模式屬于機(jī)器學(xué)習(xí)中兩種主流算法之一的監(jiān)督學(xué)習(xí)算法,通過這樣一種學(xué)習(xí)算法的工作,把武漢市的地區(qū)生產(chǎn)總值(GD P)作為輸入變量,通過訓(xùn)練集里實際的貨郵吞吐量,學(xué)習(xí)算法會在此次程序運(yùn)行中輸出一個函數(shù),該函數(shù)用h 表示,h 即為hypothesis。在本文中,這是一個單變量線性回歸問題,本文的變量為武漢市的地區(qū)生產(chǎn)總值(GD P),對于要預(yù)測的貨郵吞吐量的值,需要在函數(shù)h 中輸入地區(qū)生產(chǎn)總值的數(shù)據(jù)(即為x),從而得到貨郵吞吐量的預(yù)測值(即為y),函數(shù)h 會根據(jù)輸入的x 值來輸出對應(yīng)的y 值。所以,這可以解釋從x 到y(tǒng) 的映射是為函數(shù)h。函數(shù)h 表達(dá)式如下:
圖2 監(jiān)督學(xué)習(xí)算法工作模式
式(1)中對于模型參數(shù)(parameters)θ0、θ1的選取非常重要,在本文案例中該參數(shù)就是直線的斜率和在y 軸上的截距。同時,在線性回歸中還存在一個訓(xùn)練集,訓(xùn)練樣本的個數(shù)用m 表示。對于參數(shù)的選擇決定了對訓(xùn)練集預(yù)測的準(zhǔn)確度,所預(yù)測處理的數(shù)值與訓(xùn)練集中實際數(shù)值的參差稱為建模誤差。
所以,目標(biāo)就是使得建模誤差最小,縮小預(yù)測值與實際值的距離。將建模誤差表示為代價函數(shù)對于代價函數(shù)J(θ0,θ1)最小化的求解可用梯度下降算法,表示如下:
式(2)表示的意思是通過對θ 賦值得到局部范圍的最小值,這樣J(θ)的下降方向就等同于梯度下降最快的方向。式(2)中,α 意味著學(xué)習(xí)率,它表示代價函數(shù)隨著梯度下降最快方向的步伐,也可以理解為下降速度。所以,要將梯度下降和代價函數(shù)的結(jié)合應(yīng)用于本文案例中,進(jìn)行具體數(shù)值的擬合分析研究。
由上分析,模型hypothesis:
模型參數(shù)parameters:
代價函數(shù)cost function:
目標(biāo)goal:
1.1.2 二次指數(shù)平滑模型建模過程
一次指數(shù)平滑以第t 期的實際值與預(yù)測值的加之平滑系數(shù)α 的線性組合,所求解的值為第t+1 期的預(yù)測值,這樣預(yù)測方法的缺陷是當(dāng)數(shù)據(jù)存在趨勢時,一次指數(shù)平滑預(yù)測會出現(xiàn)滯后現(xiàn)象。二次指數(shù)平滑是在一次基礎(chǔ)上的優(yōu)化,糾正了一次預(yù)測的不確定性與預(yù)測的滯后性,因為二次預(yù)測的方法可以在一次的基礎(chǔ)上給出趨勢的修正,所以也謂之趨勢調(diào)整指數(shù)平滑法。先用一次指數(shù)平滑法得到基數(shù)預(yù)測值,隨后通過對數(shù)據(jù)趨勢變化的計算進(jìn)行預(yù)測修正。其公式如下:
其中:DFt代表第t 期的二次指數(shù)平滑預(yù)測值,SFt代表第t 期的一次預(yù)測值,T0初始值事先給定,β 為趨勢平滑系數(shù)。
預(yù)測步驟是,第一步,計算第t 期的一次指數(shù)平滑預(yù)測值SFt;第二步,用Tt=β(SFt-SFt-1)+(1-β)Tt-1計算趨勢;第三步,在趨勢調(diào)整的基礎(chǔ)上得到二次指數(shù)平滑預(yù)測值DFt=SFt+Tt。
由上建模過程的分析可得,預(yù)測值與平滑系數(shù)α 的確立息息相關(guān),α 值的選取是非常重要的。平滑系數(shù)α 值的選取越小,則意味著對現(xiàn)階段數(shù)據(jù)的權(quán)重較小,對遠(yuǎn)期數(shù)據(jù)的權(quán)重較大,這樣使得最終結(jié)果的預(yù)測穩(wěn)定性較好,但當(dāng)現(xiàn)階段數(shù)據(jù)出現(xiàn)較大波動時,則預(yù)測不準(zhǔn)確;平滑系數(shù)α 值的選取越大,代表較為看重現(xiàn)階段數(shù)據(jù),這樣預(yù)測出來的結(jié)果是代表響應(yīng)性較好。當(dāng)應(yīng)用到具體案例中時,還需根據(jù)數(shù)據(jù)的特點,來進(jìn)行平滑系數(shù)α 的選擇。
1.2.1 機(jī)器學(xué)習(xí)的線性回歸模型預(yù)測
對機(jī)場貨郵吞吐量的預(yù)測可以使得航空公司的貨運(yùn)配送路線及配送時間規(guī)劃得更加精準(zhǔn),對內(nèi)可以整體上提升航空公司在物流方面的籌劃,對外可以優(yōu)化物流服務(wù)水平,而機(jī)場的貨郵吞吐量和地區(qū)經(jīng)濟(jì)水平息息相關(guān)。因此,選取2001—2021 的地區(qū)生產(chǎn)總值(GDP)的統(tǒng)計數(shù)據(jù)作為輸入變量,航空貨郵吞吐量的統(tǒng)計數(shù)據(jù)作為輸出變量,原始數(shù)據(jù)如表1 所示,構(gòu)建線性回歸模型。
表1 武漢市GDP 與機(jī)場貨郵吞吐量
在程序運(yùn)行中,第一步,先計算代價函數(shù)h(x)=θT*x,x 是矩陣;T 表示轉(zhuǎn)置,np.power(A,B)表示對A 求B 次方:
最后預(yù)測2019—2021 年武漢天河機(jī)場貨郵吞吐量的結(jié)果如表2 所示。
表2 機(jī)器學(xué)習(xí)下的貨郵吞吐量預(yù)測值
1.2.2 二次指數(shù)平滑模型預(yù)測
以2001—2021 的武漢天河機(jī)場航空貨郵吞吐量數(shù)據(jù)為二次指數(shù)平滑預(yù)測的建模的時間序列。取2001—2003 的機(jī)場貨郵吞吐量的平均值的數(shù)據(jù)為建模初始值。根據(jù)貨郵吞吐量這個輸入變量對時間的敏感程度確定α 為0.8。
最終二次指數(shù)平滑的貨郵吞吐量預(yù)測結(jié)果如表3 所示:
表3 二次指數(shù)平滑下的貨郵吞吐量預(yù)測值
平均絕對百分比誤差(MAPE)是物流預(yù)測中經(jīng)常用來評估預(yù)測數(shù)據(jù)是否準(zhǔn)確的方法,它可以對每一個預(yù)測數(shù)據(jù)進(jìn)行歸一化處理,避免因個別數(shù)據(jù)誤判準(zhǔn)確度不高。為了對其上兩種預(yù)測方式的結(jié)果進(jìn)行量化分析,可以通過平均絕對百分誤差的計算對2019—2021 這三年預(yù)測的貨郵吞吐量的數(shù)據(jù)進(jìn)行誤差對比,其中當(dāng)MAPE 的范圍在15~20 之間證明該方法的預(yù)測性較好,MAPE 的計算公式為:
所以當(dāng)用機(jī)器學(xué)習(xí)的線性回歸模型預(yù)測時的MAPE 值為15.33;使用二次移動平均模型預(yù)測時的MAPE 值為32.67。
結(jié)果可得,相比二次指數(shù)平滑模型,使用機(jī)器學(xué)習(xí)的線性回歸模型具有較好的預(yù)測精準(zhǔn)度,對機(jī)場貨郵吞吐量的預(yù)測具有較好的優(yōu)勢。
從機(jī)場貨郵吞吐量可以看出,2020 年的數(shù)據(jù)是呈現(xiàn)負(fù)增長趨勢的,這是因為2019 年中美貿(mào)易出現(xiàn)摩擦,加之美國單邊主義的不利影響,給全世界的航空業(yè)帶來很大打擊,隨后又加之新冠疫情的突發(fā)事件,大大沖擊了全球的經(jīng)濟(jì)貿(mào)易,導(dǎo)致2020年的貨郵吞吐量不增反降。但隨著中國經(jīng)濟(jì)迅速恢復(fù),疫情的穩(wěn)步控制,我國的航空業(yè)的未來仍是可持續(xù)提升的,武漢天河機(jī)場的航空物流需求將會呈現(xiàn)出顯著遞增向上的趨勢。
武漢的航空物流發(fā)展空間龐大,機(jī)場的設(shè)備設(shè)施和技術(shù)服務(wù)會很大程度上影響航空公司的發(fā)展,在現(xiàn)有的基礎(chǔ)設(shè)施等諸多方面上不斷改進(jìn),才能夠承載更多的物流需求。對此,對航空公司提出以下建議:(1)加強(qiáng)對貨郵飛行隊伍的建設(shè),改善物流服務(wù)質(zhì)量,提升機(jī)場自身的競爭力;(2)擴(kuò)展新技術(shù),將人工智能、區(qū)塊鏈等高新技術(shù)與相關(guān)設(shè)備運(yùn)用于航空物流,使得航空物流運(yùn)作可視化、可溯源;(3)加強(qiáng)與其他航空公司合作,強(qiáng)化對國內(nèi)外航空公司的激勵措施,擴(kuò)大物流服務(wù)的輻射區(qū)域,共同推出相關(guān)優(yōu)惠政策,互惠互利;(4)加強(qiáng)人才培養(yǎng),為武漢天河機(jī)場航空發(fā)展儲備人才優(yōu)勢。