肖淑敏,李印鳳,2,劉妍煊,閆晨玉,傅航
( 1.華北理工大學(xué) 建筑與工程學(xué)院,河北 唐山063210;2.中國(guó)電科28所空中交通管理系統(tǒng)與技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,江蘇 南京210007;3.中國(guó)民用航空華北地區(qū)空中交通管理局,北京 100621)
隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,民航旅客吞吐量也呈快速發(fā)展態(tài)勢(shì)。民航運(yùn)輸以其高效性、國(guó)際性等優(yōu)勢(shì)成為世界經(jīng)濟(jì)發(fā)展中較快的行業(yè)。2019年我國(guó)僅飛機(jī)起降架次達(dá)到195.532 6萬(wàn)次旅客吞吐量達(dá)到10 001.143 8萬(wàn)人次。航空業(yè)務(wù)量預(yù)測(cè)是機(jī)場(chǎng)發(fā)展決策、規(guī)劃建設(shè)的基礎(chǔ),是確定機(jī)場(chǎng)近期建設(shè)規(guī)劃規(guī)模和遠(yuǎn)期預(yù)留控制的依據(jù)。北京作為中國(guó)的首都,隨著生活水平質(zhì)量的提高和大興機(jī)場(chǎng)的開(kāi)航更加促進(jìn)了北京航空旅客吞吐量增長(zhǎng)。在此趨勢(shì)下,對(duì)北京兩場(chǎng)航空旅客吞吐量進(jìn)行科學(xué)、準(zhǔn)確預(yù)測(cè)尤為重要。
國(guó)內(nèi)一些專家、學(xué)者已對(duì)民航運(yùn)輸開(kāi)展過(guò)許多研究工作,并已取得相應(yīng)成果。舒嚴(yán)嬌使用回歸預(yù)測(cè)法對(duì)機(jī)場(chǎng)輻射區(qū)域內(nèi)的旅客需求量進(jìn)行預(yù)測(cè),選擇巢式離散模型得到旅客吞吐量[1];李明捷等運(yùn)用灰色預(yù)測(cè)方法對(duì)未來(lái)的旅客周轉(zhuǎn)量進(jìn)行預(yù)測(cè)[2,3];陳玉寶等采用組合加權(quán)方法對(duì)預(yù)測(cè)結(jié)果進(jìn)行組合預(yù)測(cè),根據(jù)組合預(yù)測(cè)值和歷史值的誤差比較分析[4-6];張青青等運(yùn)用灰色關(guān)聯(lián)度計(jì)算相關(guān)影響因素,選取神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)[7,8];Dantas等將Bagging 和Holt Winter 模型相結(jié)合,對(duì)航空運(yùn)輸需求進(jìn)行預(yù)測(cè),并與SARIMA和HoltWinters等基準(zhǔn)方法作比較,提供了更為精確的預(yù)測(cè)[9]。WU Xiang-li 建立多元線性回歸模型,對(duì)各省未來(lái)機(jī)場(chǎng)客貨吞吐量及吞吐量增長(zhǎng)率進(jìn)行預(yù)測(cè)[10];李靜嫻等人對(duì)主流的航空運(yùn)輸業(yè)務(wù)量預(yù)測(cè)方法進(jìn)行了詳細(xì)的闡述和歸納[11]。
綜上所述,目前的研究多側(cè)重于利用單一模型做預(yù)測(cè)分析,而某一預(yù)測(cè)方法考慮因素相對(duì)單一,受個(gè)別因素影響大,容易產(chǎn)生較大誤差。故本研究不考慮疫情原因帶來(lái)的近幾年短期影響(根據(jù)國(guó)際民航運(yùn)輸協(xié)會(huì)報(bào)告可知2024年航班運(yùn)輸水平即可恢復(fù)疫情前水平),從長(zhǎng)期戰(zhàn)略角度出發(fā)進(jìn)行宏觀預(yù)測(cè),采用2010~2019年機(jī)場(chǎng)吞吐量數(shù)據(jù),運(yùn)用多元線性回歸模型、時(shí)間序列趨勢(shì)外推模型和灰色GM(1,1)預(yù)測(cè)模型分別對(duì)北京2030年旅客吞吐量進(jìn)行預(yù)測(cè),運(yùn)用熵權(quán)法對(duì)3種預(yù)測(cè)模型進(jìn)行分權(quán)組合,最終得出北京2030年旅客吞吐量,并對(duì)資源優(yōu)化分配問(wèn)題提出了建議措施。
1.1.1多元線性回歸預(yù)測(cè)法
回歸分析[12]是一種預(yù)測(cè)性的模型分析技術(shù),它研究的是因變量(旅客吞吐量)和自變量(年份)之間的關(guān)系。其第一步需要找出影響預(yù)測(cè)值的主要變量,比如,北京的旅客吞吐量與GDP、第二、三產(chǎn)業(yè)增加值、交通運(yùn)輸倉(cāng)儲(chǔ)郵政業(yè)增加值、人口數(shù)等。
以此建立一般模型,如下:
y=α1x1+α2x2+…+αnxn+μ
(1)
式中:y是因變量,α1,…αn是回歸系數(shù),xn是自變量,μ是誤差。
1.1.2趨勢(shì)外推預(yù)測(cè)法
根據(jù)擬合直線方法的相關(guān)原理建立模型。公式如下:
(2)
(3)
(4)
1.1.3灰色GM(1,1)預(yù)測(cè)法
灰色GM(1,1)預(yù)測(cè)模型[15]是指對(duì)歷史旅客吞吐量數(shù)據(jù)進(jìn)行分析,推測(cè)未來(lái)變化趨勢(shì)。該方法基于最小二乘法原理,通過(guò)累加生成弱化隨機(jī)性較為規(guī)律的離散數(shù)據(jù)列,最大可能地將過(guò)去10年的真實(shí)數(shù)據(jù)擬合成曲線,并得到曲線對(duì)應(yīng)的函數(shù)方程。
首先對(duì)已知10年的旅客吞吐量數(shù)據(jù)x0(t)進(jìn)行累加,從而生成新的數(shù)列:x1(t)={x0(t1),x0(t2),…,x0(tn)。
然后根據(jù)數(shù)列x1(t)建立一個(gè)GM(1,1)模型,其微分方程為:
(5)
式中a、u是灰色參數(shù),GM(1,1)基本模型的最小二乘估計(jì)參數(shù)列為:
(6)
其中:
(7)
將求的待定系數(shù)a、u帶入元模型即可得到:
(8)
把計(jì)算所得到的值作累減算子還原得到所求數(shù)據(jù)的估計(jì)值:
(9)
以上過(guò)程均基于Python實(shí)現(xiàn)。
該研究主要目的是對(duì)航空旅客吞吐量進(jìn)行預(yù)測(cè)分析,選擇3種常規(guī)預(yù)測(cè)模型,進(jìn)行利弊分析,得出結(jié)論:多元回歸分析預(yù)測(cè)模型的優(yōu)點(diǎn)為計(jì)算簡(jiǎn)單、精準(zhǔn)度高,但是需要大量數(shù)據(jù),且涉及種類較多;趨勢(shì)外推模型簡(jiǎn)單,操作性較容易,但是僅能對(duì)變化穩(wěn)定的數(shù)據(jù)進(jìn)行預(yù)測(cè);灰色預(yù)測(cè)模型對(duì)原始數(shù)據(jù)要求低,但是復(fù)雜度高,數(shù)學(xué)公式繁瑣。因此采用魯棒性強(qiáng)、單調(diào)性好、數(shù)據(jù)信息恒定和縮放無(wú)關(guān)性的熵權(quán)法,根據(jù)客觀真實(shí)的數(shù)據(jù),運(yùn)用差異驅(qū)動(dòng)原理嘗試求得最佳權(quán)重,做到全面并且真實(shí)地反映指標(biāo)信息,這使其賦權(quán)過(guò)程具有很高的信度和效度。利用客觀賦值的熵權(quán)法得到每一年相關(guān)指標(biāo)體系的誤差大小,考慮到吞吐量預(yù)測(cè)是一個(gè)多指標(biāo)的綜合問(wèn)題,不能孤立地看單一方法預(yù)測(cè)出的結(jié)果,需要借助每一種方法的不同誤差進(jìn)而得到每一種方法誤差的貢獻(xiàn)度,加權(quán)得到最后的預(yù)測(cè)比例。最終使用熵權(quán)模型得到各年份和預(yù)測(cè)方法的熵值與熵權(quán)。
1.2.1基本原理
熵權(quán)法是一種僅依賴于數(shù)據(jù)本身的離散性的客觀賦權(quán)法。其客觀權(quán)重是根據(jù)指標(biāo)變異性的大小來(lái)確定的。在通過(guò)已知數(shù)據(jù)對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí),若某個(gè)指標(biāo)的信息熵越小,表明指標(biāo)值的變異程度越大,提供的信息量越少,在綜合評(píng)價(jià)中所能起到的作用也越小,其權(quán)重也就越小。
1.2.2基本步驟
該算法綜合各種航空運(yùn)輸需求的影響因素,選取各個(gè)年份的誤差作為相關(guān)系數(shù)指標(biāo),運(yùn)用熵權(quán)法計(jì)算出各個(gè)方法的權(quán)重。依據(jù)權(quán)重將3種方法預(yù)測(cè)出的旅客吞吐量進(jìn)行加權(quán)平均,從而預(yù)測(cè)出北京兩場(chǎng)旅客吞吐量。具體的算法如下:
選取m個(gè)誤差,n個(gè)預(yù)測(cè)方法。綜合評(píng)價(jià)指標(biāo)數(shù)值歸一化:
(10)
其中dij為第i個(gè)誤差值的第j個(gè)方法指標(biāo)歸一化結(jié)果,rij為第i個(gè)誤差的第j個(gè)方法的數(shù)值,rmin為第j個(gè)方法指標(biāo)當(dāng)中的最小值;rmax為第j個(gè)方法指標(biāo)當(dāng)中的最大值。
3種方法指標(biāo)比重計(jì)算:
(11)
其中,Pij為第j個(gè)方法指標(biāo)中第i個(gè)誤差所占比重。
各指標(biāo)熵值的計(jì)算:
(12)
其中ej為第j個(gè)方法的熵值。
各指標(biāo)權(quán)重的計(jì)算:
(13)
其中,wj為j個(gè)方法指標(biāo)的權(quán)重,且0≤wj≤1。
誤差綜合評(píng)價(jià)指數(shù)計(jì)算:
(14)
其中,Di為第i個(gè)誤差的綜合評(píng)價(jià)指數(shù)
計(jì)算各個(gè)預(yù)測(cè)方法的權(quán)重Wk(k=1,2,…,h):
(15)
(16)
其中yk為第k種方法的旅客吞吐量。
根據(jù)國(guó)家統(tǒng)計(jì)局發(fā)布的2010~2019年北京經(jīng)濟(jì)、交通運(yùn)輸量,利用Python軟件對(duì)旅客吞吐量的影響因素做了相關(guān)性分析,結(jié)果顯示:北京的旅客吞吐量與GDP、人均GDP,第二、三產(chǎn)業(yè)增加值,交通運(yùn)輸倉(cāng)儲(chǔ)郵政業(yè)增加值、人口數(shù)、接待國(guó)際游客數(shù)、國(guó)內(nèi)游客數(shù)、鐵路旅客周轉(zhuǎn)量、公路旅客周轉(zhuǎn)量、航空運(yùn)輸業(yè)就業(yè)人數(shù)相關(guān)性顯著。如圖1所示為2010~2019年北京旅客吞吐量相關(guān)性分析。
圖1 旅客吞吐量相關(guān)性分析
除以上北京的經(jīng)濟(jì)、計(jì)劃、環(huán)境因素影響以外,在2019年以前,北京的旅客吞吐量主要由首都機(jī)場(chǎng)和南苑機(jī)場(chǎng)組成,2019年10月大興機(jī)場(chǎng)開(kāi)航后,南苑機(jī)場(chǎng)不再進(jìn)行民航旅客運(yùn)輸,主要為首都機(jī)場(chǎng)和大興機(jī)場(chǎng)。3座機(jī)場(chǎng)近10年的旅客吞吐量分布如表1所示。
表1 2010~2020北京旅客吞吐量分布/萬(wàn)人
(1)根據(jù)1.1.1中多元回歸模型,計(jì)算得出:
y=8.97x1-0.1x2-9.8x3-8.27x4+2.47x5+0.3x6-8.04x7+8 063.197 29
(17)
其中,根據(jù)相關(guān)性分析可知,x1為“北京GDP”,x2為“北京人均GDP”,x3為“第二產(chǎn)業(yè)增加值”,x4為“第三產(chǎn)業(yè)增加值”,x5為“交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政業(yè)增加值”,x6為“全國(guó)國(guó)內(nèi)游客”,x7為“北京鐵路旅客周轉(zhuǎn)量”。此模型的決定系數(shù)R2=0.981 94>0.95,接近于1,擬合程度很高,平均誤差為0.59%。
(18)
此模型的決定系數(shù)R2=0.99>0.95,接近于1,擬合程度很高,平均誤差為0.86%。
(3)根據(jù)1.1.3中灰色GM(1,1)模型得出平均誤差為0.70%。
計(jì)算所得3種方法的2010~2019年旅客吞吐量如圖2所示,2010~2019年的平均相對(duì)誤差分別為:0.59%、0.86%和0.70%,如表2所示。
圖2 2010~2019年旅客吞吐量預(yù)測(cè)
表2 2010~2019誤差分析/%
通過(guò)熵權(quán)法,使用python軟件可以確定旅客吞吐量權(quán)重:多元線性回歸:0.405 142 288;趨勢(shì)外推:0.253 003 9;灰色預(yù)測(cè)模型:0.341 853 8。熵權(quán)大小反映了誤差對(duì)預(yù)測(cè)方法的影響程度及重要性。預(yù)測(cè)結(jié)果和相對(duì)誤差如表3所示。
表3 熵權(quán)法2010~2019年吐量預(yù)測(cè)與誤差分析
由表3可知,由熵權(quán)法預(yù)測(cè)的近十年旅客吞吐量平均值為9 343.495萬(wàn)人,相對(duì)誤差最小為0.1%,最大為1.25%,平均相對(duì)誤差為0.63%,此結(jié)果相對(duì)誤差值較小,在可接受范圍內(nèi),故得到的預(yù)測(cè)值相對(duì)準(zhǔn)確可信。利用預(yù)測(cè)模型,采用熵權(quán)法進(jìn)行賦值,最終得出如圖3所示2030年北京機(jī)場(chǎng)旅客吞吐量的預(yù)測(cè)結(jié)果。
圖3 2021~2030年北京旅客吞吐量預(yù)測(cè)
由圖3可知基于自身優(yōu)勢(shì),得出的誤差相對(duì)較小,最終預(yù)測(cè)北京兩場(chǎng)2030年的旅客吞吐量為16 330.688 21萬(wàn)人次。
基于北京地區(qū)未來(lái)10年旅客吞吐量的宏觀預(yù)測(cè)結(jié)果,為更好地發(fā)揮北京“一市兩場(chǎng)”運(yùn)行模式的優(yōu)勢(shì),提出以下幾點(diǎn)發(fā)展建議:
(1)根據(jù)旅客吞吐量預(yù)測(cè)結(jié)果,在預(yù)戰(zhàn)術(shù)階段進(jìn)行兩場(chǎng)飛行量的優(yōu)化配置,充分利用兩場(chǎng)互補(bǔ)的優(yōu)勢(shì),對(duì)飽和機(jī)場(chǎng)進(jìn)行分流,促進(jìn)兩場(chǎng)的協(xié)調(diào)發(fā)展,實(shí)現(xiàn)兩場(chǎng)資源的統(tǒng)籌配置。
(2)在“一市兩場(chǎng)”的模式下,逐年增高的旅客吞吐量促使各航司優(yōu)化航班計(jì)劃,根據(jù)其區(qū)位的不同為不同區(qū)域的旅客出行提供方便,帶動(dòng)不同區(qū)域的經(jīng)濟(jì)發(fā)展,從而帶動(dòng)京津冀地區(qū)的航空運(yùn)輸保障能力整體提升。
以多元線性回歸模型、趨勢(shì)外推模型和灰色GM(1,1)預(yù)測(cè)模型為基礎(chǔ),提出了基于熵權(quán)法賦值的組合預(yù)測(cè)方法,熵權(quán)法預(yù)測(cè)模型綜合吸收了計(jì)算簡(jiǎn)單、精準(zhǔn)度高、原始數(shù)據(jù)要求低等優(yōu)點(diǎn),避開(kāi)其需要大量數(shù)據(jù)涉及種類較多等缺點(diǎn),這種方法相比單一模型預(yù)測(cè)的結(jié)果能夠減少極端數(shù)據(jù)的產(chǎn)生。最后對(duì)2030年北京兩場(chǎng)旅客吞吐量進(jìn)行了預(yù)測(cè),并對(duì)未來(lái)資源優(yōu)化分配提出2條建議。