陳華群, 王玉玨, 柳藴棲
(中國民用航空飛行學院 空中交通管理學院,四川 廣漢 618307)
突發(fā)公共事件是指突然發(fā)生,造成或者可能造成嚴重社會危害的災害或災難。由于事件的發(fā)生、防控和造成的破壞程度都具有不確定性,眾多歷史事件表明重大突發(fā)公共事件擾亂正常的航班飛行量運行次序甚至使整個民航行業(yè)都陷入低迷。如:美國911恐怖襲擊事件導致美國航空連續(xù)3個月在20%以上降幅,持續(xù)約3年才恢復到事發(fā)前水平;08年5月,汶川地震導致成都雙流機場臨時關閉,全國所有往返成都的航班備降或取消;11年日本地震引發(fā)海嘯導致福島核電站泄露影響長達數(shù)年的對日航班運行;2020年爆發(fā)的新冠疫情導致全球旅客運輸航班量呈現(xiàn)斷崖式下跌,當年2月我國單日客座率降至39.45%,比去年同期減少89%,隨著疫情擴散,全球近20家航空公司申請破產(chǎn),整個行業(yè)低谷徘徊。因此,有必要深入分析突發(fā)公共事件對航空運行的影響關聯(lián),運用現(xiàn)代信息技術,建立一套智能的飛行量預測體系,安全、高效地調配運力資源,為后續(xù)制定航空運行調整策略提供參考。
當前信息化、數(shù)字化和智能化融合技術已經(jīng)廣泛運用到突發(fā)公共事件對行業(yè)的影響分析和未來趨勢預測,主要有:王欣欣運用SPSS軟件對突發(fā)公共事件的輿情主體、客體、本體、媒體的樣本進行分類,構建了網(wǎng)絡輿情預測模型和方法,指出了突發(fā)公共事件發(fā)生時政府、媒體及其他相關企業(yè)或部門根據(jù)不同事件輿情的不同特點,采取針對性對策,有助于提高處理效率[1];李秋霞構建了 PHEEI-CGE 模型測算城市突發(fā)公共衛(wèi)生事件對我國宏觀經(jīng)濟和行業(yè)產(chǎn)出的影響,指出了從運行、整合、保障三方面系統(tǒng)和科學地應急處置協(xié)同機理[2];肖夢黎等從民眾認知與專家知識之間認知差異的視角下,提出了在治理公共突發(fā)危機中的風險溝通模式,該研究思路可借鑒為航空運輸預測時需納入社會大眾心理認知和行業(yè)專家意見[3];武昭原等利用ABM建模方式解決了不同市場主體的行為決策下的不平衡資金分配機制,該研究提出的將市場化程度、可再生能源滲透率和免考核區(qū)間等外圍影響因素,納入資金分配平衡預測[4];甘國育提出基于長短期記憶網(wǎng)絡和深度學習機制的航線的客運量和航班票價預測方法,引入神經(jīng)網(wǎng)絡有效處理了航班和票價在時間維度上復雜的非線性、非平穩(wěn)性關系[5];倪超等采用ARIMA、人工神經(jīng)網(wǎng)絡和機器學習三種基于時間序列的預測方法對高空管制區(qū)航班流量進行擬合對比,得出人工神經(jīng)網(wǎng)絡的隨機森林的預測方法準確度最高[6];陳彥暉等針對波動性上升或下降的時間序列,建立了基于廣義等高線的灰色波形預測模型和方法,分別以我國民航客運量預測進行上升趨勢和近期原油價格作為下降趨勢預測驗證,引入樣本內(nèi)數(shù)據(jù)建模和樣本外數(shù)據(jù)預測的模式,實現(xiàn)了較小樣本數(shù)量的發(fā)展變化預測[7];萬連成等分別使用了傳統(tǒng)、新信息和新陳代謝GM(1,1)灰色預測模型對新冠肺炎疫情期間的飛機利用率、確診人數(shù)、治愈人數(shù)等做灰色短期預測,由于僅選取了10天的數(shù)據(jù),使得預測結果不能完全體現(xiàn)疫情發(fā)展的生命周期[8];楊璐等構建了基于多元線性回歸法和灰色GM(1,1)模型的后疫情時期機場起降量組合預測法[9],該方法較依賴基于時間序列的歷史數(shù)據(jù),且未充分考慮疫情發(fā)展的不確定性,可能會導致預測結果抗外界干擾能力較弱。
通過現(xiàn)狀分析發(fā)現(xiàn)針對突發(fā)公共事件對航空業(yè)影響大多集中在定性管理策略,運用數(shù)據(jù)關聯(lián)分析、深度定量挖掘和智能預測的研究較少。因此,本文擬運用斯皮爾曼等級相關方法定量公共突發(fā)事件發(fā)展態(tài)勢對航空運輸?shù)挠绊戧P聯(lián),擬構建人工神經(jīng)網(wǎng)絡飛行量預測模型,明確公共突發(fā)事件對航空運行的正向傳播的影響波及范圍,由飛行量預測趨勢反向計算公共突發(fā)事件下各項策略的影響權重和激活方式。
突發(fā)公共事件包括自然災害、事故災難、公共衛(wèi)生事件和社會安全事件,根據(jù)人類社會對事件現(xiàn)有的認知和處理能力,分為可預控和不可預控[10~12]。上述特性對航空出行者即具有一定的心理影響效應,也屬于社會公共行為,本文引入ABI(Agent Based Index)機制,將突發(fā)公共事件作為個體引導特征,最終輸出造成影響的不同運營范圍和起降架次的ABI指標,具體流程如圖1所示。
圖1 基于ABI機制的突發(fā)事件下的飛行量預測
預測流程充分運用ABI的另一個核心要素“代理人”的特性,使之與突發(fā)公共事件的發(fā)展生命周期的相互融入,構建了突發(fā)公共事件下的影響航班預測的要素。
由圖1可知:根據(jù)歷史經(jīng)驗數(shù)據(jù),若突發(fā)公共事件屬于可防控類,則進入ABI的主動“代理模式”,判斷事件屬性確定事件發(fā)生的階段和預計持續(xù)的周期,確定突發(fā)公共事件的各要素對飛行量預測的影響指標。
為確定突發(fā)公共事件與航空飛行量變化趨勢之間的關聯(lián),分別設置兩個變量集(X,Y)。X代表突發(fā)公共事件的等級集,設為X={x1,x2,x3,x4},分別表示Ⅰ級(特別重大)、Ⅱ級(重大)、Ⅲ級(較大)和Ⅳ級(一般),屬于有序等級變量。為了實現(xiàn)橫向和縱向的航班數(shù)量與突發(fā)公共事件發(fā)生的關聯(lián)分析,設飛行種類變量集Y={Y1,Y2},Y1代表與去年同期運行種類數(shù)量的比例變化,Y2為當年不同事件等級下的運行種類比例變化,均屬于連續(xù)變量。上述變量符合斯皮爾曼等級相關性檢驗的要求。
選取研究周期內(nèi)m天各類運行種類數(shù)量為樣本容量n,根據(jù)應急管理部門公布的信息,確定突發(fā)公共事件等級的變化;利用歸一化處理方法將研究周期內(nèi)的各種類型分別取n個原始飛行種類數(shù)據(jù)被轉換成連續(xù)比例變化。依據(jù)原始飛行種類數(shù)量在總體數(shù)據(jù)中平均的降序位置,被分配了一個相應的等級。兩者之間的相關系數(shù)ρ計算如式(1)所示:
(1)
式中,Δdi表示被觀測的各類運行兩兩變量的等級差值。
利用SPSS數(shù)據(jù)分析技術,統(tǒng)計分析歷史公共突發(fā)事件對各種運行類別數(shù)量的影響,利用機器學習挖掘兩類數(shù)據(jù)之間的斯皮爾曼關聯(lián)性,采取樣本如表1所示,每一行兩個變量集取值代表研究周期內(nèi)每日的數(shù)據(jù),選擇斯皮爾曼相關性檢驗。
表1 變量的數(shù)據(jù)采樣
表1:i=1,2,3,4表示突發(fā)公共事件的4種等級;t=0,1表示上年度和本年度;j=1,2…m表示研究周期內(nèi)的每一天;變量Y按照各類航班分別按式(2)和(3)計算橫向和縱向占比。
依據(jù)公共突發(fā)事件與飛行量變化的歷史數(shù)據(jù)實現(xiàn)了二者相關性檢驗,定量了兩者直接的正負關聯(lián),排除了不相關的要素。同時將歷史數(shù)據(jù)所反映的趨勢可作為輸入樣本,通過樣本數(shù)據(jù)的訓練,不斷修正網(wǎng)絡權值和閾值使誤差函數(shù)沿負梯度方向下降,逼近期望的預測值。由此建立的基于BP神經(jīng)網(wǎng)絡的飛行量預測改善模型,即利用了時間序列預測的數(shù)據(jù)趨勢,又充分考慮了外界條件發(fā)生重大變化影響航空運行的動態(tài)約束,使預測結果更加貼近實際。
基于BP神經(jīng)網(wǎng)絡的正向傳播和反向計算的數(shù)據(jù)訓練方式,飛行量預測網(wǎng)絡由輸入層、隱藏層、輸出層組成[13~15]。輸入層包括研究周期內(nèi)的各類運行的起降量和突發(fā)公共事態(tài)的統(tǒng)計,隱含層代表突發(fā)公共事件下的運行約束,輸出層輸出l維各種運行的預測量,具體BP神經(jīng)網(wǎng)絡預測結構如圖2所示。
圖2 航班預測BP神經(jīng)網(wǎng)絡結構
上圖可知:輸入層將他們作為給定訓練D={(x1,y1),(x2,y2),…,(xn,yn)},其中xn∈Rd,yn∈Rl,表示輸入的各類運行的起降架次由d個屬性組成;隱含層根據(jù)專家經(jīng)驗和輸入輸出數(shù)據(jù)關聯(lián),將國際事態(tài)、國內(nèi)防控、地區(qū)協(xié)調、行業(yè)規(guī)劃和公司運營作為5個神經(jīng)元;設置兩層輸出,第一層為各類運行起降架次的預測量,第二層為的1個神經(jīng)元代表總起降量。
上述建立的飛行量預測BP神經(jīng)網(wǎng)絡是一種多層前饋網(wǎng)絡,為求得預測輸出值,關鍵需要確定輸入層與隱含層、隱含層與輸出層的權值和各神經(jīng)元的閾值。
將研究周期內(nèi)的國內(nèi)、國際、港澳、臺灣地區(qū)、客運和貨運起降架次與突發(fā)公共事件變化趨勢的關聯(lián)作為輸入,因此建立15×6的輸入層到中間層的權值矩陣。突發(fā)公共事件通常較難確定其完整的生命持續(xù)周期,影響未來飛行量的各類約束也是隨時動態(tài)變化的。本文基于Matlab的神經(jīng)網(wǎng)絡訓練能力使用隨機的方式,通過歷史數(shù)據(jù)的關聯(lián)性學習,以此進行訓練突發(fā)事件與飛行量的未來變化規(guī)律,確定各層神經(jīng)元之間的權重矩陣參數(shù)。為增加梯度下降收斂到較低訓練錯誤的幾率,按照各類飛行量進行自適應降序方式取值。
設θi為各神經(jīng)元的閾值,根據(jù)生物學中的知識,只有當神經(jīng)元接收到的信息達到閾值是才會被激活[16]。本文采用Sigmod函數(shù)作為神經(jīng)元激活,利用它可以把輸入從負無窮大到正無窮大的信號變換成0到1之間輸出,不但有利于直觀呈現(xiàn)飛行量變化的趨勢,也能實現(xiàn)某一時間段內(nèi)航班隨疫情的非線性映射,激活函數(shù)如式(4)所示:
本文通過改進Matlab自帶的BP神經(jīng)網(wǎng)絡的輸入關聯(lián),以突發(fā)公共事件生命周期的飛行量趨勢變化作為訓練函數(shù)確定權值和閾值,實現(xiàn)各層神經(jīng)元的連接,通過學習計算實現(xiàn)預測輸出;將輸出數(shù)據(jù)與實際輸出比較,誤差反傳,不斷調整權值和閾值,直至達到設置的最大迭代次數(shù)或者預期的誤差區(qū)間。具體算法步驟:
Step1生成飛行量預測的BP神經(jīng)網(wǎng)絡結構,并完成變量的初始化。設置訓練循環(huán)次數(shù)即net.trainParam.epochs=T,初始化網(wǎng)絡結構,給定誤差ε=0.01。
Step2樣本xi輸入預測網(wǎng)絡。根據(jù)設定的研究周期,輸入突發(fā)公共事件和飛行量的數(shù)據(jù)變化,以此進行關聯(lián)訓練后,將信息輸入Matlab平臺建立的預測網(wǎng)絡,即data=xlsread(‘數(shù)據(jù)’,‘Sheet1’,‘研究周期第一天:研究周期最后一天’)。
Step3各層之間的網(wǎng)絡訓練。通過各節(jié)點間的連接情況正向逐層處理后,調用train和test反復訓練和測試,完成神經(jīng)網(wǎng)絡的實際單向輸出。
Step4計算實際輸出與期望輸出的誤差。按最小誤差準則來不斷調整網(wǎng)絡結點的權值,直至誤差。
Step5誤差的反向回傳。將誤差逐層反向回傳至之前各層,并按一定原則將誤差信號加載到連接權值ωjk上,使整個神經(jīng)網(wǎng)絡的連接權值向誤差減小的方向轉化。
Step6預測結果輸出。使用matlab的神經(jīng)網(wǎng)絡工具訓練重復以上步驟,直到整個訓練樣本集的誤差減小到符合要求為止,否則轉入Step3。
為更直觀體現(xiàn)飛行量受突發(fā)事件影響的波動,本文引入歸一化處理的方式,讀取的訓練樣本數(shù)據(jù)都歸一化到[0,1]之間。
為驗證模型和算法的可行性和預測效果,以當前全球新冠疫情事件下的民用運輸類航班運行為例,運用大數(shù)據(jù)處理技術可知:疫情的發(fā)展和航班量的變化存在相關性;疫情逐漸走向可控化階段,航班量逐步恢復到疫情前的水平。
2020年的航班實際起降次數(shù)較2018年和2019年不僅是總起降次數(shù)、國內(nèi)國際以及港澳臺地區(qū)均有所減少,運用Matlab三年按月縱向統(tǒng)計對比結果如圖3所示。
圖3 我國近三年航班量縱向對比
通過數(shù)據(jù)分析可知:自2020年2月份疫情爆發(fā)后,航班量驟減至1月份的27%,同比2018、2019年同期分別減少67.9%和70.4%。隨著疫情的不斷控制,航班量逐漸恢復至同期水平,為分析新冠疫情的事態(tài)與航班變化的關聯(lián)趨勢,運用SPSS對2020年兩者每月的橫向對比進行分析,對照結果如圖4所示。
圖4 2020年新冠疫情變化與航班總量對照
通過Matlab關聯(lián)分析可知:2020年由于新冠肺炎原因造成航班量減少,2月為全年最少,在之后的十個月隨著疫情逐漸控制,航班量呈波動上升趨勢,且逐漸恢復到疫情前的水平。
2020年1月底我國疫情大量爆發(fā),對航班量振幅巨大。本文以2020年1月20日到3月12日53天爆發(fā)高峰期期內(nèi)的國際和國內(nèi)航班量與每日新增病例的變化趨勢為研究對象,通過歸一化處理,分析全球主要國家和我國新冠確診人數(shù)與我國國際國內(nèi)航班數(shù)量變化趨勢的對照,分析結果如圖5所示。
圖5 我國疫情爆發(fā)高峰期與航班量變化趨勢對比
通過圖5分析可知:國內(nèi)疫情剛爆發(fā)時,航班總量與往年同期變化不大,體現(xiàn)了面臨未知的公共衛(wèi)生事件,航空運輸具有一定的延遲效應;國際航班在國內(nèi)某一區(qū)域疫情爆發(fā)期卻呈現(xiàn)不降略增的逆勢,體現(xiàn)了國際航班主要受全國和全球疫情事態(tài)的影響。
為分析我國新冠疫情發(fā)展狀況與航班量動態(tài)變化的趨勢特征,運用SPSS數(shù)據(jù)關聯(lián)性處理對2020年全年數(shù)據(jù)的發(fā)展態(tài)勢進行對照分析,分析疫情國內(nèi)每日新增確診人數(shù)、全球每日新增確診人數(shù)和國內(nèi)航班量、國內(nèi)航班量以及港澳臺航班量的斯皮爾曼相關性結果分別如圖6所示。
通過數(shù)據(jù)相關性分析,可知:全球新增確診人數(shù)和國際航班量的斯皮爾曼相關系數(shù)為-0.149,二者為負相關呈反比函數(shù),全球每日新增病例數(shù)量限制了國際航班量架次;國際航班量也受我國國內(nèi)疫情影響,國內(nèi)新增確診人數(shù)和國際航班量的斯皮爾曼相關系數(shù)為0.477、與國內(nèi)航班量的斯皮爾曼相關系數(shù)為-0.328,表明存在顯著相關。相關系數(shù)為負說明二者呈反比例函數(shù),每日確診人數(shù)作為獨立變量,國內(nèi)航班量為依賴變量,當每日新增確診病例增加時,國內(nèi)航班量減少;當每日確診病例減少時,國內(nèi)航班量增加。
基于Matlab.net對3層航班預測BP神經(jīng)網(wǎng)絡進行訓練,輸入神經(jīng)元為2018、2019、2020以及2021年前10個月的每月航班量與之對應的新冠疫情事態(tài)關聯(lián)事件,隱含層神經(jīng)元個數(shù)設定為15個,輸出層的神經(jīng)元國內(nèi)、國際和客貨總計預測航班量4個。
樣本選取了46個月航班總量,為了避免過擬合,設置數(shù)據(jù)中的70%劃分為訓練集進行訓練,15%的數(shù)據(jù)作為驗證集進行驗證,15%的數(shù)據(jù)作為測試集進行測試。利用本文提出的改進net.iw進行訓練,得到如表2所示的輸入層至隱含層的權值矩陣。
設置最大訓練次數(shù)為1000次,自回歸結束為3,運用本文提出的基于突發(fā)公共事件生命周期的航班預測BP訓練機制,Matlab平臺運行代碼共計迭代23次并得到國內(nèi)、國際和客貨航班未來8個月的預測結果,分別如圖7至圖10所示。
圖7 未來8個月國內(nèi)航班預測結果
圖8 未來8個月國際航班預測結果
圖9 未來8個月客運航班量預測
圖10 未來8個月貨運航班總量
由上述預測結果可知:隨著2020年國慶假期之后的新冠疫情的全國范圍內(nèi)小幅度爆發(fā),2020年11月和12月份有所減少,月航班總量預計為30萬架次左右;2022年1月后的未來4個月我國月航班總量會維持在40萬架次。
對總量、國際、國內(nèi)和客貨航班進行預測,選取總航班量對模型預測誤差進行分析,經(jīng)過神經(jīng)網(wǎng)絡的23次的迭代,將未來航班量進行預測,其中存在預測誤差,最佳的驗證集在第17次迭代時出現(xiàn),此時模型平均誤差最小為415423915.9959,訓練集、驗證集和測試集平均誤差如圖11所示。
圖11 訓練集、驗證集、測試集平均誤差
同時把神經(jīng)網(wǎng)路輸出值和實際值放入一個圖中能表現(xiàn)出模型的訓練集驗、證集以與實際航班量之間的誤差,反映出模型建立是否得當,具體誤差分布如圖12所示。
圖12 預測誤差分布圖
從誤差圖中可知:在46組數(shù)據(jù)中,該模型出現(xiàn)3次輸出與實際誤差較大情況,43組輸出誤差與實際值基本一致。
以突發(fā)公共事件作為航空運行的外界干擾,構建基于ABI機制的突發(fā)事件下的飛行量預測特性,利用SPSS數(shù)據(jù)分析技術確定了突發(fā)公共事件與起降架次變化的關聯(lián)性,運用Matlab神經(jīng)網(wǎng)絡的數(shù)據(jù)訓練和計算,建立了非線性飛行量預測改善模型。以2020疫情防控與國內(nèi)外運輸航班量作為給定的輸入值,通過疫情與航班變化規(guī)律的關聯(lián)性訓練,學習運輸航班受境內(nèi)外疫情防控的約束限制規(guī)則,將各種約束條件設定為隱藏層的神經(jīng)單元,模擬一定程度內(nèi)的任意復雜非線性映射的計算搜索技術,得到最接近期望輸出值的未來飛行量預測結果。
本文建立的飛行量預測模型和算法充分考慮了外界因素的干擾,通過調整輸入對象和對應的隱含條件,上述方法也適用于低空通航飛行量的需求預測。由于篇幅和取材限制,本文只選取了國內(nèi)疫情的數(shù)據(jù)作為獨立變量參與相關性分析,并未完全統(tǒng)計國外疫情的相關數(shù)據(jù)。因此,在選取樣本期間呈單調遞減趨勢,斯皮爾曼相關系數(shù)為正相關,相關性分析存在一定的偏差。