国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機場繁忙程度的航班延誤波及分析

2019-09-04 06:35許保光劉倩倩高敏剛
中國管理科學 2019年8期
關鍵詞:離港波及貝葉斯

許保光,劉倩倩,高敏剛

(1.中國科學院科技戰(zhàn)略咨詢研究院,北京 100190;2.中國科學院大學公共政策與管理學院,北京 100049)

1 引言

航班延誤是全球航空運輸業(yè)面臨的一大難題。根據(jù)中國民航局每年發(fā)布的民航行業(yè)發(fā)展統(tǒng)計公報[1],中國民航航班正常率呈下降趨勢,從2008年的82.14%下降到2013年的72.34%,只不過2011年比2010年略有回升;且自2010年以來,航班正常率一直未達到80%。航班延誤造成巨大的經(jīng)濟損失,美國五所大學的研究者聯(lián)合發(fā)布的技術報告顯示,2007年美國航班延誤共造成312億美元的總成本,其中旅客延誤成本占到54%,占比排在第一位,航空公司直接運營成本為83億美元,排在第二位[2]。為治理航班延誤,民航局將“提高航班正點率”寫入民航業(yè)十二五發(fā)展規(guī)劃。然而,由于機場繁忙、惡劣天氣、飛機故障和航空公司計劃等原因,航班延誤不可避免。而且,由于前后連續(xù)航班往往共享飛機和/或機組資源,前一個航班的到達延誤和過站時間的延長直接影響后一個航班的正點起飛,這樣一個航班的延誤波及到下游航班,進而導致更多后續(xù)計劃航班延誤。本文主要研究機場繁忙程度對連續(xù)航班延誤波及的影響。機場的飛機起降架次反映機場的載運能力和服務水平,表現(xiàn)出機場工作人員和跑道的繁忙程度,據(jù)此以及數(shù)據(jù)可獲性,本文選擇每小時飛機起降架次作為刻畫機場繁忙程度的指標,每小時航班起降量越大,機場越繁忙。

國內(nèi)外許多學者一直致力于航班延誤波及的相關研究。比較早提及航班延誤波及問題的是Jarrah等[3]。他們在研究干擾發(fā)生后的航班計劃恢復時,指出由于航班計劃緊密相連,當一個航班延誤,后續(xù)航班被迫相應延誤,導致航班延誤波及。后來的學者們對航班延誤及波及的研究,角度和方法各不相同。如Pyrgiotis等[4]構造了一個近似網(wǎng)絡延誤模型AND(The Approximate Network Delays model)來研究規(guī)模機場網(wǎng)絡中的波及延誤問題,用排隊論模型計算單個機場的航班延誤。Rebollo和Balakrishnan[5]通過構造航空網(wǎng)絡延誤狀態(tài)變量,利用隨機森林方法預測航班對上的平均離港延誤,延誤分類誤差率只有19%,但他們的研究只針對航班對,不能細化到單個航班。靖德果等[6]利用正部函數(shù)的性質給出一個基于概率論模型的計算航班出發(fā)延誤時間的公式,從而可以估計每個航班的正點率。而Wong和Tsai[7]借鑒在臨床醫(yī)療領域廣泛應用的生存分析方法,通過Cox比例風險模型進行影響航班延誤的多因素分析,并得出結論:對于離港延誤,影響因素包括過站緩沖時間,機型以及8種延誤原因,對于到港延誤,影響因素包括飛行緩沖時間以及天氣。此外還有一些典型的統(tǒng)計方法,如延誤樹[8-9]、Petri網(wǎng)[10-11]、貝葉斯網(wǎng)絡[12-16]。

Beatty等[8]最早采用航班延誤樹的方法研究延誤波及,并引入延誤乘子的概念來表示延誤波及。他們給出初始延誤發(fā)生的時間、延誤時間和航班計劃中飛行資源(飛行員,機組,飛機)調度之間的線性關系,通過建立航班延誤樹來計算延誤乘子值以表示延誤綜合效果。但他們的研究并沒有用到實際航班數(shù)據(jù)。Ahmadbeygi等[9]也利用建立延誤波及樹的方法來研究飛行資源相關性(主要指飛機相關和飛行員相關)對于航班延誤波及的影響,提出兩大類分析指標:以波及延誤時間除以根延誤時間得到的延誤放大倍數(shù),和以縱向延誤波及航班數(shù)除以延誤波及航班數(shù)表示的延誤波及深度,并且發(fā)現(xiàn)延誤波及深度越小(表示飛行資源分離越多),延誤放大倍數(shù)越大。

丁建立等[10]建立了單架飛機執(zhí)行多個連續(xù)航班任務的時間Petri網(wǎng)模型,并利用仿真數(shù)據(jù)來研究初始航班延誤時間對后續(xù)延誤波及航班數(shù)以及延誤時間的影響。王珊珊等[11]在基本Petri網(wǎng)基礎上定義了有色出現(xiàn)網(wǎng),描述由飛機和機組這兩個關鍵資源銜接所引起的航班延誤的鏈式波及。但作者只是運用有色出現(xiàn)網(wǎng)直觀表示航班延誤的波及鏈條,沒有對波及延誤進行量化處理。

Xu Ning等[12]首先利用貝葉斯網(wǎng)絡對美國的三個樞紐機場間的航班延誤數(shù)據(jù)進行分析,其構建的貝葉斯網(wǎng)絡模型中考慮了天氣、航班取消、時間等因素。劉玉潔等[13]利用貝葉斯網(wǎng)絡分析了進港延誤和航班取消、時間對離港航班延誤波及的影響。曹衛(wèi)東和賀國光[14]分析了連續(xù)航班延誤的波及,構建的貝葉斯網(wǎng)絡中考慮了延誤原因和過站時間偏差。徐濤等[15]用一個ASN(Airline Schedule Network)網(wǎng)來表示航班計劃,并對計劃中的離港/到港事件構建貝葉斯網(wǎng)絡分析模型,考慮的因素包括機場天氣、航班所屬航空公司、航線類型(國際/國內(nèi))、時間段、機型,該分析模型可以對航班計劃中各航班的到港延誤、離港延誤是否發(fā)生及延誤等級進行概率預測。邵荃等[16]用貝葉斯網(wǎng)絡分析機場航班到達延誤到起飛延誤的波及,模型中考慮了航線類型(國際/國內(nèi)/地區(qū))、航班起飛到達時段、延誤原因三個因素。

影響航班延誤波及的原因眾多[17]。民航管理干部學院的王文俊和白福利[18]根據(jù)我國民航運行實際,把航班延誤的主要原因劃分為自然原因、民航主體運行單位(航空公司、機場、空管單位)原因、民航保障單位原因、旅客原因、公共安全事件原因和軍事活動原因。根據(jù)該劃分標準,前面綜述的相關研究往往只考慮了自然原因(如天氣)、航空公司原因(如航班計劃),而沒有考慮機場繁忙程度對航班正常起飛的影響。當機場起降航班增多時,由于停機坪、跑道等設施的容量、地面工作人員服務水平、航班起降程序等的限制,容易導致航班空中或地面等待,從而導致延誤并波及到下游航班。針對這點,本文采用貝葉斯網(wǎng)絡方法分析航班到港延誤對離港延誤的波及,并用算例驗證兩個不同貝葉斯網(wǎng)絡模型的離港延誤預測效果,其中,AD模型用到港延誤預測下一個航班的離港延誤,ATD模型用到港延誤和機場繁忙程度預測下一個航班的離港延誤。算例結果表明,考慮機場繁忙程度的延誤預測模型對航班延誤波及預測更加準確。如果航空公司能預測航班延誤程度并及時采取有效措施應對延誤,對提升航空公司延誤管理和形象有積極作用。

2 航班延誤波及問題描述

飛機是航空公司重要的生產(chǎn)資源,一架飛機一天往往執(zhí)行多個連續(xù)的航班任務,稱之為航班環(huán)。當航線環(huán)的某一節(jié)航班發(fā)生起飛延誤(或者到達延誤)后,導致后續(xù)航班發(fā)生延誤,我們稱之為航班延誤波及。

圖1表示由同一架飛機執(zhí)行的兩個連續(xù)航班間的延誤波及。

圖1 延誤波及模型

其中,航班i,j表示同一個航班環(huán)上的兩個連續(xù)航班;STD和ATD分別表示計劃和實際離港時刻;STA和ATA表示計劃和實際到港時刻;SBT=STA-STD和ABT=ATA-ATD表示計劃和實際飛行時間;STTij=STDj-STAi和ATTij=ATDj-ATAi表示計劃和實際過站時間。

由以上8個變量可推出如下4類延誤時間變量:

DDT=ATD-STD表示航班離港延誤時間,BDT=ABT-SBT表示飛行延誤時間,ADT=ATA-STA表示航班到港延誤時間,TDT=ATT-STT表示過站延誤時間。

延誤波及可以表示為DDTj=ADTi+TDTij,即航班i的到港延誤通過過站過程波及到下一個航班j的離港。

本研究提取同一飛機一天中執(zhí)行航班環(huán)的數(shù)據(jù),建立貝葉斯網(wǎng)絡模型,對數(shù)據(jù)進行分布檢驗,通過參數(shù)學習得到的概率分布進行貝葉斯網(wǎng)絡推理,研究機場繁忙程度對航班延誤波及的影響程度。我們給出如下的問題描述:

給定:1、某航空公司的航班時刻表,以航班環(huán)形式給出,各航班信息包括航班號,起飛機場,降落機場,計劃起飛時間,計劃降落時間;2、航班環(huán)中各航班到港延誤時間;3、航班環(huán)中各航班過站機場的繁忙程度(以小時飛機起降架次描述)。

預測:此航班環(huán)中后續(xù)航班的離港延誤。

3 延誤波及分析的貝葉斯網(wǎng)絡模型

3.1 模型構建

對于航班延誤波及問題而言,貝葉斯網(wǎng)絡的拓撲結構定性地描述了延誤原因對于航班延誤以及延誤間的相互影響,而條件概率表則定量地描述了這種影響。貝葉斯網(wǎng)絡的構造方法有兩種,一種是通過咨詢專家手工構造,另一種是通過數(shù)據(jù)分析獲得[22]。本文首先通過數(shù)據(jù)分析即貝葉斯網(wǎng)絡結構學習得到分析機場繁忙程度的網(wǎng)絡,再結合民航行業(yè)專家經(jīng)驗構造延誤波及分析的貝葉斯網(wǎng)絡。

3.1.1 機場繁忙程度的刻畫

將一天按小時分成24個時段,分別為(t0,t1),(t1,t2),…,(t23,t24),以每個小時機場實際起降飛機架次作為刻畫機場繁忙程度的指標,記為TBSk。對于每個在第k個時段,即(tk-1,tk),離港的航班,根據(jù)其是否有前續(xù)航班和兩個連續(xù)航班是否晚點,將連續(xù)航班可能出現(xiàn)的情景列于表1,以S1-S8表示。

表1 延誤波及情景分析

我們以圖2說明機場實際起降架次動態(tài)變化的過程。假定我們要預測機場i在第k個時段的實際起降架次,在時段k,機場i首先要安排本機場前面時段(時段k-1及以前時段)延誤過來的未起飛的航班(以延誤離港航班集合表示)和延誤到本時段降落的航班(以延誤到港航班集合表示),其次要安排計劃在時段k起降的航班,而這些計劃航班,有可能按計劃在本時段起降(以正常到港航班集合和正常離港航班集合表示),也有可能延誤到后面時段(時段k+1及以后時段)起降。圖2中,延誤到港航班集合對應延誤情景S8,正常到港航班集合對應延誤情景S7,正常離港航班集合包含延誤情景S1,S4和S6,延誤離港航班集合包含延誤情景S2,S3和S5。

圖2 機場繁忙刻畫概念圖

從圖2我們可以看到,機場每小時實際起降的航班數(shù),除了本時段計劃起降的航班外,還包括前面時段延誤到本時段的航班。下文中我們統(tǒng)計由于各種原因延誤到機場i時段k的航班數(shù),以及第k個時段機場計劃起降的航班數(shù),作為要研究的機場繁忙程度的影響變量。

模型中所考慮的影響變量列于表2。

表2 機場繁忙程度的影響變量

我們以某機場若干時段為例,給出機場繁忙程度的貝葉斯網(wǎng)絡結構學習過程及結果。我們共得到5078組樣本(部分見表3)?;贙均值聚類對各變量進行離散化處理,每個變量分成3類或4類,該示例中的每個變量的類中心列于表3。

表3 貝葉斯網(wǎng)絡建模的部分樣本(航班數(shù))(以某機場若干時段為例)

采用K2算法[23]對數(shù)據(jù)進行貝葉斯網(wǎng)絡結構學習。假定的變量順序為TQ、LL、AP、AL、LK、JH、TBS,父節(jié)點的上限為6個。初步學習結果中,變量AL、AP、LK沒有對最后的實際起降架次起到直接影響關系,因此考慮去掉這3個變量。用K2算法再次學習,最終得到的影響機場繁忙程度的貝葉斯網(wǎng)絡結構如圖3所示。圖3表示機場繁忙程度主要受天氣原因延誤過來的航班數(shù)、空中管制原因延誤過來的航班數(shù)以及本時段計劃起降航班數(shù)三個變量的影響。

圖3 機場繁忙程度影響關系的最終學習結果

按照圖3所示的網(wǎng)絡來預測某個時段的機場繁忙程度,結果表明平均預測準確率能達到80%。

3.1.2 延誤波及分析的貝葉斯網(wǎng)絡

通過咨詢專家經(jīng)驗,手工構造貝葉斯網(wǎng)絡步驟如下:

(1)確定網(wǎng)絡結構。確定建模對象范圍,選定一組問題的隨機變量,分析變量之間的因果影響關系,

確定節(jié)點狀態(tài),建立模型結構;

(2)確定網(wǎng)絡參數(shù)。貝葉斯網(wǎng)絡的參數(shù),即各變量的概率分布,一般是根據(jù)貝葉斯規(guī)則通過樣本進行參數(shù)學習獲得,有時也可以從問題的特性直接得到。

本文建立的航班延誤波及的貝葉斯網(wǎng)絡模型結構如圖4所示,我們定義為ATD(Arrival-Terminal- Departure)模型。圖4表示4個連續(xù)航班組成的航班環(huán),DDT_1至DDT_4表示航班的離港延誤時間,ADT_1至ADT_4表示航班的到港延誤時間,TBS_2至TBS_4表示過站機場的繁忙程度。首個航班的離港延誤為根節(jié)點;后續(xù)3個航班的離港延誤程度,有兩個父節(jié)點,一個是前一個航班的到港延誤程度,另一個是過站機場的繁忙程度。表示航班到港延誤程度的變量的父節(jié)點只有一個,即本航班的離港延誤程度。過站機場的繁忙程度有3個父節(jié)點。

圖4 ATD貝葉斯網(wǎng)絡模型拓撲結構

我們把只用到港延誤預測離港延誤的貝葉斯網(wǎng)絡模型定義為AD(Arrival-Departure)模型。AD模型結構如圖5所示。圖5中的節(jié)點,除去根節(jié)點,其余節(jié)點均只有一個父節(jié)點。

圖5 AD貝葉斯網(wǎng)絡模型拓撲結構

延誤時間與延誤等級對應見表4。

表4 航班延誤等級表

機場時段起降架次劃分標準見表5。

表5 TBS_i(i=2,3,4)取值范圍

注:CAN-廣州白云機場,HGH-杭州蕭山機場,KMG-昆明長水機場,PEK-北京首都機場。

3.2 網(wǎng)絡參數(shù)學習

有兩種常用的參數(shù)學習方法,即極大似然估計和貝葉斯估計[24]。相較于極大似然估計,貝葉斯估計多了一個均勻分布的先驗樣本。由于航班延誤波及問題的特殊性,比如當前續(xù)航班出現(xiàn)2個小時以上的延誤時,后續(xù)航班不可能正點起飛,因而均勻分布作為先驗分布并不適用,所以本文采用極大似然估計進行參數(shù)學習。

3.3 分布檢驗

訓練樣本和測試樣本具有相同的分布下,進行預測才是比較合適的。因而在每次驗證前,先進行訓練樣本和測試樣本的分布檢驗。本文采用非參數(shù)估計中的Kolmogorov-Smirnov檢驗,簡稱K-S檢驗。K-S檢驗的原假設為兩個樣本來自同樣的連續(xù)分布。該檢驗思路如下:統(tǒng)計得到兩個樣本的概率累積分布,計算兩個分布的最大差值作為K-S統(tǒng)計量,如果該統(tǒng)計量伴隨概率P值小于顯著水平(通常P的閾值為0.05),則認為兩個樣本總體分布具有顯著性差異。

3.4 概率推理

概率推理是給定貝葉斯網(wǎng)絡一部分節(jié)點的值,稱為證據(jù),求未知節(jié)點稱為觀測節(jié)點的后驗分布。貝葉斯網(wǎng)絡具有雙向推理功能,既可以從作為原因的父節(jié)點推理作為結果的子節(jié)點的概率,稱為預測推理,也可以由作為結果的子節(jié)點推理作為原因的父節(jié)點發(fā)生的概率,稱為診斷推理。本文要預測后續(xù)航班離港延誤等級,因而是正向推理,由原因推理結果。蒙肖蓮等[25]采用期望風險或成本總和最小原則作為貝葉斯決策準則,而本文采用的后驗概率最大化等價于0-1損失函數(shù)時的期望風險最小化。

4 算例

4.1 選取樣本

航班數(shù)據(jù)取自國內(nèi)某航空公司某年航班生產(chǎn)數(shù)據(jù)。本文共以4個航班環(huán)為例來說明,各航班環(huán)上航班的航班號、起飛機場、起飛時段見表6。

表6 航班環(huán)信息

注:flt1-flt4表示航班號,ap1-ap4表示起飛機場三字碼,t1-t4表示起飛時段。

4.2 參數(shù)學習結果

在網(wǎng)絡建立后,通過極大似然估計方法進行參數(shù)學習,限于篇幅,我們僅以第一個航班環(huán)樣本的第二個航班的離港延誤等級的參數(shù)學習結果為例進行說明,表7和表9分別表示AD模型和ATD模型下第二個航班的離港延誤等級條件概率表。

表7 DDT_2的條件概率分布表(父節(jié)點為ADT_1)

表7說明,當?shù)谝粋€航班的到達延誤時間小于等于10分鐘即第一個航班正點到達時,第二個航班正點起飛的概率達到了87%,但當?shù)谝粋€航班的到達延誤時間超過10分鐘且小于30分鐘時,第二個航班正點起飛的概率降到了45.6%,以此類推。

表8 TBS_2的條件概率分布表

表8給出圖3所示機場繁忙程度影響關系下,機場繁忙程度的參數(shù)學習結果(以第一個航班環(huán)樣本的第二個航班的起飛機場和起飛所處時段為例)??梢钥吹?,隨著延誤航班數(shù)和計劃航班數(shù)的增加,機場繁忙的幾率增加。

表9給出不同的到達延誤和機場繁忙程度下,后續(xù)航班的離港延誤時間的概率分布。當?shù)谝粋€航班準點到達時,無論過站機場多么繁忙,第二個航班準點起飛的概率均超過了80%;當?shù)谝粋€航班發(fā)生到達延誤且延誤時間小于30分鐘時,當機場處于極其繁忙狀態(tài)時,第二個航班準點起飛的概率只有50%。

4.3 分布檢驗結果

預測前都要進行K-S檢驗,由于K-S檢驗對于樣本數(shù)有一定的要求,僅給出滿足樣本數(shù)條件下的分布檢驗結果,見表10和表11。其中,k值為構造的檢驗統(tǒng)計量,表示兩個樣本的概率累積分布的最大差異,取值范圍為0到1;p為與檢驗統(tǒng)計量相對應的概率值,閾值為0.05,且p值與樣本數(shù)有關;h值表示檢驗結果,當p值大于0.05時,h等于0,表示保留原假設,當p值小于0.05時,h等于1,表示拒絕原假設。表10和表11分別表示AD模型和ATD模型各自父節(jié)點下第二個航班離港延誤的分布檢驗結果(以第一個航班環(huán)的第二個航班的離港延誤時間分布檢驗為例)。

表9 DDT_2的條件概率分布表(父節(jié)點為ADT_1和TBS_2)

表10 DDT_2的分布檢驗結果(AD模型)

表11 DDT_2的分布檢驗結果(ATD模型)

表10說明,在前續(xù)航班不延誤或者延誤時間小于半個小時的情況下,后續(xù)航班離港延誤時間測試樣本和訓練樣本具有相同的分布。表11給出在前續(xù)航班不延誤或者延誤時間小于半個小時的情況下,當機場處于各繁忙等級時的后續(xù)航班離港延誤時間的測試樣本和訓練樣本的檢驗結果;表11表明對于有足夠樣本數(shù)的前續(xù)航班延誤和機場繁忙程度分類,后續(xù)航班離港延誤時間的測試樣本和訓練樣本具有相同的分布。

4.4 預測結果

在通過檢驗后,利用學習得到的概率分布進行預測。本文采用10折交叉驗證[26]方法給出最后的離港延誤預測準確率,預測準確率定義為預測正確的樣本數(shù)占樣本總數(shù)的百分比。10折交叉驗證的做法如下:把樣本隨機均勻分成相同數(shù)量的10份,每次取1份做測試,剩下9份做訓練;共進行10次,每次的測試集均不相同。10次測試結果取平均作為最終預測結果。為保證結果的穩(wěn)健性,共進行10次10折交叉驗證。表12給出10次10折交叉驗證后取平均的預測準確率。對于樣本涉及的12個航班,ATD模型的預測準確率均大于AD模型的預測準確率,表明機場繁忙程度對延誤波及確實有一定影響。另外,接近一半的航班,ATD模型能將預測準確率提高到80%以上。

表12 預測準確率比較

5 結語

影響航班延誤波及的因素眾多,不同于以往只考慮自然原因或者航空公司原因的研究,本文提出基于機場繁忙程度的航班延誤波及貝葉斯網(wǎng)絡分析方法,以機場小時飛機起降架次作為刻畫機場繁忙程度的指標,并通過貝葉斯網(wǎng)絡結構學習得到機場繁忙程度的影響關系圖。采用10折交叉驗證方法計算離港延誤預測準確率,并以10次結果的平均值作為最終結果,以保證結果的穩(wěn)健性。算例結果表明,與不考慮機場繁忙程度的貝葉斯網(wǎng)絡模型相比,考慮機場繁忙程度的模型能夠更準確地預估航班延誤波及情況。

本文的研究中,許多影響航班延誤的因素諸如航路天氣等并沒有包括進模型中,只要獲得更多更準確的數(shù)據(jù),模型能進一步提高預測精度。另外,現(xiàn)實生活中,延誤時間為右偏分布,即較長延誤時間出現(xiàn)的頻率較低,如何利用這一信息構造先驗分布以得到更為準確的條件概率表是下一步研究的重點。

猜你喜歡
離港波及貝葉斯
基于貝葉斯定理的證據(jù)推理研究
基于貝葉斯解釋回應被告人講述的故事
租賃房地產(chǎn)的多主體貝葉斯博弈研究
租賃房地產(chǎn)的多主體貝葉斯博弈研究
旺角暴亂嫌犯被禁止離港
基于互信息的貝葉斯網(wǎng)絡結構學習
世上幾人“不差錢”
常見易混同義詞語辨析
瑞安市| 公安县| 大关县| 耒阳市| 逊克县| 铜鼓县| 太原市| 军事| 泸溪县| 大理市| 偏关县| 吉林市| 分宜县| 乐安县| 宿松县| 武城县| 开封市| 克山县| 彩票| 凌云县| 新宁县| 公主岭市| 高雄县| 巫山县| 东丰县| 习水县| 建平县| 武胜县| 葫芦岛市| 湘阴县| 皋兰县| 淮南市| 甘肃省| 襄汾县| 大安市| 巴彦县| 高邮市| 南通市| 来安县| 高台县| 德江县|