邱樹萍 吳薇薇 侯美麗
(南京航空航天大學民航學院 南京 210016)
基于Copula函數的航班延誤相關性分析*
邱樹萍吳薇薇侯美麗
(南京航空航天大學民航學院南京210016)
摘要:不同因素引起的航班延誤產生的波及影響是不同的.運用Copula理論研究了由空中管制原因導致的初始延誤引發(fā)的連續(xù)航班延誤之間的相關性,并進一步分析了初始延誤對次航班的波及效應.研究發(fā)現兩航班延誤時間都較長的組合數對出現的頻率較高;初始延誤對次航班的波及影響跟初始延誤時間長短有關.隨著初始延誤時間的增長,對次航班波及影響表現為吸收的可能性增加,延誤傳遞和增強的可能性下降.
關鍵詞:航空運輸;相關性;Copula理論;航班延誤;波及效應;尾部相關
邱樹萍(1989- ):女,碩士生,主要研究領域為交通運輸系統(tǒng)優(yōu)化
0引言
由于航班之間存在飛行器、機組及服務人員等資源共享,同時航空公司在安排運行計劃時,考慮到運行成本最小化和資源利用最大化目標,一旦某個航班遭受延誤很大程度上會影響后續(xù)航班的正常運行,即形成延誤波及效應.國內外一些學者運用多種不同的方法進行了研究.如文獻[1]通過構造貝葉斯網絡模型探討了國內某樞紐機場進港航班延誤和航班取消對離港航班延誤的影響.文獻[2]提出了用構造航班延誤波及樹的方法,清晰的展現了根節(jié)點延誤通過機組和飛機資源在網絡中傳播的過程.文獻[3]提出了延誤加法器的概念用于評估延誤的累計,引入了延誤累積(delay multiplier,DM)指標評估初始延誤造成的總延誤影響.這些文獻針對航班延誤對后續(xù)航班的波及影響運用了不同的方法,主要是從飛行資源、進離港延誤角度進行研究,但都未涉及對初始延誤引發(fā)的連續(xù)航班延誤之間的相關性進行分析.文獻[4]研究了邊緣分布均為非正態(tài)分布的輪擋延誤和登機門到達延誤之間的相關性,采用了在金融風險建模、經濟學、計量經濟學中常用的一種方法——Copula函數.Copula函數是一種靈活穩(wěn)健的相關性分析工具,尤其體現在研究隨機變量間的相關關系上.如文獻[5]引入Copula函數來代替?zhèn)鹘y(tǒng)方法估計VaR使得度量的相關性不再局限于線性相關性.文獻[6]運用混合Copula函數對上海、深圳股票市場進行了相關分析研究,其結果體現了混合Copula函數的靈活性.
本文利用Copula函數建立2連續(xù)航班延誤的聯合分布,借助建立的聯合分布函數計算2連續(xù)航班延誤分別落在不同區(qū)間的條件概率,由此進一步分析由空中管制原因導致的初始延誤對后續(xù)航班的波及影響——吸收、傳遞或增強.
1研究方法
1.1Copula理論
Copula的研究最早源于Sklar,Copula一詞原意是交換、連接的意思.Nelse對Copula函數做了嚴格的定義,Copula函數是把隨機變量ξ1,ξ2,…,ξn的聯合分布函數F(x1,x2,…,xn)與各自的邊緣分布函數Fξ1(x1),Fξ2(x2),…,Fξn(xn)相連接的連接函數,即函數C(u1,u2,…,un),使
(1)
與傳統(tǒng)的線性相關系數相比,Copula模型不限制邊緣分布的選擇,且當對變量作單調增變換時,由Copula函數導出的一致性和相關測度的值不會改變,因此使用Copula函數進行建模將變得更加靈活.常用的Copula函數有二元正態(tài)Copula函數、二元t-Copula函數、Gumbel Copula函數、Clayton Copula函數、Frank Copula函數.它們的密度函數都有各自的分布特征能刻畫不同的隨機變量之間的相關關系.
1.2Kendall秩相關系數τ
在統(tǒng)計學中,Kendall相關系數是一個基于非參數檢驗方法得到的相關性統(tǒng)計量.設(x1,y1),(x2,y2)為獨立同分布的向量,則Kendall相關系數為
(2)
式中:P[(x1-x2)(y1-y2)>0]為x與y的變化一致的概率,因此τ反映了x與y變化一致與否的程度.本文主要應用Kendall的τ與Copula函數關系進行相關參數計算,Kendall的τ與Copula函數之間的關系為[7]
(3)
2實例分析
2.1確定邊緣分布函數
本文采用的研究數據來源于國內某航空公司提供的若干個月的航班延誤數據,包含了736對基于航班串的由空中管制原因導致的初始延誤引發(fā)的連續(xù)航班.航班延誤數據均來自到達延誤,如圖1所示航班A和航班B由同架飛機執(zhí)行,航班A到達機場b時延誤(延誤由空中管制原因導致),航班B受航班A波及影響到達機場c時延誤,需要說明的是航班A不一定是飛機執(zhí)行的第一個航班,而是航班串中首個遭受延誤的航班.將2航班延誤作為隨機變量,采用正態(tài)分布、對數正態(tài)分布、威布爾分布、伽馬分布這4種連續(xù)變量概率分布函數對2個隨機變量的服從的邊緣分布函數進行分析.運用極大似然估計對連續(xù)概率分布函數進行參數估計,并通過Cramer-von Mises檢驗方法對2連續(xù)航班延誤隨機變量進行擬合優(yōu)度檢驗,以確定最優(yōu)概率分布函數.根據擬合優(yōu)度檢驗結果選擇樣本A和樣本B最優(yōu)邊緣分布均為對數正態(tài)分布,相應參數和檢驗統(tǒng)計量見表1.
圖1 航班執(zhí)行示意圖
樣本概率分布均值/比例參數標準偏差/形狀參數檢驗統(tǒng)計量W2ALognormal3.800.490.63BLognormal3.890.520.14
2.2Copula函數的參數估計及擬合優(yōu)度評價
利用SAS軟件計算兩個變量的秩相關系數τ=0.252 9.通過秩相關系數τ與Copula函數的關系式計算出各Copula函數的參數θ,然后計算五種Copula函數與經驗Copula函數的平方歐式距離d2作為檢驗其擬合優(yōu)度的標準,結果見表2.根據擬合優(yōu)度評價指標,選擇d2值最小的為最優(yōu)擬合Copula函數.結果顯示Gumbel Copula函數為最優(yōu)擬合Copula函數.
表2 5種Copula函數的參數及擬合評價指標
圖2 Gumbel Copula密度函數圖
圖3 Gumbel Copula等高線圖
圖2和圖3分別為為Gumbel Copula密度函數圖和等高線圖,二元Gumbel Copula的密度函數具有不對稱的尾部,對變量在分布的上尾的變化較敏感,能很好的捕捉到上尾相關的變化.從圖2和圖3中可以看出,2連續(xù)航班延誤之間存在上尾部相關性,即2航班延誤時間都較長的組合數對出現的頻率較高.通過尾部相關系數可以分析極值事件發(fā)生的頻率.尾部相關性是一種極值相關性的度量,即當一個觀測變量的出現值為極值時,另一個也出現極值的概率.Gumbel Copula函數上尾部相關系數與參數θ的關系為λup=2-21/θ,由θ=1.321 7得上尾相關系數λup=0.31,下尾部相關系數為0說明分布在尾部變量間是漸近獨立的.
2.3條件概率分布
計算條件概率P(y1 從表3中縱向比較來看,當A航班延誤落在某個區(qū)間時,B航班延誤落在比A航班延誤小的區(qū)間的概率要大于落在比A航班延誤大的區(qū)間的概率.由此說明由空中管制原因導致的初始延誤對次航班延誤的波及影響表現為吸收的可能性要大.從橫向與縱向的對稱位置上進行比較,如P(45 表3 A航班延誤與B航班延誤條件概率 圖4 為初始延誤對次航班波及影響表現為吸收、傳遞或增強所占比例的柱狀圖分析.由圖4可見,初始延誤對次航班波及影響表現為吸收的可能性成增長趨勢,初始延誤時間大于105 min時這種增長趨于平穩(wěn);對次航班波及影響表現為傳遞和增強的可能性均成下降趨勢,這種下降趨勢最終也趨于平穩(wěn).當初始延誤時間大于75 min時對次航班的波及影響主要表現為吸收,所占比例在70%左右;初始延誤時間在15 min和45 min之間時延誤60%的可能性傳遞,接近40%的可能性增強. 圖4 初始延誤對次航班波及影響 通過以上分析發(fā)現由空中管制原因導致的初始延誤引發(fā)的連續(xù)航班延誤之間的相依關系表現為上尾高下尾低,上尾相關系數為0.31;由空中管制原因導致的初始延誤對次航班波及影響跟初始延誤時間的長短有關.初始延誤時間長短不同次航班表現為吸收、傳遞或增強的可能性不同;隨著初始延誤時間的增長,對次航班波及影響表現為吸收的可能性增加,延誤傳遞和增強的可能性下降. 3結束語 航班計劃執(zhí)行過程中隨時都有可能遭受到隨機因素的擾動影響,航班計劃安排的越緊湊延誤在航線網絡中造成的波及影響范圍越大.本文利用Copula函數構建了由空中管制造成的初始延誤和受此航班延誤波及的次航班延誤之間的聯合分布,分析了兩連續(xù)航班延誤之間的相依關系和延誤時間分別落在不同區(qū)間上的條件概率.結果表明航班延誤沿飛機路線向下游航班傳播的概率大小跟初始延誤的時間長短有很大關系. Copula函數是研究隨機變量間的相關性分析工具,對小樣本數據的擬合效果比較好.本文基于Copula函數對由空中管制原因導致的初始延誤及受波及的次航班延誤影響的非線性相關關系充分揭示出來,并充分利用Gumbel Copula分布函數特征分析了因空中管制原因導致的初始延誤時間的不同而對次航班帶來不同的航班延誤波及影響.研究存在的不足之處在于只考慮了空中管制對后續(xù)航班的影響,沒有考慮其它延誤因素的影響作用,今后研究重點將放在多因素對航班延誤波及的影響. 參 考 文 獻 [1]劉玉潔,何丕廉,劉春波,等.基于貝葉斯網絡的航班延誤及研究[J].計算機工程與應用,2008,44(17):242-245. [2]AHMADBEYGI S,COHN A,GUAN Y,et al.Analysis of the potential for delay propagation in passenger airline networks [J]. Journal of Air Transport Management,2008,14(5): 221-236. [3]BEATTY R, HSU R, BERRY L,et al. Preliminary evaluation of flight delay propagation through an airline schedule[J].Air Traffic Quarterly,1999(7):259-270. [4]DIANA T.Improving schedule reliability based on copulas:an application to five of the most congested US airports[J].Journal of Air Transport Management, 2011(17):284-287. [5]朱世武.基于Copula的VsR度量與事后檢驗[J].數理統(tǒng)計與管理,2007,26(6):984-991. [6]李秀敏,史道濟.滬深股市相關結構分析研究[J].數理統(tǒng)計與管理,2006,25(6): 729-736. [7]HUARD D,EVIN G,FAVRE A C.Bayesian copula selection[J].Journal of Computational Statistics & Data Analysis,2006,51:809-822. 中圖法分類號:[U8] doi:10.3963/j.issn.2095-3844.2015.01.027 收稿日期:2014-11-10 Correlation Analysis of Flight Delay Based on Copula Function QIU ShupingWU WeiweiHOU Meili (SchoolofCivilAviation,NanjingUniversityof AeronauticsandAstronautics,Nanjing210016,China) Abstract:Different flight delays caused by different factors will produce different results and propagations. Copula theory is introduced to study correlation between the sequence flight delays which caused by the initial delay for air traffic control and further analysis of propagation effects on following flight caused by initial delay flight is presented. It is found that the appearance frequency of assorted pairs is higher, and the assorted pairs belong to two flights delay with longer time; The initial delay propagation effects on the following flight is related to the time of initial delay. Results demonstrate that with the increase of initial delay time, the possibility of absorption of following flight in propagation effects is increased and the possibility of propagation and enhancement of delay is reduced. Key words:air transportation;correlation;Copula theory;flight delays;propagation effects;tail dependence *國家自然科學基金項目(批準號:71201081;71171111)、中央高?;究蒲袠I(yè)務費專項科研項目(批準號:NO.NC2012005)資助