翟文鵬, 陳梵驛, 金嗣博
(中國(guó)民航大學(xué) 空中交通管理研究基地, 天津 300300)
?
基于分位數(shù)回歸的機(jī)場(chǎng)容量評(píng)估
翟文鵬, 陳梵驛, 金嗣博
(中國(guó)民航大學(xué) 空中交通管理研究基地, 天津 300300)
對(duì)北京首都國(guó)際機(jī)場(chǎng)航班運(yùn)行的歷史數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析,建立了進(jìn)離場(chǎng)小時(shí)架次及時(shí)間的三維數(shù)據(jù)結(jié)構(gòu),并利用DBSCAN算法進(jìn)行聚類分析;在消除“噪點(diǎn)”的基礎(chǔ)上,利用改進(jìn)后的分位數(shù)回歸算法生成分時(shí)段的具有95%概率的機(jī)場(chǎng)小時(shí)運(yùn)行能力包線。仿真結(jié)果表明,各個(gè)時(shí)段的機(jī)場(chǎng)進(jìn)離場(chǎng)架次具有一定的時(shí)間特性和差異:8點(diǎn)到10點(diǎn)處于離港早高峰,離港小時(shí)架次遠(yuǎn)大于進(jìn)港小時(shí)架次;10點(diǎn)到22點(diǎn)進(jìn)離港航班較為均衡,機(jī)場(chǎng)全負(fù)荷工作;其他時(shí)間段航班小時(shí)架次未達(dá)到最大容量值。
機(jī)場(chǎng)容量; 延誤; 分位數(shù)回歸; 聚類分析
當(dāng)前,國(guó)內(nèi)外空中交通流量需求旺盛,不少大型機(jī)場(chǎng)的容量已飽和,航班延誤問(wèn)題較為突出,提升航班正點(diǎn)率是迫切需要解決的問(wèn)題。而機(jī)場(chǎng)改擴(kuò)建工程耗時(shí)長(zhǎng)、投資大,因此對(duì)機(jī)場(chǎng)現(xiàn)有容量進(jìn)行科學(xué)合理的評(píng)估,提高機(jī)場(chǎng)容量利用率,有助于航班時(shí)刻資源優(yōu)化和機(jī)場(chǎng)延誤水平降低[1]。
常見(jiàn)的機(jī)場(chǎng)容量評(píng)估方法主要有仿真模型法、數(shù)學(xué)模型法和實(shí)證研究法。其中,仿真模型法能夠逼真地模擬機(jī)場(chǎng)的運(yùn)行情況,主要用于跑道容量評(píng)估;但目前多集中在對(duì)跑道容量的評(píng)估問(wèn)題中,同時(shí)需要豐富的空管專業(yè)知識(shí),特別是場(chǎng)面運(yùn)行專業(yè)知識(shí)。李雄等[2]應(yīng)用Simmod仿真軟件針對(duì)不同典型構(gòu)型平行跑道及常用跑道運(yùn)行模式,分別對(duì)跑道極限容量和實(shí)際運(yùn)行容量進(jìn)行了仿真研究。高偉等[3]通過(guò)建立雙跑道容量計(jì)算模型,并應(yīng)用Simmod軟件仿真兩種方式評(píng)估機(jī)場(chǎng)跑道容量極限。該方法與數(shù)據(jù)計(jì)算模型所得的容量差異率不超過(guò)2%。數(shù)學(xué)模型法得到的評(píng)估結(jié)果僅是理論計(jì)算值,是宏觀的容量評(píng)估,缺乏對(duì)細(xì)節(jié)的考慮,例如沒(méi)有考慮空域環(huán)境對(duì)機(jī)場(chǎng)容量的影響,通用性較差。張洪海等[4]建立了機(jī)場(chǎng)進(jìn)離場(chǎng)容量和時(shí)隙協(xié)同配置的多目標(biāo)優(yōu)化模型,考慮了機(jī)場(chǎng)容量的動(dòng)態(tài)性和航班間的相互影響,可以動(dòng)態(tài)充分利用進(jìn)離場(chǎng)容量。盧朝陽(yáng)等[5]假設(shè)機(jī)場(chǎng)到達(dá)流特性符合正態(tài)分布或韋布爾分布,采用T系統(tǒng)推導(dǎo)跑道容量,論證得到的跑道容量符合現(xiàn)實(shí)情況。實(shí)證研究方法通過(guò)對(duì)機(jī)場(chǎng)日常運(yùn)行情況的觀測(cè),利用統(tǒng)計(jì)方法獲得機(jī)場(chǎng)跑道容量的統(tǒng)計(jì)規(guī)律,通過(guò)對(duì)機(jī)場(chǎng)進(jìn)離場(chǎng)航班運(yùn)行態(tài)勢(shì)的統(tǒng)計(jì)分析得到機(jī)場(chǎng)容量的評(píng)估結(jié)果。王飛等[6]應(yīng)用k-means算法和SOM神經(jīng)網(wǎng)絡(luò)的混合聚類算法確定機(jī)場(chǎng)典型容量樣本,評(píng)估機(jī)場(chǎng)容量。國(guó)內(nèi)外關(guān)于分位數(shù)回歸的應(yīng)用主要集中在經(jīng)濟(jì)方面,鮮有用于交通領(lǐng)域。文獻(xiàn)[7]率先提出了將分位數(shù)回歸算法應(yīng)用到容量包線中,對(duì)機(jī)場(chǎng)群進(jìn)離場(chǎng)容量進(jìn)行了評(píng)估。
目前,國(guó)內(nèi)外基于歷史統(tǒng)計(jì)數(shù)據(jù)的機(jī)場(chǎng)容量評(píng)估方法,均未考慮大型樞紐機(jī)場(chǎng)由于不同時(shí)段的運(yùn)行情況差異而導(dǎo)致的機(jī)場(chǎng)運(yùn)行能力的變化,且未能對(duì)高峰小時(shí)進(jìn)離港架次進(jìn)行評(píng)估。本文構(gòu)建了具有時(shí)間維度的進(jìn)離場(chǎng)小時(shí)架次,采用聚類算法(Density-based Spatial Clustering of Applications with Noise,DBSCAN)[8-9]對(duì)進(jìn)離場(chǎng)態(tài)勢(shì)進(jìn)行了統(tǒng)計(jì)與分析。另外,本文將分位數(shù)回歸模型[10]改進(jìn)后應(yīng)用于機(jī)場(chǎng)容量評(píng)估問(wèn)題中,發(fā)掘了分位數(shù)回歸在解決容量包線問(wèn)題方面的優(yōu)越性,得出了具有一定概率分布的容量包線,使得最終得到的容量評(píng)估結(jié)果更加符合實(shí)際的運(yùn)行情況。
傳統(tǒng)的聚類方法需要預(yù)先對(duì)簇的個(gè)數(shù)進(jìn)行預(yù)設(shè),不能保證精確度。本文選擇DBSCAN算法來(lái)處理所研究的數(shù)據(jù)集,能夠根據(jù)密度對(duì)數(shù)據(jù)進(jìn)行聚類,且對(duì)簇的個(gè)數(shù)和形狀沒(méi)有要求,而且能夠發(fā)現(xiàn)“噪點(diǎn)”(進(jìn)離場(chǎng)小時(shí)架次出現(xiàn)次數(shù)少的點(diǎn))并將其分離,從而可以從大量的原始數(shù)據(jù)中獲得若干個(gè)時(shí)間段的容量簇,減少這些“噪點(diǎn)”對(duì)于容量評(píng)估的影響,提高容量評(píng)估的精確度和合理性[11-12]。此外,傳統(tǒng)的聚類方法只需沿著聚類分析點(diǎn)的外邊線進(jìn)行描繪就可獲得機(jī)場(chǎng)的極限容量評(píng)估值,以此作為機(jī)場(chǎng)容量標(biāo)準(zhǔn)并不準(zhǔn)確、科學(xué)。多個(gè)時(shí)段的實(shí)際容量低于極限容量評(píng)估值,同時(shí)沒(méi)有考慮不同時(shí)段進(jìn)離場(chǎng)航班需求。因此,需要將時(shí)間信息加入到待處理數(shù)據(jù)中,從而完成包含時(shí)間信息的三維數(shù)據(jù)聚類分析。采用DBSCAN聚類方法將進(jìn)離場(chǎng)航班進(jìn)行分析后,可獲得不同時(shí)間段進(jìn)離場(chǎng)航班各自的容量區(qū)間,但并不能獲得準(zhǔn)確時(shí)間區(qū)間的容量情況。因此,需要進(jìn)一步應(yīng)用分位數(shù)回歸對(duì)聚類分析獲得的幾個(gè)主要區(qū)間分別進(jìn)行分析,并以95%概率的容量而非極限容量進(jìn)行評(píng)估,可獲得滿足機(jī)場(chǎng)實(shí)際運(yùn)行的容量,避免由于實(shí)際容量小于極限容量從而造成不正常航班。由于進(jìn)港航班架次是非負(fù)整數(shù)且為有限值,故容量包線的潛在分段點(diǎn)也是有限的,意味著容量包線線段覆蓋了所有進(jìn)港航班架次的極小值。因此,分位數(shù)容量包線可描述為:
(1)
對(duì)于給定的τ分位數(shù)分段系數(shù)(αk,βk)的評(píng)估過(guò)程,涉及到以下線性規(guī)劃問(wèn)題,目標(biāo)函數(shù)為:
(2)
約束條件為:
(3)
(4)
式(3)定義了來(lái)自觀測(cè)值y的分位數(shù)函數(shù)的絕對(duì)偏差,式(4)保證了分段斜率的凹性。
利用傳統(tǒng)的基于歷史統(tǒng)計(jì)數(shù)據(jù)的容量評(píng)估方法得到的機(jī)場(chǎng)容量包線,僅為對(duì)機(jī)場(chǎng)運(yùn)行能力上限值的評(píng)估。然而運(yùn)行能力在滿足一切內(nèi)外條件下才能達(dá)到機(jī)場(chǎng)容量上限,出現(xiàn)的次數(shù)極少,不能作為容量評(píng)估值,否則在大部分時(shí)間段運(yùn)行能力低于極限能力的情況下,將出現(xiàn)大量航班延誤。本文擬用基于DBSCAN聚類方法對(duì)首都機(jī)場(chǎng)實(shí)際運(yùn)行中大量、長(zhǎng)期的運(yùn)行數(shù)據(jù)進(jìn)行分析,樣本來(lái)自首都機(jī)場(chǎng)2013年3月至10月的進(jìn)離港航班數(shù)據(jù)。采用本文所提出的DBSCAN聚類分析方法對(duì)其進(jìn)行聚類后,得到的結(jié)果如圖1所示。圖中未劃入各區(qū)域的點(diǎn)為噪點(diǎn),即進(jìn)離場(chǎng)架次統(tǒng)計(jì)值出現(xiàn)次數(shù)較少的點(diǎn),需要去除,為下一步基于分位數(shù)回歸提供有效數(shù)據(jù)。另外,高峰小時(shí)容量是制約機(jī)場(chǎng)運(yùn)行能力的重要指標(biāo),對(duì)于航班時(shí)刻的分配和實(shí)際運(yùn)行中航班調(diào)配都具有重要作用,關(guān)系到機(jī)場(chǎng)資源和航班時(shí)刻的利用效率。聚類分析得到的5個(gè)核心區(qū)域分別用數(shù)字區(qū)分,即進(jìn)離場(chǎng)航班運(yùn)行在5個(gè)主要的區(qū)間內(nèi),從而獲得了不同時(shí)間段進(jìn)離場(chǎng)航班各自的容量區(qū)間,為下一步通過(guò)分位數(shù)回歸評(píng)估容量包線奠定了基礎(chǔ)。
圖1 進(jìn)離港小時(shí)架次聚類結(jié)果Fig.1 Clustering results of arrival and departure per hour
對(duì)上述5個(gè)時(shí)間段的起降架次范圍進(jìn)行分位數(shù)回歸,結(jié)果如圖2所示。
圖2(a)為0點(diǎn)到6點(diǎn)進(jìn)離港小時(shí)架次,對(duì)應(yīng)圖1中的區(qū)域1,該時(shí)段進(jìn)離港架次較少,共30架次;圖2(b)為6點(diǎn)到8點(diǎn)進(jìn)離港小時(shí)架次聚類的結(jié)果,對(duì)應(yīng)圖1中的區(qū)域2,該時(shí)段離場(chǎng)航班逐漸增多,共48架次;圖2(c)為8點(diǎn)到10點(diǎn)進(jìn)離港小時(shí)架次聚類的結(jié)果,對(duì)應(yīng)圖1中的區(qū)域3,該時(shí)段處于早高峰,大量航班離場(chǎng),少量航班進(jìn)場(chǎng),共82架次;圖2(d)為10點(diǎn)到22點(diǎn)進(jìn)離港小時(shí)架次聚類的結(jié)果,對(duì)應(yīng)圖1中區(qū)域4,該時(shí)段進(jìn)離場(chǎng)架次較為均衡,機(jī)場(chǎng)全負(fù)荷工作,共106架次;圖2(e)為22點(diǎn)到24點(diǎn)進(jìn)離港小時(shí)架次聚類的結(jié)果,對(duì)應(yīng)圖1中區(qū)域5,該時(shí)段大量航班進(jìn)港過(guò)夜,共66架次。
本文針對(duì)首都機(jī)場(chǎng)進(jìn)離港小時(shí)架次進(jìn)行統(tǒng)計(jì)數(shù)據(jù)分析,將歷史統(tǒng)計(jì)進(jìn)離港小時(shí)架次與時(shí)間結(jié)合構(gòu)成三維數(shù)據(jù)并進(jìn)行DBSCAN聚類分析。本文方法避免了數(shù)據(jù)噪聲點(diǎn)的干擾,充分發(fā)揮機(jī)場(chǎng)運(yùn)行能力和降低航班延誤,使得容量評(píng)估更加合理。該算法為繁忙機(jī)場(chǎng)分時(shí)段小時(shí)容量評(píng)估提供了數(shù)據(jù)分析及容量評(píng)估手段,為航班時(shí)刻資源合理分配提供了依據(jù)。下一步將以航班延誤作為指標(biāo)之一對(duì)進(jìn)離港小時(shí)容量進(jìn)行評(píng)估。
[1]Barnhart C,Belobaba P,Odoni A R.Applications of operations research in the air transport industry[J].Transportation Science,2003,37(4):368-391.
[2]李雄,李冬賓,衛(wèi)東選.機(jī)場(chǎng)典型平行跑道容量仿真分析[J].計(jì)算機(jī)應(yīng)用,2012,32(9):2648-2651.
[3]高偉,傅煒.基于相關(guān)進(jìn)近模式的雙跑道容量計(jì)算及仿真[J].科學(xué)技術(shù)與工程,2014,14 (4):108-112.
[4]張洪海,胡明華.CDM ADGDP機(jī)場(chǎng)容量與時(shí)隙協(xié)同配置[J].系統(tǒng)工程理論與實(shí)踐,2010,30(10):1901-1908.
[5]盧朝陽(yáng),趙新?tīng)N.基于到達(dá)流特性的跑道容量分析[J].南京航空航天大學(xué)學(xué)報(bào),2011,43(1):30-34.
[6]王飛,徐肖豪.隨機(jī)GHP模型中機(jī)場(chǎng)容量混合聚類算法[J].交通運(yùn)輸工程學(xué)報(bào),2011,11(1):64-68.
[7]Ramanujam V,Balakrishnan H.Estimation of arrival-departure capacity tradeoffs in multi-airport systems[C]//Proceedings of the 48th IEEE Conference on Decision and Control.Shanghai:IEEE,2009:2534-2540.
[8]劉大有,陳慧靈,齊紅,等.時(shí)空數(shù)據(jù)挖掘研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2013,50(2):225-239.
[9]王駿,王士同,鄧趙紅.聚類分析研究中的若干問(wèn)題[J].控制與決策,2012,27(3):321-328.
[10]Kim M O.Quantile regression with varying coefficients [J].The Annals of Statistics,2007,35(1):92-108.
[11]鄧敏,劉啟亮,王佳繆,等.時(shí)空聚類分析的普適性方法[J].中國(guó)科學(xué):信息科學(xué),2012,42(1):111-124.
[12]Wang M,Wang A P,Li A B.Mining spatial-temporal clusters from geo-database[C]//Li X,Za?ane O R,Li Z H.Advanced Data Mining and Applications:Vol 4093.Xi’an:Springer Berlin Heidelberg,2006:263-270.
(編輯:李怡)
Evaluation of the airport capacity based on quantile regression
ZHAI Wen-peng, CHEN Fan-yi, JIN Si-bo
(Research Base for Air Traffic Management, CAUC, Tianjin 300300, China)
3D data structure of the arrival-departure hour sorties and time were established based on the statistical analysis of the historical data of capital airport flight operation, and proceeded the cluster analysis with DBSCAN algorithm. The airport hour operation capacity envelope with 95% probability was generated by using quantile regression algorithm on the basis of eliminating "noise". Simulation results show that the arrival and departure sorties of the airport has certain amount of time characteristics and differences: at 8:00-10:00 am in the morning rush, departure hour sorties are far greater than arrival hour sorties; at 10:00 am-22: 00 pm, arrival and departure flights is relatively balanced and full load working at the airport; other times flight hour sorties reduced and have not reached maximum capacity.
airport capacity; flight delay; quantile regression; clustering analysis
2015-09-29;
2016-01-25; 網(wǎng)絡(luò)出版時(shí)間:2016-04-22 09:52
國(guó)家自然科學(xué)基金資助(41501430,71571182,U1333116);國(guó)家空管科研課題基金資助(GKG201405002);中央高?;究蒲薪?jīng)費(fèi)資助 (ZXH2012M003);中國(guó)民航大學(xué)科研啟動(dòng)基金資助(2012QD02X);大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃基金資助 (201410059082);教育部人文社科青年基金資助(14YJC630185)
翟文鵬(1985-),男,天津人,講師,博士,研究方向?yàn)榭罩薪煌ㄒ?guī)劃與管理。
V355.1
A
1002-0853(2016)04-0086-04