国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Adaptive Lasso與RF的航班運(yùn)行風(fēng)險(xiǎn)預(yù)測改進(jìn)研究

2018-09-10 10:26:36王巖韜陳冠銘楊遠(yuǎn)浩
關(guān)鍵詞:降維航班精度

王巖韜,陳冠銘,劉 毓,楊遠(yuǎn)浩,趙 航

(中國民航大學(xué)國家空管運(yùn)行安全技術(shù)重點(diǎn)實(shí)驗(yàn)室,天津300300)

0 引言

航班運(yùn)行是一個(gè)連續(xù)動(dòng)態(tài)過程,其影響因素種類、形式、數(shù)目繁多,運(yùn)行風(fēng)險(xiǎn)隨條件不斷改變.面對此復(fù)雜系統(tǒng),構(gòu)建科學(xué)的評估和預(yù)測方法是提高安全水平的必要措施.歐美民航安全管理和風(fēng)險(xiǎn)定量研究在2000年后已有成果,但因國內(nèi)和歐美運(yùn)行環(huán)境相差巨大,導(dǎo)致模型無法移植使用[1-3].國內(nèi)民航對航班運(yùn)行安全的研究于2010年后起步,從孫瑞山教授開始至王巖韜等,已完成從研究方向、預(yù)期目標(biāo)、解決方案等多方面完整探索[4-5].2015年下發(fā)的咨詢通告《航空承運(yùn)人運(yùn)行控制風(fēng)險(xiǎn)管控系統(tǒng)實(shí)施指南》作為研究成果的典型應(yīng)用,標(biāo)志著中國民航已建立了通用性、示范性的航班風(fēng)險(xiǎn)評估體系.截止2018年初,國內(nèi)52家運(yùn)輸航空公司以此前研究為基礎(chǔ)開發(fā)了航班運(yùn)行風(fēng)險(xiǎn)控制系統(tǒng),使用核心算法包含模糊隸屬函數(shù)、風(fēng)險(xiǎn)矩陣、支持向量機(jī)和概率論等[6].上述方法存在部分缺陷,例如過度依賴專家主觀評價(jià)等已在文獻(xiàn)[7-8]中詳細(xì)論述.目前在一線應(yīng)用中亟待解決問題還包括:第一,由于評估項(xiàng)目數(shù)量多、計(jì)算過于復(fù)雜,致使響應(yīng)速度慢,無法滿足使用需求;第二,在訓(xùn)練樣本得到較高精度的基礎(chǔ)上,測試和應(yīng)用精度有時(shí)反而降低,即出現(xiàn)了過擬合現(xiàn)象.目前實(shí)踐應(yīng)用中日運(yùn)行精度處于[0.782,0.875]之間,計(jì)算精度不高且穩(wěn)定性不足[7-8].

基于上述情況,利用Adaptive Lasso擅長處理高維變量及RF有效處理過度擬合的特點(diǎn)[9],建立Adaptive Lasso與RF的二階段混合預(yù)測模型,使用某航450組航班運(yùn)行數(shù)據(jù),驗(yàn)證模型可用性.通過與PCA、RBF神經(jīng)網(wǎng)絡(luò)、SVM進(jìn)行對比,驗(yàn)證方案有效性和可靠性,旨在為航班運(yùn)行風(fēng)險(xiǎn)管控工作探索有效、快捷、準(zhǔn)確、穩(wěn)定的預(yù)測技術(shù).

1 樣本數(shù)據(jù)

1.1 數(shù)據(jù)選取

如文獻(xiàn)[6]中詳述,某航將運(yùn)行總風(fēng)險(xiǎn)分為機(jī)組方面、飛機(jī)方面、進(jìn)近著陸階段威脅3大類共63項(xiàng)影響因素.精選該航2017年風(fēng)控系統(tǒng)歷史數(shù)據(jù)共450組,包含風(fēng)險(xiǎn)高、中、低3級各150組;由飛行、簽派、機(jī)務(wù)等專家逐一檢驗(yàn),發(fā)現(xiàn)其中18組存在偏差,經(jīng)專家組商議并修正結(jié)果后,該450組航班數(shù)據(jù)作為標(biāo)準(zhǔn)樣本集合,如表1所示.

表1 航班運(yùn)行風(fēng)險(xiǎn)數(shù)據(jù)集合Table 1 Flight operations risk standard data set

1.2 應(yīng)用分析

在實(shí)踐應(yīng)用中,各因素需在數(shù)據(jù)接入層提取,先做單因素評判,再遞進(jìn)向上計(jì)算總風(fēng)險(xiǎn),具體如圖1所示.根據(jù)某航信息和運(yùn)控部門實(shí)測,平均航班運(yùn)算結(jié)果更新耗時(shí)3.6 s,響應(yīng)速度不能滿足運(yùn)行人員使用需求;此外,現(xiàn)有系統(tǒng)預(yù)測結(jié)果穩(wěn)定性不足,部分時(shí)段其計(jì)算精度低于80%,而在亟需查找原因糾正錯(cuò)誤時(shí),評判因素越多,難度越大[5].綜上,下節(jié)采用Adaptive lasso算法進(jìn)行降維,以求精減評估指標(biāo)項(xiàng).

2 指標(biāo)降維

2.1 算法簡介

Adaptive Lasso是一種高維數(shù)據(jù)線性回歸方法,本質(zhì)是改進(jìn)的兩步法Lasso[10].定義β=(β1,β2,…,βm)T是回歸系數(shù);Aj=(a1j,a2j,…,anj)T是預(yù)測變量,其中j=1,2,…,m;Y=(y1,y2,…,yn)T是響應(yīng)變量.對所有的非負(fù)的常規(guī)參數(shù)λn,求解Adaptive Lasso問題公式為,其中,;為普通最小二乘法所得系數(shù)估計(jì)值.

圖1 風(fēng)險(xiǎn)管控系統(tǒng)業(yè)務(wù)和數(shù)據(jù)架構(gòu)Fig.1 Risk control system dynamic business and data architecture

2.2 降維計(jì)算

此處,利用RGui軟件對63個(gè)風(fēng)險(xiǎn)指標(biāo)進(jìn)行計(jì)算,得到性能價(jià)格比Cp值,如表2所示.Cp值用來衡量多重共線性,其值越小越好.

表2 各指標(biāo)Cp值Table 2Cpvalue of indicators

由表2可知,在R程序運(yùn)算過程中,Cp最小值為12.869,此時(shí)總風(fēng)險(xiǎn)有效影響因素共有15個(gè),分別為機(jī)組配合程度X1、機(jī)長經(jīng)驗(yàn)?zāi)芰2、副駕駛經(jīng)驗(yàn)?zāi)芰3、機(jī)組疲勞程度X4、機(jī)組壓力程度X5、機(jī)齡X6、MEL/CDL風(fēng)險(xiǎn)X7、起飛機(jī)場天氣風(fēng)險(xiǎn)X8、起飛機(jī)場條件風(fēng)險(xiǎn)X9、著陸機(jī)場天氣風(fēng)險(xiǎn)X10、著陸機(jī)場條件風(fēng)險(xiǎn)X11、航路風(fēng)險(xiǎn)X12、航路備降機(jī)場天氣風(fēng)險(xiǎn)X13、航路備降機(jī)場條件風(fēng)險(xiǎn)X14和特殊運(yùn)行種類(二放、極地、延程運(yùn)行等)X15.

3 精度分析

以X1~X15為指標(biāo)體系,使用支持向量機(jī)算法,取400組航班標(biāo)準(zhǔn)數(shù)據(jù)作為訓(xùn)練集,剩余50組作為測試集.使用Matlab中LibSVM函數(shù),參數(shù)優(yōu)選使用SVMcgForClass,最優(yōu)懲罰因子e和核參數(shù)g通過交叉驗(yàn)證法確定,具體計(jì)算過程如文獻(xiàn)[5],得到樣本訓(xùn)練分類正確率為85.6%,同時(shí)確定e=3.042 1,g=0.562 43.

更新模型參數(shù)為最優(yōu)e和g后,如圖2和圖3所示,測試結(jié)果正確率僅為84%,與文獻(xiàn)[5]中情況類似,訓(xùn)練優(yōu)化后得到測試精度無實(shí)質(zhì)提升.進(jìn)一步分析發(fā)現(xiàn),上述指標(biāo)中存在部分交叉關(guān)系,例如X15是綜合了X10~X14限制條件下制定所得的飛行方案,而X4與X5也可能存在相互轉(zhuǎn)化現(xiàn)象.因此推斷模型過度訓(xùn)練和學(xué)習(xí)了數(shù)據(jù)中噪音,產(chǎn)生了過擬合運(yùn)算現(xiàn)象.下節(jié)采用RF方法防止過擬合,使用RF處理前后的計(jì)算結(jié)果進(jìn)行驗(yàn)證分析.

圖2 參數(shù)優(yōu)選結(jié)果(3D視圖)Fig.2 Parameter optimization results(3D view)

4 防過擬合

4.1 變量重要性計(jì)算

RF可較好地處理異常值和噪聲,對樣本依賴小,能較好地解決多級分類問題,且不容易出現(xiàn)過擬合[11].

航班風(fēng)險(xiǎn)變量重要性的衡量標(biāo)尺是各變量Xi導(dǎo)致結(jié)果的不純度.不純度計(jì)算公式為其中Q代表目標(biāo)變量的類別總數(shù),P(k/t)代表在節(jié)點(diǎn)t中第k類目標(biāo)變量的條件概率.計(jì)算每棵樹中以Xi為分裂變量節(jié)點(diǎn)的不純度下降值,再將所有樹的結(jié)果進(jìn)行平均,從而得到Xi不純度的平均下降值,下降越多則表示該變量越重要.通過SPSS Modeler評分系統(tǒng)對重要度進(jìn)行打分,結(jié)果如表3所示.

圖3 風(fēng)險(xiǎn)等級分類圖Fig.3 Parameter optimization results(3D view)

表3 指標(biāo)重要度分值及排序Table 3 Index importance score and ranking

由表3分析可見,運(yùn)行環(huán)境方面包括X8~X14,重要度總分值達(dá)到37.17,對總風(fēng)險(xiǎn)影響最大,其中著陸機(jī)場天氣風(fēng)險(xiǎn)X11最為顯著;飛行機(jī)組相關(guān)包括X1~X5,重要度分值達(dá)到 34.65,機(jī)長經(jīng)驗(yàn)X2和機(jī)組疲勞X4影響最為明顯.

4.2 誤差計(jì)算

在處理航班運(yùn)行風(fēng)險(xiǎn)模型過擬合問題時(shí),在篩選變量過程中依次剔除表3中重要度分值最低的變量,再將剩余數(shù)據(jù)代入SPSS Modeler;同理計(jì)算14次后,可得到變量數(shù)為4~15的均方根誤差和相對誤差,如表4所示.可見當(dāng)變量數(shù)為12時(shí),預(yù)測結(jié)果的均方根誤差和相對誤差最小,穩(wěn)定性最佳.故在Adaptive Lasso算法篩選結(jié)果后,再剔除航路備降機(jī)場天氣風(fēng)險(xiǎn)X13、航路備降機(jī)場條件風(fēng)險(xiǎn)X14和特殊運(yùn)行X15,保留有效變量12項(xiàng).

表4 各變量數(shù)的誤差值Table 4 Error value of variable number

4.3 混合預(yù)測模型

RF作為一種機(jī)器學(xué)習(xí)方法,自身具有評估和預(yù)測計(jì)算能力.為達(dá)到降維和防止過擬合的雙重目的,此處使用bootstrap抽樣技術(shù),從Adaptive Lasso篩選后樣本抽取訓(xùn)練子集,對每一子集進(jìn)行決策樹建模,最后再組合所有決策樹的預(yù)測結(jié)果.根據(jù)少數(shù)服從多數(shù)的原則,投票得出最終航班運(yùn)行風(fēng)險(xiǎn)預(yù)測結(jié)論.

5 對比算法

5.1 PCA模型

在以往航班風(fēng)險(xiǎn)研究中,為了全面系統(tǒng)地分析問題,盡可能完整地搜集信息,每個(gè)觀測對象往往包括多指標(biāo)和變量,之間存在相關(guān)性,因此統(tǒng)計(jì)數(shù)據(jù)反映出的信息是有部分重疊的.PCA是將相關(guān)的指標(biāo)轉(zhuǎn)化成不相關(guān)的指標(biāo),避免信息重疊,達(dá)到利用較少新變量代替較多舊變量的降維目的[12].

主成分?jǐn)?shù)學(xué)模型為

求得相關(guān)系數(shù)矩陣的特征值及主成分貢獻(xiàn)率,如表5所示,以方差累計(jì)貢獻(xiàn)率大于99%為主成分提取標(biāo)準(zhǔn),選取前4個(gè)主成分.

表5 RF處理前后的主成分Table 5 Principal component before and after RF

RF防過擬合處理前,主成分1包含X1~X3、X7~X11、X13;主成分2 包含X3~X6、X8;主成分 3包含X10、X12、X15;主成分4包含X1、X13、X14.根據(jù)特征根及對應(yīng)特征向量可計(jì)算得到主成分載荷,構(gòu)建主成分與風(fēng)險(xiǎn)各因素的線性關(guān)系式如下.

5.2 RBF模型

徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)由3層組成,包括輸入層、隱含層和輸出層.隱含層的神經(jīng)元數(shù)目由具體問題而定,輸入層節(jié)點(diǎn)只傳遞輸入信號到隱含層,隱含層節(jié)點(diǎn)由高斯函數(shù)構(gòu)成,輸出層節(jié)點(diǎn)通常是簡單的線性函數(shù)[13].

本處RBF使用newrb和newgrnn兩種進(jìn)行計(jì)算.newrb函數(shù)調(diào)用式為net=newrb(P,T,goal,spread,MN,DF),其中P為輸入向量,T為輸出向量,goal為均方誤差的目標(biāo),spread為徑向基的擴(kuò)展速度,MN為最大的神經(jīng)元個(gè)數(shù),DF是每次加進(jìn)的網(wǎng)絡(luò)參數(shù).返回值是不斷嘗試得到的,創(chuàng)建網(wǎng)絡(luò)后不斷增加中間層數(shù)量和神經(jīng)元數(shù)目,直到輸出誤差可接受為止.Newgrnn具有很強(qiáng)的非線性映射能力和學(xué)習(xí)速度,函數(shù)調(diào)用式為net=newrb(P,T,spread),網(wǎng)絡(luò)最后普遍收斂于樣本量集聚較多的回歸.

使用Matlab反復(fù)訓(xùn)練得到,在隱含層神經(jīng)元個(gè)數(shù)等于7時(shí),網(wǎng)絡(luò)輸出結(jié)果的均方誤差僅為0.009 432 9,此時(shí)精度最高,即得到7-30-1結(jié)構(gòu)的最優(yōu)RBF網(wǎng)絡(luò)模型.

6 結(jié)果分析

在 Adaptive Lasso 降維所得指標(biāo)X1~X15基礎(chǔ)上,根據(jù)表1標(biāo)準(zhǔn)航班數(shù)據(jù)集合,對RF處理前后兩類情況分別使用混合算法、主成分分析、RBF兩種方法、支持向量機(jī)進(jìn)行仿真計(jì)算,將預(yù)測結(jié)果與實(shí)際值的相對誤差進(jìn)行對比,如表6、圖4和圖5所示.

為保證驗(yàn)證準(zhǔn)確性和合理性,引入K折交叉驗(yàn)證(K-fold Cross Validation,K-CV)評估模型預(yù)測精度.K-CV可以有效地避免過學(xué)習(xí)及欠學(xué)習(xí),此處使用十折交叉驗(yàn)證,即將初始采樣分割成K=10個(gè)子樣本,每個(gè)子樣本都作為一次驗(yàn)證數(shù)據(jù),其他9個(gè)樣本用來訓(xùn)練.交叉驗(yàn)證重復(fù)10次,最終取平均結(jié)果得到估測值.

圖4 RF處理前各種方法預(yù)測值相對誤差Fig.4 Relative errors of various methods predicted values before RF

圖5 RF處理后各種方法預(yù)測值相對誤差Fig.5 Relative errors of various methods predicted values after RF

表6 RF處理前后各種方法結(jié)果匯總對比Table 6 Summary comparison of various methods predicted values after RF

由表6可知,使用Adaptive Lasso篩選掉48項(xiàng)指標(biāo)后的平均精度高于90%,預(yù)測精度不降反升,說明Adaptive Lasso對航班風(fēng)險(xiǎn)預(yù)測問題可有效降維;經(jīng)RF處理后,經(jīng)RF處理后,5種方法所得精度有明顯增長,均優(yōu)于當(dāng)前87.5%的日運(yùn)行精度,尤其對于支持向量機(jī)方法,精度相比文獻(xiàn)[5]有了大幅提升,說明隨機(jī)森林方法可有效防止模型過度擬合,對處理航班風(fēng)險(xiǎn)預(yù)測問題有較強(qiáng)適應(yīng)性;Adaptive Lasso-RF混合算法的預(yù)測精度可高達(dá)95.91%,優(yōu)于主成分分析和RBF神經(jīng)網(wǎng)絡(luò),也優(yōu)于目前風(fēng)控工作普遍使用的風(fēng)險(xiǎn)矩陣和支持向量機(jī)方法;同時(shí),混合模型的CV值僅為1.45,是各類方法測得結(jié)果的最低值,說明其預(yù)測穩(wěn)定性也為最優(yōu).

7 結(jié)論

(1)航班風(fēng)險(xiǎn)與運(yùn)行環(huán)境的相關(guān)性最為顯著,其中著陸機(jī)場天氣對風(fēng)險(xiǎn)影響最大;航班風(fēng)險(xiǎn)與飛行機(jī)組的相關(guān)性排名次之,機(jī)長經(jīng)驗(yàn)與機(jī)組疲勞是導(dǎo)致風(fēng)險(xiǎn)變大的重要因素.

(2)Adaptive Lasso算法可以將航班運(yùn)行風(fēng)險(xiǎn)指標(biāo)從63項(xiàng)有效降維至15項(xiàng),且不影響預(yù)測結(jié)果精度.

(3)隨機(jī)森林方法對處理航班風(fēng)險(xiǎn)預(yù)測問題有較強(qiáng)適應(yīng)性,可以有效防止模型過度擬合,提高結(jié)果精度.

(4)Adaptive Lasso-RF混合算法在預(yù)測精度上明顯優(yōu)于主成分分析、RBF網(wǎng)絡(luò)、風(fēng)險(xiǎn)矩陣和支持向量機(jī)等方法,且預(yù)測穩(wěn)定性最佳.

猜你喜歡
降維航班精度
全美航班短暫停飛
混動(dòng)成為降維打擊的實(shí)力 東風(fēng)風(fēng)神皓極
車主之友(2022年4期)2022-08-27 00:57:12
山航紅色定制航班
金橋(2021年10期)2021-11-05 07:23:10
山航紅色定制航班
金橋(2021年8期)2021-08-23 01:06:24
山航紅色定制航班
金橋(2021年7期)2021-07-22 01:55:10
降維打擊
海峽姐妹(2019年12期)2020-01-14 03:24:40
基于DSPIC33F微處理器的采集精度的提高
電子制作(2018年11期)2018-08-04 03:25:38
GPS/GLONASS/BDS組合PPP精度分析
改進(jìn)的Goldschmidt雙精度浮點(diǎn)除法器
拋物化Navier-Stokes方程的降維仿真模型
太仆寺旗| 松潘县| 永定县| 开平市| 宁波市| 夏河县| 密山市| 绿春县| 绩溪县| 和田市| 柳河县| 玉溪市| 阿鲁科尔沁旗| 道真| 句容市| 诸城市| 靖远县| 齐齐哈尔市| 合水县| 桑日县| 阿克苏市| SHOW| 吴旗县| 永兴县| 多伦县| 贞丰县| 南漳县| 明光市| 屏东县| 霍邱县| 青铜峡市| 铜山县| 广元市| 曲周县| 安化县| 观塘区| 晋城| 屏边| 信阳市| 安徽省| 高碑店市|