周姍姍,柏赟,袁博,汪茜,李佳杰
(北京交通大學(xué) 綜合交通運(yùn)輸大數(shù)據(jù)應(yīng)用技術(shù)交通運(yùn)輸行業(yè)重點(diǎn)實(shí)驗(yàn)室,北京 100044)
隨著全國各大城市地鐵新線的持續(xù)開通運(yùn)營,地鐵系統(tǒng)的節(jié)能降耗日益重要。新線規(guī)劃設(shè)計(jì)的優(yōu)劣和列車選型直接影響著線路牽引能耗水平,進(jìn)而影響城市軌道交通系統(tǒng)總電耗與成本。因此,有必要研究城市軌道交通新線牽引能耗預(yù)測方法,從節(jié)能角度為新線規(guī)劃設(shè)計(jì)方案選取及列車選型提供參考。牽引能耗的影響因素主要包括線路條件、列車屬性、行駛速度及操縱策略等[1?4]。此外,天氣、運(yùn)營組織方案、客流等擾動因素也會影響總牽引能耗。既有研究大多采用仿真方法或歷史數(shù)據(jù)刻畫能耗與各因素的特征關(guān)系,進(jìn)而預(yù)測列車牽引能耗。前者通過分析列車運(yùn)行受力情況,構(gòu)建列車動力學(xué)模型,在此基礎(chǔ)上計(jì)算牽引能耗。該類研究包括單列車運(yùn)行仿真及多列車運(yùn)行仿真。其中,單列車仿真系統(tǒng)無法考慮多列車之間的再生能傳輸過程,能耗計(jì)算存在偏差[5?6]。而多列車仿真系統(tǒng)雖可以刻畫列車間再生能傳遞過程,但由于供電參數(shù)標(biāo)定困難、仿真耗時較長,很少應(yīng)用于地鐵新線的能耗預(yù)測[7?8]。除仿真方法外,部分學(xué)者也通過構(gòu)建大數(shù)據(jù)模型來預(yù)測列車牽引能耗。陳垚等[9]基于SVR模型,以月均最高氣溫、輔助設(shè)備功率、日均客運(yùn)周轉(zhuǎn)量、全日走行公里、最小發(fā)車間隔、有效間隔占比為輸入預(yù)測既有線未來月度牽引能耗。呂歡歡等[10]采用支持向量回歸及隨機(jī)森林回歸方法對既有線牽引能耗進(jìn)行預(yù)測。該類方法可根據(jù)大量既有能耗數(shù)據(jù),較為準(zhǔn)確地刻畫能耗與影響因素的非線性特征關(guān)系,實(shí)現(xiàn)既有線能耗預(yù)測。但對于新線而言,線路條件、列車性能可能與既有線存在較大差異,且難以用簡單的參數(shù)如平均站間距、平均坡度、最大功率來刻畫線路條件和列車屬性對能耗的影響。因此,既有的大數(shù)據(jù)模型在預(yù)測地鐵新線能耗時存在較大偏差。本文將仿真方法與數(shù)據(jù)預(yù)測方法的優(yōu)點(diǎn)相結(jié)合,提出基于列車運(yùn)行仿真與支持向量回歸(SVR)組合的地鐵新線車公里牽引能耗預(yù)測方法,同時考慮線路條件、列車屬性、操縱策略以及天氣、客流、運(yùn)營方案等擾動因素,實(shí)現(xiàn)地鐵新線牽引單耗的精確預(yù)測。
本文所提出的預(yù)測方法共包含列車運(yùn)行仿真刻畫和支持向量機(jī)預(yù)測2個步驟,如圖1所示。
圖1 預(yù)測方法框架Fig.1 Prediction method framework
步驟1:仿真過程。
對單列車運(yùn)行過程進(jìn)行仿真,輸入線路條件、列車屬性等相關(guān)參數(shù),即可得到列車運(yùn)行的單車公里牽引能耗、單車公里再生能產(chǎn)生量及技術(shù)速度3個指標(biāo),其將作為下一步支持向量機(jī)預(yù)測的輸入。相較于采用平均坡度、平均站間距等值刻畫線路條件的影響,其基于物理模型求解單列車運(yùn)行仿真過程的實(shí)時能耗,可反映部分牽引能量消耗的內(nèi)在機(jī)理。
步驟2:支持向量機(jī)預(yù)測過程。
1)輸入輸出變量選取。由于單列車運(yùn)行仿真過程未刻畫再生能耗和輔助能耗,在該步驟中添加最小發(fā)車間隔、最大發(fā)車間隔、滿載率、氣溫及照明設(shè)備功率、空調(diào)設(shè)備功率指標(biāo),與上一步仿真所得的單車公里牽引能耗、單車公里再生能產(chǎn)生量及技術(shù)速度共同作為第2步SVR的輸入變量。輸出變量則選取為單車公里牽引能耗。
2)訓(xùn)練過程。通過提取訓(xùn)練樣本中輸入變量和輸出變量的特征關(guān)系,訓(xùn)練SVR模型,并采用交叉驗(yàn)證方法及遺傳算法對模型超參數(shù)進(jìn)行尋優(yōu)。本文中訓(xùn)練樣本為既有線,預(yù)測樣本為新線。
3)預(yù)測過程。在已知新線輸入變量的條件下,基于訓(xùn)練所得的SVR模型,可實(shí)現(xiàn)新線單車公里牽引能耗預(yù)測。
單列車運(yùn)行仿真系統(tǒng)可模擬列車運(yùn)行過程,進(jìn)而計(jì)算列車運(yùn)行實(shí)時能耗。列車運(yùn)動方程為[11]:
式中:i代表仿真時間步長;ai,vi,si分別代表第i個仿真步長初的列車加速度、速度以及位置。r代表列車回轉(zhuǎn)質(zhì)量系數(shù),取0.06。Mi代表列車牽引重量,由列車自重和乘客總重共同構(gòu)成。Δt為步長間隔,取0.5 s。Fi代表列車運(yùn)行過程中所受合力,其可被定義為:
式中:U代表受電弓處網(wǎng)壓。Ii代表第i個仿真步長下的電流,由列車有功/制動電流特性曲線和當(dāng)前速度決定。當(dāng)列車處于牽引狀態(tài)時,Ii>0,處于制動狀態(tài)時,Ii<0。Nn代表列車從起點(diǎn)運(yùn)行至終點(diǎn)包含的所有步長集合。
最終,可得單列車全線運(yùn)行時單車公里牽引能耗ETEE,單車公里再生能產(chǎn)生量EBEE及技術(shù)速度V為:
式中:L代表列車走行公里,其等于線路長度。S代表列車編組數(shù)量;T代表列車從起點(diǎn)站運(yùn)行至終點(diǎn)站不包括停站時分所耗總時長。
列車全線運(yùn)行時有上下行之分,上下行線路條件不同,會導(dǎo)致單車公里牽引能耗、單公里再生能產(chǎn)生量及技術(shù)速度發(fā)生變化。由于列車多為成對運(yùn)行,上下行開行列車數(shù)量相等,本文采用上下行單車公里牽引能耗、單車公里再生能產(chǎn)生量及技術(shù)速度平均值作為支持向量機(jī)輸入變量。
支持向量機(jī)[12]是一種典型的機(jī)器學(xué)習(xí)方法,在處理非線性問題上具有獨(dú)特的優(yōu)勢。其核心思想是將訓(xùn)練樣本(Xi,Yi)映射到高維空間X→φ(X)實(shí)現(xiàn)線性回歸,SVR方程為:
式中:w為權(quán)值向量,b為偏置值。Yi代表訓(xùn)練樣本i的地鐵牽引單耗,Xi代表第i個樣本中的輸入變量,為影響輸出變量Yi的各因素取值。
支持向量回歸的最終目的是求解得到w與b,使得樣本與回歸曲線的誤差最小?;诮Y(jié)構(gòu)風(fēng)險最小化原則,該優(yōu)化問題可構(gòu)建為:
式中:ξ和ξ*代表松弛變量,C為懲罰因子,ε代表不敏感損失系數(shù),即如果樣本點(diǎn)到回歸平面的距離小于ε,則損失為0。SVR的損失函數(shù)[13]為:
對于式(11)所示的凸二次規(guī)劃問題,可引入拉格朗日乘子α及α*,將其轉(zhuǎn)變?yōu)閷ε紗栴}進(jìn)行求解:
其中,權(quán)值向量w為:
則SVR模型可被表示為:
為簡化優(yōu)化問題維度,引入滿足Mercer[14]條件K(Xi,X)=φ(Xi)φ(X)的核函數(shù)。此時,SVR模型可表示為:
核函數(shù)可將模型由低維映射到高維,使得模型在高維中實(shí)現(xiàn)回歸。本文引入高斯核函數(shù),其可被定義為:
式中:σ2為核函數(shù)寬度。
因此,通過挑選合適的懲罰因子C,不敏感損失系數(shù)ε以及核函數(shù)寬度σ2可實(shí)現(xiàn)支持向量機(jī)模型訓(xùn)練。其中,超參數(shù)C,ε及σ2影響模型訓(xùn)練效果。懲罰因子C代表對訓(xùn)練誤差大于ε的樣本的懲罰,C越大,訓(xùn)練樣本的準(zhǔn)確性越高,模型的泛化能力越低。ε影響支持向量的數(shù)目,ε越大,支持向量數(shù)越少,模型可能過于簡單,學(xué)習(xí)精度低。σ2決定數(shù)據(jù)映射到新的特征空間的分布形態(tài),σ2越小,寬度越小,訓(xùn)練準(zhǔn)確率高,但模型的泛化能力差,容易過擬合。
本文采用遺傳算法對超參數(shù)C,ε及σ2進(jìn)行尋優(yōu),其流程如圖2所示。
圖2 參數(shù)尋優(yōu)流程Fig.2 Flowchart of parameter optimization
為驗(yàn)證本文提出的組合預(yù)測方法在新線預(yù)測中的效果,選取某城市地鐵6條線路共204組月度統(tǒng)計(jì)數(shù)據(jù)作為樣本集。
在樣本集中,輸入變量包括仿真單車公里牽引能耗(X1)、仿真單車公里再生能產(chǎn)生量(X2)、技術(shù)速度(X3)、最小發(fā)車間隔(X4)、最大發(fā)車間隔(X5)、滿載率(X6)、月均最高氣溫(X7)、照明設(shè)備功率(X8)以及空調(diào)設(shè)備功率(X9),輸出變量為牽引單耗(Y)。部分樣本數(shù)據(jù)如表1所示。
表1 樣本數(shù)據(jù)Table 1 Sample data
為消除原始數(shù)據(jù)量綱影響,將輸入輸出變量進(jìn)行歸一化處理,如式(18)所示:
表2 預(yù)測模型MAPE及RMSETable 2 MAPE and RMSE of the predictive model
為驗(yàn)證本文提出方法的預(yù)測效果,假定樣本集包含的6條線路中的其中1條線路作為新線,其余5條線路作為既有線路進(jìn)行預(yù)測。組合預(yù)測方法通過提取既有線路中單耗影響因子與單車公里牽引能耗間的特征關(guān)系,實(shí)現(xiàn)新線單耗的準(zhǔn)確預(yù)測。本文設(shè)計(jì)了2個案例來驗(yàn)證提出的組合預(yù)測方法在提取特征關(guān)系以及預(yù)測新線單車公里牽引能耗的使用效果。
案例1:假定2號線為新線,使用2號線所包含的60組數(shù)據(jù)做預(yù)測集。其余5條線路包括1,5,6,8,10,15號線共144組數(shù)據(jù)做訓(xùn)練集。
案例2:假定5號線為新線,使用5號線所包含的60組數(shù)據(jù)做預(yù)測集。其余線路包括1,2,6,8,10,15號線共144組數(shù)據(jù)做訓(xùn)練集。
由于遺傳算法在參數(shù)選擇中具有一定的隨機(jī)性,本文采取重復(fù)計(jì)算10次的方法來保證預(yù)測穩(wěn)定性,取10次預(yù)測結(jié)果的平均值為最終參數(shù)輸出。其中,2號線及5號線的預(yù)測結(jié)果分別如圖3和圖4所示。
圖3 2號線預(yù)測結(jié)果Fig.3 Predictive results of line 2
圖3和圖4結(jié)果顯示,2號線和5號線預(yù)測結(jié)果與實(shí)際數(shù)據(jù)差別不大。為量化其預(yù)測效果,采用平均百分比誤差(MAPE)和均方根誤差(RMSE)計(jì)算預(yù)測數(shù)據(jù)與實(shí)際數(shù)據(jù)的偏差程度,其計(jì)算公式為:
圖4 5號線預(yù)測結(jié)果Fig.4 Predictive results of line 5
式中:代表預(yù)測牽引單耗;Yij代表實(shí)際牽引單耗。i代表樣本點(diǎn)序號;j代表重復(fù)次數(shù)序號。
表2所示為2號線和5號線預(yù)測的MAPE值和RMSE值,結(jié)果顯示,本文提出的組合預(yù)測方法在2號線和5號線單車公里牽引能耗預(yù)測中均表現(xiàn)出良好的效果,證明了本文組合預(yù)測方法可有效提取既有線路中影響因子與單耗的特征關(guān)系,可普遍適用于地鐵新線單耗預(yù)測。
為分析遺傳算法在選擇SVR參數(shù)中的穩(wěn)定性表現(xiàn),以相對誤差RE量化10次預(yù)測結(jié)果,其計(jì)算公式為:
圖5和圖6所示結(jié)果為2號線和5號線10次預(yù)測中各樣本點(diǎn)的相對誤差。可以看出,10次重復(fù)預(yù)測中,各樣本點(diǎn)的相對誤差趨于一致,說明預(yù)測的穩(wěn)定性較高。
圖5 2號線相對誤差Fig.5 RE of line 2
圖6 5號線相對誤差Fig.6 RE of line 5
同時,分析各樣本點(diǎn)相對誤差可以發(fā)現(xiàn),在95%的置信水平下,2號線和5號線預(yù)測精度可達(dá)90%。
為驗(yàn)證本文組合預(yù)測方法相比其他預(yù)測方法在地鐵新線單耗預(yù)測中的適用效果,設(shè)計(jì)2組對比案例,分別采用“SVR”預(yù)測方法及“仿真+BP神經(jīng)網(wǎng)絡(luò)”預(yù)測方法。
“SVR”預(yù)測方法不采用仿真刻畫線路條件及列車性能因子,僅使用SVR模型進(jìn)行預(yù)測。此時,輸入變量變?yōu)槠骄鹃g距、站中心位于凸面比例、坡度絕對平均值、曲線總長占全線比例、列車質(zhì)量、車輛編組數(shù)量、技術(shù)速度、基本阻力、最小發(fā)車間隔、最大發(fā)車間隔、滿載率、氣溫、照明設(shè)備功率、空調(diào)設(shè)備功率14個變量。其余參數(shù)包括樣本集選取、遺傳算法參數(shù)選擇及重復(fù)次數(shù)等均保持不變。
表3所示預(yù)測結(jié)果表明,無仿真的“SVR”方法在2號和5號線單耗預(yù)測中的MAPE值及RMSE值均高于本文方法,說明在預(yù)測中加入仿真過程可提高新線單耗預(yù)測精度。
表3 “SVR”方法MAPE及RMSETable 3 MAPE and RMSE of“SVR”model
“仿真+BP神經(jīng)網(wǎng)絡(luò)”方法設(shè)計(jì)目的是為了比較“SVR”和“BP神經(jīng)網(wǎng)絡(luò)”2種機(jī)器學(xué)習(xí)方法的優(yōu)劣。其預(yù)測結(jié)果如表4所示。
表4 “仿真+BP神經(jīng)網(wǎng)絡(luò)”方法MAPE及RMSETable 4 MAPE and RMSE of“Simulation+BP”model
表4所示預(yù)測結(jié)果表明,“仿真+BP神經(jīng)網(wǎng)絡(luò)”方法在2號和5號線預(yù)測中的MAPE值及RMSE值均高于本文方法,說明在地鐵新線單耗預(yù)測時SVR優(yōu)于神經(jīng)網(wǎng)絡(luò)。
1)準(zhǔn)確預(yù)測地鐵新線牽引單耗對輔助新線規(guī)劃設(shè)計(jì)、列車選型等有重要意義。列車牽引能耗內(nèi)在機(jī)理復(fù)雜,將仿真和支持向量回歸相結(jié)合進(jìn)行預(yù)測,可結(jié)合列車運(yùn)行仿真及大數(shù)據(jù)預(yù)測模型的雙重優(yōu)點(diǎn),實(shí)現(xiàn)新線單車公里牽引能耗的精準(zhǔn)預(yù)測。
2)案例結(jié)果表明,采用本文提出的仿真和SVR相結(jié)合的預(yù)測方法,在95%的置信水平下,地鐵新線單車公里牽引能耗的預(yù)測精度可達(dá)90%。且本文方法優(yōu)于傳統(tǒng)的“SVR”預(yù)測方法和“仿真+BP神經(jīng)網(wǎng)絡(luò)”預(yù)測方法。下一步將對再生能進(jìn)行更詳細(xì)的刻畫,進(jìn)一步提高地鐵新線牽引單耗的預(yù)測精度。