馬 帥,高 亮,劉秀波,蔡小培
(1.北京交通大學 土木建筑工程學院,北京 100044;2.中國鐵道科學研究院集團有限公司 基礎設施檢測研究所,北京 100081)
我國客貨共線鐵路正線一般采用有砟軌道、長大隧道一般采用無砟軌道。對于客貨共線無砟軌道,由于開行貨運列車,運營條件和環(huán)境比客運專線無砟軌道或有砟軌道差,而在結構和力學性能上與客貨共線有砟軌道也存在顯著差異;即使在相同的外界環(huán)境下,4種不同條件下軌道結構的平順狀態(tài)也將呈現(xiàn)不同的發(fā)展規(guī)律。因此,有必要針對客貨共線無砟軌道建立軌道平順狀態(tài)預測模型,為制定合理維修計劃奠定基礎。
國內(nèi)外學者在軌道平順狀態(tài)預測方面取得了許多研究成果。早期學者通過試驗和軌檢車實測數(shù)據(jù)歸納分析建立了多個預測模型,如日本學者的預測公式[1-3],國際鐵路聯(lián)盟ORE的軌道不平順惡化率線性模型[4],加拿大PWMIS系統(tǒng)的線性預測模型[5]。此外,相關學者還將多種數(shù)據(jù)分析方法用于軌道平順狀態(tài)預測,如基于卡爾曼濾波的軌檢車數(shù)據(jù)預測分析方法[6]、基于軌道不平順概率分布的特性矩陣法[7]、考慮軌道狀態(tài)惡化眾多影響因素的綜合因子法[8]、改進型指數(shù)平滑預測模型[9]、基于平均劣化率的軌道質(zhì)量短期預測模型[10]、基于灰色系統(tǒng)理論的非等時距GM(1,1)預測模型[11]及其修正模型[12]、灰色GM(1,1)與AR模型的組合模型[13]、灰色模型與神經(jīng)網(wǎng)絡的組合模型[14]等。這些預測模型主要針對有砟軌道,有砟軌道平順狀態(tài)發(fā)展規(guī)律通常滿足分段線性、多項式或指數(shù)等具有明顯趨勢的形式。而研究發(fā)現(xiàn),客貨共線無砟軌道的軌道質(zhì)量指數(shù)TQI在相當長的時間內(nèi)并無明顯惡化趨勢,通常呈長期趨勢緩慢變化并伴隨平穩(wěn)波動,因此以往的預測模型難以分析這種變化特征。
基于客貨共線無砟軌道TQI的時間序列變化特征,結合小波分析和時間序列分析預測方法,本文提出將ARMA-BP神經(jīng)網(wǎng)絡和ARMA-SVR模型用于無砟軌道平順狀態(tài)預測。首先對TQI原始序列進行小波分解,將ARMA模型用于預測TQI序列平穩(wěn)波動成分,同時利用BP神經(jīng)網(wǎng)絡和支持向量回歸SVR對TQI序列的慢變趨勢成分進行建模與預測,最后綜合2種成分的預測值獲得最終預測結果。
TQI是我國工務部門評價軌道質(zhì)量和指導線路養(yǎng)護維修的重要參數(shù),由200 m區(qū)段內(nèi)左右高低、左右軌向、軌距、水平和三角坑共7項軌道不平順的標準差求和得到,能夠有效反映軌道平順性。
本文數(shù)據(jù)來自包西線慶興隧道和太中線吳堡隧道的軌檢車檢測數(shù)據(jù),2條線路的設計速度均為160 km·h-1,隧道內(nèi)分別鋪設Ⅰ型和Ⅱ型雙塊式無砟軌道。軌道不平順動態(tài)檢測每月1次,數(shù)據(jù)檢測時間為2014年1月至2016年12月,對每次的檢測數(shù)據(jù),每200 m區(qū)段計算1個TQI值,每個區(qū)段的連續(xù)多次TQI數(shù)據(jù)作為1個時間序列樣本。對2個隧道各隨機選取5個無砟軌道區(qū)段作為研究對象,TQI時間序列樣本如圖1所示,其中慶興隧道樣本的里程為K770+600—K770+800,吳堡隧道樣本的里程為K1 192+600—K1 192+800。
圖1 無砟軌道區(qū)段TQI時間序列樣本
由圖1可以看出:無砟軌道區(qū)段3年的TQI數(shù)值并未發(fā)生明顯的趨勢性變化,TQI值變化并不能用多項式或指數(shù)表示。這是因為,相比于有砟軌道,無砟軌道結構穩(wěn)定,具有較好的軌道質(zhì)量保持能力;處于隧道內(nèi),溫度、濕度也相對穩(wěn)定,不受雨雪等外界環(huán)境影響。此外,2個隧道自建成至今未進行過換軌等大修,主要的扣件維護和鋼軌打磨作業(yè)對TQI影響較小,TQI值并未發(fā)生明顯變化。
為了深入分析TQI時間序列是否含有趨勢性成分,采用小波分解方法,利用bior4.4小波基將圖1中慶興隧道的TQI樣本進行1級分解,得到低頻成分和高頻成分,如圖2所示。由圖2可以看出:低頻成分具有幅值變化相對平緩的趨勢項,而高頻成分圍繞0值均勻波動,近似滿足平穩(wěn)性。
圖2 慶興隧道TQI樣本小波分解
經(jīng)過反復試算,db6,db8,sym6,sym8和bior4.4等小波基均適用于TQI時間序列,分解結果相近,考慮雙正交小波兼顧了線性相位和正交性,故選取bior4.4小波基。
對TQI時間序列高頻成分是否滿足平穩(wěn)性需要驗證時,ADF檢驗[15]是常用的時間序列平穩(wěn)性檢驗方法。它以隨機游走模型為檢驗依據(jù),并在實際檢驗過程中推廣為以下3個模型。
(1)
(2)
(3)
其中,
ΔXt=Xt-Xt-1
式中:Xt為時間序列;εt為白噪聲;I為差分項數(shù)目;γ,β和δ為常數(shù)。
式(2)和式(3)分別考慮了常數(shù)和趨勢項,每個模型的原假設都是δ=0,即不滿足平穩(wěn)性。檢驗過程從式(3)開始,然后式(2)、式(1),何時拒絕原假設何時停止檢驗,否則直到檢驗完式(1)為止。表1為對圖2中高頻成分在顯著性水平為0.05時的平穩(wěn)性檢驗結果。
當3個公式中差分項數(shù)I取不同值時,高頻成分均拒絕原假設,這表明高頻成分滿足平穩(wěn)性;進一步分析得知,絕大多數(shù)TQI樣本的高頻成分均滿足平穩(wěn)性??梢哉J為,客貨共線無砟軌道TQI的時間序列包含平穩(wěn)的高頻成分。
表1 慶興隧道TQI樣本平穩(wěn)性檢驗結果
由于客貨共線無砟軌道TQI時間序列的不同頻率成分具有不同特性,在進行預測時應該采用不同模型分別建模??紤]到TQI高頻成分滿足平穩(wěn)性,本文采用適用于平穩(wěn)時間序列建模的ARMA模型;TQI低頻成分是慢變的非線性趨勢項,可以采用BP神經(jīng)網(wǎng)絡和支持向量回歸SVR建模。最后將ARMA子模型的預測結果分別和BP神經(jīng)網(wǎng)絡、SVR子模型的預測結果求和,得到2種軌道質(zhì)量指數(shù)TQI預測模型:ARMA-BP神經(jīng)網(wǎng)絡和ARMA-SVR預測模型的建模流程如圖3所示。
圖3 建模流程
下文建模采用圖1中慶興隧道的TQI樣本。
ARMA模型是時間序列分析中具有代表性的一類有限參數(shù)線性模型,能描述平穩(wěn)時間序列內(nèi)部的相關關系,適合平穩(wěn)時間序列建模。ARMA模型建模過程如下。
(1)TQI時間序列高頻成分的平穩(wěn)性檢驗。ARMA模型要求時間序列滿足平穩(wěn)性,可以利用ADF檢驗方法進行檢驗。如果TQI時間序列高頻成分不滿足平穩(wěn)性,可以進行差分處理使其滿足平穩(wěn)性,最后對預測結果進行積分處理。
(2)模型階數(shù)選取。自回歸階數(shù)n與滑動平均階數(shù)m一般根據(jù)貝葉斯信息準則(BIC)[16]確定。BIC準則在模型復雜度與模型對數(shù)據(jù)描述能力之間尋求最佳平衡,通過加入模型復雜度的懲罰項避免過擬合問題,是衡量模型擬合優(yōu)良性的一種標準。BIC統(tǒng)計量為
BIC=klnM-2lnL
(4)
式中:k為模型參數(shù)個數(shù);L為模型極大似然函數(shù)值;M為樣本容量。
本文分別對n和m取不同的值,當BIC統(tǒng)計量最小時將對應的n和m作為模型階數(shù)。圖4為n和m取不同值時慶興隧道TQI樣本的BIC統(tǒng)計量的柱狀分布圖。由圖4可知對于慶興隧道的TQI樣本應取n=2,m=3。
圖4 不同自回歸階數(shù)、滑動平均階數(shù)時慶興隧道TQI樣本的BIC統(tǒng)計量
(3)采用最小二乘法進行模型參數(shù)估計,得到模型參數(shù)。
BP神經(jīng)網(wǎng)絡是一種常用的前饋型神經(jīng)網(wǎng)絡,具有較強的非線性建模能力。理論上,1個3層神經(jīng)網(wǎng)絡能夠逼近任一復雜的非線性系統(tǒng)。利用BP神經(jīng)網(wǎng)絡進行TQI時間序列低頻成分建模過程如下。
(1)網(wǎng)絡結構設計,確定各層節(jié)點數(shù)目。將神經(jīng)網(wǎng)絡層數(shù)選定為3。為了保證輸入信息充足,選取輸入層節(jié)點數(shù)為5,輸出層節(jié)點數(shù)為1。對于關鍵的隱含層節(jié)點數(shù)目,分別選取節(jié)點數(shù)2~10(數(shù)目過大容易產(chǎn)生過擬合,降低模型泛化能力),然后隨機選取不同的模型初始值,對每個隱含層節(jié)點數(shù)目的神經(jīng)網(wǎng)絡均訓練100次,計算模型預測均方根誤差的平均值,結果如圖5所示。選取使誤差最小的值作為隱含層節(jié)點數(shù),由圖5可知隱含層節(jié)點數(shù)應取9。
圖5 模型誤差與隱含層節(jié)點數(shù)目關系曲線
輸入輸出矩陣的每一行是1組輸入輸出數(shù)據(jù)。
(3)數(shù)據(jù)規(guī)范化。采用最小—最大規(guī)范化方法,對輸入輸出矩陣的每一列進行規(guī)范化,計算式為
(5)
(4)確定神經(jīng)網(wǎng)絡訓練參數(shù)。神經(jīng)網(wǎng)絡隱含層和輸出層的激活函數(shù)分別取Log-sigmoid函數(shù)和Purelin函數(shù),模型訓練方法為自適應學習率梯度下降算法,學習率為0.01,目標誤差精度0.01,最大迭代次數(shù)105次。
(5)模型訓練與預測。
支持向量回歸SVR是支持向量機SVM進行回歸和數(shù)值預測時的變體,具有較強的非線性建模能力。SVR基于結構風險最小化策略訓練模型,不太容易過分擬合,因此具有較好的泛化能力;采用核函數(shù)代替復雜的高維空間內(nèi)積運算,能夠有效克服維數(shù)災難和局部極小問題。SVR試圖找到1個決策函數(shù)f(x)=ωTx+b, 其中ω和b為待定系數(shù),使得函數(shù)值f(x)與真實值y盡可能接近。一般認為當y-f(x)=0時模型的損失才為0,而支持向量回歸SVR允許y與f(x)之間存在最大偏差θ,即引進損失函數(shù)lθ(x)。
(6)
SVR的結構風險函數(shù)為
(7)
式中:‖ω‖2為模型參數(shù)絕對值的平方,描述模型的復雜程度;C為懲罰系數(shù)。
i=1, 2, …,M
(8)
s.t.
ηi≥0
式中:M為數(shù)據(jù)樣本容量。
利用SVR對TQI低頻成分建模的過程如下。
1)訓練數(shù)據(jù)集選取與整理
選定訓練數(shù)據(jù)集{(x1,y1), (x2,y2), …, (xN-p,yN-p)}∈Rp×R, 其中xi=(xi,xi+1, …,xi+p-1),yi=xi+p, 1≤i≤N-p。并采用與神經(jīng)網(wǎng)絡同樣的方法整理輸入輸出數(shù)據(jù)的格式。
2)構造最優(yōu)化問題
建立對偶形式SVR結構風險函數(shù)。
(9)
s.t.
ai≤C
式(9)的詳細推導參見文獻[17]。
基于大量分析對比,本文選擇徑向基函數(shù)作為核函數(shù),即
K(x,y)=exp(-r|x-y|2)
(10)
式中:r為徑向基核函數(shù)的參數(shù)。
3)模型參數(shù)確定
在r,C和θ這3個參數(shù)中,θ是決定模型精度的最關鍵參數(shù)。令θ在0.01~0.5范圍內(nèi)以0.01的間隔依次遞增,對于每個不同的θ值,同時允許r和C在合理范圍內(nèi)取值,并對r和C優(yōu)化使得SVR對TQI低頻序列的擬合和預測均方根誤差最小。圖6為r和C取最優(yōu)值時,θ在0.10~0.30范圍內(nèi)的均方根誤差變化曲線。結果表明,當θ取0.23時預測誤差最小,但擬合誤差略大;均衡考慮擬合和預測誤差,θ取0.20。
圖6 SVR均方根誤差與θ的關系曲線
經(jīng)過初步試算,r和C相對合理的取值范圍log2C為[5,15],log2r為[-15,-5]。當θ=0.20時,計算不同r和C情況下的SVR預測均方根誤差,如圖7所示。當預測誤差最小時,r≈0.001,C≈16 000。
圖7θ=0.20時,SVR均方根誤差與懲罰系數(shù)C、核函數(shù)參數(shù)r的關系曲面
4)求解最優(yōu)化問題
(11)
式中:φ(xi)為第i個數(shù)據(jù)樣本的映射函數(shù)值。
選擇1個正值拉格朗日乘子0 (12) 5)構造決策函數(shù) (13) 為了驗證模型對已知數(shù)據(jù)的擬合效果和對未知數(shù)據(jù)的預測能力,利用ARMA-BP神經(jīng)網(wǎng)絡和ARMA-SVR預測模型對圖1中的樣本進行擬合和預測,并與單一非線性預測模型的預測結果進行對比,其中2014年1月—2016年7月(前31個)的TQI值用于模型訓練,2016年8月—2016年12月(后5個)的值用于模型預測。此外,還分別計算了2個隧道中10個無砟軌道區(qū)段的模型的準確度指標,以對比2個組合模型之間的優(yōu)劣。 圖8為本文預測模型和單一模型(BP神經(jīng)網(wǎng)絡和SVR)對慶興隧道K770+600—K770+800里程區(qū)段TQI樣本的擬合和預測結果。圖9為吳堡隧道K1 192+600—K1 192+800里程區(qū)段TQI樣本的擬合和預測結果。表2統(tǒng)計了各模型的擬合與預測的均方根誤差。由于神經(jīng)網(wǎng)絡的輸入層確定為5層,為了便于對比,SVR的輸入向量維數(shù)取5維。此時,前5次數(shù)據(jù)(2014年1月—5月數(shù)據(jù))只能作為模型的輸入值,無法進行預測,故圖8與圖9中沒有對應數(shù)據(jù)。 表2 各模型的擬合和預測均方根誤差 由圖8和圖9可以看出:相比于本文提出的預測模型(ARMA-BP神經(jīng)網(wǎng)絡和ARMA-SVR),單一預測模型(BP神經(jīng)網(wǎng)絡和SVR)的擬合精度較高,但預測精度明顯降低。這是因為,TQI時間序列不同頻率成分的特性存在差異,單一非線性模型難以對具有多種成分、不同特性的復雜時間序列進行有效模擬,往往對訓練數(shù)據(jù)過擬合,導致模型復雜度偏高,從而降低了泛化能力,預測誤差偏高。因此,單一模型不適合TQI預測。 圖8 慶興隧道TQI樣本模型預測效果對比 圖9 吳堡隧道TQI樣本模型預測效果對比 利用ARMA-BP神經(jīng)網(wǎng)絡和ARMA-SVR這2個模型分別對慶興隧道和吳堡隧道共10個無砟軌道區(qū)段的TQI樣本進行建模與預測,并與文獻[11]中的GM(1,1)修正模型進行對比。根據(jù)文獻[14]中的模型精度指標,計算3個模型的平均相對誤差、均方根誤差、模型精度及后驗差4個指標在10個區(qū)段的平均值,結果見表3。 表3 各模型精度指標平均值 結果表明:本文提出的2個模型的預測精度等級均為1級,均可對客貨共線無砟軌道TQI時間序列進行有效預測;ARMA-BP神經(jīng)網(wǎng)絡的擬合精度高于ARMA-SVR,但預測精度低于ARMA-SVR,可以認為ARMA-SVR以犧牲擬合精度獲得較高的預測精度,具有更強的泛化能力。對于客貨共線無砟軌道得TQI時間序列,其低頻趨勢成分變化緩慢,不符合分段線性或指數(shù)等形式,具有指數(shù)函數(shù)形式的GM(1,1)模型將難以適用,而BP神經(jīng)網(wǎng)絡、SVR對此依然具有較強的建模和預測能力。 (1)客貨共線隧道內(nèi)無砟軌道TQI時間序列特征明顯,包含了緩慢變化的低頻成分和平穩(wěn)波動的高頻成分。 (2)ARMA-BP神經(jīng)網(wǎng)絡和ARMA-SVR模型可以對具有不同特性多種成分的復雜TQI時間序列進行綜合建模,預測精度明顯高于BP神經(jīng)網(wǎng)絡和SVR預測模型。ARMA-BP神經(jīng)網(wǎng)絡和ARMA-SVR模型的預測精度等級均為1級,能夠有效預測客貨共運線路無砟軌道TQI時間序列發(fā)展。 (3)本文提出的預測模型沒有考慮客貨共線無砟軌道大修情況的影響。大修作業(yè)對無砟軌道TQI變化規(guī)律的影響及預測方法需要進一步研究。3 模型預測效果
4 結 論