楊溪源,李彥哲
(蘭州交通大學(xué)自動化與電氣工程學(xué)院, 蘭州 730070)
近年來,我國鐵路事業(yè)迅猛發(fā)展,隨著列車運行速度的不斷提高,鐵路運營安全成為人們關(guān)注的熱點。鐵路運營安全主要包括:列車車體安全、信號與通信系統(tǒng)安全、調(diào)度指揮安全等[1-2]。其中,脫軌作為列車車體安全考慮因素之一,容易受大風(fēng)等自然災(zāi)害的影響[3-4]。在大風(fēng)環(huán)境及風(fēng)口區(qū)域的高路堤、丘陵等特殊路段中,由于列車氣動性能惡化,導(dǎo)致列車穩(wěn)定性受到嚴重影響,大大增加列車脫軌的可能性[5],因此,對鐵路風(fēng)速預(yù)測研究,顯得尤為重要。
國外,文獻[6-7]提出在鐵路沿線建立擋風(fēng)墻、列車外形優(yōu)化等的方法,一定程度上解決了大風(fēng)對高速列車運行的影響,但是有一定的局限性;文獻[8]根據(jù)列車運行沿線歷史風(fēng)速數(shù)據(jù)以實現(xiàn)外推估計的風(fēng)速預(yù)測研究,該方法簡單、實時性好,但預(yù)測精度不高;國內(nèi),文獻[9-11]針對鐵路沿線風(fēng)速短期預(yù)測,學(xué)者分別利用時間序列分析理論和神經(jīng)網(wǎng)絡(luò)等方法進行預(yù)測研究,很好的提高了風(fēng)速預(yù)測精度,但存在神經(jīng)網(wǎng)絡(luò)初始權(quán)值和選擇訓(xùn)練數(shù)據(jù)樣本不易確定等缺陷,基于此,支持向量機法等機器學(xué)習(xí)型算法應(yīng)運而生,以結(jié)構(gòu)風(fēng)險最小化為目標(biāo)的SVM預(yù)測模型較神經(jīng)網(wǎng)絡(luò)模型具有較高的精度,這在一定程度上克服了神經(jīng)網(wǎng)絡(luò)在鐵路短期風(fēng)速預(yù)測中的劣勢[12],但是SVM模型仍存在核函數(shù)選擇條件苛刻需遵循Mercer條件,核函數(shù)較多且其值的選取對SVM模型的預(yù)測精度有著較大的影響。在此,本文根據(jù)新型計算機算法相關(guān)向量機核函數(shù)選擇靈活無需遵循Mercer條件,核參數(shù)的設(shè)置數(shù)目少的特點,利用差分進化算法在參數(shù)優(yōu)化方面的優(yōu)勢,采用交叉算子可自適應(yīng)調(diào)整的自適應(yīng)差分進化算法,并混合了模擬退火算法對最優(yōu)參數(shù)進行二次優(yōu)化,提出了基于自適應(yīng)混合差分進化相關(guān)向量機(Self-Adaptive Hybrid Differential Evolution-Relevance Vector Machine, SAHDE-RVM)的鐵路短期風(fēng)速預(yù)測模型,通過實例對預(yù)測模型進行驗證,并與現(xiàn)有模型的預(yù)測結(jié)果進行對比分析。
相關(guān)向量機(Relevance Vector Machine, RVM)是一種基于貝葉斯框架的算法[13]。與傳統(tǒng)的SVM相比,RVM具有高稀疏性,僅有核參數(shù)的設(shè)置,核函數(shù)的選擇靈活,無需滿足Mercer條件等優(yōu)點,在回歸預(yù)測方面有著良好的應(yīng)用價值。
本文使用RVM進行回歸預(yù)測,建立RVM回歸預(yù)測模型。給定訓(xùn)練樣本的輸入集X={x1,x2,x3,…,xn,}與相應(yīng)的輸出集T={t1,t2,t3,…,tn},其中n為樣本個數(shù),設(shè)ti為目標(biāo)值且有ti∈R。輸出值ti的函數(shù)模型可表示為
ti=y(xi,w)+εi
(1)
式中,εi表示高斯白色噪聲,且εi服從分布εi~N(0,σ2),則p(ti|xi)=N(ti|y(xi,w),σ2)。RVM模型的輸出可表示為非線核函數(shù)的組合,核函數(shù)無需滿足mercer條件。RVM的回歸預(yù)測模型為
(2)
式中,wi為加權(quán)系數(shù);K(x,xi)為核函數(shù);N為樣本數(shù)量。
對于獨立分布的輸出集ti的似然估計為
(3)
式中,Φ=(Φ1,Φ2,…,ΦN);Φi=(1,K(xi,x1),…;K(xi,xn))T(i=1,…,N)。
由稀疏貝葉斯原理定義的權(quán)值參數(shù)為零的高斯先驗分布為
(4)
式中,αi為先驗高斯分布的超參數(shù);α=(α0,…,αN)T。每個獨立的超參數(shù)αi控制著權(quán)參數(shù)wi的先驗分布,使相關(guān)向量機模型具有稀疏性。
由式(3)、式(4)根據(jù)貝葉斯原理計算權(quán)值矢量w的后驗分布
N(w|μ,∑)
(5)
式中,μ=σ-2∑φTt,∑=(A+σ-2φTφ)-1,A=diag(α0,α1,…,αN)。
由式(5)可知,若要確定權(quán)值矢量w需對超參數(shù)α、σ2進行確定。用貝葉斯框架計算超參數(shù)的似然分布
(6)
式中,C為協(xié)方差且C=σ2I+ΦA(chǔ)-1ΦT。
(7)
(8)
式中,uj是第j個后驗平均權(quán)值;γj=1-αjMjj(γj∈[0,1]);Mjj為權(quán)值協(xié)方差矩陣Σ的對角線元素。
RVM學(xué)習(xí)過程中,首先初始化式(7)、式(8)中的兩個參數(shù),并通過更新迭代公式不斷更新計算兩個超參數(shù),當(dāng)模型中的參數(shù)均達到最大訓(xùn)練次數(shù)時,更新計算停止,此時得到的α與σ2為最優(yōu)值。若給定系統(tǒng)一個輸入值X*,則輸出的概率分布為
N(t)(t*|y*,σ2)
(9)
y*=uTΦ(X*)=uMPΦ(X*)
(10)
(11)
Storn R和Price K于1995年提出了差分進化算法(Differential Evolution,DE),DE是一種使用實數(shù)矢量編碼的群體智能化的優(yōu)化算法,其原理類似于遺傳算法。DE具有強大的易用性、魯棒性和全局搜索能力,已有大量的文獻證明DE算法的優(yōu)越性高于遺傳算法、蟻群算法等智能算法[14]。DE通過對群體中的個體分別進行變異、交叉、選擇等操作獲取最優(yōu)個體,從而得到最優(yōu)值。但DE算法仍然具有易早熟,較難搜索到全局最優(yōu)解等缺陷,鑒于此,本文采用一種自適應(yīng)混合差分進化算法(Self-Adaptive Hybrid Differential Evolution,SAHDE)[15-17],該模型可自適應(yīng)調(diào)整DE的交叉概率算子CR,在算法的初期保持種群的多樣性的同時提高其全局搜索能力,并引入了模擬退火算法,該算法具有較強的搜索能力可對獲取的最優(yōu)解進行二次搜索,SAHDE算法可解決DE算法早熟收斂,優(yōu)化算法的全局所搜能力。差分進化算法的操作步驟如下。
(1)變異操作:DE算法由多種變異操作方法,本文選用如下方法進行變異操作。
xm=xbest+F[(x1-x2)+(x3-x4)]
(12)
隨機挑選出4個父代個體,分別記為x1,x2,x3,x4;xbest是父代中的最優(yōu)個體;xm為變異產(chǎn)生的變異個體;F為變異率(F∈[0,1.2])。
(2)交叉操作:選取兩個個體xi和xm進行交叉操作,交叉操作后生成的新個體為xc,具體的操作方法如下式
j=1,2,…,D
(13)
其中,rand()表示[0,1]之間的隨機函數(shù),randr(i)∈{1,2,…,D}為隨機產(chǎn)生的整數(shù);D為優(yōu)化變量的維數(shù);CR為交叉率(CR∈(0,1))。
(14)
(15)
CR0為交叉算子CR的初值,CR的值根據(jù)上式自適應(yīng)調(diào)整,初始值CR0較小,而后其取值逐步增大,此時算法具備一個優(yōu)秀搜索算法所具備的能力,與傳統(tǒng)DE相比具有更好的性能。
DE種群的多樣性會導(dǎo)致其早熟收斂。為了進一步提高算法的搜索效率,本文使用模擬退火算法對SAHDE產(chǎn)生的當(dāng)前最優(yōu)個體進行二次搜索。在SAHDE當(dāng)中,選定當(dāng)前最優(yōu)個體為初始個體,既y0=xbest初始溫度選定為T0,產(chǎn)生新個體的方式如下所示
yr+1,j=yr,j+ηε(xjmax-xjmin)
j=1,2,…,D
(16)
式中,r為模擬退火算法的迭代次數(shù);yr為r次迭代后產(chǎn)生的新個體;η為控制擾動幅度;ε為服從均值或正態(tài)分布的隨機變量;xjmax、xjmin分別為第j維優(yōu)化變量的取值范圍。