樊澤園、宋曉娟、林立、李雪
(1.山東交通學(xué)院,山東 濟(jì)南250307;2.軌道交通安全技術(shù)與裝備實(shí)驗(yàn)室,山東 濟(jì)南250307)
當(dāng)前中國(guó)列控車(chē)載系統(tǒng)普遍運(yùn)用速度傳感器進(jìn)行測(cè)速定位,其計(jì)算精度直接受到輪徑值變化的影響,若不及時(shí)更新系統(tǒng)存儲(chǔ)的輪徑值則會(huì)增大測(cè)速定位誤差,影響行車(chē)安全。
鐵路行業(yè)內(nèi)關(guān)于列車(chē)輪徑校準(zhǔn)的研究,有基于多傳感器融合實(shí)現(xiàn)輪徑校準(zhǔn)[1,2]。文獻(xiàn)[3]則提出基于灰色算法進(jìn)行輪徑值的預(yù)測(cè)。BP神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用最廣泛的基本神經(jīng)網(wǎng)絡(luò),有較強(qiáng)的非線性映射能力及預(yù)測(cè)精度,可根據(jù)歷史數(shù)據(jù)自動(dòng)提取有用知識(shí)。而神經(jīng)網(wǎng)絡(luò)集成的提出則能解決BP存在收斂速度較慢、泛化能力較差、極易獲得局部極小點(diǎn)問(wèn)題。
速度傳感器通過(guò)脈沖計(jì)數(shù)獲得測(cè)量周期內(nèi)的車(chē)輪轉(zhuǎn)數(shù)并乘以輪周長(zhǎng)來(lái)計(jì)算列車(chē)行駛速度,其具體公式如下:
式(1)中:n為本次測(cè)量周期的脈沖計(jì)數(shù)值;T為本次測(cè)速周期;d為車(chē)輪直徑;N為車(chē)輪旋轉(zhuǎn)一圈傳感器發(fā)出的脈沖測(cè)量值。
在式(1)中,輪徑值d是影響其計(jì)算精度的關(guān)鍵參量。d隨著列車(chē)行駛距離的增加變小,所以必須及時(shí)更新系統(tǒng)存儲(chǔ)的車(chē)輪輪徑值,降低測(cè)速測(cè)距誤差。
本文針對(duì)鐵路局存儲(chǔ)的列車(chē)走行公里報(bào)表,引入智能算法提取有用數(shù)據(jù)進(jìn)行分析建模,尋找列車(chē)輪徑值y和列車(chē)行駛距離x之間的對(duì)應(yīng)關(guān)系,即
在學(xué)習(xí)階段,通過(guò)訓(xùn)練生成映射關(guān)系f,在預(yù)測(cè)階段根據(jù)新輸入的列車(chē)行駛里程來(lái)求得當(dāng)前的列車(chē)輪徑值,實(shí)現(xiàn)智能預(yù)測(cè)。
集成學(xué)習(xí)用于提高機(jī)器學(xué)習(xí)泛化能力,Bagging算法是其典型算法,并衍生成多個(gè)BP子網(wǎng)絡(luò),其核心思想是:給定1個(gè)訓(xùn)練集和1個(gè)學(xué)習(xí)算法,對(duì)訓(xùn)練集進(jìn)行T次重采樣,每次采樣從訓(xùn)練集中取m(m<n)個(gè)樣本進(jìn)行訓(xùn)練,訓(xùn)練結(jié)束后將取樣放回到訓(xùn)練集,經(jīng)過(guò)訓(xùn)練后得到多個(gè)訓(xùn)練預(yù)測(cè)函數(shù)f1,f2…fT。最終的集成學(xué)習(xí)器預(yù)測(cè)函數(shù)f是經(jīng)過(guò)加權(quán)平均合成的,并對(duì)新的輸入數(shù)據(jù)進(jìn)行預(yù)測(cè)。算法的具體步驟如下。
第一步,數(shù)據(jù)預(yù)處理:原始樣本數(shù)據(jù)集O={(x1,y1),(x2,y2)…(xn,yn)},采用極差標(biāo)準(zhǔn)化法對(duì)樣本歸一化處理,如公式(3),使輸入數(shù)據(jù)值在[0,1]范圍內(nèi)。
式(3)中:xi0為歸一化后的第i個(gè)輸入值;xi為第i個(gè)原始輸入值;xmax為原始輸入最大值;xmin為原始輸入最小值。然后對(duì)數(shù)據(jù)集重采樣T次,生成不同的訓(xùn)練子集。
1.2.1 標(biāo)本采集 該孕婦接受檢測(cè)前的遺傳咨詢并簽署同意書(shū),根據(jù)孕周行羊膜腔穿刺,在B 超探頭引導(dǎo)下行羊膜腔穿刺術(shù)抽取羊水30ml進(jìn)行培養(yǎng)以及染色體微陣列分析(chromosomal microarray analysis, CMA)。
第二步,根據(jù)不同的訓(xùn)練子集,并行訓(xùn)練不同的BP子網(wǎng)絡(luò),經(jīng)過(guò)訓(xùn)練學(xué)習(xí)后能夠得到不同的預(yù)測(cè)函數(shù)ft。
第三步,最終將各個(gè)子學(xué)習(xí)模型的預(yù)測(cè)函數(shù)進(jìn)行加權(quán)平均獲得集成學(xué)習(xí)器的預(yù)測(cè)函數(shù)
式(4)中:ωt為第t個(gè)預(yù)測(cè)函數(shù)在集成中所占的權(quán)重。權(quán)重值ωt大小則根據(jù)子網(wǎng)絡(luò)的泛化能力決定,利用未抽到的樣本集計(jì)算子網(wǎng)絡(luò)的相關(guān)系數(shù)R,R越大,ωt就越 大,且=1。
第四步,通過(guò)學(xué)習(xí)得到映射關(guān)系f(x),就可以輸入新的列車(chē)行駛里程xnew,從而預(yù)測(cè)當(dāng)前位置對(duì)應(yīng)的列車(chē)輪徑值ynew。
針對(duì)本文研究對(duì)象,設(shè)計(jì)BP子網(wǎng)絡(luò)為一個(gè)單輸入單輸出的三層神經(jīng)網(wǎng)絡(luò),其輸入層是列車(chē)行駛里程x,網(wǎng)絡(luò)輸出為列車(chē)輪徑值y,隱含層選取Sigmoid函數(shù),輸出層為線性激活函數(shù),w=(w1,w2…wj)是輸入層到隱含層的權(quán)值向量,v=(v1,v2…vj)是隱含層到輸出層的權(quán)值向量。
那么本文將最優(yōu)化誤差平方和作為誤差準(zhǔn)則,即
式(5)~式(6)中:N為樣本個(gè)數(shù),εi為誤差絕對(duì)值,y′i為第i個(gè)實(shí)際輸出,yi為第i個(gè)理想輸出。
選用均方根誤差(RMSE)作為評(píng)價(jià)指標(biāo),其公式如下列式(7)所示。
用相關(guān)系數(shù)R來(lái)評(píng)價(jià)子網(wǎng)絡(luò)的泛化能力,并確定集成學(xué)習(xí)中各個(gè)子網(wǎng)絡(luò)的權(quán)值ωt的大小,則第t個(gè)子網(wǎng)絡(luò)的相關(guān)系數(shù)為:
本文分別采用自適應(yīng)學(xué)習(xí)率的梯度下降法、BFGS擬牛頓Levenberg-Marquardt算法、彈性梯度下降法進(jìn)行訓(xùn)練學(xué)習(xí),隱含層神經(jīng)元的個(gè)數(shù)由經(jīng)驗(yàn)公式進(jìn)行確定,即
式(8)中:a,b分別為輸入層和輸出層單元個(gè)數(shù),α∈(1,10),故子網(wǎng)絡(luò)隱含層的神經(jīng)元個(gè)數(shù)可取范圍為[2,10]。
本文以上海鐵路局提供的CRH2型動(dòng)車(chē)組的列車(chē)車(chē)輪尺寸相關(guān)數(shù)據(jù)為基礎(chǔ),研究行車(chē)?yán)锍膛c輪徑值動(dòng)態(tài)變化的映射關(guān)系,其標(biāo)準(zhǔn)直徑為mm,隨著列車(chē)的運(yùn)行輪徑值會(huì)單調(diào)變小。對(duì)于原始數(shù)據(jù)集D,共有152組相關(guān)數(shù)據(jù),其部分?jǐn)?shù)據(jù)如表1所示。
表1 車(chē)輪相關(guān)數(shù)據(jù)(部分)
隨機(jī)選取112組數(shù)據(jù)作為原始訓(xùn)練集O,剩余作為測(cè)試集來(lái)驗(yàn)證算法的泛化能力。并在Matlab環(huán)境下進(jìn)行算法編程與仿真驗(yàn)證,對(duì)訓(xùn)練集O進(jìn)行6次重采樣生成不同的子訓(xùn)練集Ot,從而訓(xùn)練生成6個(gè)不同的BP子網(wǎng)絡(luò)。利用函數(shù)newff來(lái)創(chuàng)建BP子網(wǎng)絡(luò),隱層采用tansig函數(shù),輸出層采用purelin函數(shù),隨機(jī)產(chǎn)生網(wǎng)絡(luò)的權(quán)值、閾值,目標(biāo)誤差設(shè)為10-5,最大迭代次數(shù)設(shè)為500。對(duì)于隱層神經(jīng)元個(gè)數(shù),通過(guò)比較不同神經(jīng)元個(gè)數(shù)下的子網(wǎng)絡(luò)收斂誤差來(lái)確定最佳神經(jīng)元個(gè)數(shù),以BP子網(wǎng)絡(luò)1為例進(jìn)行說(shuō)明,其訓(xùn)練函數(shù)設(shè)為trainlm,其最佳神經(jīng)元個(gè)數(shù)是8。對(duì)不同的BP子網(wǎng)絡(luò),采用不同訓(xùn)練算法。最后用本文的Bagging集成BP網(wǎng)絡(luò)算法進(jìn)行網(wǎng)絡(luò)集成,并將其預(yù)測(cè)效果同單個(gè)BP網(wǎng)絡(luò)的預(yù)測(cè)效果、灰色預(yù)測(cè)法進(jìn)行對(duì)比分析。
在圖1中將灰色預(yù)測(cè)法、Bagging集成BP子網(wǎng)絡(luò)的強(qiáng)預(yù)測(cè)器的測(cè)試集預(yù)測(cè)誤差絕對(duì)值同6個(gè)BP子網(wǎng)絡(luò)的預(yù)測(cè)誤差絕對(duì)值的平均值進(jìn)行比較,從中看出本文算法的預(yù)測(cè)誤差絕對(duì)值明顯比另外兩種算法要小,且誤差波動(dòng)范圍小,說(shuō)明本文算法的預(yù)測(cè)精度較高,驗(yàn)證了本文算法的有效性,其預(yù)測(cè)結(jié)果接近列車(chē)輪徑的真實(shí)值。
根據(jù)鐵路局車(chē)務(wù)段存儲(chǔ)的列車(chē)輪徑值相關(guān)記錄數(shù)據(jù),提出運(yùn)用Bagging算法集成BP網(wǎng)絡(luò)的智能算法實(shí)現(xiàn)列車(chē)輪徑值的預(yù)測(cè)更新。實(shí)驗(yàn)證明運(yùn)用Bagging算法集成學(xué)習(xí)可以提高集成學(xué)習(xí)器的泛化能力,避免神經(jīng)網(wǎng)絡(luò)普遍存在的過(guò)擬合現(xiàn)象,并獲得比灰色預(yù)測(cè)、單一BP神經(jīng)網(wǎng)絡(luò)更好的預(yù)測(cè)效果;能夠較好地根據(jù)行車(chē)?yán)锍虒?duì)列車(chē)輪徑值的進(jìn)行預(yù)測(cè),從而在列車(chē)行駛過(guò)程中進(jìn)行預(yù)測(cè),自動(dòng)更新車(chē)載系統(tǒng)的輪徑存儲(chǔ)值,提高速度傳感器的計(jì)算精度,減少人為工作量,并保證行車(chē)安全。