劉 杰, 徐 敏
(1.重慶工程職業(yè)技術(shù)學(xué)院 智能制造與交通學(xué)院, 重慶 402260;2。重慶公共運(yùn)輸職業(yè)學(xué)院 運(yùn)輸貿(mào)易系,重慶 402247)
隨著城市軌道交通的迅猛發(fā)展,列車自動駕駛系統(tǒng)(以下簡稱:ATO系統(tǒng))技術(shù)也廣泛應(yīng)用在城市軌道交通日常運(yùn)營中,盡管ATO技術(shù)已經(jīng)相當(dāng)成熟,但仍不能完全替代人工駕駛。司機(jī)駕駛的主要目的是當(dāng)控制系統(tǒng)出現(xiàn)故障或發(fā)生突發(fā)事件時,可由人工駕駛列車完成運(yùn)營任務(wù),否則會造成列車滯留區(qū)間或車站,從而阻塞整個線路。多數(shù)地鐵公司規(guī)定晚8點(diǎn)后全部正線列車切換為人工駕駛模式。在人工駕駛模式下,對乘客提供的服務(wù)水平質(zhì)量完全由司機(jī)駕駛水平?jīng)Q定。隨著大數(shù)據(jù)和人工智能時代的到來,基于數(shù)據(jù)趨動的城市軌道交通智能化管理將成為未來發(fā)展方向,而司機(jī)駕駛水平管理將會成為其中重要的一部分,因此設(shè)計(jì)以列車數(shù)據(jù)為基礎(chǔ)的司機(jī)駕駛水平評價模型,不僅可以提高運(yùn)營風(fēng)險抵御能力,而且可以作為司機(jī)崗位管理的重要依據(jù)。
司機(jī)駕駛水平的好壞可以從安全、準(zhǔn)點(diǎn)、舒適和節(jié)能4個指標(biāo)來評判,列車行車記錄系統(tǒng)記錄的時間速度時序是最能體現(xiàn)上述4個指標(biāo)的數(shù)據(jù),而且數(shù)據(jù)較易獲得[1]。人工駕駛和ATO時間速度數(shù)據(jù)繪制成坐標(biāo)曲線的形式如圖1、圖2所示。
圖1 人工駕駛過程
圖2 ATO自動駕駛過程
從圖1和圖2可看出,時間速度曲線分為人工駕駛和ATO 2種。根據(jù)經(jīng)驗(yàn),ATO駕駛水平普遍高于人工駕駛。以ATO自動駕駛時序數(shù)據(jù)為標(biāo)準(zhǔn),研究如何對人工駕駛時序數(shù)據(jù)等級評價的問題。具體方法是:利用程序從行車系統(tǒng)導(dǎo)出的文件中抽取原始數(shù)據(jù),再用數(shù)據(jù)挖掘技術(shù)提取原始數(shù)據(jù)特征信息得到特征時序,再用降維技術(shù)降低數(shù)據(jù)復(fù)雜度得到樣本集,然后構(gòu)建聚類算法和模糊綜合評價混合模型對樣本集做出評價,最后分析評價結(jié)果。
直接采用行車記錄系統(tǒng)提取的原始數(shù)據(jù)作為樣本會產(chǎn)生2個問題。一是特征信息量不夠?qū)е戮垲愋Ч幻黠@;二是維度不一致導(dǎo)致數(shù)據(jù)無法統(tǒng)一處理。采用python語言編寫的tsfresh包提取時序數(shù)據(jù)特征,tsfresh能夠提取出超過64種特征,這樣既能挖掘原始數(shù)據(jù)潛在特征信息,又能統(tǒng)一所有時序數(shù)據(jù)維度[2]。原始序列表達(dá)式如下
(1)
經(jīng)過特征提取后的時序表達(dá)式如下
(2)
(3)
(4)
式中,f為tsfresh特征提取作用函數(shù);D為原始時序集;M為樣本總數(shù);S′為特征提取后的時序集。
采用聚類算法對時序數(shù)據(jù)進(jìn)行等級劃分,而聚類的效果很大程度取決于樣本的維度,特征提取后的樣本維度通常較高,如果直接聚類不僅效果不佳,模型復(fù)雜度也顯著增加,影響算法效率,因此需要對特征提取后的樣本降維??紤]到高維空間可能存在的流形結(jié)構(gòu) ,采用非線性t-sne降維算法[3],表達(dá)式如下
(5)
S={x1,x2,…,xM}
(6)
式中,xi為樣本;g為t-sne降維算法作用函數(shù);S為樣本集。
規(guī)定評價等級為5級,分別為優(yōu)、良、一般、及格、差。模型分為3個階段,第一階段用一種聚類算法將樣本集按規(guī)定等級數(shù)量聚為5類,模型表達(dá)公式如下
(7)
(8)
(9)
每一種聚類算法都有其應(yīng)用局限性,并且不同聚類算法對相同樣本集都會有不同聚類結(jié)果,因此采用單一聚類算法其結(jié)果可靠性不高。為了解決這一問題,模型第二階段將多種聚類算法的結(jié)果用模糊綜合評價算法處理,最后確定樣本等級,公式表達(dá)如下
(10)
式中,φ為模糊綜合評價算法作用函數(shù)。
具體算法如下[4]:
步驟1。確定評價因素集U={u1,u2,…,uK},這里的因素集元素就等同于聚類算法,確定評語集V={0,1,2,3,4}。
步驟2。確定評價因素權(quán)重向量W=[w1,w2,…,wk…,wK],wk由聚類算法本身效果決定。無標(biāo)簽聚類算法效果評價指標(biāo)主要有SC(Silhouette Coefficient),CH(Calinski-Harabasz Index),DB(Davies-Bouldin Index)3種,其中,SC、CH值越大表明效果越好,而DB值越接近于0效果越好,綜合3個指標(biāo)的信息給出權(quán)重公式如下[5]
(11)
(12)
(13)
(14)
Akv為第k種聚類算法對第v等級隸屬度
(15)
由模型第一和第二階段得出的ri是一次實(shí)驗(yàn)結(jié)果,因?yàn)楦鞣N聚類算法內(nèi)部隨機(jī)因素的存在,導(dǎo)致每次實(shí)驗(yàn)結(jié)果會有所不同,因此考慮到模型的穩(wěn)定性,在模型第三階段采用多次實(shí)驗(yàn)取眾數(shù)的方法最終確定評價結(jié)果,公式表達(dá)如下
(16)
(17)
因?yàn)樗緳C(jī)的整個駕駛過程由若干條人工駕駛樣本組成,所以形成一條評價等級序列,再利用模糊綜合評價算法對該等級序列進(jìn)行處理,得到司機(jī)駕駛水平評價等級結(jié)果。
(18)
這里算法和模型第二階段類似,唯一改變的是評價因素權(quán)重向量W的計(jì)算方法
(19)
隨機(jī)抽取某地鐵6號線17個車運(yùn)行記錄數(shù)據(jù)為研究對象,采用python3.6編程抽取得到4 219條時序原始數(shù)據(jù),即M=4 219,其中,ATO自動駕駛3 407條,人工駕駛812條。經(jīng)過tsfresh特征提取后每條時序數(shù)據(jù)維度統(tǒng)一為794維,再用t-sne算法將其降至2維。所有人工駕駛樣本屬于8位司機(jī),即N=8。聚類算法選擇K-means[6]、層次聚類[8]、譜聚類[7]和高斯混合聚類[9],即K=4。運(yùn)用提出模型計(jì)算得到4種聚類算法一次實(shí)驗(yàn)結(jié)果見圖3[10-11]。
圖3 一次聚類實(shí)驗(yàn)結(jié)果
從圖3可看出,4種聚類算法的聚類效果都很明顯。再設(shè)H=1 000, 8位司機(jī)駕駛過程等級變化情況見圖4。
圖4 8位司機(jī)駕駛過程等級變化情況
最終司機(jī)的評價等級如表1所示。
表1 司機(jī)駕駛水平評價等級
多種聚類算法和模糊綜合評價混合模型可以規(guī)避單一聚類算法自身缺點(diǎn),同時能定量給出最終評價結(jié)果。從結(jié)果來看,抽樣的8位司機(jī)當(dāng)中3位處于中等水平以下,3位中等水平,2位中上水平,沒有優(yōu)秀。這說明司機(jī)駕駛水平整體偏低,平時的訓(xùn)練力度不夠。從每個司機(jī)駕駛過程來看,其波動性普遍較大,等級評價為良的2位司機(jī)其駕駛波動性也較高,這說明司機(jī)的駕駛不穩(wěn)定,起伏較大。由于人的主觀評價波動性更加復(fù)雜,因此結(jié)論的實(shí)際驗(yàn)證是很困難的,但從總體上而言,以上結(jié)論得到了司機(jī)管理部門人員的認(rèn)可。針對上述情況給出如下建議:
(1)購買模擬駕駛仿真設(shè)備,加強(qiáng)司機(jī)技能訓(xùn)練力度。
(2)制定合理的獎懲措施,激勵司機(jī)提高其駕駛水平。
(3)加強(qiáng)司機(jī)的心理疏導(dǎo),緩解工作壓力。