国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于預(yù)警文本信息的調(diào)度命令智能生成模型

2020-10-11 09:59:20彭其淵胡雨欣魯工圓
關(guān)鍵詞:命令修正預(yù)警

彭其淵,胡雨欣,魯工圓

(1. 西南交通大學(xué)交通運(yùn)輸與物流學(xué)院,四川成都610031;2. 西南交通大學(xué)綜合交通運(yùn)輸智能化國(guó)家地方聯(lián)合工程實(shí)驗(yàn)室,四川成都610031;3. 中國(guó)中鐵二院工程集團(tuán)有限責(zé)任公司,四川成都610031)

調(diào)度命令是調(diào)度員處理日常行車工作中的有關(guān)問(wèn)題,以及在非正常情況下組織并指揮有關(guān)部門和人員辦理行車工作的帶有約束性的指令。目前,我國(guó)列車調(diào)度命令主要由調(diào)度員人工編寫,通過(guò)計(jì)算機(jī)調(diào)度命令軟件、傳真或者電話向相關(guān)部門或人員傳達(dá)。調(diào)度命令編寫工作占用了調(diào)度員大量的時(shí)間與精力,特別是在非正常情況下的應(yīng)急處置過(guò)程中,要求調(diào)度員在短時(shí)間內(nèi)根據(jù)已有信息發(fā)布出正確的調(diào)度命令。因此,有必要對(duì)調(diào)度命令的生成進(jìn)行深入研究,研究智能化調(diào)度命令生成方法,從而減輕調(diào)度員調(diào)度命令擬寫工作的負(fù)擔(dān),改善調(diào)度命令發(fā)布的效率和規(guī)范性,這對(duì)于提高鐵路運(yùn)輸效率、保證鐵路運(yùn)營(yíng)安全有著重大意義。

調(diào)度命令的發(fā)布場(chǎng)景一般可分為日常行車組織和非正常情況下的應(yīng)急處置兩種情況。對(duì)于日常行車工作,已有的研究大多集中于規(guī)范調(diào)度命令管理[1-2],主要針對(duì)調(diào)度命令在發(fā)布、傳達(dá)、執(zhí)行中的常見(jiàn)問(wèn)題[3]提出改進(jìn)措施[4]。

鐵路運(yùn)輸組織是一個(gè)動(dòng)態(tài)過(guò)程,在日常生產(chǎn)組織中,人員、設(shè)備、環(huán)境等因素可能突然出現(xiàn)直接危及行車安全或可能危及行車安全的非正常情況,包括設(shè)施設(shè)備故障、天氣變化、群體事件、重大疫情、電力中斷等現(xiàn)象。針對(duì)這種非正常情況,調(diào)度員能夠快速掌握事件信息,第一時(shí)間介入應(yīng)急指揮工作,進(jìn)行相關(guān)處置和通報(bào)。因此,非正常情況下的應(yīng)急處置是行車安全的重要組成部分,也是調(diào)度員的工作重點(diǎn)。孫鵬舉等[5]為有效提升高速鐵路列車調(diào)度員應(yīng)急場(chǎng)景處置能力,構(gòu)建了應(yīng)急仿真系統(tǒng)。季丕祥[6]對(duì)調(diào)度人員在面對(duì)緊急情況時(shí)的應(yīng)急處置能力進(jìn)行了分析,同時(shí)有針對(duì)性地提出解決措施。李磊等[7]將案例推理理論應(yīng)用到鐵路應(yīng)急決策中,并提出一種實(shí)用的行車事故應(yīng)急決策方法。馬齊飛揚(yáng)等[8]為解決現(xiàn)階段列車突發(fā)事件應(yīng)急救援方法普適性及動(dòng)態(tài)性差的問(wèn)題,建立基于改進(jìn)逼近理想解排序法的處置點(diǎn)應(yīng)急救援決策方法。

進(jìn)入新世紀(jì)以來(lái),信息技術(shù)突飛猛進(jìn),智能化技術(shù)在自然語(yǔ)言處理[9]、語(yǔ)音識(shí)別[10]、圖像識(shí)別[11]等方面取得突破性進(jìn)展。在中長(zhǎng)期鐵路網(wǎng)規(guī)劃中,將智能化、現(xiàn)代化作為發(fā)展任務(wù)之一。

針對(duì)非正常情況下的應(yīng)急處置過(guò)程,采用深度學(xué)習(xí)框架,基于預(yù)警文本信息,提出一種基于序列?序列(seq2seq)模型的調(diào)度命令智能生成方法,并利用實(shí)際預(yù)警文本信息和調(diào)度命令數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證。

1 調(diào)度命令智能生成模型總體架構(gòu)

調(diào)度命令智能生成模型針對(duì)非正常情況下的應(yīng)急處置場(chǎng)景。一般來(lái)說(shuō),當(dāng)應(yīng)急處置情況出現(xiàn)時(shí),在鐵路局層面上信息的收集和上報(bào)都主要集中在調(diào)度所,凡與列車運(yùn)行相關(guān),或是發(fā)生在運(yùn)行列車上的各種信息,現(xiàn)場(chǎng)人員一般都直接向列車調(diào)度員反映,可以說(shuō)列車調(diào)度員是整個(gè)事件的信息匯聚點(diǎn)。列車調(diào)度員通過(guò)各方反映的情況編寫調(diào)度命令,并直接將調(diào)度命令發(fā)往各受令方?;谝陨咸攸c(diǎn),本模型將相關(guān)部門或車站發(fā)出的預(yù)警文本信息作為模型輸入,信息提取與轉(zhuǎn)化后輸出對(duì)應(yīng)的調(diào)度命令。

圖1為調(diào)度命令智能生成模型總體架構(gòu),主要分為神經(jīng)網(wǎng)絡(luò)模塊和調(diào)度命令修正模塊兩個(gè)部分。將預(yù)警文本信息處理后的詞序列作為神經(jīng)網(wǎng)絡(luò)的輸入,該神經(jīng)網(wǎng)絡(luò)是一個(gè)seq2seq模型,神經(jīng)網(wǎng)絡(luò)輸出初始調(diào)度命令。由于生成的初始調(diào)度命令與標(biāo)準(zhǔn)調(diào)度命令的部分內(nèi)容存在一些誤差,因此利用調(diào)度命令修正模塊對(duì)初始調(diào)度命令內(nèi)容進(jìn)行修正、替換,得到最終調(diào)度命令,從而提高調(diào)度命令生成質(zhì)量。

2 調(diào)度命令智能生成模型

2.1 基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的seq2seq模型

seq2seq模型是一種編碼器?解碼器結(jié)構(gòu)的網(wǎng)絡(luò),該模型最早于2014年被Google Brain團(tuán)隊(duì)和Yoshua Bengio團(tuán)隊(duì)提出[12-13],是一個(gè)廣泛應(yīng)用于機(jī)器學(xué)習(xí)的深度學(xué)習(xí)模型框架,目前在聊天機(jī)器人、機(jī)器翻譯、自動(dòng)文摘等領(lǐng)域中應(yīng)用廣泛。

編碼器和解碼器的組合具有多樣性,使用長(zhǎng)短時(shí)記憶(LSTM)網(wǎng)絡(luò)進(jìn)行編碼器和解碼器的構(gòu)建。LSTM網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的改進(jìn)模型,能夠在一定程度上避免梯度消失問(wèn)題。LSTM網(wǎng)絡(luò)神經(jīng)元內(nèi)部結(jié)構(gòu)如圖2所示。

令t時(shí)刻輸入為xt,一個(gè)LSTM網(wǎng)絡(luò)單元通過(guò)

學(xué)習(xí)可得到t時(shí)刻隱節(jié)點(diǎn)狀態(tài)ht。LSTM網(wǎng)絡(luò)內(nèi)部計(jì)算式如下所示:

式(2)~(6)中:ft、it、ot分別表示LSTM網(wǎng)絡(luò)中的遺忘門、輸入門和輸出門;σ為激活函數(shù);W、U為權(quán)重;b為偏置項(xiàng);ct為t時(shí)刻記憶細(xì)胞存儲(chǔ)信息;ct-1為(t-1)時(shí)刻存儲(chǔ)信息;⊙表示矩陣點(diǎn)乘。

seq2seq模型基本思想是利用神經(jīng)網(wǎng)絡(luò)模型將一個(gè)可變長(zhǎng)度的輸入序列轉(zhuǎn)變成一個(gè)固定長(zhǎng)度的向量,再利用神經(jīng)網(wǎng)絡(luò)模型將該向量轉(zhuǎn)變成一個(gè)可變長(zhǎng)度的目標(biāo)輸出序列。seq2seq結(jié)構(gòu)如圖3所示。

2.1.1 編碼部分

在編碼過(guò)程中,對(duì)預(yù)處理階段得到的調(diào)度命令詞序列(x1,x2,…,xt)從前向后編碼,根據(jù)LSTM網(wǎng)絡(luò)計(jì)算規(guī)則,可得到當(dāng)前隱節(jié)點(diǎn)狀態(tài)

式中:xt表示當(dāng)前時(shí)刻的輸入。

在輸入遇到結(jié)束標(biāo)識(shí)符時(shí)表示最后一次編碼完成,此時(shí)整個(gè)文本通過(guò)編碼器轉(zhuǎn)化為隱節(jié)點(diǎn)狀態(tài)。每一次隱節(jié)點(diǎn)狀態(tài)都依賴于上一次隱節(jié)點(diǎn)狀態(tài),經(jīng)過(guò)多次循環(huán)迭代后,最后一次隱節(jié)點(diǎn)狀態(tài)包含了整個(gè)文本的語(yǔ)義特征。定義語(yǔ)義向量c為編碼過(guò)程中最后一個(gè)隱節(jié)點(diǎn)狀態(tài)。

2.1.2 解碼部分

解碼過(guò)程可以看作是編碼過(guò)程的逆過(guò)程。當(dāng)前隱節(jié)點(diǎn)狀態(tài)由前一時(shí)刻隱節(jié)點(diǎn)狀態(tài)st-1、前一時(shí)刻輸出yt-1和語(yǔ)義向量c得到,即當(dāng)前時(shí)刻隱節(jié)點(diǎn)狀態(tài)

通過(guò)隱節(jié)點(diǎn)狀態(tài)st和前一時(shí)刻的輸出來(lái)預(yù)測(cè)當(dāng)前時(shí)刻的輸出yt,語(yǔ)義向量c作為輸入的一部分同時(shí)參與運(yùn)算。每個(gè)單元的概率可表示為

式中:g(·)表示非線性多層神經(jīng)網(wǎng)絡(luò)。選取其中概率最大的值作為t時(shí)刻的輸出yt。

從整體來(lái)看,基于LSTM網(wǎng)絡(luò)的seq2seq模型將預(yù)警文本信息及其對(duì)應(yīng)調(diào)度命令看作詞序列,編碼端將輸入的預(yù)警文本信息編碼為固定維數(shù)的向量,解碼端負(fù)責(zé)從該向量中解碼出對(duì)應(yīng)的語(yǔ)言表達(dá)。

編碼器?解碼器框架在自然語(yǔ)言處理中可讀取任意的文本序列,并將其轉(zhuǎn)化為另一種文本序列,這也是調(diào)度命令智能生成模型的基礎(chǔ)。研究發(fā)現(xiàn),seq2seq模型在將輸入文本信息壓縮為一個(gè)語(yǔ)義向量時(shí)可能產(chǎn)生信息丟失的問(wèn)題[14],并且在對(duì)文本進(jìn)行輸出時(shí)缺乏提取關(guān)鍵信息、排除無(wú)用信息的能力,這就會(huì)使輸出的初始調(diào)度命令部分信息的生成出現(xiàn)錯(cuò)誤。

2.2 調(diào)度命令修正

調(diào)度命令是行車有關(guān)部門具體辦理行車工作的依據(jù),其內(nèi)容的正確性關(guān)乎鐵路運(yùn)營(yíng)安全,因此有必要針對(duì)初始調(diào)度命令生成錯(cuò)誤的部分進(jìn)行修正。通過(guò)構(gòu)建調(diào)度命令修正模塊對(duì)神經(jīng)網(wǎng)絡(luò)生成有誤的信息加以修正、替換,以保證調(diào)度命令智能生成的正確性。

2.2.1 調(diào)度命令修正策略

對(duì)各類初始調(diào)度命令的生成結(jié)果進(jìn)行分析,將難以正確生成的信息歸納為里程、線路走向、速度值、車次號(hào)和車站地點(diǎn)等五種類型。針對(duì)這五類信息,分別提出五種相應(yīng)策略進(jìn)行修正。

(1)策略1:里程信息修正

預(yù)警文本信息或調(diào)度命令對(duì)事件發(fā)生地點(diǎn)的位置描述方式之一是里程表示,如K1200+830,里程表示使地點(diǎn)描述更加精確、規(guī)范。

里程信息修正思路為:對(duì)預(yù)警文本信息中的里程信息進(jìn)行抽取,結(jié)合《高速鐵路列車調(diào)度員應(yīng)急處置指導(dǎo)書》中調(diào)度命令里程規(guī)則對(duì)里程信息處理后,得到正確的里程信息;對(duì)初始調(diào)度命令中的里程信息進(jìn)行抽取;將正確的里程信息與初始調(diào)度命令中的里程信息進(jìn)行替換,修正完畢。對(duì)于這種具有一般格式的信息,使用正則表達(dá)式進(jìn)行信息抽取[15]。通過(guò)正則表達(dá)式可以快速地對(duì)字符串進(jìn)行信息抽取操作,并且抽取結(jié)果不是一個(gè)可能值,而是準(zhǔn)確值。

(2)策略2:線路走向信息修正

同里程信息修正相似,線路走向信息修正思路為:對(duì)預(yù)警文本信息中的線路走向信息進(jìn)行抽取,得到正確的線路走向信息;對(duì)初始調(diào)度命令中的線路走向信息進(jìn)行抽?。粚⒄_的線路走向信息與初始調(diào)度命令中的線路走向信息進(jìn)行替換,修正完畢。

正則表達(dá)式如下所示:上行線|下行線|上、下行線|上下行線。

(3)策略3:車次號(hào)信息修正

車次號(hào)信息修正思路與線路走向信息修正類似,正則表達(dá)式如下所示:[0-9]{0,2}[a-zA-Z]{0,2}[0-9]*次。

(4)策略4:速度值信息修正

限速調(diào)度命令是運(yùn)用最為普遍的調(diào)度命令類型之一,應(yīng)急處置事件類型和嚴(yán)重程度直接影響限速調(diào)度命令的限速大小。針對(duì)限速調(diào)度命令的限速值,根據(jù)《高速鐵路列車調(diào)度員應(yīng)急處置指導(dǎo)書》等規(guī)章的指導(dǎo),對(duì)兩類事件下的限速條件和限速值進(jìn)行了規(guī)則總結(jié):風(fēng)速限速報(bào)警事件與雨量限速報(bào)警事件。部分規(guī)則如表1所示。

表1 速度值修正規(guī)則Tab.1 Speed value correction rule

限速值信息修正思路為:對(duì)預(yù)警文本信息中的風(fēng)速或雨量信息進(jìn)行抽取,結(jié)合《高速鐵路列車調(diào)度員應(yīng)急處置指導(dǎo)書》中限速規(guī)則將其進(jìn)行處理后,得到正確的限速值信息;對(duì)初始調(diào)度命令中的限速值信息進(jìn)行抽?。粚⒄_的限速值信息與初始調(diào)度命令中的限速值信息進(jìn)行替換,修正完畢。

風(fēng)速正則表達(dá)式如下所示:[d+.d]*m/s。

雨量正則表達(dá)式如下所示:[0-9]{1,10}mm|[0-9]{1,10}.[0-9]{1,10}mm。

限速值正則表達(dá)式如下所示:d+km/h。

(5)策略5:車站信息修正

除里程表示之外,預(yù)警文本信息或調(diào)度命令一般直接給出事件發(fā)生的車站或者區(qū)段,如:“3月2日16時(shí)01分,貴廣線佛山西站SG信號(hào)機(jī)故障滅燈?!敝袑懨魇录l(fā)生地點(diǎn)為佛山西站。

車站信息修正思路為:對(duì)預(yù)警文本信息中的所有車站信息進(jìn)行抽取,得到正確的車站信息;對(duì)初始調(diào)度命令中的車站信息進(jìn)行抽?。粚⒄_的車站信息與初始調(diào)度命令中的車站信息進(jìn)行替換,修正完畢。

然而,直接用車站或地點(diǎn)名描述事件位置時(shí)表達(dá)方法眾多。例如,表達(dá)長(zhǎng)沙南站至貴陽(yáng)北站時(shí),可能的表達(dá)方式有“長(zhǎng)沙南至貴陽(yáng)北”、“長(zhǎng)沙南―貴陽(yáng)北”、“長(zhǎng)沙南站至貴陽(yáng)北站”等,使用正則表達(dá)式進(jìn)行地點(diǎn)抽取可能會(huì)產(chǎn)生疏漏。針對(duì)該情況,需要運(yùn)用更加智能化的信息識(shí)別提取方法。

命名實(shí)體識(shí)別是用來(lái)識(shí)別并分類文本中所出現(xiàn)的指定名詞的一類自然語(yǔ)言處理任務(wù),隨著深度學(xué)習(xí)的興起,基于神經(jīng)網(wǎng)絡(luò)的命名實(shí)體識(shí)別方法由于其自動(dòng)提取特征等優(yōu)勢(shì)逐漸獲得大量應(yīng)用。使用基于雙向長(zhǎng)短時(shí)記憶(BiLSTM)網(wǎng)絡(luò)?條件隨機(jī)場(chǎng)(CRF)的方法進(jìn)行命名實(shí)體識(shí)別。

構(gòu)建的命名實(shí)體識(shí)別模型如圖4所示。模型的第一層為輸入層,隨機(jī)初始化嵌入矩陣后,將輸入字符表示從獨(dú)熱矢量映射為低維字向量(x1,m,x2,m,…,xk,m);模型的第二層為雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)層,將上一階段得到的向量序列作為雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的輸入,利用上下文信息有效地提取特征;模型的第三層為條件隨機(jī)場(chǎng)層,對(duì)句子進(jìn)行序列標(biāo)注,根據(jù)上文信息進(jìn)行標(biāo)簽預(yù)測(cè)。最終,輸出該神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)出的“BIO”標(biāo)注。

為了得到更好的識(shí)別效果,根據(jù)”BIO”標(biāo)注方法對(duì)5 000余條調(diào)度命令和安監(jiān)報(bào)信息進(jìn)行標(biāo)注,作為命名實(shí)體識(shí)別模型的訓(xùn)練和測(cè)試語(yǔ)料?!癇IO”標(biāo)注是指對(duì)序列中每個(gè)元素賦予標(biāo)注“B?X”、”I?X”或者“O”中的一種。本模型中三種標(biāo)注類型如下所示:“B?LOC”、“I?LOC”和“O”。其中,“B?LOC”表示該字符屬于車站名稱的起始字,“I?LOC”表示該字符屬于車站名稱的中間字,“O”表示該字符不屬于車站名稱。

2.2.2 調(diào)度命令修正模塊構(gòu)建

XMTD-8222電熱恒溫鼓風(fēng)干燥箱,上海精宏實(shí)驗(yàn)設(shè)備有限公司;MJX-160B-Z霉菌培養(yǎng)箱,上海博迅實(shí)業(yè)有限公司醫(yī)療設(shè)備廠;SW-CJ-20雙人單面凈化工作臺(tái),蘇州凈化設(shè)備有限公司;LDZX-30KBS立式壓力蒸汽滅菌器,上海申安醫(yī)療器械廠;HJ-2A數(shù)顯恒溫磁力加熱攪拌器,金壇市城東新瑞儀器廠;FA2004N電子天平,上海菁海儀器有限公司;H1850R離心機(jī),湖南湘儀實(shí)驗(yàn)儀器開(kāi)發(fā)有限公司;PHS-3CpH計(jì),上海智光儀器儀表有限公司;紫外可見(jiàn)分光光度計(jì),上海儀電分析儀器有限公司;恒溫水浴鍋,北京科偉永興儀器有限公司。

對(duì)涉及不同應(yīng)急處置事件的預(yù)警文本信息,神經(jīng)網(wǎng)絡(luò)可對(duì)其進(jìn)行統(tǒng)一處理和訓(xùn)練,從而生成初始調(diào)度命令。由于調(diào)度命令種類多樣,不同類型的調(diào)度命令擁有不同的內(nèi)容、結(jié)構(gòu)與特征,因此難以對(duì)所有初始調(diào)度命令使用同樣的方法進(jìn)行修正。在調(diào)度命令修正階段,對(duì)不同類型應(yīng)急處置事件分別構(gòu)建不同的調(diào)度命令修正模塊。為簡(jiǎn)化模塊構(gòu)建復(fù)雜度,各事件調(diào)度命令修正模塊由第2.2.1節(jié)所提出五種調(diào)度命令修正策略組合構(gòu)成。修正策略的調(diào)用提高了模塊的自由度,并在很大程度上減少了不同類型模塊構(gòu)建的工作量。

以“接觸網(wǎng)跳閘重合不成功”事件為例,介紹修正模塊構(gòu)建流程。事件預(yù)警文本信息如下所示:“4月5日11時(shí)30分,供電調(diào)度通知鲘門至惠東站間上、下行線接觸網(wǎng)跳閘自動(dòng)重合不成功(故標(biāo)下行線1 504 km816 m)”,對(duì)應(yīng)的調(diào)度命令為:“G6328次列車運(yùn)行至鲘門站至惠東站間上下行線1 502 km816 m 至1 506 km816 m處限速40 km·h-1”。

對(duì)上述信息進(jìn)行分析,該類調(diào)度命令為列車限速調(diào)度命令,由于限速值可通過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到,因此需要修正的部分為:車站信息,如“鲘門”、“惠東”;線路走向信息,如“上、下行線”;里程信息,根據(jù)《高速鐵路列車調(diào)度員應(yīng)急處置指導(dǎo)書》規(guī)定,限速位置按照故障點(diǎn)前后各2 km確定。綜上,“接觸網(wǎng)跳閘重合不成功”事件修正模塊以策略1、策略2和策略5組合而成。

通過(guò)以上方法對(duì)各類應(yīng)急處置事件構(gòu)建對(duì)應(yīng)的調(diào)度命令修正模塊,當(dāng)神經(jīng)網(wǎng)絡(luò)輸出初始調(diào)度命令后,即可通過(guò)關(guān)鍵詞匹配到相應(yīng)的修正模塊,調(diào)用其中的修正策略對(duì)初始調(diào)度命令進(jìn)行修正處理,得到最終調(diào)度命令。

2.3 評(píng)價(jià)指標(biāo)

采用記憶導(dǎo)向型摘要評(píng)價(jià)(ROUGE)方法來(lái)評(píng)價(jià)最終調(diào)度命令智能生成質(zhì)量。ROUGE 方法是Lin等[16]于2003年提出的一種評(píng)價(jià)自動(dòng)文摘和機(jī)器翻譯質(zhì)量的指標(biāo),中心思想是將自動(dòng)生成的文摘與專家制定的標(biāo)準(zhǔn)文摘進(jìn)行比較,通過(guò)統(tǒng)計(jì)兩者之間的基本單元數(shù)目進(jìn)行評(píng)分。將模型輸出的調(diào)度命令與標(biāo)準(zhǔn)調(diào)度命令進(jìn)行比較,統(tǒng)計(jì)生成調(diào)度命令與標(biāo)準(zhǔn)調(diào)度命令的基本單元數(shù)目,使用ROUGE 準(zhǔn)則中的ROUGE?1、ROUGE?2和ROUGE?L來(lái)評(píng)價(jià)調(diào)度命令生成質(zhì)量,最終得出的數(shù)值越高表示生成的調(diào)度命令與標(biāo)準(zhǔn)調(diào)度命令相似度越高。

ROUGE準(zhǔn)則定義如下所示:

式中:Cn,m為生成的調(diào)度命令與標(biāo)準(zhǔn)調(diào)度命令共有的n元詞數(shù)目;Cn為標(biāo)準(zhǔn)調(diào)度命令中n元詞數(shù)目,取n=1,2。

式中:l(Y,Y標(biāo))為自動(dòng)生成調(diào)度命令與標(biāo)準(zhǔn)調(diào)度命令連續(xù)最長(zhǎng)共有序列的長(zhǎng)度;l(Y標(biāo))為標(biāo)準(zhǔn)調(diào)度命令長(zhǎng)度。

3 實(shí)驗(yàn)過(guò)程及結(jié)果分析

3.1 實(shí)驗(yàn)過(guò)程

探究基于seq2seq模型的調(diào)度命令智能生成方法的應(yīng)用效果,并對(duì)調(diào)度命令修正模塊的修正情況進(jìn)行驗(yàn)證,實(shí)驗(yàn)過(guò)程如圖5所示。首先,將訓(xùn)練數(shù)據(jù)預(yù)處理之后用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練,通過(guò)參數(shù)調(diào)試得到最優(yōu)神經(jīng)網(wǎng)絡(luò)模型;其次,將測(cè)試數(shù)據(jù)中的預(yù)警文本信息作為模型的輸入投入訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型中,生成初始調(diào)度命令;再利用調(diào)度命令修正模塊進(jìn)行內(nèi)容修正,得到最終生成的調(diào)度命令;最后,使用ROUGE評(píng)價(jià)方法對(duì)生成的調(diào)度命令進(jìn)行評(píng)價(jià)。

3.2 數(shù)據(jù)集

根據(jù)廣州鐵路集團(tuán)安監(jiān)報(bào)數(shù)據(jù)和調(diào)度命令數(shù)據(jù),建立了預(yù)警文本信息?調(diào)度命令數(shù)據(jù)集,共計(jì)16 735條。數(shù)據(jù)集中預(yù)警文本信息和發(fā)布的調(diào)度命令一一對(duì)應(yīng),共計(jì)13種類型。表2列出了13種類型應(yīng)急處置、對(duì)應(yīng)的調(diào)度命令以及各類型事件所對(duì)應(yīng)的調(diào)度命令修正策略。為了更好地對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行測(cè)試,在數(shù)據(jù)集中抽出1 300條數(shù)據(jù)構(gòu)建驗(yàn)證集,驗(yàn)證集中包含13種類型預(yù)警文本信息?調(diào)度命令數(shù)據(jù),每種類型數(shù)據(jù)100條,共計(jì)1 300條。將剩余數(shù)據(jù)的90%作為訓(xùn)練集,其余10%的數(shù)據(jù)作為測(cè)試集(包含13種類型應(yīng)急處置事件,每個(gè)應(yīng)急處置事件數(shù)據(jù)量一致)。為了保證調(diào)度命令的規(guī)范性,依據(jù)《鐵路運(yùn)輸調(diào)度規(guī)則(2017版)》中調(diào)度命令模板對(duì)調(diào)度命令數(shù)據(jù)進(jìn)行規(guī)范化處理。

表2 調(diào)度命令數(shù)據(jù)集類型及修正策略Tab.2 Dispatching command dataset types and correction strategies

值得注意的是,對(duì)于同一類型應(yīng)急處置事件,不同情況下的處置辦法不同。例如,針對(duì)接觸網(wǎng)跳閘事件,接觸網(wǎng)自動(dòng)重合不成功時(shí),需發(fā)布調(diào)度命令限速;接觸網(wǎng)自動(dòng)重合成功時(shí),只需發(fā)布口頭指示限速80 km·h-1注意運(yùn)行。從兩者之間區(qū)別度非常小的文本信息中能夠獲取的有效特征是有限的,這也是調(diào)度命令生成的難點(diǎn)之一。

3.3 數(shù)據(jù)預(yù)處理

為了便于模型能夠?qū)︻A(yù)警文本信息進(jìn)行識(shí)別,并獲取更多的有效特征,在將數(shù)據(jù)輸入模型之前首先需要進(jìn)行預(yù)處理,主要有以下三個(gè)步驟:

第一步,中文分詞。使用Python庫(kù)中的jieba庫(kù)進(jìn)行分詞處理,為了更好地識(shí)別未登錄詞,構(gòu)建了車站名稱詞典。詞典中包含了所研究的廣鐵集團(tuán)管轄范圍內(nèi)的354個(gè)車站和地理位置詞匯,提高分詞精度。

第二步,去噪處理。主要剔除無(wú)用的停用詞或標(biāo)點(diǎn)符號(hào),由于需要生成完整的調(diào)度命令信息,因此僅對(duì)預(yù)警文本信息進(jìn)行去停用詞及標(biāo)點(diǎn)符號(hào)處理。

第三步,中文轉(zhuǎn)換。在利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行調(diào)度命令生成任務(wù)之前,首先需要將預(yù)警文本信息和調(diào)度命令的自然語(yǔ)言化的字詞轉(zhuǎn)化為計(jì)算機(jī)可以理解的數(shù)學(xué)語(yǔ)言。按出現(xiàn)頻率從高到低的順序分別為每一個(gè)分詞詞語(yǔ)賦予一個(gè)數(shù)字,數(shù)字從1開(kāi)始依次增加,并按<“詞語(yǔ)”:數(shù)字>的形式存儲(chǔ)在字典中,如<“車站”:128>。除了現(xiàn)有詞語(yǔ)之外,額外加入以下四種字符:、、、。其中,用來(lái)進(jìn)行字符補(bǔ)全,用來(lái)替代訓(xùn)練中未出現(xiàn)過(guò)的詞語(yǔ),為解碼器端句子起始標(biāo)志,為解碼器端句子結(jié)束標(biāo)志。最后,按照字典映射關(guān)系將輸入的句子[x1,x2,…,xt]映射為對(duì)應(yīng)的數(shù)字間的特征,將每一個(gè)數(shù)字轉(zhuǎn)換為300維張量,得到輸入序列[x1,x2,…,xt]。

3.4 實(shí)驗(yàn)結(jié)果

3.4.1 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率和迭代次數(shù)參數(shù)對(duì)比實(shí)驗(yàn)

為了確定seq2seq模型的最優(yōu)參數(shù),針對(duì)學(xué)習(xí)率、迭代次數(shù)設(shè)置不同的對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)中seq2seq模型編碼器和解碼器均采用兩層LSTM網(wǎng)絡(luò),隱層節(jié)點(diǎn)數(shù)為64,批量大小為64,隨機(jī)失活設(shè)為0.5,采用Adam算法優(yōu)化損失函數(shù)。

通過(guò)seq2seq模型輸出的調(diào)度命令稱為初始調(diào)度命令,將初始調(diào)度命令與標(biāo)準(zhǔn)調(diào)度命令進(jìn)行比對(duì),初始調(diào)度命令與標(biāo)準(zhǔn)調(diào)度命令完全匹配視為生成正確,有任何一處無(wú)法匹配則視為生成有誤。值得注意的是,由于后續(xù)還會(huì)由調(diào)度命令修正模塊對(duì)前一階段生成的初始調(diào)度命令內(nèi)容進(jìn)行修正,因此對(duì)于初始調(diào)度命令中與標(biāo)準(zhǔn)調(diào)度命令不相同,但可由調(diào)度命令修正模塊進(jìn)行修正的部分,不將其看作生成有誤。

在相同的訓(xùn)練集下,設(shè)定學(xué)習(xí)率r為0.100、0.010、0.001,迭 代 次 數(shù) 為100~700。 圖6 為 對(duì)seq2seq模型在以上參數(shù)下進(jìn)行訓(xùn)練,并在驗(yàn)證集上實(shí)驗(yàn)的結(jié)果。由圖6可見(jiàn),在三種學(xué)習(xí)率下,隨著迭代次數(shù)的增加,模型正確率都呈現(xiàn)出先增高后降低的趨勢(shì)。當(dāng)學(xué)習(xí)率0.001,迭代次數(shù)400時(shí),實(shí)驗(yàn)效果最佳。對(duì)此時(shí)各類型應(yīng)急處置事件的初始調(diào)度命令生成正確率利用驗(yàn)證集進(jìn)行測(cè)試,如圖7所示。

由圖7可知,應(yīng)急處置事件類型編號(hào)2“線路所通過(guò)信號(hào)機(jī)故障”在所有事件類型中正確率最低。該類調(diào)度命令由于文本長(zhǎng)度較短、特征過(guò)少,導(dǎo)致在機(jī)器學(xué)習(xí)時(shí)難以捕獲命令特征,未能達(dá)到較好的智能生成效果。其余事件的調(diào)度命令生成正確率大部分在90%以上,生成正確率較高。

3.4.2 實(shí)驗(yàn)結(jié)果

基于第3.4.1節(jié)確定的各項(xiàng)參數(shù)對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,在測(cè)試集上進(jìn)行最終實(shí)驗(yàn)結(jié)果展示。使用ROUGE評(píng)價(jià)指標(biāo)分別對(duì)seq2seq模型和調(diào)度命令修正階段生成的調(diào)度命令進(jìn)行評(píng)價(jià),結(jié)果取所有輸出結(jié)果的平均值,實(shí)驗(yàn)結(jié)果如表3所示。

表3 ROUGE評(píng)價(jià)結(jié)果Tab.3 ROUGE evaluation results

實(shí)驗(yàn)結(jié)果表明,最終生成的調(diào)度命令與標(biāo)準(zhǔn)調(diào)度命令的匹配度較高,并且調(diào)度命令修正模塊有效提升了模型生成質(zhì)量。其中,Rouge?1結(jié)果提升19.0%,Rouge?2結(jié)果提升18.5%,Rouge?L結(jié)果提升37.9%。

表4為利用修正模塊修正前后的調(diào)度命令生成結(jié)果示例,其中包含13種類型的應(yīng)急處置事件。從最終生成效果可見(jiàn),提出的調(diào)度命令智能生成模型能夠有效地基于預(yù)警文本信息生成對(duì)應(yīng)調(diào)度命令,生成的調(diào)度命令具有連貫性和可讀性,并且調(diào)度命令修正模塊能夠?qū)Τ跏颊{(diào)度命令進(jìn)行合理修正,提高了調(diào)度命令內(nèi)容的正確率。

5 結(jié)論

(1)seq2seq模型能夠有效地基于預(yù)警文本信息生成調(diào)度命令,正確率超過(guò)90%。

(2)引入調(diào)度命令修正模塊可以有效提升調(diào)度命令生成正確率,相較于沒(méi)有使用修正模塊時(shí),Rouge?1結(jié)果提升19.0%,Rouge?2結(jié)果提升18.5%,Rouge?L結(jié)果提升37.9%。

(3)不同結(jié)構(gòu)、特征的預(yù)警文本信息對(duì)于最終生成的調(diào)度命令正確率有一定影響,“線路所通過(guò)信號(hào)機(jī)故障”事件錯(cuò)誤率最高。

猜你喜歡
命令修正預(yù)警
只聽(tīng)主人的命令
Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
修正這一天
合同解釋、合同補(bǔ)充與合同修正
法律方法(2019年4期)2019-11-16 01:07:28
法國(guó)發(fā)布高溫預(yù)警 嚴(yán)陣以待備戰(zhàn)“史上最熱周”
移防命令下達(dá)后
園林有害生物預(yù)警與可持續(xù)控制
軟件修正
這是人民的命令
機(jī)載預(yù)警雷達(dá)對(duì)IFF 的干擾分析
长葛市| 紫金县| 梨树县| 平原县| 宁南县| 志丹县| 马尔康县| 开原市| 嘉黎县| 松江区| 锦屏县| 寿宁县| 柳江县| 呼和浩特市| 庄河市| 青州市| 高淳县| 和龙市| 侯马市| 云梦县| 海口市| 叙永县| 靖西县| 乌海市| 罗江县| 敦化市| 会理县| 金山区| 焉耆| 通化县| 台南县| 松潘县| 株洲县| 迁西县| 成武县| 白城市| 洛宁县| 甘泉县| 红河县| 牙克石市| 天镇县|