王心雨,單杏花,景 輝
(1.中國(guó)鐵道科學(xué)研究院 研究生部,北京 100081;2.中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081)
互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展使得老年人與移動(dòng)互聯(lián)網(wǎng)之間的數(shù)字鴻溝愈發(fā)明顯,為解決老年人在使用智能服務(wù)時(shí)面對(duì)的難題,提出在鐵路12306 手機(jī)客戶端上增加語(yǔ)音購(gòu)票功能。目前語(yǔ)音識(shí)別算法的準(zhǔn)確率已經(jīng)達(dá)到了較高水平,然而通用的語(yǔ)音識(shí)別算法在實(shí)際應(yīng)用中,需要解決難以識(shí)別特定領(lǐng)域的專有名詞的問題。
鐵路領(lǐng)域的語(yǔ)音識(shí)別應(yīng)用日漸廣泛,潘梁生[1]設(shè)計(jì)用于列車司機(jī)語(yǔ)音識(shí)別及作業(yè)情況評(píng)判的列車車載語(yǔ)音識(shí)別系統(tǒng),黃大吉等[2]設(shè)計(jì)基于嵌入式自然語(yǔ)言處理的車務(wù)術(shù)語(yǔ)語(yǔ)音識(shí)別方法,吳佳佳等[3]提出由調(diào)度電話語(yǔ)音識(shí)別、調(diào)度命令模板匹配構(gòu)成的調(diào)度命令智能生成方法,蔣秋華等[4]實(shí)現(xiàn)鐵路客服智能語(yǔ)音導(dǎo)航系統(tǒng),唐雯等[5]設(shè)計(jì)鐵路客運(yùn)服務(wù)機(jī)器人的語(yǔ)音交互系統(tǒng),廉文彬等[6]融合語(yǔ)音識(shí)別等技術(shù),設(shè)計(jì)鐵路客服智能質(zhì)檢系統(tǒng)。目前北京、上海、南京[7]等地的部分地鐵交通樞紐已開通語(yǔ)音購(gòu)票功能,借助智能語(yǔ)音識(shí)別技術(shù),幫助用戶完成地鐵票的購(gòu)買。考慮到智能語(yǔ)音識(shí)別技術(shù)給客運(yùn)服務(wù)帶來(lái)的提升,加之鐵路方面尚未推出語(yǔ)音購(gòu)票功能,以此為契機(jī),進(jìn)行適用于鐵路語(yǔ)音購(gòu)票的語(yǔ)音識(shí)別方法研究。
為了實(shí)現(xiàn)語(yǔ)音購(gòu)票功能的設(shè)計(jì),需明確鐵路購(gòu)票流程。鐵路購(gòu)票流程如圖1所示,旅客在進(jìn)行購(gòu)票操作時(shí),需要提供出發(fā)地、目的地、日期、車次、席別等乘車信息;后臺(tái)會(huì)根據(jù)旅客提供的信息判斷當(dāng)前選擇是否有余票,若無(wú)票,旅客需重新進(jìn)行選擇,若有票,則需提供乘車人信息;旅客提供準(zhǔn)確的乘車人信息后,系統(tǒng)會(huì)生成相應(yīng)的訂單;旅客支付成功后,此次交易完成,購(gòu)買車票成功。在設(shè)計(jì)語(yǔ)音購(gòu)票功能時(shí),需獲取出發(fā)地、目的地、日期、車次、席別等關(guān)鍵乘車信息,才能保證購(gòu)票操作的正常運(yùn)行。
圖1 鐵路購(gòu)票流程Fig.1 Procedure of railway ticket purchase
獲取信息的前提是準(zhǔn)確識(shí)別旅客口述的信息,語(yǔ)音識(shí)別技術(shù)作為實(shí)現(xiàn)語(yǔ)音購(gòu)票功能的關(guān)鍵一環(huán),設(shè)計(jì)并實(shí)現(xiàn)適用于鐵路語(yǔ)音購(gòu)票場(chǎng)景的語(yǔ)音識(shí)別模型尤其重要。語(yǔ)音識(shí)別流程,就是將一段語(yǔ)音信號(hào)轉(zhuǎn)換成相對(duì)應(yīng)的文本信息的過(guò)程,語(yǔ)音信號(hào)經(jīng)過(guò)信號(hào)處理后,逐幀提取語(yǔ)音特征,將提取好的特征送至解碼器,在聲學(xué)模型、語(yǔ)言模型的共同指導(dǎo)下,找到最為匹配的詞序列作為識(shí)別結(jié)果輸出,語(yǔ)音識(shí)別系統(tǒng)流程如圖2所示,實(shí)現(xiàn)語(yǔ)音購(gòu)票功能的關(guān)鍵技術(shù)主要為聲學(xué)模型、語(yǔ)言模型、前綴束搜索、熱詞賦權(quán)。
圖2 語(yǔ)音識(shí)別系統(tǒng)流程Fig.2 Procedure of speech recognition system
(1)聲學(xué)模型。聲學(xué)模型即對(duì)人聲進(jìn)行建模,把語(yǔ)音輸入轉(zhuǎn)換成聲學(xué)表示的輸出,并計(jì)算出相應(yīng)的概率。在中文語(yǔ)音識(shí)別中,聲學(xué)符號(hào)通常為聲韻母。聲學(xué)模型建模時(shí)需要考慮3方面的因素,一是模型的可訓(xùn)練性,即能否得到足夠的語(yǔ)料進(jìn)行訓(xùn)練;二是可推廣性,即當(dāng)模型所針對(duì)的詞匯集發(fā)生變化時(shí),原有模型能否不加修改地滿足新的詞匯集;三是精確性,即模型是否能對(duì)人聲進(jìn)行較好的識(shí)別。
(2)語(yǔ)言模型。為了準(zhǔn)確識(shí)別購(gòu)票所需的關(guān)鍵信息,解決鐵路專有名詞識(shí)別困難的問題,使當(dāng)前模型更好地了解相關(guān)的鐵路領(lǐng)域知識(shí),需要預(yù)先對(duì)語(yǔ)言模型進(jìn)行優(yōu)化,確保能夠正確識(shí)別鐵路領(lǐng)域內(nèi)的專有名詞、語(yǔ)言習(xí)慣。設(shè)計(jì)多重語(yǔ)言模型是為融合各類語(yǔ)言模型的優(yōu)點(diǎn),從而達(dá)到提高識(shí)別準(zhǔn)確率的目的。
(3)前綴束搜索。前綴束搜索通過(guò)將搜索前綴合并,使得算法的搜索束更加多樣化,以解決聲學(xué)模型識(shí)別率受兩個(gè)相同前綴的結(jié)果分?jǐn)偢怕手涤绊懙膯栴}。
(4)熱詞賦權(quán)。在語(yǔ)音識(shí)別模型中,對(duì)于常用詞匯的識(shí)別效果較好,但對(duì)一些特有的人名、公司名或者某個(gè)領(lǐng)域的專有詞匯,可能存在識(shí)別準(zhǔn)確率不高的情況。針對(duì)鐵路專有名詞,提出增加熱詞賦權(quán)模塊,提高了鐵路專有名詞的檢出率和語(yǔ)音識(shí)別模型的準(zhǔn)確率。
根據(jù)既有研究,融合模型[8]能獲得更好的預(yù)測(cè)結(jié)果,通過(guò)淺融合[9]結(jié)構(gòu)進(jìn)行語(yǔ)音識(shí)別模型設(shè)計(jì),得到基于多重語(yǔ)言模型融合的語(yǔ)音識(shí)別模型,主要包含聲學(xué)模型、語(yǔ)言模型、前綴束搜索、熱詞賦權(quán)4部分。
基于多重語(yǔ)言模型融合的語(yǔ)音識(shí)別模型是使用Listen Attend and Spell (LAS)[10]聲學(xué)模型,并融合基于長(zhǎng)短期記憶[11](LSTM)和n元統(tǒng)計(jì)(n-gram)[12]的2種語(yǔ)言模型,在每個(gè)時(shí)間步的輸出中,計(jì)算聲學(xué)模型和語(yǔ)言模型的加權(quán)得分,得分由束搜索[13]方法得出,定義為
式中:y為解碼結(jié)果;PLAS(y)為聲學(xué)模型得分; Pn-gram(y)與PLSTM(y)分別為L(zhǎng)STM和n-gram的2種語(yǔ)言模型的得分;λ為模型的得分權(quán)重。根據(jù)在開發(fā)集上多次調(diào)整測(cè)試,λ取0.35時(shí),模型的識(shí)別準(zhǔn)確率最高。
模型經(jīng)過(guò)前綴束搜索解碼,篩選出數(shù)條最佳候選句;再根據(jù)候選句包含熱詞的情況進(jìn)行賦權(quán),選擇得分最高的候選句作為識(shí)別結(jié)果。以識(shí)別“我想買安靖到固始的票”一句為例,設(shè)計(jì)基于多重語(yǔ)言模型融合的語(yǔ)音識(shí)別模型結(jié)構(gòu)如圖3所示。
圖3 基于多重語(yǔ)言模型融合的語(yǔ)音識(shí)別模型結(jié)構(gòu) Fig.3 Structure of speech recognition model based on the fusion of multiple language models
2.2.1 聲學(xué)模型
LAS聲學(xué)模型的結(jié)構(gòu)分為編碼器、注意力機(jī)制、解碼器、歸一化4個(gè)部分。LAS中“L”代表“Listen”,即為編碼器部分,從輸入序列提取隱層特征;“AS”代表“Attend and Spell”,即為注意力機(jī)制、解碼器、歸一化3個(gè)部分,Attend模塊接收Listen模塊傳遞過(guò)來(lái)的隱層特征,并用來(lái)學(xué)習(xí)輸入特征和模型最后輸出序列之間的對(duì)齊信息,其中使用的注意力機(jī)制使得每個(gè)時(shí)間步用來(lái)解碼的輸入不一樣,從而使得不同時(shí)間步關(guān)注的側(cè)重點(diǎn)不一樣;Attend模塊的輸出傳遞到Spell模塊后,解碼器按照鏈?zhǔn)椒▌t,結(jié)合之前解碼器預(yù)測(cè)的輸出、Attend的輸出及解碼器自身的網(wǎng)絡(luò)信息,經(jīng)過(guò)歸一化函數(shù),將多個(gè)神經(jīng)元的輸出映射到(0,1)區(qū)間內(nèi),最終產(chǎn)生輸出詞序列的概率分布。LAS聲學(xué)模型計(jì)算方法為
式中:x為輸入序列;h為隱層狀態(tài)的特征序列;y為輸出序列;P ( y | x)為輸出序列的概率分布。
2.2.2 語(yǔ)言模型
不同種類的語(yǔ)言模型有著各自的作用方式,LSTM語(yǔ)言模型分別給每個(gè)詞賦予各自的分布式向量表征,探索其在高維連續(xù)空間中的依賴關(guān)系;n-gram模型是最為常用的統(tǒng)計(jì)語(yǔ)言模型[14],從統(tǒng)計(jì)的角度預(yù)測(cè)句子的概率分布,可以將其看作是對(duì)詞與詞共同出現(xiàn)頻次的統(tǒng)計(jì),通過(guò)將LSTM語(yǔ)言模型和n-gram模型按適合的權(quán)重結(jié)合起來(lái),共同對(duì)聲學(xué)模型的識(shí)別結(jié)果進(jìn)行修正。
LSTM語(yǔ)言模型中最重要的是LSTM網(wǎng)絡(luò)結(jié)構(gòu),其為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)[15](RNN)。RNN可以利用上下文進(jìn)行預(yù)測(cè),但是在訓(xùn)練過(guò)程中,模型可能發(fā)生梯度消失或者爆炸,很難做到長(zhǎng)期依賴上下文進(jìn)行預(yù)測(cè)。LSTM網(wǎng)絡(luò)結(jié)構(gòu)在RNN的基礎(chǔ)上增加了輸入門、遺忘門和輸出門,分別控制輸入、前一時(shí)刻節(jié)點(diǎn)的歷史信息和輸出信息,很好地解決RNN長(zhǎng)序列訓(xùn)練過(guò)程中的梯度消失和梯度爆炸問題。LSTM網(wǎng)絡(luò)結(jié)構(gòu)計(jì)算公式為
式中:it為輸入門,用于控制C~t的哪些特征用于更新Ct;xt為輸入序列;ht-1為前一時(shí)刻的隱層狀態(tài);ft為遺忘門,表示Ct-1的哪些特征被用于計(jì)算Ct;?為L(zhǎng)STM最重要的門機(jī)制,表示ft和Ct-1之間的單位乘的關(guān)系;Ct為記憶單元;C~t為單元狀態(tài)更新值;ot為輸出門,隱層節(jié)點(diǎn)輸出ht由ot和Ct得到;Wi,Wf,Wo為參數(shù)矩陣;bi,bf,bo為偏置向量;σ,φ,tanh分別為sigmoid,softmax,tanh激活函數(shù)。
構(gòu)建LSTM語(yǔ)言模型時(shí)使用雙層LSTM網(wǎng)絡(luò)結(jié)構(gòu),堆疊式LSTM可以增加網(wǎng)絡(luò)的深度,從而提高訓(xùn)練的效率,其計(jì)算公式為
式中:x為輸入字符;P ( y | x)為下一個(gè)字符出現(xiàn)的概率;LSTM (x)完成公式 ⑷ 至公式 ⑻ 的計(jì)算過(guò)程。
由于n-gram模型是基于統(tǒng)計(jì)原理,很難做到長(zhǎng)期依賴,因而對(duì)是否采用n-gram模型得分做了設(shè)定。首先對(duì)n-gram模型的概率分布選取top-k采樣,即在采樣前將輸出的概率分布截?cái)啵〕龈怕首畲蟮膋個(gè)詞,概率矩陣中其他值都做置零操作,以降低最不可能出現(xiàn)的詞對(duì)最終預(yù)測(cè)結(jié)果的影響。若n-gram模型得分不低于設(shè)定閾值,則將其計(jì)入加權(quán)得分的計(jì)算。結(jié)合公式 ⑴,模型得分計(jì)算公式為
式中:θ為是否采用n-gram模型得分的閾值,取值為0.6。
2.2.3 前綴束搜索
為了提高解碼過(guò)程中的召回率,增加前綴束搜索解碼。首先給前綴樹的根節(jié)點(diǎn)分配1個(gè)空節(jié)點(diǎn),再向詞列表中添加字符,循環(huán)對(duì)字符進(jìn)行判斷,最終篩選出P條最佳解碼路徑。以“安靖到固始”為例,“安靖到固始”的部分解碼前綴樹如圖4所示,前綴樹中的葉節(jié)點(diǎn)表示詞組,即圖4中雙環(huán)形;非葉節(jié)點(diǎn)表示詞前綴,即圖4中單環(huán)形。
圖4 “安靖到固始”的部分解碼前綴樹 Fig.4 Prefix tree: partial decoding results of the journey from Anjing to Gushi
2.2.4 熱詞賦權(quán)
為提高鐵路專有名詞的檢出率,設(shè)計(jì)熱詞賦權(quán)模塊。購(gòu)買車票時(shí),車站名、車次、席別是高頻詞,且存在與常用詞同音或發(fā)音相近的情況,如“安靖”與常用詞“安靜”發(fā)音相近。由于有語(yǔ)言模型的參與,解碼時(shí)傾向于給在語(yǔ)料中出現(xiàn)頻率更高的詞語(yǔ)更高的權(quán)重。對(duì)于部分鐵路名詞,其最終得分仍然無(wú)法超過(guò)部分高頻詞匯,從而造成識(shí)別錯(cuò)誤,故設(shè)置熱詞庫(kù),內(nèi)含車站名、城市名、車次、席別及購(gòu)票時(shí)用到的其他專有名詞,如候補(bǔ)、余票、動(dòng)臥等。對(duì)于篩選出的候選句,根據(jù)是否出現(xiàn)熱詞庫(kù)中的詞及出現(xiàn)的頻率進(jìn)行賦權(quán)加分,并重新計(jì)算每個(gè)候選句的得分,計(jì)算公式為
每個(gè)候選句最多獲得3個(gè)熱詞得分,從而盡可能避免熱詞識(shí)別錯(cuò)誤對(duì)結(jié)果產(chǎn)生不良影響。以“我想買去固始的車票”為例,由于熱詞庫(kù)包含“固始”,在“故事”“古詩(shī)”“股市”等眾多同音詞中,“固始”會(huì)獲得額外的得分,使其以最高的概率被選為最符合該語(yǔ)義的識(shí)別詞。
考慮到旅客購(gòu)買車票時(shí)的語(yǔ)言習(xí)慣,除車站名、車次、席別等關(guān)鍵信息外,語(yǔ)句包含更多的日常用語(yǔ),故研究構(gòu)建鐵路語(yǔ)音購(gòu)票場(chǎng)景語(yǔ)料庫(kù)(以下簡(jiǎn)稱“語(yǔ)料庫(kù)”),鐵路相關(guān)語(yǔ)料主要由12306客服對(duì)話、鐵路出行指南及其他現(xiàn)行的鐵路相關(guān)規(guī)章制度組成,常識(shí)語(yǔ)料主要是從維基百科、百度百科等公開語(yǔ)料庫(kù)中提取的有效文本。鐵路語(yǔ)音購(gòu)票場(chǎng)景語(yǔ)料庫(kù)示例如表1所示。
表1 鐵路語(yǔ)音購(gòu)票場(chǎng)景語(yǔ)料庫(kù)示例Tab.1 Examples from the corpus of voice-operated ticket purchase scenarios
與語(yǔ)料庫(kù)不同的是,熱詞庫(kù)存儲(chǔ)的是鐵路領(lǐng)域術(shù)語(yǔ),比如始發(fā)站、終到站、候補(bǔ)訂單等,一般是詞或者短語(yǔ)的形式;語(yǔ)料庫(kù)存儲(chǔ)的是句子和段落,主要用于語(yǔ)言模型的訓(xùn)練。
考慮到語(yǔ)音識(shí)別場(chǎng)景的特殊性,在自建數(shù)據(jù)集時(shí)兼顧鐵路相關(guān)數(shù)據(jù)和常識(shí)性數(shù)據(jù)。鐵路相關(guān)數(shù)據(jù)主要為12306客服數(shù)據(jù)集和購(gòu)票數(shù)據(jù)集,12306客服數(shù)據(jù)集包含約542 h的語(yǔ)音數(shù)據(jù),涵蓋旅客與客服有關(guān)購(gòu)票退票、車次查詢、賬戶核驗(yàn)、物品遺失、出行體驗(yàn)等多方面的交互過(guò)程;購(gòu)票數(shù)據(jù)集包含約485 h的語(yǔ)音數(shù)據(jù),是組織專人錄制的購(gòu)票場(chǎng)景對(duì)話,且在清洗拆分語(yǔ)音數(shù)據(jù)時(shí),對(duì)旅客個(gè)人信息進(jìn)行脫敏處理,以保障旅客的信息安全。常識(shí)性數(shù)據(jù)主要為從互聯(lián)網(wǎng)公開視頻中提取出的有效音頻,包含約15 278 h的語(yǔ)音數(shù)據(jù)。實(shí)驗(yàn)數(shù)據(jù)集劃分為訓(xùn)練集、開發(fā)集、測(cè)試集,其中訓(xùn)練集用于訓(xùn)練模型,開發(fā)集用于調(diào)整參數(shù)以及對(duì)模型作出的其它調(diào)整,測(cè)試集用于評(píng)估從開發(fā)集中選出的最優(yōu)的模型。實(shí)驗(yàn)數(shù)據(jù)集統(tǒng)計(jì)信息如表2所示。
表2 實(shí)驗(yàn)數(shù)據(jù)集統(tǒng)計(jì)信息Tab.2 Statistics on the experimental dataset
為了研究不同語(yǔ)言模型及熱詞賦權(quán)對(duì)識(shí)別結(jié)果的影響,以及不同語(yǔ)料對(duì)語(yǔ)言模型作用的影響,設(shè)計(jì)基線模型和其他4種訓(xùn)練模型,與基于多重語(yǔ)言模型融合的語(yǔ)音識(shí)別模型進(jìn)行對(duì)比實(shí)驗(yàn),所有模型top-k采樣中k為20,P條最佳解碼路徑中P為10。具體設(shè)計(jì)如下。
(1)基線模型:僅使用LAS聲學(xué)模型,即不使用任何語(yǔ)言模型的情況。
(2)模型1:僅使用LSTM語(yǔ)言模型對(duì)LAS聲學(xué)模型的結(jié)果進(jìn)行修正。
(3)模型2:在LAS聲學(xué)模型的基礎(chǔ)上,使用LSTM語(yǔ)言模型和n-gram模型,其中n-gram模型的訓(xùn)練語(yǔ)料僅含鐵路語(yǔ)料。
(4)模型3:在LAS聲學(xué)模型的基礎(chǔ)上,使用LSTM語(yǔ)言模型和n-gram模型,其中n-gram模型的訓(xùn)練語(yǔ)料僅含常識(shí)語(yǔ)料。
(5)模型4:在LAS聲學(xué)模型的基礎(chǔ)上,使用LSTM語(yǔ)言模型和n-gram模型,其中n-gram模型的訓(xùn)練語(yǔ)料包含鐵路語(yǔ)料及常識(shí)語(yǔ)料。
在語(yǔ)音識(shí)別任務(wù)上,采用字錯(cuò)誤率(CER)作為語(yǔ)音識(shí)別模型的評(píng)估指標(biāo),CER越低,表示效果越好,計(jì)算公式為
式中:S為替換的字符數(shù)目;D為刪除的字符數(shù)目;I為插入的字符數(shù)目;N為參考序列中字符總數(shù)。
得到基線模型和其他4種訓(xùn)練模型,以及基于多重語(yǔ)言模型融合的語(yǔ)音識(shí)別模型在測(cè)試集上的評(píng)測(cè)結(jié)果,不同訓(xùn)練模型實(shí)驗(yàn)結(jié)果如表3所示。
表3 不同訓(xùn)練模型實(shí)驗(yàn)結(jié)果Tab.3 Experimental results of different training models
結(jié)果顯示,模型2、模型3相比基線模型的準(zhǔn)確率分別下降1.045%和1.258%,說(shuō)明僅使用鐵路語(yǔ)料或者常識(shí)語(yǔ)料訓(xùn)練的n-gram模型會(huì)反作用于識(shí)別效果,原因在于僅使用鐵路語(yǔ)料會(huì)導(dǎo)致常識(shí)語(yǔ)料的匱乏,另一種情況則恰恰相反。當(dāng)2種語(yǔ)料都具備時(shí),n-gram模型的訓(xùn)練效果較好,模型4的識(shí)別準(zhǔn)確率提高了1.276%,該情況與旅客購(gòu)票時(shí)既會(huì)使用大量日常用語(yǔ),又會(huì)提及鐵路專有名詞的語(yǔ)言習(xí)慣相吻合,故在特定的語(yǔ)音識(shí)別場(chǎng)景中,語(yǔ)音識(shí)別算法需要與鐵路領(lǐng)域的專有知識(shí)結(jié)合,最終達(dá)到較好的識(shí)別效果?;诙嘀卣Z(yǔ)言模型融合的語(yǔ)音識(shí)別模型的識(shí)別準(zhǔn)確率,相比模型4提升近1%,相比基線模型提升1.374%,說(shuō)明對(duì)于識(shí)別不常用的鐵路專有名詞來(lái)說(shuō),添加熱詞是一個(gè)較好的選擇。
綜上所述,提出的基于多重語(yǔ)言模型的語(yǔ)音識(shí)別模型,可以有效提高鐵路專有名詞的檢出率,進(jìn)而提高整個(gè)語(yǔ)音識(shí)別模型的準(zhǔn)確率。
將基于多重語(yǔ)言模型的語(yǔ)音識(shí)別模型部署到鐵路客票網(wǎng)服務(wù)器中,進(jìn)行相關(guān)測(cè)試,得到鐵路購(gòu)票語(yǔ)音實(shí)驗(yàn)效果如表4所示。由表4可見,該語(yǔ)音識(shí)別算法能解決大部分鐵路專有名詞識(shí)別困難的問題,在車站名、車次類型、車票類型等專有詞的識(shí)別上表現(xiàn)良好,能適用于鐵路語(yǔ)音購(gòu)票場(chǎng)景。雖然存在小部分詞語(yǔ)識(shí)別錯(cuò)誤的情況,但不影響用戶進(jìn)行購(gòu)票操作,除了模型本身無(wú)法完全準(zhǔn)確識(shí)別所有字詞的內(nèi)在因素外,這種情況還受到說(shuō)話人口音、說(shuō)話環(huán)境等外在因素的影響。
表4 鐵路購(gòu)票語(yǔ)音實(shí)驗(yàn)效果Tab.4 Experimental effect of voice-operated railway ticket purchase
出行服務(wù)的品質(zhì)化、智能化、定制化升級(jí)是未來(lái)的發(fā)展方向,如何為旅客提供全方位智慧化的出行服務(wù),將是鐵路客運(yùn)服務(wù)領(lǐng)域技術(shù)發(fā)展方向。針對(duì)鐵路語(yǔ)音購(gòu)票場(chǎng)景,提出基于多重語(yǔ)言模型融合的語(yǔ)音識(shí)別方法,很好地解決鐵路專有名詞識(shí)別困難的問題,能夠準(zhǔn)確識(shí)別購(gòu)票所需的關(guān)鍵信息,將語(yǔ)音識(shí)別應(yīng)用融入客運(yùn)服務(wù)是研究語(yǔ)音識(shí)別算法及相關(guān)應(yīng)用的最終目標(biāo)。除了語(yǔ)音購(gòu)票功能外,未來(lái)計(jì)劃在鐵路12306手機(jī)客戶端上增加語(yǔ)音查詢、語(yǔ)音打車等功能,逐步完善手機(jī)客戶端的語(yǔ)音交互系統(tǒng),給用戶帶來(lái)更好的使用體驗(yàn)。