国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

鐵路智能客服關(guān)鍵技術(shù)研究

2019-09-19 11:07:56張志強(qiáng)汪健雄
關(guān)鍵詞:客服語義語音

張志強(qiáng),汪健雄,靳 超

(中國鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081)

新一代客票系統(tǒng)承擔(dān)了鐵路12306互聯(lián)網(wǎng)售票、窗口售票、自動售取票、電話訂票等多種渠道售票業(yè)務(wù),目前,高峰日發(fā)售全國鐵路客票超1 200萬張,尤其是互聯(lián)網(wǎng)/手機(jī)APP渠道占售票總量的比例最高約75%,已經(jīng)成為廣大人民群眾鐵路出行購票的主要渠道。由于售票量劇增,鐵路客運(yùn)業(yè)務(wù)規(guī)則復(fù)雜,鐵路客票系統(tǒng)規(guī)模不斷擴(kuò)張,導(dǎo)致12306互聯(lián)網(wǎng)售票系統(tǒng)(簡稱:12306系統(tǒng))網(wǎng)絡(luò)客服的需求量與日俱增,給鐵路客服人員增加了大量的工作。由于人工客服存在維護(hù)成本高、服務(wù)時間受限、培訓(xùn)成本高、線路忙、人為錯誤不利于控制等問題,急需采用技術(shù)手段解決人工客服存在的問題。

中國鐵路近年來為提升客運(yùn)服務(wù)質(zhì)量,不斷引入智能技術(shù),持續(xù)開展智能客服語音平臺研究和建設(shè)。智能客服的發(fā)展是隨著人工智能及計(jì)算機(jī)硬件、軟件、網(wǎng)絡(luò)技術(shù)不斷發(fā)展而逐步推進(jìn)的,隨著智能客服機(jī)器人在各個領(lǐng)域的成功應(yīng)用,其價值已逐漸被社會所認(rèn)可。在經(jīng)歷了基于歷史、上下文理解概念、句子基于知識推理的簡單自然語言處理和搭建模型讓機(jī)器學(xué)習(xí)推理等階段,利用深度學(xué)習(xí)搭建神經(jīng)網(wǎng)絡(luò)解決困擾著人們的模型學(xué)習(xí)復(fù)雜、模型維護(hù)復(fù)雜的問題,還為語言交互、圖像識別、人臉識別等領(lǐng)域帶來了全新的突破。鐵路智能客服基于語義理解和語言處理技術(shù),利用深度學(xué)習(xí)和多場景交互技術(shù),形成用戶畫像,使其具備快速反饋及精準(zhǔn)推送能力,與人工座席協(xié)同工作。本文對鐵路智能客服的關(guān)鍵技術(shù)進(jìn)行探究,提出鐵路智能客服總體框架,構(gòu)建多渠道智能客服,為鐵路12306系統(tǒng)智能客服提供有力支撐。

1 鐵路智能客服設(shè)計(jì)

1.1 總體架構(gòu)

總體架構(gòu)設(shè)計(jì)是在保證安全的前提下引入“互聯(lián)網(wǎng)+”,構(gòu)建統(tǒng)一接入、統(tǒng)一轉(zhuǎn)辦、統(tǒng)一輸出、統(tǒng)一監(jiān)督、統(tǒng)一考核的智能客服體系,如圖1所示。

圖1 鐵路智能客服總體架構(gòu)圖

(1)多媒體受理

支持熱線電話、Web端、移動終端、第三方即時通信平臺等多渠道的統(tǒng)一接入。

(2)業(yè)務(wù)層

包括咨詢、查詢、投訴、建議的受理、轉(zhuǎn)派、處理、評價和考核。

(3)應(yīng)用層

采用自助語音、文本智能問答、人工、轉(zhuǎn)工單等方式對外提供服務(wù)。

(4)智能交互層

包括語音合成、語音識別,以及自然語言理解引擎等。

(5)支撐層

為前臺應(yīng)用提供支撐,包括渠道管理、會話管理、座席管理、工單管理、知識管理、流程管理、統(tǒng)計(jì)分析、系統(tǒng)管理、系統(tǒng)接口等模塊。

(6)數(shù)據(jù)層

包括基礎(chǔ)知識庫、領(lǐng)域知識庫、交互數(shù)據(jù)庫以及語言語義庫,文本數(shù)據(jù)庫可以通過轉(zhuǎn)換形成語音庫,是語音輸出的基礎(chǔ)。

圖2 業(yè)務(wù)處理流程圖

1.2 業(yè)務(wù)流程

用戶通過各種接入渠道輸入語音或者文本信息,通過交互平臺以語音導(dǎo)航、人工客服、智能問答等方式進(jìn)行接待,根據(jù)咨詢的業(yè)務(wù)分類(咨詢、查詢、投訴、建議)轉(zhuǎn)接到相關(guān)業(yè)務(wù)知識庫、相關(guān)業(yè)務(wù)部門人工座席等,根據(jù)具體情況,以語音、智能問答的方式進(jìn)行實(shí)時回復(fù),以工單的方式進(jìn)行延時回復(fù)。具體流程設(shè)計(jì)如圖2所示。用戶可以通過鐵路12306系統(tǒng)客服電話、12306系統(tǒng)APP語音交互或者其他語音輸入模塊向智能終端表達(dá)自己的需求,包括咨詢或者辦理各種業(yè)務(wù),鐵路智能客服通過語音識別和語義理解后,與后臺的知識庫進(jìn)行對接,獲取用戶的關(guān)注信息后反饋給用戶。這樣的交互過程貼合用戶的使用習(xí)慣,方便快捷,可有效提升客服的準(zhǔn)確性和效率。

1.3 主要功能

(1)自然語言處理

通過實(shí)時捕獲座席和用戶對話,通過語音識別和語義去理解通話,具備處理自然語言中廣泛存在的各種各樣歧義性或多義性的能力,構(gòu)建座席的人工智能(AI)助理,協(xié)同作業(yè),提高效率。

(2)知識庫管理

存儲、組織、管理各種互相聯(lián)系的知識片集合,包含覆蓋程度較為全面的常用業(yè)務(wù)詞匯和常用鏈接。

(3)最佳答案推薦

回答用戶提出的問題時,采用場景式多輪會話交互模式,基于歷史、上下文理解概念和句子,基于知識推理增強(qiáng)泛化能力,最終提供最優(yōu)答案。

(4)在線留言與轉(zhuǎn)接

當(dāng)在線客服提供的結(jié)果無法解答用戶問題時,允許用戶在線留言或轉(zhuǎn)接人工客服,解答用戶問題。

(5)評估分析

將用戶多種信息內(nèi)容結(jié)構(gòu)化,打上各類標(biāo)簽,并進(jìn)行深入的挖掘分析,形成用戶畫像進(jìn)行評估判斷,可自動為每個用戶的服務(wù)與政策制定等提供數(shù)據(jù)與決策支持。

2 智能客服關(guān)鍵技術(shù)

2.1 語義理解與語言處理

語義理解類似于人類閱讀理解,當(dāng)語言符號出現(xiàn)時,人類喚起大腦中語言符號所代表的含義,以此含義為代表去理解語言符號所代表的客觀事物。通常為了降低語義理解實(shí)現(xiàn)難度,可通過人工構(gòu)造數(shù)據(jù)集、應(yīng)答所需要的單詞、意境以及相應(yīng)的問題回答,常見的任務(wù)形式包括人工合成問答、Cloze-style queries和選擇題等方式[1]。

通過對鐵路12306系統(tǒng)客服語料(含網(wǎng)站、APP、語音渠道)進(jìn)行標(biāo)注和分析,總結(jié)客服交互式語句的特點(diǎn)及對話特點(diǎn),并采用深度學(xué)習(xí)技術(shù)進(jìn)行12306系統(tǒng)客服領(lǐng)域的實(shí)體識別,提出針對12306系統(tǒng)客服環(huán)境的語義理解方案,解決旅客屬性混雜、口音眾多、口語表達(dá)不符合規(guī)范的語法導(dǎo)致的模糊性和二義性問題

2.1.1 語義三角模型與語義網(wǎng)

語義三角關(guān)系定義了概念以及概念和概念之間的關(guān)系。這種定義使人與人之間、人與計(jì)算機(jī)之間能基于共享的概念進(jìn)行語言交流,讓機(jī)器通過理解人的認(rèn)知模型,建立機(jī)器理解人類自然語言的框架模型,如圖3所示。

通過語義三角模型將事物根據(jù)屬性劃分歸類成語義網(wǎng)。語義網(wǎng)又稱本體,語義詞典,是共享概念模型的明確的形式化規(guī)范說明。語義網(wǎng)定義了概念,以及概念和概念之間的關(guān)系,這種定義使得人和人之間,人和計(jì)算機(jī)之間能基于共享的概念進(jìn)行語言交流。語義網(wǎng)由類(class)或概念(concepts)、關(guān)系(relations)、函數(shù)(functions)、公理(axioms)、實(shí)例(instances)組成。

圖3 三角模型

語義網(wǎng)分為領(lǐng)域語義網(wǎng)和通用語義網(wǎng),用于分層分領(lǐng)域建模。通用語義網(wǎng)由來自互聯(lián)網(wǎng)積累的、商用多年以上被業(yè)界所共識的物體概念與狀態(tài)及其間的關(guān)系組成;領(lǐng)域語義網(wǎng)由各領(lǐng)域在生產(chǎn)中積累、加載的信息構(gòu)成。鐵路12306系統(tǒng)領(lǐng)域類關(guān)系展示如圖4所示。

圖4 鐵路12306系統(tǒng)語義網(wǎng)分類關(guān)系示例

2.1.2 智能語音交互

為使得智能客服像真人一樣有聽說能力,需要綜合語音合成、語音識別等智能技術(shù)[2]。語音識別技術(shù)是讓機(jī)器通過識別和理解過程將語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令,目的是將人類語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可識讀的輸入,并可以識別語音內(nèi)容、說話者、語種等信息,用于識別不同客戶語音所蘊(yùn)含的語義。語音合成可以將輸入的文字信息轉(zhuǎn)化為自然流暢的語音,替代人工為客戶提供標(biāo)準(zhǔn)化的語音應(yīng)答。鐵路人工客服采用智能語音交互服務(wù),實(shí)現(xiàn)客戶語音的“可視化”,完成客戶咨詢問題詞條及關(guān)鍵字的識別,輔助座席人員快速進(jìn)行相關(guān)知識庫、知識節(jié)點(diǎn)的搜索匹配,提高客戶座席人員的工作效率和服務(wù)能力。

2.1.3知識搜索排序

知識搜索是增強(qiáng)智能客服響應(yīng)問題的即時性和準(zhǔn)確性的關(guān)鍵技術(shù)。采用“語義相似度”和“業(yè)務(wù)相似度”相結(jié)合的評分排序算法,滿足客戶對搜索排序的個性化要求,具體步驟如下:

(1)根據(jù)搜索內(nèi)容和知識本身的語義關(guān)系得到兩者的相似度,通過相似度排序得到智能搜索的雛形;

(2)根據(jù)知識搜索的點(diǎn)擊率、熱點(diǎn)知識得到問題和知識之間相關(guān)度的指數(shù),有效區(qū)別排序權(quán)重;

(3)劃分知識等級時,與銷售業(yè)務(wù)相關(guān)的權(quán)重比管理類知識劃分的權(quán)重更高;(4)將過期知識的權(quán)重降低,提高知識有效性;(5)對個別知識的搜索權(quán)重可以通過規(guī)則來配置設(shè)定。

2.1.4 語音情感識別

在鐵路智能客服中引入語音情感識別,可根據(jù)用戶情感的變化提供更人性化的服務(wù),有效提高鐵路智能客服的服務(wù)質(zhì)量,提升用戶滿意度。例如,當(dāng)語音情感識別程序檢測到當(dāng)前用戶存在不滿情緒時可及時轉(zhuǎn)接至人工服務(wù)。而當(dāng)話務(wù)員遭遇態(tài)度惡劣的客戶時,自身情緒容易發(fā)生波動,系統(tǒng)可以提醒其保持冷靜。

情感識別本質(zhì)上是模式識別,核心在于尋找合適的識別模型[3]。目前,主要采用模式分類方法,其中,人工神經(jīng)網(wǎng)絡(luò)、隱馬爾可夫模型、支持向量機(jī)等方法取得了較好的效果。

2.2 深度學(xué)習(xí)

2.2.1 深度學(xué)習(xí)模型

鐵路智能客服采用深度學(xué)習(xí)模型,可分為一維匹配模型、二維匹配模型、推理模型[4],其中,一維匹配模型和二維匹配模型是基礎(chǔ)模型,推理模型則是在基礎(chǔ)模型上重點(diǎn)研究如何對內(nèi)容進(jìn)行推理。

(1)一維匹配模型

一維匹配模型的基本思路為:假設(shè)用戶問題記為Q,而某段文本中存在某個單詞Di可能是問題Q的答案的可能性記為F(Di,Q),或者理解為語義和問題Q整體語義的匹配程度,用點(diǎn)積表示為:

對每個單詞的匹配函數(shù)值通過歸一化指數(shù)函數(shù)進(jìn)行歸一化,該過程被稱作為注意力(Attention)操作,用于增強(qiáng)單詞是該問題答案的可能性。對于整個文本中某單詞多次出現(xiàn)的情況,其注意力操作結(jié)果不同,即該單詞在上下文中對應(yīng)答案的概率,最后將同一單詞的注意力概率值累加作為該單詞是問題Q答案的可能性,問題答案則被認(rèn)為是可能性值最大的單詞。多數(shù)主流模型基本都采用一維匹配模型結(jié)構(gòu),主要區(qū)別主要是匹配函數(shù)的定義不同[5]。

(2)二維匹配模型

二維匹配模型與一維匹配模型不同的是:其采用問題表示法進(jìn)行問題表達(dá)。相較于一維匹配模型將問題的語義表達(dá)為一個整體,二維匹配模型文本中的每個單詞都采用獨(dú)立的單詞表達(dá)(Word Embedding)向量表示。由于Word Embedding向量是每個單詞及其上下文語義的二維結(jié)構(gòu),引入了更多細(xì)節(jié)信息,整體而言,二維匹配模型效果優(yōu)于一維匹配模型。

(3)推理模型

自然語言推理是判斷兩個句子(Premise,Hypothesis)或者兩個詞之間的語義關(guān)系。自然語言文本不能明確地定義并表達(dá)符號之間的邏輯關(guān)系,所以,自然語言表達(dá)有相當(dāng)大的模糊性,推理過程的實(shí)現(xiàn)難度較大。目前,主流的推理模型有AMRNN[6]、GA Reader[7]和 IA Reader[8]。

推理過程更適用于有一定難度的問題,通常對于簡單問題沒有明顯作用。其推理作用效果與數(shù)據(jù)集難度相關(guān)聯(lián),以常見的通用推理 數(shù)據(jù)集為例,Google采用的新聞?wù)Z料庫CNN數(shù)據(jù)集整體偏容易,因此無需復(fù)雜的推理步驟也能得到正確回答,而在Facebook采用的新聞?wù)Z料庫CBT數(shù)據(jù)集上,有推理過程的評價指標(biāo)比無推理過程評價指標(biāo)提高了2.5%~5%[9]。

2.2.2 自動巡檢機(jī)制

(1)通過網(wǎng)頁爬蟲、文檔錄入等數(shù)據(jù)預(yù)處理手段進(jìn)行碎片化加工后,形成專業(yè)領(lǐng)域的知識庫,對過期知識進(jìn)行下架或刪除處理;

(2)自動對未識別的問題集進(jìn)行非結(jié)構(gòu)化分析,形成主題類別和優(yōu)化建議,便于采編人員對重點(diǎn)問題進(jìn)行優(yōu)化。

2.2.3 自我調(diào)整

自我調(diào)整是采用場景式多輪會話交互模式支持圖形化配置對話的流程,采用寒暄等場景對用戶進(jìn)行甄別,從而不斷調(diào)整機(jī)器的對話方式,實(shí)現(xiàn)對用戶的逐步引導(dǎo)。

2.3 精準(zhǔn)營銷

2.3.1 用戶畫像

通過與用戶的交流可以收集到用戶的基本信息,智能客服對這些信息進(jìn)行建模,抽象出用戶的標(biāo)簽,形成用戶畫像[10]。

(1)數(shù)據(jù)收集

主要收集網(wǎng)絡(luò)行為數(shù)據(jù)、用戶偏好數(shù)據(jù)、用戶交易數(shù)據(jù)等。

(2)建模

行為建模是對收集到的數(shù)據(jù)進(jìn)行處理,該階段注重的是大概率事件,通過算法模型盡可能排除用戶的偶然行為。

(3)成型

畫像成型是行為建模的深入,對收集數(shù)據(jù)進(jìn)行處理后對用戶進(jìn)行標(biāo)簽化,根據(jù)用戶的基本屬性(例如年齡、性別、地域等)、心理特征、興趣愛好等方面細(xì)化分類。用戶畫像無法100%準(zhǔn)確描述一個人,只能盡可能準(zhǔn)確。因此,需要不斷收集數(shù)據(jù)、根據(jù)變化的基本數(shù)據(jù)不斷修正,才能使得用戶畫像越來越立體、越來越真實(shí)。

2.3.2 營銷推送

當(dāng)用戶畫像成型后,使用大數(shù)據(jù)可視化分析,針對某個標(biāo)簽或是某個群體,細(xì)化出不同類別的用戶,評估用戶的趨勢行為及價值空間,對接業(yè)務(wù)接口,推送最新資訊或公告,做出針對性的營銷[11]。

3 結(jié)束語

基于鐵路智能客服關(guān)鍵技術(shù)的12306系統(tǒng)客服平臺已經(jīng)在中國鐵路上海局集團(tuán)有限公司試運(yùn)行,取得了良好效果,為鐵路企業(yè)與海量用戶之間建立了基于自然語言、快捷有效溝通的技術(shù)渠道,同時,為鐵路企業(yè)提供了細(xì)粒度知識管理技術(shù)和精細(xì)化管理所需的統(tǒng)計(jì)分析信息,有效解決了傳統(tǒng)人工服務(wù)維護(hù)成本高、服務(wù)時間受限、培訓(xùn)成本高、線路忙等諸多問題,減少了人為錯誤,規(guī)范了服務(wù)標(biāo)準(zhǔn),達(dá)到了精準(zhǔn)營銷和服務(wù)整合的目的,提高了鐵路12306系統(tǒng)客服接通率和滿意度,提升了鐵路用戶體驗(yàn),樹立了鐵路良好社會形象。隨著科技進(jìn)步持續(xù)升級,將構(gòu)建多渠道全方位智能客服,為鐵路客服和出行旅客提供更便捷、更友好、更準(zhǔn)確的全流程解決方案。

猜你喜歡
客服語義語音
語言與語義
語音推銷
魔力語音
基于MATLAB的語音信號處理
電子制作(2019年14期)2019-08-20 05:43:38
基于MQ3與MP3的價廉物美的酒駕語音提醒器
電子制作(2019年9期)2019-05-30 09:42:10
對方正在輸入……
小說界(2018年5期)2018-11-26 12:43:42
敬業(yè)的客服
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
基于廣東“一張網(wǎng)”對內(nèi)客服模式的探討
認(rèn)知范疇模糊與語義模糊
搜索| 眉山市| 玉屏| 昌江| 泸州市| 济宁市| 锡林浩特市| 仙居县| 宝清县| 泸溪县| 环江| 余江县| 麦盖提县| 龙川县| 南投市| 太谷县| 滨州市| 娄烦县| 五常市| 大名县| 陇南市| 陕西省| 屯昌县| 宿迁市| 合水县| 大邑县| 长海县| 平利县| 沅陵县| 五大连池市| 综艺| 池州市| 蓝田县| 灌云县| 宜宾市| 凤山市| 长乐市| 高唐县| 德昌县| 容城县| 昌江|