梅巧玲,王思宇,馬 杰
(中國鐵道科學(xué)研究院集團有限公司 電子計算技術(shù)研究所,北京 100081)
隨著人工智能及機器學(xué)習(xí)等技術(shù)的不斷進步,智能應(yīng)答和智能推送技術(shù)及系統(tǒng)日臻成熟,達到了商用的水平。微軟、阿里巴巴、騰訊、移動、小i、蘋果、谷歌等國內(nèi)外的公司都對該領(lǐng)域進行了深入的研究,發(fā)展了自己的產(chǎn)品線,逐步向個人助理方向演進[1-3]。中國高鐵正處于一個發(fā)展關(guān)鍵期,隨著高速鐵路“四縱四橫”規(guī)劃基本實現(xiàn),高速鐵路的發(fā)展影響并改變著人們的生活節(jié)奏和出行方式,廣大旅客對鐵路業(yè)務(wù)咨詢的需求也日益增長。
目前,鐵路12306互聯(lián)網(wǎng)售票系統(tǒng)(簡稱:12306)客服熱線客服人員1 232人,日均服務(wù)量7.25萬人次,節(jié)假日日均服務(wù)量8.9萬人次,寒暑假和節(jié)假日服務(wù)需求突增。隨著客票業(yè)務(wù)種類的增多,客服工作遇到了很多問題,比如客服人員與服務(wù)需求嚴(yán)重失衡,熱線一對一服務(wù)效率低,常見性問題占比大,人力耗費過多,制度類變更需及時讓全體客服人員重新學(xué)習(xí),整理回復(fù)模板,確??头藛T回復(fù)口徑一致,回復(fù)模板、規(guī)章制度檢索效率低等。微信公眾號和小程序雖然提供了部分自動應(yīng)答的功能,但只能解決少量的咨詢問題。鐵路12306線上智能客服系統(tǒng)的引入可以顯著增加旅客服務(wù)的承載量,輔助客服人員快速準(zhǔn)確地處理應(yīng)答,在提高客服人員并發(fā)處理能力的同時替代部分客服人員,減輕人工客服的壓力,為旅客提供更優(yōu)質(zhì)、更完善的體驗和個性化服務(wù)。
隨著信息系統(tǒng)智能化水平的不斷提高,以及傳感技術(shù)、智能技術(shù)、網(wǎng)絡(luò)技術(shù)和云計算技術(shù)的持續(xù)突破,智能客服系統(tǒng)逐漸興起。在應(yīng)用場景、應(yīng)用模式方面更為多元便捷,已成為智能時代客服發(fā)展的新趨勢。鐵路12306線上智能客服系統(tǒng)較傳統(tǒng)的客服系統(tǒng)而言,具有更為靈活的智能化特征和服務(wù)特性,能夠?qū)崿F(xiàn)感知、決策、執(zhí)行等系列功能,是一種新型的智能信息系統(tǒng)。該系統(tǒng)的架構(gòu)層級主要分為接入層、應(yīng)用層和數(shù)據(jù)層3部分,如圖1所示。
圖1 系統(tǒng)架構(gòu)圖
接入層主要包括基礎(chǔ)構(gòu)件和接入管理2部分:基礎(chǔ)構(gòu)件主要由語義識別引擎和需求預(yù)測引擎組成;接入管理的作用是對請求進行分類、排隊,并根據(jù)當(dāng)前的系統(tǒng)情況進行合理請求分發(fā),主要包括智能排隊、分發(fā)策略和負載均衡3個子模塊。
應(yīng)用層主要包括后臺管理和智能客服應(yīng)用2部分:后臺管理包括知識庫管理、數(shù)據(jù)采集及分析和問題庫管理;智能客服應(yīng)用包含客服機器人、定制服務(wù)、智能規(guī)則引擎、營銷推送、需求預(yù)測和語音語義識別等子模塊,各子模塊的具體功能如下。
(1)客服機器人:通過搭建知識庫,形成智能問答系統(tǒng),解決用戶的問題。系統(tǒng)支持文字和語音信息類型,滿足不同用戶的需求[4-5]。
(2)定制服務(wù):收集用戶需求(如感興趣的主題、喜好等),根據(jù)歷史記錄數(shù)據(jù)深入分析挖掘,為用戶提供全方位、全行程定制化服務(wù)。
(3)智能規(guī)則引擎:常見問題可以在線申請反饋,處理問題。后臺引擎對出現(xiàn)的問題進行歸類統(tǒng)計分析,輔助客票系統(tǒng)升級優(yōu)化問題答案。
(4)營銷推送:根據(jù)旅客行程信息,給旅客推送相關(guān)城市的天氣、酒店、熱點新聞、景點、當(dāng)?shù)靥禺a(chǎn)等信息。
(5)需求預(yù)測:通過對歷史出行記錄、最新搜索目的地等信息的大數(shù)據(jù)分析,結(jié)合地域、年齡、出行成員等信息,分析用戶的出行需求,實現(xiàn)主動服務(wù)。
(6)語音語義識別:支持對語音語義的高準(zhǔn)確率識別,從問題庫中快速匹配出相應(yīng)的問題。
數(shù)據(jù)層包含知識庫、問題庫和知識索引3部分,同時提供與客票業(yè)務(wù)系統(tǒng)、外部系統(tǒng)的數(shù)據(jù)接口。
知識庫和問題庫涵蓋全路、全渠道的多媒體應(yīng)答,包含規(guī)章制度、通告等知識,基于預(yù)采編的知識數(shù)據(jù),自動生成語義標(biāo)簽,可快速對知識進行結(jié)構(gòu)化組織。數(shù)據(jù)層和客票業(yè)務(wù)系統(tǒng)交互的數(shù)據(jù)包括列車基礎(chǔ)數(shù)據(jù)和旅客出行軌跡等;與外部系統(tǒng)交互的數(shù)據(jù)包括天氣、美食、旅游、航空等。
鐵路12306線上智能客服系統(tǒng)以自然語言處理技術(shù)為基礎(chǔ),通過多媒體網(wǎng)關(guān)統(tǒng)一接入電話、郵件、短信、微信、支付寶等多種渠道,處理語音、文本、視頻、圖片等信息。多媒體網(wǎng)關(guān)通過媒體適配器屏蔽和卸載各種接口、加密串、協(xié)議等,并進行信息過濾篩選和預(yù)處理,統(tǒng)一傳送到集中的排隊服務(wù)器中;同時,與后臺機器人引擎相結(jié)合,通過擬人化的方式與用戶進行實時交互,為用戶提供智能化的應(yīng)答服務(wù)。
系統(tǒng)以用戶屬性數(shù)據(jù)、歷史提問內(nèi)容、業(yè)務(wù)數(shù)據(jù)為基礎(chǔ),自動采用結(jié)構(gòu)化與非結(jié)構(gòu)化分析方法。用戶在各渠道(網(wǎng)站、微信、手機APP、支付寶)獲取在線服務(wù)時,系統(tǒng)自動對接各業(yè)務(wù)接口,發(fā)現(xiàn)用戶關(guān)注點,依據(jù)條件觸發(fā)營銷推送,主動向用戶推送營銷信息,如:天氣、景點、土特產(chǎn)、列車最新正晚點信息、列車停運通知、失物招領(lǐng)、突發(fā)事件公告等,讓旅客第一時間了解最新資訊,獲取更好的服務(wù)。
該功能模塊對用戶交互數(shù)據(jù)進行業(yè)務(wù)分類、聚類、熱詞統(tǒng)計并提供報表,利用語義解析功能識別用戶意圖,將關(guān)鍵信息傳遞給業(yè)務(wù)系統(tǒng),用于支撐完善知識庫,對客票系統(tǒng)的業(yè)務(wù)優(yōu)化具有參考意義。
智能應(yīng)答最早應(yīng)用于電話的語音、短信增值業(yè)務(wù),后來發(fā)展到在線客服接入網(wǎng)站等?,F(xiàn)在無論是網(wǎng)站還是移動APP,例如微信、支付寶等各類有服務(wù)咨詢功能的應(yīng)用,均采用統(tǒng)一的在線客服智能應(yīng)答服務(wù)引擎。智能應(yīng)答服務(wù)引擎提供多種形式的接口,例如,SDK、API、嵌入頁面等,并根據(jù)不同的渠道進行適配改造,實現(xiàn)接入。
智能應(yīng)答流程有3個環(huán)節(jié):開始環(huán)節(jié),包括觸發(fā)場景條件、場景開始提取信息規(guī)則;動態(tài)環(huán)節(jié),包括進入環(huán)節(jié)條件、如何詢問用戶、環(huán)節(jié)內(nèi)提取信息規(guī)則;結(jié)束環(huán)節(jié),包括退出場景條件、成功時系統(tǒng)動作、失敗時系統(tǒng)動作。系統(tǒng)對已有的大量數(shù)據(jù)進行特征提取,分析得出表示具有情感傾向性的特征詞,再通過機器學(xué)習(xí)方法,對大量數(shù)據(jù)進行建模,判斷當(dāng)前用戶的情感傾向性,再對用戶進行針對性的回答,從而實現(xiàn)智能應(yīng)答。系統(tǒng)還提供驗證集回歸測試機制,可以直觀體現(xiàn)系統(tǒng)升級優(yōu)化對應(yīng)答的影響情況。該功能需要事先定義好由模擬問題和目標(biāo)知識組成的驗證集,在系統(tǒng)版本升級和知識變化后或定期巡查過程中,由系統(tǒng)自動模擬測試,得到準(zhǔn)確率優(yōu)化建議,這樣可以不斷優(yōu)化智能應(yīng)答的結(jié)果。
鐵路12306線上智能客服系統(tǒng)是12306與用戶之間重要的溝通渠道,通過信息交流完成業(yè)務(wù)服務(wù)。自然語言信息的非結(jié)構(gòu)化特點造成大量問題不能及時反饋處理,不能有效提高用戶體驗度,要解決這一問題,需要實現(xiàn)對語言信息的智能化和自動化處理,將原來主要由人工完成的工作交給系統(tǒng)自動完成,人工只需要進行輔助處理,這樣既能減少人力資源的投入,又能提高客服處理效率和智能化水平,改善客戶體驗。
語義識別技術(shù)可以分析網(wǎng)頁、文件、社交媒體中的大量數(shù)據(jù),通過接口技術(shù)應(yīng)用于機器人、智能家居、智能語音交互等領(lǐng)域,涉及醫(yī)療、教育、金融、交通等行業(yè)[6-7]。在鐵路12306線上智能客服系統(tǒng)中,語義識別作為接入層的重要組成部分,承擔(dān)著與用戶交互的工作。
語義識別可以分為自然語言處理(NLP,Natural Language Processing)技術(shù)層和底層數(shù)據(jù)層。NLP技術(shù)層主要分為詞法句法分析和語義分析2部分,用于從給定數(shù)據(jù)中抽取重要信息。底層數(shù)據(jù)層是語義識別算法模型的基礎(chǔ),包括詞典、數(shù)據(jù)集、語料庫、知識圖譜以及外部世界常識性知識等。本系統(tǒng)利用知識庫和問題庫提供底層數(shù)據(jù),建立語義識別算法模型[8-9]。
準(zhǔn)確地掌握旅客出行特征是獲取鐵路出行需求,優(yōu)化鐵路運行圖,構(gòu)建市場化鐵路運營體系的基礎(chǔ),有助于規(guī)劃管理部門制定科學(xué)決策。同時隨著鐵路交通網(wǎng)絡(luò)規(guī)模的不斷擴大和延伸,數(shù)據(jù)采集的深度和廣度也不斷增加。鐵路系統(tǒng)在運營過程中積累了海量的數(shù)據(jù),這為提取旅客的出行鏈和出行規(guī)律奠定了數(shù)據(jù)基礎(chǔ),為進行旅客出行特征分析提供了新的思路。大數(shù)據(jù)分析技術(shù)在數(shù)據(jù)量大、數(shù)據(jù)迭代快的場景下,對鐵路系統(tǒng)在運營過程中積累的海量數(shù)據(jù)進行管理和分析,充分挖掘數(shù)據(jù)潛藏的價值。
知識圖譜又稱為科學(xué)知識圖譜,主要以知識抽取、知識表示、知識融合、知識推理技術(shù)為基礎(chǔ)。知識圖譜是知識的元素組合和邏輯聯(lián)系結(jié)構(gòu),每一個知識圖譜包括對象、條件、屬性、參數(shù)4個元素。其中,對象與屬性可以決定一個知識圖譜的結(jié)構(gòu),條件和參數(shù)可決定一個知識圖譜的實例化。一個知識圖譜可以有多個實例化結(jié)果,實例化結(jié)果與傳統(tǒng)知識庫的知識概念相似,每個實例化結(jié)果對應(yīng)一個標(biāo)準(zhǔn)答案,這就將各個實體進行了關(guān)聯(lián)。
傳統(tǒng)的客服系統(tǒng)以中文分詞和關(guān)鍵詞為核心,通過語句相似度計算來實現(xiàn)自動問答,這種系統(tǒng)雖然在客戶服務(wù)中起到不錯的效果,但是存在準(zhǔn)確率低、效率低、維護難等問題。在大數(shù)據(jù)、機器學(xué)習(xí)等新技術(shù)的影響下,鐵路12306線上智能客服系統(tǒng)利用知識圖譜技術(shù)構(gòu)建一個龐大而精細的知識庫,為每條知識設(shè)計足夠多的相似問法,并完成關(guān)鍵詞重要性標(biāo)記,通過對海量數(shù)據(jù)的分析、標(biāo)記,不斷完善、優(yōu)化知識庫,使其成為智能客服的最強大腦。
鐵路12306線上智能客服系統(tǒng)的智能搜索技術(shù)通過使用數(shù)據(jù)挖掘、機器學(xué)習(xí)等技術(shù)對列車運行數(shù)據(jù)、鐵路出行數(shù)據(jù)、用戶個性化數(shù)據(jù)進行綜合分析建模,針對每一名旅客分別建立個性化的數(shù)據(jù)模型。系統(tǒng)在接收到旅客提出的問題時,會結(jié)合問題庫中當(dāng)前熱點問題,智能分析旅客的真實意圖,返回個性化的智能搜索結(jié)果,提高返回結(jié)果的相關(guān)性和正確性。智能搜索實現(xiàn)的具體流程如下:
(1)將鐵路旅客多維特征(如年齡、出行規(guī)律、地域)進行抽取和統(tǒng)計;
(2)對出行數(shù)據(jù)進行聚類分析,按出行特征將旅客分為不同類型的旅客群體,屬于一個類型的用戶群體具有相似的屬性,對鐵路出行有相似的關(guān)注主題;
(3)系統(tǒng)分析計算各旅客群體對每個主題的關(guān)注度,獲得用戶群體和各信息主題相關(guān)性;
(4)根據(jù)問題類別、參與人數(shù)對當(dāng)前旅客關(guān)注的熱點進行動態(tài)計算,提取熱度較高的主題形成熱點主題,利用關(guān)聯(lián)規(guī)則挖掘,將熱點主題相關(guān)的熱點問題提取出來,顯著提高系統(tǒng)準(zhǔn)確率。
本文結(jié)合當(dāng)前鐵路客票服務(wù)的現(xiàn)狀,提出了鐵路12306線上智能客服系統(tǒng)方案,系統(tǒng)以自然語言處理技術(shù)為基礎(chǔ),接入方式由單一接入向集電話、短信、微信、支付寶等多種方式接入轉(zhuǎn)變,搭建了具有多方式接入、多渠道協(xié)同、多方位智能化應(yīng)用的智能客服系統(tǒng)??蛻裟茈S時隨地、便捷快速地獲得豐富的產(chǎn)品信息和全面的業(yè)務(wù)指導(dǎo),真正做到用用戶喜歡的方式為用戶進行服務(wù)。鐵路12306線上智能客服系統(tǒng)方案的研究滿足了移動互聯(lián)網(wǎng)環(huán)境下用戶和企業(yè)變革的需求,統(tǒng)一了服務(wù)內(nèi)容和服務(wù)流程,提高了客服人員工作效率,為后續(xù)系統(tǒng)功能的進一步深化研究奠定了基礎(chǔ)。