盧致亮 匡先進 曾趙錦
【摘要】? ? 自然語言處理是IT技術(shù)重要的創(chuàng)新之一,本文針對電力客服系統(tǒng)的需求,結(jié)合自然語言處理技術(shù)討論了一種電力客服系統(tǒng)設(shè)計與實現(xiàn)過程。討論了系統(tǒng)構(gòu)建過程中涉及的實現(xiàn)模式、系統(tǒng)組件、核心算法等內(nèi)容。該系統(tǒng)以電力服務(wù)為知識庫數(shù)據(jù)源,利用自然語言處理技術(shù)進行分詞及詞向量轉(zhuǎn)換,利用知識庫訓(xùn)練并構(gòu)建模型,最終完成電力智能客服系統(tǒng)的構(gòu)建,其運行效果良好。
【關(guān)鍵詞】? ?自然語言處理? ? 智能問答? ? 電力服務(wù)
引言:
人工智能技術(shù)在飛速發(fā)展,并迅速應(yīng)用于各行各業(yè)。電力系統(tǒng)關(guān)系到國計民生,人工智能在電力系統(tǒng)中的應(yīng)用必將有效提升電力運維的效率與安全。人工智能系統(tǒng)與電力系統(tǒng)的融合體現(xiàn)在諸多方面,本文以電力智能客服系統(tǒng)的設(shè)計與實現(xiàn)為切入點,將自然語言處理技術(shù)應(yīng)用于電力系統(tǒng)的自動運維,使電力系統(tǒng)的運維向自動化、智能化方向發(fā)展。
智能手機的普及讓用戶希望擁有更便捷的信息獲取方式和更人性化的人機交互體驗。此背景下,我們進行了電力客服系統(tǒng)的研究與開發(fā),在工單大數(shù)據(jù)技術(shù)的助力下,構(gòu)建了一個能夠快速吸收和利用已有知識的對話理解模型,對用戶的問題通過自然語言處理技術(shù)進行分析,采用機器學(xué)習方法構(gòu)建和優(yōu)化問答模型,構(gòu)建出一個高效、準確的智能問答系統(tǒng)。
本文組織如下,首先介紹了電力客服系統(tǒng)的研究意義,并對當前國內(nèi)外研究現(xiàn)狀進行了分析;然后討論了相關(guān)系統(tǒng)組件、核心算法、自然語言處理方法;最后給出了電力智能客服系統(tǒng)模型的構(gòu)建流程。
一、研究現(xiàn)狀
智能問答系統(tǒng)可以定義為能與人進行對話的應(yīng)用程序,即采用文字、語音來與計算機進行交互的問答系統(tǒng)。問答系統(tǒng)的發(fā)展經(jīng)歷了漫長的歷史。
1988年,Berkeley研發(fā)了聊天機器人UC[1],該系統(tǒng)通過自然語言交互界面為用戶使用系統(tǒng)提供幫助。此后延伸出多種類似系統(tǒng),如 YAP[2]用于電話信息查詢,CSIEC[2]則用于學(xué)習輔助。
國內(nèi),中科院于1998年構(gòu)建了第一個人機對話系統(tǒng)[3]。初期的問答系統(tǒng)常限定于某特定領(lǐng)域,結(jié)合知識庫和推理機而形成專家系統(tǒng)(ES)[5]。
在電力系統(tǒng)運維方面,目前應(yīng)用于電力系統(tǒng)的方法有神經(jīng)網(wǎng)絡(luò)[4]、模糊集理論[6]等。神經(jīng)網(wǎng)絡(luò)具有良好分類性,被廣泛應(yīng)用于電力系統(tǒng)的監(jiān)測、診斷、實時控制、符合預(yù)測以及狀態(tài)評估等不同的領(lǐng)域[7]。模糊集則可完成傳統(tǒng)數(shù)學(xué)方法難以描述的模糊計算問題,目前已應(yīng)用于電力系統(tǒng)的系統(tǒng)規(guī)劃、模糊控制等方面[8],這些方法在構(gòu)建智能問答系統(tǒng)方面也具有較大的潛力。
當前,越來越多的公司、研究機構(gòu)在進行智能問答技術(shù)的研發(fā),如微軟、蘋果、劍橋大學(xué)等,工業(yè)界和學(xué)術(shù)界已產(chǎn)出一些比較成熟的智能問答系統(tǒng)。實際中,電力客服系統(tǒng)因其友好、便捷和及時的特點而迅速受到客戶的認可。
三、系統(tǒng)架構(gòu)
電力客服系統(tǒng)是智能問答系統(tǒng)中的一種特殊應(yīng)用,該系統(tǒng)涉及自然語言處理、工單數(shù)據(jù)分析以及問答模型構(gòu)建,其關(guān)鍵算法涉及NLP的語義分析和情感分析。
3.1電力客服系統(tǒng)實現(xiàn)模式
問答模型分為兩類,一類通過遵循特定規(guī)則來生成答案;另一類則使用人工智能方法生成答案。
3.1.1基于規(guī)則的系統(tǒng)
該模式的標準結(jié)構(gòu)由人工智能標記語言(AIML)構(gòu)建,其局限是只能理解其編碼范圍內(nèi)的問題,預(yù)定義的問答規(guī)則定義了客戶與系統(tǒng)對話的范圍,答案僅出現(xiàn)于匹配模式中?;谝?guī)則的系統(tǒng)更易構(gòu)建,因其使用簡單的算法來理解用戶輸入并查詢相應(yīng)的答案,適用于系統(tǒng)中基礎(chǔ)知識的問答。
3.1.2基于機器學(xué)習的系統(tǒng)
該模型使用機器學(xué)習算法進行訓(xùn)練,通過自然語言處理技術(shù)來理解特定問題并生成相應(yīng)的答案。系統(tǒng)開發(fā)時采用知識庫來存儲并描述系統(tǒng)的角色,用對話記錄進行模型的反復(fù)訓(xùn)練,算法結(jié)合模型與新收到的話語自動生成匹配答案。其特點是能理解自然語言,并可在對話過程中持續(xù)學(xué)習以提升其智能化水平。
3.2電力客服系統(tǒng)的組件
整個系統(tǒng)因涉及不同的異構(gòu)組件而變得復(fù)雜,其系統(tǒng)結(jié)構(gòu)取決于多種因素,如問答內(nèi)容的用例、領(lǐng)域以及系統(tǒng)類型等,系統(tǒng)的關(guān)鍵組件如下:
3.2.1問答系統(tǒng)
問答系統(tǒng)負責回答客戶的常見問題。客戶的問題由問答系統(tǒng)進行解釋,答案則來自知識庫的匹配,知識庫的構(gòu)建可用手工訓(xùn)練或自動訓(xùn)練方式。手動訓(xùn)練需要領(lǐng)域?qū)<揖幹瞥R妴栴}列表并描述其答案,系統(tǒng)基于此列表來匹配近似問題并查詢得到相應(yīng)答案。自動化訓(xùn)練則需要向系統(tǒng)傳遞訓(xùn)練數(shù)據(jù),如工單,知識庫由訓(xùn)練得到,問答引擎生成問題和答案的對應(yīng)列表并據(jù)此對問題自動匹配其答案。
3.2.2自然語言處理
自然語言處理技術(shù)將用戶的消息上下文化,其作用是理解用戶表述的內(nèi)容,并將其轉(zhuǎn)換為計算機能識別和處理的信息。
NLP涵兩個部件,即意圖分類器和實體提取器。意圖分類器在輸入內(nèi)容和回答內(nèi)容之間構(gòu)建映射關(guān)系;實體提取器負責從用戶的輸入中識別關(guān)鍵字,幫助確定用戶的操作意圖。
NLP引擎還包含反饋機制和學(xué)習策略。反饋機制是用戶為系統(tǒng)提供的反饋信息,它可納入評價系統(tǒng)中,即用戶在對話結(jié)束時對交互系統(tǒng)進行評分,以此激勵系統(tǒng)進行改進。學(xué)習策略是一種泛型學(xué)習框架,系統(tǒng)經(jīng)訓(xùn)練后可以在對話中創(chuàng)建更為通用的網(wǎng)絡(luò)模型。
3.2.3前端系統(tǒng)
前端系統(tǒng)是用戶與電力客服系統(tǒng)交互的系統(tǒng),它是面向客戶的系統(tǒng),如微信、門戶網(wǎng)站或移動APP等。
3.2.4節(jié)點服務(wù)器/流量服務(wù)器
服務(wù)器接收用戶請求并將它路由至相應(yīng)組件,內(nèi)部組件的響應(yīng)通常流量服務(wù)器路由至前端系統(tǒng)。
3.2.5后端集成
電力客服系統(tǒng)可與現(xiàn)有的后端系統(tǒng)(CRM、數(shù)據(jù)庫、支付系統(tǒng)等)集成,以增強電力客服系統(tǒng)的整體功能。
3.3電力客服系統(tǒng)核心算法
電力客服系統(tǒng)可采用不同分類模型來工作,核心模塊包括自然語言理解和自然語言處理。
3.3.1算法模式
算法用于構(gòu)建分類器和創(chuàng)建問答模型,復(fù)雜結(jié)構(gòu)由多個問答模型組合迭代而成。神經(jīng)網(wǎng)絡(luò)用權(quán)重向量來連接輸入與輸出,如前所述,NLP處理輸入時每個句子都會被分解為單詞,每個單詞都會用作神經(jīng)網(wǎng)絡(luò)的輸入,通過訓(xùn)練數(shù)據(jù)的多次迭代計算其加權(quán)連接,每次計算都使答案更準確。對于新輸入的句子,它的分詞會被計算頻次和特征,進而進行推斷,得分高者最有可能與輸入相關(guān)聯(lián),即為答案。
3.3.2自然語言理解
自然語言理解(NLU)通過分解查詢信息來幫助系統(tǒng)理解用戶請求。它有實體、意圖和上下文三方面內(nèi)容。
實體是系統(tǒng)從用戶查詢中提取的關(guān)鍵字,用以了解用戶的需求。意圖則有助于系統(tǒng)識別用戶輸入所對應(yīng)的操作。上下文用于關(guān)聯(lián)提問意圖,而舍棄對問題本身的分析和記錄。上下文對于NLU算法而言極其重要,若分析對話的歷史則需存儲對話中所有的問題,隨著數(shù)量的增加,分析過程變得異常復(fù)雜,使用上下文則可拋棄對對話歷史的存儲轉(zhuǎn)而記錄對話狀態(tài)。
3.3.3自然語言處理
自然語言處理(NLP)是將客戶的文本、語音轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)以篩選相關(guān)答案的過程。該過程涉及情感分析、標記化、規(guī)范化和依賴解析等。
情感分析算法通過讀入實體來理解用戶的情感。標記化是將一組單詞分成片段的過程,使其在語言上具有極強的語義征性。實體識別是模型需要查找的單詞類別,如產(chǎn)品名、用戶名或地址等。規(guī)范化是處理用戶輸入中常見錯誤的過程,它使系統(tǒng)不會因為用戶的誤輸入而誤導(dǎo)整個服務(wù)流程。依賴解析是在用戶輸入的文本中查找對象的主語、動詞、名詞和常用短語的過程,由此找到用戶意圖的依賴關(guān)系。綜上,NLP將自然語言翻譯成特定模式的文本組合,通過該組合來映射最優(yōu)答案。
四、結(jié)束語
本文討論了基于自然語言處理的電力客服系統(tǒng)的設(shè)計與實現(xiàn)方法。該系統(tǒng)從運維的實際需求出發(fā),以提供良好的服務(wù)為目的,將自然語言處理技術(shù)應(yīng)用于電力運維系統(tǒng)中客服問答系統(tǒng)的構(gòu)建。
實際中,電力客服系統(tǒng)為無限量的用戶提供大規(guī)模的實時連接并像人一樣與客戶交互,使客戶輕松獲得優(yōu)質(zhì)的服務(wù)和良好的體驗。企業(yè)通過該系統(tǒng)可以高效地完成自動運維工作,從而節(jié)約資源和成本,其經(jīng)濟效益顯著。
參? 考? 文? 獻
[1] Robert Wilensky, David N. Chin, Marc Luria, James Martin, James Mayfield, and Dekai Wu. The Berkeley Unix Consultant project.Computational Linguistics, 14(4), 1988.
[2] Lovis C Wagner J Griesser V Michel PA Scherrer JR. Baud RH, Rassinoux AM. Knowledge sources for natural language processing.Proc AMIA Annu Fall Symp, 70(4), 1996.
[3]初敏. 人機對話系統(tǒng)工程. 中國科協(xié)青年學(xué)術(shù)年會, 1998.
[4] Computing Machinery. Computing machinery and intelligence-am turing. Mind, 59(236):433, 1950.
[5] Buchanan B. G. and Heuristic DENDRAL. A program for generating expiator hypotheses in organic chemistry: Machine intelligence.Edinburgh: Edinburgh University Press, page 209, 1969.
[6] Lotfi A Zadeh. Fuzzy sets. In Fuzzy sets, fuzzy logic, and fuzzy systems: selected papers by Lotfi A Zadeh, pages 394–432. World Scientific, 1996.
[7]劉秀玉, 劉嶠, 王日見, 張少華. 一種基于模糊邏輯和神經(jīng)網(wǎng)絡(luò)的電力負荷預(yù)測方法. 上海大學(xué)學(xué)報(自然科學(xué)版), 2001(01).
[8]嚴華, 吳捷, 馬志強, 吳列鑫. 模糊集理論在電力系統(tǒng)短期負荷預(yù)測中的應(yīng). 電力系統(tǒng)自動化, 2000(11).
通信作者:盧致亮,(1985.6- ),男,漢,江西省南康,大學(xué)本科,工程師,主要研究方向為電子信息。