卓翔+鄭巧彬+林漢平
摘要:隨著電力行業(yè)的不斷發(fā)展,人們需求的層次不斷提升,服務在電力營銷中扮演著越來越重要的角色。本文主要介紹了以語音交互技術結合觸摸屏交互技術為基礎的人機交互技術在電力營業(yè)廳中的應用。
關鍵詞:語音識別;語義理解;觸摸屏交互
近來社會經(jīng)濟的不斷發(fā)展,對于電力的需求與日俱增,這在一定程度上推動了電力企業(yè)的發(fā)展,也在一定程度上加劇了電力行業(yè)的競爭。為了提高電力企業(yè)的競爭力,提升服務品質來完善營銷策略是一條有效途徑。以人機交互技術為基礎的服務機器人出現(xiàn)在營業(yè)大廳,協(xié)助營業(yè)人員完成客戶對電力業(yè)務的咨詢和辦理,可以有效提升用戶的服務體驗,改善了大堂經(jīng)理的日常工作模式,實現(xiàn)了營業(yè)廳智能化的改造與建設,是電力服務自我革新、拓展電力服務空間的舉措之一。
隨著現(xiàn)代科學和計算機技術的發(fā)展,人們在與機器的信息交流中,需要一張更加方便、自然的方式。而語言是人類最重要的、最有效的、最常用的和最方便的通信形式[1]。因此,語音作為一種普遍的人機交互接口,被廣泛應用于人機交互系統(tǒng)中。目前大多數(shù)車載導航系統(tǒng)、服務機器人、教育機器人等都具備基本的語音交互功能,影視作品中的幾乎所有機器人都有此功能,可見人類對可以同一個機器進行語音交流的渴望。語音交互可分為以下四個步驟,分別是語音識別、語義理解、語義答復以及語音合成。
語音識別。語音識別系統(tǒng)根據(jù)一個較大詞庫,將用戶的一句話拆分成零散的詞語,依次識別各個詞語。對于不同的場景需要建立不同的熱詞庫,以電力營業(yè)廳為例,大部分電力業(yè)務涉及到詞語都為生僻詞,如果提前創(chuàng)建一個電力業(yè)務熱詞庫,讓搜索引擎先去搜索熱詞庫,再去搜索公共詞庫,可以加速引擎對用戶命令詞的匹配,提高語音識別效率。
語義理解。語義理解的總體流程是用戶用自然語音給出一段話,通過語音識別系統(tǒng),將語言轉換為文字,通過語義理解先對句子進行分詞,得到一系列詞組,然后利用詞庫提取關鍵詞并且推出特征值[2]。例如“今天福州的天氣如何”,首先需要一個分詞庫,對句子進行分詞處理,如果不進行分詞處理,機器很難讀懂“天”、“氣”那個字和在一起是什么意思,分詞之后,可以將這句話拆分成:今天 福州 天氣 如何。然后進行關鍵詞的提取和特征值的對應,例如關鍵詞“今天”代表的特征是日期,“福州”代表的特征是地點,“天氣”代表的特征是應用場景。接下來,可以根據(jù)這些語義結果的得出的特征值進行語義答復等處理。
語義答復。此環(huán)節(jié)的關鍵在于上一步語義理解的結果是否正確,如果正確,再對特征值進行判斷、分類。首先是場景分類,如“天氣”、“時間”、“業(yè)務”等,根據(jù)用戶不同的語言,首先定位到相應的場景,在根據(jù)不同場景的特征值進行相應的答復。例如“今天福州天氣如何”這句話,先定位到天氣場景,此場景可以設置兩個特征值:時間、地點。如果一句話的關鍵詞不足,則可以給予應答,讓用戶給出另一特征值。例如“今天天氣如何”或“福州天氣如何”,可以應答“請問你想知道今天哪里的天氣”或“請問您想知道福州哪一天的天氣”。如果此場景特征值滿足條件,即可向云端天氣查詢接口訪問數(shù)據(jù),給出當天實時的天氣數(shù)據(jù)。
語音合成。語音合成的基本結構可分為語言學處理、韻律處理和聲學處理三大模塊[3]。首先要根據(jù)聲學原理提前將全部漢字的聲母和韻母進行錄音,存放在數(shù)據(jù)庫當中。接著對要回答的文字進行語言學處理,拆分成聲母和韻母之后,對應到數(shù)據(jù)庫中的音頻數(shù)據(jù)。再對要回答文字進行情感判斷,這一步可以在語義理解中進行。判斷出文字的感情后,對回答的文字進行處理,例如“開心”的情感可以進行升調(diào),“難過”的情感可以進行降調(diào)。這樣即完成了文本到語音的轉換過程。
觸摸屏交互。在人機交互系統(tǒng)中,還有一種常見交互手段便是觸摸屏交互,可以發(fā)現(xiàn)目前市場上大部分手機都是使用觸摸屏交互,可見該項交互手段的實用價值。對于電力營業(yè)廳的業(yè)務咨詢,如果采用語音交互與觸摸屏交互的結合,可以更好引導用戶進行交互。例如用戶問“我想要裝電表”,通過語音交互技術給予用戶回答“請問你想咨詢新裝電表業(yè)務的哪些內(nèi)容”,接著在屏幕上給出該業(yè)務內(nèi)容的子選項“申請材料”、“辦理流程”、“相關費用”等,可供用戶觸屏點擊查詢。兩種交互手段的結合,能更好提升交互效率。整體的交互流程如圖1所示。
人機交互技術目前發(fā)展火熱,應用前景也是無限的,隨著互聯(lián)網(wǎng)的信息爆炸性增長,該技術將為經(jīng)濟管理、醫(yī)藥衛(wèi)生、電子銷售、網(wǎng)絡等領域提供極大的便利。如何將該技術應用到各個領域的實踐中去也是人們需要思考和探索的一個方向。
參考文獻:
[1] 何湘智.語音識別的研究與發(fā)展[J].計算機與現(xiàn)代化,2002(3):3-6.
[2] 陳林,楊丹,趙俊芹.基于語義理解的智能搜索引擎研究[J].計算機科學,2008,35(6):152-154.
[3] 黃南川,鄧振杰,王嵬嵬,等.語音合成技術的研究與發(fā)展[J].北華航天工業(yè)學院學報,2002,12(3):37-39.endprint