沙永兵 肖豐明 曹德勤 余偉 劉小軍
為滿足集控中心和調(diào)控電廠發(fā)展需求,保證電廠生產(chǎn)的安全性,現(xiàn)設(shè)計一款功能完善、實用性強的智能調(diào)度平臺。在該平臺中,主要用到以下四種關(guān)鍵技術(shù),分別是人臉識別、語音智控、智能機器人和智能告警。本文結(jié)合智能調(diào)度平臺,重點研究和實現(xiàn)該平臺四大人工智能技術(shù)。希望通過這次研究,為相關(guān)人員提供有效的借鑒和參考。
通過運用人臉識別、語音智控、智能機器人和智能告警等多種人工智能技術(shù),完成對智能調(diào)度平臺的設(shè)計,不僅可以實現(xiàn)集控中心現(xiàn)有生產(chǎn)模式的改革和創(chuàng)新,還能促使電力調(diào)度過程管理變得更加智能化、高效化,有效地提高調(diào)控電場運維操作的可靠性和安全性,促使智能調(diào)度平臺能夠正常、穩(wěn)定、安全地運行。在設(shè)計智能調(diào)度平臺期間,加強對以上幾種人工智能技術(shù)的研究顯得尤為重要。
采集終端設(shè)備包括平板、PC所收錄的語音數(shù)據(jù)上傳至聲紋庫,再根據(jù)提取的說話人聲音特征和說話內(nèi)容信息,對比聲紋庫自動核驗說話人身份,達到精準(zhǔn)的聲紋識別要求?;谝勋@授權(quán)輸入的圖片中人像破綻及成像畸形,可有效識別目標(biāo)是否為活體,并給出置信度參考,通過提取兩張人臉的特征進行相似度對比,最終返回相應(yīng)的置信度得分,系統(tǒng)根據(jù)特征匹配程度決定“拒絕”或者“接受”。用于判斷兩個輸入人臉是否屬于同一人,用于系統(tǒng)身份識別登錄及指令發(fā)布權(quán)限的核實。提供服務(wù)調(diào)用接口,提供聲紋識別和人臉識別標(biāo)準(zhǔn)調(diào)用接口,給需要調(diào)用的系統(tǒng)調(diào)用。
(一)客戶端設(shè)計
通過運用客戶端,可以采集用戶或錄音語音輸入發(fā)送到服務(wù)端進行轉(zhuǎn)寫和語義解析,同時根據(jù)語義解析結(jié)果執(zhí)行指令,控制終端設(shè)備顯示和語音播報。客戶端支持Windows和Android操作系統(tǒng),支持PC、數(shù)字大屏、一體機、機器人等終端設(shè)備。客戶端設(shè)計采用如下方式進行:
通過自然語言交互方式實現(xiàn)常用對應(yīng)用軟件的操控,如PPT、Word等文件的打開,并其內(nèi)容展示進行操控。如:用戶說“打開訊飛語音智控系統(tǒng)白皮書,詳細(xì)版”,接著用戶可以通過語音進行上下翻頁,或者跳轉(zhuǎn)到第N頁,甚至用戶可以說“幫我打開系統(tǒng)架構(gòu)”,該Word文件即會自動跳轉(zhuǎn)到該頁。
通過語音控制音視頻文件播放,用戶說“音頻播放”,會聽到“請選擇您要播放的音頻”,同時看到可供選擇的音頻列表,通過語音交互方式選擇即可播放。視頻播放支持同樣交互方式。用戶也可以直接說出“播放展館介紹”,即可播放對應(yīng)音頻或者視頻。
(二)服務(wù)端設(shè)計
智控內(nèi)容即智控方案管理。針對不同的智控對象可設(shè)置不同智控方案。
(1)網(wǎng)頁智控方案。通過運用該方案,對Web應(yīng)用系統(tǒng)進行演示操作。具體操作步驟如下:首先,直接配置網(wǎng)頁操控指令,即接收并識別用戶語音后執(zhí)行的操控指令,如頁面跳轉(zhuǎn)、按鈕點擊等操作。其次,配置錄音播報場景,既針對某個業(yè)務(wù)場景,實現(xiàn)全自動化演示與操作,無需人工參與:上傳真人錄音或者錄入講解內(nèi)容合成錄音,在客戶端語音控制播放該錄音,系統(tǒng)即可識別、解析并執(zhí)行錄音中相關(guān)操控指令,充分釋放人力。
(2)軟件智控方案。軟件智控方案主要是指應(yīng)用軟件內(nèi)容操控,如打開PPT、Word等文件,對PPT、Word文件進行上下翻頁、跳轉(zhuǎn)到指定頁(如用戶說“回到第8頁”)、調(diào)轉(zhuǎn)到指定內(nèi)容頁(如用戶說“打開系統(tǒng)架構(gòu)”),其中上下翻頁、跳轉(zhuǎn)到指定頁指令在“通用指令管理”中已配置,這里無需重復(fù)配置。
在設(shè)計智能調(diào)度平臺時,重點應(yīng)用智能機器人技術(shù),通過應(yīng)用該技術(shù),可以完成對智能服務(wù)器機器人的設(shè)計,該機器人主要由主控板、工控機、底盤控制板、IMU、激光掃描儀、華為TD-無線數(shù)據(jù)終端、語音識別模塊、表情顯示器、業(yè)務(wù)辦理顯示器、人臉識別模塊、3D攝像頭、手臂控制板、手指控制等模塊組成。
該機器人主要包含以下功能。(1)行走播報。支持設(shè)定特定時間端,按照既定路線行走,當(dāng)遇到人員時,會提醒讓行,機器人可以一邊行走,一邊播報預(yù)定內(nèi)容,同時支持智能打斷播報內(nèi)容。(2)定點講解。語音或者屏幕觸發(fā)機器人按照既定路線或者單點講解,到達指定地點,播放既定內(nèi)容(語音/圖片/視頻),可設(shè)計機器人在指定地點等待時長。同時可以讓機器人做相關(guān)動作(按照系統(tǒng)內(nèi)置動作組選擇)。(3)定制對話。本地?zé)o限量QA對話輸入,可以滿足對話內(nèi)容輕松錄入和編輯,快速響應(yīng);支持通過語音輸入控制大屏數(shù)據(jù)頁面切換,頁面切換順滑,數(shù)據(jù)能夠聯(lián)動刷新。(4)遠程監(jiān)控。Android手機或者PAD端可以通過網(wǎng)絡(luò)遠程監(jiān)控,通過機器人頭部攝像頭到現(xiàn)場情況進行監(jiān)控巡邏。(5)自動充電。機器人可根據(jù)指令或者電量情況,自行充電。(6)人臉識別。支持2000人本地人臉識別,本地錄入人臉,編輯識別后,問候內(nèi)容。在待機界面中,只要錄入人臉人員經(jīng)過就可以主動問候。(7)主動迎賓。設(shè)置機器人歡迎詞,當(dāng)機器人待機狀態(tài),只要有人進入1.5米內(nèi),就會迎賓問候,同步也有人臉識別打開,按設(shè)置內(nèi)容主動問候。問候結(jié)束彈出對話框交流。(8)編程。Android手機或者PAD端可以編程控制機器人做動作、表情、視頻和語音,起到表演的作用。
在設(shè)計智能調(diào)度平臺時,通過應(yīng)用智能告警技術(shù),可以將語音助手、應(yīng)急平臺故障分析和話務(wù)系統(tǒng)深度集成,保證平臺多樣化告警提醒功能實現(xiàn)效果。該平臺具體設(shè)計步驟如下:
(1)智能話務(wù)平臺對接報警分級系統(tǒng)。智慧告警平臺提供接口,可以實時接收水電系統(tǒng)發(fā)送的故障信息,故障信息包括故障類型、故障時間、故障內(nèi)容等信息。智慧告警平臺與報警分級系統(tǒng)通過接口進行對接,智慧告警平臺接收到告警信息后,可以根據(jù)故障信息從數(shù)據(jù)庫中檢索關(guān)聯(lián)的人員列表,如果檢索失敗或者未設(shè)置關(guān)聯(lián)人員,則可以關(guān)聯(lián)系統(tǒng)設(shè)置的緊急處理人員。
(2)對接語音合成引擎。智慧告警平臺將文本告警信息通調(diào)用語音合成引擎轉(zhuǎn)換成語音,通過智能話務(wù)平臺撥打給告警處理人員并進行告警信息播報。
(3)對接實體機器人或者現(xiàn)場播音設(shè)備,實現(xiàn)告警內(nèi)容播報。智慧告警平臺在接收到告警信息時調(diào)用語音合成引擎,通過實體機器人或現(xiàn)場播音設(shè)備,將預(yù)警內(nèi)容合成語音信息進行播報。
(4)當(dāng)發(fā)生故障時,系統(tǒng)自動識別當(dāng)前故障關(guān)聯(lián)的人員,獲取人員電話號碼,并打通相關(guān)人員調(diào)度電話,對告警信息進行播報。
在人工智能技術(shù)的應(yīng)用背景下,為促使智能調(diào)度平臺向智能化、高效化、數(shù)字化方向不斷發(fā)展,技術(shù)人員要重視對人臉識別、語音智控、智能機器人和智能告警四大關(guān)鍵技術(shù)的運用,通過運用以上技術(shù),不僅可以保證調(diào)度指揮的智能性和便捷性,還能提高調(diào)控電廠生產(chǎn)的安全性和可靠性,為確保智能調(diào)度平臺在集控模式下能夠穩(wěn)定、高效地運行提供重要的技術(shù)支持。
作者單位:五凌電力有限公司