智能調(diào)度平臺中的人工智能技術(shù)研究

2023-10-30 02:28:13沙永兵肖豐明曹德勤余偉劉小軍

中國信息化 2023年9期

沙永兵肖豐明曹德勤余偉劉小軍

為滿足集控中心和調(diào)控電廠發(fā)展需求，保證電廠生產(chǎn)的安全性，現(xiàn)設(shè)計一款功能完善、實用性強的智能調(diào)度平臺。在該平臺中，主要用到以下四種關(guān)鍵技術(shù)，分別是人臉識別、語音智控、智能機器人和智能告警。本文結(jié)合智能調(diào)度平臺，重點研究和實現(xiàn)該平臺四大人工智能技術(shù)。希望通過這次研究，為相關(guān)人員提供有效的借鑒和參考。

通過運用人臉識別、語音智控、智能機器人和智能告警等多種人工智能技術(shù)，完成對智能調(diào)度平臺的設(shè)計，不僅可以實現(xiàn)集控中心現(xiàn)有生產(chǎn)模式的改革和創(chuàng)新，還能促使電力調(diào)度過程管理變得更加智能化、高效化，有效地提高調(diào)控電場運維操作的可靠性和安全性，促使智能調(diào)度平臺能夠正常、穩(wěn)定、安全地運行。在設(shè)計智能調(diào)度平臺期間，加強對以上幾種人工智能技術(shù)的研究顯得尤為重要。

采集終端設(shè)備包括平板、PC所收錄的語音數(shù)據(jù)上傳至聲紋庫，再根據(jù)提取的說話人聲音特征和說話內(nèi)容信息，對比聲紋庫自動核驗說話人身份，達到精準(zhǔn)的聲紋識別要求?；谝勋@授權(quán)輸入的圖片中人像破綻及成像畸形，可有效識別目標(biāo)是否為活體，并給出置信度參考，通過提取兩張人臉的特征進行相似度對比，最終返回相應(yīng)的置信度得分，系統(tǒng)根據(jù)特征匹配程度決定“拒絕”或者“接受”。用于判斷兩個輸入人臉是否屬于同一人，用于系統(tǒng)身份識別登錄及指令發(fā)布權(quán)限的核實。提供服務(wù)調(diào)用接口，提供聲紋識別和人臉識別標(biāo)準(zhǔn)調(diào)用接口，給需要調(diào)用的系統(tǒng)調(diào)用。

（一）客戶端設(shè)計

通過運用客戶端，可以采集用戶或錄音語音輸入發(fā)送到服務(wù)端進行轉(zhuǎn)寫和語義解析，同時根據(jù)語義解析結(jié)果執(zhí)行指令，控制終端設(shè)備顯示和語音播報。客戶端支持Windows和Android操作系統(tǒng)，支持PC、數(shù)字大屏、一體機、機器人等終端設(shè)備。客戶端設(shè)計采用如下方式進行：

通過自然語言交互方式實現(xiàn)常用對應(yīng)用軟件的操控，如PPT、Word等文件的打開，并其內(nèi)容展示進行操控。如：用戶說“打開訊飛語音智控系統(tǒng)白皮書，詳細(xì)版”，接著用戶可以通過語音進行上下翻頁，或者跳轉(zhuǎn)到第N頁，甚至用戶可以說“幫我打開系統(tǒng)架構(gòu)”，該Word文件即會自動跳轉(zhuǎn)到該頁。

通過語音控制音視頻文件播放，用戶說“音頻播放”，會聽到“請選擇您要播放的音頻”，同時看到可供選擇的音頻列表，通過語音交互方式選擇即可播放。視頻播放支持同樣交互方式。用戶也可以直接說出“播放展館介紹”，即可播放對應(yīng)音頻或者視頻。

（二）服務(wù)端設(shè)計

智控內(nèi)容即智控方案管理。針對不同的智控對象可設(shè)置不同智控方案。

（1）網(wǎng)頁智控方案。通過運用該方案，對Web應(yīng)用系統(tǒng)進行演示操作。具體操作步驟如下：首先，直接配置網(wǎng)頁操控指令，即接收并識別用戶語音后執(zhí)行的操控指令，如頁面跳轉(zhuǎn)、按鈕點擊等操作。其次，配置錄音播報場景，既針對某個業(yè)務(wù)場景，實現(xiàn)全自動化演示與操作，無需人工參與：上傳真人錄音或者錄入講解內(nèi)容合成錄音，在客戶端語音控制播放該錄音，系統(tǒng)即可識別、解析并執(zhí)行錄音中相關(guān)操控指令，充分釋放人力。

（2）軟件智控方案。軟件智控方案主要是指應(yīng)用軟件內(nèi)容操控，如打開PPT、Word等文件，對PPT、Word文件進行上下翻頁、跳轉(zhuǎn)到指定頁（如用戶說“回到第8頁”）、調(diào)轉(zhuǎn)到指定內(nèi)容頁（如用戶說“打開系統(tǒng)架構(gòu)”），其中上下翻頁、跳轉(zhuǎn)到指定頁指令在“通用指令管理”中已配置，這里無需重復(fù)配置。

在設(shè)計智能調(diào)度平臺時，重點應(yīng)用智能機器人技術(shù)，通過應(yīng)用該技術(shù)，可以完成對智能服務(wù)器機器人的設(shè)計，該機器人主要由主控板、工控機、底盤控制板、IMU、激光掃描儀、華為TD-無線數(shù)據(jù)終端、語音識別模塊、表情顯示器、業(yè)務(wù)辦理顯示器、人臉識別模塊、3D攝像頭、手臂控制板、手指控制等模塊組成。

該機器人主要包含以下功能。（1）行走播報。支持設(shè)定特定時間端，按照既定路線行走，當(dāng)遇到人員時，會提醒讓行，機器人可以一邊行走，一邊播報預(yù)定內(nèi)容，同時支持智能打斷播報內(nèi)容。（2）定點講解。語音或者屏幕觸發(fā)機器人按照既定路線或者單點講解，到達指定地點，播放既定內(nèi)容（語音/圖片/視頻），可設(shè)計機器人在指定地點等待時長。同時可以讓機器人做相關(guān)動作（按照系統(tǒng)內(nèi)置動作組選擇）。（3）定制對話。本地?zé)o限量QA對話輸入，可以滿足對話內(nèi)容輕松錄入和編輯，快速響應(yīng)；支持通過語音輸入控制大屏數(shù)據(jù)頁面切換，頁面切換順滑，數(shù)據(jù)能夠聯(lián)動刷新。（4）遠程監(jiān)控。Android手機或者PAD端可以通過網(wǎng)絡(luò)遠程監(jiān)控，通過機器人頭部攝像頭到現(xiàn)場情況進行監(jiān)控巡邏。（5）自動充電。機器人可根據(jù)指令或者電量情況，自行充電。（6）人臉識別。支持2000人本地人臉識別，本地錄入人臉，編輯識別后，問候內(nèi)容。在待機界面中，只要錄入人臉人員經(jīng)過就可以主動問候。（7）主動迎賓。設(shè)置機器人歡迎詞，當(dāng)機器人待機狀態(tài)，只要有人進入1.5米內(nèi)，就會迎賓問候，同步也有人臉識別打開，按設(shè)置內(nèi)容主動問候。問候結(jié)束彈出對話框交流。（8）編程。Android手機或者PAD端可以編程控制機器人做動作、表情、視頻和語音，起到表演的作用。

在設(shè)計智能調(diào)度平臺時，通過應(yīng)用智能告警技術(shù)，可以將語音助手、應(yīng)急平臺故障分析和話務(wù)系統(tǒng)深度集成，保證平臺多樣化告警提醒功能實現(xiàn)效果。該平臺具體設(shè)計步驟如下：

（1）智能話務(wù)平臺對接報警分級系統(tǒng)。智慧告警平臺提供接口，可以實時接收水電系統(tǒng)發(fā)送的故障信息，故障信息包括故障類型、故障時間、故障內(nèi)容等信息。智慧告警平臺與報警分級系統(tǒng)通過接口進行對接，智慧告警平臺接收到告警信息后，可以根據(jù)故障信息從數(shù)據(jù)庫中檢索關(guān)聯(lián)的人員列表，如果檢索失敗或者未設(shè)置關(guān)聯(lián)人員，則可以關(guān)聯(lián)系統(tǒng)設(shè)置的緊急處理人員。

（2）對接語音合成引擎。智慧告警平臺將文本告警信息通調(diào)用語音合成引擎轉(zhuǎn)換成語音，通過智能話務(wù)平臺撥打給告警處理人員并進行告警信息播報。

（3）對接實體機器人或者現(xiàn)場播音設(shè)備，實現(xiàn)告警內(nèi)容播報。智慧告警平臺在接收到告警信息時調(diào)用語音合成引擎，通過實體機器人或現(xiàn)場播音設(shè)備，將預(yù)警內(nèi)容合成語音信息進行播報。

（4）當(dāng)發(fā)生故障時，系統(tǒng)自動識別當(dāng)前故障關(guān)聯(lián)的人員，獲取人員電話號碼，并打通相關(guān)人員調(diào)度電話，對告警信息進行播報。

在人工智能技術(shù)的應(yīng)用背景下，為促使智能調(diào)度平臺向智能化、高效化、數(shù)字化方向不斷發(fā)展，技術(shù)人員要重視對人臉識別、語音智控、智能機器人和智能告警四大關(guān)鍵技術(shù)的運用，通過運用以上技術(shù)，不僅可以保證調(diào)度指揮的智能性和便捷性，還能提高調(diào)控電廠生產(chǎn)的安全性和可靠性，為確保智能調(diào)度平臺在集控模式下能夠穩(wěn)定、高效地運行提供重要的技術(shù)支持。

作者單位：五凌電力有限公司

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

智能調(diào)度平臺中的人工智能技術(shù)研究