高建新 關(guān)禹 李俊杰 石超
摘要:傳統(tǒng)的會(huì)議模式已不能滿足用戶方便、高效的召開視頻會(huì)議的需求。文章提出建立優(yōu)化型智能會(huì)議系統(tǒng),系統(tǒng)由5大模塊組成,分別為人臉識(shí)別模塊、語(yǔ)音識(shí)別模塊、智能控制中樞、云計(jì)算平臺(tái)和會(huì)議平板。各模塊協(xié)調(diào)工作,實(shí)現(xiàn)會(huì)議簽到、攝像機(jī)自動(dòng)特寫、會(huì)議紀(jì)要生成等功能,以提高視頻會(huì)議的自動(dòng)化程度、便捷性、智能化,降低會(huì)議成本,有效解決用戶體驗(yàn)差等問(wèn)題。
關(guān)鍵詞:人工智能;優(yōu)化智能會(huì)議系統(tǒng);系統(tǒng)技術(shù)
中圖分類號(hào):TN948.63?文獻(xiàn)標(biāo)識(shí)碼:A?文章編號(hào):1672-9129(2020)10-0062-02
引言:現(xiàn)如今,國(guó)網(wǎng)視頻會(huì)議召開頻繁,2019年召開國(guó)網(wǎng)視頻會(huì)議近4萬(wàn)場(chǎng)。國(guó)網(wǎng)總部與網(wǎng)省電力公司之間聯(lián)系緊密,工作交流頻繁。會(huì)議規(guī)模不斷擴(kuò)大,隨之會(huì)議成本、會(huì)議系統(tǒng)的復(fù)雜度不斷提高。企業(yè)各部門的會(huì)議也多采用網(wǎng)絡(luò)視頻形式,但對(duì)網(wǎng)絡(luò)視頻會(huì)議的體驗(yàn)有諸多不滿,例如自主服務(wù)體驗(yàn)差、系統(tǒng)功能不夠人性化、音頻效果差等。實(shí)現(xiàn)完成網(wǎng)視頻會(huì)議的系統(tǒng)主要有視頻、音頻、中樞控制等部分。系統(tǒng)終端操作復(fù)雜,負(fù)責(zé)操作終端的工作人員往往需要長(zhǎng)期技術(shù)培訓(xùn)后才能夠正常完成工作。以往的視頻會(huì)議需要多個(gè)專業(yè)人員進(jìn)行電子設(shè)備管控,以保證會(huì)議正常進(jìn)行,效率低、用工成本高。
因此,傳統(tǒng)的會(huì)議模式已越來(lái)越不能滿足公司發(fā)展需求,亟需探索建立一種新的智能會(huì)議系統(tǒng)。本文結(jié)合目前人工智能的研究成果,提出一種智能會(huì)議系統(tǒng)技術(shù),來(lái)提高會(huì)議系統(tǒng)自動(dòng)化程度,提升用戶體驗(yàn)。
1?智能會(huì)議系統(tǒng)現(xiàn)狀
目前常見(jiàn)的智能會(huì)議系統(tǒng),其終端是電腦,具有原筆記簽到、終端設(shè)備桌面共享、無(wú)線投影、自動(dòng)生成會(huì)議紀(jì)要、參會(huì)人員信息交互、投票、資料分發(fā)等功能。智能會(huì)議系統(tǒng)具有自適應(yīng)性,會(huì)根據(jù)會(huì)議所在場(chǎng)地環(huán)境自動(dòng)調(diào)節(jié)系統(tǒng)模式,例如音頻接受,系統(tǒng)中有降噪模塊,會(huì)對(duì)非人類語(yǔ)言發(fā)出的聲音外的其他聲音音量減少或者消除,提高語(yǔ)音清晰度。智能會(huì)議系統(tǒng)與傳統(tǒng)視頻會(huì)議相比,可以提高視頻會(huì)議的效率、降低會(huì)議的經(jīng)濟(jì)成本與時(shí)間成本。
近年來(lái),智能手機(jī)的普及率不斷提高,走入人們的生活日常,越來(lái)越多會(huì)議的進(jìn)行選擇使用智能手機(jī)。微信軟件是每部智能手機(jī)上必備的一款軟件,這款軟件不僅方便親朋好友間的交流,更是方便了人們的日常工作。通常,一個(gè)團(tuán)隊(duì)的負(fù)責(zé)人會(huì)用微信建群,有什么工作通知會(huì)在群里發(fā)布,也常常會(huì)用微信群來(lái)召開視頻會(huì)議。參加會(huì)議的人員可以隨時(shí)隨地跟進(jìn)會(huì)議,掌握會(huì)議內(nèi)容。這種會(huì)議切實(shí)地提高工作效率,使得對(duì)人員的管理更加便捷。
2?智能會(huì)議系統(tǒng)技術(shù)
2.1系統(tǒng)總體技術(shù)架構(gòu)。優(yōu)化智能會(huì)議系統(tǒng)主要由 5 個(gè)模塊組成,分別是語(yǔ)音識(shí)別模塊、人臉識(shí)別模塊、智能控制模塊、云計(jì)算平臺(tái)模塊、智能控制模塊、會(huì)議平板,每個(gè)模塊子系統(tǒng)分別獨(dú)立完成相應(yīng)功能,各個(gè)子系統(tǒng)之間分工協(xié)作,共同實(shí)現(xiàn)智能輔助功能。
2.2技術(shù)原理。
(1)人臉識(shí)別模塊。
人臉識(shí)別模塊是負(fù)責(zé)整個(gè)系統(tǒng)的人臉圖像采集、人臉特征提取、人臉圖像識(shí)別與人臉圖像匹配工作。會(huì)議室門口的攝像機(jī)采集的參會(huì)者人臉畫面經(jīng)過(guò)視頻編碼后,送至人臉識(shí)別子系統(tǒng),對(duì)參會(huì)者進(jìn)行面部識(shí)別。會(huì)議過(guò)程中,通過(guò)會(huì)議攝像頭監(jiān)控與會(huì)者發(fā)言狀態(tài),廣播發(fā)言者特寫圖像。
人臉圖像采集是指將攝像頭拍攝到的圖像進(jìn)行預(yù)處理,標(biāo)注出圖像中人臉的大小與人臉位置。
人臉特征提取是指用數(shù)字化信息得出人臉中各個(gè)器官的形狀大小和各個(gè)器官間的位置關(guān)系信息。把這些數(shù)字化信息作為人臉?lè)诸惖奶卣饕罁?jù),人臉的特征分量為曲率、角度、歐式距離等。
人臉圖像識(shí)別與人臉圖像匹配的實(shí)現(xiàn)是根據(jù)人臉特征提取得到的特征數(shù)據(jù)信息與人臉特征數(shù)據(jù)庫(kù)中的信息進(jìn)行比對(duì)。設(shè)置一個(gè)最適的閥值,這個(gè)閥值可以使系統(tǒng)可以成功識(shí)別出人臉的概率最大。若識(shí)別結(jié)果的相似度大于所設(shè)閥值,就將匹配到的結(jié)果輸出。
(2)語(yǔ)音識(shí)別模塊。會(huì)議過(guò)程中,通過(guò)麥克風(fēng)采集錄制參會(huì)人員說(shuō)出的語(yǔ)音,語(yǔ)音信號(hào)經(jīng)編碼后送達(dá)語(yǔ)音識(shí)別子系統(tǒng),從而對(duì)語(yǔ)音信號(hào)進(jìn)行智能識(shí)別,將語(yǔ)音轉(zhuǎn)換成文字形式保存。
(3)智能控制模塊。智能控制子系統(tǒng),負(fù)責(zé)將語(yǔ)音識(shí)別出的命令轉(zhuǎn)換為會(huì)議系統(tǒng)自身可識(shí)別的一系列控制指令發(fā)送給相應(yīng)的設(shè)備。利用 API 接口進(jìn)行集中管理,實(shí)現(xiàn)有效實(shí)現(xiàn)有效屏蔽終端設(shè)備發(fā)出的控制指令。與傳統(tǒng)視頻會(huì)議系統(tǒng)相比,優(yōu)化型智能控制系統(tǒng)可以有效減少對(duì)會(huì)議系統(tǒng)運(yùn)作的人為干預(yù),降低操作難度。
(4)云計(jì)算平臺(tái)模塊。系統(tǒng)的語(yǔ)音識(shí)別與人臉識(shí)別的實(shí)現(xiàn)過(guò)程中,有龐大的數(shù)據(jù)信息需要處理,普通計(jì)算機(jī)是無(wú)法完成系統(tǒng)中的海量數(shù)據(jù)處理。因此,本文提出的系統(tǒng)選用云計(jì)算平臺(tái)來(lái)進(jìn)行對(duì)語(yǔ)音識(shí)別與人臉識(shí)別中的數(shù)據(jù)處理。云計(jì)算平臺(tái)具有極高的處理效率、準(zhǔn)確率,以實(shí)現(xiàn)系統(tǒng)的實(shí)時(shí)性。云計(jì)算平臺(tái)的運(yùn)行是由系統(tǒng)總公司統(tǒng)一分派數(shù)據(jù)信息,總公司與各分公司為云端,將需要處理的所有音視頻數(shù)據(jù)通過(guò) IP 網(wǎng)絡(luò)集中上傳至總公司,總公司對(duì)數(shù)據(jù)信息進(jìn)行處理,并及時(shí)將處理結(jié)果反饋給各分公司。云計(jì)算平臺(tái)具有龐大的信息儲(chǔ)備空間,除了可以對(duì)數(shù)據(jù)信息快速、高精確度的處理外,還可以將員工的各種信息數(shù)據(jù)儲(chǔ)存,以便于實(shí)時(shí)查詢、實(shí)時(shí)調(diào)取分析處理。
(5)會(huì)議平板。會(huì)議演示平板是最近會(huì)議室常用的一款集高清大屏顯示、多點(diǎn)觸控、電腦、電子白板、音響、網(wǎng)絡(luò)傳輸于一體的高科技多媒體產(chǎn)品,其采用超薄機(jī)身設(shè)計(jì),防炫光玻璃表面,支持超高分辨率顯示,觸控反應(yīng)速度靈敏,支持雙系統(tǒng)一體化和多屏互動(dòng),并可以配合云會(huì)議平臺(tái)實(shí)現(xiàn)召開電視會(huì)議功能。
個(gè)人會(huì)議平板,可取代紙質(zhì)會(huì)議材料,方便會(huì)議組織者及時(shí)將更新的會(huì)議資料發(fā)給參會(huì)者。另外還具有文檔批注及保存、投票、發(fā)送即時(shí)消息、請(qǐng)求服務(wù)等功能。
3?智能會(huì)議系統(tǒng)功能作用
3.1會(huì)議室準(zhǔn)入、會(huì)議簽到和面部檢測(cè)。利用人臉識(shí)別技術(shù),系統(tǒng)可以采集與會(huì)者的人臉信息,與預(yù)約時(shí)的信息比對(duì),一致時(shí),會(huì)議室門禁打開,并進(jìn)行會(huì)議簽到。防止會(huì)議室被未登記的人員占用,節(jié)省會(huì)議簽到時(shí)間。
在會(huì)議進(jìn)行中,系統(tǒng)能夠?qū)υ谥飨_(tái)發(fā)表講話的人的面部表情做實(shí)時(shí)檢測(cè)。當(dāng)系統(tǒng)檢測(cè)到要開始發(fā)言的參會(huì)者,系統(tǒng)中的智能控制模塊會(huì)將攝像頭調(diào)節(jié)至對(duì)準(zhǔn)要發(fā)言的人,對(duì)其特寫,并投射到屏幕和各個(gè)終端。提高智能會(huì)議系統(tǒng)自動(dòng)化,減少負(fù)責(zé)會(huì)議的工作人員的工作量。
3.2會(huì)議語(yǔ)音轉(zhuǎn)錄為文字。通過(guò)語(yǔ)言識(shí)別智能技術(shù),系統(tǒng)對(duì)會(huì)議音頻做實(shí)時(shí)檢測(cè)、記錄,及時(shí)記錄、生成會(huì)議紀(jì)要,有效降低文秘和參會(huì)人員的會(huì)議相關(guān)工作量。
3.3會(huì)議過(guò)程的靈活控制。在會(huì)議進(jìn)行中,系統(tǒng)通過(guò)麥克風(fēng)接收用戶在端口發(fā)出的語(yǔ)音指令,然后將接收到的指令上傳到云端到語(yǔ)音識(shí)別模塊。語(yǔ)音識(shí)別模塊把接收到的語(yǔ)音指令譯作系統(tǒng)可以識(shí)別的計(jì)算機(jī)代碼Command API,將Command API傳送至端口設(shè)備,端口設(shè)備接收到指令后,完成相應(yīng)的任務(wù),例如觀看會(huì)議、輪巡會(huì)場(chǎng)、點(diǎn)名發(fā)言、演示PPT等。
3.4會(huì)議平板應(yīng)用。會(huì)議平板可以連接傳屏器,實(shí)現(xiàn)無(wú)線投屏,以便捷地進(jìn)行會(huì)議內(nèi)容演示;支持會(huì)議演示平板反向觸控電腦,投屏后可直接由會(huì)議平板控制電腦進(jìn)行打開文件、ppt翻頁(yè)等操作,無(wú)需演講者來(lái)回切換設(shè)備;電子白板功能可以書寫、保存批注,與電視會(huì)議功能相結(jié)合,處于不同地點(diǎn)的終端可以在“同一屏幕”上進(jìn)行實(shí)時(shí)雙向協(xié)同,標(biāo)記、批注、繪圖、數(shù)據(jù)共享等。
個(gè)人會(huì)議平板,支持會(huì)議資料批量上傳、多人同步批注,讓會(huì)議進(jìn)程更加順心和高效;每個(gè)平板獨(dú)立顯示,資料隨時(shí)無(wú)線同屏共享;創(chuàng)新手勢(shì)控制,輕輕一劃,來(lái)回切換共享畫面和自己的畫面,讓會(huì)議更加靈活有趣;便捷呼叫服務(wù)功能,及時(shí)準(zhǔn)確地傳遞每位參會(huì)者的需求給會(huì)場(chǎng)服務(wù)員,提高服務(wù)效率;會(huì)議結(jié)束后可一鍵下載會(huì)議資料,刪除會(huì)議后自動(dòng)清空所有相關(guān)信息,不留痕跡,為重要會(huì)議保駕護(hù)航。
4?結(jié)語(yǔ)
本文在以往學(xué)者提出的智能會(huì)議系統(tǒng)和人工智能科技的基礎(chǔ)上,提出優(yōu)化型智能會(huì)議系統(tǒng)。優(yōu)化型會(huì)議系統(tǒng)具有人臉識(shí)別、語(yǔ)音識(shí)別、原跡簽字、自動(dòng)生成會(huì)議紀(jì)要等功能,有效地提高了會(huì)議效率,降低會(huì)議成本。系統(tǒng)相較于以往的視頻會(huì)議系統(tǒng),其自動(dòng)化程度大大提高,體驗(yàn)效果提升,便捷程度提升,從而將視頻會(huì)議系統(tǒng)運(yùn)行提升到全新水平。系統(tǒng)在各個(gè)模塊的設(shè)計(jì)、自動(dòng)化程度有待提高,例如自動(dòng)生成的會(huì)議紀(jì)要的有效性和準(zhǔn)確度,人臉識(shí)別的準(zhǔn)確率和識(shí)別速度等。
參考文獻(xiàn):
[1]劉曉東.智能會(huì)議系統(tǒng)在會(huì)議管理中的應(yīng)用及發(fā)展趨勢(shì)[J].建筑工程技術(shù)與設(shè)計(jì),2017,(15):3354.
[2]顧克明,顧程.智能會(huì)議系統(tǒng)的自適應(yīng)性[J].電聲技術(shù),2017,41(2):1-3,57.
[3]鄭廣寧,車四四,魏永靜等.基于人工智能的電視會(huì)議自主控制系統(tǒng)[J].電力信息與通信技術(shù) , 2018, 16(8): 72-76.
[4]馮嬌.基于阿米西棱鏡的高光譜成像系統(tǒng)研究[D].南京:南京郵電大學(xué),2015.