国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺析改進智能語音控制系統(tǒng)的方法

2018-03-21 00:47:15劉明輝
數(shù)字通信世界 2018年5期
關(guān)鍵詞:終端設(shè)備語句指令

劉明輝,徐 莉

(天津三星通信技術(shù)研究有限公司,天津 300385)

傳統(tǒng)的人機交互是通過觸覺來實現(xiàn)對機器的操作和控制,但是這種操作方式有很大的弊端。操作不方便,費時,尤其是針對視覺障礙的人士來說更加困難。隨著社會節(jié)奏的不斷加快,人們希望使用一種更加便捷的方式來替代觸覺對機器的操控。在這種大背景下智能語音系統(tǒng)的出現(xiàn)體現(xiàn)了其優(yōu)勢,越來越多的智能設(shè)備采用了這種智能語音的技術(shù)來實現(xiàn)操控。智能語音控制系統(tǒng)大體分為兩個部分:語音合成系統(tǒng)和語音識別系統(tǒng)。

1 語音控制系統(tǒng)介紹

1.1 語音合成系統(tǒng)介紹

語音合成(Text To Speech)是通過機械的、電子的方法產(chǎn)生人造語音的技術(shù)。傳統(tǒng)工業(yè)領(lǐng)域使用的語音控制方式是通過可編程控制器plc控制數(shù)碼語音芯片,從而實現(xiàn)語音的分段錄音,組合回放。通過軟件的修改實現(xiàn)長段錄音,循環(huán)播放等功能,從而實現(xiàn)在工業(yè)控制方面的語音合成與解析。這種語音系統(tǒng),廣泛應(yīng)用于電腦語音中,語音型數(shù)字萬用表,排隊機,以及公共汽車報站等領(lǐng)域[1]。

傳統(tǒng)的語音合成系統(tǒng),存儲空間較小,其合成詞語受限,只能合成有限的詞語句子,應(yīng)用的場景非常有限;其次,由于語音控制芯片參差不齊,其語音合成效率不高,合成效果差。除此之外,還需要通過算法來優(yōu)化語音合成效果。改進的以服務(wù)器為核心的語音合成系統(tǒng),由于其擁有存儲容量大,可實現(xiàn)cpu多核處理和處理速度快等優(yōu)勢,可直接錄制真人語音樣本用于語音播放,不需要算法合成,效率高,質(zhì)量好。并且可以根據(jù)用途,提前錄制語音反饋樣本,極大的擴展了語音控制系統(tǒng)的應(yīng)用范圍。

1.2 語音識別系統(tǒng)介紹

語音識別,也被稱為自動語音識別(Automatic Speech Recognition,ASR)技術(shù),就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù),也就是讓機器聽懂人類的語音。由于語音信號的多樣性和復(fù)雜性,傳統(tǒng)的語音識別系統(tǒng)只能在一定的限制條件下獲得滿意的性能,或者說只能應(yīng)用于某些特定的場合[2]。比如目前的語音識別系統(tǒng),僅對單一指令識別效果較好,對一條語音中包含兩條以上指令的語句,系統(tǒng)無法準確解析并執(zhí)行用戶指令。改進的以服務(wù)器為核心的語音識別系統(tǒng),可以對復(fù)雜的語音指令識別,通過RU標準語句,和RSU標準生成子語句,分別對系統(tǒng)進行訓練,簡單來說,RU語句就是非常準確的標準的精簡的語句指令,要求用戶精準發(fā)出指令,這種指令由于覆蓋精準,語料集小,所以處理速度快,效率高,但是對用戶發(fā)出指令的要求高,而RSU則是研究人員根據(jù)RU指令,對標準語句進行擴展,使服務(wù)器能夠解析口語化的指令,由于語料集的擴大,從而更能提高理解用戶指令的質(zhì)量。通過這兩種方法對模型進行訓練,可以既保證識別速度,又可以對口語化的指令進行精準識別,達到正確識別用戶語義的效果。

2 改進的語音控制系統(tǒng)

2.1 系統(tǒng)組成

該系統(tǒng)由終端設(shè)備模塊,語音分析模塊,服務(wù)器以及服務(wù)器數(shù)據(jù)庫組成。用戶通過手持設(shè)備和終端進行語音輸入。手持設(shè)備和終端對用戶輸入的語音進行信號轉(zhuǎn)換然后將解析的語音信號發(fā)送給服務(wù)器,服務(wù)器內(nèi)預(yù)置了提前訓練的匹配規(guī)則,這種匹配規(guī)則是研究人員通過大量的市場調(diào)查制定的規(guī)則,然后接收到的語音信號與預(yù)先預(yù)制規(guī)則進行匹配,當匹配準確度達到預(yù)先設(shè)定的一個閾值時。服務(wù)器即把此規(guī)則認為成用戶發(fā)送的指令。然后在服務(wù)器中的數(shù)據(jù)庫找到相應(yīng)規(guī)則的實現(xiàn)指令。然后將這個實現(xiàn)指令逐條的發(fā)送給手持設(shè)備終端。手持設(shè)備終端根據(jù)發(fā)送的指令進行執(zhí)行。執(zhí)行完后,再將結(jié)果反饋給服務(wù)器,服務(wù)器根據(jù)反饋結(jié)果下發(fā)第二條指令或終止指令。

2.2 系統(tǒng)實現(xiàn)過程

終端設(shè)備可以是手機,筆記本電腦和其他手持終端設(shè)備。用戶可以通過此終端設(shè)備進行語音控制。同時根據(jù)數(shù)據(jù)庫下發(fā)的指令。實現(xiàn)用戶語音控制的目的。

語音分析模塊,此模塊的功能主要是把輸入的語音分解成一定的語音規(guī)則。此規(guī)則,我們根據(jù)詞語的重要程度進行劃分。增大有意義的實詞的比例,刪除沒有意義的虛詞。然后將解析好的語句上傳給服務(wù)器。

服務(wù)器端,提前根據(jù)研究員制訂的一系列常用的匹配規(guī)則進行訓練。而數(shù)據(jù)庫中存放的是這些規(guī)則對應(yīng)的執(zhí)行指令。一條規(guī)則會對應(yīng)多條執(zhí)行指令來完成這個功能。服務(wù)器接收到語音分析模塊上傳的語音。解析的結(jié)果和服務(wù)器中的規(guī)則進行匹配。當匹配到某一個規(guī)則后。服務(wù)器從數(shù)據(jù)庫中找到相應(yīng)的執(zhí)行指令通過json文件下發(fā)給終端設(shè)備。

數(shù)據(jù)庫將指令下發(fā)給終端設(shè)備。設(shè)備實行完指令后,如果成功執(zhí)行,則將成功碼反饋給服務(wù)器,然后服務(wù)器在進行第二條執(zhí)行指令的下發(fā),直到完成最終的指令。如果終端正確執(zhí)行指令,則服務(wù)器收到完成指令后下發(fā)完成語音。終端將完成語音廣播出去。如果終端沒有正確執(zhí)行,則將錯誤碼反饋給服務(wù)器。服務(wù)器根據(jù)反饋的錯誤碼下發(fā)預(yù)制的語音數(shù)據(jù)給終端設(shè)備。

3 結(jié)束語

綜上所述,以服務(wù)器為核心的語音控制系統(tǒng)由于使用服務(wù)器進行語音的處理和合成,所以,可以有效的改善提高語音合成的效率和合成音質(zhì),避免了傳統(tǒng)語音控制系統(tǒng)的合成詞匯有限的弊端。此外,隨著相關(guān)研究人員在這一方面的工作經(jīng)驗的不斷豐富,手持終端設(shè)備的不斷的多樣化,這種語音控制系統(tǒng)語音識別和合成的效果會大大優(yōu)化,語音控制的效率和準確度能夠大幅度提高,并廣泛的應(yīng)用于工作和生活中。

[1] 范會敏,何鑫.中文語音合成系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機系統(tǒng)應(yīng)用,2017,(02):73-77.

[2] 張仕良.基于深度神經(jīng)網(wǎng)絡(luò)的語音識別模型研究[D].中國科學技術(shù)大學,2017.

猜你喜歡
終端設(shè)備語句指令
聽我指令:大催眠術(shù)
重點:語句銜接
視頻監(jiān)視系統(tǒng)新型終端設(shè)備接入方案
ARINC661顯控指令快速驗證方法
LED照明產(chǎn)品歐盟ErP指令要求解讀
電子測試(2018年18期)2018-11-14 02:30:34
精彩語句
配電自動化終端設(shè)備在電力配網(wǎng)自動化的應(yīng)用
電子制作(2016年15期)2017-01-15 13:39:12
車站信號系統(tǒng)終端設(shè)備整合及解決方案
如何搞定語句銜接題
語文知識(2014年4期)2014-02-28 21:59:52
坐標系旋轉(zhuǎn)指令數(shù)控編程應(yīng)用
機電信息(2014年27期)2014-02-27 15:53:56
正宁县| 安阳县| 灵寿县| 临江市| 静乐县| 浏阳市| 安平县| 昌邑市| 武山县| 四平市| 玉山县| 从江县| 马公市| 滨海县| 灵璧县| 溆浦县| 绥江县| 西畴县| 错那县| 冕宁县| 南漳县| 绍兴市| 娱乐| 康乐县| 彭山县| 临湘市| 泰州市| 阿拉善盟| 丰镇市| 东光县| 德保县| 镇宁| 临沭县| 银川市| 孝感市| 蓬溪县| 武邑县| 竹山县| 德昌县| 衡山县| 肇源县|