国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的架構(gòu)設(shè)計(jì)

2018-12-31 05:42:38劉敏
移動(dòng)信息 2018年9期
關(guān)鍵詞:架構(gòu)設(shè)計(jì)語(yǔ)音模板

劉敏

計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的架構(gòu)設(shè)計(jì)

劉敏

山東勝軟科技股份有限公司,山東 東營(yíng) 257000

近些年,隨著計(jì)算機(jī)技術(shù)的普及,計(jì)算機(jī)產(chǎn)品已成為人們工作生活中不可或缺的產(chǎn)品,在這樣的形式下需要提升計(jì)算機(jī)平臺(tái)媒體的便捷性?,F(xiàn)階段語(yǔ)音識(shí)別系統(tǒng)是最好的轉(zhuǎn)變選擇。語(yǔ)音識(shí)別系統(tǒng)的主要原理是計(jì)算機(jī)設(shè)備使用自己的語(yǔ)音識(shí)別和理解系統(tǒng)將語(yǔ)音信號(hào)轉(zhuǎn)換成文本文件或以命令的形式輸出。計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的主要任務(wù)是提取語(yǔ)音信息和識(shí)別語(yǔ)音信號(hào)的含義。經(jīng)過(guò)幾十年的研究和開(kāi)發(fā),目前的語(yǔ)音識(shí)別技術(shù)在計(jì)算機(jī)軟硬件的指導(dǎo)下取得了很好的成果。如果研究人員和設(shè)計(jì)者設(shè)計(jì)出一種能夠在單片機(jī)上實(shí)現(xiàn)語(yǔ)音識(shí)別的系統(tǒng),這將具有重要意義。因此,相關(guān)人員應(yīng)使用VC++過(guò)程模擬來(lái)開(kāi)發(fā)一個(gè)小詞匯量、獨(dú)立的單詞識(shí)別系統(tǒng),并建立一個(gè)更完善的計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)。

計(jì)算機(jī);語(yǔ)音識(shí)別系統(tǒng);架構(gòu)設(shè)計(jì)

1 簡(jiǎn)述計(jì)算技術(shù)語(yǔ)音識(shí)別系統(tǒng)技術(shù)

從計(jì)算機(jī)的發(fā)明到現(xiàn)在的普及,在操作計(jì)算機(jī)時(shí)一直是在使用鍵盤(pán),但是在現(xiàn)實(shí)的世界中還有一種物質(zhì)可以將計(jì)算機(jī)與人們進(jìn)行聯(lián)系,這就是聲音。合理利用聲音構(gòu)建起人與計(jì)算機(jī)間的聯(lián)系就是計(jì)算機(jī)語(yǔ)音識(shí)別技術(shù)。簡(jiǎn)單地說(shuō),計(jì)算機(jī)語(yǔ)音識(shí)別技術(shù)是計(jì)算機(jī)傾聽(tīng)人類(lèi)語(yǔ)言的一種工程。當(dāng)人們對(duì)著計(jì)算機(jī)說(shuō)話時(shí),計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)會(huì)將其理解成“語(yǔ)言”,并將其輸入內(nèi)部系統(tǒng),利用相關(guān)程序?qū)⒄Z(yǔ)音信息轉(zhuǎn)化為文本形式。在識(shí)別過(guò)程中,計(jì)算機(jī)根據(jù)語(yǔ)音識(shí)別模型將存儲(chǔ)在計(jì)算機(jī)中的語(yǔ)音模板的特征與輸入語(yǔ)音信號(hào)進(jìn)行比較,并根據(jù)一定的搜索和匹配策略找到一系列與輸入語(yǔ)音匹配的最佳模板。然后,根據(jù)模板的定義,可以參考表格給出計(jì)算機(jī)的識(shí)別結(jié)果。顯然,這個(gè)優(yōu)化結(jié)果直接關(guān)系特征選擇、語(yǔ)音模型質(zhì)量和模板精度[1]。

2 語(yǔ)音識(shí)別技術(shù)的發(fā)展現(xiàn)狀

通過(guò)多年的研究與努力,語(yǔ)音識(shí)別技術(shù)也得到了非常大的發(fā)展。語(yǔ)音識(shí)別已經(jīng)由研發(fā)階段發(fā)展到實(shí)際使用階段。在試驗(yàn)階段語(yǔ)音識(shí)別信號(hào)最好的情況下使用者連續(xù)進(jìn)行朗讀,信號(hào)的識(shí)別率可達(dá)到90%以上。因此語(yǔ)音識(shí)別技術(shù)也從試驗(yàn)階段轉(zhuǎn)換到實(shí)際應(yīng)用階段,實(shí)現(xiàn)了商業(yè)化。通過(guò)相關(guān)學(xué)者的研究已有兩大聽(tīng)寫(xiě)設(shè)備,即IBM ViaVoice和Dragon Dictation。語(yǔ)音識(shí)別技術(shù)也從一開(kāi)始的小眾化發(fā)展到現(xiàn)在的大眾化。語(yǔ)音識(shí)別系統(tǒng)在進(jìn)行語(yǔ)音識(shí)別時(shí)可以校對(duì)語(yǔ)言并糾正錯(cuò)誤信息,在此基礎(chǔ)上保證語(yǔ)音識(shí)別的速度與質(zhì)量。因此,為了充分發(fā)揮語(yǔ)音識(shí)別技術(shù)的應(yīng)用優(yōu)勢(shì),確保該系統(tǒng)能夠克服不同環(huán)境和口音造成的識(shí)別偏差,相關(guān)研究人員應(yīng)進(jìn)行進(jìn)一步研究,以克服這些問(wèn)題,并在此基礎(chǔ)上確保語(yǔ)音識(shí)別系統(tǒng)能夠更好地應(yīng)用于實(shí)際生產(chǎn)和生活[1]。從現(xiàn)階段來(lái)看,現(xiàn)有的語(yǔ)音識(shí)別系統(tǒng)在識(shí)別特殊單詞方面發(fā)揮了很好的作用,特別是在電話查詢、電話交換和數(shù)字字符串設(shè)置方面。接收這些任務(wù)后,系統(tǒng)不僅可以自動(dòng)接收和存儲(chǔ)信息,還可以實(shí)現(xiàn)實(shí)際數(shù)據(jù)與實(shí)驗(yàn)室數(shù)據(jù)的一致性,確保100%的識(shí)別率。但是可以限制語(yǔ)音識(shí)別系統(tǒng)的因素也相對(duì)較多,因此相關(guān)的技術(shù)人員還應(yīng)對(duì)此項(xiàng)技術(shù)進(jìn)行進(jìn)一步的研發(fā)與優(yōu)化[2]。

3 計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的架構(gòu)設(shè)計(jì)

3.1 用戶界面模塊

計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)中用戶界面模塊的主菜單主要包括運(yùn)行過(guò)程中的識(shí)別程序,并且可以選擇要在工具欄中顯示的波形原始圖或波形處理圖。此模塊中的狀態(tài)欄包括一個(gè)消息對(duì)話框和一個(gè)狀態(tài)顯示,并監(jiān)控系統(tǒng)中的軟件。

3.2 語(yǔ)音信號(hào)采集模塊

語(yǔ)音識(shí)別系統(tǒng)中語(yǔ)音信號(hào)采集模塊的主要任務(wù)是將聽(tīng)到的聲音記錄到系統(tǒng)中,然后用MGI功能記錄聽(tīng)到的聲音,最后得到帶有MGI功能的指令和消息。錄音過(guò)程中的聲音輸入通過(guò)麥克風(fēng)完成,并存儲(chǔ)在定制模板中,該模板可用作WAV文件[3]。

3.3 特征值提取模塊

每一段語(yǔ)音信號(hào)都具有一定的代表性但不是很穩(wěn)定,因此無(wú)法對(duì)有爭(zhēng)端的語(yǔ)音進(jìn)行識(shí)別與處理。當(dāng)出現(xiàn)此情況時(shí)可以將其切割成長(zhǎng)度不等的語(yǔ)音信號(hào),在滿足相關(guān)信號(hào)處理?xiàng)l件下可以運(yùn)用相關(guān)的公式進(jìn)行計(jì)算并對(duì)信號(hào)進(jìn)行處理[4]。目前,最常用的參數(shù)是:平衡振幅、短期能量和電流預(yù)測(cè)系統(tǒng)。在實(shí)際處理中,可以首先將輸入語(yǔ)音波形轉(zhuǎn)換成另一組離散參數(shù)向量。然后提取語(yǔ)音特征,主要是獲取能夠通過(guò)語(yǔ)音產(chǎn)生的波形反映語(yǔ)音特征的主要信息,排除一些不相關(guān)的語(yǔ)音信息。最典型的方案是收集樣本信號(hào)。首先,不同的時(shí)間間隔可以通過(guò)開(kāi)窗來(lái)分開(kāi),然后可以在此基礎(chǔ)上設(shè)置時(shí)間間隔[5],最常見(jiàn)的設(shè)定間隔為1~50 ms,最后可以在不同的間隔幀上提取不同的特征矢量。在這其中較簡(jiǎn)單的特征分為短時(shí)能量和過(guò)零率兩種,但其頻率特征相對(duì)是比較穩(wěn)定的。LPC分析是其中比較典型的特征,可以直接反映共振峰值的性質(zhì)。

3.4 特征庫(kù)管理模塊

特征庫(kù)中的一些相關(guān)參數(shù)可以分為兩類(lèi):一類(lèi)是音頻文件、語(yǔ)音揚(yáng)聲器名稱和語(yǔ)音內(nèi)容等:一類(lèi)是信號(hào)處理后產(chǎn)生的相關(guān)聲音內(nèi)容的語(yǔ)音特征參數(shù)。兩者都設(shè)置了相應(yīng)的誤差范圍。

3.5 模式識(shí)別模塊

模塊識(shí)別模塊可以收集用戶發(fā)出的聲音并監(jiān)控其終端,最終提取其特征。提取的聲音應(yīng)與模板一致,并且可以用作識(shí)別的最終結(jié)果。匹配的主要方式是矢量可變距離。矢量量化是指特征值中的參數(shù)來(lái)構(gòu)造相應(yīng)的特征值,它們之間的加權(quán)距離可以在匹配過(guò)程中計(jì)算出來(lái)。匹配后獲得的加權(quán)距離越小,兩者之間的距離越近。如果匹配在誤差范圍內(nèi)就是成功;如果匹配在誤差范圍外則不成功,可以根據(jù)系統(tǒng)中的動(dòng)力學(xué)產(chǎn)生的誤差來(lái)確定它是否是預(yù)期模板[6]。

4 計(jì)算機(jī)語(yǔ)言識(shí)別技術(shù)的發(fā)展趨勢(shì)

在科技的帶動(dòng)下,計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)也在不斷完善與更新,其良好的特征也完美地呈現(xiàn)在人們面前。計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的特征主要體現(xiàn)在從認(rèn)識(shí)到語(yǔ)音識(shí)別技術(shù)的發(fā)展趨勢(shì),并逐漸滿足社會(huì)發(fā)展的需要,利用獨(dú)有的特點(diǎn)與專(zhuān)業(yè)性技術(shù)來(lái)解決不同領(lǐng)域中遇到的問(wèn)題。此外,可以看出計(jì)算機(jī)語(yǔ)言識(shí)別系統(tǒng)使用范圍非常廣泛,可被利用到不同的領(lǐng)域中。如將其應(yīng)用到通信領(lǐng)域中,應(yīng)將大量的與通信領(lǐng)域相關(guān)的詞匯利用專(zhuān)業(yè)的語(yǔ)音識(shí)別系統(tǒng)進(jìn)行輸入。這樣既可以提升語(yǔ)音識(shí)別系統(tǒng)的清晰性,又可以提升其定位功能的準(zhǔn)確性,充分發(fā)揮計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的作用。計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)也在計(jì)算機(jī)技術(shù)的發(fā)展中取得了突破性進(jìn)展,并逐漸擴(kuò)展到日常工作和生活中。集成不同的語(yǔ)言可以共享相關(guān)的任務(wù)。更令人驚訝的是,計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)能夠收集、總結(jié)和分析大量詞匯信息,從而突破了多語(yǔ)言的限制。

5 結(jié)語(yǔ)

通過(guò)近些年來(lái)對(duì)計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的進(jìn)一步研究,利用VC++技術(shù)可以構(gòu)建起一個(gè)更加完善的語(yǔ)音識(shí)別系統(tǒng),并在模擬后實(shí)現(xiàn)對(duì)系統(tǒng)的調(diào)試。在現(xiàn)代移植技術(shù)的輔助下實(shí)現(xiàn)了將系統(tǒng)移植到單片機(jī)上,有效地提升了計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的處理效果,達(dá)到最初的處理與控制目的。

[1]郭洪榮. 計(jì)算機(jī)語(yǔ)音識(shí)別技術(shù)的應(yīng)用分析[J]. 黑龍江科技信息,2012(31):96.

[2]高忠生,高紅琴. 計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的架構(gòu)設(shè)計(jì)[J]. 信息記錄材料,2013,14(3):50-53.

[3]高翔. 計(jì)算機(jī)語(yǔ)音錄入系統(tǒng)中準(zhǔn)確性問(wèn)題的研究[J].自動(dòng)化與儀器儀表,2015(2):103-104.

[4]茍鵬程. 基于Android的語(yǔ)音識(shí)別設(shè)計(jì)及應(yīng)用[D]. 天津:天津大學(xué),2017.

[5]李剛. 智能語(yǔ)音識(shí)別技術(shù)的架構(gòu)與設(shè)計(jì)[J]. 電腦知識(shí)與技術(shù),2018(18):175-177.

[6]王青偉,馬鐲,崔琳,等. 語(yǔ)音識(shí)別領(lǐng)域計(jì)算機(jī)程序或算法專(zhuān)利申請(qǐng)審查[J]. 電聲技術(shù),2012,36(S1):50-52.

Architecture Design of Computer Speech Recognition System

Liu Min

Shandong Victorysoft Co., Ltd., Shandong Dongying 257000

In recent years, with the popularization of computer technology, computer products have become an indispensable product in people’s work and life. In this form, the convenience of the computer platform media needs to be improved. It can be said that the current stage of speech recognition system is the best choice for transformation. The main principle of the speech recognition system is that the computer device uses its own speech recognition and understanding system to convert the speech signal into a text file or output in the form of a command. The main task of the computer speech recognition system is to extract speech information and recognize the meaning of the speech signal. After decades of research and development, the current speech recognition technology has achieved high results under the guidance of computer hardware and software. It would be important if researchers and designers design a system that can implement speech recognition on a micro controller. Therefore, relevant personnel should use VC++process simulation to develop a small vocabulary and independent word recognition system, and establish a more complete computer speech recognition system.

computer; speech recognition system; architecture design

TN912.34

A

猜你喜歡
架構(gòu)設(shè)計(jì)語(yǔ)音模板
鋁模板在高層建筑施工中的應(yīng)用
鋁模板在高層建筑施工中的應(yīng)用
基于安全性需求的高升力控制系統(tǒng)架構(gòu)設(shè)計(jì)
魔力語(yǔ)音
基于MATLAB的語(yǔ)音信號(hào)處理
電子制作(2019年14期)2019-08-20 05:43:38
基于MQ3與MP3的價(jià)廉物美的酒駕語(yǔ)音提醒器
電子制作(2019年9期)2019-05-30 09:42:10
對(duì)方正在輸入……
鋁模板在高層建筑施工中的應(yīng)用
城市綜改 可推廣的模板較少
對(duì)稱加密算法RC5的架構(gòu)設(shè)計(jì)與電路實(shí)現(xiàn)
舒兰市| 汝南县| 大兴区| 汝州市| 航空| 桂东县| 古交市| 江西省| 南华县| 博客| 赤峰市| 桑植县| 西华县| 吉安县| 福贡县| 张北县| 霍邱县| 沈阳市| 闸北区| 建阳市| 周宁县| 镇赉县| 武安市| 印江| 斗六市| 舟曲县| 乳山市| 敖汉旗| 宁陵县| 古浪县| 吴川市| 原平市| 微山县| 海南省| 博客| 法库县| 沛县| 清新县| 衡山县| 赣榆县| 镇赉县|