国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于HTK的電臺(tái)粵語敏感詞檢測系統(tǒng)方法研究

2016-05-30 13:43楊俊
關(guān)鍵詞:粵語廣播電臺(tái)詞匯量

楊俊

摘 要:粵語是中國七大方言之一,在全球有近1.2億使用人口。本文根據(jù)粵語的特點(diǎn),針對電臺(tái)節(jié)目中出現(xiàn)的粵語敏感詞設(shè)計(jì)一套基于HTK的語音識別監(jiān)控系統(tǒng),提出基于LMS自適應(yīng)降噪的語音預(yù)處理方案,并驗(yàn)證該語音識別系統(tǒng)的識別率。通過實(shí)驗(yàn)證明該系統(tǒng)對粵語具有較高的識別率。

關(guān)鍵詞:HTK;語音識別;粵語

1 概述

語音識別發(fā)展到現(xiàn)如今,在很多領(lǐng)域已經(jīng)得到了應(yīng)用,語音識別通過幾十年的發(fā)展,已經(jīng)從孤立詞識別到連續(xù)語音識別,從小詞匯量到大詞匯量,但是,粵語連續(xù)語音識別還處在初始階段,粵語通行于兩廣、港澳地區(qū),是唯一除了普通話外擁有完善文字系統(tǒng)的漢語,并且國內(nèi)廣播電臺(tái)很少有用語音識別技術(shù)來對關(guān)鍵詞進(jìn)行檢測,因此,如何設(shè)計(jì)一個(gè)能降低背景噪聲,識別率高的基于關(guān)鍵詞的語音識別軟件,是目前廣播電臺(tái)監(jiān)播系統(tǒng)面臨的技術(shù)挑戰(zhàn)之一。

本文結(jié)合粵語的語音特點(diǎn),使用現(xiàn)在流行的隱馬爾科夫建模工具HTK工具來設(shè)計(jì)一個(gè)電臺(tái)粵語敏感詞檢測系統(tǒng)。

2 電臺(tái)粵語敏感詞檢測系統(tǒng)的基本原理

基于HMM的粵語敏感詞檢測系統(tǒng)主要由語料庫,語音預(yù)處理模塊,特征提取模塊和語音標(biāo)準(zhǔn)模版等部分組成。具體的語音識別框圖如下圖1所示:

語音預(yù)處理模塊就是對輸入的原始語音信號進(jìn)行處理,濾掉其中的不重要信息及背景噪聲等,并進(jìn)行語音信號的端點(diǎn)檢測,即判定語音有效范圍的開始和結(jié)束位置,并進(jìn)行分幀和預(yù)加重等處理工作。

在經(jīng)過語音預(yù)處理模塊后,接下來的就是提取語音的特征參數(shù)。特征參數(shù)就是從語音信號中提取出有效的語音特征,去除語音信號的其他信息。在識別階段,將輸入語音的特征矢量參數(shù)和語音標(biāo)準(zhǔn)模版進(jìn)行相似性度量比較,最后輸出識別結(jié)果。

3 建立語音材料庫

在進(jìn)行語音識別前,建立語音材料庫,確定識別基本元。確定基本元后,標(biāo)記識別基本元。標(biāo)記基本元的工作,我使用的是WaveSurfer1.8的工具,用WaveSurfer1.8的工具打開用Adobe Audition CS6錄好的錄音材料,然后使用Label標(biāo)記好每個(gè)字的起始和結(jié)束位,就完成了一個(gè)詞的標(biāo)記工作。27個(gè)電臺(tái)敏感詞由15個(gè)男主持人和15個(gè)女主持人錄制,每個(gè)敏感詞錄制3遍。

4 基于HTK電臺(tái)新聞敏感詞檢測系統(tǒng)聲學(xué)建模

聲學(xué)建模是連續(xù)語音識別的關(guān)鍵步驟,其目的就是計(jì)算語音的特征矢量系列,為聲學(xué)單元建立一套聲學(xué)模型參數(shù)。HTK工具建立聲學(xué)模型步驟如圖2所示:

本系統(tǒng)識別用的是HTK中的HCopy模塊對語音進(jìn)行特征的提取,然后用到Hinit模塊對HMM模型進(jìn)行初始化,隨后用HRest和HERest庫模塊對HMM模型進(jìn)行重估,形成準(zhǔn)確的HMM模型,通過Hvite識別工具來對HMM模型進(jìn)行解碼,其中使用HTK中的HParse使其由識別語法變成識別網(wǎng)絡(luò),最后輸出識別的結(jié)果。

5 粵語連續(xù)語音識別實(shí)驗(yàn)

5.1 更換訓(xùn)練集實(shí)驗(yàn)

實(shí)驗(yàn)中的語料庫共有27個(gè)詞匯,由30位會(huì)說粵語的人,其中男15人,女15人,用標(biāo)準(zhǔn)的粵語朗讀一遍,其中語音信息是已知的,并且用WaveSurfer1.8的工具進(jìn)行標(biāo)注。其中從語料庫中選擇前20組語音作為訓(xùn)練集,后10組語音作為測試集作為一個(gè)第一組實(shí)驗(yàn),然后用30組語音作為訓(xùn)練集,后10組語音作為測試集來作為第二組實(shí)驗(yàn),識別結(jié)果用HTK中的HResults模塊進(jìn)行輸出識別結(jié)果,第一組識別結(jié)果如圖3,第二組識別結(jié)果如圖4:

實(shí)驗(yàn)結(jié)果表明,第二組正確率(82.51%)高于第一組的正確率(75.31%),證明訓(xùn)練集的增加可以對非特定人識別的識別率有顯著的提高。

5.2 對大詞匯量連續(xù)語音的處理

對于大詞匯量連續(xù)語音的處理,可以采用深度學(xué)習(xí)的方法來代替GMM-HMM中的GMM,因?yàn)镚MM模擬任意函數(shù)的功能取決于混合高斯函數(shù)的個(gè)數(shù),所以具有一定的局限性,屬于淺層模型。而深度網(wǎng)絡(luò)可以模擬任意的函數(shù),因而表達(dá)能力更強(qiáng)。所以使用深度學(xué)習(xí)的基于統(tǒng)計(jì)語音模型作為粵語的非特定人大詞匯量連續(xù)語音識別系統(tǒng)的語言模型,來實(shí)現(xiàn)大詞匯量的連續(xù)語音識別。

6 總結(jié)

為了提高廣播監(jiān)播系統(tǒng)的智能化、高效性,減輕管理控制人員的工作壓力,將語音識別技術(shù)嵌入到廣播電臺(tái)監(jiān)播系統(tǒng)當(dāng)中。針對影響到安全播出的節(jié)目中出現(xiàn)的禁忌詞匯,或因播出信號受敵對勢力攻擊而出現(xiàn)的一些敏感詞匯,可利用語音識別技術(shù),設(shè)計(jì)一套電臺(tái)廣播新聞敏感詞檢測系統(tǒng),對播出信號進(jìn)行實(shí)時(shí)監(jiān)播。其最終研究成果和優(yōu)化的系統(tǒng)對廣播電臺(tái)的安全播出具有典型的指導(dǎo)意義,并且具有在全國各大廣播電臺(tái)推廣的價(jià)值。

參考文獻(xiàn):

[1]王海濤.廣播電視監(jiān)播系統(tǒng)中音頻及語音數(shù)據(jù)處理技術(shù)研究[D].西北工業(yè)大學(xué),2007:35-37.

[2]陳杰.基于語音識別的警報(bào)系統(tǒng)的設(shè)計(jì)及其在廣播中的應(yīng)用[J].2014.04:121.

[3]孔婷.基于語音識別的廣告監(jiān)播技術(shù)研究[D].南京理工大學(xué),2013.7:1-2.

[4]張秋野,王力劭,丁鵬.連續(xù)語音識別網(wǎng)格技術(shù)在新聞制播平臺(tái)的應(yīng)用[J].電視技術(shù),2010.02:58.

[5]陳蓉.語音識別技術(shù)在廣播電臺(tái)的應(yīng)用探討[J].廣播與電視技術(shù),2008.10:134.

[6]劉洪斌.廣播電臺(tái)網(wǎng)絡(luò)音頻搜索系統(tǒng)初探[J].中國廣播,2011.06:47.

[7]布合力齊姑麗·瓦斯力.用MATLAB實(shí)現(xiàn)維吾爾語廣播新聞敏感詞檢索系統(tǒng)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2014.06:69.

猜你喜歡
粵語廣播電臺(tái)詞匯量
粵語學(xué)堂
廣府人
——粵語·女獨(dú)·伴唱
用詞類活用法擴(kuò)充詞匯量
探究微信平臺(tái)在廣播電臺(tái)的應(yīng)用
粵語對話莊文強(qiáng) 如何平衡雙雄故事
優(yōu)雅古風(fēng)與經(jīng)典流行的全新演繹 童麗《粵語十大金曲Ⅱ》
Receptive and Productive Vocabulary in Language Teaching
城市廣播電臺(tái)新聞宣傳探討
新形勢下廣播電臺(tái)新聞的采編技巧
詞匯量測試對語言水平的預(yù)測性的實(shí)證研究