趙偉++孫廣大
摘 要
眾所周知,在語(yǔ)音的系統(tǒng)的識(shí)別中,如何降低端點(diǎn)檢測(cè)得出錯(cuò)率,一直是人們研究和考察的重點(diǎn),然而重要的步驟就是進(jìn)行端點(diǎn)的檢測(cè)。因此對(duì)端點(diǎn)檢測(cè)也成為了語(yǔ)音信號(hào)處理的一個(gè)一個(gè)關(guān)鍵的部分。本文就是根據(jù)聲音端點(diǎn)檢測(cè)的方法還有步驟,進(jìn)行探討還有研究,在本篇論文中可能會(huì)涉及到實(shí)驗(yàn)的相關(guān)的環(huán)節(jié),本篇論文用實(shí)驗(yàn)的客觀(guān)結(jié)果,來(lái)證明,這種端點(diǎn)檢測(cè)法的出錯(cuò)率就會(huì)大范圍的的降低,催檢測(cè)的準(zhǔn)確率也是一個(gè)大的提升,檢測(cè)結(jié)果也會(huì)越來(lái)越精確。這樣也更方便我們能準(zhǔn)確的檢測(cè)出語(yǔ)音信號(hào)的端點(diǎn)。
【關(guān)鍵詞】端點(diǎn)檢測(cè) 模型 過(guò)零率
1 引言
在現(xiàn)代社會(huì)人類(lèi)進(jìn)行交流,最方便和快捷的方式毫無(wú)疑問(wèn)那就是語(yǔ)音的交流。提高語(yǔ)音的傳播速度,擴(kuò)大云因的傳播內(nèi)容,一直是工程人員的一個(gè)研究的重點(diǎn),如何能夠?qū)崿F(xiàn)云因的人類(lèi)還有機(jī)器人的互相交互,提高語(yǔ)音功能的智能化,一直是語(yǔ)音信號(hào)處理研究領(lǐng)域中的重要研究課題。然而語(yǔ)音端點(diǎn)檢測(cè)它包括以下幾項(xiàng)內(nèi)容,首先是要對(duì)語(yǔ)音進(jìn)行分析,然后還有語(yǔ)音的合成,對(duì)語(yǔ)音系統(tǒng)進(jìn)行編碼處理,還有一個(gè)更為重要的技術(shù)難題就是對(duì)說(shuō)話(huà)者的說(shuō)話(huà)內(nèi)容要能夠進(jìn)行準(zhǔn)確的識(shí)別也是一項(xiàng)十分重要的環(huán)節(jié),它將直接影響到后面一些列工作的實(shí)施還有就是工作進(jìn)行的準(zhǔn)確性。但是在實(shí)際的操作的過(guò)程中,要做的第一步及是對(duì)系統(tǒng)的輸入信號(hào)能夠進(jìn)行一個(gè)準(zhǔn)確的判斷,語(yǔ)言的數(shù)據(jù)的準(zhǔn)確性是保證和確定聲音的端點(diǎn)還有尾點(diǎn)的關(guān)鍵所在,因此這就會(huì)大大的增加準(zhǔn)確性運(yùn)算強(qiáng)度,提高了學(xué)習(xí)效率,同時(shí)降低了完成這項(xiàng)任務(wù)所需要花費(fèi)的時(shí)間。
在日常的語(yǔ)音識(shí)別系統(tǒng)中,首先是根據(jù)一定的端點(diǎn)檢測(cè)算法,對(duì)語(yǔ)音的信號(hào)進(jìn)行分割處理,語(yǔ)音信號(hào)一般分為有音信號(hào),還有無(wú)音信號(hào),兩者是有很大區(qū)別的,姐姐就是對(duì)有聲片段進(jìn)行處理,這主要包括根據(jù)語(yǔ)音信號(hào)的某些明顯特征進(jìn)行處理。通過(guò)實(shí)驗(yàn)我們發(fā)現(xiàn)了一下幾點(diǎn)現(xiàn)象,首先是在安靜的環(huán)境中,語(yǔ)音系統(tǒng)識(shí)別的出錯(cuò)率,都集中在端點(diǎn)位置上。從以上的實(shí)驗(yàn)中我們可以得出,對(duì)語(yǔ)音的信號(hào)識(shí)別系統(tǒng)的檢測(cè)就顯得尤為重要。安靜的環(huán)境如此,在噪音的環(huán)境中更是如此,如果不能保證端點(diǎn)檢測(cè)的準(zhǔn)確率,會(huì)直接影響后續(xù)工作的進(jìn)行,所以我們必須保證準(zhǔn)確性,這是我們進(jìn)行下面工作的前提保證。所以語(yǔ)音信號(hào)的準(zhǔn)確還有語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)一直是現(xiàn)在進(jìn)行研究的重難點(diǎn)分析。
2 語(yǔ)音信號(hào)的時(shí)域特征
2.1 短時(shí)能量分析
語(yǔ)音信號(hào)的強(qiáng)弱是由多方面決定,其中一個(gè)關(guān)鍵點(diǎn)就是,語(yǔ)音信號(hào)時(shí)間的長(zhǎng)短問(wèn)題,這也是人們非常容易忽視的一個(gè)問(wèn)題,信號(hào)也會(huì)隨著清濁音的變化從而發(fā)生一系列相應(yīng)的變化,通過(guò)總結(jié)和分析我們得出了一下的計(jì)算工程式:
2.2 短時(shí)平均過(guò)零率
大家都非常熟悉的一點(diǎn)是,段時(shí)間的平均的過(guò)零率會(huì)對(duì)信號(hào)有著極為嚴(yán)格的要求,平均值的準(zhǔn)確性實(shí)際上就是所得符號(hào)它采集的準(zhǔn)確性,這都密不可分。根據(jù)短時(shí)能量的定律我們可以得出,短時(shí)能量的大體位置和方向。
3 端點(diǎn)檢測(cè)
3.1 端點(diǎn)檢測(cè)介紹
識(shí)別語(yǔ)音信號(hào)的起止點(diǎn)是所有語(yǔ)音識(shí)別系統(tǒng)所必須經(jīng)歷的一個(gè)過(guò)程。只有保證起點(diǎn)還有終點(diǎn)的準(zhǔn)確率。這樣我們才能保證我們測(cè)試出的結(jié)果是正確的,這樣也能夠保證我們的數(shù)據(jù)分析得出的結(jié)果是準(zhǔn)確的。通過(guò)這樣的方法,不但降低了我們數(shù)據(jù)量的采集,還有就是降低了運(yùn)算的工程量還有處理的時(shí)間,這些方面的提高都會(huì)在一定的程度上降低我們的出錯(cuò)率。人類(lèi)的聲音也是各有特色的每個(gè)人都有每個(gè)人的特點(diǎn),但是從總體上我們可以大體分為兩個(gè)部分首先第一個(gè)就是清音,第二個(gè)是濁音。這兩種聲音是有很大不同的,平常我們所采用的端點(diǎn)檢測(cè)方法,大多數(shù)會(huì)采用特征提取方法。根據(jù)這兩種聲音的發(fā)生規(guī)律,對(duì)其進(jìn)行比較和研究,將該特征和設(shè)定的門(mén)限進(jìn)行比較或是采取某種判決機(jī)制來(lái)判斷。
在日常的語(yǔ)音識(shí)別過(guò)程中,過(guò)零率的端點(diǎn)檢測(cè),是最普遍的語(yǔ)音端點(diǎn)檢測(cè)的方法,它有明顯的物理意義,而且計(jì)算的過(guò)程也是相對(duì)的簡(jiǎn)單,他的這些優(yōu)點(diǎn),使它在端點(diǎn)的實(shí)際操作中得到了最為廣泛的應(yīng)用。但是任何事物都具有它的兩面性,因此他也具有不可否認(rèn)的缺點(diǎn),而最根本最實(shí)際的判斷的標(biāo)準(zhǔn)就是根據(jù)我們?nèi)粘7e累的實(shí)際經(jīng)驗(yàn)才判斷們限的端點(diǎn)問(wèn)題。
3.2 雙門(mén)限端點(diǎn)檢測(cè)算法
對(duì)過(guò)零率的端點(diǎn)的檢測(cè)都是采用2級(jí)的判斷的方法,第一步就是根據(jù)平均值進(jìn)行第一次判斷,接下來(lái)在這個(gè)基礎(chǔ)上,我們?cè)倮枚螘r(shí)間平均的過(guò)零率統(tǒng)一進(jìn)行第二次判斷。之所以我們不用段時(shí)間判斷作為第一判斷,原因就是段時(shí)間的判斷不能準(zhǔn)確的得出起點(diǎn)的關(guān)鍵位置,因此為了增加我們判斷的準(zhǔn)確率,通常是常采用雙門(mén)限的方法,通過(guò)比較得出一個(gè)準(zhǔn)確的答案。
從圖1我們可以看出,符值都會(huì)在這個(gè)限度范圍之內(nèi)。通過(guò)這個(gè)步驟我們可以進(jìn)行第一次初步的判斷。如果進(jìn)行語(yǔ)音測(cè)試的語(yǔ)音落在了,這個(gè)起止點(diǎn)所對(duì)應(yīng)的時(shí)間的間隔之外(即AB段之外)。接下來(lái),要做的事要在噪聲的情況下,對(duì)語(yǔ)音進(jìn)行數(shù)據(jù)研究分析,我們通過(guò)分析,得出以下兩個(gè)公式,從這公式中我們可以清晰地看到,平均值準(zhǔn)確性,完全是由多級(jí)判斷而決定的,語(yǔ)音的起點(diǎn)還有結(jié)束的尾點(diǎn)都至關(guān)重要。
3.3 基于調(diào)頻-調(diào)幅模型的語(yǔ)音端點(diǎn)檢測(cè)技術(shù)
雙門(mén)限檢測(cè)方法我們?cè)谏衔慕榻B中,已經(jīng)提到了就是要根據(jù)我們以往的經(jīng)驗(yàn)值,來(lái)判斷一個(gè)大概的經(jīng)驗(yàn)值,榆次同時(shí)呢,要對(duì)判斷結(jié)果進(jìn)行二次判斷,得出一個(gè)相對(duì)來(lái)說(shuō)更為準(zhǔn)確的門(mén)限值。這樣也會(huì)增加我們判斷的誤差。與之相反的如果我么采用而運(yùn)用Teager能量算子判斷,這樣既可以反映幅值的變化,同時(shí)也能反映出頻率的變化。判斷他們是成正想觀(guān)性還是負(fù)相關(guān)性,是不是頻率的的增加,頻率也會(huì)增加。能量的輸出值是不是也會(huì)隨之發(fā)生相應(yīng)的改變,同時(shí)呢,在針對(duì)不同類(lèi)別的信號(hào)時(shí),Teager能量算子的輸出也反映出不同的特性。因此,能量算法的使用非線(xiàn)性能量算子來(lái)跟蹤語(yǔ)音信號(hào),這是我們語(yǔ)音信號(hào)系統(tǒng)的一個(gè)創(chuàng)新之舉,不在是單純的靠單個(gè)共振峰的語(yǔ)音信號(hào)能量的檢測(cè)進(jìn)行分析:
可以看出R(n)信號(hào)的能量算子輸出由兩部分組成:一部分頻率調(diào)制后的瞬時(shí)頻率,另一部分是幅值調(diào)制后的幅值包絡(luò),它可以反應(yīng)出幅值和頻率的變化。根據(jù)這個(gè)特點(diǎn)可以進(jìn)行以Teager能量算子輸出的能量為特征的端點(diǎn)檢測(cè)。
4 結(jié)論
本篇論文主要是對(duì)聲音端點(diǎn)檢測(cè)的方法進(jìn)行研究,我們通過(guò)雙門(mén)限的檢測(cè)方法,可以高效的將頻率與幅值完全給結(jié)合起來(lái),這種方法的檢測(cè)要比以往的傳統(tǒng)的能量進(jìn)行端點(diǎn)檢測(cè)得到更為準(zhǔn)確的結(jié)果。但是萬(wàn)物都存在著優(yōu)點(diǎn)還有缺點(diǎn),如果在噪音較大的情況下,我們的檢測(cè)結(jié)果也是不準(zhǔn)確的,在沒(méi)有噪音干擾的情況下它的檢測(cè)結(jié)果就會(huì)提高,同時(shí)信號(hào)不是很強(qiáng)的情況下,它的結(jié)果也不是很準(zhǔn)確。
參考文獻(xiàn)
[1]趙力.語(yǔ)音信號(hào)處理[M].北京:機(jī)械工業(yè)出版社,2003.
[2]易克初.語(yǔ)音信號(hào)處理[M].北京:國(guó)防工業(yè)出版社,2004.
[3]王炳錫,屈丹,彭煊.實(shí)用語(yǔ)音識(shí)別基礎(chǔ)[M].北京:國(guó)防工業(yè)出版社,2005.
[4]雷靜.語(yǔ)音識(shí)別技術(shù)的研究及基本實(shí)現(xiàn)[D].武漢:武漢理工大學(xué),2002.
[5]張雄偉,陳亮,楊吉斌.現(xiàn)代語(yǔ)音處理技術(shù)及應(yīng)用[M].北京:機(jī)械工業(yè)版社,2003.
[6]韓紀(jì)慶,張磊,鄭鐵然[M].北京:清華大學(xué)出版社,2004.
作者簡(jiǎn)介
趙偉(1978-),男,河北省保定市人。大學(xué)本科學(xué)歷?,F(xiàn)為河北化工醫(yī)藥職業(yè)技術(shù)學(xué)院工程師。主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)及自動(dòng)化。
孫廣大(1982-),男,河北省唐山市人。大學(xué)本科學(xué)歷?,F(xiàn)為河北化工醫(yī)藥職業(yè)技術(shù)學(xué)院工程師。主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)。
作者單位
河北化工醫(yī)藥職業(yè)技術(shù)學(xué)院 河北省石家莊市 050026