韓大偉 熊欣
摘 要:語音是人類傳遞信息的一種最主要、最有效、最方便的交流形式。語言是人類特有的交流方式,而聲音又是人類比較常用的交流工具,是傳遞信息的主要手段,所以,語音信號是人們感情交流以及思想溝通的主要途徑。目前,人們已經(jīng)進(jìn)入到了信息時代,利用一些現(xiàn)代先進(jìn)的技術(shù)方法分析語音信號,加強(qiáng)對語音信號采集與處理的研究,使人們可以更加方便的傳輸、獲取、存儲以及使用相關(guān)的語音信號,對于加快社會的發(fā)展與進(jìn)步有著非常重要的現(xiàn)實意義。
關(guān)鍵詞:語音信號;采集;處理
對于語音信號的采集與處理一直就沒有斷過研究,不僅僅是因為其具有一定的實用性,還有一個非常重要的原因就是,其始終與信息科學(xué)中最前沿的學(xué)科有著緊密的聯(lián)系,并且能夠共同發(fā)展。語音信號的采集與處理是一門涉及范圍比較廣的綜合性學(xué)科,其是以語音語言學(xué)以及數(shù)字信號處理為基礎(chǔ),并且與計算機(jī)技術(shù)、信息技術(shù)以及通信技術(shù)等均有緊密的聯(lián)系。所以,加強(qiáng)對語音信號采集與處理方法的分析與研究,有助于促進(jìn)社會的不斷發(fā)展以及科學(xué)技術(shù)的不斷進(jìn)步。
1 語音信號具有的特點
通過對大量實際語音信號的分析,我們可以明顯發(fā)現(xiàn)語音信號具有兩大特點:一是從時域方面而言,語音信號具備“短時性”特點,也就是說,從總體上而言,語音信號的特點是隨著時間的延續(xù)而發(fā)生不斷改變的,但是在一段比較短的時間范圍之內(nèi),語音信號還是可以保持不變的。通常情況下,在清音段表現(xiàn)出來的特點就是隨機(jī)噪聲,在濁音段表現(xiàn)出來的特點就是周期信號。二是從頻域方面而言,語音信號頻率主要集中的范圍就是300-3400赫茲之間。通常情況下,就可以利用這一特點,采用帶通濾波器將這一區(qū)間的語音信號頻率提取出來,之后根據(jù)8千赫茲的采樣頻率對提取出來的語音信號開展相應(yīng)的采樣工作,這樣就可以得到相對比較離散的語音信號。
2 語音信號的采集
將語音信號轉(zhuǎn)變?yōu)閿?shù)字信號,就一定要采集到語音信號,也就是要進(jìn)行語音信號的采樣與量化,進(jìn)而得到在幅度以及時間上都是離散的數(shù)字信號。采樣可以稱之為抽樣,是語音信號在時間上的離散過程,采樣的時候一定要滿足奈奎斯特定理,才可以對語音信號進(jìn)行有效的采樣。在語音信號采樣的時候,一定要重視采樣間隔的設(shè)定以及相關(guān)語音信號的混淆,也就是說,對語音信號的采集首先就要明確采樣間隔。通常情況下,采樣的頻率越高,采樣的點數(shù)就會越加密集,所得到的離散信號也就越加接近于原始的語音信號。但是采樣的頻率也不要太高,對于一些固定長度的語音信號,采集到太多的語音數(shù)據(jù),可能會給計算機(jī)系統(tǒng)帶來許多不必要的分析工作量以及占據(jù)過大的存儲空間;如果限定了數(shù)據(jù)量,而采樣的時間又太少,就會致使一些數(shù)據(jù)被排斥在外。采樣的頻率太低,采樣點的間隔距離又太遠(yuǎn),就會導(dǎo)致離散信號不足,無法反映原有語音信號的特征,進(jìn)而無法復(fù)原語音信號,導(dǎo)致出現(xiàn)信號混亂的情況。根據(jù)相關(guān)的采樣定理,可以將采樣的頻率設(shè)置為大于語音信號的2倍帶寬,這樣在采樣的過程中就不會出現(xiàn)丟失信息的情況。量化就是對幅度進(jìn)行離散,也就是將振動幅度用二進(jìn)制量化的方式予以表現(xiàn),其量化電平主要是根據(jù)級數(shù)進(jìn)行改變的,實際振動的值是一種比較連續(xù)的物理量。完成語音信號的采集之后,就可以對其進(jìn)行相關(guān)的處理。
3 語音信號的處理
語音信號處理可以簡單稱之為語音處理,是在數(shù)字信號處理以及語音學(xué)的基礎(chǔ)之上建立的一門綜合性比較強(qiáng)的學(xué)科,對其進(jìn)行處理的目的就是獲取一些語音參數(shù),進(jìn)而完成語音的傳輸或者存儲,通過某種計算的處理,以此來實現(xiàn)某種用途的具體要求,比如:辨識說話人、人工合成語音、識別講話內(nèi)容等。其包含了四大部分,語音編碼、語音識別、語音合成以及說話人識別。語音是由人類發(fā)音器官發(fā)出來的聲音,并且具有一定的現(xiàn)實意義與社交作用,可以表達(dá)一部分特定的含義,這就是語音與自然界其它聲音的根本區(qū)別所在。語音與其所表達(dá)的現(xiàn)實意義是互相依賴的統(tǒng)一體,從一方面而言,發(fā)音器官發(fā)出來的聲音一定要帶有一定的現(xiàn)實意義,并且與現(xiàn)實意義緊密的聯(lián)系在一起,這樣的聲音表達(dá)才可以稱之為語音;從另外一方面而言,現(xiàn)實意義的表達(dá)一定要借助聲音的形式,才可以被人們感知以及接受,沒有聲音的表達(dá),就不會有相應(yīng)現(xiàn)實意義的體現(xiàn)。
4 語音信號采集與處理的方法
4.1 計算機(jī)系統(tǒng)中錄音機(jī)程序
計算機(jī)系統(tǒng)的附件中有一個錄音機(jī)程序,其可以驅(qū)動聲卡進(jìn)行語音信號的采集、播放以及處理。對于語音信號的采集可以直接用麥克風(fēng)錄制人的語音,也可以利用人工輸入數(shù)據(jù)線或者音頻線將磁帶或者電視中的語音信號采集輸入到計算機(jī)當(dāng)中,這樣就可以根據(jù)輸入文件的屬性進(jìn)行文件格式、位數(shù)以及采樣頻率等方面的設(shè)置,同時也可以根據(jù)實際需要對語音信號進(jìn)行簡單的處理,比如:加大或者減小音量、添加回音效果、加快或者減慢語音的速度以及聲音反轉(zhuǎn)等,其中加速或者減速完全可以實現(xiàn)變音的效果,反轉(zhuǎn)可以實現(xiàn)聲音文件加密的目的。利用錄音機(jī)程序采集與處理語音信號的優(yōu)點就是不需要進(jìn)行相應(yīng)的編程就可以實現(xiàn)語音的錄制與播放,并且對錄音材料的編輯與處理也比較方便、靈活,比如:復(fù)制、插入、剪切、回音、混響以及反轉(zhuǎn)等,同時還可以轉(zhuǎn)換聲音文件的格式,選擇相應(yīng)的壓縮方式以及采樣頻率等。其缺點就是一次錄制語音的時間不可以多于1分鐘,除此之外,對采集的語音信號處理一定要進(jìn)行另外的編輯工作或者利用其它相關(guān)軟件予以處理。
4.2 PRAAT語音學(xué)軟件程序
PRAAT語音軟件程序是由阿姆斯特丹大學(xué)大衛(wèi)·威寧克和保羅·博爾斯馬這兩位語音學(xué)教授一起研發(fā)出來的,可以對語音進(jìn)行分析、合成以及轉(zhuǎn)換。利用PRAAT語音學(xué)軟件程序可以直接將語音錄制下來,可以從磁盤上直接讀取聲音文件或者使用算式的方法創(chuàng)建聲音,可以對一段聲音開展頻譜特征分析、音強(qiáng)曲線分析、共振峰曲線分析以及音高曲線分析等工作,同時對語音的參數(shù)進(jìn)行變換與調(diào)整,對聲音進(jìn)行標(biāo)注。大部分的語音分析均可以在PRAAT語音學(xué)軟件程序中完成,并且不需要進(jìn)行編程,因此,受到許多語音處理人員的喜愛。
4.3 計算機(jī)系統(tǒng)中MATLAB軟件程序
MATLAB軟件程序是由美國Math Works公司推出的一種交互式計算機(jī)軟件,應(yīng)用的范圍非常廣泛,主要包括通訊、測量與測試、計算生物學(xué)、財務(wù)建模、控制系統(tǒng)設(shè)計以及信號與圖像的處理等眾多方面。在附加工具箱當(dāng)中擴(kuò)展了MATLAB環(huán)境,因此,可以在此環(huán)境當(dāng)中,通過不同的編程方式驅(qū)動聲卡,以此來達(dá)到采集與播放語音信號的目的,其語音信號的分析與處理工具箱可以為分析語音信號提供非常充足的功能函數(shù),進(jìn)而利用功能函數(shù)對語音信號進(jìn)行相應(yīng)的分析與處理,不僅非常方便,還非常的快捷。利用MATLAB軟件語言編程程序可以將需要的聲音文件轉(zhuǎn)換成相應(yīng)的離散數(shù)據(jù)文件,之后利用非常強(qiáng)大的矩陣計算能力對轉(zhuǎn)換的數(shù)據(jù)進(jìn)行一定的處理,比如:數(shù)字濾波、聲音回放、時域及頻域的分析、呈現(xiàn)各種分析圖以及傅里葉變換等。
總而言之,通過對這三種方法的介紹,我們可以看出,錄音機(jī)程序?qū)τ谡Z音信號的采集非常方便,但是在處理方面就有一些欠缺,只能進(jìn)行簡單的操作,不能深入的進(jìn)行相關(guān)的處理;PRAAT語音學(xué)軟件程序?qū)τ谡Z音信號的采集與處理不需要編程就可以實現(xiàn),并且也可以通過編程完成復(fù)雜語音信號的采集與處理,深受大家的喜愛;MATLAB軟件程序?qū)τ谡Z音信號的采集與處理,可以通過控件工具箱以及相應(yīng)的函數(shù)實現(xiàn),同時對于復(fù)雜語音信號的處理就需要通過編程予以實現(xiàn)。
5 結(jié)束語
綜上所述,通過對語音信號采集與處理方面的研究,使得我們更加了解語音信號,對于語音信號的一些采集與處理方法也有了一定的認(rèn)識與了解,以及對語音信號的相關(guān)知識與作用也有了一定的掌握,所以,一定要加強(qiáng)對語音信號采集與處理方法的分析與研究,進(jìn)而推動相關(guān)科學(xué)技術(shù)的發(fā)展與進(jìn)步,提出更多的新處理方法,進(jìn)一步應(yīng)用到其它相關(guān)的領(lǐng)域。
[參考文獻(xiàn)]
[1]張桂香,高愛國.語音信號采集和處理方法的研究[J].高師理科學(xué)刊,2007(02).
[2]項勇,吳謹(jǐn).語音信號采集和播放的TCL 320 AD 50的實現(xiàn)[J].科學(xué)技術(shù)與工程,2008(12).
[3]齊子元,謝桂海,劉毅,等.一種實時語音信號采集處理系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機(jī)工程與應(yīng)用,2005(09).
[4]齊子元,謝桂海,劉毅,等.基于TMS 320 C 30的實時語音信號采集與處理系統(tǒng)[J].測控技術(shù),2004(11).
[5]蔡蓮紅,黃德智,蔡銳.現(xiàn)代語音技術(shù)基礎(chǔ)與應(yīng)用[J].中國新技術(shù)新產(chǎn)品,2003(03).
[6]張明照,劉政波,劉斌.應(yīng)用MATLAB實現(xiàn)信號的分析和處理[J].哈爾濱學(xué)院學(xué)報,2006(06).