許凡
摘要:利用計(jì)算機(jī)聲卡作為聲音信號(hào)采集的硬件,設(shè)計(jì)了一個(gè)基于LabVIEW和聲卡的聲音信號(hào)采集與識(shí)別系統(tǒng),它可以通過(guò)電腦上的聲卡采集樣本和待測(cè)聲音信號(hào),并對(duì)采集的信號(hào)加以存儲(chǔ)和顯示波形,能夠存儲(chǔ)的信號(hào)進(jìn)行識(shí)別,最終能夠?qū)崿F(xiàn)對(duì)聲音信號(hào)的識(shí)別。
關(guān)鍵詞:聲卡;LabVIEW;聲音采集
引言
聲音識(shí)別系統(tǒng)是利用PC聲卡對(duì)聲音進(jìn)行采集。在LabVIEW中對(duì)采集的信號(hào)進(jìn)行存儲(chǔ)和重載,并對(duì)聲音信號(hào)處理后提取關(guān)鍵參量進(jìn)行比對(duì)。比對(duì)結(jié)果比較準(zhǔn)確,可以判斷錄入聲音的相似性,實(shí)現(xiàn)聲音識(shí)別功能。系統(tǒng)具有成本低,交互性高,便捷的優(yōu)點(diǎn),具有一定的應(yīng)用前景。系統(tǒng)的核心是聲音匹配。識(shí)別過(guò)程中對(duì)錄入的聲音的基礎(chǔ)特征有配對(duì)要求。這需要對(duì)聲音的音頻有準(zhǔn)確的記錄和配對(duì)。但是這可以是聲音密碼鎖的一大好處,習(xí)慣的語(yǔ)速總是難以被人模仿的,因而其可靠性得以提高。在采樣與配對(duì)的過(guò)程中,聲音的分析是關(guān)鍵,在轉(zhuǎn)換過(guò)程中無(wú)法避免出現(xiàn)的失真需要盡量的減少,否則聲音密碼鎖的精確度將受到很大的限制。而所提供的硬件在這方面可能不能實(shí)現(xiàn)的很好,只能盡量做到精確,減小失真度。
1、硬件設(shè)計(jì)
筆記本電腦一般使用耳麥二合一接口,沒(méi)有Line?in,因此我們只采集聲音信號(hào)。首先對(duì)聲卡進(jìn)行設(shè)置,將聲卡的采樣率設(shè)為44100Hz,通道形式設(shè)為雙聲道,采樣位數(shù)設(shè)為16 bit。
2、軟件設(shè)計(jì)
2.1按鈕模塊
在前面板生成一個(gè)“開(kāi)始錄音”按鈕,只有當(dāng)單擊按鈕時(shí),才開(kāi)始準(zhǔn)備錄制聲音。
算法實(shí)現(xiàn)為:外層為While循環(huán),將出錯(cuò)信息和“開(kāi)始錄音”按鈕取“或”,作為循環(huán)停止的條件。這樣,在單擊“開(kāi)始錄音”按鈕之前,程序一直處于執(zhí)行這一循環(huán)狀態(tài),即等待錄制命令的下達(dá);當(dāng)單擊“開(kāi)始錄音”按鈕之后(或有出錯(cuò)信息),程序?qū)⑻鲞@一循環(huán),開(kāi)始進(jìn)入到后面的錄制環(huán)節(jié)。
2.2等待模塊
在單擊“開(kāi)始錄音”按鈕后,程序進(jìn)入這一模塊。此模塊的功能是:當(dāng)用戶還沒(méi)有發(fā)出聲音時(shí),系統(tǒng)不會(huì)將聲音錄入;只有當(dāng)系統(tǒng)檢測(cè)到的聲音信號(hào)幅值超過(guò)一個(gè)設(shè)定閾值后,才開(kāi)始對(duì)聲音信號(hào)進(jìn)行采集。這一模塊的作用是避免系統(tǒng)對(duì)聲音的錯(cuò)誤記錄。
算法實(shí)現(xiàn)為:外層為While循環(huán),每循環(huán)一次,就將聲卡采集的信號(hào)用“提取單頻信息”模塊提取波形的主頻率的幅值進(jìn)行檢測(cè)。當(dāng)幅值高于設(shè)定的門(mén)限(15)時(shí),退出While循環(huán),進(jìn)入后面的錄制程序模塊。
2.3錄制模塊
當(dāng)有聲音信號(hào)輸入時(shí),就進(jìn)行一次信號(hào)采集,然后等待下一次輸入,直到按下“停止”按鈕或者記夠6次。
算法實(shí)現(xiàn)為:用While循環(huán)對(duì)輸入的聲音信號(hào)進(jìn)行依次采樣,每次采集前都需要進(jìn)入等待模式,以防止聲音的錯(cuò)誤記錄。
2.4錄音保存
采集數(shù)據(jù)并將數(shù)據(jù)發(fā)送到緩存,然后通過(guò)“寫(xiě)入波形文件”vi將來(lái)自波形或波形數(shù)組的數(shù)據(jù)寫(xiě)入dat文件。 通過(guò)這些vi便可以實(shí)現(xiàn)聲音信號(hào)的采集,并將其存儲(chǔ)為dat格式的文件。待測(cè)聲音的采集和保存和處理與樣本聲音的類(lèi)似。
2.5聲音識(shí)別模塊
聲音的比對(duì)和判斷是這個(gè)程序的核心內(nèi)容,所以也是本次設(shè)計(jì)的重點(diǎn)內(nèi)容。算法實(shí)現(xiàn)為:使用“取整”模塊對(duì)從“提取單頻信息”模塊中得到的樣本聲音和待測(cè)聲音的頻率序列取整數(shù),再對(duì)取整后的兩個(gè)時(shí)間頻率序列序列做比較(設(shè)定一個(gè)樣本的誤差范圍,看待測(cè)時(shí)間序列值是否在該范圍內(nèi)),幅值的比較和頻率的類(lèi)似,最后通過(guò)指示燈顯示比對(duì)結(jié)果。若待測(cè)聲音頻率和幅度序列均在設(shè)定的樣本聲音誤差范圍內(nèi),則相應(yīng)的燈響應(yīng)。當(dāng)所有元素均在閾值范圍內(nèi)時(shí),表示聲音完全匹配。程序如下圖所示:
結(jié)論
結(jié)果有三種情況,分別是:匹配、不完全匹配、不匹配。兩個(gè)聲音的頻率的差值小于等于50,為匹配,兩個(gè)聲音的幅值的差值小于等于0.01為匹配,然后這兩個(gè)的值相與,指示燈的顯示即為最終結(jié)果。本文用LahVIEW軟件設(shè)計(jì)的聲音識(shí)別系統(tǒng),經(jīng)仿真測(cè)試結(jié)果表明,具有一定的實(shí)用性為進(jìn)一步提高系統(tǒng)的識(shí)別的準(zhǔn)確性,硬件方面可進(jìn)步提高聲卡的性能參數(shù)軟件方面可對(duì)信號(hào)分析群分的程序進(jìn)一步優(yōu)化。
參考文獻(xiàn):
[1]賀天柱,蘭羽.基于聲卡的監(jiān)控系統(tǒng)虛擬儀器設(shè)計(jì)[J].國(guó)外電子測(cè)量技術(shù),2012,31(10):58-60
[2]?楊陽(yáng),陳永明.聲紋識(shí)別技術(shù)及其應(yīng)[J].電聲技術(shù),2007(2)