賴尊文
摘 要:本文分析了一種新型語音識別智能鎖的系統(tǒng)設(shè)計(jì)架構(gòu),同時(shí)闡述了一種新型語言識別智能鎖的關(guān)鍵算法與處理流程,最后結(jié)合已有經(jīng)驗(yàn),分析與闡述了一種新型語言識別智能鎖的性能優(yōu)化設(shè)計(jì)。旨在全面了解一種新型語言識別智能鎖的優(yōu)化設(shè)計(jì)方法,確保其應(yīng)用的高效和穩(wěn)定。
關(guān)鍵詞:語音識別;新型智能鎖;設(shè)計(jì)架構(gòu);優(yōu)化設(shè)計(jì)
中圖分類號:TN912 文獻(xiàn)標(biāo)志碼:A
1 一種新型語音識別智能鎖的系統(tǒng)設(shè)計(jì)架構(gòu)
在語音識別技術(shù)的應(yīng)用下,成功地把聲控功能應(yīng)用到了鎖具之中,進(jìn)而有新的一種帶有語音識別功能的智能鎖出現(xiàn)。眾所周知,語音信號實(shí)際上是屬于是一個(gè)慢時(shí)間變化的信號。在具體應(yīng)用環(huán)節(jié),能夠把語音信號劃分成若干幀用于提取短時(shí)語音特征,且在幀內(nèi)按照規(guī)定信號進(jìn)行分析與處理。針對“特征提取”這一環(huán)節(jié)內(nèi)容需要把數(shù)字語音信號按照8ms~20ms短時(shí)段的形式對數(shù)據(jù)進(jìn)行分組處理,且鄰段之間可相互重疊。通過一系列提前擬定好的特征提取程序能夠?qū)⒚恳欢虝r(shí)段內(nèi)的特征向量計(jì)算出來,而后再把計(jì)算出的特征向量組成序列形式,便于存儲,而這樣一個(gè)過程便稱為模板。需注意的是在實(shí)際計(jì)算環(huán)節(jié),所有涉及到該系統(tǒng)識別的模板均需要存儲起來。
語音識別又可分成語音識別、語音樣板訓(xùn)練等兩部分,而涉及于其中的標(biāo)準(zhǔn)化模式存儲空間則被稱作“詞庫”,且單一的標(biāo)準(zhǔn)模式則被稱作“樣板”。這里提及的語音樣板訓(xùn)練,第一步要做的便是頻譜分析待識別命令,第二步則是將提取出的特征參數(shù)當(dāng)作標(biāo)準(zhǔn)化識別模式,第三步便是將其存放到由flash存儲器所構(gòu)成的模板庫之中。值得一提的是,語音識別過程實(shí)質(zhì)上可看成是提取語音命令特征參數(shù)的過程,相較于詞庫中的樣板而言,前者需要提取樣板中相似度最好的命令序號當(dāng)作識別結(jié)果,如此才能有效判定信號屬性,便于實(shí)施后續(xù)操作。
2 一種新型語音識別智能鎖的關(guān)鍵算法與處理流程
2.1 基本過程
按照實(shí)際應(yīng)用環(huán)境的不用,可將語音識別系統(tǒng)劃分成4種類型,即小詞匯量和大詞匯量識別、特定人和非特定人識別、無限詞匯量識別、獨(dú)立詞和連續(xù)詞識別。具體的語音識別過程包含了語音信號預(yù)處理—特征提取—模式匹配等環(huán)節(jié)。其中預(yù)處理又包含了預(yù)濾波—采樣與量化—加窗—端點(diǎn)檢測—預(yù)加重等環(huán)節(jié)。整個(gè)語音信號識別中最為關(guān)鍵的部分為提取特征參數(shù)。實(shí)際提取過程中應(yīng)滿足以下3個(gè)條件:第一個(gè)條件所提取的特征參數(shù)應(yīng)具有代表性,即能代表語音特征,且在區(qū)分性能方面表現(xiàn)良好;第二個(gè)條件各個(gè)階段的參數(shù)間應(yīng)表現(xiàn)出良好的獨(dú)立性;第三個(gè)條件則是所選特征參數(shù)應(yīng)便于計(jì)算,能夠采用最高效算法進(jìn)行計(jì)算,并以此確保語音識別實(shí)時(shí)實(shí)現(xiàn)。
正式進(jìn)入訓(xùn)練階段后,務(wù)必對特征參數(shù)進(jìn)行一系列有效處理,即涉及于其中的每一個(gè)詞條都需要建立與之相對應(yīng)的模型,并將這一模型保存到模板庫中。進(jìn)入識別階段后,語音信號從同一個(gè)通道處通過便獲得語音特征參數(shù),緊接著便生成了測試模板,隨后匹配參考模板,并以此把匹配分?jǐn)?shù)最高的那一個(gè)參考模板當(dāng)作識別結(jié)果應(yīng)用到運(yùn)算環(huán)節(jié)。除此之外,還能夠通過很多先驗(yàn)知識的利用,來提升識別準(zhǔn)確率。
2.2 DSP實(shí)現(xiàn)技術(shù)
DSP實(shí)現(xiàn)技術(shù)為Digital Signal Processing英文縮寫,中文翻譯成數(shù)字信號處理技術(shù),作為一門多學(xué)科交融的新技術(shù),應(yīng)用DSP實(shí)現(xiàn)技術(shù)首先要實(shí)現(xiàn)浮點(diǎn)運(yùn)算定點(diǎn),而這需要應(yīng)用到數(shù)字信號處理算法,即在ASIC、DSP等專用處理設(shè)備的應(yīng)用下展開運(yùn)算操作。諸如:語音識別算法中,涉及到很多浮點(diǎn)運(yùn)算,而在語音識別程序編寫過程中,首先需要解決的問題是使用定點(diǎn)DSP將實(shí)現(xiàn)浮點(diǎn)運(yùn)算。針對這一問題,按照相關(guān)經(jīng)驗(yàn),可通過數(shù)定標(biāo)的方式來實(shí)現(xiàn)。
其次處理數(shù)據(jù)精度。使用16b定點(diǎn)DSP實(shí)現(xiàn)語音識別算法之時(shí),雖在一定程度上提高了程序運(yùn)行速度,但數(shù)據(jù)精度依然不高,分析其原因,極大可能是因?yàn)橹虚g運(yùn)算環(huán)節(jié)累計(jì)額誤差較大而影響到運(yùn)算結(jié)果的準(zhǔn)確性。要想提升數(shù)據(jù)運(yùn)算精度,除了適時(shí)擴(kuò)展精度外,還應(yīng)采用偽浮點(diǎn)法用以表示浮點(diǎn)數(shù)。
3 一種新型語音識別智能鎖的性能優(yōu)化設(shè)計(jì)
3.1 硬件性能優(yōu)化設(shè)計(jì)
首先針對基本的硬件模塊設(shè)計(jì)。利用聲音校對模塊再通過語音識別模塊來采集外界信息,而后把采集到的模塊信息傳送到SPCE061A型單片機(jī)中,再通過圖像識別模塊來辨識與處理接收到的信息,把最終判別結(jié)果輸送到開關(guān)控制模塊中,最后便達(dá)到語音識別智能鎖中。
其次針對圖像識別模塊設(shè)計(jì)。門禁系統(tǒng)若僅是依靠著語音識別功能進(jìn)行控制,那么便無法確保足夠的安全性,甚至有可能發(fā)生盜取合法用戶的聲音信息或非法入侵等情況,要想保證語音識別智能鎖使用的安全與穩(wěn)定,那么在設(shè)計(jì)環(huán)節(jié)便需要添加圖像識別模塊,其根本目的在于保證使用著合法身份。這一模塊主要是通過鎖內(nèi)安裝的攝像頭來獲取各種圖像信息,并將其傳輸?shù)綀D像處理芯片中,再在隱馬爾可夫人臉識別系統(tǒng)的應(yīng)用下,分析圖像信息,準(zhǔn)確對用戶身份進(jìn)行檢測和識別,以此保障用戶身份合法性。
3.2 軟件性能優(yōu)化設(shè)計(jì)
軟件程序流程需通過程序主模塊才能實(shí)現(xiàn),主模塊任務(wù)主要包括了調(diào)用子模塊對用戶進(jìn)行線性的輸入處理、硬件資源初始化和響應(yīng)用戶輸入等程序。
3.3 系統(tǒng)測試
本次設(shè)計(jì)主要針對同一功能反復(fù)進(jìn)行一百次左右的測試操作,其結(jié)果如下:
首先針對語音識別模塊的測試數(shù)據(jù),當(dāng)測試環(huán)境為低噪聲環(huán)境(<50dB)時(shí),成功次數(shù)達(dá)99次,失敗次數(shù)僅為1次,即成功率為99%;當(dāng)噪聲環(huán)境為噪聲環(huán)境(60dB~70dB) 時(shí),成功次數(shù)為97次,失敗次數(shù)為3次,即成功率為97%。其次針對報(bào)警模塊的測試數(shù)據(jù),測試方法選擇的是語音控制法,成功次數(shù)為100,失敗次數(shù)為0,即成功率為100%。最后針對圖像識別模塊的測試數(shù)據(jù),當(dāng)測試距離為1cm時(shí),成功次數(shù)為100次,失敗次數(shù)為0次,即成功率為100%;當(dāng)測試距離為10cm時(shí),成功次數(shù)為99次,失敗次數(shù)為1次,即成功率為99%;當(dāng)測試距離為25cm時(shí),成功次數(shù)為95次,失敗次數(shù)為5次,即成功率為95%。
從上述測試結(jié)果中反映出的情況可知,當(dāng)噪聲在70dB以下,且和使用者的距離在25cm以下時(shí),該種新型語音識別智能鎖可以準(zhǔn)確的識別出用戶語音內(nèi)容,并在圖像識別技術(shù)的結(jié)合應(yīng)用下驗(yàn)證用戶身份,確保其是在合法情況下使用該功能。
結(jié)論
綜上所述,基于日常防盜安全標(biāo)準(zhǔn),結(jié)合現(xiàn)代科學(xué)技術(shù),通過語音互動加載模塊的應(yīng)用可鎖定用戶聲音,并在語音識別功能的利用下,實(shí)現(xiàn)聲控功能,準(zhǔn)確分析與處理用戶信息,確保其在安全環(huán)境下使用該功能。且本文通過一系列系統(tǒng)測試,進(jìn)一步驗(yàn)證了這一功能安全應(yīng)用效果,如此便為人們安全、快捷的應(yīng)用這一功能提供了條件。
參考文獻(xiàn)
[1]曾輝,謝森林,董曉慶,等.一種新型語音識別智能鎖的設(shè)計(jì)與實(shí)現(xiàn)[J].韓山師范學(xué)院學(xué)報(bào),2013(3):38-40,49.
[2]鐘召輝.基于ZigBee的無線智能鎖系統(tǒng)設(shè)計(jì)[D].杭州電子科技大學(xué),2013.
[3]張萍,崔旺,劉曉冬,等.“芝麻開門”智能鎖設(shè)計(jì)[J].河北工業(yè)大學(xué)學(xué)報(bào),2015,44(2):20-23,27.
[4]金哲誠,聞新.基于RSC-300的一種智能語音密碼鎖的設(shè)計(jì)與實(shí)現(xiàn)[J].工業(yè)控制計(jì)算機(jī),2013,26(3):103,105.