基于LD3320的非特定人識別聲控燈系統(tǒng)設計

2015-07-28 12:23:40姜杰文

現(xiàn)代電子技術 2015年11期

姜杰文

摘要：計算機技術的飛速發(fā)展帶動語音識別技術不斷取得突破，功能日漸強大的語音控制系統(tǒng)正逐漸應用于實際生活中。LD3320是一款語音識別專用芯片，響應快，識別率高，系統(tǒng)結合STC11L08XE單片機及外圍電路和nRF24L01無線傳輸芯片進行了聲控燈系統(tǒng)總體結構及各個模塊的硬件選型和程序編寫，并基于非特定人完成了對聲控燈系統(tǒng)功能的靜態(tài)測試，識別率接近95%，實驗效果理想。該嵌入式系統(tǒng)體積小、功耗低、性能穩(wěn)定、實時性好，在生產(chǎn)和生活中具有較高實用價值。

關鍵詞：語音識別；聲控燈；非特定人； LD3320

中圖分類號： TN912.34?34 文獻標識碼： A 文章編號： 1004?373X（2015）11?0027?04

Design of LD3320?based voice?controlled light system for person?independent recognition

JIANG Jie?wen， JIANG Yan?ji， BING Xiao?huan， WANG Yang

（School of Software， Liaoning Technical University， Huludao 125105， China）

Abstract： Since the break?though of voice recognition technology is droved by rapid development of computer technology， the powerful voice control system is gradually applied in real life. LD3320 is a dedicated chip for voice recognition， with fast response and high recognition rate characteristics. The overall structure design of voice?controlled light system combines STC11L08XE， peripheral circuit and wireless transmission chip nRF24L01， in which hardware selection and software programming of each module are proceeded. The static test of the functions for voice? controlled light system based on person?independent was implemented， the recognition rate is approach to 95% and the experimental effect is satisfying. The proposed embedded system has the characteristics of small size， low power dissipation， stable performance and good real?time performance. It has high practical value in manufacture and living.

Keywords： voice recognition； voice?controlled light； person?independent； LD3320

0 引言

語音處理和識別技術始于20世紀50年代，經(jīng)過幾十年探索和研究已較為成熟，從特定人、孤立詞的識別到非特定人、大詞匯量連續(xù)語音的識別，一系列的突破使得語音成為人與計算機系統(tǒng)之間新的通訊手段。近年來，作為直接有效的人機交互方式，語音識別在工業(yè)生產(chǎn)控制、智能家居生活和醫(yī)療衛(wèi)生系統(tǒng)等方面應用日益廣泛，在嵌入式系統(tǒng)領域中，具有很高的研究及實用價值[1?2]。

本文設計開發(fā)了一種基于LD3320語音識別芯片的非特定人識別的聲控燈系統(tǒng)，采用兩級語音指令，分別控制兩盞不同顏色的LED小燈，實現(xiàn)用戶發(fā)出語音指令后精確控制小燈開關的功能，為人們的生產(chǎn)生活帶來便利[3?4]。

1 語音識別概述

語音識別過程主要包括語音信號的預處理、特征提取、訓練、模式匹配、識別結果幾個部分[5]。訓練通常離線完成，對預先收集好的海量語音、語言數(shù)據(jù)庫進行信號處理和特征提取，獲取語音識別系統(tǒng)所需要的“聲學模型”和“語言模型”，保存為模板庫。識別階段通常在線完成，用戶實時語音信號經(jīng)過相同的通道得到語音特征參數(shù)，生成測試模板，與參考模板進行匹配，將相似度最高的參考模板作為識別結果[6]。語音識別流程基本框圖如圖1所示。

按照識別對象即對說話人的依賴程度可分為特定人和非特定人的語音識別系統(tǒng)[7]。特定人指訓練和識別對象為專門的人，其他人的語音不能識別；非特定人的訓練和識別對象面向大眾，不區(qū)分個人，后者的實現(xiàn)難度要大得多。

2 聲控系統(tǒng)結構設計

考慮到嵌入式系統(tǒng)組件對成本、體積和集成度的要求，本系統(tǒng)采用的處理單元是宏晶科技生產(chǎn)的STC11L08XE單片機及其外圍電路，整個系統(tǒng)由語音輸入模塊（咪頭），語音識別模塊，無線傳輸模塊，控制模塊（繼電器），電源模塊和顯示模塊（紅色和綠色LED小燈各1）構成，系統(tǒng)總體框架圖如圖2所示。

系統(tǒng)啟動后，當語音輸入模塊即咪頭開始收集語音信號，每接收到一個語音信號后通過單片機和語音識別模塊進行識別并判斷，得到正確的語音指令后，執(zhí)行單片機程序，通過其TXD串口對外進行數(shù)據(jù)輸出，無線模塊A的RXD接收口接收數(shù)據(jù)并保持數(shù)據(jù)原樣，再通過無線信號發(fā)送至無線模塊B，無線模塊B根據(jù)接收的信號改變引腳電平來控制繼電器，進而控制LED等回路的閉合。

3 硬件選型

3.1 處理器

處理器是整個系統(tǒng)的核心，不同的應用領域、不同的用戶需求，對處理器的選擇是多樣化的。本文針對嵌入式語音識別系統(tǒng)設計，采用宏晶科技生產(chǎn)的主要用于語音識別的處理器STC11L08XE。其核心開發(fā)板結構具備嵌入式系統(tǒng)功能及所需外圍設備。規(guī)格為43 mm×29.7 mm，供電電壓為5 V。I/O口輸出高電平3.3 V，擁有8 KB的FLASH，512 B的SRAM，串口通信（TTL電平）方式。是高速/低功耗/超強抗干擾的新一代8051單片機，指令代碼完全兼容傳統(tǒng)8051，但速度快8～12倍。內部集成高可靠復位電路，適應高速通信，智能控制，強干擾場合。

在選擇此處理器時主要是出于體積小易開發(fā)角度來考慮。單片機原理圖如圖3所示。

3.2 語音識別模塊

LD3320是一款“語音識別”專用芯片，采用并行方式直接與STC11L08XE單片機相接。該芯片集成了語音識別處理器和外部電路，包括A/D、D/A轉換器、麥克風接口、聲音輸出接口等。其內部集成了快速穩(wěn)定的優(yōu)化算法，無需事先訓練錄音即可完成非特定人語音識別，不需要外接任何輔助芯片，直接集成在現(xiàn)有產(chǎn)品中就可以實現(xiàn)聲控及人機對話功能[8]。內部原理圖如圖4所示。

3.3 無線傳輸模塊

nRF24L01是一款工作在2.4～2.5 GHz世界通用ISM頻段的單片無線收發(fā)器芯片。無線收發(fā)器包括：頻率發(fā)生器、增強型SchockBurst?模式控制器、功率放大器、晶體振蕩器、調制器、解調器。輸出功率頻道選擇和協(xié)議的設置可以通過SPI接口進行設置[9]。當工作在發(fā)射模式下發(fā)射功率為-6 dBm時電流消耗為9 mA，接收模式時為12.3 mA，掉電模式和待機模式下電流消耗更低。

3.4 控制模塊

控制模塊主要指繼電器，這里選用1路繼電器，本模塊兼容3.3 V和5 V單片機信號控制使用，觸發(fā)電平為高電平（3～5 V都可以）。設計方式以3.3 V向上兼容5 V，采用光耦隔離信號更穩(wěn)定。

4 系統(tǒng)程序設計

系統(tǒng)程序在Keil μVision4軟件開發(fā)環(huán)境下采用C語言進行模塊化編程。工作流程包括系統(tǒng)初始化、指令設置、識別判斷、中斷處理等。

4.1 系統(tǒng)初始化

當單片機通電后系統(tǒng)軟件先從主函數(shù)開始執(zhí)行，在對系統(tǒng)進行初始化的過程中包括調用函數(shù)將單片機初始化，通過測試開發(fā)板小燈指示單片機是否工作。執(zhí)行相應函數(shù)復位LD3320芯片，再對串口進行初始化，還要通過設置LD模塊寄存器對其命令初始化以及ASR功能初始化。

4.2 指令設置

為降低其他音源影響，提高識別率，本系統(tǒng)采用兩級指令完成對系統(tǒng)的控制。向LD模塊添加關鍵詞時，通過編輯程序定義二維數(shù)組設定一級語音指令為“管家”，二級語音指令為“開紅燈”、“開綠燈”，設定指令時，添加拼音的輸入方式作為關鍵詞數(shù)組，例如添加“管家”命令，則寫入“guan jia”，漢字間的拼音用空格隔開。實現(xiàn)功能為接收語音指令“管家”時，開發(fā)板指示燈點亮，繼而接收語音指令“開綠燈”，LED綠燈點亮，接收語音指令“開紅燈”，LED紅燈點亮。

4.3 中斷處理

當LD模塊接收到音頻信號時，進入到中斷處理函數(shù)進行識別，讀取內部寄存器返回識別碼，若每次讀取到的識別結果在寄存器中可以找到對應數(shù)值，則判斷指令正確，將數(shù)據(jù)通過TXD串口對外進行輸出，此時無線傳輸芯片A的RXD接收口再把接收到的數(shù)據(jù)保持不變發(fā)送到另一個無線模塊B，B針對信號對于引腳進行高低電平控制，進而控制繼電器。芯片B的引腳置為高電平3.3 V的時候繼電器打開即為通路，連接在繼電器上面的小燈成功通電打開。當引腳置為低電平的時候小燈關閉。程序執(zhí)行流程圖如圖5所示。

4.4 部分代碼

向LD模塊添加關鍵詞的代碼如下，添加拼音關鍵詞，同時注意修改sRecog 和pCode 數(shù)組的長度，拼音串和識別碼一一對應。

uint8 LD_AsrAddFixed（）

{

uint8 k， flag；

uint8 nAsrAddLength；

#define DATE_A 8 /*數(shù)組二維數(shù)值*/

#define DATE_B 25 /*數(shù)組一維數(shù)值*/

uint8 code sRecog[DATE_A][DATE_B] = { "guan jia"，＼

"kai hong deng"，＼ "guan hong deng"，＼

"kai lv deng"，＼

"guan lv deng"，＼ }；

uint8 code pCode[DATE_A] = {

CODE_CMD，＼

CODE_KCFD，＼

CODE_GCFD，＼

CODE_KWSD，＼

CODE_GWSD，＼

CODE_KKTD，＼

CODE_GKTD，＼

CODE_FSG

flag = 1；

for （k=0； k

{

if（LD_Check_ASRBusyFlag_b2（） == 0）

{

flag = 0；

break；

}

LD_WriteReg（0xc1， pCode[k] ）；

LD_WriteReg（0xc3， 0 ）；

LD_WriteReg（0x08， 0x04）；

delay（1）；

LD_WriteReg（0x08， 0x00）；

delay（1）；

for （nAsrAddLength=0； nAsrAddLength

{

if （sRecog[k][nAsrAddLength] == 0）

break；

LD_WriteReg（0x5， sRecog[k][nAsrAddLength]）；

}

LD_WriteReg（0xb9， nAsrAddLength）；

LD_WriteReg（0xb2， 0xff）；

LD_WriteReg（0x37， 0x04）；

}

return flag；

}

5 測試結論與分析

為了更好地檢測語音指令識別效果和系統(tǒng)功能的實現(xiàn)，測試過程中選擇多個不同音色的人進行試驗，觀察非特定人群對系統(tǒng)的控制效果，每個語音指令測試100遍。部分非特定人語音指令識別結果見表1。表中數(shù)據(jù)表示試驗100次的成功次數(shù)。

由表1可見，該系統(tǒng)對于非特定人語音指令的識別準確率接近95%。誤識別率大約在5%，響應快，準確度高，實用性強。

6 結論

隨著語音識別技術的成熟發(fā)展，嵌入式功能的日漸強大，嵌入式語音控制系統(tǒng)的需求和應用也越來越廣泛。本文設計的基于LD3320的非特定人識別聲控燈系統(tǒng)，硬件模塊選型合理，程序功能設計完善，系統(tǒng)識別率高，穩(wěn)定性好，方便集成，較理想地實現(xiàn)了非特定人通過語音指令控制小燈系統(tǒng)開關的功能，在工業(yè)自動控制、醫(yī)療系統(tǒng)以及智能家居等很多領域具有廣闊的市場前景。

參考文獻

[1] 胡航.現(xiàn)代語音信號處理[M].北京：電子工業(yè)出版社，2014.

[2] [美]拉比納，[美]謝弗.數(shù)字語音處理理論與應用（英文版）[M].北京：電子工業(yè)出版社，2011.

[3] 陳喜春.基于LD3320語音識別專用芯片實現(xiàn)的語音控制[J].電子技術，2011（11）：20?21.

[4] OH Y R， YOON J S， PARK J H， et al. A name recognition based call?and?come service for home robots [J]. IEEE Transactions on Consumer Electronics， 2008， 54（2）：247?251.

[5] 周慧芳.基于HMM的嵌入式語音識別系統(tǒng)的研究[D].廣州：廣東工業(yè)大學，2011.

[6] RABINER L， JUANG B H. Fundamentals of speech recognition [M]. Englewood： Prentice?Hall， 1993.

[7] 顧亞強.非特定人語音識別關鍵技術研究[D].長沙：國防科技大學，2009.

[8] 金鑫，田犇，闕大順.基于LD3320的語音控制系統(tǒng)設計實現(xiàn)[J].電腦與信息技術，2011，19（6）：22?25.

[9] 劉志平，趙良國.基于nRF24L01的近距離無線數(shù)據(jù)傳輸[J].應用科技，2008，35（3）：55?58.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于LD3320的非特定人識別聲控燈系統(tǒng)設計