孫衛(wèi)寧 農(nóng)浩 黃德華
【摘 要】自然保護(hù)區(qū)有著極為豐富的自然資源,很多保護(hù)區(qū)還擁有獨(dú)特的人文歷史,因此成為生態(tài)旅游活動的重要場所。旅游對保護(hù)區(qū)野生動物的影響很大,旅游噪聲污染是影響野生動物行為的最主要的因素。如何監(jiān)測和控制自然保護(hù)區(qū)的噪聲污染,已成為迫切需要攻克的科研項(xiàng)目。文章基于FPGA嵌入式系統(tǒng)實(shí)現(xiàn)對野外的聲音進(jìn)行24 h不間斷采集和處理,為自然保護(hù)區(qū)聲觀生態(tài)學(xué)研究積累本底數(shù)據(jù)和構(gòu)建研究基礎(chǔ),對指導(dǎo)廣西自然保護(hù)區(qū)的生態(tài)保護(hù)行為具有戰(zhàn)略價(jià)值和現(xiàn)實(shí)意義。
【關(guān)鍵詞】FPGA;聲音采集;硬件開發(fā)
【中圖分類號】TN912.3 【文獻(xiàn)標(biāo)識碼】A 【文章編號】1674-0688(2019)06-0058-04
本項(xiàng)目研究基于FPGA嵌入式系統(tǒng)實(shí)現(xiàn)對野外的聲音采集和處理,項(xiàng)目主要進(jìn)行硬件系統(tǒng)的設(shè)計(jì),對聲音進(jìn)行采集和存儲,根據(jù)野外采集到的聲音進(jìn)行提取,如蟲鳴、動物叫聲、人聲、雷聲等。
1 音頻的采集和分析
物體由于振動而產(chǎn)生聲音,聲音也是一種波,頻率和振幅是它的兩個重要的屬性,頻率對應(yīng)音高,振幅對應(yīng)聲音大小。聲音可以被分解為不同頻率、不同強(qiáng)度正弦波的疊加。一般我們把頻率、振幅和波形視作聲音的3個基本特征。頻率是指在單位時間內(nèi)物體振動時振動的次數(shù),它的測量單位為赫茲,頻率越高,音調(diào)越高。振幅是在振動時物體偏離中心位置的幅度大小,表示物體振動的范圍和強(qiáng)度,振幅越大,響度越大。波形是指波的圖像,頻率不同時,波形表現(xiàn)出彈簧式的伸縮;振幅不同時,波形表現(xiàn)出山峰式的起伏。了解聲音的特征后,就可以對聲音進(jìn)行采集,首先使用傳感器把聲音信號轉(zhuǎn)成電信號,也就是模擬信號,然后通過A/D轉(zhuǎn)換,把模擬音頻轉(zhuǎn)成數(shù)字音頻。在對模擬信號采樣中,采樣的頻率和采樣的位數(shù)決定了采樣的質(zhì)量。采樣頻率表示采樣的速度,即一秒鐘時間內(nèi)采集聲音樣本的數(shù)量,采樣頻率越高,說明單位時間采集的樣本數(shù)越多,重放時越能還原真實(shí)聲音,聲音越自然。采樣頻率單位是Hz(赫茲)。22.05 kHz、44.1 kHz、48 kHz這3個采樣頻率是日常工作常遇到的。在解決工程設(shè)計(jì)問題中我們常選擇這些頻率,F(xiàn)M廣播的聲音大多選用22.05 kHz,CD唱片則選擇44.1 kHz,人類的耳朵無法分辨48 kHz以上的聲音,高于48 kHz的采樣頻率在工程應(yīng)用中沒有實(shí)際意義[1]。根據(jù)奈奎斯特定律,在進(jìn)行模擬信號轉(zhuǎn)換成數(shù)字信號的轉(zhuǎn)換過程中,必須大于被采樣信號的帶寬。如果信號的帶寬是100 Hz,那么為了避免混疊現(xiàn)象,采樣頻率必須大于200 Hz。換句話說就是采樣頻率必須至少是信號中最大頻率分量頻率的2倍,才不會產(chǎn)生失真。采樣的位數(shù)就是處理聲音解析度,也叫量化位數(shù),目前常用的有8位、16位、24位的采樣位數(shù)。當(dāng)量化精度為8位時,一共有256個不同的量化值;當(dāng)量化精度為16位時,有65 536個不同的量化值。量化的精度越大,聲音的辨析度越大,聲音特征越好,能更容易分辨出不同的聲音。
音頻編碼采用脈沖編碼調(diào)制方式,脈沖編碼調(diào)制(Pulse Code Modulation,PCM)是由A.里弗斯于1937年提出的,這一概念為數(shù)字通信奠定了基礎(chǔ)。PCM是最簡單的波形編碼形式,它直接把音頻信號量化,表示成二進(jìn)制信號,通過串并轉(zhuǎn)換過程轉(zhuǎn)換為串行的脈沖,并用脈沖對樣本幅度進(jìn)行編碼,故稱為脈沖編碼調(diào)制(PCM)[2]。脈沖編碼調(diào)制就是把一個時間連續(xù)、取值連續(xù)的模擬信號變換成離散時間信號的過程。
2 硬件系統(tǒng)設(shè)計(jì)
硬件系統(tǒng)主要分為聲音數(shù)據(jù)采集模塊、模數(shù)轉(zhuǎn)換模塊、數(shù)據(jù)存儲模塊等,采集模塊把采集到的聲音通過傳感器進(jìn)行聲電轉(zhuǎn)換,通過運(yùn)放電路對信號進(jìn)行放大,得到滿足要求的電信號,輸出到A/D數(shù)據(jù)轉(zhuǎn)換模塊,采用wm8782高性能、低成本的立體聲音頻AD轉(zhuǎn)換芯片,對信號進(jìn)行模數(shù)轉(zhuǎn)換;以FPGA為核心的CPU,從A/D芯片中得到音頻數(shù)據(jù),根據(jù)在FPGA預(yù)定義好的聲音模型對音頻數(shù)據(jù)進(jìn)行采樣分析,對音頻數(shù)據(jù)進(jìn)行比對,把混合的音頻數(shù)據(jù)分離,按不同的類型進(jìn)行分類,再把分離的音頻數(shù)據(jù)通過數(shù)據(jù)總線發(fā)送到SD控制芯片,由SD控制芯片把數(shù)據(jù)寫入SD卡中進(jìn)行保存。硬件系統(tǒng)如圖1所示。
2.1 FPGA的選型
Altera是一家可編程邏輯器件的生產(chǎn)商,提供多種嵌入式產(chǎn)品,Cyclone系列提供低功耗、低成本、性能較好的設(shè)計(jì)需求,包括了時鐘管理、存儲器和存儲器的IO接口等。Cyclone IV E FPGA體系結(jié)構(gòu)包括115 K垂直排列的LE、以9-Kbit(M9K)模塊形式排列的4 Mbits嵌入式存儲器,以及266個18×18嵌入式乘法器,實(shí)現(xiàn)小于1.5 W的總功耗,產(chǎn)品廣泛應(yīng)用于汽車、計(jì)算機(jī)和消費(fèi)電子等領(lǐng)域。
Cyclone系列實(shí)現(xiàn)了陣列門的自定義設(shè)計(jì)功能,擁有比較豐富的引腳和IO接口,能夠?qū)崿F(xiàn)復(fù)雜的邏輯關(guān)系設(shè)計(jì)、數(shù)據(jù)管理和數(shù)據(jù)的并行計(jì)算。
2.2 信號采集
一般采用駐極體話筒進(jìn)行聲電的轉(zhuǎn)換,駐極體話筒具有體積小、結(jié)構(gòu)簡單、電聲性能好等優(yōu)點(diǎn),屬于最常用的電容話筒。
駐極體話筒的基本結(jié)構(gòu)由一片單面涂有金屬的駐極體薄膜與一個上面有若干個小孔的金屬電極(稱為背電極)構(gòu)成。駐極體面與背極相對,中間有一個極小的空氣隙形成一個以空氣隙和駐極體作絕緣介質(zhì),以背極和駐極體上的金屬層作為兩個電極構(gòu)成一個平板電容器[3]。在駐極體薄膜上分布有自由電荷,當(dāng)有聲音傳到駐極體話筒時,駐極體薄膜產(chǎn)生振動,平板電容器的容量發(fā)生變化,引起電容兩端電壓發(fā)生變化,產(chǎn)生電信號,實(shí)現(xiàn)聲電的轉(zhuǎn)換過程。
2.3 信號放大
駐極話筒產(chǎn)生微弱的電信號后,需要進(jìn)行信號的放大,采用Maxim推出的低成本、高品質(zhì)的麥克風(fēng)放大器MAX9814放大模塊(如圖2所示),具有噪聲的前置放大器、可變放大器、輸出放大器和控制電組成,可以對聲音大小進(jìn)行自動控制。當(dāng)聲音在近處發(fā)出時,如果聲音比較大,則降低增益,避免聲音的失真;當(dāng)聲音在遠(yuǎn)處發(fā)出時,如果聲音比較小,則提高增益,增加聲音清晰度。輸出放大器可以提供8 dB、18 dB、20 dB增益選擇,信號采集經(jīng)過MAX9814放大后,從MICOUT端輸出,接入AD模塊。
MICIN為采集信號輸入。MICOUT為信號放大輸出。BIAS為放大器偏置。CT定時電容連接,將電容連接至CT控制AGC的啟動時間和釋放時間。GAIN為三態(tài)放大器增益控制,GAIN=VDD,增益設(shè)置為40 dB;GAIN=GND,增益設(shè)置為50 dB;GAIN=懸空,無壓縮增益設(shè)置為60 dB。
2.4 信號的AD轉(zhuǎn)換
wm8782是一種高性能、低成本的立體聲音頻AD轉(zhuǎn)換芯片(如圖3所示),提供立體聲線路電平輸入和兩個控制輸入引腳,允許在3種標(biāo)準(zhǔn)的音頻接口模式運(yùn)作。一個內(nèi)部運(yùn)算放大器集成在芯片的前端,提供模擬輸入信號大于1 Vrms。該芯片還具有高通濾波器,以消除殘留的直流偏移。
wm8782提供主或從模式時鐘方案,能通過控制管腳輸入改變主、從工作模式,數(shù)字音頻輸出支持16~24 bits和8~192 kH。
wm8782特性:信噪比為100 dB('A'加權(quán)@ 48 kHz);THD-93dB(在-1dB);采樣頻率為8 ~192 kHz;主或從時鐘模式:系統(tǒng)時鐘(MCLK)分別為128 fs、192 fs、256 fs、384 fs、512 fs、768 fs。音頻數(shù)據(jù)接口模式:16~24 bit I2S,16~24位左,16~24位右對齊。電源電壓:模擬2.7~5.5 V;數(shù)字內(nèi)核2.7~3.6 V。
主模式采樣頻率見表1。采樣率選擇見表2。FSAMPEN引腳控制ADC采樣率,WM8782可以在8 kHz采樣率從操作到192 kHz。WM8782工作的最佳頻率為6.144 MHz。
2.5 數(shù)據(jù)存儲
SD卡(Secure Digital Memory Card)是一種基于半導(dǎo)體閃存工藝的存儲卡,擁有高容量、快速的數(shù)據(jù)傳輸率、攜帶方便等特點(diǎn),它被廣泛地應(yīng)用于便攜式裝置上。數(shù)據(jù)存儲使用SD卡的SPI模式進(jìn)行數(shù)據(jù)的讀寫操作。
SPI總線是Motorola公司提出的一個同步串行外設(shè)接口總線協(xié)議,采用主從方式進(jìn)行通信,一般有一個主設(shè)備和一個或多個從設(shè)備,使用至少4個端口,主要有主機(jī)輸入從機(jī)輸出MISO、主機(jī)輸出/從機(jī)輸入MOSI、串行時鐘SCK、CS使能信號。數(shù)據(jù)傳輸時,首先主控芯片發(fā)出CS使能信號,通知相應(yīng)的從芯片數(shù)據(jù)傳輸;其次主控芯片時鐘的下降沿將數(shù)據(jù)發(fā)送出去,在時鐘的上升沿讀取數(shù)據(jù);最后把得到的數(shù)據(jù)存儲到寄存器,換成串行數(shù)據(jù)存儲到SD卡,主控芯片撤銷CS信號,SPI傳輸結(jié)束[7](如圖4所示)。
SD卡的通信協(xié)議是一種簡單的命令/響應(yīng)的協(xié)議。全部命令由主機(jī)發(fā)起,SD卡接收到命令后返回響應(yīng)數(shù)據(jù)。SD卡上電后,進(jìn)入“Idle”狀態(tài),通過命令,進(jìn)行卡識別,主機(jī)會給SD卡假設(shè)一個工作電壓,并發(fā)送一個工作電壓CMD0復(fù)位命令給SD卡,為了驗(yàn)證電壓,SD卡通過CMD8命令分析操作條件是否正確,如果卡能夠在支持電壓下操作,響應(yīng)會傳回命令參數(shù)里設(shè)置的支持的電壓和檢測模式,如果卡不能在支持電壓下操作,就不會發(fā)送響應(yīng),并保持在“idle”狀態(tài)。主機(jī)對能正確識別的卡,順序發(fā)送命令進(jìn)行初始化,確定SD卡的類型(例如:標(biāo)準(zhǔn)卡或高容量)和數(shù)據(jù)的傳輸模式等。
主機(jī)和SD卡之間是通過尋址命令點(diǎn)對點(diǎn)進(jìn)行的。通過尋址命令的應(yīng)答來開始或停止數(shù)據(jù)傳輸,讀命令有塊讀(CMD17)、多塊讀(CMD18)、發(fā)送寫保護(hù)(CMD30)、發(fā)送SCR(ACMD51),以及讀模式的通用命令(CMD56);寫命令有塊寫(CMD24和CMD25)、編程CSD(CMD27)、鎖定/解鎖命令(CMD42),以及寫模式的通用命令(CMD56)。SD卡讀寫操作如圖5、圖6所示。
參 考 文 獻(xiàn)
[1]趙磊.基于FPGA的音頻信號處理的設(shè)計(jì)與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2012:17-18.
[2]龐維.基于FPGA的數(shù)字音頻系統(tǒng)的設(shè)計(jì)[D].長春:吉林大學(xué),2006:7.
[3]趙洪.駐極體話筒的結(jié)構(gòu)、原理與正確使用[J].電子制作,2003(11):58.
[5]Electronic Components Datasheet Search.MAX9814 DataSheet Maxim Integrated Products[EB/OL].http://www.alldatasheet.com/datasheet-pdf/pdf/27128/MA-
XIM/MAX9814.html,2017-12-08.
[6]Datasheet Archive Search Engine.WM8782 DataS-
heet Wolfson Integrated Products[EB/OL].http://
www.datasheetarchive.com/WM8782-datasheet.html,2016-08-12.
[7]唐磊.基于FPGA的SD卡控制器設(shè)計(jì)[J].器件與電路,2011(3):30.
[8]Matsushita Electric Industrial Co.,Ltd.(Panasonic)SanDisk Corporation Toshiba Corporation.SD Spec-
ifications Part 1 Physical Layer Simplified Specifica-
tion Version 2.00 SD[Z].2006:7-8.
[責(zé)任編輯:鐘聲賢]