林彬
【摘要】科技的發(fā)展日新月異,4G、5G技術(shù)的日漸成熟催生了相關(guān)行業(yè)領(lǐng)域的科技創(chuàng)新發(fā)展,對(duì)于麥克風(fēng)信號(hào)領(lǐng)域通信傳輸?shù)囊笠苍谠黾?,人們?duì)高品質(zhì)高穩(wěn)定的通信陣列信號(hào)處理需求也更加強(qiáng)烈,對(duì)語音信號(hào)處理需求也增大。本文通過介紹基于單片機(jī)的麥克風(fēng)陣列時(shí)延估計(jì)系統(tǒng),細(xì)致分析了單片機(jī)設(shè)計(jì)方案及麥克風(fēng)選型及陣列設(shè)計(jì),了解到單片機(jī)能夠非實(shí)時(shí)地計(jì)算出實(shí)驗(yàn)中的陣列系統(tǒng)時(shí)延,幫助復(fù)雜的麥克風(fēng)陣列時(shí)延估計(jì)實(shí)時(shí)性的研究,可實(shí)現(xiàn)對(duì)麥克風(fēng)陣列聲源定位等理論知識(shí)研究應(yīng)用分析。
【關(guān)鍵詞】麥克風(fēng);陣列;時(shí)延;單片機(jī);語音信號(hào)
中圖分類號(hào):G212? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? DOI:10.12246/j.issn.1673-0348.2023.09.067
1. 麥克風(fēng)陣列
麥克風(fēng)陣列是由一定數(shù)目的聲學(xué)傳感器(麥克風(fēng))按照一定規(guī)則排列的多麥克風(fēng)系統(tǒng)。而聲源定位,是指運(yùn)用麥克風(fēng)拾取聲音信號(hào),再通過對(duì)麥克風(fēng)陣列信號(hào)的分析與處理,得到一個(gè)或者多個(gè)聲源的位置信息定位聲源位置。麥克風(fēng)陣列系統(tǒng)的聲源定位技術(shù)研究意義在于:當(dāng)輸入的信息只有兩個(gè)方向,難以確定聲源的位置。人類的聽覺系統(tǒng)是個(gè)兩個(gè)傳感器的拾音系統(tǒng),原則上,任意兩個(gè)傳感器的拾音定位系統(tǒng)只能定位在一個(gè)平面上聲源的位置距離,但無法知道聲音是從前面還是后面任何相同距離的聲源傳來的。人耳取決于頭和外耳氣壓差聲波實(shí)現(xiàn)聲源定位。一個(gè)傳感器定位系統(tǒng)對(duì)三維空間里某個(gè)聲源進(jìn)行定位,需要最少三個(gè)傳感器來定義聲源在三維空間中的坐標(biāo)。麥克風(fēng)的數(shù)量越多,所接收到的信息量也越多,聲源的精確定位也變成可能。
麥克風(fēng)陣列的聲源定位技術(shù)首先是對(duì)聲音信號(hào)進(jìn)行采樣,再通過麥克風(fēng)陣列對(duì)信號(hào)進(jìn)行處理,得到聲源到達(dá)陣列的波達(dá)方向,從而定位聲源的位置信息。隨著技術(shù)創(chuàng)新與發(fā)展,基于麥克風(fēng)陣列的聲源定位技術(shù)已經(jīng)形成了比較成熟的理論基礎(chǔ)。但對(duì)于其聲源定位方法可以分為基于到達(dá)時(shí)延估計(jì)算法、基于最大輸出功率的可控波束形成算法和高分辨率譜估計(jì)算法三種計(jì)算方法。但人們常用的聲源定位信號(hào)處理方法是基于時(shí)延的定位算法,因?yàn)檫@種算法定位精度高,所以被廣泛使用。
2. 關(guān)于聲源定位
目前基于麥克風(fēng)陣列的聲源定位方法主要有三種:基于最大輸出功率的可控波束成形和基于高分辨譜估計(jì)以及基于到達(dá)時(shí)延差估計(jì)的定位方法。首先波束形成法的原理是將麥克風(fēng)接收到的信號(hào)進(jìn)行濾波加權(quán)求和來形成波束,再按照特定的規(guī)律對(duì)聲源位置進(jìn)行搜索定位,最終得到麥克風(fēng)最大輸出功率時(shí),即為真實(shí)的聲源方位。而基于高分辨率譜估計(jì)的定位方法適合多個(gè)聲源的情況下,是通過分解協(xié)方差矩陣估計(jì)聲源方位,突破了物理限制,模糊了聲源的分辨率與陣列尺寸之間的關(guān)系。優(yōu)點(diǎn)是在特定條件下可以實(shí)現(xiàn)任意程度的聲源定位,并且不受采樣頻率限制。但是計(jì)算系統(tǒng)比較復(fù)雜,抗噪和抗混響性能較差,因此該方法對(duì)環(huán)境要求比較高。基于到達(dá)時(shí)延差估計(jì)的定位方法可以拓展到寬帶處理模式,但是對(duì)數(shù)據(jù)誤差十分敏感,通常適合遠(yuǎn)場(chǎng)模型,且矩陣的運(yùn)算量巨大,必須運(yùn)用麥克風(fēng)陣列克服,充分利用每個(gè)麥克風(fēng)信號(hào)之間的數(shù)據(jù)相關(guān)性,加以融合來實(shí)現(xiàn)聲源定位。
對(duì)于語音信號(hào)處理的發(fā)生過程,先是增強(qiáng)單個(gè)麥克風(fēng)信號(hào)的語音信號(hào),提高信噪比。然后,為了應(yīng)對(duì)聲學(xué)環(huán)境的復(fù)雜性特點(diǎn),人們接著實(shí)現(xiàn)了多麥克風(fēng)按照一定的空間位置排列的麥克風(fēng)陣列信號(hào)處理。同時(shí)需要對(duì)麥克風(fēng)陣列進(jìn)行處理,去掉干擾信號(hào),減少雜音的影響,從而增強(qiáng)語音信號(hào)。
麥克風(fēng)陣列處理技術(shù)為麥克風(fēng)系統(tǒng)提供了更好的穩(wěn)定性,是語音信號(hào)增強(qiáng)及處理的重要部分。陣列處理方法通常包括固定波速形成算法和自適應(yīng)波速形成算法兩種。波速形成對(duì)空間噪聲有更好的抑制效果,逐漸成為陣列信號(hào)處理的主流,其中自適應(yīng)波速形成算法中的時(shí)延估計(jì)成為陣列處理中的重要一環(huán)。雖然時(shí)延估計(jì)的算法很多,但是能夠?qū)嶋H應(yīng)用的卻很少,這就歸結(jié)于研究人員的研究方向和實(shí)際使用效果。除去波速形成算法外,對(duì)于麥克風(fēng)處理技術(shù)還有多種關(guān)鍵技術(shù),比如:混響消除是為了降低聲波的多次反射和吸收,提高聲音的真實(shí)效果;回聲消除是為了更真實(shí)地保留外界聲響,消除設(shè)備本身反射聲響;陣列增益為了解決拾音距離問題,抑制噪音增強(qiáng)設(shè)備聲響。
3. 單片機(jī)麥克風(fēng)
單片機(jī)(Single-Chip Microcomputer)是一種集成電路芯片,它采用超大規(guī)模集成電路技術(shù)把各種電子電路集成到一起,其中包括具有數(shù)據(jù)處理能力的中央處理器CPU、隨機(jī)存儲(chǔ)器RAM、只讀存儲(chǔ)器ROM、多種I/O口和中斷系統(tǒng)、定時(shí)器/計(jì)數(shù)器等功能(可能還包括顯示驅(qū)動(dòng)電路、脈寬調(diào)制電路、模擬多路轉(zhuǎn)換器、A/D轉(zhuǎn)換器等電路)等,最終集成到一塊硅片上,從而構(gòu)成的一個(gè)小而完善的微型計(jì)算機(jī)系統(tǒng),并在工業(yè)控制、電子電器等領(lǐng)域中廣泛應(yīng)用。從最早的4位、8位單片機(jī),經(jīng)過長期的發(fā)展直到現(xiàn)在的高速單片機(jī),后續(xù)也許還會(huì)有集成更高、性能更高的單片機(jī)出現(xiàn)。
單片機(jī)采集麥克風(fēng)的信號(hào)一般來說是不能直接采集的,要加一個(gè)外圍芯片,麥克風(fēng)出來的信號(hào)一般來說是頻率信號(hào),外圍芯片的作用就是把頻率信號(hào)轉(zhuǎn)換為電壓信號(hào),再通過單片機(jī)的A/D口采集。還有另外一種方案是直接采集頻率信號(hào),只能通過通信的方式,設(shè)置單片機(jī)的一個(gè)定時(shí)器時(shí)鐘為外部時(shí)鐘,麥克風(fēng)的頻率信號(hào)連接這個(gè)時(shí)鐘引腳用自帶的晶振再設(shè)置一個(gè)定時(shí)器,通過定時(shí)器來判斷外部時(shí)鐘來了多少個(gè)周期來計(jì)算頻率,如果麥克風(fēng)聲音頻率過高會(huì)造成信號(hào)失真,所以一般不采取這個(gè)方案。
4. 單片機(jī)設(shè)計(jì)方案
基于DS聲源定位和AT89C52單片機(jī)設(shè)計(jì)的麥克風(fēng)陣列語音增強(qiáng)系統(tǒng)基于延遲疊加聲源定位的原理,提出了一個(gè)四通道語音增強(qiáng)的設(shè)計(jì)方案,這里將介紹硬件和軟件設(shè)計(jì)的原理,硬件設(shè)計(jì)包括單片機(jī)、數(shù)模轉(zhuǎn)換和模數(shù)轉(zhuǎn)換器、電路連接等等。設(shè)計(jì)采用了軟件和硬件相結(jié)合的方法循環(huán)緩沖區(qū),為軟件實(shí)時(shí)運(yùn)行提供可能性。
麥克風(fēng)陣列廣泛應(yīng)用于語言通信應(yīng)用程序的時(shí)空過濾,比如汽車環(huán)境等的有效的語音處理。因此,麥克風(fēng)陣列語音增強(qiáng)的技術(shù)已經(jīng)成為語音增強(qiáng)處理的重點(diǎn)。空間濾波是一種基于麥克風(fēng)陣列的信號(hào)采集的基本特征,在應(yīng)用程序中扮演了一個(gè)重要的角色,比如語音增強(qiáng)和語音識(shí)別。有的專家設(shè)計(jì)了一個(gè)便宜的麥克風(fēng)陣列實(shí)現(xiàn)了一個(gè)特定的語音增強(qiáng)技術(shù),首先,介紹了聲源定位延遲疊加原理用于語音增強(qiáng)。其次,提出了語音增強(qiáng)系統(tǒng)的設(shè)計(jì)方案,包括硬件和軟件設(shè)計(jì)。硬件設(shè)計(jì)使用AT89C52單片機(jī),ADS8515模數(shù)轉(zhuǎn)換器和DAC8820數(shù)模轉(zhuǎn)換器等。
波束形成是根據(jù)所需信號(hào)的位置,從噪聲和干擾區(qū)分空間濾波的方法。波束形成技術(shù)是DS聲源定位實(shí)現(xiàn)定向陣列系統(tǒng)的最簡(jiǎn)單和最古老的技術(shù)。由于有帶寬,因此大部分麥克風(fēng)陣列語音采集的實(shí)現(xiàn)為DS聲源定位。DS聲源定位已經(jīng)廣泛的應(yīng)用于測(cè)量,聲源定位,DOA估計(jì),免提語音應(yīng)用程序等等。DS聲源定位是通過適當(dāng)補(bǔ)償信號(hào)延遲到每個(gè)麥克風(fēng)之前結(jié)合使用一個(gè)加法運(yùn)算,這延遲信號(hào)求和的結(jié)果是一個(gè)加強(qiáng)版的期望信號(hào)從不同的渠道減少噪音。
5. 麥克風(fēng)選型與陣列設(shè)計(jì)
對(duì)于聲源定位系統(tǒng)來講,麥克風(fēng)陣列是最前端設(shè)備,麥克風(fēng)陣列的性能優(yōu)劣直接影響聲源定位的精準(zhǔn)度。因此對(duì)麥克風(fēng)的選型及陣列的設(shè)計(jì)非常重要,關(guān)系著整體系統(tǒng)的最終效果,在對(duì)聲源定位系統(tǒng)設(shè)計(jì)之前必須作好麥克風(fēng)陣列性能的設(shè)計(jì)預(yù)判,選擇合適的麥克風(fēng)類型。
麥克風(fēng)的種類繁多,可以根據(jù)結(jié)構(gòu)造型分為動(dòng)圈式、電容式、壓電式等;還可以根據(jù)適用方式分為有線和無線;根據(jù)接受聲波方向分為定向麥克風(fēng)和全向麥克風(fēng)。對(duì)于聲源定位系統(tǒng)中常用的麥克風(fēng)就是動(dòng)圈式和電容式兩種。
動(dòng)圈式麥克風(fēng)常應(yīng)用于演出現(xiàn)場(chǎng)、音視頻娛樂場(chǎng)所等,而電容式麥克風(fēng)則應(yīng)用于消費(fèi)電子領(lǐng)域。但在聲源定位系統(tǒng)中,人們綜合考慮常用電容式麥克風(fēng)作為首選。
電容式麥克風(fēng)主要包括駐極體麥克風(fēng)和微型機(jī)電系統(tǒng)麥克風(fēng),而微型機(jī)電系統(tǒng)麥克風(fēng)有相對(duì)的優(yōu)勢(shì)就是功耗低、成本低、穩(wěn)定性好。因此常用來構(gòu)成麥克風(fēng)陣列系統(tǒng)。而對(duì)于聲源定位系統(tǒng)來講,還需要對(duì)麥克風(fēng)性能參數(shù)做出具體的要求,選定合適型號(hào)的麥克風(fēng),具體要求為:
⑴為了適應(yīng)環(huán)境的需求需要接收到各個(gè)方位的聲音,并去除單向麥克風(fēng)帶來的聲學(xué)問題,定位系統(tǒng)一般選取全指向性麥克風(fēng);
⑵為了對(duì)不同信號(hào)更好地接收,對(duì)麥克風(fēng)的靈敏度的選擇居中為宜,過高或者過低的靈敏度都會(huì)影響聲音信號(hào)的接收;
⑶為了對(duì)頻率響應(yīng)范圍的最大化接受,應(yīng)該根據(jù)環(huán)境和接受聲音的頻響范圍做設(shè)定,選擇合適的頻響功率,比如人聲頻率響應(yīng)范圍應(yīng)該在200Hz~10kHz左右;
⑷對(duì)于麥克風(fēng)輸出阻抗的選擇也應(yīng)該適中,過高過低都會(huì)影響,或者阻抗噪聲能力差,或者麥克風(fēng)靈敏度偏低。
同時(shí)聲源定位技術(shù)在助聽器行業(yè)、軍事國防領(lǐng)域、智能機(jī)器人等系統(tǒng)也有廣泛的應(yīng)用。但隨著社會(huì)發(fā)展的需求,電子設(shè)備向多樣化、小型化發(fā)展,對(duì)于聲源定位技術(shù)來說,如何構(gòu)建結(jié)構(gòu)簡(jiǎn)單、低成本、高精度的小型定位系統(tǒng),是今后需要重點(diǎn)關(guān)注的方向。由于基于到達(dá)時(shí)延估計(jì)的雙步定位法的特殊算法問題,在大型聲源定位系統(tǒng)中已經(jīng)廣泛應(yīng)用,但是對(duì)于小型聲源定位系統(tǒng)來說,這種算法就相對(duì)復(fù)雜化了,限制了其推廣應(yīng)用。因此還需要尋找多種算法對(duì)應(yīng)不同的環(huán)境需求。對(duì)于各種條件下的麥克風(fēng)陣列聲源定位系統(tǒng)的研究,就需要相關(guān)人員更多的努力。目前對(duì)于麥克風(fēng)陣列聲源定位系統(tǒng),部分專家已經(jīng)能夠使其在8位單片機(jī)中實(shí)現(xiàn)。
關(guān)于算法的研究中,有的研究人員首先針對(duì)基于時(shí)延估計(jì)的聲源定位,介紹了時(shí)延估計(jì)算法的基本原理,給出了各個(gè)算法本身的優(yōu)缺點(diǎn)。其次,通過GCC方法利用頻域加權(quán)函數(shù)對(duì)信號(hào)進(jìn)行濾波,但是如果再運(yùn)用8位單片機(jī)實(shí)現(xiàn)時(shí),會(huì)受到容量限制,難以實(shí)現(xiàn)理想效果。因此可以針對(duì)特定音頻信號(hào)的時(shí)延估計(jì),可以設(shè)計(jì)一種結(jié)合匹配濾波與互相關(guān)的時(shí)延估計(jì)方法。再根據(jù)8位單片機(jī)的硬件條件限制要求,對(duì)時(shí)延估計(jì)進(jìn)行了優(yōu)化設(shè)計(jì),合理匹配存儲(chǔ)量和計(jì)算量的實(shí)際需求。再次,以單片機(jī)作為硬件平臺(tái)基礎(chǔ),基于8位單片機(jī)的硬件要求,設(shè)計(jì)一種聲音識(shí)別與測(cè)向功能的控制器,用于麥克風(fēng)陣列接收聲音信號(hào)的控制單元,通過8位單片機(jī)來對(duì)聲音進(jìn)行檢測(cè)、前后識(shí)別、模式識(shí)別,以及測(cè)向系統(tǒng)的時(shí)延估計(jì),最終設(shè)計(jì)成為結(jié)合匹配濾波與互相關(guān)的時(shí)延估計(jì)算法。最后,根據(jù)實(shí)際環(huán)境需求對(duì)控制器進(jìn)行測(cè)試調(diào)試,得出實(shí)驗(yàn)結(jié)果。明確顯示該設(shè)計(jì)系統(tǒng)算法具有更高的實(shí)時(shí)性和抗噪聲性能,并且簡(jiǎn)單化、運(yùn)算量小,可以運(yùn)用到實(shí)時(shí)定位系統(tǒng)中。
6. 結(jié)束語
本文通過對(duì)聲源定位系統(tǒng)的介紹以及單片機(jī)硬件的設(shè)計(jì)的分析,解釋了一部分關(guān)于聲源定位系統(tǒng)的時(shí)延算法,在單片機(jī)內(nèi)直接把兩路語音信號(hào)的時(shí)延差非實(shí)時(shí)的求出。有的專家在一定程度上已經(jīng)設(shè)計(jì)出無論是從需求還是運(yùn)算量或者速度上都可以完美呈現(xiàn)效果的聲源定位系統(tǒng),這就為后續(xù)的實(shí)時(shí)時(shí)延算法的設(shè)計(jì)提供了參考,也更方便完善復(fù)雜的陣列信號(hào)處理。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展與實(shí)際行業(yè)的融合,陣列信號(hào)定位系統(tǒng)正在向多樣化、多媒體化以及多業(yè)務(wù)融合方向發(fā)展。單片機(jī)正從以傳統(tǒng)單片機(jī)向多位單片機(jī)發(fā)展,同時(shí)多媒體信息業(yè)務(wù)也趨向轉(zhuǎn)變,增值業(yè)務(wù)種類增加。網(wǎng)絡(luò)架構(gòu)呈分層趨勢(shì),規(guī)范的能力層接口使越來越多的業(yè)務(wù)開發(fā)者無須深刻了解這種技術(shù)便能從事聲源系統(tǒng)的開發(fā),所有這些變化都將導(dǎo)致單片機(jī)的類型和數(shù)量呈幾何級(jí)數(shù)增長。把麥克風(fēng)利用到單片機(jī)上正是在此背景下提出的,同時(shí)概念性運(yùn)行環(huán)境也是一種顛覆傳統(tǒng)業(yè)務(wù)平臺(tái)的建設(shè)模式,屬于完全不同的創(chuàng)新性建設(shè)模式。通過對(duì)麥克風(fēng)的關(guān)鍵影響因素進(jìn)行研究分析,為麥克風(fēng)在單片機(jī)上的應(yīng)用找到理論依據(jù)和技術(shù)創(chuàng)新方式,提高麥克風(fēng)陣列系統(tǒng)工作效率,簡(jiǎn)化聲源定位系統(tǒng)維護(hù)管理工作,實(shí)現(xiàn)聲源定位系統(tǒng)的廣泛應(yīng)用,為國家新時(shí)代建設(shè)提供技術(shù)支持。
參考文獻(xiàn):
[1]李樹德,黃頌,劉彩霞,柳佳.基于TC264單片機(jī)的智能無人小車設(shè)計(jì)[J].桂林航天工業(yè)學(xué)院學(xué)報(bào),2021,26(04):435-440.
[2]郭龍霞.一種基于互相關(guān)算法的二維聲源定位系統(tǒng)[J].中國科技信息,2021(12):98-99.
[3]吉愛國,劉偉平,劉志強(qiáng),劉棟,宋傳旺.麥克風(fēng)陣列近場(chǎng)聲源定位與跟蹤系統(tǒng)[J].信息記錄材料,2019,20(07):149-152.
[4]王宇威,雍洋,孫新.基于麥克風(fēng)陣列的聲源跟蹤系統(tǒng)[J].電子產(chǎn)品世界,2018,25(12):48-51.
[5]支艷利,張?jiān)苽?基于環(huán)形麥克風(fēng)陣列的遠(yuǎn)場(chǎng)語音識(shí)別系統(tǒng)[J].微型電腦應(yīng)用,2017,33(04):62-64,73.