(中國電子科技集團公司第十研究所,成都 610000)
音響中心是機載航空電子系統(tǒng)的重要功能單元,它完成飛行員機內(nèi)通話、機外通話、指揮引導(dǎo)、飛行狀態(tài)告警等任務(wù),對飛機的安全和指揮控制起著關(guān)鍵的作用[1]。傳統(tǒng)的音響中心采用模擬音頻技術(shù)傳輸話音信號[2],由于模擬音頻設(shè)備存在易受干擾、頻帶窄、可靠性差、設(shè)備體積重量大等缺點,已不再適用于有減重需求、電磁環(huán)境復(fù)雜的航空電子領(lǐng)域應(yīng)用,因而數(shù)字音頻處理技術(shù)[3]應(yīng)運而生。數(shù)字音頻技術(shù)是將模擬聲音信號轉(zhuǎn)換為數(shù)字信號,通過現(xiàn)代數(shù)字處理方法處理、傳輸話音,數(shù)字音頻系統(tǒng)[4]具有抗干擾性強、設(shè)備體積小、重量輕、音頻信號質(zhì)量好等特點,因而本文提出了一種基于FPGA+DSP架構(gòu)的數(shù)字音頻處理系統(tǒng)。前端通過模擬音頻電路完成模擬音頻信號的A/D、D/A轉(zhuǎn)換,后端通過FPGA和DSP構(gòu)建數(shù)字處理平臺,完成數(shù)字音頻的抑制噪聲、話音增強等處理。
數(shù)字音頻處理系統(tǒng)由模擬音頻接口、數(shù)字音頻處理兩部分組成,系統(tǒng)框圖如圖1所示。其中模擬音頻接口包括輸入和輸出兩部分,輸入部分完成輸入模擬音頻信號的阻抗匹配、信號采集、濾波和預(yù)放大,并將處理后模擬音頻信號送入A/D芯片進行模/數(shù)轉(zhuǎn)換;輸出部分完成D/A芯片輸出信號的濾波、隔直和放大,輸出的模擬音頻信號驅(qū)動耳機、話筒等音頻設(shè)備。
數(shù)字音頻部分由FPGA、DSP及外圍存儲控制電路組成。FPGA作為A/D芯片與DSP間通信的橋梁,對A/D或D/A數(shù)據(jù)進行緩存、組幀和串并轉(zhuǎn)換,轉(zhuǎn)換后的數(shù)據(jù)通過LocalBus總線接口傳輸給DSP進行數(shù)據(jù)處理,同時FPGA單元完成A/D芯片初始化配置、DSP時鐘、復(fù)位信號輸出控制等功能;DSP單元作為系統(tǒng)的核心處理部分,完成數(shù)字音頻信號的混音、加權(quán)、編解碼和音頻處理算法等功能。
音頻接口電路主要包括輸入和輸出兩部分,輸入部分如圖 2所示。
圖1 數(shù)字音頻處理系統(tǒng)框圖
圖2 模擬音頻輸入接口電路
圖3 模擬音頻輸出接口電路
前端設(shè)計RC低通濾波器(由阻容網(wǎng)絡(luò)R3/C6、R6/C8組成),用于濾除音頻信號中的雜波干擾。由于音頻信號頻率范圍為300~3 400 Hz,為了有效濾除輸入音頻信號雜波并保證話音信號的平坦度,音頻輸入接口前端設(shè)計RC低通濾波器(由阻容網(wǎng)絡(luò)R3/C6,R6/C7組成),截止頻率設(shè)置為10 kHz左右,對輸入的差分音頻信號進行濾波,濾波后的信號經(jīng)隔直電容(C2/C5組成)去除直流分量后送入芯片MAX4062進行預(yù)放大,放大后的信號送入TPS721芯片進行單端信號到差分信號轉(zhuǎn)換,轉(zhuǎn)換后通過雙絞屏蔽電纜將差分信號傳給后端設(shè)備進行A/D采樣,這里采用差分信號傳輸有效降低了傳輸路徑電磁輻射對模擬信號的干擾和衰減,減小了信號的失真。
輸出音頻接口電路設(shè)計如圖3所示,由于D/A器件采用插值算法將數(shù)字信號轉(zhuǎn)換為模擬信號,D/A轉(zhuǎn)換后的模擬信號中含有低頻干擾和高頻雜波,音頻輸出接口前端由低通濾波器(阻容網(wǎng)絡(luò)C10/R10)和高通濾波器(阻容網(wǎng)絡(luò)C9/R8)組成,兩個濾波器疊加構(gòu)建了帶通濾波器,通帶設(shè)置為200~4 000Hz左右,這樣有效地濾除輸出音頻信號的雜波并保留了有用信息,濾波后的信號經(jīng)放大器(型號為OPA547)進行負反饋放大,放大后信號經(jīng)隔直電容(C11)除去直流分量后驅(qū)動耳機等音響設(shè)備。
A/D和D/A轉(zhuǎn)換電路完成模/數(shù)、數(shù)/模信號轉(zhuǎn)換功能,如圖4所示,采用TLV320AIC23B芯片完成A/D和D/A轉(zhuǎn)換,TLV320AIC23B是一款高性能的音頻編/解碼器,該芯片內(nèi)部集成A/D和D/A電路,由于TLV320AIC23B芯片由3.3 V電壓供電,單端輸入采樣,前端設(shè)計匹配電路,采用芯片INA2134及其周圍電阻網(wǎng)路完成信號匹配和差分單端轉(zhuǎn)換;
轉(zhuǎn)換后的單端信號送入TLV320AIC23B進行A/D轉(zhuǎn)換;D/A電路為A/D的逆過程,F(xiàn)PGA端將數(shù)字信號送入TLV320AIC23B的控制端,經(jīng)D/A轉(zhuǎn)換后由TLV320AIC23B模擬輸出引腳(9/10引腳)輸出驅(qū)動后端音響設(shè)備。
圖4 A/D和D/A電路
DSP和FPGA功能電路框圖如圖5所示,DSP作為系統(tǒng)的處理核心,采用ADI公司的高性能處理器ADSP-21368BBPZ,該款DSP是SHARC系列浮點處理器的產(chǎn)品,最高主頻為400 MHz,DSP最小系統(tǒng)包括時鐘單元、供電單元、復(fù)位邏輯和外擴的SDRAM存儲器和FLASH存儲器,其中DSP外部片選0分配給FLASH存儲器,用于存儲DSP固化程序以及音頻報警等,掉電不丟失數(shù)據(jù);DSP外部片選1分配給SDRAM存儲器,用于暫存程序代碼和其他運行數(shù)據(jù);DSP外部片選2分配給FPGA,用于對FPGA數(shù)據(jù)讀寫尋址;FPGA功能單元由時鐘、配置單元和FPGA組成,時鐘為FPGA工作提供時鐘源,配置單元存儲掉電不丟失的FPGA固化代碼,上電時完成FPGA配置加載,F(xiàn)PGA加載完成后輸出時鐘、復(fù)位信號完成DSP初始化配置;FPGA與DSP間通過LocalBus總線接口通信,F(xiàn)PGA完成A/D數(shù)據(jù)的緩存、組幀、串并轉(zhuǎn)換,并以中斷方式通知DSP取數(shù)。
圖5 DSP和FPGA功能電路框圖
話音活動檢測算法原理是[5]:語音與噪聲歸一化自相關(guān)函數(shù)中極大值(即能量)的概率分布不同,因而可利用能量來對濁音及非濁音(包括清音和噪聲)進行判斷。由于話音信號本身具有短時平穩(wěn)性,一般認為10~30 ms的時間范圍是準穩(wěn)態(tài)過程,在短時間內(nèi)把話音信號當(dāng)做一個穩(wěn)態(tài)過程,采用短時能量對話音信號進行激活檢測,假設(shè)第w幀話音信號Sw(n)的短時能量為Ew,計算短時能量公式如下所示:
其中N為幀長。預(yù)先設(shè)定一個閾值Y,當(dāng)短時能量Ew>Y時,判斷為話音;反之為噪聲。
基于短時能量的方法在信噪比較高時準確性較高,但當(dāng)信噪比較低時誤差較高,需要結(jié)合其它方法綜合判決,本文采用短時能量和過零率結(jié)合的話音端點檢測方法。語音信號的短時過零率ZCR[6]是指單位時間內(nèi)信號波形穿過橫軸(零電平)的次數(shù)。抽樣后的語音信號是離散的時間序列,其過零即是相鄰兩個采樣改變符號的次數(shù),定義為:
圖7 音頻處理仿真環(huán)境
其中sgn[.] 表示符號函數(shù),即
研究表明信號過零率較噪聲過零率低,當(dāng)ZCR大于設(shè)定閾值Z時,認為是噪聲;反之判定為話音。這樣通過短時能量和過零率相結(jié)合的算法,能夠準確檢測話音端點,減少誤判率和漏判率。
圖6 音頻處理算法 流程圖
為了獲得更好的通話效果,采用數(shù)字處理算法對話音信號進行處理。音頻處理算法流程圖如圖6所示。
如圖6所示DSP上電后運行初始化程序,完成A/D芯片、FLASH、SDRAM等硬件資源的初始化配置,同時設(shè)置中斷函數(shù)實時監(jiān)測是否有FPGA的緩存中斷,當(dāng)監(jiān)測到有中斷到來時調(diào)用中斷響應(yīng)函數(shù),讀取FIFO內(nèi)音頻數(shù)據(jù)。每次中斷函數(shù)讀取8 ms話音數(shù)據(jù),為了滿足音頻準平穩(wěn)信號特性,需將本次8 ms采集到的信號與前兩次(16 ms)采集的信號進行組幀,構(gòu)成24 ms音頻數(shù)據(jù),對組幀后的數(shù)據(jù)進行加窗,窗函數(shù)選擇Hanmming窗,加窗調(diào)制后的信號送入話音活動檢測模塊,若檢測到無話音活動送入舒適噪聲生成模塊重構(gòu)背景噪聲,噪聲生成模塊采用隨機白噪聲產(chǎn)生算法生成舒適白噪聲,以填補話音信號中無音段。若檢測到有話音活動送入自適應(yīng)噪聲抑制模塊進行降噪處理,經(jīng)噪聲抑制模塊去噪后的信號送入自動增益控制模塊[7],經(jīng)上述算法模塊處理后的音頻信號送入音頻輸出模塊,對數(shù)字音頻進行D/A變換、放大和匹配后輸出模擬音頻信號,驅(qū)動耳機、話筒等音響設(shè)備。
為了驗證數(shù)字話音處理系統(tǒng)的功能和性能,搭建如圖7所示驗證環(huán)境。實錄了一段在機載環(huán)境下信噪比為5 dB的飛行員話音信號作為輸入測試激勵,該信號是飛行員通話無線電設(shè)備和飛機發(fā)動機噪聲疊加的帶噪話音段,代表著一種常見、典型的機載音頻信號。話音信號處理前與處理后的結(jié)果如圖8所示。
圖8 數(shù)字話音處理系統(tǒng)效果圖
圖8(a)為信噪比為5 dB的輸入帶噪話音段,經(jīng)本系統(tǒng)處理后輸出的音頻信號如圖8(b)所示,從圖中可看出輸入信號為帶有強噪音的話音信號,經(jīng)過系統(tǒng)處理后有音無音段被準確地識別出來,無音段的噪聲信號被有效抑制,有音段的話音被明顯增強。
為了進一步評價話音信號質(zhì)量,采用主觀和客觀評價相結(jié)合的方法,其中主觀評價采用ITU組織在ITU-T P.800和P.830建議書中制定的測試標準:MOS[8](Mean Opinion Score)評分測試;客觀評價采用ITU組織推薦的語音傳輸質(zhì)量測試標準P.862-PESQ算法[9],選用基于PESQ算法開發(fā)的商用話音質(zhì)量測試儀進行測試,選取了10位受試者對不同信噪比的話音進行MOS評分和測試儀測試,測試結(jié)果如表1所列。
表1 話音質(zhì)量評價表
從表1可看出,對比不同信噪比條件下處理前后的話音信號,處理前話音信號評分較低,話音質(zhì)量較差;處理后話音信號評分有所提高,話音信號質(zhì)量較好,特別是在低信噪比條件下,處理前后的評分差值更大,話音質(zhì)量改善的效果更加明顯。另外通過多人主觀測試反映,輸入信號含有強噪聲的話音,音量強度忽強忽弱,舒適度差,處理后輸出的話音噪聲明顯減弱,話音平穩(wěn),可聽性好。試驗結(jié)果表明,數(shù)字話音處理系統(tǒng)能夠有效抑制噪聲并改善話音質(zhì)量,特別是對低信噪比條件下話音的增強起到了較好的作用。
[1] 李成文,楊軍祥.新一代直升機綜合核心處理機技術(shù)研究與實現(xiàn)[J].電子技術(shù)應(yīng)用,2014(12):121-124.
[2] 楊坤.模擬音頻技術(shù)與數(shù)字音頻技術(shù)研究[J].科技傳播,2015(7):90-91.
[3] 孫育紅.數(shù)字多媒體數(shù)據(jù)采編系統(tǒng)設(shè)計與實現(xiàn)[J].現(xiàn)代電子技術(shù),2017,40(15):122-125.
[4] 趙力.語音信號處理[M].北京:機械工業(yè)出版社,2016.
[5] Yonemori H,Maruyama R.A study on the Noise Suppression in High Frequency Acoustic Noise of IH Cooking Heater[J].Journal of the Japan Society of Applied Electromagnetics&Mechanics,2015,23(1):213-218.
[6] 紀振發(fā),楊暉,李然,等.基于短時自相關(guān)及過零率的語音端點檢測算法[J].電子科技,2016,29(9):52-55.
[7] Khing P P,Swanson B A,Ambikairajah E.The effect of automatic gain control structure and release time on cochlear implant speech intelligibility[J].Plos One, 2013,8(11):e82263.
[8] ITU-T Recommendation P.800. Methods for Subjective Determination of 17 Transmission Quality,1996.
[9] 陳曉翔,陸保體,林嘉宇.PESQ算法在軍事語音評估中的性能分析[J].微處理機,2014,35(1):35-40.
李聲飛(工程師),主要研究方向為航空機載音頻信號處理、總線技術(shù)。