王曉力 吳凱寧 康曉璐 騰白玉 李紅濤
兒童助聽器驗配中方向性模式選擇分為全向性和方向性2種,全向性是指助聽器麥克風對來自各個方向的聲信號靈敏度一致,沒有明顯的臨近效應;方向性是指助聽器麥克風對某個方位(通常是正前方)聲信號靈敏度更高。驗配師根據(jù)患者需求進行選擇。在選擇兒童公式時一般會默認為全向性。據(jù)報道,全向性模式(omnidirectional,OMNI)較方向性模式能夠提供更多的學習機會[1,2]。當助聽器程序選擇為全向性模式時,存在少量競爭的說話者情況下,言語噪聲是否影響言語識別是一個值得思考和研究的問題,尤其在課堂環(huán)境中使用自適應方向性時,環(huán)境中語音衰減是值得關注的問題。
本研究目的是評估一種完全自適應定向降噪技術的助聽器算法在競爭噪聲和競爭語音中對兒童語音識別的效果,以期驗證使用方向性和降噪相結合的算法,在以下兩種情況是否比全向性麥克風算法獲得更好的言語識別能力:(1)背景聲為合成的言語波形噪聲(speech-shaped noise,SSN);(2)背景聲為兩個真實的言語聲錄音。在參與者沒有直接面對目標聲源,以及當背景中存在兩個語音的情況下,兩種助聽器設置是否會產生相似的言語識別率表現(xiàn)。
選取14名聽障兒童參與實驗。所有受試者的平均純音聽閾(PTA)為輕度到重度。年齡5~14歲,平均年齡10.7±2.3歲。入選標準:①雙側感音性/神經性聽力損失;②采用雙側放大方案;③母語為漢語;④無已知慢性中耳炎病史。聽障兒童純音閾值見表1。
表1 聽障兒童純音閾值表
1.2.1 完全自適應方向性程序 本研究評估集成化方向性麥克風及降噪算法,奧迪康的完全自適應方向性程序,AI全聲景領航系統(tǒng)(more sound intelligence,MSI)。該算法是全自動方向性及快速降噪技術的組合。MSI使用雙麥克風,一個全向性麥克風進行聲音捕捉響應,后置心形麥克風確定環(huán)境中的噪聲源和語音源的水平、空間位置。之后由深度神經網(wǎng)絡對收集到的聲學信號進行處理,輸出精準降噪后的聲學信號。MSI技術的既定目標之一就是在分析不同競爭性聲音來源后應用方向性和降噪[3]。
1.2.2 助聽器驗配及驗證 測試前,聽障兒童兩側使用奧迪康More RITE助聽器。受試兒童共14名,女5男9,測試年齡平均10.7±2.3歲,范圍5.8~13.4,助聽器使用時間平均6.7±2.5年,范圍5.1~11.4年。65 dB SPL輸入下助聽后語音可懂度指數(shù)SII,左耳平均77.9%±9.9%,范圍62%~90%,右耳平均77.8%±11.7%,范圍57%~87%。65 dB SPL輸入下最大可聽頻率,左耳平均6000±1709 Hz,范圍3000~8000 Hz,右耳平均6321±1835 Hz,范圍3500~8000 Hz。所有受試者均使用奧迪康6~10 mm耳塞。助聽器的驗配和驗證由1名聽力師使用Audioscan Verifit (version 2.0)完成。驗配目標值是基于聽障兒童個人的聽閾和真耳耦合腔差異所得,使用公式DSL [i/o]v5.0 (desired sensation level [i/o]v5.0)。利用真耳設備的探測麥克風確保助聽器的增益和最大輸出水平。通過微調使增益盡可能接近規(guī)定目標,之后復制助聽器程序,以創(chuàng)建具有相同增益和最大輸出水平的第2個程序。一個程序設置為全向性,另一個程序設置為MSI,將兩種程序視作兩組助聽器設置。MSI設置中,自動方向性和降噪設置都被激活。使用制造商專有的助聽器配套軟件將MSI調整到最強設置。在全向性設置中降噪未被激活,選擇“耳郭全向性”作為方向性設置。兩程序中其他功能和設置均相同。反饋系統(tǒng)、移頻技術未激活,音量控制被禁用。
目標刺激材料為普通話兒童詞匯相鄰性單音節(jié)詞表[4],為標準普通話男聲錄制。掩蔽聲為兩段獨立的語音,或是兩段不同的SSN樣本在測試過程中不斷播放。兩段獨立語音為《太陽與東風》片段。保證所錄語音中沉默間隔不超過300 ms,若存在超過300 ms的空白將被識別并手動編輯到大約100 ms。創(chuàng)建兩個不同的SSN樣本,對應每個掩蔽揚聲器記錄的長時功率頻譜。
聽障兒童測試時坐在聲場中心,距離4個球型揚聲器(Elipson planet M)1.2米。揚聲器分別位于聽力障礙兒童0°、135°、225°和300°方向。聽障兒童始終面向0°方向。SSN或掩蔽語音總是從聲入射方位角為135°和225°的揚聲器中發(fā)出。聽障兒童在以下3種聆聽環(huán)境下接受測試。
第一種,目標詞的聲入射方位角為0°,掩蔽聲是兩個不同的SSN樣本。一個SSN樣本的聲入射方位角為135°,另一個樣本的聲入射方位角為225°。第二種,目標詞的聲入射方位角為300°,而掩蔽語音則是第一種環(huán)境下使用的SSN樣本。一個SSN樣本的聲入射方位角為135°,另一個為225°。第三種,目標詞的聲入射方位角為0°,而掩蔽聲為連續(xù)的語音。聲入射方位角為135°的揚聲器播放一段語音,聲入射方位角225°的揚聲器播放另一段語音。這3種聆聽環(huán)境分別被標記為A-在掩蔽噪聲下面對目標言語、B-在掩蔽噪聲下聽遠處(側方)目標言語和C-在掩蔽言語下面對目標言語。
該測試在聲場下完成,被試在標準隔音室中完成測試,環(huán)境噪聲水平24.4 dBA。測試中佩戴耳機麥克風(Shure Microflex MX153),房間外的測試人員通過耳機聽到被試反應,并實時記錄。測試過程中使用兩臺計算機,一臺記錄被試反應一臺監(jiān)控和觀察受試者狀態(tài)。如果被試對聽到的單詞不確定,將對被試鼓勵其進行猜測回答。如果被試在目標詞出現(xiàn)后約5秒內沒有做出反應,測試者判為不正確。
目標詞以65 dB SPL的固定水平呈現(xiàn)。在每次測試前隨機替換目標詞。使用“一上一下”規(guī)則[5]改變掩蔽聲水平,并測量50%正確單詞識別時對應的信噪比。在所有聆聽環(huán)境下,掩蔽聲的起始水平在第一次測試時為45 dB SPL。對于每個環(huán)境下的第二次測試,掩蔽聲的起始級別比第一次測試時估計的閾值低10 dB。自適應增減掩蔽聲初始步距為4 dB,第二次增減軌跡變動后減小為2 dB。每次測試得到8個軌跡變動,閾值計算為最后6個變動中掩蔽聲的平均水平。
對于每種聆聽環(huán)境均進行兩次測試。如兩次閾值差值<5 dB,取平均值;如差值>5 dB,則測試第三次并取三次平均值。聽障兒童在完成第一組助聽器設置的所有測試環(huán)境后,開始第二組助聽器設置測試。
在MSI和OMNI設置,使用雙向復測量方差分析(rmANOVA)比較噪聲中的言語及混合言語識別性能,如圖1所示,包括助聽器設置的內部因素以及聆聽環(huán)境的影響因素。Mauchly球度檢驗結果不太顯著,χ2(2)=2.39,P=0.32。助聽器設置作為主要影響參數(shù),F(xiàn)(1,13)=14.06,P<0.05,ηp2=0.520;聆聽環(huán)境作為主要影響參數(shù),F(xiàn)(2,26)=39.65,P<0.001,ηp2=0.753,兩種因素的檢驗效果顯著。在這兩個因素相互作用的情況下,差異很明顯,說明在3種情況下,MSI的收益并不相同。
圖1 噪聲中言語以及混合言語識別性能
通過兩兩比較,MSI與全向性助聽器設置情況下,測試助聽器在SSN (A、B、C)中的性能,顯示MSI的閾值更好。全向性在掩蔽噪聲下面對目標言語的平均閾值為8.4 dB,信噪比SD=3.9,未面對目標的平均閾值為7.8 dB,信噪比SD=4.3。相反,MSI在掩蔽噪聲下面對目標言語的平均閾值為4.4 dB,信噪比SD=4.1,未面對目標的平均閾值為4.0 dB,信噪比SD=3.9。因此,在同樣噪聲環(huán)境下測試MSI與全向性助聽器設置,MSI閾值提高約4 dB。
在多個言語 (掩蔽聲為言語)環(huán)境下,MSI與全向性助聽器設置沒有差別。對于聽障兒童,在混合言語中使用全向性設置的平均閾值為11.5 dB,信噪比SD=4.6,使用MSI設置的平均閾值為12.1 dB,信噪比SD=3.2。
本研究在SSN和競爭言語聲情況,MSI和OMNI設置下,比較了聽障兒童言語識別信噪比。結果顯示,在群體水平上,MSI提高了噪聲下言語識別SNR(提升4 dB)。即使兒童沒有面對目標源,仍然有不錯的效果(提升3.8 dB)。當背景聲為兩個競爭言語聲時,MSI和OMNI的言語識別沒有顯著差異。
在SSN背景聲下,不論是否面對噪聲源,聽障兒童言語識別閾都有提升(MSI>OMNI)。有研究評估了噪聲環(huán)境下,方向性技術對兒童的益處[6~8]。方向性技術對兒童的益處前提在于兒童必須朝向目標聲源,且目標朝向中沒有其他干擾噪聲。但兒童常不會保持面對講話者[9]。這也是為何在國際標準中,并不推薦方向性技術用于兒童的主要原因。本研究結果顯示,盡管聽障兒童并未面對目標聲源(300°),MSI仍然能為兒童提供額外3.8 dB SNR(相比OMNI),這意味著新算法可以解決以往方向性的弊端。但仍需進一步研究,以驗證當穩(wěn)態(tài)噪聲或言語聲出現(xiàn)在其他不同角度時,是否可得出相同結論。
當背景聲為競爭言語聲時,可見MSI和OMNI對于聽障兒童無顯著差異。當背景掩蔽聲包含大量潛在的有用信息時(如本實驗使用的兩個競爭言語聲),通過測試言語識別閾可以有效評估兒童是否有能力辨識聲源的聲波、選擇合適的聽覺目標進一步處理、并屏蔽無關的言語聲聲波(即選擇性注意力)[10]。少有研究討論關于方向性技術對兒童選擇性注意的影響。筆者認為,如果兒童持續(xù)面對目標聲源,且干擾聲源明顯在另一角度時,方向性算法能夠有效提升目標聲源的SNR。在這一特定環(huán)境下,方向性算法可能優(yōu)于MSI算法。然而如果兒童并不面對目標聲源,方向性算法的效果可能差于OMNI[11]或MSI算法。本實驗在兩個競爭言語聲與一個目標言語聲處于不同方位時,盡管MSI算法并沒有提升兒童的言語識別能力。但MSI并沒有衰減競爭言語聲。說明當存在數(shù)個競爭言語聲的多聲源環(huán)境中,介于方向性算法與OMNI算法間的MSI算法可能是很好的中和選擇。這一結果與Ricketts等[12]研究結論相似,即占半數(shù)以上學校時間的動態(tài)環(huán)境下,相比方向性麥克風算法,OMNI能夠提供更好的信噪比。
臨床推薦使用OMNI,而不推薦兒童使用方向性麥克風,是因為以下原因:(1)兒童往往不面對目標聲源。(2)方向性算法可能會減少可聽度,或無法提供最優(yōu)SNR。(3)其他方向可能存在潛在的有用信息,因此方向性算法會減少偶然習得的機會。本研究發(fā)現(xiàn),盡管聽障兒童并未面對目標聲源(300°),MSI算法仍然能提高言語識別SNR。這意味著使用MSI時兒童不需要面對聲源也能獲益。同時,在更接近兒童真實生活環(huán)境的實驗條件下,與方向性技術形成對照,同樣相比OMNI,方向性技術已被證實會帶來消極影響[11,13]。這意味著在未來足夠智能的助聽器算法可以取代方向性技術與OMNI,成為兒童的首選算法。
本研究的局限性在于:①沒有為每位兒童提供個性化調試。雖然使用真耳分析進行驗證,但仍然只是匹配了目標曲線,沒有進一步調試。②聽障兒童短短適應助聽器僅幾分鐘,就進入正式實驗。③研究中僅模擬了兩種環(huán)境,還需進一步實驗探究當穩(wěn)態(tài)噪聲或言語聲出現(xiàn)在其他不同角度時,MSI算法是否可得出同樣效果。
本研究主要得出以下結論:(1)在SSN背景聲下,MSI可以顯著提高兒童的言語識別能力。即使沒有面對目標聲源,仍有同樣效果;(2)在競爭言語聲背景聲下,MSI與OMNI算法對兒童的言語識別能力沒有顯著差異。