張戌寶
?
·技術(shù)與方法·
助聽(tīng)器動(dòng)態(tài)范圍控制線(xiàn)性化的策略和效果
張戌寶1
設(shè)計(jì)壓縮助聽(tīng)器的核心目標(biāo)是要確保助聽(tīng)器對(duì)實(shí)際生活中的各種聲音都有可聽(tīng)性。語(yǔ)音是由精確定時(shí)的、復(fù)雜的音素成份構(gòu)成,而任何音頻放大器都存在這些成份失真的風(fēng)險(xiǎn)。這種失真可以不是諧波失真,因此不能用常見(jiàn)的測(cè)試儀表測(cè)量出來(lái)。寬動(dòng)態(tài)范圍壓縮(wide dynamic range compression, WDRC)至今仍在廣泛地使用中[1],WDRC通過(guò)非線(xiàn)性處理實(shí)現(xiàn)了對(duì)聽(tīng)音環(huán)境中各類(lèi)聲音的可聽(tīng)性,但是在維護(hù)語(yǔ)音的自然性和保真度方面表現(xiàn)并不好[2,3];換句話(huà)說(shuō),聽(tīng)力受損者使用WDRC的助聽(tīng)器能確保聽(tīng)見(jiàn)語(yǔ)音,但可能不滿(mǎn)意對(duì)言語(yǔ)的理解度。幾項(xiàng)關(guān)于聽(tīng)音的調(diào)查結(jié)果[4~6]強(qiáng)調(diào),在處理聲音時(shí),必不可少的不單是控制語(yǔ)音動(dòng)態(tài)范圍,而且還要維護(hù)不同音素的聲強(qiáng)差異和其它可聽(tīng)見(jiàn)的聲音提示成份,如調(diào)制信息和在頻譜中淹沒(méi)的諧音等。如果這些提示成份失去或模糊不清或失真了,聽(tīng)者的大腦就被迫耗費(fèi)較多精力去區(qū)分模糊、去跟蹤無(wú)法暫停的言語(yǔ)。如果輸出語(yǔ)音是自然的、完整的,人腦能幾乎不費(fèi)力地識(shí)別競(jìng)爭(zhēng)中的語(yǔ)音,新一代助聽(tīng)器需要幫助大腦減輕識(shí)別語(yǔ)音費(fèi)力的程度。此外,壓縮過(guò)程中的時(shí)間策略也不能忽視,慢動(dòng)作的語(yǔ)音增益控制效果比快動(dòng)作的更好[3,7]。
為了實(shí)現(xiàn)這樣的目的,需要采用新的助聽(tīng)放大途徑。Blamey[8]全面地闡述了自適應(yīng)動(dòng)態(tài)范圍優(yōu)化(adaptive dynamic range optimization, ADRO)的策略和性能,在語(yǔ)音動(dòng)態(tài)范圍內(nèi)它使放大器處于線(xiàn)性工作狀態(tài);為了驗(yàn)證ADRO處理的效果,他在幾年的四次調(diào)查中,比較了ADRO、WDRC和無(wú)助聽(tīng)器的方案,證明了線(xiàn)性化處理在響度感覺(jué)和聽(tīng)音滿(mǎn)意度兩方面得分都最高[5]。Schum等[6]全面地闡述了語(yǔ)音衛(wèi)士(sound guard)的處理策略、壓縮結(jié)構(gòu)和實(shí)驗(yàn)室性能核實(shí)的結(jié)論,它是一種浮動(dòng)-線(xiàn)性的壓縮,屬于局部線(xiàn)性但總的線(xiàn)性化動(dòng)態(tài)范圍比ADRO的還要寬。Nilsson等[9]從聽(tīng)力康復(fù)的角度全面介紹了語(yǔ)音衛(wèi)士的助聽(tīng)策略、理念和先進(jìn)性?;谶@些新出現(xiàn)的線(xiàn)性化放大的進(jìn)步,本文闡述與ADRO放大和浮動(dòng)-線(xiàn)性壓縮有關(guān)的新理念、邏輯規(guī)則、放大處理和先進(jìn)的時(shí)間策略,并比較這些新一代助聽(tīng)放大器的效果。
聽(tīng)力正常人能感覺(jué)到的聲音動(dòng)態(tài)范圍大約是0~100 dB SPL;中度聽(tīng)力損失者能感覺(jué)到的聲響范圍縮小至約55~100 dB[1];大多數(shù)的感音神經(jīng)性聽(tīng)力損失發(fā)生在中、高音頻區(qū)。WDRC可以將正常的動(dòng)態(tài)范圍變換到受損的動(dòng)態(tài)范圍,完滿(mǎn)地解決了可聽(tīng)性問(wèn)題;不過(guò),WDRC會(huì)損壞語(yǔ)音的自然特性。為了解決這一問(wèn)題,ADRO處理器利用與WDRC完全不同的策略,使其聽(tīng)音效果十分不同。ADRO重視語(yǔ)音中信息豐富的聲壓區(qū)段,具體而言,在每個(gè)頻道中對(duì)語(yǔ)音信號(hào)強(qiáng)度在中部的大部分進(jìn)行線(xiàn)性放大,同時(shí)保持輸出在用戶(hù)的舒適級(jí)和可聽(tīng)級(jí)之間,而忽視信息量很少的語(yǔ)音強(qiáng)度兩端的信號(hào)[8]。在開(kāi)發(fā)ADRO的初期,主要應(yīng)用于人工耳蝸傅里葉的處理器,后來(lái)過(guò)渡到助聽(tīng)器。ADRO在一種快速傅里葉變換(fast Fourier transform, FFT)加逆快速傅里葉變換(inverse FFT, IFFT)的助聽(tīng)器芯片上實(shí)現(xiàn)其策略。
1.1 自適應(yīng)動(dòng)態(tài)范圍優(yōu)化的策略 圖1顯示ADRO在一頻道上的線(xiàn)性放大理念,其線(xiàn)性窗有40 dB,可聽(tīng)動(dòng)態(tài)范圍達(dá)90 dB。ADRO的策略是使用四個(gè)邏輯規(guī)則來(lái)控制助聽(tīng)器輸入的寬動(dòng)態(tài)范圍,這四個(gè)規(guī)則在每個(gè)頻道上獨(dú)立操作,每個(gè)頻道先作信號(hào)強(qiáng)度的統(tǒng)計(jì)分析以完成規(guī)則的判定,再控制放大器動(dòng)作。這些規(guī)則包括:
1.1.1 舒適級(jí)規(guī)則 如果一個(gè)頻道的輸出聲級(jí)超過(guò)舒適級(jí)目標(biāo)百分位數(shù),該頻道的放大增益就降低(平行四邊形頂部),否則就維持該增益。有關(guān)舒適級(jí)目標(biāo)百分位數(shù)的設(shè)置見(jiàn)1.2。
圖1 ADRO的可聽(tīng)動(dòng)態(tài)范圍是90 dB而線(xiàn)性窗是40 dB
1.1.2 可聽(tīng)級(jí)規(guī)則 如果一個(gè)頻道的輸出聲級(jí)低于可聽(tīng)級(jí)目標(biāo)百分位數(shù),該頻道的放大增益就增加(平行四邊形底部),否則就維持該增益。有關(guān)可聽(tīng)級(jí)目標(biāo)百分位數(shù)的設(shè)置見(jiàn)1.2。
1.1.3 聽(tīng)力保護(hù)規(guī)則 如果一個(gè)頻道的輸出信號(hào)超過(guò)上限(upper limit),該頻道的輸出被限制到最大輸出聲級(jí),它由ADRO助聽(tīng)器的適配軟件設(shè)置。該規(guī)則確保一個(gè)突然響的聲音,如瞬態(tài)噪聲,不超過(guò)聲音的不舒適級(jí)。
1.1.4 背景噪聲規(guī)則 如果一個(gè)頻道的增益超過(guò)規(guī)定的最大增益,該處理器就限制增益至極低以形成靜音(squelch)頻道。該規(guī)則避免長(zhǎng)期平穩(wěn)弱噪聲輸出使助聽(tīng)器用戶(hù)煩惱。
圖2 實(shí)測(cè)的ADRO助聽(tīng)器一個(gè)頻道的I/O曲線(xiàn)
圖2顯示設(shè)有ADRO的助聽(tīng)器于測(cè)試箱中在某個(gè)頻率的輸入/輸出(I/O)曲線(xiàn),該I/O曲線(xiàn)與WDRC的I/O曲線(xiàn)明顯不同。在底部的左角,當(dāng)非常低的輸入聲級(jí)(25 dB)增加時(shí),工作點(diǎn)向舒適級(jí)目標(biāo)沿著直線(xiàn)上升,其間增益是固定的;當(dāng)?shù)竭_(dá)此目標(biāo)時(shí),舒適級(jí)規(guī)則就激活且頻道增益降低。當(dāng)輸入聲級(jí)繼續(xù)增加時(shí),輸出聲級(jí)也不再增加而保持在舒適級(jí)狀態(tài)。當(dāng)輸入聲級(jí)開(kāi)始降低時(shí),工作點(diǎn)就沿著另一增益的直線(xiàn)向下移動(dòng);當(dāng)輸入聲級(jí)繼續(xù)下降且工作點(diǎn)到了可聽(tīng)級(jí)目標(biāo)時(shí),可聽(tīng)級(jí)規(guī)則激活且所在頻道增益增加以使輸出語(yǔ)音清晰可聽(tīng)。當(dāng)輸入聲級(jí)繼續(xù)減少,頻道增益達(dá)到預(yù)置的最大增益時(shí),就認(rèn)為輸入是平穩(wěn)弱噪聲而采用一個(gè)限制的增益使輸出聲音“靜音”。因此,典型的ADRO的I/O曲線(xiàn)可能是一個(gè)環(huán)形,它有兩個(gè)線(xiàn)性的側(cè)邊、非線(xiàn)性的頂邊和底邊。不過(guò),在常見(jiàn)的聽(tīng)音情況下,語(yǔ)音包絡(luò)的峰-谷值總是在數(shù)十dB以?xún)?nèi),環(huán)形的頂邊和底邊就很短,I/O曲線(xiàn)甚至退化成一條斜線(xiàn)。因此,ADRO能保護(hù)原輸入的峰-谷波形細(xì)節(jié),有利于言語(yǔ)的理解;付出的代價(jià)是放棄了可聽(tīng)級(jí)之下和舒適級(jí)之上的兩小部分信息不豐富的語(yǔ)音。當(dāng)適配ADRO助聽(tīng)器時(shí),設(shè)置舒適級(jí)/可聽(tīng)級(jí)目標(biāo)、上限和最大增益,而沒(méi)有交叉頻率、拐點(diǎn)和壓縮比的設(shè)置。
1.2 ADRO語(yǔ)音信號(hào)的統(tǒng)計(jì)分布 為了搜索出語(yǔ)音中信息量豐富的聲強(qiáng)區(qū)段,ADRO需要統(tǒng)計(jì)各頻道中的語(yǔ)音強(qiáng)度值和其出現(xiàn)率的分布情況。圖3為模擬的一個(gè)頻道上語(yǔ)音強(qiáng)度分布圖,X軸代表強(qiáng)度測(cè)量值,Y軸代表測(cè)量值的相對(duì)出現(xiàn)率,即按強(qiáng)度最大值歸一化的數(shù)據(jù)。第90百分位數(shù)是在該分布圖上的一個(gè)信號(hào)強(qiáng)度估計(jì)值,它滿(mǎn)足90%的發(fā)生次數(shù)低于該估計(jì)值而10%的發(fā)生次數(shù)大于該估計(jì)值。安靜環(huán)境中,雙瓣分布圖是常見(jiàn)的語(yǔ)音信號(hào)強(qiáng)度分布圖,如圖3,左瓣的出現(xiàn)率峰值代表輕背景噪聲測(cè)量值的最頻繁出現(xiàn)次數(shù);右瓣的出現(xiàn)率峰值代表普通言語(yǔ)測(cè)量值的最頻繁出現(xiàn)次數(shù)。統(tǒng)計(jì)分析時(shí),百分位數(shù)估計(jì)值的確定使用迭代方法:當(dāng)前的強(qiáng)度測(cè)量值與當(dāng)前的百分位數(shù)估計(jì)值比較,當(dāng)測(cè)量值大于估計(jì)值時(shí),該百分位數(shù)估計(jì)值增加一個(gè)小量(預(yù)設(shè)的上躍步);反之,該估計(jì)值就減少一個(gè)小量(預(yù)設(shè)的下躍步);多次跌代完成后,如果當(dāng)前的估計(jì)值滿(mǎn)足上躍次數(shù)是下躍次數(shù)的9倍,則當(dāng)前的估計(jì)值就收斂到了第90百分位數(shù)。類(lèi)似地,第30百分位數(shù)也可被確定:在迭代多次后,上躍次數(shù)與下躍次數(shù)之比為3:7,如果上躍步和下躍步的值設(shè)置得比較大,百分位數(shù)估計(jì)值可以收斂較快。對(duì)每個(gè)頻道上記錄的測(cè)量值作同樣的統(tǒng)計(jì)以得到各頻道兩個(gè)百分位數(shù)的估計(jì)值。統(tǒng)計(jì)分析時(shí)不設(shè)時(shí)間窗,得到的第90百分位數(shù)和第30百分位數(shù)分別用來(lái)作為舒適級(jí)規(guī)則和可聽(tīng)級(jí)規(guī)則的目標(biāo)。ADRO的統(tǒng)計(jì)規(guī)則屬于模糊邏輯類(lèi),即兩個(gè)規(guī)則不總是成立,或者它們的百分位數(shù)是不確定的。
圖3 一頻道上語(yǔ)音信號(hào)強(qiáng)度和出現(xiàn)率的統(tǒng)計(jì)分布曲線(xiàn)
1.3 ADRO處理器的延時(shí)和時(shí)間常數(shù) 在ADRO的處理中,輸出對(duì)輸入的延時(shí)是不可避免的,延時(shí)多長(zhǎng)取決于處理硬件。典型的A/D變換器和D/A變換器各自產(chǎn)生0.5 ms的延時(shí);ADRO使用的FFT加IFFT運(yùn)算各自產(chǎn)生幾毫秒的延時(shí);當(dāng)選擇16 kHz采樣頻率、64點(diǎn)FFT時(shí),總的延時(shí)是13 ms;在WDRC處理時(shí),同樣的硬件產(chǎn)生相同的延時(shí)。Blamey認(rèn)為[8],基于64點(diǎn)FFT的運(yùn)算,ADRO產(chǎn)生13 ms的延時(shí)是可行的,因?yàn)?0 ms是設(shè)計(jì)的上界。不過(guò),Agnew等指出[10],當(dāng)助聽(tīng)器有3~5 ms的延時(shí)時(shí),聽(tīng)音可能導(dǎo)致聽(tīng)覺(jué)模糊;當(dāng)延時(shí)大于10 ms時(shí),可能令人不愉快。如果使用多頻道的數(shù)字濾波器組來(lái)代替FFT[1],ADRO引起的延時(shí)將縮短。
Hansen的兩個(gè)調(diào)查說(shuō)明[11],壓縮處理器的啟動(dòng)時(shí)間和釋放時(shí)間對(duì)語(yǔ)音質(zhì)量和理解度起著重要作用。短的時(shí)間常數(shù)導(dǎo)致頻道增益急速改變,會(huì)扭曲輸入語(yǔ)音的峰-谷比和音樂(lè)信號(hào)的動(dòng)態(tài)范圍,因而引起非線(xiàn)性失真;當(dāng)然,短的時(shí)間常數(shù)對(duì)抑制強(qiáng)的瞬態(tài)干擾聲是必要的。ADRO不采用折中的時(shí)間策略,對(duì)不同的規(guī)則用不同的時(shí)間常數(shù)以確保不同的輸入均獲益,可聽(tīng)級(jí)和舒適級(jí)規(guī)則的增益調(diào)節(jié)要適應(yīng)語(yǔ)音強(qiáng)度的慢起伏,這兩個(gè)規(guī)則的調(diào)節(jié)速度為3~5 dB/s,取決于個(gè)人喜好。聽(tīng)力保護(hù)規(guī)則讓輸出不超過(guò)每個(gè)頻道的響度上限,因此,使用短得多的啟動(dòng)時(shí)間僅抑制強(qiáng)的瞬態(tài)聲音。
1.4 ADRO處理的效果 Blamey[5]使用助聽(tīng)響度概況(profile of aided loudness, PAL)測(cè)試語(yǔ)句[12]來(lái)評(píng)估ADRO的性能,并與WDRC和無(wú)助聽(tīng)器方案進(jìn)行了比較,原本的PAL有12個(gè)語(yǔ)句,來(lái)自日常生活,Blamey增加到18個(gè)語(yǔ)句,要求受試者完成環(huán)境聲音問(wèn)卷(environmental sound questionnaires, ESQ)后,再根據(jù)他們打的分來(lái)評(píng)估不同的方案。該研究歷經(jīng)幾年的4次調(diào)查代表了普遍的現(xiàn)實(shí)聽(tīng)音情景:調(diào)查1有19例受試者,從輕度到極重度聽(tīng)力損失,使用耳背式(BTE)助聽(tīng)器,使用盲法在ADRO和WDRC之間轉(zhuǎn)換比較;調(diào)查2有22例受試者,為輕度到中度聽(tīng)力損失,使用耳內(nèi)式(ITE)助聽(tīng)器,用塊交換(reverse block)法來(lái)轉(zhuǎn)換ADRO和WDRC的助聽(tīng)器;調(diào)查3中,10例受試者為中度到重度聽(tīng)力損失,使用并入數(shù)字降噪算法的BTE助聽(tīng)器,采用盲法比較;調(diào)查4的目的與其它調(diào)查不同,沒(méi)有納入WDRC,僅為了對(duì)比兩種ADRO的性能,以了解不同頻道數(shù)對(duì)聲音質(zhì)量和語(yǔ)音理解度的影響;助聽(tīng)器并入方向性麥克風(fēng)模式,10例受試者的聽(tīng)力損失從輕度到中度。
圖4 三種助聽(tīng)方案的滿(mǎn)意度得分與響度分類(lèi)的關(guān)系
ESQ問(wèn)卷響度分為“強(qiáng)聲”、“中度聲”和“輕聲”,以聽(tīng)力正常者的感覺(jué)為準(zhǔn),受試者先對(duì)每個(gè)句子的響度感覺(jué)打分,再對(duì)這些句子的聽(tīng)音滿(mǎn)意度打分。按照PAL規(guī)則,每個(gè)句子有8個(gè)響度等級(jí)(0~7)和5個(gè)滿(mǎn)意度等級(jí)(1~5);18個(gè)句子的得分形成一個(gè)數(shù)據(jù)塊,4次調(diào)查共獲得188個(gè)數(shù)據(jù)塊。使用方差分析法進(jìn)行統(tǒng)計(jì)分析,因?yàn)檫@些數(shù)據(jù)受多個(gè)獨(dú)立因素的影響,分析結(jié)果能對(duì)調(diào)查的響度和滿(mǎn)意度有合理的逼近。圖4顯示平均滿(mǎn)意度得分曲線(xiàn)(基于4次調(diào)查),可見(jiàn),兩種助聽(tīng)器方案的滿(mǎn)意度得分明顯高于無(wú)助聽(tīng)器方案的得分,特別是響度為“輕聲”時(shí);ADRO的得分較WDRC的得分高約0.2。當(dāng)響度為“強(qiáng)聲”時(shí),這三個(gè)方案的滿(mǎn)意度比較接近;隨著句子響度增加,助聽(tīng)器方案的滿(mǎn)意度得分一致下降,而無(wú)助聽(tīng)器方案的滿(mǎn)意度得分幾乎沒(méi)有變化。
眾所周知,早期的線(xiàn)性放大器不能實(shí)現(xiàn)聽(tīng)力受損者對(duì)聲音可聽(tīng)性的要求,而一個(gè)WDRC處理器能滿(mǎn)足可聽(tīng)性要求卻使輸入信號(hào)失真。Schum[6]和Nilsson等[9]闡述了一種新奇的、既線(xiàn)性又壓縮的放大器,稱(chēng)為“浮動(dòng)-線(xiàn)性”(floating-linear, FL)處理器,雖然FL和ADRO處理器開(kāi)發(fā)的目的相同,但兩者的處理策略不同。為了保留“處方”增益的約束,F(xiàn)L處理器不得不浮動(dòng)地線(xiàn)性放大,因而,在很寬的動(dòng)態(tài)范圍內(nèi)放大后的聲音能夠?qū)崿F(xiàn)傳統(tǒng)的處方目標(biāo),同時(shí)輸出語(yǔ)音又是完整的、自然的;即使在有噪聲的環(huán)境中,助聽(tīng)器用戶(hù)也能較少費(fèi)力地理解聆聽(tīng)的語(yǔ)音。
2.1 浮動(dòng)-線(xiàn)性處理器的處理策略 FL處理器設(shè)計(jì)具有獨(dú)特的優(yōu)點(diǎn),它能浮動(dòng)-線(xiàn)性地將環(huán)境聲音的動(dòng)態(tài)范圍變換到聽(tīng)力損失者的動(dòng)態(tài)范圍。FL處理器能將有30 dB峰-谷起伏的聲音輸入變換成30 dB峰-谷起伏的輸出,對(duì)不同的輸入聲壓它設(shè)有不同的線(xiàn)性增益窗,這樣的動(dòng)態(tài)壓縮稱(chēng)為“語(yǔ)音衛(wèi)士”(sound guard,SG),以強(qiáng)調(diào)不會(huì)像WDRC那樣損壞語(yǔ)音的結(jié)構(gòu)。此外,F(xiàn)L處理器設(shè)有長(zhǎng)期監(jiān)視器和短期監(jiān)視器,同時(shí)獨(dú)立工作[13],前者使用長(zhǎng)時(shí)間窗以準(zhǔn)確估計(jì)常見(jiàn)言語(yǔ)輸入的強(qiáng)度,后者使用短得多的時(shí)間窗以準(zhǔn)確估計(jì)瞬態(tài)噪聲輸入的強(qiáng)度。該FL處理器的方框圖如圖5所示,它的規(guī)則如下:
2.1.1 線(xiàn)性放大規(guī)則 當(dāng)長(zhǎng)期監(jiān)視器估計(jì)值的起伏在9 dB以?xún)?nèi)時(shí),F(xiàn)L放大器的增益維持不變,該輸入聲級(jí)的區(qū)段被稱(chēng)作9 dB線(xiàn)性窗;長(zhǎng)期和短期監(jiān)視器的兩種估計(jì)值輸出也在不斷地比較,如果這兩種估計(jì)值非常接近,則長(zhǎng)期監(jiān)視器的估計(jì)值調(diào)節(jié)放大器的增益。當(dāng)輸入信號(hào)是平穩(wěn)的語(yǔ)音時(shí),兩監(jiān)視器的輸出均方根(RMS)值起伏在約10 dB范圍內(nèi);在常見(jiàn)的對(duì)話(huà)情景中,9 dB的FL窗能確保輸出是線(xiàn)性放大的言語(yǔ)。與WDRC比較,該規(guī)則確保了輸出語(yǔ)音是自然的和無(wú)失真的,因而聽(tīng)力損失患者理解語(yǔ)音時(shí)可以盡可能少地費(fèi)力。
2.1.2 可聽(tīng)級(jí)和舒適級(jí)規(guī)則 一旦兩個(gè)監(jiān)視器的輸入估計(jì)值出現(xiàn)大的變化,如該值>9 dB,但是變化慢,這時(shí)輸入聲級(jí)就高出或低于當(dāng)前線(xiàn)性窗,F(xiàn)L放大器就立即向右方或左方“浮動(dòng)”到另一個(gè)較低或較高的增益窗上;因?yàn)镕L窗沿著“處方”曲線(xiàn)浮動(dòng),該線(xiàn)性放大的增益也確保了語(yǔ)音信號(hào)的輸出在適配處方的可聽(tīng)級(jí)和舒適級(jí)目標(biāo)之間。
2.1.3 瞬態(tài)噪聲管理(transient management, TM)規(guī)則 如果短期監(jiān)視器的估計(jì)值與長(zhǎng)期監(jiān)視器的估計(jì)值明顯不同,表明瞬態(tài)噪聲存在。該規(guī)則讓用戶(hù)能感覺(jué)到原來(lái)強(qiáng)度較弱的瞬態(tài)噪聲,因此,F(xiàn)L處理器線(xiàn)性放大且增益降低的量為6~0 dB,具體數(shù)值取決于語(yǔ)音是否存在,6 dB適用于語(yǔ)音不存在時(shí);當(dāng)語(yǔ)音存在時(shí),不要過(guò)多降低增益以保護(hù)有用的語(yǔ)音提示和自然性。如果關(guān)掉TM,原本模樣的瞬態(tài)噪聲就會(huì)出現(xiàn)。TM規(guī)則用于SG E(增強(qiáng)型語(yǔ)音衛(wèi)士)處理器,因?yàn)樗捎?2 dB 寬的線(xiàn)性窗,在某些瞬態(tài)噪聲通過(guò)它時(shí)(增益調(diào)節(jié)未及時(shí)跟上)可能導(dǎo)致不舒適的響音感覺(jué)。
對(duì)于9 dB線(xiàn)性窗的FL處理器,當(dāng)有一個(gè)突然的聲音輸入時(shí),短期監(jiān)視器的估值就調(diào)節(jié)增益,幾乎立即控制放大器的輸出;然后,增益又迅速返回到之前由長(zhǎng)期監(jiān)視器確定的增益。該操作要立即響應(yīng)突然變化的聲音,包括瞬態(tài)強(qiáng)聲和輕聲,即跳在當(dāng)前語(yǔ)音聲級(jí)之上或之下的聲音。
圖5 FL處理器與兩個(gè)獨(dú)立監(jiān)視器合作的方框圖
2.1.4 低聲壓擴(kuò)展規(guī)則 該規(guī)則的原理與常規(guī)WDRC的擴(kuò)展規(guī)則[1]相同。當(dāng)長(zhǎng)期監(jiān)視器估計(jì)值低于輕聲聲級(jí)10 dB時(shí),就認(rèn)為輸入信號(hào)是弱平穩(wěn)噪聲,F(xiàn)L處理器利用常規(guī)的低聲壓擴(kuò)展處理使放大器下降到非常低的增益,擴(kuò)展比可到1/10或沒(méi)有增益。
圖6 FL處理器在某個(gè)頻率上的I/O工作曲線(xiàn)
圖6顯示FL處理器在某個(gè)頻率上的輸入/輸出工作特性曲線(xiàn),標(biāo)出了三個(gè)增益線(xiàn)段:對(duì)角線(xiàn)代表沒(méi)增益的線(xiàn)性函數(shù),對(duì)角線(xiàn)之上的粗實(shí)線(xiàn)表示FL的線(xiàn)性窗,以一個(gè)固定的增益進(jìn)行線(xiàn)性放大;點(diǎn)線(xiàn)表示壓縮的“處方”目標(biāo),就像在常規(guī)的WDRC中見(jiàn)到的;虛線(xiàn)表示瞬態(tài)噪聲管理,與對(duì)角線(xiàn)接近,說(shuō)明增益很?。稽c(diǎn)劃線(xiàn)表示低聲壓擴(kuò)展,其斜率就是擴(kuò)展比,從處方增益線(xiàn)左端逐步下降到零。FL線(xiàn)性窗的寬度是可調(diào)的,選9或12 dB,取決于用戶(hù)個(gè)人的喜好。SG E的線(xiàn)性窗是12 dB寬,其線(xiàn)性覆蓋比SG的9 dB窗更寬;對(duì)典型的6 dB調(diào)制深度語(yǔ)音保真更好(多14%),幾乎保護(hù)到整個(gè)30 dB峰-谷的包絡(luò)[9]。由于相鄰音素的強(qiáng)度差異和音素之間的間隔信息都能被保護(hù),因而FL處理器輸出能保持原本的語(yǔ)音提示,當(dāng)語(yǔ)音比較平穩(wěn)時(shí),F(xiàn)L窗移動(dòng)非常緩慢,使增益調(diào)節(jié)就像音量控制一樣。瞬態(tài)噪聲管理保留了瞬態(tài)噪聲但在不煩人的范圍內(nèi),這樣可以避免用戶(hù)注意力出現(xiàn)不必要的轉(zhuǎn)移。
2.2 浮動(dòng)-線(xiàn)性處理器的時(shí)間策略 對(duì)于常規(guī)的WDRC,時(shí)間策略較簡(jiǎn)單:?jiǎn)?dòng)時(shí)間選短的,大約幾十毫秒;釋放時(shí)間相對(duì)地長(zhǎng),約幾百毫秒。通常,這樣的策略可以抑制突然闖入的強(qiáng)聲,維持用戶(hù)的舒適感。當(dāng)壓縮的釋放時(shí)間在25~75 ms范圍時(shí)就認(rèn)為是快動(dòng)作壓縮[6],如音節(jié)壓縮。音節(jié)壓縮基于單個(gè)音素的聲強(qiáng)來(lái)控制增益:強(qiáng)的元音得到較少的增益,不發(fā)聲的輔音得到增益較多;因此,音節(jié)壓縮形成了聲強(qiáng)比較均勻的各音素,同時(shí)改變了語(yǔ)音原本的聲強(qiáng)結(jié)構(gòu)。當(dāng)壓縮器釋放時(shí)間在約200~2 000 ms范圍時(shí),就認(rèn)為是慢動(dòng)作壓縮,目標(biāo)是保持增益平穩(wěn)控制,就像用音量控制器來(lái)調(diào)節(jié)音量那樣;但是,進(jìn)行連續(xù)的言語(yǔ)交談時(shí),又免不了隨時(shí)闖入的瞬態(tài)噪聲干擾??偠灾晟频膲嚎s器需要一種放大,它不單能針對(duì)有用輸入的聲強(qiáng)調(diào)節(jié)增益,還有適當(dāng)?shù)脑肼暱刂茣r(shí)間以便自適應(yīng)地使整體最佳。
FL處理器巧妙地利用了獨(dú)立估計(jì)而又合作判定的一對(duì)輸入監(jiān)視器,避免了慢動(dòng)作和快動(dòng)作壓縮器各自的不足,又保持了這兩種壓縮器的優(yōu)點(diǎn),這兩個(gè)監(jiān)視器不斷地對(duì)輸入信號(hào)以極快的速率采樣,不大于4 ms[13]。長(zhǎng)期監(jiān)視器在幾百毫秒到幾秒的時(shí)間上產(chǎn)生平均估計(jì)值,短期監(jiān)視器則在幾毫秒上平均;來(lái)自?xún)蓚€(gè)監(jiān)視器的輸出共同判定輸入的類(lèi)型再調(diào)節(jié)放大器增益。FL處理器的時(shí)間策略與單個(gè)快/慢動(dòng)作壓縮器的主要區(qū)別是:FL處理器的啟動(dòng)時(shí)間和釋放時(shí)間從幾毫秒到幾秒不等,取決于輸入信號(hào)的動(dòng)態(tài)特性;當(dāng)有一個(gè)突然的輸入聲音上升或下降時(shí),該處理器在瞬間將增益下降或上調(diào)。
2.3 浮動(dòng)-線(xiàn)性處理器的效果 核實(shí)FL處理器的效益是必要的,包括語(yǔ)音識(shí)別的增強(qiáng)和噪聲中聽(tīng)音費(fèi)力的程度。Sockalingam等[7]通過(guò)在Oticon國(guó)際總部的調(diào)查揭示了FL的效益,共39例有助聽(tīng)器經(jīng)驗(yàn)的受試者參加測(cè)試,其聽(tīng)力損失類(lèi)型從平坦型到斜坡型;這些受試者每人使用帶SG的助聽(tīng)器(Agil Pro)和不帶SG的助聽(tīng)器,使用平衡交叉法將受試者分為兩組,交換使用Agil助聽(tīng)器和無(wú)SG助聽(tīng)器,受試者對(duì)所用助聽(tīng)器是盲知的,且兩種助聽(tīng)器之間測(cè)試句的閱讀順序是隨機(jī)的;兩種測(cè)試條件:空間分布的語(yǔ)音加未調(diào)制噪聲(稱(chēng)空間組成)和混合的語(yǔ)音加沖激噪聲(稱(chēng)混合組成)。在空間組成中,用三個(gè)揚(yáng)聲器激勵(lì)未調(diào)制噪聲,位置在110°、180°和-110°,聲級(jí)為70 dB SPL;語(yǔ)音揚(yáng)聲器在0°,聲級(jí)是可調(diào)的;在混合組成中,噪聲和語(yǔ)音都在0°,噪聲是20 ms寬的脈沖調(diào)制白噪聲,每200 ms發(fā)一次;這樣的噪聲專(zhuān)門(mén)設(shè)計(jì)用來(lái)聽(tīng)SG助聽(tīng)器在瞬態(tài)噪聲中的效果。用Dantalle測(cè)試句的雙倍5句集和OLAS測(cè)試句(德語(yǔ))作為激勵(lì)的語(yǔ)音,在語(yǔ)音加噪聲的理解度測(cè)試中,記錄50%的語(yǔ)句識(shí)別率所對(duì)應(yīng)的信噪比(S/N),該S/N反映語(yǔ)音理解度,S/N越低理解度越高。比較Agil助聽(tīng)器與無(wú)SG助聽(tīng)器的效果時(shí),Agil的語(yǔ)音理解度在空間組成中改進(jìn)了1 dB,在混合組成中改進(jìn)了1.5 dB;在聽(tīng)音費(fèi)力程度測(cè)試中,7個(gè)打分等級(jí):不需費(fèi)力、很少費(fèi)力、較少費(fèi)力、中度費(fèi)力、較為費(fèi)力、很費(fèi)力和最費(fèi)力,如圖7所示;記錄80%的語(yǔ)句識(shí)別率對(duì)應(yīng)的S/N用于聽(tīng)音費(fèi)力度測(cè)試,由圖7可見(jiàn),使用無(wú)SG助聽(tīng)器時(shí)受試者打分的中間值為較費(fèi)力;而使用Agil助聽(tīng)器時(shí),在同樣的測(cè)試條件下受試者打分的中間值是中度費(fèi)力;說(shuō)明Agil助聽(tīng)器使受試者聽(tīng)音費(fèi)力度明顯下降。結(jié)論是,Agil的SG處理器能使語(yǔ)音理解度更好,且在語(yǔ)音加噪聲的情景下,SG助聽(tīng)器用戶(hù)在理解同樣的語(yǔ)音時(shí)較少費(fèi)力。
圖7 兩種助聽(tīng)器在語(yǔ)音加噪聲組合中的聽(tīng)音費(fèi)力程度得分
ADRO處理器幾乎在純線(xiàn)性放大中工作,線(xiàn)性窗寬可達(dá)40 dB,它使用4個(gè)邏輯規(guī)則來(lái)保護(hù)語(yǔ)音中重要的、信息含量豐富的成份,同樣也保護(hù)音樂(lè)聲;它的線(xiàn)性放大策略讓聽(tīng)力受損者聽(tīng)到的語(yǔ)音包絡(luò)結(jié)構(gòu)未損,且有自然性,因此在各種聽(tīng)音情景下,理解度和舒適度增加了。ADRO處理器放棄了傳統(tǒng)的處方增益目標(biāo),其適配軟件不考慮拐點(diǎn)、交叉頻率等參數(shù);ADRO的時(shí)間策略較為簡(jiǎn)單,針對(duì)不同的聽(tīng)音輸入選擇不同的時(shí)間常數(shù);ADRO較長(zhǎng)的處理延時(shí)可以用濾波器組代替FFT結(jié)構(gòu)來(lái)改進(jìn)。FL處理器在浮動(dòng)的線(xiàn)性運(yùn)算中工作,線(xiàn)性窗寬度為9或12 dB,它保護(hù)語(yǔ)音的提示信息不受破壞,在用戶(hù)的聽(tīng)力動(dòng)態(tài)范圍內(nèi)確保無(wú)失真的語(yǔ)音,但對(duì)音樂(lè)信號(hào)還要進(jìn)一步考慮。FL處理器還保持著處方增益的目標(biāo),它的雙監(jiān)視器獨(dú)立檢測(cè)但又合作控制啟動(dòng)時(shí)間和釋放時(shí)間,是目前最先進(jìn)的時(shí)間控制策略。對(duì)于瞬態(tài)噪聲,F(xiàn)L處理器進(jìn)行即刻增益調(diào)節(jié),之后又迅速返回到之前的增益,這樣的處理使用戶(hù)可以聽(tīng)見(jiàn)瞬態(tài)噪聲但不煩人。
任何助聽(tīng)產(chǎn)品要讓聲音既可聽(tīng)而又不破壞其自然結(jié)構(gòu),只能是線(xiàn)性化的動(dòng)態(tài)范圍處理,精細(xì)的時(shí)間策略是實(shí)現(xiàn)線(xiàn)性壓縮必不可少的輔助;從實(shí)現(xiàn)的角度,這種壓縮處理器的進(jìn)步取決于助聽(tīng)器芯片所具有的高速處理功能和超量的存儲(chǔ)器。WDRC處理器比較簡(jiǎn)單,十多年來(lái),各助聽(tīng)器廠(chǎng)家都用于其實(shí)際產(chǎn)品中;ADRO和FL處理器較為復(fù)雜,目前只有少數(shù)助聽(tīng)器廠(chǎng)家應(yīng)用于其產(chǎn)品中。
1 Theodore HV. 著. 張戌寶, 田嵐,譯.實(shí)用助聽(tīng)器原理和技術(shù)[M].第二版. 北京:人民軍醫(yī)出版社, 2013. 82,188~196, 200~201.
2 Hornsby BWY, Ricketts TA. The effects of compression ratio, signal-to-noise ratio, and level on speech recognition in normal-hearing listeners[J]. J Acoust Soc Am, 2001,109:2964.
3 Cox RM, Xu J. Short and long compression release times: speech understanding, real-world preferences, and association with cognitive ability[J]. J Am Acad Audiol,2010,21:121.
4 Arehart KH,Kates JM,Anderson MC. Effects of noise, nonlinear processing, and linear filtering on perceived music quality[J]. Intern.Journal of Audiology, 2011,50:177.
5 Blamey PJ,Martin LFA. Loudness and satisfaction ratings for hearing aid users[J]. J AmAcad Audiol,2009, 20:272.
6 Schum DJ, Sockalingam R. A new approach to nonlinear signal processing[J]. Hearing Review,2010,17:24.
7 Sockalingam R,Halmberg M.Improve speech understanding and reduced listening effort[M].Oticon White paper, Smarum, Denmark,2010.1~3.
8 Blamey PJ. Adaptive dynamic range optimization (ADRO): a digital amplification strategyfor hearing aids and cochlear implants[J]. Trends Amplif, 2005, 9:77.
9 Nilsson MJ, Behrens T. How audiology has guided the development of Oticon's latest release-Oticon Alta[M]. Oticon White paper, Askim, Sweden, 2013. 1~8.
10 Agnew J,Thornton JM.Just noticeable and objectionable group delays in digital hearing aids[J]. J Am Acad Audiol, 2000,11:330.
11 Hansen M. Effects of multi-channel compression time constants on subjectively perceived sound quality and speech intelligibility[J]. Ear Hear, 2002,23:369.
12 Palmer CV, Mueller HG, Moriarty M. Profiles of aided loudness: A validation procedure[J]. The Hearing J,1999, 52:34.
13 Simonsen CS, Behrens T.A new compression strategy based on a guided level estimator[J]. Hearing Review, 2009,16:26.
(2016-03-28收稿)
(本文編輯 雷培香)
10.3969/j.issn.1006-7299.2016.06.018
時(shí)間:2016-10-27 15:07
R764.5
A
1006-7299(2016)06-0606-06
1 瑞士Sonova助聽(tīng)器集團(tuán)加拿大分部Unitron研發(fā)部
網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/42.1391.R.20161027.1507.012.html