助聽(tīng)器動(dòng)態(tài)范圍控制線(xiàn)性化的策略和效果

2016-12-09 02:20張戌寶

聽(tīng)力學(xué)及言語(yǔ)疾病雜志 2016年6期

張戌寶

·技術(shù)與方法·

張戌寶1

設(shè)計(jì)壓縮助聽(tīng)器的核心目標(biāo)是要確保助聽(tīng)器對(duì)實(shí)際生活中的各種聲音都有可聽(tīng)性。語(yǔ)音是由精確定時(shí)的、復(fù)雜的音素成份構(gòu)成，而任何音頻放大器都存在這些成份失真的風(fēng)險(xiǎn)。這種失真可以不是諧波失真，因此不能用常見(jiàn)的測(cè)試儀表測(cè)量出來(lái)。寬動(dòng)態(tài)范圍壓縮(wide dynamic range compression, WDRC)至今仍在廣泛地使用中[1]，WDRC通過(guò)非線(xiàn)性處理實(shí)現(xiàn)了對(duì)聽(tīng)音環(huán)境中各類(lèi)聲音的可聽(tīng)性，但是在維護(hù)語(yǔ)音的自然性和保真度方面表現(xiàn)并不好[2,3]；換句話(huà)說(shuō)，聽(tīng)力受損者使用WDRC的助聽(tīng)器能確保聽(tīng)見(jiàn)語(yǔ)音，但可能不滿(mǎn)意對(duì)言語(yǔ)的理解度。幾項(xiàng)關(guān)于聽(tīng)音的調(diào)查結(jié)果[4～6]強(qiáng)調(diào)，在處理聲音時(shí)，必不可少的不單是控制語(yǔ)音動(dòng)態(tài)范圍，而且還要維護(hù)不同音素的聲強(qiáng)差異和其它可聽(tīng)見(jiàn)的聲音提示成份，如調(diào)制信息和在頻譜中淹沒(méi)的諧音等。如果這些提示成份失去或模糊不清或失真了，聽(tīng)者的大腦就被迫耗費(fèi)較多精力去區(qū)分模糊、去跟蹤無(wú)法暫停的言語(yǔ)。如果輸出語(yǔ)音是自然的、完整的，人腦能幾乎不費(fèi)力地識(shí)別競(jìng)爭(zhēng)中的語(yǔ)音，新一代助聽(tīng)器需要幫助大腦減輕識(shí)別語(yǔ)音費(fèi)力的程度。此外，壓縮過(guò)程中的時(shí)間策略也不能忽視，慢動(dòng)作的語(yǔ)音增益控制效果比快動(dòng)作的更好[3,7]。

為了實(shí)現(xiàn)這樣的目的，需要采用新的助聽(tīng)放大途徑。Blamey[8]全面地闡述了自適應(yīng)動(dòng)態(tài)范圍優(yōu)化(adaptive dynamic range optimization, ADRO)的策略和性能，在語(yǔ)音動(dòng)態(tài)范圍內(nèi)它使放大器處于線(xiàn)性工作狀態(tài)；為了驗(yàn)證ADRO處理的效果，他在幾年的四次調(diào)查中，比較了ADRO、WDRC和無(wú)助聽(tīng)器的方案，證明了線(xiàn)性化處理在響度感覺(jué)和聽(tīng)音滿(mǎn)意度兩方面得分都最高[5]。Schum等[6]全面地闡述了語(yǔ)音衛(wèi)士(sound guard)的處理策略、壓縮結(jié)構(gòu)和實(shí)驗(yàn)室性能核實(shí)的結(jié)論，它是一種浮動(dòng)-線(xiàn)性的壓縮，屬于局部線(xiàn)性但總的線(xiàn)性化動(dòng)態(tài)范圍比ADRO的還要寬。Nilsson等[9]從聽(tīng)力康復(fù)的角度全面介紹了語(yǔ)音衛(wèi)士的助聽(tīng)策略、理念和先進(jìn)性?；谶@些新出現(xiàn)的線(xiàn)性化放大的進(jìn)步，本文闡述與ADRO放大和浮動(dòng)-線(xiàn)性壓縮有關(guān)的新理念、邏輯規(guī)則、放大處理和先進(jìn)的時(shí)間策略，并比較這些新一代助聽(tīng)放大器的效果。

1 自適應(yīng)的動(dòng)態(tài)范圍優(yōu)化處理

聽(tīng)力正常人能感覺(jué)到的聲音動(dòng)態(tài)范圍大約是0～100 dB SPL；中度聽(tīng)力損失者能感覺(jué)到的聲響范圍縮小至約55～100 dB[1]；大多數(shù)的感音神經(jīng)性聽(tīng)力損失發(fā)生在中、高音頻區(qū)。WDRC可以將正常的動(dòng)態(tài)范圍變換到受損的動(dòng)態(tài)范圍，完滿(mǎn)地解決了可聽(tīng)性問(wèn)題；不過(guò)，WDRC會(huì)損壞語(yǔ)音的自然特性。為了解決這一問(wèn)題，ADRO處理器利用與WDRC完全不同的策略，使其聽(tīng)音效果十分不同。ADRO重視語(yǔ)音中信息豐富的聲壓區(qū)段，具體而言，在每個(gè)頻道中對(duì)語(yǔ)音信號(hào)強(qiáng)度在中部的大部分進(jìn)行線(xiàn)性放大，同時(shí)保持輸出在用戶(hù)的舒適級(jí)和可聽(tīng)級(jí)之間，而忽視信息量很少的語(yǔ)音強(qiáng)度兩端的信號(hào)[8]。在開(kāi)發(fā)ADRO的初期，主要應(yīng)用于人工耳蝸傅里葉的處理器，后來(lái)過(guò)渡到助聽(tīng)器。ADRO在一種快速傅里葉變換(fast Fourier transform, FFT)加逆快速傅里葉變換(inverse FFT, IFFT)的助聽(tīng)器芯片上實(shí)現(xiàn)其策略。

1.1 自適應(yīng)動(dòng)態(tài)范圍優(yōu)化的策略圖1顯示ADRO在一頻道上的線(xiàn)性放大理念，其線(xiàn)性窗有40 dB，可聽(tīng)動(dòng)態(tài)范圍達(dá)90 dB。ADRO的策略是使用四個(gè)邏輯規(guī)則來(lái)控制助聽(tīng)器輸入的寬動(dòng)態(tài)范圍，這四個(gè)規(guī)則在每個(gè)頻道上獨(dú)立操作，每個(gè)頻道先作信號(hào)強(qiáng)度的統(tǒng)計(jì)分析以完成規(guī)則的判定，再控制放大器動(dòng)作。這些規(guī)則包括：

1.1.1 舒適級(jí)規(guī)則如果一個(gè)頻道的輸出聲級(jí)超過(guò)舒適級(jí)目標(biāo)百分位數(shù)，該頻道的放大增益就降低(平行四邊形頂部)，否則就維持該增益。有關(guān)舒適級(jí)目標(biāo)百分位數(shù)的設(shè)置見(jiàn)1.2。

圖1 ADRO的可聽(tīng)動(dòng)態(tài)范圍是90 dB而線(xiàn)性窗是40 dB

1.1.2 可聽(tīng)級(jí)規(guī)則如果一個(gè)頻道的輸出聲級(jí)低于可聽(tīng)級(jí)目標(biāo)百分位數(shù)，該頻道的放大增益就增加(平行四邊形底部)，否則就維持該增益。有關(guān)可聽(tīng)級(jí)目標(biāo)百分位數(shù)的設(shè)置見(jiàn)1.2。

1.1.3 聽(tīng)力保護(hù)規(guī)則如果一個(gè)頻道的輸出信號(hào)超過(guò)上限(upper limit)，該頻道的輸出被限制到最大輸出聲級(jí),它由ADRO助聽(tīng)器的適配軟件設(shè)置。該規(guī)則確保一個(gè)突然響的聲音，如瞬態(tài)噪聲，不超過(guò)聲音的不舒適級(jí)。

1.1.4 背景噪聲規(guī)則如果一個(gè)頻道的增益超過(guò)規(guī)定的最大增益，該處理器就限制增益至極低以形成靜音(squelch)頻道。該規(guī)則避免長(zhǎng)期平穩(wěn)弱噪聲輸出使助聽(tīng)器用戶(hù)煩惱。

圖2 實(shí)測(cè)的ADRO助聽(tīng)器一個(gè)頻道的I/O曲線(xiàn)

圖2顯示設(shè)有ADRO的助聽(tīng)器于測(cè)試箱中在某個(gè)頻率的輸入/輸出(I/O)曲線(xiàn)，該I/O曲線(xiàn)與WDRC的I/O曲線(xiàn)明顯不同。在底部的左角，當(dāng)非常低的輸入聲級(jí)(25 dB)增加時(shí)，工作點(diǎn)向舒適級(jí)目標(biāo)沿著直線(xiàn)上升，其間增益是固定的；當(dāng)?shù)竭_(dá)此目標(biāo)時(shí)，舒適級(jí)規(guī)則就激活且頻道增益降低。當(dāng)輸入聲級(jí)繼續(xù)增加時(shí)，輸出聲級(jí)也不再增加而保持在舒適級(jí)狀態(tài)。當(dāng)輸入聲級(jí)開(kāi)始降低時(shí)，工作點(diǎn)就沿著另一增益的直線(xiàn)向下移動(dòng)；當(dāng)輸入聲級(jí)繼續(xù)下降且工作點(diǎn)到了可聽(tīng)級(jí)目標(biāo)時(shí)，可聽(tīng)級(jí)規(guī)則激活且所在頻道增益增加以使輸出語(yǔ)音清晰可聽(tīng)。當(dāng)輸入聲級(jí)繼續(xù)減少，頻道增益達(dá)到預(yù)置的最大增益時(shí)，就認(rèn)為輸入是平穩(wěn)弱噪聲而采用一個(gè)限制的增益使輸出聲音“靜音”。因此，典型的ADRO的I/O曲線(xiàn)可能是一個(gè)環(huán)形，它有兩個(gè)線(xiàn)性的側(cè)邊、非線(xiàn)性的頂邊和底邊。不過(guò)，在常見(jiàn)的聽(tīng)音情況下，語(yǔ)音包絡(luò)的峰-谷值總是在數(shù)十dB以?xún)?nèi)，環(huán)形的頂邊和底邊就很短，I/O曲線(xiàn)甚至退化成一條斜線(xiàn)。因此，ADRO能保護(hù)原輸入的峰-谷波形細(xì)節(jié)，有利于言語(yǔ)的理解；付出的代價(jià)是放棄了可聽(tīng)級(jí)之下和舒適級(jí)之上的兩小部分信息不豐富的語(yǔ)音。當(dāng)適配ADRO助聽(tīng)器時(shí)，設(shè)置舒適級(jí)/可聽(tīng)級(jí)目標(biāo)、上限和最大增益，而沒(méi)有交叉頻率、拐點(diǎn)和壓縮比的設(shè)置。

1.2 ADRO語(yǔ)音信號(hào)的統(tǒng)計(jì)分布為了搜索出語(yǔ)音中信息量豐富的聲強(qiáng)區(qū)段，ADRO需要統(tǒng)計(jì)各頻道中的語(yǔ)音強(qiáng)度值和其出現(xiàn)率的分布情況。圖3為模擬的一個(gè)頻道上語(yǔ)音強(qiáng)度分布圖，X軸代表強(qiáng)度測(cè)量值，Y軸代表測(cè)量值的相對(duì)出現(xiàn)率，即按強(qiáng)度最大值歸一化的數(shù)據(jù)。第90百分位數(shù)是在該分布圖上的一個(gè)信號(hào)強(qiáng)度估計(jì)值，它滿(mǎn)足90%的發(fā)生次數(shù)低于該估計(jì)值而10%的發(fā)生次數(shù)大于該估計(jì)值。安靜環(huán)境中，雙瓣分布圖是常見(jiàn)的語(yǔ)音信號(hào)強(qiáng)度分布圖，如圖3，左瓣的出現(xiàn)率峰值代表輕背景噪聲測(cè)量值的最頻繁出現(xiàn)次數(shù)；右瓣的出現(xiàn)率峰值代表普通言語(yǔ)測(cè)量值的最頻繁出現(xiàn)次數(shù)。統(tǒng)計(jì)分析時(shí)，百分位數(shù)估計(jì)值的確定使用迭代方法：當(dāng)前的強(qiáng)度測(cè)量值與當(dāng)前的百分位數(shù)估計(jì)值比較，當(dāng)測(cè)量值大于估計(jì)值時(shí)，該百分位數(shù)估計(jì)值增加一個(gè)小量(預(yù)設(shè)的上躍步)；反之，該估計(jì)值就減少一個(gè)小量(預(yù)設(shè)的下躍步)；多次跌代完成后，如果當(dāng)前的估計(jì)值滿(mǎn)足上躍次數(shù)是下躍次數(shù)的9倍，則當(dāng)前的估計(jì)值就收斂到了第90百分位數(shù)。類(lèi)似地，第30百分位數(shù)也可被確定：在迭代多次后，上躍次數(shù)與下躍次數(shù)之比為3:7，如果上躍步和下躍步的值設(shè)置得比較大，百分位數(shù)估計(jì)值可以收斂較快。對(duì)每個(gè)頻道上記錄的測(cè)量值作同樣的統(tǒng)計(jì)以得到各頻道兩個(gè)百分位數(shù)的估計(jì)值。統(tǒng)計(jì)分析時(shí)不設(shè)時(shí)間窗，得到的第90百分位數(shù)和第30百分位數(shù)分別用來(lái)作為舒適級(jí)規(guī)則和可聽(tīng)級(jí)規(guī)則的目標(biāo)。ADRO的統(tǒng)計(jì)規(guī)則屬于模糊邏輯類(lèi)，即兩個(gè)規(guī)則不總是成立，或者它們的百分位數(shù)是不確定的。

圖3 一頻道上語(yǔ)音信號(hào)強(qiáng)度和出現(xiàn)率的統(tǒng)計(jì)分布曲線(xiàn)

1.3 ADRO處理器的延時(shí)和時(shí)間常數(shù) 在ADRO的處理中，輸出對(duì)輸入的延時(shí)是不可避免的，延時(shí)多長(zhǎng)取決于處理硬件。典型的A/D變換器和D/A變換器各自產(chǎn)生0.5 ms的延時(shí)；ADRO使用的FFT加IFFT運(yùn)算各自產(chǎn)生幾毫秒的延時(shí)；當(dāng)選擇16 kHz采樣頻率、64點(diǎn)FFT時(shí)，總的延時(shí)是13 ms；在WDRC處理時(shí)，同樣的硬件產(chǎn)生相同的延時(shí)。Blamey認(rèn)為[8]，基于64點(diǎn)FFT的運(yùn)算，ADRO產(chǎn)生13 ms的延時(shí)是可行的，因?yàn)?0 ms是設(shè)計(jì)的上界。不過(guò)，Agnew等指出[10]，當(dāng)助聽(tīng)器有3～5 ms的延時(shí)時(shí)，聽(tīng)音可能導(dǎo)致聽(tīng)覺(jué)模糊；當(dāng)延時(shí)大于10 ms時(shí)，可能令人不愉快。如果使用多頻道的數(shù)字濾波器組來(lái)代替FFT[1]，ADRO引起的延時(shí)將縮短。

Hansen的兩個(gè)調(diào)查說(shuō)明[11]，壓縮處理器的啟動(dòng)時(shí)間和釋放時(shí)間對(duì)語(yǔ)音質(zhì)量和理解度起著重要作用。短的時(shí)間常數(shù)導(dǎo)致頻道增益急速改變，會(huì)扭曲輸入語(yǔ)音的峰-谷比和音樂(lè)信號(hào)的動(dòng)態(tài)范圍，因而引起非線(xiàn)性失真；當(dāng)然，短的時(shí)間常數(shù)對(duì)抑制強(qiáng)的瞬態(tài)干擾聲是必要的。ADRO不采用折中的時(shí)間策略，對(duì)不同的規(guī)則用不同的時(shí)間常數(shù)以確保不同的輸入均獲益，可聽(tīng)級(jí)和舒適級(jí)規(guī)則的增益調(diào)節(jié)要適應(yīng)語(yǔ)音強(qiáng)度的慢起伏，這兩個(gè)規(guī)則的調(diào)節(jié)速度為3～5 dB/s，取決于個(gè)人喜好。聽(tīng)力保護(hù)規(guī)則讓輸出不超過(guò)每個(gè)頻道的響度上限，因此，使用短得多的啟動(dòng)時(shí)間僅抑制強(qiáng)的瞬態(tài)聲音。

1.4 ADRO處理的效果 Blamey[5]使用助聽(tīng)響度概況(profile of aided loudness, PAL)測(cè)試語(yǔ)句[12]來(lái)評(píng)估ADRO的性能，并與WDRC和無(wú)助聽(tīng)器方案進(jìn)行了比較，原本的PAL有12個(gè)語(yǔ)句，來(lái)自日常生活，Blamey增加到18個(gè)語(yǔ)句，要求受試者完成環(huán)境聲音問(wèn)卷(environmental sound questionnaires, ESQ)后，再根據(jù)他們打的分來(lái)評(píng)估不同的方案。該研究歷經(jīng)幾年的4次調(diào)查代表了普遍的現(xiàn)實(shí)聽(tīng)音情景：調(diào)查1有19例受試者，從輕度到極重度聽(tīng)力損失，使用耳背式(BTE)助聽(tīng)器，使用盲法在ADRO和WDRC之間轉(zhuǎn)換比較；調(diào)查2有22例受試者，為輕度到中度聽(tīng)力損失，使用耳內(nèi)式(ITE)助聽(tīng)器，用塊交換(reverse block)法來(lái)轉(zhuǎn)換ADRO和WDRC的助聽(tīng)器；調(diào)查3中，10例受試者為中度到重度聽(tīng)力損失，使用并入數(shù)字降噪算法的BTE助聽(tīng)器，采用盲法比較；調(diào)查4的目的與其它調(diào)查不同，沒(méi)有納入WDRC，僅為了對(duì)比兩種ADRO的性能，以了解不同頻道數(shù)對(duì)聲音質(zhì)量和語(yǔ)音理解度的影響；助聽(tīng)器并入方向性麥克風(fēng)模式，10例受試者的聽(tīng)力損失從輕度到中度。

圖4 三種助聽(tīng)方案的滿(mǎn)意度得分與響度分類(lèi)的關(guān)系

ESQ問(wèn)卷響度分為“強(qiáng)聲”、“中度聲”和“輕聲”，以聽(tīng)力正常者的感覺(jué)為準(zhǔn)，受試者先對(duì)每個(gè)句子的響度感覺(jué)打分，再對(duì)這些句子的聽(tīng)音滿(mǎn)意度打分。按照PAL規(guī)則，每個(gè)句子有8個(gè)響度等級(jí)(0～7)和5個(gè)滿(mǎn)意度等級(jí)(1～5)；18個(gè)句子的得分形成一個(gè)數(shù)據(jù)塊，4次調(diào)查共獲得188個(gè)數(shù)據(jù)塊。使用方差分析法進(jìn)行統(tǒng)計(jì)分析，因?yàn)檫@些數(shù)據(jù)受多個(gè)獨(dú)立因素的影響，分析結(jié)果能對(duì)調(diào)查的響度和滿(mǎn)意度有合理的逼近。圖4顯示平均滿(mǎn)意度得分曲線(xiàn)(基于4次調(diào)查)，可見(jiàn)，兩種助聽(tīng)器方案的滿(mǎn)意度得分明顯高于無(wú)助聽(tīng)器方案的得分，特別是響度為“輕聲”時(shí)；ADRO的得分較WDRC的得分高約0.2。當(dāng)響度為“強(qiáng)聲”時(shí)，這三個(gè)方案的滿(mǎn)意度比較接近；隨著句子響度增加，助聽(tīng)器方案的滿(mǎn)意度得分一致下降，而無(wú)助聽(tīng)器方案的滿(mǎn)意度得分幾乎沒(méi)有變化。

2 浮動(dòng)-線(xiàn)性處理器

眾所周知，早期的線(xiàn)性放大器不能實(shí)現(xiàn)聽(tīng)力受損者對(duì)聲音可聽(tīng)性的要求，而一個(gè)WDRC處理器能滿(mǎn)足可聽(tīng)性要求卻使輸入信號(hào)失真。Schum[6]和Nilsson等[9]闡述了一種新奇的、既線(xiàn)性又壓縮的放大器，稱(chēng)為“浮動(dòng)-線(xiàn)性”(floating-linear, FL)處理器，雖然FL和ADRO處理器開(kāi)發(fā)的目的相同，但兩者的處理策略不同。為了保留“處方”增益的約束，F(xiàn)L處理器不得不浮動(dòng)地線(xiàn)性放大，因而，在很寬的動(dòng)態(tài)范圍內(nèi)放大后的聲音能夠?qū)崿F(xiàn)傳統(tǒng)的處方目標(biāo)，同時(shí)輸出語(yǔ)音又是完整的、自然的；即使在有噪聲的環(huán)境中，助聽(tīng)器用戶(hù)也能較少費(fèi)力地理解聆聽(tīng)的語(yǔ)音。

2.1 浮動(dòng)-線(xiàn)性處理器的處理策略 FL處理器設(shè)計(jì)具有獨(dú)特的優(yōu)點(diǎn)，它能浮動(dòng)-線(xiàn)性地將環(huán)境聲音的動(dòng)態(tài)范圍變換到聽(tīng)力損失者的動(dòng)態(tài)范圍。FL處理器能將有30 dB峰-谷起伏的聲音輸入變換成30 dB峰-谷起伏的輸出，對(duì)不同的輸入聲壓它設(shè)有不同的線(xiàn)性增益窗，這樣的動(dòng)態(tài)壓縮稱(chēng)為“語(yǔ)音衛(wèi)士”(sound guard，SG)，以強(qiáng)調(diào)不會(huì)像WDRC那樣損壞語(yǔ)音的結(jié)構(gòu)。此外，F(xiàn)L處理器設(shè)有長(zhǎng)期監(jiān)視器和短期監(jiān)視器，同時(shí)獨(dú)立工作[13]，前者使用長(zhǎng)時(shí)間窗以準(zhǔn)確估計(jì)常見(jiàn)言語(yǔ)輸入的強(qiáng)度，后者使用短得多的時(shí)間窗以準(zhǔn)確估計(jì)瞬態(tài)噪聲輸入的強(qiáng)度。該FL處理器的方框圖如圖5所示，它的規(guī)則如下：

2.1.1 線(xiàn)性放大規(guī)則當(dāng)長(zhǎng)期監(jiān)視器估計(jì)值的起伏在9 dB以?xún)?nèi)時(shí)，F(xiàn)L放大器的增益維持不變，該輸入聲級(jí)的區(qū)段被稱(chēng)作9 dB線(xiàn)性窗；長(zhǎng)期和短期監(jiān)視器的兩種估計(jì)值輸出也在不斷地比較，如果這兩種估計(jì)值非常接近，則長(zhǎng)期監(jiān)視器的估計(jì)值調(diào)節(jié)放大器的增益。當(dāng)輸入信號(hào)是平穩(wěn)的語(yǔ)音時(shí)，兩監(jiān)視器的輸出均方根(RMS)值起伏在約10 dB范圍內(nèi)；在常見(jiàn)的對(duì)話(huà)情景中，9 dB的FL窗能確保輸出是線(xiàn)性放大的言語(yǔ)。與WDRC比較，該規(guī)則確保了輸出語(yǔ)音是自然的和無(wú)失真的，因而聽(tīng)力損失患者理解語(yǔ)音時(shí)可以盡可能少地費(fèi)力。

2.1.2 可聽(tīng)級(jí)和舒適級(jí)規(guī)則一旦兩個(gè)監(jiān)視器的輸入估計(jì)值出現(xiàn)大的變化，如該值>9 dB，但是變化慢，這時(shí)輸入聲級(jí)就高出或低于當(dāng)前線(xiàn)性窗，F(xiàn)L放大器就立即向右方或左方“浮動(dòng)”到另一個(gè)較低或較高的增益窗上；因?yàn)镕L窗沿著“處方”曲線(xiàn)浮動(dòng)，該線(xiàn)性放大的增益也確保了語(yǔ)音信號(hào)的輸出在適配處方的可聽(tīng)級(jí)和舒適級(jí)目標(biāo)之間。

2.1.3 瞬態(tài)噪聲管理(transient management, TM)規(guī)則如果短期監(jiān)視器的估計(jì)值與長(zhǎng)期監(jiān)視器的估計(jì)值明顯不同，表明瞬態(tài)噪聲存在。該規(guī)則讓用戶(hù)能感覺(jué)到原來(lái)強(qiáng)度較弱的瞬態(tài)噪聲，因此，F(xiàn)L處理器線(xiàn)性放大且增益降低的量為6～0 dB，具體數(shù)值取決于語(yǔ)音是否存在，6 dB適用于語(yǔ)音不存在時(shí)；當(dāng)語(yǔ)音存在時(shí)，不要過(guò)多降低增益以保護(hù)有用的語(yǔ)音提示和自然性。如果關(guān)掉TM，原本模樣的瞬態(tài)噪聲就會(huì)出現(xiàn)。TM規(guī)則用于SG E(增強(qiáng)型語(yǔ)音衛(wèi)士)處理器，因?yàn)樗捎?2 dB 寬的線(xiàn)性窗，在某些瞬態(tài)噪聲通過(guò)它時(shí)(增益調(diào)節(jié)未及時(shí)跟上)可能導(dǎo)致不舒適的響音感覺(jué)。

對(duì)于9 dB線(xiàn)性窗的FL處理器，當(dāng)有一個(gè)突然的聲音輸入時(shí)，短期監(jiān)視器的估值就調(diào)節(jié)增益，幾乎立即控制放大器的輸出；然后，增益又迅速返回到之前由長(zhǎng)期監(jiān)視器確定的增益。該操作要立即響應(yīng)突然變化的聲音，包括瞬態(tài)強(qiáng)聲和輕聲，即跳在當(dāng)前語(yǔ)音聲級(jí)之上或之下的聲音。

圖5 FL處理器與兩個(gè)獨(dú)立監(jiān)視器合作的方框圖

2.1.4 低聲壓擴(kuò)展規(guī)則該規(guī)則的原理與常規(guī)WDRC的擴(kuò)展規(guī)則[1]相同。當(dāng)長(zhǎng)期監(jiān)視器估計(jì)值低于輕聲聲級(jí)10 dB時(shí)，就認(rèn)為輸入信號(hào)是弱平穩(wěn)噪聲，F(xiàn)L處理器利用常規(guī)的低聲壓擴(kuò)展處理使放大器下降到非常低的增益，擴(kuò)展比可到1/10或沒(méi)有增益。

圖6 FL處理器在某個(gè)頻率上的I/O工作曲線(xiàn)

圖6顯示FL處理器在某個(gè)頻率上的輸入/輸出工作特性曲線(xiàn)，標(biāo)出了三個(gè)增益線(xiàn)段：對(duì)角線(xiàn)代表沒(méi)增益的線(xiàn)性函數(shù)，對(duì)角線(xiàn)之上的粗實(shí)線(xiàn)表示FL的線(xiàn)性窗，以一個(gè)固定的增益進(jìn)行線(xiàn)性放大；點(diǎn)線(xiàn)表示壓縮的“處方”目標(biāo)，就像在常規(guī)的WDRC中見(jiàn)到的；虛線(xiàn)表示瞬態(tài)噪聲管理，與對(duì)角線(xiàn)接近，說(shuō)明增益很?。稽c(diǎn)劃線(xiàn)表示低聲壓擴(kuò)展，其斜率就是擴(kuò)展比，從處方增益線(xiàn)左端逐步下降到零。FL線(xiàn)性窗的寬度是可調(diào)的，選9或12 dB，取決于用戶(hù)個(gè)人的喜好。SG E的線(xiàn)性窗是12 dB寬，其線(xiàn)性覆蓋比SG的9 dB窗更寬；對(duì)典型的6 dB調(diào)制深度語(yǔ)音保真更好(多14%)，幾乎保護(hù)到整個(gè)30 dB峰-谷的包絡(luò)[9]。由于相鄰音素的強(qiáng)度差異和音素之間的間隔信息都能被保護(hù)，因而FL處理器輸出能保持原本的語(yǔ)音提示，當(dāng)語(yǔ)音比較平穩(wěn)時(shí)，F(xiàn)L窗移動(dòng)非常緩慢，使增益調(diào)節(jié)就像音量控制一樣。瞬態(tài)噪聲管理保留了瞬態(tài)噪聲但在不煩人的范圍內(nèi)，這樣可以避免用戶(hù)注意力出現(xiàn)不必要的轉(zhuǎn)移。

2.2 浮動(dòng)-線(xiàn)性處理器的時(shí)間策略對(duì)于常規(guī)的WDRC，時(shí)間策略較簡(jiǎn)單：?jiǎn)?dòng)時(shí)間選短的，大約幾十毫秒；釋放時(shí)間相對(duì)地長(zhǎng)，約幾百毫秒。通常，這樣的策略可以抑制突然闖入的強(qiáng)聲，維持用戶(hù)的舒適感。當(dāng)壓縮的釋放時(shí)間在25～75 ms范圍時(shí)就認(rèn)為是快動(dòng)作壓縮[6]，如音節(jié)壓縮。音節(jié)壓縮基于單個(gè)音素的聲強(qiáng)來(lái)控制增益：強(qiáng)的元音得到較少的增益，不發(fā)聲的輔音得到增益較多；因此，音節(jié)壓縮形成了聲強(qiáng)比較均勻的各音素，同時(shí)改變了語(yǔ)音原本的聲強(qiáng)結(jié)構(gòu)。當(dāng)壓縮器釋放時(shí)間在約200～2 000 ms范圍時(shí)，就認(rèn)為是慢動(dòng)作壓縮，目標(biāo)是保持增益平穩(wěn)控制，就像用音量控制器來(lái)調(diào)節(jié)音量那樣；但是，進(jìn)行連續(xù)的言語(yǔ)交談時(shí)，又免不了隨時(shí)闖入的瞬態(tài)噪聲干擾?？偠灾晟频膲嚎s器需要一種放大，它不單能針對(duì)有用輸入的聲強(qiáng)調(diào)節(jié)增益，還有適當(dāng)?shù)脑肼暱刂茣r(shí)間以便自適應(yīng)地使整體最佳。

FL處理器巧妙地利用了獨(dú)立估計(jì)而又合作判定的一對(duì)輸入監(jiān)視器，避免了慢動(dòng)作和快動(dòng)作壓縮器各自的不足，又保持了這兩種壓縮器的優(yōu)點(diǎn)，這兩個(gè)監(jiān)視器不斷地對(duì)輸入信號(hào)以極快的速率采樣，不大于4 ms[13]。長(zhǎng)期監(jiān)視器在幾百毫秒到幾秒的時(shí)間上產(chǎn)生平均估計(jì)值，短期監(jiān)視器則在幾毫秒上平均；來(lái)自?xún)蓚€(gè)監(jiān)視器的輸出共同判定輸入的類(lèi)型再調(diào)節(jié)放大器增益。FL處理器的時(shí)間策略與單個(gè)快/慢動(dòng)作壓縮器的主要區(qū)別是：FL處理器的啟動(dòng)時(shí)間和釋放時(shí)間從幾毫秒到幾秒不等，取決于輸入信號(hào)的動(dòng)態(tài)特性；當(dāng)有一個(gè)突然的輸入聲音上升或下降時(shí)，該處理器在瞬間將增益下降或上調(diào)。

2.3 浮動(dòng)-線(xiàn)性處理器的效果核實(shí)FL處理器的效益是必要的，包括語(yǔ)音識(shí)別的增強(qiáng)和噪聲中聽(tīng)音費(fèi)力的程度。Sockalingam等[7]通過(guò)在Oticon國(guó)際總部的調(diào)查揭示了FL的效益，共39例有助聽(tīng)器經(jīng)驗(yàn)的受試者參加測(cè)試，其聽(tīng)力損失類(lèi)型從平坦型到斜坡型；這些受試者每人使用帶SG的助聽(tīng)器(Agil Pro)和不帶SG的助聽(tīng)器，使用平衡交叉法將受試者分為兩組，交換使用Agil助聽(tīng)器和無(wú)SG助聽(tīng)器，受試者對(duì)所用助聽(tīng)器是盲知的，且兩種助聽(tīng)器之間測(cè)試句的閱讀順序是隨機(jī)的；兩種測(cè)試條件：空間分布的語(yǔ)音加未調(diào)制噪聲(稱(chēng)空間組成)和混合的語(yǔ)音加沖激噪聲(稱(chēng)混合組成)。在空間組成中，用三個(gè)揚(yáng)聲器激勵(lì)未調(diào)制噪聲，位置在110°、180°和-110°，聲級(jí)為70 dB SPL；語(yǔ)音揚(yáng)聲器在0°，聲級(jí)是可調(diào)的；在混合組成中，噪聲和語(yǔ)音都在0°，噪聲是20 ms寬的脈沖調(diào)制白噪聲，每200 ms發(fā)一次；這樣的噪聲專(zhuān)門(mén)設(shè)計(jì)用來(lái)聽(tīng)SG助聽(tīng)器在瞬態(tài)噪聲中的效果。用Dantalle測(cè)試句的雙倍5句集和OLAS測(cè)試句(德語(yǔ))作為激勵(lì)的語(yǔ)音，在語(yǔ)音加噪聲的理解度測(cè)試中，記錄50%的語(yǔ)句識(shí)別率所對(duì)應(yīng)的信噪比(S/N)，該S/N反映語(yǔ)音理解度，S/N越低理解度越高。比較Agil助聽(tīng)器與無(wú)SG助聽(tīng)器的效果時(shí)，Agil的語(yǔ)音理解度在空間組成中改進(jìn)了1 dB，在混合組成中改進(jìn)了1.5 dB；在聽(tīng)音費(fèi)力程度測(cè)試中，7個(gè)打分等級(jí)：不需費(fèi)力、很少費(fèi)力、較少費(fèi)力、中度費(fèi)力、較為費(fèi)力、很費(fèi)力和最費(fèi)力，如圖7所示；記錄80%的語(yǔ)句識(shí)別率對(duì)應(yīng)的S/N用于聽(tīng)音費(fèi)力度測(cè)試，由圖7可見(jiàn)，使用無(wú)SG助聽(tīng)器時(shí)受試者打分的中間值為較費(fèi)力；而使用Agil助聽(tīng)器時(shí)，在同樣的測(cè)試條件下受試者打分的中間值是中度費(fèi)力；說(shuō)明Agil助聽(tīng)器使受試者聽(tīng)音費(fèi)力度明顯下降。結(jié)論是，Agil的SG處理器能使語(yǔ)音理解度更好，且在語(yǔ)音加噪聲的情景下，SG助聽(tīng)器用戶(hù)在理解同樣的語(yǔ)音時(shí)較少費(fèi)力。

圖7 兩種助聽(tīng)器在語(yǔ)音加噪聲組合中的聽(tīng)音費(fèi)力程度得分

3 小結(jié)

ADRO處理器幾乎在純線(xiàn)性放大中工作，線(xiàn)性窗寬可達(dá)40 dB，它使用4個(gè)邏輯規(guī)則來(lái)保護(hù)語(yǔ)音中重要的、信息含量豐富的成份，同樣也保護(hù)音樂(lè)聲；它的線(xiàn)性放大策略讓聽(tīng)力受損者聽(tīng)到的語(yǔ)音包絡(luò)結(jié)構(gòu)未損，且有自然性，因此在各種聽(tīng)音情景下，理解度和舒適度增加了。ADRO處理器放棄了傳統(tǒng)的處方增益目標(biāo)，其適配軟件不考慮拐點(diǎn)、交叉頻率等參數(shù)；ADRO的時(shí)間策略較為簡(jiǎn)單，針對(duì)不同的聽(tīng)音輸入選擇不同的時(shí)間常數(shù)；ADRO較長(zhǎng)的處理延時(shí)可以用濾波器組代替FFT結(jié)構(gòu)來(lái)改進(jìn)。FL處理器在浮動(dòng)的線(xiàn)性運(yùn)算中工作，線(xiàn)性窗寬度為9或12 dB，它保護(hù)語(yǔ)音的提示信息不受破壞，在用戶(hù)的聽(tīng)力動(dòng)態(tài)范圍內(nèi)確保無(wú)失真的語(yǔ)音，但對(duì)音樂(lè)信號(hào)還要進(jìn)一步考慮。FL處理器還保持著處方增益的目標(biāo)，它的雙監(jiān)視器獨(dú)立檢測(cè)但又合作控制啟動(dòng)時(shí)間和釋放時(shí)間，是目前最先進(jìn)的時(shí)間控制策略。對(duì)于瞬態(tài)噪聲，F(xiàn)L處理器進(jìn)行即刻增益調(diào)節(jié)，之后又迅速返回到之前的增益，這樣的處理使用戶(hù)可以聽(tīng)見(jiàn)瞬態(tài)噪聲但不煩人。

任何助聽(tīng)產(chǎn)品要讓聲音既可聽(tīng)而又不破壞其自然結(jié)構(gòu)，只能是線(xiàn)性化的動(dòng)態(tài)范圍處理，精細(xì)的時(shí)間策略是實(shí)現(xiàn)線(xiàn)性壓縮必不可少的輔助；從實(shí)現(xiàn)的角度，這種壓縮處理器的進(jìn)步取決于助聽(tīng)器芯片所具有的高速處理功能和超量的存儲(chǔ)器。WDRC處理器比較簡(jiǎn)單，十多年來(lái)，各助聽(tīng)器廠(chǎng)家都用于其實(shí)際產(chǎn)品中；ADRO和FL處理器較為復(fù)雜，目前只有少數(shù)助聽(tīng)器廠(chǎng)家應(yīng)用于其產(chǎn)品中。

1 Theodore HV. 著. 張戌寶, 田嵐，譯.實(shí)用助聽(tīng)器原理和技術(shù)[M].第二版. 北京:人民軍醫(yī)出版社, 2013. 82,188～196, 200～201.

2 Hornsby BWY, Ricketts TA. The effects of compression ratio, signal-to-noise ratio, and level on speech recognition in normal-hearing listeners[J]. J Acoust Soc Am, 2001,109:2964.

3 Cox RM, Xu J. Short and long compression release times: speech understanding, real-world preferences, and association with cognitive ability[J]. J Am Acad Audiol,2010，21:121.

4 Arehart KH,Kates JM,Anderson MC. Effects of noise, nonlinear processing, and linear filtering on perceived music quality[J]. Intern.Journal of Audiology, 2011,50:177.

5 Blamey PJ,Martin LFA. Loudness and satisfaction ratings for hearing aid users[J]. J AmAcad Audiol,2009, 20:272.

6 Schum DJ, Sockalingam R. A new approach to nonlinear signal processing[J]. Hearing Review,2010,17:24.

7 Sockalingam R，Halmberg M.Improve speech understanding and reduced listening effort[M].Oticon White paper, Smarum, Denmark,2010.1～3.

8 Blamey PJ. Adaptive dynamic range optimization (ADRO): a digital amplification strategyfor hearing aids and cochlear implants[J]. Trends Amplif, 2005, 9:77.

9 Nilsson MJ, Behrens T. How audiology has guided the development of Oticon's latest release-Oticon Alta[M]. Oticon White paper, Askim, Sweden, 2013. 1～8.

10 Agnew J,Thornton JM.Just noticeable and objectionable group delays in digital hearing aids[J]. J Am Acad Audiol, 2000,11:330.

11 Hansen M. Effects of multi-channel compression time constants on subjectively perceived sound quality and speech intelligibility[J]. Ear Hear, 2002,23:369.

12 Palmer CV, Mueller HG, Moriarty M. Profiles of aided loudness: A validation procedure[J]. The Hearing J,1999, 52:34.

13 Simonsen CS, Behrens T.A new compression strategy based on a guided level estimator[J]. Hearing Review, 2009,16:26.

(2016-03-28收稿)

(本文編輯雷培香)

10.3969/j.issn.1006-7299.2016.06.018

時(shí)間：2016-10-27 15:07

R764.5

1006-7299(2016)06-0606-06

1 瑞士Sonova助聽(tīng)器集團(tuán)加拿大分部Unitron研發(fā)部

網(wǎng)絡(luò)出版地址：http://www.cnki.net/kcms/detail/42.1391.R.20161027.1507.012.html

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

助聽(tīng)器動(dòng)態(tài)范圍控制線(xiàn)性化的策略和效果

1 自適應(yīng)的動(dòng)態(tài)范圍優(yōu)化處理

2 浮動(dòng)-線(xiàn)性處理器

3 小結(jié)