李志強 林永武 陳俊健
摘要:在聽覺生理學的內(nèi)在原因和外部因素,如噪音、耳毒性藥物、日益嚴重的老年化問題的作用下,高頻聽力損失已經(jīng)成為如今最常見的聽力障礙。針對高頻聽力受損的上述特點并結合聽覺生理學和語音信號處理技術,提出了移頻法和頻譜壓縮法2種高頻聽力補償?shù)姆椒?。對這2種聽力補償方法的原理和優(yōu)缺點進行了深入研究,并通過實驗仿真的方式對上述方法進行了驗證。結果顯示,頻譜壓縮算法雖然系統(tǒng)開銷比較大,但在降頻效果上比移頻算法的效果更好,是一種更值得推薦的高頻聽力損失補償算法。
關鍵詞:高頻聽力損失;補償算法;移頻;頻譜壓縮
中圖分類號:TP391.4文獻標志碼:A文章編號:1008-1739(2020)21-60-4
0引言
權威聽力機構研究表明,世界上聽力殘疾位于各類殘疾之首。在最近10年中,發(fā)達國家以及一些發(fā)展中國家,國民聽力病患發(fā)病率增加了3倍以上。聽力損失在中度以上的患者數(shù)量已經(jīng)超過世界人口的6%。中國聽力障礙患者中90%的人存在中高頻聽力損失,耳機的過度使用和急劇惡化的老齡化問題,使得青少年和老年人中的高頻聽損患者比例更高[1]。
針對高頻聽力損失的補償技術,很多研究人員嘗試使用頻率降低技術進行語音助聽和培訓[2]。Baer在2019年對降頻補償技術進行了全面的研究和總結,并且表示降頻技術在未來將有很好的發(fā)展前途[3]。本文將對2種聽力補償方法的原理和優(yōu)缺點進行深入研究,并通過實驗對上述方法進行仿真驗證。
1聽力學的基本原理
物體的振動通過媒體到達人類的耳朵,被人類的耳朵接收,就是所謂的聲音。20 Hz~20 kHz是人耳所能感知的聲音頻率范圍,不到20 Hz頻率的聲音叫做次聲波,超過20 kHz的聲音稱為超聲波。平常所聽到的聲音主要是各種不同頻率的聲音疊加復合聲一起而形成的,能量集中頻帶不同聲音的性質(zhì)也有所不同。通常高音調(diào)聲音能量主要集中在高頻部分,低音調(diào)的聲音能量主要集中在低頻部分[4]。人類的語音頻率范圍主要集中在200 Hz~8 kHz。按照頻率的高低,通常將超過1 kHz的叫做高頻區(qū)域,500 Hz~1 kHz區(qū)域稱為中頻區(qū)域,不到500 Hz的區(qū)域稱為低頻區(qū)域。圖1和圖2所示的是一段時域和頻域上關于語音信號的波形圖。
2高頻聽力損失補償算法
高頻聽力損失在現(xiàn)代社會中是非常普遍的疾病,然而人們不太重視,甚至大部分人不知道它的存在。實際上大部分的聽力下降都與高頻聽力受損密切相關,高頻聽力損失補償算法在彌補高頻聽力受損方面有至關重要的作用。目前有多通道聲碼器壓縮[6]、頻率轉(zhuǎn)移[7]及頻率壓縮[8]等幾種常見算法。
頻率轉(zhuǎn)移是目前比較先進的一種算法,主要原理是對用傅里葉變換過的頻譜信息按照一定的移頻量進行移頻。算法首先需要確定原始語音的聲學特性,然后選擇必須降低頻率的聲音,并將其移向低頻區(qū),而不需要降低頻率的聲音則保持不變??偟膩碚f,就是將臨界的高頻語音信息轉(zhuǎn)移到尚具有較好殘余聽力的低頻區(qū)中。同傳統(tǒng)的助聽算法相比較,在進行了高頻轉(zhuǎn)移之后比較有效地保留了原有的語音信息。在將高頻信息移動到低頻部分的同時,人耳對處理后聲音的識別沒有明顯下降。移頻算法流程如圖3所示,流程為:①對原始語音信號進行傅里葉變換;②將高頻信息移動至低頻;③對處理后語音進行傅里葉逆變換;④得到重構的語音信號。
與移頻算法不同,頻譜壓縮算法是對頻譜信號進行重采樣而設計的。頻譜壓縮算法流程如圖4所示,流程為:①對原始語音信號進行傅里葉變換;②對變換后的頻譜重采樣;③將采樣后的頻譜作為低頻,④高頻部分補0;⑤對處理后的語音進行傅里葉逆變換;⑥得到重構的語音信號。
重采樣技術就是將原來的采樣頻率轉(zhuǎn)換為新的采樣頻率,從而適應不同采樣率的要求。在對聲音信號進行重采樣時,如果滿足Nyquest定理(采樣頻率大于等于語音信號最高頻率的2倍),可通過一個插值函數(shù)比較完整地還原語音,重采樣算法采用線性插值法。
圖5所示的是一個理想的重構系統(tǒng),圖中( )是由( )形成的沖激串。
濾波器頻率的響應函數(shù)(j)如圖6所示。
3實驗仿真結果及分析
在針對高頻聽力損失的特點和對上述算法理論深入分析的基礎上,對2種算法分別進行了仿真實驗。為了模仿自然中同時具有連續(xù)的高低頻的聲音,仿真采用的原始語音信號是頻率范圍在0~20 000 Hz的一段連續(xù)蜂鳴信號。
移頻算法仿真結果如圖7所示。對仿真后的結果進行分析,可以發(fā)現(xiàn)經(jīng)過移頻處理后的信號與原始信號相比,聲音高頻部分已經(jīng)被轉(zhuǎn)移到了人耳可以識別的較低頻部分。移頻后的信號頻譜圖處理前后相差不大,主要原因是移頻的點數(shù)很多,移頻后肉眼看到的就不是很明顯。而從時頻分布圖和處理前后語音信號圖就可以看出比較明顯的變化。由于技術和條件有限,移頻后的語音信號聽上去失真較大,沒有很好地保留原始語音信號的一些特征,可能對人耳的語音理解度有所影響,造成這個結果的主要原因是此算法是通過恒定的頻率進行移頻的,這樣就導致語言聲出現(xiàn)不自然的變化。
頻譜壓縮算法的仿真結果如圖8所示。從仿真圖上可以看出,在降頻的效果上此算法的效果要比移頻算法的效果更好。語音信息超過10 000 Hz的高頻部分已經(jīng)完整地壓縮到了0~100 00 Hz的中高頻部分了。而且從語譜圖可以看出,降頻后聲音的能量比較集中在中低頻的部分,語音中信息的丟失并沒有那么嚴重。但是從人耳直觀上聽到處理后的聲音和原來的聲音變化還是比較明顯。這主要還是因為算法不夠具體和完善,忽略了聲音中濾波的處理和共振峰的保護等。使用語音重采樣的方法對于還原原始語音的真實度上效果較好,雖然系統(tǒng)開銷比較大,但卻是一種更值得推廣的方法。
4結束語
本文提出并仿真實現(xiàn)了移頻法和頻譜壓縮法2種高頻聽力補償方案,二者都各有優(yōu)缺點,移頻法更為簡單、運算較少、系統(tǒng)的開銷也比較小,能有效地把高頻的信息轉(zhuǎn)移到低頻部分,但是聲音的失真現(xiàn)象比較嚴重,可能會影響人耳對語音信息的識別。而頻譜壓縮法采用了音頻的重采樣方法,在移頻的同時比較有效地保留了聲音中的原始信息,運算量較大,是一種更好的方法。這2種算法也有很多的不足和待改進的地方,首先是沒有考慮聲音的降噪和保存聲音原來的特性,只是著重表現(xiàn)了聲音的降頻這一方面。另外,2種算法均難以處理日常生活中的全部聲音信號,需要其他算法的配合才能得到令人滿意的助聽效果。
參考文獻
[1]余艷萍,于文永,楊向茹,等.中文版老年聽力障礙篩查量表評分與純音聽閾測試的比較研究[J].聽力學及言語疾病雜志,2020,28(3):253-256.
[2]羅麗.DSP數(shù)字助聽器關鍵技術[J].電子技術與軟件工程, 2019(12): 92.
[3] BAER T, MOORE B C J. Evaluation of A Scheme to Compensate for Reduced Frequency Selectivity in Hearing-impaired Subjects[M]. Modeling Sensorineural Hearing Loss: Routledge,2019.
[4] THIJS van de Laar,BERT de Vries[J].IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 2016,24(11): 2200-2213.
[5] VROEGOP J L,HOMANS N C,VAN D S M P,et al. Comparing Two Hearing Aid Fitting Algorithms for Bimodal Cochlear Implant Users.[J]. Ear Hear,2018,40(1):1.
[6]曾珖,謝志文.基于長時共振峰分布的多通道響度補償算法[C]//2018年全國聲學大會論文集K語言聲學與語音信號處理,2018-12,中國北京:出版社不詳,2018:8-9.
[7]李戰(zhàn)明,張璇.基于頻率轉(zhuǎn)移的數(shù)字助聽器單通道響度補償算法[J].電子設計工程,2017, 25(5): 83-87.
[8]胡杰彬.數(shù)字助聽器的響度補償和移頻壓縮研究[D].哈爾濱:哈爾濱工業(yè)大學,2017.