王杰 嚴(yán)志豪 楊喬赫 陸錫坤 陳運(yùn)達(dá) 桑晉秋
(1 廣州大學(xué)電子與通信工程學(xué)院 廣州 510006)
(2 中國科學(xué)院聲學(xué)研究所 噪聲與振動重點(diǎn)實(shí)驗(yàn)室 北京 100190)
(3 中國科學(xué)院大學(xué) 北京 100049)
聽覺系統(tǒng)產(chǎn)生聲音的方式分為氣傳導(dǎo)和骨傳導(dǎo)(Bone conduction,BC)兩種。氣傳導(dǎo)中聲音依次經(jīng)過外耳、中耳和內(nèi)耳,最終刺激基底膜并且在神經(jīng)元上產(chǎn)生聽覺。骨傳導(dǎo)則是利用頭骨振動接收和傳遞聲音信號,骨導(dǎo)設(shè)備的核心器件為骨導(dǎo)振子,是將電信號轉(zhuǎn)化為聲振動信號的換能器。骨傳導(dǎo)具有抗干擾能力強(qiáng)、在空氣中聲音不易泄漏等特點(diǎn),因此在軍事、民用化學(xué)、緊急救援等復(fù)雜危險(xiǎn)的環(huán)境中有明顯的優(yōu)勢。骨傳導(dǎo)傳播的路徑主要有以下5種[1]:(1)骨導(dǎo)振動在耳道中產(chǎn)生輻射聲;(2)骨導(dǎo)振動引起中耳聽小骨運(yùn)動從而產(chǎn)生聲音;(3)骨導(dǎo)振動引起耳蝸液的慣性運(yùn)動;(4)骨導(dǎo)振動使耳蝸壁伸縮引起耳蝸液流動;(5)腦脊液的壓力傳遞。人體頭部相當(dāng)于一個復(fù)雜的機(jī)械系統(tǒng)[2],具有多種振動模式和非線性等特性。聲音經(jīng)過骨導(dǎo)振子在頭部傳輸時,在不同位置的傳輸特性和衰減不同,所以骨導(dǎo)振子的不同佩戴位置會影響骨傳導(dǎo)聲重放的音質(zhì)和清晰度,從而影響聽音者檢測和識別聲音的能力。目前骨傳導(dǎo)助聽器和耳機(jī)已受到越來越多的關(guān)注和應(yīng)用。骨傳導(dǎo)耳機(jī)可以避免因耳道長期封閉而對耳膜帶來的損傷,也讓使用者在接收耳機(jī)信號的同時能保持對現(xiàn)場環(huán)境聲信息的敏感性,因此,在很多場合如運(yùn)動、駕駛、公共場所以及軍事領(lǐng)域得到了廣泛應(yīng)用。尋找骨導(dǎo)振子的最佳位置可以減少設(shè)備功耗和增長設(shè)備使用時間,減輕長時間使用中因音質(zhì)不佳和清晰度不足帶來的疲勞感,提升用戶的體驗(yàn)。
聽力閾值是指人感知聲音的最小響度,測量骨導(dǎo)振子在人體頭部不同位置耦合下的聽力閾值可表明不同位置間的靈敏性差距。語言清晰度是衡量信號可理解程度的評價(jià)指標(biāo),與氣傳導(dǎo)耳機(jī)相比,骨傳導(dǎo)耳機(jī)在語言清晰度存在差距。音質(zhì)對于骨導(dǎo)耳機(jī)的推廣和應(yīng)用而言也非常重要,不同位置耦合下的骨導(dǎo)耳機(jī)會產(chǎn)生不同的音質(zhì)。本文將圍繞這3個方面進(jìn)行實(shí)驗(yàn)研究,為探究骨導(dǎo)振子的最佳佩戴位置提供依據(jù)。
近年來骨傳導(dǎo)的非臨床研究獲得了一定的發(fā)展,一些研究者在骨傳導(dǎo)的聽力閾值和清晰度方面進(jìn)行了相關(guān)研究。Studebaker[3]測量了前額、乳突和頂點(diǎn)3個位置的純音聽力閾值;McBride等[4]基于軍事應(yīng)用需求研究骨導(dǎo)耳機(jī)在11個位置的聽力閾值,結(jié)果顯示髁骨位置聽閾總體最低;Tran等[5]研究骨傳導(dǎo)傳聲器在頭部11個位置和鎖骨佩戴時錄制的信號強(qiáng)度,結(jié)果表明信號強(qiáng)度明顯依賴于骨導(dǎo)傳聲器佩戴位置。Dobrev等[6]研究骨傳導(dǎo)助聽器在不經(jīng)皮傳輸時不同位置佩戴的效果,發(fā)現(xiàn)髁骨位置比乳突能產(chǎn)生更低閾值和更高耳蝸鼓岬速度。上述研究僅考慮位置因素對骨傳導(dǎo)靈敏性的影響,沒有考慮對語言清晰度和主觀音質(zhì)的影響。Gripper等[7]利用呼號測試方法在髁骨位置上進(jìn)行骨傳導(dǎo)語聲清晰度測試,發(fā)現(xiàn)信噪比因素影響語言清晰度得分;Osafo-Yeboah等[8]同樣采用呼號測試方法,實(shí)驗(yàn)表明髁骨和乳突在清晰度得分上沒有顯著統(tǒng)計(jì)學(xué)差異;Stanley等[9]采用診斷押韻測試方法,實(shí)驗(yàn)顯示髁骨和頂點(diǎn)位置在清晰度得分上存在顯著統(tǒng)計(jì)學(xué)差異。Fujimoto等[10]使用日本音節(jié)字表作為清晰度的測聽材料,發(fā)現(xiàn)在堵耳條件下的骨傳導(dǎo)清晰度得分比氣傳導(dǎo)高。呼號測試方法的語聲材料是數(shù)字和軍事術(shù)語組成,診斷押韻測試的語聲材料是由英語對話組成,以上骨傳導(dǎo)語言清晰度研究主要針對軍事術(shù)語或者其他外語,目前對于漢語的測試尚未見有報(bào)道。
本文將進(jìn)行3部分實(shí)驗(yàn),首先對不同佩戴位置測試聽力閾值,分析靈敏性和傳輸性能;然后采用漢語清晰度測試音節(jié)表探討不同佩戴位置情況下的信噪比因素、背景噪聲類型對骨傳導(dǎo)語言清晰度的影響;最后利用對偶比較法對不同佩戴位置下的骨導(dǎo)振子進(jìn)行重放聲效果的主觀音質(zhì)評價(jià)實(shí)驗(yàn)。綜合3個實(shí)驗(yàn)結(jié)果,選擇最佳骨導(dǎo)振子佩戴位置。
本文實(shí)驗(yàn)在聽音室內(nèi)進(jìn)行,房間大小為6.78 m×3.51 m×2.26 m,混響時間約為250 ms,背景噪聲大小為21 dB SPL。實(shí)驗(yàn)測量儀器包括計(jì)算機(jī)、聲卡(型號為Fireface UFX II)和骨導(dǎo)振子(RadioEar B81)。選取頭部6個佩戴位置,分別為乳突、髁骨、前額、耳廓上方、下頜骨和太陽穴,如圖1所示。所有實(shí)驗(yàn)均為單耳測試,分別對6個位置的全部或部分進(jìn)行了測試。受試者均為聽力正常的11名研究生,能夠熟練地讀寫漢語,年齡范圍23~25歲。參加測試人員都沒有進(jìn)行過主觀聽音訓(xùn)練和測試。
人體頭部各個位置上的皮膚厚度和頭骨結(jié)構(gòu)都不相同,導(dǎo)致骨導(dǎo)振子在頭部不同位置耦合會引起聲信號的傳輸效率不同。聽力閾值是指人耳感知聲音的最小響度,可用于分析骨導(dǎo)振子在不同位置間的靈敏性差距。本實(shí)驗(yàn)主要目的是通過比較接收純音信號的能力來確定骨導(dǎo)振子B81在受試者頭部的最佳耦合位置和不利的接觸點(diǎn)。選取圖1中的6個位置佩戴骨導(dǎo)振子。
圖1 頭部位置示意圖Fig.1 Head position diagram
聽力閾值測量的國際標(biāo)準(zhǔn)共有兩種,分別為上升法和升降法[11],本文采用升降法進(jìn)行閾值測量,圖2為升降法測量的過程。實(shí)驗(yàn)測量選取250 Hz、500 Hz、1000 Hz、2000 Hz、4000 Hz和8000 Hz共6個頻點(diǎn)。相鄰的峰和谷記為一個測量流程(上升過程或者下降過程),一個測量流程內(nèi)步長不變,圖2中每個實(shí)心圓點(diǎn)代表一個步長。一次聽力閾值測量共需10次測量流程,其中步長在第1、第2、第4、第6、第8個流程后減半,初始的步長為32 dB。
圖2 升降法測量過程Fig.2 Lifting method measurement process
具體步驟如下:首先進(jìn)行熟悉實(shí)驗(yàn),調(diào)整輸出音量至合適大小,使測試者能清晰聽見并且做出反應(yīng),確定該音量為初始值;測試者做出反應(yīng)后,以規(guī)定的步長降低音量,若測試者依然能聽到,則繼續(xù)按步長降低音量,直到測試者聽不見,記為下降測量流程;然后以規(guī)定步長提高輸出音量,直到做出反應(yīng),記為上升測量流程;反復(fù)進(jìn)行下降和上升測量流程,取最后兩次的上升過程的峰和下降過程的谷的平均作為聽力閾值。
圖3為6個位置的平均聽力閾值的測量結(jié)果曲線,橫坐標(biāo)表示測量頻率,縱坐標(biāo)表示聽力閾值相對于聲卡內(nèi)部電壓的相對電平,單位為聽力閾值相對級。每個佩戴位置點(diǎn)的聽力閾值的頻率曲線存在相似的變化范圍特征,250~1000 Hz為下降趨勢,1000~4000 Hz相對平坦,4000~8000 Hz為上升趨勢。低頻段(250 Hz,500 Hz)聽力閾值高于中高頻段,一部分原因可能是骨導(dǎo)振子在低頻的振動容易產(chǎn)生的觸覺,影響到聽力閾值的判斷。聽力閾值在1000~4000 Hz范圍內(nèi)相對較低,表明在產(chǎn)生同樣響度的條件下骨導(dǎo)振子需要較低的電輸入信號,傳輸效率更高。
圖3 骨傳導(dǎo)6個位置的平均聽力閾值Fig.3 Average hearing threshold of 6 positions of BC
由圖3也可以看出,髁骨的聽力閾值最低,乳突位置次之。乳突位置是美國國家標(biāo)準(zhǔn)協(xié)會(ANSI)進(jìn)行BC聽力測試的標(biāo)準(zhǔn)放置位置。將乳突位置測量值作為參考點(diǎn),與其他位置的結(jié)果進(jìn)行比較。實(shí)驗(yàn)結(jié)果顯示在測試頻域內(nèi)髁骨位置的聽力閾值均低于乳突位置,平均每個頻率點(diǎn)低8.7 dB;在大部分頻率點(diǎn)上,其余4個位置聽力閾值均高于乳突。這與文獻(xiàn)[4]和文獻(xiàn)[12]中的結(jié)論是一致的:文獻(xiàn)[4]的實(shí)驗(yàn)驗(yàn)證了髁骨位置在各個頻率點(diǎn)上總體最低;文獻(xiàn)[12]表明在耳道開放和堵塞的情況下,髁骨位置的聽力閾值比乳突位置的低,聽力閾值測量曲線總體也呈現(xiàn)“U”的形狀,其中開放耳道時乳突位置在4000 Hz處閾值最低,髁骨位置在1000 Hz處閾值最低,這與本文的實(shí)驗(yàn)結(jié)果一致。不同佩戴位置產(chǎn)生不同的聽力閾值的原因,可能是髁骨和乳突位置距離耳蝸?zhàn)罱蚨曅盘柲芰康乃p較其他位置少,前額其他位置最遠(yuǎn)所以衰減較大。另外骨導(dǎo)振子佩戴在髁骨時,可能也會引起耳廓附近空氣振動,進(jìn)而導(dǎo)致一部分聲音信號進(jìn)入耳內(nèi),從而降低聽力閾值,因此髁骨位置聽力閾值最低。
本文的語言清晰度實(shí)驗(yàn)研究在不同背景噪聲類型和信噪比情況下骨導(dǎo)聲的清晰度,通過骨導(dǎo)聲清晰度得分可以進(jìn)一步驗(yàn)證骨導(dǎo)設(shè)備佩戴位置是否合適。與西方語言屬于無聲調(diào)語言不同,漢語是由聲母、韻母和聲調(diào)組成的聲韻調(diào)結(jié)構(gòu)。漢語在聽感上有拼合感,西方語言如英語則更有滑動感。漢語的音素和聲調(diào)都具有不同的時頻特點(diǎn),能攜帶不同的信息量。復(fù)雜的環(huán)境中,聲母更容易受到噪聲干擾。本文清晰度實(shí)驗(yàn)的語聲材料使用國家標(biāo)準(zhǔn)GB15508—1995的漢語清晰度測試音節(jié)表—KXY表[13]。
標(biāo)準(zhǔn)的KXY表一共有10張,每張75個音節(jié)(每個音節(jié)對應(yīng)一個漢字),選取其中一張的片段如表1所示。為避免測試時記憶和熟悉度影響測試結(jié)果,每次實(shí)驗(yàn)都需要將平衡字節(jié)表隨機(jī)亂序組合再生成測試信號。3個音節(jié)為一組,生成時需要使用引導(dǎo)語句,如“第一組是:xxx”,x代表一個音節(jié)。利用Neospeech TTS語聲庫生成語聲測試材料,采樣率為16 kHz。語聲測試材料考慮兩種背景噪聲類型(白噪聲和babble噪聲,來自NOISEX-92噪聲庫)和3種信噪比(5 dB、0 dB、?5 dB)。
考慮實(shí)際情況中可佩戴的部位,本實(shí)驗(yàn)中受試者僅在圖1中選取3個測量位置(髁骨、乳突、太陽穴)佩戴骨導(dǎo)振子,并且和氣傳導(dǎo)耳機(jī)(森海塞爾IE800)進(jìn)行對比。測試時隨機(jī)播放測試音節(jié)表,受試者記錄所聽到的音節(jié)。語言清晰度得分為正確音節(jié)數(shù)占測試音節(jié)總數(shù)的百分比。
表1 一張語言清晰度測試音節(jié)表Table 1 Fragment of syllable table of sp eech intelligibility test
為了探究在不同信噪比下的骨傳導(dǎo)的語言清晰度得分的差異,同時比較與氣傳導(dǎo)的差距,將白噪聲分別在5 dB、0 dB和?5 dB三種信噪比條件下加入純凈語聲,并測量髁骨、乳突、太陽穴以及氣傳導(dǎo)佩戴方式下得到的主觀漢語語言清晰度得分,如圖4所示。在3種信噪比下,骨傳導(dǎo)的清晰度得分均比氣傳導(dǎo)低。當(dāng)信噪比為5 dB時,氣傳導(dǎo)的清晰度得分較太陽穴、乳突和髁骨高22.4%、8.5%和4.7%;信噪比為0 dB時,較3個位置分別高26.6%,6.5%和4.1%;信噪比為?5 dB時為40.2%,15.4%和9.8%。這表明氣傳導(dǎo)的總體性能優(yōu)于骨傳導(dǎo)。骨傳導(dǎo)的漢語語言清晰度得分總體趨勢隨著信噪比的提高而上升。如圖5所示,babble噪聲也得到了類似的結(jié)論。
圖4 白噪聲下漢語語言清晰度得分Fig.4 Chinese speech intelligibility score under white noise
圖5 babble噪聲下漢語語言清晰度得分Fig.5 Chinese speech intelligibility score under babble noise
白噪聲信噪比由?5 dB變化為0 dB時,3個測量位置的平均清晰度得分提升31.3%,信噪比由0 dB變化為5 dB時提升了8.7%,同理babble噪聲,分別提升17.7%、5.9%。在信噪比變化相同的情況下,白噪聲比babble噪聲對骨傳導(dǎo)的清晰度得分影響更大。
進(jìn)一步,為更好地觀察骨導(dǎo)振子3個佩戴位置的清晰度差異,表2給出不同位置間漢語語言清晰度得分的變化。
表2 不同測量位置下漢語語言清晰度得分變化Table 2 Changes in Chinese language intelligibility scores under different p ositions
由表2可知,髁骨在3個測量位置中清晰度得分最高,乳突位置次之,太陽穴位置最低。測量位置從太陽穴到髁骨變化時,白噪聲下信噪比分別為5 dB、0 dB和?5 dB時,清晰度得分提升了16.8%、21.6%和27.7%;在babble噪聲同樣情況下,提升13.9%、14.7%和15.4%。測量位置從乳突到髁骨變化時,白噪聲下信噪比分別為5 dB、0 dB和?5 dB時,清晰度得分提升3.6%、2.3%和5.1%;在babble噪聲同樣情況下,提升3.5%、1.5%和4.2%。相同的信噪比和背景噪聲時,測量位置的改變會影響清晰度得分。太陽穴位置變化到髁骨時,清晰度得分提升明顯,乳突到髁骨變化時,清晰度提升相對較小。這表明骨導(dǎo)振子的位置對語言清晰度影響較大。
探究骨傳導(dǎo)佩戴位置因素對語言清晰度得分的影響,以及比較不同佩戴位置與氣傳導(dǎo)是否存在顯著性差異,對如圖4所示白噪聲的3種信噪比的清晰度得分進(jìn)行ANOVA方差因素分析,結(jié)果如表3所示。乳突、髁骨、太陽穴和氣傳導(dǎo)的清晰度得分在3種信噪比下均為顯著性差異。事后檢驗(yàn)(Post hoc test)采用最小顯著性差異法(Least signif icant difference,LSD),結(jié)果顯示在5 dB(P=0.342)、0 dB(P=0.529)和?5 dB(P=0.484)三種條件下,髁骨和乳突的清晰度得分不存在顯著統(tǒng)計(jì)學(xué)差異,髁骨和太陽穴在3種信噪比下則均存在顯著差異。方差分析結(jié)果與已有文獻(xiàn)[8]和文獻(xiàn)[9]的結(jié)論類似:文獻(xiàn)[8]使用呼號測試方法也發(fā)現(xiàn)髁骨和乳突不存在顯著統(tǒng)計(jì)學(xué)差異;文獻(xiàn)[9]在黑鷹直升機(jī)背景噪聲下使用診斷押韻測試方法,發(fā)現(xiàn)位置因素(髁骨、乳突、頂點(diǎn))在統(tǒng)計(jì)學(xué)上存在顯著的總體影響,事后多重比較表明髁骨和頂點(diǎn)存在顯著差異,髁骨和乳突不存在顯著差異。由上述分析可知,測量位置對清晰度得分在統(tǒng)計(jì)學(xué)上存在顯著的總體影響,但需進(jìn)行事后多重比較分析具體測量位置組別之間的差異。
表3 乳突、髁骨、太陽穴和氣傳導(dǎo)清晰度得分的方差分析Table 3 ANOVA of the intelligibility scores at different p ositions of the BC vibrator
聽覺的主觀心理實(shí)驗(yàn)是通過實(shí)驗(yàn)用統(tǒng)計(jì)分析的方法將模糊的主觀感覺量化,總結(jié)出其所蘊(yùn)含的規(guī)律[14]。常用的心理尺度構(gòu)造方法有對偶比較法、排序法、語義細(xì)分法和分級評分法等。在主觀音質(zhì)評價(jià)領(lǐng)域,通常采用如下兩種方式進(jìn)行:語義細(xì)分法和對偶比較。語義細(xì)分法是用若干語義不同的形容詞描述被評價(jià)對象;對偶比較法則是隨機(jī)抽取一對被評價(jià)對象讓測試者進(jìn)行偏好選擇。與語義細(xì)分法相比,對偶比較法可以避免測試者對評價(jià)標(biāo)準(zhǔn)中的形容詞不確定性引起的影響。因此本文音質(zhì)主觀評價(jià)實(shí)驗(yàn)采用對偶比較法研究骨導(dǎo)聲在不同位置的音質(zhì)效果。
對偶比較法是通過被評價(jià)對象的兩兩比較關(guān)系來間接地估計(jì)出所有被評價(jià)對象地相對心理尺度。具體實(shí)驗(yàn)步驟如下:分別生成3種測聽音樂材料,包含男女聲流行音樂和弦樂。對圖1頭部的6個位置點(diǎn)進(jìn)行兩兩配對共15組,佩戴B81骨導(dǎo)振子,每組根據(jù)骨導(dǎo)聲重放的音質(zhì)效果,進(jìn)行偏愛選擇。3種測聽音樂材料按照相同響度進(jìn)行播放,每次骨傳導(dǎo)音質(zhì)主觀評價(jià)需進(jìn)行45次實(shí)驗(yàn),進(jìn)行比較時不考慮兩兩配對的先后順序組合。
圖6為在男聲、女聲和弦樂3種測試音樂下6個位置的音質(zhì)心理尺度得分。對偶比較法構(gòu)造心理尺度的基本原理是認(rèn)為心理量是符合正態(tài)分布的隨機(jī)變量[15]。具體操作為先兩兩比較后統(tǒng)計(jì)出偏愛度選擇概率;然后通過正態(tài)分布(方差為1,均值為0)將偏愛度選擇概率轉(zhuǎn)換為偏愛度正態(tài)變量,設(shè)最偏愛評價(jià)對象的心理尺度是100,最不偏愛的心理尺度為0;最后運(yùn)用線性變換求出其他評價(jià)對象的心理尺度。在男聲、女聲和弦樂中,髁骨的心理尺度均為最高分?jǐn)?shù),乳突位置次之,下頜骨表現(xiàn)最差。男聲的測試結(jié)果發(fā)現(xiàn)髁骨的評價(jià)尺度得分與乳突評價(jià)尺度得分相差31,與太陽穴相差39;女聲的測試條件下髁骨和乳突、太陽穴分別相差35、94;弦樂測試條件下髁骨和乳突、太陽穴分別相差49、78。當(dāng)佩戴位置變化時,女聲和弦樂評價(jià)尺度變化范圍比男聲大。位置因素對女聲和弦樂的骨傳導(dǎo)重放的音質(zhì)影響更加明顯,男聲對于位置因素敏感性相對較低。骨導(dǎo)聲的傳輸是通過頭部的顱骨、軟組織和體液的振動傳播。測量位置不同顱骨和軟組織密度也不相同,聲信號的失真也不相同,這可能是引起不同位置間的音質(zhì)評價(jià)不同的原因。
圖6 主觀聽音評價(jià)得分Fig.6 Subjective sound quality evaluation score
本文對不同佩戴位置下的骨傳導(dǎo)設(shè)備進(jìn)行聽力閾值測量、骨傳導(dǎo)音質(zhì)主觀評價(jià)和語言清晰度實(shí)驗(yàn),研究位置因素對骨導(dǎo)重放聲的影響。由聽力閾值測量實(shí)驗(yàn)結(jié)果可知,髁骨是靈敏度最高的測量位置,乳突次之,骨導(dǎo)振子在1000~4000 Hz范圍內(nèi)傳輸效率相對較高。由語言清晰度實(shí)驗(yàn)結(jié)果可知,氣傳導(dǎo)在清晰度的總體性能優(yōu)于骨傳導(dǎo),背景噪聲類型和信噪比影響骨傳導(dǎo)語言清晰度得分,不同位置的骨傳導(dǎo)語言清晰度得分也存在差異,其中髁骨得分最高。主觀音質(zhì)評價(jià)中,髁骨在3種測試音樂下得分最高,下頜骨表現(xiàn)最差,位置變化對女聲和弦樂的骨傳導(dǎo)重放的音質(zhì)影響明顯。本文的研究可為骨導(dǎo)振子佩戴位置的選擇及骨傳導(dǎo)耳機(jī)/助聽器的設(shè)計(jì)提供依據(jù),為聲重放質(zhì)量的改進(jìn)提供參考,有助于提升骨傳導(dǎo)聲重放的性能。