符秋養(yǎng)趙靖 摘譯 梁勇 審校
南方醫(yī)科大學附屬南方醫(yī)院耳鼻咽喉-頭頸外科(廣州 510515)
一般的簡短刺激如短聲、純音和簡單言語聲均可誘發(fā)出聽皮層誘發(fā)電位(auditory-evoked potentials,AEPs)的P1、N1和P2成分,由于P1的幅值相對較小,因此N1和P2波通常被認為是AEPs的特征波,通常將其歸為N1/P2復合波。N1波對刺激聲的起始特征敏感,P2波則反映了刺激聲的聲學或語音學特征。人類言語聲包含時域和頻域上快速變化的信息,其中嗓音起始時間(voice onset time,VOT)影響N1和P2的潛伏期。對比單音節(jié)/sei/、齒擦音/s/和元音/ei/誘發(fā)的AEPs,發(fā)現/sei/誘發(fā)的AEPs是/s/和/ei/誘發(fā)反應的組合,其中重疊的AEPs成分稱為聲學變化復合波(acoustic change complex,ACC),反映了整個刺激過程中的聲學變化,由N1/P2復合波構成。當音節(jié)包含的音素之間具有足夠長的延遲時間時,其誘發(fā)的AEPs各個成分之間沒有重疊,因此ACC清晰可見;但當延遲時間較短時,ACC由于AEPs成分波的重疊而難以辨認,此時即使僅出現一個較明顯的N1/P2復合波,也可能是多個N1/P2復合波的組合。為了證明這個觀點,本研究采用純音誘發(fā)出的AEPs通過加權參數來合成具有不同VOT的言語聲誘發(fā)出的AEPs。
刺激聲為1 kHz的短純音(時長300 ms,升降時間各5 ms)和5個不同VOT的男性語音Ei /a:i/(VOT = 0 ms)、Bett /bet/(VOT = 35 ms)、Dieb /di:b/(VOT = 60 ms)、Pult /pult/(VOT = 80 ms)和Tau /tau/(VOT = 105 ms)。記錄這兩類刺激聲在7例聽力正常青年(年齡22~27歲)引出的皮層聽覺誘發(fā)電位。以短純音誘發(fā)的反應作為擬合對照模版,根據刺激言語聲VOT的不同來乘以不同的加權系數k1和k2合成仿真波形,將合成的仿真波形與對應言語聲所誘發(fā)的單個受試者的波形以及7個受試者的總體平均波形進行比較,以評估仿真波形的擬合效果。為獲得仿真波形與反應波形的最佳擬合,使兩者波峰的潛伏期和幅值在數值上基本相等,應用高斯-牛頓算法,求出使仿真波形與反應波形的誤差最小的加權系數k1和k2,由此可發(fā)現和比較不同的VOT對N1/P2復合波的影響。
結果顯示,短純音誘發(fā)的AEPs為單一的N1/P2復合波,而言語聲誘發(fā)的AEPs成分較為復雜,隨著VOT的變化而不同:VOT較長的言語聲誘發(fā)出的AEPs可觀察到兩個N1/P2復合波,而VOT較短的言語聲誘發(fā)出的AEPs則只有一個N1/P2復合波。所有受試者同一言語刺激聲誘發(fā)出的AEPs相似,仿真波形與對應的誘發(fā)波形在不同刺激間以及不同受試者間均無顯著性差異,兩者相應波峰的潛伏期和幅值的平均差值分別為10 ms和0.3 μV。仿真波形與相應的個體波形以及總體平均波形均高度相關,其相關系數范圍分別為68%~85%和77%~96%。由此可知仿真波形能很好地擬合誘發(fā)波形,其最佳擬合的加權系數k1和k2均在0.30~0.41范圍內。
上述結果說明,VOT較短的單音節(jié)言語聲誘發(fā)的皮層聽覺反應可以近似地描述為兩個重疊的N1/P2復合波,其中一個N1/P2復合波反映了音節(jié)的起始,另一個則對應于音節(jié)中元音的起始,可以根據VOT來預測并分離這兩個復合波。VOT較長的音節(jié)刺激因為刺激聲變化的潛伏期足夠長,從而避免了神經反應的相互重疊,可記錄到兩個N1/P2復合波;而VOT較短的音節(jié)刺激則因為神經反應的重疊只能記錄到一個N1/P2復合波。
(摘譯自:Burger M,et al.Ear & Hearing,2009,30:16~22)