陳 飛 張 昊 王士元 彭 剛,3
1香港理工大學(xué)中文及雙語學(xué)系 香港 九龍 2上海交通大學(xué)外國語學(xué)院 上海 200240 3中國科學(xué)院深圳先進(jìn)技術(shù)研究院 廣東 深圳 518055
提要 為了探討元音內(nèi)部的固有共振峰信息對元音感知的影響,文章采用范疇感知研究范式中的辨認(rèn)和區(qū)分測試,考察普通話母語者對于普通話單元音之間(/i/-/a/)、前響雙元音和單元音之間(/ai/-/a/)以及后響雙元音和單元音之間(/ia/-/a/)的刺激連續(xù)統(tǒng)感知情況。結(jié)果表明:當(dāng)不同元音之間(單元音與單元音)內(nèi)部的共振峰曲線在走向上處于相對穩(wěn)態(tài)時(shí),其感知的范疇化程度較低;相反,當(dāng)不同元音之間(復(fù)合元音與單元音)內(nèi)部的共振峰曲線在走向上存在著相對動(dòng)態(tài)變化時(shí),其感知的范疇化程度則會顯著提高。結(jié)合文獻(xiàn)中有關(guān)其他音位范疇化感知的現(xiàn)有研究,文章還進(jìn)一步總結(jié)了影響音位感知范疇化程度的多種內(nèi)部和外部因素,并提出了在行為學(xué)和腦電研究中衡量音位感知范疇化程度高低的客觀量化指標(biāo)。
范疇化是認(rèn)知科學(xué)研究中的一個(gè)焦點(diǎn),是指大腦通過感知器官對實(shí)物和現(xiàn)象的突出特征進(jìn)行遴選和歸納,并利用認(rèn)知符號系統(tǒng)加以分門別類,將紛繁復(fù)雜的外部刺激轉(zhuǎn)化為范疇化的信息。范疇化感知(categorical perception, CP)現(xiàn)象廣泛地存在于人們感知外部世界的多種模態(tài),視覺上的范疇化感知現(xiàn)象已被眾多學(xué)者所論述,比如基于視覺感知對不同顏色(Bornstein et al.1976)或者對面部表情(etcoff & Magee 1992)的分類。在聽覺領(lǐng)域,人們同樣傾向于將無限多樣的語音信號歸納為有限的類別,將連續(xù)的語音變化感知為離散的音位范疇(王士元和彭剛 2007)。有研究證明,剛出生不久的嬰兒就能對一些語音對立表現(xiàn)出范疇化知覺(eimas et al.1971; Werker & Tees 1984),并且這種言語范疇性知覺會隨著兒童年齡的增長、母語語言經(jīng)驗(yàn)的豐富而逐漸完善和成熟(席潔等 2009;Chen et al.2017),從而幫助人們準(zhǔn)確理解語音信號所傳達(dá)的信息,提升日常言語交際的效率。
言語感知的范疇性體現(xiàn)為人類對連續(xù)物理屬性的非連續(xù)性感知,語音刺激連續(xù)統(tǒng)被感知為離散的、數(shù)量有限的語音范疇,即音位;聽話者對范疇間(between category)語音差異比對范疇內(nèi)(within category)語音差異的感知敏感得多。對語音范疇化感知的研究最早可追溯到二十世紀(jì)五十年代,Liberman et al.(1957)通過修改英語濁塞音/b/、/d/、/g/后接元音/e/時(shí)在F2維度上共振峰過渡音征(formant transition)(吳宗濟(jì)和林茂燦 2014:140)的起始位置,等步長合成出從/b/經(jīng)/d/并最終到/g/的語音連續(xù)統(tǒng),并首次提出了包括辨認(rèn)任務(wù)(identification task)和區(qū)分任務(wù)(discrimination task)的研究語音范疇感知的行為學(xué)研究范式。另外,他們將語音范疇化感知的主要特點(diǎn)概括如下:1)在辨認(rèn)實(shí)驗(yàn)中,辨認(rèn)曲線在不同語音范疇的邊界位置附近有陡峭的上升或下降;2)在區(qū)分實(shí)驗(yàn)中,區(qū)分正確率曲線有一個(gè)突起的峰值;3)辨認(rèn)曲線的邊界位置與區(qū)分曲線的峰值位置相對應(yīng),即“峰界對應(yīng)”。如果滿足了這三個(gè)標(biāo)準(zhǔn),則說明語音感知是范疇性的;反之,則屬于連續(xù)型感知(continuous perception)類型,也就意味著兩個(gè)語音間沒有明確的感知邊界。Liberman et al.(1957)的研究為語音范疇化感知研究奠定了重要的方法論及理論基礎(chǔ)。其后,從辨認(rèn)實(shí)驗(yàn)和區(qū)分實(shí)驗(yàn)兩種心理語音學(xué)任務(wù)模式出發(fā),探討語音范疇表征的心理機(jī)制,成為語音范疇化知覺實(shí)驗(yàn)研究的經(jīng)典范式。
語音中的輔音感知呈現(xiàn)出了非常典型的范疇化感知特征(Liberman et al.1957;Liberman et al.1961;Miller & eimas 1977)。然而,以共振峰(formant)為主要聲學(xué)線索的元音感知是否為范疇感知,在學(xué)界一直還沒有定論。Fry et al.(1962)最早運(yùn)用范疇感知實(shí)驗(yàn)范式,探討了英語單元音/i/、/ε/、//的聽覺感知,通過改變英語元音的F1、F2這兩條共振峰,等步長合成由元音/i/經(jīng)/ε/并最終到//的包括13個(gè)語音刺激的連續(xù)統(tǒng),相鄰兩個(gè)語音刺激間有等量的共振峰參數(shù)差異。感知結(jié)果顯示,元音辨認(rèn)曲線的陡峭程度并不如濁塞音/b/、/d/、/g/那么高,從一個(gè)元音范疇到另一個(gè)元音范疇的轉(zhuǎn)變更像是漸變而非突變;在區(qū)分實(shí)驗(yàn)中,被試對各個(gè)元音刺激音對的區(qū)分正確率普遍較高,而且沒有表現(xiàn)出顯著的區(qū)分峰值,因而也就缺乏所謂的“峰界對應(yīng)”。Fry et al.(1962)將元音的這種感知類型定義為“連續(xù)感知”,以同塞音的“范疇感知”相區(qū)別,并且認(rèn)為元、輔音在感知模式上存在差異的主要原因在于各元音和輔音在發(fā)音時(shí)的連續(xù)性程度不同,這種觀點(diǎn)后來得到了Liberman et al.(1967)所提出的“肌動(dòng)理論”(motor theory)的支持。
然而,有一些學(xué)者后來發(fā)現(xiàn)單元音的感知也具有類似范疇性感知的特點(diǎn),如Studdert-Kennedy(1976)報(bào)道的一項(xiàng)研究表明,對“輔元輔”音節(jié)結(jié)構(gòu)(CVC)中的單元音和相應(yīng)的孤立單元音(V)音節(jié)分別作辨認(rèn)和區(qū)分測試,發(fā)現(xiàn)CVC音節(jié)結(jié)構(gòu)中的單元音感知的范疇性特點(diǎn)相對而言更為明顯。還有一些學(xué)者直接比較孤立單元音感知和在外部語境影響下的單元音感知的不同,認(rèn)為語境中單元音感知的范疇化程度更高(Repp et al.1979; Healy & Repp 1982)。另外,Pisoni(1975)指出,元音感知在某些特定的任務(wù)模式(如ABX區(qū)分設(shè)計(jì))或語境因素影響下會呈現(xiàn)出某些范疇化感知的特點(diǎn),但這源于特定區(qū)分任務(wù)或語境阻礙了區(qū)分實(shí)驗(yàn)中對聽覺聲學(xué)信息的檢索,使得范疇內(nèi)刺激對的區(qū)分正確率下降。Cowan & Morse(1986)認(rèn)為對范疇內(nèi)和范疇間語音刺激對的區(qū)分并非僅僅分別依賴聽覺記憶(auditory memory)或語音記憶(phonetic memory)那么簡單,并且重點(diǎn)探討了區(qū)分實(shí)驗(yàn)設(shè)計(jì)中的元音次序效應(yīng)(vowel order effect)的影響。除了從上述語境、區(qū)分任務(wù)設(shè)計(jì)等因素探討元音范疇化感知問題以外,還有一些學(xué)者從共時(shí)層面著手,探討母語經(jīng)驗(yàn)對元音感知范疇化程度的影響(Stevens et al.1969;Zhang et al.2016)。總之,雖然在特定外在因素(如受語境影響或者在特定的區(qū)分任務(wù))的影響之下,母語者對單元音感知呈現(xiàn)出一定的類似于范疇化感知的模式(categorical-like perception),但是參照Liberman et al.(1957)歸納的音位感知范疇化的基本特征,我們發(fā)現(xiàn):這種感知結(jié)果的范疇性特征并不是完全充足。后人(Hallé et al.2004)進(jìn)一步把這種新的感知類型定義為“類范疇型感知”(quasi-categorical perception)。
目前有關(guān)普通話元音的感知研究相對比較薄弱,研究成果也比較少。Cheung(2004)對漢語普通話中具有鮮明特色的兩個(gè)舌尖單元音//、//進(jìn)行了范疇化感知研究。實(shí)驗(yàn)結(jié)果顯示 F3 是普通話的兩個(gè)舌尖單元音//、//聽辨中最為重要的感知線索,對舌尖單元音的辨認(rèn)和區(qū)分需要操控 F3 才能實(shí)現(xiàn),F(xiàn)2 在兩個(gè)舌尖元音的聽辨中只起輔助作用。Cheung(2004)認(rèn)為,母語者對于普通話舌尖單元音的感知也是介于“范疇感知”和“連續(xù)感知”之間的第三種感知類型,即“類范疇型感知”。最近,相關(guān)學(xué)者(劉掌才等 2016)對普通話中的一級元音感知進(jìn)行了探索,他們不再去論證普通話單元音的感知是否是“范疇化”感知的問題,而是分析辨認(rèn)邊界位置得出了各相鄰單元音的聽感分界,并在此基礎(chǔ)上大致勾畫出了普通話基礎(chǔ)元音的聽感格局,通過與其聲學(xué)格局的對比,發(fā)現(xiàn)了它們在空間分布上的一致性關(guān)系。
總之,以往元音感知的研究大都關(guān)注于受外部因素影響下(如語境因素、區(qū)分實(shí)驗(yàn)設(shè)計(jì)或者聽者的語言經(jīng)驗(yàn)),對單元音感知在屬性上是 “范疇型”“類范疇型”或是“連續(xù)型”的鑒別,而針對元音內(nèi)部的固有共振峰信息對于元音感知范疇化程度高低的影響,卻鮮有學(xué)者關(guān)注。一般而言,單元音的共振峰的走向隨著時(shí)間改變并不會發(fā)生太大的變化,我們稱之為穩(wěn)態(tài)特征(steady-state property),而復(fù)合元音的前幾條共振峰的走向則會發(fā)生漸變或者突變,我們稱之為動(dòng)態(tài)屬性(dynamic property)。元音內(nèi)部的固有共振峰屬性對感知結(jié)果的影響,反映的是一種普遍性的感知模式,即對元音共振峰相對穩(wěn)態(tài)vs.相對動(dòng)態(tài)的感知模式,探討這類問題對于進(jìn)一步了解人類的普遍認(rèn)知和感知機(jī)制具有重要的理論意義。然而,目前有關(guān)元音感知的研究均著眼于共振峰處于穩(wěn)態(tài)的單元音感知,且相關(guān)研究結(jié)果均表明穩(wěn)態(tài)單元音感知的范疇化程度偏低。雖然有研究者(Nearey 1989)已經(jīng)提出過這樣的假設(shè):元音的穩(wěn)態(tài)特征,如單元音中的穩(wěn)態(tài)共振峰是元音聽辨的重要聲學(xué)線索,另外一些元音固有的動(dòng)態(tài)屬性,比如復(fù)合元音中共振峰的動(dòng)態(tài)改變也可能會對元音感知產(chǎn)生重要影響。但是,到目前為止尚未有實(shí)證研究去探討有關(guān)復(fù)合元音的范疇化感知問題,并與單元音之間的感知范疇化程度高低進(jìn)行對比。
范疇化感知考察的是不同音位之間的感知情況,不同單元音之間的共振峰曲線在其走向上相對而言是一致的、穩(wěn)態(tài)的;而復(fù)合元音與單元音之間在其共振峰曲線的走向上相對而言是不一致的、動(dòng)態(tài)的。本研究采用范疇感知研究的經(jīng)典行為學(xué)范式,通過探討普通話中單元音之間(/i/-/a/)、前響雙元音和單元音之間(/ai/-/a/)、后響雙元音和單元音之間(/ia/-/a/)的范疇化感知的表現(xiàn),對比不同類別元音內(nèi)部共振峰信息的穩(wěn)態(tài)與動(dòng)態(tài)屬性的差異在元音聽感上的差異表現(xiàn),從而探究元音內(nèi)部共振峰曲線在走向上的相對穩(wěn)態(tài)(單元音之間)和相對動(dòng)態(tài)變化(復(fù)合元音與單元音)對于元音感知的影響。我們提出這樣的實(shí)驗(yàn)假設(shè):單元音之間的感知范疇化程度不足(文獻(xiàn)已證明),而復(fù)合元音與單元音在共振峰走向上的相對動(dòng)態(tài)變化模式會使得其感知的范疇化程度得到提高。更進(jìn)一步,我們綜合其他音位感知的相關(guān)研究成果,探討音位本身所固有的內(nèi)部頻率信息會如何影響音位感知范疇化程度的高低。
本研究所招募的被試是來自某研究院的17名在讀碩士研究生(9男8女),平均年齡為23.32歲(標(biāo)準(zhǔn)差=2.37)。所有被試均為普通話母語者,且來自北方方言區(qū),視聽能力正常,非語言學(xué)、心理學(xué)專業(yè)學(xué)生, 無閱讀、聽力障礙與口咽部疾病,均沒有接受過正規(guī)音樂訓(xùn)練。被試均為自愿參與,實(shí)驗(yàn)前簽署了知情同意書,在安靜的語音實(shí)驗(yàn)室中完成實(shí)驗(yàn)任務(wù),并得到一份禮品作為報(bào)酬。
當(dāng)我們發(fā)復(fù)合元音時(shí),口腔和舌頭從一個(gè)元音滑到另一個(gè)元音的位置上去,兩個(gè)(或三個(gè))元音成分的分量往往不相等,其中有一個(gè)往往特別顯著,被稱為韻腹。由于普通話的復(fù)合元音屬于假性復(fù)合元音(吳宗濟(jì)和林茂燦 2014),對于其二合元音而言,按他們在元音成分分量上的差別又可以分為前響二合元音和后響二合元音。其中前響二合元音的韻腹在前、韻尾在后,如普通話中的/ai/、/ei/、/ao/、/ou/;后響二合元音的韻頭在前、韻腹在后,如普通話中的/ia/、/ie/、/ua/、/uo/、/ye/。從元音的共振峰模式上看,后響二合元音的后一元音成分(韻腹部分)普遍存在著較長穩(wěn)定段;然而,對于前響二合元音的共振峰模式存在爭議,王萍(2008)通過大樣本分析了52位北京人的發(fā)音語料,歸納了普通話前響二合元音的兩種主要類型:一種是韻腹部分先有較長的共振峰穩(wěn)定段,后面緊接著斜率較大的韻尾過渡段;另外一種是韻腹部分共振峰先會有緩慢變化的過程,后面再連接斜率較大的過渡段。在本實(shí)驗(yàn)中,我們將選取前響二合元音中的前一種共振峰模式作為參照,以保持前響、后響二合元音在共振峰模式上的相對統(tǒng)一。
我們將選取普通話元音系統(tǒng)中的單元音/i/、/a/以及前響二合元音/ai/、后響二合元音/ia/作為語音材料。由于/i/、/a/均屬于普通話頂點(diǎn)元音,且其組合的兩個(gè)前響和后響二合元音在普通話音節(jié)或者音節(jié)成分中的出現(xiàn)頻率很高,從而在一定程度上排除了發(fā)音頻次等自上而下的加工信息對于感知結(jié)果的影響。在本實(shí)驗(yàn)中,這些單元音和復(fù)合元音均將獨(dú)立作為普通話零聲母音節(jié)的感知材料,且負(fù)載聲調(diào)統(tǒng)一為高平調(diào)(即普通話音節(jié)“衣、啊、哀、鴨”),以排除輔音聲母、韻尾、聲調(diào)等其他因素對元音感知結(jié)果的影響。另外,石鋒(1983)指出在自然發(fā)音時(shí),漢語音節(jié)內(nèi)部在時(shí)長上存在著補(bǔ)償調(diào)節(jié)作用,以保證各個(gè)音節(jié)的發(fā)音時(shí)長不至于相差太大。因此,本實(shí)驗(yàn)中的單元音音節(jié)和雙元音音節(jié)在總時(shí)長上是保持一致的(見下頁圖1)。此外,曹劍芬和楊順安(1984)通過聲學(xué)測量得出:普通話中所有二合元音韻腹與韻尾、韻腹和韻頭的時(shí)長比值的平均值約為6∶4;而吳燕萍(2008)的研究進(jìn)一步表明,當(dāng)二合元音中的韻腹由低元音/a/來充當(dāng)時(shí),韻腹部分/a/所占時(shí)長比例會顯著變高,最高時(shí)可達(dá)7∶3。因此,本研究中將二合元音中(/ai/、/ia/)的韻腹和韻尾、韻腹和韻頭的時(shí)長比例統(tǒng)一定為一個(gè)適中值2∶1,如下頁圖1所示(圖中11號刺激均為典型的單元音/a/)。
由于元音的前三條共振峰是其聽辨的最重要物理線索(Ladefoged & Broadbent 1957;Liberman et al.1967),因此我們修改了元音的F1、F2、F3的值,共合成了三套語音刺激連續(xù)統(tǒng):/i/-/a/單元音間的刺激連續(xù)統(tǒng)、/ai/-/a/前響雙元音和單元音的刺激連續(xù)統(tǒng)、/ia/-/a/后響雙元音和單元音的刺激連續(xù)統(tǒng)(見下頁圖1)。三套刺激連續(xù)統(tǒng)中的各個(gè)元音刺激都是借助Praat軟件下(Boersma & Weenink 2009)Akustyk程序包里的 “Create Continuum”命令來實(shí)現(xiàn)(Plichta 2012),除操控變量F1、F2、F3外,其他聲學(xué)參數(shù)(F4、F5、基頻值、音強(qiáng)等)均保持一致,以排除這些變量的影響,共合成了從/i/到/a/、從/ai/到/a/、從/ia/到/a/的三套連續(xù)統(tǒng)。所有語音刺激的音強(qiáng)均為72 dB, 音長均統(tǒng)一為270ms。F1、F2、F3維度分別以63Hz、73Hz、70Hz為一個(gè)步長,每套刺激連續(xù)統(tǒng)下均合成了11個(gè)語音刺激。其中,三套刺激連續(xù)統(tǒng)中的11號刺激均為典型的單元音/a/;/i/-/a/連續(xù)統(tǒng)中的1號刺激是典型的單元音/i/;/ai/-/a/連續(xù)統(tǒng)中的1號刺激是典型的前響雙元音/ai/;/ia/-/a/連續(xù)統(tǒng)中的1號刺激是典型的后響雙元音/ia/。這些典型的單元音和雙元音刺激的語音頻譜圖如下頁圖2所示(圖中紅色虛線為共振峰曲線,各圖中從下至上的三條分別為F1、F2、F3),在聽感上均比較自然。
圖 1 /i/-/a/組、/ai/-/a/組、/ia/-/a/組的刺激連續(xù)統(tǒng)
圖2單元音/i/、/a/和雙元音/ai/、/ia/的頻譜圖
實(shí)驗(yàn)通過e-prime軟件實(shí)現(xiàn),利用筆記本電腦呈現(xiàn)語音刺激和探測界面,實(shí)驗(yàn)采用范疇感知經(jīng)典行為學(xué)范式,包括辨認(rèn)實(shí)驗(yàn)和區(qū)分實(shí)驗(yàn),每位被試均需參與并完成這兩部分測試。正式實(shí)驗(yàn)開始前有練習(xí)環(huán)節(jié),確保被試?yán)斫鈱?shí)驗(yàn)任務(wù)并熟悉按鍵。
辨認(rèn)測試:每次呈現(xiàn)一個(gè)語音刺激后,就要求被試根據(jù)所聽到的刺激音,盡量迅速地按鍵反應(yīng)。按照刺激連續(xù)統(tǒng)的不同分為三個(gè)辨認(rèn)單元:如果判斷為/a/,按鍵盤上的數(shù)字1鍵;如果判斷為/i/、/ai/或者/ia/,則按數(shù)字2鍵。每個(gè)語音刺激重復(fù)10次,以隨機(jī)順序呈現(xiàn),每個(gè)被試共計(jì)需完成330個(gè)辨認(rèn)任務(wù)(11個(gè)刺激×10次重復(fù)×3個(gè)單元)。三個(gè)辨認(rèn)單元以亂序形式在被試之間實(shí)現(xiàn)。在完成一定量的辨認(rèn)任務(wù)后,被試會有足夠的休息時(shí)間。每個(gè)被試完成整個(gè)辨認(rèn)測試共需要25分鐘左右。
區(qū)分測試:采取AX區(qū)分任務(wù)模式,由兩個(gè)屬于同一連續(xù)統(tǒng)的語音刺激組合成一個(gè)刺激對的形式呈現(xiàn)。刺激對的內(nèi)部時(shí)間間隔(ISI)為500ms,每個(gè)連續(xù)統(tǒng)下均包含了29個(gè)區(qū)分刺激對,即18個(gè)間隔為2個(gè)步長的不同刺激對(9個(gè)順序刺激對:1-3,2-4,……,8-10, 9-11等和9個(gè)逆序刺激對:3-1, 4-2,……,10-8, 11-9等)與11個(gè)相同刺激對(1-1, 2-2,……,10-10,11-11)。要求被試盡快判斷其所聽到的一對刺激是相同還是不同:若相同,按“V”鍵;不同則按“N”鍵。按照刺激連續(xù)統(tǒng)的不同分為三個(gè)區(qū)分單元,每個(gè)刺激對重復(fù)7次,以隨機(jī)順序呈現(xiàn),每個(gè)被試共需完成609個(gè)區(qū)分任務(wù)(29個(gè)刺激對×7次重復(fù)×3個(gè)單元)。三個(gè)區(qū)分單元之間的順序在被試之間實(shí)現(xiàn)亂序。在完成一定量的區(qū)分任務(wù)后,被試會有足夠的休息時(shí)間。每個(gè)被試完成整個(gè)區(qū)分測試共需大約45分鐘。
計(jì)算出共17位被試的感知數(shù)據(jù),包括辨認(rèn)邊界位置、辨認(rèn)邊界寬度以及區(qū)分正確率(包括范疇內(nèi)和范疇間區(qū)分正確率)。
辨認(rèn)邊界位置與邊界寬度:邊界位置是指兩個(gè)辨認(rèn)函數(shù)的曲線在辨認(rèn)率達(dá)到50%處(即兩條曲線的交點(diǎn)處)所對應(yīng)的刺激序號值;邊界寬度是指辨認(rèn)率為25%與75%間的線性距離, 這個(gè)數(shù)值由概率分析中的均值與標(biāo)準(zhǔn)差決定(Peng et al.2010)。邊界寬度越窄,表明在邊界附近從一個(gè)音位范疇到另一個(gè)音位范疇變化的速率越快。本實(shí)驗(yàn)中邊界位置與邊界寬度均采用Probit分析擬合(Finney 1971)得到。
區(qū)分正確率:采用了Xu et al.(2006)提出的計(jì)算公式。我們把所有的區(qū)分刺激對重新劃分為九組,每組中均包括四種類型的刺激對形式,即AA、BB、AB、BA,比如2-4組包含了2-2、4-4、2-4和4-2這四種刺激對。相鄰的組會包含重疊的AA或者BB刺激(比如4-4刺激對同時(shí)存在于2-4組和4-6組中)。對于每組的區(qū)分正確率P值的計(jì)算方法為:
P=P(‘S’/S)×P(S)+P(‘D’/D)×P(D)
式中,P(‘S’/S)代表了被試在聽到相同刺激對后,做出“相同”判斷的百分比;P(‘D’/D)代表了被試在聽到不同刺激對后,做出“不同”判斷的百分比。P(S)代表在每組內(nèi)相同刺激對占所有刺激對的百分比,P(D)代表在每組內(nèi)不同刺激對占所有刺激對的百分比。在本實(shí)驗(yàn)中,P(S)和P(D)均為50%。
范疇內(nèi)與范疇間區(qū)分正確率:基于每一個(gè)被試的具體辨認(rèn)邊界位置,我們又進(jìn)一步把區(qū)分測試中九組的區(qū)分正確率二分為范疇內(nèi)和范疇間區(qū)分正確率(具體方法參看Chen et al.2017)。比如對于某一個(gè)被試而言,其辨認(rèn)邊界位置為5.8,那么跨過該邊界位置的兩組區(qū)分組(4-6組和5-7組)的區(qū)分正確率平均值即為該被試的范疇間區(qū)分正確率,其余七組的區(qū)分正確率的平均值即為該被試的范疇內(nèi)區(qū)分正確率。
三套刺激連續(xù)統(tǒng)下(/i/-/a/組、/ai/-/a/組、/ia/-/a/組)的平均辨認(rèn)和區(qū)分曲線如下頁圖3所示,可以直觀地看到,對于單元音/i/-/a/組的刺激連續(xù)統(tǒng),辨認(rèn)曲線在交點(diǎn)附近的變化相對較為平緩,區(qū)分曲線雖然整體正確率較高,但是有較大的波動(dòng)和起伏,并且沒有在辨認(rèn)邊界附近呈現(xiàn)明顯的凸起峰值;而對于雙元音與單元音/ai/-/a/組以及/ia/-/a/組的刺激連續(xù)統(tǒng),辨認(rèn)曲線在交點(diǎn)附近呈現(xiàn)相對陡峭的上升或下降,且區(qū)分曲線在邊界位置附近有一個(gè)明顯凸起的區(qū)分峰值。
圖 3 三套連續(xù)統(tǒng)的辨認(rèn)、區(qū)分曲線圖
通過概率分析得到的所有被試的辨認(rèn)邊界位置和邊界寬度的平均值以及標(biāo)準(zhǔn)差如表1所示:
表1 三套連續(xù)統(tǒng)下的邊界位置與邊界寬度
刺激連續(xù)統(tǒng)邊界位置邊界寬度平均值標(biāo)準(zhǔn)差平均值標(biāo)準(zhǔn)差/i/-/a/6.141.461.910.91/ai/-/a/7.201.011.320.45/ia/-/a/5.980.991.310.54
單因素重復(fù)測量方差分析的結(jié)果表明:/i/-/a/、/ai/-/a/、/ia/-/a/三組刺激連續(xù)統(tǒng)的邊界位置主效應(yīng)顯著,F(xiàn)(2,32)=5.52, p < 0.01, ηp2=0.26。進(jìn)一步的Tukey多重比較發(fā)現(xiàn),/ai/-/a/組的邊界位置(7.20)相對于/ia/-/a/組的邊界位置(5.98)發(fā)生了明顯后移(p<0.01)。另外,/i/-/a/、/ai/-/a/、/ia/-/a/三組刺激連續(xù)統(tǒng)的邊界寬度主效應(yīng)顯著,F(xiàn)(2,32)=5.94,p<0.01,ηp2=0.27。這三組刺激連續(xù)統(tǒng)的邊界寬度箱線圖如圖4 (圖中盒子中的粗黑線代表中位數(shù))所示。Tukey多重比較結(jié)果顯示,其中/ai/-/a/組的邊界寬度(1.32)和/ia/-/a/組的邊界寬度(1.31)相對于單元音組/i/-/a/(1.91)都明顯更窄(ps<0.05),這說明在邊界位置附近,雙元音與單元音組的辨認(rèn)曲線的變化速率更快,因此范疇化特點(diǎn)更強(qiáng)。
圖 4 三套連續(xù)統(tǒng)下的邊界寬度箱線圖
被試對于感知/i/-/a/、/ai/-/a/、/ia/-/a/三組刺激連續(xù)統(tǒng)的范疇內(nèi)和范疇間區(qū)分正確率如圖5所示。我們進(jìn)行了3(三套刺激連續(xù)統(tǒng))× 2(范疇內(nèi)與范疇間兩種區(qū)分類別)兩因素重復(fù)測量方差分析,選用格林豪斯-蓋斯?fàn)枡z驗(yàn)矯正結(jié)果(Greenhouse-Geisser correction)。統(tǒng)計(jì)結(jié)果表明,不同的刺激連續(xù)統(tǒng)具有主效應(yīng),F(xiàn)(2,32) =59.16,p<0.001,ηp2=0.79;區(qū)分類別也具有主效應(yīng),F(xiàn)(1,16)=36.89,p<0.001,ηp2=0.69;另外,刺激連續(xù)統(tǒng)與區(qū)分類別具有顯著的交互效應(yīng),F(xiàn)(2,32)=19.75,p<0.001,ηp2=0.55。
圖 5 三套連續(xù)統(tǒng)下的范疇內(nèi)與范疇間區(qū)分正確率
鑒于交互效應(yīng)的產(chǎn)生,我們又分別對/i/-/a/、/ai/-/a/、/ia/-/a/三組刺激連續(xù)統(tǒng)下的范疇內(nèi)與范疇間的區(qū)分正確率進(jìn)行了簡單主效應(yīng)(simple main effect)分析。在單元音/i/-/a/組的連續(xù)統(tǒng)中,范疇內(nèi)區(qū)分正確率(81.67%)和范疇間區(qū)分正確率(83.56%)沒有顯著差異,F(xiàn)(1,16)=0.53, p=0.48。然而,在前響雙元音與單元音/ai/-/a/組的連續(xù)統(tǒng)中,其范疇間的區(qū)分正確率(73.94%)要明顯高于范疇內(nèi)的區(qū)分正確率(57.01%),F(xiàn)(1,16)=74.09, p<0.001;對于后響雙元音與單元音/ia/-/a/組的連續(xù)統(tǒng),其范疇間的區(qū)分正確率(71.55%)也要明顯高于范疇內(nèi)的區(qū)分正確率(61.14%),F(xiàn)(1,16)=37.21,p<0.001。
為了探討元音內(nèi)部共振峰信息的相對穩(wěn)態(tài)和動(dòng)態(tài)變化對于元音感知的影響,我們考察了普通話母語者對于單元音之間(/i/-/a/組)、前響雙元音和單元音之間(/ai/-/a/組)、后響雙元音和單元音之間(/ia/-/a/組)的辨認(rèn)和區(qū)分測試表現(xiàn),這些前響、后響復(fù)合元音的內(nèi)部共振峰的大小和走向在韻尾、韻頭部分都存在著動(dòng)態(tài)的變化。依據(jù)Liberman et al.(1957)提出的語音范疇化感知的基本特征,我們發(fā)現(xiàn),普通話單元音之間(/i/-/a/組)感知的范疇化程度較低,具體體現(xiàn)為:/i/-/a/組在辨認(rèn)測試中的邊界寬度較寬,即邊界位置附近辨認(rèn)曲線的變化相對比較緩慢,并沒有呈現(xiàn)陡升或陡降的特點(diǎn);其次,/i/-/a/組的區(qū)分正確率曲線的波動(dòng)和起伏較大,并且范疇內(nèi)和范疇間的區(qū)分正確率無顯著差異。相比較而言,普通話雙元音與單元音之間(/ai/-/a/組、/ia/-/a/組)感知的范疇化程度較高,具體體現(xiàn)為:/ai/-/a/組和/ia/-/a/組的辨認(rèn)邊界寬度都更窄,即邊界位置附近辨認(rèn)曲線的變化呈現(xiàn)出了陡升或陡降的特點(diǎn);其次,/ai/-/a/組和/ia/-/a/組的區(qū)分正確率曲線都在邊界位置附近存在一個(gè)明顯凸起的峰值,且同等聲學(xué)差異下的范疇間的區(qū)分正確率要顯著高于范疇內(nèi)的區(qū)分正確率。因此,普通話雙元音和單元音之間的感知表現(xiàn)出了典型的范疇化感知的特征,雙元音與單元音之間共振峰信息在曲線走向上的相對動(dòng)態(tài)變化使得感知的范疇化程度有了顯著的提高。
本實(shí)驗(yàn)研究結(jié)果表明,當(dāng)不同元音之間(單元音與單元音)內(nèi)部的共振峰走向處于相對穩(wěn)態(tài)時(shí),其感知的范疇化程度較低;相反,當(dāng)不同元音之間(雙元音與單元音)內(nèi)部的共振峰走向相對而言存在著顯著的動(dòng)態(tài)變化時(shí),其感知的范疇化程度會得到顯著地提高,表現(xiàn)出了典型的范疇化感知特點(diǎn)。另外需要注意的是,本研究中單元音組中的相鄰刺激之間的共振峰平均大小差異,實(shí)際上是大于雙元音與單元音組相鄰刺激的共振峰平均大小差異的(見圖1)。因此,共振峰信息在走向上的相對動(dòng)態(tài)變化而非共振峰的大小差異,才是影響感知結(jié)果的關(guān)鍵決定性因素。元音之間內(nèi)部共振峰在走向上的相對變化與否,會對其感知的范疇化程度的高低產(chǎn)生非常重要的影響。
與此類似,基頻信息F0才是決定聲調(diào)的最重要的內(nèi)部物理因素,相關(guān)文獻(xiàn)中有關(guān)聲調(diào)感知屬于范疇型感知類型的判斷,均來自不同調(diào)形(基頻走向)的聲調(diào)刺激對。一系列研究證明了普通話母語者對于陰平和陽平、陰平和去聲、陽平和去聲、上聲和去聲之間的聲調(diào)感知呈現(xiàn)出行為學(xué)上的范疇化感知特征(Wang 1976; Xu et al.2006; Peng et al.2010; 榮蓉2013; Chen et al.2017)。學(xué)界在后來的研究中發(fā)現(xiàn)了其他漢語方言聲調(diào)(Francis et al.2003; 高云峰 2004)、藏語聲調(diào)(孔江平 1995)感知的范疇化現(xiàn)象。另外,借助于事件相關(guān)電位(event-related potential, eRP, 如Xi et al.2010; Zheng et al.2012; Zhang et al.2012)以及功能性磁共振成像(functional MRI, fMRI,如Zhang et al.2011)等技術(shù),相關(guān)研究進(jìn)一步揭示了普通話陰平和陽平、陽平和去聲之間聲調(diào)范疇化感知的大腦生理基礎(chǔ)和神經(jīng)機(jī)制。Wang(1967)進(jìn)一步指出,聲調(diào)中的曲折特征(contour feature)屬于一種動(dòng)態(tài)屬性。然而,在有關(guān)平調(diào)之間或者其他調(diào)形相似的聲調(diào)感知研究卻得出了不一樣的結(jié)論:平調(diào)之間的感知類型是連續(xù)型的(Abramson 1979; Francis et al.2003),甚至于調(diào)型相似的聲調(diào)對之間的感知在區(qū)分曲線上也沒有呈現(xiàn)出典型的范疇性特點(diǎn)(王韞佳和李美京 2010;王韞佳和覃夕航 2015)。雖然后來有些學(xué)者在其研究中發(fā)現(xiàn)了廣州話和東海話中平調(diào)之間的感知(金健 2010)或者相似調(diào)形聲調(diào)的感知(陰平和上聲,該實(shí)驗(yàn)中“上聲”被設(shè)計(jì)為“低平調(diào)”)(榮蓉和石鋒 2013)呈現(xiàn)出了范疇型或類范疇型的特征,但值得注意的是,他們都把目標(biāo)聲調(diào)置于負(fù)載句或是有意義的詞語中,并不是經(jīng)典范疇感知實(shí)驗(yàn)范式中的孤立音節(jié)感知,所以對目標(biāo)聲調(diào)的感知結(jié)果必定受到了前后語境的影響,語境中的基頻信息的參照作用可能使得目標(biāo)聲調(diào)的感知更加清晰。因此,通過對比、總結(jié)可以發(fā)現(xiàn),在沒有語境因素參與的孤立音節(jié)單字調(diào)感知的條件下,導(dǎo)致聲調(diào)感知的范疇型與連續(xù)型不同結(jié)果產(chǎn)生的原因很可能在于:前者使用的聲調(diào)對材料包括了聲調(diào)之間調(diào)形的相對改變,而后者使用的聲調(diào)對的調(diào)形相似。因此,二種不同感知結(jié)果可能是由于使用的聲調(diào)材料在“基頻模式”或者“基頻走向”上的差異所引起的。
綜上所述,音位之間的范疇化感知的相關(guān)研究結(jié)果表明,當(dāng)音位內(nèi)部起決定性作用的頻率信息在走向上處于相對穩(wěn)態(tài)時(shí)(如聲調(diào)間調(diào)形的相對一致、單元音共振峰的相對穩(wěn)態(tài)特征),其不同音位之間感知的范疇化程度較低;相反,當(dāng)音位內(nèi)部起決定性作用的頻率信息在走向上處于相對動(dòng)態(tài)變化時(shí)(如塞音的過渡音征變化、曲折調(diào)在基頻走向上的相對改變、復(fù)合元音共振峰的動(dòng)態(tài)變化),其不同音位之間感知的范疇化程度則會較高。另外,除了頻率外,音位的內(nèi)部時(shí)長因素也會對其感知范疇化程度的高低產(chǎn)生影響,比如Pisoni(1973)的一項(xiàng)研究對比了在/i/-/I/ 刺激時(shí)長的長(300ms)和短(50ms)兩種條件下元音刺激連續(xù)統(tǒng)的聽辨結(jié)果,發(fā)現(xiàn)在元音時(shí)長較短時(shí),承載刺激對間聲學(xué)差異的聽覺信息(auditory information)的呈現(xiàn)時(shí)間會相應(yīng)變短,使得區(qū)分范疇內(nèi)刺激對差異所主要依賴的聽覺記憶(auditory memory)變得模糊,進(jìn)而造成范疇內(nèi)刺激音對區(qū)分正確率的下降;而區(qū)分范疇間刺激音對所主要依賴的語音記憶(phonetic memory)相對穩(wěn)定,因此范疇間刺激對的區(qū)分正確率不會因時(shí)長變短而發(fā)生顯著變化,從而范疇間刺激對的區(qū)分峰值相對而言會也更為顯著,因此時(shí)長較短的元音感知的范疇化程度更高。另外,Gerrits & Schouten(2004)認(rèn)為在連續(xù)語流中,由于元音發(fā)音時(shí)長縮短,元音感知線索呈現(xiàn)時(shí)間隨之縮短,聲譜編碼更為復(fù)雜,使得元音的感知更具范疇性特征。當(dāng)然,關(guān)于音位內(nèi)部時(shí)長因素及其與頻率因素的交互作用對音位感知范疇化程度的影響,還需要更多的研究去進(jìn)一步探討和論證。
有學(xué)者(劉掌才等 2016)非常明確地指出,無論是作為音段音位的元、輔音,還是作為超音段音位的聲調(diào),一個(gè)音位本身就應(yīng)該是一個(gè)范疇,該音位的所有自由變體和條件變體即為范疇的成員。語音的聽覺格局和語音的聲學(xué)特征的確應(yīng)該存在一定的對應(yīng)性,特定的音位在發(fā)音人的語言系統(tǒng)中能夠區(qū)別意義,在某種意義上它們就應(yīng)該是范疇化感知的。如此說來,對語言中的聲調(diào)、輔音,甚至是元音的感知在本質(zhì)上都應(yīng)屬于“范疇化感知”類型,只不過人們對不同音位感知的范疇化程度有高有低,各種內(nèi)部、外部因素均會直接或者間接影響到音位感知的范疇化程度的高低。
在上文的一系列討論中已經(jīng)指出,音位內(nèi)部的相關(guān)時(shí)、頻信息,音位外部的語言環(huán)境、實(shí)驗(yàn)方法和聽者的語言經(jīng)驗(yàn)(跨語言或者跨方言的差異,見Peng et al.2010)都會對音位的范疇化感知產(chǎn)生重要的影響,甚至于失樂癥者(Jiang et al.2012)、自閉癥譜系障礙患者(Chen et al. 2016; Wang et al.2017)等特殊人群對其母語中音位的范疇化感知也都存在著不同程度的缺陷。因此,音位的范疇化感知特征不僅由其物理屬性決定,同樣受制于聽辨人的生理和心理屬性,是由不同的內(nèi)部、外部因素有機(jī)地組合在一起而形成的一個(gè)心理上的感知范疇,是一個(gè)極其復(fù)雜的“多維的感知場”。我們認(rèn)為,以往的傳統(tǒng)研究中將語音的感知類型截然劃分為“范疇感知”“連續(xù)感知”或者“類范疇化感知”,并不能滿足言語感知的實(shí)際,在典型的連續(xù)型和典型的范疇型感知之間還存在著非常多的中間狀態(tài)。感知結(jié)果本身就是一個(gè)范疇化程度由低到高的連續(xù)統(tǒng),由于Liberman et al.(1957)所提出的范疇化標(biāo)準(zhǔn)只是對感知類型二分的定性分析,因此我們需要在該標(biāo)準(zhǔn)的指導(dǎo)下,發(fā)掘在各類不同因素影響下衡量范疇化程度高低的具體量化指標(biāo)。
音位感知范疇化程度高低的量化研究是近年來范疇感知研究中的新進(jìn)展,音位感知的范疇化程度越高,表明對不同類別音位的區(qū)分度越高。那么,哪些感知參數(shù)可以用來客觀衡量音位感知范疇化程度的高低呢?首先,辨認(rèn)測試中的邊界位置的作用主要在于劃分不同音位類別在聽感上的分界。如本文中的/ai/-/a/組的邊界位置相對于/ia/-/a/組明顯靠后,是由于/ai/-/a/組內(nèi)部共振峰發(fā)生變化的位置在時(shí)長后1/3的韻尾部分,而/ia/-/a/組內(nèi)部共振峰發(fā)生變化的位置是在前1/3的韻頭部分。另外,有研究指出,相對于非母語者,成人母語被試的母語經(jīng)驗(yàn)并不會改變其音位感知的邊界位置(Peng et al.2010;Xu et al.2006);并且兒童隨著語言經(jīng)驗(yàn)的增多,其音位感知的邊界位置也不會發(fā)生變化(Chen et al.2017)。因此,我們認(rèn)為辨認(rèn)邊界位置并不能作為衡量音位感知范疇化程度高低的有效指標(biāo)。而對于音位感知范疇化程度的高低,可以使用辨認(rèn)測試中辨認(rèn)曲線的斜率(Xu et al.2006)或辨認(rèn)邊界寬度(Peng et al.2010)等參數(shù)來量化體現(xiàn)。邊界寬度(辨認(rèn)率為25%與75%間的線性距離)著重考察的是邊界位置附近的辨認(rèn)變化速率,而辨認(rèn)曲線的斜率則受到了整條辨認(rèn)曲線的影響。由于Liberman et al.(1957)所提出來的有關(guān)衡量范疇化感知的標(biāo)準(zhǔn)中,強(qiáng)調(diào)辨認(rèn)曲線是在不同范疇的“邊界附近”有陡峭的上升或下降,因此,我們認(rèn)為辨認(rèn)邊界寬度比辨認(rèn)曲線的斜率更適合作為衡量感知范疇化程度高低的有效客觀指標(biāo)。另外,在區(qū)分測試中,Liberman et al.(1957)強(qiáng)調(diào)了在邊界位置附近區(qū)分正確率的顯著提高,其實(shí)也就意味著“范疇間區(qū)分正確率”的重要性。在本實(shí)驗(yàn)中,雖然/i/-/a/組的整體區(qū)分正確率相比于其他兩組均偏高,這主要是因?yàn)?i/-/a/組中區(qū)分刺激對之間在物理(共振峰)參數(shù)上差異較大;但是由于/i/-/a/組的區(qū)分曲線并沒有在邊界附近出現(xiàn)一個(gè)明顯凸起的區(qū)分峰值,且范疇間區(qū)分正確率并沒有高于范疇內(nèi)區(qū)分正確率,因此其感知的范疇化程度仍然較低;而/ai/-/a/組和/ia/-/a/組的范疇間區(qū)分正確率要遠(yuǎn)高于其范疇內(nèi)區(qū)分正確率,其感知的范疇化程度較高。因此,在范疇感知行為測試中,辨認(rèn)邊界寬度越窄、范疇間區(qū)分正確率相比于范疇內(nèi)區(qū)分正確率越高,也意味著音位感知的范疇化程度越高;反之,則音位感知的范疇化程度越低。
另外,由于范疇感知的行為測試受限于被試的注意力、認(rèn)知水平、記憶力等因素,很多年齡偏小的嬰幼兒被試或者患有各類特殊認(rèn)知障礙的人士并不能有效完成辨認(rèn)、區(qū)分等行為測試。隨著認(rèn)知神經(jīng)科學(xué)的發(fā)展,借助于腦電技術(shù),可以在被試不需要主動(dòng)注意力的前提下,采集其對不同音位刺激感知的腦電信號,實(shí)現(xiàn)對嬰幼兒或者特殊障礙人士分析其范疇化感知能力的可能性。腦電中的eRP是一種特殊的腦誘發(fā)電位,是大腦對特定的刺激或事件做出反應(yīng)的神經(jīng)電生理體現(xiàn)。Xi et al.(2010)證明在不需要主動(dòng)注意力的條件下,范疇間音位偏差比范疇內(nèi)音位偏差能夠引發(fā)更明顯的腦電波成分,這說明屬于不同范疇的音位刺激在大腦皮層已經(jīng)有了生理表征上的顯著差異。且相關(guān)研究結(jié)果表明,事件相關(guān)電位中的失匹配性反應(yīng)波(Mismatch Responses,MMR)從正向波(Positive Mismatch Response,P-MMR)向負(fù)向波(Mismatch Negativity, MMN)的轉(zhuǎn)換,一方面反映出聲音刺激在物理屬性上的差異由小到大的變化,另一方面可以反映出聽者對刺激差異在感知區(qū)分能力上由弱到強(qiáng)的變化(Lee et al.2012)。一般而言,對于不同音位感知的范疇化程度越高,這種失匹配性反應(yīng)波會傾向于負(fù)向波(MMN),并且這種失匹配性負(fù)波的幅值會更負(fù),潛伏期會提前;而對于音位感知范疇化程度偏低的聽者而言,這種失匹配性反應(yīng)波會傾向于正向波(P-MMR)。因此,聽者對于隸屬不同范疇的音位刺激的偏差感知可能在失匹配性反應(yīng)波的極向、幅值甚至潛伏期上存在差異,這些腦電成分也可以作為衡量音位感知范疇化程度高低的神經(jīng)生理指標(biāo)。
本研究考察了元音內(nèi)在的固有共振峰信息對于元音感知范疇化程度的影響,當(dāng)不同元音之間(單元音與單元音)內(nèi)部的共振峰信息在走向上處于相對穩(wěn)態(tài)時(shí),其感知的范疇化程度較低;相反,當(dāng)不同元音之間(雙元音與單元音)內(nèi)部的共振峰信息在走向上存在動(dòng)態(tài)變化時(shí),其感知的范疇化程度會得到顯著地提高。結(jié)合以往研究中關(guān)于聲調(diào)范疇化感知的相關(guān)結(jié)論,我們認(rèn)為音位之間內(nèi)部的頻率信息(基頻或者共振峰)在走向上的相對穩(wěn)態(tài)或動(dòng)態(tài)變化會對感知結(jié)果產(chǎn)生重要的影響。由于音位感知是受到多種內(nèi)部、外部因素影響下而形成的一個(gè)復(fù)雜的感知范疇,我們主張拋棄以往研究中對感知結(jié)果“范疇型”或“連續(xù)型”的粗略劃分,而應(yīng)該重點(diǎn)比較受到某種或某些變量影響下的音位感知范疇化程度高低的量化差異。我們還指出,在經(jīng)典范疇化感知行為測試中所得到的辨認(rèn)邊界寬度、范疇間與范疇內(nèi)區(qū)分正確率可以作為描寫范疇化程度高低的客觀行為學(xué)指標(biāo),而事件相關(guān)電位中失匹配性反應(yīng)波在極向、幅值甚至潛伏期上的差異也可以作為衡量音位感知范疇化程度高低的神經(jīng)生理指標(biāo)。未來有關(guān)音位范疇化感知的研究應(yīng)該走向定量化、科學(xué)化,而本文所總結(jié)和提出的有關(guān)音位感知范疇化程度的各類影響因素及其衡量指標(biāo)具有重要的參考和指導(dǎo)意義。