孫娜娜
(呂梁學(xué)院,山西 呂梁 033000)
?
漢字詞頻與客觀口語詞匯獲得年齡關(guān)系的研究
孫娜娜
(呂梁學(xué)院,山西 呂梁 033000)
[摘要]詞匯獲得年齡和詞頻對(duì)詞匯加工有重要的影響。通過選取551個(gè)音節(jié)的同音最高頻詞、同音中頻詞和同音最低頻詞作為調(diào)查詞匯,讓0-4歲幼兒的家長(zhǎng)從中選取其孩子在該年齡階段獲得的詞匯,收集AoA數(shù)據(jù)。根據(jù)調(diào)查結(jié)果探討漢字詞頻和客觀AoA的相互關(guān)系,研究發(fā)現(xiàn)客觀AoA和詞頻有一定程度的相關(guān),但并不完全一致。此研究結(jié)論可以為心理語言學(xué)研究實(shí)驗(yàn)材料的選擇提供依據(jù)。
[關(guān)鍵詞]詞匯獲得年齡;詞頻;客觀AoA
詞匯習(xí)得年齡(Age of acquisition, AoA)指第一次以口語或者書面語形式接觸到某個(gè)詞并理解其意義的年齡。詞匯習(xí)得年齡效應(yīng)指?jìng)€(gè)體對(duì)早獲得詞的加工比晚獲得詞的加工更快且更準(zhǔn)確。詞頻效應(yīng)指?jìng)€(gè)體對(duì)高頻詞匯的加工易于對(duì)低頻詞匯的加工。
(一)詞匯習(xí)得年齡效應(yīng)
語言認(rèn)知任務(wù)中,AoA是影響詞匯加工速度的一個(gè)重要因素。研究者在圖片命名任務(wù)(picture-naming task)(e.g., Lotto, Surian & Job, 2010)、詞匯命名任務(wù)(word-naming task)(Morrison & Ellis,1995; Brysbaert, Lange & Van Wijnendaele,2000)、詞匯判斷任務(wù)(lexical decision making)(e.g., Brysbaert et al., 2000)等任務(wù)中,均發(fā)現(xiàn)了AoA效應(yīng)。
(二)詞頻效應(yīng)
詞頻影響詞匯的理解(comprehension)和產(chǎn)生(production),包括其加工速度和正確率等(Jay, 2003)。在詞匯判斷任務(wù)(即讓被試判斷所呈現(xiàn)的一串字母是否是一個(gè)真詞)(Rubenstein, Garfield & Millikan, 1970)和命名任務(wù)(即讓被試根據(jù)呈現(xiàn)的信號(hào),如客體的圖像,說出單詞)(Forster & Chambers, 1973)中,均發(fā)現(xiàn)了明顯的詞頻效應(yīng),詞頻越高的詞,判斷或命名的時(shí)間越短。
(三)詞頻與AoA的關(guān)系
AoA效應(yīng)被發(fā)現(xiàn)以來,詞匯獲得年齡和詞頻在詞匯識(shí)別中的關(guān)系問題一直是研究者爭(zhēng)論的焦點(diǎn)。有的研究者認(rèn)為,過去發(fā)現(xiàn)的詞匯識(shí)別任務(wù)中的頻率效應(yīng)可以歸因于未加控制的AoA因素,如Morrison(1995) 等人發(fā)現(xiàn)詞匯命名任務(wù)中AoA決定詞匯命名的時(shí)間,頻率沒有作用。而有的研究者得出了不同的結(jié)論,認(rèn)為AoA和頻率都是詞匯識(shí)別的重要影響因素,它們對(duì)詞匯識(shí)別的過程獨(dú)立產(chǎn)生影響,它們的效應(yīng)是一種相加的關(guān)系(陳寶國,王立新,王璐璐,彭耽齡,2004)。
(四)主觀AoA與客觀AoA
以往研究中有兩種類型的AoA數(shù)據(jù):主觀AoA數(shù)據(jù)和客觀AoA數(shù)據(jù)。主觀AoA數(shù)據(jù)是通過讓被試報(bào)告自己在哪個(gè)年齡階段學(xué)會(huì)的所呈現(xiàn)的詞獲得的??陀^AoA數(shù)據(jù)通過圖片命名任務(wù)收集,此項(xiàng)任務(wù)中,給不同年齡階段的兒童呈現(xiàn)圖片,讓兒童給這些圖片命名,如果某一年齡階段的兒童能正確地給某一圖片命名,說明兒童在該年齡階段已習(xí)得與該圖片對(duì)應(yīng)的詞匯。
以往多數(shù)研究采用主觀評(píng)定的AoA數(shù)據(jù)(Gilhooly & Logie, 1980),Morrison et al. (1997)試圖收集客觀AoA數(shù)據(jù),并通過計(jì)算主觀AoA和客觀AoA數(shù)據(jù)的相關(guān)系數(shù)評(píng)估主觀AoA的有效性,獲得主觀AoA和客觀AoA的相關(guān)系數(shù)為0.7。
客觀AoA數(shù)據(jù)和主觀AoA數(shù)據(jù)高度相關(guān),然而客觀AoA和其他心理語言學(xué)變量有中度相關(guān)(相關(guān)系數(shù)很少超過0.5)(Andrei Grigoriev & Ivan Oshhepkov, 2013)。這使得一些研究者相信主觀AoA可能是一個(gè)組合變量;它可能依賴于其他變量,如詞頻、熟悉度等(Morrison et al.,1997)。
然而漢語中還未有研究獲取客觀AoA數(shù)據(jù),因此漢語客觀AoA與詞頻的關(guān)系仍是未知數(shù)。本研究將一個(gè)詞的詞匯獲得年齡定義為該詞首次在幼兒時(shí)期習(xí)得的年齡。通過這種方法獲得的AoA數(shù)據(jù)比較客觀,不依賴于被試的回憶而存在,實(shí)驗(yàn)結(jié)果可進(jìn)行重復(fù)檢驗(yàn),也可為以后心理語言學(xué)材料的選取提供依據(jù)。
(一)被試
選取0-1,1-1.5, 1.5-2, 2-2.5, 2.5-3, 3-4六個(gè)年齡組幼兒的家長(zhǎng)作為調(diào)查對(duì)象,各年齡段對(duì)應(yīng)的被試人數(shù)分別為66人、101人、58人、155人、101人、59人。其中男幼兒242個(gè),女幼兒282個(gè)。采用與被試面對(duì)面的調(diào)查方式,要求被試從調(diào)查問卷中選出他們的孩子在該年齡階段能夠理解的詞。共發(fā)放問卷555份,有效問卷524份,有效率為94%。
(二)調(diào)查問卷
首先,從詞頻詞典(2011-9-22校正版)選出不含多音字的、同音字?jǐn)?shù)大于等于三的音節(jié);然后從每個(gè)音節(jié)各取一個(gè)最高頻詞、一個(gè)中間詞頻的詞(即中頻詞)、一個(gè)最低頻詞作為熟悉度評(píng)估的刺激。高頻詞組或低頻詞組中,如果有兩個(gè)以上詞的頻度等同,則從中隨機(jī)選出一個(gè)作為刺激,如果一個(gè)音節(jié)的同音字?jǐn)?shù)是奇數(shù),則選擇最中間的詞作為這個(gè)音節(jié)的中頻詞;如果一個(gè)音節(jié)的同音字?jǐn)?shù)是偶數(shù),則隨機(jī)選擇正中間的兩個(gè)詞中的一個(gè)作為這個(gè)音節(jié)的中頻詞。最后選出551個(gè)音節(jié)的高頻詞、中頻詞和低頻詞,共1653個(gè)詞構(gòu)成調(diào)查問卷。
(三)數(shù)據(jù)收集與處理
發(fā)放問卷過程中,采用主試與被試一對(duì)一、面對(duì)面的方式,問卷當(dāng)場(chǎng)回收。檢查剔除無效問卷,采用Excel, SPSS13.0等統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)處理。
對(duì)于某一特定的詞,只有超過10個(gè)以上的被試選擇,才將此詞納入統(tǒng)計(jì)處理中,并且將該詞中數(shù)值最小的三個(gè)年齡數(shù)據(jù)的平均值作為該詞的口語詞匯獲得年齡,即客觀AoA數(shù)據(jù)。
本研究探討漢語客觀AoA數(shù)據(jù)的分布,以及客觀AoA數(shù)據(jù)與詞頻的關(guān)系。
為了便于結(jié)果分析,將AoA數(shù)據(jù)與詞頻進(jìn)行分組。
AoA數(shù)值范圍及分組原則如下:數(shù)值在0至1之間(包括1)為組1,數(shù)值在1至1.5之間(包括1.5)為組2,數(shù)值在1.5至2之間(包括2)為組3,數(shù)值在2至2.5之間(包括2.5)為組4,數(shù)值大于2.5為組5。
詞頻數(shù)值范圍及分組結(jié)果見表1:
(一)漢語AoA數(shù)據(jù)的頻數(shù)分布
由結(jié)果分析可知,漢語AoA為2.5以上的詞,即兩歲半以上學(xué)會(huì)的詞最多,占到了所有詞的77.4%。其次是在AoA分組為2(即一歲到一歲半)這一年齡階段學(xué)會(huì)的詞居多。在AoA分組為4(即兩歲到兩歲半)這一年齡階段學(xué)會(huì)的詞最少。
(二)漢語AoA和詞頻的關(guān)系(見表2和圖1)
AoA分組數(shù)據(jù)與詞頻分組數(shù)據(jù)均為等級(jí)變量,因此用Spearman相關(guān)計(jì)算AoA與詞頻的相關(guān)系數(shù),求得r=-0.57,說明詞頻與AoA數(shù)值存在一定程度的關(guān)聯(lián)。
通過表2和圖1進(jìn)一步分析可知,AOA比較大的詞(分組為5,年齡為2.5以上),有多種詞頻,且低頻詞(詞頻分組<=8,詞頻<569)占到了近87%。AOA比較小的詞(分組為1至4,年齡小于2.5)共375個(gè),多數(shù)為詞頻相對(duì)較高的詞,74%以上詞頻大于572(詞頻分組為9、10.11)。低頻詞(詞頻<37,詞頻分組為1、2、3、4)98%以上屬于AOA比較大的詞(AOA分組為5,年齡為大于2.5)。高頻詞(詞頻>572,詞頻分組為9、10、11)的AOA分布比較廣泛。
通過客觀調(diào)查的方式,獲取了《現(xiàn)代漢語常用詞頻詞典》中1653個(gè)詞的客觀口語AoA數(shù)據(jù),區(qū)別于以往漢語研究所采用的主觀評(píng)定的AoA數(shù)據(jù)(陳寶國,王立新,王璐璐,彭耽齡,2004)。此為漢語中首批客觀口語AoA數(shù)據(jù)。以往研究中主觀AoA數(shù)據(jù)混淆了詞頻、熟悉度等無關(guān)因素的影響,因此其對(duì)詞匯加工的影響很難解釋清楚。本研究收集的客觀口語AoA數(shù)據(jù)可為今后心理語言學(xué)的研究提供參考。
漢語口語AoA數(shù)據(jù)分布的結(jié)果表明,雖然本研究所采用的詞均源自《現(xiàn)代漢語常用詞頻詞典》,但大部分詞仍是幼兒兩歲半以后習(xí)得的。這可能跟《現(xiàn)代漢語常用詞頻詞典》中收集的是書面語的詞頻有一定關(guān)系,因此很多兩歲半之前習(xí)得的詞未在《漢語常用詞頻詞典》中,或者未在本研究所選取的詞匯中。
從AoA與詞頻的相關(guān)關(guān)系分析可知,AoA與詞頻的相關(guān)系數(shù)為-0.57,高于0.5,這不同于以往Andrei Grigoriev & Ivan Oshhepkov(2013)等的研究結(jié)果,前人研究均認(rèn)為詞頻與客觀AoA只存在中等程度的相關(guān),相關(guān)系數(shù)小于0.5。本研究之所以得出不一樣的結(jié)論,可能由于實(shí)驗(yàn)材料的不同,前人研究使用的實(shí)驗(yàn)材料均為拼音語言材料,而本研究使用的是漢字詞。漢字詞與拼音語言有很大差異,漢字詞中同音字比較多,且很多為象形字,因此導(dǎo)致不同的實(shí)驗(yàn)結(jié)果。另外本研究獲得客觀AoA數(shù)據(jù)的方式與以往研究不同,以往研究客觀AoA數(shù)據(jù)通常通過圖片命名任務(wù)收集(Morrison et al. ,1997),而本研究采用調(diào)查幼兒家長(zhǎng)的方式。數(shù)據(jù)收集方式的不同也可能導(dǎo)致實(shí)驗(yàn)結(jié)果有差異。以往收集AoA數(shù)據(jù)的圖片命名任務(wù)雖然也是一種客觀的方法,但本研究中的很多詞匯用圖片描述非常困難,所以采取了調(diào)查幼兒家長(zhǎng)的數(shù)據(jù)收集方法,比起主觀評(píng)估,此方法更為客觀。主觀評(píng)估的方法由于要求被試憑借記憶進(jìn)行回憶,得出的數(shù)據(jù)可能存在一定的誤差,且受到詞頻、熟悉度等因素的干擾。本研究采用的方法雖不能完全排除熟悉度等因素的影響,但由于讓幼兒家長(zhǎng)選擇自己的孩子在當(dāng)前年齡階段已經(jīng)掌握的詞,熟悉度等因素的影響程度會(huì)大大減小。
由計(jì)算的相關(guān)系數(shù)及圖表分析可知,AoA與詞頻存在一定程度的相關(guān),呈現(xiàn)一種詞匯習(xí)得年齡越早詞匯出現(xiàn)頻率越高的趨勢(shì),然而相關(guān)系數(shù)并不是很高,而且由圖表可知,這種趨勢(shì)也不是很明顯,所以客觀AoA和詞頻仍然有明顯差異,這一點(diǎn)與以往的研究結(jié)論是一致的(Alvarez & Cuetos, 2007)。因此心理語言學(xué)的研究應(yīng)同時(shí)考慮客觀AoA和詞頻對(duì)詞匯加工的影響。
(一) 本研究收集了《現(xiàn)代漢語常用詞頻詞典》中1653個(gè)詞的客觀口語AoA數(shù)據(jù)。
(二) 多數(shù)漢字詞是幼兒兩歲半以后習(xí)得的。
(三) 客觀詞頻和客觀口語AoA既有一定程度的相關(guān),也存在差異。
[參考文獻(xiàn)]
[1]lvarez, B., & Cuetos, F. (2007). Objective age of acquisition norms for a set of 328 words in Spanish. Behavior Research Methods,2007, 39(3): 377-383.
[2]Andrei Grigoriev & Ivan Oshhepkov. Objective age of acquisition norms for a set of 286 words in Russian: Relationships with other psycholinguistic variables. Behavior Research. 2013, 45(4): 1208-1217.
[3]Brysbaert, M., Lange, M., & Van Wijnendaele, I. (2000). The effects of age-of-acquisition and frequency-of-occurrence in visual word recognition: Further evidence from the Dutch language.European Journal of Cognitive Psychology, 2000, 12(1): 65-85.
[4]Forster, K. I., & Chambers, S. M. Lexical access and naming time. Journal of Verbal Learning and Verbal Behavior, 1973, 12(6): 627-635.
[5]Gilhooly, K., & Logie, R. Age-of-acquisition, imagery, concreteness, familiarity, and ambiguity measures for 1,944 words. Behavior Research Methods, 1980, 12(4): 395-427.
[6]Jay, T. B. Words and word recognition [M]. New York: Prentice Hall. 2003.
[7]Lotto, L., Surian, L., & Job, R. Objective age of acquisition for 223 Italian words: Norms and effects on picture naming speed. Behavior Research Methods, 2010, 42(1): 126-133.
[8]Morrison, C. M., Chappell, T. D., & Ellis, A. W. Age of Acquisition Norms for a Large Set of Object Names and Their Relation to Adult Estimates and Other Variables. The Quarterly Journal of Experimental Psychology Section A: Human Experimental Psychology, 1997, 50(3): 528-559.
[9]Morrison, C. M., & Ellis, A. W. Roles of Word Frequency and Age of Acquisition in Word Naming and Lexical Decision.Journal of Experimental Psychology: Learning, Memory, and Cognition, 1995, 21(1): 116-133.
[10]Rubenstein, H., Garfield, L., & Millikan, J. A. Homographic entries in the internal lexicon. Journal of Verbal Learning and Verbal Behavior, 1970, 9(5): 487-494.
[11]陳寶國, 王立新, 王璐璐, 彭聃齡. 詞匯習(xí)得年齡和頻率對(duì)詞匯識(shí)別的影響[J].心理科學(xué), 2004, 27(5): 1060-1064.
[12]劉源, 梁南元, 王德進(jìn), 張社英, 楊鐵鷹, 揭春雨, 孫偉(主編). 現(xiàn)代漢語常用詞詞頻詞典[M]. 北京: 宇航出版社. 1990.
[責(zé)任編輯:K]
[收稿日期]2015-04-23
[基金項(xiàng)目]呂梁學(xué)院2013年校內(nèi)青年基金項(xiàng)目(RWQN201306)結(jié)題成果。
[作者簡(jiǎn)介]孫娜娜(1985- ),女,山東德州人,主要從事漢語認(rèn)知研究。
[中圖分類號(hào)]H193.3
[文獻(xiàn)標(biāo)識(shí)碼]A
[文章編號(hào)]1671-5330(2015)03-0120-04