【摘要】本研究旨在任務(wù)型測(cè)試視角下從理論角度探討現(xiàn)行詞匯測(cè)試工具在測(cè)量學(xué)習(xí)者詞匯能力上的可靠性。我們結(jié)合Bachman的語(yǔ)言測(cè)試?yán)碚摶仡櫹嚓P(guān)研究后發(fā)現(xiàn)對(duì)詞匯能力的定義應(yīng)該包含語(yǔ)言運(yùn)用的范疇,在確保信度和強(qiáng)化效度間取得均衡進(jìn)而實(shí)現(xiàn)任務(wù)設(shè)置中能力評(píng)級(jí)多層次性和語(yǔ)言使用特征真實(shí)性。由于話題和任務(wù)設(shè)置目標(biāo)相關(guān)性對(duì)學(xué)習(xí)者引起的反撥效應(yīng)可以通過(guò)控制引發(fā)手段來(lái)確保測(cè)試結(jié)果的可解釋性,因此為了保持測(cè)試工具高預(yù)測(cè)力,必須使任務(wù)設(shè)置符合不同水平學(xué)習(xí)者要求,同時(shí)還要注意語(yǔ)境對(duì)測(cè)試結(jié)果的干擾,合理采用人工干預(yù)確保信度。
【關(guān)鍵詞】詞匯知識(shí) 語(yǔ)境 任務(wù)型測(cè)試 預(yù)測(cè)準(zhǔn)確性 結(jié)構(gòu)效度
【中圖分類(lèi)號(hào)】H319 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2018)27-0089-02
一、引言
詞匯學(xué)習(xí)是一個(gè)循環(huán)往復(fù)的過(guò)程,如何準(zhǔn)確判斷學(xué)習(xí)者詞匯能力進(jìn)展已成為測(cè)試評(píng)估中重要問(wèn)題。詞匯能力發(fā)展受詞匯知識(shí)多層次性、接受輸入量和質(zhì)、學(xué)習(xí)者語(yǔ)言能力影響,是處于習(xí)得準(zhǔn)備狀態(tài)的學(xué)習(xí)者通過(guò)操練等方法進(jìn)入形態(tài)-功能接口時(shí)形成的詞法能力。然而詞法化的形成又是潛移默化的過(guò)程,設(shè)計(jì)合適的測(cè)量工具來(lái)研究詞法化成為最佳選擇。本文就近十年來(lái)有關(guān)詞匯能力測(cè)量的相關(guān)研究進(jìn)行綜述,為進(jìn)一步改進(jìn)測(cè)量工具提供理論依據(jù)。
二、詞匯知識(shí)和測(cè)試
一個(gè)英語(yǔ)單詞包含的知識(shí)有多層次性(戴曼純,2000)。就知識(shí)深度而言,一個(gè)詞所囊括知識(shí)可分為接受性知識(shí)和產(chǎn)出性知識(shí)。接受性知識(shí)包括詞的形式、意義和功能,產(chǎn)出性知識(shí)是接受性知識(shí)的延伸,包括拼讀、在語(yǔ)境中的使用等(Nation, 1990/2003)。任務(wù)內(nèi)容自然分為學(xué)習(xí)材料和學(xué)習(xí)目標(biāo),材料是實(shí)現(xiàn)目標(biāo)的載體,而目標(biāo)不僅是記憶,更要求在不同語(yǔ)境中能準(zhǔn)確使用(Gu, 2003)。因此,測(cè)量詞匯能力不單是記憶的量,更重要的是在不同任務(wù)類(lèi)型和語(yǔ)境下使用詞匯的質(zhì)。
盡管單個(gè)詞所包含知識(shí)呈現(xiàn)多層次性,但就知識(shí)廣度而言,大體涵蓋形式、意義和用法三方面。三者各自獨(dú)立但又相互聯(lián)系,形式與意義層面發(fā)生互動(dòng),形式和意義層面又分別與用法層面產(chǎn)生互動(dòng)關(guān)系,三者間互動(dòng)有賴(lài)于概念結(jié)構(gòu)中介作用。在測(cè)試中,應(yīng)試者與測(cè)試任務(wù)間需通過(guò)形式、意義、用法間的循環(huán)才能實(shí)現(xiàn)互動(dòng)。當(dāng)遇到生詞時(shí),應(yīng)試者在初期準(zhǔn)備中形式、意義和用法間的互動(dòng)關(guān)系較弱,因此憑借自身經(jīng)驗(yàn)性知識(shí)通過(guò)已知來(lái)構(gòu)建未知,與原有概念結(jié)構(gòu)形成有效鏈接,經(jīng)過(guò)同化使其發(fā)生“量”的更新;更新后結(jié)構(gòu)進(jìn)入中期處理,應(yīng)試者心理機(jī)制發(fā)揮過(guò)濾作用對(duì)已發(fā)生“量”的變化后結(jié)構(gòu)進(jìn)行篩選,以便提取關(guān)鍵新信息結(jié)構(gòu);提取完成進(jìn)入后期產(chǎn)出,前一階段形成的結(jié)構(gòu)通過(guò)順應(yīng)實(shí)現(xiàn)與原有概念結(jié)構(gòu)整合,從而實(shí)現(xiàn)概念結(jié)構(gòu)在“質(zhì)”上重組。在此階段,形式、意義和用法在新概念結(jié)構(gòu)中介作用下形成較強(qiáng)互動(dòng)關(guān)系,在此基礎(chǔ)上重回至任務(wù)中完成預(yù)設(shè)要求。一旦出現(xiàn)生詞,此過(guò)程將重新進(jìn)入準(zhǔn)備階段,如此循環(huán)往復(fù)以至最終完成任務(wù)設(shè)置目標(biāo)。
語(yǔ)境對(duì)測(cè)試過(guò)程影響主要是通過(guò)受試者為完成任務(wù)設(shè)置目標(biāo)而采用的心理評(píng)估手段來(lái)實(shí)現(xiàn)的。根據(jù)與話題相關(guān)程度,語(yǔ)境可分為直接語(yǔ)境和背景語(yǔ)境。直接語(yǔ)境與話題相關(guān)程度低,指存在于句子或文章中非話題知識(shí)或背景知識(shí)的語(yǔ)言線索或暗示等信息;背景語(yǔ)境與話題相關(guān)程度高,指在主題知識(shí)暗示下與學(xué)習(xí)者經(jīng)驗(yàn)性知識(shí)相匹配的形式或意義上的圖式框架。在直接語(yǔ)境下,學(xué)習(xí)者憑借文本中出現(xiàn)的提示信息對(duì)目標(biāo)生詞完成策略選擇、利用已知提示分析、生成語(yǔ)義和驗(yàn)證推理這一系列過(guò)程。其中,提示信息包括分析詞語(yǔ)形態(tài)結(jié)構(gòu)、詞性、生詞所在句的語(yǔ)法結(jié)構(gòu),而驗(yàn)證過(guò)程則將經(jīng)驗(yàn)性知識(shí)放入文本所蘊(yùn)涵的語(yǔ)境中加以檢驗(yàn)其恰當(dāng)性;在背景語(yǔ)境下,學(xué)習(xí)者主要利用自己積累的經(jīng)驗(yàn)、話題知識(shí)、篇章結(jié)構(gòu)知識(shí)進(jìn)行從上到下處理來(lái)揣摩生詞,并通過(guò)文本中語(yǔ)法提示信息進(jìn)行從下到上處理來(lái)驗(yàn)證結(jié)果,易受話題化影響引起反撥效應(yīng)。
三、詞匯知識(shí)和測(cè)量
詞匯量測(cè)試和詞匯層級(jí)測(cè)試是關(guān)注焦點(diǎn)。Nation (1993)認(rèn)為詞匯量測(cè)試項(xiàng)目從字典所列詞條中抽取樣本,基于此,Schmitt, D. Schmitt & Clapham (2001)提出了擴(kuò)展版詞匯層級(jí)測(cè)試方案。Beglar (2010)通過(guò)R語(yǔ)言發(fā)現(xiàn)詞匯量測(cè)試對(duì)接受性詞匯知識(shí)的信度和效度都達(dá)到了要求,而Perkins & Linnville (1987)通過(guò)檢驗(yàn)詞匯測(cè)試工具的結(jié)構(gòu)定義發(fā)現(xiàn)應(yīng)試者所處學(xué)習(xí)階段應(yīng)包含在結(jié)構(gòu)定義中。因此,工具通用性不僅取決于對(duì)詞匯量進(jìn)行準(zhǔn)確的概念化,而且還要使概念化后的詞匯量具有可操作性(Laufer, Elder, Hill & Congdon, 2004)。
盡管測(cè)量工具按照理論要求設(shè)計(jì),但往往不參照語(yǔ)境對(duì)詞匯量做粗略估計(jì),應(yīng)在互動(dòng)觀基礎(chǔ)上考慮語(yǔ)境構(gòu)建新測(cè)量框架 (Read & Chapelle, 2001),然而現(xiàn)有測(cè)試工具常忽略語(yǔ)境聚焦接受性詞匯量,比如Yes-No測(cè)試法雖具有一定的效度和信度,然而用離散法設(shè)計(jì)出的試題與傳統(tǒng)選擇題和正誤判斷題相比,測(cè)試結(jié)果被高估導(dǎo)致信度存在問(wèn)題(Beeckmans, R et al., 2001)。通過(guò)計(jì)算應(yīng)試者對(duì)項(xiàng)目反應(yīng)時(shí)間并不存在優(yōu)勢(shì)(Pellicer-Sánchez & Schmitt, 2012),原因在于應(yīng)試者推測(cè)和反應(yīng)方式,只有改進(jìn)控制手段(Huibregtse, Admiraal & Meara, 2002)。但Yes-No測(cè)試法在詞匯層級(jí)測(cè)試中能有效測(cè)量接受性詞匯量(Mochida & Harrington, 2006),既能提供評(píng)估詞匯知識(shí)掌握質(zhì)量,又能確認(rèn)詞匯是否完全為學(xué)習(xí)者掌握(Meara & Buxton,1987;Read,1993)。
對(duì)產(chǎn)出性詞匯知識(shí)測(cè)量需要控制式誘發(fā)加詞匯頻度測(cè)試手段,如Laufer & Nation (1999)調(diào)查出了不同級(jí)別學(xué)習(xí)者產(chǎn)出詞匯量,而Fitzpatrick & Clenton (2010)通過(guò)誘導(dǎo)產(chǎn)出并結(jié)合詞頻分析計(jì)算產(chǎn)出詞匯量。而在詞匯豐富性上,Jarvis (2002)通過(guò)比較詞匯形符和類(lèi)符比例曲線,發(fā)現(xiàn)課堂輸入與詞匯豐富性正相關(guān),寫(xiě)作質(zhì)量受制于詞匯知識(shí),而詞匯豐富性受母語(yǔ)背景影響;Malvern & Richards (2002)則使用自行設(shè)計(jì)D測(cè)量法結(jié)合vocd軟件來(lái)計(jì)算話語(yǔ)詞匯豐富性中間接發(fā)現(xiàn)受試群體對(duì)研究者所采用的誘發(fā)詞匯法引起的反撥效應(yīng)。在測(cè)量中,詞匯知識(shí)深度有可能受母語(yǔ)影響,Schoonen & Verhallen (2008)發(fā)現(xiàn)母語(yǔ)水平對(duì)兒童二語(yǔ)學(xué)習(xí)者詞匯知識(shí)深度影響顯著;而詞匯知識(shí)廣度可能受學(xué)習(xí)者語(yǔ)法能力影響,Shiotso & Weir(2007)發(fā)現(xiàn)句法知識(shí)在預(yù)測(cè)閱讀能力水平上略高于詞匯廣度知識(shí)預(yù)測(cè)力。此外,Schmitt,Wun Chung Ng & Garras (2010)的研究發(fā)現(xiàn)詞義聯(lián)想范式預(yù)測(cè)能力高低上限時(shí)解釋力良好,預(yù)測(cè)中階能力段時(shí)解釋力欠佳。
除測(cè)試方法外,語(yǔ)言能力也會(huì)影響學(xué)習(xí)者完成詞匯測(cè)試任務(wù)質(zhì)量。Yamada (2009)驗(yàn)證Hoey所構(gòu)建文本主旨辯識(shí)理論中發(fā)現(xiàn)語(yǔ)言能力受語(yǔ)境中主旨識(shí)別影響,F(xiàn)airclough (2011)在檢驗(yàn)Meara & Buxton(1987)的識(shí)別任務(wù)中發(fā)現(xiàn)對(duì)水平低的學(xué)習(xí)者效果顯著,對(duì)水平高的學(xué)習(xí)者解釋力不足。而Crossley, Salsbury,McNamara & Javis (2011)和Crossley,Salsbury & McNamara (2012)提出詞匯能力要包含詞匯量和知識(shí)特征,詞匯能力模型應(yīng)當(dāng)考慮不同語(yǔ)言能力間可比性。
此外,對(duì)大規(guī)模語(yǔ)言能力測(cè)試(如TOEFL)中詞匯測(cè)試項(xiàng)目分析后發(fā)現(xiàn)語(yǔ)法、搭配、詞際聯(lián)想及語(yǔ)義方面知識(shí)都未能完全體現(xiàn)出來(lái)(Schmitt, 1999)。基于此,Qian & Schedl (2004)為新TOEFL開(kāi)發(fā)的詞匯測(cè)試項(xiàng)目與舊詞匯測(cè)試項(xiàng)目相比較對(duì)學(xué)習(xí)者閱讀水平預(yù)測(cè)能力相當(dāng)。OLoughlin (1995)則挑選了澳大利亞英語(yǔ)交際能力評(píng)估考試進(jìn)行分析后發(fā)現(xiàn)互動(dòng)量和非語(yǔ)言因素影響到受試詞匯知識(shí)的豐富性。
四、結(jié)語(yǔ)
影響詞匯測(cè)試效度和信度的核心問(wèn)題是對(duì)詞匯能力的定義。對(duì)能力的范疇化不僅僅是詞匯量、深度和豐富性,而更應(yīng)包含詞匯運(yùn)用,即運(yùn)用已有知識(shí)結(jié)構(gòu)解決新問(wèn)題,在此基礎(chǔ)上形成詞法化能力。對(duì)詞匯能力范疇化同時(shí)會(huì)影響到結(jié)構(gòu)效度對(duì)應(yīng)試者能力評(píng)級(jí)區(qū)分度,結(jié)構(gòu)效度本身也受任務(wù)設(shè)置類(lèi)型的影響。傳統(tǒng)語(yǔ)法判斷題在測(cè)試詞匯廣度上占有優(yōu)勢(shì),但在測(cè)試詞匯深度上囿于單一選項(xiàng)設(shè)置易出現(xiàn)預(yù)測(cè)效度問(wèn)題,即測(cè)試出能力反映不出真實(shí)水平。在信度不受影響前提下,通過(guò)引入R語(yǔ)言進(jìn)行殘差分析以改進(jìn)測(cè)試工具內(nèi)容效度。針對(duì)書(shū)面語(yǔ)和口語(yǔ)的測(cè)試往往存在信度問(wèn)題,其任務(wù)設(shè)置易受到應(yīng)試者背景知識(shí)影響,一旦設(shè)置內(nèi)容與話題知識(shí)相關(guān),易引起反撥效應(yīng)產(chǎn)生測(cè)量誤差。通過(guò)語(yǔ)言建架構(gòu)筑能力評(píng)級(jí)指標(biāo)可以改進(jìn)由測(cè)量誤差引起的信度失衡,在不影響內(nèi)容效度的前提下控制引發(fā)手段使受試者克服由于話題相關(guān)所帶來(lái)的遷移效應(yīng),通過(guò)提高預(yù)測(cè)效度來(lái)提升測(cè)試信度。
參考文獻(xiàn):
[1]Bachman,L.F.& A.S.Palmer Language Testing in Practice [M]. Shanghai: Shanghai Foreign Language Education Press,1996/2003:44-47
[2]Bachman,L.F.Fundamental Considerations in Language Testing [M]. Shanghai: Shanghai Foreign Language Education Press,1997/2004:127-130
[3]Beeckmans,R.et al Examining the Yes/No vocabulary test: some methodological issues in theory and practice[J].Language Testing,2001,18:235-274
[4]Beglar,D.A Rasch-based validation of the Vocabulary Size Test[J].Language Testing,2010,27:101-118
[5]Crossley,S.A.,T.Salsbury & D.S.McNamara Predicting the proficiency level of language learners using lexical indices[J].Language Testing,2012,29:243-263
[6]Crossley,S.A.,T.Salsbury,D.S.McNamara & S. Jarvis Predicting lexical proficiency in language learner texts using computational indices[J],Language Testing,2011,28:561-580
[7]Fairclough,M.Testing the lexical recognition task with Spanish/English bilinguals in the United States[J].Language Testing,2011,28:273-297
[8]Fitzpatrick & Clenton The challenge of validation:Assessing the performance of a test of productive vocabulary[J].Language Testing,2010,27:537-554
[9]Gu,Y.Q.Vocabulary Learning in a Second Language: Person, Task, Context and Strategies[J/OL].TESL-EJ,2003(2):1-25
[10]Huibregtse,I.,W.Admiraal & P.Meara Scores on a yes-no vocabulary test: correction for guessing and response style[J]. Language Testing,2002,19:227-245
[11]Jarvis,S.Short texts, best-fitting curves and new measures of lexical diversity[J]. Language Testing,2002,19:57-84
[12]Laufer,B.& P.Nation A vocabulary-size test of controlled productive ability[J]. Language Testing,1999,16:33-51
[13]Laufer,B.,C.Elder,K.Hill & P. Congdo Size and strength:do we need both to measure vocabulary knowledge?[J].Language Testing,2004,21:202-226
[14]Malvern,D.& B.Richards Investigating accommodation in language proficiency interviews using a new measure of lexical diversity[J]. Language Testing, 2002, 19: 85-104
[15]Meara,P.& B.Buxton An alternative to multiple choice vocabulary tests[J]. Language Testing,1987,4:142-154
[16]Mochida,K.& M. Harrington The Yes/No test as a measure of receptive vocabulary knowledge[J].Language Testing,2006,23:73-98
[17]Nation,I.S.P.Teaching and Learning Vocabulary[M]. Beijing: Foreign Language Teaching and Research Press,1990/2003
[18]Nation,P.Using dictionaries to estimate vocabulary size:essential,but rarely followed, procedures[J].Language Testing,1993,10:27-40
[19]O'Loughlin,K.Lexical density in candidate output on direct and semi-direct versions of an oral proficiency test[J].Language Testing,1995,12:217-237
[20]Pellicer-Sánchez,A.& N.Schmitt Scoring Yes–No vocabulary tests: Reaction time vs. nonword approaches[J].Language Testing,2012,29:489-509
[21]Perkins,K.& S.E.Linnville A construct definition study of a standardized ESL vocabulary test[J].Language Testing,1987,4:125-141
[22]Qian,David,D.& M.Schedl Evaluation of an in-depth vocabulary knowledge measure for assessing reading performance[J]. Language Testing, 2004, 21: 28-52
[23]Read,J.& C.A.Chapelle A framework for second language vocabulary assessment[J]. Language Testing,2001,18:1-32
[24]Read,J.The development of a new measure of L2 vocabulary knowledge[J]. Language Testing,1993,10:355-371
[25]Schmitt,N.The relationship between TOEFL vocabulary items and meaning, association, collocation and word-class knowledge[J].Language Testing,1999,16:189-216
[26]Schmitt,N.,D.Schmitt,& C.Clapham Developing and exploring the behaviour of two new versions of the Vocabulary Levels Test[J]. Language Testing, 2001, 18: 55-88
[27]Schmitt,N.,J.Wun Ching Ng, & J. Garras The Word Associates Format: Validation evidence[J].Language Testing,2011,28:105-126
[28]Schoonen,R.& M. Verhallen The assessment of deep word knowledge in young first and second language learners[J]. Language Testing,2008,25:211-236
[29]Shiotsu,T.& C.J.Weir The relative significance of syntactic knowledge and vocabulary breadth in the prediction of reading comprehension test performance[J]. Language Testing, 2007,24:99-128
[30]Yamada,K.Lexical patterns in L2 textual gist identification assessment[J].Language Testing, 2009,26:101-122
[31]戴曼純,論第二語(yǔ)言詞匯習(xí)得研究[J].外語(yǔ)教學(xué)與研究,2000(2):138-144
[32]劉潤(rùn)清、韓寶成,語(yǔ)言測(cè)試和它的方法(修訂版)[M].北京:外語(yǔ)教學(xué)與研究出版社,1999
作者簡(jiǎn)介:
方昊 (1981-),男,安徽省安慶市人,碩士研究生學(xué)歷,就職于安慶師范大學(xué)外國(guó)語(yǔ)學(xué)院,講師,研究方向?yàn)槎Z(yǔ)習(xí)得,語(yǔ)法和詞匯教學(xué)。