王 麗 張立英
(1.西安外國語大學(xué) 經(jīng)濟(jì)金融學(xué)院,陜西 西安 710128; 2.上海交通大學(xué) 外國語學(xué)院,上海 200240;3.解放軍外國語學(xué)院 英語系,河南 洛陽 471003)
?
學(xué)習(xí)者語料庫分級(jí)方法研究:反思與啟迪
王麗1,2張立英3
(1.西安外國語大學(xué) 經(jīng)濟(jì)金融學(xué)院,陜西 西安 710128; 2.上海交通大學(xué) 外國語學(xué)院,上海 200240;3.解放軍外國語學(xué)院 英語系,河南 洛陽 471003)
本研究調(diào)查了國內(nèi)外學(xué)習(xí)者語料庫語言水平分級(jí)方法,結(jié)果表明,國內(nèi)外重要的學(xué)習(xí)者語料庫主要依靠“學(xué)習(xí)者背景”、“教師判斷”、“測(cè)試成績”以及“語言能力量表等級(jí)”這四種方法來區(qū)分語料庫級(jí)別。本文通過對(duì)比分析不同分級(jí)方法的優(yōu)勢(shì)與不足,進(jìn)一步探索了語言能力量表對(duì)教師自建語料庫的啟示,對(duì)于我國學(xué)習(xí)者語料庫研究和二語教學(xué)都有一定的理論價(jià)值和現(xiàn)實(shí)意義。
學(xué)習(xí)者語料庫;語言水平等級(jí);語言能力量表
學(xué)習(xí)者語料庫是按照一定的原則和設(shè)計(jì)標(biāo)準(zhǔn),收集語言學(xué)習(xí)者各種書面語和口語的自然語料而建立起來的一種電子文本庫。[1]自20世紀(jì)90年代以來,隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,學(xué)習(xí)者語料庫建設(shè)呈現(xiàn)蓬勃發(fā)展的趨勢(shì),出現(xiàn)了諸如ICLC,JPU,PELCRA,CLC等大型語料庫。學(xué)習(xí)者語料庫如實(shí)地記錄了學(xué)習(xí)者語言輸出的實(shí)際情況,在描述學(xué)習(xí)者中介語特征,揭示其發(fā)展規(guī)律等方面提供了客觀、大量的數(shù)據(jù),不僅極大地拓寬二語習(xí)得的研究視野,也為外語教學(xué)理論和實(shí)踐提供重要的反饋和支撐。[2]
作為一種重要的數(shù)據(jù)資源,學(xué)習(xí)者語料庫元數(shù)據(jù)信息的準(zhǔn)確性直接影響相關(guān)研究的信度、效度以及研究結(jié)論的可推廣性。其中,語料庫建設(shè)者對(duì)學(xué)習(xí)者語言水平(language proficiency)的界定尤為關(guān)鍵,這是因?yàn)榇蠖鄶?shù)應(yīng)用語言學(xué)研究都是圍繞學(xué)習(xí)者的語言水平而開展的,或者把它設(shè)為自變量,即研究對(duì)象分組的重要依據(jù),或者設(shè)為因變量,用于衡量教學(xué)或?qū)嶒?yàn)效果。[3]遺憾的是,在學(xué)習(xí)者語料庫被廣泛用于二語習(xí)得研究、語言測(cè)試開發(fā)及教材編撰的大背景下,目前關(guān)于學(xué)習(xí)者語料庫建設(shè)者如何區(qū)分學(xué)習(xí)者語言水平這一問題還尚未引起足夠的關(guān)注。鑒于此,本文將主要探討以下兩個(gè)問題:國內(nèi)外現(xiàn)有學(xué)習(xí)者語料庫采用的分級(jí)方法有哪些?這些分級(jí)方法的優(yōu)勢(shì)與不足對(duì)于我國學(xué)習(xí)者語料庫的開發(fā)和建設(shè)有何啟發(fā)?在此基礎(chǔ)上,筆者探討了基于語言能力量表等級(jí)的語料庫建庫方法。
在學(xué)習(xí)者語料庫研究方面,比利時(shí)Louvain大學(xué)英語語料庫語言學(xué)研究中心(Centre for English Corpus Linguistics)一直走在該領(lǐng)域的前列,該中心收集并在其官網(wǎng)公布了世界各地頗具影響力的139個(gè)學(xué)習(xí)者語料庫的基本信息,其中包括91個(gè)學(xué)習(xí)者書面語語料庫,33個(gè)學(xué)習(xí)者口語語料庫,12個(gè)口筆語語料庫以及3個(gè)視頻語料庫(詳情請(qǐng)見https://www.uclouvain.be/en-cecl-lcworld.html)。本文以Louvain大學(xué)官網(wǎng)列出的學(xué)習(xí)者語料庫為主要研究對(duì)象,結(jié)合文獻(xiàn)回顧、郵件采訪語料庫開發(fā)者的方法,調(diào)查了它們的語料等級(jí)劃分方式。根據(jù)收集到的語料庫信息,筆者將按照語料等級(jí)劃分方式進(jìn)行分類統(tǒng)計(jì),分析描述各分類方法的特征,并在此基礎(chǔ)上討論對(duì)構(gòu)建中國學(xué)習(xí)者語料庫的啟示。
目前學(xué)習(xí)者語料庫的分級(jí)方法可以分為四類:“學(xué)習(xí)者背景”、“教師判斷”、“測(cè)試成績”以及“量表等級(jí)”。根據(jù)其語料分級(jí)信息來源的不同,這四類方法又可以細(xì)分為十種具體的手段(見圖1)。后文將對(duì)這些分級(jí)方法和手段進(jìn)行簡要的介紹。
圖1 學(xué)習(xí)者語料庫分級(jí)方法與手段
(一)基于學(xué)習(xí)者背景(learner background)的分級(jí)方法
本次調(diào)查顯示,絕大多數(shù)學(xué)習(xí)者語料庫都提供有關(guān)語料提供者(即學(xué)習(xí)者)的背景信息,并以此為基礎(chǔ)來劃分語料庫的水平等級(jí)。學(xué)習(xí)者背景信息主要包括學(xué)習(xí)者在目標(biāo)語國家經(jīng)歷(學(xué)習(xí)或工作)和受教育程度。這種方法的優(yōu)勢(shì)在于獲取信息的便利性,但是也存在明顯的局限性。例如,學(xué)習(xí)者在目標(biāo)語國家的學(xué)習(xí)或工作經(jīng)歷并不足以代表其接觸目標(biāo)語的時(shí)間和強(qiáng)度,更遑論學(xué)習(xí)者的語言水平了。同樣,以學(xué)習(xí)者受教育程度為語言水平劃分標(biāo)準(zhǔn)也存在明顯問題,不同的教育機(jī)構(gòu)在區(qū)分學(xué)生水平或者評(píng)估學(xué)生能力的時(shí)候往往采用不同的標(biāo)準(zhǔn)。這一問題在語料庫數(shù)據(jù)涉及不同國籍背景學(xué)習(xí)者時(shí)尤為突出。例如,對(duì)某些學(xué)校而言,必須要達(dá)到具體的水平才能晉升一個(gè)能力等級(jí),而對(duì)另外一些學(xué)校而言,年級(jí)的變動(dòng)完全是自然而然的事情。因此,基于學(xué)習(xí)者個(gè)人外部信息來判斷語料所反映的語言水平很可能是不可靠的。
事實(shí)上,一些學(xué)者已經(jīng)開始關(guān)注此類語料庫分級(jí)方法的局限性。Tono指出,“基于學(xué)習(xí)者年齡或所在年級(jí)等信息無法確保語料提供者處于同等的語言水平”。[4]針對(duì)ICLE 語料庫(International Corpus of Learner English)的實(shí)證研究也發(fā)現(xiàn),日本學(xué)生的語言水平遠(yuǎn)遠(yuǎn)低于具有同樣教育背景(即高校大三、大四的學(xué)生)的歐洲國家英語學(xué)習(xí)者,[1]進(jìn)一步證明不同母語背景的同級(jí)別學(xué)習(xí)者在語言水平方面確實(shí)存在顯著的差異。目前,ICLE建設(shè)者已將該語料庫配套使用手冊(cè)中對(duì)語料庫級(jí)別的描述從高水平學(xué)習(xí)者調(diào)整為中級(jí)到高級(jí)的學(xué)習(xí)者。
(二)基于教師判斷(teacher judgment)的分級(jí)方法
個(gè)別語料庫(如French Interlanguage Database)采用了教師判斷的方法來劃分語料庫等級(jí)。教師判斷的手段包括對(duì)學(xué)生水平和學(xué)生語料(如課堂作業(yè))等級(jí)水平的判斷。前者的主要問題在于信息的不透明。例如,人們無法了解“該生處于中等水平”這樣的論斷代表何種水平,而且教師對(duì)學(xué)生語言水平的判斷往往受到教師與學(xué)生的熟悉程度等因素的影響,很難做到客觀準(zhǔn)確。相比之下,教師判斷學(xué)生文本的方法顯然更加直觀,但是由于不同年級(jí)的授課教師往往在嚴(yán)厲程度、評(píng)分標(biāo)準(zhǔn)制定等方面存在巨大差異,因此很可能將實(shí)際上處于同一等級(jí)的文本劃分到不同等級(jí)之下,或者將不同等級(jí)的文本劃歸為同一等級(jí),這些因素難免會(huì)降低后續(xù)研究的信度和效度。
(三)基于測(cè)試成績(test score)的分級(jí)方法
第三種語料庫分級(jí)方法涉及對(duì)測(cè)試成績的使用。根據(jù)測(cè)試種類和成績報(bào)道項(xiàng)的不同,這種方法又可以被細(xì)分為四種手段。其中,測(cè)試種類包括校本考試和專業(yè)語言測(cè)試機(jī)構(gòu)開發(fā)的標(biāo)準(zhǔn)化考試;成績報(bào)道項(xiàng)可以是總分(通常為考生聽、說、讀、寫成績的平均值),也可以是學(xué)生寫作或口語部分的分項(xiàng)分。從測(cè)試種類的角度來看,與校本考試相比,標(biāo)準(zhǔn)化考試從試題開發(fā)過程的專業(yè)性、成績的可推廣性以及測(cè)試內(nèi)容、評(píng)分標(biāo)準(zhǔn)的透明度等方面都更加規(guī)范。從成績報(bào)道的層面來看,考生的綜合分由于受閱讀、聽力等技能水平的影響,很可能無法正確反映語料庫中書面語語料或口語語料所處的水平等級(jí)。例如,相較于寫作、口語這兩種輸出型技能,英語為外語的學(xué)習(xí)者往往在閱讀、聽力這兩種輸入型技能上得到更多的訓(xùn)練,因此,寫作水平只處于初級(jí)階段的學(xué)習(xí)者很可能會(huì)被歸為中級(jí)甚至高級(jí)學(xué)習(xí)者。由此看來,使用標(biāo)準(zhǔn)化考試并報(bào)道考生語料來源項(xiàng)的單項(xiàng)成績是該類方法中最為可靠的分級(jí)手段。
(四)基于語言能力量表等級(jí)(proficiency scale levels)的分級(jí)方法
語言能力量表,又稱語言能力標(biāo)準(zhǔn),是對(duì)外語學(xué)習(xí)者和使用者的外語能力從低到高的一系列描述。[5](P26-30)語言能力量表貫穿于外語教學(xué)諸環(huán)節(jié)之中,是外語教學(xué)目標(biāo)或評(píng)價(jià)目標(biāo)的參照或依據(jù)。通過與語言能力量表建立等級(jí)對(duì)應(yīng)關(guān)系,不同測(cè)試之間可以實(shí)現(xiàn)相互對(duì)接,這樣既方便了考試用戶對(duì)測(cè)試結(jié)果的理解和使用,又有利于資格證書之間的相互認(rèn)證。語言能力量表研究已經(jīng)有60多年的歷史,主要集中在北美、澳大利亞、歐洲等國家和地區(qū),開發(fā)了諸如ILR (Interagency Language Roundtable)、CLB (Canadian Language Benchmarks)、ISLPR (International Second Language Proficiency Ratings)、ALTE (Association of Language Testers in Europe和CEFR(Common European Framework of Reference for Languages)等知名量表。其中,CEFR尤其在歐洲各國乃至世界范圍內(nèi)的語言教育和測(cè)試領(lǐng)域發(fā)揮著巨大的影響作用。該量表將語言學(xué)習(xí)者的外語應(yīng)用能力分成六個(gè)等級(jí)(入門級(jí)、初級(jí)、中級(jí)、中高級(jí)、高級(jí)、精通級(jí)),以“能做什么”(Can do)的能力水平描述,從所具有的語言交際能力、所掌握的語言知識(shí)和技能、所面對(duì)的語言交際場(chǎng)景和領(lǐng)域等方面,詳細(xì)地描述了處于各個(gè)等級(jí)學(xué)習(xí)者的一系列典型語言行為表現(xiàn)。[6](P1-4)近年來,越來越多的考試機(jī)構(gòu)(如劍橋大學(xué)考試中心、美國教育考試服務(wù)中心等),包括雅思、托福等國際知名的大規(guī)模、高風(fēng)險(xiǎn)考試,紛紛開始尋求與CEFR建立對(duì)應(yīng)關(guān)系,以期擴(kuò)大它們的國際認(rèn)可度。[7]
借鑒量表等級(jí)標(biāo)準(zhǔn)是近年來新興的學(xué)習(xí)者語料庫分級(jí)方法,也是語言測(cè)試與語料庫研究領(lǐng)域緊密結(jié)合的產(chǎn)物。根據(jù)語料與量表等級(jí)描述語的對(duì)接方式,可以分為量表等級(jí)直接對(duì)接法和間接對(duì)接法。采用量表等級(jí)直接對(duì)接法時(shí),語料庫建設(shè)者需要邀請(qǐng)多位熟悉該量表等級(jí)描述語的專家,并在保證信度(如提供培訓(xùn))的前提下,請(qǐng)專家評(píng)估語料庫中的語料等級(jí)。Carlsen以ASK語料庫和CEFR量表為例,詳細(xì)地描述了這一方法的步驟和過程。[8]采用間接對(duì)接法的語料庫的語料全部取自與量表對(duì)接的標(biāo)準(zhǔn)化測(cè)試,由于這些測(cè)試的分?jǐn)?shù)段已經(jīng)與量表中的各個(gè)級(jí)別建立了等級(jí)對(duì)應(yīng)關(guān)系,因此可以間接地反映語料所處的量表等級(jí)。CLC語料庫(the Cambridge Learner Corpus)中的語料全部來自劍橋大學(xué)考試中心開發(fā)的測(cè)試項(xiàng)目,是使用量表等級(jí)間接對(duì)接法的典型代表。
(一)現(xiàn)有語料庫分級(jí)方法的優(yōu)勢(shì)與不足
Atkin et al.指出,語料庫文本的采樣可以分為內(nèi)部標(biāo)準(zhǔn)(internal criteria)和外部標(biāo)準(zhǔn)(external criteria)兩大類。[9]內(nèi)部標(biāo)準(zhǔn)是根據(jù)文本內(nèi)部的語言特征(如詞匯、句法)、風(fēng)格等因素界定的標(biāo)準(zhǔn);外部標(biāo)準(zhǔn)則主要涉及非語言因素,包括學(xué)習(xí)者特征等。如上文所述,采用“學(xué)習(xí)者背景”等外部標(biāo)準(zhǔn)的語料庫分級(jí)方法雖然方便易行,但是脫離了文本本身,因此無法確保其真實(shí)地反映語料本身所體現(xiàn)的學(xué)習(xí)者水平。相比之下,以文本或內(nèi)部標(biāo)準(zhǔn)為導(dǎo)向的分級(jí)方法(如測(cè)試單項(xiàng)分)直接作用于語料,能夠提供更加準(zhǔn)確有效的信息。在此類分級(jí)方法中,以教師判斷和校本測(cè)試成績?yōu)榛A(chǔ)的手段普遍存在評(píng)分標(biāo)準(zhǔn)不一致的問題。基于標(biāo)準(zhǔn)化測(cè)試單項(xiàng)成績(寫作或口語)以及語言能力量表等級(jí)的語料庫無論從工具本身的效度還是分級(jí)標(biāo)準(zhǔn)等方面都更加專業(yè)、規(guī)范。以CEFR為例,基于量表等級(jí)的分級(jí)方法尤其具有以下三個(gè)核心優(yōu)勢(shì)。
第一,相較于將學(xué)習(xí)者語言水平區(qū)分為初級(jí)、中級(jí)、高級(jí)這三個(gè)等級(jí)的常規(guī)做法,CEFR將語言水平劃分為六級(jí),為開展更細(xì)致、更深入的研究提供了平臺(tái)。第二,CEFR是一個(gè)跨語言量表(language neutral),可以作為統(tǒng)一的能力標(biāo)尺用于不同語言學(xué)習(xí)者語料庫,為開展跨語言中介語研究等創(chuàng)造了有利條件。第三,CEFR直接對(duì)接法的操作時(shí)間不受時(shí)間和空間的限制,即便是已經(jīng)開發(fā)完成的語料庫,語料庫建設(shè)者或研究人員仍然可以采用這種方法獲取語料庫等級(jí)信息;而間接對(duì)接法更加方便快捷,并提供諸如語體類型、話題范圍、學(xué)習(xí)者的個(gè)體特征等重要信息。
需要指出的是,雖然以CEFR為評(píng)級(jí)標(biāo)準(zhǔn)的學(xué)習(xí)者語料庫具有許多優(yōu)勢(shì),但是語料庫建設(shè)者在采用CEFR標(biāo)準(zhǔn)時(shí)應(yīng)特別注意以下三點(diǎn)。首先,直接對(duì)接法非常耗時(shí)、費(fèi)力,且語料庫數(shù)據(jù)越大,其可操作性就越差。其次,目前一些語言測(cè)試雖然聲稱與CEFR對(duì)接成功,但卻并未提供任何相關(guān)的研究信息,因此無法判斷其是否遵循了科學(xué)的對(duì)接原則。因此,語料庫建設(shè)者在采用間接對(duì)接法時(shí),需要仔細(xì)評(píng)估語料來源測(cè)試的專業(yè)性。[10]最后,CEFR是通用外語領(lǐng)域的產(chǎn)物,并不能準(zhǔn)確地描述專門用途外語的等級(jí)特點(diǎn),因此不建議將其用于專門用途學(xué)習(xí)者語料庫。
(二)對(duì)我國語料庫建設(shè)的啟示
1、我國主要學(xué)習(xí)者語料庫分級(jí)方式
我國是一個(gè)外語學(xué)習(xí)大國,外語教學(xué)有其自身的特點(diǎn),要了解和研究我國外語教學(xué)就需要建立自己的語料庫,為外語教學(xué)和研究提供第一手真實(shí)、全面的語料。我國語料庫研究從20世紀(jì)70年代末80年代初興起,在吸收國外建庫經(jīng)驗(yàn)的基礎(chǔ)上結(jié)合我國國情及外語教學(xué)實(shí)際對(duì)學(xué)習(xí)者語料庫建設(shè)展開了卓有成效的探索,建成了一些較大型的外語學(xué)習(xí)者語料庫,其中大多屬于英語學(xué)習(xí)者語料庫。[11]表1列出了目前我國主要的英語學(xué)習(xí)者語料庫及其基本信息。
如表1所示,我國先后建成的學(xué)習(xí)者語料庫主要依賴高風(fēng)險(xiǎn)標(biāo)準(zhǔn)化測(cè)試成績來區(qū)分語料庫等級(jí)。如CLEC的語料主要采集于全國大學(xué)英語四級(jí)考試的作文部分,[12] (P1-3)SWECCL中的部分語料采集于全國大學(xué)專業(yè)四級(jí)英語口語考試錄音。[13]這種做法有兩個(gè)好處:首先,相關(guān)測(cè)試的題型內(nèi)容、評(píng)分標(biāo)準(zhǔn)等能夠保持一致性和透明性,并配有專業(yè)人士監(jiān)控測(cè)試的信度和效度,從而盡量保證測(cè)試成績與學(xué)習(xí)者實(shí)際語言能力之間的正相關(guān)關(guān)系。另外,考試機(jī)構(gòu)可以很方便地獲取考試數(shù)據(jù)、考生背景以及考生成績等信息,同時(shí)還可以依據(jù)分?jǐn)?shù)信息采集處于不同成績段的英語學(xué)習(xí)者語料擴(kuò)大語料代表性。然而,需要指出的是,雖然測(cè)試文本對(duì)于描述學(xué)習(xí)者的語言習(xí)得特征具有一定參考價(jià)值,但是由于受考試語境限制,這些語料不能完全代表學(xué)習(xí)者的自然習(xí)得狀態(tài)。我國外語學(xué)習(xí)者語料庫需要第一手資料來保證語料的真實(shí)自然,從而更準(zhǔn)確描述學(xué)習(xí)者的語言特征。這就需要一線外語教師參與到語料庫的建設(shè)工作中來,而語言能力量表為科學(xué)開發(fā)與合并教師自建學(xué)習(xí)者語料庫搭建了一個(gè)平臺(tái)。
2、語言能力量表與教師小型語料庫建設(shè)
從語料庫分級(jí)方式來看,教師判斷和量表等級(jí)是目前尚未引起我國學(xué)習(xí)者語料庫建設(shè)者的關(guān)注。這兩種方法的缺失反映了我國教師自建語料庫發(fā)展較為緩慢且影響力低以及語言能力量表的重要性尚未引起廣泛關(guān)注的現(xiàn)實(shí)。近年來,越來越多的學(xué)者開始呼吁一線外語教師參與到語料庫建設(shè)中來,[14] [15]但是探討的內(nèi)容還集中在單個(gè)小型語料庫的建設(shè),關(guān)于如何整合這些語料資源這一話題還鮮有學(xué)者關(guān)注?;诖?,筆者提出一個(gè)新的設(shè)想:結(jié)合教師判斷與語言能力量表的分級(jí)方法,采用自下而上的方式建設(shè)學(xué)習(xí)者語料庫。其基本理念是鼓勵(lì)一線外語教師建立個(gè)人小型學(xué)習(xí)者語料庫,將學(xué)生語料按照語言能力量表所提供的語言能力標(biāo)準(zhǔn)進(jìn)行等級(jí)劃分,同時(shí)使用統(tǒng)一的語料標(biāo)注和賦碼系統(tǒng)。這樣既可以解決教師判斷語料庫等級(jí)主觀性過強(qiáng),評(píng)判標(biāo)準(zhǔn)千差萬別等問題,還可為將來各庫的有效合并創(chuàng)造必要條件。我國有人數(shù)最多的外語學(xué)習(xí)者(絕大多數(shù)為英語),也擁有大量的外語教師。充分發(fā)揮廣大基層外語教師的力量,將極大地提升我國學(xué)習(xí)者語料庫的庫容以及語料本身的真實(shí)性、代表性和多樣性,更加充分地反映出學(xué)習(xí)者二語發(fā)展的特征和全貌。合并后的大型語料庫不但能夠進(jìn)一步推動(dòng)我國學(xué)習(xí)者語料庫和語言教學(xué)研究,還將為自主開發(fā)適合我國外語學(xué)習(xí)實(shí)際情況的語言能力量表提供直接的數(shù)據(jù)支持,這無疑對(duì)我國外語教學(xué)一條龍建設(shè)具有重要的戰(zhàn)略意義。
3、基于語言能力量表等級(jí)的小型語料庫建設(shè)方法初探——以CEFR為例
如上文所述,目前世界范圍內(nèi)已經(jīng)開發(fā)出多個(gè)語言能力量表,盡管他們的研制背景各不相同,但是都具有相似的結(jié)構(gòu),[16]如都以一定的語言學(xué)理論為基礎(chǔ)構(gòu)建描述框架,以短句的形式對(duì)語言能力進(jìn)行定性描述等。以CEFR為例,該量表由56個(gè)分量表構(gòu)成,包含聽、說、讀、寫、譯五個(gè)基本技能,并從詞匯、語法、拼寫等不同方面對(duì)學(xué)習(xí)者語言使用能力以“能做”描述語的形式進(jìn)行了詳細(xì)的描述。在以CEFR能力等級(jí)描述為基礎(chǔ)建設(shè)教師自建小型語料庫時(shí),可以采取以下幾個(gè)步驟:標(biāo)準(zhǔn)設(shè)定—標(biāo)準(zhǔn)培訓(xùn)—標(biāo)準(zhǔn)實(shí)施。
首先,由于語言能力量表往往包含不同的語言技能和描述維度,應(yīng)組織專家學(xué)者選擇最相關(guān)的能力分量表作為語言能力等級(jí)的評(píng)價(jià)標(biāo)準(zhǔn)。所選擇的分量表必須與語料庫語料類型和基本內(nèi)容直接相關(guān)。例如,在建設(shè)書面語料庫時(shí)可以參考CEFR中的下述幾個(gè)分量表(頁碼以CEFR英文版為準(zhǔn)[6]):
——總體筆頭表達(dá)能力量表(第61頁)
——報(bào)告和短文撰寫能力量表(第62頁)
——?jiǎng)?chuàng)作寫作能力量表(第62頁)
——詞匯能力量表(第112頁)
——詞匯掌握程度量表(第112頁)
——語法能力量表(第114頁)
——拼寫能力量表(第118頁)
——連貫和銜接能力量表(第125頁)
表2列出了“語法能力”分量表的具體內(nèi)容,供讀者參考。需要指出的是,由于CEFR是針對(duì)歐洲的外語學(xué)習(xí)者開發(fā)的,且在語言質(zhì)量描述方面?zhèn)戎乜谡Z技能,[17](P108-120)因此在選定分量表以后,還需確定諸如采用英文描述語還是中文描述語、是否需要適當(dāng)修改描述語措辭、是否需要細(xì)分或調(diào)整等級(jí)排序等問題,力求使最終選擇地等級(jí)標(biāo)準(zhǔn)適用于中國英語教學(xué)和測(cè)試環(huán)境,并且容易被廣大基層教師理解和掌握。
表2 語法能力分量表
其次,在確定最終的等級(jí)描述語之后,需要對(duì)廣大一線教師進(jìn)行相關(guān)培訓(xùn)。培訓(xùn)內(nèi)容應(yīng)包括語料庫建設(shè)方法和CEFR等級(jí)描述這兩部分。培訓(xùn)應(yīng)在語言教學(xué)單位和語言教育管理或權(quán)威部門的統(tǒng)一指導(dǎo)和部署下進(jìn)行,需要語料庫、語言測(cè)試、二語習(xí)得等領(lǐng)域?qū)<覍W(xué)者的通力合作,是一項(xiàng)綜合性很強(qiáng)的工作。在這個(gè)過程中,可以充分利用網(wǎng)絡(luò)資源,采用在線培訓(xùn)等方式,從而節(jié)省高昂的人力資本。同時(shí)應(yīng)適當(dāng)加入評(píng)估方法,如邀請(qǐng)教師以CEFR標(biāo)準(zhǔn)評(píng)判一些范文的等級(jí)水平,來確定培訓(xùn)是否成功。為保證等級(jí)評(píng)價(jià)的效度和信度,可以采用同一篇語料由兩名教師評(píng)判,有異議的語料交由第三方確認(rèn)。教師評(píng)判語料的同時(shí),也是對(duì)語料進(jìn)行標(biāo)注的過程,語料標(biāo)注可以分為兩部分,一部分涉及CEFR相關(guān)的變量,包括量表等級(jí)標(biāo)注,一部分是語言特征變量標(biāo)注,包括詞頻信息、超出CEFR相應(yīng)等級(jí)詞匯所占百分比、平均句長、詞匯密度、難易度指標(biāo)、詞性賦碼、拼寫錯(cuò)誤、語法錯(cuò)誤等。
按照CEFR等級(jí)描述確定相關(guān)語料的等級(jí)是自上而下的方法,可以輔之以自下而上的方法,即將教師評(píng)定等級(jí)的語料收集起來,用語料庫技術(shù)分析語料的語言特征,然后檢驗(yàn)這些特征是否匹配CEFR描述語。自下而上的方法既可驗(yàn)證所評(píng)定的語料等級(jí),又可提取相應(yīng)等級(jí)的語言特征。這兩種方法相輔相成,自上而下的方法依賴因教師對(duì)CEFR描述語的解讀和語料評(píng)判,帶有一定主觀性,自下而上方法,注重大量數(shù)據(jù)的收集,可以通過統(tǒng)計(jì)手段克服教師評(píng)判帶有的主觀性,使之具有一定的客觀性和概括性。
最后,在標(biāo)準(zhǔn)實(shí)施階段,需要設(shè)立實(shí)時(shí)的幫助和反饋機(jī)制來處理教師在實(shí)際操作中所遇到的困難和問題。尤其需要關(guān)注的是無法納入CEFR等級(jí)的語料,這些語料極有可能反映我國學(xué)生獨(dú)特的中介語特征,是語言研究的寶貴資料,也是在我國自主開發(fā)外語語言能力等級(jí)量表的重要參考依據(jù)。
學(xué)習(xí)者語料庫已經(jīng)成為當(dāng)代語言學(xué)理論研究和應(yīng)用研究不可或缺的基礎(chǔ)資源,在最近二三十年間的發(fā)展尤為迅猛,世界各國紛紛建立起各種各樣的學(xué)習(xí)者語料庫,通過借鑒國外經(jīng)驗(yàn)以及結(jié)合我國國情,國內(nèi)學(xué)者也在學(xué)習(xí)者語料庫建設(shè)方面開展了廣泛的研究,并取得了豐碩成果。然而,在學(xué)習(xí)者語料庫被廣泛用于二語習(xí)得研究、語言測(cè)試開發(fā)及教材編撰的大背景下,目前關(guān)于學(xué)習(xí)者語料庫建設(shè)者如何區(qū)分學(xué)習(xí)者語言水平這一問題還尚未引起足夠的關(guān)注,這無疑將在很大程度上影響相關(guān)研究結(jié)論的信度、效度及可推廣性。鑒于此,本文調(diào)查了國內(nèi)外重要學(xué)習(xí)者語料庫語言水平分級(jí)方法,結(jié)果表明,國內(nèi)外重要的學(xué)習(xí)者語料庫主要依靠“學(xué)習(xí)者背景”、“教師判斷”、“測(cè)試成績”以及“語言能力量表等級(jí)”這四種方法來區(qū)分語料庫級(jí)別。其中,采用“學(xué)習(xí)者背景”等外部標(biāo)準(zhǔn)的分級(jí)方法雖然方便易行,但是卻脫離了文本本身,無法有效反映語料水平。相比之下,語言能力量表作為一種新興的語言水平分級(jí)方法,具有很強(qiáng)的專業(yè)性和規(guī)范性,能夠?yàn)檎Z料本身提供細(xì)化、科學(xué)的分級(jí),因此值得進(jìn)一步推廣普及。
基于此,本文探討了結(jié)合教師判斷與語言能力量表的分級(jí)方法,采用自下而上的方式建設(shè)學(xué)習(xí)者語料庫的可行性。其基本理念是鼓勵(lì)一線外語教師以語言能力量表為基礎(chǔ)建立個(gè)人小型學(xué)習(xí)者語料庫的可行性。這樣既可以解決教師判斷主觀性過強(qiáng),評(píng)判標(biāo)準(zhǔn)千差萬別等問題,還可為將來各庫的有效合并創(chuàng)造必要條件。與此同時(shí),充分發(fā)揮廣大基層外語教師的力量將極大地提升我國學(xué)習(xí)者語料庫的庫容以及語料本身的真實(shí)性、代表性和多樣性,從而為更全面地描述學(xué)習(xí)者的二語發(fā)展特征和全貌提供可能。合并后的大型語料庫不但能夠進(jìn)一步推動(dòng)語料庫研究和語言教學(xué)的發(fā)展,還將為自主開發(fā)適合我國外語學(xué)習(xí)實(shí)際情況的語言能力量表提供直接的數(shù)據(jù)支持,這對(duì)我國外語教學(xué)研究一條龍建設(shè)也具有重要的戰(zhàn)略意義。本文以CEFR為例,嘗試性地探討了在以語言能力量表等級(jí)描述為基礎(chǔ)建設(shè)教師自建小型語料庫的方法和步驟。需要指出的是,從標(biāo)準(zhǔn)設(shè)定到標(biāo)準(zhǔn)的培訓(xùn)與實(shí)施,需要眾多語言教學(xué)單位、測(cè)試機(jī)構(gòu)和語言教育管理部門的通力合作。因此,如何保證教師語料庫建設(shè)既符合科學(xué)的原則,又滿足實(shí)用的需求,這是綜合性很強(qiáng)且十分艱巨的工作,任重而道遠(yuǎn)。
[1] Granger, S. Learner corpora in foreign language education[A]. In N. V. Deusen-Scholl & N. H. Hornberger (eds.). Encyclopedia of language and education second and foreign language education, 2ndEdition, Volume 4: Second and foreign language education. New York: Springer, 337-351, 2008.
[2] 孔文,鄒申.語料庫在語言測(cè)試中的應(yīng)用[J].外語電化教學(xué),2007,(3):47-51.
[3] 武和平,韓百敬.應(yīng)用語言學(xué)與二語習(xí)得研究中“語言水平”的測(cè)量與界定—一項(xiàng)基于文獻(xiàn)計(jì)量學(xué)的研究[J].山東外語教學(xué),2010,(2):20-25.
[4] Tono, Y. Learner corpora: design, development and applications[A]. In P. Rayson, A. Wilson, T. McEnery, A. Hardie, & S. Khoja (ed.). Proceedings of the corpus linguistics 2001 conference, UCREL technical paper Number 13. Lancaster: Lancaster University, 800-809, 2003.
[5] Bachman, L. F. Fundamental considerations in language testing[M]. Oxford: Oxford University Press, 1990.
[6] Council of Europe. Common European framework of reference for language learning, teaching and assessment[M]. Cambridge: Cambridge University Press, 2001.
[7] Papageorgiou, S. Investigating the decision-making process of standard setting participants[J]. Language Testing, 2010, 27: 261-282.
[8] Carlsen, C. Proficiency level-a fuzzy variable in computer learner corpora[J]. Applied Linguistics, 2012, 33: 161-183.
[9] Atkin, S., J. Clear & N. Ostler. Corpus design criteria[J]. Literacy and linguistic computing, 1992, 7: 1-16.
[10] Figueras, N., B. North, S. Takala, N.Verhelst & P. V.Avermaet. Relating examinations to the Common European Framework: A manual[J]. Language Testing, 2005, 22: 261-279.
[11] 王立非,孫曉坤.國內(nèi)外英語學(xué)習(xí)者語料庫的發(fā)展:現(xiàn)狀與方法[J].外語電化教學(xué),2005,(10):19-24.
[12] 桂詩春,楊惠中.中國學(xué)習(xí)者英語語料庫[M].上海:上海外語教育出版社,2003.
[13] 王立非,文秋芳.“中國學(xué)生英語口筆語語料庫”的建設(shè)與研究評(píng)述[J].外語界,2007,(1),2005:22-28.
[14] 謝家成.個(gè)人英語教學(xué)語料庫的運(yùn)用[J].外語電化教學(xué),2004,(4):34-36.
[15] 梁茂成.利用WordPilot在外語教學(xué)中自建小型語料庫[J].外語電化教學(xué),2003:42-45.
[16] 韓寶成,常海潮.中外外語能力標(biāo)準(zhǔn)對(duì)比研究[J].中國外語,2011,(4):39-54.
[17] North, B. The development of a common framework scale of language proficiency[M]. New York: Peter Lang, 2000.
責(zé)任編輯:周延云
Proficiency Assessment Approaches in L2 Learner Corpora: A Critical Evaluation
Wang Li1,2Zhang Liying3
(1. School of Finance and Economics, Xi'an International Studies University, Xi'an 710128, China; 2. College of Foreign Languages, Shanghai Jiao Tong University, Shanghai 200240, China; 3. English Department, PLA University of Foreign Languages, Luoyang 471003, China)
This paper presents a survey of the approaches adopted by current L2 learner corpora developers to determine language proficiency levels. Four major conventions for the assignment of proficiency levels emerged from the analysis, which were learner background, teacher judgment, test score and language proficiency scale. A critical evaluation of the strengths and weaknesses associated with each approach is presented. The paper goes on to consider the feasibility of using language proficiency scale as a common reference tool for proficiency level assignment in the compilation of school-based L2 learner corpora, which has broader theoretical and practical implications for corpus design as well as language teaching.
L2 learner corpora; language proficiency levels; language proficiency scale
2015-10-07
2015年教育部人文社會(huì)科學(xué)研究青年基金項(xiàng)目“中國大學(xué)生商務(wù)英語寫作能力等級(jí)量表評(píng)價(jià)體系構(gòu)建研究”(15YJC740084)
王麗(1980-),女,重慶人,西安外國語大學(xué)經(jīng)濟(jì)金融學(xué)院講師,上海交通大學(xué)外國語學(xué)院博士研究生,主要從事專門用途英語和語言測(cè)試研究。
H315
A
1672-335X(2016)02-0107-07