楊旸 趙守輝
提 要 本文從語言規(guī)劃視角出發(fā),討論語言能力評估的社會應(yīng)用,目的在于揭示隱藏在語言技術(shù)功能背后的象征性本質(zhì),從而為讀者提供理解語言能力的另一個視角。文章簡要綜述了語言能力測試的歷史進程,展示了海外學術(shù)界對語言能力評估在研究理念上發(fā)生的兩次重大轉(zhuǎn)變,即由關(guān)注被試者對語言本體結(jié)構(gòu)知識的掌握到對在特定場景中實際交際能力的強調(diào);由聚焦測試效度描述語言能力的客觀準確性到對應(yīng)用測試結(jié)果及所產(chǎn)生的社會影響的關(guān)心?;趯M庹Z言測試領(lǐng)域有關(guān)語言能力測試結(jié)果社會應(yīng)用研究文獻的調(diào)查,本文整理討論了施測者或政府利用語言能力評估實現(xiàn)各自教育或政治目的四個主要的社會維度。文章結(jié)合中國實際情況,探討了該領(lǐng)域發(fā)展的國際趨勢對中國相關(guān)領(lǐng)域研究的啟示。
關(guān)鍵詞 語言評估;社會結(jié)果;心理測量;效度;反撥
Abstract Language is embedded in society. As a symbolic capital, language also serves as the main component of the human resource. The use of language assessments thus has significant consequences for individuals material life and personal fates. Accordingly, language assessments will inevitably become a means for resources management and social control exploited by governments. Through examining the use of language assessments from the perspective of language planning and policy study, this paper attempts to unpack the symbolic nature of language under its technical attributes, thus providing Chinese audience with a new perspective of understanding language proficiency. In this paper, based on a succinct review of the international literature on the developing trajectory of language testing and evaluation, we first show the two milestone changes occurred in the theories of the language testing study, i.e. a shift of focus from measuring linguistic knowledge and language forms of test takers to their pragmatic skills in the actual communication settings, and a shift of concern from the objectivity and accuracy of validity of the test battery to the impact of social application of the test results. Drawing upon the vast investigation of the international literature about social applications of language testing, the paper then identifies and discusses the four main social dimensions of how language assessments being utilized by testing authorities or governments to achieve their educational or political ends. In the closing part, we further unravel the very nature underlying the social dimensions of language assessments, and explore the implications of the international trends in this field for Chinese researchers and practitioners.
Key words language assessments; social consequences; psychometrics; validity; washback
一、引言:語言能力及
語言評估發(fā)展進程
Chomsky(1965)將“語言能力”(linguistic competence)定義為本族語者內(nèi)化的語言知識體系,包括語音、詞法、句法和語義等規(guī)則。具體說來,是指能辨識和造出合乎語法的句子的能力。1972年Hymes提出了與Chomsky相對立的“交際能力”(communicative competence)。Hymes認為交際能力應(yīng)包括語用知識和能力,即在語言運用過程中,交際雙方不僅需要知道交際話語的結(jié)構(gòu)正確與否,還需要知道交際話語在特定語境中的可行性、得體性和目的性。為區(qū)分Chomsky提出的“語言能力”和“恰當使用語言的能力”,Hymes(1972)把前者稱為“語言能力”(linguistic competence),后者稱為“交際能力”(communicative competence)。戴曼純(2002)進一步將通常意義上的語言能力概括為:抽象的陳述性知識體系、運用語用知識的技能(自動化的程序性知識體系)和語言的實際運用(即我們聽、讀、說、寫的語句、語篇)。語言能力的內(nèi)涵已從傳統(tǒng)意義上的語言技能,轉(zhuǎn)變?yōu)槿谌攵喾N因素的綜合能力。
與此相適應(yīng),作為檢驗語言能力的語言測試也沿著對語言能力這種認識的過程發(fā)生了第一次質(zhì)的轉(zhuǎn)變。
語言測試作為一種具有理論基礎(chǔ)的評估制度實踐始于20世紀后半葉。當時,語言測試是結(jié)合心理計量學與應(yīng)用語言學的跨學科研究,而心理計量學是語言測試的基礎(chǔ),為其提供測量規(guī)范及方法。與心理計量學結(jié)合后,語言測試在很長時間內(nèi)都沿襲傳統(tǒng)心理計量學方法來測試語言本體知識,致力于研究如何采用并開發(fā)新的測量手段以提高測試的信度和效度,而較少系統(tǒng)地研究更廣泛的問題。
隨著語言能力內(nèi)涵的豐富,二語教學中交際能力范式的興起,語言教育學家認識到,對語言能力的評估應(yīng)該是語言技能的綜合測評。而要全面測量語言能力,就必須測量它在一定的社會情景下的雙向互動。測試的重點應(yīng)放在實際“交際水平”和“交際能力”上,而不是單方面的語音、詞匯、語法知識等的運用上。
為此,Carroll(1961)設(shè)計了考試規(guī)范二維框架。其中一個維度表示技能,另一個維度表示語言知識。兩個維度的交叉部分形成網(wǎng)格,每一個柵格代表一種技能以及與之對應(yīng)的語言知識。Carroll分別放入了四種語言技能項目(辨音能力、口語能力、閱讀能力及寫作能力)和四種語言要素項目(音位或拼寫法、詞法、句法及詞匯)。
20世紀80年代,Canale & Swain(1980)區(qū)分了“語法能力”和“社會語言學能力”。而后,Canale(1983)又進一步區(qū)分了“社會語言學能力”和“話語能力”。90年代初,在語言學與應(yīng)用語言學研究深入發(fā)展的影響下,Bachman(1990)提出了新的語言交際能力模型(Communicative Language Ability,簡稱CLA)。 該模型被認為是語言測試領(lǐng)域?qū)φZ言能力研究的里程碑,使語言交際能力把語言知識和語言使用的場景特征結(jié)合起來。
語言測試不僅需要測試者具備一定的語言知識,還須具備語言以外的社會文化規(guī)則等方面的知識和能力,體現(xiàn)使用者創(chuàng)造并解釋意義的能力。在以后的研究中,Bachman & Palmer(1996)發(fā)展并細化了Bachman(1990)的CLA模型,并把它和語言測驗的實踐緊密聯(lián)系起來,最終使得基于Bachman的交際語言能力模式產(chǎn)生的交際語言測試在外語教學界備受推崇,成為占絕對主導地位的語言測試模式。
然而,一個心理計量學意義上好的測試不一定是一個社會意義上好的測試,因為任何測試都有深遠的、無法預料的社會結(jié)果(McNamara & Roever 2006)。這個亟待研究的議題曾長期湮沒在心理計量學的個人認知差異理論之下。
語言測試的社會維度是語言能力評估研究者所關(guān)注的重要方面。它涉及語言測試在社會中扮演的角色及影響。將考試效度的概念擴展到包括考試使用、社會后果等在內(nèi)的先驅(qū)是Messick。他認為效度并不是對考試本身的評價,而是對測試結(jié)果的解釋和使用的評價,效度研究是收集不同方面的證據(jù)來考察使用者對測試結(jié)果的解釋,以確保使用的合理性(Messick 1989:13)。
Messick對測試效度理論的貢獻之一是明確了效度的對象。更為重要的是他把其涵蓋范圍由分數(shù)意義擴展到相關(guān)性,使用、價值意義及社會后果(Shepard 1993,轉(zhuǎn)引自王立群 2009a)。 Messick(1989)稱他的這一主張為統(tǒng)一效度理論,其核心是構(gòu)念效度(construct validity),涉及社會維度的兩個方面:測試分數(shù)賦有社會、文化特性;測試使用具有社會后果及道德價值。
綜上所述,自20世紀90年代,語言測試和評價的形式在認識論和哲學觀上發(fā)生了變革。語言評估最初的主要作用是用于對教育體系的管理,更具體地說,以往人們對測試在教育領(lǐng)域內(nèi)的反撥作用關(guān)注較多,而不大注意其他方面。從只關(guān)注結(jié)構(gòu)本體,到加入交際維度,又跨越到關(guān)注其社會結(jié)果與道德價值,人們認識到語言在交際中的使用受情景因素影響,語言能力不但包括語音、詞匯、語法知識,還應(yīng)包括社會語用能力,語言能力具有社會維度。這可看作測試學研究在世紀之交發(fā)生的第二次轉(zhuǎn)向。
中國學者也較早地意識到了本文論述的語言能力評估研究所經(jīng)歷的前兩次重要轉(zhuǎn)變并進行了及時的介紹。如王立群(2009a)從教育社會學的理論發(fā)展過程中論證語言測試社會維度的基本理論構(gòu)建。張艷(2014)認為,語言測試的社會維度起源于效度理論和反撥效應(yīng)的拓展,強調(diào)測試的社會后果及分數(shù)所賦予的社會價值,其核心問題包括責任、公平及道德準則的建立和發(fā)展。楊秀芬(2015)研究了效度在語言測試領(lǐng)域的發(fā)展軌跡,認為效度是衡量測試質(zhì)量的重要指標之一,其發(fā)展經(jīng)歷了從單一效度觀到分類效度觀再到整體效度觀的蛻變。同樣及時捕捉到海外學術(shù)焦點,并做出深刻分析的還有何蓮珍、呂洲洋(2013),他們從批判語言測試的角度研究了語言測試。
從本文綜述到的學者所發(fā)表的期刊來源看,語言能力測試的社會效度仍遠未引起中國主流測試研究領(lǐng)域的重視。少數(shù)學者的相關(guān)研究是在國際主流語言測試中得到充分踐行以后,直到近年才引起一定關(guān)注,而且主要是從英語能力評估的角度加以引進和應(yīng)用。如王立群(2009b,2011)分析了美國托??荚嚨纳鐣S度,提出了改善中國英語語言測試社會維度的策略。黃倩(2013)研究了大學英語四、六級與其社會影響的關(guān)系,并從如何提高其積極影響等方面提出了相關(guān)建議。此外,國內(nèi)相關(guān)介紹在梳理和歸納語言測試發(fā)展歷程時,缺乏較為深入的探討和對具體情形的挖掘與描述。
二、語言能力測試的社會結(jié)果
如前所述,語言測試除了盡一切可能保證測試對應(yīng)試者的語言能力提供準確、客觀和公正的測量及對教學有好的反撥作用外,還要確保測試的良好社會維度。語言測試的社會維度指語言測試在社會中的使用情況、社會特征以及測試所產(chǎn)生的社會影響和后果。Filer(2000)認為測試領(lǐng)域歷來有兩個取向:技術(shù)話語(technical discourse)和社會話語(sociological discourse)。前者關(guān)注測試本身的質(zhì)量,如信度、效度、標準等技術(shù)指標;后者關(guān)注測試在社會中的使用及產(chǎn)生的影響。McNamara(2000)提出用“反撥”(washback)和“影響”(impact)這兩個術(shù)語來表達語言測試在不同層面上產(chǎn)生的結(jié)果。前者表示語言測試對教學產(chǎn)生的影響,后者則表示語言測試對社會和教育系統(tǒng)等產(chǎn)生的影響。測試的教育學意義自不待言,測試的反撥作用是研究教學與評估的傳統(tǒng)話題。它可以形塑教育體系及學習過程并作為可以帶來教育變革的政策工具,在某種程度上被看作教改的替代品,借以達到政治目的。Bachmann(2004)指出語言測試已成為我們教育體系和社會組成的一部分。我們使用測試來幫助做出多種決策,所以它應(yīng)該可以幫我們收集有關(guān)考生的有用信息,從而使個人和群體受益,這要求測試的施測者去傾聽被測試者和決策者的聲音。
語言能力測試,除了教育學的應(yīng)用,還成為證明語言能力的工具,正如McNamara(2000)所強調(diào)的,效度必須與結(jié)果相關(guān)涉才是有意義的效度。正是因為對語言測試領(lǐng)域許多非技術(shù)性問題的關(guān)注,特別是對其社會影響所涉及的道德責任與規(guī)范的公平等問題的關(guān)注,才使語言測試成為語言政策學者持續(xù)關(guān)注的一個重要話題(如 Cooper 1968;Spolsky 1978,1994,1995;Shohamy 2001,2006,2007)。下面,我們將從語言規(guī)劃與政策的宏觀視角出發(fā),考察語言能力測試在社會資源分配、規(guī)范的建立、社會準入和意識形態(tài)的構(gòu)建四個方面的作用,旨在展現(xiàn)語言能力測試社會維度的具體情形。
(一)語言能力評估與資源分配
自從法國社會學家Bourdieu提出語言資本理論以來,語言對個人福祉的作用在語言政策研究領(lǐng)域獲得廣泛認可與應(yīng)用,而語言能力測試正是語言由象征性資本轉(zhuǎn)化為實物資本這一過程得以實現(xiàn)的手段。自20世紀 60 年代以來,伴隨著大規(guī)模、標準化語言考試的迅猛發(fā)展,應(yīng)試者的語言考試成績已經(jīng)成為政府部門、企業(yè)等做出相關(guān)決策的重要依據(jù)之一,這些決策都會對考生的生活產(chǎn)生重要影響 (Spolsky 1995;Shohamy 2001)。然而,常常被人們忽略的是,語言評估在現(xiàn)實生活中不但在個人稀有資源如職位、教育機會分配方面起著重要作用,高風險測試(high-stakes tests)更成為調(diào)配社會資源與實現(xiàn)集團政治目的的重要手段(Shohamy 2001;McNamara & Roever 2006等)。
美國NCLB法案(No Child Left Behind Act)便是測試被用來決定資源分配的典型例子。該法案“不讓一個孩子落后”是2002年1月8日由美國總統(tǒng)喬治·布什簽署的一項美國聯(lián)邦法律。該法案規(guī)定全美超過95%的學生必須參加英語語言文學和數(shù)學考試??荚嚦煽兒玫膶W校將得到更多的財政支持??己藭r,學校被分為若干群組,其中一個常見群組是英語作為二語的學習者??己藭瑫r考慮學校整體和群組兩個層面的表現(xiàn)。只有兩個層面全部達標,才算考核合格。①該法案的實施產(chǎn)生了一些計劃外的效果,例如雙語服務(wù)資助縮減、學校教育應(yīng)試化嚴重等,某些學校甚至鼓勵說其他語言的少數(shù)族裔學生退學,以提高學校的平均成績。該法案的設(shè)計初衷是關(guān)注弱勢學生(英語作為二語的學習者),優(yōu)先滿足他們的需求,提高他們的成績。但該法案實際起到的是負面反撥作用,給利益相關(guān)人帶來了嚴重影響。
(二)語言能力評估與規(guī)范的確立
語言能力測試與評估的標準以什么為依據(jù)呢?換句話說,為什么標準音是倫敦音而不是牛津音?對最基本語言能力的評估容易判別,可以依據(jù)常理,認為只要是可以辨識意義的發(fā)音,就是正確的,同時也是標準的。但對個體語言能力級別的確定則需要依據(jù)規(guī)范。規(guī)范意味著選擇。語言的高聲望變體可以在人們的現(xiàn)實交際中自然形成,然而,語言規(guī)劃與政策研究的結(jié)果表明,語言規(guī)范更多地是一種政府行為,而語言的評估測試正是在這一過程中推動某一變體成為人為規(guī)范的手段。
語言測試以犧牲區(qū)域性或本土化變體來維護標準變體。美國托業(yè)考試(TOEIC)②使用的規(guī)范是標準美語、英式英語和澳洲英語,其他區(qū)域性變體中的常見詞匯、語法或風格變體形式均被判定為錯誤形式(Young 2012)。這些所謂“錯誤形式”在使用非本土化英語變體且受過教育的使用者看來是可以接受的(Lowenberg 1993)。可以說,以標準美語、英式英語或澳洲英語為規(guī)范是通過測試的形式被人為建構(gòu)的。
Fulcher(2009) 將社會稱為集體主義(collecti?vism),認為個人身份和價值等同于他們在集體中的成員身份,維護其成員身份的方式就是使用共同語并制定統(tǒng)一標準規(guī)范。語言測試采取一套評判標準是背后集體主義意識形態(tài)支撐的結(jié)果。與集體主義相對的另一種政治哲學是個人主義(individualism)。例如Canagarajah(2009)提到的印度社區(qū)發(fā)展出的英語區(qū)域性變體。這些變體使英語在印度變?yōu)椤岸喾N英語”(Plurilingual English),并且成為當?shù)亟虒W和測試中使用的“規(guī)范”。
(三)語言能力評估與社會準入
語言能力測試的性質(zhì)使其最初被用作身份甄別手段,測試失敗甚至可能導致危及生命的后果。最典型的莫過于猶太人歷史傳說中的“shibboleth”發(fā)音測試。McNamara(2005)搜集了歷史上用于軍事陣營和種族甄別的大量語言測試實例,這類測試都具有簡單(通常為一詞一音)、直接、暴力、臨時性和非正式的特點。而語言測試的社會準入功能是指語言測試具有使被測試者獲得某項認可,證明其具備某種水平或能力,從而使被測試者得以獲準進入社會或社會某一領(lǐng)域的功能,所以McNamara(2005)便直接稱其為21世紀的shibboleth。
現(xiàn)代語言測試雖不再直接產(chǎn)生危及生命的后果,卻是晉升、入職、移民、入籍或避難等社會準入具體形式的先決條件,在歸屬感、公民權(quán)、文化身份建立等問題中扮演著重要角色。近年來相關(guān)事件頻頻發(fā)生,如荷蘭專為移民設(shè)計荷蘭語測試,英國提高了境外牧師入關(guān)的語言要求,澳洲國會議員敦促提高移民語言測試難度等。在瑞典,自由黨曾積極提出建議,擬將瑞典語考試納入申請公民身份的強制要求,并借此獲得2002年選舉多數(shù)席位。近年來,入籍語言測試問題在瑞典變成燙手山芋。反對者認為該測試會成為阻擋移民的高門檻;支持者認為該考試可以考察申請人在非正式環(huán)境下使用瑞典語的交際能力,以預測申請人能否參與社會活動,融為社會成員,行使諸如投票權(quán)等公民權(quán)利,以及在勞動力市場是否具競爭力等。目前,因所有政黨一致認為這一話題太具爭議性,政府已不再將其提上政治議程(Nygren-Junkin 2009)。
(四)語言能力評估與意識形態(tài)建構(gòu)
語言作為象征共同體成員的標志,對其能力的評定也需要通過測試才能得以實現(xiàn)。一體化是歐洲各民族自古羅馬時代就一直被廣泛認可的意識形態(tài)?!稓W洲共同語言參考框架》(Common European Framework of Reference for Languages,簡稱CEFR)的建立正是體現(xiàn)了這樣的意識形態(tài)。該框架是歐洲委員會在2001年11月通過的一套建議標準,為歐洲語言在評量架構(gòu)和教學指引、考試、教材方面提供基準。其政治與教育上的意義在于可用來評估語言學習者在所學語言上的成績,同時也可以作為教育評估的指導方針。③Blackledge(2009)介紹CEFR在英國的使用情況時指出,一方面,該標準為參與考試的移民提供了基本知識和讀寫能力;另一方面,如考試失敗,該標準也起到拒絕人們?nèi)腙P(guān)、居住和獲得公民身份的作用。把語言能力作為公民資格和國籍的基本要求,反映了當本民族意識形態(tài)遭遇外來沖擊時,語言作為國家和民族顯性認同標志的重要性,語言在民族主義運動中起著對內(nèi)喚醒民族意識、提高民族向心力,對外與其他民族相區(qū)隔的重要作用(陳平 2008)。
語言能力測試的內(nèi)容及方式也常被研究者批評為起到了意識形態(tài)建構(gòu)的隱性作用。國際上最有影響的托福對不同文化背景的全球考生形成一種十分隱蔽而有效的文化控制,在施考和應(yīng)考的過程中,向世界宣傳了美國的政治、經(jīng)濟、文化和價值觀念,使考生對美國文化和教育產(chǎn)生了認同和歸化傾向。它的功能與作用已遠遠超出了考試工作本身(王立群 2009b)。
語言測試也常通過劃分語言文化等級來達到建構(gòu)意識形態(tài)的目的。在以色列,根據(jù)《回歸法》(Law of Return),所有猶太人都有權(quán)成為以色列公民。此外,1948年間生活在巴勒斯坦的阿拉伯人及其子女也有權(quán)獲得以色列公民身份。其他群體只有在極少數(shù)情況下能被授予以色列公民身份,其中一個要求便是掌握“希伯來語知識”。雖然以色列政府并未針對性地設(shè)置官方語言測試,但所有高等教育的入學考試都使用希伯來語進行。若想進一步獲得受教育的資格,就必須掌握該語言。希伯來語和阿拉伯語均為以色列官方語言。但希伯來語代表了以色列作為一個猶太國家的集體身份認同(the collective national identity),因此享有優(yōu)先地位。這種考試行為降低了阿拉伯語在以色列社會的地位與威望。語言測試作為一種工具,肯定并加強了語言的等級(Shohamy 2007;Shohamy & Kanza 2009),體現(xiàn)了特定意識形態(tài),輔助政府實現(xiàn)其政治目標。再如上文提到的美國NCLB法案。因強調(diào)學生的英語語言文學水平,該考試進一步強化了英語在美國的社會地位。不少學者因此批判該法案忽視移民語言,貶低其他語言的價值,甚至致其消亡。這種邊緣化移民語言的信號,也傳遞了一種信息,即任何使用這些語言來表現(xiàn)的知識都是無價值的,這些知識也因此而貶值(Evan & Hornberger 2005;Menken 2005,2006)。由此可見,語言測試強調(diào)的是同化性政治議題,而非互動性議題,因為它們強化了主導語言的地位,壓制并解構(gòu)了少數(shù)群體的獨有知識。即使官方課程大綱中有倡導多元化的表述,語言測試仍可以超越表述,使得真正的官方政策及其背后的意識形態(tài)取向暴露無遺(Shohamy 2004,2007)。
三、結(jié)語:社會效度的本質(zhì)及現(xiàn)實意義
語言根植于社會,作為一種象征性資本,語言也是人力資本的主要組成部分。對語言能力評估結(jié)果的運用,可以對個體的現(xiàn)實生活及命運產(chǎn)生巨大影響。正因為對語言能力的評估必然會成為政府資源管理及實現(xiàn)社會控制的工具,職是之故,必須從批判的視角對其本質(zhì)進行反思及再審視。批判測試學聚焦社會結(jié)果,它突破了停留在計算是否精確的階段,將語言能力評估置于更加廣闊的社會政治語境中,對測試后效的反思不再局限于反撥效應(yīng),而是重新審視測試中滲透的權(quán)力與控制以及測試所具有的社會價值和政治功能。這是一種不同于以往傳統(tǒng)測試和評價的途徑和思路,應(yīng)該將其視作研究范疇和評價文化的飛躍。這種方法認為課程、課堂教學、語言測試這些看似中立的學校知識場已成為不同利益群體的角逐場。文化實踐中包含權(quán)力斗爭,教育中充滿不平等與壓迫,語言測試則成為種種權(quán)力斗爭、社會公平、社會價值等的一種重要的呈現(xiàn)形式(王立群 2009a;樓荷英 2014),從而使考試的測試后果、道德和公平性等社會問題成為研究熱點。語言作為一種隱性的文化資本,對其能力的評估會不可避免地涉及對社會稀有資源的分配,因此也常常被用作社會控制與階級壓迫的手段。當然不是所有的測試都是“壞的”及充滿壓迫的,批判的方法只是提醒我們時刻以謹慎懷疑的目光審視司空見慣的現(xiàn)象。
同辭書一樣,語言能力評估在規(guī)劃人們語言行為方面發(fā)揮一種聲譽規(guī)劃的作用。如前所述,語言能力測試在將象征性資本轉(zhuǎn)化為實在資本的過程中起著至關(guān)重要的作用,從這個意義上說,在一個多語社會,語言能力決定個體的生存質(zhì)量和自身命運。社會越發(fā)展,語言能力在決定人的自由度方面的作用也必將越大。因此,對語言能力測試的研究進入了語言政策學者的視野。語言能力與語言評估密切相關(guān)。能力意味著標準的度量,能力與評估是兩個密不可分的概念。提醒人們關(guān)注語言本質(zhì)的社會歷史文化層面和語言測試的實質(zhì),是對基于結(jié)構(gòu)主義心理測量(psychometric-structuralist)的解構(gòu)。
本文從社會結(jié)果的角度具體分析語言測試的社會維度,包括資源分配、規(guī)范確立、社會準入及意識形態(tài)建構(gòu)等。就我們視野所及,國內(nèi)還沒有看到漢語能力評估社會維度的文獻。至今中國政府職能部門、學術(shù)機構(gòu)及個人已經(jīng)研制開發(fā)了若干基于國家通用語(或漢語)的水平測試系統(tǒng)。這些系統(tǒng)在應(yīng)用過程中因社會維度導致對應(yīng)試者語言能力效度的影響,也無疑值得關(guān)注。例如,HSK(尤其是閱讀理解試題)將日本、韓國等東亞文化圈學生與歐美學生同等看待,使用同一標準。在海外漢語教學中,同一個班的學習者來自不同的語言背景,既有零起點的純外語學習者,又有家庭語言是漢語的華裔學生;即使同是零起點的真正外語學習者,也有東方文化背景與西方文化背景之別。簡單且不加批判地使用測試,在語言能力評估社會維度學者看來是短視而不負責任的,應(yīng)將測試道德納入語言水平測試實踐,以期實現(xiàn)測試的正面反撥效應(yīng)和效度最大化。
毋庸置疑,中國目前的語言能力評估理論與實踐,仍將以心理計量測試為主流。本文從語言規(guī)劃與政策視角對測試本身的設(shè)計公平性、目的及社會應(yīng)用的公平性進行了再審視,對語言評估使用最廣的量化工具,效度理論的兩個重要觀點提出質(zhì)疑,指出心理計量方法評估語言能力的局限性,目的在于為我們思考語言能力提供了一個嶄新的視角,呼吁關(guān)注語言評估的人文層面。
注 釋
① 參見https://en.wikipedia.org/wiki/No_Child_Left_Behind_Act。
② 美國托業(yè)考試為測試和提高職業(yè)英語交流能力的職業(yè)英語考試。
③ 參見https://zh.wikipedia.org/wiki/。
參考文獻
陳 平 2008 《語言民族主義:歐洲與中國》,《外語教學與研究》第1期。
戴曼純 2002 《外語能力的界定及其應(yīng)用》,《外語教學與研究》第6期。
何蓮珍、呂洲洋 2013 《語言測試研究的新視角:批評語言測試》,《浙江大學學報》(人文社會科學版)第6期。
黃 倩 2013 《語言測試社會維度之社會影響研究——基于大學英語四、六級考試的分析》,西北大學碩士學位論文。
樓荷英 2014 《配對(組)口語測試的社會性及其微觀研究》,《浙江工業(yè)大學學報》(社會科學版)第2期。
王立群 2009a 《教育社會學視角下的語言測試社會維度》,《無錫商業(yè)職業(yè)技術(shù)學院學報》第2期。
王立群 2009b 《美國托??荚嚨纳鐣S度分析及其啟示》,《江西電力職業(yè)技術(shù)學院學報》第2期。
王立群 2011 《托??荚嚿鐣S度分析——兼談大學英語四、六級考試》,《衡水學院學報》第2期。
楊秀芬 2015 《語言測試的效度研究:回顧與展望》,《景德鎮(zhèn)學院學報》第4期。
張 艷 2014 《語言測試的道德維度:研究理路與實踐反思》,《江海學刊》第6期。
Bachman, Lyle F. 1990. Fundamental Considerations in Language Testing. Oxford: Oxford University Press.
Bachman, Lyle F. 2004. Statistical Analysis of Language Assessment. Cambridge: Cambridge University Press.
Bachman, Lyle F. and Adrian S. Palmer. 1996. Language Testing in Practice: Designing and Developing Useful Language Tests. Oxford: Oxford University Press.
Blackledge, Adrian. 2009. Inventing English as Convenient Fiction: Language Testing Regimes in the United Kingdom.In Guus Extra, Massimiliano Spotti, and Piet Van Avermaet (eds.). Language Testing, Migration and Citizenship: Cross-national Perspectives on Integration Regimes. New York: Continuum.
Canagarajah, Suresh. 2009. The Plurilingual Tradition and the English Language in South Asia. AILA Review 22, 5-22.
Canale, Michael and Merrill Swain. 1980. Theoretical Bases of Communicative Approaches to Second Language Teaching and Testing. Applied Linguistics 1(1), 1-47.
Canale, Michael. 1983. From Communicative Competence to Communicative Language Pedagogy. In Jack C. Richards and Richard W. Schmidt (eds.). Language and Communication. London: Longman.
Carroll, John Bissell. 1961. Fundamental Considerations in Testing for English Language Proficiency of Foreign Students. In Harold B. Allen and Russell N. Campbell (eds.). Testing the English Proficiency of Foreign Students. Washington, D. C.: Center for Applied Linguistics.
Chomsky, Noam. 1965. Aspects of the Theory of Syntax. Cambridge: MIT Press.
Cooper, Robert L. 1968. An Elaborated Language Testing Mo?del. Language Learning 18, 57-72.
Evan, Bruce A. and Nancy H. Hornberger. 2005. No Child Left Behind: Repealing and Unpeeling Federal Language Education Policy in the United States. Language Policy 4(1), 87-106.
Filer, Ann. 2000. Introduction. In Ann Filer (ed.). Assessment: Social Practice and Social Product. London: Routledge.
Fulcher, Glenn. 2009. Test Use and Political Philosophy. Annual Review of Applied Linguistics 29, 3-20.
Hymes, Dell. 1972. Models of the Interaction of Language and Social Life. In John Joseph Gumperz and Dell H. Hymes (eds.). Directions in Sociolinguistics: The Ethnography of Communication. New York: Holt, Reinhart and Winston.
Lowenberg, Peter H. 1993. Issues of Validity in Tests of English as a World Language: Whose Standards? World Englishes 12, 95-106.
McNamara, Tim. 2000. Language Testing. Oxford: Oxford University Press.
McNamara, Tim. 2005. 21st Century Shibboleth: Language Tests, Identity and Intergroup Conflict. Language Policy 4(4), 351-370.
McNamara, Tim and Carsten Roever. 2006. Language Testing: The Social Dimension. Oxford: Blackwell Publishing.
Menken, Kate. 2005. When the Test Is What Counts: How High-Stakes Testing Affects Language Policy and the Education of English Language Learners in High School. Doctoral Dissertation. Teachers College, Columbia University.
Menken, Kate. 2006. Teaching to the Test: How Standardized Testing Promoted by the No Child Left Behind Act Impacts Language Policy, Curriculum, and Instruction for English Language Learners. Bilingual Research Journal 30(2), 521-546.
Messick, Samuel J. 1989. Validity. In Robert Linn (ed.). Educational Measurement (3rd edition). New York: Macmillan.
Nygren-Junkin, Lilian. 2009. Language, Migration and Citizenship in Sweden: Still a Test-Free Zone. In Guus Extra, Massimiliano Spotti, and Piet Van Avermaet (eds.). Language Testing, Migration and Citizenship, Cross-National Perspectives on Integration Regimes. New York: Continuum.
Shohamy, Elana.2001.The Power of Tests: A Critical Perspective of the Uses of Language Tests. London: Pearson Education.
Shohamy, Elana. 2004. Assessment in Multicultural Societies: Applying Democratic Principles and Practices to Language Testing. In Bonny Norton and Kelleen Toohey (eds.). Critical Pedagogies and Language Learning. New York/London: Cambridge University Press.
Shohamy, Elana. 2006. Language Policy: Hidden Agendas and New Approaches. London: Routledge.
Shohamy, Elana. 2007. Language Tests as Language Policy Tools. Assessment in Education 14(1), 117-130.
Shohamy, Elana and Tzahi Kanza. 2009. Language and Citizenship in Israel. Language Assessment Quarterly 6(1), 83-88.
Spolsky, Bernard. 1978. Linguistics and Language Testers. In Bernard Spolsky (ed.). Papers in Applied Linguistics: Advances in Language Testing (Series 2). Arlington: The Center for Applied Linguistics.
Spolsky, Bernard. 1994. Policy Issues in Testing and Evalu?ation. The Annals of the American Academy of Political and Social Science 532, 226-237.
Spolsky, Bernard. 1995. Measured Words. Oxford: Oxford University Press.
Young, Richard F. 2012. Social Dimensions of Language Testing. In Glenn Fulcher and Fred Davidson (eds.). The Routledge Handbook of Language Testing. New York: Routledge.
責任編輯:戴 燃