白雪晴
(東北石油大學(xué) 外國語學(xué)院,黑龍江 大慶 163318)
語言測試在過程性評估系統(tǒng)中的應(yīng)用
白雪晴
(東北石油大學(xué) 外國語學(xué)院,黑龍江 大慶 163318)
根據(jù)《大學(xué)英語課程要求》,全面、客觀、科學(xué)、準確的評估體系對于實現(xiàn)教學(xué)目標至關(guān)重要。評估能幫助教師及時獲取教學(xué)反饋信息、改進教學(xué)管理、保證教學(xué)質(zhì)量,同時評估能使學(xué)生及時調(diào)整學(xué)習策略、改進學(xué)習方法、提高學(xué)習效率。通過系統(tǒng)闡述形成性評估的理論基礎(chǔ),介紹語言測試的歷史、種類和標準,進一步論證語言測試在過程性評估過程中的應(yīng)用十分必要。
過程性評估;語言測試;大學(xué)英語
教學(xué)評估是教學(xué)的重要關(guān)節(jié)。建立科學(xué)、全面、客觀的評估體系對實現(xiàn)教學(xué)目標起著不可替代的作用。教學(xué)評估是教師獲得教學(xué)反饋、改進教學(xué)方法、促進教學(xué)管理、保證教學(xué)質(zhì)量的重要依據(jù)。教學(xué)評估同時也是學(xué)生掌握教學(xué)內(nèi)容、改進學(xué)習方法、調(diào)整學(xué)習策略、形成學(xué)習風格、提高學(xué)習效率、檢測學(xué)習成果的有效手段。
根據(jù)對學(xué)生學(xué)習成績形成評估方式的不同,可以把評估大體分為兩種:形成性評估(formative-assessment)和終結(jié)性評估(summativeassessment)。根據(jù)大學(xué)英語課程教學(xué)改革要求(College-English Requirements),[1]形成性評估是指“教學(xué)過程中進行的過程性和發(fā)展性評估,即根據(jù)課程目標,采用多種評估手段和方式,跟蹤教學(xué)過程,反饋教學(xué)信息,促進學(xué)生全面發(fā)展”。它有別于一考定終身的終結(jié)性評估,即“在一個教學(xué)階段結(jié)束時進行的總結(jié)性評估”。
(一)語言測試的歷史回顧
隨著人們對語言學(xué)習的深入認識和研究,語言測試也經(jīng)過了不同的發(fā)展歷程。spolsky(1978)[2]認為語言測試發(fā)展至今大抵經(jīng)過了三個階段,即20世紀五六十年代的前科學(xué)階段(pre-scientificperiod),20世紀五50年代的心理測量階段(psychometric-structralistperiod),以及自20世紀70年代至今的整合式——社會語言學(xué)主導(dǎo)階段(integrative-socioliguistic period)。
測試前科學(xué)階段以傳統(tǒng)外語教學(xué)的語法翻譯法(the-grammar-translation-approach)為依托。這種方法把語言當作知識去教,認為教外語就是教有關(guān)語法、詞匯、語音的知識,教學(xué)的注意力放在語言形式上面。例如,常常對句子結(jié)構(gòu)進行冗長、詳盡的解釋和分析,把翻譯作為主要的操練方式,比較目標語和母語在形式方面的異同。教學(xué)重視讀和寫,不重視聽和說的訓(xùn)練。
第二次世界大戰(zhàn)到20世紀60年代,是聽說法(the-audiolingual-approach)的黃金時期。聽說法的理論基礎(chǔ)是行為主義心理學(xué)(behavioristic-psychology)和結(jié)構(gòu)主義語言學(xué)(structural-linguistics)。聽說法把語言學(xué)習看作是刺激——反應(yīng)(stimulus-response)的過程,認為學(xué)習就是在心理上建立反應(yīng)與反應(yīng)之間的聯(lián)系,語言學(xué)習是習慣的形成(habitformation)。這種方法認為,要學(xué)會語言就需要模仿和記憶,反復(fù)練習,強化訓(xùn)練。主張用對比的方法來確定教學(xué)的要點、設(shè)計句型;考試的重點是考技能,從技能這個角度來看語言的形式,把技能分成“聽”、“說”、“讀”、“寫”四種,有時還加上“譯”;重視聽和說的技能,除了讀和寫的測試外,時常有聽力測試,有時還有口試。考試題型多樣化,例如句型轉(zhuǎn)換、詞語替換、詞語填空、語法填空等。其命題講究科學(xué)性,提倡用科學(xué)的方法命題,主張用教育統(tǒng)計學(xué)的理論和方法采集數(shù)據(jù),對題項和整個測試的質(zhì)量進行評價。
20世紀70年代的交際法(thecommunicativeapproach)主張要加強對能力(competence)的培養(yǎng),特別是對交際能力(communicative-competence)的培養(yǎng)。這種方法認為,教學(xué)的目的是培養(yǎng)使用外語或第二語言進行交際的能力,為此要教給學(xué)生各種反映語言功能的語言并教會學(xué)生在不同的場合正確地(correctly)、得體地(appropriately)使用語言。在語言測試方面,專家們推崇交際式測試(communicative testing)。當今,Bachman[3]有關(guān)交際式測試的論述影響最為廣泛。他在前人研究的基礎(chǔ)上,針對使用語言測試和研究語言測試的需要,認為語言能力就是把語言知識和語言使用的語境特征結(jié)合起來。他把語言交際能力(communicativelanguageability)分成三個部分,即語言能力(language-competence)、策略能力(strategic-competence)和心理生理機制(psychophysiologicalmechanisms)。他認為,英語測試有以下幾個基本特點:一是把重點放在考查能力上面,考試要能反映多種能力的綜合水平。二是多采用以任務(wù)為基礎(chǔ)的問題(task-based-questions)或解難型活動(problem-solving-activities)。三是注重語篇水平的能力測試,按照交際需要靈活處理聽、說、讀、寫技能和語言點的問題,提倡綜合應(yīng)用。
(二)形成性評估的理論基礎(chǔ)
過程性評估順應(yīng)大學(xué)外語教學(xué)改革的要求,培養(yǎng)“學(xué)生的英語綜合應(yīng)用能力,特別是聽說能力,使他們在今后的學(xué)習工作交往中能用英語有效地進行交際,同時增強自主學(xué)習能力,提高綜合文化素質(zhì),以適應(yīng)我國社會發(fā)展和國際交流的需要”。過程性評估體現(xiàn)了整合各個教育學(xué)習資源,全方位、多角度評估學(xué)生的要求。過程性評估把建構(gòu)主義、人本主義、社會互動主義的觀點有機結(jié)合起來,使教與學(xué)能夠相互促進、相互提高。
建構(gòu)主義強調(diào)個體從自身經(jīng)驗背景出發(fā),對客觀事物的主觀理解和意義建構(gòu),重視學(xué)習過程。個體內(nèi)化知識,在運用過程中主動理解和詮釋語言意義。過程性評估從動態(tài)的、構(gòu)建的角度為提供學(xué)生檢測知識內(nèi)化的工具,為教師學(xué)生提供知識建構(gòu)的檢測手段。
人本主義心理學(xué)強調(diào),人在滿足基本需求的基礎(chǔ)上,還需要降低內(nèi)驅(qū)力、追求更高層次的需求以保持心理平衡。人天然具有學(xué)習的潛力,學(xué)習是人的終生需求。有意義的學(xué)習發(fā)生是有條件的,當學(xué)習者認為知識和個人相關(guān),并且學(xué)習者能參與其中時才會發(fā)生。因此,教育要尊重學(xué)習者個體,尊重學(xué)習者的個人需求和情感,鼓勵學(xué)習者對自己負責、自己選擇,實現(xiàn)真正意義上的終生學(xué)習和全面教育。過程評估能夠有效滿足學(xué)生認知自我的要求,培養(yǎng)學(xué)生自我負責,自我發(fā)展的能力,為學(xué)生的全面進步提供客觀的衡量尺度。
社會互動理論強調(diào),學(xué)習過程中學(xué)習者在與他人交往和互動中學(xué)習知識。維果茨基(Vygotsky)[4]提出,對學(xué)習者個體產(chǎn)生重要意義的人,如教師、伙伴等,在學(xué)習者學(xué)習過程中起到中介作用。教師的角色從一直以來的單純傳遞者轉(zhuǎn)化為中介者。過程性評估體系的建立和多層次評估體制的運用使學(xué)生之間的互評、教師對學(xué)生的評價、學(xué)生對教師的評價結(jié)合起來,共同構(gòu)成一個完備的評價體系和網(wǎng)絡(luò)。
通過多層次、多角度、多方面的評估,學(xué)習者作為個體,對自己的學(xué)習負責,有意識或無意識地利用各自不同的學(xué)習方法和策略將已經(jīng)學(xué)會的外語知識與新的語言現(xiàn)象結(jié)合起來學(xué)習。個體的學(xué)習行為不再是簡單地由外界刺激而產(chǎn)生的條件反射,學(xué)習行為是從每個人的內(nèi)部心理結(jié)構(gòu)出發(fā),對從學(xué)習環(huán)境中獲得的誘導(dǎo)和激勵機制進行反思或思考。
語言測試首先是一種方法,不論正式還是非正式的測試,結(jié)構(gòu)性或非結(jié)構(gòu)性的,主觀性的還是客觀性的都需要有恰當?shù)臏y試方法。其次,測試都意在達到特定目的,根據(jù)測試結(jié)果為學(xué)生提供考量標準和尺度。再次,測試前需要詳實周密的計劃以保證測試的效果。
(一)語言測試的分類
分類,就是根據(jù)人或者事物的特性進行歸類。根據(jù)測試目的不同,測試可分為水平測試(proficiency tests)、成就測試(achievement-tests)、能力傾向測試(aptitude-tests)、診斷性測試和分級測試(diagnostic andplacementtests)幾種。下面我們從不同的角度來認識各種測試的特性。
1.成就測試(achievement-tests)
成就測試是用于檢測個人技能或知識的測試。一般來說能力測試指的是針對評價個人在學(xué)到特定等級的技能或者知識后的掌握程度的一種標準化測試。較高的測試成績往往表明學(xué)生已經(jīng)掌握此等級的技能或知識;測試成績偏低則意味著該學(xué)生還未能掌握此等級的技能,需要補習或者重修課程來達到掌握本等級課程的目的。成就測試有利于激勵學(xué)生努力學(xué)習,能比較全面地了解學(xué)生的不足,是考核教師工作、檢查教學(xué)質(zhì)量的手段,可為修改教學(xué)內(nèi)容、修訂大綱及教學(xué)計劃提供依據(jù),為教學(xué)科研提供資料。如果能夠做到測試結(jié)果穩(wěn)定,有利于比較同一年級不同班級的成績,比較本屆學(xué)生與往屆學(xué)生的成績,或者比較不同學(xué)校同一年級學(xué)生的成績。
2.水平測試(proficiency-tests)
水平測試用于測量掌握英語的一般水平,與特定的任務(wù)相聯(lián)系,是一種回顧展望性測試。美國教育考試服務(wù)處(Educational-Testing-Service)主管的TOEFL就是水平測試的代表。我國教育部考試中心主管的外語水平考試(WSK)和全國四六級考試(CET4,CET6)也屬于這一類。命題一般不考慮被試用過什么課本、學(xué)了多久、是怎么學(xué)的,也不受教學(xué)大綱的約束,而是按照任務(wù)決定難度和區(qū)分能力。有的水平測試是選拔性的,要求有較高的區(qū)分性;有的水平測試是過關(guān)性的,要求讓合乎標準的測試者能夠通過。
3.能力傾向測試(aptitude-tests)
能力傾向測試是一種展望性的測試,種類繁多。有的把智能作為一個整體來測量,測量綜合智能(general-intelligence)。這種測試常常用于了解學(xué)習外語的能力傾向,判斷是否具有學(xué)外語的天賦?,F(xiàn)代語言能力傾向測試(MLAT)是美國著名的測試。
4.診斷性測試(diagnostic-tests)
診斷性測試是用來監(jiān)測教學(xué)的測試,回顧過去,檢查過去一段時間的教學(xué)效果。這種測試把問題集中到需要了解的方面,例如想知道學(xué)生是否掌握了虛擬語氣的基本用法,那么題項都應(yīng)該涉及這個特殊的語言現(xiàn)象。
5.分級測試(placement-tests)
分級測試的目的很明確,回顧測試者以往的語言學(xué)習情況,按程度分班、分級,使下一階段教學(xué)能夠順利進行。分級測試屬于鑒別性測試(differentiation-tests),因此要注意提高測試的區(qū)分能力,以便更好地把不同層次的學(xué)生分開來。
(二)語言測試的標準
測試的標準主要包括三個方面:信度(consistancy)、效度(validity)和可行性(practicality)。
Bachman把信度定義為“測試的一致性”(consistencyofmeasurement)。信度所涉及的問題是個體測試成績在多大程度上是由測試誤差或其它因素所影響的。如果說一個測試的信度高,是指一個考生的成績序列反復(fù)測試都大體相同。相同的測試對同一測試者,或不同情形的相匹配測試者應(yīng)得出相似的結(jié)果。影響因素主要包括考生水平的差異、題目的數(shù)量、題目的區(qū)分度。命題人員需要提高試題題目的區(qū)分度和增加試題的數(shù)目來提高信度,在有限的測試時間內(nèi)保證試題的信度,測試可以完備、客觀地反映測試者的語言水平和學(xué)習能力。
效度是指考試能否測量它所要測量的內(nèi)容,是否能達到預(yù)期的測試目的。效度可以從內(nèi)容效度(content-validity)、效標關(guān)聯(lián)效度(criterion-related validity)、結(jié)構(gòu)效度(constructvalidity)等不同方面進行評估。效度所關(guān)注的問題是個體測試成績在多大程度上和個體語言能力相關(guān)。使測試誤差造成的影響最小化,檢測的語言能力的效果最大化,是兩個相互補充的目標。信度是效度的前提或必要條件。
可行性是指在有限的經(jīng)濟、物資等客觀實際基礎(chǔ)上,把測試時間、測試地點、測試管理、測試評語等因素綜合起來,拿出最優(yōu)化的測試方案。例如測試的時間長短、是人工閱卷還是機讀卡測試、是紙質(zhì)試卷還是計算機網(wǎng)考,在優(yōu)化各類資源的同時,使測試與教學(xué)有機統(tǒng)一,教師可以根據(jù)測評的結(jié)果更好地解讀學(xué)生的學(xué)習狀態(tài)和學(xué)業(yè)成果。
(一)過程性評估要求多種評估手段相結(jié)合
過程性評估要求學(xué)生自我評價、學(xué)生間互相評價、教師對學(xué)生評估、學(xué)生對教師評價相結(jié)合,多渠道、多層面對學(xué)生學(xué)習和教師授課給予評估。多種類型測試的運用為客觀科學(xué)地反映學(xué)生和教師的現(xiàn)狀提供依據(jù)。分級測試使學(xué)生合理分流,更有效地利用教學(xué)資源;診斷性測試幫助教師及時了解學(xué)生對具體教學(xué)重點難點的把握情況;成就性測試提供學(xué)生階段性的學(xué)習成果檢測。綜合不同測試的特點和優(yōu)點,分析不同測試的需要,提供不同的測試內(nèi)容,掌握學(xué)生的學(xué)習動向,了解教師的教學(xué)理念,開創(chuàng)教學(xué)的新局面,以考試促教學(xué),以考試促改革。
(二)測試過程中要注重測試的可行性、信度、效度的統(tǒng)一
測試應(yīng)從宏觀把握測試的標準,因地制考,因時制考。單憑經(jīng)驗和印象的測試不能滿足新形勢下教學(xué)改革的要求。測試內(nèi)容和方法要符合測試的目的,滿足測試的要求,測試結(jié)果要能反映測試的初衷,具有一定的穩(wěn)定性。信度只是必要條件但不是充要條件,信度是效度的前提,保證測試的效度更應(yīng)引起命題教師的重視。命題教師要處理好wh-問題,即測試者是誰(WHOM)、為什么測(WHY),測什么(WHAT)以及怎樣測(HOW)的問題。測試內(nèi)容要體現(xiàn)新的語言教學(xué)觀。語言測試應(yīng)該隨著語言觀的發(fā)展而發(fā)展,并隨著教學(xué)理念、教學(xué)模式的更新而更新。
(三)正確認識教考的關(guān)系,提高測試的正面反撥效應(yīng)
“反撥效應(yīng)”(washbackorbackwash)是指語言測試對教與學(xué)帶來的沖擊和影響,同時還指語言測試對課程設(shè)置、教育者以及人才培養(yǎng)等所帶來的不可低估的影響。測試是教和學(xué)的導(dǎo)向,測試應(yīng)提高正面的反撥效應(yīng),減少負面反撥效應(yīng)。成績測試要與教學(xué)目標相結(jié)合,使用尺度參照才能使教學(xué)與測試相互促進、相互激發(fā)。通過測試既能使學(xué)生全面客觀地了解自己的語言水平,又能看到完成學(xué)業(yè)過程中的點滴變化;既能讓教師了解每個學(xué)生的學(xué)習狀況,又能促進教師適應(yīng)新情況下新的教學(xué)模式轉(zhuǎn)變和教學(xué)改革的要求。
(四)培養(yǎng)學(xué)生的測試策略和學(xué)習策略
測試要培養(yǎng)能力。通過語言測試來影響語言學(xué)習者的個人認知,教師通過測試結(jié)果了解學(xué)習者的特點,針對每個學(xué)生的情況進行導(dǎo)學(xué)助學(xué)。根據(jù)奧馬力(o'malley)和夏莫特(Chamot)[5]的策略培訓(xùn)程序,首先是學(xué)生意識到自己已經(jīng)使用的策略,接著教師向他們介紹和示范新的策略并給予學(xué)生練習新策略的機會,最后由學(xué)生自我評價使用這些策略后的效果。通過在不同階段運用適當?shù)臏y試,可以使學(xué)生學(xué)習策略的培養(yǎng)取得事半功倍的效果。
(五)過程性評估要求建立并完善教學(xué)文件和教學(xué)管理文件
學(xué)生檔案、訪談、座談、網(wǎng)上自主學(xué)習記錄、課堂活動管理、學(xué)籍管理、學(xué)分管理、教學(xué)考核規(guī)范、學(xué)生學(xué)習成績、考試試卷分析、教師教課的基本教學(xué)文件等資料要建立配套的記錄機制、保存機制、分析機制和管理機制。
教學(xué)評估是大學(xué)英語課程教學(xué)的重要環(huán)節(jié),建立全面、客觀、科學(xué)、準確的評估體系是實現(xiàn)教學(xué)目標的必要條件。教學(xué)評估是學(xué)生調(diào)整學(xué)習策略、改進學(xué)習方法、提高學(xué)習效率、取得學(xué)業(yè)進步的催化劑;是教師提高業(yè)務(wù)水平、完善知識結(jié)構(gòu)、轉(zhuǎn)變教學(xué)理念、贏得教學(xué)效果的助推器。實踐證明合理地運用語言測試是過程性評估體系的基石。
[1] 教育部高等教育司.大學(xué)英語課程教學(xué)要求[M].上海:上海外語教育出版社,2007.
[2] Spolsky,Bernard(Editor).1978.Approaches-to-Language Testing[M].Arlington,VA:Center-for-Applided-Linguistics.
[3] Bachman,L.F.Fundamental-Consideration-in-Language Testing[M].Oxford-University-Press,UK,1990.
[4] Vygotsky,L.S.1962.Thought-and-Language[M].Cambridge,Mass:MIT-Press.
[5] O'Malley,J.and-A.Chamot.1990.Language-Learning Strategies[M].Cambridge:Cambreidge-University-Press.
Key-words:formative-assessment;language-testing;college-English
〔責任編輯:王一婷〕
Application of Language Testing in the Formative Assessment System
BAI-Xue-qing
(Department-of-Foreign-Language,Daqing-Petroleum-Institute,Daqing-163318,China)
According-to-theCollegeEnglish-CurriculumRequirements,acomprehensive,objective,scientific-and-accurate-evaluation-system-is-of-vital-importance-to-the-achievement-of-course-goals.It-not-only-helps-teachers-obtain feedback,improve-the-administration-of-teaching,and-ensure-teaching-quality-but-also-provide-students-with-an-effectivemans-to-adjust-their-leaning-strategies-andmethods,improve-their-learning-efficiency-and-achieve-the-desired learning-effects.This-article-systematically-discusses-the-theoretical-base-for-formative-assessment,introduces-classification-of-language-tests,states-the-criteria-for-language-testing,and-further-states-how-to-apply-language-testing to-the-formative-assessment-system.
G642.4
A
201004-25
1671-6671(2010)03006504
白雪晴(1980),女,黑龍江大慶人,東北石油大學(xué)外國語學(xué)院講師,外國語言學(xué)及應(yīng)用語言學(xué)碩士,研究方向:應(yīng)用語言學(xué)。