【摘 要】本文通過介紹和分析美國大學委員會(College Board)在對其所主辦的美國學術能力評估測試(SAT,Scholastic Assessment Test)進行改革的背景及其所做的數據統(tǒng)計和分析工作,對正在經歷改革的英語專業(yè)八級考試提出了四點實際建議。筆者認為,通過分析考試預測效度以及考試成績與學生畢業(yè)成就、專業(yè)課程成績及接受社會機構培訓等因素間的相關性,可以使高等學校外語專業(yè)教育指導委員會更好確立考試有效性,更科學地調整各個考試部分,消除考試中可能出現(xiàn)的不公平因素,并更積極處理同類型、級別考試間的競爭和借鑒關系。
【關鍵詞】英語專業(yè)八級考試;美國學術能力評估測試;預測效度;相關性分析
英語專業(yè)八級考試(TEM8,Test for English Majors-Band 8),全稱為全國高校英語專業(yè)八級考試,自1991年起由中國大陸教育部實行,每年3月舉行考試,考察對象是全國綜合性大學英語專業(yè)和外語類院校相關專業(yè)學生。英語專業(yè)八級證書雖然并不與學位授予直接掛鉤,但通常被認為是國內最高級別的英語能力證書,受到社會各界廣泛承認。
2015年8月,外語專業(yè)教學測試專家委員會正式宣布通過英語專業(yè)八級考試改革方案,并向各高校發(fā)送了相關說明及參考樣題。本次改革中,原有的聽力理解,閱讀理解,語言知識,翻譯和寫作部分都發(fā)生了不同程度的擴充或改變,翻譯中的英譯中部分以及自2005年以后加入的人文知識部分被取消,考試時間被縮短。此番改革受到了各大高校英語專業(yè)師生的高度關注。改革后的首次考試將于2016年3月舉行。
無獨有偶,2016年3月,由美國大學委員會(College Board)主辦的美國學術能力評估測試(SAT,Scholastic Assessment Test)也將在改革后首次亮相。本次改革對SAT考試的時間、總分值、分數計算方法、考試范圍、題型和考題資料來源等方面都進行了全方位的調整。SAT考試也被稱為“美國高考”,是包括中國學生在內的全球學生申請絕大部分北美地區(qū)高等院校本科生階段入學資格的重要參考指標。自2014年3月,美國大學委員會新總裁大衛(wèi)·科爾曼(David Coleman)在發(fā)布會上首次提出SAT改革方案后,無論是中國學生群體,還是廣大的社會英語培訓機構市場,都表現(xiàn)出了極大的關注。
筆者在其所屬高校負責學生的專業(yè)八級考試備考指導工作,并教授相關備考課程(選修課程),已針對改革內容進行了研究,以備對教學內容進行相關調整。筆者常被同學問及,此番改革背后的目的是什么,為什么取消了一些題型,擴充了另一些題型,又調整了一些題型?這些改革和調整是否能使得英語專業(yè)八級考試更好體現(xiàn)出學生本科階段的專業(yè)學習情況?可惜的是,高等學校外語專業(yè)教育指導委員會所下發(fā)的寥寥數頁的說明之中并沒有對題型調整背后意圖的說明,也沒有相關的統(tǒng)計數據支持來說明改革對于專業(yè)八級考試科學性的提高作用。作為教師,除了一如既往要求學生夯實基礎,并努力借鑒其他考試中出現(xiàn)的類似題型解題技巧以外,并不能從根本解答學生的疑惑。
筆者在社會實踐中也積極投身于SAT考試的培訓和教研工作,針對本輪SAT考試的改革內容進行了長期深入的研究。經筆者比較后認為,在SAT考試改革的背后,其主辦方的科學態(tài)度和基于統(tǒng)計數據的研究方法有諸多值得借鑒之處,筆者在此謹希望利用SAT考試改革的啟示,對英語專業(yè)八級考試,尤其是針對其在統(tǒng)計數據收集和運用方面提出一些建議:
一、進行英語專業(yè)八級考試及其各個部分預測效度數據的收集及分析,作為該考試有效性的證明和改革的依據
效度(Validity)這個概念是測試學領域的基本概念,也是決定測試質量的最重要標準。效度指的是考試結果在多大程度上反映出其所測試的能力。為了證明SAT的高效度,美國大學委員會建立了全國高校學生表現(xiàn)數據庫,根據歷屆高中生畢業(yè)參加完SAT后在大學一年級中的表現(xiàn),通過線性回歸等數據統(tǒng)計方法,展開對于SAT預測效度(Predicative Validity)的研究。經統(tǒng)計,美國大學委員會發(fā)現(xiàn),SAT總分與學生在大學一年級的平均分相關系數達到約0.54(相關系數低、中、高分別對應的數值是0.1,0.3,0.5),證明了SAT成績與大學一年級平均分的相關性非常高。但在各個不同部分之間也有一定的區(qū)別,比如寫作部分(主要為語法)的效度更高(平均相關性達到0.52),而數學部分的效度偏低(平均相關性為0.48)。
因此,美國大學委員會在改革中對于兩部分進行了差異化的處理:
語法部分:語法部分考點范圍變化不大,僅增加了標點符號的考察和近義詞的選詞。
數學部分:數學部分原有大綱中的“基礎數論與運算”被平均分配到了“代數”、“數據分析”、“高等數學”和“其他”部分中,同時在“其他”部分增加了“復數”的考點。幾何的比例從25%-30%下降到了10%,空間幾何的內容被刪除?!皵当矸治觥钡牟糠謴?5%增加到了28%,內容除了繼續(xù)考察圖表數據分析以外,還加強了對圖像特征進行文字表述的考察。增加了“高等數學”部分,加入如多項式因子等內容。
根據改革說明,英語專業(yè)八級考試旨在檢查英語專業(yè)四年級學生運用英語獲取、理解和處理一般或專業(yè)相關信息以達到交際要求的能力。其效度也應受到統(tǒng)計學研究的檢驗。如能通過統(tǒng)計建立起專業(yè)八級考試成績與英語專業(yè)學生畢業(yè)成就,如就業(yè)率及畢業(yè)起薪等數據的相關度,從一定程度上可以體現(xiàn)出專業(yè)八級考試的有效性。當然,這樣的統(tǒng)計工作應當考慮到大學聲譽及其所在地域等因素的影響,例如,著名大學英語系的畢業(yè)生即使專業(yè)八級成績較低也會相對更容易找到工作,經濟較發(fā)達地區(qū)的大學英語專業(yè)畢業(yè)生即使專業(yè)八級成績較低,其畢業(yè)工作起薪也會相對較高。因此,在樣本的選取中,應當覆蓋各個不同排名段和不同經濟發(fā)展水平地區(qū)的大學,以保證統(tǒng)計結果的可參考性。
另外,借鑒美國大學委員會利用各部分效度指導改革的做法,高等學校外語專業(yè)教育指導委員會也可以建立起專業(yè)八級各個部分與英語專業(yè)畢業(yè)生畢業(yè)成就的相關性數據,并利用其結果指導工作,確定各部分的調整力度。盡可能保留效度較高的部分,而針對效度較低的部分作出更大的調整。
二、統(tǒng)計改革后的專業(yè)八級考試和學生英語專業(yè)課程成績之間的相關性數據,考慮是否將人文知識作為選考的獨立考試,作為英語專業(yè)學生專業(yè)學習效果的衡量標準
SAT考試分成SAT I和SAT II兩部分,前者主要考察學生讀、寫、算的基本學術能力,而后者則是根據不同學科進行的專項知識性測試,如美國歷史、數學、物理等,SAT II是學生根據自身情況和申請需要選做的。雖然美國大學委員會一直鼓吹SAT I是基于美國高中課程,但除了簡單數學部分以外,SAT I和美國高中教學內容沒有知識和內容上的直接關聯(lián)。加州大學在對78000名大學一年級學生進行數據分析后,發(fā)現(xiàn)改革前的SAT I在預測學生大學成績時不如SAT II。美國很多名校招生時需要或者建議考生提供SAT II的成績用來彌補SAT I的預測效度不足。其背后的主要原因是SAT II和美國高中課程的內容更加相符。
針對上述情況,在本輪SAT改革中,主辦方基于2009年創(chuàng)立的大學和就業(yè)預備標準(College and Career Readiness Standards)和由其所衍生出來的美國課程大綱做出了一系列的調整。如在閱讀部分中,開始要求學生了解18、19以及20世紀早期的美國文學,分析同一時代的不同文章怎樣討論同一話題,從而反映出學生在高中文學課中的知識掌握情況。又如,每次SAT考試的閱讀部分中必然會有一篇文章是美國建國文獻或歷史重要演講(如《聯(lián)邦黨人文集》),從而反映出學生在高中歷史課中的知識掌握情況。在數學中,增加“復數”運算和“高等數學”部分,從而反映出學生在高中數學課的知識掌握情況等。
在英語專業(yè)八級考試中,原有的人文知識部分被取消了。但在考綱中仍然要求考生掌握英語國家的政治、經濟、歷史、文化、教育和語言等知識。高等學校外語專業(yè)教育指導委員會除了盡量將相關知識融入到其他部分以外,還應當統(tǒng)計改革后的專業(yè)八級考試和學生英語專業(yè)課程成績之間的相關性數據。如果相關性偏低,則代表有需要通過其他方式輔助考查。
原有的人文知識部分確實存在缺陷,該部分雖只有10題,但覆蓋了英語專業(yè)的四門常見的專業(yè)選修課程,包括英語國家概況、英國文學、美國文學和語言學概論。在原有的考試形式中,平均每一門課程只能通過2到3題的選擇題進行考察,平均每一題考查最多四個知識點,相比每一門課程浩瀚的知識量,比例嚴重失調,偶然性較大,科學性欠缺。這很有可能就是該部分被取消的原因。
如果采取類似于英語專業(yè)八級口語與口譯考試的方法,將人文知識作為選做的獨立考試,則可以增加單次考試的題量,擴大知識覆蓋面,從而更全面客觀反映英語專業(yè)學生專業(yè)學習的效果。相應的,也可以促進各院校英語專業(yè)繼續(xù)保持對于英語專業(yè)文學、語言學和文化類課程的關注,在鼓勵學生選修的基礎上提高教學的深度,并利用清晰的考試范圍來進一步規(guī)范相關課程教學內容。同時,相關用人單位在招聘過程中以及相關院校在招收碩士研究生過程中也可將選考部分作為建議或要求的標準,鞭策有志應聘相關工作或報考相關學校專業(yè)的學生早作準備,并且彌補改革后的英語專業(yè)八級考試可能出現(xiàn)的在體現(xiàn)學生相關知識能力方面的不足。
三、建立英語專業(yè)八級考試成績與學生參加社會培訓機構輔導情況的相關性數據,主動消除不公平的因素
在上一部分所述加州大學進行的研究中,發(fā)現(xiàn)SAT成績容易受到社會經濟變量的影響。簡單說,家庭條件,父母受教育程度以及初高中學校水平等都在很大程度上影響著原有SAT考試的成績,構成了測試偏見問題。出現(xiàn)這個現(xiàn)象的一個重要原因就是社會經濟變量很大程度上影響著SAT的備考和表現(xiàn),因為備考改革前的SAT所需的資料和培訓課程價格不菲,對于低收入家庭是筆不小的開支。針對這一點,美國大學委員會和Khan Academy(可汗學院:由孟加拉裔美國人薩爾曼·可汗創(chuàng)立的一家教育性非營利組織,主旨在于利用網絡影片進行免費授課,現(xiàn)有關于數學、歷史、金融、物理、化學、生物、天文學等科目的內容,教學影片超過2000段,機構的使命是加快各年齡學生的學習速度)合作,在其網站上發(fā)布新SAT練習題等資料,盡量削弱社會經濟變量對新SAT成績的影響。
筆者認為,英語專業(yè)八級考試作為具有權威性,富有含金量的考試,也應考慮公平性問題,但與SAT考試類似的偏見情況也出現(xiàn)在原有考試中。由于英語專業(yè)八級考試僅針對英語專業(yè)和外語類院校少數相關專業(yè)學生,屬于相對“冷門”的考試,在絕大部分地區(qū)很難開設出具有盈利規(guī)模的培訓班,使其并不受到逐利的社會培訓機構的高度關注。但是在如北京、上海等高校集中的城市,由于英語專業(yè)學生基數較大,一些培訓機構仍然能每年開辦成一定規(guī)模的補習班。這就有可能造成不公平的情況:身在大城市高校的英語專業(yè)學生“近水樓臺先得月”,能夠通過社會培訓的力量強化應考技巧,取得更高的成績,而身在中小城市高效的英語專業(yè)學生即使有心接受培訓,但仍無力跨越地域的壁壘。另外,即使同在大城市高校,也可能有一些學生由于經濟原因無法參加社會培訓機構的補習班,使其相對經濟條件更好的同學處于非學習因素上的劣勢。
通過統(tǒng)計工作,高等學校外語專業(yè)教育指導委員會可以在大城市高校中比較學生有無參加過社會機構培訓與專業(yè)八級考試成績的相關性以及英語專業(yè)課成績與專業(yè)八級考試成績的相關性。如出現(xiàn)大量倒掛的情況,即專業(yè)課成績較差學生經過社會機構培訓后在專業(yè)八級考試中成績超出專業(yè)課成績較好的學生,則說明該考試的公平性受到了社會培訓機構的影響,在地域和經濟背景上造成了不公平。
如出現(xiàn)上述情況,則高等學校外語專業(yè)教育指導委員會應效仿美國大學委員會,通過非盈利的網絡課堂等平臺等無壁壘的方式發(fā)布習題等免費資料,并上傳公益性的應考技巧講座視頻,從而消除地域和經濟背景對考試公平性的影響。
四、積極處理同級別、同類型考試間的競爭和借鑒關系
對于美國的SAT考試來說,有一個重要的競爭對手,就是美國大學入學考試(ACT, American College Test)。該考試又稱“美國會考”,雖然在性質上與SAT考試有一定差異,但在作用上與其有明顯的重合,故形成了較為強烈的競爭關系。
ACT考試對于SAT的改革有較為明顯的促進作用。2013年,ACT考生人數首次超越SAT考生人數,于是美國大學委員會于2014年公布了改革方案。美國大學委員會屢次通過研究強調和加強考試預測效度也正是應對ACT對其所造成的競爭。ACT最重要的優(yōu)勢在于其與美國高中課程內容有更大的相關性,這一方面使一些高校認為其能更加客觀反映出學生在高中階段的學習情況,同時,ACT也使得更多考生只要將高中課程學習扎實,無需額外學習資料或課外輔導就能取得滿意的成績。這些都是其對于SAT地位產生沖擊的重要原因,也使SAT的主辦方迫于競爭壓力進行了針對性的改革(比如加強與美國高中課程的相關性)。
ACT考試對于SAT的改革有較位明顯的借鑒作用。本輪SAT改革中很多變化都有向ACT靠攏的跡象,如將選擇題選項數量從5個減為4個(ACT考試中絕大多數題目都為四個選項),從而降低考試難度。又比如取消原本的倒扣分制度,SAT考試在改革前采取錯題倒扣分制度,旨在鼓勵學生培養(yǎng)科學精神,杜絕胡亂猜測,但不少評論人士指出,大部分學生在做題時即使是猜測,也是基于已有知識的猜測(educated guess),不應打壓,加之ACT考試中沒有倒扣分制度,于是SAT主辦方在改革中迫于壓力取消潦倒扣分制度。另外,SAT主辦方還迫于ACT的競爭壓力降低了報名費用。盡管這些改變都可被視為是為了爭奪生源而采取的市場行為,但必須承認,這樣的良性競爭正在使SAT和ACT都在向更加科學和有利于考生的方向發(fā)展。
英語專業(yè)八級考試也面臨各類難度類似,或形式類似的考試的沖擊。無論是國外的托福(TOEFL,Test of English as Foreign Language),還是國內的中高級口譯考試都是受到社會各界廣泛承認的考試。作為英語專業(yè)八級考試,在并不與學位授予直接掛鉤的前提下,如要維持其含金量和權威性,就應當通過科學的方法證明及提高其預測效度。這也是本文所提出的建議的價值所在。
同時,英語專業(yè)八級考試也應當繼續(xù)保持積極借鑒其他考試優(yōu)點的良好傳統(tǒng)。在本次改革中,聽力部分新增的盲聽特征(即學生在收聽英語對話時并不能看到考題)就在托??荚囍写嬖?。在閱讀部分中,加入了主觀題,要求學生自己撰寫問題的答案,而不是單純的選擇,這樣的特征也在高級口譯考試的筆試中有所體現(xiàn)。在寫作部分中,加入了分析性寫作,又一次與托福不謀而合。
相信如果外語專業(yè)教學測試專家委員會保持危機意識,不斷通過科學的方法提升英語專業(yè)八級考試的預測效度,同時繼續(xù)博采眾長,不斷借鑒其他考試的可取之處,定能繼續(xù)保持該考試的權威性及相應證書的含金量。更重要的是,為各大高校英語專業(yè)的教學提供參考,為提高中國高校英語專業(yè)學生的學術及應用水平做出更大的貢獻。
參考文獻:
[1]Atkinson, R.C. Achievement versus Aptitude in College Admissions[C]. Rethinking the SAT: the future of standardized testing in university admissions, New York: Routledge, 2002.
[2]Briggs, D.C. Evaluating SAT Coaching: Gains, Effects, and Self-selection. Rethinking the SAT: the future of standardized testing in university admissions, New York: Routledge, 2002.
[3]關于英語專業(yè)八級考試(TEM8)題型調整的說明[EB/OL]
http://wenku.baidu.com/link?url=NT11TutacEU-rtaPUBm5Bar19ZTJvqfqI6BYi6NzDnDhmgEn3lNOVfierTgK4uxkB_dYU958RwhkO0Wa3TvU_X2ZaMCqkfhA7VHHJY2abBm
[4]Geiser, S. & Studley, R.E. Predictive Validity and Differential Impact of the SAT I and SAT II at the University of California[C]. Rethinking the SAT: the future of standardized testing in university admissions, New York: Routledge, 2002.
[5]Using the SAT to Connect Students and Colleges[EB/OL]
http://professionals.collegeboard.com/testing/sat-reasoning/about
[6]2016年SAT改革官方說明[EB/OL]
http://wenku.baidu.com/link?url=OrFzyTN7hnwd1UyV1lis-o5-OrR52JGkzvNxS72GX0wC7RfZBF-TBp8tOnPKoEw3Okzt8kpjJNTHTKn3Yxec7MeV1VH5hIRew99XuGRs6RC
作者簡介:
丁楨杰(1985~),男,浙江諸暨人,講師,碩士,主要從事口筆譯理論實踐及國內外英語測試研究。