苗 燕
(中國礦業(yè)大學外國語言文化學院,江蘇徐州221116)
英語專業(yè)八級口語與口譯測試(簡稱專八口試)于2003年4月首次推行,其中的口譯測試部分是一項測試英語專業(yè)學生口譯能力的水平考試。2003年4月,10所高校1486名考生參與了測試,同年12月再次舉行測試,30所高校3896名考生參與了測試。[1]自2004年以來,專八口試日趨成熟,但是總的來說全國的通過率不是很高,這與專八口試中的口譯測試內(nèi)容不無關系。根據(jù)英語專業(yè)教學新大綱(2000)[2],專八口試中的口譯部分旨在評估學生的外事口譯能力,測試內(nèi)容的主題應為國內(nèi)外的熱點新聞,在實際操作中,其口譯測試內(nèi)容也多為正式場合下的發(fā)言口譯,這對于學生來說有較大難度。此外,有些學生雖然通過了該項測試,但其在正式場合下的口譯能力仍然不盡如人意。因此,對專八口試中的口譯測試做一個詳細分析是極為必要的。本文擬研究專八口試中的口譯測試的內(nèi)容效度,因為效度是研究和評估一項測試的客觀標準,而內(nèi)容效度又是測試效度的一個重要組成部分。
測試效度指一套測試對應該測試的內(nèi)容所測的程度,所測量到的結果與要考察的內(nèi)容的吻合度,這是巴赫曼(Bachman)理論的重要組成部分。[3]語言測試的測試效度可分為不同種類,如內(nèi)容效度、預測效度、共時效度和構念效度等。內(nèi)容效度包括對測試所欲測量的行為領域加以定義和對測試項目的邏輯性設計,從而覆蓋該領域的所有重要部分。內(nèi)容效度的目的是評估這些項目是否充分代表了一個行為領域或者構造了一種特定利益。因此,內(nèi)容效度能夠更為直接地表明八級口試中口譯測試效度的高低。
衡量內(nèi)容效度有3個標準,即測試內(nèi)容與測試目的是否相關,測試內(nèi)容是否具有代表性以及測試內(nèi)容是否適合測試者,[4]即相關性,代表性和適合性。
口譯測試有不穩(wěn)定性、瞬間性和臨時性的特點。[5]因此,和外語的其他能力測試相比,口譯測試較難實施。世界各地的口譯測試都發(fā)展得較為緩慢,中國尤為如此。在中國,隨著經(jīng)濟的發(fā)展、對外交流的日益增強,近年來口譯測試得到了更多的關注。徐海銘教授在其《我國英語專業(yè)口語測試現(xiàn)狀的理論分析》[6]中指出:中國口譯測試發(fā)展緩慢的原因之一在于很難確定測試效度。如今,專八口試中口譯測試部分還依然存在著不足,雖然語言學者們展開了許多研究,但口譯測試的難度依然難以克服。
北京外國語大學著名應用語言學教授文秋芳對英語測試,尤其是英語專業(yè)四級考試、英語專業(yè)八級考試和專八口試做了大量寶貴的研究。在其名為《英語專業(yè)八級口語統(tǒng)測考試指南》中,文秋芳提到了專八口試的內(nèi)容和形式以及評分標準。在其另一篇名為《全國英語專業(yè)八級口試體系的研究與實施》[7]的論文中,文秋芳對全國專八口試的實施做了研究。這篇論文寫于2005年,當時它在專八口試中口譯測試部分方面算是一項比較全面的研究,但社會發(fā)展如此迅速,根據(jù)當今的標準它也許就略顯不足了。
南京師范大學教授徐海銘等在《我國英語專業(yè)口語測試現(xiàn)狀的理論分析》[8]中對專八口試中口譯測試部分的真實性、任務類型、評分標準、評分者培訓、測試模式和反撥效應做了深入分析。他們認為口譯測試的關鍵問題在于測試效度,他們還指出,專八口試中口譯測試部分僅僅關注口譯的理論和原則,因而測試的實施似乎過于簡單,以經(jīng)驗為導向的針對專八口試中口譯測試部分及研究還需要加以完善。
根據(jù)內(nèi)容效度的3個衡量標準,八級口譯測試的內(nèi)容效度取決于測試任務的選擇、材料的主題和考生對本次測試的反映。以下部分將根據(jù)相關性、代表性、真實性和適應性這4個標準對八級口譯測試的測試內(nèi)容進行充分分析。
所謂的相關性是指所選材料應限制在固定范圍之內(nèi),測試的內(nèi)容不允許超出教學大綱和學生的課程內(nèi)容??谧g課程是一門培養(yǎng)英語專業(yè)學生英語基本技能和技巧的課程,通過給予學生基本口譯理論和背景知識的指導,培養(yǎng)學生的基本口譯技能,讓學生學習記憶、復述、筆記及公眾演講等的技巧,掌握對某些話題接續(xù)口譯的能力,從而能夠準確且流利地進行英譯漢、漢譯英的口譯。[9]這種能力正是專八口試中口譯測試部分所要考察的能力,也是新教學大綱所要求的能力。因此,英語專業(yè)的學生應該能夠與外國人進行流利而得體的溝通,有條不紊地、連貫地發(fā)表他們對某件事情的深刻意見和見解。專八口試中口譯測試部分要求通過測試的考生能夠在正式的外事場合下進行口譯。[10]如果專八口試中口譯測試部分的內(nèi)容局限于英語口語領域,那么口譯能力會因為范圍過大而不能得到完全反映,因此口譯測試的內(nèi)容應該是口譯。在專八口試中口譯測試部分中,第一項任務是英譯漢,第二項任務是漢譯英??梢钥闯?,八級口譯測試的內(nèi)容范圍是明確的,因而是具有高度相關性的。
代表性是指測試在多大程度上充分地反映了內(nèi)容域(content demain)。[11]高度的代表性要求所選材料能夠廣泛涉及各個領域,但同時也要避免在保證了相關性后而局限于某些話題。根據(jù)2000年頒布的教學大綱,專八口試中口譯測試部分測試內(nèi)容的主題應該與外事活動密切相關。
筆者對八級口譯測試的試卷做了詳細的分析,從而發(fā)現(xiàn)測試內(nèi)容的主題為會議和宴會這類正式場合下的發(fā)言口譯。筆者將測試內(nèi)容分為企業(yè)介紹、宣傳或開幕祝詞(2004、2006 -2008、2010)、外交事務的政治性演說(2004-2005)、商務宴會致辭(2005)、歡迎致辭(2006)、學術會議演講(2007)、告別演說(2008)、致謝詞(2009),以及新聞發(fā)布會發(fā)言(2009-2010)。由此可以看出,所有這些發(fā)言或是與時事具有高度的相關性或是展示了深刻的文化底蘊,也就是說所選的主題范圍是相當廣泛的。這樣,一方面可以使學生在仿真情境中進行口譯,另一方面培養(yǎng)了其關注時事的意識。
從以上分析可以得出:專八口試中口譯測試部分極具口譯的代表性。
除了相關性和代表性,真實性是評估八級口譯測試內(nèi)容效度的另一個重要參數(shù)。
在口譯測試中,真實性是衡量測試內(nèi)容是否具有高度的內(nèi)容效度的尺子,直接反映內(nèi)容效度的代表性。巴赫曼提出的真實性也是指模擬測試內(nèi)容的代表性及一個給定的語言和目標應用任務的相符合的程度。[12]仿真度越高,真實性就越高。為創(chuàng)造交際情景作為語境,在實施口譯測試時要遵循真實性的法則。在語言測試領域,有分別以巴赫曼和帕默(Palmer)為代表的兩派。盡管他們都認為真實性是一個給定語言任務和目標應用任務的相符合的程度,但巴赫曼傾向于用“現(xiàn)實的”方式來論證真實性,這種方法可以通過設計模擬實際語言運用的場景的測試來實現(xiàn)。
在英語口語測試領域,“現(xiàn)實的”方法得到了廣泛使用,如求職時的英語口語面試。此外,大學英語四、六級的口語測試也都基本上采用這種方式。[13]這種方法也可以應用到口譯測試中。根據(jù)前面對專八口試中口譯測試部分的內(nèi)容分析,專八口試中口譯測試部分的內(nèi)容主要是會議和宴會這類正式場合下的發(fā)言,這些和現(xiàn)實生活中發(fā)生的事情是一樣的。因此,模擬的場合對于保持真實性是合適的。
筆者選了兩份專八口試中口譯測試部分樣本試卷,對材料的主題進行更詳細的分析,并以此來檢驗測試的內(nèi)容是否適合學生。對于第一項任務英譯漢,從這兩份樣本中可以觀察出既沒有晦澀的單詞,也沒有過于復雜的句子,表達方式也非常地道明了。因此,學生很容易理解,而且從上面的分析也可以推斷出第一項任務的內(nèi)容效度并不低。至于第二項任務漢譯英,樣本試卷中所選的詞語是正式且常見的,句子不長不短,適合學生進行口譯。因此,根據(jù)筆者的分析,第二項任務的內(nèi)容效度也是適當?shù)摹?/p>
至于材料的長度,筆者選擇了2004-2005、2008和2010年的樣本試卷,并給出了原文長度的詳細數(shù)據(jù),見表1表2。
表1 英譯漢
表2 漢譯英
如以上表1表2數(shù)據(jù)所示,第一項任務的材料長度相對而言逐年遞增,第二項任務也是如此。因此可以推斷出專八口試中口譯測試部分的難度正在逐年增大,因為社會需要更有能力的口譯員。因此,學生應在日常訓練中用較長的材料來鍛煉自己。
在2011年專八口試之后,為了能夠更加全面而準確地分析考生對試題難易程度的反映,筆者對中國礦業(yè)大學的考生做了一項問卷調(diào)查以獲取他們對此次測試的評價。該問卷包括兩部分,第一部分是調(diào)查學生對試題難易程度的看法,第二部分是調(diào)查學生對試題長度的意見。發(fā)出的90份問卷中82份被收回,78份得到分析。問卷調(diào)查結果見表3表4:
表3 試題難度(學生總數(shù):78)
表4 試題長度(學生總數(shù):78)
正如參加過專八口試口譯測試的學生反映,盡管他們?yōu)榱舜隧棞y試修了口譯課,但對于他們大多數(shù)人來說,若想在專八口試口譯測試中表現(xiàn)良好還沒有那么容易。然而,由于參加此次問卷調(diào)查的學生數(shù)量有限,此項調(diào)查僅能反映部分學生對此次測試的看法。為了能夠讓考生對試題難度的反映更具說服力,筆者將中國礦業(yè)大學的專八口試口譯測試通過率與全國其它高校的通過率進行了比較。
表5 通過率
從表5可以明顯看出,中國礦業(yè)大學的通過率比全國平均通過率高。中國礦業(yè)大學外國語言文化學院在全國170所高校的外語學院中排行名次約為第60到第70名,學生的英語水平相對較高。[14]因此,可以得出結論:表格3和表格4中的數(shù)據(jù)在一定程度上是有效的。
關于專八口試口譯測試的記錄形式,錄音沒有錄像那么有效。原因是通過錄像口譯,評分者不僅可以判斷學生的溝通能力,而且還可以觀察學生的口譯特點,如手勢、表情、素養(yǎng)、方法等。但由于資源和技術的匱乏,這種想法至今尚未得到落實。
根據(jù)筆者的分析,盡管專八口試口譯測試部分的內(nèi)容效度是較高的,但由于社會對口譯員的口譯能力要求日益提高,專八口試口譯測試部分還存在許多不足和問題,因此口譯的內(nèi)容應緊隨社會的發(fā)展和日益提高的要求。此外,測試的內(nèi)容應保證能被大多數(shù)學生所接受,也就是說不能太難,也不能太過簡單。
至于專八口試口譯測試部分的主題,大多數(shù)主題是合理的。因此,企業(yè)介紹、新聞發(fā)布會發(fā)言等主題應當保留。然而在現(xiàn)實生活中,也有許多各種各樣的正式場合,這些內(nèi)容都可以用來作為口譯測試的素材,這包括政治、經(jīng)濟、文化和公益事業(yè)等方面的材料。因此,試卷出題者應該擴大內(nèi)容的范圍,從而使專八口試口譯測試部分具有更高的代表性,相關性和真實性。
根據(jù)效度理論和一些學者對八級口譯測試的研究,本文通過分析試卷的口譯部分對八級口譯測試的內(nèi)容效度進行了研究。根據(jù)前面對內(nèi)容效度的論證和對測試內(nèi)容的分析,可以得出專八口試口譯測試具有較高的內(nèi)容效度這一結論。
[1][7]文秋芳,王文宇,周丹丹,王艷.全國英語專業(yè)八級口試體系的研究與實施[J].外語界,2005,(5):53.
[2][9]高等學校英語專業(yè)英語教學大綱(修訂版).高校外語專業(yè)教學指導委員會英語組.上海:上海外語教育出版社,2000:19.
[3][4]鄒申.TEM 考試效度研究[M].上海:上海外語教育出版社,1997.97.
[5][6][8]徐海銘,徐忠明.我國英語專業(yè)口語測試現(xiàn)狀的理論分析[J].南京師大學報(社會科學版),2006,(2):92-98.
[10]文秋芳,吳克明,王文宇,任裕海.全國英語專業(yè)八級口試的可行性研究[J].外語界,2002,(4):67.
[11]Messick,S.Validity[A].In R.L.Linn(eds.)Educational Measurement,3rd edition[C].New York:American Council on Education and Macmillan,1989:39.
[12][13]鄒申,楊任明.簡明英語測試教程[M].北京:高等教育出版社,2005.
[14]http://wenku.baidu.com/view/59c3a340a8956bec0975e338.html.