華有杰
(賀州學院,廣西 賀州 542800)
英語寫作測試信度保障機制構建研究
——以賀州學院寫作教學為例
華有杰
(賀州學院,廣西 賀州 542800)
以賀州學院英語專業(yè)本科寫作教學為例,本研究突破傳統(tǒng)的寫作測試評分的印象法及分析評分法的局限,提出寫作測試評分模塊與等級相結合的模型,在每個模塊中區(qū)分六個等,最大限度提高寫作測試評分的效度.
英語寫作測試;模塊;等級
人們對英語測試的寫作部分總會認為其信度不高.傳統(tǒng)的英語寫作印象法評分更是成為人們詬病英語寫作測試的理由之一.事實上,不少學者的專門研究英語寫作測試傳統(tǒng)評分機制,得出結論:傳統(tǒng)英語寫作測試評分信度過低.這主要體現(xiàn)于兩個方面:評分員自我縱向評分的不一致性及評分員之間橫向評分的不一致性.
在日常英語教學的英文寫作測試中,評分員往往就是英語寫作的任課教師,故直接影響寫作測試評分的因素至少有以下幾個方面:其一,學生作文中明確寫出來的東西;其二,評分員認為學生作文中所要表達的東西;其三,學生英語作文的書寫及文章總體外觀;其四,評分員對學生原有的了解.除此之外,學生參加寫作測試的狀態(tài)及評分員評分的狀態(tài)等都會影響英語寫作測試的評分.“對于同一篇作文,不同的老師給的分數(shù)很可能不一樣.甚至同一位老師在不同的時間給的分也不一樣.”[1]
為明確不同評分員之間評分的差異,本研究將一次英語寫作滿分為20分的五名學生的作文描述件給了四名不同的專業(yè)教師進行評分,評分結果如下表.
甲乙丙丁A 14 10 9 9 B 11 9 6 12 C 10 8 5 10 D 7 7 2 11 E 5 6 1 6合計 47 40 23 48
R甲=9,R乙=4,R丙=8,R丁=6.數(shù)據(jù)表明,丙、丁兩評分員所給分數(shù)全距相對比較接近,甲與乙的分數(shù)全距相差較遠;甲評分員給分范圍最大,乙評分員給分范圍最也..數(shù)據(jù)表明,甲與丁兩評分員所給分數(shù)的平均分大體相當,丙評分員評分最為嚴格,平均分最低.
S甲=3.03,S乙=1.41,S丙=2.87,S丁=2.10.數(shù)據(jù)表明,甲評分員給分波動性最大,乙評分員評分波動最小.
評分員丁與其他評分員的給分重點存在顯著差異.
寫作測試評分的不可靠性遠不止這些.同一學生在相隔較短的時間內容參加難度大致相當?shù)牟煌瑢懽鳒y試,理論上而言,該學生的得分應大致相當,但現(xiàn)實中根本無法保證.這既受學生自身狀況的影響,又受評分員的影響.甚至同一份試卷由同一評分員評閱,不同時間的評閱分數(shù)也相差甚遠.
由此可知,寫作測試的評分主觀性和片面性是不可避免的.
盡管寫作測試有上述種種不可靠性,寫作測試在實踐中的作用卻是不可低估,寫作測試被廣泛運用于各類英語考試當中,因為學生用自己的語言組織和表達思想和觀點的能力在日常交際中至關重要.故寫作測試不單可以用作學生寫作技能培養(yǎng)的重要手段,還可以作為英語學習高級階段教學反拔效果檢測的重要工具.如果能形成一種信度較高的英語寫作測試的評分機制,以保證英語寫作測試的信度,則英語寫作測試的效果也不會低于其他客觀性測試的效果.
當然,不能用把寫作測試評分的所有主觀因素排除,或用精心制訂的懲罰制度來確保英語寫作測試的客觀性評分基礎,從而提高英語寫作測試的信度.然則,只要以充分考慮和處理好英語寫作測試評分機制中的主觀因素,找到一種新方法,這種方法能夠克服傳統(tǒng)寫作測試評分手段中因主主觀因素而內在的不可靠性,則英語寫作測試評分機制的信度是可以大大提高的.
針對傳統(tǒng)英語寫作測試評分方法中不可靠性,本研究提出英語寫作測試的等級+模塊評分機制.這種機制首先將學生英語寫作的能力水平區(qū)分為優(yōu)秀、很好、好、一般、差、很差六個等級.其次,將學生英語作文評分的學生證言使用劃分為內容、篇章結構、語言使用、詞匯、拼寫、標點符號、連貫性、切題等若干個方面.制定英語寫作測試評分標準首先要研究評分的幾個構成部分.結合筆者日常英語寫作教學工作,本研究以賀州學院英語專業(yè)四級考試和英語專業(yè)八級考試專項教學中的寫作測試為例,把英語寫作測試具體劃分為內容、篇章結構、詞匯、語言使用、其他等五個模塊,每個模塊都被賦予一定的權重.等級與模塊結合后,每一個模塊都區(qū)分六個不同的等級,給出相應的等級分數(shù).
等級劃分有總體等級劃分與模塊等級劃分兩種.總體等級劃分是對學生英語寫作測試的總體表現(xiàn)給出一個具體描述,區(qū)分六個不同等級,每個等級都有相對應的分數(shù)區(qū)間.模塊等級劃分是把學生英語作文中的語言使用區(qū)分為內容、篇章結構、語法、語言使用及詞匯、其他等具有一定分值權重的五個模塊.一個模塊就是評分的一個考察點.每個模塊都劃分優(yōu)秀、很好、好、一般、差、很差六個等級.以百分制為例,本研究的英語寫作測試評分總體等級劃分描述如下.(1)優(yōu)秀(90-100分):完全完成了寫作測試規(guī)定的任務.語言流暢自然、幾乎沒有語法錯誤,具體而言:內容覆蓋所有內容要點;使用了較多甚至復雜的句法結構和詞匯;語法結構或詞匯使用方面有部分錯誤,但主要是因為使用較為復雜的句法結構或較為高級的語匯所致;具備較強的語言運用能力.(2)很好(70-89分):完全完成了寫作測試規(guī)定的任務.選詞用句變化豐富、句式結構多變,沒有基本的語法錯誤,具體而言:雖然遺漏一到兩個次重點,但內容覆蓋所有主要內容;使用能夠滿足任務要求的句法結構和詞匯;語法結構或詞匯使用方面基本準確,主要語法錯誤主要是因為嘗試使用較為復雜的句法結構或較為高級的語匯所致;應用簡單的語句間連接成分,使全文結構緊湊,達到一寫作測試的預期目的.(3)好(60-69分):基本完成了英語寫作測試規(guī)定的任務.遺漏部分內容要點,但基本意思沒有遺漏太多.語言句式簡單,但表述清楚、自然,有一定的語法錯誤,但不是太多.信息能夠基本清楚地傳達給讀者.(4)一般(45-59分)未適當完成英語寫作測試規(guī)定的任務.遺漏或未描述清楚一些主要內容,寫了一無關內容.語法結構單調,詞匯使用比較單調.有一些語法結構或詞匯的錯誤,影響了對寫作內容的理解.較少使用語句之間的連接成分,內容缺少連貫性.信息未能清楚地傳達給讀者.(5)差(31-44分)未完成英語寫作測試規(guī)定的任務.明顯遺漏主要內容,出現(xiàn)了一些無關內容,原因可能是未理解寫作測試的相關要求.語法結構過于單調,所使用的詞匯有限.寫作中存在較多的語法結構呀詞匯方面的錯誤,影響對寫作內容的理解.缺乏語句之間的連接成分,內容不連貫.信息未能傳達給讀者.(6)很差(0-30分)未能傳達讀者任何信息.內容太少或太亂或基本與寫作測試要求無關這種等級標準的描述既可用于日常的教學隨堂測試,也可以用于具有一定規(guī)模的英語寫作測試.
這種總體等級標準也是動態(tài)的.在日常教學,本課題組針對英語專業(yè)四級和專業(yè)八級寫作測試的不同要求,形成以下兩個不同的等級標準.1.英語專業(yè)四級寫作標準(1)優(yōu)秀:語言流暢地道,幾乎沒有語病,完全達到寫作要求(2)很好:選詞造句變化豐富,鋪路工結構多變,沒有基本的語?。?)好:語言句式不是復雜,但能完成寫作任務,表述簡單自然,語法錯誤不是太多(4)一般:語句基本正確,但有些地方不太流暢,有部分語法錯誤.(5)差:語言、語法使用不當,無法完成寫作任務(6)很差:語言毫無章法,缺乏基本的英語知識2.英語專業(yè)八級寫作標準(1)優(yōu)秀:完全沒有語法錯誤,內容充實,語言變化豐富,表達得體,完全完成寫作任務.(2)很好:較好地完成寫作任務,語言自然、流暢,幾乎沒有語法錯誤.(3)好:語言表達正確,沒有基本的語法錯誤,論述緊扣主題.(4)一般:能夠完成寫作任務,語言正確自然.(5)差:大體能完成寫作任務,但有一定的語法錯誤,語言生硬.(6)很差:有基本語法錯誤,詞匯量過小.
日常教學中,筆者分別運用上述兩表對英語專業(yè)學生模擬專業(yè)四級及英語專業(yè)學生模擬專業(yè)八級考試的寫作測試進行評分,不同評分員對同一學生的評分要比沒有任何標準的傳統(tǒng)印象評分法的信度高得多.為進一步提高英語寫作測試的信度,筆者結合《高級英語》的寫作教學及《英語寫作》等課程教學,將英語寫作測試的評分標準進一步細化成內容、篇章結構、語法、語言使用及詞匯、其他等具有一定分值權重的五個模塊.權重分布如下.
模塊 內容 篇章結構 語法 語言使用詞匯 其他權重 0.3 0.2 0.2 0.25 0.05
在實際寫作測試評分中,對每一個評分模塊又細分為優(yōu)秀、很好、好、一般、差、很差六個等級.為與平時教學的百分制接軌,沒整個寫作測試滿分為100分,則內容為30分,篇章結構為20分,語言使用及為25分,詞法為20分,其他5分.每個模塊的分數(shù)等級及標準如下.1.寫作內容模塊評分標準(1)優(yōu)秀:30-26分,完全完成寫作任務,內容詳實,覆蓋所有要點(2)很好:25-21分,很好完成寫作任務,內容充實,雖漏掉一兩個次重點,但覆蓋所有要點.(3)好:20-16分,能夠完成寫作任務,內容基本全面,雖漏掉一兩個次重點,覆蓋所有要點.(4)一般:15-11分,基本完成寫作任務,內容要點有部分缺漏,有一些無關內容.(5)差10-5分,不能完成寫作任務,內容核心部分缺失,有一定的無關內容.(6)很差:4-0分,完全無法完成寫作任務,所寫的東西基本與主題無關.2.篇章結構模塊評分標準.(1)優(yōu)秀:20-18分,完全完成寫作任務,層次分明,結構緊湊.(2)很好:17-14分,很好完成寫作任務,層次分明,結構基本緊湊(3)好:13-10分,能夠完成寫作任務,層次基本分明,結構基本緊湊.(4)一般:9-7分,基本完成寫作任務,層次基本分明,結構不夠緊湊.(5)差:6-4分,不能完成寫作任務,層次不夠分明,結構不夠緊湊.(6)很差:3-0分,完全無法完成寫作任務,所寫的東西毫無結構與層次.3.語法模塊評分標準(1)優(yōu)秀:20-18分,完全完成寫作任務,語法正確,能有效交流.(2)很好:17-14分,很好完成寫作任務,幾乎沒有語法錯誤,能有效交流,(3)好:13-10分,能夠完成寫作任務,有些許語法錯誤,但不影響能正常交流(4)一般:9-7分,基本完成寫作任務,語法不正確.(5)差:6-4分,不能完成寫作任務,很多語法不正確,影響交流.(6)很差: 3-0分,完全無法完成寫作任務,所寫的東西語法全部錯誤,無法交流.4.語言使用與詞匯模塊評分標準.(1)優(yōu)秀:25-22分,完全完成寫作任務,詞匯使用豐富多變,得體、精確(2)很好:21-18,分很好完成寫作任務,詞匯使用豐富,得體、準確(3)好:17-13分,夠完成寫作任務,詞匯使用得體、準確.(4)一般:12-9分,基本完成寫作任務,詞匯使用基本得體、部分詞使用不夠準確.(5)差:8-5分,不能完成寫作任務,詞匯使用不夠得體、不夠準確.(6)很差:4-0分,完全無法完成寫作任務,詞匯使用不得體、不準確5.其他方面模塊評分標準.(1)優(yōu)秀:5分,完全完成寫作任務,標點符號使用正確,拼寫正確.(2)很好:4分,很好完成寫作任務,標點符號使用與拼寫幾乎沒有錯誤(3)好:3分,能夠完成寫作任務,標點符號使用與拼寫正確,有一些錯誤(4)一般:2分,基本完成寫作任務,標點符號使用與拼寫基本正確,有一些錯誤(5)差:6-4分,不能完成寫作任務,標點符號使用與拼寫有較多的錯誤(6)很差:0分,完全無法完成寫作任務,標點符號使用與拼寫都是錯誤.
模塊劃分的理論依據(jù)是結構主義語言學理論中交際語言能力模式.該模式認為,交際語言能力構成的主要因素是可以分解為語言知識和語用知識.語言知識包括語法知識和語篇知識兩塊,前者含詞匯、句法、語音及書寫等方面的知識,后者含語句連結、修辭及會話等方面的知識.語用知識也有兩個方面:功能知識與社會語言知識.功能知識包括達意功能、操縱功能、傳授功能及想象性語言能等.社會語言知識則包括各種語言變體知識,如方言,語體知識、文化習俗知識、修辭知識等方面.[2]
基于以上等級+模塊的評分機制,本課題組改造傳統(tǒng)的寫作測試評分的印象法,并提出分析評分法工作制.
傳統(tǒng)的寫作測試印象評分法的做法是,一個或幾個評分員對一份試卷給單獨給出分數(shù).分數(shù)評的評定是評分員基于學生寫作所做的總體印象,評分員對這種總體印象做出判斷,不必在評分過程中細抓作文的各個細節(jié).這種判斷基本上是評分員個人的主觀判斷,通常會受評分員自身的各種狀況的影響,如評分員的情緒、個人偏見、細心程度、疲勞程度等.為克服這種印象評分法的不可靠性,本課題級通常是由4個專業(yè)教師組成一個評分小組,先組織評分小組的成員學習評分標準各個等級的描述.培訓結束后馬上開始評閱工作.四位評分員對同一份試卷做出評分,然后一個平均分.這種平均分的信度往往要比單個評分員的分數(shù)的信度高.各評分員對一份試卷出現(xiàn)偏差比較大時,對該試卷重新進行評分.在沒有區(qū)分等級評分標準的情況下,各評分員之間的評分差別較大,但運用英語寫作測試評分總體等級劃分描述標準后,要求每一位評分員快速讀完學生作文,然后在印象中大體定級,定級后級出具體分數(shù).這種多人評分員制既給每個評分員充分的評分自主權,又要求評分細心閱讀學生作文,從宏觀上把握整個作文的質量.這往往會使評分員很快疲勞.當評分員感到比較疲勞時,建議評分員暫停評閱工作,適當休息后重新評閱.這種多人制印象評分法的優(yōu)勢就是在于節(jié)省時間.這一點對大規(guī)模的考試而言尤為明顯.
當然,在高校日常教學中,每次都組織多位專業(yè)教師對日常寫作測試進行評分不太現(xiàn)實,切實可行的方法是任課教師自己一個人為評分員.這時,為克服印象法中評分員的主觀性,提高評分的信度,分析法成為首選.分析評分法首先要預先精心制定好評分細則.這些評分細則就是上文中的模塊評分標準.模塊評分標準在日常寫作教學中可操作性強;只要熟悉模塊標準,任何一個評分員都可依標準盡量客觀地給出模塊分數(shù),然后計算出寫作總分.每個模塊的分數(shù)對教師的教學具有很高的指導作用,使教師明確自己教學的優(yōu)勢與劣勢,對不足之處采取相應的措施予以補救.而每個學生也能夠清晰地知道自己每個模塊的得分,非常有利于學生針對自己的薄弱環(huán)節(jié)進行努力.
每一次考試模塊的劃分及每個模塊的具體標準都可以依據(jù)不同程度的考試而靈活制定.如基礎階段可以側重語法與詞匯,中級與高級階段側可以更多地關注作文的流暢程度.
與印象法相比,分析法相當費時.故在大規(guī)劃的考試中更多地采用印象法評分,在日常的教學中采用分析法能夠更有效地指導教學.研究表明,印象法單個評分員的信息最低,多人制印象法總體評分的信度比分析法單個評分員的信度更高,而多個評分員用分析法得出的平均分信度最高.
等級+模塊的評分機制
英語寫作測試由于評分員的主觀因素而不可避免地具有不可靠性.用總體等級劃分的標準改造傳統(tǒng)的印象法,形成多人制印象法評分法,其信度可以大大提高.用模塊等級劃的標準將學生英語寫作測試的評分要點細分為不同的得分模塊,采用分析法評分,英語寫作測試的信度最高.具體劃分哪些模塊,每個模塊的權重各是多少都可以根據(jù)考試的不同程度與考試的不同目的靈活制定.在高校日常的英語寫作教學中,教師可能根據(jù)實際靈活選用一種或兩種評分方法,以取得最佳效果.
〔1〕Heaton, J.B.英語測試[M].北京:外語教學與研究出版社,2000.
〔2〕武尊民.英語測試的理論與實踐[M].北京:外語教學與研究出版社,2002.5-9.
H319
A
1673-260X(2014)03-0183-03
本文系廣西教育教學“十二五”規(guī)劃課題成果+《生態(tài)美學式翻譯教學模式的構建研究》(2013C078)