寫作測評工具在大學(xué)英語中的應(yīng)用研究綜述

2013-04-29 11:34:40陳周云遲秀湘牛潔珍

考試周刊 2013年52期

陳周云遲秀湘牛潔珍

摘要：現(xiàn)代教育信息技術(shù)應(yīng)用于語言測試和教學(xué)領(lǐng)域是大勢所趨，本文介紹了目前國外比較流行的八種寫作測評工具。相比較而言，國內(nèi)對于寫作在線測評工具的研究尚處于初始階段，主要體現(xiàn)在三個(gè)方面：理論介紹、模型構(gòu)建和實(shí)證研究。雖然這項(xiàng)技術(shù)具備很大優(yōu)勢，但是在技術(shù)革新和實(shí)際應(yīng)用方面仍然面臨諸多挑戰(zhàn)，急需更多的實(shí)證研究達(dá)到最佳應(yīng)用效果。

關(guān)鍵詞：寫作在線測評工具信息技術(shù) 語言測試

一、引言

現(xiàn)代教育技術(shù)的發(fā)展與普及為語言教學(xué)和語言測試的發(fā)展帶來了契機(jī)，寫作在線測評工具不斷研制、開發(fā)和應(yīng)用就是一個(gè)極好的例子。寫作在線測評工具就是利用現(xiàn)代教育技術(shù)對語言學(xué)生的作文進(jìn)行在線判斷、評分并且給出及時(shí)反饋的計(jì)算機(jī)軟件系統(tǒng)。它以反饋、調(diào)控和改進(jìn)為目的，具有改善教學(xué)活動(dòng)、監(jiān)控寫作過程的功能，能夠達(dá)到及時(shí)反饋、改進(jìn)、調(diào)控學(xué)生學(xué)習(xí)進(jìn)程的效果。作為衡量語言輸出能力的重要指標(biāo)——寫的能力，無論是檢測還是平時(shí)訓(xùn)練，都需要客觀、公正的評閱者，給予及時(shí)、中肯的反饋，同時(shí)為學(xué)生提供不斷修正、改進(jìn)的機(jī)會(huì)，敏銳地捕捉他們的點(diǎn)滴進(jìn)步，調(diào)動(dòng)他們的寫作積極性。計(jì)算機(jī)技術(shù)和信息系統(tǒng)的日新月異為解決這一亙古難題帶來了希望，國內(nèi)外各個(gè)領(lǐng)域的專家學(xué)者們紛紛研制開發(fā)寫作在線評閱工具。這種寫作在線評閱工具主要應(yīng)用于語言測試和語言教學(xué)領(lǐng)域，針對已經(jīng)輸入計(jì)算機(jī)內(nèi)部的學(xué)生作文文本進(jìn)行評閱，主要用在高風(fēng)險(xiǎn)考試中，作為人工評分的補(bǔ)充進(jìn)行實(shí)際評分；還可以用在語言教學(xué)中，對學(xué)生的寫作能力進(jìn)行診斷、提供修改建議等。

二、國外寫作測評工具綜述

該項(xiàng)技術(shù)的研究始于20世紀(jì)60年代的美國，目前國外較為成熟的寫作自動(dòng)測評工具主要包括：Project Essay Grade（PEG），Intelligent Essay Assessor（IEA），Electronic Essay Rater（E-rater），Criterion，IntelliMetric，Bayesian Essay Test Scoring System（BETSY），My Access！，以及Writing Roadmap2.0（WRM）系統(tǒng)等。

1.PEG

作為最早被開發(fā)出來的寫作自動(dòng)測評工具，PEG主要針對所輸入文本的一些容易量化的特征，如：長度（包括文章、句子、甚至單詞的長度）、標(biāo)點(diǎn)符號、語法等因素，利用統(tǒng)計(jì)中的多元回歸分析，給文章評分。盡管PEG在實(shí)際應(yīng)用中與人工評分有著很高的相關(guān)性，準(zhǔn)確率也很高，但是由于PEG的評分標(biāo)準(zhǔn)只是表層特征，忽視或者說沒有辦法量化文章的本質(zhì)特征，如：內(nèi)容的相關(guān)性、組織體裁、作者的觀點(diǎn)態(tài)度、篇章結(jié)構(gòu)等，而且不能提出反饋，因此沒有得到教育界的認(rèn)可和接受。不管怎樣，PEG是利用計(jì)算機(jī)代替人工閱卷的首次嘗試，為后來的技術(shù)改進(jìn)奠定了基礎(chǔ)。

2.IEA

IEA的基本原理是潛在語義分析——LSA（latent semantic analysis）技術(shù)。潛在語義分析用于作文評分時(shí)有三個(gè)步驟：首先，要挑選出有代表性的作文范文樣本；其次，這些樣本被表示為潛在語義分析中使用的變量；最后，待評分作文在內(nèi)容和概念的相關(guān)性上與這些樣本進(jìn)行比較，從而取最類似范文的平均分?jǐn)?shù)（韓寧，2009）。與PEG只關(guān)注文本的表面語言特征相比，IEA關(guān)注文本的整體內(nèi)容，同時(shí)包含對文本的寫作技巧，如語法、標(biāo)點(diǎn)等的反饋，與人工評分的相關(guān)性也很高，具有更大的教育價(jià)值，是作文自動(dòng)評分系統(tǒng)的重大突破。由于該方法只能對作文內(nèi)容進(jìn)行評價(jià)，而不顧作文的語言質(zhì)量，因此評分效度很難保證。而且其設(shè)計(jì)初衷是為評價(jià)本族語作文所用，如果用于評測外語學(xué)習(xí)者的作文，其信度和效度就很難取得令人滿意的效果。

3.E-rater

E-rater利用了多種技術(shù)，如統(tǒng)計(jì)技術(shù)、矢量空間模型技術(shù)和人工智能中的自然語言處理技術(shù)，因此，E-rater既能夠像PEG那樣評判作文的語言表層特征，又能夠像IEA那樣評判作文的內(nèi)容質(zhì)量。此外，E-rater還能夠?qū)ψ魑牡钠陆Y(jié)構(gòu)進(jìn)行分析。E-rater兼顧作文的內(nèi)容和語言形式，是一種混合的自動(dòng)評分系統(tǒng)，與人工評分之間的一致性達(dá)到了最高點(diǎn)。然而，E-rater并非十全十美。其旨在分析語言質(zhì)量的句法多樣性分析模塊不能全面衡量語言質(zhì)量的其他方面，如詞法、語言的準(zhǔn)確性等，從而影響了評分信度。另外，其旨在分析內(nèi)容質(zhì)量的主題內(nèi)容，分析模塊所使用的信息檢索技術(shù)，與IEA所使用的潛在語義分析相比，有點(diǎn)落伍，不能有效排除由于詞匯同義和歧義所產(chǎn)生的干擾信息。其帶有創(chuàng)新意義的篇章結(jié)構(gòu)分析模塊主要靠在文本中搜索話語標(biāo)記語，像in conclusion、first of all等容易產(chǎn)生不良的反撥作用，致使考生認(rèn)為，只要多使用這些話語標(biāo)記語就可以得高分。（梁茂成，文秋芳，2007）

4.Criterion

作為一個(gè)基于互聯(lián)網(wǎng)的作文評分和評價(jià)服務(wù)系統(tǒng)，Criterion不僅可以用于考試評分，還可以給出作文個(gè)性化的診斷性反饋。其技術(shù)核心是綜合了E-rater和另一個(gè)軟件系統(tǒng)Critique，前者提供評分，后者可以對作者寫作能力提供診斷信息，包括語法、用詞及寫作機(jī)制（比如大小寫、標(biāo)點(diǎn)符號）等多方面。Criterion的改進(jìn)主要體現(xiàn)在三個(gè)方面：能評判與分析事先訓(xùn)練過的作文題目、能夠給出所有題目（包括新提供的題目）的診斷反饋信息、可以適用于母語非英語的寫作。雖然其反饋的類型比較有限，但是Criterion在提供形成性反饋信息方面畢竟邁出了一大步，開創(chuàng)了寫作評價(jià)工具服務(wù)于教學(xué)的先河。

5.IntelliMetric

IntelliMetric是第一套基于人工智能技術(shù)開發(fā)出的作文評分系統(tǒng)，取代E-rater用來給GMAT作文評分。它能夠模仿人工評卷，對作文的內(nèi)容、形式、組織和寫作習(xí)慣進(jìn)行評分，集中了人工智能、自然語言處理和統(tǒng)計(jì)技術(shù)的長處，是一種能夠內(nèi)化專家級評卷員集體智慧的學(xué)習(xí)機(jī)。它開發(fā)了能夠分析詞性和句法關(guān)系的自然語言處理技術(shù)，依據(jù)英語標(biāo)準(zhǔn)書面語的主要特征，內(nèi)化作文中與某些特征相關(guān)的每一個(gè)得分點(diǎn)評判作文。IntelliMetric能夠評估作文中語義、句法、篇章3個(gè)層次的300多項(xiàng)特征。據(jù)稱在性能方面能夠跟專家級評卷員給出的分?jǐn)?shù)一樣準(zhǔn)確。另外，IntelliMetric能夠評閱除了英語以外的其他多種語言的作文。

6.BETSY

BETSY以概率論為指導(dǎo)，其核心原理是貝葉斯分析方法，基于訓(xùn)練語料對文本進(jìn)行分類的程序。該系統(tǒng)使用了包括內(nèi)容與形式方面的一個(gè)大型特征集，根據(jù)優(yōu)、良、合格、不合格四個(gè)類型尺度，把一篇作文劃分到一個(gè)最合適的集合中。其開發(fā)者聲稱這個(gè)程序集合了PEG、LSA、E-rater的優(yōu)點(diǎn)并且具有自己的特色。例如，能夠用于短文評測，產(chǎn)生診斷性結(jié)果，可以非常方便地應(yīng)用于不同的學(xué)科專業(yè)范圍，并且其結(jié)果對非統(tǒng)計(jì)人員來說通俗易懂，可免費(fèi)下載使用。

7.My Access！

My Access！主要為學(xué)生提供一個(gè)寫作環(huán)境，能夠迅速形成結(jié)構(gòu)化的形成性反饋和診斷報(bào)告，學(xué)生可以根據(jù)這些結(jié)果修改自己的作文，改進(jìn)寫作技巧。同時(shí)也為教師提供了一個(gè)基于網(wǎng)絡(luò)的輔導(dǎo)環(huán)境，可以選擇多種的報(bào)告格式，瀏覽學(xué)生的歷史記錄，分析學(xué)生的錯(cuò)誤，把學(xué)生按水平分組，等等。My Access！還被大規(guī)模地應(yīng)用于課堂教學(xué)。大部分研究表明教師和學(xué)生對My Access！的使用持積極肯定態(tài)度，使用后學(xué)生成績也有明顯提高。教師對系統(tǒng)的積極態(tài)度和正確使用及對學(xué)生的正面引導(dǎo)，系統(tǒng)評價(jià)、教師評價(jià)、同行互評等相結(jié)合是最佳使用方法。

8.WRM2.0

WRM2.0是美國McGraw-Hill公司設(shè)計(jì)的寫作在線形成性評價(jià)工具。該系統(tǒng)可以針對作文的語言形式（如拼寫、詞匯、語法結(jié)構(gòu)等）和語篇的內(nèi)容及組織結(jié)構(gòu)等提供多種形式的電子評語反饋信息，同時(shí)還具備教師調(diào)整評分功能，便于教師提供更加準(zhǔn)確、客觀、全面的評語和修改建議。該系統(tǒng)除了提供一個(gè)綜合評分以外，還可以根據(jù)六個(gè)維度（思想和內(nèi)容、組織機(jī)構(gòu)、體裁、詞匯運(yùn)用、流暢度、拼寫及語法正確率等）給出分項(xiàng)分值，并且根據(jù)這六個(gè)維度和作文的篇章結(jié)構(gòu)給予評語反饋與修改建議。關(guān)于WRM的實(shí)證研究主要集中于美國的弗吉尼亞州，研究結(jié)果表明，使用WRM2.0的學(xué)生在州統(tǒng)考中成績明顯高于沒有使用的學(xué)生。WRM2.0已經(jīng)被國內(nèi)引進(jìn)，一些關(guān)于該工具的應(yīng)用文獻(xiàn)，將在下文進(jìn)一步闡述。

三、國內(nèi)研究現(xiàn)狀

國內(nèi)的一些專家和學(xué)者比較關(guān)注現(xiàn)代信息技術(shù)在語言教學(xué)中的應(yīng)用。然而，關(guān)于寫作在線測評工具在語言教學(xué)和測試中的研究尚屬于初始階段，主要集中于三個(gè)方面：理論介紹、模型構(gòu)建和實(shí)證研究。

1.理論介紹

國內(nèi)對寫作在線評價(jià)工具的興趣主要始于本世紀(jì)初，集中在對國外寫作自動(dòng)評價(jià)系統(tǒng)的原理和特點(diǎn)的介紹。梁茂成、文秋芳（2007）評價(jià)和比較了國外具有代表性的三種作文自動(dòng)評分系統(tǒng)：PEG、IEA、E-rater，指出這些評分系統(tǒng)在訓(xùn)練及作文的人工評分方法和機(jī)器評分效度等方面存在的問題，并分析了這些作文自動(dòng)評分系統(tǒng)為我國自主開發(fā)作文自動(dòng)評分系統(tǒng)所提供的借鑒作用。葛詩利、陳瀟瀟（2007）討論了國外的寫作自動(dòng)評價(jià)工具在二語寫作評分方面的表現(xiàn)，分析了自動(dòng)作文評分技術(shù)在英語作為外語寫作領(lǐng)域的發(fā)展及針對中國英語學(xué)習(xí)者作文自動(dòng)評分的研究，并且提出適合中國國情的研究方向及可能應(yīng)用的方法。陳瀟瀟、葛詩利（2008）介紹了國外比較有影響力的六種寫作自動(dòng)評價(jià)工具，分析了國內(nèi)市場對寫作自動(dòng)評價(jià)工具的需求，介紹了國內(nèi)對寫作自動(dòng)評價(jià)工具的開發(fā)研究，指出了英語作為外語的作文自動(dòng)評價(jià)工具研究的發(fā)展與不足之處。韓寧（2009）具體介紹了目前美國較流行的用于大規(guī)模考試評分和英語教學(xué)中的七個(gè)寫作自動(dòng)評分系統(tǒng)，詳細(xì)地闡明了各自的工作原理和特點(diǎn)，同時(shí)也指出了今后的主要研究方向，尤其是在國內(nèi)引入這些評價(jià)系統(tǒng)時(shí)需要改進(jìn)的地方。

2.模型構(gòu)建

國內(nèi)最早設(shè)計(jì)符合中國學(xué)生英語作文自動(dòng)評價(jià)工具模型構(gòu)建的應(yīng)該是梁茂成（2005）。他的建模方法兼顧了PEG和IEA的長處，設(shè)立訓(xùn)練集和驗(yàn)證集，在訓(xùn)練集的基礎(chǔ)上得到評分模型，用驗(yàn)證集交叉驗(yàn)證模型的可信度，進(jìn)而采用雙重交叉驗(yàn)證。他的模型是在訓(xùn)練集中提取大量的作文淺層文本特征，連同作文的內(nèi)容作為自變量，人工評分作為因變量一起用于多元回歸計(jì)算，得到作文評分的回歸方程。提取待評分作文的相關(guān)特征值，代入回歸方程即可得到該作文的得分。其模型的評分準(zhǔn)確率很高，但是由于樣本數(shù)量過小，作為自變量的淺層文本特征，還需要進(jìn)一步研究。在此基礎(chǔ)上，梁茂成（2011）研制了大規(guī)模英語考試作文評分系統(tǒng)，基于人工評判的大量中國大學(xué)生作文語料庫建立模型，從語言、內(nèi)容和組織結(jié)構(gòu)三方面對作文進(jìn)行評價(jià)，為開發(fā)適合中國學(xué)生練習(xí)和評價(jià)的寫作自評系統(tǒng)做出了很大的努力。

3.實(shí)證研究

國內(nèi)的實(shí)證研究主要集中使用技術(shù)相對比較成熟的WRM2.0。王淑雯（2011）結(jié)合教學(xué)實(shí)例，強(qiáng)調(diào)WRM2.0系統(tǒng)所能夠提供的及時(shí)、全面的多元化反饋有助于提高學(xué)生的語言正確率和寫作水平。該項(xiàng)實(shí)驗(yàn)為期三個(gè)月，對系統(tǒng)使用情況采用問卷調(diào)查、訪談和總結(jié)，結(jié)果顯示，所有教師對系統(tǒng)采取積極態(tài)度，絕大部分學(xué)生認(rèn)為系統(tǒng)有助于提高他們的寫作水平。由于該研究主要采用定性形式，缺乏定量數(shù)據(jù)，沒有客觀的前測、后測成績比對及實(shí)驗(yàn)組和對照組成績比對，而且使用周期太短，因此，其有效性還有待于進(jìn)一步考查。周穎（2011）的實(shí)驗(yàn)對象為某高校英語專業(yè)二年級學(xué)生，使用周期為一年，收集了以紙質(zhì)調(diào)查問卷、訪談及實(shí)驗(yàn)組和對照組期末考試成績作為前測和后測成績等數(shù)據(jù)，運(yùn)用SPSS 16.0對回收問卷進(jìn)行常規(guī)數(shù)理統(tǒng)計(jì)。研究結(jié)果顯示：學(xué)生對在線形成性評價(jià)工具持肯定態(tài)度，實(shí)驗(yàn)組成績比對照組有顯著提高。文章還具體分析在線形成性評價(jià)工具在學(xué)生英語寫作應(yīng)用過程中遇到的情況，進(jìn)而提出相應(yīng)的對策，為利用寫作在線測評工具進(jìn)行教學(xué)提供新思路。蔣學(xué)清、蔡靜等（2011）以某高校非英語專業(yè)的二年級學(xué)生為研究對象，研究方法包括問卷調(diào)查、訪談和實(shí)驗(yàn)前、后英語寫作成績的統(tǒng)計(jì)學(xué)分析，研究時(shí)間是一學(xué)期。研究結(jié)果發(fā)現(xiàn)，實(shí)驗(yàn)組和對照組的英語寫作水平都有了明顯的進(jìn)步，但實(shí)驗(yàn)組的進(jìn)步幅度更大。這說明寫作在線測評工具所提供的形成性評價(jià)方式和自動(dòng)反饋功能對非母語英語學(xué)習(xí)者的寫作能力可以發(fā)揮積極的作用。該研究還發(fā)現(xiàn)，與對照組相比，實(shí)驗(yàn)組在作文結(jié)構(gòu)、語法、單詞拼寫和標(biāo)點(diǎn)運(yùn)用方面有顯著提高，但在思想內(nèi)容、語體、選詞和句式變化方面的優(yōu)勢則并不顯著，并且分析了原因，包括學(xué)生方面和系統(tǒng)本身的不完善。遲秀湘（2013）的實(shí)驗(yàn)對象為某高校非英語專業(yè)二年級學(xué)生，使用周期為十周，收集的定性和定量數(shù)據(jù)包括實(shí)驗(yàn)組和對照組的前測、后測成績以及調(diào)查問卷和訪談結(jié)果等。實(shí)驗(yàn)結(jié)果表明：參與實(shí)驗(yàn)的老師和學(xué)生普遍采取積極態(tài)度，學(xué)生成績顯著提高。但是也有個(gè)別學(xué)生持保留態(tài)度，影響他們態(tài)度和成績的因素有待進(jìn)一步研究。

四、關(guān)于寫作在線測評工具應(yīng)用問題反思

寫作在線測評工具在國內(nèi)有著很大的潛在市場。在語言測試方面，除了漢語作文以外，作為主要外語的英語作文（這是本文及本項(xiàng)目主要關(guān)注的方向）出現(xiàn)在各種級別的語言測試中，包括中考、高考、大學(xué)生英語四、六級考試、專業(yè)英語四、八級、PETS、研究生入學(xué)考試等，閱卷工作量繁重，閱卷人員的信度也頗有爭議，急需客觀、公正、信度和效度較高的寫作測評工具。在語言教學(xué)方面，良好的自動(dòng)閱卷工具會(huì)對教學(xué)產(chǎn)生積極正面的反撥效應(yīng)。而且，如果在線測評工具能夠根據(jù)作文的不同維度，提供形成性及時(shí)反饋診斷報(bào)告，則有助于學(xué)生對寫作產(chǎn)生積極的態(tài)度，提高寫作水平，而且能夠減少教師作文批改量，減輕教師負(fù)擔(dān)，為教、學(xué)雙方帶來切實(shí)的好處。具體的優(yōu)勢體現(xiàn)在以下幾個(gè)方面。

1.反饋的多元性

系統(tǒng)能夠及時(shí)地提供電子反饋和教師可以參與的人工反饋；分?jǐn)?shù)反饋與診斷性評語反饋相結(jié)合；針對作文語言形式和語篇內(nèi)容結(jié)構(gòu)的反饋相結(jié)合；形成性反饋和終結(jié)性反饋相結(jié)合等多元反饋形式。

2.學(xué)生自主性和個(gè)性化

系統(tǒng)體現(xiàn)了“以學(xué)生為中心”的素質(zhì)教育理念，學(xué)生可以自主安排寫作時(shí)間和地點(diǎn)，自主選擇符合其水平和認(rèn)知風(fēng)格的寫作任務(wù)；可以無限次地提交作文—獲得反饋—再修改—再提交，形成良性循環(huán)，完成寫作任務(wù)。

3.形成性

系統(tǒng)能夠自動(dòng)記錄學(xué)生的歷次寫作情況，對寫作過程中的思維、行為、策略等進(jìn)行全面反饋并記錄，創(chuàng)建個(gè)人寫作檔案，有助于教師隨時(shí)了解、監(jiān)控學(xué)生全體或個(gè)體的寫作進(jìn)展，也有助于學(xué)生了解自己的學(xué)習(xí)情況及和同學(xué)之間的差距，反思寫作中存在的問題。

4.交互性

系統(tǒng)不僅可以實(shí)現(xiàn)學(xué)生、教師與機(jī)器的互動(dòng)，還可以實(shí)現(xiàn)學(xué)生之間的同行互評、教師與學(xué)生的多方位互動(dòng)。教師不僅可以通過系統(tǒng)給學(xué)生布置寫作任務(wù)，還可以通過系統(tǒng)對電子分?jǐn)?shù)和反饋進(jìn)行人工干預(yù)和修改。

5.激發(fā)學(xué)習(xí)動(dòng)機(jī)

系統(tǒng)所提供的及時(shí)評分能夠有效彌補(bǔ)人工評分的滯后性，大大激發(fā)學(xué)生的學(xué)習(xí)動(dòng)機(jī)。同時(shí)診斷性反饋評語為學(xué)生及時(shí)修改作文給予提示，修改過后在分?jǐn)?shù)上立竿見影的體現(xiàn)，會(huì)給學(xué)生帶來欣喜與成就感，大大調(diào)動(dòng)學(xué)生寫作的積極性和主動(dòng)性。

然而，寫作在線測評工具畢竟是信息技術(shù)的產(chǎn)物，其開發(fā)、研制和改進(jìn)需要最先進(jìn)的技術(shù)為支撐，需要既了解信息技術(shù)，又懂得語言教學(xué)、測試規(guī)律的復(fù)合型人才，不斷更新的信息技術(shù)是提高系統(tǒng)的效度和信度的關(guān)鍵。另外，寫作在線測評工具在語言教學(xué)過程中的使用離不開教師和學(xué)生，他們對系統(tǒng)的態(tài)度、對系統(tǒng)的掌握熟練程度、對系統(tǒng)的使用方法都會(huì)在很大程度上影響系統(tǒng)的實(shí)際應(yīng)用效果。因此，只有當(dāng)教師創(chuàng)造性地把軟件技術(shù)有機(jī)地融入教學(xué)中，引導(dǎo)學(xué)生合理有效地利用系統(tǒng)，才能取得最佳效果。

現(xiàn)代信息技術(shù)進(jìn)入外語教學(xué)與測試領(lǐng)域是今后的發(fā)展方向，大勢所趨。雖然目前尚有需要完善的地方，但是我們要接受并且掌握它，在使用過程中探索它的潛能和局限性，為以后的完善改進(jìn)提出建議。站在這項(xiàng)改革浪潮上的外語教學(xué)一線教師應(yīng)該順勢而為、勇挑重?fù)?dān)，掌握應(yīng)用最新的系統(tǒng)技術(shù)，開展全方位的實(shí)證研究，讓技術(shù)真正地服務(wù)于教學(xué)。

參考文獻(xiàn)：

[1]陳瀟瀟，葛詩利.自動(dòng)作文評分研究綜述[J].解放軍外國語學(xué)院學(xué)報(bào)，2008，31（5）：79-83.

[2]葛詩利，陳瀟瀟.中國學(xué)習(xí)者自動(dòng)作文評分探索[J].外語界，2007，122（5）：43-50.

[3]韓寧.幾個(gè)英語作文自動(dòng)評分系統(tǒng)的原理與評述[J].中國考試，2009，203（3）：38-44.

[4]梁茂成，文秋芳.國外作文自動(dòng)評分系統(tǒng)評述及啟示[J].外語電化教學(xué)，2007，217（5）：18-24.

[5]梁茂成.大規(guī)?？荚囉⒄Z作文自動(dòng)評分系統(tǒng)的研制[M].北京：高等教育出版社，2011.

[6]周穎.在線形成性評價(jià)工具在英語寫作中的應(yīng)用——困難及對策探究[J].現(xiàn)代教育技術(shù)，2011，21（9）：88-93.

[7]梁茂成.中國學(xué)生英語作文自動(dòng)評分模型的構(gòu)建[D].南京：南京大學(xué)博士論文，2005.

[8]王淑雯.如何利用Writing Roadmap 2.0進(jìn)行在線英語寫作反饋[J].現(xiàn)代教育技術(shù)，2011，21（3）：76-81.

[9]蔣學(xué)清，蔡靜，唐錦蘭.探析自動(dòng)作文評價(jià)系統(tǒng)對大學(xué)生英語寫作能力發(fā)展的影響[J].山東外語教學(xué)，2011，145（6）：36-43.

[10]遲秀湘.探究在線形成性評價(jià)工具對學(xué)生英語寫作能力的影響[J].海外英語，2013，228（5）：10-12.

基金項(xiàng)目：本研究得到北京市教育科學(xué)“十二五”規(guī)劃課題“在線形成性評價(jià)工具在英語寫作中的應(yīng)用研究”（項(xiàng)目編號：DDB12703）的資助。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

寫作測評工具在大學(xué)英語中的應(yīng)用研究綜述