陳周云 遲秀湘 牛潔珍
摘 要: 現(xiàn)代教育信息技術(shù)應(yīng)用于語言測試和教學(xué)領(lǐng)域是大勢所趨,本文介紹了目前國外比較流行的八種寫作測評工具。相比較而言,國內(nèi)對于寫作在線測評工具的研究尚處于初始階段,主要體現(xiàn)在三個(gè)方面:理論介紹、模型構(gòu)建和實(shí)證研究。雖然這項(xiàng)技術(shù)具備很大優(yōu)勢,但是在技術(shù)革新和實(shí)際應(yīng)用方面仍然面臨諸多挑戰(zhàn),急需更多的實(shí)證研究達(dá)到最佳應(yīng)用效果。
關(guān)鍵詞: 寫作在線測評工具 信息技術(shù) 語言測試
一、引言
現(xiàn)代教育技術(shù)的發(fā)展與普及為語言教學(xué)和語言測試的發(fā)展帶來了契機(jī),寫作在線測評工具不斷研制、開發(fā)和應(yīng)用就是一個(gè)極好的例子。寫作在線測評工具就是利用現(xiàn)代教育技術(shù)對語言學(xué)生的作文進(jìn)行在線判斷、評分并且給出及時(shí)反饋的計(jì)算機(jī)軟件系統(tǒng)。它以反饋、調(diào)控和改進(jìn)為目的,具有改善教學(xué)活動(dòng)、監(jiān)控寫作過程的功能,能夠達(dá)到及時(shí)反饋、改進(jìn)、調(diào)控學(xué)生學(xué)習(xí)進(jìn)程的效果。作為衡量語言輸出能力的重要指標(biāo)——寫的能力,無論是檢測還是平時(shí)訓(xùn)練,都需要客觀、公正的評閱者,給予及時(shí)、中肯的反饋,同時(shí)為學(xué)生提供不斷修正、改進(jìn)的機(jī)會(huì),敏銳地捕捉他們的點(diǎn)滴進(jìn)步,調(diào)動(dòng)他們的寫作積極性。計(jì)算機(jī)技術(shù)和信息系統(tǒng)的日新月異為解決這一亙古難題帶來了希望,國內(nèi)外各個(gè)領(lǐng)域的專家學(xué)者們紛紛研制開發(fā)寫作在線評閱工具。這種寫作在線評閱工具主要應(yīng)用于語言測試和語言教學(xué)領(lǐng)域,針對已經(jīng)輸入計(jì)算機(jī)內(nèi)部的學(xué)生作文文本進(jìn)行評閱,主要用在高風(fēng)險(xiǎn)考試中,作為人工評分的補(bǔ)充進(jìn)行實(shí)際評分;還可以用在語言教學(xué)中,對學(xué)生的寫作能力進(jìn)行診斷、提供修改建議等。
二、國外寫作測評工具綜述
該項(xiàng)技術(shù)的研究始于20世紀(jì)60年代的美國,目前國外較為成熟的寫作自動(dòng)測評工具主要包括:Project Essay Grade(PEG),Intelligent Essay Assessor(IEA),Electronic Essay Rater(E-rater),Criterion,IntelliMetric,Bayesian Essay Test Scoring System(BETSY),My Access!,以及Writing Roadmap2.0(WRM)系統(tǒng)等。
1.PEG
作為最早被開發(fā)出來的寫作自動(dòng)測評工具,PEG主要針對所輸入文本的一些容易量化的特征,如:長度(包括文章、句子、甚至單詞的長度)、標(biāo)點(diǎn)符號、語法等因素,利用統(tǒng)計(jì)中的多元回歸分析,給文章評分。盡管PEG在實(shí)際應(yīng)用中與人工評分有著很高的相關(guān)性,準(zhǔn)確率也很高,但是由于PEG的評分標(biāo)準(zhǔn)只是表層特征,忽視或者說沒有辦法量化文章的本質(zhì)特征,如:內(nèi)容的相關(guān)性、組織體裁、作者的觀點(diǎn)態(tài)度、篇章結(jié)構(gòu)等,而且不能提出反饋,因此沒有得到教育界的認(rèn)可和接受。不管怎樣,PEG是利用計(jì)算機(jī)代替人工閱卷的首次嘗試,為后來的技術(shù)改進(jìn)奠定了基礎(chǔ)。
2.IEA
IEA的基本原理是潛在語義分析——LSA(latent semantic analysis)技術(shù)。潛在語義分析用于作文評分時(shí)有三個(gè)步驟:首先,要挑選出有代表性的作文范文樣本;其次,這些樣本被表示為潛在語義分析中使用的變量;最后,待評分作文在內(nèi)容和概念的相關(guān)性上與這些樣本進(jìn)行比較,從而取最類似范文的平均分?jǐn)?shù)(韓寧,2009)。與PEG只關(guān)注文本的表面語言特征相比,IEA關(guān)注文本的整體內(nèi)容,同時(shí)包含對文本的寫作技巧,如語法、標(biāo)點(diǎn)等的反饋,與人工評分的相關(guān)性也很高,具有更大的教育價(jià)值,是作文自動(dòng)評分系統(tǒng)的重大突破。由于該方法只能對作文內(nèi)容進(jìn)行評價(jià),而不顧作文的語言質(zhì)量,因此評分效度很難保證。而且其設(shè)計(jì)初衷是為評價(jià)本族語作文所用,如果用于評測外語學(xué)習(xí)者的作文,其信度和效度就很難取得令人滿意的效果。
3.E-rater
E-rater利用了多種技術(shù),如統(tǒng)計(jì)技術(shù)、矢量空間模型技術(shù)和人工智能中的自然語言處理技術(shù),因此,E-rater既能夠像PEG那樣評判作文的語言表層特征,又能夠像IEA那樣評判作文的內(nèi)容質(zhì)量。此外,E-rater還能夠?qū)ψ魑牡钠陆Y(jié)構(gòu)進(jìn)行分析。E-rater兼顧作文的內(nèi)容和語言形式,是一種混合的自動(dòng)評分系統(tǒng),與人工評分之間的一致性達(dá)到了最高點(diǎn)。然而,E-rater并非十全十美。其旨在分析語言質(zhì)量的句法多樣性分析模塊不能全面衡量語言質(zhì)量的其他方面,如詞法、語言的準(zhǔn)確性等,從而影響了評分信度。另外,其旨在分析內(nèi)容質(zhì)量的主題內(nèi)容,分析模塊所使用的信息檢索技術(shù),與IEA所使用的潛在語義分析相比,有點(diǎn)落伍,不能有效排除由于詞匯同義和歧義所產(chǎn)生的干擾信息。其帶有創(chuàng)新意義的篇章結(jié)構(gòu)分析模塊主要靠在文本中搜索話語標(biāo)記語,像in conclusion、first of all等容易產(chǎn)生不良的反撥作用,致使考生認(rèn)為,只要多使用這些話語標(biāo)記語就可以得高分。(梁茂成,文秋芳,2007)
4.Criterion
作為一個(gè)基于互聯(lián)網(wǎng)的作文評分和評價(jià)服務(wù)系統(tǒng),Criterion不僅可以用于考試評分,還可以給出作文個(gè)性化的診斷性反饋。其技術(shù)核心是綜合了E-rater和另一個(gè)軟件系統(tǒng)Critique,前者提供評分,后者可以對作者寫作能力提供診斷信息,包括語法、用詞及寫作機(jī)制(比如大小寫、標(biāo)點(diǎn)符號)等多方面。Criterion的改進(jìn)主要體現(xiàn)在三個(gè)方面:能評判與分析事先訓(xùn)練過的作文題目、能夠給出所有題目(包括新提供的題目)的診斷反饋信息、可以適用于母語非英語的寫作。雖然其反饋的類型比較有限,但是Criterion在提供形成性反饋信息方面畢竟邁出了一大步,開創(chuàng)了寫作評價(jià)工具服務(wù)于教學(xué)的先河。
5.IntelliMetric
IntelliMetric是第一套基于人工智能技術(shù)開發(fā)出的作文評分系統(tǒng),取代E-rater用來給GMAT作文評分。它能夠模仿人工評卷,對作文的內(nèi)容、形式、組織和寫作習(xí)慣進(jìn)行評分,集中了人工智能、自然語言處理和統(tǒng)計(jì)技術(shù)的長處,是一種能夠內(nèi)化專家級評卷員集體智慧的學(xué)習(xí)機(jī)。它開發(fā)了能夠分析詞性和句法關(guān)系的自然語言處理技術(shù),依據(jù)英語標(biāo)準(zhǔn)書面語的主要特征,內(nèi)化作文中與某些特征相關(guān)的每一個(gè)得分點(diǎn)評判作文。IntelliMetric能夠評估作文中語義、句法、篇章3個(gè)層次的300多項(xiàng)特征。據(jù)稱在性能方面能夠跟專家級評卷員給出的分?jǐn)?shù)一樣準(zhǔn)確。另外,IntelliMetric能夠評閱除了英語以外的其他多種語言的作文。
6.BETSY
BETSY以概率論為指導(dǎo),其核心原理是貝葉斯分析方法,基于訓(xùn)練語料對文本進(jìn)行分類的程序。該系統(tǒng)使用了包括內(nèi)容與形式方面的一個(gè)大型特征集,根據(jù)優(yōu)、良、合格、不合格四個(gè)類型尺度,把一篇作文劃分到一個(gè)最合適的集合中。其開發(fā)者聲稱這個(gè)程序集合了PEG、LSA、E-rater的優(yōu)點(diǎn)并且具有自己的特色。例如,能夠用于短文評測,產(chǎn)生診斷性結(jié)果,可以非常方便地應(yīng)用于不同的學(xué)科專業(yè)范圍,并且其結(jié)果對非統(tǒng)計(jì)人員來說通俗易懂,可免費(fèi)下載使用。
7.My Access!
My Access!主要為學(xué)生提供一個(gè)寫作環(huán)境,能夠迅速形成結(jié)構(gòu)化的形成性反饋和診斷報(bào)告,學(xué)生可以根據(jù)這些結(jié)果修改自己的作文,改進(jìn)寫作技巧。同時(shí)也為教師提供了一個(gè)基于網(wǎng)絡(luò)的輔導(dǎo)環(huán)境,可以選擇多種的報(bào)告格式,瀏覽學(xué)生的歷史記錄,分析學(xué)生的錯(cuò)誤,把學(xué)生按水平分組,等等。My Access!還被大規(guī)模地應(yīng)用于課堂教學(xué)。大部分研究表明教師和學(xué)生對My Access!的使用持積極肯定態(tài)度,使用后學(xué)生成績也有明顯提高。教師對系統(tǒng)的積極態(tài)度和正確使用及對學(xué)生的正面引導(dǎo),系統(tǒng)評價(jià)、教師評價(jià)、同行互評等相結(jié)合是最佳使用方法。
8.WRM2.0
WRM2.0是美國McGraw-Hill公司設(shè)計(jì)的寫作在線形成性評價(jià)工具。該系統(tǒng)可以針對作文的語言形式(如拼寫、詞匯、語法結(jié)構(gòu)等)和語篇的內(nèi)容及組織結(jié)構(gòu)等提供多種形式的電子評語反饋信息,同時(shí)還具備教師調(diào)整評分功能,便于教師提供更加準(zhǔn)確、客觀、全面的評語和修改建議。該系統(tǒng)除了提供一個(gè)綜合評分以外,還可以根據(jù)六個(gè)維度(思想和內(nèi)容、組織機(jī)構(gòu)、體裁、詞匯運(yùn)用、流暢度、拼寫及語法正確率等)給出分項(xiàng)分值,并且根據(jù)這六個(gè)維度和作文的篇章結(jié)構(gòu)給予評語反饋與修改建議。關(guān)于WRM的實(shí)證研究主要集中于美國的弗吉尼亞州,研究結(jié)果表明,使用WRM2.0的學(xué)生在州統(tǒng)考中成績明顯高于沒有使用的學(xué)生。WRM2.0已經(jīng)被國內(nèi)引進(jìn),一些關(guān)于該工具的應(yīng)用文獻(xiàn),將在下文進(jìn)一步闡述。
三、國內(nèi)研究現(xiàn)狀
國內(nèi)的一些專家和學(xué)者比較關(guān)注現(xiàn)代信息技術(shù)在語言教學(xué)中的應(yīng)用。然而,關(guān)于寫作在線測評工具在語言教學(xué)和測試中的研究尚屬于初始階段,主要集中于三個(gè)方面:理論介紹、模型構(gòu)建和實(shí)證研究。
1.理論介紹
國內(nèi)對寫作在線評價(jià)工具的興趣主要始于本世紀(jì)初,集中在對國外寫作自動(dòng)評價(jià)系統(tǒng)的原理和特點(diǎn)的介紹。梁茂成、文秋芳(2007)評價(jià)和比較了國外具有代表性的三種作文自動(dòng)評分系統(tǒng):PEG、IEA、E-rater,指出這些評分系統(tǒng)在訓(xùn)練及作文的人工評分方法和機(jī)器評分效度等方面存在的問題,并分析了這些作文自動(dòng)評分系統(tǒng)為我國自主開發(fā)作文自動(dòng)評分系統(tǒng)所提供的借鑒作用。葛詩利、陳瀟瀟(2007)討論了國外的寫作自動(dòng)評價(jià)工具在二語寫作評分方面的表現(xiàn),分析了自動(dòng)作文評分技術(shù)在英語作為外語寫作領(lǐng)域的發(fā)展及針對中國英語學(xué)習(xí)者作文自動(dòng)評分的研究,并且提出適合中國國情的研究方向及可能應(yīng)用的方法。陳瀟瀟、葛詩利(2008)介紹了國外比較有影響力的六種寫作自動(dòng)評價(jià)工具,分析了國內(nèi)市場對寫作自動(dòng)評價(jià)工具的需求,介紹了國內(nèi)對寫作自動(dòng)評價(jià)工具的開發(fā)研究,指出了英語作為外語的作文自動(dòng)評價(jià)工具研究的發(fā)展與不足之處。韓寧(2009)具體介紹了目前美國較流行的用于大規(guī)模考試評分和英語教學(xué)中的七個(gè)寫作自動(dòng)評分系統(tǒng),詳細(xì)地闡明了各自的工作原理和特點(diǎn),同時(shí)也指出了今后的主要研究方向,尤其是在國內(nèi)引入這些評價(jià)系統(tǒng)時(shí)需要改進(jìn)的地方。
2.模型構(gòu)建
國內(nèi)最早設(shè)計(jì)符合中國學(xué)生英語作文自動(dòng)評價(jià)工具模型構(gòu)建的應(yīng)該是梁茂成(2005)。他的建模方法兼顧了PEG和IEA的長處,設(shè)立訓(xùn)練集和驗(yàn)證集,在訓(xùn)練集的基礎(chǔ)上得到評分模型,用驗(yàn)證集交叉驗(yàn)證模型的可信度,進(jìn)而采用雙重交叉驗(yàn)證。他的模型是在訓(xùn)練集中提取大量的作文淺層文本特征,連同作文的內(nèi)容作為自變量,人工評分作為因變量一起用于多元回歸計(jì)算,得到作文評分的回歸方程。提取待評分作文的相關(guān)特征值,代入回歸方程即可得到該作文的得分。其模型的評分準(zhǔn)確率很高,但是由于樣本數(shù)量過小,作為自變量的淺層文本特征,還需要進(jìn)一步研究。在此基礎(chǔ)上,梁茂成(2011)研制了大規(guī)模英語考試作文評分系統(tǒng),基于人工評判的大量中國大學(xué)生作文語料庫建立模型,從語言、內(nèi)容和組織結(jié)構(gòu)三方面對作文進(jìn)行評價(jià),為開發(fā)適合中國學(xué)生練習(xí)和評價(jià)的寫作自評系統(tǒng)做出了很大的努力。
3.實(shí)證研究
國內(nèi)的實(shí)證研究主要集中使用技術(shù)相對比較成熟的WRM2.0。王淑雯(2011)結(jié)合教學(xué)實(shí)例,強(qiáng)調(diào)WRM2.0系統(tǒng)所能夠提供的及時(shí)、全面的多元化反饋有助于提高學(xué)生的語言正確率和寫作水平。該項(xiàng)實(shí)驗(yàn)為期三個(gè)月,對系統(tǒng)使用情況采用問卷調(diào)查、訪談和總結(jié),結(jié)果顯示,所有教師對系統(tǒng)采取積極態(tài)度,絕大部分學(xué)生認(rèn)為系統(tǒng)有助于提高他們的寫作水平。由于該研究主要采用定性形式,缺乏定量數(shù)據(jù),沒有客觀的前測、后測成績比對及實(shí)驗(yàn)組和對照組成績比對,而且使用周期太短,因此,其有效性還有待于進(jìn)一步考查。周穎(2011)的實(shí)驗(yàn)對象為某高校英語專業(yè)二年級學(xué)生,使用周期為一年,收集了以紙質(zhì)調(diào)查問卷、訪談及實(shí)驗(yàn)組和對照組期末考試成績作為前測和后測成績等數(shù)據(jù),運(yùn)用SPSS 16.0對回收問卷進(jìn)行常規(guī)數(shù)理統(tǒng)計(jì)。研究結(jié)果顯示:學(xué)生對在線形成性評價(jià)工具持肯定態(tài)度,實(shí)驗(yàn)組成績比對照組有顯著提高。文章還具體分析在線形成性評價(jià)工具在學(xué)生英語寫作應(yīng)用過程中遇到的情況,進(jìn)而提出相應(yīng)的對策,為利用寫作在線測評工具進(jìn)行教學(xué)提供新思路。蔣學(xué)清、蔡靜等(2011)以某高校非英語專業(yè)的二年級學(xué)生為研究對象,研究方法包括問卷調(diào)查、訪談和實(shí)驗(yàn)前、后英語寫作成績的統(tǒng)計(jì)學(xué)分析,研究時(shí)間是一學(xué)期。研究結(jié)果發(fā)現(xiàn),實(shí)驗(yàn)組和對照組的英語寫作水平都有了明顯的進(jìn)步,但實(shí)驗(yàn)組的進(jìn)步幅度更大。這說明寫作在線測評工具所提供的形成性評價(jià)方式和自動(dòng)反饋功能對非母語英語學(xué)習(xí)者的寫作能力可以發(fā)揮積極的作用。該研究還發(fā)現(xiàn),與對照組相比,實(shí)驗(yàn)組在作文結(jié)構(gòu)、語法、單詞拼寫和標(biāo)點(diǎn)運(yùn)用方面有顯著提高,但在思想內(nèi)容、語體、選詞和句式變化方面的優(yōu)勢則并不顯著,并且分析了原因,包括學(xué)生方面和系統(tǒng)本身的不完善。遲秀湘(2013)的實(shí)驗(yàn)對象為某高校非英語專業(yè)二年級學(xué)生,使用周期為十周,收集的定性和定量數(shù)據(jù)包括實(shí)驗(yàn)組和對照組的前測、后測成績以及調(diào)查問卷和訪談結(jié)果等。實(shí)驗(yàn)結(jié)果表明:參與實(shí)驗(yàn)的老師和學(xué)生普遍采取積極態(tài)度,學(xué)生成績顯著提高。但是也有個(gè)別學(xué)生持保留態(tài)度,影響他們態(tài)度和成績的因素有待進(jìn)一步研究。
四、關(guān)于寫作在線測評工具應(yīng)用問題反思
寫作在線測評工具在國內(nèi)有著很大的潛在市場。在語言測試方面,除了漢語作文以外,作為主要外語的英語作文(這是本文及本項(xiàng)目主要關(guān)注的方向)出現(xiàn)在各種級別的語言測試中,包括中考、高考、大學(xué)生英語四、六級考試、專業(yè)英語四、八級、PETS、研究生入學(xué)考試等,閱卷工作量繁重,閱卷人員的信度也頗有爭議,急需客觀、公正、信度和效度較高的寫作測評工具。在語言教學(xué)方面,良好的自動(dòng)閱卷工具會(huì)對教學(xué)產(chǎn)生積極正面的反撥效應(yīng)。而且,如果在線測評工具能夠根據(jù)作文的不同維度,提供形成性及時(shí)反饋診斷報(bào)告,則有助于學(xué)生對寫作產(chǎn)生積極的態(tài)度,提高寫作水平,而且能夠減少教師作文批改量,減輕教師負(fù)擔(dān),為教、學(xué)雙方帶來切實(shí)的好處。具體的優(yōu)勢體現(xiàn)在以下幾個(gè)方面。
1.反饋的多元性
系統(tǒng)能夠及時(shí)地提供電子反饋和教師可以參與的人工反饋;分?jǐn)?shù)反饋與診斷性評語反饋相結(jié)合;針對作文語言形式和語篇內(nèi)容結(jié)構(gòu)的反饋相結(jié)合;形成性反饋和終結(jié)性反饋相結(jié)合等多元反饋形式。
2.學(xué)生自主性和個(gè)性化
系統(tǒng)體現(xiàn)了“以學(xué)生為中心”的素質(zhì)教育理念,學(xué)生可以自主安排寫作時(shí)間和地點(diǎn),自主選擇符合其水平和認(rèn)知風(fēng)格的寫作任務(wù);可以無限次地提交作文—獲得反饋—再修改—再提交,形成良性循環(huán),完成寫作任務(wù)。
3.形成性
系統(tǒng)能夠自動(dòng)記錄學(xué)生的歷次寫作情況,對寫作過程中的思維、行為、策略等進(jìn)行全面反饋并記錄,創(chuàng)建個(gè)人寫作檔案,有助于教師隨時(shí)了解、監(jiān)控學(xué)生全體或個(gè)體的寫作進(jìn)展,也有助于學(xué)生了解自己的學(xué)習(xí)情況及和同學(xué)之間的差距,反思寫作中存在的問題。
4.交互性
系統(tǒng)不僅可以實(shí)現(xiàn)學(xué)生、教師與機(jī)器的互動(dòng),還可以實(shí)現(xiàn)學(xué)生之間的同行互評、教師與學(xué)生的多方位互動(dòng)。教師不僅可以通過系統(tǒng)給學(xué)生布置寫作任務(wù),還可以通過系統(tǒng)對電子分?jǐn)?shù)和反饋進(jìn)行人工干預(yù)和修改。
5.激發(fā)學(xué)習(xí)動(dòng)機(jī)
系統(tǒng)所提供的及時(shí)評分能夠有效彌補(bǔ)人工評分的滯后性,大大激發(fā)學(xué)生的學(xué)習(xí)動(dòng)機(jī)。同時(shí)診斷性反饋評語為學(xué)生及時(shí)修改作文給予提示,修改過后在分?jǐn)?shù)上立竿見影的體現(xiàn),會(huì)給學(xué)生帶來欣喜與成就感,大大調(diào)動(dòng)學(xué)生寫作的積極性和主動(dòng)性。
然而,寫作在線測評工具畢竟是信息技術(shù)的產(chǎn)物,其開發(fā)、研制和改進(jìn)需要最先進(jìn)的技術(shù)為支撐,需要既了解信息技術(shù),又懂得語言教學(xué)、測試規(guī)律的復(fù)合型人才,不斷更新的信息技術(shù)是提高系統(tǒng)的效度和信度的關(guān)鍵。另外,寫作在線測評工具在語言教學(xué)過程中的使用離不開教師和學(xué)生,他們對系統(tǒng)的態(tài)度、對系統(tǒng)的掌握熟練程度、對系統(tǒng)的使用方法都會(huì)在很大程度上影響系統(tǒng)的實(shí)際應(yīng)用效果。因此,只有當(dāng)教師創(chuàng)造性地把軟件技術(shù)有機(jī)地融入教學(xué)中,引導(dǎo)學(xué)生合理有效地利用系統(tǒng),才能取得最佳效果。
現(xiàn)代信息技術(shù)進(jìn)入外語教學(xué)與測試領(lǐng)域是今后的發(fā)展方向,大勢所趨。雖然目前尚有需要完善的地方,但是我們要接受并且掌握它,在使用過程中探索它的潛能和局限性,為以后的完善改進(jìn)提出建議。站在這項(xiàng)改革浪潮上的外語教學(xué)一線教師應(yīng)該順勢而為、勇挑重?fù)?dān),掌握應(yīng)用最新的系統(tǒng)技術(shù),開展全方位的實(shí)證研究,讓技術(shù)真正地服務(wù)于教學(xué)。
參考文獻(xiàn):
[1]陳瀟瀟,葛詩利.自動(dòng)作文評分研究綜述[J].解放軍外國語學(xué)院學(xué)報(bào),2008,31(5):79-83.
[2]葛詩利,陳瀟瀟.中國學(xué)習(xí)者自動(dòng)作文評分探索[J].外語界,2007,122(5):43-50.
[3]韓寧.幾個(gè)英語作文自動(dòng)評分系統(tǒng)的原理與評述[J].中國考試,2009,203(3):38-44.
[4]梁茂成,文秋芳.國外作文自動(dòng)評分系統(tǒng)評述及啟示[J].外語電化教學(xué),2007,217(5):18-24.
[5]梁茂成.大規(guī)??荚囉⒄Z作文自動(dòng)評分系統(tǒng)的研制[M].北京:高等教育出版社,2011.
[6]周穎.在線形成性評價(jià)工具在英語寫作中的應(yīng)用——困難及對策探究[J].現(xiàn)代教育技術(shù),2011,21(9):88-93.
[7]梁茂成.中國學(xué)生英語作文自動(dòng)評分模型的構(gòu)建[D].南京:南京大學(xué)博士論文,2005.
[8]王淑雯.如何利用Writing Roadmap 2.0進(jìn)行在線英語寫作反饋[J].現(xiàn)代教育技術(shù),2011,21(3):76-81.
[9]蔣學(xué)清,蔡靜,唐錦蘭.探析自動(dòng)作文評價(jià)系統(tǒng)對大學(xué)生英語寫作能力發(fā)展的影響[J].山東外語教學(xué),2011,145(6):36-43.
[10]遲秀湘.探究在線形成性評價(jià)工具對學(xué)生英語寫作能力的影響[J].海外英語,2013,228(5):10-12.
基金項(xiàng)目:本研究得到北京市教育科學(xué)“十二五”規(guī)劃課題“在線形成性評價(jià)工具在英語寫作中的應(yīng)用研究”(項(xiàng)目編號:DDB12703)的資助。