劉淑君 李 艷 何躍偉 王婧婧
(1. 湖州師范學(xué)院人文學(xué)院,湖州 313000;2. 浙江大學(xué)教育學(xué)院,杭州 310058;3. 杭州市保俶塔申花實(shí)驗(yàn)學(xué)校,杭州 310058)
作為人工智能在教育場(chǎng)景中的一種典型應(yīng)用,智能作文評(píng)價(jià)以其秒批改和秒反饋的優(yōu)勢(shì)為未來個(gè)性化的寫作教學(xué)實(shí)踐提供了可能性,給傳統(tǒng)語言教育的變革帶來新契機(jī)。所謂智能作文反饋,是指智能作文評(píng)價(jià)系統(tǒng)生成的作文反饋信息,包括評(píng)分信息和內(nèi)容反饋信息兩個(gè)部分。自20世紀(jì)60年代美國杜克大學(xué)Page教授團(tuán)隊(duì)開發(fā)第一款智能作文評(píng)價(jià)系統(tǒng)PEG(Project Essay Grade)以來,智能作文評(píng)價(jià)的系統(tǒng)研發(fā)和教學(xué)應(yīng)用效果就一直備受學(xué)界關(guān)注(Page, 1966)。早期的智能作文評(píng)價(jià)系統(tǒng)側(cè)重評(píng)分功能,隨著計(jì)算機(jī)自然語言處理技術(shù)的進(jìn)步,20世紀(jì)90年代研發(fā)的E-rater、MY Access和Criterion等智能系統(tǒng)將作文評(píng)分與內(nèi)容反饋相結(jié)合,為作者提供更加全面而多維的評(píng)價(jià)(唐錦蘭,吳一安,2011)。同時(shí),此類系統(tǒng)還支持師生互動(dòng)和生生互動(dòng),有利于創(chuàng)建融合教師反饋、同伴互評(píng)和智能反饋的多元交互平臺(tái),推動(dòng)以證據(jù)為中心的寫作教學(xué)實(shí)踐 (Li, Link, & Hegelheimer, 2015)。國外有研究顯示,智能作文反饋對(duì)學(xué)生寫作修改實(shí)踐、作文質(zhì)量以及動(dòng)機(jī)信念等方面都有積極影響(Stevenson & Phakiti,2014)。近年來,隨著越來越多的國家啟動(dòng)智能作文評(píng)價(jià)的研發(fā)工作,此類系統(tǒng)評(píng)價(jià)的對(duì)象逐漸從英語作文擴(kuò)展到中文、日語和阿拉伯語等其他語種的文本(Azmi, Al-Jouie, & Hussain, 2019; Hao, Xu, Ke, Su,& Peng, 2016; Ishioka, Kameda, & Coling, 2006, pp. 233-240)。以IN課堂語文作文智能批改(簡(jiǎn)稱IN課堂)和愛語文APP為代表的中文作文智能評(píng)價(jià)工具也逐漸進(jìn)入教育場(chǎng)景。由于中文智能作文反饋工具教育應(yīng)用的時(shí)間較短,目前還處于推廣階段,很多語文教師對(duì)其反饋質(zhì)量和應(yīng)用效果持懷疑態(tài)度,這也影響了此類系統(tǒng)教育應(yīng)用潛力的發(fā)揮。
本研究擬選取IN課堂語文作文智能批改(簡(jiǎn)稱IN課堂)作為智能反饋工具,從寫作修改實(shí)踐、作文質(zhì)量、寫作動(dòng)機(jī)和學(xué)生感知等多維度探究融入智能作文反饋的中學(xué)議論文寫作教學(xué)效果。之所以選擇IN課堂,是因?yàn)橐延醒芯堪l(fā)現(xiàn),IN課堂兼具評(píng)分和反饋功能,支持學(xué)生多次提交作文獲得評(píng)價(jià),并為人機(jī)互動(dòng)和師生互動(dòng)提供空間,支持機(jī)器和師生之間的雙向反饋(IN課堂智能教育平臺(tái),2018;董艷等,2021);此外,IN課堂評(píng)分效度良好,反饋質(zhì)量較高,具備與教師協(xié)同教學(xué)的可能性(劉淑君等,2021)。本研究選擇議論文作為寫作文體,原因有二:首先,議論文是中學(xué)寫作教學(xué)的重要文體之一,它承載著世界觀與方法論教育的重任,與學(xué)生的思維發(fā)展關(guān)系密切(劉華,2012);其次,中學(xué)生議論文寫作能力和邏輯思維品質(zhì)的發(fā)展現(xiàn)狀不容樂觀,初中生論證思維與能力還不足以為高中寫作任務(wù)奠定良好基礎(chǔ),議論文在中學(xué)階段既是重點(diǎn)也是難點(diǎn)(鄧彤,2014)。
國外已有研究顯示,智能作文反饋對(duì)學(xué)生寫作修改實(shí)踐具有重要影響(Link, Mehrzad, & Rahimi,2020; Li, Link, & Hegelheimer, 2015; Chapelle, Cotos, & Lee, 2015)。有研究者從作文提交次數(shù)、修改行為、修改層次和修改效果等方面調(diào)查了學(xué)生寫作修改實(shí)踐,發(fā)現(xiàn)智能反饋組學(xué)生較教師反饋組學(xué)生修改成功率更高,但會(huì)更多地通過移除行為進(jìn)行修改,解決問題的努力程度有待提高(Link, Mehrzad, &Rahimi, 2020)。Attali(2004)通過對(duì)Criterion數(shù)據(jù)庫中6—12年級(jí)學(xué)生的23 567篇作文的分析發(fā)現(xiàn),71%的作文只有一次提交記錄,學(xué)生并未基于智能反饋信息進(jìn)行進(jìn)一步的寫作修改;29%作文提交了2—10次,說明學(xué)生得到系統(tǒng)多次反饋并進(jìn)行了修改,其作文終稿質(zhì)量較初稿有所提升。Li, Link, &Hegelheimer (2015)針對(duì)美國某高校70名學(xué)生的研究發(fā)現(xiàn),智能作文反饋能幫助母語為非英語(English as a Foreign Language,簡(jiǎn)稱EFL)的大學(xué)生增加作文提交次數(shù),由此提升作文質(zhì)量。
Chapelle, Cotos, &Lee(2015)對(duì)美國20名EFL大學(xué)生基于Criterion反饋的寫作修改行為進(jìn)行了分析,結(jié)果發(fā)現(xiàn),學(xué)生忽視了50%的智能反饋信息,但70%基于智能反饋的修改都帶來了文本質(zhì)量的提升;基于智能反饋的修改行為可分為無修改、移除、增加、刪除、替換和調(diào)序六種類型,學(xué)生最常用的是“替換”。修改層次指作文終稿較初稿的內(nèi)容變化層次,包括詞匯、語法、格式、內(nèi)容、結(jié)構(gòu)、觀點(diǎn)等,可分為低階修改和高階修改(Cotos, Link, & Huffman, 2017)。有研究者以美國某高校28名EFL學(xué)生(實(shí)驗(yàn)組12人、對(duì)照組16人)為樣本、以Criterion為反饋工具進(jìn)行對(duì)照實(shí)驗(yàn)發(fā)現(xiàn),智能反饋并不會(huì)將學(xué)生寫作修改局限在低階層面,實(shí)驗(yàn)組(“教師+Criterion”反饋)和對(duì)照組(教師反饋)學(xué)生在高階修改和低階修改的占比上沒有顯著差異;然而,學(xué)生忽視了45%的智能反饋內(nèi)容,遠(yuǎn)高于教師反饋被忽視的比例,但學(xué)生基于智能反饋的修改成功率高于教師反饋(Link, Mehrzad, & Rahimi, 2020)??梢姡瑑H向?qū)W生提供反饋并不能保障落實(shí)效果,智能反饋在得到有效落實(shí)的情況下才能提升寫作修改效果。
智能作文反饋對(duì)作文質(zhì)量的影響是該領(lǐng)域的研究焦點(diǎn),由于評(píng)價(jià)工具、學(xué)生樣本、語言背景的復(fù)雜性,此類研究還不能達(dá)成一致結(jié)論。Wang, Shang, & Briody(2013)對(duì)57名EFL大學(xué)生實(shí)施為期16周的對(duì)照實(shí)驗(yàn)(實(shí)驗(yàn)組31人、對(duì)照組26人)顯示,智能反饋組較對(duì)照組(教師反饋)在文本準(zhǔn)確性上有顯著優(yōu)勢(shì)。另有研究針對(duì)大學(xué)生作文(n=463)的內(nèi)容分析表明,Criterion的教學(xué)應(yīng)用可以降低EFL大學(xué)生的文本錯(cuò)誤率,但以英語為母語的學(xué)生作文錯(cuò)誤率并沒有降低(Chodorow, Gamon, & Tetreault,2010)??梢?,當(dāng)智能反饋融入EFL大學(xué)生寫作教學(xué)時(shí),學(xué)生作文質(zhì)量會(huì)得到提高(Choi, 2010)。
針對(duì)以英語為母語的中小學(xué)生的研究結(jié)果比較復(fù)雜。Shermis, Garvan, & Diao(2008)分析了美國某地區(qū)六、七、八、十年級(jí)2017名學(xué)生借助智能反饋完成的11 685篇文章的質(zhì)量,發(fā)現(xiàn)各年級(jí)學(xué)生作文質(zhì)量都有提升,且八年級(jí)學(xué)生作文成績(jī)提升最為顯著、語言錯(cuò)誤率降幅最大;這是由于學(xué)生寫作修改能力隨著年級(jí)遞增而提升,同時(shí)作文成績(jī)提升幅度也和文體類型相關(guān)。但是,當(dāng)智能反饋直接與傳統(tǒng)寫作教學(xué)簡(jiǎn)單疊加時(shí),智能反饋組與其他反饋組學(xué)生作文質(zhì)量往往沒有顯著差異。比如,Ware(2014)研究發(fā)現(xiàn),接受同伴反饋、教師反饋和Criterion反饋的三組初中生(n=82)在作文準(zhǔn)確性、流暢性與整體分?jǐn)?shù)上都沒有顯著差異,教師反饋與同伴反饋較智能反饋對(duì)學(xué)生文體要素使用有更積極的影響。還有學(xué)者將美國某地區(qū)114名六年級(jí)學(xué)生分為實(shí)驗(yàn)組(使用PEG反饋)和對(duì)照組(使用谷歌文檔編輯)開展對(duì)照實(shí)驗(yàn),發(fā)現(xiàn)兩組學(xué)生后測(cè)作文質(zhì)量無顯著差異,且較前測(cè)都沒有顯著提升(Wilson& Roscoe, 2020)。然而,當(dāng)智能作文反饋與有效教學(xué)策略結(jié)合時(shí),學(xué)生作文質(zhì)量會(huì)得到較大幅度提升。Palermo和Thomson(2018)以美國某地區(qū)829名6—8年級(jí)學(xué)生為樣本,通過對(duì)照實(shí)驗(yàn)探究“傳統(tǒng)寫作教學(xué)”“智能反饋+傳統(tǒng)寫作教學(xué)”和“智能反饋+自我調(diào)節(jié)策略發(fā)展教學(xué)(Self-Regulated Strategy Development,簡(jiǎn)稱SRSD)”三種條件對(duì)學(xué)生寫作質(zhì)量的影響,結(jié)果顯示,“智能反饋+SRSD”組學(xué)生的后測(cè)作文較其他兩組篇幅更長、質(zhì)量更高且包含更多的議論文文體要素。這說明智能反饋與特定教學(xué)策略有機(jī)結(jié)合能促進(jìn)學(xué)生寫作能力提升與遷移。
多項(xiàng)研究表明,智能作文反饋對(duì)學(xué)生寫作動(dòng)機(jī)有積極影響(Grime & Warschauer, 2010; Foltz, 2014;Wilson & Czik, 2016)。Grime和Warschauer(2010)探究了智能作文評(píng)價(jià)系統(tǒng)MY Access在美國某地區(qū)八所中學(xué)的使用情況,發(fā)現(xiàn)MY Access的應(yīng)用能提升中學(xué)生寫作與修改動(dòng)機(jī)。Foltz(2014)的研究發(fā)現(xiàn),使用Write-to-Learn反饋的學(xué)生會(huì)增加寫作和修改的時(shí)間投入,由此提升寫作參與的持久性和寫作毅力。Wilson & Czik(2016)以美國145名八年級(jí)學(xué)生為樣本的對(duì)照實(shí)驗(yàn)研究(實(shí)驗(yàn)組72人、對(duì)照組73人)表明,實(shí)驗(yàn)組(PEG+教師反饋)學(xué)生對(duì)寫作動(dòng)機(jī)量表中毅力維度的題項(xiàng)“我會(huì)花時(shí)間解決寫作中的問題”的認(rèn)同度顯著高于對(duì)照組(教師反饋);同時(shí),實(shí)驗(yàn)組學(xué)生的作文提交次數(shù)也高于對(duì)照組學(xué)生。以上研究為智能作文反饋對(duì)學(xué)生寫作動(dòng)機(jī)的積極影響提供了依據(jù),但該領(lǐng)域還需要推進(jìn)針對(duì)不同語種文本反饋工具的更多實(shí)證研究,進(jìn)一步驗(yàn)證以上結(jié)論。
通過對(duì)智能作文反饋領(lǐng)域的文獻(xiàn)回顧不難發(fā)現(xiàn),已有研究大多聚焦英文智能作文評(píng)價(jià)系統(tǒng)的教學(xué)應(yīng)用效果,由于中文智能作文評(píng)價(jià)系統(tǒng)興起較晚,相關(guān)實(shí)踐研究還比較有限,教育界還需要開展更多實(shí)證研究驗(yàn)證其在寫作教學(xué)中的應(yīng)用路徑及效果。目前,中學(xué)寫作教學(xué)中存在反饋滯后、學(xué)生寫作動(dòng)機(jī)低下等問題,教師認(rèn)知和時(shí)間精力都存在局限。如何發(fā)揮AI新技術(shù)的優(yōu)勢(shì),探索人機(jī)協(xié)同寫作教學(xué)的合宜形式,是智能時(shí)代語文教師必須思考的問題(宋靈清,許林,2018;余勝泉,王琦,2019)。
鑒于以上國內(nèi)外研究綜述,本研究擬聚焦人機(jī)協(xié)同的議論文寫作實(shí)踐,探究融入智能作文反饋的中學(xué)寫作教學(xué)效果。研究首先分析中學(xué)生寫作修改實(shí)踐的特點(diǎn),繼而調(diào)查學(xué)生作文質(zhì)量、寫作動(dòng)機(jī)及寫作修改信念的變化,最后以回顧筆記的形式調(diào)查學(xué)生對(duì)智能作文反饋的體驗(yàn)與感受。研究包含以下四個(gè)問題:
(1)在融入智能作文反饋的中學(xué)議論文寫作教學(xué)中,學(xué)生寫作修改行為、層次、動(dòng)因和效果分別表現(xiàn)如何?
(2)融入智能作文反饋的中學(xué)議論文寫作教學(xué)能否提升學(xué)生作文成績(jī)、文章長度和議論文要素使用頻率?
(3)融入智能作文反饋的中學(xué)議論文寫作教學(xué)能否促進(jìn)學(xué)生寫作動(dòng)機(jī)和修改信念的提升?
(4)中學(xué)生對(duì)智能作文反饋的體驗(yàn)與感受如何?
研究者本人(教育博士,曾任教中學(xué)語文)在B校面向七、八年級(jí)學(xué)生開設(shè)一門“論辯寫作”拓展課,以選修該課程的學(xué)生為研究樣本。論辯文是議論文的一種,側(cè)重在有爭(zhēng)議的問題上表明立場(chǎng)、捍衛(wèi)立場(chǎng)并駁斥反面觀點(diǎn)。B校是長三角地區(qū)某省會(huì)城市的九年一貫制學(xué)校,該校在國家必修課程外,面向七、八年級(jí)學(xué)生開設(shè)豐富多彩的拓展課。該課程通過學(xué)生自主報(bào)名與學(xué)校調(diào)劑分配相結(jié)合的方式招募到35名學(xué)生。
教學(xué)實(shí)驗(yàn)貫穿秋冬學(xué)期(2020年9—12月),課程共十周,每周兩個(gè)課時(shí)。實(shí)驗(yàn)過程中,學(xué)生需接受議論文寫作指導(dǎo),完成三篇作文初稿,并借助IN課堂修改作文。有四名學(xué)生作文提交不完整,三名學(xué)生中途轉(zhuǎn)到其他課程,全程參與實(shí)驗(yàn)課程并完成寫作任務(wù)的有28名學(xué)生。學(xué)生平均年齡13.13歲,男生人數(shù)是女生的1.5倍;自主選課的有12人(占比42.86%),接受調(diào)劑的有16人(占比57.14%)。
本研究采取單組前后測(cè)的方法設(shè)計(jì)實(shí)驗(yàn)。第一周,學(xué)生完成寫作動(dòng)機(jī)和寫作修改信念問卷,撰寫一篇命題議論文作為前測(cè)作文;教師介紹IN課堂的功能和操作方法。第二至三周,教師教授議論文的構(gòu)思和寫作要點(diǎn),并以師生合作寫作的形式強(qiáng)化寫作知識(shí)。第四至九周,學(xué)生完成三次議論文寫作活動(dòng),每次活動(dòng)用時(shí)兩周:前一周學(xué)生接受寫作指導(dǎo)并撰寫初稿;后一周學(xué)生在機(jī)房借助IN課堂反饋修改文章,教師適時(shí)組織交流展示活動(dòng)。寫作指導(dǎo)、初稿撰寫和作品交流活動(dòng)都在B校某教室進(jìn)行;寫作修改活動(dòng)在學(xué)校機(jī)房開展,該機(jī)房座位縱向排列,共四排,可容納40人同時(shí)上機(jī)。第十周,學(xué)生完成寫作動(dòng)機(jī)和修改信念后測(cè),教師以開放性問題引導(dǎo)學(xué)生回顧基于IN課堂反饋的作文修改過程,學(xué)生書寫回顧筆記。之后,研究者收集并分析學(xué)生寫作修改、作文質(zhì)量、動(dòng)機(jī)信念和體驗(yàn)感受等方面的數(shù)據(jù),用以驗(yàn)證融入智能作文反饋的中學(xué)寫作教學(xué)效果。
本課程融入了智能評(píng)價(jià)的人工智能要素,具有創(chuàng)新實(shí)驗(yàn)性質(zhì),以鼓勵(lì)學(xué)生參與、激發(fā)寫作興趣和培養(yǎng)論辯思維為主要目標(biāo),教師基于學(xué)生綜合表現(xiàn)評(píng)定課程成績(jī)。具體而言,考勤占20%,課堂參與占30%,作業(yè)提交占30%,作文成績(jī)占20%,學(xué)生作文成績(jī)?nèi)∪巫魑慕K稿成績(jī)之和。
教師為每次寫作練習(xí)提供兩個(gè)題目,一個(gè)是社會(huì)熱點(diǎn)話題評(píng)論,另一個(gè)是《西游記》人物論辯,學(xué)生可根據(jù)興趣自由選擇。熱點(diǎn)話題選取與學(xué)生生活緊密相關(guān)的話題,比如“中學(xué)生追星利大于弊還是弊大于利”等?!段饔斡洝肥遣烤幈菊Z文教材中的必讀名著,屬于七年級(jí)上冊(cè)的閱讀任務(wù),七、八年級(jí)學(xué)生對(duì)其內(nèi)容都比較熟悉,該書趣味性與深刻性并重,是很好的論辯資源,因此,研究者設(shè)計(jì)系列人物論辯話題,比如“豬八戒是取經(jīng)路上的豬隊(duì)友還是好隊(duì)員”等。題目編制完成后,研究者邀請(qǐng)B校語文教師對(duì)其趣味性和適宜性進(jìn)行審核。
本研究所收集的數(shù)據(jù)包括學(xué)生寫作修改、寫作動(dòng)機(jī)、修改信念和回顧筆記,擬從多個(gè)維度探究融入智能作文反饋的中學(xué)寫作教學(xué)效果。各類數(shù)據(jù)的收集與分析過程如下。
1. 寫作修改數(shù)據(jù)的收集與分析
本研究以學(xué)生第三次作文初稿(n=28)和終稿(n=28)為樣本分析學(xué)生寫作修改特點(diǎn),從修改行為、修改層次、修改動(dòng)因和效果四個(gè)方面收集并分析數(shù)據(jù)。
研究者采用Beyond Compare軟件對(duì)作文初稿和終稿文本進(jìn)行內(nèi)容對(duì)比,將有獨(dú)立意義的修改點(diǎn)逐個(gè)錄入Excel表格,共梳理出修改點(diǎn)253項(xiàng),隨后統(tǒng)計(jì)每篇作文初稿字?jǐn)?shù),將實(shí)際修改數(shù)量轉(zhuǎn)化為每千字修改數(shù)。
借鑒已有文獻(xiàn)中的分類方式,研究者結(jié)合國內(nèi)中學(xué)寫作教學(xué)現(xiàn)狀,將寫作修改行為劃分為增加、刪除、調(diào)序和替換等四種類型;修改層次分為低階修改和高階修改,其中低階修改指有關(guān)標(biāo)點(diǎn)、詞句、語法的表層修改,高階修改指涉及主題意義、內(nèi)容選材和結(jié)構(gòu)構(gòu)思等的深層修改(Chapelle, Cotos, &Lee, 2015; Link, Mehrzad, & Rahimi, 2020)。研究者與B校語文教師W合作,從修改行為和修改層次的維度對(duì)修改點(diǎn)進(jìn)行編碼;之后對(duì)比IN課堂反饋和文本修改情況,初步判斷各修改點(diǎn)屬于自主修改還是回應(yīng)反饋的修改,從修改動(dòng)因和效果的角度對(duì)修改點(diǎn)進(jìn)行編碼;最后,對(duì)寫作修改行為和修改層次的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,比較學(xué)生自主修改和回應(yīng)反饋修改的比例及效果。修改點(diǎn)編碼樣例如表1所示。
表1 學(xué)生寫作修改層次、行為、動(dòng)因和效果的編碼樣例
2. 學(xué)生作文質(zhì)量數(shù)據(jù)的收集與分析
本研究從學(xué)生作文成績(jī)、文章長度和議論文要素等方面收集學(xué)生議論文寫作質(zhì)量的相關(guān)數(shù)據(jù)。
(1)學(xué)生作文成績(jī)數(shù)據(jù)的收集與分析
教學(xué)實(shí)驗(yàn)貫穿秋冬學(xué)期,有一定的持續(xù)性,因此本研究不僅調(diào)查學(xué)生作文終稿成績(jī)較初稿成績(jī)的提升情況,也分析學(xué)生作文的長期進(jìn)步情況。
針對(duì)學(xué)生的三次作文練習(xí),每篇作文初稿和終稿都被錄入IN課堂得到智能評(píng)分,同時(shí)教師參照中考作文評(píng)分標(biāo)準(zhǔn)對(duì)作文評(píng)分,兩種評(píng)分方式都以40分為滿分成績(jī),取二者均值為作文最終成績(jī)。研究對(duì)學(xué)生三次作文初稿和終稿成績(jī)分別進(jìn)行配對(duì)樣本t檢驗(yàn),以此驗(yàn)證學(xué)生議論文成績(jī)?cè)诙唐趦?nèi)——終稿成績(jī)較初稿成績(jī)——的提升狀況。
同時(shí),研究以學(xué)生第三次作文初稿作為后測(cè)樣本,與前測(cè)作文成績(jī)比較,以此檢驗(yàn)學(xué)生作文成績(jī)長期提升狀況,即學(xué)生在無反饋的情況下獨(dú)立完成的作文是否有進(jìn)步。借鑒美國國家評(píng)估理事會(huì)編制的八年級(jí)議論文評(píng)分指南,參照國內(nèi)議論文教學(xué)情況,研究者編制針對(duì)中學(xué)生的議論文整體評(píng)分規(guī)則,用于前后測(cè)作文評(píng)分。該評(píng)分規(guī)則提供1—6分的評(píng)分指導(dǎo)建議,評(píng)分員需從整體上對(duì)文章質(zhì)量進(jìn)行評(píng)估,不用單獨(dú)評(píng)估個(gè)別項(xiàng)目或局部質(zhì)量(National Assessment Governors Board, 2017)。
研究者和W首先獨(dú)立完成前后測(cè)作文評(píng)分,取兩人評(píng)分精確一致項(xiàng)(評(píng)分完全一致)與相鄰一致項(xiàng)(評(píng)分等級(jí)相鄰)項(xiàng)數(shù)之和除以總項(xiàng)數(shù)計(jì)算評(píng)分一致性(Hoang & Kunnan, 2016)。兩位評(píng)分員針對(duì)前測(cè)作文的評(píng)分一致性為0.96,針對(duì)后測(cè)作文的評(píng)分一致性為0.92,都比較理想。之后,二人再次審閱評(píng)分有差異的作文,協(xié)商達(dá)成最終得分。研究采用SPSS 23對(duì)前后測(cè)作文整體得分進(jìn)行Wilcoxon非參數(shù)檢驗(yàn),以此驗(yàn)證學(xué)生作文長期提升狀況。
(2)學(xué)生作文長度數(shù)據(jù)的收集與分析
在寫作教學(xué)領(lǐng)域,作文長度是衡量教學(xué)效果的指標(biāo)之一(Graham & Harris, 2003, pp. 323-334),有人發(fā)現(xiàn)作文長度和作文質(zhì)量呈顯著正相關(guān)(Morphy & Graham, 2012),語文課程標(biāo)準(zhǔn)和中高考作文評(píng)價(jià)標(biāo)準(zhǔn)也都對(duì)學(xué)生作文字?jǐn)?shù)提出了明確要求。本研究對(duì)學(xué)生作文前測(cè)和后測(cè)(第三次作文初稿)作文長度進(jìn)行對(duì)比,以此調(diào)查融入智能作文反饋的寫作教學(xué)能否影響學(xué)生作文長度。作文長度用總字?jǐn)?shù)來衡量,研究者用Word文檔字?jǐn)?shù)統(tǒng)計(jì)功能記錄前后測(cè)作文字?jǐn)?shù),該過程忽略書寫、語法等文本錯(cuò)誤,只關(guān)注總字?jǐn)?shù)。研究采用SPSS 23對(duì)前后測(cè)作文字?jǐn)?shù)進(jìn)行配對(duì)樣本t檢驗(yàn),用以驗(yàn)證學(xué)生作文長度是否顯著增加。
(3)學(xué)生議論文要素使用數(shù)據(jù)的收集與分析
根據(jù)先前文獻(xiàn)中推薦的程序,研究者和W對(duì)前后測(cè)作文中的議論文要素——論點(diǎn)、論據(jù)、闡釋、反駁和結(jié)論——合作評(píng)分(Scardamalia, Bereiter, &Goelman, 1982, pp. 175-210)。對(duì)于論點(diǎn)和結(jié)論,如果文本包含該要素,得1分,如不包含,得0分;對(duì)于論據(jù)、闡釋(進(jìn)一步解釋論據(jù)和論點(diǎn)之間的關(guān)系)和反駁,每出現(xiàn)一次得1分。二人提前閱讀五篇文章,了解學(xué)生大致水平,交流評(píng)分中可能出現(xiàn)的問題,明確評(píng)分細(xì)則。之后,兩位評(píng)分員分別評(píng)閱十篇作文,統(tǒng)計(jì)每項(xiàng)議論文要素的評(píng)分一致性。結(jié)果顯示,二者在論點(diǎn)層面一致性為1,支持理由層面一致性為0.80,闡述層面一致性為0.80,反駁層面一致性為0.90,結(jié)論層面的一致性為0.90,都比較理想。對(duì)于評(píng)分有差異的樣本,二人通過協(xié)商達(dá)成一致。
研究采用SPSS 23對(duì)前后測(cè)作文的各要素得進(jìn)行Wilcoxon非參數(shù)檢驗(yàn),用以檢驗(yàn)學(xué)生后測(cè)作文中議論文要素使用情況較前測(cè)是否有提升。
3. 學(xué)生寫作動(dòng)機(jī)與修改信念數(shù)據(jù)的收集與分析
學(xué)生在實(shí)驗(yàn)前后都需完成寫作動(dòng)機(jī)量表和寫作修改信念問卷。學(xué)生寫作動(dòng)機(jī)量表在已有文獻(xiàn)基礎(chǔ)上改編(Piazza & Siebert, 2008),共11題,包括學(xué)生對(duì)寫作的自信(三個(gè)題項(xiàng))、毅力(四個(gè)題項(xiàng))和激情(四個(gè)題項(xiàng))三個(gè)維度,采用李克特七點(diǎn)量表設(shè)計(jì)(見表2)。該量表在研發(fā)階段的克隆巴赫α系數(shù)為0.89,在本研究的前后測(cè)中,量表的克隆巴赫α系數(shù)分別為0.88和0.91,表明量表信度較高。研究采用SPSS 23對(duì)學(xué)生寫作動(dòng)機(jī)前后測(cè)進(jìn)行配對(duì)樣本t檢驗(yàn),用以驗(yàn)證融入智能作文反饋的議論文寫作教學(xué)能否提升學(xué)生寫作動(dòng)機(jī)。
表2 學(xué)生寫作動(dòng)機(jī)量表題項(xiàng)樣例(Piazza & Siebert, 2008)
借鑒前人編制的寫作修改信念量表(Chen & Zhang, 2019),本研究根據(jù)國內(nèi)中學(xué)生議論文寫作特點(diǎn)略作調(diào)整,如將“我可以修改文章中的拼寫錯(cuò)誤”改為“我可以修改文章中的錯(cuò)別字”,由此形成中學(xué)生寫作修改信念問卷。該問卷由15個(gè)題項(xiàng)組成,分低階修改信念和高階修改信念兩個(gè)維度,前者包括五個(gè)題項(xiàng),后者包括十個(gè)題項(xiàng)(見表3)。學(xué)生根據(jù)對(duì)各項(xiàng)陳述的自信程度在“0—10”中進(jìn)行選擇,“0”表示“做不到”,“10”表示“完全可以做到”。在本研究中,該問卷前后測(cè)的克隆巴赫α系數(shù)分別為0.97和0.96,說明量表信度良好。研究采用SPSS 23對(duì)學(xué)生低階和高階修改信念的前后測(cè)得分進(jìn)行配對(duì)樣本t檢驗(yàn),用以調(diào)查實(shí)驗(yàn)前后學(xué)生寫作修改信念提升狀況。
表3 中學(xué)生寫作修改信念問卷的題項(xiàng)樣例(Chen & Zhang, 2019)
4. 學(xué)生體驗(yàn)與感受類數(shù)據(jù)的收集與分析
教學(xué)實(shí)驗(yàn)結(jié)束后,教師將第三次作文初稿的智能評(píng)分與反饋信息提供給學(xué)生。教師提出“IN課堂的作文評(píng)分對(duì)你的寫作有幫助嗎,為什么?”“IN課堂的反饋建議對(duì)你的寫作有幫助嗎,為什么?”和“你認(rèn)為IN課堂在哪些方面需要改進(jìn)?”三個(gè)問題,要求學(xué)生回顧第三次寫作修改過程,將回答寫在相關(guān)的評(píng)分或反饋內(nèi)容旁邊,最終收集到20份回顧筆記。研究者分類整理學(xué)生對(duì)每個(gè)問題的回答內(nèi)容,對(duì)其進(jìn)一步梳理總結(jié)。
針對(duì)問題一(在融入智能作文反饋的中學(xué)議論文寫作教學(xué)中,學(xué)生寫作修改行為、層次、動(dòng)因和效果分別表現(xiàn)如何?),本研究以學(xué)生第三次作文初稿(n=28)和終稿(n=28)為樣本,通過文本對(duì)比整理出253項(xiàng)修改點(diǎn),將每篇文章的修改數(shù)量轉(zhuǎn)換為每千字修改數(shù),之后對(duì)全部修改點(diǎn)從修改行為、層次、動(dòng)因與效果四方面編碼分析。
在253項(xiàng)修改點(diǎn)中,學(xué)生最常做出的修改行為是增加(141項(xiàng),占比55.73%),然后依次是替換(85項(xiàng),占比33.60%)、刪除(23項(xiàng),占比9.09%)、調(diào)序(4項(xiàng),占比1.58%)。表4顯示,學(xué)生每千字平均修改數(shù)量為13.05 (SD=7.34),其中低階修改占比60.38%,超過了高階修改占比(39.62%)??梢姡谌谌胫悄茏魑姆答伒膶懽鹘虒W(xué)條件下,學(xué)生更側(cè)重低階修改。
表4 學(xué)生作文修改層次統(tǒng)計(jì)(n=28)
由修改動(dòng)因維度的編碼分析可知,在253項(xiàng)修改點(diǎn)中,學(xué)生回應(yīng)IN課堂反饋的修改占17%(43項(xiàng)),其他83%(210項(xiàng))都屬于自主修改。兩種修改動(dòng)因下的低階修改占比都高于高階修改;回應(yīng)IN課堂反饋修改的低階修改比例(62.79%)略高于自主修改的低階修改比例(60%),但二者相差不大(見表5)。
表5 學(xué)生寫作修改動(dòng)因與層次比較(n=28)
從修改效果看,在學(xué)生回應(yīng)IN課堂反饋的43項(xiàng)修改中,40項(xiàng)(占比93%)屬于成功的修改,即修改有助于提升文本質(zhì)量;只有3項(xiàng)(占比7%)屬于不成功的修改,沒有達(dá)成預(yù)期的文本改進(jìn)。追蹤具體文本發(fā)現(xiàn),針對(duì)IN課堂具體精準(zhǔn)的反饋內(nèi)容,學(xué)生大多能做出有效修改;而針對(duì)模糊籠統(tǒng)的智能反饋,學(xué)生修改效果往往不理想(見表6)。在學(xué)生做出的210項(xiàng)自主修改中,修改成功的有170條(占比81%),另外40條(占比19%)修改并不成功??梢?,與學(xué)生自主修改相比,基于IN課堂反饋的修改成功率更高。智能作文反饋對(duì)學(xué)生作文質(zhì)量的影響往往通過寫作修改實(shí)踐來實(shí)現(xiàn),接下來將分析學(xué)生作文質(zhì)量在準(zhǔn)實(shí)驗(yàn)期間的發(fā)展變化。
表6 學(xué)生基于IN課堂反饋的作文修改樣例
針對(duì)問題二(融入智能作文反饋的中學(xué)議論文教學(xué)能否提升學(xué)生作文成績(jī)、文章長度和議論要素使用頻率?),本研究從作文成績(jī)、文章長度和文體要素三方面分析學(xué)生議論文質(zhì)量。
首先,針對(duì)學(xué)生作文成績(jī),本研究不僅調(diào)查學(xué)生作文終稿成績(jī)較初稿提升情況,還關(guān)注學(xué)生作文長期進(jìn)步。對(duì)學(xué)生三次作文初稿成績(jī)和終稿成績(jī)進(jìn)行配對(duì)樣本t檢驗(yàn),表7顯示,學(xué)生三次作文終稿成績(jī)較初稿成績(jī)都顯著提升,寫作修改效果良好。
表7 學(xué)生作文成績(jī)的配對(duì)樣本t檢驗(yàn)(n=28)
研究者和W教師合作對(duì)28位學(xué)生的前測(cè)作文和后測(cè)作文(第三次作文初稿)進(jìn)行整體評(píng)分,取二者均分作為每篇作文的最終得分。Wilcoxon非參數(shù)檢驗(yàn)結(jié)果顯示,前后測(cè)作文成績(jī)的中位數(shù)都是3分。然而,從符號(hào)秩的數(shù)據(jù)看,正秩(后測(cè)>前測(cè))的個(gè)案數(shù)為22,秩平均值為12.18;負(fù)秩(后測(cè)<前測(cè))的個(gè)案數(shù)為5,秩平均值為8.00;綁定值(后測(cè)=前測(cè))的個(gè)案數(shù)為5??梢?,學(xué)生后測(cè)作文成績(jī)要高于前測(cè),且這種差異具有顯著性(Z=-4.09,p<0.01),效應(yīng)量為中等(見表8)。經(jīng)過十周的教學(xué)干預(yù),學(xué)生獨(dú)立完成作文的成績(jī)較前測(cè)有顯著提升,且該提升具有長期效應(yīng),表明在智能作文反饋的學(xué)習(xí)環(huán)境中,學(xué)生能將習(xí)得技能遷移到新的寫作任務(wù)中。
表8 學(xué)生前后測(cè)作文成績(jī)的Wilcoxon非參數(shù)檢驗(yàn)(n=28)
由此可知,融入智能作文反饋的寫作教學(xué)不僅能促進(jìn)學(xué)生作文終稿成績(jī)較初稿的短期提升,還有助于學(xué)生議論文寫作能力的長期進(jìn)步。
其次,對(duì)學(xué)生前測(cè)和后測(cè)作文(第三次作文初稿)的字?jǐn)?shù)統(tǒng)計(jì)顯示,學(xué)生前測(cè)作文平均字?jǐn)?shù)為515.32,后測(cè)作文平均字?jǐn)?shù)為708.18,后測(cè)作文字?jǐn)?shù)比前測(cè)高出近200。配對(duì)樣本t檢驗(yàn)結(jié)果顯示,后測(cè)作文長度顯著高于前測(cè)作文長度(t=7.47,p<0.01)??梢?,在融入智能作文反饋的寫作教學(xué)條件下,學(xué)生作文長度提升幅度顯著。
最后,研究者和W教師對(duì)學(xué)生前后測(cè)作文中的議論文要素合作評(píng)分,由此得到前后測(cè)作文的文體要素得分。Wilcoxon非參數(shù)檢驗(yàn)結(jié)果顯示,后測(cè)作文在論據(jù)、闡釋和結(jié)論上的得分顯著高于前測(cè),且具備小到中等的效應(yīng)量;前后測(cè)作文在論點(diǎn)和反駁層面的得分均沒有顯著差異(見表9)。深入調(diào)查發(fā)現(xiàn),有12名學(xué)生的后測(cè)作文論據(jù)項(xiàng)數(shù)高于前測(cè),占總樣本的42.86%;有19名學(xué)生的后測(cè)作文闡釋項(xiàng)數(shù)超過前測(cè),占總樣本的67.86%;有10名學(xué)生在后測(cè)作文中增加結(jié)論要素,完成從無到有的突破,占總樣本的35.71%??梢?,在融入智能作文反饋的寫作教學(xué)條件下,學(xué)生對(duì)論據(jù)、闡釋、結(jié)論三個(gè)文體要素的使用頻率提升顯著,論點(diǎn)和反駁兩個(gè)要素的使用頻率沒有顯著變化。
表9 學(xué)生前后測(cè)作文中議論文要素的Wilcoxon非參數(shù)檢驗(yàn)結(jié)果(n=28)
綜上可知,在融入智能作文反饋的寫作教學(xué)條件下,中學(xué)生議論文在作文成績(jī)、文章長度和文體要素使用上都有顯著進(jìn)步。在這一顯性表現(xiàn)的背后,學(xué)生寫作動(dòng)機(jī)與修改信念的變化也值得關(guān)注。
針對(duì)問題三(融入智能反饋的中學(xué)議論文寫作教學(xué)能否促進(jìn)學(xué)生寫作動(dòng)機(jī)和修改信念的提升?),本研究首先對(duì)學(xué)生寫作動(dòng)機(jī)前后測(cè)進(jìn)行配對(duì)樣本t檢驗(yàn)。表10顯示,學(xué)生寫作動(dòng)機(jī)后測(cè)在毅力維度(t=2.15,p<0.05)和激情維度(t=2.53,p<0.05)都較前測(cè)有顯著提升,自信維度前后測(cè)之間沒有顯著差異。
表10 學(xué)生寫作動(dòng)機(jī)前后測(cè)的t檢驗(yàn)(n=28)
其次,對(duì)寫作修改信念前后測(cè)進(jìn)行配對(duì)樣本t檢驗(yàn)。表11顯示,后測(cè)量表均分顯著高于前測(cè)(t=4.40,p<0.01),低階修改信念后測(cè)得分顯著高于前測(cè)(t=3.58,p<0.01),高階修改信念后測(cè)得分也顯著高于前測(cè)(t=4.47,p<0.01)。值得注意的是,學(xué)生前測(cè)的高階修改信念均分6.53(SD=2.55)低于低階修改信念均分7.14(SD=2.40);學(xué)生后測(cè)的高階修改信念均分8.17(SD=2.82)也低于低階修改信念均分8.64(SD=1.76)。
表11 學(xué)生寫作修改信念前后測(cè)配對(duì)樣本t檢驗(yàn)(n=28)
總之,在融入智能作文反饋的寫作教學(xué)條件下,學(xué)生寫作修改信念較前測(cè)有所提升,量表均分、低階修改信念和高階修改信念的提升都是顯著的。此外,不管是前測(cè)還是后測(cè),學(xué)生的低階修改信念得分都高于高階修改信念,說明學(xué)生對(duì)完成低階修改有更強(qiáng)的意愿和信心。
學(xué)生寫作修改實(shí)踐、作文質(zhì)量、寫作動(dòng)機(jī)和信念在準(zhǔn)實(shí)驗(yàn)期間的發(fā)展變化情況,都可以和學(xué)生的體驗(yàn)感受類信息互相印證。針對(duì)問題四(中學(xué)生對(duì)智能作文反饋的體驗(yàn)與感受如何?),本研究借助三個(gè)開放性問題收集學(xué)生的體驗(yàn)和感受數(shù)據(jù)。對(duì)于問題一(你認(rèn)為IN課堂作文評(píng)分對(duì)你的寫作有幫助嗎,為什么?),有16名學(xué)生(占比80%)給出肯定回答,理由有三。第一,它能幫助學(xué)生了解作文質(zhì)量(九人次)。一方面,IN課堂評(píng)分可幫助認(rèn)識(shí)自身作文水平,讓學(xué)生有自知之明,不會(huì)盲目自信;另一方面,在修改作文提交后,系統(tǒng)會(huì)立即評(píng)分,學(xué)生可了解修改后的作文質(zhì)量。第二,它能促進(jìn)學(xué)生寫作修改實(shí)踐(七人次)。有人表示,自己提交作文后會(huì)第一時(shí)間關(guān)注分?jǐn)?shù),如果偏低,就會(huì)立刻修改,“覺得分?jǐn)?shù)太低似乎傷自尊,想要努力去修改完善”,“它會(huì)激勵(lì)自己努力去突破,修改一次就看看是否有提升,等待的三秒鐘有點(diǎn)小激動(dòng)的,就像玩游戲一樣,能增加寫作的趣味性”。第三,它能增強(qiáng)學(xué)生的寫作自信(三人次)。有同學(xué)舉例說,“我把文章修改提交后,發(fā)現(xiàn)比之前提升了5分,就會(huì)覺得自身努力被認(rèn)可,會(huì)很開心”。
有兩名學(xué)生(占比10%)表示IN課堂評(píng)分對(duì)寫作沒有幫助,并對(duì)其評(píng)分公正性表示質(zhì)疑。學(xué)生提到,“系統(tǒng)對(duì)字?jǐn)?shù)過于重視,對(duì)重復(fù)累贅語段不能有效判定,對(duì)引用名言的判斷過于程式化,只關(guān)注是否有引用標(biāo)志,這會(huì)導(dǎo)致評(píng)分不公”,“如果我增加一段和主題無關(guān)的內(nèi)容,作文分?jǐn)?shù)也會(huì)提升,這說明智能評(píng)分和人類評(píng)分還是有差距的,它還是不夠聰明”。另外兩名學(xué)生(占比10%)未明確表態(tài)。
針對(duì)問題二(IN課堂的反饋建議對(duì)你的寫作有幫助嗎,為什么?),有13名學(xué)生(占比65%)給出了肯定答案,有五名學(xué)生(占比25%)表示沒有用或用處不太大,還有兩名學(xué)生(占比10%)沒有給出明確回答。
對(duì)IN課堂反饋建議持肯定態(tài)度的學(xué)生主要給出了三點(diǎn)理由。第一,它能為學(xué)生寫作修改過程提供支持,拓展修改思路(六人次)。一方面,系統(tǒng)會(huì)針對(duì)標(biāo)點(diǎn)、錯(cuò)別字和語法等提供修改建議。有學(xué)生舉例說,IN課堂提出“在同一句話中出現(xiàn)多次‘他’,建議只保留一處,避免稱謂上的重復(fù)”,這是自己寫作時(shí)沒有注意到的,修改后確實(shí)會(huì)讓語句更流暢。另一方面,系統(tǒng)給出的作文提分點(diǎn)往往能提供修改作文的方向。有學(xué)生以作文《豬八戒,取經(jīng)路上的好隊(duì)員》舉例,系統(tǒng)提出“讓事實(shí)說話,用令人信服的事例來證明自己論點(diǎn)正確,道理將不言而喻”,該同學(xué)據(jù)此得到啟發(fā),增加了一個(gè)事例來佐證觀點(diǎn)。第二,它可以豐富學(xué)生寫作知識(shí)和語言積累(三人次)。有學(xué)生提及,“系統(tǒng)提供‘如何使說理具有力度’的寫作指導(dǎo)短文,讓我對(duì)議論文語言有了更深刻的認(rèn)識(shí)”;也有同學(xué)提出,“拓展學(xué)習(xí)”板塊的詞語辨析有趣又有用,能豐富詞語運(yùn)用的知識(shí)。第三,它會(huì)激發(fā)學(xué)生寫作和修改的熱情(五人次)。有學(xué)生認(rèn)為,系統(tǒng)會(huì)對(duì)作文從詞句到語段都大加表揚(yáng),讓學(xué)生有種被肯定的自豪感,更積極地投入寫作與修改實(shí)踐。
然而,也有五名學(xué)生(占比25%)認(rèn)為IN課堂反饋信息沒有用或用處不大,主要有三個(gè)原因。第一,系統(tǒng)表揚(yáng)內(nèi)容過于夸張且不貼合文本(兩人次)。有學(xué)生舉例說,系統(tǒng)說文章“語言優(yōu)美,又富有啟迪,以小見大、見社會(huì)、見精神”,與文章內(nèi)容不符,適當(dāng)表揚(yáng)確實(shí)能激勵(lì)寫作,但表揚(yáng)不貼切也影響效果。第二,反饋建議存在籠統(tǒng)、缺乏針對(duì)性、程式化等問題(四人次)。有學(xué)生舉例說,系統(tǒng)建議有時(shí)過于寬泛和籠統(tǒng),它提出“文章角度比較單一,說服力不強(qiáng),建議運(yùn)用正反對(duì)比的思維方式組織和闡釋材料”,自己還是不知從何處下手;也有學(xué)生覺得某些建議聽起來不錯(cuò),但很難落實(shí),比如系統(tǒng)建議“立意角度還可以更有新意,可嘗試打破常規(guī),逆向思維,進(jìn)行反向立意”,自己很難據(jù)此修改。第三,對(duì)文本錯(cuò)誤的識(shí)別率不高(三人次)。有學(xué)生指出,盡管系統(tǒng)識(shí)別出部分標(biāo)點(diǎn)、錯(cuò)別字和語法等文本錯(cuò)誤,但大量語言錯(cuò)誤,尤其是比較復(fù)雜的語法錯(cuò)誤還不能被識(shí)別出來。
針對(duì)第三個(gè)開放問題(你認(rèn)為IN課堂系統(tǒng)在哪些方面需要改進(jìn)?),學(xué)生提出完善評(píng)分機(jī)制、加強(qiáng)內(nèi)容反饋的針對(duì)性、提供寫作范文范例、豐富評(píng)價(jià)文體(比如增加詩歌類)等改進(jìn)建議。
學(xué)生最常做出的修改行為是增加和替換,二者都能體現(xiàn)出學(xué)生處理寫作問題時(shí)的積極態(tài)度。Link,Mehrzad, & Rahimi(2020)的研究發(fā)現(xiàn),智能反饋條件下學(xué)生會(huì)更頻繁地做出移除行為,即把反饋有問題的內(nèi)容直接刪除,帶有逃避問題的消極傾向;與之相比,本研究的結(jié)果還是讓人樂觀的。此外,學(xué)生用到調(diào)序的次數(shù)最少,或許調(diào)整內(nèi)容順序要用到較高層次的寫作與思維能力,對(duì)中低水平學(xué)生來說并不容易。
學(xué)生低階修改比例(60.38%)高于高階修改(39.62%),即學(xué)生更側(cè)重低階修改。對(duì)中學(xué)生來說,或許理解與落實(shí)高階修改建議有一定的難度。該結(jié)果與寫作修改信念調(diào)查的發(fā)現(xiàn)是契合的,學(xué)生低階修改信念得分高于高階修改信念,說明學(xué)生更有意愿和信心完成低階修改。深入調(diào)查IN課堂反饋內(nèi)容發(fā)現(xiàn),學(xué)生會(huì)忽視系統(tǒng)生成的大量高階建議,落實(shí)高階修改建議需要更復(fù)雜的寫作技能和更強(qiáng)的毅力,即使對(duì)優(yōu)秀的學(xué)生來說也是挑戰(zhàn)。學(xué)生在回顧筆記中也提到,IN課堂高階修改建議存在過于籠統(tǒng)、程式化、針對(duì)性不強(qiáng)等問題,或許現(xiàn)階段人工智能技術(shù)還無法達(dá)成對(duì)內(nèi)容意義的深度理解,教師在高階反饋方面應(yīng)該更有優(yōu)勢(shì),這也為人機(jī)協(xié)同寫作教學(xué)提供了發(fā)展方向。
學(xué)生自主修改和回應(yīng)IN課堂反饋修改的占比分別為83%和17%,說明學(xué)生非常重視自主修改,會(huì)依靠個(gè)體認(rèn)知積極發(fā)現(xiàn)、診斷并解決寫作中的問題。學(xué)生自主修改的成功率低于基于智能反饋的修改成功率,這和先前針對(duì)英語寫作修改研究的結(jié)果是一致的(Link, Mehrzad, & Rahimi, 2020)。IN課堂會(huì)幫助學(xué)生發(fā)現(xiàn)并診斷文本低階錯(cuò)誤,甚至提供具體解決方案,學(xué)生只需接受即可,修改成功率自然會(huì)提高;學(xué)生自主修改文本時(shí),需要獨(dú)立發(fā)現(xiàn)、診斷、解決文本中的問題,每個(gè)步驟都有失敗的可能,修改成功率也會(huì)相應(yīng)降低。
分析學(xué)生的寫作修改特點(diǎn),不僅能幫助語文教育者從微觀角度了解學(xué)生的寫作修改現(xiàn)狀,也可使研究者反思智能反饋工具對(duì)學(xué)生寫作修改的意義和價(jià)值。學(xué)生的寫作修改實(shí)踐不僅體現(xiàn)了學(xué)生的寫作動(dòng)機(jī)與修改信念,也直接影響著學(xué)生作文終稿較初稿的提升狀況,是衡量中學(xué)寫作教學(xué)效果的重要依據(jù)。
該結(jié)果與前人多項(xiàng)研究結(jié)果一致,智能作文反饋對(duì)普通學(xué)生和學(xué)習(xí)障礙生的作文質(zhì)量都有提升作用(Stevenson & Phakiti,2014)。Palermo & Thomson(2018)的研究發(fā)現(xiàn),智能作文反饋與特定教學(xué)策略相結(jié)合能顯著提升中學(xué)生寫作質(zhì)量,本研究的結(jié)果與之基本類似。本研究不僅調(diào)查學(xué)生作文終稿較初稿成績(jī)提升情況,還關(guān)注學(xué)生作文成績(jī)長期提升狀況,同時(shí)分析學(xué)生對(duì)議論文論據(jù)、闡釋和結(jié)論等要素的使用頻率,以期通過多維度數(shù)據(jù)的相互驗(yàn)證提升研究結(jié)果的可信度。
值得注意的是,本研究采取單組前后測(cè)的方法設(shè)計(jì)實(shí)驗(yàn),并沒有對(duì)照組控制實(shí)驗(yàn)條件,因此學(xué)生作文質(zhì)量提升或許得益于課程教學(xué),也可能是自我發(fā)展因素(Stevenson & Phakiti, 2014),未必完全歸因于智能作文反饋的貢獻(xiàn),這也是本研究的局限所在。教學(xué)實(shí)驗(yàn)設(shè)計(jì)和實(shí)施需依托已有學(xué)生和課程資源,難以在真空條件下開展,更嚴(yán)謹(jǐn)?shù)膶?duì)照實(shí)驗(yàn)設(shè)計(jì)還有待未來研究推進(jìn)。
寫作動(dòng)機(jī)對(duì)提升作文成績(jī)具有重要作用(Hayes, 2012)。已有研究表明,智能作文反饋能促進(jìn)學(xué)生寫作動(dòng)機(jī)的提升(Morphy & Graham, 2012; Foltz, 2014),本研究印證了該結(jié)論。經(jīng)過十周的教學(xué)試驗(yàn),學(xué)生寫作動(dòng)機(jī)在毅力和激情維度提升顯著,證實(shí)中文智能作文反饋對(duì)中學(xué)生寫作動(dòng)機(jī)具有積極影響。學(xué)生在回顧筆記中也提出,IN課堂的“秒評(píng)分”讓學(xué)生看到點(diǎn)滴進(jìn)步,會(huì)提升寫作信心,“秒反饋”也通過全面表揚(yáng)激發(fā)學(xué)生寫作興趣,這都和學(xué)生寫作動(dòng)機(jī)密切相關(guān)。值得注意的是,學(xué)生寫作動(dòng)機(jī)發(fā)展過程緩慢,且受多種因素的影響。由于缺乏對(duì)照組,學(xué)生又來自不同班級(jí),本研究設(shè)計(jì)方案本身并沒有排除語文課程、家庭教育等干擾因素,因此對(duì)該結(jié)論的接受和解釋應(yīng)持慎重態(tài)度。
學(xué)生寫作修改信念在低階和高階維度都有顯著提升,這與學(xué)生寫作毅力維度的提升可相互解釋。學(xué)生寫作動(dòng)機(jī)量表第三題(我在寫作中會(huì)嘗試各種可能性)和第十題(我會(huì)花時(shí)間解決寫作中的問題)屬于毅力維度,都和寫作修改信念聯(lián)系緊密。學(xué)生寫作修改信念提升或許與兩種因素有關(guān):一方面,教師鼓勵(lì)學(xué)生圍繞論點(diǎn)、論據(jù)等文體要素構(gòu)思、撰寫和反思文本,學(xué)生在修改時(shí)有抓手;另一方面,智能作文反饋即時(shí)而便捷,學(xué)生能隨時(shí)提交作文并得到“秒評(píng)分”和“秒反饋”,這能激發(fā)學(xué)生的持續(xù)修改意愿。然而,寫作修改信念與學(xué)生修改數(shù)量、行為、層次等實(shí)踐未必存在正相關(guān),也就是說,學(xué)生修改信念提升并不等于同等程度的寫作修改行為與效果。修改信念轉(zhuǎn)化為有效寫作修改實(shí)踐不僅需要師生協(xié)力提升寫作修改能力,還有賴智能作文評(píng)價(jià)系統(tǒng)在技術(shù)上迭代更新,提升反饋質(zhì)量,強(qiáng)化過程支持力度。
回顧筆記顯示,百分之八十的學(xué)生肯定智能評(píng)分對(duì)寫作的促進(jìn)作用,超過一半的學(xué)生對(duì)IN課堂的內(nèi)容反饋持肯定態(tài)度,即大多數(shù)學(xué)生認(rèn)可智能作文反饋的效果,這與先前針對(duì)英語智能作文評(píng)價(jià)的調(diào)查結(jié)果是一致的,師生大多數(shù)情況下對(duì)智能反饋有著較高的認(rèn)可度(Palermo & Thomson, 2018; Grime &Warschauer, 2010)。學(xué)生認(rèn)為智能評(píng)分的有用性體現(xiàn)在幫助認(rèn)識(shí)自身作文水平、促進(jìn)寫作修改、提升寫作自信等方面,這都建立在IN課堂評(píng)分效度良好的基礎(chǔ)上。這里的“評(píng)分效度良好”主要來自學(xué)生的主觀判斷,即學(xué)生認(rèn)為IN課堂評(píng)分和作文質(zhì)量是契合的,能反映自身真實(shí)的寫作水平;少部分學(xué)生對(duì)IN課堂評(píng)分效度產(chǎn)生質(zhì)疑,認(rèn)為自己將修改后的文本反饋給系統(tǒng)時(shí),IN課堂迭代評(píng)分不夠準(zhǔn)確科學(xué),因此不認(rèn)可智能評(píng)分。盡管學(xué)生對(duì)IN課堂評(píng)分效度的評(píng)判未必完全科學(xué),但它能為IN課堂的系統(tǒng)改進(jìn)提供重要啟發(fā)。先前有研究證實(shí)IN課堂評(píng)分效度良好,但是它主要關(guān)注系統(tǒng)對(duì)作文的初次評(píng)分,而非寫作修改過程中對(duì)同一篇作文的動(dòng)態(tài)的迭代評(píng)分(劉淑君,李艷,楊普光,李小麗和高紅芳,2021),而這恰恰是學(xué)生在寫作修改過程中更為看重的。
一半以上的學(xué)生對(duì)IN課堂的內(nèi)容反饋持肯定態(tài)度,認(rèn)為它能拓展寫作修改思路、豐富知識(shí)積累并激發(fā)寫作興趣,這分別指向IN課堂提供的糾正型、信息型(比如提供學(xué)習(xí)資源)和表揚(yáng)型反饋的有效性。部分學(xué)生提出智能反饋內(nèi)容存在表揚(yáng)不夠貼切、建議過于籠統(tǒng)、對(duì)文本錯(cuò)誤識(shí)別率不高等問題??梢?,學(xué)生是否接受智能反饋信息,取決于反饋內(nèi)容是否準(zhǔn)確科學(xué)且容易理解,即學(xué)生只有在認(rèn)可反饋內(nèi)容的科學(xué)性、能夠理解且有能力實(shí)施時(shí),才能將其轉(zhuǎn)化為寫作修改行為(Link, Mehrzad, & Rahimi,2020)。
由此可知,智能反饋質(zhì)量是影響學(xué)生使用體驗(yàn)的關(guān)鍵因素。大部分學(xué)生對(duì)智能作文反饋持積極態(tài)度,這帶給語文教育者一種技術(shù)賦能教學(xué)的信念,也顯示出智能作文反饋在教學(xué)應(yīng)用上的巨大潛力。同時(shí),學(xué)生基于用戶體驗(yàn)對(duì)IN課堂提出完善評(píng)分機(jī)制、加強(qiáng)反饋針對(duì)性等建議,為系統(tǒng)的功能完善和技術(shù)革新提供了重要啟發(fā)。
修改是寫作認(rèn)知模型中的關(guān)鍵環(huán)節(jié)( Flower & Hayes, 1981),學(xué)生在發(fā)現(xiàn)、診斷和解決文本問題的過程中會(huì)遇到困難,需要從寫作反饋中得到支持。智能作文反饋具備即時(shí)生成和雙向互動(dòng)的優(yōu)勢(shì),讓“練習(xí)—反饋—修改”的迭代過程實(shí)現(xiàn)智能化(Attali, 2004);同時(shí),系統(tǒng)語料庫可為學(xué)生匹配個(gè)性化學(xué)習(xí)資源,推動(dòng)自適應(yīng)學(xué)習(xí)的發(fā)展。融入智能作文反饋的中學(xué)寫作教學(xué)在學(xué)生寫作修改實(shí)踐、作文質(zhì)量和寫作動(dòng)機(jī)信念等維度收獲了積極成效。教師盡管在認(rèn)知和精力上存在局限,但在意義理解、情感交流、學(xué)習(xí)引導(dǎo)等方面的優(yōu)勢(shì)依然無可取代。人機(jī)協(xié)同教學(xué)應(yīng)是未來寫作教學(xué)的理想形態(tài),智能作文反饋能成為傳統(tǒng)寫作教學(xué)的有益補(bǔ)充,但并不能動(dòng)搖教學(xué)過程中師生對(duì)話的核心作用(閆光才,2021)。
依托B校“論辯寫作”課程的單組教學(xué)實(shí)驗(yàn),本研究從學(xué)生寫作修改實(shí)踐、作文質(zhì)量、動(dòng)機(jī)信念等維度探究融入智能作文反饋的中學(xué)議論文寫作教學(xué)效果,主要得出三點(diǎn)結(jié)論。
第一,在智能作文反饋條件下,學(xué)生最常做出的修改行為是增加和替換,較少用到刪除和調(diào)序,寫作修改行為較為積極;學(xué)生更側(cè)重低階修改,在落實(shí)高階反饋建議上還面臨挑戰(zhàn);學(xué)生非常重視自主修改,然而其成功率低于回應(yīng)IN課堂反饋修改的成功率。第二,融入智能作文反饋的議論文寫作教學(xué)效果良好,學(xué)生的作文質(zhì)量、寫作動(dòng)機(jī)及寫作修改信念得到全方位提升,智能作文反饋系統(tǒng)與教師的協(xié)同教學(xué)具備實(shí)施的可能性。第三,大部分學(xué)生認(rèn)可智能作文反饋對(duì)寫作的促進(jìn)作用,智能反饋質(zhì)量是影響學(xué)生體驗(yàn)的重要因素。
上述結(jié)論說明,智能作文反饋能促進(jìn)學(xué)生作文質(zhì)量和動(dòng)機(jī)信念的提升,學(xué)生對(duì)其認(rèn)可度較高,具備教學(xué)應(yīng)用的基礎(chǔ),這為人機(jī)協(xié)同寫作教學(xué)領(lǐng)域的發(fā)展提供了重要啟示和建議。
首先,學(xué)校應(yīng)創(chuàng)設(shè)智慧校園環(huán)境,支持智能技術(shù)在語文教學(xué)中的廣泛應(yīng)用。學(xué)校管理者應(yīng)該順應(yīng)時(shí)代發(fā)展趨勢(shì),充分認(rèn)識(shí)到智能技術(shù)在教學(xué)中的作用,為教師提供自由的工作空間,支持教育創(chuàng)新實(shí)驗(yàn)。其次,教師應(yīng)積極轉(zhuǎn)換角色,提升人工智能素養(yǎng),在人機(jī)協(xié)同寫作教學(xué)中有所擔(dān)當(dāng)。智能作文反饋可以隨時(shí)隨地向?qū)W生提供服務(wù),反饋內(nèi)容豐富而廣泛,這讓寫作教學(xué)超越了教室這一封閉場(chǎng)域,同時(shí)打破了教師“傳道、授業(yè)、解惑”的傳統(tǒng)功能角色。教師要在智能時(shí)代發(fā)揮引領(lǐng)者、促進(jìn)者、協(xié)調(diào)者的作用,推動(dòng)人機(jī)協(xié)同教學(xué)的有效實(shí)施。最后,研發(fā)方應(yīng)立足用戶體驗(yàn),關(guān)注智能作文反饋的應(yīng)用效果,通過跨學(xué)科合作實(shí)現(xiàn)產(chǎn)品持續(xù)迭代升級(jí)。“人—機(jī)”雙向反饋質(zhì)量是決定智能作文反饋應(yīng)用效果的關(guān)鍵因素,只有不斷提升系統(tǒng)的文本識(shí)別和反饋精準(zhǔn)度,找準(zhǔn)定位,才能在人機(jī)協(xié)同寫作教學(xué)中發(fā)揮技術(shù)優(yōu)勢(shì)。系統(tǒng)應(yīng)著力通過高質(zhì)量反饋監(jiān)控學(xué)生修改過程,通過提供學(xué)習(xí)資源和過程性支持輔助學(xué)生提升能力,最終助力學(xué)生成長為獨(dú)立的作者。
華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版)2022年9期