馬玉慧 夏雪瑩 張文慧
[摘? ?要] 課堂提問是教師課堂教學(xué)行為的關(guān)鍵組成部分,是師生進(jìn)行課堂交互的主要方式。對(duì)教師課堂提問進(jìn)行分析,是提升教師課堂教學(xué)水平的關(guān)鍵。視頻分析法是目前進(jìn)行課堂提問分析的主要方法。但該方法需要花費(fèi)大量的時(shí)間和人力,導(dǎo)致無(wú)法進(jìn)行大規(guī)模應(yīng)用。近幾年,隨著人工智能技術(shù)的不斷成熟,越來(lái)越多的領(lǐng)域開始利用人工智能替代人工操作。為使課堂提問分析能夠高效、大規(guī)模地應(yīng)用,本研究提出基于深度學(xué)習(xí)的課堂提問自動(dòng)分析方法。研究采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)及長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM),對(duì)80節(jié)課的9090條課堂教師提問文本進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,CNN模型具有更好的分類效果,其在提問內(nèi)容和提問類型兩個(gè)維度上的整體準(zhǔn)確率分別是85.17%和87.84%。應(yīng)用該方法訓(xùn)練的模型,可替代傳統(tǒng)的視頻分析法,能夠?qū)崿F(xiàn)大規(guī)模的教師課堂提問話語(yǔ)的自動(dòng)分析。
[關(guān)鍵詞] 課堂提問; 自動(dòng)分類; 深度神經(jīng)網(wǎng)絡(luò); 深度學(xué)習(xí)
[中圖分類號(hào)] G434? ? ? ? ? ? [文獻(xiàn)標(biāo)志碼] A
[作者簡(jiǎn)介] 馬玉慧(1974—),女,遼寧錦州人。副教授,博士,主要從事人工智能教育應(yīng)用的研究。E-mail:799493385 @qq.com。
一、引? ?言
課堂提問是教師課堂教學(xué)行為的關(guān)鍵組成部分,是師生進(jìn)行課堂交互的主要方式。有效的課堂教學(xué)提問不僅能夠吸引學(xué)生的注意力,激發(fā)學(xué)習(xí)興趣,而且能夠引導(dǎo)學(xué)生深入思考,及時(shí)評(píng)價(jià)教學(xué)效果[1-2]。對(duì)教師的課堂提問進(jìn)行質(zhì)性研究,是區(qū)分新手教師與專家教師,促進(jìn)教師專業(yè)發(fā)展的有效途徑之一[3-5]?,F(xiàn)有的教師課堂提問研究,多采用視頻案例分析法,即對(duì)課堂教學(xué)進(jìn)行錄像,課后反復(fù)觀看錄像,并將教師教學(xué)行為轉(zhuǎn)錄為文字,再進(jìn)行編碼統(tǒng)計(jì)分析[6-8]。這種分析方法可以較好地對(duì)教師課堂提問進(jìn)行深入的量化與剖析,確定教師課堂上的提問數(shù)量、提問方式、提問類型及提問所在教學(xué)環(huán)節(jié)等[9-11]。但該方法面臨的主要問題是需要大量的人工操作,導(dǎo)致該方法無(wú)法大規(guī)模推廣使用。
深度學(xué)習(xí)(Deep Learning)是當(dāng)前人工智能技術(shù)發(fā)展的主流方向。近幾年人工智能技術(shù)在眾多領(lǐng)域的廣泛推廣與使用,大多歸功于深度學(xué)習(xí)技術(shù)的發(fā)展。深度學(xué)習(xí)幾乎成了人工智能的代名詞。隨著訓(xùn)練數(shù)據(jù)的不斷增多,算力大幅提升,算法的創(chuàng)新與改進(jìn),深度學(xué)習(xí)訓(xùn)練得到的智能體越來(lái)越多地應(yīng)用在不同領(lǐng)域,替代人類自動(dòng)完成各項(xiàng)耗時(shí)、耗力的繁雜工作,將人們從大量的重復(fù)性工作中解放出來(lái),將更多精力集中于創(chuàng)造性的工作中。
近幾年,深度學(xué)習(xí)技術(shù)已開始應(yīng)用于教育領(lǐng)域[12-14],教育研究者期望用機(jī)器自己學(xué)習(xí)得到的模型替代部分人類工作,減輕研究者和教師的工作負(fù)擔(dān),實(shí)現(xiàn)智能教育。在本研究中,針對(duì)現(xiàn)有基于視頻分析法進(jìn)行教師課堂提問研究的不足,本文提出了利用深度學(xué)習(xí)技術(shù),對(duì)教師的課堂提問進(jìn)行研究的方法,解決視頻分析無(wú)法大規(guī)模使用的問題,同時(shí)為基于深度學(xué)習(xí)的教師課堂分析提供研究思路與方法的借鑒。
二、研究現(xiàn)狀
(一)教師課堂提問的分類及分析方法研究
課堂提問是教師課堂教學(xué)中最普遍的教學(xué)行為之一,是教學(xué)過程中師生進(jìn)行溝通和交流的主要方法。課堂提問是教學(xué)質(zhì)量的重要保障,但若能在課堂上進(jìn)行有效的提問絕非易事[15]。已有研究表明,新手教師在課堂提問方面,與專家型教師存在較大差異[5,16]。因此,對(duì)新手教師的課堂提問進(jìn)行研究,發(fā)現(xiàn)新手教師與專家教師在提問環(huán)節(jié)的差異,對(duì)于新手教師提高教學(xué)質(zhì)量,促進(jìn)專業(yè)發(fā)展具有重要作用[17]。
在現(xiàn)有課堂提問的研究中,教師提問分類問題是眾多研究者關(guān)注的重點(diǎn)之一。于國(guó)文等對(duì)不同國(guó)家中學(xué)數(shù)學(xué)教師的課堂提問進(jìn)行了研究,將教師數(shù)學(xué)課堂提問分為三個(gè)維度:提問對(duì)象、提問內(nèi)容和提問水平。進(jìn)一步地,將提問對(duì)象分為個(gè)別學(xué)生、小組和全班同學(xué);提問內(nèi)容分為知識(shí)點(diǎn)類、題目信息類和管理類;提問水平分為低水平的回憶型、理解型和應(yīng)用型,高水平的分析型、綜合型和評(píng)價(jià)型[18]。顧泠沅將提問類型分為常規(guī)管理性問題、記憶性問題、推理性問題、創(chuàng)造性問題和批判性問題五類[19];涂榮豹將提問類型分為回憶性提問、理解性提問、分析綜合性提問和評(píng)價(jià)性提問[20]。葉立軍等根據(jù)教師提問的作用,回答所對(duì)應(yīng)的認(rèn)知水平,將提問分為管理型提問、識(shí)記型提問、重復(fù)型提問、提示型提問、補(bǔ)充型提問、理解型提問、評(píng)價(jià)型問題7種類型[4]。已有研究的提問分類維度為實(shí)現(xiàn)教師課堂提問的自動(dòng)分析提供了很好的研究基礎(chǔ)。
目前常用的課堂提問分析方法是視頻分析法。張文宇等對(duì)我國(guó)首屆全日制教育碩士學(xué)科教學(xué)(數(shù)學(xué))專業(yè)教學(xué)技能決賽的33名參賽學(xué)生的視頻進(jìn)行視頻分析,由此發(fā)現(xiàn)這些職前教師在課堂提問環(huán)節(jié)的不足[10]。葉立軍等同樣采用視頻分析法,對(duì)兩位從教二十年教師的課堂視頻實(shí)錄進(jìn)行分析。除了對(duì)兩位教師的課堂提問類型進(jìn)行統(tǒng)計(jì)分析外,還對(duì)提問的總共用時(shí)、學(xué)生回答的次數(shù)、回答的總時(shí)長(zhǎng)進(jìn)行了統(tǒng)計(jì)分析[4]。于國(guó)文等采用基于NVivo對(duì)中國(guó)、澳大利亞、法國(guó)、芬蘭的專家型教師的課堂教學(xué)視頻中的課堂提問進(jìn)行了比較分析,探究不同國(guó)家教師課堂提問的各自特點(diǎn)[18]。
通常,課堂教學(xué)的視頻分析法的具體步驟如下:(1)將課堂實(shí)錄視頻轉(zhuǎn)錄為文字,生成原始素材;(2)將素材導(dǎo)入視頻分析軟件(如NVivo軟件等);(3)構(gòu)建課堂提問分類編碼體系,并進(jìn)行信度和效度驗(yàn)證;(4)基于提問分類編碼體系,人工進(jìn)行編碼;(5)利用SPSS軟件進(jìn)行編碼的統(tǒng)計(jì)分析。
視頻分析法能夠有效地對(duì)教師課堂提問進(jìn)行分析,但也存在顯著的不足,即整個(gè)分析過程需要投入大量的人力和時(shí)間,導(dǎo)致該方法無(wú)法大規(guī)模推廣應(yīng)用,無(wú)法對(duì)更多教師的課堂提問進(jìn)行精準(zhǔn)分析。為此,在人工智能時(shí)代,采用自動(dòng)分析法替代視頻分析法成為大規(guī)模促進(jìn)教師專業(yè)發(fā)展的切實(shí)有效途徑。
(二)基于深度學(xué)習(xí)的文本分類在教育中的應(yīng)用
深度學(xué)習(xí)最早由加拿大多倫多大學(xué)教授希頓(Hinton)等提出。深度學(xué)習(xí)模型的結(jié)構(gòu)模擬了人類大腦神經(jīng)系統(tǒng)的結(jié)構(gòu)原理,通過多層神經(jīng)元之間的信息傳遞,實(shí)現(xiàn)不同特征的提取,最終形成數(shù)據(jù)的分層特征表示。理解深度學(xué)習(xí),可以從“深度”和“學(xué)習(xí)”兩個(gè)方面著手。“學(xué)習(xí)”是指深度學(xué)習(xí)完成任務(wù)所需的“知識(shí)或技能”并非來(lái)源于人們預(yù)先編寫的程序規(guī)則,而是從大量數(shù)據(jù)中自動(dòng)學(xué)習(xí)獲得。也就是說,深度學(xué)習(xí)獲取知識(shí)的途徑來(lái)源于海量數(shù)據(jù)?!吧疃取笔窍鄬?duì)于機(jī)器學(xué)習(xí)的“淺層”而言的。機(jī)器學(xué)習(xí)中的邏輯回歸、支持向量機(jī)、最大熵方法等模型,都是基于淺層結(jié)構(gòu)來(lái)處理數(shù)據(jù)的。這些模型只有1層或2層非線性特征轉(zhuǎn)換層,而深度學(xué)習(xí)是一個(gè)具有多層隱層節(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)。多層隱層節(jié)點(diǎn)的結(jié)構(gòu)不僅能更好地刻畫大量數(shù)據(jù)中隱含的復(fù)雜特征,而且通過逐層初始化,降低了神經(jīng)元數(shù)量和訓(xùn)練的難度。此外,相對(duì)于淺層學(xué)習(xí)而言,深度學(xué)習(xí)還有一個(gè)顯著優(yōu)勢(shì),通過多層隱層的模型結(jié)構(gòu),再加上海量的數(shù)據(jù),能夠自動(dòng)學(xué)習(xí)隱藏在數(shù)據(jù)背后的更有用的特征,無(wú)須淺層機(jī)器學(xué)習(xí)所必需的特征工程,從而能夠更精準(zhǔn)地進(jìn)行預(yù)測(cè)和分類[21-22]。
文本分類是深度學(xué)習(xí)在自然語(yǔ)言理解領(lǐng)域的一個(gè)主要應(yīng)用場(chǎng)景之一。基于深度學(xué)習(xí)文本分類的一般流程大致為文本預(yù)處理、文本表示、基于深度學(xué)習(xí)模型的文本分類三個(gè)部分。不同領(lǐng)域的中文文本分類的應(yīng)用和研究,其文本預(yù)處理的方法大體相同,基本包括中文分詞、去停用詞、規(guī)范化等。文本表示是將文字轉(zhuǎn)換成計(jì)算機(jī)能夠進(jìn)行處理運(yùn)算的數(shù)字或向量。深度學(xué)習(xí)中多采用詞嵌入方法,如Word2Vec、Bert等方法將文本表示成多維的向量,用于后續(xù)的基于向量的分類?;谏疃葘W(xué)習(xí)文本分類的不同應(yīng)用研究,其主要的不同在于采用了不同的深度學(xué)習(xí)模型。目前,常見的深度學(xué)習(xí)文本分類模型有卷積神經(jīng)網(wǎng)絡(luò)CNN[23]、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)LSTM[24-25]、雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)Bi-LSTM[26]、基于注意力機(jī)制的雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)BiLSTM-Attention[27]等。
目前,基于深度學(xué)習(xí)的文本分類技術(shù)已開始應(yīng)用于教育領(lǐng)域,并取得了一定的研究成果。例如馮翔等為自動(dòng)識(shí)別在線學(xué)習(xí)過程中學(xué)生的學(xué)業(yè)情緒,構(gòu)建了基于LSTM模型的學(xué)業(yè)情緒預(yù)測(cè)系統(tǒng)。該系統(tǒng)通過爬蟲程序獲取10萬(wàn)余條在線學(xué)習(xí)中學(xué)生的反饋文本數(shù)據(jù),利用LSTM模型實(shí)現(xiàn)學(xué)習(xí)者的學(xué)業(yè)情感的識(shí)別與分類,模型預(yù)測(cè)的準(zhǔn)確率達(dá)到89%[14]。甄園宜等人收集了16047條學(xué)生在線協(xié)作學(xué)習(xí)過程中的交互文本數(shù)據(jù),基于CNN、LSTM、Bi-LSTM模型,將學(xué)生在線協(xié)作學(xué)習(xí)過程中的交互文本進(jìn)行分類,再根據(jù)交互文本所屬類別有針對(duì)性地進(jìn)行在線協(xié)作學(xué)習(xí)的實(shí)時(shí)監(jiān)測(cè)和干預(yù)[12]。研究的實(shí)驗(yàn)結(jié)果表明,相對(duì)于CNN、LSTM模型而言,Bi-LSTM具有更高的準(zhǔn)確率,為77.42%。羅梟應(yīng)用Bi-LSTM結(jié)合CNN實(shí)現(xiàn)了試卷主觀題的自動(dòng)評(píng)分。采用的方法是將之前主觀題的連續(xù)評(píng)分(如滿分6分)改為分成3個(gè)分?jǐn)?shù)段,相當(dāng)于將主觀題分為3類(0~1分為第1類,2~4分為第2類,5~6分為第3類),這樣就將主觀題的評(píng)分轉(zhuǎn)換成文本分類問題,在SST-2數(shù)據(jù)集上其準(zhǔn)確率為89.7%[28]。
綜上所述,基于深度學(xué)習(xí)的文本分類能夠幫助人類減少大量重復(fù)、繁雜工作,是實(shí)現(xiàn)教育智能化的有力抓手之一。目前該基于深度學(xué)習(xí)的文本分類在教育領(lǐng)域中的應(yīng)用尚處于起步階段。不同的應(yīng)用情境,分類的準(zhǔn)確率會(huì)受到數(shù)據(jù)集質(zhì)量、深度學(xué)習(xí)模型的選定,以及分類歧義程度等諸多因素的影響。如何挖掘教育領(lǐng)域中的文本分類的教育問題,選擇適當(dāng)?shù)纳疃葘W(xué)習(xí)模型,是目前我們進(jìn)行深度學(xué)習(xí)文本分類教育應(yīng)用的關(guān)鍵所在。
三、基于深度學(xué)習(xí)的教師課堂提問分類方法
教師課堂教學(xué)提問分析本質(zhì)上是文本分類問題。采用基于深度學(xué)習(xí)的文本分類方法對(duì)教師的課堂教學(xué)提問進(jìn)行分析,能夠很好地解決傳統(tǒng)視頻分析方法無(wú)法大規(guī)模應(yīng)用的問題。基于深度學(xué)習(xí)對(duì)教師的課堂提問進(jìn)行分類,首先要構(gòu)建分類體系,再利用深度學(xué)習(xí)的分類方法進(jìn)行分類。下面以初中數(shù)學(xué)課堂為例,闡述基于深度學(xué)習(xí)的教師課堂提問分類方法。
(一)數(shù)學(xué)課堂提問的分類
本文主要在于國(guó)文等關(guān)于數(shù)學(xué)課堂提問分類研究的基礎(chǔ)上[18],將數(shù)學(xué)課堂提問分為提問內(nèi)容和提問類型兩大類。提問內(nèi)容主要是“提問什么”,提問類型則依據(jù)布魯姆的教學(xué)目標(biāo)分類,從提問認(rèn)知層級(jí)的視角進(jìn)行了進(jìn)一步劃分。具體地,將提問按提問內(nèi)容分為知識(shí)點(diǎn)類提問、題目信息類提問和管理類提問;將提問類型分為識(shí)記型提問、提示型提問、分析型提問、應(yīng)用型提問、評(píng)價(jià)性提問。具體的類別劃分及示例見表1。
(二)基于深度學(xué)習(xí)的課堂提問分類的流程
基于深度學(xué)習(xí)的課堂提問分類主要包括數(shù)據(jù)收集、語(yǔ)料標(biāo)注、數(shù)據(jù)預(yù)處理、數(shù)據(jù)表示、模型的選擇與訓(xùn)練、預(yù)測(cè)六個(gè)步驟。
1. 數(shù)據(jù)收集與整理
數(shù)據(jù)收集是進(jìn)行深度學(xué)習(xí)模型訓(xùn)練的第一步,也是很關(guān)鍵的一步。數(shù)據(jù)集的數(shù)量、各類別數(shù)據(jù)量的均衡程度,都會(huì)對(duì)分類效果產(chǎn)生影響。教師課堂提問的數(shù)據(jù)多來(lái)源于課堂實(shí)錄,因此要先利用語(yǔ)音轉(zhuǎn)換軟件,將視頻中的語(yǔ)音轉(zhuǎn)換成文本。
2. 語(yǔ)料標(biāo)注
將收集的數(shù)據(jù)以句子為單位進(jìn)行標(biāo)注。在本研究中將提問按其對(duì)應(yīng)的提問內(nèi)容分別標(biāo)注為0、1、2三類,按提問類型標(biāo)注為0、1、2、3、4五類。例如,將“解分式方程的步驟是什么?”按提問內(nèi)容標(biāo)注為0,按提問類型標(biāo)注為0;“為什么兩個(gè)三角形相似?說出你的理由”按提問內(nèi)容標(biāo)注為1,按提問類型標(biāo)注為2。
3. 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理的目的是將收集的數(shù)據(jù)集轉(zhuǎn)換成符合深度學(xué)習(xí)模型訓(xùn)練要求的數(shù)據(jù)。本研究中的預(yù)處理包括去除過長(zhǎng)或過短語(yǔ)句、打亂語(yǔ)料順序,以及數(shù)據(jù)采樣。去除過長(zhǎng)或過短語(yǔ)句,用于減少課堂語(yǔ)料數(shù)據(jù)集的噪聲。打亂語(yǔ)料順序即亂序?qū)W習(xí),是在送入程序之前打亂語(yǔ)料的順序,使得深度學(xué)習(xí)效果更好。為避免各類別中訓(xùn)練樣本的數(shù)據(jù)不均衡,本研究采用合成少數(shù)類過采樣與下采樣相結(jié)合的混合采樣方式,以降低因各類數(shù)據(jù)不均衡而導(dǎo)致的分類誤差。
4. 數(shù)據(jù)表示
數(shù)據(jù)表示一般有詞向量與字向量表示。詞向量是以詞為單位的向量表示,字向量是以字為單位的向量表示。在不同應(yīng)用場(chǎng)景中,基于詞向量與字向量的深度學(xué)習(xí)會(huì)有不同的應(yīng)用效果[29]。由于本研究的數(shù)據(jù)量不大,因此采用字向量進(jìn)行數(shù)據(jù)表示。
5. 模型的選擇與訓(xùn)練
從常用的深度學(xué)習(xí)模型中選擇模型作為分類器進(jìn)行訓(xùn)練,本研究選取CNN模型和LSTM模型作為課堂提問文本的分類器模型。
(1)CNN模型。CNN模型是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks)的簡(jiǎn)稱。典型的CNN模型的結(jié)構(gòu)包括輸入層、卷積層、池化層、全連接層和輸出層。其中卷積層是CNN模型的核心。這些卷積層具有小尺寸但可以在整個(gè)矩陣上移動(dòng)的過濾器,即卷積核。卷積計(jì)算作為一種有效提取特征的方法,每一個(gè)步長(zhǎng)卷積核會(huì)與輸入矩陣出現(xiàn)重合區(qū)域,重合區(qū)域?qū)?yīng)的元素相乘、求和再加上偏置項(xiàng)得到輸出特征的一個(gè)像素點(diǎn);池化用于減少卷積神經(jīng)網(wǎng)絡(luò)中的特征數(shù)據(jù)量;全連接層中每個(gè)神經(jīng)元與前后相鄰層的每一個(gè)神經(jīng)元都有連接關(guān)系,輸入是特征,輸出為預(yù)測(cè)結(jié)果。CNN模型的基本原理:假設(shè)一個(gè)k維向量,首先將每個(gè)字的字向量拼接形成句向量送入神經(jīng)網(wǎng)絡(luò);之后使用卷積核對(duì)句子進(jìn)行卷積操作,形成新特征;然后設(shè)置卷積核步長(zhǎng),得到句子矩陣的特征集;最后對(duì)特征集作最大值池化計(jì)算,找出最大的特征值與某一特定卷積核作對(duì)應(yīng),最終得到分類結(jié)果。
(2)LSTM模型。LSTM模型全稱長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory),是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)模型(RNN),它通過三個(gè)門結(jié)構(gòu)(遺忘門、輸入門和輸出門),較好地解決了循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失、梯度爆炸,以及無(wú)法處理序列中長(zhǎng)距離依賴問題。目前,LSTM已廣泛應(yīng)用于不同領(lǐng)域的序列預(yù)測(cè)。LSTM模型的基本原理是通過三個(gè)門結(jié)構(gòu)控制信息的輸入、更新和輸出,也就是通過門結(jié)構(gòu),有選擇地決定應(yīng)丟棄、更新和輸出哪些信息。具體地,LSTM利用遺忘門,將前一時(shí)刻的隱藏狀態(tài)ht-1和當(dāng)前輸入xt,經(jīng)過Sigmoid函數(shù)δ,決定保留或丟棄前一時(shí)刻記憶單元Ct-1中哪些信息,計(jì)算方法為:ft=δ(Wf·[ht-1,xt]+bf),其中ft表示信息遺忘值,ft=0表示全部舍棄,ft=1表示全部保留。Wf和bf分別表示遺忘門的連接權(quán)重和偏置。輸入門決定了在當(dāng)前節(jié)點(diǎn)中應(yīng)添加哪些信息,輸入門先通過一個(gè)Sigmoid函數(shù),用于控制要更新的信息it,it=δ(Wi·[ht-1,xt]+bi),Wi和bi分別表示輸入門的連接權(quán)重和偏置,再經(jīng)過tanh函數(shù)生成候選向量■■,■■=tanh(WC·[ht-1,xt]+bC),WC和bC分別表示更新值連接權(quán)重和偏置值,則當(dāng)前記憶單元的狀態(tài)Ct=ft*Ct-1+it*■■。輸出門決定了最后輸出什么信息,確定具體的輸出信息。最后的輸出經(jīng)過了Sigmoid函數(shù)和tanh函數(shù),Ot=δ(Wo·[ht-1,xt]+bo),ht=Ot*tanh Ct,Ot表示輸出門狀態(tài),Wo和bo分別表示輸出門的權(quán)重和偏置,ht表示最終輸出值,Ct表示當(dāng)前記憶單元狀態(tài)。確定好模型后,應(yīng)用經(jīng)過預(yù)處理的數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,并調(diào)整模型參數(shù),直至模型在測(cè)試集上的評(píng)價(jià)指標(biāo)不再增加。
6. 預(yù)測(cè)
選擇具有更好分類效果的模型作為分類器,將待分析的提問句子經(jīng)過數(shù)據(jù)表示轉(zhuǎn)換后輸入到模型中進(jìn)行分類,達(dá)到最終的分類結(jié)果。
四、實(shí)驗(yàn)及結(jié)果分析
(一)實(shí)驗(yàn)數(shù)據(jù)集
表2? ? ? ? ? ? ? ? ? 各提問類型語(yǔ)料分布表
本研究收集80節(jié)初中數(shù)學(xué)優(yōu)秀課堂實(shí)錄,共收集到9090條課堂提問語(yǔ)料。為保證課堂提問數(shù)據(jù)的有效性和數(shù)據(jù)均衡性,本研究刪除了部分?jǐn)?shù)據(jù)。將調(diào)整后的教師課堂提問語(yǔ)料分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,即分別選取每類數(shù)據(jù)中的60%作為訓(xùn)練集、20%作為驗(yàn)證集和20%作為測(cè)試集。數(shù)據(jù)集在提問內(nèi)容、提問類型維度上的分布情況見表2。
(二)評(píng)價(jià)標(biāo)準(zhǔn)
本研究通過繪制準(zhǔn)確率(Accuracy)和損失率(Loss)變化趨勢(shì)圖來(lái)直觀得知模型訓(xùn)練過程表現(xiàn)情況。使用精確率(Precision)、召回率(Recall)、F1值和準(zhǔn)確率(Accuracy)作為課堂教師提問分類效果的評(píng)價(jià)指標(biāo),并延伸二分類的評(píng)價(jià)標(biāo)準(zhǔn)。計(jì)算公式如下:
Precision = ■? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)
Recall = ■? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)
F1 = ■? ? ? ? ? ? ? ? ? ? ? ? ?(3)
Accuracy = ■? ? ? ? ? ? ? ? ? ? ?(4)
其中,TP表示預(yù)測(cè)正確的正樣本數(shù)量,F(xiàn)P表示預(yù)測(cè)錯(cuò)誤的正樣本數(shù)量,TN表示預(yù)測(cè)正確的負(fù)樣本數(shù)量,F(xiàn)N是預(yù)測(cè)錯(cuò)誤的負(fù)樣本數(shù)量。Precision針對(duì)預(yù)測(cè)結(jié)果而言,表示在被所有預(yù)測(cè)為正樣本中實(shí)際為正樣本的概率,即精確率;Recall針對(duì)原樣本而言,表示實(shí)際為正樣本中被預(yù)測(cè)為正樣本的概率,即召回率;精確率和召回率又被叫作查準(zhǔn)率和查全率,F(xiàn)1分?jǐn)?shù)同時(shí)考慮精確率和召回率,讓兩者同時(shí)達(dá)到最高,取得平衡,即對(duì)分類器的性能進(jìn)行綜合評(píng)判。Accuracy表示預(yù)測(cè)正確的結(jié)果占總樣本的百分比,代表整體的預(yù)測(cè)準(zhǔn)確程度,包括正樣本和負(fù)樣本。
(三)實(shí)驗(yàn)?zāi)P驮O(shè)置
實(shí)驗(yàn)的硬件環(huán)境為Intel(R) Core(TM)i7-9700K CPU、64GB內(nèi)存,操作系統(tǒng)是64位Windows10。采用Keras框架來(lái)搭建基于深度神經(jīng)網(wǎng)絡(luò)的兩個(gè)分類模型。其中“epochs”設(shè)置為100輪、“batch_size” 設(shè)置為64、“dropout”設(shè)置為0.2、“l(fā)earning_rate”設(shè)置為1e-3。模型的其他參數(shù)的設(shè)置為:(1)CNN模型。使用256個(gè)大小尺寸為5的卷積核來(lái)提取文本特征,經(jīng)過全局最大值池化操作后,全連接層神經(jīng)元的個(gè)數(shù)是128,最后使用Softmax函數(shù)對(duì)提問文本分類。(2)LSTM模型。使用128個(gè)LSTM隱藏層的神經(jīng)單元進(jìn)行語(yǔ)義信息學(xué)習(xí),連接2個(gè)隱藏層層數(shù)進(jìn)入全連接層,使用Adam方法進(jìn)行優(yōu)化,最后使用Softmax函數(shù)對(duì)提問文本分類。
(四)實(shí)驗(yàn)結(jié)果與分析
使用訓(xùn)練集對(duì)上述兩個(gè)文本分類器模型進(jìn)行訓(xùn)練,經(jīng)由驗(yàn)證集調(diào)整參數(shù)后,獲得的分類模型在測(cè)試集上進(jìn)行分類測(cè)試的各項(xiàng)指標(biāo)見表3。
表3? ? ? ? ? ? ? 提問內(nèi)容分類的實(shí)驗(yàn)結(jié)果
表4? ? ? ? ? ? ? ?提問類型分類的實(shí)驗(yàn)結(jié)果
觀察表3和表4可知,CNN模型的整體準(zhǔn)確率較LSTM模型高。其中,在提問內(nèi)容維度上相較于LSTM模型提高了5.27%;在提問類型維度上相較于LSTM模型提高了4.59%。結(jié)果表明,在課堂內(nèi)容維度及提問類型維度的分類中,CNN模型可以更好地提取短文本信息。此外,CNN模型在訓(xùn)練集和驗(yàn)證集中的準(zhǔn)確率和Loss值的變化曲線如圖1和2所示??芍?,CNN模型在訓(xùn)練數(shù)據(jù)集的過程中,模型準(zhǔn)確率逐漸升高,Loss值逐漸縮小,模型的訓(xùn)練過程表現(xiàn)良好。
五、結(jié)? ?語(yǔ)
課堂提問是教師課堂教學(xué)的重要教學(xué)技能之一,是教師專業(yè)發(fā)展中的關(guān)鍵環(huán)節(jié)?,F(xiàn)有的視頻分析法,通過人工編碼和看視頻,能夠?qū)處煹恼n堂提問進(jìn)行分析,挖掘課堂上教師提問的數(shù)量、提問的類型以及提問的內(nèi)容等。但這種方法耗時(shí)耗力,無(wú)法進(jìn)行大范圍推廣與應(yīng)用。本研究提出了基于深度學(xué)習(xí)文本分類技術(shù)的教師課堂提問分析方法。該方法先收集教師課堂提問數(shù)據(jù),經(jīng)過預(yù)處理后對(duì)深度學(xué)習(xí)模型(卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò))進(jìn)行訓(xùn)練,使得深度學(xué)習(xí)模型能夠自動(dòng)對(duì)課堂提問進(jìn)行預(yù)測(cè)分類。從實(shí)驗(yàn)結(jié)果的評(píng)價(jià)指標(biāo)上看,該方法可以替代基于人工的視頻分析方法,能夠?qū)處熣n堂提問分析進(jìn)行大規(guī)模應(yīng)用,有助于促進(jìn)教師專業(yè)發(fā)展。本研究的實(shí)驗(yàn)結(jié)果表明,基于深度學(xué)習(xí)的智能文本處理方法可替代,或部分替代原有的人工操作,成為助力教師專業(yè)發(fā)展,乃至整個(gè)教育領(lǐng)域發(fā)展的利器。
[參考文獻(xiàn)]
[1] 洪松舟,盧正芝.我國(guó)有效課堂提問研究十余年回顧與反思[J].河北師范大學(xué)學(xué)報(bào)(教育科學(xué)版),2008,10(12):34-37.
[2] 盧正芝,洪松舟.教師有效課堂提問:價(jià)值取向與標(biāo)準(zhǔn)建構(gòu)[J].教育研究,2010,31(4):65-70.
[3] 陳薇,沈書生.小學(xué)數(shù)學(xué)教學(xué)中深度問題的研究——基于專家教師課堂提問的案例分析[J].課程·教材·教法,2019,39(10):118-123.
[4] 葉立軍,鄭欣.專家型數(shù)學(xué)教師代數(shù)復(fù)習(xí)課提問行為研究——以一次函數(shù)和反比例函數(shù)為例[J].數(shù)學(xué)教育學(xué)報(bào),2018,27(2):46-49.
[5] 鄭友富.專家型教師與新手教師課堂提問的比較研究[J].教育科學(xué)研究,2009(11):57-60.
[6] 葉立軍,斯海霞.基于錄像分析背景下的代數(shù)課堂教學(xué)提問研究[J].教育理論與實(shí)踐,2010,30(8):41-43.
[7] 周瑩,王華.中美中學(xué)數(shù)學(xué)優(yōu)秀教師課堂提問的比較研究——以兩國(guó)同課異構(gòu)的課堂錄像為例[J].數(shù)學(xué)教育學(xué)報(bào),2013,22(4):25-29.
[8] 胡啟宙,孫慶括.初中數(shù)學(xué)教師課堂提問的方式和反饋水平實(shí)證研究——基于三位教師課堂錄像的編碼分析[J].數(shù)學(xué)教育學(xué)報(bào),2015,24(4):72-75.
[9] 葉立軍. 數(shù)學(xué)教師課堂教學(xué)行為比較研究[D].南京:南京師范大學(xué),2012.
[10] 張文宇,范會(huì)勇.基于 NVivo10 分析的數(shù)學(xué)教育專業(yè)碩士課堂提問研究——以首屆全國(guó)全日制教育碩士學(xué)科教學(xué)(數(shù)學(xué))專業(yè)教學(xué)技能決賽視頻為例[J].數(shù)學(xué)教育學(xué)報(bào),2019,28(1):92-96.
[11] 葉立軍,周芳麗.基于錄像分析背景下的教師提問方式研究[J].教育理論與實(shí)踐,2012,32(5):52-54.
[12] 甄園宜,鄭蘭琴.基于深度神經(jīng)網(wǎng)絡(luò)的在線協(xié)作學(xué)習(xí)交互文本分類方法[J].現(xiàn)代遠(yuǎn)程教育研究,2020,32(3):104-112.
[13] 魏艷濤,秦道影,胡佳敏,姚璜,師亞飛.基于深度學(xué)習(xí)的學(xué)生課堂行為識(shí)別[J].現(xiàn)代教育技術(shù),2019,29(7):87-91.
[14] 馮翔,邱龍輝,郭曉然.基于LSTM模型的學(xué)生反饋文本學(xué)業(yè)情緒識(shí)別方法[J].開放教育研究,2019,25(2):114-120.
[15] 邵懷領(lǐng).課堂提問有效性:標(biāo)準(zhǔn)、策略及觀察[J].教育科學(xué),2009,25(1):38-41.
[16] 黃會(huì)來(lái),王迎.數(shù)學(xué)高效與低效教師課堂提問教學(xué)行為的案例比較[J].數(shù)學(xué)教育學(xué)報(bào),2011,20(3):90-92.
[17] 黃友初.教師課堂教學(xué)行為的四個(gè)要素[J].數(shù)學(xué)教育學(xué)報(bào),2016,25(1):72-74.
[18] 于國(guó)文,曹一鳴.“中澳法芬”中學(xué)數(shù)學(xué)課堂教師提問的實(shí)證研究[J].數(shù)學(xué)教育學(xué)報(bào),2019,28(2):56-63.
[19] 顧泠沅,周衛(wèi).課堂教學(xué)的觀察與研究——學(xué)會(huì)觀察[J]上海教育,1999(5):14-18.
[20] 涂榮豹.數(shù)學(xué)建構(gòu)主義學(xué)習(xí)的實(shí)質(zhì)及其主要特征[J].數(shù)學(xué)教育學(xué)報(bào),1999(4):16-20.
[21] 余凱,賈磊,陳雨強(qiáng),徐偉.深度學(xué)習(xí)的昨天、今天和明天[J].計(jì)算機(jī)研究與發(fā)展,2013,50(9):1799-1804.
[22] 張建明,詹智財(cái),成科揚(yáng),詹永照.深度學(xué)習(xí)的研究與發(fā)展[J].江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,36(2):191-200.
[23] 馮帥,許童羽,周云成,趙冬雪,金寧,王郝日欽. 基于深度卷積神經(jīng)網(wǎng)絡(luò)的水稻知識(shí)文本分類方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2021(2):1-13.
[24] 趙明,杜會(huì)芳,董翠翠,陳長(zhǎng)松.基于word2vec和LSTM的飲食健康文本分類研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(10):202-208.
[25] 曾誰(shuí)飛,張笑燕,杜曉峰,陸天波.基于神經(jīng)網(wǎng)絡(luò)的文本表示模型新方法[J].通信學(xué)報(bào),2017,38(4):86-98.
[26] 翁洋,谷松原,李靜,王楓,李俊良,李鑫.面向大規(guī)模裁判文書結(jié)構(gòu)化的文本分類算法[J].天津大學(xué)學(xué)報(bào)(自然科學(xué)與工程技術(shù)版),2021,54(4):418-425.
[27] 馮斌,張又文,唐昕,郭創(chuàng)新,王堅(jiān)俊,楊強(qiáng),王慧芳.基于BiLSTM-Attention神經(jīng)網(wǎng)絡(luò)的電力設(shè)備缺陷文本挖掘[J].中國(guó)電機(jī)工程學(xué)報(bào),2020,40(S1):1-10.
[28] 羅梟. 基于深度學(xué)習(xí)的課程主觀題自動(dòng)判卷技術(shù)研究與實(shí)現(xiàn)[D].杭州:浙江農(nóng)林大學(xué),2019.
[29] 劉敬學(xué),孟凡榮,周勇,劉兵.字符級(jí)卷積神經(jīng)網(wǎng)絡(luò)短文本分類算法[J].計(jì)算機(jī)工程與應(yīng)用, 2019,55(5):135-142.