張曉峰 李明喜 俞建慧 吳剛
【摘要】? 在全面推進“網(wǎng)絡學習空間人人通”的建設背景下,學習云空間的應用不斷深入。但正如其他在線學習平臺一樣,學習云空間也存在輟學率高、學習投入不足等問題。本文聚焦學習云空間中學習主體認知投入相關數(shù)據(jù)的獲取,提出了基于機器學習的認知投入量化方法。首先,分析了認知投入的構(gòu)成要素,并基于班杜拉的社會認知理論,建立了面向?qū)W習云空間的認知投入模型。然后構(gòu)建了圍繞“數(shù)據(jù)采集-數(shù)據(jù)處理-量化實現(xiàn)-量化應用”的認知投入量化框架,并設計了一個基于支持向量機的認知投入量化算法。最后以世界大學城系統(tǒng)平臺數(shù)據(jù)為支撐,通過與其他機器學習算法的對比得到研究結(jié)果,基于SVM算法具有較高的量化精確率,本研究希望能為教育領域深層認知投入量化提供一種可行的參考方案。
【關鍵詞】? 在線學習;學習分析;深層次學習;深度學習;學習投入;社會認知理論;認知學習理論;認知投入; 機器學習;支持向量機
一、引言
隨著教育信息化2.0和社會交互網(wǎng)絡的發(fā)展,在線學習成為教師教學和學生學習的重要形式,尤其是基于云計算的網(wǎng)絡學習空間(學習云空間)的產(chǎn)生,真正實現(xiàn)了大規(guī)模資源池的共建共享,極大地促進了學習主體基于云的網(wǎng)絡化泛在交互學習(黃昌勤, 等, 2015)。這些特性使得學習云空間成為研究者當前關注的熱點問題。有研究表明,學習云空間中師生時空分離特性使得學習主體容易受到外界因素的干擾,出現(xiàn)學習投入不足、學習效率低等問題(韓中美, 等, 2017)。學習投入是衡量學習效率的重要指標之一,因此對學習投入進行量化研究,并給予適當?shù)膶W習干預、自我診斷、學情檢測等智能支持服務,是解決學習主體學習投入不足和提高學習效率的關鍵。
在目前針對學習投入的相關研究中,陳怡碩(Chen, 2017)研究了學習投入與學習主體的學術成就和高階能力發(fā)展正相關。約翰遜指出(Johnson, 2014)對學習投入的及時測評和實時分析將會有效地促進學習績效的提高;約翰(John, 1987, p.10)將學習過程分為“淺層”“深層”“目標達成”三階段;阿達爾等(Adar, Debra, Rena, & Christian, 2018)認為學習投入是由行為投入、情感投入和認知投入三維結(jié)構(gòu)組成,并且它們之間存在相互關系。李爽等(2018)基于學習管理系統(tǒng)采用多層回歸方法對學習投入的三個維度進行測量;武法提等(2018)圍繞學習行為投入發(fā)生機制和本質(zhì)特征展開探索,構(gòu)建學習行為投入理論模型;王洪江等(2017)基于在線學習活動實時分析學習過程,發(fā)現(xiàn)參與、交互等行為是影響學習行為投入的主要因素。
綜上所述,現(xiàn)有研究多集中在學習行為投入的研究,鮮有對情感與認知投入的深入分析。認知投入作為學習投入的基本構(gòu)成維度,反映學習主體在學習活動中的高階投入。布魯納的認知發(fā)現(xiàn)學習理論認為學習是主動形成認知結(jié)構(gòu)(知識經(jīng)驗系統(tǒng))的過程,其內(nèi)在認知復雜抽象,難以表征。故以往采用問卷數(shù)據(jù)進行認知投入量化的方法無法滿足對多維多特征認知投入影響因素的量化研究。當前,以數(shù)據(jù)挖掘、機器學習為代表的分析方法逐步成為學習量化分析的新潮流,支持向量機(Support Vector Machine,SVM)作為一種機器學習算法,因其具備處理復雜教育數(shù)據(jù)的能力而令人矚目,因此本研究以“認知”為著眼點采用基于SVM的機器學習方法對認知投入進行量化分析。
基于以上所述,本文聚焦學習主體的認知投入數(shù)據(jù)獲取,基于社會認知理論構(gòu)建了面向?qū)W習云空間的認知投入模型,并設計了以“數(shù)據(jù)采集-數(shù)據(jù)處理-量化實現(xiàn)-量化應用”為主線的認知投入量化框架,以期對認知投入的量化提出一種切實可行的技術方法。
二、面向?qū)W習云空間的認知投入模型構(gòu)建
學習投入是學習主體學習過程的重要觀測指標之一,也是學業(yè)成就的預測指標之一。其中認知投入作為學習投入中的深層次學習階段,一直是教育學、認知心理學等領域的熱點研究問題。因此,本文基于認知學習理論和社會認知理論,通過對教育場景下認知投入指標與因素的分析,首先闡述了認知投入的相關理論,進而提出了符合學習云空間交互特性的認知投入構(gòu)成要素,最后構(gòu)建了面向?qū)W習云空間的認知投入模型。
(一)認知投入模型構(gòu)建依據(jù)
已有國內(nèi)外學者對認知投入的相關理論進行了探索。弗雷德里克斯等(Fredricks, Blumenfeld, & Paris, 2004)的課堂學習投入量表將認知投入定義為深層認知策略的應用以及對學習的有效自我監(jiān)控與調(diào)節(jié)兩類?;谏鲜鼋Y(jié)論,斯米特等強調(diào)(Smit, Cornelis, Monique, & Rob, 2017),更多使用深層認知策略的學習主體比更多使用淺層認知策略的學習主體,在學習上付出更多的心理努力,并具有更好的理解水平。其中,深層認知策略主要關注的是知識間的聯(lián)系和探尋學習內(nèi)容的意義等,而淺層認知策略主要關注的是表面看起來非常重要的標題和要素,并對此進行機械記憶。李等人認為(Lee, Pate, & Cozart, 2015)認知投入的表現(xiàn)是學習主體在甄選、評價相關信息和資源時所付出的心智努力程度,在學習活動中針對認知目標應用學習策略,并主動將新知識遷移運用到不同的情境中,關注知識間的聯(lián)系,探尋學習內(nèi)容的意義?;诟ダ椎吕锟怂沟膶嶒灲Y(jié)果,國內(nèi)學者(李爽, 等, 2015)編制的遠程學習投入量表結(jié)合自我監(jiān)控與元認知策略,將認知投入劃分為認知策略、元認知策略、情感管理策略和資源管理策略四類。在其后續(xù)的研究(李爽, 等, 2016)中,認為學習挑戰(zhàn)是認知投入的重要指標,是對知識的深度加工與創(chuàng)新應用。張艷梅等人(2014)基于開發(fā)的移動環(huán)境,從自主調(diào)節(jié)學習、自主學習、知識建構(gòu)和生成式學習四個方面分析評測學習主體的認知投入。
還有其他一些研究文獻與評測工具也為認知投入提供了分析維度。孫之元等(Sun & Rueda, 2012)的遠程學習投入評價量表(Student engagement in distance education, SEDE)提出認知投入主要指完成學習任務時對學習資源的搜索、管理和學習策略的應用;迪克森(Dixson, 2010)編制的在線學習投入量表(the Online Student Engagement Scale, OSES)提出了自我管理、主動將課程內(nèi)容與生活實踐相關聯(lián)以及將課程內(nèi)容應用到實際生活這三個認知投入維度。
由于網(wǎng)絡學習比傳統(tǒng)面對面學習存在更大的挑戰(zhàn),需要學習者付出更多的心智努力才足以獲得良好的學習績效,大量文獻指出認知投入與學習策略和自我監(jiān)控有關(孔企平, 2002; Fredricks, Blumenfeld, & Paris, 2004; 張娜, 2012),也有研究指出(Shea, Hayes, & Smith, 2012)要著重從學生如何對自身認知進行調(diào)控的角度出發(fā)深入考慮認知投入,即元認知投入的視角。艾克和加里森(Akyol & Garrison, 2011)認為,元認知投入主要包括認知管理(主動執(zhí)行學習和控制學習環(huán)境)和認知監(jiān)控(學習者反思自己和對學習過程做出的改變)。因此,本研究將學習策略應用和學習自我監(jiān)控作為認知投入的依據(jù),從元認知投入的角度出發(fā)將學習自我監(jiān)控細化為管理與監(jiān)控兩個方面,選取自我管理和自我監(jiān)控與調(diào)節(jié)來表征認知投入。其中,自我管理和自我監(jiān)控與調(diào)節(jié)的側(cè)重點不同,自我管理特指學習者在主動學習意愿的前提下對學習條件與環(huán)境進行管理,而自我監(jiān)控與調(diào)節(jié)則是學習者發(fā)揮主觀能動性,通過改變學習過程中的內(nèi)在行為以及自我反思進行調(diào)整??紤]到學習是不斷追求對知識的應用與創(chuàng)造,作為最具影響力的學習投入測量工具,即全美學生投入調(diào)查 ( the National Survey of Student Engagement, NSSE)將學習挑戰(zhàn)作為認知投入的重要內(nèi)容,本文也將學習挑戰(zhàn)作為認知投入的重要構(gòu)成要素:學習挑戰(zhàn)是學習者在認知形態(tài)上對更高學習成就的渴望與追求,有助于學習者高階能力的發(fā)展。結(jié)合上述表述,本文認為認知投入是人類認知過程中的深層次心智努力活動,是學習主體在學習中所采用認知策略的具體應用,包含自我管理、自我監(jiān)控與調(diào)節(jié)、學習挑戰(zhàn)三個方面,是從被動學習到主動學習的自我知識構(gòu)建過程。其中,認知策略的應用包括精加工策略、組織策略等,精加工策略是指把新舊知識聯(lián)系起來從而增加新知識的意義,組織策略是將提煉出來的知識點加以構(gòu)造,形成知識結(jié)構(gòu)的更高水平的知識,這與本文的認知投入構(gòu)成要素不謀而合。
(二)認知投入構(gòu)成要素分析
布魯納的認知學習理論認為學習是學習主體以其原有的認知結(jié)構(gòu)為基礎,對外界事物進行感知、分析、歸納和總結(jié)的主動認知過程,是通過把新舊知識進行整合而逐漸構(gòu)建新的認知體系的過程(毛志新, 2016)。結(jié)合此觀點,鑒于認知投入的心智努力特性不可直接獲取,本論文擬借助學習主體的管理和調(diào)控過程作為研究認知的直接媒介,并以認知體系蘊含學習挑戰(zhàn)為基礎建構(gòu)新的認知投入研究視角,這與認知學習理論不謀而合。
網(wǎng)絡學習云空間是學習者借助學習投入完成自我知識建構(gòu)的理想場所,是新視角下認知投入研究的典型環(huán)境代表。網(wǎng)絡學習以豐富的資源供給、便捷化和跨時空的交互支持成為當前重要的學習形態(tài)之一。在這一形態(tài)中基于網(wǎng)絡的交互可以有效地促進學習主體掌握學習內(nèi)容、實現(xiàn)學習挑戰(zhàn)。同時,互聯(lián)互通下的自我管理和過程調(diào)控將有利于保障交互目標的達到和認知成效的獲取。云空間是云平臺支持下物理空間的虛擬化延伸,因此基于云空間的網(wǎng)絡學習——網(wǎng)絡學習云空間,能夠最大化地實現(xiàn)資源共享和可自定制的空間環(huán)境配置,這將極大地增強學習主體在學習過程中的交互體驗,更有利于學習主體展開認知投入。
因此,以布魯納的認知學習理論為指導,結(jié)合認知投入模型構(gòu)建的理論基礎,依據(jù)學習云空間的特點和優(yōu)勢,本研究將認知投入解析為圖1所示要素體系。
1. 自我管理
學習云空間是以學習主體為中心的典型教育應用場景,它將明確學習主體管理學習的責任,支持學習主體主動應用認知策略進行學習過程管理。在云空間中,主要表現(xiàn)為自主學習與對學習資源、學習時間和學習工具的管理。其中,自主學習指學習主體在認知層面上所體現(xiàn)出的主動學習意愿,是學習主體對云空間資源、時間和工具有效利用的前提之一。學習云空間賦予學習主體更多的自主學習管理權(quán),可滿足學習主體對學習時間、學習資源(課程、教學內(nèi)容)和學習工具(評估、協(xié)作、記錄等工具)的基本管理需求。對云空間中的學習資源、時間和工具的管理反映了學習主體在學習過程中有意識地進行組織與協(xié)調(diào),以期達到高效利用資源、時間和工具的目標。
自我管理作為認知投入的基本構(gòu)成要素之一,體現(xiàn)了學習主體在主動參與、探究新知和解決問題過程中的自我責任感與自我管理意識,是學習主體在泛在化網(wǎng)絡中進行知識構(gòu)建、個性化學習與社會化參與必不可少的認知技能。
2. 自我監(jiān)控與調(diào)節(jié)
自我監(jiān)控與調(diào)節(jié)是指學習主體在認知驅(qū)動下,針對認知目標對所發(fā)生的學習活動進行自我控制、修正和調(diào)整的過程。在云空間中,自我監(jiān)控與調(diào)節(jié)涵蓋了明確學習目標、制定學習計劃、改進學習方法、定期自我評價和自我反思五個方面。
明確學習目標是學習主體為調(diào)節(jié)個體認知差異而清晰化學習目標的過程,是云空間中學習主體自我監(jiān)控與調(diào)節(jié)學習活動的指揮棒。學習計劃是學習主體實施學習活動的藍圖,制定彈性可行的學習計劃有助于學習主體量力而行地安排學習時間和內(nèi)容,是實現(xiàn)學習目標必不可少的方式之一。學習方法是達成學習目標的手段,在學習過程中基于對目標的監(jiān)控和調(diào)節(jié),學習主體需要對自己的學習方法進行適應和改進,以最優(yōu)的學習方法提升學習效率。定期自我評價是學習主體有規(guī)律地對學習任務等做出的自我判斷,促進學習主體積極參與學習過程。自我反思是學習主體深度學習的表現(xiàn),是自我意識高度發(fā)展的結(jié)果。通過對自身學習、思維等認知活動的反思,學習主體可以創(chuàng)建豐富的認知情境來發(fā)展其認知活動,從而提升認知的理解水平。
自我監(jiān)控與調(diào)節(jié)是認知投入的重要構(gòu)成要素,反映了學習主體有計劃地設置學習目標、調(diào)整學習計劃、評價學習任務和反思學習的全過程,是促進學習主體向高水平認知邁進的關鍵。
3. 學習挑戰(zhàn)
作為高層次的認知投入要素的構(gòu)成部分,學習挑戰(zhàn)是指學習主體在知識應用與創(chuàng)新,或在超越學習要求等更高的認知挑戰(zhàn)中的投入,具體表現(xiàn)為學習策略應用、知識深度加工和知識體系建構(gòu)三個方面。
學習策略應用指學習主體在具體學習過程中有意識地使用系統(tǒng)方法加工與處理信息,是學習者知識內(nèi)化的前提之一。知識深度加工呈現(xiàn)了將新知識與先前知識深度組織、重構(gòu)及整合的過程,有助于學習主體對知識的深度理解及遷移應用。知識體系建構(gòu)是將紛繁復雜、孤立分散的知識點按其內(nèi)在規(guī)律整合的過程,反映了學習主體將知識進行完整體系化的深層次認知過程。
學習挑戰(zhàn)是認知投入的關鍵構(gòu)成要素,體現(xiàn)了學習主體在認知形態(tài)上對更高學習成就的渴望與追求,是學習主體在學習過程中獲取更高學習成果至關重要的認知技能。
(三)學習云空間中認知投入模型的構(gòu)建
班杜拉的社會認知理論指出,學習主體圍繞不同的學習環(huán)境開展不同的投入行為,而投入行為又會影響學習主體的發(fā)展(趙呈領, 等, 2016)??梢?,學習環(huán)境既是主體投入行為的載體,也是影響主體行為投入的潛在因素。作為一種資源高度共享的虛擬化環(huán)境,網(wǎng)絡學習云空間具備便捷可定制的空間支持,極大地拓展了物理學習空間的情境支持,賦能學習主體采用認知策略實施高效的行為投入。在此情境下,認知投入要素所蘊含的認知投入行為成為學習主體與認知目標的中介,它與學習環(huán)境密不可分。
根據(jù)以上分析,鑒于認知目標是教學活動的出發(fā)點,也是學習活動的歸宿,本研究加入認知目標,與學習主體、學習環(huán)境和投入行為共同構(gòu)建了基于學習云空間的認知投入模型(如圖2所示),下文將從模型的內(nèi)部認知投入過程和外層動態(tài)循環(huán)過程展開闡釋。
該模型內(nèi)部以學習主體在學習空間環(huán)境下的投入行為來實現(xiàn)認知目標為主線,反映學習主體認知投入的過程。學習主體作為學習活動中投入行為的發(fā)起者和控制者,通過投入積極、有效的行為促進認知目標的達成。模型內(nèi)部核心因素包括投入行為與承載行為的學習環(huán)境。投入行為表現(xiàn)為人機交互、主體內(nèi)省和人際交互。人機交互指學習主體在開展學習活動中人與計算機之間的信息交換的行為。人際交互是以人為媒介進行的交流行為。主體內(nèi)省即學習主體的心理活動,囊括自我管理、自我監(jiān)控調(diào)節(jié)以及學習挑戰(zhàn)的認知投入行為,是本文后續(xù)量化認知投入的重點研究內(nèi)容。其中,自我管理與監(jiān)控調(diào)節(jié)可以保障學習活動的協(xié)調(diào),學習挑戰(zhàn)能夠促進學習目標的實現(xiàn),由此形成積極穩(wěn)定的投入狀態(tài)。學習環(huán)境是開展投入行為的場所,由物理環(huán)境、社會環(huán)境和心理環(huán)境組成。物理環(huán)境給予學習主體進行人機交互行為的支撐,涉及網(wǎng)絡條件、課程資源、教學內(nèi)容等;社會環(huán)境是學習主體進行人際交互行為的重要依托,涵蓋人際關系、家庭背景等信息;心理環(huán)境是學習主體進行主體內(nèi)省時所涉足的心理關聯(lián)性情境,是學習投入活動不可或缺的支持性環(huán)境事實。
模型外層包含學習主體、投入量化、認知目標和效果測評的動態(tài)循環(huán)過程。在整個過程中,通過對比投入量化結(jié)果與認知目標之間的差距,對學習主體的認知投入進行效果評測,然后將效果評測結(jié)果反饋給學習主體,進而幫助學習主體調(diào)整認知投入要素所蘊含的認知投入行為,以期達成認知目標。其中,投入量化是采取量化手段將復雜的認知投入行為以清晰明確的方式表示(將在本文后續(xù)內(nèi)容中詳細闡述)。模型中,動態(tài)循環(huán)可以決定以目標為導向的主體做出的投入行為,并強調(diào)了自我管理、自我監(jiān)控調(diào)節(jié)和學習挑戰(zhàn)的作用。
三、學習云空間中認知投入量化實現(xiàn)
認知投入是學習主體深層次學習的有效表征之一,涉及學習全過程的方方面面,如何獲取并量化多維多層次的認知投入要素成為接下來研究的重點之一。然而,現(xiàn)有的研究多集中于傳統(tǒng)教育場景下以量表、問卷為主的方式量化認知投入,指標體系缺少從學習過程視角進行認知投入的描述,難以真正表征學習認知投入的水平。正因為如此,近年來快速發(fā)展的教育大數(shù)據(jù)、機器學習和云計算等新型技術一改傳統(tǒng)的量化方式,成為助推學習認知投入量化研究發(fā)展的重要力量。鑒于此,本文首先結(jié)合已有成果建立認知投入程度指標,接著針對學習云空間的平臺特點,基于機器學習方法設計了認知投入的量化框架,然后對云空間中的數(shù)據(jù)進行采集與處理,最后進行認知投入量化的實現(xiàn)。
(一)認知投入程度指標分析
認知投入是學習主體對知識進行加工的心智活動,其涉及的過程不可見,由此許多研究利用在線環(huán)境的行為數(shù)據(jù)來推斷認知投入(Brinton et al., 2015; Kaser, Hallinen, & Schwartz, 2017),以實現(xiàn)通過創(chuàng)建行為集的方式來測量認知投入的目的。行為數(shù)據(jù)來源于行為,行為作為學習過程開展的載體,必須在一定的時間范圍內(nèi)借助實體空間付諸實施,因此本文將投入內(nèi)容、投入依托的時間與空間作為認知投入程度指標分析的起點。鑒于時間是投入行為的必要關聯(lián)因素,本文直接將時間作為認知投入的重要分析依據(jù)和表征指標??紤]到認知投入內(nèi)容本身的隱蔽特性及其與所依托空間的深度融合特性,本文將兩者泛指認知投入過程以及過程中所遵照、依托和創(chuàng)設的氛圍。其中,學習目標與任務、學習對象與內(nèi)容、物理環(huán)境與社會關聯(lián)、學習過程與效果等都是兩者交織融合的重要內(nèi)容。就投入程度而言,前述重要內(nèi)容顯然包括深度與廣度兩個方面,因此認知投入還需借助深度與關聯(lián)度兩個指標進行表征。深度與關聯(lián)度的視角不同,深度特指認知涉足內(nèi)容層次的高低,關聯(lián)度反映所學知識與情境的融合水平,側(cè)重應用。綜上所述,本研究選取時間、深度和關聯(lián)度三個程度指標來表征認知投入要素。
時間主要是指與學習主體認知投入有關的頻率、時間等能夠直接從日志文件中獲取的數(shù)據(jù)信息,包括次數(shù)、間隔、持續(xù)時長、及時性和規(guī)律性等信息。其中,次數(shù)是對認知投入行為頻次的統(tǒng)計描述;間隔是相鄰認知投入行為產(chǎn)生的時間距離;持續(xù)時長是指認知投入行為延續(xù)的時間長度;及時性表示學習主體對發(fā)布的學習任務與完成學習任務的時間差;規(guī)律性則是對及時性是否存在規(guī)律的探索。
深度作為認知投入程度分析的指標之一,是強調(diào)認知投入累積性的層次概念。依據(jù)布魯姆的認知教育目標分類理論,本研究將學習主體的認知過程從低級到高級分為六個層次,即識記、理解、應用、分析、綜合和評價。識記指認識并記憶;理解指對知識的初步領會;應用指對所學的概念、法則和原理的運用;分析指詳細闡釋知識概念間的相互關系;綜合指整合知識以便創(chuàng)造性地解決問題;評價指理性對知識價值做出判斷的過程。
聯(lián)通主義作為隨網(wǎng)絡發(fā)展起來的學習理論產(chǎn)物,該理論認為學習即連接的建立和網(wǎng)絡的形成,著重強調(diào)建立學習主體外部知識與內(nèi)部認知之間的關聯(lián),以此形成知識網(wǎng)絡結(jié)構(gòu),促進自身認知水平的提高(王志軍, 等, 2015)。一些研究(張思, 等, 2017; 梁云真, 等, 2016)將交互內(nèi)容與學習主題的關聯(lián)性作為衡量學習投入的重要指標,還有研究(王志軍, 等, 2015)指出學習主體的認知參與包括建立概念和意義之間深度關聯(lián),最高層次的認知參與是知識創(chuàng)造?;诖?,關聯(lián)度也成為描述認知投入量化的重要指標,本研究選取了經(jīng)驗、情景、主題、創(chuàng)新和邏輯五個維度。其中,經(jīng)驗指學習主體從親身活動及經(jīng)歷中獲得的學習;情景指將新知識學以致用的情況;主題是找出新觀點與學習主題之間的關系;創(chuàng)新是發(fā)現(xiàn)新想法中的潛在可能與創(chuàng)造知識之間的關系;邏輯則是檢驗新思想是否合理的對話過程。
(二)認知投入量化框架設計
基于上述學習云空間的認知投入模型,為實現(xiàn)面向?qū)W習云空間的認知投入的量化研究,本研究設計了如圖3所示的認知投入量化框架,該框架從數(shù)據(jù)采集、數(shù)據(jù)處理、量化實現(xiàn)和量化應用四個模塊闡釋了認知投入量化的整個閉合循環(huán)過程,為后續(xù)量化應用的實施提供有力的支撐。
1. 數(shù)據(jù)采集模塊
學習云空間因其豐富的共享資源和便捷的交互特性,記錄并存儲了關于學習主體投入行為的海量數(shù)據(jù),主要分為三類:一是學習主體在學習過程中產(chǎn)生的日志數(shù)據(jù);二是學習云空間環(huán)境中的動態(tài)數(shù)據(jù),包含交互文本和學習成果(測試、作業(yè)及作品);三是問卷數(shù)據(jù)。采集并分析這些數(shù)據(jù)有助于了解學習主體隱藏的投入行為。因此,采集數(shù)據(jù)成為認知投入量化分析的基礎,為后續(xù)研究提供數(shù)據(jù)支持。
2. 數(shù)據(jù)處理模塊
學習云空間環(huán)境下采集的數(shù)據(jù)具有結(jié)構(gòu)多樣性。為了使各種形式的數(shù)據(jù)成為機器學習可讀的數(shù)據(jù)形式,需對數(shù)據(jù)進行數(shù)據(jù)處理,其方法包括描述統(tǒng)計、文本分析和關聯(lián)分析。數(shù)據(jù)處理是認知投入量化分析的前提,對于認知量化分析結(jié)果的準確性有著決定性作用,直接影響認知投入量化的可信度。
3. 量化實現(xiàn)模塊
認知投入量化的實現(xiàn)是本文研究的重點,由上述指標分析結(jié)果可知,認知投入量化分析的影響要素具有多維性和復雜性。鑒于SVM具有快速且準確地處理多維多特征教育數(shù)據(jù)的能力,本研究采用以SVM為代表的機器學習算法為量化模型。首先,將采集的數(shù)據(jù)集分為訓練集和測試集兩部分,并對訓練集進行聚類操作,得到學習主體認知投入分類結(jié)果;然后,根據(jù)分類結(jié)果,設計機器學習算法,再將訓練集“喂”入機器學習模型中訓練量化模型;最后,將測試集輸入到量化模型中以測試模型的認知投入量化能力。
4.量化應用模塊
服務于教與學是投入量化的最終目標,也是投入量化研究中進行反饋完善的重要階段。由于量化應用與量化結(jié)果的層次有極大的關聯(lián)性,本研究針對量化結(jié)果的三個層次(淺層、目標達成與深層)差異性地展開量化應用實踐工作。在淺層和目標達成階段,綜合考慮認知投入的構(gòu)成要素,我們在云空間中既對學習主體的學習過程進行干預,干預方式包括提醒警示和鼓勵等,又利用認知投入的量化結(jié)果預測學習主體的學習情況,包括學業(yè)成績預測和學情預測等??傊?,認知投入量化的核心應用體現(xiàn)在利用認知投入量化結(jié)果來干預學習過程、預測學習情況、推薦學習資源、調(diào)整學習內(nèi)容和優(yōu)化學習環(huán)境等,以促進認知目標的達成和學習績效的提升,為學習云空間下進行的學習干預和學習預測等提供一定的依據(jù)和實踐參考,具體的應用在后續(xù)研究中予以呈現(xiàn),限于篇幅不再贅述。
(三)數(shù)據(jù)采集與處理
基于云計算服務,“云+端”的學習云空間環(huán)境使外顯的學習行為能夠以海量數(shù)據(jù)的形式記錄并保存。而在線學習過程中,學習主體復雜的認知投入主要通過外顯的行為方式反映出來。為了更好地量化認知投入,本研究設計了數(shù)據(jù)采集處理流程圖,主要包含數(shù)據(jù)采集與數(shù)據(jù)處理兩部分,如圖4所示。
在數(shù)據(jù)采集方面,為保障數(shù)據(jù)能夠提供完整的認知投入信息,本研究用三種方式采集數(shù)據(jù):一是從Web服務器所產(chǎn)生的日志文件中獲取日志數(shù)據(jù);二是從學習云空間平臺的環(huán)境中捕獲學習主體的動態(tài)數(shù)據(jù),包括交互文本數(shù)據(jù)和學習成果數(shù)據(jù);三是運用問卷工具收集學習主體的認知投入信息。
在數(shù)據(jù)處理方面,根據(jù)認知投入數(shù)據(jù)來源的不同,考慮到機器學習算法讀取數(shù)據(jù)的格式要求,本研究綜合多種途徑對學習主體的認知投入數(shù)據(jù)進行處理。處理途徑包括:利用描述性統(tǒng)計方法對結(jié)構(gòu)化數(shù)據(jù)進行整理,從時間維度表征認知投入;通過文本分析法對非結(jié)構(gòu)化數(shù)據(jù)進行處理分析,篩選出深度指標和關聯(lián)度指標的數(shù)據(jù),并從深度維度表征認知投入;通過灰色關聯(lián)分析計算關聯(lián)系數(shù)與關聯(lián)度,從關聯(lián)維度表征數(shù)據(jù)。其中,文本分析指的是對學習主體的動態(tài)數(shù)據(jù)進行處理。首先,通過對每個學習主體的動態(tài)文本進行細讀歸并;接著,利用NLPIR工具對文本進行分詞標注、詞頻統(tǒng)計和關鍵詞提取等操作;然后,借鑒布魯姆教育目標分類體系和可選動詞表來判斷認知投入的深度層級;最后,進行人工梳理和判斷學習主體達到的認知投入關聯(lián)程度,并對學習主體的認知投入數(shù)據(jù)加注標簽。以上對數(shù)據(jù)的采集與處理步驟為后續(xù)認知投入量化的實現(xiàn)提供了精準的數(shù)據(jù)支持。
(四)學習云空間中認知投入量化實現(xiàn)
當前,以學習主體的認知需求為核心,通過全面記錄與追蹤學習主體的學習動態(tài),利用過程性的認知數(shù)據(jù)與分析算法對難以直接觀察的內(nèi)在認知過程進行量化研究是亟待解決的教育問題之一。因此,基于上述的認知數(shù)據(jù)處理及認知投入量化指標分析等前期工作,設計了如下面向?qū)W習云空間的認知投入量化過程,為目前量化內(nèi)在認知過程提供一種新的研究思路。
1. 量化實現(xiàn)的環(huán)境說明
班杜拉的社會認知理論強調(diào)環(huán)境、學習主體和行為三者之間是相互動態(tài)影響的。行為是內(nèi)隱認知的外在表現(xiàn)。同樣,學習主體在學習云空間的認知過程將受到多個復雜的外在變量影響。因此,為保障對認知投入量化的精確性與可靠性,需減少無關變量或特殊情況,本文將圍繞上述投入量化框架,對學習云空間的環(huán)境提出以下說明:
說明一:學習以課程為主體,課程整體存在周期,且過程數(shù)據(jù)與歷史數(shù)據(jù)可查可用。
說明二:為了保證認知投入量化的連續(xù)性,目前本研究假定整個學習過程中不存在或極少存在輟學現(xiàn)象,而對輟學現(xiàn)象的研究將在未來工作中展開。
說明三:假設每個描述學習主體認知投入的數(shù)據(jù)至少包含一種認知投入構(gòu)成要素(自主學習、自我反思、學習策略應用等共12個),確保每個學習主體的數(shù)據(jù)都能被應用于量化,不存在認知投入的學習主體本次研究將不予考慮。
2. 認知投入程度指標量化
對于認知投入的程度量化,本文基于以上研究結(jié)果將從時間效度、深度和關聯(lián)度三個程度指標提出認知投入量化的計算公式。
根據(jù)上文中認知投入時間程度指標分析所得,可依次基于次數(shù)、間隔、持續(xù)時長、及時性、規(guī)律性五個維度構(gòu)建一個五元組表征時間效度,即[T=[Tf,Tg,Ta,Tp,Tr]]。將學習主體在學習云空間的行為發(fā)生次數(shù)、活動開始時間、活動結(jié)束時間、學習任務發(fā)布時間、學習任務完成時間等服務器日志數(shù)據(jù)依次表示為tf,ts,to,tm,tc。次數(shù)Tf是指學習主體行為發(fā)生的次數(shù),即tf。
針對認知投入量化中的深度程度指標,可依次按照識記、理解、應用、分析、綜合和評價六個維度構(gòu)建六元組表征深度,即[D=[D1,D2,D3,D4,D5,D6]]。對學習主體在學習云空間的交互文本進行關鍵詞提取,實現(xiàn)對深度程度指標的定位,六元組[D]滿足One-Hot編碼,即表示在深度的6個指標中只有一個指標的值為1,其余全為0。例如:學習主體A能夠“理解”學習內(nèi)容,那么,學習主體A的深度可表示為:[DA=[0,1,0,0,0,0]]。
為表征關聯(lián)程度指標可構(gòu)建一個五元組,即[R=[R1,R2,R3,R4,R5]],R1、R2、R3、R4和R5分別表示經(jīng)驗、情景、主題、創(chuàng)新和邏輯。本文以自我反思為例,通過灰色關聯(lián)分析計算認知投入構(gòu)成要素與關聯(lián)程度指標(經(jīng)驗、情景、主題、創(chuàng)新和邏輯)的相關關系,具體說明如圖5所示。其中,自我反思的k個數(shù)據(jù)組成參考數(shù)列,關聯(lián)程度指標的k個數(shù)據(jù)組成比較數(shù)列,首先計算參考數(shù)列[x0]的第k個元素與比較數(shù)列[xi]的第k個元素之間的關聯(lián)系數(shù)[ξi(k)],見公式6。
基于上述對認知投入程度指標的量化,提出學習云空間中學習主體自我反思的認知投入程度量化表達式,見公式(8)。其余構(gòu)成要素的程度指標量化與自我反思類似,因篇幅有限,故不在此贅述。
3. 認知投入量化實現(xiàn)
(1)SVM模型選擇
支持向量機(SVM)是當前使用較多、效果最好的一種分類算法,能有效地從大規(guī)模、非線性、高緯度的數(shù)據(jù)集中學習到一個較精確的分類模型,因本文的認知投入量化數(shù)據(jù)集具有非線性、高維等特征,故依據(jù)Mercer定理(文孟飛, 等, 2016)為SVM選擇適當?shù)暮撕瘮?shù),將復雜非線性特征空間映射到一個簡單的高維空間,以降低SVM分類器的復雜度。SVM常用的核函數(shù)包括線性核函數(shù)、多項式核函數(shù)和高斯核函數(shù),鑒于本文的訓練數(shù)據(jù)集特征較復雜,甚至多于樣本本身的數(shù)量,因此選取線性核函數(shù)作為SVM的核函數(shù)。當SVM處理多分類問題時,需要構(gòu)造合適的多類分類機。其中,一類對一類法中的每個分類機只涉及兩類訓練樣本,訓練時間大幅度縮減,在針對類別較少的分類問題時整體性能優(yōu)越(付旻, 等, 2018)。因此,本文采用一類對一類法進行認知投入量化,完成對SVM模型的選擇。
(2)基于K-Means的認知投入聚類分析
本研究的最終目的是利用SVM模型對認知投入進行量化分類,而SVM屬于機器學習中的有監(jiān)督學習方法范疇,故輸入至SVM模型的訓練數(shù)據(jù)需要提供明確可靠的分類標簽。因此,通過上述對認知投入數(shù)據(jù)的采集與歸一化處理等操作,采用K-Means算法對學習主體認知投入數(shù)據(jù)進行聚類分析,通過肘部法則求解得到最佳分類數(shù)k為3。鑒于上述K-Means的聚類分析結(jié)果,可將學習主體的認知投入分為三類,這也正與教育實證研究下的認知層析分類體系不謀而合。因此,本研究將學習主體的認知投入以正態(tài)分布劃分為“淺層”“深層”“目標達成”三個等級,占比分別為15.85%、68.3%、15.85%。
(3)基于SVM的認知投入量化算法設計
對訓練數(shù)據(jù)的標簽分類后,利用基于多分類支持向量機(multi-class SVM)的機器學習算法實現(xiàn)對認知投入的量化。具體思想如下:首先收集學習云空間中日志、動態(tài)數(shù)據(jù)以及問卷數(shù)據(jù),進行數(shù)據(jù)處理得到認知投入樣本數(shù)據(jù),將樣本數(shù)據(jù)分為訓練集和測試集兩部分,初始化數(shù)據(jù)得到認知投入數(shù)據(jù)矩陣向量;然后將訓練集輸入SVM模型,利用網(wǎng)格搜索(Gridsearch)訓練得到最優(yōu)的SVM量化模型(付旻, 等, 2018);最后將測試集輸入訓練好的模型,得到認知投入分類結(jié)果,即認知投入量化結(jié)果。圖6是基于SVM的認知投入量化算法設計。
[算法1:基于SVM的認知投入量化算法
輸入:學習主體認知投入樣本數(shù)據(jù)集C
輸出:學習主體認知投入量化結(jié)果Begin
1. 將樣本數(shù)據(jù)C進行處理,將數(shù)據(jù)集分為訓練集Ctrain和測試集Ctest;
2. 初始化數(shù)據(jù),獲得學習主體認知投入訓練數(shù)據(jù)矩陣向量集合Ctr={Ctr1,Ctr2,…},學習主體認知投入測試數(shù)據(jù)矩陣向量集合Cte={Cte1,Cte2,…};
3. Gridsearch初始化SVM模型Msvm及其對應的參數(shù)Psvm;
4. 定義評分方法precision;
5. 將Ctr輸入Msvm中,利用Gridsearch訓練Msvm;
6. 基于最佳分數(shù)precision選出最佳的參數(shù)組合Pfinal,得到最優(yōu)模型Mfinal;
7. 將Cte輸入到Mfinal中,測試Mfinal的效果;
8. 基于模型的量化結(jié)果得到的認知投入類別標簽,如深層、淺層等。
綜合以上步驟,即可實現(xiàn)面向?qū)W習云空間的認知投入量化,最終可從SVM量化模型獲得認知投入量化結(jié)果,即“淺層”“目標達成”“深層”三類認知投入。
四、量化實驗驗證與量化效果分析
(一)認知投入數(shù)據(jù)獲取
本文所使用的數(shù)據(jù)來源于團隊前期搭建的iStudy學習平臺(世界大學城的空間化學習系統(tǒng)實驗版),通過同類型的課程學習,以其中80名學習主體作為研究對象,進行為期6周的學習進程跟蹤并采集相關數(shù)據(jù),通過處理無效和缺省數(shù)據(jù)最終得到15,440條認知投入基礎數(shù)據(jù),以此數(shù)據(jù)為基礎建立模型并進行模型的效果驗證。
(二)量化驗證及其分析
1. 實驗一:不同機器學習模型下的量化準確率對比
為驗證SVM量化模型的效果,分別選取邏輯回歸、隨機森林和k近鄰算法進行實驗對比分析,通過交叉驗證方法得到各模型的量化準確率,如圖7所示。從圖7可以看出,支持向量機的平均準確率達到80%以上,而邏輯回歸、隨機森林和k近鄰的平均準確率只有65%,并且在交叉驗證的15組數(shù)據(jù)中支持向量機的結(jié)果相對穩(wěn)定,有13組數(shù)據(jù)的準確率高于80%,而其他模型的準確率結(jié)果不穩(wěn)定,尤其k近鄰模型的最低準確率只有20%。因此,通過對比不同機器學習模型的量化準確率能夠發(fā)現(xiàn)SVM模型具備較好的量化效果。
2. 實驗二:SVM模型中基于不同核函數(shù)量化效果的對比分析
本文選取常用的線性核、高斯核及多項式核函數(shù)來解決SVM分類時維度過高、計算能力不足的問題。其中,線性核主要用于線性可分的情形,具備參數(shù)少、速度快等特征,對于一般數(shù)據(jù)分類效果較理想;高斯核主要用于線性不可分的情形,具備參數(shù)多、過程比較耗時等特征;多項式核函數(shù)也可解決非線性問題,優(yōu)點是參數(shù)極少、運行速度快。通過各核函數(shù)分別計算量化準確率與運行時間來表示SVM的量化效果,具體情況見表1。結(jié)果顯示:線性核函數(shù)的準確率較高,達到85%,但運行時間要比多項式核函數(shù)稍長一些。因此,通過對比不同核函數(shù)的量化準確率和運行時間,能夠發(fā)現(xiàn)線性核函數(shù)在不耗時的同時具備較好的量化效果。
3. 實驗三:不同規(guī)模訓練集對量化準確率的影響程度
SVM模型量化準確率同時也受到訓練集與測試集比例的影響,本文分別選取60%、65%、70%、75%、80%、85%、90%、95%的數(shù)據(jù)集作為訓練集訓練量化模型。結(jié)果如圖8所示。隨著訓練集的增加,量化的準確率也在逐步提升,當訓練集數(shù)據(jù)量在70%~85%之間時,準確率可達80%以上;當訓練集數(shù)量達到75%時,獲得最好的量化效果,準確率約為85%。因此,本文選取75%的數(shù)據(jù)做訓練集,25%的數(shù)據(jù)作測試集,完成對SVM量化模型的調(diào)整。
五、研究結(jié)論與展望
隨著“教育信息化2.0行動計劃”的開展,在線教育發(fā)展迎來了春天,然而不論何種在線學習平臺都存在著“學習投入不足”的問題。因此,在當前的在線學習研究中解決學習主體學習投入不足的問題迫在眉睫。著眼于學習過程中的認知投入問題,本文針對學習云空間的學習投入現(xiàn)狀,利用機器學習的方法完成了認知投入的量化。首先,通過文獻法探討了認知投入的內(nèi)涵及相關理論,提出了基于社會認知理論的認知投入模型。然后,設計了認知投入量化框架,利用支持向量機對認知投入進行分類操作,實現(xiàn)對認知投入的量化。最后,本研究設計了一系列的實驗,分別從不同的機器學習模型、核函數(shù)以及訓練集規(guī)模三方面驗證量化模型的有效性。
但本研究仍存在以下兩個主要局限:沒有將基于認知過程數(shù)據(jù)的投入量化模型推廣到量化應用中;學習主體的學習投入狀態(tài)不僅僅體現(xiàn)在認知層面,也包含行為投入和情感投入兩方面。
因此,今后的研究將從以下兩個方面展開:擴大研究的樣本,對量化算法不斷修正,實現(xiàn)干預學習過程、預測學習情況、推薦學習資源等的應用效果分析;融合行為與情感投入進行更深入的量化研究,將發(fā)生在學習全過程的投入情況及時反饋給學習主體,促進學習主體的個性化發(fā)展。
[參考文獻]
付旻,王煒,王昊,等. 2018. 多分類支持向量機在公交換乘識別中的應用[J]. 哈爾濱工業(yè)大學學報(3):26-32.
韓中美,王希哲,黃昌勤,等. 2017. 學習云空間中學習路徑的情境語義標識及應用[J]. 現(xiàn)代教育技術(11):120-126.
黃昌勤,王希哲,張冬冬,等. 2015. 學習云空間支持下的研究性學習研究與實踐[J]. 中國電化教育(8):21-28.
孔企平. 2000. “學生投入”的概念內(nèi)涵與結(jié)構(gòu)[J]. 外國教育資料(2):72-76.
李爽,李榮芹,喻忱. 2018. 基于LMS數(shù)據(jù)的遠程學習者學習投入評測模型[J]. 開放教育研究(20):91-102.
李爽,王增賢,喻忱,等. 2016. 在線學習行為投入分析框架與測量指標研究——基于LMS數(shù)據(jù)的學習分析[J]. 開放教育研究(2):77-88.
李爽,喻忱. 2015. 遠程學生學習投入評價量表編制與應用[J]. 開放教育研究(12):62-70.
梁云真,趙呈領,阮玉嬌,等. 2016. 網(wǎng)絡學習空間中交互行為的實證研究——基于社會網(wǎng)絡分析的視角[J]. 中國電化教育(7):22-28.
毛志新. 2016. 布魯納認知—發(fā)現(xiàn)學習理論對成人教育學科建設的啟示[J]. 中國成人教育(20):4-6.
王洪江,穆肅,黃潔,等. 2017. 自主學習投入度實時分析方法及應用研究[J]. 電化教育研究(10):44-50.
王志軍,陳麗. 2015. 聯(lián)通主義學習的教學交互理論模型建構(gòu)研究[J]. 開放教育研究(5):25-34.
文孟飛,胡超,于文濤. 2016. 一種基于特征提取的教育視頻資源推送方法[J]. 現(xiàn)代遠程教育研究(3):104-112.
武法提,張琪. 2018. 學習行為投入:定義、分析框架與理論模型[J]. 中國電化教育(1):35-41.
張娜. 2012. 國內(nèi)外學習投入及其學校影響因素研究綜述[J]. 心理研究,5(2):83-92.
張思,劉清堂,雷詩捷,等. 2017. 網(wǎng)絡學習空間中學習者學習投入的研究——網(wǎng)絡學習行為的大數(shù)據(jù)分析[J]. 中國電化教育(4):24-30,40.
張艷梅,章寧,涂艷,等. 2014. 移動環(huán)境下學習者在線參與度研究[J]. 現(xiàn)代教育技術(11):88-96.
章宜華. 2001. 西方詞典釋義類型和釋義結(jié)構(gòu)研究[J]. 辭書研究(1):39-50.
趙呈領,梁云真,劉麗麗,等. 2016. 基于社會認知理論的網(wǎng)絡學習空間知識共享行為研究[J]. 電化教育研究(10):14-21,41.
Adar, B. E. , Debra, M. ,& Rena, D. , et al. (2018). Investigating the multidimensionality of engagement: Affective, behavioral, and cognitive engagement across science activities and contexts. Contemporary Educational Psychology, 53(1):87-105.
Akyol, Z. , & Garrison, D. R. ( 2011). Assessing metacognitionin an online community of inquiry[J]. Internet and Higher Education, 14(3):183-190.
Brinton, C. G., Buccapatnam, S., & Chiang, M., et al. (2015). Mining MOOC clickstreams: On the relationship between learner video-watching behavior and performance. Retrieved from http://arxiv.org/pdf/1503.06489.pdf
Chen, I. S. (2017). Computer self-efficacy, learning performance, and the mediating role of learning engagement. Computers in Human Behavior, 72(2):362–370.
Dixson, M. D. (2010). Creating effective student engagement in online courses: What do students find engaging. Journal of the Scholarship of Teaching and Learning, 10(2):1-13.
Fredricks, J. A. , Blumenfeld, P. C. , & Paris, A. H. (2004). School Engagement: Potential of the Concept, State of the Evidence. Review of Educational Research, 74(1):59-109.
John, B. (1987). Student approaches to learning and studying. Study process questionnaire manual:study process questionnaire manual: catalogue no 500fk. Australian Council Educational Research. (p: 10).
Johnson, M. L. , Sinatra, G. M. (2013). Use of task - value instructional inductions for facilitating engagement and conceptual change. Contemporary Educational Psychology, 38(1):51-63.
Kaser, T.,? Hallinen, N. R., & Schwartz, D. L. (2017). Modeling exploration strategies to predict student performance within a learning environment and beyond. Proceedings of the seventh international learning analytics & knowledge conference (pp. 31–40). ACM.
Lee, E. , Pate, J. A. , & Cozart. D. (2015). Autonomy support for online students. Techtrends, 59(4):54-61.
Shea, P. , Hayes, S. ,Smith, S. U. , et al.(2012). Learning presence: Additional research on a new conceptual element within the community of inquiry (CoI) framework[J]. Internet and Higher Education, 15(2): 89-95.
Smit, K. , Brabander, C. J. D. , & Boekaerts, M., et al. (2017). The self-regulation of motivation: Motivational strategies as mediator between motivational beliefs and engagement for learning. International Journal of Educational Research, 82(1):124-134.
作者簡介:張曉峰,碩士研究生;吳剛,碩士研究生。華南師范大學教育信息技術學院(510631)。
李明喜,博士研究生,華南師范大學外國語言文化學院(510631)。
俞建慧,博士研究生,浙江師范大學教師教育學院(321004)。
責任編輯 郝 丹