杜爽 飛云倩 何牧 胡航
【摘 要】
隨著大數(shù)據(jù)分析技術(shù)的不斷發(fā)展,教育學(xué)者不斷采用學(xué)習(xí)分析技術(shù)挖掘教育大數(shù)據(jù)中學(xué)習(xí)行為特征和規(guī)律,但較少通過行為日志數(shù)據(jù)來探尋多種學(xué)習(xí)行為與學(xué)習(xí)績效之間的關(guān)系。研究采集了833名大學(xué)生的圖書借閱和一卡通消費日志數(shù)據(jù),構(gòu)建學(xué)習(xí)績效、借閱行為、早起行為特征指標(biāo),通過聚類和關(guān)聯(lián)分析探究了兩種學(xué)習(xí)行為對大學(xué)生學(xué)習(xí)績效的影響和關(guān)系,結(jié)合元認(rèn)知問卷建立群體學(xué)習(xí)行為與整體學(xué)習(xí)績效和元認(rèn)知之間的關(guān)聯(lián)。研究結(jié)果顯示:①兩種行為均與學(xué)習(xí)績效建立了相關(guān)關(guān)系,元認(rèn)知發(fā)揮了中介作用;②早起行為主要反映出大學(xué)生元認(rèn)知體驗與計劃水平,早起時間比早起規(guī)律更能反映與學(xué)習(xí)績效的相關(guān)程度;③借閱行為主要反映大學(xué)生元認(rèn)知思維活動監(jiān)控和反思上的差異,閱讀速度對學(xué)習(xí)績效有顯著影響,借閱量與閱讀深度促進(jìn)專業(yè)知識技能的掌握。根據(jù)研究結(jié)果建議:①打造深度學(xué)習(xí)環(huán)境,激發(fā)大學(xué)生自我學(xué)習(xí)能動性;②優(yōu)化知識傳播方式,滿足大學(xué)生個性化閱讀需求;③改變圖書館角色定位,為學(xué)科專業(yè)發(fā)展提供高質(zhì)量服務(wù)。
【關(guān)鍵詞】? 大學(xué)生;早起行為;借閱行為;學(xué)習(xí)績效;聚類分析;關(guān)聯(lián)分析;元認(rèn)知
【中圖分類號】? ?G40-057? ? ? ? ?【文獻(xiàn)標(biāo)識碼】? A? ? ? ?【文章編號】? 1009-458x(2020)11-0047-12
一、問題提出
(一)教育大數(shù)據(jù)在教育研究中的應(yīng)用
我國教育大數(shù)據(jù)的研究與實踐已經(jīng)開始興起,一方面對掌握教育發(fā)展現(xiàn)狀、制定科學(xué)教育政策、配置合理的教育資源等具有重要的現(xiàn)實意義;另一方面反映學(xué)習(xí)者個體及群體的學(xué)習(xí)現(xiàn)狀與規(guī)律,為教育管理機(jī)構(gòu)把握教育現(xiàn)狀、及時科學(xué)地調(diào)整教育政策和科學(xué)決策提供現(xiàn)實依據(jù)(胡航, 等, 2019)。學(xué)習(xí)分析作為教育大數(shù)據(jù)重要的分析技術(shù),通過對學(xué)習(xí)者日志大數(shù)據(jù)進(jìn)行解釋和分析,用已知模型和方法評估學(xué)生的學(xué)習(xí)進(jìn)程,并對未來的學(xué)習(xí)績效進(jìn)行預(yù)測并發(fā)現(xiàn)潛在的問題(Johnson, et al., 2012)。學(xué)習(xí)行為分析是教育大數(shù)據(jù)分析中重要的應(yīng)用場景,結(jié)合大數(shù)據(jù)技術(shù)與學(xué)習(xí)分析技術(shù)研究智能數(shù)字化教育服務(wù)支撐平臺可以解決當(dāng)今教育信息化面臨的多種問題(馮翔, 等, 2013)。我國一些高校通過學(xué)校業(yè)務(wù)系統(tǒng)中產(chǎn)生大量的業(yè)務(wù)數(shù)據(jù)和學(xué)習(xí)資源,形成學(xué)習(xí)、科研、借閱、消費、活動等行為產(chǎn)生的動態(tài)數(shù)據(jù)源,實現(xiàn)智慧學(xué)習(xí)環(huán)境中“教、學(xué)、管”等相關(guān)數(shù)據(jù)分析,建立學(xué)習(xí)者行為模型(林秀瑜, 等, 2019),為學(xué)習(xí)者、教師和教育管理者提供實時、可用的信息,并利用這些信息來提高學(xué)習(xí)者的學(xué)習(xí)成就(李艷燕, 等, 2012)。近年來,一些學(xué)者開始采用機(jī)器學(xué)習(xí)和人工智能等技術(shù)從已有的學(xué)習(xí)資源中發(fā)現(xiàn)學(xué)習(xí)過程中存在的規(guī)律和問題,以期通過學(xué)習(xí)分析技術(shù)進(jìn)行解釋和揭示各要素之間的關(guān)系和影響,從而解決教學(xué)活動中面臨的問題,探究教育大數(shù)據(jù)中的實用價值(胡欽太, 等, 2016)。如利用關(guān)聯(lián)規(guī)則挖掘行為規(guī)律(李宏運, 2009),通過聚類分析研究行為傾向(吳志強(qiáng), 2011),通過學(xué)習(xí)分析技術(shù)促進(jìn)學(xué)習(xí)者元認(rèn)知發(fā)展(毛剛, 2018)。這些研究為教育大數(shù)據(jù)提供了基礎(chǔ)的技術(shù)應(yīng)用,增進(jìn)了教育工作者對教學(xué)規(guī)律和學(xué)習(xí)特征的認(rèn)識,但大數(shù)據(jù)技術(shù)在教育領(lǐng)域的應(yīng)用還不夠全面,一是以往用于學(xué)習(xí)行為與學(xué)習(xí)效果的研究數(shù)據(jù)來源較為單一,多以調(diào)查問卷、在線學(xué)習(xí)記錄、校園網(wǎng)業(yè)務(wù)日志中某一數(shù)據(jù)源進(jìn)行分析,而多類型數(shù)據(jù)綜合分析的研究較少;二是傳統(tǒng)統(tǒng)計研究方法或監(jiān)督學(xué)習(xí)進(jìn)行分析的較多,而基于教育大數(shù)據(jù)的機(jī)器學(xué)習(xí)技術(shù),特別是對多類型數(shù)據(jù)采用非監(jiān)督學(xué)習(xí)進(jìn)行探究的較少;三是研究學(xué)習(xí)行為與學(xué)生思維發(fā)展之間的關(guān)系研究較少,學(xué)習(xí)行為特征背后所蘊(yùn)含教育學(xué)、心理學(xué)意義的解釋還不夠全面。
(二)選擇早起行為與借閱行為的緣由
在學(xué)習(xí)行為研究的選擇上,一些學(xué)者按照學(xué)習(xí)模式選擇課堂學(xué)習(xí)行為和課外學(xué)習(xí)行為(張艷, 2019),一些學(xué)者按照教與學(xué)行為的研究方法選擇課堂教學(xué)行為分析階段和廣義學(xué)習(xí)行為(黃榮懷, 等, 2020)。本文選擇早起與借閱行為的緣由,一是基于行為屬性的研究價值,早起行為是大學(xué)生為了完成學(xué)習(xí)任務(wù)在規(guī)定時間之前的自發(fā)性行為,是一種基礎(chǔ)性的自律行為;借閱行為是大學(xué)生為了某種學(xué)習(xí)目的而獲取學(xué)習(xí)資源的自主性行為,是一種基礎(chǔ)性的自學(xué)行為。這兩種行為在諸多學(xué)習(xí)行為中具有典型性和代表性,能體現(xiàn)大學(xué)生主動、力圖解決問題的學(xué)習(xí)行為特征,通過對行為發(fā)生次數(shù)、頻率和時間等行為屬性的分析,能較好地反映大學(xué)生自我效能意識、自我認(rèn)知調(diào)節(jié)等思維發(fā)展過程。二是從元認(rèn)知分析的角度,元認(rèn)知活動的調(diào)節(jié)主要通過監(jiān)控和控制兩種基本方式來實現(xiàn),大學(xué)生通過認(rèn)知活動將元認(rèn)知技能運用到真實場景中,早起與圖書借閱運用元認(rèn)知技能是有意識的行為,當(dāng)大學(xué)生自身的元認(rèn)知計劃、監(jiān)控、調(diào)節(jié)和反思得到充分體驗后,將形成一種不為意識所察覺的元認(rèn)知知識。三是基于數(shù)據(jù)分析方法,數(shù)字化校園一卡通系統(tǒng)能很好地存儲學(xué)生的消費記錄和圖書館借閱記錄,是一種良好的結(jié)構(gòu)化數(shù)據(jù),易于后期根據(jù)數(shù)據(jù)屬性將其轉(zhuǎn)換成可測量和計算的行為指標(biāo),以支持挖掘工具的數(shù)據(jù)處理和分析系統(tǒng)的智能計算。
本文選擇校園網(wǎng)業(yè)務(wù)日志數(shù)據(jù)、調(diào)查問卷、成績數(shù)據(jù),采用非監(jiān)督學(xué)習(xí)分析方法,探究早起與借閱兩種學(xué)習(xí)行為與學(xué)習(xí)績效之間的關(guān)系,以期為現(xiàn)有學(xué)習(xí)行為研究范式的建立和發(fā)展提供借鑒,主要研究以下三個問題:
1. 大學(xué)生借閱和早起行為與學(xué)習(xí)績效分別有怎樣的關(guān)系?
2. 不同借閱和早起行為類型與學(xué)習(xí)績效之間有怎樣的關(guān)聯(lián)?
3. 不同借閱和早起行為類型與元認(rèn)知水平有怎樣的關(guān)系?
二、研究基礎(chǔ)
(一)學(xué)習(xí)行為與學(xué)習(xí)績效的關(guān)系
隨著教育大數(shù)據(jù)分析技術(shù)的發(fā)展,不少學(xué)者通過學(xué)習(xí)分析技術(shù)建立不同類型的學(xué)習(xí)行為分析模型探究與學(xué)習(xí)績效的關(guān)系,如采用數(shù)據(jù)挖掘技術(shù)對網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績進(jìn)行預(yù)測(趙慧瓊, 等, 2017),運用因子分析、回歸分析等學(xué)習(xí)分析技術(shù)構(gòu)建學(xué)生在線學(xué)習(xí)行為與學(xué)習(xí)績效相關(guān)模型(李小娟, 等, 2017),利用多元回歸分析法判定在線學(xué)習(xí)行為影響學(xué)生學(xué)習(xí)績效的預(yù)警因素(王改花, 等, 2019)。這些研究從不同分析對象和分析方法建立了學(xué)習(xí)行為與學(xué)習(xí)效果之間的聯(lián)系。相較于傳統(tǒng)學(xué)習(xí)行為分析主要的不同體現(xiàn)在:一是依托在線學(xué)習(xí)平臺作為研究對象的較多,對線下課程、校園活動場景的行為研究較少;二是分析的數(shù)據(jù)量從傳統(tǒng)的小規(guī)模樣本轉(zhuǎn)變成多類型海量數(shù)據(jù),其中蘊(yùn)含更多的行為特征信息,在線學(xué)習(xí)平臺能采集結(jié)構(gòu)良好的存儲數(shù)據(jù),有利于后期進(jìn)行處理和分析;三是分析手段多樣,分析精度越來越高,不僅結(jié)合統(tǒng)計學(xué)研究方法,更多的是結(jié)合大數(shù)據(jù)分析、人工智能技術(shù),從學(xué)習(xí)行為本身的屬性、特征等維度建立與學(xué)習(xí)績效的關(guān)系模型和預(yù)測模型;四是行為與學(xué)習(xí)績效關(guān)系的解釋,從數(shù)據(jù)的統(tǒng)計描述、可視化等方式,逐步深入到行為模式背后形成機(jī)制和形成動機(jī)的詮釋。
(二)早起和借閱行為與學(xué)習(xí)績效的關(guān)系
本文所指的早起行為以大學(xué)生在校期間早上8點第一節(jié)課作為時間基點,主要分析大學(xué)生在早上6點至9點之間進(jìn)行一卡通消費的次數(shù)、頻率和平均時間。目前關(guān)于早起行為如何影響學(xué)習(xí)績效的研究較少,多從大學(xué)生睡眠質(zhì)量、作息時間等維度進(jìn)行調(diào)查研究,發(fā)現(xiàn)生活規(guī)律對大學(xué)生學(xué)業(yè)成績的影響。?nder等(2014)發(fā)現(xiàn)睡眠質(zhì)量、早起時間與學(xué)習(xí)成績存在密切關(guān)系,大學(xué)生的學(xué)業(yè)成績對早起行為和睡眠質(zhì)量有影響作用;宋玉婷等(2017)研究了大學(xué)生睡眠質(zhì)量和學(xué)業(yè)成績之間的關(guān)系,發(fā)現(xiàn)學(xué)業(yè)成績越差的學(xué)生,其自控力越弱,睡眠質(zhì)量越差,從中可以發(fā)現(xiàn)睡眠與學(xué)習(xí)績效存在相關(guān)性。
借閱行為主要分析大學(xué)生在圖書館中借閱圖書的數(shù)量、種類和時間。目前,借閱行為主要分析挖掘讀者的閱讀規(guī)律和閱讀習(xí)慣等行為特征,為高校圖書館提供個性化和多樣化服務(wù)(Xiong, 2014)。隨著信息化技術(shù)的不斷發(fā)展,國內(nèi)外高校圖書館都非常重視管理創(chuàng)新和服務(wù)意識的提高,特別是圖書館多元化融合對教學(xué)質(zhì)量的影響(Cruz, 2019),大學(xué)生圖書館利用程度和相應(yīng)的學(xué)習(xí)績效產(chǎn)出是衡量圖書館存在價值的重要標(biāo)準(zhǔn)(Whitmire, 2002)。因此,近年來挖掘借閱行為與學(xué)習(xí)績效的關(guān)系得到更多學(xué)者的關(guān)注。楊新涯等(2013)依托借閱數(shù)據(jù)對國貿(mào)、工管、機(jī)械、通信四個專業(yè)本科生的借閱數(shù)量、借閱文獻(xiàn)類別數(shù)據(jù)展開統(tǒng)計分析,得出理工類專業(yè)學(xué)生借閱數(shù)量高于文科類且專業(yè)文獻(xiàn)借閱較多的結(jié)論。潘穎等(2019)將專業(yè)分為理、工、文、管四個學(xué)科,開展本科生課程成績與借閱行為學(xué)科差異性的實證研究。
(三)學(xué)習(xí)行為與元認(rèn)知的關(guān)系
元認(rèn)知是對認(rèn)知的認(rèn)知,是個體對自己認(rèn)知狀態(tài)與過程的意識和調(diào)節(jié)(弗拉維爾, 等, 2002)。學(xué)習(xí)行為與元認(rèn)知相互影響,一些研究證明了元認(rèn)知對學(xué)習(xí)行為的影響。Hill等(1997)發(fā)現(xiàn)元認(rèn)知知識、自我效能感和先前知識水平等因素對學(xué)習(xí)行為的影響,認(rèn)為這些因素有助于學(xué)習(xí)者自我監(jiān)控和增強(qiáng)定位感的提升。后期一些學(xué)者在研究網(wǎng)絡(luò)學(xué)習(xí)行為模式中也發(fā)現(xiàn)元認(rèn)知和自我效能感方面的投入會顯著影響學(xué)習(xí)行為(馬志強(qiáng), 等, 2017)。
還有一些研究從不同學(xué)習(xí)理論探究學(xué)習(xí)行為對元認(rèn)知的影響。查爾斯·庫利(Charles Cooley)從社會學(xué)的角度探究認(rèn)知與行為的關(guān)系,指出行為是對自我認(rèn)識的一種反應(yīng),是在參與社會活動中產(chǎn)生的自我評價過程。舒茨(Alfred Schütz)從行為的群體化屬性中指出,學(xué)習(xí)行為不僅是學(xué)生的個體行為,群體在學(xué)習(xí)活動中的相互比較、相互學(xué)習(xí)和影響,對個體的學(xué)習(xí)動機(jī)和能動性等認(rèn)知發(fā)展起到了積極促進(jìn)作用。姜強(qiáng)等(2019)利用學(xué)生行為和交互日志數(shù)據(jù),采用開放學(xué)習(xí)者模型進(jìn)行學(xué)習(xí)過程可視化,進(jìn)而評價了學(xué)習(xí)者元認(rèn)知水平,證明了學(xué)習(xí)行為對元認(rèn)知技能的影響作用。
鑒于以上討論,本文對早起和借閱兩種學(xué)習(xí)行為特征進(jìn)行聚類分析和關(guān)聯(lián)分析,對數(shù)據(jù)之間的邏輯聯(lián)系和數(shù)據(jù)屬性之間的深層關(guān)系進(jìn)行剖析,建立群體學(xué)習(xí)行為與整體學(xué)習(xí)績效和元認(rèn)知之間的關(guān)聯(lián),探究兩種學(xué)習(xí)行為與學(xué)習(xí)績效的關(guān)系。
三、研究設(shè)計
(一)研究對象與數(shù)據(jù)來源
研究以C市S高校2018級大學(xué)生作為研究對象,采集數(shù)據(jù)的時間從2018年9月到2019年8月。圖書借閱數(shù)據(jù)來源于圖書館的業(yè)務(wù)日志,早起數(shù)據(jù)來源于學(xué)生在學(xué)校一卡通的消費日志,學(xué)習(xí)績效數(shù)據(jù)來源于學(xué)校教務(wù)系統(tǒng)中課程信息和課程成績數(shù)據(jù)。元認(rèn)知測試問卷在2019年6月期末考試后向?qū)W生發(fā)放。
在這些數(shù)據(jù)中,由于日志數(shù)據(jù)記錄了所有學(xué)生的活動記錄,需要對這些數(shù)據(jù)進(jìn)行排查和清洗,發(fā)現(xiàn)問題數(shù)據(jù)并處理,如有部分學(xué)生在一天中多次借還或借閱時間已超過一學(xué)年,都將其處理為一次借閱行為。經(jīng)過刪除重復(fù)和無效數(shù)據(jù),最終篩選匯總出833名大學(xué)生總計102,297條日志數(shù)據(jù),同時對這833名大學(xué)生定向發(fā)放元認(rèn)知調(diào)查問卷,共收集有效問卷833份,作為本次研究樣本。
(二)分析方法
在學(xué)習(xí)行為研究方法上,一是采用行為聚類方法分別研究早起和借閱行為特征與學(xué)習(xí)績效之間的關(guān)系,目的是比較不同學(xué)習(xí)行為與學(xué)習(xí)績效之間的差異;二是采用關(guān)聯(lián)分析法探究這兩種行為特征和學(xué)習(xí)績效的關(guān)系,探究不同學(xué)習(xí)行為類型對學(xué)習(xí)績效產(chǎn)生的共同作用;三是采用問卷調(diào)查法從元認(rèn)知體驗與計劃、思維監(jiān)控和思維反思三個維度進(jìn)一步解釋兩種行為與大學(xué)生認(rèn)知發(fā)展的影響,最終揭示外顯行學(xué)習(xí)行為對學(xué)習(xí)績效和內(nèi)在思維的影響關(guān)系。
1. 聚類分析
聚類分析(Clustering Analysis)是一種無監(jiān)督學(xué)習(xí)方法,通過計算工具對考察對象按照某種特定屬性進(jìn)行劃分、探查數(shù)據(jù)結(jié)構(gòu),使同一個類的對象具有相似的屬性特征,不同類的對象相異(Soman, Diwakar, & Ajay, 2009)。其中,K均值聚類算法(K-means),因在時間復(fù)雜度和空間復(fù)雜度低,并在不同類型數(shù)據(jù)集有良好分類效果等優(yōu)點,在學(xué)習(xí)分析中被廣泛采用。該算法在使用前需要設(shè)定簇數(shù)K值,初始聚類中心對后期聚類效果會產(chǎn)生重要影響(喬璐, 等, 2020)。本文采用SPSS中modeler工具,設(shè)定K值為3,將早起和借閱兩種行為分別聚為3類,結(jié)合學(xué)習(xí)績效F1 和F2進(jìn)行克魯斯卡爾-沃利斯檢測,比較早起和借閱行為對學(xué)習(xí)績效的影響。
2. 關(guān)聯(lián)分析
關(guān)聯(lián)分析(Association Analysis)也是一種無監(jiān)督學(xué)習(xí)方法,是一種通過尋找數(shù)據(jù)之間關(guān)聯(lián)規(guī)則的過程,關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項(屬性、變量)之間隱藏的(潛在的)相互關(guān)系(儲文靜, 等, 2010)。本文采用懷卡托智能WeKa分析軟件,將csv數(shù)據(jù)轉(zhuǎn)換為專屬arff文件。arff文件格式中以每一名學(xué)生的早起、借閱行為、學(xué)習(xí)績效屬性形成一行數(shù)據(jù)樣本,在WeKa環(huán)境中稱為一個實例(Instance),將行為特征和學(xué)習(xí)績效數(shù)據(jù)導(dǎo)入形成數(shù)據(jù)集(Data information)。