劉 崢,申 紅,徐小勇
(西安鐵路職業(yè)技術(shù)學(xué)院交通運(yùn)輸學(xué)院,陜西 西安 710064)
通過自我監(jiān)控、自我評(píng)價(jià)來評(píng)估學(xué)生在不同階段的學(xué)習(xí)效果,可幫助教師改進(jìn)教學(xué)設(shè)計(jì)。為了監(jiān)測學(xué)生的學(xué)習(xí)過程,相關(guān)研究使用了問卷調(diào)查方法[1],對學(xué)生從學(xué)習(xí)情況、學(xué)習(xí)態(tài)度、對課程的評(píng)價(jià)及建議進(jìn)行了調(diào)查分析,但這種方法并不是總能達(dá)到理想效果。為了提高問卷效度,學(xué)生需花費(fèi)不少的時(shí)間和精力,且不可能將該問卷多次應(yīng)用于所有課程。目前,價(jià)格低廉、具有獲取和存儲(chǔ)日?;顒?dòng)數(shù)據(jù)能力的可穿戴設(shè)備已經(jīng)得到廣泛應(yīng)用。通過可穿戴設(shè)備,教師可以監(jiān)測教學(xué)互動(dòng)質(zhì)量、學(xué)生心理健康和學(xué)習(xí)參與度[2]。
筆者在課堂活動(dòng)中使用腕戴式設(shè)備捕獲學(xué)生生理數(shù)據(jù),并應(yīng)用機(jī)器學(xué)習(xí)技術(shù)從生理數(shù)據(jù)推斷學(xué)習(xí)效果。隨后通過將學(xué)生在課堂上的相關(guān)信息提供給教師,促進(jìn)教師不斷提高教學(xué)質(zhì)量,從而達(dá)到高效教學(xué)的目的[3],以期為機(jī)器學(xué)習(xí)算法與人體生理數(shù)據(jù)研究領(lǐng)域提供新思路。
生理感知和量化自我技術(shù)的融合可以提供真實(shí)而細(xì)致的學(xué)習(xí)活動(dòng)數(shù)據(jù),從而為教師教學(xué)提供參考[4-5]。相關(guān)研究[6]表明,生理數(shù)據(jù)來源(包括可穿戴和穩(wěn)定的設(shè)備)可以提供重要的信息來源,從而為使用可穿戴設(shè)備監(jiān)測學(xué)生學(xué)習(xí)過程提供有力的數(shù)據(jù)保障。
在監(jiān)測人體生理數(shù)據(jù)時(shí),學(xué)者們往往關(guān)注來自自主神經(jīng)系統(tǒng)的生理測量數(shù)據(jù)[7-8],與中樞神經(jīng)系統(tǒng)監(jiān)測相比,自主神經(jīng)系統(tǒng)監(jiān)測成本更低、速度更快、佩戴更隱蔽,在生理學(xué)上更有效。近年來,相關(guān)專家學(xué)者對腕戴式可穿戴傳感設(shè)備的研究越來越廣泛,涉及的領(lǐng)域包括健身、醫(yī)療、娛樂、游戲和生活方式等。
量化自我技術(shù)可以幫助學(xué)生增強(qiáng)學(xué)習(xí)動(dòng)機(jī),做出明智的學(xué)習(xí)選擇[9-10],提高其元認(rèn)知能力。例如,假設(shè)學(xué)生想要了解他的學(xué)習(xí)效率在一天的幾個(gè)小時(shí)、一學(xué)期的幾個(gè)時(shí)間段(例如,學(xué)期開始、考試前)等的變化情況,用傳統(tǒng)的工具來評(píng)估學(xué)生的學(xué)習(xí)過程是無法實(shí)現(xiàn)的;而自我量化技術(shù)提供了這種可能,該技術(shù)可以幫助人們收集關(guān)于其行為、習(xí)慣和思想的個(gè)人數(shù)據(jù),目的是讓用戶參與自我監(jiān)控和自我反思,從而調(diào)節(jié)其生活中的各個(gè)方面。腕戴式可穿戴設(shè)備除了具有自我量化技術(shù)的非侵入性、可以進(jìn)行高頻用戶活動(dòng)跟蹤等優(yōu)點(diǎn)外,還提供了一種增強(qiáng)意識(shí)、動(dòng)力和行為變化的方法。諸如,健身跟蹤器可以為佩戴者提供其活動(dòng)的信息[11],并允許設(shè)定自己的目標(biāo)。將健身追蹤器的類比應(yīng)用到學(xué)習(xí)環(huán)境中,有可能改變學(xué)生學(xué)習(xí)和教師教學(xué)的方式,并為各種學(xué)習(xí)設(shè)計(jì)、決策提供信息。
為了在課堂活動(dòng)中捕獲細(xì)粒度的生理數(shù)據(jù),本研究在某高校課堂中進(jìn)行。參與者為31名年齡在18~24歲 (平均值為20.48,標(biāo)準(zhǔn)差(standard deviation,SD)為1.81)的計(jì)算機(jī)科學(xué)專業(yè)的學(xué)生,其中包括12名女生和19名男生,分為6組(5組5人,1組6人)。在每節(jié)課結(jié)束時(shí),要求學(xué)生根據(jù)一份標(biāo)準(zhǔn)化的問卷來評(píng)估其在這堂課中的學(xué)習(xí)效果。
在每堂課開始時(shí),參與者便戴上由本課題組自行設(shè)計(jì)、研發(fā)的腕戴設(shè)備。在課程結(jié)束時(shí),每個(gè)參與者都要完成一份問卷調(diào)查表,該表記錄的是其學(xué)習(xí)過程。上課時(shí)間約45 min(平均44.26 min,SD 6.4 min),其中大約35 min是實(shí)際上課時(shí)間(平均35.1 min,SD 13.1 min)。參與者所用的腕戴式可穿戴設(shè)備能夠同時(shí)捕獲所有數(shù)據(jù)流,并且具有很高的準(zhǔn)確性,同時(shí)入侵和維護(hù)需求少。
實(shí)驗(yàn)設(shè)計(jì)為單組時(shí)間序列,實(shí)驗(yàn)時(shí)對每組進(jìn)行連續(xù)生理數(shù)據(jù)監(jiān)測和問卷調(diào)查測量,并進(jìn)行數(shù)據(jù)處理。對每個(gè)參與者記錄3次數(shù)據(jù)(每周1節(jié)課,持續(xù)3周),并記錄了3種不同的課堂活動(dòng),平均持續(xù)35.1 min。圖1為實(shí)驗(yàn)方案,每個(gè)參與者花3~4 min入座并佩戴腕戴式可穿戴設(shè)備,開始課堂活動(dòng)。參與者最終花費(fèi)5~6 min完成問卷。每節(jié)課(包括設(shè)置設(shè)備、課堂活動(dòng)加上填寫問卷的時(shí)間)持續(xù)34.26 min。
圖1 實(shí)驗(yàn)方案
每節(jié)課結(jié)束時(shí),學(xué)生們都要完成一份書面調(diào)查用于收集學(xué)生對學(xué)習(xí)過程的反饋,包括:1)滿意度(SAT);2)有用性(USE);3)成績(PER)。在每個(gè)課堂活動(dòng)結(jié)束時(shí),這3個(gè)因素被用來量化學(xué)生的學(xué)習(xí)體驗(yàn)。在所有的測量中,均采用7點(diǎn)李克特量表。
由于生理參數(shù)與情緒和認(rèn)知過程密切相關(guān),因此可以使用皮膚電活動(dòng)(EDA)來檢查潛意識(shí)中可能發(fā)生的內(nèi)隱情緒反應(yīng)[12-13]。此外,某些情緒會(huì)觸發(fā)諸如腎上腺素之類的激素的釋放,從而增加血流量,為肌肉帶來更多的氧氣,并增加血壓。其中血流量的變化與血壓和周圍溫度成正比。這些反應(yīng)被用于推斷各種與學(xué)習(xí)相關(guān)的參數(shù),包括認(rèn)知負(fù)荷、感知困難和學(xué)習(xí)成績。
在學(xué)生上課期間,使用腕戴式可穿戴設(shè)備捕獲參與者的生理參數(shù)數(shù)據(jù),其中包括血液流變(HR)、血壓(BP)、體溫(TEMP)和皮膚電活動(dòng)(EDA)水平[14-15]。參與者用非慣用手佩戴腕帶,并記錄4種不同的測量值:1)1 Hz時(shí)的HR;2)4 Hz時(shí)的EDA;3)4 Hz時(shí)的TEMP;4)64 Hz時(shí)的BP。
腕戴式可穿戴設(shè)備數(shù)據(jù)會(huì)受到年齡、性別、一天中的不同時(shí)間段以及其他生理狀況的影響。為了消除時(shí)間序列數(shù)據(jù)中的個(gè)人偏差和其他條件偏差,將時(shí)間序列歸一化為數(shù)據(jù)前10 s的平均值。此外,使用MinMax歸一化來使所有數(shù)據(jù)在0到1范圍內(nèi)。為了消除可穿戴設(shè)備數(shù)據(jù)源(EDA,HR,BP,TEMP)中的噪聲,在時(shí)間序列數(shù)據(jù)上擬合樣條曲線。圖2顯示了從原始時(shí)間序列到平滑時(shí)間序列的過程。
圖2 數(shù)據(jù)預(yù)處理過程
聚合效度是指運(yùn)用不同測量方法測定同一特征時(shí)測量結(jié)果的相似程度,即不同測量方式應(yīng)在相同特征的測定中聚合在一起。本研究使用3個(gè)參數(shù)來評(píng)估聚合效度,即組合信度、項(xiàng)目信度、平均方差提取值(AVE)。
本文對組合信度和維度進(jìn)行了分析,以檢查問卷中所使用量表的有效性。關(guān)于量表的可靠性,使用克朗巴哈系數(shù)α,通過測量加載到基礎(chǔ)結(jié)構(gòu)上的因子來評(píng)估每個(gè)項(xiàng)目的信度,包括3個(gè)因子:滿意度、有用性、成績,如表1所示。AVE測量的是總體變異數(shù)與測量誤差引起的變異數(shù)之間的關(guān)系。當(dāng)平均方差提取值大于或等于0.50時(shí),聚合效度滿足要求。
表1 問卷測量量表
本文使用皮爾遜相關(guān)系數(shù)P確定3個(gè)變量之間的相關(guān)性,該系數(shù)量化了變量之間關(guān)系的強(qiáng)度。如表2所示,皮爾遜檢驗(yàn)證明了這3個(gè)因素之間存在較強(qiáng)的相關(guān)性。此外,還對變量進(jìn)行了區(qū)分效度檢驗(yàn),要求每個(gè)變量平均方差提取值的平方根大于其與其余變量的相關(guān)性。
表2 各個(gè)因素之間的P值
本文考慮了4種數(shù)據(jù)流,即BVP(blood volume pulse,血容量脈搏)、HR、EDA、TEMP。對于每種數(shù)據(jù)流,分別使用4種不同的訓(xùn)練算法——隨機(jī)森林(RF),線性內(nèi)核(SVM)、徑向基內(nèi)核(SVM)和多項(xiàng)式內(nèi)核(SVM)來計(jì)算與3個(gè)問卷調(diào)查因子(SAT、USE、PER)有關(guān)的均方根誤差(RMSE)。4種訓(xùn)練算法的選擇符合普適計(jì)算的相關(guān)工作,也與算法的質(zhì)量有關(guān)。這4種訓(xùn)練算法都可以用于預(yù)測分類目標(biāo)變量和連續(xù)目標(biāo)變量。
圖3顯示了不同訓(xùn)練算法和不同數(shù)據(jù)流(BVP、HR、EDA、TEMP)的比較,其中具有多項(xiàng)式內(nèi)核的SVM優(yōu)于其他算法。結(jié)果表明,USE的最小錯(cuò)誤率為13.8%,PER的最小錯(cuò)誤率為11.0%,SAT的最小錯(cuò)誤率為11.8%。
圖3 不同訓(xùn)練算法和不同數(shù)據(jù)流(BVP、HR、EDA、TEMP)的比較
總體而言,多項(xiàng)式SVM優(yōu)于其他訓(xùn)練算法。從圖3可以看出,多項(xiàng)式SVM和徑向SVM之間的成對差異表明沒有統(tǒng)計(jì)學(xué)上的顯著差異(P>0.05)。與徑向SVM和多項(xiàng)式SVM相比,RF的性能較差(P<0.05)。由表3可知,線性SVM在統(tǒng)計(jì)上不及其他3種訓(xùn)練算法(P<0.001)。
表3 RF、線性SVM、徑向SVM和多項(xiàng)式SVM成對差異t檢驗(yàn)結(jié)果
上述研究結(jié)果表明,從可穿戴式傳感器獲得的生理數(shù)據(jù)可以反映學(xué)生的學(xué)習(xí)過程。將生理數(shù)據(jù)與機(jī)器學(xué)習(xí)算法相結(jié)合對學(xué)習(xí)效果進(jìn)行評(píng)估可以取得更為準(zhǔn)確的結(jié)果和自我責(zé)任感。使用可穿戴式傳感設(shè)備自動(dòng)捕獲學(xué)生學(xué)習(xí)過程的可能性為使用量化自我技術(shù)的學(xué)生增強(qiáng)學(xué)習(xí)動(dòng)機(jī)開辟了新途徑。由于該方法為學(xué)生和老師提供了早期反饋,因此它使教師有可能得到關(guān)于精神不集中、不投入、不感興趣的預(yù)警,并提醒學(xué)生和教師盡早采取補(bǔ)救措施。研究發(fā)現(xiàn),利用生理數(shù)據(jù)可以很好地預(yù)測心理行為、學(xué)習(xí)參與度和學(xué)習(xí)成果。由此可知,可穿戴式傳感技術(shù)在學(xué)習(xí)中的實(shí)際意義已大大增強(qiáng)。
研究結(jié)果對學(xué)習(xí)和人機(jī)交互研究還有一些啟示。其一,提供了利用傳感數(shù)據(jù)收集和檢測學(xué)生學(xué)習(xí)過程可行性的證據(jù),使得教師能夠以相對容易和敏捷的方式來探索不同的教學(xué)和學(xué)習(xí)設(shè)計(jì)決策的有效性;其二,它為無法提供問卷反饋的學(xué)生群體(如由于缺乏語言能力或行為能力缺陷)提供了一種新的研究方向??傊纱┐鱾鞲屑夹g(shù)與量化自我技術(shù)的結(jié)合可支持學(xué)習(xí)中的自我監(jiān)測、評(píng)估和元認(rèn)知反思,具有重要的實(shí)踐意義和理論意義。
寶貴的學(xué)習(xí)經(jīng)驗(yàn)可為學(xué)習(xí)者節(jié)省大量的時(shí)間,有利于推動(dòng)學(xué)習(xí)目標(biāo)的實(shí)現(xiàn)。如果能將學(xué)生在課堂上的體驗(yàn)信息提供給教師,則教師也能對自己的教學(xué)表現(xiàn)進(jìn)行反思,設(shè)計(jì)出有效的、以學(xué)生為中心的教學(xué)方法。然而,要建立這樣的反饋系統(tǒng),首先需要設(shè)計(jì)有效的方法來獲取學(xué)生的學(xué)習(xí)過程。為此,本文提出了基于可穿戴設(shè)備監(jiān)測學(xué)生學(xué)習(xí)過程的方法,分別使用4種訓(xùn)練算法評(píng)估了與問卷調(diào)查因子有關(guān)的均方根誤差。結(jié)果表明,相比于其他算法,多項(xiàng)式SVM算法在有用性、成績、滿意度方面具有優(yōu)勢,為可穿戴傳感技術(shù)的發(fā)展提供了新的方向。