虞思慧 楊明 潘城杰 程俊豪 李文娟
摘要:學(xué)情分析是智慧教育的重要組成部分。云計算是存儲和處理大規(guī)模數(shù)據(jù)的最新技術(shù)手段。本文將云計算和深度學(xué)習(xí)技術(shù)相結(jié)合,提出了一款高效、智能的學(xué)情數(shù)據(jù)分析系統(tǒng)。本文首先構(gòu)建了基于云邊混合架構(gòu)的學(xué)情分析系統(tǒng)模型,接著詳細(xì)論述了平臺的設(shè)計、部署和實施過程,最后設(shè)計了一系列相關(guān)實驗進(jìn)行實證分析。通過對中國大學(xué)MOOC平臺真實數(shù)據(jù)的建模分析結(jié)果表明,該系統(tǒng)具備了良好的數(shù)據(jù)分析和挖掘能力,能夠為教師和教學(xué)管理者提供有益參考,從而為在線教學(xué)效果和滿意度提升提供技術(shù)支持。
關(guān)鍵詞:云計算;深度學(xué)習(xí)建模;學(xué)情分析系統(tǒng);教學(xué)質(zhì)量評價
中圖分類號:TP393? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2024)07-0018-03
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)
0 引言
隨著互聯(lián)網(wǎng)的縱深發(fā)展,教育領(lǐng)域逐漸邁入數(shù)字化、智慧化時代。線上教學(xué)成為目前主流的教學(xué)形式之一。盡管線上教學(xué)平臺的課程內(nèi)容十分豐富,然而質(zhì)量卻良莠不齊,很難為學(xué)習(xí)者提供量身定制的個性化服務(wù)。學(xué)情分析系統(tǒng)提供了對教學(xué)內(nèi)容和學(xué)評教數(shù)據(jù)的分析總結(jié),能夠輔助決策,是提高在線教學(xué)質(zhì)量、提升教學(xué)效果的重要技術(shù)手段。
學(xué)情分析系統(tǒng)的研究始于20世紀(jì)末,隨著深度學(xué)習(xí)技術(shù)的崛起而得到顯著發(fā)展。早期學(xué)情分析系統(tǒng)主要依賴于傳統(tǒng)機(jī)器學(xué)習(xí)算法,如決策樹、支持向量機(jī)等,這些方法在處理大規(guī)模數(shù)據(jù)時顯得力不從心。而深度學(xué)習(xí)算法,因其出色的特征學(xué)習(xí)和模式識別能力,在學(xué)情分析領(lǐng)域逐漸得到廣泛應(yīng)用。比如,王麗、談云兵[1]探討了深度學(xué)習(xí)模型在博客數(shù)據(jù)分析中的應(yīng)用和存在問題。景紅娜[2]構(gòu)建了基于Moodle教學(xué)平臺的深度學(xué)習(xí)模式,并通過實驗驗證了該模式的教學(xué)效果。段金菊[3]結(jié)合實踐案例剖析了深度學(xué)習(xí)的學(xué)習(xí)策略和效果。Meng等人[4]提出一種基于多層卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)方法。Deng等人[5]提出了結(jié)合CNN與BiLSTM的融合模型進(jìn)行文本情感分析,有效地提高了情感識別的準(zhǔn)確性。Szu-Yin Lin等人[6]使用集成學(xué)習(xí)技術(shù)和BERT模型實施情感分析取得了不錯的效果。
然而,目前學(xué)情分析系統(tǒng)的研究仍面臨諸多問題和挑戰(zhàn),包括:1) 學(xué)情數(shù)據(jù)量大,且存在評價數(shù)據(jù)離散化、個性化等特點,而目前主流的學(xué)情分析平臺普遍存在數(shù)據(jù)存儲和計算能力不足的問題。2) 盡管深度學(xué)習(xí)算法的學(xué)習(xí)效果比較理想,但在處理教育大數(shù)據(jù)時,由于算法自身的開銷較大,導(dǎo)致數(shù)據(jù)分析結(jié)果的實時性不足。3) 大部分學(xué)情分析系統(tǒng)針對的并非真實的評價數(shù)據(jù),數(shù)據(jù)統(tǒng)計分析的結(jié)果缺乏可信度和說服力。
針對上述問題,本文結(jié)合云計算和深度學(xué)習(xí)技術(shù)提出了一款基于云邊混合架構(gòu)的學(xué)情分析模型。云計算為存儲和分析大規(guī)模學(xué)情數(shù)據(jù)提供了強(qiáng)大的存儲和計算能力,深度學(xué)習(xí)算法則提供了處理復(fù)雜數(shù)據(jù)和提取高階特征的能力,有助實現(xiàn)對學(xué)生學(xué)習(xí)行為的精準(zhǔn)預(yù)測和個性化建議。
本文的主要貢獻(xiàn)包括:
1)提出了一款基于云邊混合架構(gòu)的學(xué)情分析模型,通過云邊協(xié)同提高學(xué)情分析處理的能力,降低處理時延。
2)比較了不同深度學(xué)習(xí)模型在實施學(xué)情數(shù)據(jù)挖掘的效果,以幫助學(xué)情分析選擇最佳模型,從而提高數(shù)據(jù)分類和挖掘的準(zhǔn)確性。
3)實現(xiàn)對中國大學(xué)幕客平臺真實數(shù)據(jù)的爬取和分析,實現(xiàn)對教學(xué)效果的縱橫向比較,有助于提升線上教學(xué)質(zhì)量。
本文余下部分的結(jié)構(gòu)如下:第1章介紹系統(tǒng)總體架構(gòu)和主要實施流程,第2章是系統(tǒng)建模與實驗設(shè)計,第3章對中國大學(xué)慕課的實證數(shù)據(jù)進(jìn)行學(xué)情分析并給出對比報告。最后是總結(jié)和展望。
1 系統(tǒng)總體架構(gòu)
1.1 系統(tǒng)模型
基于云邊混合架構(gòu)的學(xué)情分析系統(tǒng)模型架構(gòu)圖如圖1所示:
學(xué)情分析系統(tǒng)搭建在云計算和邊端環(huán)境中,實施基于云邊協(xié)同的深度學(xué)習(xí)過程。云主機(jī)實現(xiàn)學(xué)情大數(shù)據(jù)的存儲和離線分析,邊緣和終端設(shè)備實施小規(guī)模數(shù)據(jù)的本地在線學(xué)習(xí)。云邊協(xié)作加速了數(shù)據(jù)分析過程,降低處理時延。數(shù)據(jù)層實現(xiàn)數(shù)據(jù)存儲和事務(wù)處理,業(yè)務(wù)層則根據(jù)應(yīng)用需求構(gòu)建相關(guān)接口。前端搭建了友好的人機(jī)交互接口,便于使用者輕松掌握學(xué)情分析的結(jié)果。
1.2 系統(tǒng)功能模塊圖
本系統(tǒng)的功能模塊圖如圖 2所示:
該系統(tǒng)分析平臺將通過可視化方式展示學(xué)情數(shù)據(jù)的分析結(jié)果,并提供實時反饋和建議,為高校學(xué)生和教師提供全方位的學(xué)情分析服務(wù),幫助學(xué)生改進(jìn)學(xué)習(xí)策略、提高學(xué)習(xí)效率,學(xué)生可以更清晰地了解自己的學(xué)情狀態(tài)和學(xué)習(xí)效果幫助教師更好地了解學(xué)生的學(xué)習(xí)情況和需求,提供有針對性的教育教學(xué)服務(wù)。
1.3 研究步驟
主要研究步驟是:1) 學(xué)情數(shù)據(jù)爬取。2) 數(shù)據(jù)預(yù)處理,包括去除重復(fù)數(shù)據(jù)、去除無用字符、使用jieba分詞、去除停用詞等,處理出本項目所需要的數(shù)據(jù)內(nèi)容,使用w2v生成詞向量并對數(shù)據(jù)集進(jìn)行劃分。3) 根據(jù)學(xué)情分析的任務(wù)需求選擇適合的深度學(xué)習(xí)模型,包括設(shè)計實驗對現(xiàn)有的深度模型進(jìn)行對比,采用交叉驗證等方法評估模型的性能,最終選出最合適的模型。4) 進(jìn)行調(diào)參和優(yōu)化以提高模型的精度、泛化性和可解釋性。5) 結(jié)果預(yù)測,將預(yù)測結(jié)果轉(zhuǎn)化為相應(yīng)的學(xué)情建議,例如課程推薦、個性化教學(xué)建議等。
2 建模與實驗設(shè)計
2.1 模型對比
本文重點比較了深度學(xué)習(xí)中的LSTM模型和BERT模型,如圖3所示。LSTM模型具有更低的損失分?jǐn)?shù),因而表現(xiàn)更好。然而,兩種模型的準(zhǔn)確度基本相同,所以如果只關(guān)注準(zhǔn)確度,那么二者表現(xiàn)相當(dāng)。
2.2 實驗設(shè)計
2.2.1 環(huán)境配置
表1? 環(huán)境配置
[開發(fā)的硬件環(huán)境 處理器:Intel Core i7-1165G7 CPU @ 2.80GHz 內(nèi)存:16 GB DDR4 運行的硬件環(huán)境 處理器:Intel(R) Core(TM) i5-3230M CPU @ 2.60GHz 內(nèi)存:8GB 操作系統(tǒng) Windows 10/11 軟件開發(fā)環(huán)境/開發(fā)工具 PyCharm 2023.1.2、AutoDl 該軟件的運行平臺/操作系統(tǒng) PyCharm 2023.1.2、Windows 10/11 軟件運行支撐環(huán)境/支持軟件 Windows 7、Windows 10 編程語言 Python ]
2.2.2 實施訓(xùn)練
使用云主機(jī)Auto DL服務(wù)器,配合本地進(jìn)行數(shù)據(jù)集相關(guān)訓(xùn)練。
2.2.3 運行結(jié)果
系統(tǒng)運行結(jié)果如圖5所示,當(dāng)輸入隨機(jī)的評價內(nèi)容時,系統(tǒng)會給出評判結(jié)果。
3 學(xué)情數(shù)據(jù)分析
筆者爬取了中國大學(xué)幕客的評價數(shù)據(jù),并對數(shù)據(jù)進(jìn)行了分析,以下是分析結(jié)果。
3.1 同一所學(xué)校內(nèi)部不同課程評分比較的結(jié)果
圖6展示幕客網(wǎng)中北京大學(xué)30門課程的評分?jǐn)?shù)據(jù)。從圖中可以看出,課程評分方差較大,這說明學(xué)生對課程的評價存在較大差異??赡艿脑蚴菍W(xué)生對課程教學(xué)內(nèi)容的喜好程度不同,評價較為個體化。而對于此類評分方差較大的課程,學(xué)??梢钥紤]進(jìn)一步探究評價意見差異化的具體原因,通過調(diào)整課程內(nèi)容、改進(jìn)教學(xué)方法或者增加師生互動的方式,提高整體課程質(zhì)量。
3.2 不同大學(xué)之間橫向比較的結(jié)果
圖7和圖8分別展示了不同大學(xué)的課程數(shù)量和評論數(shù)量的折線圖,不難看出:1) 課程數(shù)量的分布在不同大學(xué)間呈現(xiàn)較大的不均勻性,這可能受到大學(xué)規(guī)模、學(xué)科設(shè)置、在線教育發(fā)展等因素的影響。2) 評論數(shù)據(jù)呈現(xiàn)明顯的差異,這反映了學(xué)生對不同大學(xué)課程的關(guān)注和反饋程度,評論數(shù)量的分布可能受到課程內(nèi)容、教學(xué)質(zhì)量、學(xué)生參與度等因素的影響。3) 關(guān)聯(lián)性觀察:還可以觀察到課程數(shù)量和評論數(shù)量之間的關(guān)聯(lián)關(guān)系,借助這種關(guān)聯(lián)性可以幫助大學(xué)進(jìn)行在線教育課程的優(yōu)化和改進(jìn)。
4 總結(jié)與展望
本文提出了一款融合云計算和深度學(xué)習(xí)技術(shù)的學(xué)情分析系統(tǒng)。系統(tǒng)基于云邊混合計算模型,充分利用了云計算的高可用性、邊緣計算系統(tǒng)的低時延,以及深度學(xué)習(xí)的數(shù)據(jù)分析能力,能夠?qū)崿F(xiàn)對學(xué)生學(xué)習(xí)行為和課程評價數(shù)據(jù)的精準(zhǔn)分析。實驗設(shè)計和實證分析結(jié)果表明,本文模型在數(shù)據(jù)分析精度和性能方面的有效性。然而,本文提出的系統(tǒng)暫未考慮數(shù)據(jù)的安全和隱私保護(hù)問題,以及深度學(xué)習(xí)模型在云邊混合架構(gòu)的優(yōu)化和參數(shù)自適應(yīng)調(diào)整等,這是筆者接下去重點研究的方向。
參考文獻(xiàn):
[1] 王麗,談云兵.基于博客的深度學(xué)習(xí)研究:以蘇州教育博客為例[J].中國遠(yuǎn)程教育,2009(12):40-43,79.
[2] 景紅娜,陳琳,趙雪萍.基于Moodle的深層學(xué)習(xí)研究[J].遠(yuǎn)程教育雜志,2011,29(3):27-33.
[3] 段金菊.e-Learning環(huán)境下促進(jìn)深度學(xué)習(xí)的策略研究[J].中國電化教育,2012(5):38-43.
[4] MENG J N,LONG Y C,YU Y H,et al.Cross-domain text sentiment analysis based on CNN_FT method[J].Information,2019,10(5):162.
[5] DENG H J,ERGU D J,LIU F Y,et al.Text sentiment analysis of fusion model based on attention mechanism[J].Procedia Computer Science,2022,199:741-748.
[6] LIN S Y,KUNG Y C,LEU F Y.Predictive intelligence in harmful news identification by BERT-based ensemble learning model with text sentiment analysis[J].Information Processing & Management,2022,59(2):102872.
【通聯(lián)編輯:唐一東】