韋書令 文夢丹 鄧孟紅
[摘 要]大數(shù)據(jù)作為第三次信息技術(shù)浪潮的主要趨勢,對社會各行各業(yè)形成了重要的影響。文章從自適應(yīng)學(xué)習(xí)、精準(zhǔn)資源推薦和學(xué)習(xí)分析技術(shù)等方面對大數(shù)據(jù)技術(shù)應(yīng)用進行研究,探討社區(qū)居民在參與數(shù)字化學(xué)習(xí)平臺應(yīng)用過程中遇到的資源建設(shè)、服務(wù)共享和數(shù)據(jù)處理等問題及其原因,提出利用大數(shù)據(jù)技術(shù)改進和完善社區(qū)數(shù)字化學(xué)習(xí)平臺的應(yīng)用策略,建立精準(zhǔn)快捷的學(xué)習(xí)資源推薦機制,為建設(shè)學(xué)習(xí)型社會提供技術(shù)支撐。
[關(guān)鍵詞]大數(shù)據(jù);社區(qū)教育;自適應(yīng)學(xué)習(xí);資源推薦
[中圖分類號]G720 [文獻標(biāo)識碼]A [文章編號]1008-7656(2018)03-0029-04
一、前言
隨著互聯(lián)網(wǎng)應(yīng)用技術(shù)的不斷發(fā)展,數(shù)字化學(xué)習(xí)平臺可為社區(qū)居民提供大量優(yōu)質(zhì)在線教學(xué)資源,但在使用過程中也產(chǎn)生了大量結(jié)構(gòu)化和非結(jié)構(gòu)化的教學(xué)信息,傳統(tǒng)的數(shù)據(jù)處理方法難以應(yīng)付管理、服務(wù)、研究、評價等教學(xué)大數(shù)據(jù)。目前社區(qū)教育信息量的爆炸式增長已經(jīng)引起了專家與學(xué)者的關(guān)注,大數(shù)據(jù)技術(shù)在社區(qū)教育的研究與實踐中發(fā)揮著越來越重要的作用。數(shù)據(jù)處理技術(shù)的創(chuàng)新發(fā)展成為人們新的視野焦點,如何利用與分析這些數(shù)據(jù)信息,不僅影響著信息交流、知識傳遞和學(xué)習(xí)效果,而且在一定程度上影響著教學(xué)決策制定和學(xué)習(xí)模式優(yōu)化,并已經(jīng)成為目前教育工作者和學(xué)習(xí)者關(guān)注的內(nèi)容[1]。
目前,大數(shù)據(jù)在社區(qū)教育領(lǐng)域的應(yīng)用還存在著一些問題,數(shù)字化學(xué)習(xí)平臺的數(shù)據(jù)標(biāo)準(zhǔn)還有待完善,數(shù)據(jù)匯集需要建立統(tǒng)一標(biāo)準(zhǔn)與規(guī)范,電大系統(tǒng)、培訓(xùn)機構(gòu)和中高職所建設(shè)的社區(qū)在線學(xué)習(xí)資源沒有得到有效整合;現(xiàn)有社區(qū)數(shù)字化學(xué)習(xí)平臺在系統(tǒng)設(shè)計上,對教與學(xué)過程的記錄不夠全面細致;盡管當(dāng)前傳感器、Wifi網(wǎng)絡(luò)、移動設(shè)備等技術(shù)手段得到了廣泛應(yīng)用,但現(xiàn)有社區(qū)數(shù)字化學(xué)習(xí)平臺建設(shè)中,對數(shù)據(jù)采集的支持還不夠。
大數(shù)據(jù)已經(jīng)對人們的生活、工作和學(xué)習(xí)產(chǎn)生了深刻地影響。大數(shù)據(jù)在社區(qū)教育的應(yīng)用意義在于對不同來源和類型的教學(xué)數(shù)據(jù)集合進行分析和研究,發(fā)現(xiàn)影響教學(xué)的數(shù)據(jù)信息,為師生解決教學(xué)問題提供參考決策。教師通過大數(shù)據(jù)對學(xué)習(xí)者學(xué)習(xí)中產(chǎn)生的海量數(shù)據(jù)進行分析預(yù)測,為學(xué)習(xí)者推送個性化的學(xué)習(xí)資源,從而有效地提高學(xué)習(xí)者的學(xué)習(xí)效果,以便真正做到孔子所提及的有教無類和因材施教[2] 。
本研究將從自適應(yīng)學(xué)習(xí)分析技術(shù)、精準(zhǔn)資源推薦等方面對大數(shù)據(jù)技術(shù)應(yīng)用進行探究,探討社區(qū)居民通過對數(shù)字化學(xué)習(xí)平臺應(yīng)用過程中遇到的資源建設(shè)、服務(wù)共享和數(shù)據(jù)處理等問題及其原因,最后提出利用大數(shù)據(jù)技術(shù)改進和完善社區(qū)數(shù)字化學(xué)習(xí)平臺的應(yīng)用策略。
二、大數(shù)據(jù)的關(guān)鍵技術(shù)
社區(qū)數(shù)字化學(xué)習(xí)平臺在教學(xué)實施過程產(chǎn)生了大量結(jié)構(gòu)化和非結(jié)構(gòu)化的教學(xué)數(shù)據(jù),而大數(shù)據(jù)技術(shù)的發(fā)展成熟,為這些問題提供了多種解決方案。上世紀(jì)90年代至本世紀(jì)初,隨著數(shù)據(jù)挖掘理論和數(shù)據(jù)庫技術(shù)的發(fā)展完善,知識管理應(yīng)用工具大量涌現(xiàn),如知識管理系統(tǒng)、專家系統(tǒng)等;到了本世紀(jì)前十年,隨著Web2.0技術(shù)的成熟推廣,大量非結(jié)構(gòu)化數(shù)據(jù)的不斷產(chǎn)生,給原有的數(shù)據(jù)處理技術(shù)帶來巨大的挑戰(zhàn),這也促使了大數(shù)據(jù)技術(shù)快速發(fā)展,以谷歌的GFS和MapReduce為代表的并行計算和分布式系統(tǒng)等技術(shù)開始進入主流視野;到了2010年以后,各行各業(yè)開始廣泛應(yīng)用大數(shù)據(jù),越來越多的個人、機構(gòu)和公司運用大數(shù)據(jù)進行智能分析決策。2017年上半年有63家大數(shù)據(jù)創(chuàng)業(yè)公司獲得了融資,總?cè)谫Y金額超過68億人民幣,其中獲得上億元融資的企業(yè)就有17家。教育大數(shù)據(jù)正在成為教育領(lǐng)域不可忽視的新型驅(qū)動力,在教育教學(xué)研究與實踐中發(fā)揮著越來越重要的作用[3]。
大數(shù)據(jù)的特點可以總結(jié)為“4V”,即大量(Volume)、高速度(Velocity)、多樣化(Variety)、價值(Value)。大數(shù)據(jù)的應(yīng)用往往占用大量的數(shù)據(jù)存儲容量,計量單位甚至達到 EB、ZB、YB,而且計算速度快,生成數(shù)據(jù)分析結(jié)果所需要的時間在秒級范圍內(nèi)。大數(shù)據(jù)包含網(wǎng)絡(luò)文檔、音頻、視頻、圖片、地理位置等數(shù)據(jù)集,人們可以通過多種分析技術(shù)從大數(shù)據(jù)中挖掘有價值的信息。下面我們將從技術(shù)框架、存儲和管理、處理和分析以及計算模式等方面來系統(tǒng)闡述大數(shù)據(jù)的關(guān)鍵技術(shù)。
1.大數(shù)據(jù)的技術(shù)框架
大數(shù)據(jù)技術(shù)框架通過Hadoop和Spark構(gòu)建了一個龐大的技術(shù)生態(tài)圈如圖1。Hadoop是由HDFS和MapReduce組成的分布式文件系統(tǒng),HDFS用來存儲海量數(shù)據(jù),MapReduce可提供海量數(shù)據(jù)計算服務(wù),具體表現(xiàn)為計算節(jié)點、集群、機柜和數(shù)據(jù)中心;數(shù)據(jù)管理主要是面向結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)進行管理,Cassandra、MongoDB以及在Postgres等數(shù)據(jù)庫技術(shù)可以非常方便地對非結(jié)構(gòu)化數(shù)據(jù)進行存儲和處理;在Spark生態(tài)系統(tǒng)上通過機器學(xué)習(xí)和分布式計算完成統(tǒng)計性分析、數(shù)據(jù)挖掘、可視化分析等業(yè)務(wù)計算,流式實時運算Storm也可用于數(shù)據(jù)管理。使用的分析工具包括日志管理工具Splunk,支持的數(shù)據(jù)源也是多種類型的,可視化工具Tableau,SPSS主要用于數(shù)據(jù)建模工作,常用工具語言有java和python。
2.大數(shù)據(jù)存儲和管理
通常認(rèn)為大數(shù)據(jù)由半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)組成,其中以非結(jié)構(gòu)化數(shù)據(jù)居多,采用內(nèi)容檢索、交叉比對、深度挖掘和綜合分析等方法對不同類型的數(shù)據(jù)應(yīng)用進行處理。針對大數(shù)據(jù)的存儲與管理問題,目前常用的oldSQL、NoSQL 與NewSQL等非結(jié)構(gòu)化數(shù)據(jù)庫都可以解決傳統(tǒng)數(shù)據(jù)庫難以處理的諸如內(nèi)容檢索、深度挖掘和綜合分析等問題。
3.大數(shù)據(jù)處理和分析
利用分布式并行編程模型以及分布式計算框架,結(jié)合當(dāng)前流行的機器學(xué)習(xí)算法,可實現(xiàn)對海量數(shù)據(jù)的處理和分析,對分析結(jié)果進行可視化呈現(xiàn),利用形象直觀的表現(xiàn)形式來顯示復(fù)雜的資源內(nèi)容,包括散點圖、直方圖、時間軸和樹圖等;分析方法包括查詢分析、流分析和復(fù)雜分析。
4.大數(shù)據(jù)的計算模式
根據(jù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)和計算特征,從大量的數(shù)據(jù)計算問題和需求中提取抽象特征模型,對數(shù)據(jù)處理的不同需求和特征維度,形成了多種大數(shù)據(jù)計算模式,每種模式都提供了對應(yīng)的大數(shù)據(jù)解決方案和代表產(chǎn)品(如表1)。
三、大數(shù)據(jù)在社區(qū)教育領(lǐng)域的應(yīng)用
1.自適應(yīng)學(xué)習(xí)
社區(qū)教育的本質(zhì)是以滿足社區(qū)居民的需求為根本,以提高社區(qū)居民的生活水平和改善社區(qū)內(nèi)經(jīng)濟狀況為目的,是社區(qū)人力資源智力開發(fā)和技能提升的創(chuàng)造性過程。因此,社區(qū)教育的人才培養(yǎng)目標(biāo)具有多層次和多類型的特點,應(yīng)針對每一位學(xué)習(xí)者個性化需求而提供教學(xué)內(nèi)容。由于社區(qū)學(xué)習(xí)者的能力水平參差不齊,利用自適應(yīng)學(xué)習(xí)工具評估學(xué)習(xí)者,分析學(xué)習(xí)者對問題具體的回答,為學(xué)習(xí)者提供獨一無二的內(nèi)容反饋、線索和學(xué)習(xí)資源,滿足其個性化的學(xué)習(xí)需求。在培生集團給出的《解碼自適應(yīng)學(xué)習(xí)》的報告中定義,“自適應(yīng)學(xué)習(xí)是一種教育科技手段,它通過自主提供適合每位學(xué)習(xí)者的獨立幫助,在現(xiàn)實中與學(xué)習(xí)者產(chǎn)生實時互動?!?自適應(yīng)學(xué)習(xí)一般應(yīng)用在測試中,根據(jù)學(xué)習(xí)者回答問題的正確與否,及時改變和調(diào)整測評的標(biāo)準(zhǔn)。比如英語考試中的GRE和GMAT,測試者在連續(xù)做對題目之后就會發(fā)現(xiàn)題目越來越難,這就是自適應(yīng)評估工具在根據(jù)測試者的表現(xiàn)及時調(diào)整的結(jié)果。
2.學(xué)習(xí)分析
在社區(qū)教育教學(xué)中,教學(xué)過程的組織結(jié)構(gòu)特征和師生關(guān)系密切相關(guān)。在社區(qū)數(shù)字化學(xué)習(xí)平臺上,學(xué)習(xí)者參與教學(xué)活動和構(gòu)建知識體系受到自身的社會背景、文化背景和知識能力的影響。因此,教師需要把學(xué)習(xí)對象自身觀點、知識的影響限制在一定范圍內(nèi),對學(xué)習(xí)者的每個學(xué)習(xí)環(huán)節(jié)進行分析和評價。以學(xué)習(xí)分析為工具,給出行動指導(dǎo)、立足服務(wù)的體系結(jié)構(gòu)、信息與服務(wù)一攬子解決方案,其根本目的是提升學(xué)習(xí)質(zhì)量。學(xué)習(xí)分析的預(yù)測功能是基于教育大數(shù)據(jù)的預(yù)測,其結(jié)果具有可參考性,能為目前的教學(xué)和后期教學(xué)優(yōu)化提供重要的指導(dǎo)作用[4] 。
目前一般用聚類、預(yù)測、關(guān)系挖掘、文本挖掘等數(shù)據(jù)挖掘方法和工具采集學(xué)習(xí)者學(xué)習(xí)數(shù)據(jù),并將采集到的數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)化數(shù)據(jù),運用統(tǒng)計分析、內(nèi)容分析、社會網(wǎng)絡(luò)分析及語義分析等方法,從大量冗雜的數(shù)據(jù)中挖掘有用信息。常用的學(xué)習(xí)分析工具如Course Signals、Blackboard、Desire2Learn和Moodle等在線平臺都可以運用統(tǒng)計分析法,分析學(xué)習(xí)者的學(xué)習(xí)表現(xiàn)。
數(shù)字化學(xué)習(xí)平臺從技術(shù)層面實現(xiàn)了各種學(xué)習(xí)行為數(shù)據(jù)的量化與可視化,通過記錄、分類、挖掘和運用學(xué)習(xí)者學(xué)習(xí)過程中產(chǎn)生的大量非結(jié)構(gòu)化數(shù)據(jù),能夠揭示出學(xué)習(xí)者學(xué)習(xí)存在的問題和效果;通過監(jiān)測、跟蹤、分析和應(yīng)用學(xué)習(xí)者在整個學(xué)習(xí)過程中形成的數(shù)據(jù)檔案,能夠幫助教師理解學(xué)習(xí)者為了掌握學(xué)習(xí)內(nèi)容而進行學(xué)習(xí)的全過程。
3.精準(zhǔn)學(xué)習(xí)資源推薦
社區(qū)教育課程的設(shè)計在課程目標(biāo)設(shè)置、教學(xué)設(shè)計和課程內(nèi)容安排及實施上,應(yīng)立足社區(qū)實際,關(guān)注社區(qū)本地化以及給社區(qū)帶來的教育影響;從課程實施角度看,關(guān)注課程實施中居民的學(xué)習(xí)體驗、方式與過程,在教學(xué)過程中注重靈活和多樣化。社區(qū)學(xué)習(xí)資源的設(shè)計和開發(fā)還應(yīng)該關(guān)注不同群體的現(xiàn)實需求與發(fā)展需要,突出課程開發(fā)的層次性和與特色性。因此,社區(qū)數(shù)字化學(xué)習(xí)平臺需要為學(xué)習(xí)者提供精準(zhǔn)的學(xué)習(xí)資源推薦系統(tǒng)。
目前學(xué)習(xí)資源的推薦方法包括基于內(nèi)容的推薦和基于協(xié)同過濾的推薦。它們基本原理是,根據(jù)學(xué)習(xí)者以往瀏覽較多的學(xué)習(xí)資源,選擇其他類似的學(xué)習(xí)資源作為推薦結(jié)果。例如,現(xiàn)在有一門課程與學(xué)習(xí)者過去學(xué)過的課程內(nèi)容有相同知識點或者內(nèi)容類似,則學(xué)習(xí)者可能就喜歡瀏覽這門新課程。通常使用學(xué)習(xí)者模型的向量特征來描述學(xué)習(xí)者的學(xué)習(xí)需求,提取課程內(nèi)容的特征維度,作為學(xué)習(xí)者模型的內(nèi)容特征。通過計算學(xué)習(xí)者模型的匹配度,將匹配度高的課程推送給目標(biāo)學(xué)習(xí)者。
四、大數(shù)據(jù)在社區(qū)教育領(lǐng)域的實施策略研究
1.優(yōu)化學(xué)習(xí)資源推薦算法,要以社區(qū)居民為中心,將社區(qū)教育數(shù)字化學(xué)習(xí)資源進行整合和共享。利用現(xiàn)有各類學(xué)校的數(shù)字化學(xué)習(xí)信息、學(xué)習(xí)資源、各類行業(yè)培訓(xùn)課程和各縣市區(qū)社區(qū)教育的數(shù)字化內(nèi)容按標(biāo)準(zhǔn)的數(shù)據(jù)規(guī)范統(tǒng)一整合在社區(qū)數(shù)字化學(xué)習(xí)平臺,形成共建共享的社區(qū)教育服務(wù)體系。
在優(yōu)化學(xué)習(xí)資源推薦算法方面,首先處理好學(xué)習(xí)者和學(xué)習(xí)資源之間的關(guān)系,為學(xué)習(xí)者各項隱性和顯性行為設(shè)置權(quán)重。顯式(explicit)的行為包括:瀏覽、點擊、收藏、分享、評論、點贊等;隱式(implicit)的行為包括:瀏覽時長、播放時長、瀏覽次數(shù)等。通過權(quán)重設(shè)置將對學(xué)習(xí)者做出更精準(zhǔn)、更全面的分析和畫像建模,為學(xué)習(xí)者提供更加優(yōu)質(zhì)的多場景學(xué)習(xí)支持服務(wù),訂制更合適的自身學(xué)習(xí)風(fēng)格和學(xué)習(xí)路徑。
2.建立安全機制,保護社區(qū)居民個人數(shù)據(jù)隱私。大數(shù)據(jù)環(huán)境下,個人數(shù)據(jù)作為一項重要資源,其蘊藏的巨大價值日益凸顯[5]?;趯W(xué)習(xí)者學(xué)習(xí)過程的大數(shù)據(jù)分析,教師可以獲知和挖掘?qū)W習(xí)者的學(xué)習(xí)情況、情感狀態(tài)甚至精神狀態(tài),所以保護學(xué)習(xí)者的隱私已成為必須解決的問題。社區(qū)教育大數(shù)據(jù)涉及大規(guī)模的社區(qū)學(xué)習(xí)居民群體,特別是對于大量的未成年和老年學(xué)習(xí)者而言,隱私保護至關(guān)重要。所以,應(yīng)當(dāng)從法律上明確和規(guī)范公開數(shù)據(jù)與私有數(shù)據(jù)的邊界,有效保護隱私數(shù)據(jù)。在明確數(shù)據(jù)來源和使用責(zé)權(quán)的前提下,才能有效地開展教育大數(shù)據(jù)研究與應(yīng)用。
目前針對隱私保護問題,已經(jīng)提出了諸如加密、訪問控制、匿名化、變換和差分隱私等方法。大數(shù)據(jù)帶來更加便捷的服務(wù),然而其與數(shù)據(jù)隱私卻存在著矛盾的關(guān)系。美國佐治亞理工Ling Liu教授提出,在大數(shù)據(jù)的背景下,我們應(yīng)該著眼于探索以可用性為導(dǎo)向的隱私保護方法。此外,數(shù)據(jù)隱私應(yīng)該包括個人和組織對數(shù)據(jù)收集、使用和分析,甚至是交易的控制權(quán)。
3.建立“學(xué)分銀行”成果認(rèn)證制度,健全平臺大數(shù)據(jù)應(yīng)用評價機制。[6]將社區(qū)居民的在線學(xué)習(xí)信息納入學(xué)分系統(tǒng),建立社區(qū)居民社區(qū)學(xué)習(xí)大數(shù)據(jù),對學(xué)習(xí)者參與學(xué)習(xí)的內(nèi)容、時間以及結(jié)業(yè)成績進行記錄,并與電大系統(tǒng)、職業(yè)學(xué)院和高等學(xué)校等各種教育機構(gòu)建立“課程互通、學(xué)分互認(rèn)”的學(xué)分認(rèn)證體系,逐步社區(qū)學(xué)習(xí)大數(shù)據(jù)認(rèn)證制度。對平臺收集獲取的學(xué)習(xí)大數(shù)據(jù)進行可視化分析,幫助學(xué)習(xí)者進行大數(shù)據(jù)學(xué)習(xí)評估、預(yù)測和干預(yù),推動社區(qū)教育朝著開放性和個性化的方向發(fā)展。
[參考文獻]
[1]周馨.大數(shù)據(jù)時代教育數(shù)據(jù)價值挖掘[J].信息與電腦(理論版),2013(8).
[2]崔曉鸞,趙可云.大數(shù)據(jù)在教育領(lǐng)域的研究熱點及發(fā)展趨勢——基于共詞分析的可視化研究[J].現(xiàn)代遠距離教育,2016(4).
[3]孫洪濤,鄭勤華.教育大數(shù)據(jù)的核心技術(shù)、應(yīng)用現(xiàn)狀與發(fā)展趨勢[J].遠程教育雜志,2016 (5).
[4]劉鳳娟.大數(shù)據(jù)的教育應(yīng)用研究綜述[J].現(xiàn)代教育技術(shù),2014(8).
[5]姜強,趙蔚,王朋嬌,王麗萍.基于大數(shù)據(jù)的個性化自適應(yīng)在線學(xué)習(xí)分析模型及實現(xiàn)[J].中國電化教育,2015(1).
[6]韋書令.社區(qū)教育數(shù)字化學(xué)習(xí)平臺建設(shè)和資源共享研究[J].成人教育,2017(5).
[7]張燕南.大數(shù)據(jù)的教育領(lǐng)域應(yīng)用之研究[D].上海:華東師范大學(xué),2016.
[8]肖玉敏,孟冰紋,唐婷婷,吳永和,謝蓉.面向智慧教育的大數(shù)據(jù)研究與實踐:價值發(fā)現(xiàn)與路徑探索[J].電化教育研究,2017(12).
[9]張正華.大數(shù)據(jù)時代“MOOCS”對終身教育發(fā)展影響的研究[D].天津:天津工業(yè)大學(xué),2017.
[10]李媛.大數(shù)據(jù)時代個人信息保護研究[D].重慶:西南政法大學(xué),2016.
[11]裴瑩,付世秋,吳鋒.我國教育大數(shù)據(jù)研究熱點及存在問題的可視化分析[J].中國遠程教育,2017(12).
[作者簡介]韋書令(1984-),男,壯族,廣西馬山人,碩士,助理研究員,研究方向:在線教育、社區(qū)教育、數(shù)字化學(xué)習(xí)分析應(yīng)用;文夢丹(1989-),女,湖南衡陽人,碩士,講師,研究方向:在線教育、數(shù)字化多媒體制作與開發(fā);鄧孟紅(1984-),男,瑤族,廣西恭城人,碩士,講師,研究方向:遠程教育、計算機應(yīng)用、數(shù)字化學(xué)習(xí)資源建設(shè)。
[責(zé)任編輯 周個妹]