王小偉
[摘? ? 要] “互聯(lián)網(wǎng)+”給教育領域帶來的不僅有海量的開放性學習資源,在促進傳統(tǒng)課堂和在線教育的深度融合過程中,還產(chǎn)生了大量的行為數(shù)據(jù)。如何全面采集教與學全過程數(shù)據(jù),并對這些數(shù)據(jù)進行挖掘分析,實現(xiàn)教育決策的科學化是個值得深入研究的課題。本研究從功能需求出發(fā),通過分析教育大數(shù)據(jù)平臺的使用場景,設計構建了教育大數(shù)據(jù)平臺的基本架構,并對平臺建設過程中的關鍵問題進行了闡述,以期為后續(xù)教育大數(shù)據(jù)平臺的具體實現(xiàn)奠定基礎。
[關鍵詞] 互聯(lián)網(wǎng)+;教育大數(shù)據(jù);深度融合;信息化
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 21. 079
[中圖分類號] G710? ? [文獻標識碼]? A? ? ? [文章編號]? 1673 - 0194(2019)21- 0198- 02
1? ? ? 引? ? 言
高校的信息化建設起步較早,通過各類信息系統(tǒng)的使用,給工作帶來了巨大的便利,在使用過程中積累了大量的數(shù)據(jù)資源[1]。隨著學校信息化應用程度的不斷提高,數(shù)據(jù)量越來越大,數(shù)據(jù)種類也越來越多,不僅包括結構化數(shù)據(jù),還包括大量半結構化、非結構化數(shù)據(jù)。在數(shù)字校園1.0時代,雖然完成了基本的數(shù)據(jù)同步和交換,但是大多數(shù)交換僅限于基礎數(shù)據(jù),大量的業(yè)務數(shù)據(jù)依然塵封在各個業(yè)務系統(tǒng),沒有發(fā)揮數(shù)據(jù)之間的關聯(lián)作用,依然存在著信息孤島[2]。
“互聯(lián)網(wǎng)+”概念的提出,給各行各業(yè)都帶來了巨大的變革?!盎ヂ?lián)網(wǎng)+”即“互聯(lián)網(wǎng)+各個傳統(tǒng)行業(yè)”,但它不只是簡單的兩者相加,而是將信息技術與傳統(tǒng)行業(yè)進行深度融合,創(chuàng)造新的發(fā)展生態(tài)。對于教育領域[3]來說,互聯(lián)網(wǎng)帶來的不只是海量的開放性學習資源,還有傳統(tǒng)課堂教學與學習方式的變革。近幾年,隨著網(wǎng)絡學習空間、MOOC、微課等的大量應用,不僅顛覆了傳統(tǒng)的授課模式,而且促進了傳統(tǒng)課堂和在線教育的深度融合[4],在此過程中,產(chǎn)生了大量的行為數(shù)據(jù)。面對這些海量的數(shù)據(jù),如何全面采集教與學全過程數(shù)據(jù),并對這些數(shù)據(jù)進行挖掘分析,以此來真正促進學生的個性化學習, 實現(xiàn)教育決策的科學化[5]是個值得深入研究的課題。
本研究對教育大數(shù)據(jù)平臺的架構及其關鍵技術進行研究,希望能為后期建設提供參考。
2? ? ? 教育大數(shù)據(jù)平臺的構建
2.1? ?功能需求
教育大數(shù)據(jù)平臺的核心功能是從各個相關業(yè)務系統(tǒng)進行數(shù)據(jù)采集,通過整合、分析,深入挖掘數(shù)據(jù)之間的關系,進而為各類決策提供數(shù)據(jù)支撐?;竟δ苄枨螅?/p>
(1)全量數(shù)據(jù)交換中心,應具備從各個業(yè)務系統(tǒng)采集各類結構化和非結構化數(shù)據(jù)的能力,提供各種標準化數(shù)據(jù)接口,以滿足不同數(shù)據(jù)源的采集需求。
(2)中心數(shù)據(jù)庫,應具備針對海量數(shù)據(jù)的高效計算能力,因此高可用、低成本、高容錯、可擴展的分布式存儲是必要的。
(3)應用中心:采集數(shù)據(jù)的最終目的是為了應用,這是我們的終極目標,因此應提供各類跨系統(tǒng)跨部門的查詢、統(tǒng)計功能;提供面向教育領域的分析挖掘模型及其相應的算法,提供各類交叉數(shù)據(jù)挖掘功能,使得數(shù)據(jù)挖掘信息更全面,結果更可靠。
(4)用戶中心:面向各類人群,提供各類服務。
2.2? ?教育大數(shù)據(jù)平臺的使用場景
學生用戶:通過采集學生的學習、生活等行為數(shù)據(jù),進行數(shù)據(jù)分析和挖掘,可以對學生做出學習效果評估、學習成績預警、心理健康預警、就業(yè)前景預測等,進而為學生提供個性化學習路線建議,找到最適合學生的學習方式。
教師用戶:通過采集教育環(huán)境數(shù)據(jù),一方面可以對教師的教學行為進行診斷,方便教師適時調整教學模式、教學計劃進度等。另一方面可為任課老師或管理老師提供精確的學生畫像,讓教師能準確掌握每個學生的學習和生活情況,進而為學生提供個性化管理和授課,適時地進行人工干預,實現(xiàn)真正的因材施教。
教學管理者:通過大數(shù)據(jù)技術在教學過程中可以更加準確地分析評價課堂教學的質量和效果。以往對課堂、教師的評價體系是定性和模糊的,無法做定量的判斷,大數(shù)據(jù)平臺下,可以通過采集各類教學過程數(shù)據(jù),高效地獲得教學的真實情況,從而得到真實的教學評價。
行政管理者:通過將教育環(huán)境中的數(shù)據(jù)利用起來,從中挖掘出潛在的有價值信息,為各類管理決策提供有效依據(jù),從而使得高校的管理更加具有目的性和高效性。
3? ? ? 架構設計
結合前面的功能需求,設計了教育大數(shù)據(jù)平臺的基本架構,如圖1所示:
數(shù)據(jù)源:包括現(xiàn)有正在運行的各個業(yè)務系統(tǒng)數(shù)據(jù)(含結構化數(shù)據(jù)和非結構化數(shù)據(jù))。
數(shù)據(jù)交換中心:主要負責采集各個業(yè)務系統(tǒng)數(shù)據(jù),通過數(shù)據(jù)清洗、轉換、整合,形成規(guī)范的標準化數(shù)據(jù),進入中心數(shù)據(jù)庫;同時當數(shù)據(jù)源數(shù)據(jù)發(fā)生變化時,負責同步數(shù)據(jù)到相應業(yè)務系統(tǒng)。
中心數(shù)據(jù)庫:承載著非常重要的功能,數(shù)據(jù)的準確性、規(guī)范性非常重要。因此各業(yè)務數(shù)據(jù)在進入中心數(shù)據(jù)庫之前一定要進行清洗、比對、過濾,形成比較準確全面的數(shù)據(jù),才有可能提供給業(yè)務系統(tǒng)共享并支持下一步的大數(shù)據(jù)分析等應用。
應用層:基于中心數(shù)據(jù)庫,對各類數(shù)據(jù)進行數(shù)據(jù)分析和數(shù)據(jù)挖掘,并進行可視化展示,為各類人群提供各類服務。
4? ? ? 教育大數(shù)據(jù)平臺建設過程中的關鍵問題
教育大數(shù)據(jù)平臺能夠提供海量數(shù)據(jù)的高效計算,能夠為學校管理者提供有價值的數(shù)據(jù)支撐和價值挖掘。但在實際建設過程中,往往存在著數(shù)據(jù)類型多樣、數(shù)據(jù)來源眾多、數(shù)據(jù)質量低下等問題。因此,在構建教育大數(shù)據(jù)平臺之前,需要進行大量的數(shù)據(jù)準備工作。
(1)建立數(shù)據(jù)標準:參照國家的信息管理規(guī)范,與各業(yè)務部門共同研究制定校級數(shù)據(jù)標準;在集成過程中,輔助各種業(yè)務檢驗規(guī)則進行驗證,根據(jù)結果反饋并修改數(shù)據(jù)規(guī)則及質量問題,逐步提升數(shù)據(jù)質量;同時,總結和形成數(shù)據(jù)集成流程標準、轉換規(guī)則標準、流程變更標準等數(shù)據(jù)管理標準,制定數(shù)據(jù)使用和管理等相關規(guī)章制度。
(2)數(shù)據(jù)采集:是教育大數(shù)據(jù)平臺建設過程中的重點和難點。只有保證數(shù)據(jù)的準確性、及時性和有效性,才能最大程度地發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)來源通常有兩種方式:自動獲取、手工導入。通過與現(xiàn)有業(yè)務系統(tǒng)數(shù)據(jù)庫對接可實現(xiàn)數(shù)據(jù)的自動獲取,手工導入由數(shù)據(jù)提供部門進行手工導入,可能存在時效性問題。在實際集成過程中,應盡可能準確地確定數(shù)據(jù)的源頭,盡可能自動獲取數(shù)據(jù),以保證數(shù)據(jù)采集的時效性和準確性。
(3)數(shù)據(jù)交換中心:主要是對收集到的數(shù)據(jù)進行存儲、清洗、過濾,將數(shù)據(jù)轉換成標準化數(shù)據(jù)。不同類型的數(shù)據(jù)可以通過多種方法采集到,而這些數(shù)據(jù)想要用于數(shù)據(jù)挖掘,必須要經(jīng)過數(shù)據(jù)處理,因為采集到的數(shù)據(jù)往往是不完善的,可能存在各種各樣的問題,必須通過技術手段來處理這些采集到的原始數(shù)據(jù),即通過數(shù)據(jù)清洗、數(shù)據(jù)變換、數(shù)據(jù)提取這一過程來處理原始數(shù)據(jù)。
(4)應用中心:主要是基于中心數(shù)據(jù)庫,對數(shù)據(jù)進行深度挖掘,并通過可視化方式進行展示,從而為各類人群提供各類服務。因此該部分的重點是各類數(shù)據(jù)模型的建立,使得針對教育領域的數(shù)據(jù)挖掘更豐富、更可靠。
(5)計算能力:由于要進行大量的運算,因此需要分布式計算框架,并且要有很好的擴展性、容錯能力和高效可靠的輸入輸出,以滿足大數(shù)據(jù)處理的需求。
5? ? ? 結? ? 語
教育大數(shù)據(jù)平臺最核心的應用就是對數(shù)據(jù)的分析,其目標是發(fā)現(xiàn)數(shù)據(jù)內在的規(guī)律,挖掘數(shù)據(jù)中隱藏的信息,從而輔助制定決策。因此,全樣本分析是大數(shù)據(jù)分析的關鍵,我們需要盡可能多而且全面地收集學生、教師、管理機構的相關信息,才能為我們進一步的分析提供數(shù)據(jù)支撐。
本研究從功能需求出發(fā),通過分析教育大數(shù)據(jù)平臺的使用場景,設計構建了教育大數(shù)據(jù)平臺的基本架構,并對平臺建設過程中的關鍵問題進行了闡述,為后續(xù)教育大數(shù)據(jù)平臺的具體實現(xiàn)奠定基礎。
主要參考文獻
[1]李建.大數(shù)據(jù)時代高校數(shù)據(jù)中心的建設構想[J].信息通信,2018(1):197-198.
[2]束乾倩,涂慶華,崔聰.教育信息化2.0視域下的大數(shù)據(jù)分析平臺建設思路[J].教育現(xiàn)代化,2018,5(41):314-315.
[3]李振,周東岱,劉娜,等.教育大數(shù)據(jù)的平臺構建與關鍵實現(xiàn)技術[J].現(xiàn)代教育技術,2018,28(1):100-106.
[4]李書欽.面向智慧決策的高校大數(shù)據(jù)平臺的設計與實現(xiàn)[C]//中國計算機用戶協(xié)會網(wǎng)絡應用分會2018年第二十二屆網(wǎng)絡新技術與應用年會論文集,2018:4.
[5]楊競堯.面向教育的大數(shù)據(jù)平臺設計[J].中國戰(zhàn)略新興產(chǎn)業(yè),2017(44):19-20.
[6]唐燕,劉仁權,王蘋.基于Hadoop的高校大數(shù)據(jù)平臺的設計與實現(xiàn)[J].信息技術,2017(12):105-109.
[7]龍虎,李娜.大數(shù)據(jù)分析處理與平臺架構技術研究[J].電腦編程技巧與維護,2019(3):88-90.