国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數據的教育決策研究

2019-04-25 00:25單瑩楊圣洪朱承學
中國教育信息化·高教職教 2019年3期
關鍵詞:支持系統大數據

單瑩 楊圣洪 朱承學

摘? ?要:文章從教育大數據的視角,探索教育決策系統的建設架構和思路,并提出通過加強教育大數據標準化建設、提高教育決策主體的數據素養(yǎng)、建立教育大數據共享融合機制、培養(yǎng)教育大數據復合型人才、健全教育大數據安全保障體系等途徑建立基于大數據的教育決策優(yōu)化機制。

關鍵詞:大數據;教育決策;支持系統

中圖分類號:G40-058 文獻標志碼:A 文章編號:1673-8454(2019)05-0048-04

毋庸置疑,在所有教育管理活動中,教育決策是核心和關鍵所在。它不僅影響教育管理工作的效率和成效,更關乎小到學生、教師的個體發(fā)展,大到地區(qū)乃至國家教育事業(yè)的興衰。在現今這個“自媒體”時代,教育由于關系每家每戶、各色群體,也因此成為全社會關注的焦點和人人都可以談論的熱點——高考改革的一舉一動、基礎教育的備受詬病、地區(qū)差距及城鄉(xiāng)差別帶來的教育不均衡、農村教育與教師隊伍的發(fā)展困境、學生的學習評價和教師的職業(yè)倦怠、學校的育人環(huán)境與校長的專業(yè)化……有關教育的任何一個決定、一條制度、一項法規(guī),都有可能牽動無數人的目光,教育決策的環(huán)境變得前所未有的復雜,教育決策科學性、有效性的需求也日漸突出和迫切。

隨著教育信息化的全面快速推進,海量的教育大數據為教育決策提供了充分的數據基礎,而數據挖掘、商業(yè)智能、云計算、計算機模擬等信息技術的迅猛發(fā)展,又為基于教育大數據之上的智慧教育決策提供了有效手段。2014年3月,教育部印發(fā)的《2014年教育信息化工作要點》中提出:加強對動態(tài)監(jiān)測、決策應用、教育預測等相關數據資源的整合與集成,為教育決策提供及時和準確的數據支持,推動教育基礎數據在全國的共享。可見,告別“感覺”和“經驗”,以數據驅動決策的能力已成為教育決策的方向和實踐路徑。

一、大數據和教育大數據

大數據這一詞匯從2009年開始流行,2012年成為時代發(fā)展的一個重要趨勢,2013年被媒體稱為中國大數據元年。

教育大數據是大數據的一個子集,特指教育領域的大數據,是整個教育活動過程中所產生的以及根據教育需要采集到的、一切用于教育發(fā)展并可創(chuàng)造巨大潛在價值的數據集合。

教育大數據主要分成兩類:宏觀數據,如國家、各省市的教育年鑒;過程數據,如各學生、各科目、各過程環(huán)節(jié)的成績,據教育部2017年統計數據(http://www.chyxx.com/industry/201808/664173.html)顯示,當年全國中小學在校生總數為18560.7萬人,其中中職在校學生1592.5萬、高中在校學生 2374.5萬、初中在校學生 4442.1萬、小學在校學生 10093.7萬、特殊教育在校學生 57.9萬,如果按每個學生一年10門學科記錄期中、期末、小考分數,按5門過程成績記錄,就有92.80億條數據,按平均每條數據5K計算,可能需4640175×5K=4.425216萬TB=43PB數據,如果再加上本科學生數據,將達到100PB的驚人數據量,多年累積下來,這些數據的存貯與利用就是大數據研究的范圍。

二、基于大數據的教育決策支持系統建設

早期數據處理采用“數據挖掘技術”,尋找數據之間的相關性,如“啤酒與嬰兒尿片”,當數據達到海量,傳統的數據挖掘技術需與云計算、超級計算結合起來,不僅要在海量數據中找出規(guī)律,而且將這種規(guī)律用某種方式表現出來,并應用在新數據新問題中,這便是機器學習等人工智能技術,尤其基于深度神經網絡的機器學習即“深度學習”技術,在AlphaGo與AlphaGo Zero戰(zhàn)勝人類頂尖圍棋選手后,這種技術已經成為業(yè)界追捧的技術,因此教育大數據的處理應采用機器學習等人工智能技術。

1.機器學習處理教育大數據的基本框架

教育大數據處理的機器學習建模過程,一般分為七大步驟,分別是數據采集、數據清洗、預處理、特征選擇、機器學習模型選擇、模型效果評估和決策。如圖1所示。

第一步,數據采集。把紙質的資料掃描為PDF形式,再把PDF形式轉換為CSV文件,存儲到云服務器上。

第二步,數據清洗。包括數據去重、字符串為空的統一標注等。

第三步,數據預處理。包括Y變量標注、訓練樣本和測試樣本的篩選、正負樣本比例的調整以及啞變量處理等。

第四歩,特征選擇。包括Filter和Wrapper兩種特征選擇,特征降維、特征提升。

第五歩,模型選擇。包括模型選擇、參數設置以及評估指標選擇。

第六步,模型效果評估。包括模型的ROC曲線、AUC面積、模型正則化、模型假設、超參數搜索等。

第七步,決策。把模型的輸出概率轉化為一個分數,對所有樣本的分數進行區(qū)間統計,最后,選擇一個分數閾值,把分數閾值以內的樣本判斷為壞樣本,把分數閾值以外的樣本判斷為好樣本。

2.教育機器學習的實例:教師教學與學生學習成效評價的機器學習

在教育大數據時代,將各學校、各教育的監(jiān)控匯聚起來,將教學過程中教師板書、走動范圍、教鞭、教具使用、形體動作、聲音、語速、表情等言談舉止通過視頻形體分析提取出來,將學生課堂表現——小動作、睡覺、全神貫注、互動情況等分析提取出來,還通過問卷調查等獲取學習效果,通過機器學習,找出影響學習質量的因子。為此采用機器學習方法建立成效評價模型,確定關鍵特征,選擇機器學習樹模型,決策會反饋到數據采集階段。此研究中最后采用隨機森林和XGBOOST模型?;跈C器學習方法的教師教學與學生學習成效評價模型如圖2所示。

3.教育機器學習的實例:教育投入與教學質量成效評價的機器學習的研究

在大數據時代,機器學習應用在智能教學和智能學習中,收集湖南省教育年鑒的數據,將教育在校舍基本保障、教師績效、教師培訓、信息化教學、學生競賽等方面的投入,與九年義務制教育的比例、初中升高中比率、初中升高職比率、高中升本科比率、高中升高職比率、當地GDP之間的相關性等進行分析,通過機器學習建模,找出影響教育質量的因子,哪些是正相關,哪些是互相關,找出投入與產出之間的關系,即模型,以確定最佳的教育投入模式,如投“磚頭”即校舍及設備的硬件投資、投“人頭”即教師待遇之間的比例是多大最合適等。

從教學管理的角度,收集每位學生、每科的各種過程數據,如入學考試、期中、期末、各種小考,小升初比率、初中升高中比率、初中升高職比率、高中升本科比率、高中升高職比率,各種競賽獲獎的情況,還有關于教學效果的各種問卷調查等,通過機器學習找出教學行為與學生學習效果正相關的因素。

4.基于以上分析建立驗證系統

(1)平臺功能及模塊

①Web服務器

Web服務器,即平臺前端,以Web瀏覽器的形式展現給用戶??梢怨芾砦募ㄉ蟼?、瀏覽、下載和刪除文件。可以根據機器學習的建模過程,選擇相應的腳本,創(chuàng)建一個任務壓縮包,并儲存起來??梢圆榭礄C器學習建模結果,瀏覽評估指標ROC曲線和AUC面積;可以依據自定義的評分策略做決策。

兩個數據表:一個是mysql-文件信息數據表,記錄用戶的文件信息;另一個是mysql-任務信息數據表,記錄用戶的任務壓縮包信息。

②文件系統

文件系統可以是一個服務器,也可以是一個Hadoop集群,存儲用戶上傳的或者執(zhí)行任務返回的結果文件。

③Zookeeper調度系統

基于Zookeeper分布式開源系統搭建的調度系統,用于管理用戶創(chuàng)建的機器學習任務,并對相應的任務進行調度。

④任務執(zhí)行集群

是一個服務器,也可以是基于Spark搭建的集群,用于執(zhí)行用戶創(chuàng)建的機器學習任務。

(2)基本架構,如圖3所示

(3)基本架構中的邏輯關系

①用戶上傳文件,增加文件信息到mysql-文件信息數據表;用戶選擇機器學習處理腳本,創(chuàng)建機器學習任務壓縮包,存儲任務壓縮包,增加壓縮包信息到mysql-任務信息數據表。

②Zookeeper調度系統掃描mysql-任務信息數據表,發(fā)現有未執(zhí)行的任務;根據任務相關信息從文件系統下載文件數據和從Web服務器下載任務壓縮包。

③Zookeeeper調度系統根據mysql-任務信息數據表的相關信息,安排相應的機器學習任務包到集群執(zhí)行。

④集群執(zhí)行任務完畢,給文件系統返回結果文件,給調度系統返回任務執(zhí)行結果信息,調度系統更新mysql-任務信息數據表的任務相關信息。

⑤在Web界面,根據mysql-任務信息數據表和mysql-文件信息數據表查看某任務的結果,包括評估指標ROC曲線和AUC面積等。

(4)系統運行界面(見圖4a、b、c、d、e)

網址:http://apple41.com:2018/。

三、建立基于大數據的教育決策優(yōu)化機制

大數據應用于教育決策包含大數據獲取、挖掘、分析、應用等階段,不同階段面臨著不同的挑戰(zhàn),需要不斷地完善各階段,形成整體機制,實現立體化的決策支撐。

1.加強教育大數據標準建設

數據的獲取是大數據應用的源頭,基于大數據的教育決策需要多來源、多類型的數據集合。數據的標準化、規(guī)范化是保證各教育部門數據資源共享和業(yè)務系統整合的關鍵,數據標準的缺失可能會導致數據獲取不足、數據處理錯誤、無效信息冗余、有效信息遺漏,從而將教育決策的方向引入歧途,降低教育決策的可用性和科學性,增加教育決策的風險性。因此,制定統一的數據格式標準、數據采集標準和質量標準,構建清晰有效合理的教育數據管理戰(zhàn)略、治理機制和處理流程,保障教育數據的規(guī)范化采集與匯聚共享,保證被采集數據的有效性、一致性和準確性,是開展基于大數據的教育決策工作的基礎和前提。

2.提高教育決策主體的數據素養(yǎng)

大數據發(fā)展對教育決策者的數據素質提出了更高要求。一是要培養(yǎng)數據意識:決策者要“心中有數”,樹立起數據驅動決策的管理意識,建立大數據思維,保持對數據的敏感性,認同教育數據的價值和意義,擺脫對舊有決策習慣的路徑依賴,構建基于大數據決策的教育行政組織文化和制度。二是要提高數據能力:能夠對管理決策所需要的數據進行大致定位;能夠理解可視化數據模型等不同數據的表達形式;能夠把握數據分析結果對教育決策的具體效用;能夠通過數據處理呈現的結果對決策做出準確判斷;能夠反思數據對決策實施的效果,形成拓展性思維。三是要樹立數據倫理觀:教育管理者應重視數據安全與個人隱私的保護,提高數據使用的倫理道德。

3.建立教育大數據共享融合機制

大數據視角下的教育決策對數據來源提出了廣泛性和全面性的要求,因此需要消滅現存的條塊分割的數據孤島,對各級各類教育部門的現有數據信息進行整體優(yōu)化與有效清理,實現數據的規(guī)范化、模塊化,打通教育部門縱向和橫向業(yè)務數據的融合渠道,為建立數據共享機制提供平臺支撐。

4.培養(yǎng)教育大數據復合型人才

教育大數據涵蓋內容廣泛,不同的教育決策需要不同的教育數據進行支撐,如何根據決策需求從海量數據源中判斷數據的選擇,如何將來源于各異構數據源的數據按照預先設計好的規(guī)則進行轉化清洗,如何借助大數據進行數據建?;蜈厔蓊A測分析,都迫切需要同時具有大數據領域和教育決策領域知識的復合型人才。因此,當務之急是加快教育大數據復合型人才的引進和培養(yǎng),既要充分發(fā)揮高校在培養(yǎng)大數據專業(yè)人才方面的先天優(yōu)勢,合理調整教育資源分配,完善專業(yè)人才培養(yǎng)體系;同時,又要加強與互聯網公司、數據技術企業(yè)資源合作,通過聯合創(chuàng)建大數據技術研發(fā)中心及科研團隊,快速培養(yǎng)滿足需求的教育大數據復合型人才。

5.建立健全教育大數據安全保障體系

從國家層面看,教育數據的安全性可以比肩金融數據。從個人來看,龐大規(guī)模的受教育者與教育者群體,尤其是大量未成年學生,隱私保護至關重要。因此,應當出臺教育大數據治理的法規(guī)條令,設立完善的教育大數據使用及監(jiān)管機制,明確政府、學校、企業(yè)和個人在數據收集、處理、共享過程中的責任和義務,明確教育數據的開放程度、開放范圍、開放對象,規(guī)范公開數據與私有數據的邊界。同時,要建立教育大數據安全保障技術體系,通過開發(fā)新的數據安全監(jiān)測工具,升級數據安全防護技術來保證數據不被竊取。在來源清晰、責權明確、應用有序的前提下,通過數據安全法規(guī)體系和技術保障體系的雙重作用,共同維護教育大數據的信息安全,有效開展教育大數據研究與應用。

參考文獻:

[1]彭紅光,林君芬.邁向云時代的教育變革[M]北京:科學出版社,2012.8.

[2]單瑩.基于教育信息化的數字化終身學習體系的構建[J].成人教育,2014(3).

[3]單瑩.從幕課、微課看碎片化和娛樂化學習[J].中國教育信息化,2014(11).

[4]楊現民,王榴卉,唐斯斯.教育大數據的應用模式與政策建議[J].電化教育研究,2015(9).

(編輯:王天鵬)

猜你喜歡
支持系統大數據
心理健康支持系統對2~3歲聽障兒童干預后的影響
“長征”五號地面發(fā)射支持系統短期快速恢復實踐
大數據環(huán)境下基于移動客戶端的傳統媒體轉型思路
復雜產品全生命周期服務支持系統需求分析
上海:精心構建醫(yī)改社會支持系統
論高職院校貧困生社會支持系統的構建
人工肝支持系統臨床應用的研究進展
石门县| 容城县| 博客| 盐城市| 天峻县| 特克斯县| 彝良县| 兴和县| 景泰县| 玉林市| 尼勒克县| 崇礼县| 怀安县| 灵丘县| 达拉特旗| 高淳县| 南京市| 南昌市| 尚志市| 太仓市| 广德县| 霞浦县| 扶余县| 外汇| 肇庆市| 南丰县| 朝阳县| 彭州市| 扶余县| 岗巴县| 临沭县| 尉犁县| 慈溪市| 旬阳县| 宜阳县| 连平县| 静宁县| 鞍山市| 利辛县| 朝阳县| 通州区|