鄧逢光 張子石
摘要:大數(shù)據(jù)是當(dāng)今最熱門的概念和技術(shù)之一,給我們的工作、生活、學(xué)習(xí)以及思維方式都帶來(lái)了革命性的影響。為改變當(dāng)前學(xué)生管理依靠說(shuō)教和事后分析找對(duì)策的傳統(tǒng)方式向更有針對(duì)性、個(gè)性化和預(yù)測(cè)性的科學(xué)管理方式轉(zhuǎn)變,該文通過(guò)學(xué)生教育管理和信息技術(shù)深度融合的途徑,分析了學(xué)生校園行為產(chǎn)生的大數(shù)據(jù)價(jià)值,深入闡述了學(xué)生校園行為大數(shù)據(jù)采集方法、分析預(yù)測(cè)模型和可視化模型等關(guān)鍵技術(shù),采用主流的Hadoop開(kāi)源平臺(tái)架構(gòu),建構(gòu)了學(xué)生校園行為大數(shù)據(jù)分析預(yù)警管理平臺(tái)系統(tǒng),對(duì)學(xué)生行為進(jìn)行預(yù)警安全管控,實(shí)現(xiàn)了學(xué)生管理手段的信息化,提升學(xué)生教育管理科學(xué)化水平,促進(jìn)智慧數(shù)字化校園建設(shè)。
關(guān)鍵詞:教育大數(shù)據(jù);學(xué)生行為分析;預(yù)測(cè)模型;數(shù)據(jù)挖掘
一、引言
聯(lián)合國(guó)在2012年發(fā)布了《大數(shù)據(jù)白皮書(shū)》,對(duì)大數(shù)據(jù)時(shí)代的到來(lái)并將深刻影響經(jīng)濟(jì)社會(huì)發(fā)展做了闡述。國(guó)務(wù)院在2015年8月也出臺(tái)了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》,大數(shù)據(jù)已經(jīng)成為我們國(guó)家基礎(chǔ)性和前瞻性的技術(shù),是國(guó)家實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略的內(nèi)在需要和必然選擇。我們應(yīng)該結(jié)合國(guó)家大數(shù)據(jù)政策與教育信息化大戰(zhàn)略,積極推進(jìn)教育大數(shù)據(jù)在學(xué)校中的應(yīng)用,探索發(fā)揮大數(shù)據(jù)技術(shù)對(duì)變革教育方式、促進(jìn)教育公平、提升教育質(zhì)量的支撐作用,這是當(dāng)前提升學(xué)校教育管理信息化水平的關(guān)鍵。根據(jù)最新的青少年自殺報(bào)告信息顯示:中國(guó)兒童自殺率高居世界的第一位。我國(guó)每一年都有大約三十多萬(wàn)人自殺而死亡,將近二百多萬(wàn)人自殺未遂,其中百分之四十是未成年人。我國(guó)中小學(xué)生有情緒、學(xué)習(xí)和行為障礙的接近三千多萬(wàn)人。相關(guān)的研究也發(fā)現(xiàn)我國(guó)高等學(xué)校有心理問(wèn)題的大學(xué)生大約占20%,其中15%的學(xué)生屬于一般性的心理問(wèn)題,需要學(xué)校輔導(dǎo)員和親朋好友進(jìn)行心理疏導(dǎo);3.5%的學(xué)生屬于有心理障礙,會(huì)經(jīng)常出現(xiàn)消瘦、失眠和煩躁等癥狀;1.5%的學(xué)生屬于有精神病,會(huì)失去自我控制能力,分不清現(xiàn)實(shí)與幻覺(jué)。這些都是不容忽視的數(shù)據(jù),表明當(dāng)前我國(guó)青少年心理問(wèn)題的嚴(yán)重性。但遺憾的是我們學(xué)校對(duì)學(xué)生的行為和心理健康干預(yù)是缺位不作為的。目前,我國(guó)學(xué)校的學(xué)生校園行為管理手段大多數(shù)是宣傳說(shuō)教和定期排查,其管理方法只停留在事后定性分析上,這種管理手段非常被動(dòng)和落后,已經(jīng)不適應(yīng)學(xué)校現(xiàn)代化教育管理的需要,更不符合大數(shù)據(jù)時(shí)代的發(fā)展方向。
二、教育大數(shù)據(jù)的研究與應(yīng)用現(xiàn)狀
大數(shù)據(jù)的產(chǎn)生給未來(lái)信息技術(shù)帶來(lái)新的機(jī)遇與挑戰(zhàn)。大數(shù)據(jù)技術(shù)對(duì)科學(xué)數(shù)據(jù)的實(shí)時(shí)性、完整性和有效性都提出非常高的要求,必須根據(jù)大數(shù)據(jù)的特點(diǎn)對(duì)當(dāng)前數(shù)據(jù)處理技術(shù)實(shí)施變革,從而形成更有益于大數(shù)據(jù)采集、存貯、清洗、分析、共享的新興技術(shù)。世界上,大數(shù)據(jù)于2012年起就成為學(xué)術(shù)圈的熱門話題,在教育領(lǐng)域也被廣為討論。美國(guó)布魯金斯研究院報(bào)告中指出,教師通過(guò)大數(shù)據(jù)就可了解學(xué)生平時(shí)的表現(xiàn)和學(xué)習(xí)方式,而不必依賴傳統(tǒng)的測(cè)驗(yàn)方法,就能夠清楚知道學(xué)生掌握的知識(shí)和對(duì)學(xué)生最有效的教育方式是什么,并可以用大數(shù)據(jù)的深度綜合分析來(lái)研究學(xué)生的學(xué)習(xí)狀況。2012年10月美國(guó)教育部發(fā)布了《通過(guò)教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》的報(bào)告,對(duì)美國(guó)大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用上所面對(duì)的機(jī)遇和挑戰(zhàn)進(jìn)行非常詳細(xì)的論述,并且以大數(shù)據(jù)技術(shù)在自適應(yīng)學(xué)習(xí)系統(tǒng)中的應(yīng)用進(jìn)行了案例分析說(shuō)明。
自2009年開(kāi)始大數(shù)據(jù)技術(shù)就成為學(xué)術(shù)界常用的名詞術(shù)語(yǔ),但是國(guó)內(nèi)大數(shù)據(jù)在教育領(lǐng)域中的應(yīng)用是近幾年才開(kāi)始出現(xiàn)的。自2013年起,我國(guó)掀起了教育大數(shù)據(jù)應(yīng)用性研究的熱潮。在教育部辦公廳的《2014年教育信息化工作要點(diǎn)》中強(qiáng)調(diào),要對(duì)動(dòng)態(tài)監(jiān)測(cè)、決策應(yīng)用、教育預(yù)測(cè)等相關(guān)數(shù)據(jù)資源進(jìn)行匯聚整合,為教育科學(xué)決策提供及時(shí)、準(zhǔn)確和有效的數(shù)據(jù)支撐,并能共享全國(guó)的教育基礎(chǔ)數(shù)據(jù)。大數(shù)據(jù)技術(shù)在教育管理中的應(yīng)用主要包括教育數(shù)據(jù)的采集、存儲(chǔ)、分析和智能挖掘等幾方面,能為教學(xué)過(guò)程提供實(shí)時(shí)的、全樣本的數(shù)據(jù)信息,為教學(xué)活動(dòng)的實(shí)施方案提供可操作的客觀分析,用智慧的手段幫助教師和學(xué)校管理者形成科學(xué)和快速的決策,真正實(shí)現(xiàn)智慧教育。教育大數(shù)據(jù)還可以依托學(xué)習(xí)分析和數(shù)據(jù)挖掘兩項(xiàng)關(guān)鍵技術(shù),通過(guò)技術(shù)思維反向驅(qū)動(dòng)大數(shù)據(jù)分化成為教育教學(xué)應(yīng)用的獨(dú)立分支,提供研究和解決教育信息技術(shù)領(lǐng)域問(wèn)題的新方法,促進(jìn)教育管理、教學(xué)模式、個(gè)性化教育、教育評(píng)價(jià)等方面創(chuàng)新。
由此可見(jiàn),教育大數(shù)據(jù)的研究與應(yīng)用越來(lái)越受到教育管理者的重視,并展開(kāi)與教育各領(lǐng)域工作的深度融合,為更科學(xué)更有效的教育管理提供支撐。但目前關(guān)于教育大數(shù)據(jù)的研究與應(yīng)用還處于開(kāi)始階段,研究主要停留在學(xué)習(xí)分析、學(xué)習(xí)策略、個(gè)性化教育、教育數(shù)據(jù)挖掘、管理方式的改善等方面,對(duì)學(xué)生校園行為等一些具體的應(yīng)用分析研究不夠,缺乏科學(xué)性和規(guī)范化的頂層設(shè)計(jì),面臨實(shí)際應(yīng)用、安全與隱私、運(yùn)營(yíng)等許多層次的挑戰(zhàn)。因此,特別需要對(duì)教育大數(shù)據(jù)進(jìn)行整體規(guī)劃和具體應(yīng)用綜合研究。
三、學(xué)生校園行為大數(shù)據(jù)的產(chǎn)生與價(jià)值
隨著信息技術(shù)的不斷發(fā)展,數(shù)字化校園的數(shù)據(jù)產(chǎn)生主要通過(guò)教學(xué)活動(dòng)和教育管理過(guò)程兩個(gè)渠道實(shí)現(xiàn),并生成了巨量的結(jié)構(gòu)化或非結(jié)構(gòu)化的教育數(shù)據(jù),如與學(xué)校教學(xué)和管理相關(guān)的網(wǎng)絡(luò)行為、網(wǎng)上查詢、微博微信、跟帖論壇等。隨著智慧學(xué)校的不斷發(fā)展,校園數(shù)據(jù)迅速膨脹,其存量越來(lái)越大,成為名副其實(shí)的“大數(shù)據(jù)”。教育大數(shù)據(jù)是在整個(gè)教育活動(dòng)過(guò)程中產(chǎn)生的、根據(jù)學(xué)校教育教學(xué)和管理需要而采集的、有巨大潛在應(yīng)用價(jià)值的數(shù)據(jù)集合。
校園行為數(shù)據(jù)種類繁多,非常復(fù)雜,難以精確整合,不易建立起各類數(shù)據(jù)間的相關(guān)聯(lián)性,同時(shí)對(duì)這類數(shù)據(jù)的處理經(jīng)驗(yàn)也不足。對(duì)于半結(jié)構(gòu)和非結(jié)構(gòu)數(shù)據(jù)的處理,傳統(tǒng)的關(guān)聯(lián)分析、聚類算法等數(shù)據(jù)挖掘技術(shù)已滿足不了需求,傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)面臨著前所未有的沖擊和挑戰(zhàn)。根據(jù)學(xué)校的數(shù)據(jù)體系,我們可以通過(guò)校園“一卡通”數(shù)據(jù)、校園網(wǎng)絡(luò)監(jiān)控?cái)?shù)據(jù)、基礎(chǔ)教務(wù)數(shù)據(jù)等數(shù)據(jù)源收集大數(shù)據(jù),并通過(guò)大數(shù)據(jù)處理與分析技術(shù)來(lái)實(shí)施學(xué)生校園行為大數(shù)據(jù)分析,挖掘出教育數(shù)據(jù)在管理、教學(xué)、學(xué)習(xí)中的實(shí)際價(jià)值(如圖1所示)。
我們可以通過(guò)校園“一卡通”各個(gè)終端機(jī)收集到海量的數(shù)據(jù),并且針對(duì)具體的教學(xué)應(yīng)用場(chǎng)景進(jìn)行分析建模。通過(guò)大數(shù)據(jù)技術(shù)分析“一卡通”系統(tǒng)中的上課考勤、實(shí)驗(yàn)室出入和宿舍門禁等刷卡記錄情況,建立學(xué)生行為表現(xiàn)預(yù)警系統(tǒng),記錄所有在校學(xué)生的遲到、早退和曠課次數(shù)、體育訓(xùn)練、參加公益活動(dòng)、課堂測(cè)試成績(jī)等數(shù)字化信息,達(dá)到設(shè)定值系統(tǒng)就會(huì)自動(dòng)預(yù)警,管理者和輔導(dǎo)員可以根據(jù)預(yù)警情況及時(shí)做出響應(yīng)和判斷。通過(guò)分析“一卡通”系統(tǒng)中圖書(shū)館借閱情況、學(xué)生用餐記錄、超市消費(fèi)情況、學(xué)生校醫(yī)就診情況、宿舍上網(wǎng)情況等,就可以幫助教師和家長(zhǎng)了解學(xué)生在學(xué)校期間的所有行為情況,分析預(yù)測(cè)學(xué)生的各種行為趨勢(shì),并且可根據(jù)學(xué)生行為的綜合表現(xiàn),公正、全面地對(duì)學(xué)生德智體美勞等進(jìn)行評(píng)價(jià),從而實(shí)現(xiàn)家校之間的良性互動(dòng)和溝通,真正管理好在校的學(xué)生。通過(guò)分析“一卡通”系統(tǒng)中學(xué)生的學(xué)習(xí)專業(yè)情況、公共選課情況,分析學(xué)生的興趣和愛(ài)好,建立相互關(guān)聯(lián)的自動(dòng)推薦分析系統(tǒng),幫助學(xué)生更好地進(jìn)行職業(yè)生涯規(guī)劃;通過(guò)分析優(yōu)秀畢業(yè)生的成長(zhǎng)經(jīng)歷,讓學(xué)生非常容易地學(xué)習(xí)到成功者的經(jīng)驗(yàn),同時(shí)也幫助學(xué)生真正了解自己的特長(zhǎng)和興趣,進(jìn)一步提高學(xué)生將來(lái)的社會(huì)就業(yè)率。
四、學(xué)生行為大數(shù)據(jù)分析關(guān)鍵技術(shù)
傳統(tǒng)的學(xué)生行為管理,往往是經(jīng)驗(yàn)的、路徑依賴式的管理,如今的大數(shù)據(jù)應(yīng)用,讓我們能主動(dòng)掌握學(xué)生校園行為發(fā)生的特點(diǎn)和規(guī)律,并可據(jù)此做出研判和預(yù)測(cè),實(shí)現(xiàn)學(xué)?!扒爸檬健钡墓芾砟J絼?chuàng)新。因此,挖掘教育數(shù)據(jù)在教學(xué)管理、教學(xué)、學(xué)習(xí)中的實(shí)際價(jià)值,開(kāi)發(fā)基于大數(shù)據(jù)的學(xué)生校園行為分析預(yù)警管理平臺(tái),能夠根據(jù)學(xué)校教學(xué)質(zhì)量、學(xué)生日常行為、學(xué)生安全管控、學(xué)生心理輔導(dǎo)等來(lái)進(jìn)行教育大數(shù)據(jù)處理與分析,輔助學(xué)校管理的宏觀決策,輔助教學(xué)生產(chǎn)安全管控,包括:金融信貸風(fēng)險(xiǎn)、網(wǎng)絡(luò)行為、消費(fèi)行為、曠課行為、掛科、學(xué)分不足等一系列的預(yù)警,深度挖掘?qū)W生心理問(wèn)題,對(duì)有問(wèn)題的學(xué)生進(jìn)行預(yù)警和重點(diǎn)關(guān)注。
(一)學(xué)生校園行為分析數(shù)據(jù)采集方法
移動(dòng)互連、物聯(lián)網(wǎng)、云計(jì)算、社交網(wǎng)絡(luò)、Web的快速發(fā)展讓學(xué)生校園行為數(shù)據(jù)前所未有的增長(zhǎng),海量數(shù)據(jù)中必然蘊(yùn)含著巨大的價(jià)值。當(dāng)前學(xué)生校園行為分析方法主要包括關(guān)聯(lián)分析、特征分析、分類預(yù)測(cè)、異常分析和TopN分析等,這些都需要采集大量的數(shù)據(jù)。學(xué)生校園行為分析數(shù)據(jù)包括結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)可以通過(guò)“一卡通”、網(wǎng)絡(luò)監(jiān)控、教務(wù)、考勤等校園部署的信息系統(tǒng)進(jìn)行數(shù)據(jù)采集和轉(zhuǎn)換。非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)大部分來(lái)源于互聯(lián)網(wǎng)、社區(qū)論壇等,需要利用數(shù)據(jù)采集平臺(tái),運(yùn)用云化ETL工具、流數(shù)據(jù)處理、網(wǎng)絡(luò)爬蟲(chóng)等工具進(jìn)行采集。
(二)學(xué)生校園行為分析預(yù)測(cè)模型
學(xué)生校園行為分析以統(tǒng)計(jì)分析、聚類、預(yù)測(cè)、關(guān)系挖掘、文本挖掘等教育數(shù)據(jù)挖掘方法為基礎(chǔ),設(shè)計(jì)與建立學(xué)生離群行為分析、學(xué)生情感分析等非常規(guī)挖掘模型,從學(xué)生心理健康測(cè)試、精神狀態(tài)、情感態(tài)度、人際關(guān)系、行為軌跡、家庭背景、上課考試情況、課外活動(dòng)情況、各種獎(jiǎng)懲統(tǒng)計(jì)、微博微信活躍度、宗教信仰等方面進(jìn)行數(shù)據(jù)關(guān)聯(lián)性分析,設(shè)置各分析系統(tǒng)模塊的分級(jí)指標(biāo)和權(quán)重比例,深入剖析每位學(xué)生的個(gè)性特征、行為規(guī)律、生活習(xí)慣及其智力水平等,建立以影像、圖形、文本、語(yǔ)音等非結(jié)構(gòu)化數(shù)據(jù)為對(duì)象的學(xué)生校園行為大數(shù)據(jù)分析安全預(yù)警管理模式,做到未雨綢繆,防微杜漸,真正實(shí)現(xiàn)“平安校園”的管理目標(biāo)。
(三)學(xué)生行為大數(shù)據(jù)可視化模型
大數(shù)據(jù)背后蘊(yùn)藏著非常大的應(yīng)用價(jià)值,但是如果沒(méi)有人能夠看得懂這些數(shù)據(jù)背后含義的話,再多的大數(shù)據(jù)分析方式方法都沒(méi)有用。通過(guò)專業(yè)的可視化工具SAS、SPSS建立學(xué)生校園行為大數(shù)據(jù)可視化模型,實(shí)現(xiàn)對(duì)學(xué)生行為大型數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行可視化,使管理者不再是簡(jiǎn)單地通過(guò)數(shù)據(jù)關(guān)系表來(lái)觀察和分析用戶數(shù)據(jù)信息,從而以更直觀、更方便的方式觀看到所有用戶的數(shù)據(jù)及其結(jié)構(gòu)關(guān)系。我們通過(guò)對(duì)學(xué)生行為的數(shù)據(jù)進(jìn)行離群點(diǎn)分析,初步形成具有相似行為特征值的聚類分析,最后梳理生成不同主題內(nèi)容的大數(shù)據(jù)分析模塊。學(xué)生在校期間的課堂出勤情況、考試分?jǐn)?shù)、及格率、優(yōu)秀率等可自動(dòng)生成不同的動(dòng)態(tài)曲線圖,讓老師非常直觀地掌握學(xué)生的學(xué)習(xí)情況和發(fā)展趨勢(shì);通過(guò)對(duì)網(wǎng)絡(luò)行為監(jiān)控,可以對(duì)使用網(wǎng)絡(luò)的學(xué)生進(jìn)行熱點(diǎn)話題分析,針對(duì)重點(diǎn)標(biāo)注的政治性詞語(yǔ)出現(xiàn)的頻率,可以分析學(xué)生對(duì)時(shí)事政治敏感問(wèn)題的關(guān)注情況,教師和學(xué)生管理者可以根據(jù)這些數(shù)據(jù)進(jìn)行輿情分析;對(duì)學(xué)生安全數(shù)據(jù)的進(jìn)行系統(tǒng)分析,可以將學(xué)生的情緒和態(tài)度進(jìn)行直觀可視化,并且針對(duì)重點(diǎn)標(biāo)注“焦慮”“失戀”“憤恨”等負(fù)面情緒主題詞,實(shí)時(shí)掌握學(xué)生的生理和心理健康問(wèn)題。還可以根據(jù)學(xué)生情感問(wèn)題情況、人際交往記錄、行動(dòng)軌跡信息、常用聯(lián)系人等數(shù)據(jù),跟蹤觀察在校學(xué)生的行動(dòng)行為軌跡,預(yù)先劃定學(xué)習(xí)區(qū)域、運(yùn)動(dòng)區(qū)域和生活區(qū)域等人身平安區(qū)域,一旦系統(tǒng)出現(xiàn)監(jiān)測(cè)到數(shù)據(jù)出現(xiàn)不穩(wěn)定或者超常規(guī)的跡象預(yù)警時(shí),就要密切關(guān)注和跟蹤學(xué)生的行為,防患于未然。
五、學(xué)生校園行為大數(shù)據(jù)分析預(yù)警管理平臺(tái)的建構(gòu)
學(xué)生校園行為大數(shù)據(jù)分析預(yù)警管理平臺(tái)采用當(dāng)前主流的大數(shù)據(jù)框架Hadoop對(duì)數(shù)字化校園環(huán)境產(chǎn)生的大規(guī)模學(xué)生行為數(shù)據(jù)進(jìn)行采集、加工和分析,建構(gòu)起大數(shù)據(jù)與學(xué)生管理系統(tǒng)中的相關(guān)性聯(lián)系,形成學(xué)生校園行為數(shù)據(jù)分析系統(tǒng)總體架構(gòu);設(shè)計(jì)學(xué)生校園行為分析系統(tǒng)的數(shù)據(jù)采集框架、功能架構(gòu)和關(guān)鍵算法,對(duì)學(xué)生校園行為異構(gòu)數(shù)據(jù)進(jìn)行分布式存儲(chǔ)和處理,實(shí)現(xiàn)學(xué)生行為數(shù)據(jù)的全面挖掘和深入分析,對(duì)學(xué)生的行為動(dòng)態(tài)提前掌控,并對(duì)重點(diǎn)學(xué)生的行為發(fā)展做出預(yù)判。
(一)平臺(tái)總體框架設(shè)計(jì)
基于大數(shù)據(jù)的學(xué)生校園行為分析預(yù)警平臺(tái)采用“1+1+4+N”的總體功能架構(gòu)設(shè)計(jì):1個(gè)校園基礎(chǔ)數(shù)據(jù)源;1個(gè)大數(shù)據(jù)基礎(chǔ)運(yùn)行平臺(tái);4大平臺(tái):數(shù)據(jù)采集存儲(chǔ)平臺(tái)、綜合分析挖掘平臺(tái)、智能預(yù)警平臺(tái)、安全運(yùn)行管控平臺(tái);N大應(yīng)用,包括:智能預(yù)警、數(shù)據(jù)挖掘、多維分析、關(guān)鍵指標(biāo)、專題分析等,如圖2所示。
系統(tǒng)將校園大數(shù)據(jù)學(xué)生行為分析中心的四大平臺(tái)體系分成“3+1”結(jié)構(gòu),即數(shù)據(jù)采集與存儲(chǔ)平臺(tái)、分析與挖掘平臺(tái)、監(jiān)測(cè)與決策平臺(tái),以及覆蓋整個(gè)系統(tǒng)的安全管控平臺(tái)。數(shù)據(jù)采集與存儲(chǔ)平臺(tái)的主要職責(zé)是對(duì)學(xué)校管理基礎(chǔ)信息和學(xué)生行為相關(guān)大數(shù)據(jù)進(jìn)行收集,并將采集到的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化存儲(chǔ)和清洗。這是學(xué)校的信息數(shù)據(jù),也是未來(lái)數(shù)字學(xué)校的最重要資產(chǎn)。分析與挖掘平臺(tái)的主要職責(zé)是對(duì)學(xué)校采集到的大數(shù)據(jù)進(jìn)行專門的分析建模,此后再深入對(duì)數(shù)據(jù)進(jìn)行挖掘和智能分析。智能預(yù)警平臺(tái)的主要職責(zé)是利用大數(shù)據(jù)技術(shù)分析的結(jié)論對(duì)學(xué)生的異常行為進(jìn)行智能預(yù)警,以及產(chǎn)生與之相對(duì)應(yīng)的安全監(jiān)督措施等。安全管控平臺(tái)的主要職責(zé)是負(fù)責(zé)整個(gè)系統(tǒng)數(shù)據(jù)監(jiān)控和數(shù)據(jù)管理,確保學(xué)校的數(shù)據(jù)資產(chǎn)的安全性和可控性。
(二)平臺(tái)技術(shù)架構(gòu)
基于大數(shù)據(jù)的學(xué)生校園行為分析預(yù)警平臺(tái)采用典型的大數(shù)據(jù)技術(shù)架構(gòu),分為三大層次,即:數(shù)據(jù)源層、數(shù)據(jù)處理層和應(yīng)用層(數(shù)據(jù)分析挖掘與智能預(yù)警層)。數(shù)據(jù)源層主要有結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)包括“一卡通”、網(wǎng)絡(luò)監(jiān)控、教務(wù)數(shù)據(jù)、考勤等系統(tǒng)自動(dòng)收集到的數(shù)據(jù);非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)主要來(lái)源于互聯(lián)網(wǎng)、文檔等。數(shù)據(jù)處理層包括數(shù)據(jù)采集平臺(tái)(云化ETL工具、流數(shù)據(jù)處理、網(wǎng)絡(luò)爬蟲(chóng)等)、數(shù)據(jù)存儲(chǔ)平臺(tái)(主數(shù)據(jù)倉(cāng)庫(kù))、數(shù)據(jù)運(yùn)算平臺(tái)(分布式數(shù)據(jù)庫(kù)、Hadoop平臺(tái)等)。數(shù)據(jù)分析挖掘與智能預(yù)警層包括基礎(chǔ)分析組件、多維分析組件、數(shù)據(jù)挖掘組件、實(shí)時(shí)分析組件、自助分析組件等,如圖3所示。
六、結(jié)束語(yǔ)
基于大數(shù)據(jù)的學(xué)生校園行為分析預(yù)警平臺(tái)系統(tǒng)是在當(dāng)前非常流行的Hadoop開(kāi)源平臺(tái)下進(jìn)行二次開(kāi)發(fā),首先底層數(shù)據(jù)采集模塊進(jìn)行設(shè)計(jì)開(kāi)發(fā)、文本化存儲(chǔ)模塊,實(shí)現(xiàn)各種異構(gòu)數(shù)據(jù)和非異構(gòu)數(shù)據(jù)的采集和文本化;然后用分析算法實(shí)現(xiàn)各個(gè)功能模塊,進(jìn)一步對(duì)各種數(shù)據(jù)進(jìn)行挖掘和分析,并采用主流的架構(gòu)完成相關(guān)模塊的開(kāi)發(fā),同時(shí)對(duì)分析結(jié)果進(jìn)行圖形化直觀展示。平臺(tái)系統(tǒng)能夠深度挖掘?qū)W生行為和心理問(wèn)題,幫助學(xué)校管理者進(jìn)行教學(xué)管理的宏觀決策,輔助教學(xué)生產(chǎn)安全管控,實(shí)現(xiàn)預(yù)警指標(biāo)模型、預(yù)警信息產(chǎn)生、預(yù)警信息推送等一系列的預(yù)警功能,真正實(shí)現(xiàn)智慧數(shù)字化校園。