唐元林
摘 要 簡(jiǎn)要介紹了大數(shù)據(jù)的概念,論述了大數(shù)據(jù)應(yīng)用于高校學(xué)生管理的緊迫性,同時(shí)介紹了大數(shù)據(jù)的安全管理和大數(shù)據(jù)分析方法在高校學(xué)生管理中的應(yīng)用,并分析了構(gòu)建各類學(xué)生管理模型的思路和方法。
關(guān)鍵詞 大數(shù)據(jù);高校;學(xué)生管理;應(yīng)用
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2019)235-0155-02
在如今信息化時(shí)代,大數(shù)據(jù)廣泛應(yīng)用于各個(gè)領(lǐng)域,給各行各業(yè)帶來(lái)了巨大的變化,同時(shí),數(shù)據(jù)量也呈指數(shù)級(jí)增長(zhǎng),高校在長(zhǎng)期的運(yùn)行過(guò)程中產(chǎn)生大量有價(jià)值的數(shù)據(jù),如何利用這海量的數(shù)據(jù)提升高校學(xué)生管理水平是各高校面臨的挑戰(zhàn)和機(jī)遇。
1 大數(shù)據(jù)技術(shù)概述
大數(shù)據(jù)是指那些數(shù)據(jù)量特別大,數(shù)據(jù)種類特別復(fù)雜的數(shù)據(jù)集,這種數(shù)據(jù)無(wú)法用傳統(tǒng)的數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)和管理。大數(shù)據(jù)的主要特點(diǎn)是數(shù)據(jù)量大、數(shù)據(jù)類別復(fù)雜、數(shù)據(jù)處理快和數(shù)據(jù)真實(shí)性高。數(shù)據(jù)的形式有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),如視頻、圖片、文本和網(wǎng)絡(luò)瀏覽記錄等。大數(shù)據(jù)技術(shù)主要包含5個(gè)方面:可視化分析、數(shù)據(jù)挖掘、預(yù)測(cè)性分析、語(yǔ)義引擎和數(shù)據(jù)質(zhì)量管理。通過(guò)數(shù)據(jù)挖掘找到影響某個(gè)結(jié)果的影響因素,并構(gòu)建相應(yīng)的數(shù)據(jù)模型,通過(guò)機(jī)器學(xué)習(xí)算法,采用已有的數(shù)據(jù)不斷訓(xùn)練模型參數(shù),使得模型預(yù)測(cè)更加準(zhǔn)確。
2 大數(shù)據(jù)技術(shù)應(yīng)用于高校學(xué)生管理的緊迫性
隨著近年來(lái)高校擴(kuò)招政策,各個(gè)高校的學(xué)生規(guī)模不斷擴(kuò)大,給高校帶來(lái)巨大的管理壓力。一方面,高校學(xué)生管理人員配備相比學(xué)生規(guī)模還是遠(yuǎn)遠(yuǎn)不夠;另一方面,高校學(xué)生中有很多是獨(dú)生子女,獨(dú)生子女個(gè)體的巨大差異也給高校學(xué)生管理帶來(lái)了很大的困難。隨著如今各高校各類學(xué)生管理信息系統(tǒng)的不斷完善,學(xué)生的學(xué)業(yè)數(shù)據(jù)、社團(tuán)活動(dòng)、出入門(mén)禁數(shù)據(jù)等數(shù)據(jù)的累積,采用大數(shù)據(jù)技術(shù)對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行采集、加工、分析和整理,產(chǎn)生可以反映學(xué)生個(gè)體特征的數(shù)據(jù),從而給高校學(xué)生管理人員的管理提供依據(jù)。同時(shí),各二級(jí)學(xué)院、輔導(dǎo)員、班主任可以根據(jù)分析結(jié)果給學(xué)生提供個(gè)性化的幫助,如就業(yè)、選課等方面的指導(dǎo),從而不斷提高高校的學(xué)生管理水平。
3 大數(shù)據(jù)技術(shù)在高校學(xué)生管理中的應(yīng)用
3.1 學(xué)生相關(guān)數(shù)據(jù)的采集存儲(chǔ)
3.1.1 數(shù)據(jù)的屬性
大數(shù)據(jù)分析的前提是要累積一定規(guī)模的學(xué)生相關(guān)數(shù)據(jù),包括學(xué)生的成績(jī)數(shù)據(jù)、課堂考勤數(shù)據(jù)、課程平臺(tái)學(xué)習(xí)數(shù)據(jù)、參加社團(tuán)活動(dòng)數(shù)據(jù)、校園卡使用數(shù)據(jù)、門(mén)禁數(shù)據(jù)、圖書(shū)館借閱數(shù)據(jù)等。大數(shù)據(jù)分析要求數(shù)據(jù)必須滿足規(guī)模性、動(dòng)態(tài)性、多樣性。規(guī)模性是從量上來(lái)度量,數(shù)據(jù)量越大,越接近實(shí)際情況,分析越準(zhǔn)確,一定規(guī)模的統(tǒng)計(jì)樣本數(shù)是大數(shù)據(jù)分析的基礎(chǔ)。多樣性是從數(shù)據(jù)種類的維度上來(lái)度量,數(shù)據(jù)的種類、數(shù)據(jù)的來(lái)源越多,越有助于數(shù)據(jù)的交叉驗(yàn)證,從而確保分析結(jié)果的可靠性。動(dòng)態(tài)性是從時(shí)間序列的維度來(lái)度量,結(jié)合了時(shí)間維度,可以判斷某個(gè)要素隨時(shí)間的變化趨勢(shì),使得數(shù)據(jù)分析更加科學(xué)和豐富。
3.1.2 數(shù)據(jù)的存儲(chǔ)
目前絕大多數(shù)高校還是采用傳統(tǒng)的服務(wù)器存儲(chǔ)學(xué)生的各類數(shù)據(jù),傳統(tǒng)服務(wù)器如果遇到停電等突發(fā)情況時(shí)將面臨數(shù)據(jù)丟失等風(fēng)險(xiǎn),雖然各高校都會(huì)配備不間斷電源,但是不間斷電源最多只能維持幾個(gè)小時(shí),還是無(wú)法滿足高校的管理需要。隨著學(xué)生規(guī)模的不斷擴(kuò)大,學(xué)生管理產(chǎn)生的數(shù)據(jù)將急劇增加,服務(wù)器呈現(xiàn)多而分散的問(wèn)題,不利于數(shù)據(jù)的共享和數(shù)據(jù)處理。基于云架構(gòu)的分布式文件系統(tǒng)(DFS)因其具備無(wú)限擴(kuò)展性、冗余性、容錯(cuò)性被廣泛應(yīng)用于各領(lǐng)域,高校應(yīng)采用云平臺(tái)來(lái)存儲(chǔ)學(xué)生各類數(shù)據(jù),以便更好的對(duì)數(shù)據(jù)進(jìn)行整合和處理。
3.1.3 數(shù)據(jù)的來(lái)源與獲取
與學(xué)生管理相關(guān)的數(shù)據(jù)有學(xué)生成績(jī)數(shù)據(jù)庫(kù)、學(xué)生社團(tuán)活動(dòng)數(shù)據(jù)庫(kù)、學(xué)生選課數(shù)據(jù)庫(kù)、學(xué)生信息數(shù)據(jù)庫(kù)、學(xué)生校園卡使用數(shù)據(jù)庫(kù)、學(xué)生圖書(shū)館借閱數(shù)據(jù)庫(kù)、學(xué)生在線學(xué)習(xí)數(shù)據(jù)庫(kù)、學(xué)生出入門(mén)禁數(shù)據(jù)庫(kù)、畢業(yè)生就業(yè)數(shù)據(jù)庫(kù)、學(xué)生校內(nèi)網(wǎng)頁(yè)、論壇留言等數(shù)據(jù)。絕大多數(shù)數(shù)據(jù)庫(kù)是由學(xué)校的教務(wù)處、學(xué)生處和團(tuán)委牽頭建立,組織學(xué)生填報(bào),以教務(wù)系統(tǒng)為例,涉及學(xué)生管理數(shù)據(jù)的表有近百個(gè)。包含學(xué)生成績(jī)數(shù)據(jù),學(xué)生選課數(shù)據(jù),學(xué)生基本信息數(shù)據(jù)庫(kù),這些數(shù)據(jù)以結(jié)構(gòu)化數(shù)據(jù)為主。學(xué)生參加社團(tuán)活動(dòng)數(shù)據(jù)以非結(jié)構(gòu)化數(shù)據(jù)為主。充分收集不同來(lái)源的學(xué)生管理數(shù)據(jù),數(shù)據(jù)的質(zhì)量直接決定了分析結(jié)果的準(zhǔn)確性。
3.2 學(xué)生相關(guān)數(shù)據(jù)的安全管理
學(xué)生相關(guān)數(shù)據(jù)采集后還要做好數(shù)據(jù)安全的管理,學(xué)生相關(guān)數(shù)據(jù)的安全是大數(shù)據(jù)技術(shù)分析的前提。網(wǎng)絡(luò)的開(kāi)放性決定了學(xué)生各類數(shù)據(jù)被黑客等攻擊是不可避免的。另外高校的管理人員信息安全意識(shí)普遍比較薄弱,加之缺乏信息安全相關(guān)背景知識(shí),這給學(xué)生相關(guān)信息安全帶來(lái)很大的隱患。一方面要采用最新的信息加密技術(shù)對(duì)學(xué)生相關(guān)數(shù)據(jù)進(jìn)行加密保護(hù),同時(shí)也要做好數(shù)據(jù)的定期備份,確保系統(tǒng)出現(xiàn)故障情況下能短時(shí)間修復(fù);另一方面,高校也要加強(qiáng)管理人員的信息安全教育,如各類學(xué)生管理系統(tǒng)的密碼設(shè)置規(guī)范和網(wǎng)絡(luò)使用禁忌等,確保學(xué)生信息的安全。
3.3 學(xué)生管理數(shù)據(jù)的融合和分析
通常情況下學(xué)生管理數(shù)據(jù)來(lái)源于不同部門(mén),各部門(mén)采用的數(shù)據(jù)形式不盡相同,同時(shí)數(shù)據(jù)的結(jié)構(gòu)也不同,有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),如視頻、圖片、文本和網(wǎng)絡(luò)瀏覽數(shù)據(jù)等。對(duì)于以上這些數(shù)據(jù)要采用數(shù)據(jù)融合技術(shù)將結(jié)構(gòu)不同、定義多樣的數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使得其成為結(jié)構(gòu)相同、語(yǔ)義相近的數(shù)據(jù),便于后續(xù)的數(shù)據(jù)分析和處理。
大數(shù)據(jù)技術(shù)分析主要有可視化分析、數(shù)據(jù)挖掘和預(yù)測(cè)分析等??梢暬治鍪悄軌蛑庇^的展示大數(shù)據(jù)的特點(diǎn),具有良好的交互性。數(shù)據(jù)挖掘是從大量有噪聲的、模糊的、隨機(jī)的實(shí)際數(shù)據(jù)中,提取有價(jià)值的數(shù)據(jù)。預(yù)測(cè)分析是在可視化分析和數(shù)據(jù)挖掘的基礎(chǔ)上,建立模型,通過(guò)數(shù)據(jù)訓(xùn)練優(yōu)化模型,從而可以利用模型預(yù)測(cè)未來(lái)可能出現(xiàn)的情況。數(shù)據(jù)挖掘是數(shù)據(jù)模型的發(fā)現(xiàn)過(guò)程,高??梢岳脭?shù)據(jù)挖掘方法構(gòu)建各類學(xué)生管理模型,比如學(xué)業(yè)預(yù)警模型、學(xué)生選課推薦模型等??梢圆捎脵C(jī)器學(xué)習(xí)算法訓(xùn)練模型參數(shù),使得模型預(yù)測(cè)更加準(zhǔn)確。
數(shù)據(jù)挖掘有4種常見(jiàn)的分析方法,分別是描述型分析、診斷型分析、指令型分析和預(yù)測(cè)型分析。描述型分析是最常見(jiàn)的大數(shù)據(jù)分析方法,注重大數(shù)據(jù)的背后發(fā)生了什么;預(yù)測(cè)型分析注重未來(lái)將發(fā)生什么;診斷型分析主要側(cè)重發(fā)生的原因;指令型分析側(cè)重給用戶提供可行的解決方案。數(shù)據(jù)挖掘采用的算法主要包括分類與預(yù)測(cè)挖掘、聚類挖掘、關(guān)聯(lián)規(guī)則、決策樹(shù)方法、神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、模糊理論、可視化技術(shù)等,其中聚類分類與預(yù)測(cè)挖掘、關(guān)聯(lián)規(guī)則和決策樹(shù)分類三種算法比較適用于高校學(xué)生管理。
3.3.1 聚類、分類與預(yù)測(cè)挖掘算法在學(xué)生管理中的應(yīng)用
聚類算法主要包括K-means、 BIRCH、DBSCAN、CLIQLE等方法,高校在學(xué)生管理里時(shí)候可采用K-means算法的聚類挖掘分析技術(shù),這種分析技術(shù)能夠分析出某一類學(xué)生群體的行為特征。高??梢岳脤W(xué)生在網(wǎng)絡(luò)平臺(tái)的學(xué)習(xí)行為數(shù)據(jù),判斷某個(gè)群體學(xué)生的學(xué)習(xí)效果和課程的質(zhì)量。高校也可以利用學(xué)生就業(yè)數(shù)據(jù)庫(kù)找出就業(yè)率比較高群體學(xué)生的特征并加以分析。高??梢岳脤W(xué)生成績(jī)數(shù)據(jù)分析出有學(xué)業(yè)危機(jī)的學(xué)生群體,并進(jìn)行人為干預(yù)。
3.3.2 關(guān)聯(lián)規(guī)則算法在學(xué)生管理中的應(yīng)用
關(guān)聯(lián)規(guī)則算法主要用于發(fā)現(xiàn)大數(shù)據(jù)背后各要素之間可能存在的關(guān)聯(lián),主要算法有挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的Apriori算法,該算法可以用來(lái)分析某種現(xiàn)象的影響因素。高??梢酝ㄟ^(guò)學(xué)生參加社團(tuán)活動(dòng)數(shù)據(jù)發(fā)現(xiàn)學(xué)生的興趣,向?qū)W生推薦合適的課程。高??梢越Y(jié)合學(xué)生就業(yè)數(shù)據(jù)和學(xué)生參加社團(tuán)數(shù)據(jù),得出就業(yè)率高和學(xué)生參加社團(tuán)的相關(guān)度。高??梢岳脤W(xué)生在校內(nèi)實(shí)名網(wǎng)絡(luò)中網(wǎng)頁(yè)瀏覽數(shù)據(jù),分析出學(xué)生瀏覽負(fù)面信息與學(xué)生存在心理健康問(wèn)題的相關(guān)度。
3.3.3 機(jī)器學(xué)習(xí)在構(gòu)建學(xué)生管理模型中的應(yīng)用
為了使得模型的預(yù)測(cè)更加準(zhǔn)確,可以采用機(jī)器學(xué)習(xí)方法訓(xùn)練模型參數(shù)。機(jī)器學(xué)習(xí)分為有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。高??梢圆捎糜斜O(jiān)督的機(jī)器學(xué)習(xí),通過(guò)已有的數(shù)據(jù)不斷訓(xùn)練模型,使得模型的預(yù)測(cè)更加準(zhǔn)確。通過(guò)成績(jī)數(shù)據(jù)和學(xué)生網(wǎng)絡(luò)學(xué)習(xí)等數(shù)據(jù)高??梢越W(xué)生的學(xué)業(yè)預(yù)警模型。通過(guò)學(xué)生各類競(jìng)賽數(shù)據(jù)、成績(jī)數(shù)據(jù)、社團(tuán)等數(shù)據(jù)構(gòu)建學(xué)生的能力模型,給學(xué)生提供個(gè)性化的就業(yè)推薦。高??梢岳脤W(xué)生對(duì)課程的評(píng)價(jià)數(shù)據(jù)和學(xué)生網(wǎng)絡(luò)平臺(tái)的學(xué)習(xí)行為數(shù)據(jù),構(gòu)建優(yōu)質(zhì)課程模型,給學(xué)生提供更優(yōu)質(zhì)的課程資源。高??梢岳脤W(xué)生網(wǎng)絡(luò)瀏覽數(shù)據(jù)、校內(nèi)各類網(wǎng)絡(luò)留言數(shù)據(jù)建立實(shí)時(shí)的學(xué)生心理健康狀態(tài)監(jiān)測(cè)模型,及時(shí)發(fā)現(xiàn)可能存在負(fù)面情緒的學(xué)生,通過(guò)跟學(xué)生的及時(shí)溝通,化解學(xué)生的心理健康問(wèn)題。
參考文獻(xiàn)
[1]張靜,劉危,楊兵,單文波.試析大數(shù)據(jù)分析在學(xué)科建設(shè)中的應(yīng)用[J].高教學(xué)刊,2019(5):1-5.
[2]楊陽(yáng),石城,蘇力.大數(shù)據(jù)時(shí)代高校學(xué)生教育管理工作摭探[J].成才之路,2019(6):8.
[3]袁興梅.基于大數(shù)據(jù)的高校學(xué)生教育管理研究[J].中國(guó)成人教育,2018(24):34-36.