国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)背景下高校教育數(shù)據(jù)的分析與應(yīng)用研究

2017-05-30 12:42:42胡祖輝徐毅
現(xiàn)代教育科學(xué) 2017年1期
關(guān)鍵詞:分析模型大數(shù)據(jù)

胡祖輝 徐毅

[摘要]教育數(shù)據(jù)在大數(shù)據(jù)時(shí)代成了寶貴資源,其價(jià)值已經(jīng)在國(guó)內(nèi)外引起了相關(guān)方面的高度重視。為挖掘教育數(shù)據(jù)中蘊(yùn)含的有價(jià)值信息,筆者提出了教育數(shù)據(jù)分析的模型,并以高校常見(jiàn)的學(xué)生、成績(jī)、消費(fèi)和門(mén)禁等方面的數(shù)據(jù)為例進(jìn)行分析研究,為高校教育數(shù)據(jù)分析與應(yīng)用提供參考。實(shí)踐中,教育數(shù)據(jù)內(nèi)涵豐富,分析方法眾多,有待做進(jìn)一步的深入研究,以便更好地服務(wù)于教育教學(xué)和教育管理。

[關(guān)鍵詞]大數(shù)據(jù);教育數(shù)據(jù);分析模型;分析實(shí)例

[中圖分類號(hào)] G640 [文獻(xiàn)標(biāo)識(shí)碼] A[文章編號(hào)]1005-5843(2017)01-0109-06

[DOI]1013980/jcnkixdjykx201701022

一、引言

現(xiàn)代信息技術(shù)與經(jīng)濟(jì)社會(huì)交匯融合的逐步加深引發(fā)了數(shù)據(jù)的迅猛增長(zhǎng),人類社會(huì)跨入了大數(shù)據(jù)時(shí)代。國(guó)務(wù)院2015年印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》指出,大數(shù)據(jù)是以容量大、類型多、存取速度快、應(yīng)用價(jià)值高為主要特征的數(shù)據(jù)集合,正快速發(fā)展為對(duì)數(shù)量巨大、來(lái)源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲(chǔ)和關(guān)聯(lián)分析,從中發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)。大數(shù)據(jù)正日益對(duì)全球生產(chǎn)、流通、分配、消費(fèi)活動(dòng)以及經(jīng)濟(jì)運(yùn)行機(jī)制、社會(huì)生活方式和國(guó)家治理能力產(chǎn)生重要影響[1]。信息技術(shù)對(duì)教育領(lǐng)域的正面影響已經(jīng)得到廣泛認(rèn)可?!秶?guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》和《教育部教育信息化十年發(fā)展規(guī)劃(2011-2020年)》均明確指出,信息技術(shù)對(duì)教育發(fā)展具有革命性影響,必須予以高度重視[2];以教育信息化帶動(dòng)教育現(xiàn)代化,是我國(guó)教育事業(yè)發(fā)展的戰(zhàn)略選擇 [3]。教育信息化為高校帶來(lái)了豐富的教育資源、高效的教學(xué)方式、便捷的管理手段等諸多好處,提高了高校的教學(xué)科研水平和教育教學(xué)質(zhì)量,從而提升了高校的核心競(jìng)爭(zhēng)力。但在教育信息化的發(fā)展程度上,各高校的發(fā)展水平參差不齊,很多高校仍然將注意力集中在各種信息系統(tǒng)上,沒(méi)有給予數(shù)據(jù)這一寶貴資源以應(yīng)有的重視[4];高校內(nèi)部各個(gè)部門(mén)往往根據(jù)各自的業(yè)務(wù)需要單獨(dú)建設(shè)信息系統(tǒng),不同信息系統(tǒng)之間缺少數(shù)據(jù)共享,容易形成信息孤島,難以保證數(shù)據(jù)的一致性和準(zhǔn)確性;高校各個(gè)信息系統(tǒng)運(yùn)行過(guò)程中產(chǎn)生的許多有價(jià)值的信息長(zhǎng)期被忽視,亟待加以分析和利用。因此,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)是高校的無(wú)形資產(chǎn),對(duì)數(shù)據(jù)進(jìn)行分析和挖掘應(yīng)成為高校推進(jìn)教育信息化建設(shè)的一項(xiàng)重要內(nèi)容。

二、教育數(shù)據(jù)的內(nèi)涵與研究現(xiàn)狀

教育數(shù)據(jù)是大數(shù)據(jù)的一個(gè)子集,即教育領(lǐng)域的數(shù)據(jù)。廣義的教育數(shù)據(jù)是指整個(gè)教育活動(dòng)過(guò)程中所產(chǎn)生的及根據(jù)教育需要所采集到的,一切用于教育發(fā)展并擁有巨大潛在價(jià)值的數(shù)據(jù)集合[5]。根據(jù)統(tǒng)計(jì)范疇的大小,教育數(shù)據(jù)可分為國(guó)家、社會(huì)、教育機(jī)構(gòu)、教育活動(dòng)參與者等多個(gè)層面。狹義的教育數(shù)據(jù)是指高校內(nèi)各個(gè)信息系統(tǒng)運(yùn)行過(guò)程中所產(chǎn)生的數(shù)據(jù)集合。高校學(xué)生從入學(xué)到畢業(yè)的整個(gè)大學(xué)生活周期中,在各個(gè)信息系統(tǒng)中留下了大量的數(shù)據(jù)信息,包括選課、考試、考勤、繳費(fèi)、評(píng)優(yōu)、上網(wǎng)、消費(fèi)、圖書(shū)借閱、網(wǎng)絡(luò)學(xué)習(xí)等。楊現(xiàn)民等學(xué)者提出了教育數(shù)據(jù)的“冰山模型”——將教育數(shù)據(jù)分為顯露于“冰面”之上的和隱藏于“冰面”之下的兩大部分[6]?!氨妗鄙系臄?shù)據(jù)主要為顯性的結(jié)果性數(shù)據(jù),如學(xué)籍信息、成績(jī)信息、考勤信息、繳費(fèi)信息等。而“冰面”下的數(shù)據(jù)則以隱性的過(guò)程性數(shù)據(jù)為主,包括學(xué)習(xí)、考試、上網(wǎng)、消費(fèi)等行為以及各種行為之間的內(nèi)在聯(lián)系等。長(zhǎng)期以來(lái),很多高校將注意力集中于“冰面”上的數(shù)據(jù),而忽視了對(duì)“冰面”下數(shù)據(jù)的利用。在大數(shù)據(jù)時(shí)代,我們需要轉(zhuǎn)變觀念,無(wú)論“冰面”上還是“冰面”下的數(shù)據(jù)都同等重要,要積極地加以研究和利用。

教育數(shù)據(jù)分析的重要意義在于通過(guò)分析得出能夠反映客觀事實(shí)的、潛在的、有意義的信息,以之保證教育教學(xué)的客觀性和有效性。教育數(shù)據(jù)分析是運(yùn)用數(shù)據(jù)分析方法從來(lái)自教育系統(tǒng)的原始數(shù)據(jù)中提取出有意義信息的過(guò)程,這些信息可以為教育者、學(xué)習(xí)者、管理者、教育軟件開(kāi)發(fā)者和教育研究者等提供服務(wù)[7]。教學(xué)、科研、管理是教育機(jī)構(gòu)的基本活動(dòng),教育數(shù)據(jù)分析也就相應(yīng)地分劃為教學(xué)數(shù)據(jù)分析、管理數(shù)據(jù)分析和科研數(shù)據(jù)分析三個(gè)研究方向[8]。教育活動(dòng)與教育數(shù)據(jù)密切關(guān)聯(lián),教育活動(dòng)產(chǎn)生教育數(shù)據(jù),教育數(shù)據(jù)分析結(jié)果可以指導(dǎo)教育活動(dòng),實(shí)現(xiàn)兩者雙向關(guān)聯(lián)的關(guān)鍵在于對(duì)教育數(shù)據(jù)的分析。

教育數(shù)據(jù)分析包括統(tǒng)計(jì)運(yùn)算、數(shù)據(jù)挖掘、預(yù)測(cè)分析和決策支持等程序,其重要價(jià)值已經(jīng)在國(guó)內(nèi)外引起了高度的重視。早在2008年,荷蘭、美國(guó)、德國(guó)、加拿大、澳大利亞等國(guó)的研究人員發(fā)起成立了國(guó)際教育數(shù)據(jù)挖掘組織。在該組織的大力推動(dòng)下,第一屆國(guó)際教育數(shù)據(jù)挖掘?qū)W術(shù)會(huì)議于2008年在加拿大召開(kāi),至今已舉辦了九屆。同時(shí),該組織于2011年開(kāi)通了國(guó)際教育數(shù)據(jù)挖掘網(wǎng)站,并且成功創(chuàng)辦了專門(mén)的電子期刊JEMD[9]。這促使越來(lái)越多的國(guó)家和高校開(kāi)始重視對(duì)教育大數(shù)據(jù)的分析。2012年,美國(guó)教育部門(mén)實(shí)施了一項(xiàng)耗資2億美元的將大數(shù)據(jù)分析應(yīng)用于美國(guó)公共教育的計(jì)劃,目的是運(yùn)用教育大數(shù)據(jù)分析來(lái)促進(jìn)教與學(xué)[10]。美國(guó)教育技術(shù)辦公室在2012年10月發(fā)布了一份《通過(guò)教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》的研究報(bào)告,對(duì)美國(guó)國(guó)內(nèi)教育數(shù)據(jù)挖掘和學(xué)習(xí)分析的研究及應(yīng)用情況進(jìn)行了總結(jié),并提出了改進(jìn)建議[11]。在此期間,哈佛大學(xué)、斯坦福大學(xué)、耶魯大學(xué)等世界知名高校都啟動(dòng)了教育大數(shù)據(jù)的相關(guān)研究計(jì)劃;一些企業(yè)已經(jīng)成功開(kāi)發(fā)出了分析教育大數(shù)據(jù)的相關(guān)產(chǎn)品,如美國(guó)的Knewton公司、英國(guó)的Pearson公司、加拿大的Desire2Learn公司等。我國(guó)當(dāng)前的教育大數(shù)據(jù)研究與應(yīng)用整體上還處于起步階段,專注于教育大數(shù)據(jù)發(fā)展應(yīng)用的機(jī)構(gòu)和企業(yè)為數(shù)不多。2014年5月,電子科技大學(xué)成立了教育大數(shù)據(jù)研究所,并已經(jīng)取得了了數(shù)據(jù)一體化平臺(tái)、學(xué)生畫(huà)像系統(tǒng)等多項(xiàng)研究成果。2015年9月,中國(guó)統(tǒng)計(jì)信息服務(wù)中心和曲阜師范大學(xué)共同成立了中國(guó)教育大數(shù)據(jù)研究院。

三、教育數(shù)據(jù)分析模型

按照數(shù)據(jù)分析的一般流程,教育數(shù)據(jù)分析主要包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析和結(jié)果評(píng)價(jià)四個(gè)步驟(教育數(shù)據(jù)分析模型如圖1所示)。

圖1教育數(shù)據(jù)分析模型

(一)數(shù)據(jù)采集

教育數(shù)據(jù)來(lái)源廣泛,涉及到高校的多個(gè)職能部門(mén)。通常這些數(shù)據(jù)分散存儲(chǔ)在高校的各個(gè)信息系統(tǒng)之中,如學(xué)生數(shù)據(jù)存儲(chǔ)在學(xué)生管理系統(tǒng)中,成績(jī)數(shù)據(jù)存儲(chǔ)在教務(wù)管理系統(tǒng)中,消費(fèi)數(shù)據(jù)和門(mén)禁數(shù)據(jù)存儲(chǔ)在校園卡管理系統(tǒng)中,圖書(shū)借閱數(shù)據(jù)存儲(chǔ)在圖書(shū)借閱管理系統(tǒng)中,等等。綜合考慮成本、可行性、安全性等因素,進(jìn)行數(shù)據(jù)采集的最佳方案是先依托現(xiàn)有的各個(gè)信息系統(tǒng)進(jìn)行日常數(shù)據(jù)采集,然后通過(guò)ETL數(shù)據(jù)共享和交換技術(shù)進(jìn)行數(shù)據(jù)集成。由于各個(gè)信息系統(tǒng)可能采用不同的數(shù)據(jù)存儲(chǔ)技術(shù),因此數(shù)據(jù)源中的數(shù)據(jù)通常是異構(gòu)的,可能包括Oracle、SQL Server、MySQL、文本文件等形式。ETL(ETL是英文 ExtractTransformLoad 的縮寫(xiě),用來(lái)描述將數(shù)據(jù)從來(lái)源端經(jīng)過(guò)抽?。╡xtract)、轉(zhuǎn)換(transform)、加載(load)至目的端的過(guò)程)需要將分散的異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)提取到臨時(shí)中間層,然后按照統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行轉(zhuǎn)換,最后加載到目標(biāo)數(shù)據(jù)庫(kù)。

(二)數(shù)據(jù)預(yù)處理

數(shù)據(jù)采集解決了數(shù)據(jù)來(lái)源的問(wèn)題,但這些來(lái)自現(xiàn)實(shí)中的“臟數(shù)據(jù)”往往無(wú)法直接用于數(shù)據(jù)分析,要在數(shù)據(jù)分析之前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)預(yù)處理的方法有多種,包括數(shù)據(jù)清洗、合并、變換、歸約等。數(shù)據(jù)清洗主要是處理數(shù)據(jù)中存在的缺失值和噪聲數(shù)據(jù),清除異常數(shù)據(jù)和冗余數(shù)據(jù),以提高數(shù)據(jù)質(zhì)量;數(shù)據(jù)合并是根據(jù)數(shù)據(jù)分析的需要將原來(lái)分別從多個(gè)數(shù)據(jù)源采集到的數(shù)據(jù)進(jìn)行整合,以提高數(shù)據(jù)分析效率;數(shù)據(jù)變換是通過(guò)離散化、規(guī)范化等方式將數(shù)據(jù)轉(zhuǎn)換成適用于數(shù)據(jù)分析的形式;數(shù)據(jù)規(guī)約是運(yùn)用數(shù)據(jù)歸約技術(shù)得到原始數(shù)據(jù)集的歸約表示,既保持了原數(shù)據(jù)的完整性,又大大減少了數(shù)據(jù)分析的時(shí)間。

(三)數(shù)據(jù)分析

廣義的的數(shù)據(jù)分析方法可以分為兩個(gè)層次,即狹義的數(shù)據(jù)分析和數(shù)據(jù)挖掘。狹義的數(shù)據(jù)分析是指使用統(tǒng)計(jì)分析方法及工具對(duì)數(shù)據(jù)進(jìn)行處理與分析,提取有價(jià)值的信息。數(shù)據(jù)挖掘則是指運(yùn)用人工智能、機(jī)器學(xué)習(xí)等算法,從大量數(shù)據(jù)中挖掘出隱含的、有價(jià)值的信息。狹義的數(shù)據(jù)分析和數(shù)據(jù)挖掘本質(zhì)上都是從數(shù)據(jù)里面發(fā)現(xiàn)有價(jià)值的信息和規(guī)律,兩者之間并沒(méi)有清晰的界限。從某種意義上說(shuō),數(shù)據(jù)挖掘是一種更深層次的數(shù)據(jù)分析,其重點(diǎn)在于發(fā)現(xiàn)隱含的未知信息和規(guī)律。

(四)結(jié)果評(píng)價(jià)

結(jié)果評(píng)價(jià)的方法包括查準(zhǔn)率、查全率、正確率、顯著性等。查準(zhǔn)率為算法識(shí)別正確的正面樣本數(shù)與所有識(shí)別為正面的樣本數(shù)的比值,用于衡量算法的精確度;查全率也稱為召回率,為算法識(shí)別正確的正面樣本數(shù)與樣本中所有的真正正面樣本數(shù)的比值,反映算法的靈敏度;正確率為算法識(shí)別正確的觀點(diǎn)數(shù)與樣本總數(shù)的比值,反映算法的準(zhǔn)確度;顯著性為假設(shè)檢驗(yàn)分析結(jié)果,通常以005或001為閾值,若顯著性值小于閾值則拒絕原假設(shè),大于閾值則接受原假設(shè)。具體采用哪些指標(biāo)進(jìn)行結(jié)果評(píng)價(jià),需要根據(jù)實(shí)際情況來(lái)確定。

四、教育數(shù)據(jù)分析實(shí)例

(一)研究對(duì)象

為更好地說(shuō)明教育數(shù)據(jù)分析的方法及應(yīng)用價(jià)值,筆者以高校常見(jiàn)的學(xué)生數(shù)據(jù)、成績(jī)數(shù)據(jù)、消費(fèi)數(shù)據(jù)和門(mén)禁數(shù)據(jù)為研究對(duì)象進(jìn)行實(shí)例分析。從學(xué)生管理系統(tǒng)中提取某年級(jí)在籍本科生數(shù)據(jù)6 725條記錄,從教務(wù)管理系統(tǒng)中提取某年級(jí)成績(jī)數(shù)據(jù)401 278條記錄,從研究生管理系統(tǒng)中提取在籍研究生數(shù)據(jù)2 598條記錄和研究生成績(jī)數(shù)據(jù)45 988條,從校園卡管理系統(tǒng)中提取某月消費(fèi)數(shù)據(jù)316 629條和門(mén)禁數(shù)據(jù)10 106條。

(二)數(shù)據(jù)預(yù)處理

1學(xué)生數(shù)據(jù)。將本科生數(shù)據(jù)和研究生數(shù)據(jù)進(jìn)行合并,保留“學(xué)號(hào)”“姓名”“性別”等關(guān)鍵信息字段,去除非關(guān)鍵信息字段,增加“學(xué)生類別”字段以區(qū)分本科生和研究生。合并后的學(xué)生數(shù)據(jù)記錄總數(shù)為本科生和研究生學(xué)生數(shù)據(jù)記錄之總和。

2成績(jī)數(shù)據(jù)。為準(zhǔn)確衡量每個(gè)學(xué)生的綜合學(xué)習(xí)質(zhì)量,引入GPA(Grade Point Average,平均績(jī)點(diǎn))進(jìn)行成績(jī)?cè)u(píng)定。經(jīng)過(guò)計(jì)算平均績(jī)點(diǎn),每個(gè)學(xué)生只保留1條成績(jī)數(shù)據(jù)記錄,成績(jī)數(shù)據(jù)量大大減少。為便于更好地進(jìn)行數(shù)據(jù)分析,采用等寬分箱法進(jìn)一步對(duì)成績(jī)數(shù)據(jù)進(jìn)行離散化處理。平均績(jī)點(diǎn)在區(qū)間(0,1]的記錄記為JD1,平均績(jī)點(diǎn)在區(qū)間[1,2]的記錄記為JD2,平均績(jī)點(diǎn)在區(qū)間(2,3]的記錄記為JD3,平均績(jī)點(diǎn)在區(qū)間(3,4]的記為JD4。這樣就把成績(jī)數(shù)據(jù)分成了四類,反映了學(xué)生課程學(xué)習(xí)質(zhì)量的四個(gè)層次。

3消費(fèi)數(shù)據(jù)。首先利用數(shù)據(jù)庫(kù)分組查詢匯總得到每個(gè)學(xué)生的消費(fèi)總金額。這樣處理后得到的消費(fèi)數(shù)據(jù)匯總記錄就會(huì)小于學(xué)生數(shù)據(jù)記錄總數(shù)(客觀上存在部分學(xué)生一個(gè)月都不在校內(nèi)消費(fèi)的情況,對(duì)這部分學(xué)生按缺省值0進(jìn)行填充),然后對(duì)消費(fèi)金額進(jìn)行離散化處理。消費(fèi)金額為0的分為一組,記為JE1。對(duì)消費(fèi)金額大于0的記錄采用等頻分箱法進(jìn)行分組,即按照消費(fèi)金額從小到大的順序進(jìn)行排列,根據(jù)人數(shù)等分為若干部分,每部分為一組。消費(fèi)金額在區(qū)間(0,164]的記錄記為JE2,消費(fèi)金額在區(qū)間(164,2745]的記錄記為JE3,消費(fèi)金額在區(qū)間(2745, 11614]的記錄記為JE4,其中1 1614為最大消費(fèi)金額。

4門(mén)禁數(shù)據(jù)。首先利用分組查詢匯總得到每個(gè)學(xué)生的門(mén)禁刷卡次數(shù),然后對(duì)沒(méi)有門(mén)禁刷卡記錄的學(xué)生按缺省值0進(jìn)行填充,再對(duì)門(mén)禁刷卡次數(shù)進(jìn)行離散化處理。門(mén)禁刷卡次數(shù)為0記錄的分為一組,記為MJ1。門(mén)禁刷卡次數(shù)特征明顯,可根據(jù)經(jīng)驗(yàn)值將門(mén)禁刷卡次數(shù)大于0的記錄分為2組:門(mén)禁刷卡次數(shù)為1次到3次的為“偶爾晚歸”,記為MJ2;門(mén)禁刷卡次數(shù)大于3次的為“經(jīng)常晚歸”,記為MJ3。

(三)數(shù)據(jù)可視化分析

數(shù)據(jù)可視化分析是指將數(shù)據(jù)分析結(jié)果以圖形、圖像等形式予以展現(xiàn),并進(jìn)一步揭示其中所隱含信息的過(guò)程。使用Tableau對(duì)經(jīng)過(guò)數(shù)據(jù)預(yù)處理的學(xué)生數(shù)據(jù)、成績(jī)數(shù)據(jù)、消費(fèi)數(shù)據(jù)和門(mén)禁數(shù)據(jù)進(jìn)行可視化數(shù)據(jù)分析,可得到4張統(tǒng)計(jì)圖表(如圖2所示)。

從圖2可以直觀地看出:(1)與本科生相比,研究生JD3和JD4所占的比例較高,研究生課程學(xué)習(xí)質(zhì)量較好。(2)與男生相比,女生JD3和JD4所占的比例較高,女生的課程學(xué)習(xí)質(zhì)量較好。(3)本科生和研究生中都存在不少整月不在校消費(fèi)的學(xué)生(即JE1對(duì)應(yīng)的學(xué)生)。(4)與本科生相比,研究生中高消費(fèi)學(xué)生(JE4)的比例較低。(5)與女生相比,男生中高消費(fèi)學(xué)生(JE4)的比例較高,尤其是本科生男生。(6)本科生和研究生中都存在不少“經(jīng)常晚歸”的學(xué)生,即MJ3對(duì)應(yīng)的學(xué)生;(7)與本科生相比,研究生中晚歸學(xué)生(MJ3)的比例較低;(8)與男生相比,女生中晚歸學(xué)生(MJ3)比例較低。

將數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果應(yīng)用于管理,可以得出以下結(jié)論及建議:(1)無(wú)論是學(xué)習(xí)上還是生活上,研究生總體上比本科生更為成熟,這與研究生年齡較大、閱歷較多有關(guān)。女生總體上比男生生活更有序,學(xué)習(xí)成績(jī)更好,這與女生能夠更好地安排大學(xué)學(xué)習(xí)生活有關(guān)。因此,應(yīng)重點(diǎn)關(guān)注本科生男生的在校學(xué)習(xí)和生活,有針對(duì)性地制定相應(yīng)的管理措施。(2)JE1對(duì)應(yīng)的學(xué)生整月不在校消費(fèi),屬于異常情況,是請(qǐng)假離校還是未經(jīng)請(qǐng)假擅自離校,應(yīng)通過(guò)院系管理人員進(jìn)一步了解原因。(3)MJ3對(duì)應(yīng)的學(xué)生“經(jīng)常晚歸”,也屬于異常情況,是因?yàn)閷W(xué)習(xí)原因還是存在違紀(jì)情況,需要進(jìn)一步跟蹤了解,并根據(jù)具體情況作進(jìn)一步的處理,以減少晚歸現(xiàn)象。

(四)聚類分析

采用微軟SSAS對(duì)本科生群體的平均績(jī)點(diǎn)、消費(fèi)金額和門(mén)禁次數(shù)進(jìn)行聚類分析。以經(jīng)過(guò)離散化處理的數(shù)據(jù)為數(shù)據(jù)源,設(shè)置算法的運(yùn)行參數(shù):聚類算法為K-means算法,聚類數(shù)為3,訓(xùn)練集為全部樣本6 725條記錄。完成聚類分析后,可得到聚類分析結(jié)果(如表1所示)。從表1可以看出,分析結(jié)果把本科生劃為三類:第一類學(xué)生人數(shù)最多,超過(guò)總體的60%,主要特征是學(xué)習(xí)成績(jī)較好、消費(fèi)較高、晚歸現(xiàn)象較少。這類學(xué)生雖然生活條件較好,但能夠認(rèn)真學(xué)習(xí),較好地遵守學(xué)校紀(jì)律。第二類學(xué)生人數(shù)也較多,主要特征為學(xué)習(xí)成績(jī)較好、消費(fèi)較低、幾乎沒(méi)有晚歸現(xiàn)象。這類學(xué)生生活節(jié)儉,學(xué)習(xí)認(rèn)真,嚴(yán)格遵守紀(jì)律。第三類學(xué)生人數(shù)較少,接近總體的10%。這類學(xué)生大部分成績(jī)較差,晚歸現(xiàn)象較為嚴(yán)重,消費(fèi)主要分為兩種情況:不在校消費(fèi)或消費(fèi)較高。這類學(xué)生學(xué)習(xí)不認(rèn)真,紀(jì)律意識(shí)淡薄,有長(zhǎng)時(shí)間離校、消費(fèi)大手大腳、經(jīng)常晚歸或夜不歸宿等多種不良表現(xiàn)。但第三類中也存在少部分成績(jī)較好的學(xué)生,其經(jīng)常晚歸的原因包括參加科研或準(zhǔn)備各類競(jìng)賽。

根據(jù)聚類分析結(jié)果,可以得出以下結(jié)論及建議:(1)消費(fèi)高低與學(xué)習(xí)成績(jī)優(yōu)劣沒(méi)有必然的聯(lián)系,但長(zhǎng)時(shí)間不在校消費(fèi)反映了學(xué)生長(zhǎng)期離校會(huì)影響學(xué)習(xí)成績(jī)的問(wèn)題,因此應(yīng)對(duì)長(zhǎng)時(shí)間不在校消費(fèi)的學(xué)生進(jìn)行重點(diǎn)關(guān)注。(2)遵守學(xué)校紀(jì)律是學(xué)習(xí)成績(jī)較好的必要條件,晚歸次數(shù)較多的學(xué)生大部分成績(jī)較差,因此加強(qiáng)公寓管理、減少晚歸現(xiàn)象,以保證學(xué)生的整體學(xué)習(xí)質(zhì)量。(3)第一類和第二類學(xué)生都能夠合理安排好大學(xué)學(xué)習(xí)生活,第三類中大部分學(xué)生的紀(jì)律意識(shí)和學(xué)習(xí)自覺(jué)性較差,應(yīng)該成為教育管理的重點(diǎn),應(yīng)通過(guò)多種方式督促其遵守學(xué)校紀(jì)律、認(rèn)真學(xué)習(xí)。

五、結(jié)論

大數(shù)據(jù)是教育發(fā)展的未來(lái),教育大數(shù)據(jù)是教育信息化的最新發(fā)展趨勢(shì)。在大數(shù)據(jù)時(shí)代,對(duì)教育數(shù)據(jù)進(jìn)行采集、分析和利用的條件已經(jīng)完全成熟。教育數(shù)據(jù)分析可以得到教育數(shù)據(jù)中的隱含信息,在教育數(shù)據(jù)分析的支撐下,高校教育教學(xué)和教育管理工作將更有針對(duì)性,也更有效果,將會(huì)使因材施教和個(gè)性化教育的教育理想成為現(xiàn)實(shí)。筆者提出了教育數(shù)據(jù)分析模型,并舉例進(jìn)行了數(shù)據(jù)分析與挖掘,得到了數(shù)據(jù)中蘊(yùn)含的一些有意義的信息,這些信息有助于高校教育管理工作的改進(jìn)。教育數(shù)據(jù)及教育數(shù)據(jù)分析的價(jià)值遠(yuǎn)不止于此,有待進(jìn)一步深入研究和挖掘,以便更好地為教育教學(xué)和教育管理服務(wù)。

參考文獻(xiàn):

[1]促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要[EB/OL].http://www govcn/zhengce/content/201509/05/content_10137 htm, 2015-08-31

[2] 國(guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)[EB/OL].http://wwwmoeeducn/publicfiles/business/htmlfiles/moe/moe_838/201008/93704html, 2010-07-29

[3] 教育部關(guān)于印發(fā)《教育信息化十年發(fā)展規(guī)劃(2011-2020年)》的通知[EB/OL].http://wwwmoeeducn/publicfiles/business/htmlfiles/moe/s3342/201203/xxgk_133322 html, 2012-03-13

[4] 先曉兵,陳鳳,王繼元等 基于大數(shù)據(jù)的高校學(xué)生管理工作研究與實(shí)踐[J].中國(guó)教育信息化,2015(5): 6-10

[5][6]楊現(xiàn)民,王榴卉,唐斯斯教育大數(shù)據(jù)的應(yīng)用模式與政策建議[J].電化教育研究,2015(9):54-61

[7] 李婷,傅鋼善國(guó)內(nèi)外教育數(shù)據(jù)挖掘研究現(xiàn)狀及趨勢(shì)分析[J].現(xiàn)代教育技術(shù),2010(10):21-25

[8] 葛道凱,張少剛,魏順平教育數(shù)據(jù)挖掘:方法與應(yīng)用[M].北京:教育科學(xué)出版社, 2012

[9] Educational Data Mining [DB/OL].http://wwweducationaldataminingorg

[10] 胡德維大數(shù)據(jù)“革命”教育[N].光明日?qǐng)?bào),2013-10-19(5)

[11] Bienkowski M,F(xiàn)eng M, Means B Enhancing Teaching and Learning Through Educational Data Mining and Learning Analytics: An Issue Brief[R]. Washington :US Department of Education, Office of Educational Technology, 2012

猜你喜歡
分析模型大數(shù)據(jù)
基于BERT-VGG16的多模態(tài)情感分析模型
層次分析模型在結(jié)核疾病預(yù)防控制系統(tǒng)中的應(yīng)用
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
全啟發(fā)式語(yǔ)言分析模型
大功率型EPS控制器熱分析模型的研究
IFC4結(jié)構(gòu)分析模型應(yīng)用技術(shù)
大學(xué)英語(yǔ)需求分析模型的理論構(gòu)建
宜良县| 杨浦区| 菏泽市| 宝清县| 达州市| 嘉定区| 增城市| 福海县| 青河县| 马鞍山市| 共和县| 柳河县| 墨竹工卡县| 巫山县| 旺苍县| 平凉市| 高阳县| 中阳县| 耿马| 大厂| 凤冈县| 曲松县| 合川市| 遂昌县| 房山区| 育儿| 汨罗市| 商都县| 贵州省| 上高县| 阿拉尔市| 禹城市| 平罗县| 高密市| 巧家县| 德化县| 来宾市| 岐山县| 建水县| 榆中县| 竹北市|