摘 要:深度挖掘教育數(shù)據(jù)中的隱藏信息,可以暴露教育過程中存在的主要問題,為教育管理部門教育決策提供支持。本文從基礎(chǔ)教育的角度著手,基于大數(shù)據(jù)背景下,深入詳細地探討基礎(chǔ)教育評估與教學(xué)資源分配,以期對基礎(chǔ)教育的發(fā)展提供一定的參考借鑒。
關(guān)鍵詞:大數(shù)據(jù);基礎(chǔ)教育;教育評估;資源分配
引言:
現(xiàn)今時代,大數(shù)據(jù)已經(jīng)被應(yīng)用到了各個領(lǐng)域、各個行業(yè),如我國的電子科技大學(xué)還成功地通過收集學(xué)生在學(xué)校中生活學(xué)習(xí)的大數(shù)據(jù),尋找到了校園中“最孤獨的人”,我們可以看到大數(shù)據(jù)已經(jīng)在影響著生活的方方面面。那么能不能利用它的優(yōu)勢,讓它也來服務(wù)于基礎(chǔ)教育,讓現(xiàn)代最流行的大數(shù)據(jù)也可以對基礎(chǔ)教育起一些有益的作用,利用有限的資源和大數(shù)據(jù)本身所具有的一些優(yōu)勢,促進基礎(chǔ)教育的發(fā)展,這是從事基礎(chǔ)教育工作的人們所需要思考和研究的一個重要的問題,正如舍恩伯格指出的那樣:“就像望遠鏡能讓我們看到宇宙的廣闊,顯微鏡能讓我們觀察到微生物的面貌一樣,大數(shù)據(jù)正在改變著我們的生活以及我們理解世界的方式?!币虼?,本研究就是對大數(shù)據(jù)下的基礎(chǔ)教育評估與教學(xué)資源分配進行研究,讓人們開始重視大數(shù)據(jù),利用好大數(shù)據(jù)促進基礎(chǔ)教育的發(fā)展。
一、大數(shù)據(jù)相關(guān)概述
(一)大數(shù)據(jù)的概念
大數(shù)據(jù)是什么,現(xiàn)在還沒有一個統(tǒng)一的概念界定。不過通過研究百度百科、維基百科,以及麥肯錫全球研究所給出的定義,我們可以窺見大數(shù)據(jù)的一些特征,由此可以得出大數(shù)據(jù)的概念。根據(jù)這些解釋,可以發(fā)現(xiàn)大數(shù)據(jù)就是一個海量的數(shù)據(jù)集合,最根本的特征就是大,數(shù)據(jù)量極其大,數(shù)據(jù)流動速度快,人工無法完成對它的統(tǒng)計,必須依靠計算機技術(shù)進行分析計算的一類數(shù)據(jù),同時分析大數(shù)據(jù)可以得出更加客觀的結(jié)論。大數(shù)據(jù)以其獨有的數(shù)據(jù)優(yōu)勢,發(fā)揮著巨大的作用,而這些作用,正是大數(shù)據(jù)盛行的原因,也是大數(shù)據(jù)能夠促進基礎(chǔ)教育發(fā)展的根本原因。
(二)大數(shù)據(jù)的特征
大數(shù)據(jù)的特征是大數(shù)據(jù)能夠發(fā)揮作用的保障,也是促進基礎(chǔ)教育發(fā)展的本質(zhì)屬性,正是因為大數(shù)據(jù)有這些特征,才促使它變得越來越重要。大數(shù)據(jù)主要具備以下幾個方面的基本特征:(1)用數(shù)據(jù)表達。大數(shù)據(jù)的第一個特征,也是最基本的特征,就是可以用大量的、全方位的數(shù)據(jù)來表達一個清晰的事實。(2)用數(shù)據(jù)預(yù)測。用數(shù)據(jù)來預(yù)測是大數(shù)據(jù)最重要的一個特征。在當(dāng)今社會已經(jīng)有很多方面都運用了大數(shù)據(jù)進行預(yù)測,比如說當(dāng)今流行的網(wǎng)絡(luò)電商賣家,他們通過消費者的搜索記錄,甚至是鼠標(biāo)在某一個頁面停留的時間來預(yù)測消費者們需要什么樣的商品,價位是多少的商品,進而彈出適合消費者們購買的商品供他們挑選。(3)用數(shù)據(jù)超越。用數(shù)據(jù)超越是我們利用大數(shù)據(jù)最根本的目標(biāo)。目前的及更久以前的數(shù)據(jù)都將被記錄保存下來,為的就是未來更好得發(fā)展。大數(shù)據(jù)最終的目標(biāo)就是要超越前一個時代的發(fā)展,在下一個時代可以發(fā)展的更好。大數(shù)據(jù)也是一種不斷超越的數(shù)據(jù)模式,時刻想著要超越之前的發(fā)展,奠定未來發(fā)展的基礎(chǔ)。
二、大數(shù)據(jù)下的基礎(chǔ)教育智能評估研究
教育評估作為當(dāng)今教育領(lǐng)域中的主要研究問題之一,對于教育改革發(fā)展方向及管理決策制定有著至關(guān)重要的作用。下面將以某市高級中學(xué)基礎(chǔ)教育數(shù)據(jù)為例,探討大數(shù)據(jù)下的基礎(chǔ)教育智能評估。
(一)教育評估實驗數(shù)據(jù)
現(xiàn)有某市高級中學(xué)基礎(chǔ)建設(shè)資源統(tǒng)計數(shù)據(jù),根據(jù)這些數(shù)據(jù)來分析學(xué)校是否為示范性學(xué)校建立評價模型,從而對高級中學(xué)辦學(xué)水平進行評估?;A(chǔ)建設(shè)資源數(shù)據(jù)包括教師人數(shù)、校舍建筑面積(m?)、輔助用房面積(m?)、體育館面積(m?)、圖書冊數(shù)(冊)、計算機臺數(shù)(臺)、教學(xué)儀器設(shè)備資產(chǎn)等七項指標(biāo),以七項指標(biāo)評估學(xué)校是否為示范性學(xué)校,對數(shù)據(jù)進行整理分析,建立評估模型。
(二)基于Lib-SVM算法評估模型流程
針對表1中數(shù)據(jù),設(shè)計基于Lib-SVM算法評估模型流程如下:
1.計算生均指標(biāo)數(shù)據(jù),按列進行數(shù)據(jù)歸一化。
2.參照Lib-SVM數(shù)據(jù)格式要求,轉(zhuǎn)化數(shù)據(jù)格式。整理好實驗數(shù)據(jù),使用FormatDataLibsvm將數(shù)據(jù)轉(zhuǎn)化為Lib-SVM模型要求的格式。
3.選擇核函數(shù)。優(yōu)先考慮RBF核函數(shù),因為RBF核函數(shù)能夠?qū)崿F(xiàn)非線性映射,線性核函數(shù)只是RBF核函數(shù)一維的特例,多項式核函數(shù)參數(shù)過多,大幅度增加了模型的復(fù)雜程度,sigmoid核函數(shù)不適用于分類。
4.選取最優(yōu)參數(shù)c和g。RBF核函數(shù)有兩個重要參數(shù)c和g,對于給定問題,我們預(yù)先并不知道c和g如何取值是最好的,因此必須做好參數(shù)搜索的工作,以便于找到最合適的參數(shù)c和g,使評估模型可以對冊數(shù)數(shù)據(jù)準(zhǔn)確地進行分類評估。
5.建立Lib-SVM分類模型。設(shè)置svmtrain參數(shù),使用格式化之后的數(shù)據(jù)集訓(xùn)練建立Lib-SVM分類模型。
6.模型測試。利用svmpredict加載建立的Lib-SVM模型進行測試。
(三)實驗設(shè)計及結(jié)果分析
將數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集,其中,前100條數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,后25條數(shù)據(jù)作為測試數(shù)據(jù)集。對實驗數(shù)據(jù)進行歸一化處理;然后使用Format Data Libsvm將歸一化后的數(shù)據(jù)轉(zhuǎn)化為Lib-SVM數(shù)據(jù)格式;選擇nu-SVC作為主函數(shù)、RBF函數(shù)作為核函數(shù),使用grid.py進行網(wǎng)格搜索方法尋找RBF核函數(shù)最佳的c和g的參數(shù)值,得到的最佳參數(shù)c=32.0,g=0.5,以此建立Lib-SVM評估模型。以此Lib-SVM評估模型對訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集分別進行測試,訓(xùn)練數(shù)據(jù)集評估結(jié)果準(zhǔn)確度為92%、相對誤差8%;測試數(shù)據(jù)集評估結(jié)果準(zhǔn)確度為84%、相對誤差16%。
從評估結(jié)果可以看出,評估模型在訓(xùn)練集評估中準(zhǔn)確率較高,在測試數(shù)據(jù)集評估中準(zhǔn)確率略低一些。但是,隨著數(shù)據(jù)集樣本數(shù)量的增加,此評估模型準(zhǔn)確率也會隨之增加,進而使得評估結(jié)果更加具有說服力。此評估模型評估結(jié)果可以在很大程度上為教育評估工作提供較高的參考借鑒價值,輔助教育評估工作的進行。
三、大數(shù)據(jù)下的區(qū)域教學(xué)資源分配研究
下面將以某市各區(qū)縣學(xué)生人數(shù)、教師人數(shù)、圖書冊數(shù)統(tǒng)計數(shù)據(jù)為例,探討大數(shù)據(jù)下的區(qū)域教學(xué)資源分配。
(一)教學(xué)資源分配實驗數(shù)據(jù)
某市各區(qū)縣高中學(xué)生人數(shù)、教師人數(shù)、圖書冊書統(tǒng)計情況顯示,各區(qū)縣之間的生師比和生均圖書冊數(shù)差距相對而言非常大,已經(jīng)是屬于教育資源不均衡的情況。若現(xiàn)有1000名新招高中教師,以及100000冊新圖書待分配到各區(qū)縣中去,為考慮教育資源區(qū)域均衡,則應(yīng)降低生師比,提升生均圖書冊數(shù),使得各區(qū)縣生師比和生均圖書冊數(shù)趨于平衡狀態(tài)。
(二)基于PSO的資源分配模型流程
針對表1中數(shù)據(jù),設(shè)計基于PSO的資源分配模型流程如下:
1.初始化種群。相對于一般問題,粒子數(shù)控制在10~40之間,本文研究問題粒子數(shù)取20,生成粒子群。
2.更新粒子位置。學(xué)習(xí)因子c1、c2取值為c1=c2=2.0,慣性權(quán)重ω初始取值為ω=1.0,并隨著迭代的進行逐步遞減到ω=0.4,從而確保發(fā)揮粒子群的全局搜索能力。
3.更新粒子位置和當(dāng)前最優(yōu)位置。計算各粒子新的適應(yīng)值,更新粒子最優(yōu)位置和種群最優(yōu)位置。
4.驗證結(jié)束條件。算法結(jié)束條件為多次迭代粒子群最優(yōu)尋優(yōu)結(jié)果無變化,或目前迭代次數(shù)超過初始化迭代次數(shù),則算法結(jié)束,否則轉(zhuǎn)回(2)繼續(xù)尋優(yōu)過程。
(三)實驗設(shè)計及結(jié)果分析
首先考慮教師的分配,將各區(qū)縣生師比從大到小排序可知,生師比在各區(qū)縣間的差距相當(dāng)大,迫切需要解決其區(qū)域教育資源不均衡的問題。
使用粒子群優(yōu)化算法對該1000名教師分配,分配目標(biāo)為降低生師比過高區(qū)縣生師比情況,旨在平衡各區(qū)縣生師比現(xiàn)狀。分配結(jié)果數(shù)據(jù)顯示,僅有五個生師比比較高的區(qū)縣分配到新教師,這些生師比較高的區(qū)縣通過教師的分配已經(jīng)有了較大幅度的下降。通過此分配模型的分配結(jié)果,能夠比較明顯地改善區(qū)域教育資源不均衡的現(xiàn)狀,隨著每年對新教師的不斷均衡分配,各區(qū)縣的生師比必然能夠達到一定的均衡,然后協(xié)同下降。
接下來再考慮100000冊圖書的分配,將各區(qū)縣的生均圖書冊數(shù)從小到大排序可發(fā)現(xiàn),不同區(qū)縣間的差異非常大,最大值是最小值的四倍,教育資源不均衡問題非常嚴(yán)重。通過使用粒子群優(yōu)化算法來分配該10萬冊圖書,使之能改善區(qū)域生均圖書的不均衡現(xiàn)狀。分配結(jié)果數(shù)據(jù)中顯示僅僅生均圖書冊數(shù)最低的四個區(qū)縣分配到部分圖書,但僅有一個區(qū)縣的生均圖書冊數(shù)提升比較明顯。
從分配后的結(jié)果可以看出,僅僅分配前生均圖書冊數(shù)最低的區(qū)縣由于分配到大多數(shù)圖書的原因,其分配后生均圖書冊數(shù)提升比較明顯,其他三個區(qū)縣的生均圖書冊數(shù)在分配前和分配后并沒有明顯的提升。造成這一情況的主要原因是原區(qū)縣圖書冊數(shù)基數(shù)過大,10萬冊圖書相對于其原有圖書冊數(shù)來說太少,很難通過這些新圖書來明顯改善生均圖書冊數(shù)不均衡的現(xiàn)狀。
教育資源分配本身是一件復(fù)雜的工作,要保證盡量通過對教育資源的分配過程,使得教育資源區(qū)域均衡化,必須要借助大數(shù)據(jù)技術(shù)來實現(xiàn)。通過上述基于PSO算法的資源均配模型來策劃教育資源的分配任務(wù),在分配的過程中全面考慮各區(qū)縣資源情況,讓分配結(jié)果趨于教育資源均衡情況,改善教育資源不均衡的問題,可以為教育部門提供數(shù)據(jù)支持,幫助教育部門作出合理的分配策略,使得教育資源的分配更加科學(xué)合理。
結(jié)束語:
本文在深刻了解基礎(chǔ)教育資源大數(shù)據(jù)之后,對教育資源大數(shù)據(jù)進行了全面的分析,針對大數(shù)據(jù)在教育領(lǐng)域的主要研究方向,提出了本文的主要工作任務(wù)。結(jié)合基礎(chǔ)教育資源統(tǒng)計數(shù)據(jù)和大數(shù)據(jù)在教育領(lǐng)域的研究方向,實現(xiàn)了大數(shù)據(jù)下的基礎(chǔ)教育智能評估及區(qū)域教學(xué)資源分配。
作者簡介:
冉子喬 1990.11.27,北京,漢 ,碩士,對外經(jīng)濟貿(mào)易大學(xué)統(tǒng)計學(xué)院在職人員高級課程研修班學(xué)員;研究方向:大數(shù)據(jù)分析與應(yīng)用