盧文青 秦志永
摘 要 目前在教育大數(shù)據(jù)應(yīng)用過程中仍存在數(shù)據(jù)共享障礙、數(shù)據(jù)體系混雜、數(shù)據(jù)挖掘難度大、數(shù)據(jù)安全與隱私缺乏監(jiān)管以及數(shù)據(jù)結(jié)論存在缺陷等問題,針對問題進(jìn)行深入分析,并在數(shù)據(jù)共享、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)準(zhǔn)體系構(gòu)建、數(shù)據(jù)服務(wù)、數(shù)據(jù)管理等方面提出對策建議。
關(guān)鍵詞 教育大數(shù)據(jù);教育信息化;數(shù)據(jù)挖掘;數(shù)據(jù)管理
中圖分類號:G630 文獻(xiàn)標(biāo)識碼:B
文章編號:1671-489X(2017)17-0078-03
1 前言
教育大數(shù)據(jù)是整個教育活動過程中所產(chǎn)生的以及根據(jù)教育需要采集到的一切用于教育發(fā)展并可創(chuàng)造巨大潛在價值的數(shù)據(jù)集合[1]。借助于教育大數(shù)據(jù)分析,可有效促進(jìn)教育教學(xué)發(fā)展,在個性化教學(xué)環(huán)境定制、提升教學(xué)水平、優(yōu)化教學(xué)質(zhì)量等方面具有積極意義。但亦應(yīng)指出的是,大數(shù)據(jù)雖然帶來思維方式的巨大變革,但是也可能成為一種過度膨脹的力量,使教育管理者寄希望于大數(shù)據(jù)能夠解決教育領(lǐng)域的諸多問題。教育是培養(yǎng)人的過程,具有復(fù)雜性、公益性的特征。這一方面要求大數(shù)據(jù)的質(zhì)量不斷提高,另一方面在認(rèn)識上應(yīng)明確大數(shù)據(jù)不能代替豐富、動態(tài)、變化的教育教學(xué)實踐活動,它僅是一種實踐的指導(dǎo),使實踐更具理性化的特征。因此,如何基于實踐的觀點認(rèn)識大數(shù)據(jù),如何正確認(rèn)識大數(shù)據(jù),提升數(shù)據(jù)質(zhì)量,如何利用教育大數(shù)據(jù)更好地服務(wù)于教育,是擺在教育工作者面前亟待解決的問題。
2 教育大數(shù)據(jù)應(yīng)用過程中面臨的主要問題及原因
數(shù)據(jù)共享存在障礙 大數(shù)據(jù)相信全量數(shù)據(jù),通過分析幾乎全樣本的數(shù)據(jù)來思考和分析問題。從抽樣中得到的結(jié)論總是有水分的,而全部樣本中得到的結(jié)論水分就很少,數(shù)據(jù)量越大,真實性也就越大。然而各地學(xué)校之間教育信息化基礎(chǔ)設(shè)施環(huán)境的建設(shè)往往各具特色,互不兼容,限制了數(shù)據(jù)的共享,使得“數(shù)據(jù)孤島”成為制約教育大數(shù)據(jù)發(fā)展的瓶頸。
數(shù)據(jù)體系混雜 出于計量的需要,總是習(xí)慣于把教育分解,然而分解后的數(shù)據(jù)指標(biāo)體系所描述的屬性特征并不保證是教育的真實再現(xiàn)。由于缺乏標(biāo)準(zhǔn)的數(shù)據(jù)體系,各學(xué)校對數(shù)據(jù)指標(biāo)的性質(zhì)差異以及數(shù)值差異所表示的實際意義存在認(rèn)識上的分歧,各學(xué)校都傾向于強化本校數(shù)值較高的指標(biāo)在綜合分析中的作用,相對削弱數(shù)值水平較低的指標(biāo)的作用,導(dǎo)致在數(shù)據(jù)收集和分析時存在指標(biāo)各異、標(biāo)準(zhǔn)不同、口徑不一的情況。
教育大數(shù)據(jù)既包括常規(guī)的結(jié)構(gòu)化數(shù)據(jù)(如成績、學(xué)籍、就業(yè)率、出勤記錄等),也包括海量難以分析的非結(jié)構(gòu)化數(shù)據(jù)(如圖片、視頻、教學(xué)軟件、學(xué)習(xí)游戲等)。不僅結(jié)構(gòu)復(fù)雜,而且在收集數(shù)據(jù)的過程中因為操作系統(tǒng)以及版本的不同,數(shù)據(jù)收集的結(jié)果可能會存在多份的情況,造成不必要的數(shù)據(jù)冗余。另外,由于數(shù)據(jù)的真實性無法全部保證,數(shù)據(jù)中還可能存在許多的“偽數(shù)據(jù)”。
由此可知,數(shù)據(jù)體系的混雜不僅增加了數(shù)據(jù)收集的難度,而且削弱了數(shù)據(jù)整合的價值。
數(shù)據(jù)挖掘難度大 教育大數(shù)據(jù)的價值就在于數(shù)據(jù)挖掘,沒經(jīng)過挖掘的大數(shù)據(jù)只是沒有開采出來的原油,不具有實用價值,而數(shù)據(jù)挖掘就是通過算法模型搜索隱藏于其中的信息的過程。教育大數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)將越來越占據(jù)主導(dǎo)地位,但是要把視頻和圖片等轉(zhuǎn)換成有用的數(shù)據(jù)信息,則必須首先定義視頻或圖片等的價值。大數(shù)據(jù)時代信息分析的難點就在于對海量的非結(jié)構(gòu)化數(shù)據(jù)的分析,而在此領(lǐng)域的研究尚不成熟。
在海量、復(fù)雜、多維的數(shù)據(jù)中去挖掘數(shù)據(jù)之間的相關(guān)性,使用的數(shù)據(jù)越多,分析的難度越大,則討論、分析、爭議的時間、人力、財力等成本也會相應(yīng)提高。而采用的數(shù)據(jù)過少,則又不能充分認(rèn)識教育過程的本質(zhì)。因此,數(shù)據(jù)挖掘的算法模型很重要,但是創(chuàng)建模型的人經(jīng)常不清楚建模依據(jù)的歷史數(shù)據(jù)在未來是否穩(wěn)定,而使用模型的人也不知道整個數(shù)據(jù)模型的加工過程;創(chuàng)建模型的人可能不知道此種模型效果好不好,而使用模型的人也不知道該怎么去反饋使用的結(jié)果[2]。這樣一來,信息不對稱現(xiàn)象嚴(yán)重,影響了算法模型的質(zhì)量優(yōu)化。
數(shù)據(jù)挖掘的本質(zhì)就是還原。雖然好的數(shù)據(jù)模型是一種有益的提煉,但有時候也會因為缺少場景數(shù)據(jù)的支持,在某種程度上造成信息的歪曲。事實表明,一些不易收集的量更直接影響人的行為,如健康、情緒、性格、興趣、習(xí)慣等。缺少了這些背景數(shù)據(jù)的支持,數(shù)據(jù)分析的結(jié)果可能會失真,甚至與事實大相徑庭。
數(shù)據(jù)安全與隱私亟待有效監(jiān)管 教育大數(shù)據(jù)收集了各種來源、各種類型的數(shù)據(jù),其中也包含很多和用戶隱私相關(guān)的信息。由于國家在教育大數(shù)據(jù)方面并沒有出臺相應(yīng)的法律法規(guī),保護(hù)不當(dāng)可能會帶來嚴(yán)重的安全風(fēng)險。在大數(shù)據(jù)時代,個體面臨的威脅并不僅限于個人的隱私泄露,還在于基于大數(shù)據(jù)對人們狀態(tài)和行為的預(yù)測,而這種隱性的數(shù)據(jù)暴露往往是個人無法預(yù)知和控制的。如通過分析學(xué)生關(guān)于閱讀的歷史紀(jì)錄,得到學(xué)生的愛好、興趣傾向等信息。
教育是塑造人的過程,而這種重塑是建立在社會的遺忘機制之上的。因為有了隨時間模糊的遺忘機制,個體才能夠不停地在記憶中構(gòu)建和重構(gòu)自己的過去,進(jìn)而接受不斷發(fā)展的自我與別人,才有能力從過去的經(jīng)歷中吸取教訓(xùn),并調(diào)整自身的行為以融入未來的社會[3]。由于數(shù)字化記憶缺少人類記憶中自主遺忘的功能,因此,完善的數(shù)字化記憶帶來的寒蟬效應(yīng)(指用戶害怕自己的言行遭到指責(zé)或者懲罰,不敢發(fā)表言論,如同蟬在寒冷天氣中噤聲一般)可能會改變或約束學(xué)生的行為,進(jìn)而影響學(xué)生的健康成長。
數(shù)據(jù)結(jié)論存在缺陷 雖然在教育實踐中運用數(shù)據(jù)指標(biāo)來評價教育并不一定是最好的方式,但也是必然要選擇的方式,因為無計量則無管理。由于教育中人的性格、美感、道德、價值觀等方面難以量化的現(xiàn)實,造成對教育指標(biāo)體系的“簡單化”處理。換言之,在實踐中利用某些數(shù)據(jù)(如成績)指標(biāo),并不是因為最有價值,而是最易計量。
數(shù)據(jù)分析的結(jié)論具有導(dǎo)向作用,由于數(shù)據(jù)體系的不完整以及算法模型的不完美,管理者的決策空間就會相應(yīng)地受到擠壓。雖然數(shù)據(jù)結(jié)論有一定的片面性,但是數(shù)據(jù)結(jié)論賦予管理策略合理性,加劇了學(xué)校對成績的關(guān)注而忽略了人文精神的培養(yǎng)。簡單的教育培養(yǎng)了簡單的學(xué)生:專制、占有欲強、缺乏審美情趣和道德感、自制力缺乏、攀比心太強……凡此種種,都是“簡單人格”的寫照,而在教育的輪回中,又在不斷復(fù)制并加劇這種“簡單化”。由此可見,數(shù)據(jù)結(jié)論的缺陷不僅反映了計量的必要性與科學(xué)性之間產(chǎn)生了矛盾,也體現(xiàn)了教育目標(biāo)的長遠(yuǎn)性與計量的短視性之間的矛盾。endprint
在數(shù)據(jù)結(jié)論的表達(dá)方面,許多的數(shù)據(jù)結(jié)論雖然是正確的,但相對于非統(tǒng)計專業(yè)的學(xué)校管理者來講,要么晦澀難懂,要么枯燥乏味,缺乏高效的數(shù)據(jù)表達(dá)方式,降低了信息傳遞和溝通的質(zhì)量。
3 教育大數(shù)據(jù)應(yīng)用過程中的對策
針對教育大數(shù)據(jù)應(yīng)用過程中存在的問題,提出以下對策。
互聯(lián)互通是基礎(chǔ) 統(tǒng)籌建設(shè)信息化基礎(chǔ)設(shè)施和應(yīng)用環(huán)境,達(dá)到高速可用、安全可靠、可信共享、泛在開放的水平,推動各級各類學(xué)校逐步優(yōu)化教育信息化基礎(chǔ)應(yīng)用環(huán)境,完善信息化設(shè)施配備,提升網(wǎng)絡(luò)保障能力。以可持續(xù)發(fā)展的教育信息化應(yīng)用環(huán)境為基礎(chǔ),構(gòu)建省市級教育大數(shù)據(jù)平臺,促進(jìn)各級各類學(xué)校數(shù)據(jù)共享,實現(xiàn)數(shù)據(jù)的統(tǒng)一開放、實時分析,破除“數(shù)據(jù)孤島”,推動教育大數(shù)據(jù)建設(shè)。
標(biāo)準(zhǔn)的數(shù)據(jù)指標(biāo)體系是根本 國家正在推行學(xué)生的“終身一人一號”統(tǒng)一學(xué)籍信息管理制度,各項數(shù)據(jù)都有了身份標(biāo)簽,為持續(xù)性記錄每個學(xué)生的學(xué)業(yè)表現(xiàn)與全面發(fā)展情況提供制度保障。在數(shù)據(jù)指標(biāo)體系方面,需要加強基礎(chǔ)設(shè)計,制定與國家教育信息化標(biāo)準(zhǔn)相銜接的統(tǒng)一的標(biāo)準(zhǔn)與規(guī)范,涉及數(shù)據(jù)的收集、分析與管理等方面,涵蓋基礎(chǔ)標(biāo)準(zhǔn)、數(shù)據(jù)處理標(biāo)準(zhǔn)、數(shù)據(jù)安全標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)、數(shù)據(jù)服務(wù)標(biāo)準(zhǔn)等。只有確保標(biāo)準(zhǔn)的一致性和權(quán)威性,才能在統(tǒng)一的大數(shù)據(jù)平臺內(nèi)統(tǒng)籌梳理數(shù)據(jù)來源和流向,集中管理各類基礎(chǔ)數(shù)據(jù),確保數(shù)據(jù)完整、可用、可整合,實現(xiàn)教育大數(shù)據(jù)的快速抽取、統(tǒng)一共享、及時挖掘。
人才與技術(shù)是關(guān)鍵 大數(shù)據(jù)時代課堂變得無處不在,如翻轉(zhuǎn)課堂的引入、數(shù)字校園的流行、云課堂的設(shè)想……課堂將不再是單一和被動的模式化、固態(tài)化的傳統(tǒng)課堂。課堂既可以是校內(nèi)的,也可以是校外的;既可以是現(xiàn)場的,也可以是網(wǎng)絡(luò)的,課堂空間被無限拓寬,課堂形式變得自由多元[4]。在動態(tài)變換的場景下面向多版本、多操作系統(tǒng)收集教育數(shù)據(jù),定義非結(jié)構(gòu)化數(shù)據(jù)的價值,研究新的算法模型以探尋教育因素之間的相關(guān)性等方面,都迫切需要人才與技術(shù)的支持。
新形勢下的教育不僅關(guān)注知識與技能的學(xué)習(xí),更加注重人文精神的培養(yǎng)。利用大數(shù)據(jù)挖掘興趣、性格等心理特征在教學(xué)與個人成長中的價值,更是需要多學(xué)科人才的合作。因此,需要組織教育學(xué)、數(shù)學(xué)、計算機科學(xué)、統(tǒng)計學(xué)等多學(xué)科的人員成立專門的教育大數(shù)據(jù)挖掘中心,打破信息不對稱,集聚各方智慧,引入多角度的評價方式,建立多樣化的指標(biāo)體系,通過技術(shù)攻關(guān)破解數(shù)據(jù)挖掘中的難題,并探究出美學(xué)形式與現(xiàn)實功能兼顧的數(shù)據(jù)可視化手段,實現(xiàn)數(shù)據(jù)結(jié)論的有效傳達(dá)與溝通。
數(shù)據(jù)服務(wù)與教學(xué)的深度融合是核心 教育大數(shù)據(jù)既服務(wù)于教育教學(xué),又來源于教育教學(xué),因此有必要通過優(yōu)質(zhì)數(shù)字化教育資源的建設(shè)與共享,深化信息技術(shù)與課堂教學(xué)的融合,拓展數(shù)據(jù)收集的類型與規(guī)模,提升教育大數(shù)據(jù)的服務(wù)空間。
由于技術(shù)水平的限制,不可能把千變?nèi)f化的教育行為提煉歸納進(jìn)一套或幾套模型里。數(shù)據(jù)模型的局限性決定了在教育實踐中需要對模型進(jìn)行檢驗,并通過技術(shù)改進(jìn)實現(xiàn)模型的迭代優(yōu)化,形成持續(xù)反饋的機制,進(jìn)而不斷提升數(shù)據(jù)分析的價值和有效性。由此可見,深化數(shù)據(jù)服務(wù)與教育教學(xué)的融合,不僅是促進(jìn)教學(xué)改革、提升教育質(zhì)量、實現(xiàn)教育均衡的重要手段,更是實現(xiàn)教育大數(shù)據(jù)驅(qū)動教育發(fā)展的必然選擇,無融合則無數(shù)據(jù),無數(shù)據(jù)則無服務(wù),無服務(wù)則無反饋,無反饋則無優(yōu)化。
數(shù)據(jù)管理是保障 注重數(shù)據(jù)的隱私保護(hù)與安全管理,出臺相關(guān)的管理辦法。按照分級管理、逐級負(fù)責(zé)的原則,健全網(wǎng)絡(luò)與信息安全管理責(zé)任體系,完善網(wǎng)絡(luò)與信息安全管理制度。明確數(shù)據(jù)管理各部門、人員的安全管理職責(zé),建立數(shù)據(jù)資源的保密等級,設(shè)計高性能、高可信度的教育大數(shù)據(jù)存儲系統(tǒng),建立數(shù)據(jù)安全應(yīng)急保障機制,為大數(shù)據(jù)平臺提供充分的安全保障。
學(xué)生的成長是一個過程,這一過程可能是緩慢而復(fù)雜的。針對教育大數(shù)據(jù)建立生命周期管理制度非常必要,對數(shù)據(jù)只進(jìn)行一定的控制,允許數(shù)據(jù)被模糊、被遺忘。給學(xué)生留一些自身需要的空間來定義自己,尊重學(xué)生重新塑造自己身份的自由,促使其在成長的道路上甩掉過去的包袱,調(diào)整自身的行為并融入未來,幫助其健康成長。
4 結(jié)語
教育發(fā)展必將迎來大數(shù)據(jù)驅(qū)動的新時代,大數(shù)據(jù)將幫助教育工作者找到更加合適的方法,提供更加廣闊的思路來為教育教學(xué)的決策提供數(shù)據(jù)支撐。立足于大數(shù)據(jù)發(fā)展的理論前沿和教育實踐的需要,才能強化數(shù)據(jù)對教育教學(xué)的服務(wù)與支撐,逐步完善對教育的認(rèn)識,回歸教育復(fù)雜性的本質(zhì)。
參考文獻(xiàn)
[1]楊現(xiàn)民,王榴卉,唐斯斯.教育大數(shù)據(jù)的應(yīng)用模式與政策建議[J].電化教育研究,2015(9):54-61.
[2]車品覺.決戰(zhàn)大數(shù)據(jù)[M].杭州:浙江人民出版社,2014.
[3]舍恩伯格.刪除:大數(shù)據(jù)取舍之道[M].袁杰,譯.杭州:浙江人民出版社,2013.
[4]吳地花.大數(shù)據(jù)時代的教育創(chuàng)新研究[J].教育探索,
2016(4):120-123.endprint