国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國際教育大數(shù)據(jù)研究的熱點、前沿和趨勢

2019-04-01 06:23蔣鑫洪明
中國遠(yuǎn)程教育 2019年2期
關(guān)鍵詞:教育大數(shù)據(jù)學(xué)習(xí)分析對比研究

蔣鑫 洪明

【摘要】大數(shù)據(jù)技術(shù)通過不同視角對教育數(shù)據(jù)進(jìn)行處理和分析,將教育的實時決策、學(xué)習(xí)的個性化變成現(xiàn)實。以WOS數(shù)據(jù)庫為數(shù)據(jù)來源,運(yùn)用文獻(xiàn)計量法、可視化分析法和內(nèi)容分析法,對國際教育大數(shù)據(jù)研究領(lǐng)域的現(xiàn)狀進(jìn)行分析發(fā)現(xiàn):教育大數(shù)據(jù)文獻(xiàn)發(fā)文量呈現(xiàn)增長態(tài)勢;美國和中國學(xué)者的科研產(chǎn)出較多,而新加坡學(xué)者顯示出較強(qiáng)的國際交流潛力與實力,由此形成“三足鼎立”之勢;高等院校則成為國際教育大數(shù)據(jù)研究的主要機(jī)構(gòu)群體;國際上已經(jīng)形成一支以揚(yáng)納基斯、馬爾達(dá)尼為代表的核心作者群,但核心作者之間分散性明顯、連接性較弱;研究熱點涉及大數(shù)據(jù)理論、處理技術(shù)以及學(xué)習(xí)方式等方向;發(fā)展脈絡(luò)顯示國際教育大數(shù)據(jù)研究已經(jīng)實現(xiàn)了由“技術(shù)主體”向“學(xué)習(xí)服務(wù)”的理念轉(zhuǎn)變,由宏觀理論探討轉(zhuǎn)向?qū)ξ⒂^具體問題的探究,隱私安全、數(shù)據(jù)挖掘必將受到持續(xù)關(guān)注。國內(nèi)學(xué)者需要對照國內(nèi)研究現(xiàn)狀,借鑒國際經(jīng)驗,立足自身研究特色,加強(qiáng)交流,避免研究出現(xiàn)“偏向”。

【關(guān)鍵詞】? 教育大數(shù)據(jù);對比研究;數(shù)據(jù)挖掘;學(xué)習(xí)分析;文獻(xiàn)計量法

【中圖分類號】? G434? ? ? 【文獻(xiàn)標(biāo)識碼】? A? ? ? 【文章編號】 1009-458x(2019)2-0026-13

一、引言

教育大數(shù)據(jù)是大數(shù)據(jù)的一個重要子集,特指教育領(lǐng)域的數(shù)據(jù)集合(裴瑩等, 2017)。隨著教育信息化的不斷推進(jìn)、教學(xué)方式的不斷變革,越來越多的數(shù)據(jù)出現(xiàn)在學(xué)習(xí)、教學(xué)以及學(xué)校管理之中。面對海量數(shù)據(jù),大數(shù)據(jù)技術(shù)通過不同視角對教育數(shù)據(jù)進(jìn)行處理和分析,將教育的實時決策、學(xué)習(xí)者的個性化學(xué)習(xí)變成現(xiàn)實(鄭燕林等, 2015; 張洪孟等, 2015)。在以互聯(lián)網(wǎng)、數(shù)據(jù)挖掘、學(xué)習(xí)分析等綜合技術(shù)為基礎(chǔ)的大數(shù)據(jù)時代,教育正悄然發(fā)生著深刻的變革,人類的學(xué)習(xí)和思維方式也在發(fā)生著重要的變化。在這一背景下,世界范圍內(nèi),許多國家的高校、科研院所等相繼成立了大數(shù)據(jù)研究機(jī)構(gòu),從不同視角開展對教育大數(shù)據(jù)的研究工作(McKinsey & Company, 2011)。不僅如此,2017年12月8日,習(xí)近平總書記在實施國家大數(shù)據(jù)戰(zhàn)略第二次集體學(xué)習(xí)會上強(qiáng)調(diào):“我們應(yīng)該審時度勢、精心謀劃、超前布局、力爭主動,深入了解大數(shù)據(jù)發(fā)展現(xiàn)狀和趨勢及其對經(jīng)濟(jì)社會發(fā)展的影響,分析我國大數(shù)據(jù)發(fā)展取得的成績和存在的問題,……更好地服務(wù)我國經(jīng)濟(jì)社會發(fā)展和人民生活改善?!蹦敲丛谶@種背景下,國際上有關(guān)教育大數(shù)據(jù)及其相關(guān)問題的研究究竟是一種怎樣的狀態(tài)?它經(jīng)歷了怎樣的演變軌跡?其熱點和前沿為何?國內(nèi)教育大數(shù)據(jù)研究又存在哪些特點?本文試圖從文獻(xiàn)分析的角度,對上述問題做出回答。

二、數(shù)據(jù)來源和方法

(一)數(shù)據(jù)來源

本次研究選擇了Web of Science(WOS)平臺下的核心數(shù)據(jù)庫作為文獻(xiàn)搜索來源。在檢索詞的確定方面,除選定“大數(shù)據(jù)(big data)”與“教育(education)”“教學(xué)(teaching)”“學(xué)習(xí)(learning)”的組合外,還采用了美國教育部在2012年10月發(fā)布的《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報告中的兩個重要概念“數(shù)據(jù)挖掘”“數(shù)據(jù)分析”(胡弼成等, 2015),增加了對“數(shù)據(jù)挖掘(data mining)”與“教育(education)”以及“數(shù)據(jù)分析(data analytics)”與“教育(education)”兩項復(fù)合檢索。本研究將文獻(xiàn)檢索的時間截止日設(shè)定為2017年12月31日,在去除重復(fù)文獻(xiàn)后,最終篩選出436篇論文,作為本次研究的主要數(shù)據(jù)來源。

(二)研究方法

本研究主要采用三種分析方法。一是文獻(xiàn)計量法。主要統(tǒng)計和分析國際上教育大數(shù)據(jù)研究文獻(xiàn)的發(fā)文時間、來源國家、發(fā)文機(jī)構(gòu)、作者發(fā)文量以及被引頻次,對教育大數(shù)據(jù)的研究現(xiàn)狀做出客觀評價。二是可視化分析方法。即借助CiteSpace可視化軟件生成教育大數(shù)據(jù)“文獻(xiàn)關(guān)鍵詞聚類圖”與“引文文獻(xiàn)共被引區(qū)視圖”,以此探索教育大數(shù)據(jù)研究的歷程與現(xiàn)狀,并對未來發(fā)展的趨勢進(jìn)行預(yù)測。三是內(nèi)容分析法。由于高被引文獻(xiàn)是構(gòu)成教育大數(shù)據(jù)研究的重要知識基礎(chǔ),具有重大的學(xué)術(shù)價值,因此對高被引文獻(xiàn)內(nèi)容進(jìn)行分析和描述是有必要的,這有助于我們深度了解國際教育大數(shù)據(jù)研究的熱點與前沿。

三、研究結(jié)果分析

(一)發(fā)文量年度變化趨勢分析

發(fā)文數(shù)量可顯示某一學(xué)科領(lǐng)域受關(guān)注的程度,逐年連續(xù)的發(fā)文量可反映該學(xué)科領(lǐng)域受關(guān)注程度的變化。圖1統(tǒng)計出WOS核心數(shù)據(jù)庫所收錄的歷年教育大數(shù)據(jù)文獻(xiàn)走勢。數(shù)據(jù)顯示,WOS核心數(shù)據(jù)庫收錄的最早的有關(guān)教育大數(shù)據(jù)的論文可追溯至2002年,該論文由斯洛文尼亞學(xué)者烏爾班契奇(Urbancic, T.)等撰寫,篇名為“基于網(wǎng)絡(luò)的數(shù)字挖掘分析與決策支持的教育(Web-based analysis of data mining and decision support education)”。他在該篇文獻(xiàn)中認(rèn)為,數(shù)據(jù)挖掘可以實現(xiàn)知識從學(xué)術(shù)到教育應(yīng)用的轉(zhuǎn)移,可為教育提供參考性決策,但卻未對“教育數(shù)據(jù)挖掘”的概念進(jìn)行明確界定(Urbancic, T., 2002)。這篇論文發(fā)表后的大約5年里,WOS核心數(shù)據(jù)庫再也沒有教育大數(shù)據(jù)主題的論文出現(xiàn),直至2007年才出現(xiàn)第二篇同類題材的論文。從2007年到2012年,雖然每年都有同類主題的論文問世,但每年的發(fā)文量均不超過10篇。而2013年是一個轉(zhuǎn)折點,當(dāng)年發(fā)文量直接突破10篇,達(dá)到21篇。此后每年都保持快速增長勢頭,其峰值在2016年達(dá)到140篇。

按照研究文獻(xiàn)的時間分布,可大致將教育大數(shù)據(jù)研究劃分為三個階段。從2002年到2006年為首篇之后的零增長階段,該階段教育大數(shù)據(jù)研究成果零星,雖目前僅有一篇可查閱,但該篇文獻(xiàn)卻為教育大數(shù)據(jù)研究奠定了基礎(chǔ);從2007年到2011年為緩慢增長階段,是教育大數(shù)據(jù)研究的起步階段,研究成果雖總體數(shù)量不多,但已開始呈現(xiàn)出逐年遞增的潛在趨勢(見圖1);從2012年到2016年為快速增長階段,相關(guān)文獻(xiàn)劇增,反映出國際范圍內(nèi)關(guān)于“教育大數(shù)據(jù)”的研究在這一時期開始呈現(xiàn)“井噴之勢”,至今尚未出現(xiàn)回落或“拐點”,國際對教育大數(shù)據(jù)的關(guān)注仍處于持續(xù)升溫的過程中。

(二)文獻(xiàn)來源的國別分析

文獻(xiàn)來源的國別統(tǒng)計可反映出各國對教育大數(shù)據(jù)研究的貢獻(xiàn)大小,了解教育大數(shù)據(jù)研究的熱點區(qū)域。本研究收集的436篇論文共來自58個國家(地區(qū)),區(qū)域分布較為廣泛。表1統(tǒng)計了教育大數(shù)據(jù)研究領(lǐng)域發(fā)文量居前十位的國家,這十個國家的作者共參與了414篇論文的發(fā)表,占論文總量的95.0%。從表1來看,中國、美國發(fā)文量分別高達(dá)146篇和131篇,遠(yuǎn)高于其他國家,在教育大數(shù)據(jù)研究領(lǐng)域具有絕對領(lǐng)先地位,展現(xiàn)出較強(qiáng)的科研產(chǎn)出能力及學(xué)術(shù)研究實力。

在被引頻次方面,436篇樣本文獻(xiàn)共被引用2,422次。被引頻次最高的是美國學(xué)者,達(dá)到855次;被引頻次最少的有捷克、奧地利等19個國家,被引頻次均為0次??梢钥闯?,教育大數(shù)據(jù)雖然已經(jīng)成為世界各國的研究熱點,但總被引頻次卻差異較大,論文認(rèn)可度高低不同。美國學(xué)者在教育大數(shù)據(jù)研究成果國際化方面展現(xiàn)了相當(dāng)?shù)膶嵙?,這與美國教育技術(shù)在全球占據(jù)顯著優(yōu)勢的學(xué)術(shù)地位或有密切關(guān)系。而中國學(xué)者研究成果的總被引頻次為563次,高居第二位,呈現(xiàn)出一定的發(fā)展?jié)摿Α?/p>

從篇均被引頻次看,新加坡學(xué)者被引頻次最高,平均每篇論文被引用達(dá)到14次,德國、西班牙學(xué)者緊隨其后,分別達(dá)到7.38次和7.07次??梢?,新加坡學(xué)者研究成果質(zhì)量較高,在國際范圍內(nèi)獲得了較高的認(rèn)可度,具備了強(qiáng)勁的交流潛力和現(xiàn)實交流能力。而中國學(xué)者雖在發(fā)文量上優(yōu)勢較大,但在篇均被引頻次方面與新加坡、美國等國家學(xué)者存在一定的差距,僅為3.86次,研究成果質(zhì)量仍需進(jìn)一步提高。

(三)核心作者分析

學(xué)科領(lǐng)域核心作者在很大程度上影響著學(xué)科發(fā)展的方向和速度,因此,對核心作者論文發(fā)表情況進(jìn)行分析則具有指標(biāo)性的價值和意義(張敏等, 2014)。經(jīng)統(tǒng)計,教育大數(shù)據(jù)研究領(lǐng)域的這436篇核心文獻(xiàn)中共有1,232位作者。我們引入國際上比較流行的核心作者計算公式——普萊斯(Price)公式作為遴選核心作者的量化標(biāo)準(zhǔn):Ni=0.749[Nm],其中Nm為教育大數(shù)據(jù)最高產(chǎn)作者的發(fā)文量,Ni為能夠入選核心作者的發(fā)文量最低標(biāo)準(zhǔn)。在本研究中,最高產(chǎn)作者為來自美國的揚(yáng)納基斯(Giannakis, G. B. )教授,共有6篇教育大數(shù)據(jù)文獻(xiàn)發(fā)表。經(jīng)過計算,入選核心作者的最低發(fā)文量為Ni=1.83≈2篇。經(jīng)過統(tǒng)計分析,共有104位作者發(fā)文量不少于2篇,約占作者總數(shù)的8.44%,另有1,128位作者均只有1篇有關(guān)教育大數(shù)據(jù)的論文發(fā)表。從以上數(shù)據(jù)可以看出,目前國際上從事有關(guān)教育大數(shù)據(jù)研究的作者雖然較多,但大多為尚未形成長期、穩(wěn)定的研究方向的瞬時作者。不僅如此,當(dāng)我們利用CiteSpace軟件,選擇作者為節(jié)點類型,形成教育大數(shù)據(jù)核心作者共現(xiàn)圖譜(圖2),可以看到,作者之間未形成中心性,這一點從圖2也可得到印證,作者群“孤島”較多,104位核心作者僅有42條連線,說明作者群之間缺乏跨地區(qū)的交流和協(xié)作。

根據(jù)普萊斯理論:“核心作者的發(fā)文量約為發(fā)文總量的50%,大約10%的杰出科研工作者發(fā)表論文約占全部論文的一半”(趙新亮等, 2017)。本研究中發(fā)文量超過2篇的104位作者共有228篇論文發(fā)表,從這個角度而言,教育大數(shù)據(jù)研究領(lǐng)域的國際核心作者群已經(jīng)形成。圖3為教育大數(shù)據(jù)研究發(fā)文量排名前九位的高產(chǎn)作者統(tǒng)計。

如圖3所示,美國學(xué)者揚(yáng)納基斯發(fā)文量最高,他共參與了6篇有關(guān)教育大數(shù)據(jù)論文的發(fā)表。這說明他對教育大數(shù)據(jù)問題保持著較高的研究興趣,科研產(chǎn)出較多。揚(yáng)納基斯來自美國明尼蘇達(dá)大學(xué),他與馬爾達(dá)尼(Mardani, M.)合作在數(shù)據(jù)挖掘方向進(jìn)行了大量研究,共同嘗試以回歸、分類、聚類的方式對大數(shù)據(jù)進(jìn)行提取分析,在教育大數(shù)據(jù)領(lǐng)域影響力較大,他們共同為教育大數(shù)據(jù)領(lǐng)域的理論發(fā)展與實踐探索做出了巨大貢獻(xiàn)。

(四)文獻(xiàn)發(fā)表機(jī)構(gòu)分析

文獻(xiàn)標(biāo)屬來源機(jī)構(gòu)統(tǒng)計可以幫助我們確認(rèn)教育大數(shù)據(jù)研究的熱點機(jī)構(gòu)。表2篩選出了發(fā)文量居前十位的機(jī)構(gòu)。在這前十位的機(jī)構(gòu)中,僅有中國科學(xué)院一家是科研機(jī)構(gòu),而其余九家均是高等院校。由此可見,國際上,高等院校已經(jīng)構(gòu)成了教育大數(shù)據(jù)研究成果的主要來源。究其原因,一方面從人力資源的角度來看,高校院系擁有對教育大數(shù)據(jù)應(yīng)用領(lǐng)域更為關(guān)注的學(xué)術(shù)“領(lǐng)軍者”及高端學(xué)術(shù)人才,如圖3中所示的揚(yáng)納基斯等人,他們既能接觸到國內(nèi)外相同或相近研究領(lǐng)域的最新動態(tài)和前沿成果,又具有很高的學(xué)術(shù)熱情和科研能力;另一方面從學(xué)術(shù)氛圍的角度來看,隨著教育信息化的不斷深入,高校環(huán)境為大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用提供了“沃土”,高校院系和教育者根據(jù)自身發(fā)展的需求,重視對新興領(lǐng)域的挖掘開發(fā)和科學(xué)研究,塑造了良好的學(xué)術(shù)氛圍。

從地域分布看,在教育大數(shù)據(jù)研究發(fā)文量居前十位的機(jī)構(gòu)中,有五所高校來自美國,可見美國高校對教育大數(shù)據(jù)保持了較高的研究興趣,在全球教育大數(shù)據(jù)研究領(lǐng)域占有強(qiáng)勢學(xué)術(shù)地位,尤其是排名第一位的明尼蘇達(dá)大學(xué),其名下的教育大數(shù)據(jù)研究論文高達(dá)8篇,科學(xué)產(chǎn)出能力較強(qiáng),而核心作者揚(yáng)納基斯和馬爾達(dá)尼教授均是來自此大學(xué),充分顯示該校在教育大數(shù)據(jù)研究領(lǐng)域的國際性影響力與實力。另外,中國的三所機(jī)構(gòu),中國科學(xué)院、華中科技大學(xué)、大連理工大學(xué),均榜上有名,發(fā)文量分列第二、三、六位??梢钥闯?,來自美國、中國的學(xué)術(shù)機(jī)構(gòu)已經(jīng)發(fā)展為國際上教育大數(shù)據(jù)研究的主體力量。

從被引頻次看,來自中國科學(xué)院的研究成果總被引頻次最高,達(dá)到169次,可以看出中國科學(xué)院的學(xué)者對教育大數(shù)據(jù)的研究成果較受國際學(xué)者的認(rèn)可。2014年,中國科學(xué)院成立了大數(shù)據(jù)挖掘與知識管理重點實驗室,較早地對數(shù)據(jù)科學(xué)理論、智能知識管理以及諸多交叉領(lǐng)域開展了理論和應(yīng)用研究。從篇均被引頻次看,來自中國科學(xué)院的學(xué)者的研究成果同樣也是名列榜首,這也說明了中國科學(xué)院學(xué)者在研究方向、視角、范式等方面均保持較高的國際水準(zhǔn),較受國外學(xué)者的歡迎,在教育大數(shù)據(jù)研究的國際舞臺中扮演了重要角色。

(五)教育大數(shù)據(jù)研究的熱點分析

關(guān)鍵詞是對整篇文獻(xiàn)的概括,關(guān)鍵詞出現(xiàn)頻次的高低可以在一定程度上作為判斷某研究方向在領(lǐng)域內(nèi)是否為研究熱點提供了重要的論證依據(jù)。而中心度是衡量研究熱度的另一重要指標(biāo),在某種意義上而言,中心度度量節(jié)點在系統(tǒng)中的重要程度,體現(xiàn)著關(guān)鍵詞節(jié)點在不同聚類之間的樞紐作用。這兩個指標(biāo)可以為確定研究熱點提供重要參考,而從二者的一致性和差異性可以有效地探尋出國際教育大數(shù)據(jù)不同研究方向之間的耦合關(guān)系,為我們深入分析國際教育大數(shù)據(jù)研究的熱點和現(xiàn)狀提供有價值的參考和論據(jù)。本研究借助CiteSpace軟件,通過關(guān)鍵詞的聚類功能對436篇樣本文獻(xiàn)進(jìn)行關(guān)鍵詞共現(xiàn)分析,形成了教育大數(shù)據(jù)研究關(guān)鍵詞聚類圖,如圖4所示。

在圖4中,一個節(jié)點代表一個關(guān)鍵詞,節(jié)點越大說明關(guān)鍵詞出現(xiàn)的頻次越高,而中心度則是衡量節(jié)點權(quán)利大小的重要指標(biāo),是體現(xiàn)節(jié)點在網(wǎng)絡(luò)中相對地位和重要性的度量,顯示著關(guān)鍵詞節(jié)點在不同聚類之間或者界面上的樞紐作用。將關(guān)鍵詞的中心度與頻次之間的一致性及差異進(jìn)行對比,可以有效地探尋出教育大數(shù)據(jù)熱點領(lǐng)域之間的關(guān)系。表3為CiteSpace軟件統(tǒng)計出的頻次排名前20位的關(guān)鍵詞。

關(guān)鍵詞出現(xiàn)頻次越高,說明這個關(guān)鍵詞在所有文獻(xiàn)中出現(xiàn)的概率越高,那么這個關(guān)鍵詞涉及的方向可能越受學(xué)者們的關(guān)注,越可能是研究的熱點問題。由圖4所示,關(guān)鍵詞“大數(shù)據(jù)(big data)”的節(jié)點最大。據(jù)表3所示,該關(guān)鍵詞出現(xiàn)頻次為154次,由于“big data”是數(shù)據(jù)來源的重要檢索詞之一,因此其出現(xiàn)頻次最高并不足為奇。而“機(jī)器學(xué)習(xí)(machine learning)”“數(shù)據(jù)挖掘(data mining)”的頻次分別居第二、三位(40次和39次),說明這兩個關(guān)鍵詞在教育大數(shù)據(jù)領(lǐng)域較受學(xué)者們關(guān)注,反映這兩個關(guān)鍵詞相關(guān)的研究方向為教育大數(shù)據(jù)研究領(lǐng)域中較為核心的研究內(nèi)容,借助數(shù)據(jù)處理技術(shù)實現(xiàn)教育數(shù)據(jù)的挖掘可能是目前國際教育大數(shù)據(jù)研究的重要方向。另外,關(guān)鍵詞“分級(classification)”“回歸(regression)”“學(xué)習(xí)分析(learning analytics)”“學(xué)校(school)”“分析(analytics)”“深度學(xué)習(xí)(deep learning)”“安全(security)”“教育(education)”“模式(model)”的出現(xiàn)頻次也超過10次,可以推斷,在教育大數(shù)據(jù)研究領(lǐng)域中,這些關(guān)鍵詞所代表的研究方向也受到國際學(xué)者的較多關(guān)注。

在中心度值方面,“數(shù)據(jù)挖掘(data mining)”值最高,達(dá)到0.32,這說明數(shù)據(jù)挖掘在整個網(wǎng)絡(luò)結(jié)構(gòu)中處于最為重要的地位,連接教育大數(shù)據(jù)領(lǐng)域各個研究熱點的“橋梁”作用明顯。結(jié)合其出現(xiàn)頻次可知,數(shù)據(jù)挖掘是教育領(lǐng)域大數(shù)據(jù)研究的重要熱點方向;“機(jī)器學(xué)習(xí)(machine learning)”和“學(xué)習(xí)分析(learning analytics)”的中心度值分別居第二和第三位,均為0.28,說明“機(jī)器學(xué)習(xí)(machine learning)”和“學(xué)習(xí)分析(learning analytics)”在教育大數(shù)據(jù)研究領(lǐng)域的內(nèi)部連接作用也較強(qiáng),表現(xiàn)出較強(qiáng)的關(guān)聯(lián)性。這也可能預(yù)示著,在教育信息化背景下,機(jī)器學(xué)習(xí)或許可為海量數(shù)據(jù)精確、高效地分析并服務(wù)學(xué)習(xí)提供重要的參考路徑。“機(jī)器學(xué)習(xí)(machine learning)”在網(wǎng)絡(luò)結(jié)構(gòu)圖中不僅中心度值較高,節(jié)點位置較為重要,而且在教育大數(shù)據(jù)領(lǐng)域出現(xiàn)頻次較高,說明機(jī)器學(xué)習(xí)即是目前教育大數(shù)據(jù)研究的熱點領(lǐng)域,也是研究的核心方向。而機(jī)器學(xué)習(xí)又作為人工智能的重要分支,其相關(guān)理論或可為教育大數(shù)據(jù)研究發(fā)展提供重要的理論借鑒與支撐,應(yīng)引起我們的關(guān)注。

此外,在本研究中,我們也發(fā)現(xiàn)存在中心度和頻次不一致的情況,這是由于關(guān)鍵詞的頻次和中心度是從不同視角反映教育大數(shù)據(jù)研究領(lǐng)域的熱點分布情況,而二者的對比恰可幫助我們把握教育大數(shù)據(jù)研究領(lǐng)域的重點。在表3中,關(guān)鍵詞“云計算(cloud computing)”“高等教育(higher education)”中心度值分別為0.27、0.25,排名靠前,說明云計算、高等教育在關(guān)鍵詞聚類圖中的地位較為重要,溝通和連接教育大數(shù)據(jù)領(lǐng)域內(nèi)部不同熱點方向的作用明顯,但出現(xiàn)頻次卻僅為9次、8次,體現(xiàn)了這些研究內(nèi)容在溝通與連接其他研究熱點方面雖然有重要的橋梁作用,但被關(guān)注的程度還有待加強(qiáng)。國際學(xué)者應(yīng)提高對大數(shù)據(jù)背景下高等教育、云計算研究的重視,促進(jìn)教育大數(shù)據(jù)研究的完善。

美國新媒體聯(lián)盟2016年發(fā)布的《2016 地平線報告(高教版)》指出,個性化是在開放環(huán)境中實現(xiàn)教育公平的重要手段,個性化要求教學(xué)不按照同質(zhì)的教學(xué)資源開展同質(zhì)的教學(xué),在未來五年內(nèi),如何通過技術(shù)滿足所有學(xué)生的個性化學(xué)習(xí)需求仍將會是世界范圍內(nèi)的難題(NMC Horizon Report, 2016)。對高等教育的關(guān)注度不夠突出,可能與目前的研究與應(yīng)用主要局限于進(jìn)行技術(shù)上的個體嘗試,尚未實現(xiàn)整體化、規(guī)?;茝V有關(guān)(金慧等, 2016)。而對云計算進(jìn)行追本溯源,其最初是作為一種新型的商業(yè)數(shù)據(jù)處理模式出現(xiàn)的,它可將計算任務(wù)分布在由大量計算機(jī)構(gòu)成的資源池上,有效地幫助用戶根據(jù)需要獲取計算力、存儲空間和各種軟件服務(wù)。隨著在線教育的逐漸推廣,研究表明,以云計算處理教育數(shù)據(jù)可有效改善在線課程中固有的師生交互低下的劣勢,幫助教師及時調(diào)整授課內(nèi)容,從而確定最有效的課程元素。而目前教育大數(shù)據(jù)研究者對云計算的關(guān)注熱度不高,可能與云計算主要作為典型的商業(yè)計算模型,而尚未探討出合理處理教育領(lǐng)域大數(shù)據(jù)的有效模式有關(guān)(張懷南等, 2013)。

另外有一些關(guān)鍵詞“分級(classification)”“回歸(regression)”的中心度值不高,說明這些領(lǐng)域關(guān)聯(lián)度相對較弱,但出現(xiàn)頻次卻較高,體現(xiàn)了國際學(xué)者對數(shù)據(jù)處理技術(shù)的重視,這種反差現(xiàn)象應(yīng)引起我們的警覺。學(xué)者應(yīng)注重大數(shù)據(jù)與云計算相融合,增加對大數(shù)據(jù)技術(shù)服務(wù)高等教育領(lǐng)域、改善學(xué)習(xí)效果的關(guān)注,避免陷入“唯技術(shù)”的窘境,促進(jìn)教育大數(shù)據(jù)研究的全面發(fā)展。

綜上所述,借助關(guān)鍵詞頻次和中心度的統(tǒng)計與分析,我們可以概括出目前教育大數(shù)據(jù)研究的國際熱點主要聚焦于以下幾個方面。

一是關(guān)注教育大數(shù)據(jù)的基礎(chǔ)理論和應(yīng)用。代表關(guān)鍵詞有“學(xué)校(school)”“大數(shù)據(jù)(big data)”“高等教育(higher education)”“風(fēng)險(risk)”等。這個方向的焦點總體看來可以劃分為兩個方面:首先是教育大數(shù)據(jù)的基本概念、內(nèi)涵等方面,對教育大數(shù)據(jù)的基本特征和作用進(jìn)行研究和概括;其次是教育大數(shù)據(jù)的應(yīng)用研究,主要是在高等教育、基礎(chǔ)教育領(lǐng)域的應(yīng)用探究,重點探討了信息化時代背景下大數(shù)據(jù)技術(shù)對傳統(tǒng)教育的顛覆和對教學(xué)改革的推進(jìn)。

二是聚焦大數(shù)據(jù)處理技術(shù)在教育領(lǐng)域的應(yīng)用。代表關(guān)鍵詞有“數(shù)據(jù)挖掘(data mining)”“機(jī)器學(xué)習(xí)(machine learning)”“教育數(shù)據(jù)挖掘(educational data mining)”“分布式(distributed)”“云計算(cloud computing)”“可視化(visualization)”等。這個方向的研究者主要對數(shù)據(jù)的分析技術(shù)進(jìn)行探討,關(guān)注如何依靠數(shù)據(jù)技術(shù)實現(xiàn)對海量教育數(shù)據(jù)的分析和挖掘。分布式、可視化、數(shù)據(jù)挖掘是目前大數(shù)據(jù)技術(shù)服務(wù)教育領(lǐng)域的主要方式,尤其教育數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)預(yù)示著基于海量學(xué)習(xí)數(shù)據(jù)的統(tǒng)計分析基礎(chǔ)上實現(xiàn)智能化的發(fā)現(xiàn)和預(yù)測,可能代表著未來教育的潛在模式。

三是關(guān)注大數(shù)據(jù)背景下學(xué)習(xí)方式研究。代表關(guān)鍵詞有“深度學(xué)習(xí)(deep learning)”“在線學(xué)習(xí)(online learning)”“電子學(xué)習(xí)(e-learning)”“學(xué)習(xí)分析(learning analytics)”“效果(effect)”“績效(performance)”等。這方面重點分析基于大數(shù)據(jù)技術(shù)的個性化學(xué)習(xí)模式給教育帶來的巨大變革,推進(jìn)深度學(xué)習(xí)、實踐以及問題解決為導(dǎo)向的教學(xué)模式改革。隨著互聯(lián)網(wǎng)等技術(shù)在教育中的不斷應(yīng)用,新型學(xué)習(xí)方式不斷涌現(xiàn),電子學(xué)習(xí)、在線學(xué)習(xí)等改變了傳統(tǒng)的教育方式,也促進(jìn)新型而適宜的教學(xué)模式和學(xué)習(xí)環(huán)境的形成與構(gòu)建。大數(shù)據(jù)技術(shù)可以深入學(xué)習(xí)情境,發(fā)現(xiàn)隱性規(guī)律,為教育者提供有關(guān)學(xué)習(xí)者學(xué)習(xí)風(fēng)格、學(xué)習(xí)行為等的重要信息,實現(xiàn)教育決策的科學(xué)與精準(zhǔn)預(yù)測。

(六)教育大數(shù)據(jù)研究演進(jìn)脈絡(luò)分析

數(shù)據(jù)演進(jìn)脈絡(luò)可以直觀地反映出教育大數(shù)據(jù)研究的發(fā)展軌跡,對于我們把握教育大數(shù)據(jù)研究的發(fā)展趨勢和前沿都有著重要意義。引用文獻(xiàn)和關(guān)鍵詞變化可為數(shù)據(jù)演進(jìn)脈絡(luò)梳理提供重要參考。其中引用文獻(xiàn)又作為論文來源的重要知識基礎(chǔ),對我們分析論文背后關(guān)注方向的轉(zhuǎn)變具有重要的參考價值。

我們將樣本數(shù)據(jù)導(dǎo)入軟件,設(shè)定參數(shù)運(yùn)行程序,形成文獻(xiàn)共被引網(wǎng)絡(luò)圖譜(如圖5)。

在網(wǎng)絡(luò)圖譜中共形成節(jié)點257個,每個節(jié)點代表一篇引文文獻(xiàn),節(jié)點的大小代表引文被引用的頻次高低,引文之間的引用關(guān)系則通過連線表示。我們按照被引頻次,篩選出被引高于10次的9篇引文文獻(xiàn),將這9篇文獻(xiàn)作為國際教育大數(shù)據(jù)研究的高被引文獻(xiàn),按照時間排列如表4所示。

從被引頻次看,這9篇引文文獻(xiàn)反映了國際教育大數(shù)據(jù)研究領(lǐng)域的高影響力文獻(xiàn)和前沿文獻(xiàn),可視為國際教育大數(shù)據(jù)領(lǐng)域重要的知識載體。借助引文文獻(xiàn)年份的變化可以窺探出國際教育大數(shù)據(jù)研究領(lǐng)域關(guān)注熱點的演變,歸納出教育大數(shù)據(jù)研究的發(fā)展脈絡(luò)和前沿。

此外,根據(jù)關(guān)鍵詞的首次出現(xiàn)年份,我們編制出關(guān)鍵詞時間統(tǒng)計表,通過關(guān)鍵詞中心度值的變化分析,可為梳理教育大數(shù)據(jù)研究的發(fā)展脈絡(luò)提供內(nèi)容觀測的時間窗口。

高被引文獻(xiàn)構(gòu)成了國際教育大數(shù)據(jù)研究的知識基礎(chǔ),而關(guān)鍵詞的演變在一定程度上可以反映出教育大數(shù)據(jù)研究的熱點演變。根據(jù)圖1及我們所做的分析,教育大數(shù)據(jù)研究比較關(guān)鍵的年份為2002年和2013年,這兩個年份可以視為教育大數(shù)據(jù)研究開始出現(xiàn)和大規(guī)模發(fā)展的重要時間節(jié)點;而從表5高頻關(guān)鍵詞中心度大小看,教育大數(shù)據(jù)研究具有重要影響力的節(jié)點出現(xiàn)在2008年、2010年和2013年,這些年份分別出現(xiàn)了“數(shù)據(jù)挖掘(data mining)”“高等教育(higher education)”和“機(jī)器學(xué)習(xí)(machine learning)”這三個較為重要的高頻關(guān)鍵詞,高頻關(guān)鍵詞每年的變化代表著研究內(nèi)容的不斷切換。依據(jù)高頻關(guān)鍵詞在不同時段的集合和聚類,我們可將國際教育大數(shù)據(jù)研究發(fā)展分為以下幾個階段:

1. 第一階段(2002年至2008年):教育大數(shù)據(jù)研究的萌芽階段

數(shù)據(jù)處理技術(shù)是這一階段探討的重點主題,這一點集中體現(xiàn)在關(guān)鍵詞“數(shù)據(jù)挖掘(data mining)”之中,其中心度值最高達(dá)到0.71。這一階段發(fā)表的高被引的文獻(xiàn)開啟了國際教育大數(shù)據(jù)研究的先河,新加坡南洋理工大學(xué)黃廣斌(Huang, G. B. )和加拿大多倫多大學(xué)辛頓(Hinton, G. E. )的被引論文是這一時期的代表。黃廣斌(Huang, G. B., 2004)提出可通過優(yōu)化算法改進(jìn)“極限學(xué)習(xí)機(jī)”,從而促進(jìn)學(xué)習(xí)者快速有效的學(xué)習(xí);辛頓(Hinton, G. E., 2006)強(qiáng)調(diào)用“喚醒算法”(wake- sleep)促進(jìn)學(xué)生的深度學(xué)習(xí)。由此可見,從算法等技術(shù)的角度實現(xiàn)挖掘數(shù)據(jù)是這一時期學(xué)者的主要探討方向。雖然在這一時期尚未明確提出“教育大數(shù)據(jù)”“教育數(shù)據(jù)挖掘”的概念,但已有學(xué)者從技術(shù)的視角,嘗試了數(shù)據(jù)處理技術(shù)在教育領(lǐng)域應(yīng)用的可能性,開啟了國際教育大數(shù)據(jù)研究的先河,迪恩(Dean, J., 2008)在“Mapreduce:Simplified data processing on large clusters”一文中,對Map-reduce程序進(jìn)行了編譯,可將其應(yīng)用于數(shù)據(jù)處理,該模型極大簡化了傳統(tǒng)的并行計算編程模型,提高了并行計算的效率。該篇文獻(xiàn)被引頻次高達(dá)26次,可見該文獻(xiàn)成為較多后續(xù)研究的基礎(chǔ)文獻(xiàn),受到較多關(guān)注。不過,結(jié)合圖1可知,這一階段學(xué)者們的發(fā)文量尚十分有限,教育大數(shù)據(jù)發(fā)展尚處于技術(shù)孕育的萌芽階段。該階段主要是學(xué)者對大數(shù)據(jù)應(yīng)用于教育領(lǐng)域的思考,雖然首次出現(xiàn)了物聯(lián)網(wǎng)、數(shù)據(jù)挖掘等關(guān)鍵詞,但研究并不深入,研究的內(nèi)容也較局限于各種數(shù)據(jù)處理技術(shù)及其對教育的影響和啟發(fā)。

2. 第二階段(2009年至2010年):教育大數(shù)據(jù)研究的興起階段

基于前期技術(shù)的鋪墊,這一時期開始進(jìn)入“教育數(shù)據(jù)的發(fā)現(xiàn)階段”。從表5可知,這一時期關(guān)鍵詞“高等教育(higher education)”“教育(education)”中心度值較高,分別達(dá)到0.25和0.16,關(guān)鍵詞“技術(shù)(technology)”表明學(xué)界對傳統(tǒng)數(shù)據(jù)挖掘技術(shù)依然保持關(guān)注,而“教育(education)”和“大數(shù)據(jù)(big data)”等關(guān)鍵詞的出現(xiàn)則代表著這一時期學(xué)者們就信息化時代背景下大數(shù)據(jù)技術(shù)對傳統(tǒng)教育的顛覆和對教學(xué)改革的推進(jìn)的可能性進(jìn)行了探討,教育大數(shù)據(jù)的研究開始逐漸向“發(fā)現(xiàn)教育數(shù)據(jù)”階段過渡。西班牙學(xué)者羅梅羅(Romero, C. )等作為較早注意到教育數(shù)據(jù)作用的權(quán)威,最早對教育數(shù)據(jù)挖掘(EDM)的概念進(jìn)行定義,明確提出如下觀點:教育大數(shù)據(jù)技術(shù)能夠深入探尋學(xué)生的學(xué)習(xí)情境;海量數(shù)據(jù)可為教育規(guī)律的發(fā)現(xiàn)提供重要的樣本基礎(chǔ);基于數(shù)據(jù)驅(qū)動的挖掘機(jī)理和學(xué)習(xí)分析可以對學(xué)習(xí)行為做出精準(zhǔn)的分析(Romero, C. & Ventura, S., 2010)。除此之外,黃曉英(Huang, X. Y., 2010)對教育數(shù)據(jù)挖掘在高等教育領(lǐng)域的應(yīng)用前景也進(jìn)行了分析,認(rèn)為數(shù)據(jù)挖掘可以用于對學(xué)習(xí)者課堂復(fù)雜行為的預(yù)測,數(shù)據(jù)處理技術(shù)可以幫助教育者還原教育本質(zhì),塑造民主、和諧的課堂氣氛。不僅如此,關(guān)鍵詞“評價(evaluation)”的出現(xiàn)說明,學(xué)者對大數(shù)據(jù)重塑教育評價系統(tǒng)的關(guān)注,打破以考試和作業(yè)為指標(biāo)的傳統(tǒng)衡量方式,將傳統(tǒng)的單一的經(jīng)驗式評價轉(zhuǎn)變?yōu)榛诮逃髷?shù)據(jù)的過程式評價,挖掘更為隱性的學(xué)習(xí)者特征。總之,這一時期的關(guān)鍵詞主要集中在“教育(education)”“評價(evaluation)”等主題中,表明此階段大數(shù)據(jù)研究開始擺脫單純對技術(shù)的依賴,逐漸向?qū)W習(xí)方式和教學(xué)活動領(lǐng)域滲透。

3. 第三階段(2011年至2012年):教育大數(shù)據(jù)研究的初步發(fā)展階段

這一時期的研究熱點由大數(shù)據(jù)技術(shù)教育應(yīng)用的可行性探討轉(zhuǎn)向大數(shù)據(jù)技術(shù)對教育決策的支持探究,開啟了由“發(fā)現(xiàn)數(shù)據(jù)”向“挖掘數(shù)據(jù)”轉(zhuǎn)變的初步嘗試,開始聚焦教育數(shù)據(jù)挖掘技術(shù)的預(yù)測和決策功能。與上一階段不同的是,這一時期關(guān)鍵詞主要集中在“知識(knowledge)”“發(fā)現(xiàn)(discovery)”“學(xué)生(student)”“決策(decision)”等方面,表明研究開始側(cè)重對教育數(shù)據(jù)的升華,以及大數(shù)據(jù)技術(shù)在教育具體方向的嘗試性應(yīng)用。大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用從本質(zhì)而言就是數(shù)據(jù)經(jīng)過分析處理后,逐步提升為信息和知識,實現(xiàn)從底層向頂層的升華(王萍,? 2015)。2011年。麥肯錫報告正式標(biāo)志著“大數(shù)據(jù)時代”的來臨。美國政府率先做出回應(yīng),2012年,奧巴馬政府在白宮網(wǎng)站發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》,宣布投資2 億美元到大數(shù)據(jù)領(lǐng)域,以推動轉(zhuǎn)變現(xiàn)有的教學(xué)與學(xué)習(xí)方式,這一舉動引發(fā)世界的關(guān)注。如何直接使大數(shù)據(jù)技術(shù)在短時間內(nèi)對教育產(chǎn)生深刻影響,實現(xiàn)下層抽象數(shù)據(jù)由向上層知識的轉(zhuǎn)換則引發(fā)了學(xué)者更深層次的思考。印度學(xué)者夏爾馬(Sharma, M., 2011)認(rèn)為,預(yù)測功能是大數(shù)據(jù)技術(shù)在教育中最直接的應(yīng)用,他嘗試以自組織樹算法(SOTA)對學(xué)生在線學(xué)習(xí)日志中的數(shù)據(jù)進(jìn)行分析,并成功對學(xué)生成績進(jìn)行了預(yù)測,實證結(jié)果表明,預(yù)測成績與學(xué)生真實成績呈現(xiàn)出高契合度。在教育領(lǐng)域應(yīng)用抽象數(shù)據(jù),實現(xiàn)預(yù)測導(dǎo)向,對數(shù)據(jù)處理技術(shù)也提出了更高的要求,關(guān)鍵詞“技術(shù)(technology)”的持續(xù)出現(xiàn)也印證了這一點,數(shù)據(jù)挖掘技術(shù)依然受到學(xué)者的重視,但與之前不同的是,這一時期學(xué)者賦予技術(shù)更明確的針對性,以已有的技術(shù)模型和方法評估學(xué)生的學(xué)習(xí)進(jìn)程,并嘗試對學(xué)習(xí)績效進(jìn)行預(yù)測進(jìn)而發(fā)現(xiàn)潛在的問題成為這一時期學(xué)者探究的關(guān)鍵。黃廣斌通過改良極限學(xué)習(xí)算法完善了自適應(yīng)學(xué)習(xí)系統(tǒng)的架構(gòu),實現(xiàn)了更有效的基于數(shù)據(jù)驅(qū)動的挖掘機(jī)理和學(xué)習(xí)分析,為在學(xué)習(xí)情境中實現(xiàn)精準(zhǔn)預(yù)測奠定了重要基礎(chǔ)(黃廣斌, 2012)??傊穗A段學(xué)者圍繞數(shù)據(jù)的預(yù)測和決策功能的探討,是教育數(shù)據(jù)服務(wù)教學(xué)的最初嘗試。

4. 第四階段(2013年至今):教育大數(shù)據(jù)研究的深入發(fā)展階段

教育大數(shù)據(jù)研究在這一時期開始呈現(xiàn)多元、深入的發(fā)展趨勢,研究聚焦開始轉(zhuǎn)向更為具體的微觀層面,基于上一階段對教育數(shù)據(jù)利用的初步探究后,學(xué)者對如何進(jìn)一步實現(xiàn)數(shù)據(jù)的有效利用進(jìn)行了更多維的探討。關(guān)鍵詞“雅虎(Yahoo)”“智慧(smart)”“個性化學(xué)習(xí)(personalized learning)”“安全(security)”等代表的諸多相關(guān)領(lǐng)域受到關(guān)注。隨著人工智能等信息技術(shù)的快速發(fā)展,實現(xiàn)尊重個體學(xué)習(xí)差異的個性化教學(xué)成為大數(shù)據(jù)時代進(jìn)行教學(xué)策略動態(tài)調(diào)整的新要求。舍恩伯格(2013)在《大數(shù)據(jù)時代》中提出:“傳統(tǒng)教育策略的制定主要以教師的教學(xué)經(jīng)驗為參照,進(jìn)而實現(xiàn)對學(xué)習(xí)者學(xué)習(xí)行為的判斷,而大數(shù)據(jù)對學(xué)生學(xué)習(xí)過程的重塑主要是基于三個特征:預(yù)測、個性化和反饋?!泵绹逃夹g(shù)辦公室基于不斷變化的技術(shù)環(huán)境發(fā)布的“國家教育技術(shù)規(guī)劃”持續(xù)受到國際的關(guān)注,其在2016年發(fā)布的第五份“國家教育技術(shù)規(guī)劃”中就曾明確指出,大數(shù)據(jù)技術(shù)在基于海量學(xué)習(xí)數(shù)據(jù)的統(tǒng)計分析基礎(chǔ)上,實現(xiàn)教學(xué)智能化的發(fā)現(xiàn)和預(yù)測,可以有效和有針對性地輔助學(xué)習(xí)者的個性化發(fā)展。不僅如此,有效利用數(shù)據(jù)也逐漸滲透到數(shù)據(jù)發(fā)現(xiàn)所隱含的倫理道德規(guī)則之中。個性化服務(wù)意味著教師要盡可能地滿足學(xué)生特定的學(xué)習(xí)需求,不可避免地要對學(xué)習(xí)者的學(xué)習(xí)行為相關(guān)數(shù)據(jù)進(jìn)行收集、分析和挖掘,而個人數(shù)據(jù)的收集必然涉及數(shù)據(jù)隱私問題。在開放環(huán)境下合理開展教學(xué)活動需要教師有特別的數(shù)據(jù)智慧,這種智慧不僅要求教師具備基于數(shù)據(jù)確認(rèn)學(xué)生學(xué)習(xí)需求、實施教學(xué)方案的數(shù)字素養(yǎng),而且更需要遵循數(shù)據(jù)開放邊際的倫理要求。關(guān)鍵詞“雅虎(Yahoo)”“安全(security)”的出現(xiàn)在一定層面上反映了學(xué)界對2014年的雅虎數(shù)據(jù)泄露事件引發(fā)數(shù)據(jù)安全的擔(dān)憂,美國也重新對《家庭教育權(quán)利和隱私權(quán)法》(FERPA)和《兒童在線隱私權(quán)保護(hù)法》(COPPA)等數(shù)據(jù)安全法案進(jìn)行再授權(quán),強(qiáng)化了學(xué)生數(shù)據(jù)保護(hù)的法律規(guī)范和問責(zé)機(jī)制,為大數(shù)據(jù)保護(hù)的法制健全樹立了典范(王正青, 2016)。學(xué)界對數(shù)據(jù)安全問題的關(guān)注在高被引文獻(xiàn)中也得到體現(xiàn),吳信東(Wu, X. D., & Zhu, X. Q., 2014)等提出了一種數(shù)據(jù)挖掘模型,該模型將數(shù)據(jù)溯源、數(shù)據(jù)水印、身份認(rèn)證、數(shù)據(jù)發(fā)布匿名保護(hù)、社交網(wǎng)絡(luò)匿名等技術(shù)納入其中。該篇文獻(xiàn)被引頻次在關(guān)鍵文獻(xiàn)中高居第二位,這也預(yù)示著教育數(shù)據(jù)安全、隱私等具體問題在近年里受到關(guān)注??傊跀?shù)據(jù)處理技術(shù)不斷成熟的背景下,在不違反倫理原則的前提下,進(jìn)一步挖掘教育數(shù)據(jù)的利用價值,更有效地服務(wù)個性化學(xué)習(xí)也必將是未來學(xué)習(xí)關(guān)注的焦點。

綜上所述,從演進(jìn)脈絡(luò)看,國際教育大數(shù)據(jù)發(fā)展依次經(jīng)歷了在數(shù)據(jù)挖掘技術(shù)中孕育、可行性探討、依托成熟技術(shù)模型實現(xiàn)教育決策、基于數(shù)據(jù)的個性化服務(wù)四個時期,在這個發(fā)展脈絡(luò)中,技術(shù)始終扮演著重要角色。研究聚焦也實現(xiàn)了三個方面的變化:一是由“技術(shù)主體”向“學(xué)習(xí)服務(wù)”理念轉(zhuǎn)變;二是由自上而下的宏觀理論探討轉(zhuǎn)向?qū)ψ韵露系奈⒂^具體問題的關(guān)注;三是從關(guān)注教育數(shù)據(jù)挖掘的內(nèi)涵轉(zhuǎn)向如何合理、高效地實現(xiàn)教育大數(shù)據(jù)服務(wù)。這三個方面的變化也代表著教育大數(shù)據(jù)的研究正不斷走向深化。此外,經(jīng)過軟件探測,筆者發(fā)現(xiàn)(如圖6),數(shù)據(jù)挖掘?qū)⒁廊皇俏磥韲H教育大數(shù)據(jù)研究的前沿方向,必會持續(xù)受到學(xué)者的關(guān)注。

四、結(jié)論與反思

(一)結(jié)論

本文基于WOS數(shù)據(jù)平臺,通過文獻(xiàn)計量方法并使用CiteSpace軟件對國際教育大數(shù)據(jù)研究的現(xiàn)狀、熱點以及發(fā)展脈絡(luò)進(jìn)行了分析。在基于關(guān)鍵詞共現(xiàn)知識圖譜和引文共被引圖譜的基礎(chǔ)上進(jìn)行動態(tài)信息挖掘,并對關(guān)鍵文獻(xiàn)進(jìn)行了深入閱讀分析,形成以下結(jié)論。

第一,從文獻(xiàn)發(fā)表時間分布看,截至目前可大致分為三個階段:從2002年到2006年為首篇之后的零增長階段,從2007年到2011年為緩慢增長階段,從2012年到2016年為快速增長階段。最早的關(guān)于教育大數(shù)據(jù)的研究文獻(xiàn)出現(xiàn)在2002年,但由于當(dāng)時教學(xué)理念、技術(shù)支持等因素的限制,尚未得到廣泛的推廣和關(guān)注,可以說,從發(fā)文量上看,2002年、2013年是國際教育大數(shù)據(jù)研究發(fā)展具有標(biāo)志性的時間節(jié)點。截至今日,國際針對教育大數(shù)據(jù)的研究仍處于快速發(fā)展期。據(jù)統(tǒng)計,由于文獻(xiàn)入庫的延遲, 2017年1月1日至12月31日已有96篇文獻(xiàn)入庫,可以預(yù)測未來對教育大數(shù)據(jù)的研究仍將呈現(xiàn)增長態(tài)勢。

第二,從熱點區(qū)域和機(jī)構(gòu)看,美國、中國、新加坡已經(jīng)成為教育大數(shù)據(jù)研究的熱點區(qū)域,美國、中國學(xué)者的科研產(chǎn)出較多,而新加坡學(xué)者研究成果的質(zhì)量較高,呈現(xiàn)“三足鼎立”之勢,這三個國家成為教育大數(shù)據(jù)領(lǐng)域具有奠基性意義的區(qū)域;而高等院校則成為國際教育大數(shù)據(jù)研究的主要機(jī)構(gòu)群體,來自美國明尼蘇達(dá)大學(xué)、中國社會科學(xué)院的學(xué)者發(fā)文量、總被引頻次以及篇均被引頻次均名列前茅,其成果受到國際學(xué)者的格外關(guān)注,已經(jīng)成為國際上教育大數(shù)據(jù)研究的主體力量。

第三,從核心作者看,目前在國際上已經(jīng)形成了一支教育大數(shù)據(jù)研究核心作者群,這些核心作者碩果累累,其研究成果的質(zhì)量也處于較高水平,來自明尼蘇達(dá)大學(xué)的揚(yáng)納基斯、馬爾達(dá)尼是其中較有影響力的研究者代表,他們的研究成果受到國際教育大數(shù)據(jù)領(lǐng)域?qū)W者的較多關(guān)注,其研究方向在一定程度上可代表領(lǐng)域內(nèi)的熱點與前沿問題。但在今后的研究中,應(yīng)引導(dǎo)相關(guān)領(lǐng)域的學(xué)者們共同關(guān)注和探索教育大數(shù)據(jù)研究,廣泛開展地區(qū)之間的學(xué)術(shù)交流,共同探討教育大數(shù)據(jù)研究的可持續(xù)發(fā)展之路。

第四,從研究熱點和前沿看,可歸納為三個方面:教育大數(shù)據(jù)的理論應(yīng)用探討、大數(shù)據(jù)處理技術(shù)在教育領(lǐng)域的應(yīng)用以及大數(shù)據(jù)背景下的學(xué)習(xí)方式研究。它們共同構(gòu)成了國際教育大數(shù)據(jù)領(lǐng)域的研究熱點。從中心度和頻次的對比看,數(shù)據(jù)挖掘技術(shù)是教育大數(shù)據(jù)領(lǐng)域關(guān)注的重點方向,而大數(shù)據(jù)背景下對高等教育、云計算研究的關(guān)注有待進(jìn)一步提升。結(jié)合梳理出的關(guān)鍵文獻(xiàn),整體來看,教育大數(shù)據(jù)的研究主題已經(jīng)開始偏向于實踐領(lǐng)域,將已有的數(shù)據(jù)挖掘模型應(yīng)用于教育數(shù)據(jù)的處理,進(jìn)而實現(xiàn)教育的預(yù)測和評價導(dǎo)向已經(jīng)成為國際學(xué)者關(guān)注的熱點,數(shù)據(jù)挖掘技術(shù)仍將獲得持續(xù)性關(guān)注。

第五,從教育大數(shù)據(jù)研究的發(fā)展脈絡(luò)看,教育大數(shù)據(jù)在本世紀(jì)初開始萌芽,期間經(jīng)歷了大數(shù)據(jù)技術(shù)在教育領(lǐng)域的興起與初探,目前已經(jīng)走向深入發(fā)展階段,學(xué)者開始聚焦數(shù)據(jù)的安全和隱私等具體問題。從每個階段的研究重點和轉(zhuǎn)向看,國際教育大數(shù)據(jù)研究實現(xiàn)了從對單純數(shù)據(jù)挖掘技術(shù)的依賴向依托數(shù)據(jù)挖掘技術(shù)教育決策應(yīng)用的過渡,其中形成的一些經(jīng)典文獻(xiàn)對我們豐富教育大數(shù)據(jù)研究的理論積淀、把握發(fā)展方向都有重要的借鑒意義。

(二)反思

橫向來看,我國目前已經(jīng)成為教育大數(shù)據(jù)研究的熱門區(qū)域,不僅發(fā)文量名列前茅,而且涌現(xiàn)出如中國科學(xué)院等研究成果優(yōu)質(zhì)的科研學(xué)術(shù)機(jī)構(gòu),在國際教育大數(shù)據(jù)的研究舞臺上占據(jù)了重要地位。欣喜之余,我們也要對我國研究成果的不平衡現(xiàn)狀保持清醒。我國學(xué)者對教育大數(shù)據(jù)的研究成果的整體篇均被引頻次僅為3.86次,與新加坡學(xué)者的14次、美國學(xué)者的6.53次均有一定差距,而中國科學(xué)院學(xué)者研究成果的篇均被引頻次卻高達(dá)24.14次,可見中國學(xué)者的教育大數(shù)據(jù)研究成果質(zhì)量差異較大,除個別機(jī)構(gòu)外,整體呈現(xiàn)學(xué)術(shù)交流能力不強(qiáng)的現(xiàn)狀。

目前,國內(nèi)已有學(xué)者對我國教育大數(shù)據(jù)研究現(xiàn)狀進(jìn)行了分析,按照研究方法可大致將其分為兩類:一是采用傳統(tǒng)文獻(xiàn)綜述方式,以劉鳳娟等為代表;二是采用知識圖譜方式,以王娟、裴瑩等為代表。其中知識圖譜的方式又可基本分為SPSS和CiteSpace兩種方式,其數(shù)據(jù)來源均以中國知網(wǎng)為基礎(chǔ)。綜合他們對國內(nèi)教育大數(shù)據(jù)研究的梳理,對比本研究,我國教育大數(shù)據(jù)研究的特色和不足初見端倪。

其一,從發(fā)展脈絡(luò)看,我國教育大數(shù)據(jù)研究發(fā)展稍顯滯后。劉鳳娟(2014)采用文獻(xiàn)分析法對我國教育大數(shù)據(jù)研究發(fā)展脈絡(luò)進(jìn)行梳理,依據(jù)文獻(xiàn)發(fā)文量,她認(rèn)為2012年我國的教育大數(shù)據(jù)研究開始萌芽,有5篇相關(guān)論文收錄;而2013年之后,我國教育大數(shù)據(jù)研究論文數(shù)目開始倍增,教育大數(shù)據(jù)研究正式起步。而裴瑩等(2017)通過區(qū)視圖利用知網(wǎng)收錄的文獻(xiàn)對我國教育大數(shù)據(jù)研究發(fā)展脈絡(luò)也進(jìn)行了梳理,將國內(nèi)的研究分為三個階段:開始應(yīng)用階段(2013年)、興起階段(2014年)、深入發(fā)展階段(2015至2016年)。綜合以上兩位學(xué)者采用不同方法梳理出的結(jié)果并與本研究對比,可得出以下兩點結(jié)論:①國內(nèi)外相關(guān)研究的關(guān)鍵時間點基本一致。2013年是我國教育大數(shù)據(jù)研究發(fā)展具有里程碑意義的時間點,而本研究梳理出的國際大數(shù)據(jù)研究的關(guān)鍵時間點為2002年、2013年,國內(nèi)發(fā)展基本符合國際發(fā)展趨勢;②國內(nèi)研究發(fā)展推進(jìn)稍顯滯后。本研究顯示,國際教育大數(shù)據(jù)研究可追溯至2002年,2013年步入深入發(fā)展期,至今已完成了從可行性探討向關(guān)注教育大數(shù)據(jù)應(yīng)用的轉(zhuǎn)變,而裴瑩等人的研究揭示出,國內(nèi)教育大數(shù)據(jù)的研究自2013年開始萌芽,雖2015年進(jìn)入深入發(fā)展階段,但至今仍處于可行性的理論性探討階段,實證研究廣度不夠(裴瑩等, 2017)。以此推斷,國內(nèi)發(fā)展時間和研究范式均體現(xiàn)出一定的滯后性。

其二,從研究熱點和前沿看,國內(nèi)研究特色明顯,對主流問題關(guān)注尚可,但對部分前沿問題聚焦不夠。有相關(guān)學(xué)者雖采用不同方法,但均對國內(nèi)教育大數(shù)據(jù)研究熱點前沿問題進(jìn)行了關(guān)注。崔曉鸞(2016)采用SPSS軟件的聚類功能分析出國內(nèi)教育大數(shù)據(jù)研究的熱點方向為理論研究、以思想政治教育為代表的高校教育改革研究、個性化學(xué)習(xí)研究;而王娟(2016)采用CiteSpace軟件分析出,“學(xué)習(xí)分析”“機(jī)器學(xué)習(xí)”“數(shù)據(jù)挖掘”“慕課”“教學(xué)改革”“高等教育”“思想政治教育”等為國內(nèi)研究的熱點詞匯,而“數(shù)據(jù)挖掘”“高職教育”則是國內(nèi)研究的前沿突顯詞;裴瑩(2017)根據(jù)CiteSpace分析的關(guān)鍵詞,將國內(nèi)研究領(lǐng)域概括為大數(shù)據(jù)技術(shù)、學(xué)習(xí)方式探索、個性化教學(xué)改革、學(xué)習(xí)行為分析等幾個熱點方向。對比表3國際研究熱點高頻關(guān)鍵詞及其分析可以發(fā)現(xiàn):首先,國內(nèi)研究熱點與國際關(guān)注的主流方向基本一致,關(guān)鍵詞“數(shù)據(jù)挖掘”“學(xué)習(xí)分析”“機(jī)器學(xué)習(xí)”“高等教育”等均為國內(nèi)外學(xué)者關(guān)注的高頻詞匯,可見,國內(nèi)外學(xué)者對主流方向的關(guān)注基本趨同;其次,國內(nèi)研究前沿多元,關(guān)注特色明顯,在研究前沿突顯詞方面,“數(shù)據(jù)挖掘”“職業(yè)教育”是國內(nèi)學(xué)者關(guān)注的前沿方向,而國際僅探測出“數(shù)據(jù)挖掘”這唯一突顯詞,從這個角度而言,國內(nèi)研究發(fā)展的潛在趨勢更為多樣。不僅如此,關(guān)鍵詞“思想政治教育”均不約而同地出現(xiàn)在三位學(xué)者統(tǒng)計的國內(nèi)熱點詞匯中,可見大數(shù)據(jù)為思想政治教育帶來的機(jī)遇與倫理挑戰(zhàn)研究引起國內(nèi)學(xué)者的關(guān)注,成為國內(nèi)大數(shù)據(jù)研究的重要方向之一,而國外學(xué)者卻鮮有涉及,這可能與中國特色密切相關(guān)。但從表3中關(guān)鍵詞“安全(security)”和脈絡(luò)前沿所反映出的國際學(xué)者關(guān)注的數(shù)據(jù)安全問題,均未見于以上三位國內(nèi)學(xué)者對中國研究熱點的梳理,可見,國內(nèi)尚未出現(xiàn)相關(guān)詞匯與文獻(xiàn),聚焦略顯不夠。

其三,從研究方式看,國內(nèi)外研究均呈現(xiàn)高校研究為主體、學(xué)術(shù)交流缺乏的特征。王娟等(2016)通過對國內(nèi)教育大數(shù)據(jù)研究機(jī)構(gòu)的梳理發(fā)現(xiàn):國內(nèi)教育大數(shù)據(jù)研究的高產(chǎn)機(jī)構(gòu)均來自國內(nèi)高等院校,但研究團(tuán)體分散,不同機(jī)構(gòu)之間交流合作較少(裴瑩等, 2017)??梢钥闯鲅芯亢献魅后w的凝聚力不夠是國內(nèi)外研究團(tuán)隊的共性;不僅如此,在其研究中,江蘇師范大學(xué)、西南大學(xué)等高校是國內(nèi)教育大數(shù)據(jù)研究的高產(chǎn)機(jī)構(gòu),這一點與本研究篩選出的中國科學(xué)院等結(jié)果存在一定出入。筆者認(rèn)為,這可能與數(shù)據(jù)來自不同數(shù)據(jù)庫有關(guān),從本研究的分析看,國內(nèi)學(xué)者的相關(guān)研究已頗具特色,國內(nèi)學(xué)者應(yīng)擴(kuò)大學(xué)術(shù)視野,樹立學(xué)術(shù)自信,積極參與國際教育大數(shù)據(jù)研究的交流。

總之,綜合分析看,中國教育大數(shù)據(jù)研究需要明確國際化方向,形成自己的核心研究團(tuán)隊,國內(nèi)高等院校更應(yīng)該在其中發(fā)揮引領(lǐng)和奠基作用,積極參與國際交流與合作研究,以保持對國際主流與前沿方向的警覺。當(dāng)然,從中國國情來看,我們也不能盲目跟風(fēng)、機(jī)械照搬,扎根實踐的調(diào)查研究和經(jīng)驗研究尤為關(guān)鍵。只有立足中國獨(dú)特的教育大數(shù)據(jù)研究的文化處境和實踐經(jīng)驗,累積一項項調(diào)查研究和經(jīng)驗研究,才可能形成中國特色的學(xué)術(shù)概念和分析框架,推動中國教育大數(shù)據(jù)研究的范式轉(zhuǎn)型與良性發(fā)展,為國際學(xué)界貢獻(xiàn)中國的知識與經(jīng)驗。

[參考文獻(xiàn)]

崔曉鸞,趙可云. 2016. 大數(shù)據(jù)在教育領(lǐng)域的研究熱點及發(fā)展趨勢——基于共詞分析的可視化研究[J]. 現(xiàn)代遠(yuǎn)距離教育(4):79-85.

胡弼成,王祖霖. 2015. “大數(shù)據(jù)”對教育的作用、挑戰(zhàn)及教育變革趨勢——大數(shù)據(jù)時代教育變革的最新研究進(jìn)展綜述[J]. 現(xiàn)代大學(xué)教育(4):98-104.

金慧,劉迪,高玲慧,宋蕾. 2016. 新媒體聯(lián)盟《地平線報告》(2016高等教育版)解讀與啟示[J]. 遠(yuǎn)程教育雜志,35(2):3-10.

劉鳳娟. 2014. 大數(shù)據(jù)的教育應(yīng)用研究綜述[J]. 現(xiàn)代教育技術(shù),35(8):13-19.

裴瑩,付世秋,吳鋒. 2017. 我國教育大數(shù)據(jù)研究熱點及存在問題的可視化分析[J]. 中國遠(yuǎn)程教育(5):1-8.

王娟,陳世超,王林麗,楊現(xiàn)民. 2016. 基于CiteSpace的教育大數(shù)據(jù)研究熱點與趨勢分析[J]. 現(xiàn)代教育技術(shù),26(2):5-13.

王萍. 2015. 大數(shù)據(jù)時代提升教師數(shù)據(jù)智慧研究[J]. 開放教育研究, 21(3):30-39.

王正青. 2016. 大數(shù)據(jù)時代美國學(xué)生數(shù)據(jù)隱私保護(hù)立法與治理體系[J]. 比較教育研究,38(11):28-33.

維克托·邁爾-舍恩伯格,等. 2013. 大數(shù)據(jù)時代[M]. 盛楊燕,等,譯. 杭州:浙江人民出版社.

張洪孟,胡凡剛. 2015. 教育虛擬社區(qū):教育大數(shù)據(jù)的必然回歸[J]. 開放教育研究,21(1):44-52.

張懷南,楊成. 2013. 我國云計算教育應(yīng)用的研究綜述[J]. 中國遠(yuǎn)程教育(1):20-26,95.

張敏,沈雪樂. 2014. 國際知識發(fā)現(xiàn)研究領(lǐng)域核心作者群成熟度分析[J]. 情報雜志,33(8):111-116.

趙新亮,張彥通. 2017. 鄉(xiāng)村教師研究的國際前沿、主題演變及知識基礎(chǔ)分析——基于2000—2016年主題為“rural teacher”的SSCI論文數(shù)據(jù)[J]. 湖南師范大學(xué)教育科學(xué)學(xué)報,16(4):16-22.

鄭燕林,柳海民. 2015. 大數(shù)據(jù)在美國教育評價中的應(yīng)用路徑分析[J]. 中國電化教育(7):25-31.

Department of Education. (2015, December). Future Ready Learning: Reimagining the Role of Technology in Education. National Education Technology Plan. Retrieved November 18, 2017, from https://tech.ed.gov/files/2015/12/NETP16.pdf

Department of Education. (2017, January). Protecting Student Privacy While Using Online Educational Services:Model Terms of Service. Retrieved January 25, 2018, from http://ptac.ed.gov/sites/default/files/TOS_Guidance_Mar2016.pdf

Hinton, G. E. Osindero S. (2006). A Fast Learning Algorithm for Deep Belief Nets. Neural Computerion, 18(7), 1527-1554.

Huang, G. B. (2004). Extreme learning machine: Theory and applications. 8th Brazilian Symposium on Neural Networks. Sao Luis, Brazil.

Huang, X. Y. (2010). Application of Data Mining in Higher Education System. Proceedings of International Forum of Knowledge As A Service, (12), 203-206.

McKinsey & Company. (June 2011). Big data: The next frontier for innovation, competition, and productivity. Retrieved November 21, 2017, from https://bigdatawg.nist.gov/pdf/MGI_big_data_full_report.pdf

New Media Consortium. (2016, November). NMC Horizon Report -2016 Higher Education. Retrieved January 18, 2018, from https://www.nmc. org/publication/nmc-horizon-report-2016-higher-education-edition/

Romero, C., & Ventura, S. (2010). Educational Data Mining: A Review of the State of the Art. IEEE Transactions on Systems Man and Cybernetics Part c-Applications and Reviews, 40(6), 601-618.

Sharma, M. (2011). Accuracy Comparison of Predictive Algorithms of Data Mining: Application in Education Sector. Communications in Computer and Information Science, (125), 189-194.

Urbancic, T. (2002). Web-based analysis of data mining and decision support education. Ai Communications, 14(5), 199-204.

Wu, X. D., & Zhu, X. Q. (2014). Data Mining with Big Data. IEEE Transactions on Knowledge and Data Engineering, 26(1), 97-107.

收稿日期:2017-11-29

定稿日期:2018-02-07

作者簡介:蔣鑫,博士研究生,福建師范大學(xué)教育學(xué)院(350117)。

洪明,博士,教授,博士生導(dǎo)師,福建師范大學(xué)教育學(xué)院,福建省基礎(chǔ)教育與教師教育研究中心(350117)。

責(zé)任編輯 郝 丹

猜你喜歡
教育大數(shù)據(jù)學(xué)習(xí)分析對比研究
教育大數(shù)據(jù)在教育管理中的運(yùn)用分析
簡析小學(xué)勞動與技術(shù)教育的有效合作學(xué)習(xí)
教育大數(shù)據(jù)研究綜述
淺析大數(shù)據(jù)在教育中的應(yīng)用
詩歌里的低訴,蒼涼中的守望
模因論視角下的英漢網(wǎng)絡(luò)語言對比研究
傳統(tǒng)中藥學(xué)與生藥學(xué)的對比研究
“互聯(lián)網(wǎng)+教育”變革路徑研究進(jìn)展