南 鋼, 夏云峰
(1. 上海市教育科學(xué)研究院, 上海 200032; 2. 中共邵陽市委黨校,湖南 邵陽 422000)
隨著計(jì)算機(jī)技術(shù)、互聯(lián)網(wǎng)通信技術(shù)和傳感技術(shù)的融合創(chuàng)新發(fā)展,大數(shù)據(jù)已成為IT產(chǎn)業(yè)又一次顛覆性的技術(shù)變革,并深深影響著人類的主觀意識和生活方式,以及人類對客觀世界的認(rèn)知?!按髷?shù)據(jù)”最早由著名未來學(xué)家阿爾文·托夫勒在1980年出版的《第三次浪潮》中提出,其后,Nature的“Big Data Special”專題、Science的“Dealing with Data”專題和麥肯錫全球研究院發(fā)布的報(bào)告等,都詳細(xì)闡述了大數(shù)據(jù)及其在未來發(fā)展的趨勢[1]。盡管如此,學(xué)界對大數(shù)據(jù)還未形成一個(gè)統(tǒng)一的界定,其中,既有基于產(chǎn)品的,也有基于過程的,還有基于認(rèn)知的,更有基于社會運(yùn)動的。當(dāng)然,從已有的研究和相關(guān)論述來看,對大數(shù)據(jù)的界定總體可從廣義和狹義兩個(gè)層面來理解。廣義層面強(qiáng)調(diào)的是大數(shù)據(jù)帶給人類認(rèn)知世界的新方法論和新世界觀及其對社會政治、經(jīng)濟(jì)和文化所產(chǎn)生的廣泛影響;狹義層面強(qiáng)調(diào)的是大數(shù)據(jù)注重利用科學(xué)工具對體量龐大的數(shù)據(jù)進(jìn)行的梳理和整合。但無論是從狹義層面的數(shù)據(jù)整合,還是從廣義層面的方法論和世界觀來看,大數(shù)據(jù)都是以海量數(shù)據(jù)的挖掘和分析為基礎(chǔ),通過對相關(guān)關(guān)系的揭示,為人類對現(xiàn)狀的研究、問題的發(fā)現(xiàn)和趨勢的預(yù)測提供全新的應(yīng)用工具和思維方式[2]。
雖然學(xué)界對大數(shù)據(jù)沒有一個(gè)確切和統(tǒng)一的定義,但對大數(shù)據(jù)的四大基本特性卻有普遍一致的認(rèn)同,一般把其概括為“4V”[3]。一是數(shù)據(jù)容量浩大(Volume),主要體現(xiàn)在計(jì)量數(shù)據(jù)的單位呈指數(shù)級的增長,如計(jì)量單位從過去的GB一直躍升到TB、EB、ZB,甚至達(dá)到DB。二是速度(Velocity),可以從三方面來體現(xiàn)大數(shù)據(jù)的速度:其一,數(shù)據(jù)更新?lián)Q代更快,主要是指數(shù)據(jù)的產(chǎn)生和更新速度隨著計(jì)算機(jī)技術(shù)的發(fā)展在飛速增長;其二,數(shù)據(jù)獲取速度更快,主要是指依靠飛速發(fā)展的網(wǎng)絡(luò)信息技術(shù),人們獲取數(shù)據(jù)的速度也在同步增加;其三,數(shù)據(jù)運(yùn)算速度更快,大數(shù)據(jù)處理技術(shù)可以在短時(shí)間內(nèi)實(shí)現(xiàn)TB級甚至DB級的運(yùn)算,大大提高了人類對數(shù)據(jù)的組織、分析和決策能力,為人類認(rèn)知世界開辟了一條新的路徑。三是數(shù)據(jù)類型多樣性(Variety),主要指大數(shù)據(jù)涵蓋結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù),以及以圖片、聲音、視頻等呈現(xiàn)的非結(jié)構(gòu)化數(shù)據(jù)等各種數(shù)據(jù)。四是價(jià)值性(Value),主要指通過對大數(shù)據(jù)的深度挖掘和分析能直接為社會實(shí)踐服務(wù)。
在新一代信息技術(shù)與社會各領(lǐng)域深度融合下生成的大數(shù)據(jù),為推動研究的科學(xué)化提供了可能,同時(shí)也為認(rèn)知社會現(xiàn)象提供了數(shù)據(jù)支撐,更為發(fā)現(xiàn)社會演變規(guī)律提供了最新的數(shù)據(jù)依據(jù)。因此,隨著大數(shù)據(jù)時(shí)代的到來,探究大數(shù)據(jù)與教育科學(xué)研究如何有效結(jié)合既是時(shí)代發(fā)展的客觀要求,也是教育科學(xué)研究順應(yīng)時(shí)代發(fā)展的必然走向。對此,需在準(zhǔn)確把握大數(shù)據(jù)內(nèi)涵的基礎(chǔ)上,對教育科學(xué)研究的內(nèi)涵進(jìn)行深刻理解,才能精準(zhǔn)把控大數(shù)據(jù)與教育科學(xué)研究的契合點(diǎn)。當(dāng)前,教育科學(xué)研究總體上形成了理性主義的思辨、經(jīng)驗(yàn)主義的人文和自然主義的實(shí)證三大傳統(tǒng),并且隨著社會科學(xué)的發(fā)展,三大傳統(tǒng)又交互影響并不斷衍生出一些新的研究范式,如圖靈獎獲得者吉姆格雷就把科學(xué)研究劃分為實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)和數(shù)據(jù)密集型科學(xué)四種范式[4]。因此,在大數(shù)據(jù)時(shí)代,如何實(shí)現(xiàn)教育科學(xué)研究與大數(shù)據(jù)的有效融合,不僅關(guān)系到大數(shù)據(jù)的應(yīng)用前景,更關(guān)系到教育科學(xué)的未來發(fā)展,影響到教育科學(xué)研究的科學(xué)化水平和學(xué)科地位。為此,探討大數(shù)據(jù)時(shí)代為教育科學(xué)研究帶來的現(xiàn)實(shí)可能及其面臨的諸多風(fēng)險(xiǎn),并提出可能的發(fā)展策略,就顯得非常迫切。
計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)技術(shù)的發(fā)展不僅使人類進(jìn)入了一個(gè)以海量數(shù)據(jù)為基本特征的大數(shù)據(jù)王國時(shí)代,而且促進(jìn)了大數(shù)據(jù)分析與處理技術(shù)的發(fā)展,凸顯了大數(shù)據(jù)在全景式、立體化展現(xiàn)人類社會生活方面的獨(dú)特優(yōu)勢。今天,無論是在數(shù)據(jù)獲取、數(shù)據(jù)存儲、數(shù)據(jù)索引與可視化分析等方面的不斷發(fā)展,還是基于大數(shù)據(jù)的抽樣、分類、聚類、關(guān)聯(lián)分析方法的產(chǎn)生,都極大地拓展和優(yōu)化了以往的研究方法和研究范式??梢哉f,大數(shù)據(jù)不僅對自然科學(xué)產(chǎn)生了廣泛而深入的影響,也同樣深刻影響著人文社會科學(xué)研究,教育科學(xué)研究也不例外。正是在這一背景之下,教育科學(xué)也迎來了一個(gè)新的時(shí)代,面臨著研究上的諸多可能與突破。
教育科學(xué)研究是指運(yùn)用科學(xué)的研究方法和研究手段對教育現(xiàn)象和教育問題進(jìn)行的有目的、有計(jì)劃、有系統(tǒng)的探索和研究活動,本質(zhì)上是人類認(rèn)識和解釋教育現(xiàn)象和教育問題的一個(gè)過程??v觀人類在教育科學(xué)研究上形成的若干范式,雖然極大地促進(jìn)了教育科學(xué)研究的發(fā)展,但也不難發(fā)現(xiàn),各種研究范式本身面臨著自身無法克服的先天局限。例如,思辨過分注重對事物內(nèi)部統(tǒng)一性的探求,從而容易忽視對事物內(nèi)部的矛盾性或變動性的認(rèn)識,容易出現(xiàn)用靜止的觀點(diǎn)看問題的傾向[5];而實(shí)證研究由于強(qiáng)調(diào)在時(shí)間、樣本、情境等方面的特殊性,以及對過程性數(shù)據(jù)的忽視,因而得出的結(jié)果往往不能代表復(fù)雜的教育系統(tǒng),也難以適用于整個(gè)教育系統(tǒng)[6]。在大數(shù)據(jù)時(shí)代,伴隨數(shù)據(jù)密集型科學(xué)的快速發(fā)展,教育數(shù)據(jù)的來源渠道、存在方式、表現(xiàn)形態(tài)和處理技術(shù)也都發(fā)生了巨大變革,從而為教育科學(xué)研究突破以往的研究視域并拓展研究邊界提供了可能。例如,數(shù)據(jù)的動態(tài)生成既打破了思辨對統(tǒng)一性的追求實(shí)現(xiàn)了多元性、全樣本的連續(xù)性,也克服了抽樣的局限性呈現(xiàn)出整體性等。其中,特別是通過對各種非正式的、非結(jié)構(gòu)化的、非線性的連續(xù)性和日常性數(shù)據(jù)的挖掘,可以獲得依靠傳統(tǒng)方法無法得到的實(shí)時(shí)真實(shí)的教育活動信息所構(gòu)成的系統(tǒng)大數(shù)據(jù)和個(gè)體大數(shù)據(jù),進(jìn)而揭示教育改革發(fā)展中一些復(fù)雜的深層作用機(jī)制,最終拓寬教育科學(xué)研究的邊界。有學(xué)者明確指出:“大數(shù)據(jù)的‘大’是一種隱喻,不能從字面上理解?!髷?shù)據(jù)的‘大’不是量的追求,而是一種質(zhì)的需要?!盵7]他進(jìn)而指出,“大數(shù)據(jù)是某種復(fù)雜適應(yīng)系統(tǒng)的顯現(xiàn)”[7]。這說明,之所以強(qiáng)調(diào)教育是大數(shù)據(jù)的,就在于大數(shù)據(jù)是對教育之復(fù)雜系統(tǒng)的表征和再現(xiàn)。而正是通過對海量教育數(shù)據(jù)信息的集群分析和處理,有助于我們從教育生活的不同側(cè)面洞悉教育系統(tǒng)中的隱性觀念和潛在機(jī)制。正如有學(xué)者指出的那樣,“教育數(shù)據(jù)挖掘除繼續(xù)教育研究的傳統(tǒng)議題外,確實(shí)因大數(shù)據(jù)而可以切入一些過去教育研究不可能進(jìn)行的新的研究問題和角度”[8]。的確,大數(shù)據(jù)時(shí)代的到來為教育科學(xué)研究注入了無限生機(jī)與活力,預(yù)示著教育科學(xué)研究的廣闊前景。
傳統(tǒng)教育科學(xué)研究普遍重視理論假設(shè)和判斷的重要性。例如,就理性主義的思辨范式來說,它以演繹邏輯為基本框架,基本形式是三段論,其中特別強(qiáng)調(diào)前提的正確和科學(xué),而前提的科學(xué)性又是源于人類的經(jīng)驗(yàn)和理性判斷;就自然主義的實(shí)證范式來說,它是基于理論假設(shè)驅(qū)動的知識發(fā)現(xiàn)理論,一般遵循“理論假設(shè)—?dú)w納推理—驗(yàn)證假設(shè)—研究結(jié)論”的邏輯理路;就經(jīng)驗(yàn)主義的人文范式來說,它所包含的研究方法,諸如詮釋學(xué)、現(xiàn)象學(xué)、后現(xiàn)代主義、批判理論、后實(shí)證主義等都離不開一定的理論闡釋和解讀??梢姡碚摷僭O(shè)是傳統(tǒng)教育科學(xué)研究遵循的重要原則。也就是說,無論是在理性判斷、理論假設(shè)、理論詮釋等方面,還是在研究中涉及的抽樣分析和數(shù)據(jù)驗(yàn)證上,大多需要研究者在主觀層面做出界定和判斷,這就會由于研究者本身的知識結(jié)構(gòu)、價(jià)值立場和意識形態(tài)等主觀因素產(chǎn)生“個(gè)體依賴”等問題。而大數(shù)據(jù)時(shí)代的到來,則引發(fā)了教育科學(xué)研究范式中所蘊(yùn)含的思維方式變革,并進(jìn)而推動了知識發(fā)現(xiàn)方式的變革,即形成了“海量數(shù)據(jù)搜集→數(shù)據(jù)清洗→數(shù)據(jù)挖掘和分析→發(fā)現(xiàn)知識→知識推演和服務(wù)”[9]的知識發(fā)現(xiàn)及其運(yùn)用模式??梢?,在大數(shù)據(jù)時(shí)代,基于理性判斷、理論假設(shè)和理論詮釋的教育研究范式逐漸轉(zhuǎn)變?yōu)榛凇皵?shù)據(jù)驅(qū)動”的教育研究。大數(shù)據(jù)技術(shù)以大數(shù)定律為基礎(chǔ),一方面通過對數(shù)據(jù)的清洗、提純和降維等技術(shù)來保證數(shù)據(jù)的客觀性、真實(shí)性和效用性;另一方面通過對海量數(shù)據(jù)的挖掘、對比、分析、聚類等方式來發(fā)現(xiàn)數(shù)據(jù)信息之間的內(nèi)在聯(lián)系。這樣,“規(guī)模大、類型多、時(shí)效性強(qiáng)的大數(shù)據(jù)使人們可以應(yīng)用教育測評模型更加精確地認(rèn)識教育現(xiàn)象”[10],并進(jìn)而發(fā)現(xiàn)問題、把握規(guī)律和預(yù)測趨勢,這就使教育科學(xué)研究能在較大程度上規(guī)避研究者在研究過程中對已有知識結(jié)構(gòu)、價(jià)值立場和意識形態(tài)等的依賴甚至偏見,有助于實(shí)現(xiàn)教育研究的科學(xué)化。
作為近代科學(xué)飛速發(fā)展的一個(gè)產(chǎn)物,科學(xué)方法成為自然科學(xué)發(fā)展的重要基礎(chǔ),并影響著人文社會科學(xué)包括教育科學(xué)的發(fā)展。科學(xué)主義提倡實(shí)證和定量,強(qiáng)調(diào)小規(guī)模抽樣調(diào)查和實(shí)驗(yàn)研究的重要性,但由于受研究者主觀因素和客觀條件等的制約,盡管所獲取的數(shù)據(jù)在來源、功能和特性等方面具有較強(qiáng)的代表性和針對性,但也存在一定問題。例如,從數(shù)據(jù)來源來看,主要是以主觀框定的抽樣調(diào)查方式來獲取樣本,但通過這一限定條件獲取的數(shù)據(jù)范圍較小,以致樣本數(shù)量受限;從數(shù)據(jù)功能來看,既往教育實(shí)證研究一般是在若干小單元的基礎(chǔ)上對數(shù)據(jù)進(jìn)行收集、測量、分析和具體描述;從數(shù)據(jù)特征來看,以往教育實(shí)證研究所運(yùn)用或產(chǎn)生的數(shù)據(jù)大都按照統(tǒng)一標(biāo)準(zhǔn)進(jìn)行收集和處理,結(jié)果使數(shù)據(jù)呈現(xiàn)出較強(qiáng)的代表性和針對性,但導(dǎo)致不同類型數(shù)據(jù)間的交互性和鏈接性極為薄弱。今天,大數(shù)據(jù)時(shí)代的一個(gè)重要思維轉(zhuǎn)變,就是“要全體不要抽樣”[11]。它不僅可以提供事物之間的共性信息與普遍性規(guī)律,還可以提供個(gè)性化的特征信息,特別是對少數(shù)群體特征及微小規(guī)律進(jìn)行揭示,這是傳統(tǒng)抽樣數(shù)據(jù)無法給予的[12]。這意味著,教育研究將突破原有數(shù)據(jù)的限制,并通過各類小數(shù)據(jù)匯集成大數(shù)據(jù)。由于各類小數(shù)據(jù)之間沒有特定的邊界和限制,即使存在一些不可避免的數(shù)據(jù)間隙,也會被整個(gè)大數(shù)據(jù)的規(guī)模優(yōu)勢所掩蓋,從而使大數(shù)據(jù)在來源、功能和特性等方面發(fā)生變化。在來源上,教育大數(shù)據(jù)主要以布滿傳感器和人工智能數(shù)據(jù)處理設(shè)備的“互聯(lián)網(wǎng)+”為獲取通道。它們是未經(jīng)研究者修剪和加工的自然原始教育數(shù)據(jù),但也包括個(gè)體手動采集的相關(guān)教育數(shù)據(jù);在功能上,教育大數(shù)據(jù)呈現(xiàn)出多角度、全方位、全過程的多點(diǎn)觀測和整體描述;在特征上,以在教育活動中產(chǎn)生的全樣本數(shù)據(jù)信息為主,包括了所有圖像、語音和文本數(shù)據(jù)。正是由于大數(shù)據(jù)“排除了樣本與總體之間的差異,排除了抽樣帶來的系統(tǒng)誤差,排除了樣本的選擇性偏差等”[8],因而能彌合小數(shù)據(jù)之間的間隙并克服其對教育研究的限制,使教育研究中以前不能被描述或揭示的整體教育現(xiàn)象和趨勢,也能通過數(shù)據(jù)化的形式來加以客觀呈現(xiàn)和展示。
近代以來,教育實(shí)驗(yàn)法的運(yùn)用極大地推動了教育學(xué)科的科學(xué)化進(jìn)程,其中對數(shù)據(jù)的處理集中體現(xiàn)了對因果關(guān)系的探究??梢姡角笠蚬P(guān)系是現(xiàn)代教育研究的主要追求,也是人們把握教育規(guī)律的重要切入點(diǎn)。但由于開展真正的教育實(shí)驗(yàn)研究并不容易,所以其推廣一直遇到問題。與此同時(shí),教育相關(guān)研究則受到學(xué)界的普遍關(guān)注。進(jìn)入大數(shù)據(jù)時(shí)代后,由于大數(shù)據(jù)本身的特性,使其能更好地服務(wù)于相關(guān)研究。舍恩伯格等在《大數(shù)據(jù)時(shí)代》中就明確提到大數(shù)據(jù)下的一個(gè)思維轉(zhuǎn)變,即“相關(guān)關(guān)系比因果關(guān)系能更好地了解這個(gè)世界”[11]。在此背景下,教育相關(guān)研究也受到學(xué)界的普遍推崇,而相對忽視對因果關(guān)系的追求。因此,“大數(shù)據(jù)的使用就意味著以放棄理解‘為什么’為代價(jià)換來對‘是什么’的了解”[8]。由于教育系統(tǒng)、教育結(jié)構(gòu)、教育要素和教育對象的復(fù)雜性,決定著教育科學(xué)研究的復(fù)雜性。為了保證研究的科學(xué)性,以往僅僅依靠對局部教育現(xiàn)象的研究而達(dá)致對全局的把握的因果關(guān)系的探索,已經(jīng)面臨著諸多局限和不足,而大數(shù)據(jù)正好可以通過對海量數(shù)據(jù)的收集、挖掘和整理,以及分類、比較和聚類來洞悉教育系統(tǒng)的復(fù)雜性,并為分析教育系統(tǒng)、教育結(jié)構(gòu)、教育要素和教育對象內(nèi)部及其之間的相互關(guān)系提供了重要依據(jù),進(jìn)而探尋對諸多相關(guān)關(guān)系的合理解釋,為教育改革和發(fā)展提供事實(shí)理據(jù)。換言之,基于大數(shù)據(jù),“在理論上可以將總體全部納入分析框架,而無須參數(shù)檢驗(yàn),這為更加全面、系統(tǒng)地反映和描述教育現(xiàn)象與問題、檢測與評估過程、預(yù)測與規(guī)劃教育發(fā)展,以及導(dǎo)向教育價(jià)值提供了更大的可能”[10]。而且,依托教育大數(shù)據(jù)開展的相關(guān)分析“不存在模糊性、不確定性和易變性,可以通過重復(fù)實(shí)踐和研究加以檢驗(yàn)、校正與論證”[6],從而保證了教育科學(xué)研究的科學(xué)性。
雖然大數(shù)據(jù)時(shí)代的到來為人類社會生活帶來了諸多可能,也推動了數(shù)據(jù)處理方法的發(fā)展,但作為一種技術(shù)和分析方法,它與以往的任何一種研究方法一樣,并不是萬能的,也會給科學(xué)研究帶來一定的風(fēng)險(xiǎn)和誤區(qū)。2014年,加州大學(xué)戴維斯分校技術(shù)管理學(xué)教授巴格瓦(Bargava)博士就曾指出大數(shù)據(jù)發(fā)展的困境。就教育科學(xué)研究來說,應(yīng)在享受其促進(jìn)研究科學(xué)化、提升研究有效性的同時(shí),及時(shí)預(yù)見其在教育科學(xué)研究中的風(fēng)險(xiǎn),研判其風(fēng)險(xiǎn)可能給教育科學(xué)研究造成的不利影響,努力做好研究風(fēng)險(xiǎn)的防范和規(guī)避。
面對今天大數(shù)據(jù)時(shí)代暴增的數(shù)據(jù)及其對社會生活所產(chǎn)生的深刻影響,我們已然置身于一個(gè)“數(shù)據(jù)王國”,教育研究概莫能外。前已述及,大數(shù)據(jù)的產(chǎn)生將破除教育研究中對理性判斷、理論假設(shè)和理論詮釋等的過度依賴,有助于教育科學(xué)通過數(shù)據(jù)整理、挖掘和分析,規(guī)避對知識結(jié)構(gòu)、價(jià)值立場和意識形態(tài)等的依賴,實(shí)現(xiàn)教育研究的科學(xué)化,這也正是現(xiàn)代教育學(xué)一再宣稱的“真正的教育研究”所強(qiáng)調(diào)的。毋庸置疑,教育數(shù)據(jù)資料越充分,其中所隱含的教育信息之間的關(guān)聯(lián)性也體現(xiàn)得越清晰,也就越能揭示多元教育場景中的復(fù)雜問題,并提出有針對性的解決方略。因此,大數(shù)據(jù)遵循自下而上的知識發(fā)現(xiàn)觀和基于證據(jù)的分析預(yù)測過程,旨在從不確定性中發(fā)現(xiàn)確定性。這一基于數(shù)據(jù)累積的知識邏輯蘊(yùn)藏著一種不可違背的形而上學(xué)哲學(xué)原理,“即認(rèn)為世界構(gòu)成基礎(chǔ)是萬物同質(zhì)、萬物皆數(shù)。也就是說,世界上所有事物的本質(zhì)是數(shù),其結(jié)構(gòu)就是各種數(shù)關(guān)系的結(jié)合或分離”[13]?;诖耍藗冋J(rèn)為,教育研究只要通過數(shù)據(jù)挖掘和分析就能揭示其所蘊(yùn)含的相關(guān)關(guān)系和規(guī)律,就能解決一切問題。在這種情況下,理性判斷、理論假設(shè)和理論詮釋開始變得可有可無,有學(xué)者甚至還指出了傳統(tǒng)思辨方法在教育研究中的局限性?!罢軐W(xué)的方法或思辨的方法不以客觀地認(rèn)識世界和解釋世界為目的,它不是科學(xué)研究方法。而且,由于主要從概念和命題出發(fā)而不是完全從事實(shí)出發(fā),因此難以成為可積累的、可驗(yàn)證的知識?!盵14]在這種背景下,教育研究中的數(shù)據(jù)存儲代替了理性判斷,數(shù)據(jù)挖掘代替了理論假設(shè),數(shù)據(jù)分析代替了理論闡釋。自此,數(shù)據(jù)成為人類社會生活的中心和思維方式的中心。數(shù)據(jù)崇拜、數(shù)據(jù)獨(dú)尊、數(shù)據(jù)至上充斥著人們的頭腦,人類理性的光環(huán)開始湮沒在數(shù)據(jù)的洪流中,人類由理論積累所建構(gòu)的文明史開始被由數(shù)據(jù)積累所要求的存儲空間替代,人類的精神家園開始變得日漸虛無,并將最終迷失并消失在數(shù)據(jù)的混雜中。
基于大數(shù)據(jù)的分析注重從海量數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)之間的內(nèi)在規(guī)律,強(qiáng)調(diào)無序中的有序、雜亂中的規(guī)律和不確定性中的確定性,因此更注重整體分析。但教育科學(xué)不同于其他社會科學(xué)的一個(gè)重要特征,就是具有較強(qiáng)的實(shí)踐性。加拿大教育學(xué)專家馬克斯·范梅南曾明確指出:“教育學(xué)是一門實(shí)踐性的學(xué)科?!币簿褪钦f,教育科學(xué)是面向教育生活世界和教育教學(xué)實(shí)踐的一門科學(xué)。這就決定了教育科學(xué)研究不僅要發(fā)現(xiàn)理論化的教育知識,完善教育理論體系,還要關(guān)注實(shí)踐性的教育知識,即求真;與此同時(shí),更要探尋教育生活世界的真諦,追求教育的可能生活與可能的教育生活,即求善和求美。這就是說,教育研究不僅關(guān)注客觀世界,更關(guān)注作為主體的人的主觀世界,并始終圍繞人之發(fā)展與幸福這一核心主題探討教育的意義與價(jià)值。因此,教育研究是一個(gè)事關(guān)意義世界和價(jià)值關(guān)涉的研究。與此同時(shí),由于教育活動富有情境性、個(gè)性化、動態(tài)性和生成性,也決定了教育研究不可能只有一種固定的模式。在研究教育現(xiàn)象時(shí),有學(xué)者指出:“一方面,要按照線性的觀點(diǎn)來觀察其中的有序性,從中尋找規(guī)律性、普遍性的東西;另一方面,要按照非線性的觀點(diǎn)來觀察其中的無序性、偶然性,從中尋找個(gè)別化的經(jīng)驗(yàn)與體會。因?yàn)檫@種無序的‘噪聲’或偶發(fā)事件也確切地承載著教育本真的奧秘與意蘊(yùn)?!盵15]但在大數(shù)據(jù)時(shí)代,教育的這一人文實(shí)踐特質(zhì)也開始受到巨大挑戰(zhàn)。有學(xué)者在談及大數(shù)據(jù)時(shí)代自然科學(xué)和人文學(xué)科的差異時(shí)曾指出:“反觀各人文學(xué)科,較為注重個(gè)人體驗(yàn),其主要方法為體悟、思辨等,多建立于個(gè)人假設(shè)基礎(chǔ)上,用思辨的方法建構(gòu)具有個(gè)性化的思想理論體系。人文學(xué)科由于缺少具有客觀性的數(shù)據(jù),從而無法用數(shù)據(jù)說話,造成因人而異、各說一辭的局面,主體間很難取得共識?!盵16]可見,數(shù)據(jù)方法似乎與教育等人文學(xué)科天生就存在一種內(nèi)在矛盾,它無法對人的情感和態(tài)度、心理和行為、意義與價(jià)值等進(jìn)行體驗(yàn)、思辨、解讀、闡釋。因此,當(dāng)我們處于數(shù)據(jù)王國時(shí),鑒于數(shù)據(jù)的全序列、大規(guī)模、高速度,必然會弱化和消弭教育研究中的人文性、實(shí)踐性和情境性。
與小數(shù)據(jù)基于抽樣的精準(zhǔn)性和代表性相比,大數(shù)據(jù)更重視規(guī)模,更強(qiáng)調(diào)感知。近代以來,正是依托實(shí)證主義,教育科學(xué)才躋身于科學(xué)之林,也才有資格分享教育科學(xué)的美譽(yù)。這說明,唯有依托數(shù)據(jù)資料,教育研究才能實(shí)現(xiàn)自身的科學(xué)化,這也使數(shù)據(jù)資料成為教育研究科學(xué)化的重要標(biāo)尺。事實(shí)上,教育實(shí)證主義研究的一個(gè)重要特征就是注重?cái)?shù)據(jù)抽樣,它具有代表性、間隙性、針對性和工具性等諸多優(yōu)點(diǎn),并已經(jīng)發(fā)展成為一種比較成熟的方法體系。今天,大數(shù)據(jù)的最大優(yōu)勢是其規(guī)模性,因此它的廣泛應(yīng)用和深度普及將使研究者不再擔(dān)心數(shù)據(jù)的代表性問題。因?yàn)樗依巳珮颖镜臄?shù)據(jù)信息,彌合了各個(gè)數(shù)據(jù)間的間隙,能進(jìn)行海量數(shù)據(jù)的高效檢索和“全景式”或“大背景”式的可視化展現(xiàn)[17]。舍恩伯格等就曾指出,“允許不精確已成為大數(shù)據(jù)的一個(gè)特點(diǎn)”。從來源、特征和功能三者來看,以大數(shù)據(jù)方法或大數(shù)據(jù)嵌入和應(yīng)用為核心開展的教育研究具有較強(qiáng)的概然性和歸納性。這些研究多是做一個(gè)總體的趨勢判斷,并不追求數(shù)據(jù)背后的必然邏輯,而是通過對數(shù)據(jù)規(guī)律和關(guān)系的揭示來歸納結(jié)論。作為人文社會科學(xué)的重要領(lǐng)域之一,教育研究也必然受其影響而變得更加科學(xué),如通過數(shù)據(jù)形式可以呈現(xiàn)更為復(fù)雜和多元的教育現(xiàn)象、在具體研究客體的選擇和設(shè)立上也從“客觀實(shí)在”走向“數(shù)據(jù)表示”[18]。與此同時(shí),大數(shù)據(jù)也產(chǎn)生了一個(gè)重要問題,即對小數(shù)據(jù)精準(zhǔn)分析的忽視和弱化。由于較少結(jié)合小數(shù)據(jù)來對大數(shù)據(jù)揭示的整體趨勢或個(gè)別問題和現(xiàn)象作相應(yīng)解讀,結(jié)果導(dǎo)致相關(guān)研究結(jié)論多是四舍五入、泛泛而談,以致研究缺乏應(yīng)有的精準(zhǔn)性和科學(xué)性。這表明,大數(shù)據(jù)在教育研究領(lǐng)域的廣泛應(yīng)用和深度滲透正在弱化和消解著“小數(shù)據(jù)”的精準(zhǔn)性和適用性,且有蔓延之勢,這是大數(shù)據(jù)暴力侵襲教育研究,引發(fā)“唯大數(shù)據(jù)”風(fēng)險(xiǎn)的直接表現(xiàn)。
大數(shù)據(jù)重相關(guān)分析,小數(shù)據(jù)重因果分析,這在目前學(xué)界已經(jīng)達(dá)成共識。前已述及,數(shù)據(jù)對教育研究具有重要作用,但是否數(shù)據(jù)越多越好呢?回答是否定的。這是因?yàn)榇髷?shù)據(jù)產(chǎn)生的信息價(jià)值具有邊際遞減效應(yīng)。當(dāng)“數(shù)據(jù)體量大到一定程度,所提供的信息幾乎不再增加,但是收集、處理的成本卻在不斷增加,同時(shí)所含有的數(shù)據(jù)噪聲反而影響信息提取”[12]。由于大數(shù)據(jù)源于布滿傳感器和人工智能數(shù)據(jù)處理設(shè)備的“互聯(lián)網(wǎng)+”,不受個(gè)體或群體主觀意識的控制,具有明顯的龐雜性和混沌性,且主要是對世界進(jìn)行整體描述,因而在對大數(shù)據(jù)的激情崇拜中,相關(guān)關(guān)系受到空前重視。因?yàn)椤跋嚓P(guān)關(guān)系比因果關(guān)系能更好地了解這個(gè)世界”。但“基于相關(guān)分析得出的結(jié)論往往是表面現(xiàn)象,反映它們有某種共同變化的趨勢,但并不必然存在因果關(guān)系。如果直接基于相關(guān)分析結(jié)果做決策,有時(shí)可能會對決策造成誤導(dǎo)”[12]。有學(xué)者進(jìn)一步指出,由于大數(shù)據(jù)分析關(guān)注相關(guān)關(guān)系,認(rèn)為在大數(shù)據(jù)時(shí)代有了足夠的數(shù)據(jù)就會發(fā)現(xiàn)相關(guān)關(guān)系,因而在大數(shù)據(jù)時(shí)代有相關(guān)關(guān)系就足夠了[19]。例如,全樣本數(shù)據(jù)既可以避免因抽樣限制產(chǎn)生的反向因果問題,也可以避免由于抽樣偏頗所引起的樣本選擇偏差,還能通過全樣本數(shù)據(jù)的篩選和匹配避免變量遺漏問題[20]。也就是說,通過數(shù)據(jù)分析,能夠發(fā)現(xiàn)原來兩個(gè)不存在直接因果關(guān)系的變量間存在一種相關(guān)關(guān)系,而對這種相關(guān)關(guān)系的揭示又能探索出新的因果關(guān)系或深化對已有因果關(guān)系的理解和揭示。因此,大數(shù)據(jù)在教育研究中的應(yīng)用要避免深陷外部表象,就有必要深化因果關(guān)系研究[19]。事實(shí)上,對因果關(guān)系的研究可以在一定程度上滿足大數(shù)據(jù)時(shí)代對深層次分析的需要。
教育科學(xué)在經(jīng)歷了理性主義的思辨、自然主義的實(shí)證和經(jīng)驗(yàn)主義的人文三大范式后,今天又迎來了大數(shù)據(jù)時(shí)代。它既給教育科學(xué)研究帶來了諸多可能與發(fā)展空間,但也使傳統(tǒng)的教育科學(xué)研究面臨一定的風(fēng)險(xiǎn)和挑戰(zhàn)。那么,如何既揚(yáng)其所長,充分利用和發(fā)揮其給教育科學(xué)研究帶來的便利與可能,推動教育科學(xué)研究的科學(xué)化、理論化和精準(zhǔn)化,又避其所短,努力規(guī)避、防范和化解大數(shù)據(jù)研究中的諸多風(fēng)險(xiǎn)與危機(jī),這既需要勇氣也需要智慧。為此,教育科學(xué)研究工作者必須認(rèn)識到,大數(shù)據(jù)雖能推動信息處理方法的創(chuàng)新,但它不是萬能的,其運(yùn)用必然存在一定的邊界。因此,如何在教育科學(xué)研究中理性、規(guī)范、科學(xué)、有序地運(yùn)用大數(shù)據(jù),如何實(shí)現(xiàn)大數(shù)據(jù)與教育科學(xué)研究自身屬性的統(tǒng)整與融合,將成為未來教育科學(xué)研究發(fā)展的重要方向。
從歷史發(fā)展來看,數(shù)據(jù)經(jīng)歷了原始數(shù)據(jù)的產(chǎn)生、科學(xué)數(shù)據(jù)的形成到大數(shù)據(jù)的誕生三個(gè)階段,但無論是哪種數(shù)據(jù),其本質(zhì)都是一種數(shù)據(jù)。就后兩者來說,最大的區(qū)別在于數(shù)據(jù)的量及其所能揭示的關(guān)系。相較于大數(shù)據(jù)而言,科學(xué)數(shù)據(jù)即“小數(shù)據(jù)”往往是基于特定科學(xué)標(biāo)準(zhǔn)而獲取的,具有明顯的代表性、針對性和解釋性等特征,因而能對單個(gè)現(xiàn)象或問題進(jìn)行深度挖掘和闡釋。伴隨科學(xué)數(shù)據(jù)的形成及其對統(tǒng)計(jì)研究方法的影響,教育科學(xué)也發(fā)展出了從描述性統(tǒng)計(jì)分析到推斷性統(tǒng)計(jì)分析的方法和技術(shù)。大數(shù)據(jù)時(shí)代,更是帶來數(shù)據(jù)分析技術(shù)和統(tǒng)計(jì)方法的大量使用,特別是其“所具有的數(shù)據(jù)特征使得部分傳統(tǒng)統(tǒng)計(jì)方法不再適用”[12]。同時(shí),雖然大數(shù)據(jù)能對教育問題或現(xiàn)象做出全景式的解讀,揭示教育研究問題的大致趨勢,并提供足夠有價(jià)值的信息,但“大數(shù)據(jù)時(shí)代不應(yīng)該也絕對不是‘理論終結(jié)’的時(shí)代……僅僅反映了現(xiàn)實(shí)中人們對大數(shù)據(jù)挖掘特點(diǎn)及其局限性的一種妥協(xié)甚至是無奈”[8]。由于處理成本、處理范圍和處理要求等原因,并不能獲得良好的數(shù)據(jù)分析結(jié)果,這表明以大數(shù)據(jù)及其技術(shù)的應(yīng)用為核心的教育科學(xué)研究無法對局部和單個(gè)教育問題或現(xiàn)象進(jìn)行深度挖掘和闡釋??梢?,作為數(shù)據(jù)呈現(xiàn)的不同形式,大數(shù)據(jù)與小數(shù)據(jù)對于開展教育研究工作各有利弊。也就是說,大數(shù)據(jù)和小數(shù)據(jù)在教育研究中并非完全對立。而且從研究對象來看,其既是一個(gè)集合體,又是一個(gè)集合元素,具體取決于研究的需要。因此,在開展教育科學(xué)研究的過程中,唯有大數(shù)據(jù)與小數(shù)據(jù)相結(jié)合,實(shí)現(xiàn)不同數(shù)據(jù)優(yōu)勢的互補(bǔ)相融和有機(jī)整合,即基于全數(shù)據(jù)開展教育研究,方能獲得對教育研究對象的全方位和立體化理解。例如,在區(qū)域教育發(fā)展上,為了實(shí)現(xiàn)教育資源的科學(xué)配置、改進(jìn)教育基本公共服務(wù)、完善教育質(zhì)量的監(jiān)測與管理,就有必要構(gòu)建區(qū)域教育大數(shù)據(jù)系統(tǒng)模型并開展相關(guān)研究工作[21],以發(fā)現(xiàn)區(qū)域教育發(fā)展中的共性特征和普遍問題。但為了把握局部教育或特定學(xué)校的發(fā)展?fàn)顩r,就離不開對小數(shù)據(jù)的分析研究。
傳統(tǒng)以統(tǒng)計(jì)學(xué)為中心的數(shù)據(jù)分析是近代以來科學(xué)研究的前提和基礎(chǔ),但這一方法對于大數(shù)據(jù)并不適合。哈佛大學(xué)的菲利斯·弗蘭克爾和羅莎琳德·瑞德早在2008年就指出,大數(shù)據(jù)對于科學(xué)發(fā)展來說是激動人心的,但只有創(chuàng)造新的工具才能從大數(shù)據(jù)中獲取意義[10]??梢姡瑒?chuàng)新數(shù)據(jù)分析方法和技術(shù)是大數(shù)據(jù)能否產(chǎn)生的關(guān)鍵。今天,基于大數(shù)據(jù)驅(qū)動的數(shù)據(jù)分析已經(jīng)突破了這一藩籬,成為“涉及統(tǒng)計(jì)、數(shù)據(jù)庫技術(shù)、模型識別、機(jī)器學(xué)習(xí)等領(lǐng)域”的一個(gè)新興交叉學(xué)科[8]。就教育而言,大數(shù)據(jù)技術(shù)為教育研究、教育決策及教育實(shí)踐提供了一把利器,成為教育研究走向科學(xué)化的重要支撐[22],但要發(fā)揮其作用,“還取決于數(shù)據(jù)的收集、發(fā)掘、存儲、整合、分析這樣的技術(shù)手段,而且還取決于我們建立了什么樣的數(shù)據(jù)分析模型。數(shù)據(jù)說話需要一系列的技術(shù)。一方面要挖掘整合數(shù)據(jù);另一方面要形成高水平的數(shù)據(jù)分析模型”[23]。在數(shù)據(jù)挖掘上,由于深度學(xué)習(xí)算法“更具有靈活性和準(zhǔn)確性,它可以彌補(bǔ)許多數(shù)據(jù)挖掘方法的缺點(diǎn),其在語音識別、圖像識別、情感分析、學(xué)習(xí)預(yù)測、自然語言處理等多個(gè)領(lǐng)域發(fā)揮了重大作用”[24],因而可以實(shí)現(xiàn)對教育大數(shù)據(jù)的有效挖掘,特別是已經(jīng)開始廣泛應(yīng)用于學(xué)生學(xué)習(xí)追蹤及表現(xiàn)預(yù)測、基于MOOC的教學(xué)輔助工具開發(fā)、大規(guī)??荚嚋y評技術(shù)等方面,并取得了預(yù)期的成果。在數(shù)據(jù)分析模型上,以計(jì)算機(jī)仿真方法為基礎(chǔ)的教育計(jì)算實(shí)驗(yàn)研究,“用虛擬現(xiàn)實(shí)、決策仿真對教育系統(tǒng)進(jìn)行建模,抽取真實(shí)教育系統(tǒng)中的運(yùn)行要素,梳理要素之間的關(guān)系與規(guī)則,建立虛擬的仿真教育系統(tǒng)”[6],進(jìn)而探索教育現(xiàn)象的演化規(guī)律。在數(shù)據(jù)測評模型上,通過“將復(fù)雜的教育現(xiàn)象簡單化,將紛繁復(fù)雜的‘大數(shù)據(jù)’變成‘小數(shù)據(jù)’,即通過應(yīng)用成熟模型,把握教育大數(shù)據(jù)世界中的關(guān)鍵要素和信息,解決教育改革和發(fā)展中的實(shí)際問題”[10],這已經(jīng)被認(rèn)為是應(yīng)對教育大數(shù)據(jù)時(shí)代的重要戰(zhàn)略工具。此外,借助地理信息系統(tǒng)(GIS軟件)和可視化軟件CitespaceV、Tableau等,還可以進(jìn)行大數(shù)據(jù)畫像、知識圖譜分析等,有助于研究教育資源的優(yōu)化布局,發(fā)現(xiàn)教育科學(xué)各領(lǐng)域知識的隱含模式及其規(guī)律。
大數(shù)據(jù)時(shí)代的到來為教育研究注入了新的活力,但并不意味著基于大數(shù)據(jù)的分析將成為教育研究的唯一手段和途徑。首先,大數(shù)據(jù)的“大”是相對的。即便人類社會生活和教育世界的所有方面都能數(shù)據(jù)化,人類也沒有足夠的理智來獲取這些數(shù)據(jù)。而且相對于整個(gè)數(shù)據(jù)“宇宙”來講,大數(shù)據(jù)仍顯得微不足道。其次,大數(shù)據(jù)是客觀資源。從其產(chǎn)生和存在來說,它不受人類個(gè)體或群體的左右。但由于大數(shù)據(jù)自身不具備主動思考的能力,所以人類在采集和應(yīng)用時(shí)必然會面臨技術(shù)工程師和研究者等人的各種偏見。再次,大數(shù)據(jù)是魚龍混雜的數(shù)據(jù),其中包含著大量的垃圾數(shù)據(jù)、無用數(shù)據(jù)、偽劣數(shù)據(jù)和重復(fù)數(shù)據(jù)。如果不能對這些數(shù)據(jù)進(jìn)行及時(shí)清理,勢必干擾大數(shù)據(jù)驅(qū)動的數(shù)據(jù)分析。最后,由于大數(shù)據(jù)的全樣本、全流程、全類型等特征,使我們不再生活在一個(gè)“封閉”的世界,而是一個(gè)透明的社會,這就提出一個(gè)隱私數(shù)據(jù)的公開問題。這些都表明,大數(shù)據(jù)面臨著一定困境,存在著一定陷阱,而要助推教育研究的有效性,就必須走出上述數(shù)據(jù)困境和陷阱。為此,一是針對教育數(shù)據(jù)的連續(xù)性和無限性,努力構(gòu)建多層面多系統(tǒng)教育數(shù)據(jù)發(fā)展監(jiān)測動態(tài)模型,努力做好教育信息的監(jiān)控和預(yù)測。二是應(yīng)發(fā)展一種關(guān)于數(shù)據(jù)分析的藝術(shù)以避免數(shù)據(jù)偏見,諸如“抽取足以滿足統(tǒng)計(jì)目的和精度的樣本,需要研究新的適應(yīng)性、序貫性和動態(tài)的抽樣方法”[25],并“針對總體的特點(diǎn)和研究精度的要求選擇不同的抽樣設(shè)計(jì)方案”[14]。三是通過去粗取精、去偽存真的工夫提取關(guān)鍵數(shù)據(jù)和核心要素,提升數(shù)據(jù)的價(jià)值密度和利用空間。四是應(yīng)在不侵犯教師、學(xué)生等相關(guān)主體隱私并在符合法律法規(guī)的前提下公開教育數(shù)據(jù),切實(shí)保證教育數(shù)據(jù)的合法公布和使用。此外,數(shù)據(jù)分析的本質(zhì)是對現(xiàn)象的歸一化處理,它在抹平差異的同時(shí),又在制造新的差異,如在對教育現(xiàn)象進(jìn)行描述時(shí),可能將異質(zhì)的“一”歸結(jié)為同質(zhì)的“一”。這種“歸一”化處理在教育科學(xué)研究中極不可取[18]。
理論建構(gòu)是科學(xué)進(jìn)步的重要標(biāo)志,教育科學(xué)也不例外。大數(shù)據(jù)雖然破除了教育研究對理論假設(shè)的過度依賴,同時(shí)在海量數(shù)據(jù)的浪潮中弱化著理論思辨的價(jià)值和意義,但這并不等于它不需要理論建構(gòu)。今天,當(dāng)我們在探尋大數(shù)據(jù)時(shí)代的教育研究之路時(shí)發(fā)現(xiàn),大數(shù)據(jù)與理論建構(gòu)不僅不矛盾,而且還互為補(bǔ)充??梢哉f,大數(shù)據(jù)的持續(xù)生成及其所蘊(yùn)含的復(fù)雜聯(lián)系不僅有助于建構(gòu)新的教育理論,而且能夠幫助我們重新審視既有的教育理論,進(jìn)而實(shí)現(xiàn)對教育理論的修訂與重構(gòu)。正是“大數(shù)據(jù)的利用可以產(chǎn)生許多小數(shù)據(jù)時(shí)代無法涉及、難以進(jìn)行操作的研究問題,并為新理論和新假設(shè)的產(chǎn)生提供了可能性”[8]。有學(xué)者進(jìn)一步提出了教育研究的第四范式,即數(shù)據(jù)密集型科學(xué)研究范式,“主要利用計(jì)算機(jī)、數(shù)據(jù)管理和統(tǒng)計(jì)分析工具對大數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)復(fù)雜現(xiàn)象背后隱含的模式,并從中獲取知識”[6]。這表明,大數(shù)據(jù)對發(fā)展教育科學(xué)研究具有積極意義。當(dāng)然,大數(shù)據(jù)對教育理論的建構(gòu)和推動并非數(shù)據(jù)自身的邏輯必然,而是理論思維與海量數(shù)據(jù)之間的互動生成。因?yàn)樵u價(jià)一項(xiàng)研究的理論性強(qiáng)弱,除了要考慮它是否基于事實(shí)和邏輯,還要考慮是否依托前人的理論提出假設(shè),是否為研究步驟中進(jìn)行演繹推理的元素,是否為了發(fā)現(xiàn)規(guī)律和形成理論[14]??梢姡髷?shù)據(jù)時(shí)代的教育研究應(yīng)注重?cái)?shù)據(jù)生成、數(shù)據(jù)分析和理論建構(gòu)的有機(jī)統(tǒng)一。一方面,數(shù)據(jù)驅(qū)動的教育研究需要更充分的理論指導(dǎo)和支撐,方能確保教育研究的證據(jù)性、學(xué)理性和科學(xué)性,并最終推動教育研究向著學(xué)科良性的方向發(fā)展;另一方面,教育理論的科學(xué)性也唯有通過大數(shù)據(jù)方法或大數(shù)據(jù)嵌入和應(yīng)用來進(jìn)行或相關(guān)或因果的研究才能得到驗(yàn)證。唯有如此,大數(shù)據(jù)時(shí)代的教育研究才能實(shí)現(xiàn)數(shù)據(jù)生成、數(shù)據(jù)分析與理論建構(gòu)的有效融合,避免陷入“唯數(shù)據(jù)”的陷阱,不斷完善教育研究的理論建構(gòu)。
與自然科學(xué)和其他社會科學(xué)不同,教育科學(xué)的一個(gè)顯著特征就是具有較強(qiáng)的人文性。換言之,它指向人的生活世界、意義訴求和價(jià)值選擇,而其基本路徑就是體驗(yàn)、感悟、理解和共情,這在自然主義、人文主義和人本主義的研究范式中已經(jīng)得到一定體現(xiàn)。20世紀(jì)以來,伴隨人類學(xué)、解釋學(xué)及后現(xiàn)代哲學(xué)的興起,這一傳統(tǒng)得以延續(xù)并不斷創(chuàng)新,并出現(xiàn)了多種形式的質(zhì)的研究方法。進(jìn)入大數(shù)據(jù)時(shí)代后,教育研究的范式開始轉(zhuǎn)向大數(shù)據(jù)驅(qū)動,這雖然為教育研究開辟了新的研究路徑與研究前景,但也弱化了實(shí)踐情境與人文理解的多元,因而使研究無法觸及教育領(lǐng)域的“真實(shí)”和“本然”,更無法揭示教育規(guī)律,似乎大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘本身就與教育學(xué)科的人文性相抵觸。同樣,反過來,教育學(xué)科的人文訴求和價(jià)值關(guān)涉是否有助于數(shù)據(jù)挖掘和數(shù)據(jù)理解,似乎同樣存在著一定的距離和鴻溝。事實(shí)上,不僅大數(shù)據(jù)本身內(nèi)含著一定的人文價(jià)值,而且教育學(xué)科的人文性也體現(xiàn)在教育科學(xué)的方方面面。為此,要處理好人文理解與數(shù)據(jù)挖掘的關(guān)系,推動二者的融合,就需要做到以下兩點(diǎn):一是使數(shù)據(jù)有利于增進(jìn)教育理解;二是通過人文關(guān)懷來提高數(shù)據(jù)采集質(zhì)量。就前者來說,伴隨大數(shù)據(jù)時(shí)代的到來及其所具有的規(guī)?;?、客觀化、混雜化和在線化等特征的出現(xiàn),“社會科學(xué)迎來了數(shù)據(jù)采集的革命性新工具,并進(jìn)入了與自然科學(xué)共享方法論平臺的新時(shí)代。大數(shù)據(jù)革命讓社會科學(xué)的數(shù)據(jù)采集進(jìn)入智能化、自動化時(shí)代,并帶來了客觀、精準(zhǔn)、在線的海量數(shù)據(jù),讓社會科學(xué)與自然科學(xué)一樣,能夠?qū)崿F(xiàn)‘讓數(shù)據(jù)說話’”[16]。正是通過這一方式,教育科學(xué)也實(shí)現(xiàn)了“讓數(shù)據(jù)生成意義、讓數(shù)據(jù)增進(jìn)理解、讓數(shù)據(jù)產(chǎn)生價(jià)值”的人文目標(biāo)。就后者來說,教育科學(xué)可以通過自身的人文關(guān)懷來避免數(shù)據(jù)采集中的主觀偏差和價(jià)值偏離,進(jìn)而提升數(shù)據(jù)質(zhì)量。換言之,使數(shù)據(jù)彰顯人文價(jià)值和意蘊(yùn)應(yīng)成為大數(shù)據(jù)時(shí)代教育科學(xué)研究的自覺追求和研究品性。
綜上所述,大數(shù)據(jù)時(shí)代的到來既給教育科學(xué)研究帶來了新的機(jī)遇、新的可能和新的空間,但也潛藏著研究中的諸多風(fēng)險(xiǎn)。我們唯有充分認(rèn)識到這些問題,才能走出“數(shù)據(jù)崇拜”的危機(jī),推動大數(shù)據(jù)時(shí)代教育科學(xué)研究的良性健康發(fā)展。
湖南師范大學(xué)教育科學(xué)學(xué)報(bào)2020年4期