◎程 光 勝
《深化新時(shí)代教育評價(jià)改革總體方案》要求,充分利用信息技術(shù),提高教育評價(jià)的科學(xué)性、專業(yè)性、客觀性,同時(shí)針對不同主體和不同學(xué)段、不同類型教育特點(diǎn),設(shè)計(jì)能力為重、全面發(fā)展、面向人人、因材施教的學(xué)生評價(jià),創(chuàng)新過程性評價(jià)[1]。職業(yè)教育是一種類型教育,在國家戰(zhàn)略發(fā)展中,與普通教育具有同等重要的地位[2]。與普通教育中的知識學(xué)習(xí)和科學(xué)研究不同,職業(yè)教育以職業(yè)技能提升為核心,以工匠精神塑造為靈魂。因此,開展職業(yè)教育的學(xué)習(xí)評價(jià)不能照搬和模仿普通教育領(lǐng)域的學(xué)習(xí)評價(jià)。通過評價(jià)促進(jìn)學(xué)習(xí)是學(xué)習(xí)評價(jià)活動的邏輯起點(diǎn),而傳統(tǒng)的學(xué)習(xí)評價(jià)基本上是一種終結(jié)性的評價(jià),操作簡單,強(qiáng)調(diào)結(jié)果,但忽視了過程。如何基于職業(yè)教育的學(xué)習(xí)特點(diǎn),構(gòu)建動態(tài)、立體、多維的過程性學(xué)習(xí)評價(jià),是當(dāng)前職業(yè)教育評價(jià)關(guān)注的熱點(diǎn)。
伴隨著大數(shù)據(jù)技術(shù)在教育教學(xué)中的深度融合,基于數(shù)據(jù)實(shí)現(xiàn)對教育和學(xué)習(xí)的評價(jià),使得評價(jià)結(jié)果更加真實(shí)、客觀和科學(xué)。然而,大數(shù)據(jù)所呈現(xiàn)的某些趨勢或規(guī)律只是信息重復(fù)的結(jié)果,預(yù)測分析結(jié)果的準(zhǔn)確性取決于數(shù)據(jù)的質(zhì)量和規(guī)則的制定。同時(shí),大數(shù)據(jù)分析還存在這樣的特點(diǎn):在分析中尋找目標(biāo),注重尋找關(guān)聯(lián)性、發(fā)現(xiàn)未知知識,在一定的時(shí)間范圍內(nèi)生成可接受的解。這些問題和特點(diǎn),對于個(gè)性化的學(xué)習(xí)分析而言,可能會存在大數(shù)據(jù)應(yīng)用的局限性。
在大數(shù)據(jù)發(fā)展過程中,也產(chǎn)生了令人欣慰的小數(shù)據(jù)。這些小數(shù)據(jù)是圍繞個(gè)體的全方位數(shù)據(jù),形成個(gè)體的完整數(shù)字視圖,體現(xiàn)出高價(jià)值、高效率、個(gè)性化的特點(diǎn)。因此,利用這些小數(shù)據(jù)開展職業(yè)教育環(huán)境下的精準(zhǔn)學(xué)習(xí)評價(jià),能夠準(zhǔn)確把握學(xué)習(xí)者的學(xué)習(xí)概況,捕獲學(xué)習(xí)者多維度的學(xué)習(xí)信息,從而改進(jìn)當(dāng)前學(xué)習(xí)的不足,促進(jìn)有效的學(xué)習(xí)。在當(dāng)前職業(yè)教育環(huán)境下,以學(xué)習(xí)者為圓心,在精準(zhǔn)學(xué)習(xí)評價(jià)中描繪學(xué)生能力發(fā)展的增長半徑,通過個(gè)性化的學(xué)習(xí)評價(jià),為學(xué)習(xí)者提供差異化的教育及學(xué)習(xí)資源,以人為本,形成學(xué)習(xí)者個(gè)性化的競爭優(yōu)勢,使學(xué)習(xí)者在服務(wù)經(jīng)濟(jì)社會發(fā)展中能夠獨(dú)當(dāng)一面,真正獲得人生出彩的機(jī)會。
大數(shù)據(jù)不僅僅是數(shù)據(jù)體量之大,大數(shù)據(jù)帶來的是一次重大的時(shí)代轉(zhuǎn)型,通過其自身蘊(yùn)含的技術(shù)力量變革世界的同時(shí),更是激發(fā)思維方式的變革,包括整體思維、復(fù)雜思維和相關(guān)思維等的變革。這種變革不斷重塑社會管理和國家戰(zhàn)略決策、產(chǎn)業(yè)和組織流程及服務(wù)方式,同時(shí)也會給教育管理和學(xué)習(xí)評價(jià)帶來新的力量。
與大數(shù)據(jù)分析技術(shù)相伴的是學(xué)習(xí)分析、人工智能等技術(shù)的綜合一體化應(yīng)用,因此,在學(xué)習(xí)評價(jià)、教學(xué)評價(jià)、教育評價(jià)等領(lǐng)域,其主題關(guān)鍵詞是“大數(shù)據(jù)綜合素質(zhì)評價(jià)”“人工智能教育評價(jià)”“智能技術(shù)學(xué)習(xí)評價(jià)”“數(shù)智融合教學(xué)評價(jià)”等,借助信息技術(shù)能夠增強(qiáng)和創(chuàng)新教育評價(jià)工具,優(yōu)化教育評價(jià)管理,提升教育評價(jià)質(zhì)量,拓展教育評價(jià)結(jié)果應(yīng)用成效[3]。在數(shù)字化轉(zhuǎn)型背景下,伴隨著德智體美勞五育全要素?cái)?shù)據(jù)的出現(xiàn),學(xué)生綜合素質(zhì)評價(jià)告別了單調(diào)人為的定性化評價(jià),設(shè)計(jì)基于數(shù)據(jù)支撐的、反映核心素養(yǎng)的綜合素質(zhì)評價(jià)指標(biāo)體系是高質(zhì)量教育評價(jià)的關(guān)鍵。張治等以此為出發(fā)點(diǎn),根據(jù)不同維度數(shù)據(jù)采集的難易程度及技術(shù)要求,設(shè)計(jì)了MIPAL數(shù)據(jù)模型,在此基礎(chǔ)上通過數(shù)字畫像評價(jià)學(xué)生綜合素質(zhì)[4]。大數(shù)據(jù)變革學(xué)生綜合素質(zhì)評價(jià),大數(shù)據(jù)技術(shù)可分層設(shè)計(jì)并管理評價(jià)的各個(gè)階段,如大數(shù)據(jù)采集技術(shù)可實(shí)現(xiàn)評價(jià)輸入、大數(shù)據(jù)處理技術(shù)可實(shí)現(xiàn)評價(jià)處理、大數(shù)據(jù)挖掘分析技術(shù)可實(shí)現(xiàn)評價(jià)分析、大數(shù)據(jù)輸出技術(shù)可實(shí)現(xiàn)評價(jià)輸出、大數(shù)據(jù)推送技術(shù)可實(shí)現(xiàn)評價(jià)反饋等,從而確保評價(jià)輸入的全面、處理的有效、分析的深刻,輸出的精準(zhǔn)和反饋的及時(shí)[5]。因此,數(shù)據(jù)驅(qū)動的素質(zhì)評價(jià),強(qiáng)調(diào)常態(tài)檢測,主張用數(shù)據(jù)說話,遵循觀測學(xué)習(xí)、解釋學(xué)習(xí)、反饋學(xué)習(xí)的循環(huán)邏輯。
學(xué)生素質(zhì)具有整體性、穩(wěn)定性和長期性,其蘊(yùn)含個(gè)體的價(jià)值追求、思維方式、審美取向及行為表現(xiàn),與核心素養(yǎng)相輔相成,形成一個(gè)整體,因此采用傳統(tǒng)紙筆測試來測評綜合素質(zhì),顯然是測評不出來的,需要借助智能技術(shù),基于全域的網(wǎng)絡(luò)覆蓋和終端數(shù)據(jù)采集,獲取學(xué)生外顯和內(nèi)隱的量化數(shù)據(jù),經(jīng)過計(jì)算處理實(shí)現(xiàn)素質(zhì)的測評。彭波等基于人工智能視域,從評價(jià)目標(biāo)、評價(jià)主體、評價(jià)方式、評價(jià)標(biāo)準(zhǔn)、評價(jià)結(jié)果等方面分析了人工智能在教育評價(jià)中的應(yīng)用,指出未來的教育評價(jià),必將滲透人工智能的理念,同時(shí)人工智能的理念會影響教育評價(jià)改革的進(jìn)程和方向[6]??梢钥吹剑诖髷?shù)據(jù)和人工智能技術(shù)的教育評價(jià)是科學(xué)評價(jià)的實(shí)現(xiàn)途徑和方式,也是教育現(xiàn)代化的重要特征。
在大數(shù)據(jù)、人工智能技術(shù)應(yīng)用于基礎(chǔ)教育、高等教育領(lǐng)域?qū)嵤┙逃八刭|(zhì)評價(jià)的同時(shí),也有部分研究基于職業(yè)教育視角,探索數(shù)據(jù)和技術(shù)如何賦能職業(yè)教育評價(jià)。孫翠香認(rèn)為,職業(yè)教育評價(jià)是一個(gè)復(fù)雜的評價(jià)系統(tǒng),在這個(gè)系統(tǒng)中,立德樹人是職業(yè)教育評價(jià)的核心,而“課程與教學(xué)實(shí)踐”“人的發(fā)展”是評價(jià)的目的,在整體系統(tǒng)化教育評價(jià)框架的統(tǒng)一下,要增強(qiáng)“協(xié)同”評價(jià)效應(yīng),平衡評價(jià)的“問責(zé)功能”和“發(fā)展功能”[7]。作為教育評價(jià)的一個(gè)重要組成部分,職業(yè)教育學(xué)習(xí)評價(jià)已由結(jié)果性評價(jià)向過程性評價(jià)轉(zhuǎn)變,結(jié)合現(xiàn)代信息技術(shù)和學(xué)習(xí)數(shù)據(jù),程光勝設(shè)計(jì)了職業(yè)教育精準(zhǔn)學(xué)習(xí)評價(jià)框架,并從改進(jìn)結(jié)果評價(jià)、強(qiáng)化過程評價(jià)、探索增值評價(jià)、健全綜合評價(jià)四個(gè)方面闡述了精準(zhǔn)學(xué)習(xí)評價(jià)的實(shí)踐探索[8]。
上述文獻(xiàn)充分發(fā)揮數(shù)據(jù)和智能技術(shù)的優(yōu)勢,運(yùn)用多種學(xué)習(xí)分析技術(shù)實(shí)現(xiàn)對教育及學(xué)習(xí)的多維度評價(jià)。技術(shù)賦能教育及學(xué)習(xí)評價(jià),是深化新時(shí)代教育評價(jià)改革的必然選擇,具有科學(xué)化、多元化、立體化、最優(yōu)化、精準(zhǔn)化等主要特征[9]。同時(shí),基于數(shù)據(jù)實(shí)現(xiàn)學(xué)習(xí)評價(jià),是科學(xué)研究第四范式在學(xué)習(xí)評價(jià)中的應(yīng)用,將會豐富教育評價(jià)本體論,重塑教育評價(jià)認(rèn)識論,深化教育評價(jià)價(jià)值論,變革教育評價(jià)方法論,使教育評價(jià)不斷走向智慧化和專業(yè)化[10]。
伴隨著經(jīng)濟(jì)社會的發(fā)展,職業(yè)教育的生源由單一正在走向多元,這是由職業(yè)教育的性質(zhì)所決定的。當(dāng)前,在高職擴(kuò)招百萬的政策影響下,我國職業(yè)教育的生源結(jié)構(gòu)已由學(xué)齡段生源進(jìn)入學(xué)齡段生源與社會生源持續(xù)并存的新常態(tài)[11]。與學(xué)齡段生源相比,社會生源具有學(xué)習(xí)持久力不足、認(rèn)知能力不足、內(nèi)生動力強(qiáng)、社會屬性強(qiáng)等特點(diǎn)。在這種背景下,學(xué)習(xí)者的學(xué)習(xí)特點(diǎn)、學(xué)習(xí)方式、學(xué)習(xí)理念等呈現(xiàn)出多元化的特征,加之職業(yè)教育人才培養(yǎng)的目標(biāo)是高素質(zhì)技術(shù)技能人才,因此如果采用傳統(tǒng)的紙筆測試評價(jià)其學(xué)習(xí),顯然是不合適的。
因此,本文在教育大數(shù)據(jù)環(huán)境下,充分利用智慧學(xué)習(xí)環(huán)境、平臺以及智能化設(shè)備,采集以學(xué)習(xí)者個(gè)體為中心的學(xué)習(xí)小數(shù)據(jù),對學(xué)習(xí)者的學(xué)習(xí)進(jìn)行動態(tài)、立體、過程性的評價(jià),以評價(jià)促進(jìn)學(xué)習(xí),讓每一位學(xué)習(xí)者都能發(fā)揮個(gè)性優(yōu)勢,不斷改進(jìn)和發(fā)展學(xué)習(xí),實(shí)現(xiàn)健康成長并成才,在全面建設(shè)社會主義現(xiàn)代化國家、實(shí)現(xiàn)中華民族偉大復(fù)興中國夢的征程中,讓每一個(gè)接受過職業(yè)教育的學(xué)習(xí)者都能成就夢想,獲得人生出彩的機(jī)會。
通過搜索引擎,很多用戶只可能關(guān)注海量搜索結(jié)果的前面條目;在財(cái)務(wù)決策時(shí),財(cái)務(wù)主管也許只關(guān)注財(cái)務(wù)報(bào)表中的部分匯總數(shù)據(jù);在書店購書時(shí),買者一般只會閱讀前言和目錄信息;在平臺購物時(shí),客戶也僅僅關(guān)注商品評論中的部分評論信息。事實(shí)上,在很多領(lǐng)域、很多情況下囿于時(shí)間和成本,人們面對和能夠處理的數(shù)據(jù)僅僅是大量數(shù)據(jù)下的一部分。從這個(gè)角度來看,人們的決策往往是基于部分?jǐn)?shù)據(jù)的,以局部了解整體。陳國青等將這樣的部分?jǐn)?shù)據(jù)視作小數(shù)據(jù),認(rèn)為小數(shù)據(jù)是相關(guān)數(shù)據(jù)全體的一個(gè)子集,并從數(shù)學(xué)的角度給出了“大數(shù)據(jù)—小數(shù)據(jù)”的形式化定義[12]。在遵從小數(shù)據(jù)是相關(guān)全體數(shù)據(jù)子集的基礎(chǔ)上,陳輝從應(yīng)用方式的角度認(rèn)為,小數(shù)據(jù)是大數(shù)據(jù)時(shí)代下的一類新興數(shù)據(jù),是圍繞個(gè)體的全方位數(shù)據(jù)及其配套的收集、處理、分析和對外交互的綜合應(yīng)用系統(tǒng)[13]?;诖耍疚恼J(rèn)為,在當(dāng)前大數(shù)據(jù)環(huán)境下,把圍繞同一個(gè)體的所有數(shù)據(jù)通過特定的技術(shù)和工具抽取出來,執(zhí)行清洗、轉(zhuǎn)換、整合等操作,然后按照合適的存儲模型組織管理起來,就形成了個(gè)體小數(shù)據(jù)。因此,從這個(gè)角度來看,小數(shù)據(jù)是一個(gè)富有個(gè)體色彩的數(shù)據(jù)系統(tǒng),反映了個(gè)體的完整行為軌跡,具有鮮明的個(gè)體獨(dú)特性、復(fù)雜的類型多樣性、高度的實(shí)時(shí)動態(tài)性和鮮明的人機(jī)交互性。
從數(shù)據(jù)科學(xué)的角度來看,數(shù)據(jù)亦有大小之分,然而,這種大小不是數(shù)據(jù)規(guī)模的大和小,而是從應(yīng)用的角度將數(shù)據(jù)劃分為大數(shù)據(jù)和小數(shù)據(jù),大數(shù)據(jù)偏向總體和全局,小數(shù)據(jù)側(cè)重個(gè)體和局部。
大數(shù)據(jù)很大,表現(xiàn)為數(shù)據(jù)量大、數(shù)據(jù)種類多、數(shù)據(jù)增長速度快,與此對應(yīng)的分析方法眾多,涵蓋統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)等方法。然而,大數(shù)據(jù)有時(shí)也很小,在分析中其所呈現(xiàn)的某些趨勢或規(guī)律只是信息重復(fù)的結(jié)果,具有一定的普遍性,但是缺乏針對性和精準(zhǔn)性,微觀個(gè)體差異不顯著。
大數(shù)據(jù)和小數(shù)據(jù)之間并無明顯的界限,小數(shù)據(jù)通過不斷積累,會形成“大”數(shù)據(jù)。在無法獲得大數(shù)據(jù)的現(xiàn)實(shí)下,小數(shù)據(jù)因其信息密度高,在分析中能獲得較高的投入產(chǎn)出。與大數(shù)據(jù)分析相比,小數(shù)據(jù)能夠在采集個(gè)體全局?jǐn)?shù)據(jù)的同時(shí)更加充分地洞察個(gè)體的異質(zhì)性,換言之,就是具有個(gè)體的針對性,求同存異。
總之,大數(shù)據(jù)體現(xiàn)出規(guī)律,小數(shù)據(jù)蘊(yùn)含著智慧。小數(shù)據(jù)“見微”,做個(gè)人刻畫;大數(shù)據(jù)“知著”,反映總體特征和規(guī)律。
學(xué)習(xí)評價(jià)是教育評價(jià)的一個(gè)重要組成部分,主要針對學(xué)生的學(xué)習(xí)做出客觀的價(jià)值判斷。借助人工智能等新一代信息技術(shù),可以分析學(xué)習(xí)過程,總結(jié)學(xué)習(xí)結(jié)果,預(yù)測學(xué)習(xí)發(fā)展[14],這大大地拓展了傳統(tǒng)教育評價(jià)的內(nèi)容和邊界。但是,對于不同的學(xué)習(xí)主體而言,由于培養(yǎng)目標(biāo)和學(xué)習(xí)內(nèi)容的不同,其學(xué)習(xí)評價(jià)內(nèi)容存在教育很大的差別。與普通教育相比,職業(yè)教育目標(biāo)是培養(yǎng)能工巧匠、大國工匠的高素質(zhì)技術(shù)技能人才,培養(yǎng)知識型、技能型、創(chuàng)新型的高素質(zhì)勞動者,建設(shè)技能型社會,不僅符合我國的國情,而且能夠助力中華民族偉大復(fù)興中國夢的實(shí)現(xiàn)[15]。職業(yè)學(xué)生的學(xué)習(xí)內(nèi)容可分為宏觀、中觀和微觀層面:宏觀層面由基于功能性的“技能—認(rèn)知”學(xué)習(xí)和基于人本性的“社會—心理”學(xué)習(xí)構(gòu)成,描述外顯世界向內(nèi)隱世界的躍遷;中觀層面由“專業(yè)—內(nèi)容”學(xué)習(xí)、“政治—社會”學(xué)習(xí)、“操作—方法”學(xué)習(xí)三部分組成,詮釋內(nèi)容與方法以及對象與環(huán)境的互動;微觀層面涵蓋“學(xué)習(xí)—工作”和“合作—交流”,解讀人與物以及人與人互動的技術(shù)。[16]因此,職業(yè)教育學(xué)習(xí)評價(jià)最終需要反映職業(yè)學(xué)生的知識習(xí)得、技能掌握和能力養(yǎng)成。
科學(xué)的學(xué)習(xí)評價(jià)是提升職業(yè)教育質(zhì)量的關(guān)鍵。從社會視角來看,學(xué)習(xí)評價(jià)要注重能力因素,是職業(yè)教育外部質(zhì)量評價(jià)的重要方面;從教育視角來看,學(xué)習(xí)評價(jià)要兼具教育性和職業(yè)性,是職業(yè)教育質(zhì)量的重要檢測和保障手段;從學(xué)生視角來看,學(xué)習(xí)評價(jià)要具備鼓勵(lì)和回饋的功效,促進(jìn)學(xué)生的成長和未來發(fā)展。[17]以評促學(xué)是學(xué)習(xí)評價(jià)的終極目標(biāo),通過學(xué)習(xí)評價(jià),幫助學(xué)生反思學(xué)習(xí)、改進(jìn)學(xué)習(xí),促進(jìn)學(xué)生的個(gè)性化發(fā)展,最終培養(yǎng)主動、健康發(fā)展的個(gè)體生命,培育人的生命自覺和實(shí)踐智慧[18],這與教育的根本任務(wù)——“立德樹人”是完全一致的。
在學(xué)習(xí)者學(xué)習(xí)過程中,其學(xué)習(xí)行為數(shù)據(jù)的產(chǎn)生主要有三種方式:分別是學(xué)習(xí)者主動輸入、系統(tǒng)實(shí)時(shí)記錄、可穿戴設(shè)備自動生成。
學(xué)習(xí)者主動輸入的數(shù)據(jù)主要包括:學(xué)習(xí)者的基本信息,如學(xué)號、姓名、專業(yè)、性別等;學(xué)習(xí)者在智能學(xué)習(xí)平臺或圖書館管理平臺使用中檢索過的關(guān)鍵詞、圖書的借閱記錄等;學(xué)習(xí)者在學(xué)習(xí)完資源后發(fā)起或參與的主題討論;學(xué)習(xí)者在項(xiàng)目完成或?qū)嵙?xí)實(shí)訓(xùn)結(jié)束后撰寫的總結(jié)報(bào)告等。這些數(shù)據(jù)一般為結(jié)構(gòu)化數(shù)據(jù),存儲于特定的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)中,可以通過SQL命令實(shí)現(xiàn)查詢獲取。
系統(tǒng)實(shí)時(shí)記錄一般是由在線學(xué)習(xí)系統(tǒng)或虛擬仿真平臺通過日志服務(wù)器自動生成,記錄了學(xué)習(xí)者在系統(tǒng)中的學(xué)習(xí)行為軌跡,主要包括:學(xué)習(xí)者何時(shí)何地以何種方式登入和登出系統(tǒng);登入系統(tǒng)后請求了何種資源和服務(wù),對資源和服務(wù)做了何種操作,操作時(shí)長以及操作頻率;與哪些主題和哪些學(xué)習(xí)者產(chǎn)生了互動;操作行為安全審計(jì)等。由于數(shù)據(jù)是實(shí)時(shí)記錄和生成的,因此產(chǎn)生的數(shù)據(jù)量較大,其存儲形式一般為普通記事本文件或格式化良好的XML文件,從類型上來講屬于半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)。
可穿戴設(shè)備自動生成是學(xué)習(xí)者攜帶的含有各種傳感器的智能化設(shè)備,可以自動獲取學(xué)習(xí)者的多項(xiàng)生理和心理數(shù)據(jù),以及學(xué)習(xí)的場景數(shù)據(jù),由于傳感器實(shí)時(shí)工作的特性,其生成的數(shù)據(jù)是實(shí)時(shí)的,所以數(shù)據(jù)量也比較龐大,并且也屬于半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)。
鑒于個(gè)體學(xué)習(xí)小數(shù)據(jù)的類型復(fù)雜性和多源特性,在具體存儲時(shí),學(xué)習(xí)者可以選擇關(guān)系型存儲和非關(guān)系型存儲的結(jié)合,即實(shí)現(xiàn)基于SQL和基于NoSQL不同存儲的融合。
從優(yōu)勢和特性來講,SQL面向結(jié)構(gòu)化、數(shù)據(jù)量不大的應(yīng)用環(huán)境,支持主鍵、外鍵、非空、唯一等約束,以及基本表上其他數(shù)據(jù)庫對象的創(chuàng)建,如索引、視圖、觸發(fā)器等,具有強(qiáng)大的安全控制機(jī)制,支持基于ACID的事務(wù)操作,支持連接、嵌套、集合等的復(fù)雜查詢操作。NoSQL是面向大數(shù)據(jù)技術(shù)環(huán)境實(shí)現(xiàn)數(shù)據(jù)存儲的非關(guān)系型數(shù)據(jù)庫,用于超大規(guī)模數(shù)據(jù)的存儲,具有高可擴(kuò)展性、分布式計(jì)算、低成本等特性。在具體實(shí)現(xiàn)上,主要有鍵值對型(如Redis、Riak等),可以通過用戶ID號匹配與之對應(yīng)的數(shù)據(jù)內(nèi)容;文檔型(如MongoDB、CouchDB等),數(shù)據(jù)以某種結(jié)構(gòu)或結(jié)構(gòu)不嚴(yán)格的文檔形式存儲,一個(gè)文檔對應(yīng)一系列數(shù)據(jù)項(xiàng)集;列存儲型(如HBase、Cassandra等),數(shù)據(jù)以列存儲,一個(gè)Key可以對應(yīng)多個(gè)列;圖型(如Infinite Graph、Neo4J等),通過頂點(diǎn)與連邊的網(wǎng)絡(luò)圖存儲數(shù)據(jù),適合關(guān)系型較強(qiáng)的用戶小數(shù)據(jù)存儲。
針對個(gè)體學(xué)習(xí)小數(shù)據(jù),根據(jù)具體應(yīng)用場景,學(xué)習(xí)者可選擇MySQL數(shù)據(jù)庫存儲結(jié)構(gòu)化數(shù)據(jù),選擇MongoDB數(shù)據(jù)庫存儲半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。這是因?yàn)?,在關(guān)系數(shù)據(jù)庫產(chǎn)品中,由于MySQL支持多種操作系統(tǒng)、多種開發(fā)語言,加之開源,在很多軟件系統(tǒng)中,大部分應(yīng)用以MySQL管理后臺的業(yè)務(wù)數(shù)據(jù),并且隨著數(shù)據(jù)規(guī)模的擴(kuò)大,MySQL通過構(gòu)建集群實(shí)現(xiàn)橫向擴(kuò)展,從而滿足海量數(shù)據(jù)的讀寫要求。而在非關(guān)系數(shù)據(jù)庫產(chǎn)品中,MongoDB以一種類似于Json對象的文檔方式來完成數(shù)據(jù)的存儲,所有文檔可實(shí)現(xiàn)分布式架構(gòu)存儲,通過Map/Reduce執(zhí)行批量處理和聚合操作,在數(shù)據(jù)讀寫時(shí),硬盤中的數(shù)據(jù)通過nmap方式映射到內(nèi)存中。
在新技術(shù)的快速發(fā)展和影響下,職業(yè)教育要堅(jiān)持立德樹人,注重“人”的發(fā)展,培養(yǎng)專業(yè)能力與通用能力兼具、能力水平更高的復(fù)合型、智能型技術(shù)技能人才[19]。而能力的培養(yǎng)需要建立在一定的知識基礎(chǔ)上,并能掌握多種工具使用這些知識,提升技能水平,最終形成解決具體問題的核心能力。因此,作為職業(yè)教育的學(xué)習(xí)評價(jià),最終涉及到這樣三個(gè)方面:知識習(xí)得、技能掌握和能力養(yǎng)成上,即KSA模型(Knowledge、Skill、Ability,簡稱 KSA),如圖1所示。
圖1 職業(yè)教育學(xué)習(xí)評價(jià)
知識習(xí)得反映完成工作任務(wù)需具備的知識,如管理學(xué)知識、經(jīng)濟(jì)學(xué)知識、數(shù)學(xué)知識等;技能掌握反映完成工作任務(wù)需具備的技能,如Excel數(shù)據(jù)分析技能、SQL數(shù)據(jù)查詢技能、PPT文稿制作技能等;能力養(yǎng)成反映完成工作任務(wù)需具備的能力,如需求溝通能力、實(shí)驗(yàn)設(shè)計(jì)能力、總結(jié)匯報(bào)能力等。一方面,通過職業(yè)教育系統(tǒng)化的培養(yǎng)和學(xué)習(xí),可以促進(jìn)學(xué)習(xí)者KSA的提升;另一方面,職業(yè)教育學(xué)習(xí)評價(jià)對學(xué)習(xí)的促進(jìn)也體現(xiàn)在KSA的發(fā)展上。[20]
學(xué)習(xí)者的學(xué)習(xí)過程通過學(xué)習(xí)行為來體現(xiàn),每一次的學(xué)習(xí)行為都會涵蓋學(xué)習(xí)的時(shí)間、學(xué)習(xí)的地點(diǎn)以及通過何種設(shè)備進(jìn)行學(xué)習(xí)。因此,選擇時(shí)間、空間和設(shè)備三個(gè)維度立體化地呈現(xiàn)學(xué)習(xí)行為,如圖2所示。
圖2 小數(shù)據(jù)建模維度
學(xué)習(xí)時(shí)間可以將一天的學(xué)習(xí)時(shí)間按照特定時(shí)間段進(jìn)行劃分,如 (0:00, 6:00]、(6:00, 8:00]、(8:00,12:00]、(12:00, 14:00]、(14:00, 18:00]、(18:00, 20:00]、(20:00, 24:00]七個(gè)時(shí)間段;空間維度反映學(xué)習(xí)者在什么地方學(xué)習(xí),如智慧教室、線上、圖書館、實(shí)訓(xùn)室、企業(yè)等;設(shè)備主要是學(xué)習(xí)者通過什么方式進(jìn)行學(xué)習(xí),如智能手機(jī)、普通PC、專業(yè)實(shí)訓(xùn)設(shè)備、虛擬仿真、各種學(xué)習(xí)系統(tǒng)等。這樣,每一個(gè)學(xué)習(xí)行為都可以表示為
由于學(xué)習(xí)行為數(shù)據(jù)一般是由系統(tǒng)和設(shè)備自動生成的,其格式基本都是日志文件,通過對這些日志文件的解析,可以以
當(dāng)個(gè)體學(xué)習(xí)小數(shù)據(jù)匯聚到一起時(shí),就會形成學(xué)習(xí)“大”數(shù)據(jù)。同時(shí),這些學(xué)習(xí)小數(shù)據(jù)具有很強(qiáng)的時(shí)效性,要求在短時(shí)間內(nèi)及時(shí)處理才能體現(xiàn)出有效感知和預(yù)測。另外,作為學(xué)習(xí)的主體——學(xué)習(xí)者,在學(xué)習(xí)過程中往往涉及情緒、心理等因素的波動,如果需要對學(xué)習(xí)做出準(zhǔn)確的評價(jià),就涉及到多源數(shù)據(jù)的融合,以確保分析結(jié)果的準(zhǔn)確性。從這些方面可以看出,小數(shù)據(jù)和大數(shù)據(jù)具有部分類似的特征,在當(dāng)前大數(shù)據(jù)存儲和處理相對成熟的基礎(chǔ)上,對小數(shù)據(jù)的管理和使用完全可以利用大數(shù)據(jù)相關(guān)技術(shù)[21]。目前,針對大數(shù)據(jù)處理的典型計(jì)算框架有:Hadoop、Spark、Flink、Storm、Samza等,這些框架都是Apache基金會平臺上發(fā)布的開源項(xiàng)目。從類型上來看,Hadoop屬于僅支持批處理的計(jì)算框架,Storm和Samza是僅支持流處理的計(jì)算框架,而Spark和Flink既支持批處理,也支持流處理。由于個(gè)體學(xué)習(xí)小數(shù)據(jù)增長速度快,并且動態(tài)實(shí)時(shí)生成,匯總到一起,數(shù)據(jù)量大,對計(jì)算吞吐量要求也高。通過綜合考慮,由于Spark具有強(qiáng)大而完善的內(nèi)存計(jì)算和處理優(yōu)化機(jī)制,可大幅提升計(jì)算性能,并通過批處理引擎的原生語義實(shí)現(xiàn)流數(shù)據(jù)的微批(Micro-batch)計(jì)算,同時(shí)在框架整合上還可與Hadoop有效集成。因此,選擇Spark作為計(jì)算的處理框架。這樣,就形成了個(gè)體小數(shù)據(jù)的分析處理框架,如圖3所示。
圖3 個(gè)體小數(shù)據(jù)的分析處理框架
本文將整個(gè)分析處理過程分為四層,分別是個(gè)體學(xué)習(xí)數(shù)據(jù)存儲層、個(gè)體學(xué)習(xí)數(shù)據(jù)計(jì)算層、個(gè)體學(xué)習(xí)數(shù)據(jù)分析層和個(gè)體學(xué)習(xí)評價(jià)生成層。為了邏輯上的清晰呈現(xiàn),本文專門設(shè)置了個(gè)體學(xué)習(xí)數(shù)據(jù)計(jì)算層和個(gè)體學(xué)習(xí)數(shù)據(jù)分析層,但實(shí)際從功能上來講,這兩層可以合并為一層,因?yàn)椴还苓x擇哪一種或哪幾種分析任務(wù),最終都要通過Spark大數(shù)據(jù)計(jì)算框架來調(diào)度執(zhí)行具體的計(jì)算處理。
由于學(xué)習(xí)小數(shù)據(jù)涉及眾多指標(biāo)變量,為了充分利用這些數(shù)據(jù),并降低計(jì)算的復(fù)雜性,保證生成精準(zhǔn)的學(xué)習(xí)評價(jià)結(jié)果,這里采用因子分析描述和刻畫學(xué)習(xí)小數(shù)據(jù)與評價(jià)結(jié)果之間的關(guān)系。因子分析是一種多變量統(tǒng)計(jì)分析方法,其思想是“降維”,但與主成分分析不同,因子分析基于原始變量的相關(guān)矩陣。
設(shè)E代表學(xué)習(xí)評價(jià)的結(jié)果,E={E1, E2, E3 },E1表示學(xué)習(xí)者的學(xué)習(xí)習(xí)得,E2表示學(xué)習(xí)者的技能掌握,E3表示學(xué)習(xí)者的能力素養(yǎng)。則:
這里,i=1,2,3,j=1,2,……,n,n代表學(xué)習(xí)者小數(shù)據(jù)的數(shù)據(jù)容量。aij為常量矩陣,表示因子載荷,可通過主成分法、主軸因子法、最小二乘法等求得。Fj為相互獨(dú)立且不可測的公因子,表示學(xué)習(xí)相關(guān)因子在整個(gè)用戶小數(shù)據(jù)指標(biāo)體系中的權(quán)重。εi為僅對該類學(xué)習(xí)效果有影響的特殊因子,在E的計(jì)算表達(dá)式中,F(xiàn)與εi相互獨(dú)立。
學(xué)習(xí)評價(jià)就是學(xué)習(xí)者基本信息、知識習(xí)得、技能掌握和能力養(yǎng)成的結(jié)果匯總,可以完整刻畫學(xué)習(xí)者在特定時(shí)間段內(nèi)學(xué)習(xí)的整體情況。通過上述模型生成的學(xué)習(xí)評價(jià)結(jié)果并不是固定不變的,而會隨著學(xué)習(xí)者學(xué)習(xí)行為、時(shí)間、空間等的變化而變化,這種變化也可以通過模型進(jìn)行刻畫和描述,如果用R表示學(xué)習(xí)者在某個(gè)時(shí)間點(diǎn)上生成的學(xué)習(xí)評價(jià)結(jié)果,那么引入時(shí)間變量t,則R就是一個(gè)隨時(shí)間t衰減的函數(shù),具體如下。
式中 i=1,2,3,Ct為隨時(shí)間t變化的衰減值,Ct∈(0,1],如果時(shí)間間隔越長,Ct的取值越小,衰減越厲害。其計(jì)算公式為:
式中t為當(dāng)前時(shí)間,t'為學(xué)習(xí)行為發(fā)生或?qū)W習(xí)評價(jià)結(jié)果生成的時(shí)間,α為衰減因子,其值可由專家根據(jù)經(jīng)驗(yàn)給出或通過回歸計(jì)算得到。
這樣,學(xué)習(xí)評價(jià)結(jié)果就會產(chǎn)生時(shí)間上的連續(xù)性,并且隨著時(shí)間的推移,前期的學(xué)習(xí)評價(jià)結(jié)果因新的學(xué)習(xí)行為影響而被逐漸淡化,這也在一定程度上反映了學(xué)習(xí)評價(jià)結(jié)果對之前學(xué)習(xí)行為的改進(jìn)和優(yōu)化,從而達(dá)到以評價(jià)促進(jìn)學(xué)習(xí)的評價(jià)目的。當(dāng)然,引入衰減函數(shù),還有另外一個(gè)原因,防止學(xué)習(xí)者被貼上固化標(biāo)簽,引起歧視性待遇[22],從而束縛學(xué)習(xí)者后面的進(jìn)步、成長和改變。
總之,數(shù)據(jù)作為信息時(shí)代的關(guān)鍵生產(chǎn)要素,在政府決策、企業(yè)管理、教育教學(xué)等領(lǐng)域的作用日漸凸顯。本文從數(shù)據(jù)科學(xué)的角度,對大數(shù)據(jù)環(huán)境下產(chǎn)生的個(gè)體小數(shù)據(jù)進(jìn)行了全面闡述,包括小數(shù)據(jù)的內(nèi)涵、大數(shù)據(jù)與小數(shù)據(jù)的關(guān)系。在此基礎(chǔ)上,以職業(yè)教育為背景,以職業(yè)教育學(xué)習(xí)評價(jià)為研究對象,分析了職業(yè)教育背景下個(gè)體學(xué)習(xí)小數(shù)據(jù)的采集和存儲,提出了由學(xué)習(xí)小數(shù)據(jù)源、學(xué)習(xí)小數(shù)據(jù)存儲、學(xué)習(xí)小數(shù)據(jù)計(jì)算、學(xué)習(xí)小數(shù)據(jù)分析、評價(jià)結(jié)果生成組成的個(gè)體小數(shù)據(jù)分析處理的框架,通過各層的調(diào)用和處理,最終以知識習(xí)得、技能掌握和能力養(yǎng)成反映職業(yè)教育環(huán)境下學(xué)習(xí)者的學(xué)習(xí)成果。由于小數(shù)據(jù)采集的多源性,為了生成精準(zhǔn)的學(xué)習(xí)評價(jià)結(jié)果,運(yùn)用因子分析刻畫和描述學(xué)習(xí)小數(shù)據(jù)與評價(jià)結(jié)果之間的關(guān)系。有了學(xué)習(xí)評價(jià)結(jié)果,可以構(gòu)建個(gè)性化的學(xué)習(xí)服務(wù),生成個(gè)性化的學(xué)習(xí)畫像,挖掘個(gè)性化的學(xué)習(xí)需求,產(chǎn)生個(gè)性化的學(xué)習(xí)資源推薦。學(xué)習(xí)評價(jià)既是對之前學(xué)習(xí)行為的深度分析和評判,也是后續(xù)推動教學(xué)改進(jìn)和學(xué)習(xí)改進(jìn)的基礎(chǔ)。在當(dāng)前智能技術(shù)驅(qū)動教育變革過程中,精準(zhǔn)學(xué)習(xí)評價(jià)為智慧教育和全面發(fā)展的人才培養(yǎng)提供了新的思路和參考。