劉 鑫,楊 娟
(蘇州大學(xué) 教育學(xué)院,江蘇 蘇州 215123)
人工智能(Artificial Intelligence)始于20世紀(jì)50年代,隨著大數(shù)據(jù)的積聚、理論算法的革新、計(jì)算能力的提升,人工智能在很多應(yīng)用領(lǐng)域取得了突破性進(jìn)展,迎來了又一個(gè)繁榮時(shí)期。而機(jī)器學(xué)習(xí)(Machine Learning)是人工智能技術(shù)的核心,是一門涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科,研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能[1]。作為人工智能領(lǐng)域下的一個(gè)重要的分支,機(jī)器學(xué)習(xí)是使計(jì)算機(jī)具有智能的根本途徑。目前,有關(guān)機(jī)器學(xué)習(xí)在教育領(lǐng)域的相關(guān)研究還比較缺乏,因此有必要對機(jī)器學(xué)習(xí)在其它領(lǐng)域的研究現(xiàn)狀進(jìn)行分析,進(jìn)而對其在教育領(lǐng)域的應(yīng)用前景進(jìn)行一個(gè)有效的探究。
文獻(xiàn)計(jì)量方法是利用數(shù)學(xué)或統(tǒng)計(jì)學(xué)方法,對文獻(xiàn)的外部特征數(shù)量進(jìn)行描述,繼而對科學(xué)技術(shù)的現(xiàn)狀與發(fā)展趨勢進(jìn)行評價(jià)和預(yù)測的研究方法[2]。通過文獻(xiàn)的年代分布、研究主題分布等方面對所收集到的文獻(xiàn)進(jìn)行系統(tǒng)分析。
共詞分析就是將文獻(xiàn)主題詞作為分析對象,利用包容系數(shù)、聚類分析等多種統(tǒng)計(jì)分析方法,把眾多分析對象之間錯(cuò)綜復(fù)雜的共詞網(wǎng)狀關(guān)系簡化為以數(shù)值、圖形直觀地表示出來的過程[3]。
文章選取中國知網(wǎng)(CNKI)收錄期刊為數(shù)據(jù)分析來源,對檢索條件進(jìn)行設(shè)置,其中檢索主題為“機(jī)器學(xué)習(xí)”,檢索年限為2007—2017年,期刊的來源類別為全部期刊。經(jīng)過初步檢索得到3 687條結(jié)果,除去“編者按”、“開欄語”、“會議”及其它不適合用于可視化分析的文獻(xiàn),共得到有效文獻(xiàn)3 334篇。
將有效文獻(xiàn)以EndNote格式導(dǎo)出,并且將導(dǎo)出的數(shù)據(jù)通過SATI轉(zhuǎn)換成相應(yīng)的矩陣,再利用SPSS對矩陣數(shù)據(jù)進(jìn)行系統(tǒng)聚類分析與多維尺度分析。
進(jìn)行聚類分析之前,需要去除核心關(guān)鍵詞“機(jī)器學(xué)習(xí)”,在SATI矩陣行列顯示關(guān)鍵詞數(shù)量設(shè)置為31,得到所需的機(jī)器學(xué)習(xí)關(guān)鍵詞31×31的相似矩陣(Co-Occurrence Matrix (Similarity))的excel文件,將“機(jī)器學(xué)習(xí)”所在的行列值進(jìn)行刪除。再將相似矩陣導(dǎo)入SPSS21.0中,采用“分析—分類—系統(tǒng)聚類”方法進(jìn)行聚類分析,得到機(jī)器學(xué)習(xí)關(guān)鍵詞共詞聚類樹狀圖,見圖1。
圖1 機(jī)器學(xué)習(xí)領(lǐng)域關(guān)鍵詞聚類圖
通過聚類圖可以將機(jī)器學(xué)習(xí)領(lǐng)域的關(guān)鍵詞劃分為以下幾個(gè)部分:分組1包括人工智能、學(xué)習(xí)(人工智能)領(lǐng)域、AI和算法;分組2包括數(shù)據(jù)挖掘、大數(shù)據(jù)分類、半監(jiān)督學(xué)習(xí)和預(yù)測;分組3包括深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)、入侵檢測、神經(jīng)網(wǎng)絡(luò)支持向量機(jī)、決策樹和隨機(jī)森林;分組4包括集成學(xué)習(xí)、流量分類、情感分析、情感分類和特征選擇;分組5包括自然語言處理、信息抽取、特征提取、模式識別、文本分類和SVM。
根據(jù)關(guān)鍵詞聚類圖的分析結(jié)果對多維尺度分析圖進(jìn)行描繪,可以進(jìn)一步得到深度學(xué)習(xí)研究熱點(diǎn)的知識圖譜。多維尺度分析是通過利用二維平面空間中點(diǎn)(對象)的距離反映研究個(gè)體(高頻關(guān)鍵詞)間的相似性或差異性,也能反映出相關(guān)研究領(lǐng)域的內(nèi)部聚合度[4]。將30×30關(guān)鍵詞相異矩陣導(dǎo)入SPSS21.0,利用方法“分析—度量—多維尺度(ALSCAI)”對相異矩陣進(jìn)行分析處理,得到機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)知識圖譜,見圖2。
圖2 機(jī)器學(xué)習(xí)領(lǐng)域研究熱點(diǎn)知識圖譜
通過結(jié)合圖1中機(jī)器學(xué)習(xí)關(guān)鍵詞聚類圖和圖2中多維尺度分析所得的Euclidean距離模型散點(diǎn)圖,可將機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)概括為以下四個(gè)領(lǐng)域,具體為研究領(lǐng)域1:人工智能相關(guān)研究;領(lǐng)域2:大數(shù)據(jù)相關(guān)研究;領(lǐng)域3:機(jī)器學(xué)習(xí)相關(guān)算法及深度學(xué)習(xí);領(lǐng)域4:機(jī)器學(xué)習(xí)實(shí)際相關(guān)應(yīng)用。
從關(guān)鍵詞“人工智能”、這不也是“人工智能”嗎?等可以看出,領(lǐng)域1主要是與人工智能相關(guān)的研究,包括對于人工智能的相關(guān)研究概述以及在各個(gè)領(lǐng)域應(yīng)用現(xiàn)狀等。
從關(guān)鍵詞“大數(shù)據(jù)”、“數(shù)據(jù)挖掘”和“預(yù)測”等不難看出,領(lǐng)域2主要是在大數(shù)據(jù)背景下,利用機(jī)器學(xué)習(xí)對大量且繁雜的數(shù)據(jù)進(jìn)行挖掘,通過統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、模式識別等諸多方法來實(shí)現(xiàn)從大量的數(shù)據(jù)中通過算法搜索隱藏于其中的信息以及將實(shí)例數(shù)據(jù)劃到合適的類別中。
從關(guān)鍵詞“算法”、“神經(jīng)網(wǎng)絡(luò)”和“深度學(xué)習(xí)”等可以看出,領(lǐng)域3是關(guān)于機(jī)器學(xué)習(xí)的相關(guān)算法研究以及基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)的應(yīng)用發(fā)展。
從關(guān)鍵詞“特征提取”、“情感分析”和“文本分類”等可以看出,領(lǐng)域4是關(guān)于機(jī)器學(xué)習(xí)在實(shí)際中具體應(yīng)用的相關(guān)研究,通過特征提取、特征選擇等手段,對文本進(jìn)行分類和分析。
通過對機(jī)器學(xué)習(xí)總體的現(xiàn)狀研究有了一個(gè)了解后,可以看出機(jī)器學(xué)習(xí)目前在大多數(shù)領(lǐng)域的應(yīng)用是比較廣泛的,從這些已經(jīng)有了成熟應(yīng)用的領(lǐng)域中,可以預(yù)見機(jī)器學(xué)習(xí)在教育領(lǐng)域的應(yīng)用前景。
機(jī)器學(xué)習(xí)是人工智能的核心,而人工智能相關(guān)產(chǎn)品的推廣和應(yīng)用也是機(jī)器學(xué)習(xí)發(fā)展的重要體現(xiàn)之一?;谌斯ぶ悄艿南嚓P(guān)產(chǎn)品在教育領(lǐng)域中的應(yīng)用已經(jīng)有了不少嘗試,并且取得了不錯(cuò)的教學(xué)效果。
人工智能技術(shù)推動了個(gè)性化教育從理念走向?qū)嵺`,在教育各場景中常態(tài)化應(yīng)用了科大訊飛的智能教學(xué)、智能學(xué)習(xí)和智能管理系統(tǒng),從而形成了一系列典型特色的人工智能教育應(yīng)用案例[5]。人工智能時(shí)代的來臨,不僅將改變學(xué)校教育的目標(biāo),也為實(shí)現(xiàn)新的教學(xué)形態(tài)提供了可能,這些體現(xiàn)到學(xué)習(xí)空間上,就是一些新的特征將得以凸顯,即人工智能時(shí)代的學(xué)習(xí)空間變革[6]。學(xué)習(xí)空間的設(shè)計(jì)在原有基礎(chǔ)上要凸顯出層次性、多樣性和協(xié)同性,比如在空間規(guī)劃方面可以參考AltSchool的學(xué)習(xí)空間布局,還有各種智能技術(shù)的有機(jī)整合等。TensorFlow等開源人工智能系統(tǒng)為推動教育人工智能的研究與應(yīng)用提供了新的思路和方法,其在教育領(lǐng)域可應(yīng)用于教育大數(shù)據(jù)分析、學(xué)習(xí)推薦系統(tǒng)、教學(xué)游戲和教育機(jī)器人等方面,助力智能教學(xué)應(yīng)用的設(shè)計(jì)與實(shí)現(xiàn)[7]。除此之外,人工智能在學(xué)校管理、校園安全、課堂管理、智能助教、自動閱卷和自適應(yīng)教學(xué)等方面都有發(fā)揮作用。隨著機(jī)器學(xué)習(xí)的不斷發(fā)展,人工智能技術(shù)也會更加成熟,其在教育領(lǐng)域的應(yīng)用也會更加多樣化。
在日常生活中,無時(shí)無刻不在產(chǎn)生數(shù)據(jù),如何挖掘數(shù)據(jù)背后隱藏的知識信息并高效地利用,已成為各行各業(yè)考慮的一個(gè)重要因素。對教育過程中生成的大量數(shù)據(jù)進(jìn)行分析與探究,已經(jīng)成為當(dāng)前教育研究的熱點(diǎn)和趨勢。在此背景下,教育數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。
教育數(shù)據(jù)挖掘是匯集教育學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)等多學(xué)科知識,能夠從海量教育數(shù)據(jù)中挖掘出蘊(yùn)藏的信息規(guī)律和數(shù)據(jù)價(jià)值[8]。通常教育數(shù)據(jù)挖掘的主要流程包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘和結(jié)果分析四個(gè)步驟,其中數(shù)據(jù)挖掘是整個(gè)過程的核心,主要運(yùn)用統(tǒng)計(jì)分析、人工智能、機(jī)器學(xué)習(xí)等方法,從學(xué)習(xí)者產(chǎn)生的大量的數(shù)據(jù)中挖掘出內(nèi)隱的、有價(jià)值的信息的過程[9]。通過數(shù)據(jù)挖掘技術(shù)能夠幫助課程管理者和教師分析學(xué)生的學(xué)習(xí)行為,刻畫學(xué)習(xí)者的學(xué)習(xí)風(fēng)格與學(xué)習(xí)肖像,為學(xué)生提供學(xué)習(xí)建議,從而能夠改善和提升課程教育質(zhì)量,預(yù)測學(xué)習(xí)者未來的學(xué)習(xí)趨勢。在當(dāng)今的遠(yuǎn)程網(wǎng)絡(luò)教學(xué)和混合學(xué)習(xí)中,教育數(shù)據(jù)挖掘技術(shù)能夠?yàn)閷W(xué)習(xí)者的個(gè)性化及自適應(yīng)學(xué)習(xí)提供有力的數(shù)據(jù)支持。
在教育領(lǐng)域深度學(xué)習(xí)已經(jīng)不再是一個(gè)陌生的名詞,信息時(shí)代把人們以前應(yīng)該重視但被忽略了的思考與實(shí)踐凸顯了出來。近年來,隨著機(jī)器學(xué)習(xí)研究的不斷深入,深度學(xué)習(xí)作為人工智能領(lǐng)域中機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)新興研究方向,逐漸成為廣大研究者關(guān)注的焦點(diǎn)。深度學(xué)習(xí)架構(gòu)由多層非線性運(yùn)算單元組成,每個(gè)較低層的輸出作為更高層的輸入,可以從大量輸入數(shù)據(jù)中學(xué)習(xí)有效的特征表示[10]。2017年新媒體聯(lián)盟《地平線報(bào)告》(基礎(chǔ)教育版)中指出,深度學(xué)習(xí)策略在未來五年甚至更長時(shí)間里都將是驅(qū)動基礎(chǔ)教育應(yīng)用技術(shù)的關(guān)鍵要素[11]。
在當(dāng)今互聯(lián)網(wǎng)迅速發(fā)展的時(shí)代,碎片化、泛在學(xué)習(xí)、移動學(xué)習(xí)等方式普遍受到了人們的關(guān)注,但是這些途徑獲得的知識往往是孤立的、雜亂的和被動的,僅僅停留在淺層學(xué)習(xí)的層次。借鑒機(jī)器學(xué)習(xí)領(lǐng)域的深度學(xué)習(xí)理念,深度學(xué)習(xí)要求不僅僅只注重淺層次的知識學(xué)習(xí),要以淺層次的知識作為深層次內(nèi)容的輸入,從而有效掌握相關(guān)知識的深層表征。深度學(xué)習(xí)是在理解學(xué)習(xí)的基礎(chǔ)上,學(xué)習(xí)者能夠批判性地學(xué)習(xí)新的思想和事實(shí),并將它們?nèi)谌朐械恼J(rèn)知結(jié)構(gòu)中,能夠在眾多思想間進(jìn)行聯(lián)系,并能夠?qū)⒁延械闹R遷移到新的情境中,做出決策和解決問題的學(xué)習(xí)[11]。那么機(jī)器學(xué)習(xí)或人工智能技術(shù)能否有效地促進(jìn)學(xué)生從淺層學(xué)習(xí)向深度學(xué)習(xí)過渡?研究者們進(jìn)行了大量的探究,如顧小清教授及其團(tuán)隊(duì)嘗試用“語義圖示工具模型”引發(fā)學(xué)生進(jìn)行深度學(xué)習(xí)[12],安富海教授基于我國目前中小學(xué)課堂學(xué)習(xí)的現(xiàn)狀提出了一系列促進(jìn)深度學(xué)習(xí)的教學(xué)策略,還有一些研究者通過改變翻轉(zhuǎn)課堂設(shè)計(jì)形式促進(jìn)學(xué)生的高級思維能力和創(chuàng)造力的發(fā)展等等,這些實(shí)踐都說明了如何有效地促進(jìn)學(xué)習(xí)者深度學(xué)習(xí)是研究者們一直追求的目標(biāo)之一。
作為機(jī)器學(xué)習(xí)實(shí)際應(yīng)用中非常重要的兩個(gè)方面,通過對文本和圖像的特征提取以及情感分析,在教育領(lǐng)域中有著非常強(qiáng)大的實(shí)用性??梢岳迷诰€學(xué)習(xí)過程中學(xué)習(xí)者學(xué)習(xí)活動所產(chǎn)生的大量數(shù)據(jù)對學(xué)習(xí)者產(chǎn)生形成性評價(jià)。首先基于認(rèn)知思維的要求作為在線學(xué)習(xí)的目標(biāo)分類,通過自動分類算法進(jìn)行聚類分析區(qū)分學(xué)習(xí)者的應(yīng)用能力層次,在此基礎(chǔ)上,為提高數(shù)據(jù)的處理效率,加快對學(xué)習(xí)者的評價(jià),再采用三層自動編碼器的神經(jīng)網(wǎng)絡(luò)降維提取關(guān)鍵特征,然后利用訓(xùn)練集中的數(shù)據(jù)訓(xùn)練學(xué)習(xí)器,并利用集成學(xué)習(xí)機(jī)制綜合單個(gè)學(xué)習(xí)器的結(jié)果,得到更為準(zhǔn)確的評價(jià)結(jié)果。由于多媒體畫面圖像的情感依賴學(xué)習(xí)者的主觀感受,主觀性很強(qiáng),利用計(jì)算機(jī)對多媒體畫面圖像的情感進(jìn)行自動估計(jì),可以避免主觀性評價(jià)的片面性,實(shí)現(xiàn)對多媒體畫面圖像情感的大數(shù)據(jù)分析。
不論是線下學(xué)習(xí)還是線上學(xué)習(xí),都可以通過對學(xué)習(xí)者學(xué)習(xí)過程中產(chǎn)生的文本內(nèi)容和影像內(nèi)容進(jìn)行分析。通過對相應(yīng)文本和影像進(jìn)行特征提取,就可以對學(xué)習(xí)者的學(xué)習(xí)投入度、學(xué)習(xí)效果以及學(xué)習(xí)滿意度等做出相應(yīng)判斷,對學(xué)習(xí)者在整個(gè)學(xué)習(xí)過程中的學(xué)習(xí)情緒和狀態(tài)也能有一個(gè)清晰認(rèn)知。這些對于教學(xué)者對課程教學(xué)有效度的判斷、教學(xué)設(shè)計(jì)和教學(xué)方法的改進(jìn)都有很大的幫助。
首先,通過對機(jī)器學(xué)習(xí)近十年研究現(xiàn)狀進(jìn)行了分析,在此基礎(chǔ)上,對機(jī)器學(xué)習(xí)在教育領(lǐng)域的應(yīng)用前景做出了進(jìn)一步的探討研究,盡管上述幾個(gè)方面在當(dāng)前教育領(lǐng)域中有所涉獵,但是相較于其在計(jì)算機(jī)科學(xué)、商業(yè)等領(lǐng)域的應(yīng)用現(xiàn)狀來說還是有一定差距的。無論是在理論認(rèn)知還是在實(shí)踐應(yīng)用方面,機(jī)器學(xué)習(xí)在教育領(lǐng)域的應(yīng)用都還有很大的發(fā)展空間。為了實(shí)現(xiàn)教育的信息化和智慧化,有必要提高對機(jī)器學(xué)習(xí)的重視,促進(jìn)機(jī)器學(xué)習(xí)在教育領(lǐng)域的實(shí)踐應(yīng)用。