王萍 王陳欣 朱璇
摘要:教育人工智能系統(tǒng)設(shè)計與應(yīng)用研究的目標是推動教育與人工智能深度融合,促進人工智能在教育領(lǐng)域的落地,加速教育邁向智能化時代。文章從文獻分析、地平線報告分析、技術(shù)成熟度模型分析三個方面梳理了當(dāng)前教育人工智能應(yīng)用研究的現(xiàn)狀。接著,分析了教育人工智能系統(tǒng)的主要功能模塊,歸納了系統(tǒng)設(shè)計開發(fā)中存在的問題與面臨的困難。在此基礎(chǔ)上提出了基于自動化思想和學(xué)習(xí)理論支持的新型教育人工智能系統(tǒng)設(shè)計方法與模型,并進行了案例實踐研究?;谧詣踊椒ǖ慕逃斯ぶ悄芟到y(tǒng)設(shè)計有助于幫助教師實現(xiàn)智能教育應(yīng)用,降低人工智能應(yīng)用門檻,擴展教育應(yīng)用場景,提高開發(fā)與更新效率。
關(guān)鍵詞:自動化;教育;人工智能;系統(tǒng)設(shè)計;學(xué)習(xí)理論
中圖分類號:G434
文獻標識碼:A
文章編號:1006-9860(2020)06-0007-09
一、引言
作為科技進步的核心驅(qū)動力,人工智能對社會發(fā)展帶來了深刻變革。教育領(lǐng)域也在積極探尋如何與人工智能深度融合,推動教育創(chuàng)新,構(gòu)建智能時代下的教育新生態(tài)。但人工智能對教育的具體賦能并非是一蹴而就的,教育領(lǐng)域目前還面臨著缺少成熟應(yīng)用模式、缺少人工智能專家、缺少技術(shù)平臺支撐等問題,人工智能尚未能夠有效的支持構(gòu)建教育工具和教育系統(tǒng)。如何推動人工智能的落地應(yīng)用、實現(xiàn)人工智能系統(tǒng)的便捷開發(fā)將是教育人工智能發(fā)展道路上的重要環(huán)節(jié)。
自動化是人類文明進步和社會現(xiàn)代化的標志。伴隨人類社會的進步,自動化技術(shù)在社會需求的推動下不斷發(fā)展。當(dāng)前,通過自動化方法構(gòu)建人工智能系統(tǒng)是人工智能領(lǐng)域開始關(guān)注的一個重要方向。作為一種新的研究方法,自動化機器學(xué)習(xí)、自動化深度學(xué)習(xí)等人工智能方法使用“以人工智能訓(xùn)練人工智能”的設(shè)計思路,擴展人工智能研究和應(yīng)用的范圍,實現(xiàn)開放普惠的人工智能目標。使用者只需給出輸入數(shù)據(jù)和任務(wù)類型,系統(tǒng)建模中的算法與模型構(gòu)建等專業(yè)性任務(wù)由機器自動完成,從而有效降低人工智能應(yīng)用與系統(tǒng)開發(fā)的門檻,推動人工智能應(yīng)用的標準化、模塊化、自動化。
當(dāng)前教育人工智能的研究總體上呈現(xiàn)理論探討多、落地應(yīng)用少的現(xiàn)狀,自動化人工智能方法為教育領(lǐng)域的人工智能研究與應(yīng)用提供了思路。本文在分析教育人工智能系統(tǒng)設(shè)計與應(yīng)用已有研究與問題的基礎(chǔ)上,探討基于自動化思想的設(shè)計方法,以期為探索教育人工智能的應(yīng)用與實踐提供參考。
二、相關(guān)研究分析
我們從文獻分析、地平線報告分析、Gartner技術(shù)趨勢分析三個方面,對教育人工智能的研究現(xiàn)狀進行梳理,并重點分析人工智能在應(yīng)用層面的研究與進展。
(一)國內(nèi)教育人工智能研究現(xiàn)狀
為了深入分析國內(nèi)教育人工智能的研究現(xiàn)狀,我們選取了國內(nèi)教育技術(shù)領(lǐng)域7個主要CSSCI期刊中內(nèi)容關(guān)于人工智能的論文,從2017年1月至2019年12月共369篇,對文章主題進行了歸納與分類。分析結(jié)果可以發(fā)現(xiàn)當(dāng)前國內(nèi)教育人工智能研究存在較為明顯的“理論研究豐富,場景討論充分,技術(shù)應(yīng)用匱乏”的局面。
1.當(dāng)前國內(nèi)教育人工智能的研究主題主要有三大類。(1)理論探討類。這類研究(174篇)主要從理論角度分析人工智能對教育、學(xué)習(xí)領(lǐng)域帶來的影響,討論智能化時代下對教育帶來的沖擊,具體又可分為綜述類、文件解讀類、理論分析類。這些研究為我們把握人工智能技術(shù)對教育的賦能,分析智能教育的內(nèi)涵與定位,了解世界各國與相關(guān)機構(gòu)的人工智能政策與規(guī)劃,指導(dǎo)我國未來教育人工智能戰(zhàn)略的制定等方面具有積極的意義。(2)應(yīng)用場景類。這類研究(169篇)主要從人工智能技術(shù)參與構(gòu)建的教育應(yīng)用場景展開討論。其中智慧課堂、智慧校園的內(nèi)涵與建設(shè)研究重點分析智能技術(shù)對于課堂、校園等學(xué)習(xí)空間帶來的變革。其他應(yīng)用場景類研究,我們歸為“智能+”類,主要是探索人工智能視域下相關(guān)研究的融合,包括對“智能+5G”“智能+云計算”“智能+慕課”“智能+STEM”等的討論。人工智能技術(shù)融合其他信息技術(shù)正在構(gòu)建全新的技術(shù)場域,從而賦能教育創(chuàng)新,構(gòu)建新的智能應(yīng)用場景。(3)技術(shù)開發(fā)類。當(dāng)前,國內(nèi)教育人工智能中具體的技術(shù)開發(fā)類研究明顯落后于理論研究。在26項已有研究中,17項研究主題為智能系統(tǒng)設(shè)計類,9項研究探索了智能算法。這些研究基本上針對某一具體任務(wù)進行了教育人工智能系統(tǒng)的設(shè)計與算法設(shè)計研究。
2.通過對國內(nèi)已有研究的梳理,可以發(fā)現(xiàn)當(dāng)前教育人工智能在理論分析和潛在應(yīng)用場景的討論已較為全面,但具體應(yīng)用實現(xiàn)和技術(shù)研究方面還較少,系統(tǒng)設(shè)計與算法研究還有待于深入。在教育人工智能的系統(tǒng)應(yīng)用框架和實現(xiàn)流程方面,一些學(xué)者結(jié)合人工智能技術(shù)特征進行了分析,提出教育人工智能技術(shù)框架主要包括教育數(shù)據(jù)層、算法層、感知層、認知層和教育應(yīng)用層。但研究也還主要停留在框架的建構(gòu)層面,對于如何應(yīng)用框架中的模塊和技術(shù)到具體的教育人工智能應(yīng)用中,還缺少實踐研究。雖然如何推動并實現(xiàn)有效的落地應(yīng)用已經(jīng)受到理論關(guān)注與討論,但探索如何有效落地應(yīng)用的機制和方法還較為匱乏。
(二)地平線報告對人工智能的分析
地平線報告從2014年開始持續(xù)關(guān)注虛擬助理、自適應(yīng)學(xué)習(xí)、自然用戶界面、機器人技術(shù)等智能技術(shù)在教育領(lǐng)域中的應(yīng)用。2017年以來人工智能作為專項技術(shù)連續(xù)出現(xiàn)在地平線報告中。作為影響教育未來中長期發(fā)展的關(guān)鍵技術(shù),智能技術(shù)的發(fā)展與應(yīng)用成為地平線趨勢預(yù)測的重要部分(如圖1所示)。
圖1描述了地平線報告中近年對人工智能相關(guān)技術(shù)的教育應(yīng)用分析,呈現(xiàn)如下特點。
1.關(guān)注點逐步擴散和全面。從關(guān)注學(xué)習(xí)(2017),到關(guān)注研究與技術(shù)(2018年),到關(guān)注人工智能在教育領(lǐng)域的全面應(yīng)用(2019年)。2017年地平線報告指出人工智能技術(shù)可以“深入理解學(xué)習(xí)者特征,學(xué)習(xí)者思維模式,從而提升在線學(xué)習(xí)和自適應(yīng)學(xué)習(xí)系統(tǒng)的性能”。2018年,在關(guān)注學(xué)習(xí)的基礎(chǔ)上,地平線報告開始關(guān)注人工智能作為有效的研究手段與教學(xué)工具,“增強在線學(xué)習(xí)、適應(yīng)學(xué)習(xí)軟件和研究過程,與學(xué)生進行積極反饋與互動,是有效的教學(xué)工具和技術(shù)解決方案”。2019年地平線報告分析繼續(xù)指出,人工智能技術(shù)作用于教育教學(xué)的全過程,“可以提供個性化體驗,減少工作量和協(xié)作分析大型數(shù)據(jù)集,以為教學(xué)應(yīng)用程序提供借鑒。支持自適應(yīng)學(xué)習(xí)等教學(xué)方法,滿足個性化學(xué)習(xí)。通過數(shù)據(jù)建模分析輔助教學(xué)策略和教學(xué)管理”。
2.關(guān)注教育人工智能的具體應(yīng)用。地平線報告將人工智能作為支持教育的基礎(chǔ)性技術(shù)和重大創(chuàng)新技術(shù)予以關(guān)注并重點關(guān)注人工智能的應(yīng)用方式,即人工智能如何落地于具體的教育場景中,如何應(yīng)用于教與學(xué)過程中。如近年地平線報告中關(guān)注的虛擬助理、自然用戶界面等是對話式人工智能的典型技術(shù),自適應(yīng)學(xué)習(xí)則體現(xiàn)了智能技術(shù)在學(xué)習(xí)系統(tǒng)中的典型應(yīng)用。因此,地平線報告的分析從底層支持層到教學(xué)應(yīng)用層,圍繞人工智能技術(shù)應(yīng)用展開分析,體現(xiàn)了教育對技術(shù)的需求和技術(shù)對教育的支持。
(三)人工智能技術(shù)成熟度模型中的應(yīng)用趨勢分析
Hype Cycle技術(shù)成熟度曲線模型是由Gartner提出的一個應(yīng)用廣泛的發(fā)展周期預(yù)測模型,模型描述了一項技術(shù)從誕生到成熟,再到廣泛應(yīng)用的過程。作為近年科技領(lǐng)域的核心技術(shù),Gartner連續(xù)三年發(fā)布了人工智能Hype Cycle成熟度曲線,對人工智能中的細分技術(shù)、應(yīng)用領(lǐng)域、發(fā)展現(xiàn)狀等項目進行分析與預(yù)測,為研究人工智能技術(shù)的創(chuàng)新和發(fā)展路徑提供了評估標準和分析工具。
我們對2017-2019年Gartner的人工智能成熟度曲線模型進行了分析,重點篩選與“促進應(yīng)用”相關(guān)的人工智能項目,結(jié)合教育領(lǐng)域應(yīng)用,得到如下分析,如圖2所示。
1.人工智能的應(yīng)用落地需要從專家支持、技術(shù)支持和基礎(chǔ)設(shè)施支持等維度展開探索,這些技術(shù)和服務(wù)正處于快速發(fā)展中。2017年AI咨詢及系統(tǒng)整合服務(wù)(AI-related C&SI Services,ACSI)在技術(shù)成熟度模型中提出,旨在從專業(yè)人員支持的角度,為具有人工智能應(yīng)用需求的領(lǐng)域提供咨詢、軟件實施及相關(guān)服務(wù)。人工智能開發(fā)工具包從技術(shù)支持維度,人工智能云服務(wù)從基礎(chǔ)設(shè)施支持維度,分別在2018和2019技術(shù)成熟度曲線中提出,并迅速發(fā)展,為人工智能的落地應(yīng)用提供支撐。人工智能開發(fā)工具包包括數(shù)據(jù)平臺、框架和分析庫、軟件開發(fā)包等,能夠支持人工智能應(yīng)用程序的快速開發(fā)和部署。服務(wù)于人工智能的云服務(wù)為人工智能提供了硬件設(shè)施和算法軟件層面的服務(wù)支持,幫助各種類型的應(yīng)用者能夠使用到人工智能所需的算力和算法。
2.人工智能中的機器學(xué)習(xí)和深度學(xué)習(xí)算法研究已經(jīng)相對成熟,已經(jīng)度過技術(shù)快速發(fā)展期的頂端,開始走向下降期,這個時期也是技術(shù)應(yīng)用模式探索的關(guān)鍵時期。在應(yīng)用的探索中,作為降低機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)門檻的有效方法,推動人工智能應(yīng)用的AUTOML(自動化機器學(xué)習(xí))在2019年得到迅速發(fā)展。
(四)研究評述
1.國內(nèi)教育人工智能的研究需加強對人工智能落地應(yīng)用的研究。當(dāng)前對于如何將人工智能應(yīng)用于教育場景的系統(tǒng)設(shè)計、開發(fā)和實現(xiàn)等研究還較少,包括人工智能技術(shù)的技術(shù)門檻、教育領(lǐng)域?qū)I(yè)人工智能人才的缺乏、教育大數(shù)據(jù)的不足等。因此,需要我們探索有效的方法解決面臨的問題,推動教育領(lǐng)域人工智能的落地應(yīng)用研究。
2.地平線報告研究重點從技術(shù)維度對教育領(lǐng)域內(nèi)人工智能的應(yīng)用進行了分析,關(guān)注重點也在逐步擴散和全面,包含了學(xué)習(xí)支持、研究手段、教學(xué)工具、數(shù)據(jù)策略等方面。這也說明對教育人工智能的研究正在更多的關(guān)注實踐。在人工智能應(yīng)用落地的技術(shù)支持上,Gartner人工智能成熟度模型中對人員支持、軟件支持、服務(wù)支持、云支持、自動化框架支持等的預(yù)測和分析,對于人工智能的落地應(yīng)用有著重要的指導(dǎo)價值。
3.雖然“關(guān)注應(yīng)用”是地平線報告的核心思想,也是技術(shù)成熟模型分析中的重要趨勢,但人工智能在教育領(lǐng)域中的應(yīng)用研究還是薄弱環(huán)節(jié)?!叭绾翁剿饔行У慕逃斯ぶ悄芟到y(tǒng)的設(shè)計與應(yīng)用方法”是需要解決的關(guān)鍵問題。本文旨在研究解決該問題、探索新的教育人工智能應(yīng)用的設(shè)計模型與方法,為教育人工智能系統(tǒng)應(yīng)用的開展和落地提供參考和借鑒。
三、教育人工智能應(yīng)用系統(tǒng)的功能模塊與問題分析
(一)教育人工智能應(yīng)用系統(tǒng)的功能模塊
在人工智能的發(fā)展過程中,有符號主義、連接主義和行為主義三個主要研究范式和學(xué)派。三種范式對智能的產(chǎn)生有著不同的解釋與設(shè)計思想,也影響著人工智能應(yīng)用的技術(shù)手段與設(shè)計模式。當(dāng)前教育人工智能領(lǐng)域主要使用機器學(xué)習(xí)和深度學(xué)習(xí)算法構(gòu)建系統(tǒng)應(yīng)用,是一種基于連接主義的智能模型。基于連接主義模式的特點是:需要通過學(xué)習(xí)高維數(shù)據(jù)來獲取高層語義表達;產(chǎn)生的是黑盒模型,通常具有較高的準確性,但模型的內(nèi)部工作機制無法準確得知;難以估計每個特征對模型預(yù)測結(jié)果的重要性,以及不同特征之間的相互作用關(guān)系。
在大數(shù)據(jù)與超強算力的支撐下,機器學(xué)習(xí)、深度學(xué)習(xí)已在計算機視覺、語音識別、自然語言處理等方面達到甚至超過人類水平,是實現(xiàn)人工智能成功的重要推動力之一?;谶B接主義思想的教育人工智能系統(tǒng)的設(shè)計模型與過程如圖3所示,可以分為教育需求、教育數(shù)據(jù)、教育特征、教育模型、教育應(yīng)用五個主要功能模塊。
1.問題定義與需求分析
問題定義與需求分析是教育人工智能系統(tǒng)開發(fā)的出發(fā)點。我們所要解決的教育問題和系統(tǒng)需求應(yīng)當(dāng)是人工智能可以解決的。人工智能應(yīng)用于教育有其邊界與定位,并非所有的教育問題都適合使用人工智能來解決。只有在恰當(dāng)?shù)慕逃龍鼍芭c教學(xué)需求下,人工智能技術(shù)的應(yīng)用才能產(chǎn)生正向的教育效果。我們需要明確人工智能適合解決哪些任務(wù),哪些教育問題和需求適合人工智能解決。Science對適合機器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)進行了總結(jié),給出了關(guān)鍵評判標準,如需要有明確定義的輸入和輸出;存在或能夠創(chuàng)建大規(guī)模數(shù)據(jù)集;任務(wù)能提供明確的反饋,具有明確的目標和指標;任務(wù)不需要依靠復(fù)雜背景知識的長邏輯鏈;允許容錯性,不需要最佳的解決方案;功能不會出現(xiàn)快速變化;沒有特別的靈巧性、身體技能或機動性要求等。這些標準在我們進行教育人工智能應(yīng)用設(shè)計時可以進行借鑒和參考。在問題定義與需求分析階段,需要教育工作者和技術(shù)人員的共同參與。人工智能技術(shù)與教育應(yīng)用場景是相輔相成的,需要綜合考量和分析人工智能技術(shù)的成熟度與教育場景的復(fù)雜度。
2.教育數(shù)據(jù)收集與處理
以深度學(xué)習(xí)為核心的人工智能算法需要大規(guī)模數(shù)據(jù)進行訓(xùn)練能得到更好效果,基礎(chǔ)數(shù)據(jù)服務(wù)是教育人工智能應(yīng)用和智能系統(tǒng)開發(fā)的支撐。教育數(shù)據(jù)服務(wù)的發(fā)展要推動建設(shè)教育數(shù)據(jù)資源庫、標準測試數(shù)據(jù)集、基礎(chǔ)數(shù)據(jù)平臺,并構(gòu)建科學(xué)高效的數(shù)據(jù)管理機制。教育大數(shù)據(jù)來源包括Web數(shù)據(jù)、云端數(shù)據(jù)、可穿戴設(shè)備傳感器數(shù)據(jù)等多種來源的學(xué)生學(xué)習(xí)數(shù)據(jù)、行為數(shù)據(jù)、教學(xué)管理數(shù)據(jù)等。在教育數(shù)據(jù)的收集過程中,需要考慮以下問題:智能教育系統(tǒng)的實現(xiàn)需要哪些數(shù)據(jù)?數(shù)據(jù)的存儲形式和介質(zhì)是什么?獲取數(shù)據(jù)的成本和難易度如何?數(shù)據(jù)是否覆蓋了應(yīng)用的大部分情境?數(shù)據(jù)是否具有較高的可信度?當(dāng)前大部分教育數(shù)據(jù)還處于數(shù)據(jù)碎片化、規(guī)則模糊的階段,教育數(shù)據(jù)的采集和處理還存在技術(shù)處理方式、管理機制不成熟等問題。
3.教育特征選擇與構(gòu)建
在人工智能領(lǐng)域,特征是指使用領(lǐng)域知識對原始數(shù)據(jù)進行分析,從中抽取和構(gòu)建有效的信息應(yīng)用于智能算法的設(shè)計。在機器學(xué)習(xí)中,特征對于整個機器學(xué)習(xí)模型至關(guān)重要,并且有時會確定其性能的上限。教育特征工程是將教育數(shù)據(jù)與人工智能連接在一起的橋梁,是保證人工智能模型是否與教育目標問題匹配的關(guān)鍵制約因素。教育特征的好壞也直接決定了教育智能系統(tǒng)算法的靈活性和效果。如Gardner等通過數(shù)據(jù)與文獻分析等,給出了慕課研究中的教育特征類型,包括:學(xué)習(xí)活動、人口學(xué)特征、文本特征、社會化、認知特征等,在此基礎(chǔ)上構(gòu)建了慕課學(xué)習(xí)者成功性的預(yù)測模型。
當(dāng)前機器學(xué)習(xí)系統(tǒng)主要采用傳統(tǒng)方法構(gòu)建特征,通過個人的專業(yè)知識和經(jīng)驗構(gòu)建最佳的特征。一般來說,這是一個繁瑣耗時且容易出錯的過程,造成了效果和效率的局限性,并且經(jīng)驗的局限性使得難以為預(yù)測目標確定最具代表性的特征。深度學(xué)習(xí)減少了對手工特征工程的需求,正在教育人工智能研究中應(yīng)用越來越廣泛。
4.教育智能系統(tǒng)模型構(gòu)建
人工智能教育應(yīng)用的核心目標是通過機器學(xué)習(xí)的方式建立人類學(xué)習(xí)的規(guī)則,也即構(gòu)建有效的智能模型。人工智能模型的構(gòu)建包括模型訓(xùn)練與模型評估。教育人工智能系統(tǒng)中的模型一般結(jié)合問題和數(shù)據(jù),大多選擇當(dāng)前通用的、成熟的機器學(xué)習(xí)和深度學(xué)習(xí)模型。機器學(xué)習(xí)模型根據(jù)可使用的數(shù)據(jù)類型可分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)兩類。監(jiān)督學(xué)習(xí)主要包括分類和回歸,無監(jiān)督學(xué)習(xí)主要包括數(shù)據(jù)聚類、數(shù)據(jù)降維等。常用的深度學(xué)習(xí)模型有卷積神經(jīng)網(wǎng)絡(luò)(CNN)、回歸神經(jīng)網(wǎng)絡(luò)(RNN)、深度信念網(wǎng)絡(luò)(DBN)等。在模型選擇后進行模型的評估,對模型的效率、正確率等進行評價,一般使用與訓(xùn)練數(shù)據(jù)集進行模型訓(xùn)練,并用不同的測試數(shù)據(jù)集進行模型驗證從而明確模型在現(xiàn)實系統(tǒng)中的表現(xiàn),最終給出應(yīng)用模型。
5.模型部署與應(yīng)用
在智能模型確定后,將其部署到實際的教育應(yīng)用場景中。模型部署將訓(xùn)練的模型持久化,提供REST服務(wù)接口、設(shè)備端SDK等部署方式。模型部署的方式由教育應(yīng)用的實際需求決定,根據(jù)系統(tǒng)應(yīng)用規(guī)模的大小、性能要求等來綜合確定。部署成功的模型即可進入到教育應(yīng)用過程。
(二)教育人工智能應(yīng)用系統(tǒng)的問題分析
結(jié)合對教育人工智能系統(tǒng)設(shè)計中主要功能模塊的分析,一個成功的教育人工智能系統(tǒng)需要高質(zhì)量的教育數(shù)據(jù)支持,優(yōu)秀的數(shù)據(jù)預(yù)處理;合適的特征構(gòu)建,恰當(dāng)?shù)哪P徒Y(jié)構(gòu)和功能;優(yōu)秀的訓(xùn)練策略,嚴格的結(jié)果分析與靈活的應(yīng)用部署等。當(dāng)前教育人工智能系統(tǒng)設(shè)計開發(fā)中面臨的主要困難還較多,造成了教育人工智能落地難、應(yīng)用研究落后的現(xiàn)狀。
1.技術(shù)層面:特征與模型構(gòu)建問題
教育領(lǐng)域應(yīng)用場景對教育特征的構(gòu)建與模型構(gòu)建帶來具體的要求。通常情況下,特征工程是一項復(fù)雜耗時的工作,需要經(jīng)過特征構(gòu)建、特征選擇、特征壓縮等多個步驟,并需要應(yīng)用者具有領(lǐng)域?qū)I(yè)知識和數(shù)據(jù)分析能力。當(dāng)前教育特征的構(gòu)建工作主要還是由缺乏領(lǐng)域知識背景的技術(shù)人員完成,并且存在傳統(tǒng)特征構(gòu)建的效率低,可移植性差問題。在智能模型的構(gòu)建與優(yōu)化上,還沒有系統(tǒng)的方法進行模型選擇和參數(shù)調(diào)節(jié),基本是依靠人工調(diào)試和選擇,所構(gòu)建的模型難以進行衡量與對比。
2.人員層面:人員與復(fù)雜度問題
教育人工智能系統(tǒng)的構(gòu)建過程是一個相對復(fù)雜的過程,較高的技術(shù)門檻使得大量一線教師難以直接運用人工智能到實際教學(xué)場景中。并且人工智能不僅僅只是技術(shù)問題,更面臨復(fù)雜的教育領(lǐng)域的業(yè)務(wù)問題,需要多領(lǐng)域?qū)<覉F隊的合作參與,包括教學(xué)專家,數(shù)據(jù)工程師,算法工程師等,但教育領(lǐng)域匱乏的人才難以與教育大數(shù)據(jù)的快速發(fā)展與人工智能應(yīng)用的要求相匹配。
3.成本層面:成本與效率問題
當(dāng)前,構(gòu)建優(yōu)良的教育智能系統(tǒng)通常需要較長的時間和較為昂貴的成本。智能系統(tǒng)對算法算力的要求,需要一定的成本進行軟硬件設(shè)備的購買與維護。在效率方面,即使是有經(jīng)驗的人工智能專業(yè)人員,通常也需要花費大量時間來構(gòu)建合適的智能模型。如果目標、特征或數(shù)據(jù)發(fā)生變化,則系統(tǒng)的設(shè)計還需要重新進行。在教育領(lǐng)域,由于缺少成熟應(yīng)用,以及領(lǐng)域人員與技術(shù)人員的割裂性,所以在成本與效率方面面臨著更嚴峻的問題。
四、基于自動化方法的教育人工智能應(yīng)用系統(tǒng)設(shè)計
在教育領(lǐng)域評判一項技術(shù)的價值,除了能夠有效提升學(xué)習(xí)效果和教育系統(tǒng)功能外,技術(shù)是否具有普適性也是重要的方面。人工智能的快速發(fā)展與人工智能實際應(yīng)用中面臨的矛盾,需要我們探索有效的方法解決設(shè)計與開發(fā)過程中面臨的技術(shù)、人員、復(fù)雜性等問題,在人工智能的設(shè)計過程中引入自動化方法是一個有效的途徑。
如何以智能來設(shè)計智能,如何利用已有的機器學(xué)習(xí)知識和算法使人工智能能夠?qū)崿F(xiàn)部分處理過程的自動化,從而自主搭建適合教育領(lǐng)域應(yīng)用場景的系統(tǒng)模型,是教育人工智能應(yīng)用系統(tǒng)值得探索的領(lǐng)域。
(一)基本思想
1.自動化
自動化的概念跟隨時代也在發(fā)展,從最初的機器代替人完成操作或復(fù)雜的任務(wù)等體力工作,到進一步代替或輔助人的腦力勞動,以自動地完成特定的任務(wù)。在人工智能環(huán)境下,以智能訓(xùn)練智能,是自動化思想的新發(fā)展。自動化人工智能,如自動化機器學(xué)習(xí)和自動化深度學(xué)習(xí),是將人工智能應(yīng)用中需要專家人工參與的特征提取、模型選擇、參數(shù)調(diào)節(jié)、優(yōu)化評價等重要步驟進行自動化實現(xiàn),使得智能模型無需人工干預(yù)即可被構(gòu)建并具有超過人類專家的優(yōu)勢。這是自動化方法在軟件工程和人工智能領(lǐng)域的應(yīng)用和發(fā)展,是將人工智能算法應(yīng)用于問題解決的自動化過程,是探索人工智能的一種新的研究方法。
2.人工智能即服務(wù)
“人工智能即服務(wù)”由谷歌公司最早提出,其目標是將人工智能的解決方案和計算能力以云服務(wù)的形式提供,使云平臺承載人工智能的軟硬件資源。使用者無需購買維護高成本硬件設(shè)備,無需學(xué)習(xí)復(fù)雜的算法和技術(shù)即可創(chuàng)建和使用智能應(yīng)用。人工智能即服務(wù)為自動化人工智能的設(shè)計模式提供方向,自動化人工智能是人工智能即服務(wù)的重要應(yīng)用形式。兩者的目標都是為了更有效的降低人工智能的門檻,提高人工智能應(yīng)用的便利與效率。
(二)學(xué)習(xí)理論基礎(chǔ)
1.學(xué)習(xí)圈理論
讓機器產(chǎn)生智能進行自動化學(xué)習(xí)的過程與人類思考學(xué)習(xí)的過程類似。美國社會心理學(xué)家、教育家?guī)觳膶W(xué)習(xí)圈理論認為,人類的學(xué)習(xí)過程是由四個適應(yīng)性學(xué)習(xí)階段構(gòu)成的環(huán)形結(jié)構(gòu),包括具體經(jīng)驗,反思性觀察,抽象概念化和主動實踐,即通過經(jīng)驗反思得出理論,再用理論指導(dǎo)行動,進一步從行動中歸納經(jīng)驗。人們在學(xué)習(xí)的“經(jīng)驗、反思、啟示和行動”中達到學(xué)習(xí)的螺旋式循環(huán)進步,獲取知識。自動化人工智能方法借鑒了人類學(xué)習(xí)的思想,從經(jīng)驗的升華和理論化中去獲取知識,如下頁圖4所示。其中“具體經(jīng)驗”對應(yīng)獲得教育數(shù)據(jù),自動構(gòu)建教育特征;“反思觀察”是智能模型訓(xùn)練的過程,形成的“抽象概念”是模型的構(gòu)建,進行“實驗和實踐”則是模型應(yīng)用的過程。自動化人工智能方法遵循了人類學(xué)習(xí)的基本規(guī)律,將人的思考學(xué)習(xí)過程應(yīng)用于智能系統(tǒng)的流程設(shè)計。通過收集行為數(shù)據(jù),得到反饋數(shù)據(jù)并自動構(gòu)建特征,進行模型的自動化訓(xùn)練,然后將模型應(yīng)用,模型應(yīng)用后又可以收集數(shù)據(jù),開始新的學(xué)習(xí)。
2.元學(xué)習(xí)
元學(xué)習(xí)起源于認知科學(xué)領(lǐng)域,比格斯(1985)將元學(xué)習(xí)定義為“意識到并控制自己的學(xué)習(xí)”。在人類的學(xué)習(xí)中,每次學(xué)習(xí)無論成功失敗,我們都收獲一定的經(jīng)驗。人類之所以能夠快速學(xué)習(xí)的關(guān)鍵是人類具備學(xué)會學(xué)習(xí)的能力,能夠充分的利用以往的知識經(jīng)驗來指導(dǎo)新任務(wù)的學(xué)習(xí)。在構(gòu)建自動化智能系統(tǒng)時,也應(yīng)該考慮充分利用已有的每一次的學(xué)習(xí)經(jīng)驗,逐步改進,提升系統(tǒng)的有效性。在人工智能領(lǐng)域借鑒元學(xué)習(xí)的思想,使機器學(xué)習(xí)或深度學(xué)習(xí)算法“學(xué)會如何學(xué)習(xí)”,目標是設(shè)計出靈活的機器學(xué)習(xí)模型,它可以基于過去的經(jīng)驗與知識,通過少量的訓(xùn)練樣本快速學(xué)會新概念和技能。元學(xué)習(xí)使機器具有學(xué)會學(xué)習(xí)的能力,從而在面對新的任務(wù)時,可以利用已有的知識來加速人工智能的學(xué)習(xí)速度。
(三)基于自動化方法的設(shè)計模型
1.模型結(jié)構(gòu)
基于學(xué)習(xí)理論和自動化思想支持,我們設(shè)計新的教育人工智能應(yīng)用系統(tǒng)模型如圖5所示。在模型中,在教育業(yè)務(wù)領(lǐng)域只需要給出明確的教育需求,將教育數(shù)據(jù)提交到基于云端的自動化處理模塊,即可完成數(shù)據(jù)清理、特征構(gòu)建、模型構(gòu)建、評估與優(yōu)化的過程。這個過程對用戶是透明的,由系統(tǒng)自動完成,并將得出的最優(yōu)化模型應(yīng)用提供給用戶。
使用自動化模型方法,在教育領(lǐng)域,只需關(guān)注教育需求,給出教育數(shù)據(jù),中間的過程由自動化過程處理。其中,自動化特征工程改進了傳統(tǒng)手工特征工程的標準流程,從數(shù)據(jù)中自動構(gòu)建新的候選特征,并選擇最佳的特征進行模型的訓(xùn)練,使得模型可以有最優(yōu)的表現(xiàn)。這不僅減少了特征工程所花費的時間,還可以根據(jù)數(shù)據(jù)特征進行自動組合,有效解決了人為組合特征不全面問題,創(chuàng)建了可解釋的特征,并且比手動特征工程更高效,可重復(fù)性更高。自動化模型構(gòu)建可以基于數(shù)據(jù)集與自動化特征工程構(gòu)建的特征,選擇適用于該數(shù)據(jù)集的模型,對多個模型進行自動訓(xùn)練和調(diào)整,并對訓(xùn)練后的模型進行評估,輸出效果最佳的模型,從而實現(xiàn)人工智能工作的流程自動化。
自動化人工智能處理的整個過程,從導(dǎo)入數(shù)據(jù)到模型訓(xùn)練,可以通過拖放式交互界面完成。這種易用性、便捷性有效擴展了教育人工智能的應(yīng)用場景和范圍,使普通教育者也可以用人工智能技術(shù)解決現(xiàn)實中的教育問題,為缺少專業(yè)技術(shù)知識的人員快速的構(gòu)建人工智能應(yīng)用提供了有效途徑。同時也有效縮短了智能應(yīng)用的開發(fā)周期,推動教育人工智能應(yīng)用的快速開發(fā)與迭代。
2.自動化人工智能平臺
自動化人工智能平臺是自動化系統(tǒng)的核心部分,目前正處于建設(shè)和發(fā)展階段。在教育人工智能的研發(fā)過程中,選擇適當(dāng)?shù)淖詣踊脚_進行系統(tǒng)設(shè)計與開發(fā)是有效提升教育產(chǎn)品研發(fā)效率和擴展教育產(chǎn)品功能模塊的方式。當(dāng)前自動化平臺主要有兩類,一類是主要科技公司提供的自動化平臺支持,另一類為開源自動化平臺。這些平臺具有不同的特點,如表1所示。
在教育領(lǐng)域中自動化平臺選用的標準應(yīng)首先要遵循人工智能開發(fā)的普適原則,包括公平、可靠、安全、隱私、透明、責(zé)任等,在此基礎(chǔ)上從教育系統(tǒng)的特點出發(fā),考慮以下應(yīng)用原則。
(1)服務(wù)于教育目標的整體性規(guī)劃。教育人工智能系統(tǒng)的設(shè)計是一項系統(tǒng)工程,在進行自動化平臺應(yīng)用時,應(yīng)從教育人工智能系統(tǒng)的整體設(shè)計角度出發(fā)。自動化平臺是整個系統(tǒng)的一個組成部分,要在教育系統(tǒng)功能的問題分析與目標分析上,從教學(xué)角度、功能角度、技術(shù)角度、環(huán)境角度等方面進行綜合考量,服務(wù)于教育目標,服務(wù)于教育應(yīng)用的整體環(huán)境。
(2)服務(wù)于功能性的多維度分析。在自動化方法應(yīng)用上,需要進行充分的調(diào)研分析,明確系統(tǒng)的功能模塊??蓛?yōu)先選用現(xiàn)有成熟的技術(shù)模塊進行教育功能的實現(xiàn),并兼顧技術(shù)的成熟性和前瞻性。在擴展性上,可選用開源技術(shù)以保證后期的持續(xù)性。在界面支持上,可選用適當(dāng)?shù)目梢暬С峙c交互支持。在標準化方面,盡量兼顧到教育系統(tǒng)標準、學(xué)習(xí)標準、平臺標準等標準規(guī)范。
五、案例應(yīng)用研究
(一)研究背景分析
慕課的應(yīng)用產(chǎn)生了海量數(shù)據(jù),為學(xué)習(xí)分析與人工智能研究提供了大數(shù)據(jù)基礎(chǔ)。在慕課系統(tǒng)中,論壇數(shù)據(jù)中包含了大量的學(xué)習(xí)者學(xué)習(xí)過程、學(xué)習(xí)評價和學(xué)習(xí)體驗數(shù)據(jù),是一種典型的文本類教育大數(shù)據(jù)。對論壇數(shù)據(jù)進行分析將為慕課教學(xué)和管理提供有效的支持。吳林靜等提出了慕課評論的語義分析模型,將慕課評論分為內(nèi)容相關(guān)類、情感相關(guān)類和其他類。Liu等提出了一個非監(jiān)督模型,通過對論壇文本數(shù)據(jù)的挖掘,分析了學(xué)習(xí)者關(guān)注的論壇主題及學(xué)習(xí)者在學(xué)習(xí)過程中的情感狀態(tài)。Lan等使用概率模型對慕課論壇中的主題進行了建模研究。這些研究對于論壇數(shù)據(jù)的處理是通過機器學(xué)習(xí)或深度學(xué)習(xí)算法實現(xiàn)與分析,需要具有一定的技術(shù)基礎(chǔ),由慕課教師和技術(shù)人員的合作完成。