摘要:隨著生成式人工智能的快速發(fā)展,基于大模型的智能體已經(jīng)逐步具備了多模態(tài)感知、檢索增強生成、推理與規(guī)劃、交互與進化等能力。該研究提出基于大模型的教學(xué)智能體的基本概念與框架,以“大模型”為技術(shù)核心,重點構(gòu)建“教育任務(wù)設(shè)定”“教育任務(wù)規(guī)劃”“教育能力實現(xiàn)與拓展”“教育內(nèi)容記憶與反思”“交互協(xié)作與動態(tài)進化”多個功能模塊,支持與多類型對象交互并實現(xiàn)動態(tài)進化,涵蓋人機交互、多智能體交互以及環(huán)境交互?;谒岢龅目蚣?,研究以項目式學(xué)習(xí)任務(wù)為應(yīng)用場景,闡述了教學(xué)智能體作為“助教智能體”和“同伴智能體”,在個性化驅(qū)動問題提出、項目方案共同設(shè)計、項目作品協(xié)作完成、項目作品多角色評價多個環(huán)節(jié)的作用及相關(guān)支撐技術(shù)。最后,研究進一步探討了教學(xué)智能體的發(fā)展方向與未來展望。
關(guān)鍵詞:教學(xué)智能體;大模型;生成式人工智能;項目式學(xué)習(xí)
中圖分類號:G434 文獻標識碼:A
* 本文系北京市教育科學(xué)“十四五”規(guī)劃2021年度重點課題“人工智能驅(qū)動的新一代智能導(dǎo)學(xué)系統(tǒng)構(gòu)建研究”(課題編號:CHAA21036)研究成果。
隨著生成式人工智能的快速演進,多模態(tài)大模型日益彰顯其在多模態(tài)內(nèi)容理解和生成方面的優(yōu)勢。多模態(tài)大模型(下文簡稱“大模型”)指能夠處理并理解文本、圖像、視音頻等多種模態(tài)數(shù)據(jù)輸入的人工智能模型。以GPT-4為代表的人工智能模型均屬于多模態(tài)大模型。大模型通常具有超大規(guī)模參數(shù),支持通過提示工程與微調(diào)等方式進行推理與決策制定,并在自然語言處理與視音頻分析等多任務(wù)上表現(xiàn)出卓越性能。為進一步釋放大模型的應(yīng)用潛力,人工智能領(lǐng)域的研究者開始嘗試構(gòu)建基于大模型的智能體。智能體又被稱為自主智能體(Autonomous Agent),指可感知環(huán)境并反作用于環(huán)境,以實現(xiàn)其自身目標的自適應(yīng)系統(tǒng)[1]。自20世紀開始,設(shè)計與實現(xiàn)智能體已成為人工智能領(lǐng)域研究的主要目標之一,但該項研究長期受限于核心模型的智能化水平。大模型的出現(xiàn),為構(gòu)建和實現(xiàn)智能體提供了可行的技術(shù)路徑,而智能體與外部環(huán)境的交互能力也可以促進大模型的下游任務(wù)適配。因此,基于大模型的智能體構(gòu)建在人工智能領(lǐng)域和多個垂直領(lǐng)域受到日益重視[2],但在教育領(lǐng)域尚缺乏系統(tǒng)設(shè)計與全面論述。
在教育領(lǐng)域,國內(nèi)外學(xué)者對智能體的研究尚處于起步階段。早期研究關(guān)注面向知識共享及其組織管理模式優(yōu)化的智能體構(gòu)建[3],也有研究嘗試設(shè)計可以與學(xué)習(xí)者互動的教育智能體,以實現(xiàn)以學(xué)生為中心的個性化在線學(xué)習(xí)[4]。近年來,研究者從認知學(xué)習(xí)的作用機制[5]與社會線索設(shè)計[6]等角度對智能體開展研究,強調(diào)學(xué)習(xí)主體的高階意義加工和交互創(chuàng)新[7]。隨著大模型等生成式人工智能技術(shù)日趨成熟,研究者嘗試構(gòu)建基于大語言模型(Large Language Model,LLM)的通用智能體,利用其作為用戶交互助手進行數(shù)學(xué)公式的格式轉(zhuǎn)化[8]。此外,研究者嘗試利用多個通用智能體,模擬教師和學(xué)生之間的課堂交互,實驗結(jié)果表明在教學(xué)方法、課程和學(xué)生表現(xiàn)等維度與真實課堂環(huán)境具有高相似度[9]。
當(dāng)前教育領(lǐng)域研究多停留在對通用智能體的教育應(yīng)用嘗試,尚缺乏明確定義和體系化架構(gòu)設(shè)計。因此,本研究提出“教學(xué)智能體”概念,旨在充分利用生成式人工智能對環(huán)境感知、推理規(guī)劃、學(xué)習(xí)改進、行動決策等方面的自主適應(yīng)能力,在課堂教學(xué)、課后輔導(dǎo)、教師研修、家校合作等多種教育場景下,為教育各利益相關(guān)方提供教與學(xué)的智能化服務(wù)。本研究將基于生成式人工智能領(lǐng)域的最新技術(shù)進展,結(jié)合當(dāng)前教育領(lǐng)域的實際需求,開展教學(xué)智能體設(shè)計與實現(xiàn)路徑研究。
(一)基本概念
在人工智能領(lǐng)域,智能體需要能夠感知其外部環(huán)境并做出行動,以對外部環(huán)境產(chǎn)生影響。通常情況下,智能體與外部環(huán)境間的感知與行動不斷循環(huán),形成密切交互,以完成具體任務(wù)目標。圖1為基于大模型的智能體的基本框架,其中大模型是智能體的基礎(chǔ)支撐與核心。對于給定的任務(wù),智能體首先通過環(huán)境感知能力,采集信息以了解外部動態(tài)變化的環(huán)境。進而,智能體可通過推理規(guī)劃方式,基于邏輯思維分步求解給定任務(wù)中的具體問題。在此過程中,記憶檢索機制支持存儲與讀取過往經(jīng)驗,有助于提升推理規(guī)劃的質(zhì)量。同時,智能體也可以利用海量數(shù)據(jù)找尋客觀規(guī)律進行學(xué)習(xí)改進,從而提升自身性能,并存儲于記憶中。在此基礎(chǔ)上,智能體通過權(quán)衡推理規(guī)劃中的行動利弊,做出合理決策并選取執(zhí)行工具,將決策轉(zhuǎn)化為對外部環(huán)境的實際作用和影響,以完成任務(wù)目標。與傳統(tǒng)人工智能領(lǐng)域的智能體相比,基于大模型的智能體具有以下多項核心能力。
(二)核心能力
1.多模態(tài)感知與生成
多模態(tài)感知與生成通過整合視覺、語音、文本等多種數(shù)據(jù)通道,以單獨或組合的方式實現(xiàn)外部信息獲取,從而賦予智能體理解并解析自身所處環(huán)境的能力。依托視覺與語言的理解與生成能力,智能體可以實現(xiàn)視覺問答(Visual Question Answering,VQA)與文本生成圖像(Text-to-Image Generation)等多種圖文感知與生成任務(wù)[10]。例如,視覺問答任務(wù)要求智能體基于圖像信息,回答“計數(shù)”“屬性識別”“物體檢測”等場景理解類問題。在此基礎(chǔ)上,基于外部知識的視覺問答任務(wù)(Outside Knowledge VQA)則要求智能體回答無法僅通過圖像信息理解的問題,并鼓勵其通過外部知識庫檢索與圖像理解相結(jié)合的方式生成答案[11]。當(dāng)前,智能體的多模態(tài)感知與生成能力已經(jīng)拓展至視頻領(lǐng)域,支持對連續(xù)圖像幀進行解讀與構(gòu)建,從而較為準確地解答針對視頻內(nèi)容的提問或生成邏輯合理的高畫質(zhì)視頻。此外,對于具身操作的實體機器人或虛擬環(huán)境角色,多模態(tài)感知可以支持其實現(xiàn)實時環(huán)境交互的信息更新,輔助智能體完成任務(wù)規(guī)劃、路徑規(guī)劃、推理與決策等復(fù)雜任務(wù)。
2.檢索增強生成
為緩解大模型生成與事實相悖的“幻覺”、數(shù)據(jù)更新不及時等問題,檢索增強生成(Retrieval-augmented Generation,RAG)技術(shù)開始逐步被廣泛采用。檢索增強生成技術(shù)可基于知識庫檢索器,為大模型提供與待解決問題相關(guān)且可靠的外部知識。該技術(shù)主要包括三個基本步驟,即索引建立、問題檢索與內(nèi)容生成[12]。索引建立步驟需要基于指定任務(wù)信息構(gòu)建知識庫,其知識資源類型可以涵蓋文檔、網(wǎng)頁、知識圖譜等形式,并利用語言模型的詞嵌入等方法抽取資源的文本語義特征,然后將特征在線或離線存儲于知識庫。問題檢索步驟將用戶提問內(nèi)容作為檢索請求,抽取其文本語義特征,檢索得到知識庫中與之匹配的數(shù)據(jù)內(nèi)容,作為提問的輔助信息。內(nèi)容生成步驟中,大模型基于用戶提問信息與檢索得到的輔助信息,通過數(shù)據(jù)增強或構(gòu)建注意力機制等方法,完成問題答案的生成[13]??▋?nèi)基梅隆大學(xué)團隊基于檢索增強生成理念,為智能體提供了接口文檔查詢功能。通過查詢液體處理器的接口文檔,該智能體可以基于用戶的文字指令,借助紫外可見光譜測量工具與Python計算工具,實現(xiàn)對液體處理器的精準控制,可用于科學(xué)實驗的自動設(shè)計、規(guī)劃與執(zhí)行[14]。
3.推理與規(guī)劃
智能體的任務(wù)規(guī)劃致力于將復(fù)雜任務(wù)拆解為多個可執(zhí)行的子任務(wù),主要依托的是大模型的推理能力。通過構(gòu)建能夠激發(fā)大模型推理能力的提示信息(Prompt),智能體可以自主完成多步驟推理,將復(fù)雜任務(wù)拆解為多個可執(zhí)行的子任務(wù),從而自主規(guī)劃用于完成任務(wù)目標的具體行為序列。目前已有多種被證實有效的提示信息構(gòu)建方法,包括典型的基于單路徑推理的思維鏈(Chain of Thought,CoT)、基于多路徑推理的自我一致性思維鏈(Self-consistency,CoT-SC)、思維樹(Tree of Thought,TOT),以及融合行為反思的規(guī)劃方法ReAct等。
思維鏈[15]作為最早被提出的推理方法之一,旨在激發(fā)大模型在推理過程中使用多步驟思考,從而引導(dǎo)大模型單路徑執(zhí)行具體任務(wù)。在此基礎(chǔ)上,自我一致性思維鏈[16]考慮到大模型生成內(nèi)容的隨機性,通過多次重復(fù)執(zhí)行單路徑推理思維鏈的方式,構(gòu)建多組并列的思維鏈,最終選取一致性最高的結(jié)果作為答案。思維樹[17]則進一步細化推理過程并整合以上兩者優(yōu)勢,構(gòu)建樹形結(jié)構(gòu)的問題解決方案。樹形結(jié)構(gòu)中的每一條路徑代表一種解決方案,每一個節(jié)點代表一個中間步驟。思維樹依據(jù)不同的問題屬性,分解任務(wù)推理的中間步驟,力求每一步均以相對可靠的小步驟執(zhí)行,從而在當(dāng)前節(jié)點上生成下一步可能的解決方案。思維樹通過設(shè)置針對每個節(jié)點獨立的質(zhì)量評估機制或多節(jié)點間的投票機制,為后續(xù)搜索算法提供啟發(fā)式的路徑選擇依據(jù)。最終,依據(jù)不同的樹形結(jié)構(gòu),使用廣度優(yōu)先或深度優(yōu)先搜索算法選取最佳的問題解決路徑。ReAct[18]規(guī)劃方法則進一步在推理過程中整合了任務(wù)執(zhí)行的反饋信息,使智能體實現(xiàn)自主與外界的資源交互、任務(wù)規(guī)劃更新、異常情況處理等功能。在具體任務(wù)規(guī)劃過程中,ReAct規(guī)劃方法由思考(Thought)、行動(Action)與行動結(jié)果觀察(Observation)三個基本行為組成。通過循環(huán)執(zhí)行這一行為組合,生成包含多輪推理步驟的最終解決方案。ReAct方法在問題回答、事實驗證、文本游戲、網(wǎng)頁導(dǎo)航多種語言與決策任務(wù)中,均表現(xiàn)出較好的性能,其生成的任務(wù)軌跡也具有可解釋性與可信度。
4.交互與進化
智能體可通過與外部環(huán)境、人類以及其它智能體的交互,開展協(xié)作并完成復(fù)雜任務(wù),進而實現(xiàn)自主進化。在與外部環(huán)境的交互中,智能體可以基于自身數(shù)據(jù)、可用工具、庫存資源、環(huán)境描述等信息,自主設(shè)置任務(wù)并探索外部世界。在探索過程中,智能體可以基于機器語言的自檢機制,構(gòu)建技能庫積累技能,實現(xiàn)復(fù)雜且有意義的自主進化行為。例如旅行者Voyager作為大模型驅(qū)動的智能體,在沙盒生存游戲中實現(xiàn)了自主的世界探索和技能進化[19]。
在與人的交互中,智能體支持用戶自定義集成多種大語言模型與工具,開展自主規(guī)劃與人機協(xié)作,從而有效解決編程、數(shù)學(xué)、操作實驗、在線決策、問答等多領(lǐng)域多類型任務(wù)。例如,智能體可通過自動解題方式解決復(fù)雜數(shù)論問題,且當(dāng)問題解答錯誤時,可通過人機協(xié)作方式,獲取人工反饋提示,改進并更正自動解答中的錯誤[20]。智能體可基于用戶輸入的指令完成有機合成、藥物發(fā)現(xiàn)以及材料設(shè)計等任務(wù),在測試中實現(xiàn)一種驅(qū)蚊劑與三種有機催化劑的自動合成,并通過人機協(xié)作引導(dǎo)人類發(fā)現(xiàn)新型發(fā)色團[21]。
多個不同的智能體間也可以開展交互與協(xié)作,推進復(fù)雜任務(wù)的解決與自我進化。例如通過構(gòu)建“規(guī)劃、執(zhí)行、感知、學(xué)習(xí)”(Plan,Execute,Inspect,and Learn,PEIL)引導(dǎo)機制,可實現(xiàn)基于多智能體的任務(wù)規(guī)劃與工具執(zhí)行、視覺感知與記憶管理、主動學(xué)習(xí)與方案優(yōu)化,并在視覺問答與推理問答等任務(wù)中表現(xiàn)出卓越性能[22]。同時,多智能體之間的辯論式交互,可用于提升其復(fù)雜推理問題的解決能力,并已在常識性機器翻譯與反直觀的算數(shù)推理任務(wù)中展現(xiàn)有效性[23]。此外,智能體還可以通過角色分工與多智能體間協(xié)作,模擬和實現(xiàn)特定業(yè)務(wù)流程及其任務(wù)目標。例如,MetaGPT多智能體協(xié)作框架可以為多智能體賦予角色分工(例如產(chǎn)品經(jīng)理與軟件開發(fā)工程師)并設(shè)定工作流,通過引入人類作業(yè)機制,實現(xiàn)多角色智能體的串聯(lián)工作及其之間的數(shù)據(jù)流轉(zhuǎn),從而實現(xiàn)軟件開發(fā)的自動化流程[24]。
此外,智能體的記憶機制在交互與進化中起到重要作用,支持了智能體的交互歷史回顧、知識獲取、經(jīng)驗反思、技能積累與自我進化。斯坦福大學(xué)提出的生成式智能體(Generative Agents)在沙盒游戲引擎構(gòu)建了虛擬小鎮(zhèn)場景,可實現(xiàn)虛擬個體的動態(tài)行為規(guī)劃以及模擬可信的人類行為[25]。該生成式智能體構(gòu)建了一套記憶流機制,可將感知到的虛擬環(huán)境信息與個體經(jīng)歷存儲在記憶流中。智能體可以基于個體記憶作出行為決策,同時可以用于形成長期的行為規(guī)劃與高層次的反思,為后續(xù)行為決策作記憶儲備。例如,在有關(guān)“是否參加派對”的行為決策中,智能體首先從記憶流中檢索相關(guān)的記憶記錄,依據(jù)每條記錄與決策任務(wù)的時效度、相關(guān)度以及重要程度,加權(quán)求和計算每條記憶的綜合得分,排名靠前的記憶將作為決策依據(jù),被納入到提示信息中,輔助其行為決策。
(三)實現(xiàn)方式
智能體將大模型作為核心控制器,強調(diào)智能體與信息之間的動態(tài)交互、推理與規(guī)劃能力的整合、記憶與反思機制的建立、工具使用與執(zhí)行任務(wù)能力的實現(xiàn),以及與外部交互過程中能力的不斷進化。這些特性共同賦予智能體高階信息理解與加工能力,使其在決策方式上更加接近人類,并表現(xiàn)出對復(fù)雜情境的理解和處理能力[26]。為支持基于大模型的智能體落地實現(xiàn),目前已經(jīng)有多個工程框架被開發(fā)并開源,例如支持單智能體實現(xiàn)的LangChain[27]與AutoGPT[28],以及支持多智能體協(xié)作的AutoGen[29]、BabyAGI[30]與CAMEL[31]。這些框架為研究人員和開發(fā)者提供了重要資源,便于開發(fā)和測試智能體的多場景應(yīng)用。
在上述實現(xiàn)框架中,LangChain與AutoGen分別是應(yīng)用較為廣泛的單智能體和多智能體框架。LangChain可提供結(jié)構(gòu)化的大模型應(yīng)用流程,便于智能體的工程落地,其技術(shù)組成模塊包括模型I/O、檢索、智能體、鏈與記憶等。LangChain支持豐富的工具與工具包調(diào)用,并可以實現(xiàn)檢索增強生成、ReAct規(guī)劃等多項智能體核心能力。AutoGen則支持用戶依據(jù)需求,靈活定義多智能體之間的交互模式與人機協(xié)作模式,例如由一位智能體主持、人工參與多智能體交互的動態(tài)群組討論模式,或由兩個智能體分別負責(zé)編碼與執(zhí)行調(diào)試的協(xié)作編碼模式等。AutoGen可支持多智能體的交互記憶讀寫,可通過調(diào)用Python第三方工具包實現(xiàn)工具的使用(例如調(diào)用Matplotlib繪圖庫完成數(shù)學(xué)制圖),并且支持將任務(wù)轉(zhuǎn)化為機器語言解決,例如利用代碼分步執(zhí)行任務(wù),并通過智能體間的代碼執(zhí)行與調(diào)試(Debugging)確保程序的成功運行。
LangChain與AutoGen均為智能體實現(xiàn)提供了可行方案,還可以通過配合使用發(fā)揮二者各自優(yōu)勢。例如,可以利用AutoGen靈活構(gòu)建并實現(xiàn)智能體的交互框架與基于機器語言的任務(wù)執(zhí)行,并利用LangChain協(xié)助連接外部豐富的工具庫(例如ArXiv、Office365、Wolfram Alpha等)以及自定義工具(通過用戶提供工具功能描述、方法實現(xiàn)代碼、輸入輸出格式等信息實現(xiàn)),從而拓展智能體的能力邊界。
基于當(dāng)前教育領(lǐng)域大模型的快速演進和發(fā)展[32],本研究提出構(gòu)建基于大模型的教學(xué)智能體。如圖2所示,教學(xué)智能體以“大模型”為核心,其主要功能模塊包括“教育任務(wù)設(shè)定”“教育任務(wù)規(guī)劃”“教育能力實現(xiàn)與拓展”“教育內(nèi)容記憶與反思”。同時,教學(xué)智能體支持與多類型對象交互并實現(xiàn)動態(tài)進化,涵蓋人機交互、多智能體交互以及環(huán)境交互。
(一)教育任務(wù)設(shè)定
“教育任務(wù)設(shè)定”模塊涵蓋教育場景設(shè)定、教育需求設(shè)定與教育角色設(shè)定等關(guān)鍵信息的提供。其中,教育場景的設(shè)定為智能體提供教育任務(wù)的背景信息,例如以學(xué)生為主體的項目式學(xué)習(xí)場景、在線自主學(xué)習(xí)場景、傳統(tǒng)課堂教學(xué)場景等;教育需求設(shè)定為智能體提供對教育任務(wù)的具體目標描述,例如為項目式學(xué)習(xí)提供策略性支架、評價學(xué)習(xí)者問題解決能力、協(xié)調(diào)小組協(xié)作學(xué)習(xí)等;教育角色設(shè)定為智能體賦予教育任務(wù)中需扮演的特定角色信息,例如教師助教、學(xué)生學(xué)伴、研修助手、家庭助理等。教育角色的設(shè)定有助于智能體更有效地與教育用戶互動,提供個性化交互體驗,提高輔助效果。多個教學(xué)智能體之間還可通過扮演不同教育角色,以分工協(xié)作、辯論對抗、人機協(xié)同等形式,滿足特定教育場景下的關(guān)鍵教學(xué)需求。
(二)教育任務(wù)規(guī)劃
基于所設(shè)定的教育任務(wù)信息,教學(xué)智能體可以實現(xiàn)自主任務(wù)規(guī)劃,其基本步驟與順序分別為“任務(wù)方案思考”“方案分解規(guī)劃”與“執(zhí)行結(jié)果感知”。首先,“任務(wù)方案思考”步驟基于所設(shè)定的教育場景、需求和角色等關(guān)鍵信息,結(jié)合相關(guān)的教育標準或框架、教育資源與輔助工具,進行整體方案的推理和生成;“方案分解規(guī)劃”步驟將所生成的整體方案,分解為多個可實現(xiàn)、可管理的子任務(wù),包括規(guī)劃具體的教學(xué)活動、教學(xué)資源、教學(xué)工具、教育評價方式等。教學(xué)智能體還可以根據(jù)教師或?qū)W習(xí)者的反饋實時調(diào)整各子任務(wù),確保教育任務(wù)規(guī)劃的適應(yīng)性與有效性。規(guī)劃的子任務(wù)執(zhí)行完成后,“執(zhí)行結(jié)果感知”步驟負責(zé)獲取執(zhí)行結(jié)果以及多維度交互信息。通過引入評價反饋機制,基于任務(wù)執(zhí)行結(jié)果,智能體可以自主推理判斷或人工評價子任務(wù)完成質(zhì)量。若發(fā)現(xiàn)問題或未達成規(guī)劃目標,則重新開始“任務(wù)方案思考”步驟,直至達成目標后方可退出循環(huán)機制。利用上述教育任務(wù)規(guī)劃流程,智能體能夠迭代優(yōu)化教育任務(wù)執(zhí)行過程與策略,滿足高效個性化教育需求。
(三)教育能力實現(xiàn)與拓展
教學(xué)智能體可以實現(xiàn)和拓展多項基本能力,以執(zhí)行所規(guī)劃的具體教育任務(wù)。首先,教學(xué)智能體可以調(diào)用外部專業(yè)教學(xué)工具及其運行環(huán)境,包括但不限于數(shù)學(xué)計算工具、教育教學(xué)軟件與協(xié)作學(xué)習(xí)工具。例如,教學(xué)智能體可以調(diào)用數(shù)學(xué)計算工具Wolfram Alpha[33],通過基于自然語言或數(shù)學(xué)公式的交互,解答多學(xué)科所需的精確計算問題。這些外部工具可以為教學(xué)智能體提供大模型不具備的專業(yè)能力,從而幫助其完成所規(guī)劃教育任務(wù)中的專業(yè)問題解決。
教學(xué)智能體可以通過檢索增強生成等方式,避免輸出錯誤教育信息,拓展其知識與能力邊界。教育服務(wù)的提供通常需要具備高準確度與可解釋性,因此需要為智能體提供實時更新且可靠的信息源。例如,智能體可以從國家教育資源公共服務(wù)平臺、專業(yè)教育學(xué)術(shù)期刊以及教育新聞網(wǎng)站等渠道,獲取和整合最新教育資源和實時教育數(shù)據(jù),實現(xiàn)檢索增強生成教育內(nèi)容,并能清晰解釋其提供內(nèi)容的依據(jù),確保所提供教育服務(wù)的時效性和準確性。
此外,教學(xué)智能體在對教育場景要素感知與理解后,可以自動生成包括教學(xué)文本對話、視音頻教學(xué)資源等形式的教育內(nèi)容和制品,為所設(shè)定的教育角色提供全流程支持。例如,當(dāng)教育任務(wù)執(zhí)行涉及編程與邏輯推理時,可借助大模型的代碼生成與調(diào)式能力,將任務(wù)翻譯為Python等機器語言并輔助學(xué)習(xí)者完成編程任務(wù)。對于需要具身操作的教育任務(wù),教學(xué)智能體可以基于物理環(huán)境感知能力,自動生成操作流程并根據(jù)教育用戶指令完成軟硬件實時控制。
(四)教育內(nèi)容記憶與反思
教學(xué)智能體的教育內(nèi)容記憶主要用于存儲與讀取教育任務(wù)規(guī)劃與執(zhí)行過程中的重要數(shù)據(jù),支持智能體的自我反思。具體而言,教育內(nèi)容記憶可以存儲所有步驟的教育任務(wù)規(guī)劃及各步驟執(zhí)行的基礎(chǔ)性數(shù)據(jù),例如教育任務(wù)解決方案數(shù)據(jù)、智能體與學(xué)習(xí)者的交互問答數(shù)據(jù)、外部工具調(diào)用的過程與結(jié)果數(shù)據(jù)、軟硬件控制與操作數(shù)據(jù)等?;谒鎯Φ幕A(chǔ)性數(shù)據(jù),智能體可以通過大模型的自我提問或歸納總結(jié)等方式,反思加工得到教育知識與經(jīng)驗等高階信息。例如,教學(xué)智能體可以通過反思,得到所服務(wù)學(xué)習(xí)者的個性化特征及其教學(xué)交互效果等信息。結(jié)合試錯機制或交互反饋,教學(xué)智能體還可以總結(jié)失敗或低效率的教學(xué)經(jīng)歷,再次遇到類似教育任務(wù)時,作為教學(xué)策略自主優(yōu)化與改進的參考依據(jù)。此外,智能體所存儲的豐富教育記憶與反思,還可以作為重要的參考知識與資源,支持其教學(xué)能力的拓展。
基于權(quán)限維度劃分,教育內(nèi)容記憶可分為公有記憶與私有記憶。公有記憶指教學(xué)智能體所積累的教育知識與教學(xué)資源,包括學(xué)科知識圖譜、教學(xué)法知識、課程標準、教學(xué)材料、教輔材料等;私有記憶則為與教育用戶及其角色密切相關(guān)的個體信息,例如個體學(xué)習(xí)者的歷史交互與學(xué)習(xí)評價數(shù)據(jù)、個體教師的教學(xué)視頻、教學(xué)方案與教學(xué)評價數(shù)據(jù)等。教學(xué)智能體需要合理使用不同權(quán)限的記憶數(shù)據(jù),尊重教育用戶隱私,建立相應(yīng)的教育數(shù)據(jù)使用規(guī)范。
(五)交互協(xié)作與動態(tài)進化
教學(xué)智能體可通過與不同角色的教育用戶、其它智能體及教育環(huán)境進行交互,實現(xiàn)教育任務(wù)的協(xié)作規(guī)劃與執(zhí)行,促進自身的動態(tài)進化。在與教育用戶的交互中,教學(xué)智能體能夠充分理解不同角色的教育用戶意圖,從而提供多種形式和模態(tài)的人機交互服務(wù)。例如,針對學(xué)習(xí)者在線自主學(xué)習(xí)場景,提供多類型支架式智能導(dǎo)學(xué)交互服務(wù),支持推薦文本、視頻和音頻教學(xué)資源在內(nèi)的多模態(tài)教學(xué)內(nèi)容,實時提供進度評價與反饋信息。在與其它智能體的交互中,智能體可以依據(jù)不同智能體的角色扮演及教育任務(wù),實現(xiàn)督促引導(dǎo)、討論交流、分工協(xié)作甚至有序辯論對抗等交互模式。例如,開展多智能體的辯論式交互,實現(xiàn)復(fù)雜教育任務(wù)的科學(xué)拆解與合理規(guī)劃。另外,可以將教育對象引入多智能體交互過程中,實現(xiàn)人機協(xié)作模式下的教育目標達成。例如,在協(xié)作組卷過程中,依據(jù)教師提供的學(xué)科、知識點、區(qū)分度等需求信息,不同智能體可分別作為出題者、被試者以及批閱者完成組卷,并最終交由教師審核組卷質(zhì)量。在與教育環(huán)境的交互中,智能體在充分感知和理解教育場景與環(huán)境要素的基礎(chǔ)上,可以充分利用外部軟硬件工具及其人機交互能力,實現(xiàn)具身操作與人機協(xié)同。例如,智能體可通過對實驗儀器狀態(tài)的實時感知與機械臂的精準控制,協(xié)同學(xué)習(xí)者完成物理、化學(xué)等學(xué)科類的復(fù)雜實驗操作或科學(xué)探究類的實踐過程。
教學(xué)智能體在與教育用戶、其它智能體及教育環(huán)境的交互中,通過對過程性與結(jié)果性數(shù)據(jù)、反饋信息進行持續(xù)采集與分析,可以逐步形成教育經(jīng)驗與反思性知識。這些經(jīng)驗與知識可以被智能體記憶存儲與讀取,并用于未來教育任務(wù)的規(guī)劃與教育能力的執(zhí)行,從而實現(xiàn)其問題解決能力的動態(tài)提升與進化。例如,通過反思人機交互過程信息、總結(jié)科學(xué)儀器控制流程,教學(xué)智能體可以更高效地規(guī)劃科學(xué)實驗步驟,并為學(xué)習(xí)者提供實驗操作的實時支架與科學(xué)探究的協(xié)作服務(wù)。
基于前述所提出的框架,本研究以項目式學(xué)習(xí)場景為例闡述教學(xué)智能體的應(yīng)用。項目式學(xué)習(xí)是培養(yǎng)學(xué)生核心素養(yǎng)與高階能力的有效教學(xué)模式[34],在典型的項目式學(xué)習(xí)過程中,學(xué)習(xí)者通常需要教師與同伴的持續(xù)支持以完成項目作品。教學(xué)智能體可以通過項目式學(xué)習(xí)任務(wù)設(shè)定,為項目式作品的完成進行具體任務(wù)規(guī)劃,支持與項目式學(xué)習(xí)相關(guān)內(nèi)容的記憶與反思,提供多模態(tài)項目資源生成、檢索增強生成式的學(xué)習(xí)支架、高質(zhì)量代碼生成與反饋等多種能力的實現(xiàn)與拓展,同時支持人機交互與多智能體交互模式。如圖3所示,教學(xué)智能體可以擔(dān)任“助教智能體”與“同伴智能體”兩類教育角色,在不同項目環(huán)節(jié)中具有不同的任務(wù)設(shè)定、拓展能力與個體記憶,從而表現(xiàn)出能力與功能差異,為學(xué)習(xí)者提供多種交互支持。我們以信息科技或人工智能課程中常見的“垃圾分類”跨學(xué)科主題為例,闡述教學(xué)智能體在項目式學(xué)習(xí)各個環(huán)節(jié)中的作用。
(一)個性化驅(qū)動問題提出
項目式學(xué)習(xí)需要基于真實情境提出驅(qū)動問題,使學(xué)習(xí)者能真實地感到解決該問題的迫切性和可行性,從而激發(fā)其進行深入探究與完成項目的內(nèi)在動力。因此,在驅(qū)動問題提出環(huán)節(jié),“助教智能體”可以首先依據(jù)預(yù)設(shè)的學(xué)習(xí)情景,建立驅(qū)動問題引導(dǎo)框架。在此基礎(chǔ)上,“助教智能體”能夠與學(xué)習(xí)者開展多模態(tài)形式的在線討論,并依據(jù)學(xué)習(xí)者的特點與學(xué)習(xí)意圖,采用個性化對話路徑與交互策略,最終引導(dǎo)學(xué)習(xí)者自主提出項目的驅(qū)動問題?!爸讨悄荏w”可以利用前述LangChain開源技術(shù)框架中的智能體模塊(Agents Module)實現(xiàn)此主要功能,通過將預(yù)設(shè)的引導(dǎo)框架作為每一輪對話的目標問題,并將學(xué)習(xí)者作為每一輪任務(wù)規(guī)劃中必選的咨詢工具,實現(xiàn)主動向?qū)W習(xí)者提問并開展討論。
例如針對“垃圾分類”這一環(huán)保主題,“助教智能體”可以為學(xué)習(xí)者創(chuàng)設(shè)真實情景,調(diào)用外部ERNIEViLG多模態(tài)大模型[35]的圖片生成能力,繪制“海洋垃圾漩渦”“難以降解的塑料垃圾”等情景圖片。同時,“助教智能體”基于大模型的對話能力,與學(xué)習(xí)者進行垃圾治理迫切性的在線討論。結(jié)合學(xué)習(xí)者的具體反饋,“助教智能體”可以繼續(xù)提出垃圾治理的可能必要步驟和方法,從而引導(dǎo)學(xué)生自主思考并明確具體要開展的項目活動,例如“如何宣傳垃圾分類環(huán)保理念”或“如何制作一個智能垃圾桶用于垃圾分類”。
(二)項目方案共同設(shè)計
為解決學(xué)習(xí)者提出的個性化驅(qū)動問題,教學(xué)智能體可以搭建學(xué)習(xí)者與智能體間的動態(tài)討論小組,基于其教育任務(wù)規(guī)劃能力幫助學(xué)習(xí)者確定具體解決方案,并對方案進行分解規(guī)劃。小組討論可以依據(jù)項目目標與學(xué)習(xí)者風(fēng)格,采用“智能體領(lǐng)導(dǎo)”或“學(xué)習(xí)者領(lǐng)導(dǎo)”兩種模式開展。在“智能體領(lǐng)導(dǎo)”模式下,教學(xué)智能體可以利用前述的AutoGen開源技術(shù)框架,構(gòu)建多個“同伴智能體”,模擬和扮演人類小組成員在項目式學(xué)習(xí)過程中的不同角色,開展人類學(xué)習(xí)者與多個“同伴智能體”間的多角色交互。在此過程中,“助教智能體”主要負責(zé)基于小組對話歷史內(nèi)容及項目目標,選擇每一輪的發(fā)言者(人類學(xué)習(xí)者或“同伴智能體”),并將發(fā)言內(nèi)容廣播給所有小組成員,從而在多輪發(fā)言與信息傳達中實現(xiàn)項目實施方案的協(xié)同設(shè)計。在“學(xué)習(xí)者領(lǐng)導(dǎo)”模式下,學(xué)習(xí)者則可直接自主選擇與不同“同伴智能體”展開對話。
具體而言,在“智能體領(lǐng)導(dǎo)”模式下,為解決驅(qū)動問題“如何宣傳垃圾分類環(huán)保理念”,教學(xué)智能體可以首先利用其任務(wù)規(guī)劃能力,將驅(qū)動問題的解決方案分解為“了解垃圾分類規(guī)則”“搜集各類典型垃圾示例”“制作宣傳素材和載體”等多個可執(zhí)行的子任務(wù)?;谒?guī)劃的子任務(wù),教學(xué)智能體可構(gòu)建多個“同伴智能體”與學(xué)習(xí)者針對具體項目方案開展討論,提供策略性支架,并對學(xué)習(xí)者的意見進行實時理解與及時反饋,逐步引導(dǎo)學(xué)習(xí)者共同完成項目方案的設(shè)計。例如針對“制作宣傳素材和載體”這一子任務(wù),多個“同伴智能體”在小組討論中,可以提出海報、網(wǎng)頁或微信小程序等不同宣傳形式的解決方案。如果學(xué)習(xí)者基于自身興趣和專長提出支持網(wǎng)頁形式,“助教智能體”則選擇具備相關(guān)能力的“同伴智能體”發(fā)言,基于制作“垃圾分類宣傳網(wǎng)站”展開方案設(shè)計和討論,幫助學(xué)習(xí)者明確如何設(shè)計和搭建宣傳網(wǎng)站。隨后,“助教智能體”可以在小組內(nèi)廣播得到的方案,并選擇其他“同伴智能體”細化建議,例如需要首先明確“垃圾分類”的規(guī)則并將其展示在網(wǎng)站重要位置。
(三)項目作品協(xié)同完成
基于所設(shè)計的項目方案,教學(xué)智能體可以構(gòu)建相應(yīng)的“同伴智能體”,與學(xué)習(xí)者協(xié)同完成項目作品的制作。項目作品的制作首先需要進行相關(guān)素材和信息的采集。例如在 “了解垃圾分類規(guī)則”子任務(wù)中,需要學(xué)習(xí)者搜集當(dāng)?shù)刈钚碌睦诸悩藴?。由于世界各地垃圾分類標準不同且更新變化,“助教智能體”可采用RAG方式為學(xué)習(xí)者提供準確的內(nèi)容生成。如圖4所示,“同伴智能體”利用LangChain框架提供的多種函數(shù)快捷實現(xiàn)RAG流程。首先,“索引建立”步驟通過智能體自動爬取或人工篩選互聯(lián)網(wǎng)上的政府環(huán)境部門官方網(wǎng)站資源,利用LangChain中的文檔加載(Document Loaders)方法收集可靠的信息,并利用其文本切分(Text Splitter)方法將長文本切分為語義相關(guān)的短句。在此基礎(chǔ)上,“問題檢索”步驟選取大模型抽取文本特征向量,并利用Chroma向量數(shù)據(jù)庫進行存儲,構(gòu)建“垃圾分類標準”的特征檢索知識庫。進而,利用基于問答的檢索方法(Retrieval QA)抽取用戶提問的文本特征,并基于特征相似度檢索與提問信息最為相關(guān)的向量數(shù)據(jù)庫中的信息。最后,“內(nèi)容生成”步驟將檢索得到的信息與用戶提問信息輸入提示模版(Prompt Template),構(gòu)建完整的提示信息,利用大模型最終生成最新且正確的各地垃圾分類規(guī)則。
在相關(guān)素材收集完成后,“助教智能體”可以進一步協(xié)助學(xué)習(xí)者制作“垃圾分類宣傳網(wǎng)站”。在此過程中,學(xué)習(xí)者可以通過多模態(tài)方式與智能體交流,為其展示手繪的網(wǎng)站前端設(shè)計樣稿,或用文本與智能體溝通網(wǎng)站后端設(shè)計理念?!爸讨悄荏w”可以調(diào)用多個外部網(wǎng)頁設(shè)計腳本語言庫,自動生成對應(yīng)的網(wǎng)頁代碼。同時,教學(xué)智能體可利用AutoGen框架內(nèi)嵌的機器語言執(zhí)行環(huán)境,直接執(zhí)行生成的代碼,并將執(zhí)行結(jié)果與錯誤提示反饋給“助教智能體”,指導(dǎo)其進一步自動修改和完善代碼。學(xué)習(xí)者也可以基于已生成的頁面,通過頁面截屏或自然語言方式反饋修改意見,從而“助教智能體”可依據(jù)反饋內(nèi)容進一步調(diào)整優(yōu)化網(wǎng)站。
(四)項目作品多角色評價
在項目作品展示與評價環(huán)節(jié),“助教智能體”與“同伴智能體”可以從各自角度,分別開展項目作品的教師評價與同伴評價。智能體根據(jù)個性化驅(qū)動問題與項目方案,預(yù)先生成相應(yīng)的過程性與結(jié)果性評價量規(guī)。在學(xué)習(xí)者匯報展示人機協(xié)同制作的項目作品過程中,“助教智能體”與“同伴智能體”可依據(jù)各自記憶模塊存儲的不同過程性信息及相應(yīng)評價量規(guī),從教師與外組同伴角度對匯報內(nèi)容進行項目實施的過程性評價。例如針對“垃圾分類宣傳網(wǎng)站”項目作品,智能體可以根據(jù)學(xué)習(xí)者在小組討論和網(wǎng)站制作過程中的貢獻程度,進行客觀評價。同時,智能體還可以利用其環(huán)境交互能力,實現(xiàn)對網(wǎng)頁的點擊訪問,對網(wǎng)站的設(shè)計進行交互測試與量化統(tǒng)計,例如從網(wǎng)頁的元素數(shù)量、色彩選擇、多媒體使用等角度,得到對該項目作品的結(jié)果性評價。此外,智能體可以基于其多模態(tài)感知能力,將學(xué)習(xí)者匯報內(nèi)容以視頻形式輸入,對學(xué)習(xí)者項目匯報的語言流暢度、內(nèi)容邏輯性、闡述完整度等方面進行評價。
基于本輪項目作品的評價信息,“助教智能體”與“同伴智能體”可以結(jié)合各自存儲的記憶,從學(xué)習(xí)者的知識掌握、技能獲取、交互有效性等方面進行反思提問,促進其教育任務(wù)規(guī)劃、教學(xué)與交互能力的同步提升。從而在下一輪的項目式學(xué)習(xí)中,智能體面對新的學(xué)習(xí)者群體,可以更有效地開展相同主題下的項目式學(xué)習(xí),實現(xiàn)智能體教育能力的進化。
基于大模型的教學(xué)智能體是生成式人工智能在教育領(lǐng)域重要的未來研究方向和應(yīng)用落地形式之一,也是解決教育領(lǐng)域人機協(xié)同模式的核心技術(shù)路徑。本研究提出的教學(xué)智能體架構(gòu),以大模型及其多種能力為核心,結(jié)合教育領(lǐng)域的多場景需求和多角色服務(wù)特點,致力于啟發(fā)和幫助未來高智能化教育系統(tǒng)的設(shè)計和實現(xiàn)。在此基礎(chǔ)上,詳細論述了項目式學(xué)習(xí)場景下,教學(xué)智能體的角色、功能及其與學(xué)習(xí)者的協(xié)作實踐路徑。教學(xué)智能體的研究目前仍處于起步階段,本文針對其未來發(fā)展提出以下研究展望:
1.設(shè)計和研發(fā)教學(xué)智能體亟需受到重視,以確保教育領(lǐng)域可以充分利用生成式人工智能等前沿技術(shù),快速提高各類教育產(chǎn)品和服務(wù)的智能性與交互性。需要重視多智能體技術(shù)的應(yīng)用,利用智能體模擬和扮演不同教育關(guān)鍵角色,實現(xiàn)“討論-實踐-反思”等多種模式的高效教學(xué)交互過程。同時,需要充分發(fā)揮智能體與人類各自的智慧優(yōu)勢,實現(xiàn)更為合理有效的人機協(xié)同教育模式。
2.與通用領(lǐng)域或其它垂直領(lǐng)域智能體相比,教育領(lǐng)域智能體構(gòu)建具有領(lǐng)域自身的特殊需求和特點,需要充分考慮教育場景與教學(xué)對象的復(fù)雜性,設(shè)計專有教育大模型及其核心教育能力。教育大模型需要深入理解教育資源、教學(xué)對象以及教學(xué)過程,具備相關(guān)教育理論與學(xué)習(xí)科學(xué)理論的支撐。
3.教學(xué)智能體的設(shè)計需要充分考慮其對學(xué)習(xí)者價值觀和倫理觀念的影響,確保智能體的行為符合社會的道德標準和教育目標。在教育任務(wù)執(zhí)行過程中,教學(xué)智能體需要具備持續(xù)學(xué)習(xí)和自我優(yōu)化的能力,在與教育利益相關(guān)方的互動中不斷積累經(jīng)驗,提高其教育服務(wù)的可靠性與可信性,提供包容性的教育資源和教學(xué)策略,避免偏見和歧視。
參考文獻:
[1] Franklin S,Graesser A.Is it an Agent,or just a Program :A Taxonomy for Autonomous Agents [A].International Workshop on Agent Theories, Architectures, and Languages [C].Berlin,Heidelberg:Springer Berlin Heidelberg,1996.21-35.
[2] Xi Z Chen W,Guo X,et al.The Rise and Potential of Large Language Model Based Agents:A Survey [DB/OL].https://arxiv.org/abs/2309.07864,2023-09-19.
[3] Soller A,Busetta P.An Intelligent Agent Architecture for Facilitating Knowledge Sharing Communication [A].Rosenschein S J,Wooldridge M.Proceedings of the Workshop on Humans and Multi-Agent Systems at the 2nd International Joint Conference on Autonomous Agents and Multi-Agent System [C].New York:Association for Computing Machinery,2003.94-100.
[4] Woolf B P.Building Intelligent Interactive Tutors: Student-centered Strategies for Revolutionizing e-Learning [M].Burlington:Morgan Kaufmann,2010.
[5] 劉清堂,巴深等.教育智能體對認知學(xué)習(xí)的作用機制研究述評[J].遠程教育雜志,2019,37(5):35-44.
[6] 劉清堂,巴深等.視頻課程中教育智能體的社會線索設(shè)計研究[J].電化教育研究,2020,41(9):55-60.
[7] 劉三女牙,彭晛等.數(shù)據(jù)新要素視域下的智能教育:模型、路徑和挑戰(zhàn)[J].電化教育研究,2021,42(9):5-11+19.
[8] Swan,M.,Kido,T.,Roland,E.,Santos,R.P.D.Math Agents:Computational Infrastructure, Mathematical Embedding, and Genomics [DB/OL].https:// arxiv.org/abs/2307.02502,2023-07-04.
[9] Jinxin S,Jiabao Z,et al.CGMI:Configurable General Multi-agent Interaction Framework [DB/OL].https://arxiv.org/abs/2308.12503,2023-08-28.
[10] Durante Z,Huang Q,et al.Agent AI:Surveying the Horizons of Multimodal Interaction [DB/OL].https://arxiv.org/abs/2401.03568,2024-01-25.
[11] Marino K,Rastegari M,et al.Ok-vqa:A Visual Question Answering Benchmark Requiring External Knowledge [A].Robert S.and Florian K..Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition [C].Piscataway:IEEE Computer Society,2019.3195-3204.
[12] Gao Y,Xiong Y,et al.Retrieval-augmented Generation for Large Language Models:A Survey [DB/OL].https://arxiv.org/abs/2312.10997,2024-01-05.
[13] Li H,Su Y,et al.A Survey on Retrieval-augmented Text Generation [DB/OL]. https://arxiv.org/abs/2202.01110,2022-02-13.
[14] Boiko D A,MacKnight R,Gomes G.Emergent Autonomous Scientific Research Capabilities of Large Language Models [DB/OL].https://arxiv.org/ abs/2304.05332,2023-04-11.
[15] Wei J,Wang X,et al.Chain-of-thought Prompting Elicits Reasoning in Large Language Models [J].Advances in Neural Information Processing Systems,2022,35:24824-24837.
[16] Wang X,Wei J,et al.Self-consistency Improves Chain of Thought Reasoning in Language Models [DB/OL].https://arxiv.org/ abs/2203.11171,2023-03-07.
[17] Yao S,Yu D,et al.Tree of Thoughts: Deliberate Problem Solving with Large Language Models [J].Advances in Neural Information Processing Systems,2024,36:1-11.
[18] Yao S,Zhao J,et al.ReAct:Synergizing Reasoning and Acting in Language Models [DB/OL].https://arxiv.org/abs/2210.03629,2023-03-10.
[19] Wang G,Xie Y,et al.Voyager:An Open-Ended Embodied Agent with Large Language Models [A].Colas C,Teodorescu L,Ady N,Sancaktar C,Chu J.Intrinsically-Motivated and Open-Ended Learning Workshop@ NeurIPS2023 [C].Cambridge,MA:MITPress,2023.
[20] Wu Q,Bansal G,et al.Autogen:Enabling Next-gen LLM Applications via Multi-agent Conversation Framework [DB/OL].https://arxiv.org/ abs/2308.08155,2023-10-03.
[21] Bran A M,Cox S,et al.ChemCrow:Augmenting Large-language Models with Chemistry Tools [DB/OL].https://arxiv.org/abs/2304.05376,2023-10-02.
[22] Gao D,Ji L,et al.AssistGPT:A General Multi-modal Assistant that Can Plan, Execute,Inspect,and Learn [DB/OL].https://arxiv.org/ abs/2306.08640,2023-06-28.
[23] Liang T,He Z,et al.Encouraging Divergent Thinking in Large Language Models through Multi-Agent Debate [DB/OL].https://arxiv.org/ abs/2305.19118,2023-05-30.
[24] Hong S,Zheng X,et al.Metagpt:Meta Programming for Multi-agent Collaborative Framework [DB/OL].https://arxiv.org/abs/2308.00352,2023-11-06.
[25] Park J S,O’Brien J,et al.Generative Agents:Interactive Simulacra of Human Behavior [A].Follmer S,Han J,Steimle J,Riche N H.Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology [C].New York:Association for Computing Machinery,2023.1-22.
[26] Wang L,Ma C,et al.A Survey on Large Language Model Based Autonomous Agents [J].Frontiers of Computer Science,2024,18(6):1-26.
[27] LangChain.LangChain [EB/OL].https://python.langchain.com/docs/get_ started/introduction,2023-11-12.
[28] Auto-GPT.Auto-GPT [EB/OL].https://docs.agpt.co/,2023-12-29.
[29] AutoGen.AutoGen [EB/OL].https://microsoft.github.io/autogen/,2023-12-28.
[30] BabyAGI.BabyAGI [DB/OL].https://github.com/yoheinakajima/ babyagi,2023-12-28.
[31] Li G,Hammoud H,et al.Camel:Communicative Agents for “mind” Exploration of Large Language Model Society [J].Advances in Neural Information Processing Systems,2024,36:1-34.
[32] 盧宇,余京蕾等.多模態(tài)大模型的教育應(yīng)用研究與展望[J].電化教育研究,2023,44(6):38-44.
[33] Wolfram.WolframAlpha [EB/OL].https://www.wolframalpha.com/,2023-11-11.
[34] 馬寧,郭佳惠等.大數(shù)據(jù)背景下證據(jù)導(dǎo)向的項目式學(xué)習(xí)模式與系統(tǒng)[J].中國電化教育,2022,(2):75-82.
[35] Zhang Z,Han X,et al.ERNIE:Enhanced Language Representation with Informative Entities [A].Korhonen A,Traum D,Màrquez L.Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics [C].Stroudsburg:Association for Computational Linguistics,2019.1441-1451.
作者簡介:
盧宇:副教授,博士生導(dǎo)師,研究方向為人工智能及其教育應(yīng)用。
余京蕾:在讀博士,研究方向為人工智能及其教育應(yīng)用。
陳鵬鶴:講師,博士,研究方向為人工智能及其教育應(yīng)用。
Design and Application of Pedagogical Agent with Foundation Model
Lu Yu1,2, Yu Jinglei1, Chen Penghe1,2
1. School of Educational Technology, Faculty of Education, Beijing Normal University, Beijing 100875 2. Advanced Innovation Center for Future Education, Beijing Normal University, Beijing 100875
Abstract: With the rapid development of generative artificial intelligence, agent with foundation model has gradually acquired the capabilities of multimodal perception, retrieval and augmentation generation, reasoning and planning, interaction, and evolution. In this study, we propose the basic concept and framework of pedagogical agent with foundational model, with foundation model as the core, focusing on the construction of “educational task setting”, “educational task planning”, “educational capability realization and expansion”, “educational content memory and reflection”, “interactive collaboration and dynamic evolution”. It also supports interaction with multiple types of objects and dynamic evolution, covering human-computer interaction, multi-agent interaction, and environment interaction. Based on the proposed framework, this study takes the project-based learning task as an application scenario, and describes how the proposed pedagogical agent can be used as “assistant agent” and “peer agent” in personalization-driven problem posing, co-design of the project plan, collaborative completion of the project work, and multi-role evaluation of the project work. Finally, this study further discusses the future development and outlook of pedagogical agent.
Keywords: pedagogical agents; foundation model; generative artificial intelligence; project-based learning
責(zé)任編輯:趙云建