陳聰聰 李晨 王亞飛
摘要:當前,人工智能技術(shù)在教育領(lǐng)域的影響已逐漸凸顯,“人工智能+教育”的新型教學(xué)模式探索成為教育領(lǐng)域的研究熱點。近來,文生視頻模型Sora的出現(xiàn)受到了廣泛關(guān)注,雖然未來Sora對于教育教學(xué)的影響尚未可知,但引入智能技術(shù)以促進教育教學(xué)高質(zhì)量發(fā)展的趨勢已經(jīng)不可阻擋。為此,文章梳理了文生視頻模型的技術(shù)演進,介紹了主流文生視頻模型的基本情況,并闡釋了Sora的緣起和應(yīng)用優(yōu)勢。在此基礎(chǔ)上,文章分析了Sora融入教育教學(xué)帶來的機遇,主要表現(xiàn)為豐富了教學(xué)資源、增強了沉浸式教學(xué)體驗、創(chuàng)新了交互方式;同時,文章從技術(shù)成熟度、師生技術(shù)素養(yǎng)、倫理安全風(fēng)險、監(jiān)管與治理制度四個方面,探討了Sora融入教育教學(xué)面臨的主要挑戰(zhàn),以期推動Sora在教育教學(xué)中的應(yīng)用,并為開展智能技術(shù)支撐的教育教學(xué)提供參考。
關(guān)鍵詞:Sora;人工智能;智能教育;大模型
【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009—8097(2024)05—0027—08 【DOI】10.3969/j.issn.1009-8097.2024.05.003
2022年11月,美國人工智能研究公司OpenAI發(fā)布大語言模型ChatGPT,其一經(jīng)問世,就憑借強大的數(shù)據(jù)處理和分析預(yù)測能力,在全球范圍內(nèi)受到了各行業(yè)的廣泛關(guān)注,訊飛星火、文心一言等系列人工智能大模型產(chǎn)品也隨之涌現(xiàn)。當人們還在探索ChatGPT的潛力和挑戰(zhàn)并為其應(yīng)用展開激烈的討論時,OpenAI又于2024年2月發(fā)布了文生視頻模型Sora,其可以通過文本描述生成最長60秒的逼真視頻,這一突破性變革再度掀起了討論熱潮并持續(xù)發(fā)酵。Sora的發(fā)布,也意味著AI技術(shù)在視頻技術(shù)領(lǐng)域的巨大飛躍,未來可能對金融、醫(yī)療、教育等行業(yè)都將產(chǎn)生深遠的影響[1]。Sora的出現(xiàn),為教育教學(xué)的方式和內(nèi)容帶來了新的可能,但其帶來的影響究竟如何尚未可知,因此有必要對其應(yīng)用于教育教學(xué)的潛力進行探索與分析?;诖?,本研究嘗試梳理文生視頻模型的技術(shù)演進及其主流的模型,并分析Sora的誕生歷程和應(yīng)用優(yōu)勢,來探討Sora融入教育教學(xué)帶來的機遇及其面臨的主要挑戰(zhàn)。
一 文生視頻模型
1 文生視頻模型的技術(shù)演進
文生視頻(Text-to-Video)模型是一種結(jié)合深度學(xué)習(xí)和視覺生成的人工智能技術(shù),能夠基于用戶提供的文本指令信息自動識別并生成各種主題和風(fēng)格的視頻片段。這類模型基于神經(jīng)網(wǎng)絡(luò)架構(gòu),可以在處理海量視頻數(shù)據(jù)的同時,保持高速的計算和準確的內(nèi)容生成能力。隨著訓(xùn)練數(shù)據(jù)的增加,憑借強大的學(xué)習(xí)能力,經(jīng)過不斷的迭代優(yōu)化,文生視頻模型產(chǎn)出的內(nèi)容逐漸貼合用戶的需求和想象,實現(xiàn)了從自然語言到動態(tài)視頻的轉(zhuǎn)換。目前,文生視頻模型尚處于起步階段,在其發(fā)展過程中先后采用了不同技術(shù),主要有:①基于生成對抗網(wǎng)絡(luò)(Generative Adversarial Nets,GAN)和變分自編碼器(Variational Autoencoder,VAE)技術(shù)生成視頻內(nèi)容[2]。其中,GAN利用生成器和判別器,通過迭代的對抗訓(xùn)練生成動態(tài)視頻[3];VAE則通過對數(shù)據(jù)進行編/解碼以生成連貫的視頻序列[4],典型代表有Text2Filter[5]。②引入Transformer模型。先對輸入的文本進行編碼,再轉(zhuǎn)化為視頻token,然后通過特征融合以輸出視頻內(nèi)容,典型代表有Phenaki[6]、NUWA[7]。③擴散(Diffusion)模型成為主流框架[8]。通過逐步添加隨機噪聲,進行逆向去噪生成視頻,典型代表有Make-A-Video[9]、Gen-2[10]。從本質(zhì)上來說,Sora也是一種擴散(Diffusion)模型,但不同于傳統(tǒng)的文生視頻模型,Sora已在視頻持續(xù)時間、理解能力、分辨率等方面都有了全新的突破。
2 主流的文生視頻模型
當前,主流的主流文生視頻模型有Gen-2、Pika 1.0、Stable Video Diffusion等。本研究根據(jù)相關(guān)的官網(wǎng)信息,梳理了這些模型的基本情況,如表1所示。其中,Runway是較早研究文生視頻的開發(fā)團隊,先后推出了Gen-1、Gen-2兩個版本的模型。其中,Gen-2憑借清晰度相對較高的視頻質(zhì)量而在文生視頻領(lǐng)域應(yīng)用廣泛,但其仍存在語義理解欠佳、視頻扭曲掉幀、連貫性較差等問題。Pika 1.0具有較強的語義理解能力,且在動畫風(fēng)格的視頻生成方面表現(xiàn)突出,新推出的Lip Sync還提供“對口型”功能,可以同步聲音與視頻角色的嘴部動作,增強畫面效果的真實感。Stable Video Diffusion作為一個開源的文生視頻模型,可以實現(xiàn)多視角視頻合成和幀插入功能,也在一定程度上提升了視頻內(nèi)容的質(zhì)量。據(jù)OpenAI官網(wǎng)介紹,相較于以往的文生視頻模型,Sora不僅增加了視頻的持續(xù)時長、提升了語義理解能力,還可以支持對視頻內(nèi)容的編輯擴展,并涌現(xiàn)了一定的物理仿真能力,這些特性對于影視、廣告等傳媒行業(yè)將產(chǎn)生深遠影響。
二 Sora的緣起與應(yīng)用優(yōu)勢
1 Sora的緣起
2021年1月,OpenAI公司基于旗下產(chǎn)品GPT-3研發(fā)了文生圖模型DALL-E,這是一款包含120億參數(shù)的多模態(tài)預(yù)訓(xùn)練模型。DALL-E具有強大的文字理解和圖像生成能力,可以實現(xiàn)從文字提示到對應(yīng)清晰圖像的轉(zhuǎn)換,從而打破了語言與圖像之間的天然壁壘,因此迅速吸引了廣告設(shè)計、游戲制作等領(lǐng)域從業(yè)人員的目光,并在實際的工作生產(chǎn)中進行了應(yīng)用。2022年4月,OpenAI公司對DALL-E進行升級,發(fā)布了DALL-E 2。相比DALL-E,DALL-E 2不僅提高了圖像生成的真實性和準確性、加快了圖像的生成速度,而且允許用戶對圖像進行編輯,故交互性更加顯著。2023年9月,DALL-E 3正式發(fā)布,其最大的亮點是集成了ChatGPT,可以更加準確地理解用戶給出的提示詞,并且在圖像的質(zhì)量方面有了較大的提升——Sora正是借鑒DALL-E 3而開發(fā)的一款文生視頻大模型。
2 Sora的應(yīng)用優(yōu)勢
Sora來源于日語“空”,意為“天空”,代表無限的創(chuàng)造潛力。OpenAI公司將Sora比作“世界模擬器”,稱其為實現(xiàn)人工通用智能(Artificial General Intelligence,AGI)的重要里程碑[11]。作為一個DiT(Diffusion Transformer)模型[12],Sora的大致工作過程是:先將用戶提示信息進行壓縮,再分解為一系列時空潛在補?。⊿pacetime Latent Patch),再利用Transformer模型進行處理后得到最終的視頻輸出內(nèi)容。Sora的應(yīng)用優(yōu)勢主要表現(xiàn)為:
①降低了應(yīng)用門檻。受技術(shù)操作、設(shè)備配置等因素的影響,傳統(tǒng)視頻制作中視頻內(nèi)容創(chuàng)作的發(fā)揮空間有限,阻礙了視頻內(nèi)容生產(chǎn)者數(shù)量的持續(xù)擴充,進而影響了相關(guān)行業(yè)的多元發(fā)展和創(chuàng)新步伐,而Sora的出現(xiàn)可以簡化創(chuàng)作流程、減少制作成本,進而降低了視頻創(chuàng)作的門檻,提升了創(chuàng)意和思維表達的自由度。這一優(yōu)勢無論是對于個體創(chuàng)作、商業(yè)應(yīng)用,還是對于教育、科研等特定領(lǐng)域都具有重要的意義,將進一步加速行業(yè)融合創(chuàng)新的步伐。②實現(xiàn)了對話式視頻生成。隨著以ChatGPT為代表的生成式人工智能技術(shù)的迅速崛起,人機交互的方式正在發(fā)生變革,而Sora接收用戶給定的文字提示信息并反饋動態(tài)視頻輸出的工作流程,將催生對話式新型視頻人機交流模式,以豐富多元的人機交互方式,促成更加全面的交互環(huán)境的形成,提升人機互動體驗感。③涌現(xiàn)了物理仿真能力。Sora在經(jīng)過大規(guī)模數(shù)據(jù)的訓(xùn)練后,展現(xiàn)了一定程度的涌現(xiàn)能力,這是大語言模型的重要特性,是指在模型的訓(xùn)練和應(yīng)用過程中出現(xiàn)的、之前未被編碼的意想不到的能力[13]。得益于這一能力,Sora不僅能夠?qū)W習(xí)現(xiàn)實世界的客觀規(guī)律,還可以根據(jù)掌握的知識推斷并模擬運動場景,實現(xiàn)3D一致性和長時連貫性,確保視角轉(zhuǎn)換狀態(tài)下視頻內(nèi)容的穩(wěn)定性。因此可以說,這一能力為Sora“構(gòu)建通用世界模擬器”的未來愿景奠定了堅實基礎(chǔ)。
三 Sora融入教育教學(xué)帶來的機遇
當前,人工智能技術(shù)已經(jīng)開始介入課堂教學(xué),促使教學(xué)模式逐步轉(zhuǎn)向“師-機-生”三元結(jié)構(gòu),旨在為學(xué)生提供更加高效、有針對性的學(xué)習(xí)路徑,實現(xiàn)教育數(shù)字化轉(zhuǎn)型。如果Sora技術(shù)能在教育教學(xué)中實現(xiàn)落地,將會促進教學(xué)模式的多元化發(fā)展,加快推動傳統(tǒng)教育走向智能教育。
1 豐富了教學(xué)資源
當前,智慧課堂已成為信息技術(shù)支撐下課堂教學(xué)實踐的重要趨勢,其憑借VR、ChatGPT等智慧教育核心技術(shù)的應(yīng)用,使傳統(tǒng)單一、枯燥的課堂模式得到了顯著改善:利用VR設(shè)計英語學(xué)習(xí)教育游戲,激發(fā)了學(xué)生的學(xué)習(xí)興趣和動機[14];基于ChatGPT構(gòu)建智能數(shù)學(xué)學(xué)習(xí)系統(tǒng),能為學(xué)生提供代數(shù)解題提示,幫助其反思和糾正解題過程中出現(xiàn)的錯誤[15]。而Sora作為一款文字視頻生成工具,是對智慧教育實踐工具的有效補充,且便捷性更強、效率更高,可以直接將文字、圖像、已有視頻轉(zhuǎn)化成全新的視頻內(nèi)容,并可視化呈現(xiàn)復(fù)雜、抽象的知識概念,從而提高學(xué)生的理解能力,并豐富教學(xué)內(nèi)容。例如,教師可以應(yīng)用Sora的3D效果展示復(fù)雜的幾何圖形、動態(tài)演繹公式的推理過程等,從而加深學(xué)生對知識點的直觀印象,促進學(xué)生空間思維和邏輯思維能力的發(fā)展。同時,Sora可以幫助教師實現(xiàn)教學(xué)資源的有效整合,匯總不同學(xué)科的知識創(chuàng)建綜合性的教學(xué)視頻,在豐富教學(xué)內(nèi)容的同時拓寬學(xué)生的學(xué)習(xí)視野,使其形成完整的知識體系。此外,年輕教師在教學(xué)過程中對于知識點的理解和重難點的把握等可能存在不足,導(dǎo)致教學(xué)內(nèi)容講授效果不理想、課堂效率降低等問題的發(fā)生,從而影響了學(xué)生的學(xué)習(xí)成效。而Sora可以利用自身強大的文字理解能力,通過視頻演繹的方式表達教師難以準確表達的概念和思想,促進其內(nèi)隱的實踐性知識顯性化,從而縮小新手教師與專家教師之間的差距,助力年輕教師學(xué)習(xí)成長[16]。教學(xué)設(shè)備方面,Sora還可以通過改善視頻的構(gòu)圖,為手機、電腦、平板等不同的設(shè)備創(chuàng)建合適尺寸的內(nèi)容,這擴展了教學(xué)材料的表現(xiàn)形式,促進了教學(xué)設(shè)計的可視化,使教師可以更高效地獲取和制作教學(xué)資源,而無須考慮視頻內(nèi)容在不同設(shè)備上的兼容性問題。
2 增強了沉浸式教學(xué)體驗
據(jù)OpenAI官網(wǎng)介紹,Sora能夠根據(jù)接收到的提示信息模擬現(xiàn)實世界的人物和場景,并涌現(xiàn)出了一定的物理仿真能力,可以生成具有長時連貫性和3D一致性的視頻畫面。利用這一特性,可以通過動態(tài)的視覺元素展示抽象的概念知識,將教學(xué)形式拓展到更加逼真、更具體驗性的沉浸式教學(xué)情境,尤其是地理、生物等需要空間想象力的課程。例如,在地理課程中,教師可以應(yīng)用Sora的3D效果動態(tài)展示不同地區(qū)的地貌、氣候變化,使學(xué)生在觀看視頻的同時,能夠直觀了解并掌握地理現(xiàn)象的發(fā)生過程。Sora在教學(xué)中的應(yīng)用,一方面可以通過模擬現(xiàn)實場景吸引學(xué)生的注意力,使學(xué)生集中于課堂知識的吸收和理解,從而實現(xiàn)課堂環(huán)境的優(yōu)化;另一方面有助于將抽象的概念具像化,幫助學(xué)生突破認知障礙,并更加直觀地理解和記憶課堂知識,從而提升自身的學(xué)習(xí)效率和能力[17],并有效降低學(xué)習(xí)門檻,實現(xiàn)多元立體化的課堂互動,突破自然語言形式的限制,拓展教學(xué)互動的深度和廣度[18]。
3 創(chuàng)新了交互方式
經(jīng)過前期大量的數(shù)據(jù)訓(xùn)練,Sora已經(jīng)對現(xiàn)實世界的發(fā)展規(guī)律具有了一定程度的儲備和理解能力,可以快速實現(xiàn)虛擬場景的構(gòu)建,并較為準確地預(yù)測和模擬事物的未來狀態(tài)。這意味著,將這一優(yōu)勢應(yīng)用于教學(xué),教師可以通過逼真、生動的視頻形式將復(fù)雜問題簡單化、抽象問題具體化,使學(xué)生從更加直觀的角度學(xué)習(xí)知識,提升學(xué)生對知識的理解和記憶能力。目前,利用人工智能技術(shù)輔助課堂教學(xué)雖已成為新常態(tài),但在具體的教學(xué)過程中,教師大多只是利用其預(yù)先設(shè)計教學(xué)內(nèi)容,難以根據(jù)學(xué)生需求進行即時的靈活調(diào)整[19],不利于教學(xué)內(nèi)容個性化和交互性的實現(xiàn)。而Sora允許教師根據(jù)學(xué)生的課堂反饋和學(xué)習(xí)進度,實時調(diào)整教學(xué)視頻內(nèi)容;學(xué)生也不再只是被動地接收教師講授的知識,而是可以根據(jù)視頻內(nèi)容提出問題并展開討論,甚至可以互換師生身份,直接參與教學(xué)內(nèi)容的設(shè)計。在這種教學(xué)模式下,教師從教學(xué)活動的主導(dǎo)者變?yōu)橐龑?dǎo)者,可以將更多的精力投入到與學(xué)生的互動中,故有利于提升教學(xué)的效率和質(zhì)量;而學(xué)生從課堂教學(xué)的接受者變?yōu)閰⑴c者,可以直接參與學(xué)習(xí)內(nèi)容的設(shè)計過程,故有利于增強其學(xué)習(xí)的主動性,提升其邏輯思維能力和創(chuàng)造力。這種全新的交互方式形成了學(xué)生、教師、機器之間的多向互動,真正實現(xiàn)了“以教師為主導(dǎo),以學(xué)生為主體”的教學(xué)理念,有助于打造全新的教育生態(tài)。
四 Sora融入教育教學(xué)面臨的主要挑戰(zhàn)
雖然Sora的出現(xiàn)為促進教育模式創(chuàng)新提供了新的方向,有助于推動個性化教育進程、提升人才培養(yǎng)效率,但仍要理性看待Sora融入教育教學(xué)的可能性并客觀認識其面臨的諸多挑戰(zhàn)。
1 技術(shù)成熟度不足
雖然“人工智能+”的熱潮正在全球各行業(yè)范圍內(nèi)興起,但人工智能技術(shù)本身具有復(fù)雜性、擴展性、不可控性、不可預(yù)知性等特點[20],將其融入其他領(lǐng)域形成的產(chǎn)業(yè)模式存在極大的不確定性。OpenAI將Sora比作“世界模擬器”,其是否真的能夠做到理解物理世界并進行準確建模仍有待驗證。就當前OpenAI官網(wǎng)給出的示例來看,Sora生成視頻內(nèi)容的準確性和合理性還存在明顯不足,技術(shù)成熟度還遠遠不足以投入實際生產(chǎn),而技術(shù)從最初提出到投入生產(chǎn)需要一定的周期和復(fù)雜的條件[21],期間要經(jīng)歷大量的測試和不斷的調(diào)整,而Sora尚處在這一復(fù)雜過程的第一階段。在教育領(lǐng)域,Sora還沒有正式發(fā)布試用,未來將其應(yīng)用于實際教學(xué)的效果能否達到演示內(nèi)容的程度尚未可知;另外,教育傳播對內(nèi)容表達的嚴謹性和精確度要求更高,將Sora技術(shù)應(yīng)用于教育教學(xué),一旦生成的視頻內(nèi)容與實際教學(xué)不符,就可能會對學(xué)生產(chǎn)生誤導(dǎo),影響其對信息的接收和對知識的理解,從而與其應(yīng)用于教育的初衷相悖。
2 師生技術(shù)素養(yǎng)欠缺
當前,人工智能技術(shù)正在推動教學(xué)模式向“師-機-生”三元結(jié)構(gòu)轉(zhuǎn)變。這種教學(xué)模式要求師生不僅具備基本的學(xué)科知識素養(yǎng),還需提升自身的智能技術(shù)素養(yǎng),并將其合理應(yīng)用于日常的教育和學(xué)習(xí)中[22]。然而,Sora的功能仍需要不斷完善,學(xué)校管理者和師生也尚未做好應(yīng)用的準備,畢竟從了解到切實掌握一項陌生的技術(shù)需要一定的時間和經(jīng)驗積累。即使Sora未來發(fā)展成熟,其運用于教育教學(xué)時也仍然需要師生具備基本的技術(shù)素養(yǎng)——如果缺乏相關(guān)的技術(shù)知識和應(yīng)用能力,師生在教與學(xué)的過程中就可能因缺乏對Sora技術(shù)的了解而產(chǎn)生消極抵觸心理;如果無法正確把握Sora技術(shù)的應(yīng)用界限,則可能出現(xiàn)師生過度依賴技術(shù)的情況,而違背了技術(shù)只是一種輔助手段的基本理念。另外,Sora因海量數(shù)據(jù)訓(xùn)練而天然存在的“黑箱”特性,使其生成的視頻內(nèi)容可信度存疑,如果師生不能應(yīng)用批判性思維對視頻內(nèi)容進行分析和辨別,而只是盲目地接收Sora得出的信息,那么師生將可能吸納錯誤的知識,出現(xiàn)思維的惰化,從而弱化問題的解決能力,失去對知識獲取的主動性——長此以往,將會造成思維能力的退化[23]。
3 倫理安全風(fēng)險滋生
2023年9月,聯(lián)合國教科文組織發(fā)布《在教育和研究中使用生成式人工智能的指南》[24],這是自ChatGPT出現(xiàn)以來頒布的首份規(guī)范生成式人工智能相關(guān)內(nèi)容和行為的指導(dǎo)性文件。該指南從顯性和隱性兩個方面分析了生成式人工智能技術(shù)可能帶來的風(fēng)險,強調(diào)了生成式人工智能技術(shù)規(guī)范應(yīng)用的重要性。智能技術(shù)在變革教育的同時,也衍生出了算法歧視與不透明、技術(shù)濫用與依賴等一系列倫理問題[25][26],而在生成式人工智能的數(shù)據(jù)質(zhì)量風(fēng)險中,偏見和歧視問題十分突出[27]。作為主要基于歐美語料庫的大模型,Sora的訓(xùn)練數(shù)據(jù)內(nèi)容中可能存在的價值觀沖突會對青少年的世界觀構(gòu)建產(chǎn)生潛移默化的影響,并導(dǎo)致弱勢群體“數(shù)字殖民”升級的風(fēng)險[28]。目前,OpenAI官網(wǎng)針對Sora的技術(shù)報告介紹了其宏觀框架,但沒有明確其視頻訓(xùn)練數(shù)據(jù)的來源,經(jīng)過大規(guī)模的數(shù)據(jù)訓(xùn)練,Sora的學(xué)習(xí)內(nèi)容可能會因各地文化的差異存在偏見和不穩(wěn)定因素[29],這為學(xué)生自主學(xué)習(xí)中的觀念形成埋下了隱患。此外,相較于文字和圖片,視頻承載的信息量更大,容易給學(xué)生留下更加直觀、深刻的印象,如果視頻內(nèi)容包含誤導(dǎo)信息,就會加深其帶來的負面影響,而Sora的超強涌現(xiàn)能力更是加大了這一風(fēng)險。OpenAI公司也表示,對于Sora生成視頻可能存在的錯誤信息、仇恨內(nèi)容、偏見內(nèi)容等還需不斷測試。可見,師生需慎重對待Sora生成的視頻內(nèi)容,如果師生的倫理安全意識不足,就可能無法正確辨認視頻內(nèi)容的合理性和公平性,從而使其合法權(quán)益受到侵犯[30]。
4 監(jiān)管與治理制度滯后
隨著生成式人工智能技術(shù)的快速發(fā)展,其在教育領(lǐng)域的應(yīng)用越來越廣泛,各國政府、學(xué)校、企業(yè)等都在積極探索生成式人工智能技術(shù)與教育教學(xué)融合的發(fā)展路向,以培養(yǎng)契合數(shù)字化轉(zhuǎn)型要求的高水平創(chuàng)新型人才。而有效的監(jiān)管和治理,能夠引導(dǎo)師生在安全范圍內(nèi)將生成式人工智能技術(shù)應(yīng)用于日常的教與學(xué),從而促進智能技術(shù)融入教育教學(xué)的健康、穩(wěn)定發(fā)展[31]。針對智能技術(shù)賦能教育進行監(jiān)管和治理,一直是我國政府部門的重點工作之一。2023年5月,我國發(fā)布《生成式人工智能服務(wù)管理暫行辦法》,規(guī)定了生成式人工智能服務(wù)的合法使用范圍,旨在促進生成式人工智能的健康發(fā)展和規(guī)范應(yīng)用[32]。但是,針對技術(shù)的立法是一個漫長且復(fù)雜的過程,需要考慮多方面的因素,致使相關(guān)監(jiān)管政策推進的步伐往往落后于技術(shù)的發(fā)展速度,而缺少法規(guī)和條例的引導(dǎo)與治理會引發(fā)技術(shù)濫用、隱私泄露等一系列風(fēng)險,從而限制生成式人工智能的發(fā)展[33]。在教學(xué)實踐中,如果沒有明確的政策引導(dǎo),師生應(yīng)用Sora之類的智能技術(shù)時就可能會缺乏責(zé)任感和規(guī)范約束,造成不良違規(guī)行為的滋生[34]。近年來,風(fēng)險監(jiān)管機制的缺失使人工智能技術(shù)應(yīng)用違規(guī)行為的問題日益凸顯,加上人工智能技術(shù)尤其是具有突破性、不穩(wěn)定性的Sora技術(shù)具有驚人的更新迭代速度,迫切需要政府及時提出監(jiān)管措施以防范使用風(fēng)險?;诖?,政府部門亟需加速制定相關(guān)的法律法規(guī)或指導(dǎo)意見,健全數(shù)字教育技術(shù)風(fēng)險監(jiān)管機制,監(jiān)督和治理生成式人工智能技術(shù)的合理教育應(yīng)用,打造技術(shù)與教育融合的健康生態(tài)環(huán)境。
五 結(jié)語
Sora技術(shù)才剛剛啟程,未來的發(fā)展方向尚未可知,但智能技術(shù)賦能教育教學(xué)的趨勢已然形成。本研究探索了Sora應(yīng)用于教育教學(xué)的潛力,期望通過對其所面臨的機遇與挑戰(zhàn)的討論,為推動Sora在課堂教學(xué)中的應(yīng)用提供參考。技術(shù)的引入是為了更好地推動教育高質(zhì)量發(fā)展,教育工作者應(yīng)積極探索依托創(chuàng)新技術(shù)開展教育教學(xué)的方法,適應(yīng)數(shù)字化轉(zhuǎn)型時代人才培養(yǎng)的新范式。以Sora技術(shù)融入教育教學(xué)為契機,加強對學(xué)生創(chuàng)新能力的培養(yǎng),全面提升教師的智能教育技術(shù)應(yīng)用能力,可以更好地應(yīng)對新技術(shù)對教育教學(xué)的沖擊。相信隨著功能的不斷完善,ChatGPT、Sora等新一代智能技術(shù)將為師生帶來更佳的教與學(xué)體驗,助力打造和諧、優(yōu)質(zhì)的教育生態(tài)環(huán)境。
參考文獻
[1]Liu Y, Zhang K, Li Y, et al. Sora: A review on background, technology, limitations, and opportunities of large vision models[OL].
[2]Kim D, Joo D, Kim J. Tivgan: Text to image to video generation with step-by-step evolutionary generator[J]. IEEE Access, 2020,8:153113-153122.
[3]Vondrick C, Pirsiavash H, Torralba A. Generating videos with scene dynamics[OL].
[4]Pham D , Le T M V .Auto-encoding variational bayes for inferring topics and visualization[OL].
[5]Li Y, Min M R, Shen D, et al. Video generation from text[OL].
[6]Villegas R, Babaeizadeh M, Kindermans P J, et al. Phenaki: Variable length video generation from open domain textual descriptions[OL].
[7]Chenfei Wu, Jian Liang, Lei Ji, et al. N?WA: Visual synthesis pre-training for neural visual world creation[OL].
[8]Ho J, Chan W, Saharia C, et al. Imagen video: High definition video generation with diffusion models[OL].
[9]Singer U, Polyak A, Hayes T, et al. Make-a-video: Text-to-video generation without text-video data[OL].
[10]Runway. Gen-2: The next step forward for generative AI[OL].
[11]OpenAI. Video generation models as world simulators[OL].
[12]Yanyan Z .Construction of a smart classroom for image processing courses in colleges and universities based on artificial intelligence: Taking fundamentals of photoshop as an example[A]. 2023 IEEE 3rd International Conference on Social Sciences and Intelligence Management (SSIM)[C]. Taiwan: IEEE, 2023:84-88.
[13]陳向東,趙麗娟,劉澤民.擴展學(xué)科的疆域:大模型的涌現(xiàn)能力對學(xué)習(xí)科學(xué)的影響[J].現(xiàn)代教育技術(shù),2024,(1):44-54.
[14]何聚厚,黃秀莉,韓廣新,等.VR教育游戲?qū)W習(xí)動機影響因素實證研究[J].電化教育研究,2019,(8):70-77.
[15]Pardos Z A, Bhandari S. Learning gain differences between ChatGPT and human tutor generated algebra hints[OL].
[16]張銘銳,閆志明,孫銘璐,等.教師知識圖譜:人工智能賦能教師專業(yè)發(fā)展的必由之路[J].現(xiàn)代教育技術(shù),2023,(8):38-47.
[17]Lin Z,Shujuan X. Optimization of classroom teaching quality based on multimedia feature extraction technology[J]. International Journal of Web-Based Learning and Teaching Technologies (IJWLTT), 2024,(1):1-11.
[18]Ahmed K K, Jumaili A A A. Adopting video assignments as a tool to improve first-year pharmacy students class engagement[J]. Annales Pharmaceutiques Francaises, 2024,(2):263-270.
[19]鐘紹春.人工智能支持智慧學(xué)習(xí)的方向與途徑[J].中國電化教育,2019,(7):8-13.
[20]杜華,孫艷超.聲稱是人工智能浪潮下知識觀的再審視——兼論兩個經(jīng)典知識之問的當代回應(yīng)[J].現(xiàn)代教育技術(shù),2024,(1),96-106.
[21]張學(xué)義,范阿翔.基于技術(shù)成熟度曲線的人工智能審視[J].科學(xué)技術(shù)哲學(xué)研究,2019,(2):14-19.
[22]楊宗凱,王俊,吳砥,等.ChatGPT/生成式人工智能對教育的影響探析及應(yīng)對策略[J].華東師范大學(xué)學(xué)報(教育科學(xué)版),2023,(7),26-35.
[23]曹培杰,謝陽斌,武卉紫,等.教育大模型的發(fā)展現(xiàn)狀、創(chuàng)新架構(gòu)及應(yīng)用展望[J].現(xiàn)代教育技術(shù),2024,(2):5-12.
[24]UNESC0. Guidance for Generative Al in Education and Research[OL].
[25]杜靜,黃榮懷,李政璇,等.智能教育時代下人工智能倫理的內(nèi)涵與建構(gòu)原則[J].電化教育研究,2019,(7):21-29.
[26]胡小勇,黃婕,林梓柔,等.教育人工智能倫理:內(nèi)涵框架、認知現(xiàn)狀與風(fēng)險規(guī)避[J].現(xiàn)代遠程教育研究,2022,(2):21-28、36.
[27]邢露元,沈心怡,王嘉怡.生成式人工智能訓(xùn)練數(shù)據(jù)風(fēng)險的規(guī)制路徑研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2024,(1):10-18
[28]苗逢春.生成式人工智能技術(shù)原理及其教育適用性考證[J].現(xiàn)代教育技術(shù),2023,(11):5-18.
[29]劉明,吳忠明,廖劍,等.大語言模型的教育應(yīng)用:原理、現(xiàn)狀與挑戰(zhàn)——從輕量級BERT到對話式ChatGPT[J].現(xiàn)代教育技術(shù),2023,(8):19-28.
[30]黃榮懷,張國良,劉夢彧.面向智慧教育的技術(shù)倫理取向與風(fēng)險規(guī)約[J].現(xiàn)代教育技術(shù),2024,(2),13-22.
[31][34]劉明,吳忠明,廖劍,等.大語言模型的教育應(yīng)用:原理、現(xiàn)狀與挑戰(zhàn)——從輕量級BERT到對話式ChatGPT[J].現(xiàn)代教育技術(shù),2023,(8):19-28.
[32]陳子君.大數(shù)據(jù)賦能基層監(jiān)督的互構(gòu)邏輯——基于“技術(shù)-信息-組織”的理論視角[OL].
[33]楊建武,羅飛燕.類ChatGPT生成式人工智能的運行機制、法律風(fēng)險與規(guī)制路徑[OL].
Text-To-Video Model Sora for Education and Teaching: Opportunities and Challenges
CHEN Cong-Cong1LI Chen2[Corresponding Author]WANG Ya-Fei3,4
(1. Information Technology Center, Tsinghua University, Beijing, China 100084; 2.College of Physical Education,
Xinjiang Normal University, Urumqi, Xinjiang, China 830054; 3. School of Education, Shanghai Normal University,
Shanghai, China 200234; 4. iFLYTEK Educational Technology Institute, Hefei, Anhui, China 230088)
Abstract: At present, the influence of artificial intelligence technology in the field of education has gradually become prominent, and the exploration of a new teaching model of “Artificial Intelligence + Education” has become the research hotspot in the field of education. Recently, the emergence of Text-To-Video model Sora, has received widespread attention, although the future impact of Sora on education and teaching is unknown, the trend of introducing intelligent technology to promote the high-quality development of education and teaching has been unstoppable. Therefore, this paper sorted out the technical evolution of Text-To-Video model, introduced the basic situation of mainstream Text-To-Video model, and explained the origin and application advantages of Sora. Accordingly, the opportunities brought by Soras integration into education and teaching were analyzed, which mainly manifested in enriching teaching resources, enhancing immersive teaching experience and innovating interactive methods. At the same time, the main challenges of integrating Sora into education and teaching were discussed from four aspects of technology maturity, teachers and students technical literacy, ethical safety risks, supervision and governance system, in order to promote the application of Sora in education and teaching, and provide reference for carrying out education and teaching supported by intelligent technology.
Keywords: Sora; artificial intelligence; intelligent education; large language models
作者簡介:陳聰聰,編輯,碩士,研究方向為編輯出版、教育技術(shù)等,郵箱為chencongcong@tsinghua.edu.cn。
收稿日期:2024年3月15日
編輯:小米