孫柏林
(中國自動化學會專家咨詢委員會,北京 100000)
世界主要國家競相將發(fā)展數(shù)字經(jīng)濟作為搶抓新一輪科技革命和產(chǎn)業(yè)變革新機遇的重要抓手,紛紛制定并出臺戰(zhàn)略和規(guī)劃,加快構(gòu)建國家競爭新優(yōu)勢,搶占國際競爭制高點。日前,國務(wù)院印發(fā)《“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃》(以下簡稱《規(guī)劃》),從頂層設(shè)計上明確了我國數(shù)字經(jīng)濟發(fā)展的總體思路、發(fā)展目標、重點任務(wù)和重大舉措,是“十四五”時期推動我國數(shù)字經(jīng)濟高質(zhì)量發(fā)展的行動綱領(lǐng)。
“發(fā)展數(shù)字經(jīng)濟意義重大,是把握新一輪科技革命和產(chǎn)業(yè)變革新機遇的戰(zhàn)略選擇?!秉h的二十大報告提出“加快發(fā)展數(shù)字經(jīng)濟,促進數(shù)字經(jīng)濟和實體經(jīng)濟深度融合,打造具有國際競爭力的數(shù)字產(chǎn)業(yè)集群”的任務(wù)。數(shù)字經(jīng)濟的崛起與繁榮,賦予了經(jīng)濟社會發(fā)展的“新領(lǐng)域、新賽道”和“新動能、新優(yōu)勢”,正在成為引領(lǐng)中國經(jīng)濟增長和社會發(fā)展的重要力量。
數(shù)字經(jīng)濟是新一輪科技革命的必然產(chǎn)物,數(shù)字經(jīng)濟是全球未來的發(fā)展方向。習近平同志強調(diào):“以信息化,培育新動能,用新動能,推動新發(fā)展!而數(shù)字人則是數(shù)字經(jīng)濟發(fā)展的一種“新動能”。隨著科技發(fā)展的一日千里,“數(shù)字人”已經(jīng)變得觸手可及。
“十四五”規(guī)劃提出,要發(fā)展戰(zhàn)略性新興產(chǎn)業(yè),推動互聯(lián)網(wǎng)+、大數(shù)據(jù)、人工智能等同各產(chǎn)業(yè)深度融合。在此背景下,百度研究院推測,2021年,數(shù)字人、虛擬人將大批量出現(xiàn),生命科學成為 AI應(yīng)用新領(lǐng)地,各行各業(yè)加速轉(zhuǎn)型。
隨著人工智能、虛擬現(xiàn)實等技術(shù)的發(fā)展和融合,數(shù)字人正在以高度擬人化進入生產(chǎn)、生活各個領(lǐng)域,將彰顯數(shù)字經(jīng)濟發(fā)展的“新動能”,為 Z 時代新消費市場,以及產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型構(gòu)筑巨大的想象空間和應(yīng)用前景。
2021年,稱得上的是元宇宙元年。而隨著元宇宙概念的大熱,也讓虛擬數(shù)字人的發(fā)展獲得飛躍式提升,從外觀數(shù)字化逐漸深入到行為的交互化、思想的智能化。以虛擬主播、虛擬偶像、虛擬員工等為代表的數(shù)字人成功進入大眾視野,并以多元的姿態(tài)在影視、游戲、傳媒、文旅、教育、醫(yī)療、訓練、金融等眾多領(lǐng)域大放異彩。
許多專家認為,“未來10年,數(shù)字/虛擬人將全面進入人們的工作、家庭和生活,你會擁有數(shù)字人同事、數(shù)字人家人和數(shù)字人朋友。”,“未來在生活和工作當中,必將有大規(guī)模的數(shù)字人與人類共存。”專家認為:“虛擬數(shù)字人,是開啟元宇宙的先鋒,是通往元宇宙的船票?!?/p>
所謂“數(shù)字人”,是指將人體的組織形態(tài)結(jié)構(gòu)、物理功能、生理功能實現(xiàn)數(shù)字化,相當于人體的“活地圖”。所謂虛擬數(shù)字人,就是由計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成等計算機手段創(chuàng)造及使用,并具有多重人類特征(外貌特征、人類表演能力、人類交互能力等)的綜合產(chǎn)物。實現(xiàn)了現(xiàn)實與虛擬的對比結(jié)合。
根據(jù)百度網(wǎng)“科普中國·科學百科”的解釋,狹義的數(shù)字人,是利用信息科學對人體進行虛擬仿真,是一種信息科學與生命科學融合的產(chǎn)物,最終目的是建立多學科、多層次的數(shù)字模型,達到對人體從微觀到宏觀的精確模擬。廣義的數(shù)字人,是指數(shù)字技術(shù)在人體解剖、物理、生理及智能的各個層次、各個階段的滲透。
虛擬數(shù)字人概念最早起源于1990年的日本動漫,是通過繪畫、動畫、CG技術(shù)等,在虛擬或現(xiàn)實場景中實現(xiàn)非真人的形象。2018年之前,受限于技術(shù)瓶頸、內(nèi)容單向輸出等因素,大部分虛擬數(shù)字人并未出現(xiàn)特別大的破圈的狀態(tài),虛擬和真實世界的屏障一直難以逾越。近年來,伴隨CG、人工智能、動態(tài)捕捉等科學技術(shù)的不斷進步,數(shù)字人的互動性和社交屬性不斷增強,虛擬和真實的邊界逐漸消弭,也開始受到行業(yè)各方的關(guān)注。
“數(shù)字人”的概念在美國首次提出則是在2011年,隨后開始在全球流行并一躍成為最炙手可熱的詞語之一。2018年,在新華社新媒體上出現(xiàn)了由AI合成的虛擬主播,國家電網(wǎng)山東濟南營業(yè)廳也出現(xiàn)了數(shù)字人——“國網(wǎng)機器人”。2019年,百度與浦發(fā)銀行聯(lián)手打造的國內(nèi)首個虛擬數(shù)字員工“小浦”正式上崗,虛擬數(shù)字人開始出現(xiàn)在越來越多的地方。
據(jù)介紹,中國在 2001 年立項“數(shù)字人”項目,中國科學院聯(lián)合眾多國內(nèi)頂尖醫(yī)學院校共同進行了技術(shù)攻關(guān)。數(shù)字人公司在 2008 年加入研發(fā)團隊,承擔中國“數(shù)字人”的三維重建,于 2015年開發(fā)出中國“數(shù)字人解剖系統(tǒng)”,打破國外“數(shù)字人”技術(shù)壟斷。產(chǎn)品一經(jīng)面世,就在全國 400多家醫(yī)學院校和醫(yī)師培訓中心得到應(yīng)用。據(jù)了解,在打破了國外壟斷之后,中國“數(shù)字人解剖系統(tǒng)”開始走向國際市場,今年將在北美、北歐、中亞、東亞等區(qū)域?qū)崿F(xiàn)布局。
速途元宇宙研究院發(fā)布的《2022虛擬人產(chǎn)業(yè)研究報告》中指出,虛擬人本質(zhì)上是以數(shù)字形式存在的,具有人類的外觀行為,甚至思想特征的虛擬形象。
數(shù)字人是具有人類的外觀、行為甚至思想等特征,以數(shù)字形式存在的虛擬形象。數(shù)字人既包括基于某個知名人物生成的孿生型數(shù)字人,也可以是完全憑空設(shè)計的原生型數(shù)字人??偱_在2022年北京冬奧會期間上線了原生型的手語虛擬主播,“央視頻”平臺在今年的兩會報道中推出了基于真人評論員的孿生型數(shù)字人,抖音、騰訊、阿里等其他互聯(lián)網(wǎng)平臺也紛紛推出各自的數(shù)字人形象,虛擬數(shù)字人技術(shù)正在迎來發(fā)展熱潮。
那么,數(shù)字人到底是什么,具有哪些特征,分為哪幾種類型,以及都應(yīng)用在什么行業(yè)呢?
在當下數(shù)字技術(shù)手段的支撐下,虛擬數(shù)字人已經(jīng)可以模擬真人的會話、表情和動作,在各種不同的場景進行交互應(yīng)用。數(shù)字人需要具有感知力、學習力、有溫度、可進化等智能化特征。
從去年至今,大量虛擬數(shù)字人在各種場景中頻繁上崗亮相,替代了一部分真人的簡單重復(fù)的工作……
數(shù)字人具有哪些特征?其市場價值、產(chǎn)業(yè)生態(tài)和發(fā)展趨勢如何?諸多業(yè)內(nèi)人士力圖從,認知、生態(tài)、能力、實踐和展望等維度展現(xiàn)數(shù)字人發(fā)展的未來圖景。
新一輪科技革命和產(chǎn)業(yè)變革加速發(fā)展,大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等數(shù)字技術(shù)向經(jīng)濟社會各領(lǐng)域廣泛滲透,引發(fā)生產(chǎn)生活方式和產(chǎn)業(yè)生態(tài)的革命性變革。數(shù)字經(jīng)濟帶來了新的就業(yè)形態(tài)、新的創(chuàng)業(yè)形態(tài)和新的經(jīng)濟生態(tài),為老百姓獲取收入提供了新方式、新途徑。而數(shù)字人則賦于數(shù)字經(jīng)濟發(fā)展的“新動能”,值得人們關(guān)注。
了解了什么是數(shù)字人,接下來就要搞清楚數(shù)字人的原理,它到底是怎么說話、互動的,是背后有真人在操控,還是完全通過技術(shù)生成?顯而易見,數(shù)字人能否走遠,核心在技術(shù)。數(shù)字人的誕生發(fā)展和AI人工智能密不可分,想了解數(shù)字人的運作原理,首先要知道數(shù)字人的通用系統(tǒng)框架。數(shù)字人系統(tǒng)一般情況下由人物形象、語音生成、動畫生成、音視頻合成顯示、交互等5個模塊構(gòu)成,其中交互模塊為擴展項,根據(jù)其有無,可將數(shù)字人分為交互型數(shù)字人和非交互型數(shù)字人。
“數(shù)字人的擬人化以及生產(chǎn)制作的自動化程度,反映數(shù)字人系統(tǒng)整體進化和發(fā)展水平,代表著數(shù)字技術(shù)綜合運用能力和成熟度體現(xiàn)?!鄙虦萍紨?shù)字空間事業(yè)群數(shù)字文娛事業(yè)部總經(jīng)理欒青認為,根據(jù)“擬人化”和“自動化”兩個維度,可以將數(shù)字人分成 L1-L5五個等級。
“其中,人們將L4和L5 等級的數(shù)字人統(tǒng)稱為AI數(shù)字人?!睂<艺f,“只有達到L4級別及以上的數(shù)字人,才能真正地走入千行百業(yè),在消費和產(chǎn)業(yè)領(lǐng)域大放異彩?!?/p>
從產(chǎn)品技術(shù)趨勢看,未來數(shù)字人都將是由AI驅(qū)動內(nèi)容生成,多模態(tài)AI技術(shù)是核心;交互會越來越智能;形象越來越逼真,由擬人到類人到同人。從行業(yè)應(yīng)用趨勢看,未來幾年將是人類員工與數(shù)字人并存的方式,AI輔助/支持人類進行工作。從產(chǎn)業(yè)落地趨勢看,AI數(shù)字人將以平臺工具的形式輸出,賦能各行各業(yè);在數(shù)字人平臺型公司以外,數(shù)字人運營賽道也有可能產(chǎn)出獨角獸。從整體發(fā)展趨勢看,未來另一高潛力賽道將是演藝型數(shù)字人。
“數(shù)字人的下一步,將逐步聚焦到‘數(shù)字人的大腦’的升級,大腦的智能性提升,能夠幫助虛擬人拓展到更多開放領(lǐng)域,為社會帶來更多價值。”專家說,當前數(shù)字人的發(fā)展面表現(xiàn)為多種類型百花齊放,各個賽道在技術(shù)上快速迭代升級,但數(shù)字人的“大腦”仍存在很大升級空間,如情緒理解、智能問答、自然交互等。
從最小的范疇說起,虛擬數(shù)字人具備三方面的特征:
一是擁有類人的外觀,具有特定的相貌、性別和性格;
二是擁有類人的行為,能夠用語言、面部表情和肢體動作進行“自我”表達;
三是擁有類人的思考方式,能夠識別外部環(huán)境,并與人交流互動。
綜合來看,就是具備四方面的能力,即形象能力、感知能力、表達能力和娛樂互動能力。如果我們下次再看到有新的虛擬數(shù)字人,就可以結(jié)合這些特征和能力來判斷這個虛擬數(shù)字人的可信度。
專家指出:目前,我國數(shù)字人技術(shù)全面落地應(yīng)用還面臨很多挑戰(zhàn),要想數(shù)字人被安全、穩(wěn)定地生產(chǎn)并給社會帶來商業(yè)價值,以下幾方面亟待突破:
一是由于目前 AI 技術(shù)還處于發(fā)展的早期階段,數(shù)字人雖然外表像人,但是數(shù)字人在自己的表情管理、感知互動等方面缺乏親和力,其內(nèi)核跟真人相距甚遠。
二是數(shù)字人制作成本高昂,制作周期也比較長,并且效果無法保證。如何實現(xiàn)虛擬數(shù)字人的快速生成、低成本大量復(fù)制、高頻次內(nèi)容產(chǎn)出是其規(guī)?;瘧?yīng)用的關(guān)鍵。
三是數(shù)字人研發(fā)人才短缺,導致市面上難以出現(xiàn)相對較好的產(chǎn)品。
四是數(shù)字人形象 IP、故事 IP、品牌 IP的權(quán)利歸屬尚存法律空白,也存在著內(nèi)容違規(guī)、版權(quán)糾紛、肖像侵權(quán)、隱私泄露、網(wǎng)絡(luò)成癮、數(shù)據(jù)安全等風險。
五是隨著人工智能等相關(guān)技術(shù)的不斷精進及其在數(shù)字人形象生成、動作驅(qū)動、語言交互等環(huán)節(jié)應(yīng)用的不斷深入,數(shù)字人將更智能化和平民化。
2021年以來,虛擬“數(shù)字人”市場快速升溫,多家科技企業(yè)發(fā)布了“數(shù)字人”相關(guān)產(chǎn)品。近日,百度發(fā)布國內(nèi)首個可在APP內(nèi)互動的超寫實“數(shù)字人”。此前,阿里巴巴開發(fā)的超寫實“數(shù)字人”AYAYI正式“入職”阿里,成為天貓超級品牌日的數(shù)字主理人;OPPO發(fā)布的基于虛擬人多模態(tài)交互的手機智能助手,可實現(xiàn)與用戶在多個場景生態(tài)下實時交互;B站專門為虛擬主播開設(shè)分區(qū)。不知不覺,虛擬“數(shù)字人”已經(jīng)開始走進我們的生活。
“數(shù)字人應(yīng)用目前可大致分為3種類型:真人分身、模擬員工和虛擬偶像。
從去年至今,大量虛擬數(shù)字人在各種場景中頻繁上崗亮相,替代了一部分真人簡單重復(fù)的工作。數(shù)字/虛擬人是多維度人工智能的組合技術(shù),也是數(shù)字經(jīng)濟發(fā)展下各場景效率提升、體驗提升的重要支撐能力,應(yīng)用場景將越來越普遍。
數(shù)字人的應(yīng)用場景眾多!下面舉例說明之。
1)擬人化的應(yīng)用
近日,“數(shù)字梅蘭芳”大師復(fù)現(xiàn)項目啟動儀式在北京梅蘭芳大劇院舉行。由北京理工大學參與研制的全國首個高精度京劇數(shù)字人“梅蘭芳孿生數(shù)字人”在儀式現(xiàn)場亮相。
該項目以京劇大師梅蘭芳先生26歲時的模樣為原型,對其進行復(fù)現(xiàn)。項目由中央戲劇學院、北京理工大學共同發(fā)起,騰訊公司提供技術(shù)支持,受到“北京高校卓越青年科學家”計劃資助,并得到了多家單位和梅蘭芳先生家人及弟子的大力支持。
江蘇衛(wèi)視2022跨年演唱會的虛擬人“鄧麗君”;
2021年萬科總部最佳新人獎的數(shù)字人員工“崔筱盼”;
冬奧會期間,央視主播王冰冰的虛擬形象在《冰冰帶你說冬奧》專屬H5中亮相;
北京冬奧會中,具“AI虛擬與教練系統(tǒng)”雙重身份的“觀君”,輔助運動員徐夢桃、齊廣璞雙雙摘得金牌,成為超級自然虛擬人對運動員輔助訓練的成功案例。在這屆冬奧會期間,多款虛擬數(shù)字人亮相,包括由百度智能云提供支持的央視新聞AI手語虛擬主播,騰旭3D手語數(shù)智人“聆語”,以及AI虛擬氣象主播“馮小殊”等,虛擬數(shù)字人也因此更多的被大眾知道。
2022年“兩會”期間,央視“冠察兩會”欄目中,超仿真主持人王冠就是真實主持人王冠的數(shù)字人“分身”。
比如,虛擬VUP洛天依,她是國內(nèi)最早的虛擬歌手,連續(xù)幾年登上央視;虛擬KOL翎Ling,中央電視臺推出的臺網(wǎng)互動少年團選秀節(jié)目《上線吧!華彩少年》中的虛擬學員;明星虛擬形象干喵,天貓首位品牌代言人易烊千璽的虛擬人物。
2)企業(yè)上的應(yīng)用
“過往行業(yè)普遍認為,AI being的應(yīng)用場景很窄,基本就是娛樂、偶像、代言人等領(lǐng)域。其實并非如此。包括企業(yè)數(shù)字化轉(zhuǎn)型、體育、金融等各類垂直領(lǐng)域的應(yīng)用場景,AI being同樣可以實現(xiàn)落地。”有專家強調(diào),小冰在誕生之初,就更關(guān)注人工智能在擬合人類情商維度的發(fā)展,強調(diào)人工智能情商而非任務(wù)完成在人機交互中的基礎(chǔ)價值。
小冰進入金融、汽車、內(nèi)容生產(chǎn)、體育等垂直領(lǐng)域,聚焦于人工智能和人類的協(xié)同,并非硬性地替代人類,而是將AI交互體驗滲透到行業(yè)關(guān)鍵應(yīng)用場景中,滿足行業(yè)對AI應(yīng)用和數(shù)字化轉(zhuǎn)型的各種業(yè)務(wù)創(chuàng)新需求,推動‘有溫度的’產(chǎn)業(yè)化升級?!?/p>
“商湯 AI 數(shù)字人面向全行業(yè)提供企業(yè)級解決方案,目前已落地金融網(wǎng)點、手機銀行、購物中心、黨建展廳、政務(wù)前臺、品牌營銷、智慧車艙等多個場景?!睓枨嗯e例,廣州新塘的永旺夢樂城與商湯聯(lián)合打造了超寫實型 AI 數(shù)字人“小糖”,其在客服咨詢、導航導購等方面,回答準確率超過 90%。初步估計,在客服環(huán)節(jié)至少能夠幫助商場節(jié)約 50% 以上的人力成本。
“6月中旬,作為人機交互底座的科大訊飛AI虛擬人交互平臺1.0,通過中國信通院首批數(shù)字人系統(tǒng)基礎(chǔ)能力評測,獲得數(shù)字人領(lǐng)域的權(quán)威標準認證。”科大訊飛虛擬人平臺業(yè)務(wù)線總經(jīng)理郜靜文介紹,目前,科大訊飛AI虛擬人已經(jīng)在媒體、金融、醫(yī)療、教育、文旅、文娛、企業(yè)、政務(wù)等多場景應(yīng)用,虛擬人使用企業(yè)和開發(fā)者超過上千家。基于訊飛開放平臺生態(tài),未來該交互平臺將發(fā)揮更大的數(shù)字經(jīng)濟價值。
事實上,AI虛擬數(shù)字人此前就已經(jīng)在各個領(lǐng)域被應(yīng)用,包括虛擬KOL、虛擬偶像、明星虛擬形象、虛擬模特、虛擬主播。數(shù)字人更重要的是重塑商業(yè)模式,元宇宙賦予了虛擬數(shù)字人新的活力,數(shù)字人連同數(shù)字藏品一起,背后是元宇宙統(tǒng)領(lǐng)下的生產(chǎn)力與生產(chǎn)關(guān)系的脈搏,帶來新一輪的IP孵化與商業(yè)化,數(shù)字人及其人機交互有望得到變革與重塑。
企業(yè)機構(gòu)數(shù)字人
企業(yè)機構(gòu):企業(yè)展廳、運營商營業(yè)廳、銀行網(wǎng)點、線下零售店
①智能迎賓,通過AI虛擬客服,實現(xiàn)“面對面”的問題咨詢,覆蓋天氣、交通等技能,也可支持客戶自定義業(yè)務(wù)問題,如樓盤信息等;
②企業(yè)宣傳,一體機具備廣告機功能,在展廳支持多個企業(yè)和產(chǎn)品視頻廣告片的循環(huán)播放,展示企業(yè)和品牌形象;
③信息發(fā)布,通過后臺系統(tǒng)針對多臺機器進行信息通知發(fā)布,觸達各級網(wǎng)點。
3)公共場所數(shù)字人
公共場所:車站、機場、地鐵站、旅游景點、電教館、博物館
①咨詢導引,為客戶面對面提供業(yè)務(wù)咨詢辦理服務(wù),如附近交通、火車、航班查詢、地鐵車次查詢、景點介紹、實時天氣情況、博物館展品介紹等。
②廣告宣傳,通過視頻、文字等形式,展示車站、旅游景點等信息,傳播公共服務(wù)理念和人文精神。
4)政府機構(gòu)數(shù)字人
政府機構(gòu):辦事窗口、政務(wù)大廳、宣傳部門
①智能客服,一體機通過AI智能客服“面對面”進行業(yè)務(wù)咨詢,提供業(yè)務(wù)辦理流程、辦理材料、辦理問題的回答,顯著降低辦事人員的接待量,提高服務(wù)效率、提升整體的服務(wù)接待體驗;
②黨政宣傳,通過在辦事大廳、政務(wù)大廳放置一體機,進行黨政建設(shè)信息宣傳、最新政務(wù)動態(tài)、黨政宣傳片的視頻宣傳。
5)教育界的數(shù)字人
通過對與數(shù)字人相關(guān)的國內(nèi)外文獻及案例的梳理與分析,發(fā)現(xiàn)數(shù)字人的發(fā)展給教育帶來了極大的沖擊。數(shù)字人的發(fā)展給教育帶來了機會,如虛擬教師構(gòu)建個性化學習環(huán)境、虛擬學生實現(xiàn)像人一樣學習和思考、虛擬學伴陪伴并指導用戶學習、虛擬教育主播可以面向社會群體傳播知識、虛擬導游可以提高社會教育的趣味性和靈活性,激活了教育元宇宙的生態(tài)。國內(nèi)學者對教育數(shù)字人的研究尚少,在知網(wǎng)上以“教育數(shù)字人”為關(guān)鍵詞檢索出的相關(guān)文獻為0篇,以“教育數(shù)字人”為主題檢索出的相關(guān)文獻僅18篇,且缺乏對其應(yīng)用的分析與總結(jié)?;诖耍P者在對教育數(shù)字人的概念、特征與技術(shù)分析的基礎(chǔ)上,從學校教育型數(shù)字人和社會教育型數(shù)字人兩方面剖析其應(yīng)用及國內(nèi)外相關(guān)案例,對教育數(shù)字人所面臨的挑戰(zhàn)及實施建議進行了分析總結(jié),以期為數(shù)字人促進教育發(fā)展提供思路,推動數(shù)字人與教育的初步融合發(fā)展邁向創(chuàng)新發(fā)展階段。
教育數(shù)字人是教育元宇宙的敲門磚,其教育性、交互性、虛擬性和擬人性對增強教育元宇宙的真實感、互動感和沉浸感具有非常重要的作用。
[教育數(shù)字人的概念]
教育元宇宙為教育相關(guān)主體創(chuàng)建數(shù)字身份,實現(xiàn)真實人和數(shù)字人的教育交互。文獻[8]從狹義上講,教育元宇宙是基于VR等智能技術(shù)實現(xiàn)讓人沉浸式教與學的虛擬世界;從廣義上講,教育元宇宙涵蓋了數(shù)字教育世界的所有概念,包括當前的互聯(lián)網(wǎng)+教育和未來虛實融合的數(shù)字化教育世界,而在這個教育世界中最重要的主體是真實人和數(shù)字人。教育數(shù)字人是計算機通過復(fù)制或模擬真實世界中教育主體的體格而生成的實體,可以擺脫與人類身體互動相關(guān)的物理、空間和時間限制,與其他真實或虛擬對象、人或系統(tǒng)進行交互。簡言之,教育數(shù)字人意指具有數(shù)字化外形的與教育息息相關(guān)的虛擬人物,不僅擁有人的外觀、行為和思想,還具有識別外界環(huán)境、與人交流互動的能力。教育數(shù)字人有兩種主要類型——教育數(shù)字人化身(由人控制)和教育虛擬代理(由計算機控制)。教育數(shù)字人化身是由實時用戶控制的教育數(shù)字人,集成了人體生理、心理、生物力學等特征,能夠?qū)⒄鎸嵔逃澜绲膭幼鳌⒁鈭D和想法遷移到虛擬世界中。教育虛擬代理是由計算機程序創(chuàng)建并控制的教育數(shù)字人,用于支持真實教育主體與虛擬環(huán)境的交互[9]。
[教育數(shù)字人的特征]
第一,教育數(shù)字人具有教育性[12]。在高度仿真的虛擬教學場景中,師生能打破時空限制,通過控制虛擬化身以具身認知體驗和沉浸式體驗的方式進行情境性、探究性的學習活動和交互,形成虛擬人、教師和學生數(shù)字孿生體三位一體的局面,相比傳統(tǒng)教學方式效率更高、互動性更強,空間成本、時間成本被顛覆性降低,教育效率被顛覆性提升。如虛擬教師除了可以模擬真人教師的姿態(tài)、形象、行為和表情之外,還可以完成既定的教學任務(wù),展現(xiàn)高度擬人化的虛擬教師形象。虛擬學生也可以理解人的想法,實現(xiàn)像人一樣學習和思考,主動生成符合用戶需求的互動,直觀、全面地捕捉人的需求。第二,教育數(shù)字人具有交互性。教育數(shù)字人可以在教育元宇宙中和真實人類傳遞信息。根據(jù)信息傳輸?shù)姆较?,教育?shù)字人與人類的交互可以分為三類:①信息可以從人傳遞到教育數(shù)字人來指導真實的人在虛擬教育環(huán)境中的動作(人→教育數(shù)字人),如清華大學虛擬學生華智冰唱歌;②信息的傳遞可以從人到教育數(shù)字人再到人(人→教育數(shù)字人→人),如虛擬教育主播播報新冠疫情防控通知等。第三,信息可以通過教育數(shù)字人從一個人傳遞給另外一個人(人A→教育數(shù)字人A→教育數(shù)字人B→人B),如A同學和B同學使用ASOUL平臺通過數(shù)字人進行學術(shù)交流和互動。教育數(shù)字人的交互性極大地促進了教育的情感感知與強交互,替代真實的教育相關(guān)者完成許多真人完成不了的教育任務(wù)[7]。③教育數(shù)字人具有虛擬性。教育數(shù)字人打破了物理空間和虛擬空間的界限,教育主體通過虛擬化身,在教育元宇宙中獲得全息化臨場感,如瞬間傳送或物體重力下落等。教育數(shù)字人的沉浸性有三種方式,分別是空間、時間和情感沉浸。首先,教育數(shù)字人的生成伴隨著對用戶的感知系統(tǒng)的數(shù)字化復(fù)刻,這意味著真實的人通過教育數(shù)字人可以在虛擬空間中獲得身臨其境的體驗;其次,教育數(shù)字人不會衰老,擺脫了時間的限制,這種自主性極大提高了對教育用戶的吸引力;再次,用戶通過教育數(shù)字人進行交互,產(chǎn)生情感共鳴,進而收獲情感沉浸[10]。第四,教育數(shù)字人具有高度擬人化的特點,擁有人的外觀及性格特征。教育數(shù)字人無論是微表情、發(fā)質(zhì),還是膚質(zhì),做到對真實人的還原,且教育數(shù)字人可以根據(jù)不同的光影條件做出對應(yīng)的渲染和模擬,擁有貼近真正的教育相關(guān)者的虛擬形象。教育數(shù)字人被賦予了獨特的人物個性和飽滿的情感,在形象、言談舉止等方面無限接近于真實的教育相關(guān)者。
“數(shù)字人作為數(shù)字世界的基本組成之一,同樣面臨數(shù)據(jù)安全和網(wǎng)絡(luò)安全等治理挑戰(zhàn)?!睂<抑赋?,尤其當數(shù)字人在生產(chǎn)生活中的滲透性愈來愈高強、扮演越來越重要的角色時,其系統(tǒng)安全性將變得極為重要。此外,數(shù)字人作為人機交互媒介,同樣也會在日常應(yīng)用中涉及用戶隱私和倫理問題。這些都需要通過建立一系列監(jiān)管和保障機制,并輔助技術(shù)手段予以解決。
數(shù)字浪潮下,各種新業(yè)態(tài)、新模式不斷涌現(xiàn)。
因數(shù)字而變,因數(shù)字而興。展望未來,一系列新的數(shù)字應(yīng)用加速走來,數(shù)字中國迎來更廣闊的發(fā)展前景。虛擬數(shù)字人最終將走向人性化。數(shù)字引領(lǐng)新格局,一起向未來!
市場研究機構(gòu)量子位智庫發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)報告》預(yù)計,到2030年,我國虛擬人整體市場規(guī)模將達到2700億元,當前虛擬人產(chǎn)業(yè)處于前期培育階段。受訪專家提示,要警惕虛擬人在學習過程中將偏見與惡意“反哺”給人類。此外,人類可能會到達一個臨界點,即跟虛擬人互動的時間達到甚至超過跟真人互動的時間,有些人可能會沉浸于虛擬世界,或者從虛擬人身上尋找主要的情感依托,也可能引發(fā)一系列社會問題。
在不遠的未來,無論是在現(xiàn)實世界還是影視、游戲作品中,AI數(shù)字人、AI智能體都將無處不在,為我們增添娛樂體驗、帶來便捷服務(wù)、實現(xiàn)效率提升,深刻改變我們的生活和工作方式。白皮書指出,隨著人工智能、虛擬現(xiàn)實等相關(guān)技術(shù)的逐步成熟,通過深度學習和認知泛化,AI數(shù)字人將會全面突破應(yīng)用邊界,升級成為數(shù)字世界的“超級助手”。
相關(guān)數(shù)據(jù)顯示,預(yù)計2030年虛擬數(shù)字人市場規(guī)模將到達2700億元。其中,身份型虛擬人將在未來發(fā)展中占據(jù)主導地位達到約1750億元,服務(wù)型虛擬數(shù)字人則相對穩(wěn)定發(fā)展,總規(guī)模也將超過950億元。
作為元宇宙世界里的重要角色,虛擬數(shù)字人成為了2022年的最大風口。元宇宙為未來世界帶來無限可能性,虛擬數(shù)字人則被視為未來人們進入元宇宙的入口。虛擬偶像、虛擬主播、虛擬員工不斷涌現(xiàn)在人們視野中,虛擬數(shù)字人開始布局各種可能性賽道,越來越多的行業(yè)正在打造自己的虛擬數(shù)字人形象。
2022年6月28日,市場調(diào)研機構(gòu) IDC發(fā)布的《中國AI數(shù)字人市場現(xiàn)狀與機會分析,2022》報告顯示,中國AI數(shù)字人市場規(guī)模呈現(xiàn)高速增長趨勢,預(yù)計到2026年將達102.4億元。報告指出,政策、應(yīng)用價值、市場需求、資本支出、技術(shù)成熟正合力推動AI數(shù)字人市場崛起。
2030年我國虛擬人市場將達到2700億元,目前仍處于發(fā)展的初期階段。我國數(shù)字人起步雖晚,但發(fā)展迅速,正在全球范圍帶頭落實數(shù)字人運營管理規(guī)范、建立虛擬數(shù)字人評估體系、打造科學權(quán)威評測方法并積極探索商業(yè)模式并推動數(shù)字人在各行業(yè)中應(yīng)用。但仍不能忽視的是,目前在數(shù)字人的制作、培育以及應(yīng)用方面,技術(shù)和數(shù)字人倫理的探討力度及其成果,相比國外產(chǎn)業(yè)組織仍有待提高。
目前,數(shù)字人的制作方式自動化程度還很低,生產(chǎn)門檻又很高,關(guān)鍵技術(shù)還不完全成熟。下一步,相關(guān)廠商和行業(yè)會繼續(xù)加大關(guān)鍵核心技術(shù)的創(chuàng)新,降低數(shù)字人的生產(chǎn)制作成本,提高對數(shù)字人面部和聲音的還原度,推進數(shù)字人開放平臺建設(shè),增強技術(shù)可及性,最終實現(xiàn)更加自然、逼真的互動體驗。
隨著技術(shù)的進一步成熟以及元宇宙等新興概念的落地,數(shù)字人應(yīng)用有望越來越豐富,未來發(fā)展前景廣闊。在數(shù)字化發(fā)展浪潮中把握新機遇、應(yīng)對新挑戰(zhàn)、塑造新優(yōu)勢。當然,我們也不應(yīng)當忘記虛擬數(shù)字人的種種風險。
“當前世界百年變局和世紀疫情交織疊加,新一輪科技革命和產(chǎn)業(yè)變革深入推進,推動數(shù)字化轉(zhuǎn)型日益成為順應(yīng)世界之變、時代之變、發(fā)展之變的重要任務(wù)。”
希望人們在發(fā)展中把準方向,在變革中搶抓先機,不斷提高數(shù)字技術(shù)技能和數(shù)字經(jīng)濟思維,爭做數(shù)字經(jīng)濟的創(chuàng)新者、數(shù)字經(jīng)濟的先行者,在追潮弄潮中實現(xiàn)人生價值。
最后,我想到牛頓說過:把簡單的事情考慮得很復(fù)雜,可以發(fā)現(xiàn)新領(lǐng)域;把復(fù)雜的事情看得很簡單,可以發(fā)現(xiàn)新定律。在數(shù)字人領(lǐng)域同樣如此!
隨著技術(shù)進步,虛擬人潮流將如何演變,值得期待。