楊燕
2021年是元宇宙元年,元宇宙概念的火爆帶動(dòng)了數(shù)字人市場的快速升溫。
數(shù)字人正成為一股潮流,涌入人們的日常生活——虛擬美妝達(dá)人柳夜熙,抖音出道三天點(diǎn)贊即超百萬,一夜之間成為國內(nèi)虛擬偶像界的“頂流”;在江蘇衛(wèi)視跨年演唱會(huì)上,昔日歌后鄧麗君“重返”舞臺(tái),與歌手周深同臺(tái)對(duì)唱,交織幾代人的青春記憶;20多位數(shù)字人同臺(tái)亮相冬奧會(huì),擔(dān)當(dāng)手語主播、氣象主播、奧林匹克公益宣傳大使等角色……
數(shù)字人的熱度吸引著眾多參與者入局,企查查數(shù)據(jù)顯示,國內(nèi)現(xiàn)有數(shù)字人相關(guān)企業(yè)超過28萬家,近5年的新增注冊(cè)企業(yè)增速復(fù)合增長率達(dá)到近60%。
與此同時(shí),資本也在不斷涌入數(shù)字人賽道。據(jù)天眼查數(shù)據(jù),2021年全年,數(shù)字人相關(guān)投資共27筆,融資金額從數(shù)百萬元人民幣到數(shù)千萬美元不等。2022年開年不到一個(gè)月時(shí)間,數(shù)字人領(lǐng)域即完成了近百起融資,累計(jì)額度超過4億元人民幣。
來源:商湯智能產(chǎn)業(yè)研究院
數(shù)字人市場的熱度不減,技術(shù)驅(qū)動(dòng)和需求牽引也是助力的關(guān)鍵。數(shù)字人的核心是“人”,本質(zhì)上是通過數(shù)字技術(shù)提高數(shù)字人的綜合體驗(yàn),使之帶來真人般的感受和互動(dòng)。
一方面,隨著人工智能、虛擬現(xiàn)實(shí)、高精度渲染等技術(shù)的發(fā)展和融合,數(shù)字人的擬人化程度愈來愈高,從形象、表情、姿態(tài)、動(dòng)作,再到語音、語意、語態(tài)等方方面面,正在逐步逼近真人水平。
另一方面,人工智能技術(shù)在數(shù)字人形象生成、動(dòng)作驅(qū)動(dòng)和語言交互等環(huán)節(jié)的深入應(yīng)用,也將進(jìn)一步提升數(shù)字人制作的自動(dòng)化水平,推動(dòng)數(shù)字人市場從利基走向大眾。
在需求側(cè),流量經(jīng)濟(jì)和人口紅利都面臨增長瓶頸,對(duì)生產(chǎn)力效率與成本提出了更多要求。數(shù)字人的高度擬人化代替真人角色進(jìn)入生產(chǎn)生活各個(gè)領(lǐng)域,將為Z時(shí)代新消費(fèi)市場,以及產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型構(gòu)筑巨大的想象空間和應(yīng)用前景。據(jù)頭豹研究所測算,2030年我國數(shù)字人整體市場規(guī)模將達(dá)到2700億元。
數(shù)字人的擬人化,以及制作的自動(dòng)化程度高低,反映數(shù)字人系統(tǒng)整體進(jìn)化和發(fā)展水平,代表著數(shù)字技術(shù)綜合運(yùn)用能力和成熟度。根據(jù)擬人化和自動(dòng)化兩個(gè)維度,我們可以將數(shù)字人分成L1-L5五個(gè)等級(jí)。
其中,我們將L4和L5等級(jí)的數(shù)字人統(tǒng)稱為“AI數(shù)字人”。“他們”不僅具備高度的擬人化呈現(xiàn),在形象、動(dòng)作和智力層面都更接近于真人水平,能夠聽懂、看懂,有記憶、自學(xué)習(xí),可與人進(jìn)行自然交互。同時(shí),在制作流程中也融合了大量的人工智能算法技術(shù)來提升數(shù)字人的生產(chǎn)效率,降低數(shù)字人的制作成本。只有達(dá)到L4級(jí)別及以上的數(shù)字人,才能真正在消費(fèi)和產(chǎn)業(yè)領(lǐng)域大放異彩。
首先,在應(yīng)用層面,多模態(tài)交互是AI數(shù)字人的核心力。
具備足夠自然和擬真的多模態(tài)交互能力,是數(shù)字人在更廣泛的應(yīng)用場景中逐步替代真人角色的關(guān)鍵。所謂“多模態(tài)交互”,即將深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)圖形學(xué)相結(jié)合,充分模擬人與人之間自然真實(shí)的交互方式,實(shí)現(xiàn)“聽得懂,看得見,說得出”的人機(jī)交互效果。
來源:商湯智能產(chǎn)業(yè)研究院
擁有多模態(tài)交互能力的AI數(shù)字人,不僅能夠呈現(xiàn)傳統(tǒng)語音對(duì)話無法展現(xiàn)的多媒體信息,通過結(jié)合視覺AI技術(shù),還能完成身份識(shí)別、手勢(shì)識(shí)別、情感識(shí)別等多項(xiàng)交互任務(wù),讓交互過程更加豐富且高效。與此同時(shí),可視化的寫實(shí)形象也賦予了AI數(shù)字人獨(dú)特的情感溫度,有助于建立人性化的情感紐帶。
其次,在價(jià)值層面,自主學(xué)習(xí)是AI數(shù)字人的創(chuàng)造力。
每一個(gè)AI數(shù)字人背后都有一個(gè)“最強(qiáng)大腦”,可以基于自然語言處理、知識(shí)圖譜等技術(shù),結(jié)合不同領(lǐng)域的知識(shí)庫和海量數(shù)據(jù)訓(xùn)練,進(jìn)行深度學(xué)習(xí)和自我迭代,讓自己變得越來越“聰明”,越來越專業(yè),從而能夠快速適應(yīng)瞬息萬變的市場變化和細(xì)分化的場景需求,不斷打破既有的應(yīng)用邊界,持續(xù)創(chuàng)造新價(jià)值和新體驗(yàn)。
第三,在制作層面,AIGC是AI數(shù)字人的生產(chǎn)力。
高制作成本和長制作周期,掣肘數(shù)字人產(chǎn)業(yè)規(guī)?;l(fā)展。傳統(tǒng)流程中,每一個(gè)數(shù)字人依賴人工“雕琢”而成。其中,僅3D建模就要花費(fèi)數(shù)月時(shí)間。打造一個(gè)高精度、高保真的3D數(shù)字人形象,動(dòng)輒需要百萬規(guī)模的資金投入。
AI重塑生產(chǎn)流程,輔助數(shù)字人自動(dòng)化生成,是AI數(shù)字人生產(chǎn)力之本,可以加速數(shù)字人生產(chǎn),降低制作門檻和成本投入。例如,商湯科技為軟銀大會(huì)打造的軟銀COO今井康之的AI數(shù)字人形象,就是基于少量照片的面部掃描,結(jié)合AI算法快速生成數(shù)字人高精度3D模型,將傳統(tǒng)3-6個(gè)月的制作周期縮短至到僅僅15天。
根據(jù)使用目的和底層邏輯不同,AI數(shù)字人的發(fā)展大致可分為三大應(yīng)用方向。
方向一:主要以創(chuàng)建IP影響力或打造粉絲經(jīng)濟(jì)為目的,包括虛擬偶像、虛擬KOL、虛擬演員、虛擬主播等。
基于“IP孵化+內(nèi)容運(yùn)營”,賦予“他們”獨(dú)特的人設(shè)和人格特質(zhì),以此來吸引不同受眾群體的關(guān)注,從而形成一定規(guī)模的流量基礎(chǔ)和情感鏈接。再通過諸如直播帶貨、跨界品牌代言、IP授權(quán)周邊衍生品、娛樂演藝等多種手段,實(shí)現(xiàn)價(jià)值閉環(huán)或進(jìn)行商業(yè)化變現(xiàn)。
相對(duì)真人IP,數(shù)字人IP的可塑性更強(qiáng)。包括形象、人設(shè)及背景故事的創(chuàng)作自由度為數(shù)字人IP的商業(yè)創(chuàng)新帶來了更大的想象空間,重塑粉絲經(jīng)濟(jì)。
例如,可邀請(qǐng)用戶或粉絲一起參與數(shù)字人IP的創(chuàng)建和孵化過程,通過“共創(chuàng)”的方式建立起IP與用戶間的強(qiáng)情感關(guān)聯(lián),讓IP更具真實(shí)感和生命力。尤其在品牌自建數(shù)字人IP路徑中,契合品牌調(diào)性和消費(fèi)者心理預(yù)期的數(shù)字人IP,更有利于品牌理念的有效傳遞和快速破圈,進(jìn)而獲得更多收益。同時(shí),數(shù)字人IP也更具可控性,不會(huì)受到人設(shè)崩塌、負(fù)面新聞、檔期或合約問題等不確定性因素影響,商業(yè)安全性和穩(wěn)定性高。
方向二:主要以替代真人服務(wù)、實(shí)現(xiàn)降本增效為目的,包括虛擬客服、虛擬前臺(tái)、虛擬導(dǎo)游、虛擬主持人等。
“他們”能夠“7×24小時(shí)”在崗不間斷地提供服務(wù)支持,尤其針對(duì)標(biāo)準(zhǔn)化、重復(fù)性高的真人服務(wù)可以實(shí)現(xiàn)數(shù)字化替代,并結(jié)合業(yè)務(wù)流程自動(dòng)化,幫助企業(yè)進(jìn)一步提高生產(chǎn)效率、降低人工服務(wù)成本,為企業(yè)數(shù)字化轉(zhuǎn)型提供新路徑。
相對(duì)真人服務(wù),AI數(shù)字人具有較高的靈活度,不受主觀、時(shí)間、環(huán)境或外界不確定因素影響,企業(yè)可控性強(qiáng),可以保證服務(wù)的穩(wěn)定性和連續(xù)性,也能降低企業(yè)因不確定性所帶來的隱性成本問題。
來源:商湯智能產(chǎn)業(yè)研究院
同時(shí),AI數(shù)字人的邊際效益遞增現(xiàn)象顯著。一方面,雖然前期數(shù)字人制作需要一定投入,但數(shù)字資產(chǎn)復(fù)制使用的邊際成本很低,單個(gè)數(shù)字人的可變成本也低于真人;另一方面,AI數(shù)字人具有較強(qiáng)的自主學(xué)習(xí)能力,結(jié)合知識(shí)圖譜技術(shù)和數(shù)據(jù)訓(xùn)練,可以不斷優(yōu)化服務(wù)精度、擴(kuò)展業(yè)務(wù)廣度,從而提升企業(yè)數(shù)字人力資產(chǎn)的投入產(chǎn)出效率。
方向三:隨著人工智能及相關(guān)技術(shù)的逐步成熟,通過自主學(xué)習(xí)和認(rèn)知泛化,AI數(shù)字人將會(huì)全面突破應(yīng)用邊界,升級(jí)成為數(shù)字世界的超級(jí)助手。
與前兩個(gè)應(yīng)用方向不同,AI數(shù)字人的第三大應(yīng)用方向不僅遵循真實(shí)世界的“替代”邏輯,初衷更在于滿足用戶與數(shù)字世界的連接和交互需求,實(shí)現(xiàn)對(duì)于數(shù)字世界的直接操作。這些數(shù)字人將成為我們?cè)跀?shù)字世界的AI代理人。通過與“他們”的直接交互,可以“隨機(jī)應(yīng)變”的針對(duì)用戶個(gè)性化、多樣化需求,提供全天候、全方位的人性化陪伴和智能化服務(wù),成為人們通向虛實(shí)融合世界的超級(jí)入口。
無論哪個(gè)應(yīng)用方向,對(duì)于數(shù)字人產(chǎn)業(yè)而言都將是一個(gè)千億級(jí)規(guī)模的潛力市場。那么,如何組織資源和生態(tài),推動(dòng)數(shù)字技術(shù)在數(shù)字人產(chǎn)業(yè)中的應(yīng)用和發(fā)展,提高數(shù)字人的生產(chǎn)效率和數(shù)字人的智能水平,將會(huì)是一個(gè)重要命題。