国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字人:人機(jī)交互的革命

2022-11-02 03:58小康中國(guó)小康網(wǎng)孫媛媛
小康 2022年30期
關(guān)鍵詞:千言鄧麗君虛擬世界

文|《小康》·中國(guó)小康網(wǎng) 孫媛媛

數(shù)字栩生CEO宋震

不斷擴(kuò)展 目前,數(shù)字人在服務(wù)行業(yè)場(chǎng)景的覆蓋面大,但參與程度還不深,隨著技術(shù)進(jìn)步,其應(yīng)用廣度和深度將不斷擴(kuò)展。攝影/寧穎

隨著虛擬數(shù)字人在關(guān)鍵平臺(tái)上的運(yùn)用,它在許多行業(yè)里發(fā)揮了重要作用,虛擬數(shù)字人引發(fā)了人們對(duì)它的好奇與關(guān)注。與模擬機(jī)器人相比,虛擬數(shù)字人在形象、表達(dá)和理解層面漸漸貼近日常生活,那么,現(xiàn)如今的虛擬數(shù)字人可以為我們做什么?它具體應(yīng)用于哪些領(lǐng)域以及具備哪些優(yōu)勢(shì)呢?國(guó)內(nèi)領(lǐng)先的超寫實(shí)數(shù)字人創(chuàng)作平臺(tái)—數(shù)字栩生CEO宋震有著他的專業(yè)解答。

以AI技術(shù)為驅(qū)動(dòng),實(shí)現(xiàn)數(shù)字人“千人千面”

數(shù)字栩生是一家掌握光場(chǎng)重建核心技術(shù)的數(shù)字人垂直領(lǐng)域硬核科技公司,成立僅一年多,團(tuán)隊(duì)成員大部分都是90后?,F(xiàn)有30多位員工,以技術(shù)團(tuán)隊(duì)為主,公司剛完成由聯(lián)想創(chuàng)投領(lǐng)投、藍(lán)色光標(biāo)和蔚領(lǐng)時(shí)代跟投的Pre A輪融資?!拔覀兎浅?春肁I和數(shù)字人的結(jié)合,以AI技術(shù)賦能數(shù)字人的各個(gè)環(huán)節(jié),實(shí)現(xiàn)與NLP(自然語(yǔ)言處理,Natural Language Processing)系統(tǒng),甚至大模型系統(tǒng)的對(duì)接,為他們的AI能力提供數(shù)字人接口和數(shù)字人服務(wù),我們主要的研究都聚焦在數(shù)字小腦上,用數(shù)字小腦去驅(qū)動(dòng)數(shù)字人,讓數(shù)字人不再是千篇一律,而是千人千面,每個(gè)數(shù)字人都有自己的獨(dú)立個(gè)性和特征。”

在宋震看來,數(shù)字人需要有自己的思想,能夠思考問題,能夠?qū)W習(xí)?!拔覀儼雅cAI系統(tǒng)連接驅(qū)動(dòng)數(shù)字人的中臺(tái)叫數(shù)字小腦,它跟真實(shí)人類的腦結(jié)構(gòu)是一樣的,大腦是負(fù)責(zé)理性思考,也就是現(xiàn)在NLP部分。它只負(fù)責(zé)理性思考,產(chǎn)生不了感情,但是人在交流過程中,更多的是很多帶感情色彩的溝通,而不是冷冰冰的理性?!北热纭澳阏鎵摹边@句話,從不同人嘴里說出來,以及面對(duì)不同的對(duì)象說,意義完全不同,而AI大腦只能理解這三個(gè)字的表面意義,理解不了其情感意義,做不到深度的思考。

“數(shù)字人的理性知識(shí)具備了,但距離感情交流還比較遠(yuǎn)。我們認(rèn)為未來數(shù)字人應(yīng)該是帶感情交流的獨(dú)立個(gè)體,他不光有視覺、聽覺,還應(yīng)有觸覺、嗅覺。”有了視覺之后,他早上打招呼可以很自然地表達(dá):“嘿,你今天穿這件衣服真漂亮!”比如嗅覺,“好香!你今天噴的什么香水?”但目前的數(shù)字人交互是做不到的,AI大腦停留在知識(shí)層面的邏輯思考。“他可以下圍棋,贏過世界冠軍,但是談戀愛肯定不如一個(gè)普通人那樣富有情感?!?/p>

“當(dāng)數(shù)字人具有了視覺和嗅覺,有了人類五官的這些功能之后,他才有可能更像一個(gè)人,但現(xiàn)在他還是一臺(tái)思考和工作的機(jī)器?!彼握鹛寡?,目前的技術(shù)只負(fù)責(zé)把人還原出來?!拔覀儾蛔鯝I的大模型系統(tǒng),比較樂觀地看,未來三到五年還會(huì)有一些更好的成果出現(xiàn)。我們看到一些內(nèi)測(cè),如果咱們之間隔著一塊布互相看不到彼此的時(shí)候,我可能并不知道我在跟AI聊天,現(xiàn)在能做到聊二三十個(gè)話題都不會(huì)露餡?!?/p>

業(yè)內(nèi)人士表示,數(shù)字人在可控性、可編程性和規(guī)模成本等方面具有優(yōu)勢(shì)。目前,數(shù)字人在服務(wù)行業(yè)場(chǎng)景的覆蓋面大,但參與程度還不深,隨著技術(shù)進(jìn)步,其應(yīng)用廣度和深度將不斷擴(kuò)展。據(jù)宋震介紹,數(shù)字人目前有做主持人、主播、游戲里的演員,以及服務(wù)型的場(chǎng)景,比如金融、保險(xiǎn)類的客服,問題和回答標(biāo)準(zhǔn)化,沒有太多個(gè)性化內(nèi)容,是AI比較好的應(yīng)用落地場(chǎng)景。

“我們的愿景是以數(shù)字技術(shù)構(gòu)建人性光芒,幫助用戶創(chuàng)造價(jià)值,讓人機(jī)交互不再是冷冰冰的屏幕,為生活帶來更多美好的情感?!睌?shù)字栩生CEO宋震表示。

改變?nèi)藱C(jī)互動(dòng)模式,讓交流更有情感

互聯(lián)網(wǎng)剛興起的時(shí)候,流行一句話叫:“網(wǎng)上聊天的時(shí)候,你不知道對(duì)方是不是一條狗。”隨著未來虛擬人越來越真實(shí),越來越規(guī)模化之后,成本也越來越低?!坝辛嗣李佭@些功能以后,我們看到的已經(jīng)不是真實(shí)世界里的那個(gè)人了。像抖音、快手這樣的平臺(tái),我們不知道視頻背后的人真實(shí)的模樣,潛移默化中接受了虛擬人的存在。比如,我希望我的家人永生,而他是可以活在虛擬的世界里的,我想他的時(shí)候就可以和他聊天,而這在技術(shù)上是可以實(shí)現(xiàn)的。如果數(shù)字人能夠提供足夠的情感價(jià)值,那么我為什么非要跟真人談戀愛呢?”宋震表示,數(shù)字人可能會(huì)改變現(xiàn)有社會(huì)的運(yùn)行規(guī)則,也會(huì)帶來很多哲學(xué)和倫理問題,“現(xiàn)實(shí)世界里如果同時(shí)跟三個(gè)人談戀愛,肯定不道德,但在虛擬世界里,同時(shí)跟十個(gè)虛擬人談戀愛,我是不是不道德的?所以,數(shù)字人現(xiàn)在只是開始,未來十年會(huì)迎來屬于它的黃金階段。”

春草是今年8月剛推出來數(shù)字人,她是一名高三女生,18歲,正處青春期,叛逆,卻積極陽(yáng)光,熱愛攀巖運(yùn)動(dòng),是小有成績(jī)的運(yùn)動(dòng)員,她鼻子上的傷疤,是第一次參加攀巖錦標(biāo)賽時(shí)留下的印記,是一個(gè)熱血元?dú)獾呐?。這是由蔚領(lǐng)時(shí)代和海西傳媒合作開發(fā)的中國(guó)數(shù)字人演員,智能數(shù)字面部技術(shù)從渲染到算法,由數(shù)字栩生研發(fā)制作,從采集原型的50多個(gè)表情,到拆分成400多個(gè)子表情,自動(dòng)綁定系統(tǒng)后,再組合成2000多個(gè)微妙表情,最后通過AI支配實(shí)現(xiàn)動(dòng)態(tài)呈現(xiàn),通過AI交互實(shí)驗(yàn)不同情境的演繹。

“春草的定位除了游戲里的角色之外,導(dǎo)演可以直接跟這個(gè)演員互動(dòng)講戲,然后讓她現(xiàn)場(chǎng)表演。春草是在我們的光場(chǎng)采集錄影棚里制作的,采用了我們獨(dú)有的面部支持技術(shù),能夠讓演員直接驅(qū)動(dòng)春草,進(jìn)行表演,導(dǎo)演能直接看到結(jié)果,這個(gè)技術(shù)是顛覆性的?!彼握鸾榻B說。

之前的數(shù)字人完成面部表情捕捉之后,導(dǎo)演不能直接看到結(jié)果,需要精修、渲染。但是春草在表演時(shí),可以實(shí)現(xiàn)實(shí)時(shí)的互動(dòng),作為演員,她能聽到導(dǎo)演的指令。“春草的誕生標(biāo)志著實(shí)時(shí)驅(qū)動(dòng)的數(shù)字人能進(jìn)入到表演環(huán)節(jié)了。以前的數(shù)字人更多是功能性的,做一個(gè)主播,或者服務(wù)員,情緒表達(dá)沒有那么強(qiáng)烈。但演戲需要技術(shù),而且是一種人工智能的技術(shù)?!?/p>

數(shù)字手語(yǔ)主持人“千言”是數(shù)字栩生的另一個(gè)成功案例,她可以實(shí)現(xiàn)電視轉(zhuǎn)播手語(yǔ)的自動(dòng)生成,可以完成從漢語(yǔ)到手語(yǔ)、手語(yǔ)到漢語(yǔ)的雙向翻譯,實(shí)現(xiàn)聽障聾人群的信息無障礙交流。千言現(xiàn)在已經(jīng)簽了幾百家電視臺(tái),做手語(yǔ)主播,還有一些教育場(chǎng)景,比如給聾啞人進(jìn)行教學(xué)的時(shí)候使用。此外,還有政府的無障礙通道,如果聾啞人去辦事,千言可以擔(dān)任AI翻譯。

“通過計(jì)算機(jī)模仿聽障人士的大腦,將播報(bào)文本輸入進(jìn)系統(tǒng)中,千言便可進(jìn)行實(shí)時(shí)手語(yǔ)播報(bào)。除了實(shí)時(shí)手語(yǔ)播報(bào),千言還能演唱三山五園歌曲、跳手語(yǔ)舞蹈?!彼握鸾榻B,千言是和千博信息公司合作的,“千博信息是國(guó)內(nèi)非常領(lǐng)先的AI公司,主要是把我們說的話翻譯成聾啞人能夠理解的手語(yǔ),我們覺得這個(gè)素材特別好,通過數(shù)字人實(shí)現(xiàn)對(duì)殘疾人的關(guān)心和幫助,用數(shù)字人技術(shù)提高他們的生活質(zhì)量。”

國(guó)內(nèi)首創(chuàng)微表情AI生成,提升情緒表達(dá)

“AI大腦”實(shí)現(xiàn)自然語(yǔ)言處理、知識(shí)管理、對(duì)話系統(tǒng)等功能,并實(shí)現(xiàn)對(duì)多個(gè)業(yè)務(wù)系統(tǒng)的實(shí)時(shí)連接,提供人機(jī)交流的主題邏輯功能。 “AI小腦”實(shí)現(xiàn)基于深度學(xué)習(xí)的個(gè)性化數(shù)字人動(dòng)作表情自動(dòng)生成,為人機(jī)交流提供更自然的交互體驗(yàn)。

AI小腦就是人和數(shù)字人的交互轉(zhuǎn)化成文本或是音頻,能夠自動(dòng)翻譯成個(gè)性化的表情和動(dòng)作。宋震介紹,“我們?cè)诳脆圎惥@個(gè)虛擬人的時(shí)候,就發(fā)現(xiàn)她不光是用鄧麗君的聲音在說話,還有一些她本人的小調(diào)皮的表情和動(dòng)作,可以跟人開玩笑,給人感覺仿佛是在和鄧麗君說話。這就是深度學(xué)習(xí)在語(yǔ)言領(lǐng)域的一種處理方法,只要上傳一段鄧麗君的聲音,經(jīng)過訓(xùn)練之后,再開口講話,就變成鄧麗君的聲音了?!睌?shù)字栩生引入了“AI小腦”理念,為現(xiàn)有AI大腦平臺(tái)與虛擬人的驅(qū)動(dòng)間搭建“橋梁”,豐富了虛擬人的信息靈敏度與范圍,也將語(yǔ)音和文字信息轉(zhuǎn)化為帶有情感的、可聽可視的信息,為虛擬人“注入”情感,解決現(xiàn)有數(shù)字人感情表達(dá)不真實(shí)的問題。

學(xué)習(xí)思考 數(shù)字栩生CEO宋震在接受采訪時(shí)表示,數(shù)字人需要有自己的思想,能夠思考問題,能夠?qū)W習(xí)。攝影/寧穎

人的表情非常復(fù)雜。人類在長(zhǎng)達(dá)十幾萬年的進(jìn)化過程中,養(yǎng)成了人的眼睛對(duì)表情的敏感度非常高,我們可以從一個(gè)微妙的表情,就能感受到他人所傳遞出來的情緒。“人臉的復(fù)雜性體現(xiàn)在40多塊肌肉,能組合出來5000多種不同的表情。沒經(jīng)過表演訓(xùn)練的人可能做不出來那么多表情。表情不光是可視化的符號(hào),還是可以傳遞很多信息的內(nèi)容?!疑鷼饬恕?,可以通過表情馬上就能看出來。前幾年我們所有的科研方向都聚焦在怎么真實(shí)地再現(xiàn)和表達(dá)表情。”

光場(chǎng)采集,是數(shù)字栩生為了采集到真實(shí)個(gè)人的表情專門制作的一套設(shè)備?!氨热缯f采集人的50個(gè)表情,我們會(huì)把它拆成將近500個(gè)表情,然后讓這些表情再運(yùn)動(dòng)起來,又能組合出來幾千種表情,以期達(dá)到傳遞很微妙信息的效果,能夠非常真實(shí)地再現(xiàn)人臉的表情。即便是經(jīng)過專業(yè)訓(xùn)練演員也不過如此了?!彼握鹬v述說,前幾年,在采集表情的時(shí)候,幾乎采了北京電影學(xué)院表演系的所有學(xué)生,因?yàn)樗麄兪苓^表演訓(xùn)練,能夠做出更豐富、更準(zhǔn)確的表情,能夠更精準(zhǔn)地傳達(dá)自己的情緒,“就是我們俗話說的表演級(jí)表情?!?/p>

表情采集之后,用數(shù)字栩生自有的一套算法,重建三維模型,做表情的重建,包括表情的拆分和組合,一整套技術(shù)組合以后,才能得到一個(gè)面部栩栩如生的人。

“數(shù)字人的動(dòng)作則使用動(dòng)作捕捉技術(shù)來呈現(xiàn),這是一套比較成熟的技術(shù)體系,從好萊塢電影技術(shù)中萌發(fā)和誕生,迄今為止已經(jīng)發(fā)展幾十年了。我們目前的研究重點(diǎn)是使用AI技術(shù)自動(dòng)生成動(dòng)作,也取得了不少成果。每次動(dòng)作都用捕捉的方式,復(fù)雜而且困難,如果自動(dòng)生成,就變成一種自動(dòng)化的動(dòng)作。”

數(shù)字人無法實(shí)時(shí)交互的話,就缺少了很多應(yīng)用場(chǎng)景,只能用于生產(chǎn)視頻,因此數(shù)字栩生的研究方向就是生產(chǎn)能夠?qū)崟r(shí)交互數(shù)字人。“只有在數(shù)字人能實(shí)現(xiàn)交互以后,他才可以干很多事情,脫離了原來的偶像身份,走進(jìn)千家萬戶了。這是一種跨時(shí)代的新技術(shù),在國(guó)內(nèi)也是先進(jìn)的?!?/p>

宋震介紹,目前公司的幾個(gè)聯(lián)合創(chuàng)始人,背景都跟虛擬世界相關(guān),他個(gè)人的主要研究方向是仿真,研究怎么把世界虛擬化,而合伙人則分別是研究VR、AR的?!霸趺丛谔摂M世界里去做更沉浸的交互,共同點(diǎn)就是虛擬世界。五六年前,我們發(fā)現(xiàn)了一個(gè)痛點(diǎn),虛擬世界里的人質(zhì)量很差,傳遞不了、也表達(dá)不了任何的東西,就是個(gè)假人。如果想達(dá)到非常真實(shí)的交互,需要付出的代價(jià)非常大,周期長(zhǎng)、成本高,鄧麗君這一版的數(shù)字人做了兩年。這樣的話,如果想進(jìn)行大規(guī)模的商業(yè)化是不可能的。我們就圍繞著這個(gè)痛點(diǎn),想著怎么在虛擬世界里做好一個(gè)能交互的高真實(shí)的數(shù)字人。數(shù)字人的真實(shí)度的追求是無止境的,所以目前數(shù)字栩生鎖定的客戶主要是要求更高的類型,“未來我們?cè)诓粩嗟靥岣撸瑫r(shí)也努力降低數(shù)字人的生產(chǎn)成本,讓更多的人能用上,需求和成本之間更加匹配。”

從產(chǎn)業(yè)發(fā)展來看,數(shù)字人現(xiàn)在才剛剛嶄露頭角,其實(shí)人最喜歡的是人和人的交互?!拔也⒉徽J(rèn)為數(shù)字人是臺(tái)機(jī)器,對(duì)人機(jī)交互來講,它是一場(chǎng)革命。”宋震說。

“我們的愿景是以數(shù)字技術(shù)構(gòu)建人性光芒,幫助用戶創(chuàng)造價(jià)值,讓人機(jī)交互不再是冷冰冰的屏幕,為生活帶來更多美好的情感?!彼握鸨硎緯?huì)持續(xù)致力于改變?nèi)藱C(jī)交互的方式,“目前,我們跟手機(jī)、電腦的交互是沒有感情的,希望將來在AI技術(shù)的支持下,跟機(jī)器交互的時(shí)候,實(shí)現(xiàn)情感的連接和流動(dòng),讓更加真實(shí)的數(shù)字人參與進(jìn)我們的生活。”

猜你喜歡
千言鄧麗君虛擬世界
蓮花水鄉(xiāng)雜詠(錄一)
全球首發(fā)!“酒是這樣——鄧麗君品牌酒上市發(fā)布會(huì)”盛大舉行
“南京鄧麗君”李家華:唱著“君歌”走世界
話過千言氣自強(qiáng)
鄧麗君的清邁“小城故事”
任時(shí)光匆匆流去,我只在乎你 陳佳《又見鄧麗君》
虛擬世界和真實(shí)世界的紐帶
送別
虛擬世界大門正啟
擁抱虛擬 珍惜現(xiàn)實(shí)
南通市| 郑州市| 陆川县| 永善县| 璧山县| 南靖县| 灵武市| 七台河市| 措美县| 横峰县| 布拖县| 东乌珠穆沁旗| 三江| 敖汉旗| 克什克腾旗| 玉林市| 卢龙县| 女性| 永定县| 吉水县| 克什克腾旗| 湘潭县| 焦作市| 河津市| 嘉义县| 新宁县| 寿阳县| 平顶山市| 根河市| 夹江县| 尚志市| 蕲春县| 高清| 大安市| 雷波县| 阿拉善右旗| 宾阳县| 平凉市| 临江市| 万载县| 闽侯县|