人工智能數(shù)字衛(wèi)生工作者
可能大家都看過(guò)《阿凡達(dá)》《蜘蛛俠 II》《猩球崛起 I - III》等好萊塢的商業(yè)大片,給人們留下深刻印象的,莫過(guò)于這些電影的炫麗特效。但大多數(shù)人都是影院觀看一次,過(guò)個(gè)眼癮就完了;除非是做電影與動(dòng)畫(huà)方面的專業(yè)人才,或許也沒(méi)有太多人想去深入了解電影背后的技術(shù)。
但如果你是一名資深影迷,那么一定對(duì) CG(Computer-Generated,電腦生成)技術(shù)并不陌生。它是一種借助計(jì)算機(jī)來(lái)制作動(dòng)畫(huà)的技術(shù),大致可以分為二維動(dòng)畫(huà)(2D)和三維動(dòng)畫(huà)(3D)兩種。
電影《阿凡達(dá)》
作為“電影史上 10 大里程碑之作”之一的《阿凡達(dá)》來(lái)說(shuō),它之所以被廣大影迷稱為“奇跡之作”,除了其背后隱喻的人文爭(zhēng)議、導(dǎo)演卡梅隆進(jìn)行的多角度投入等因素之外,就是因?yàn)檫@部電影是用了 CG 動(dòng)畫(huà)的 3D 技術(shù)來(lái)拍攝的,讓人們?cè)谟^影時(shí)體驗(yàn)到了近乎完美的身臨其境的感受。
那么,這部“傳奇”電影是怎樣做到這一點(diǎn)的呢?《阿凡達(dá)》中體現(xiàn)的“里程碑”級(jí)的 3D 效果,不僅僅是因?yàn)槭褂昧俗孕醒邪l(fā)的 3D 攝像機(jī)和虛擬攝影機(jī),還在于應(yīng)用了一項(xiàng)能保留演員細(xì)致表情的技術(shù),進(jìn)一步加深了營(yíng)造電影真實(shí)感的砝碼。在此之前使用 CG 技術(shù)拍攝的電影,比如《最終幻想》等,往往因?yàn)槿宋锩娌勘砬榻┯?,讓人一眼就判斷出是用了電腦特效,從而失去了真實(shí)的沉浸感。
而《阿凡達(dá)》中角色面部表情無(wú)比真實(shí)的原因,要?dú)w功于電影制作團(tuán)隊(duì)中主要負(fù)責(zé)計(jì)算機(jī)生成面部工作的 Mark Sagar。他也因?yàn)樵凇栋⒎策_(dá)》和另一部應(yīng)用該面部表情技術(shù)的電影《金剛》中的出色工作,分別在 2010 年和 2011 年獲得了奧斯卡科技獎(jiǎng)。
Mark Sagar 副教授目前是奧克蘭大學(xué)生物工程學(xué)院動(dòng)畫(huà)技術(shù)實(shí)驗(yàn)室的主任,旨在創(chuàng)造自主互動(dòng)的動(dòng)畫(huà)系統(tǒng),助力下一代人機(jī)互動(dòng)和面部動(dòng)作技術(shù)的發(fā)展。他從構(gòu)建模仿人眼的機(jī)器開(kāi)始,目前的研究方向包括開(kāi)發(fā)結(jié)構(gòu)合理的虛擬眼睛和創(chuàng)建生物力學(xué)模擬解剖的真實(shí)模型;這將是一個(gè)通過(guò)數(shù)學(xué)和生理學(xué),將逼真的人類特征結(jié)合計(jì)算機(jī)圖像的案例。
? ?baby? ?x嘗試畫(huà)一個(gè)心形
除了學(xué)術(shù)研究之外,Mark Sagar 還聯(lián)合創(chuàng)立了一家專注于開(kāi)發(fā)具有情感響應(yīng)功能、并有著個(gè)性和特色的虛擬形象公司 Soul Machines(后文統(tǒng)稱:靈魂機(jī)器)。靈魂機(jī)器的總部位于新西蘭的奧克蘭市,由 AI 研究人員、神經(jīng)科學(xué)家、心理學(xué)家、藝術(shù)家和創(chuàng)新思想家等構(gòu)成,目前已成功為梅賽德斯奔馳、SKI-II 和索尼等公司定制了虛擬服務(wù)形象。
? ?baby? ?x? 內(nèi)部虛擬神經(jīng)系統(tǒng)
另外,值得一提的是,世界衛(wèi)生組織在 2020 年 7 月推出了首個(gè)人工智能數(shù)字衛(wèi)生工作者 Florence。這是由靈魂機(jī)器公司所開(kāi)發(fā),并得到了亞馬遜網(wǎng)絡(luò)服務(wù)和谷歌云的支持。據(jù)悉,F(xiàn)lorence 被用于駁斥關(guān)于 COVID-19 和吸煙的不實(shí)信息,并幫助吸煙者制定個(gè)性化戒煙倡議,可通過(guò)視頻或文字全天向人們提供服務(wù)。
不要以為這只不過(guò)是給一個(gè)精靈或者某個(gè)同學(xué)配上一張臉這么簡(jiǎn)單,靈魂機(jī)器實(shí)際上從 4 個(gè)方面改善了人機(jī)交互體驗(yàn):首先,其定制的形象十分逼真;其次,它所采用的數(shù)字 DNA(Digital DNA)技術(shù)可以保證迅速且規(guī)模化地創(chuàng)造及定制交互;此外,通過(guò) AI 驅(qū)動(dòng)的數(shù)字大腦還可以讓虛擬形象識(shí)別交互者的面部表情,判斷交互者的心情狀態(tài),并作出反饋,以便更深度且真實(shí)地進(jìn)行互動(dòng);最后,其做出的虛擬形象還可以在與人的互動(dòng)中不斷學(xué)習(xí),提升表現(xiàn)。
下面來(lái)看一個(gè)具體的例子—— Baby X。以自家女兒為原型,Mark Sagar 帶領(lǐng)動(dòng)畫(huà)技術(shù)實(shí)驗(yàn)室研發(fā)出一個(gè)“永生”于屏幕中的數(shù)字寶寶—— Baby X,這個(gè)寶寶可以傾聽(tīng)并對(duì)語(yǔ)言給出表情和動(dòng)作上的反饋。比如在 Baby X 在“生病難受”時(shí)、對(duì)話人不理睬她時(shí),她就會(huì)表現(xiàn)出憂傷焦躁的行為和表情。而與其交互的人則需要像在真實(shí)世界照顧幼童一樣,跟 Baby X 交流,使其“平靜下來(lái)”。
AI 寶寶會(huì)自主反應(yīng)、還會(huì)每天長(zhǎng)大
除此之外,這個(gè)數(shù)字寶寶還會(huì)對(duì)虛擬網(wǎng)頁(yè)做出反應(yīng)。比如,你可以在屏幕中看到 Baby X 正嘗試畫(huà)一個(gè)心形,或者嘗試彈虛擬鋼琴等;交互者還可以與正在行為中的數(shù)字寶寶進(jìn)行互動(dòng)。
對(duì) Baby X 內(nèi)部進(jìn)行解析,這個(gè)數(shù)字寶寶是由虛擬的神經(jīng)系統(tǒng)驅(qū)動(dòng)的,如果以虛擬透視解剖圖來(lái)進(jìn)行展示,可以看到這個(gè)虛擬的神經(jīng)系統(tǒng)控制著她的一舉一動(dòng),包括呼吸、心跳、動(dòng)作和表情等。這個(gè)系統(tǒng)的中樞,就在虛擬大腦中,主要負(fù)責(zé)控制并發(fā)出對(duì)任意傳感輸入的反饋。
AI 寶寶完全模仿人的思考模式,以及行為過(guò)程
雖然目前來(lái)看,這些形象還有很多缺陷,比如口型或表情略為僵硬等,但不可否認(rèn),靈魂機(jī)器的開(kāi)發(fā)成果看上去已經(jīng)離人類很接近了。
當(dāng)然,對(duì)于靈魂機(jī)器來(lái)說(shuō),其所在的研究領(lǐng)域也有著很大的發(fā)展空間。根據(jù) Juniper Research 的研究,到 2022 年,對(duì)話助理每年將節(jié)省 80 多億美元的成本,相比較之下,2007 年這一數(shù)字為 2000 萬(wàn)美元。另外,到 2020 年年底,聊天機(jī)器人預(yù)計(jì)將為 85% 的客戶服務(wù)互動(dòng)提供動(dòng)力。
2020 年 1 月,靈魂機(jī)器在由淡馬錫牽頭的 B 輪融資中籌集了 4000 萬(wàn)美元,參投機(jī)構(gòu)包括 Lakestar 以及現(xiàn)有投資者 Horizons Ventures、奧克蘭大學(xué)發(fā)明家基金、Salesforce Ventures 等。繼2016 年 11 月完成 750 萬(wàn)美元的 A 輪后,本次融資交易將使靈魂機(jī)器的總投資增加到近 5000 萬(wàn)美元。
在新資金的加持下,靈魂機(jī)器的技術(shù)又有了哪些突破?不論從思想靈魂的角度,還是從數(shù)字機(jī)器的層面,這家公司在未來(lái)將會(huì)如何發(fā)展?他們的聯(lián)合創(chuàng)始人 Greg Cross,將在今年的 EmTech China 全球新興科技峰會(huì)上帶你深入走進(jìn)其技術(shù)應(yīng)用的核心范圍。(摘自美《深科技》)(編輯/費(fèi)勒萌)