毒少
如果我們把voco和face2face這兩個技術合起來的話……
近日,那個開發(fā)p圖應用photoshop的adobe公司,更新了一波新品。
還發(fā)布了首個基于深度學習的平臺——「Adobe Sensei」
簡單來說,這就是ai,sensei 利用了 adobe 長期積累的大量數(shù)據(jù)和內(nèi)容,從圖片到影像,能夠幫助我們解決很多問題,將重復勞動變得自動化。
這樣你就可以在幾分鐘內(nèi)調(diào)好一個表情:Sensei 可以進行臉部自動編輯。
它可以在照片里自動查找到人臉以及人臉的各個部分,包括眉毛、嘴唇和眼睛,并且學習這些部位的位置,來讓設計師們調(diào)整照片上人的表情,而不會看起來不自然或者怪異。
的確很強大!
不過,這次真正能把我們點燃的黑科技,是它——Project VOCO。
它的厲害之處——可以根據(jù)一個人說話的錄音,合成幾乎以假亂真的任意錄音。
首先,讓voco學會你的話,你丟一段大概20分鐘的音頻讓它學。
比如這句:And ur I kissed my dogs and my wife.
你在這句中,不管調(diào)換詞的位置、添加新詞,音效完全聽不出來有任何差異,幾乎接近于完美模仿原發(fā)音者。
這簡直就是音頻編輯領域里的“Photoshop”。
那么這樣一來,真的就實現(xiàn)了“把話強加到別人身上了”……
看來柯南的變聲器差不多可以出貨了。
音頻技術能如此,那么,視頻可以無中生有么?
早在半年前,其實就已經(jīng)實現(xiàn)了。而且效果達到了可怕的真人秀級別,可以這么說——這軟件一出,視頻即將淪陷。
注意!下面你看到的——都是假的!
這是一項叫「Face2Face」的技術——能實現(xiàn)實時面部重演(Real-time Facial Reenactment)。
它可以實時捕捉使用者的表情,然后替換已有視頻中人物的表情。把一個人的臉部RGB影像,通過算法,進行采集。
然后與另一個人的RGB數(shù)值進行比對,測算臉部五官結構。
最后就可以將主角的表情和口型無縫替換。這樣就能讓他做從未做過的表情。
而你,只需要一個普通攝像頭就能實現(xiàn),甚至——可以在家?guī)蛫W巴馬在白宮開個告別演說。
還是那句話——你的思想有多遠,你就可以有多變態(tài)!
你們有沒有察覺這里面有個特別不對勁的地方——如果我們把voco和face2face這兩個技術合起來的話……
你還是你嗎?
摘編自微信公眾號“放毒”