肖文杰
以Deep Fake為主的開源算法,讓“換臉”變得普及。
“眼見為實”這句話流傳到今天,已經沒法算作真理了。從最初的“PS美顏”“PS美景”開始,針對視覺的“造假”技術不斷精進。2017年,一位開發(fā)者把一款名為DeepFake的AI換臉算法開源,自此互聯(lián)網界掀起了一股換臉創(chuàng)作熱潮。許多視頻博主將電影中的演員換臉,為自己的賬號吸引流量,甚至有很多開發(fā)者制作了一鍵換臉App,供用戶下載使用。
然而這股技術狂歡很快走向“失控”。有人將色情電影中的人臉換成女明星,對明星的聲譽造成了困擾;在美國,網上還出現(xiàn)多位總統(tǒng)換臉演講的惡搞新聞視頻,使得政治輿論一度受到干擾。如果你認為這些“翻車”離自己很遠,還有一種更為直觀的可怕場景—假設你得罪了一名駭客,他把你的臉替換到一段犯罪視頻中,隨后,這段視頻被當作司法證據(jù)。
“有研究發(fā)現(xiàn),大概30%的用戶觀看時鑒別不出圖像的真假,于是我們提出做換臉鑒別算法的研究?!蔽④泚喼扪芯吭焊呒壯芯繂T陳棟告訴《第一財經》雜志。2019年11月,陳棟所在的研究組提出換臉鑒別算法“Face X-Ray”,今年2月,關于這項算法技術的論文被2020年IEEE國際計算機視覺與模式識別會議(CVPR2020)收錄。
在學術界,有關換臉鑒別的算法研發(fā)其實一直十分活躍,大多數(shù)采用的是訓練AI分類器—搜集大量的真實人臉素材,以及這些人臉被某種算法換臉的素材,用自監(jiān)督學習的方法訓練AI鑒別什么樣的臉是被替換過的。這種方法的局限性在于,訓練出的AI只能基于特定的換臉算法做鑒定,只有當換臉圖像采用的是已知換臉算法,鑒別精確度才有可能達到99%;如果拿一張AI沒有學習過的換臉算法圖片去鑒別,其精度就會驟降到70%以下。大多數(shù)換臉圖片僅憑肉眼很難判斷其背后的算法,因此用“分類法”鑒定假臉并不具備通用性。
而Face X-Ray可以在不知道照片真假,以及換臉圖像采用了哪種換臉算法的背景下完成鑒定。其訓練方法是,研究員將一些真實的人臉圖像手工合成為假的人臉圖像,將真假臉的融合邊界變?yōu)橐阎?,然后利用深度學習技術讓AI學習如何找出這個邊界。最終的結果是,當AI發(fā)現(xiàn)一張陌生圖片中的臉為假臉時,會對假臉邊界發(fā)出“響應”,即在一個黑色圖像中將換臉的邊界點亮,如果是一張真實的人臉圖片,機器則不會輸出響應,顯示為一張純黑的圖像,這樣的響應過程很像給圖片照了一張“X光”。
“我們想要解決的問題是鑒別出所有換臉的圖像,包括將來會出現(xiàn)、現(xiàn)在還不存在的算法?!蔽④泚喼扪芯吭撼崭痹洪L郭百寧告訴《第一財經》雜志。
不同圖片“噪聲”不同,可能是“Face X-Ray”的算法解釋之一。
在過去很長一段時間里,微軟亞洲研究院計算機視覺組的研究員同樣用“分類法”做研究,還曾經把一種基于“分類法”的算法鑒別精度從98%提高到99.6%。后來隨著換臉技術越來越復雜多樣,研究員們便萌生了研發(fā)“通用鑒別”的想法,但一直沒有找到合適的算法路徑。直到2019年9月,研究員偶然發(fā)現(xiàn)Face X-Ray這種識別邊界的思路,可以將未知換臉算法圖片的識別精度從70%一下子提高到95%以上。
“很多時候做研究就像踢球射門,有可能你踢很多次都不進,但你必須不斷嘗試射門,才能創(chuàng)造進球的可能?!惫賹幷f。
除了通用性,F(xiàn)ace X-Ray的另一個突破是讓AI鑒別換臉具備可解釋性—用“分類法”鑒別一張人臉圖片,機器只能給出一張圖片是否被換臉的結論,并不能指出哪里被替換了,而FaceX-Ray可以將邊界標注出來。
近半年來,F(xiàn)ace X-Ray項目組成員的主要工作是提高視頻換臉鑒別的精度,具體操作方法是將視頻做逐幀的換臉鑒別,以此判斷某一片段素材的人臉真假。從造假技術上來看,視頻換臉比圖片換臉的難度高,因為造假者很難保證造假圖像的連續(xù)性—有可能前幾幀是一個人,后幾幀又變了一個人。另一個陳棟正在研究的突破點是,當視頻被換臉時,圖像的光照會出現(xiàn)抖動,研究員們也許可以通過檢測這種抖動來提高鑒別算法的精度。“我們希望能在今年把這個技術研究出來?!标悧澱f。
即便實現(xiàn)了多項突破,也并不意味著FaceX-Ray就是萬能的。
Face X-Ray只能標注出換臉的邊界在哪,并不能說出更深層次的判斷緣由?!氨热缯婺樅图倌樣捎趤碜圆煌膱D像,這導致兩塊圖片會有不同的‘噪聲,因此被機器識別出來鑒定為假,噪聲的不同只是這個算法的解釋之一,可能也有其他的東西不同,這是神經網絡自己發(fā)掘出來的?!标悧澱f。此外,圖片的分辨率以及視頻的壓縮比也會影響AI的鑒別。如果人臉在圖片中僅占十幾個像素,或者視頻的壓縮比很高,F(xiàn)ace X-Ray的鑒別精度就會下降。再比如,如果造假者用電腦直接“無中生有”一個假臉,鑒別的精度也會降低。
Face X-Ray發(fā)現(xiàn)一張陌生圖片中的臉為假臉時,會在一個黑色圖像中將換臉的邊界點亮。
由于新的換臉技術持續(xù)涌現(xiàn),微軟亞洲研究院的科學家需要不斷用新出現(xiàn)的換臉算法圖片來訓練Face X-Ray,以保證這項鑒別技術緊跟“造假潮流”。如今有很多存有真假人臉視頻的數(shù)據(jù)庫幫助研究人員做試驗,比如FaceForensics++ 數(shù)據(jù)集,其中有1000段真實視頻和4000段被證實造假的視頻,多為新聞相關的素材。
但即便能夠鑒別出圖片被換過臉,科學家也很難單純根據(jù)Face X-Ray的鑒別結果反推換臉技術。比如很多換臉算法并不能將真假人臉上的光線統(tǒng)一,但有一種名為“alpha blending”的技術,可以把替換過的人臉部分的光線改成和原圖整體一樣,方法是利用波聲方程找到唯一的解。據(jù)陳棟介紹,目前主流的換臉算法有三類,最簡單的是將一張真實圖片的人臉貼到另一張真實圖片中;第二類是基于3D人臉技術,把一個三維人臉數(shù)據(jù)貼到另一張圖片中,再根據(jù)后者圖片原人物的姿勢、光照渲染,使之渾然一體,這一類算法目前是造假的主流;第三類是基于深層對照網絡技術,用深度學習的網絡生成人臉,如此一來假臉的豐富度會更高。
“當然,也可能有人會針對Face X-Ray的檢測算法,給換臉圖片加入一些特定的對抗措施,避免被我們檢測出來。我們不能杜絕造假,只能把造假的難度提高?!标悧澱f。鑒別假臉其實就像電子郵箱識別垃圾郵件,或者用于證明你是真人而非機器的“驗證碼”技術,“造假”和“反造假”是一場逐漸升級的貓鼠游戲,沒有完美的造假技術,也沒有完美的鑒別造假技術,況且扮演防御角色的“反造假”,在大多數(shù)情況下是被動 的。
目前Face X-Ray的檢測精度平均達到95%以上,仍處于研發(fā)狀態(tài),,還缺乏一定的“實戰(zhàn)”經驗。郭百寧的設想是,未來換臉鑒別技術可以像殺毒軟件一樣供人們自由下載,用以過濾掉搜索引擎上虛假的人臉圖片或視頻?!安贿^,技術是永遠在升級進步的,它不能完全解決一個社會問題,因此想要打擊換臉造假,僅僅精進技術是不夠的,需要相關法律的健全,以及全社會的參與?!彼f。