文| 馬迪
AI 是怎么學(xué)會畫畫的?它的作品算是藝術(shù)品嗎?以后人類畫家會失業(yè)嗎?
AI的聰明程度,早就超出了大眾的想象。
當(dāng)年AlphaGo擊敗中國棋手柯潔,人們并不十分沮喪,因為他們認為圍棋處于計算機擅長的計算領(lǐng)域,只要算力足夠大,再復(fù)雜的游戲能都被窮舉,人類的敗北在意料之中;而藝術(shù)創(chuàng)作就不同了,人類迸發(fā)的靈感、復(fù)雜的情緒、無盡的想象力,這些東西是AI永遠不可能具備的,也是人類創(chuàng)造力的最高體現(xiàn)。
然而,最近一款免費的AI作畫工具Disco Diffusion,打破了人們固有的觀念。你可以在社交網(wǎng)站上搜索“AI繪畫”,看看那些不遜于專業(yè)畫家的精彩作品!這讓人不得不深思,創(chuàng)造力真的是人類獨有的嗎?AI是怎么學(xué)會畫畫的?它的作品算是藝術(shù)品嗎?以后人類畫家會失業(yè)嗎?
人類學(xué)畫,通常是從兒童時期開始,經(jīng)歷反復(fù)練習(xí)才能逐漸掌握各種技巧,最終一筆一筆地傳達出自己的想象。但如果我們換一個思路,從AI的視角來看繪畫,又是什么樣子呢?
點、線、形、彩、構(gòu)圖、光影、虛實、透視……這些都不是重點,在AI看來,無論什么樣的圖像都只是一個由像素點構(gòu)成的矩陣,每個像素點都由紅、綠、藍三個顏色通道組成。AI繪畫相當(dāng)于一個可以逐漸產(chǎn)生像素、進行圖像生成的計算機模型。一方面,模型中要包含海量的參數(shù),比如繪畫中每一筆的位置、形狀、顏色,甚至是覆蓋關(guān)系、筆觸組合等等;另一方面,還需要基于海量的已有圖像進行訓(xùn)練,讓AI可以找到效果最好、最合適的參數(shù),輸出讓人類能夠接受的結(jié)果。
在AI領(lǐng)域中,有一項非常熱門的分支,叫做機器學(xué)習(xí),用程序模擬人類學(xué)習(xí)的過程,可以自我更新、自我進化、累積經(jīng)驗,最終形成自己的某種程序。而在機器學(xué)習(xí)中,又有一種非常熱門的方式叫生成對抗網(wǎng)絡(luò)。2014年,Ian Goodfellow提出了該模型,即設(shè)計兩個獨立的機器學(xué)習(xí)網(wǎng)絡(luò),分別為生成器和判別器。以模擬一張圖片為例,生成器不斷訓(xùn)練,目的是“模仿”出以假亂真的圖;判別器則不斷檢測,判斷出此圖是真是假。在對抗過程中,兩者都會不斷優(yōu)化,提高自己的生成能力和判別能力。這樣“左右互搏”的結(jié)果就是,最終產(chǎn)出的圖片越來越自然,也越來越真實。
對抗生成網(wǎng)絡(luò)提出后,AI的圖像生成能力有了大跨步的發(fā)展,一些有趣的APP應(yīng)運而生。像可以給線稿上色的PAIntschAIner,能夠識別線稿的內(nèi)容,比如可識別人像的皮膚、頭發(fā)、衣服等,分別涂上適當(dāng)?shù)念伾仙秶€很精準。還有能補完草稿的GauGAN,只需你用不同顏色的色塊和線條勾勒幾筆,它就可以生成完成度極高的圖像。
之所以有人將2022稱為AI繪畫元年,是因為今年的AI畫手開始井噴式地出現(xiàn)。它們有驚人的迭代速度,還有震驚世人的色彩、構(gòu)圖能力以及想象力、創(chuàng)作力。這一切似乎都在表示,AI畫手正在逐漸掌握“畫語權(quán)”。
Disco Diffusion一經(jīng)面世就刷爆了全球各大社交媒體,顛覆了很多人對AI的認知。這是一款基于谷歌的技術(shù)框架開發(fā)的AI作畫工具,能夠根據(jù)用戶的描述文字生成高質(zhì)量的畫作。它的核心技術(shù)是圖像擴散模型,也就是對自己生成的圖像進行一次又一次的“去噪”,減少無關(guān)的干擾部分,使其變得越來越清晰。這個過程就被稱為“迭代”。每次迭代時,AI會利用其圖像識別技術(shù),依據(jù)文本提示對現(xiàn)有的圖像擴散模型進行評估,并為其提供下次迭代的“方向”。就這樣AI生產(chǎn)的圖像會和文本提示的匹配度越來越高,圖像的精細度也會逐漸增加。
在包括很多專業(yè)畫手在內(nèi)的人們眼里,AI生成的畫作是非常驚人的,甚至可以說擁有一定的藝術(shù)感,尤其是其所展現(xiàn)的“想象力”,幾乎是將手伸到了人類認為只有自己才能做到的領(lǐng)域。這不免引起了很多人的擔(dān)憂:人類畫家會不會被AI所取代?
就像攝影技術(shù)誕生200年,仍然不能取代繪畫一樣,AI繪畫雖然會對現(xiàn)在的繪畫產(chǎn)生沖擊,但兩者之間并非你死我活的競爭關(guān)系。說到底,目前的AI繪畫只是對人類輸入語言的簡單理解和詮釋,整個繪制過程還是“黑箱操作”,不到成品出來,誰都不知道畫會是什么樣子,更不要提精準表達畫家的思想了。很多藝術(shù)家傾向于用AI繪畫作為“輔助工具”,在動筆之前,先將理念輸入AI生成多張不同風(fēng)格的畫作,借它們來尋找靈感。
可以確定的是,AI繪畫背后的技術(shù)仍在快速發(fā)展,產(chǎn)出的畫作必將越來越多,人類和算法,在一次次從輸入到輸出的互動中,正一起推開新世界的大門。