樂艷娜 馬瓊
2022年美國科羅拉多州博覽會的藝術(shù)比賽中,游戲設(shè)計師杰森·艾倫使用AI繪圖工具M(jìn)idjourney創(chuàng)作的作品《太空歌劇院》獲得第一名,很快在網(wǎng)絡(luò)上引起激烈的討論,其中很大一部分爭議聚焦在:AI會不會替代人類畫家?
想要梵高為你畫一幅畫?只需輸入幾個關(guān)鍵詞就能實現(xiàn)——這是人工智能(AI)在藝術(shù)領(lǐng)域的新拓展。擴(kuò)散模型(Diffusion Model)等技術(shù)的出現(xiàn),已讓AI生成圖像成為現(xiàn)實。
層出不窮
AI繪畫從想象變成現(xiàn)實,有賴于一些重要的產(chǎn)品問世。
2021年1月,人工智能研究公司Open AI開發(fā)的文本生成圖像工具DALL·E面世。DALL·E這個名字來自超現(xiàn)實主義畫家達(dá)利和《機(jī)器人總動員》中的機(jī)器人瓦力。
正如它的名字所暗示的,DALL·E是一個能創(chuàng)作超現(xiàn)實畫作的機(jī)器人,可以從自然語言描述中生成圖像。但那時的它生成的圖像還比較簡單,比如,你可以利用它生成牛油果形的扶手椅等。
同年12月,另一款可以直接在手機(jī)應(yīng)用商店下載的軟件Dream by WOMBO上架,由于使用便捷被很多人熟知,但生成的圖像質(zhì)量仍比較低。
真正的轉(zhuǎn)折點是2022年1月Disco Diffusion的出現(xiàn)。使用者只需輸入幾個關(guān)鍵詞,就能生成對應(yīng)的圖像,如果你想要某位大師的畫風(fēng)或者賽博朋克風(fēng)格,只需再加入相關(guān)描述語,Disco Diffusion都能生成令人驚艷的效果圖。
阿文是國內(nèi)最早一批接觸AI繪畫的人,作為一個PPT設(shè)計師,他擁有豐富的計算機(jī)圖像創(chuàng)作經(jīng)驗和藝術(shù)素材積累。初次使用Disco Diffusion,阿文就被AI繪畫的效果震驚:在他寫下“星空下的向日葵花?!焙?,AI用梵高的畫風(fēng)生成了夢境般的效果圖,展現(xiàn)出不輸人類的畫技。
2022年4月,阿文開始在社交媒體上分享Disco Diffusion的成果圖,也整理制作了初學(xué)者入門的中文教程,很多初學(xué)者通過他的教程開始接觸這一軟件,也使阿文的微博粉絲量短短幾個月內(nèi)達(dá)到90萬。
阿文形容,Disco Diffusion的特點是“不確定性”,這種不確定性能給人提供更多的靈感,但也讓它每次生成作品就像開盲盒一樣,無法穩(wěn)定輸出。所以在AI繪畫的討論社區(qū)中,使用者們討論最多的話題就是如何用更精準(zhǔn)的描述詞得到自己想要的畫面。
阿文表示,人們在盡情地使用自己的想象力組合各種元素:兔子太空員在星際旅行、賽博朋克風(fēng)的宮殿、新海誠風(fēng)格的田野……由于訓(xùn)練數(shù)據(jù)庫非常龐大,Disco Diffusion能實現(xiàn)大多數(shù)畫家風(fēng)格和常見事物元素的融合,而它的AI生成計算借助云端服務(wù)器,對用戶的本地硬件沒有很高的要求,降低了入門門檻,讓更多人得以了解和方便地體驗AI繪畫。
開放共建
除了文字生成圖像的功能外,Disco Diffusion還支持導(dǎo)入?yún)⒖紙D生成圖像和生成視頻等功能。
相較于人,AI繪畫的作品更加瘋狂大膽,宏觀畫面令人震撼,但對動物和人的細(xì)節(jié)處理還有很多不足,人的臉部、手部細(xì)節(jié)經(jīng)常會很怪異或者缺失。同時,它的界面只是簡陋地堆滿英文代碼,生成一幅畫的時間長達(dá)半小時到數(shù)小時,這無疑會“勸退”許多初學(xué)者。
但這些問題很快就被后來居上的開發(fā)者們解決了。2022年3月面世的Midjourney擁有更簡潔的操作界面,在人像的細(xì)節(jié)處理上也表現(xiàn)得更好,并且將生成一幅畫的時間縮短到了60秒。
1個月后,Open AI推出了DALL·E 2,它比初代DALL·E的清晰度高4倍,生成圖像的速度達(dá)到1分鐘10張圖,并且能生成更真實準(zhǔn)確的圖像,在生成的圖像上還可以直接涂抹修改。
“Disco Diffusion生成的宏偉場景和筆觸感很讓人震撼,但我最多只能用它做疊背景的素材,但是DALL·E 2的出現(xiàn)顛覆了我的想法,它完全有創(chuàng)作能力生成一些很具體的人像和物體?!卑⑽恼f他曾嘗試用DALL·E 2給油畫里的人物改變發(fā)型、讓背對觀眾的大象轉(zhuǎn)身……這些對于人類畫家來說特別刁鉆的“甲方需求”,DALL·E 2都能非常輕松地完成,甚至還能根據(jù)原有畫作自動補充擴(kuò)展圖像,這樣的人工智能自主生成內(nèi)容(AIGC)被認(rèn)為是當(dāng)前一個重要的技術(shù)趨勢。
但AI繪畫的發(fā)展還不止于此,僅僅1個月后,谷歌就在新發(fā)布的論文中介紹了它推出的AI繪圖工具Imagen,直接對標(biāo)DALL·E 2,號稱其擁有“前所未有的寫實感和深度的語言理解”,并在2022年6月推出了像素更高、細(xì)節(jié)更豐富的AI繪圖工具Parti。
與此同時,各大科技公司紛紛涉足AI繪畫領(lǐng)域,Meta AI開發(fā)了Make-A-Scene,可以根據(jù)任意給定的形狀和文字描述生成圖片;微軟和北京大學(xué)合作開發(fā)了以“女媧”為名的AI繪圖工具NüWA;百度推出“文心·一格”,可以用中文描述詞生成圖像。
雖然各種AI繪畫軟件層出不窮,但很多都需要申請內(nèi)測資格才能使用,普通用戶想體驗更加豐富的功能,還需要等待或者付費。這一現(xiàn)狀在8月22日被改變,當(dāng)前功能最強(qiáng)大的AI繪圖工具之一的Stable Diffusion宣布開源,任何用戶都可以使用它開源的技術(shù),借助云端或者本地服務(wù)器生成圖像。
更重要的是,在開源社區(qū)人們可以對它進(jìn)行各種迭代優(yōu)化,僅僅1周的時間,就出現(xiàn)了各種版本和使用教程,它甚至被做成插件加入到修圖軟件中,實現(xiàn)無縫拼接補充圖片。
9月1日,2022世界人工智能大會(WAIC)在上海開幕,Tiamat團(tuán)隊在會場展示了他們AI繪制的作品,并宣布在半個月后會從內(nèi)測變?yōu)檎缴暇€開放。
Tiamat是目前國內(nèi)前沿的AI圖像生成引擎之一,除了提供AI繪圖工具,Tiamat還打造了一個交流社區(qū),愛好者們可以交流AI生成藝術(shù)的相關(guān)話題。
在社區(qū)中,愛好者們被稱為“魔法師”,他們對于想要生成圖像的文字描述就是“魔法咒語”,對畫幅、清晰度、風(fēng)格等描述是“藥水配方”,輸入配方后只需要幾分鐘就能得到一張AI生成的對應(yīng)圖像。這樣的“AI魔法”讓剛剛接觸到這個領(lǐng)域的愛好者們非常驚喜,自3月上線后就在各大社交媒體平臺受到關(guān)注。
青柑是Tiamat的創(chuàng)始人之一,據(jù)她介紹,“Tiamat不只是一個工具,我們的定位是一個AI生成藝術(shù)社區(qū),希望每一個加入社區(qū)的人都能共建社區(qū),交流探討未來AI生成藝術(shù)的一切可能性?!?/p>
在同一會場,百度也利用“文心·一格”現(xiàn)場生成了梵高風(fēng)格的“外灘游船”和莫奈風(fēng)格的“印象生煎”等具有上海風(fēng)貌的多種風(fēng)格藝術(shù)作品。在此之前,“文心·一格”還被用于補全名畫《富春山居圖》,補充的部分與原作風(fēng)格非常近似。
倫理隱憂
在AI繪畫飛速發(fā)展的同時,一些藝術(shù)家開始擔(dān)憂自己是否會被AI繪畫替代。2022年美國科羅拉多州博覽會的藝術(shù)比賽中,游戲設(shè)計師杰森·艾倫使用AI繪圖工具M(jìn)idjourney創(chuàng)作的作品《太空歌劇院》獲得第一名,很快在網(wǎng)絡(luò)上引起激烈的討論,其中很大一部分爭議聚焦在:AI會不會代替人類畫家?
對于這個問題,親身體驗過各種AI繪圖工具的阿文覺得那些對藝術(shù)風(fēng)格、藝術(shù)史更了解的畫家在未來仍然會有優(yōu)勢。“認(rèn)識的藝術(shù)家越多,你生成的AI作品就會更加自由,風(fēng)格就更加多變,而不是僅使用梵高或者莫奈這些大眾熟悉的藝術(shù)家。所以AI不會讓我失業(yè),而我大概率能早點下班。”阿文說。
而青柑表示:“更好的情況是,Tiamat會成為輔助工具,能幫助更多創(chuàng)作者去創(chuàng)作?,F(xiàn)在也有很多小伙伴在這方面進(jìn)行了實踐,很好地將AI藝術(shù)融入了自己的創(chuàng)作之中,越來越多的人正在接受和擁抱新技術(shù)帶來的許多可能?!?/p>
除了是否會替代人類畫家的討論外,關(guān)于AI繪畫其他的倫理問題也逐漸浮現(xiàn),如AI模仿畫風(fēng)的侵權(quán)問題、AI生成暴力圖片、AI加重刻板印象等。對此,阿文表示:“你可以把AI看成是一個能力很強(qiáng)的人類畫家,人類不能做的事情它同樣不能做?!?/p>
而Open AI在DALL·E 2的使用聲明中提到:“我們限制了 DALL·E 2 生成暴力、仇恨或成人圖像的能力。通過從訓(xùn)練數(shù)據(jù)中刪除最明確的內(nèi)容,我們最大限度地減少了 DALL·E 2 對這些概念的接觸。我們還使用了先進(jìn)的技術(shù)來防止生成逼真的真實個人面孔,包括公眾人物的面孔。”
同時,由于學(xué)習(xí)的數(shù)據(jù)集不同,AI可能會學(xué)習(xí)到人類的刻板印象、種族歧視和性別歧視等,Open AI團(tuán)隊提到他們正在努力增加措施限制這些情況的出現(xiàn)。Tiamat則是把能識別到人類面部的數(shù)據(jù)主動剔除,避免用戶使用“畫人”的功能。
(摘自《環(huán)球》2022年第9期)