編譯/張含陽
對抗網(wǎng)絡生成的藝術作品為何比人類藝術家更受歡迎?
編譯/張含陽
深度學習如何像人類一樣產(chǎn)生“創(chuàng)造力”,一直是AI科學家們研究的熱點。羅格斯大學和查爾斯頓學院近日聯(lián)合發(fā)布了一篇論文,發(fā)布了一種全新的深度學習模型——創(chuàng)意對抗網(wǎng)絡(Creative Adversarial Networks,CANs)。CAN通過學習風格和偏離風格規(guī)范來生成“藝術作品”。該論文是在2017年6月20日至6月22日在亞特蘭大舉行的第八屆國際計算創(chuàng)意大會(ICCC)發(fā)布的論文的擴展版本。
我們提出了一個新的藝術創(chuàng)作系統(tǒng)。該系統(tǒng)通過觀察藝術和學習風格來生成藝術作品,并通過偏離學習的風格增加生成的藝術的喚醒潛力而變得具有創(chuàng)造性。我們建立了生成對抗網(wǎng)絡(GAN),它已經(jīng)顯示出學習生成模擬給定分布的新穎圖像的能力。我們認為,這樣的網(wǎng)絡在其原始設計中產(chǎn)生創(chuàng)意產(chǎn)品的能力有限。我們提出對其目標的修改,使其能夠通過最大限度地偏離已建立的風格和最小化偏離藝術品分布來創(chuàng)造創(chuàng)意藝術。我們進行實驗,比較人類測試者對所產(chǎn)生的藝術的反應,以及他們對藝術家創(chuàng)造的藝術的反應。結果表明,人類測試者無法將系統(tǒng)生成的藝術作品與當代藝術家所產(chǎn)生的藝術區(qū)分開。人類測試者甚至在某些程度上,對機器生成的圖像產(chǎn)生了更高的評價。
自從人工智能崛起以來,科學家一直在探索機器產(chǎn)生詩歌、故事、笑話、音樂、繪畫等人類創(chuàng)意產(chǎn)品的能力,以及對于創(chuàng)造能力的解決方案。這種能力才是真正顯示人工智能算法是否智能的基礎。在視覺藝術方面,已經(jīng)提出了幾種系統(tǒng),不僅在AI和計算創(chuàng)意領域,而且在計算機圖形學和機器學習中,自動創(chuàng)建藝術的算法亦有研究。
在有關計算創(chuàng)意的相關文獻中,提出了不同的算法,專注于發(fā)現(xiàn)各種有效的探索創(chuàng)意空間的方法。幾種方法已經(jīng)使用進化過程,其中算法通過生成候選者進行迭代,使用適應度函數(shù)來評估它們,然后修改它們以改善下一次迭代的適應度分數(shù)。通常,該過程在遺傳算法框架內(nèi)完成。正如DiPaola和Gabora在 2009年所指出的,任何算法的挑戰(zhàn)都集中于“如何編寫具有審美意義的邏輯適應度函數(shù)”。一些早期的系統(tǒng)在回路中使用了一個能夠引導進程的人類。在這些互動系統(tǒng)中,計算機探索創(chuàng)意空間,人類扮演觀察器的角色,其反饋對于推動過程至關重要。而最近的系統(tǒng)則強調(diào)了創(chuàng)意過程中感知和認知的作用。
本論文的目的是發(fā)現(xiàn)藝術生成的計算創(chuàng)意系統(tǒng),而不需要在創(chuàng)作過程中涉及到人類藝術家,但仍然將人類創(chuàng)意產(chǎn)品融入到學習過程中。藝術生成算法的一個重要組成部分是將他們的創(chuàng)作過程與人類藝術家在時間上產(chǎn)生的藝術相關聯(lián)。我們相信這是重要的,因為人類的創(chuàng)作過程利用了藝術的先前的經(jīng)驗。一位人類藝術家不斷接受其他藝術家的作品,并且一直以來都面對著各種各樣的藝術。人類藝術家如何將過去藝術的知識與他們產(chǎn)生新形式的能力結合在一起仍然在很大程度上是未知的,這需要一套理論來建模,如何將藝術風格與藝術創(chuàng)作相結合。
科林·馬丁代爾(Colin M artindale,1943-2008)提出了一種解釋新藝術創(chuàng)作的心理學理論。他假設,在任何時候,創(chuàng)意藝術家都試圖增加藝術的喚醒潛力來推動改變慣性。然而,這種增長必須是最小的,以避免觀察器的負面反應(最不努力的原則)。馬丁代爾還假設,當藝術家在風格的角色中發(fā)揮其他手段時,風格的突破就是增加藝術的喚醒潛力的一種方式。本文提出的方法靈感來自于馬丁代爾的最小努力原則和他對風格的分析。在試圖解釋藝術進步的理論中,我們發(fā)現(xiàn)馬丁代爾的理論是在計算上可行的。
深層神經(jīng)網(wǎng)絡最近在推動各種應用領域的人工智能方面發(fā)揮了轉(zhuǎn)型作用。特別需要指出的是,人類已經(jīng)提出了幾個具有生成新穎圖像以模擬給定訓練分布的生成深層網(wǎng)絡。生成對抗網(wǎng)絡(GAN)已經(jīng)非常成功地實現(xiàn)了這一目標。我們認為,這樣的網(wǎng)絡在其原始設計中產(chǎn)生創(chuàng)意作品的能力有限。靈感來自于馬丁代爾的理論,在本文中,我們提出修改GAN的目標,使其能夠通過最大化偏離已建立的風格同時最大限度地減少偏離藝術品分布來創(chuàng)造創(chuàng)意藝術。
圖1 顯示了生成的圖像的樣本
圖2 CAN系統(tǒng)框架圖
在提出的創(chuàng)意對抗網(wǎng)絡(CAN)中,發(fā)生器被設計為接收來自鑒別器的兩個信號,作為兩個相互矛盾的力量,以實現(xiàn)三點:
1)生成新作品;
2)新作品不應該太新,它不應該遠離分布,否則會產(chǎn)生太多的喚醒,從而根據(jù)W undt曲線激活厭惡系統(tǒng)并落入負面特征范圍;
3)生成的作品應該增加風格的模糊性。
類似于生成對抗網(wǎng)絡(GAN),CAN具有兩個對手網(wǎng)絡,一個鑒別器和一個發(fā)生器。鑒別器可以使用與風格標簽(文藝復興、巴洛克風格、印象派、表現(xiàn)主義等)相關的大量藝術品,并使用它來學習區(qū)分風格。生成器無法訪問任何藝術品,它從隨機輸入中生成藝術,但與GAN不同,它從鑒別器接收兩個信號,以生成其任何作品。
第一個信號是鑒別器對“藝術與非藝術”的分類。在傳統(tǒng)的GAN中,該信號使得發(fā)生器能夠改變其權重,以產(chǎn)生更頻繁地欺騙鑒別器關于它是否來自相同分布的圖像。由于我們案例中的鑒別器是對藝術進行了訓練的,所以這將表明鑒別器是否認為所產(chǎn)生的藝術來自與知道的實際藝術相同的分布。在這個意義上,這個信號標示出鑒別器是否認為呈現(xiàn)給它的圖像是“藝術還是非藝術”。由于發(fā)生器僅接收到該信號,所以它將最終收斂以產(chǎn)生將模擬藝術的圖像。
發(fā)生器接收的第二個信號是關于鑒別器可以將生成的藝術分類成已建立樣式的信號。如果發(fā)生器生成了鑒別器認為是藝術的圖像,并且也可以容易地分類成已建立的樣式之一,則發(fā)生器將愚弄鑒別器以相信它產(chǎn)生符合已建立樣式的實際藝術。相比之下,創(chuàng)意發(fā)生器將嘗試產(chǎn)生混淆鑒別器的藝術。一方面,它試圖欺騙鑒別器認為它是“藝術”,另一方面它試圖混淆鑒別器所產(chǎn)生的作品風格。
這兩個信號是矛盾的力量,因為第一個信號推動發(fā)生器產(chǎn)生鑒別器接受為“藝術”的作品,但是如果它在已建立的樣式的規(guī)則中成功,則鑒別器也將能夠?qū)ζ滹L格進行分類。 那么第二個信號將會對發(fā)生器造成嚴重的懲罰。 這是因為第二個信號推動發(fā)生器產(chǎn)生風格模糊的作品。 因此,這兩個信號在一起應該推動發(fā)生器探索靠近藝術分布的創(chuàng)意空間。
張含陽 本刊編輯