張羿
天青色等煙雨,而我在等你。
炊煙裊裊升起,隔江千萬(wàn)里。
周杰倫的流行歌曲《青花瓷》相信朋友們都聽(tīng)過(guò),它是一首充滿書生飄逸氣息的中國(guó)風(fēng)歌曲。婉轉(zhuǎn)動(dòng)聽(tīng)的旋律和意境深遠(yuǎn)的歌詞,無(wú)疑會(huì)讓聽(tīng)眾腦補(bǔ)出一幅優(yōu)美的畫卷。
但是你相信嗎?人工智能聽(tīng)完這首歌也能“腦補(bǔ)”并描繪出一幅畫。上面這幅畫就是人工智能根據(jù)以上幾句歌詞繪制的作品。朦朧的遠(yuǎn)山籠罩著輕紗,綿綿細(xì)雨伴著漫山云霧,山上草木郁郁蔥蔥,山峰在裊裊云煙中若隱若現(xiàn),空靈秀氣。整幅作品不但符合歌曲的意境,還極具中國(guó)傳統(tǒng)水墨畫的神韻,說(shuō)它出自人類插畫師之手也不為過(guò)。
你一定會(huì)好奇:人工智能是如何繪制出插畫作品的?要回答這個(gè)問(wèn)題,需要先了解一下何為人工智能。人工智能(Artificial Intelligence),其詞根arti本身就兼具藝術(shù)與文化的含義,但它誕生的最初目的并非是為了進(jìn)行藝術(shù)創(chuàng)作。早在1956年,麥卡錫、明斯基等科學(xué)家在美國(guó)達(dá)特茅斯學(xué)院開(kāi)會(huì),研討如何用機(jī)器模擬人的智能,首次提出“人工智能”這一概念。這標(biāo)志著人工智能學(xué)科的誕生。然而,其發(fā)展歷程幾經(jīng)沉浮,幾十年后的今天終于取得了令人矚目的成果。人工智能已經(jīng)可以勝任很多只有人類才能完成的任務(wù),比如視(圖像文字識(shí)別等)、聽(tīng)(語(yǔ)音識(shí)別、機(jī)器翻譯等)、說(shuō)(語(yǔ)音合成、人機(jī)對(duì)話等)、思考(下棋打牌、電子競(jìng)技、科學(xué)研究、寫作等)、運(yùn)動(dòng)(自動(dòng)駕駛汽車等)。
不難看出,經(jīng)過(guò)幾十年的研究摸索,人工智能已經(jīng)達(dá)到了新高度。而且,人工智能在普遍認(rèn)為最不可能被機(jī)器替代的藝術(shù)創(chuàng)作領(lǐng)域也闖出了一片新天地。一直秉行實(shí)用主義的人工智能居然躋身藝術(shù)領(lǐng)域,人們或多或少會(huì)覺(jué)得有些不可思議。但了解了人工智能創(chuàng)作藝術(shù)作品的原理之后,就能知道這其實(shí)是意料之外、情理之中的事情。
以繪畫這種最常見(jiàn)的藝術(shù)形式為例,想讓AI實(shí)現(xiàn)繪畫,必須先讓它學(xué)會(huì)識(shí)別物體,理解世界。這對(duì)于人類而言,易如反掌,比如面前有一顆草莓,我們瞬間就能識(shí)別出它是草莓,大腦會(huì)自覺(jué)提取草莓的特征——有點(diǎn)圓的三角形、紅色、表面帶顆?!堰@些特征匯總起來(lái),就能判斷是草莓。
然而,計(jì)算機(jī)無(wú)法像人類這樣輕而易舉地捕捉到草莓的特征。因?yàn)橛?jì)算機(jī)擅長(zhǎng)的是加減乘除運(yùn)算,這種純計(jì)算能力并不能讓它直接辨認(rèn)出草莓。此時(shí)它需要先把草莓圖像轉(zhuǎn)化成數(shù)字,再用計(jì)算機(jī)擅長(zhǎng)的加減乘除來(lái)操作這些數(shù)字,最終判斷出是草莓。
我們可以制作一個(gè)簡(jiǎn)單的會(huì)識(shí)別數(shù)字的AI,親身體驗(yàn)AI學(xué)習(xí)識(shí)別數(shù)字的過(guò)程。比如,白紙上寫了一個(gè)7,如何讓AI認(rèn)出寫的是7。我們可以用3×3的九宮格把圖像分成9個(gè)區(qū)域,7經(jīng)過(guò)的區(qū)域就用1表示,否則為0。這樣,圖像就轉(zhuǎn)化成了AI能處理的數(shù)字。然后,科學(xué)家模仿人腦的思考機(jī)制,創(chuàng)造了“人工神經(jīng)網(wǎng)絡(luò)”。人腦由大量的神經(jīng)元組成,神經(jīng)元之間相互連接形成網(wǎng)絡(luò)。神經(jīng)元通過(guò)“突觸”(接觸的部分)接收其他神經(jīng)元的信號(hào)。當(dāng)它接收的信號(hào)總量超過(guò)一定大小后,它就會(huì)把信號(hào)傳遞給其他神經(jīng)元。人腦進(jìn)行信息處理的機(jī)制正是依靠神經(jīng)元不斷傳遞信號(hào)。
人工神經(jīng)網(wǎng)絡(luò)就是模擬人腦神經(jīng)元的活動(dòng)。人工神經(jīng)元接收多個(gè)輸入數(shù)值,進(jìn)行若干計(jì)算之后輸出數(shù)值結(jié)果。在上面的例子中,九宮格中的1和0就是輸入的數(shù)值,把它們一字?jǐn)[開(kāi),形成了人工神經(jīng)元的“輸入層”。輸入層的數(shù)據(jù)最終會(huì)傳到后面的“輸出層”。當(dāng)然,這些數(shù)據(jù)直接傳下去是毫無(wú)意義的,而要經(jīng)過(guò)計(jì)算處理。因此,每個(gè)輸入值都對(duì)應(yīng)一個(gè)“權(quán)重”。用人腦神經(jīng)元解釋的話,權(quán)重相當(dāng)于突觸的連接強(qiáng)度。權(quán)重越大,對(duì)應(yīng)的輸入值就越容易傳到后面的輸出層。神經(jīng)網(wǎng)絡(luò)就是通過(guò)不斷修改權(quán)重來(lái)改變?nèi)斯ど窠?jīng)元之間的連接強(qiáng)度,由此進(jìn)行學(xué)習(xí)的。學(xué)習(xí)之前,權(quán)重是雜亂無(wú)章的,因此得到的輸出信號(hào)并不能正確識(shí)別我們寫的數(shù)字7。核對(duì)答案之后,AI發(fā)現(xiàn)結(jié)果錯(cuò)誤。此時(shí),AI會(huì)自主修改權(quán)重。比如,AI可能發(fā)現(xiàn),九宮格中的上邊和右邊這幾個(gè)區(qū)域是容易被7覆蓋的區(qū)域,所以這幾個(gè)輸入值所對(duì)應(yīng)的權(quán)重要調(diào)大一些。相反,左下角幾個(gè)區(qū)域不容易被7覆蓋,一旦這些區(qū)域被覆蓋了就要扣分,所以把對(duì)應(yīng)的權(quán)重修改成負(fù)數(shù)。此時(shí),輸出結(jié)果顯示,7會(huì)被正確識(shí)別,而4和0則不會(huì)被識(shí)別為7。通過(guò)對(duì)大量數(shù)字圖片反復(fù)進(jìn)行“識(shí)別圖像—核對(duì)—修改權(quán)重”的過(guò)程,AI最終能學(xué)會(huì)正確識(shí)別數(shù)字?,F(xiàn)在常見(jiàn)的神經(jīng)網(wǎng)絡(luò)識(shí)別數(shù)字的正確率已經(jīng)達(dá)到99%以上。
現(xiàn)實(shí)中的問(wèn)題往往非常復(fù)雜,用如此簡(jiǎn)單的人工神經(jīng)網(wǎng)絡(luò)無(wú)法解決所有問(wèn)題。因此,絕大多數(shù)人工神經(jīng)網(wǎng)絡(luò)并不止輸入層和輸出層這兩層,中間還有很多隱藏層,故而得名“深度神經(jīng)網(wǎng)絡(luò)”。訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),即所謂的“深度學(xué)習(xí)”。
像前文中提到的計(jì)算機(jī)辨認(rèn)草莓的例子就需要用到深度神經(jīng)網(wǎng)絡(luò)。在計(jì)算機(jī)中,草莓圖像首先被分解為像素,一個(gè)個(gè)像素點(diǎn)構(gòu)成了輸入層。在靠近輸入層的隱藏層上,分布著對(duì)構(gòu)成圖像輪廓的橫豎斜等線段有反應(yīng)的節(jié)點(diǎn)。信息傳到下一層之后,這些線段無(wú)縫銜接,整合為更復(fù)雜的圖塊。每經(jīng)過(guò)一個(gè)隱藏層,上一層中的信息就會(huì)再次組合,識(shí)別出的圖案也隨之越來(lái)越復(fù)雜。反復(fù)進(jìn)行“識(shí)別圖像—核對(duì)—修改權(quán)重”的過(guò)程之后,“尖狀”“顆粒”這些契合草莓的特征路徑上的節(jié)點(diǎn)被點(diǎn)亮,最終輸出草莓的結(jié)果。
神經(jīng)網(wǎng)絡(luò)就像在根據(jù)你提供的數(shù)據(jù)和目標(biāo)進(jìn)行規(guī)律總結(jié)。你要設(shè)計(jì)出合適的網(wǎng)絡(luò)模型,運(yùn)用各種技巧,盡可能找到這個(gè)預(yù)期的規(guī)律。假如你設(shè)想的輸入輸出數(shù)學(xué)邏輯關(guān)系正確,這個(gè)網(wǎng)絡(luò)模型理論上就能實(shí)現(xiàn)。
現(xiàn)在再回到開(kāi)篇AI根據(jù)《青花瓷》歌詞繪制的山水題材水墨畫。讓AI學(xué)會(huì)繪制這樣一幅畫需要給它準(zhǔn)備兩個(gè)模塊,分別叫作“學(xué)生模塊”和“老師模塊”。學(xué)生模塊負(fù)責(zé)創(chuàng)作,老師模塊負(fù)責(zé)對(duì)學(xué)生的作品進(jìn)行核對(duì)。一開(kāi)始,學(xué)生模塊并不會(huì)畫山水畫。但沒(méi)關(guān)系,我們可以讓學(xué)生模塊隨機(jī)生成一些山的圖片。同時(shí),我們?cè)贉?zhǔn)備一些真實(shí)的山水畫作品。當(dāng)隨機(jī)生成的圖片和真實(shí)的山水畫作品都準(zhǔn)備好之后,我們就可以對(duì)老師模塊進(jìn)行訓(xùn)練。當(dāng)老師模塊看到隨機(jī)圖片的時(shí)候,就告訴它這不是山;當(dāng)老師模塊看到真實(shí)的山水畫之后,就告訴它這是正確的山。讓“老師”不停地看圖學(xué)習(xí)之后,“老師”會(huì)粗略地學(xué)會(huì)一點(diǎn)判斷能力,比如它可能會(huì)學(xué)到:尖狀的圖形是山。雖然這種判斷力非常有限,但用它來(lái)指導(dǎo)一無(wú)所知的“學(xué)生”卻是恰到好處。因?yàn)閷?duì)這樣的學(xué)生來(lái)說(shuō),教的東西太復(fù)雜往往會(huì)適得其反。于是第一輪教學(xué)就這樣開(kāi)始了?!皩W(xué)生”學(xué)習(xí)的知識(shí)是:山必須是尖狀的。這樣一個(gè)簡(jiǎn)單的知識(shí)對(duì)“學(xué)生”來(lái)說(shuō)很容易學(xué)習(xí)。經(jīng)過(guò)一輪訓(xùn)練之后,“學(xué)生”就會(huì)創(chuàng)作出很多尖狀物體的圖片。我們?cè)儆眠@些尖狀物體的圖片去訓(xùn)練“老師”,讓“老師”知道,僅僅有尖狀物體的圖片并不是山?!袄蠋煛敝饾u了解到,山除了是尖狀外,上面還可能有植被。隨后,讓能力提升之后的“老師”再去訓(xùn)練“學(xué)生”,然后再用提升之后的“學(xué)生”訓(xùn)練“老師”。經(jīng)過(guò)這樣一輪輪的反復(fù)訓(xùn)練后,“老師”知道山不但是尖狀,還要覆蓋植被,還可能云霧繚繞,等等?!皩W(xué)生”也知道創(chuàng)作的山要契合以上各種特征。最后,“學(xué)生”終于能夠創(chuàng)造出靠譜的山水畫作品。
總而言之,AI繪畫并不是通俗理解的抄襲和縫合,但可能存在規(guī)律、套路上的縫合。AI先根據(jù)輸入的關(guān)鍵詞確定繪制的主題和物品,接下來(lái)的風(fēng)格則源于人類畫師的作品。比如開(kāi)篇那幅根據(jù)《青花瓷》歌詞生成的作品就是中國(guó)水墨畫風(fēng)格。如果把《七里香》的歌詞“雨下整夜,我的愛(ài)溢出就像雨水。院子落葉,跟我的思念厚厚一疊”給AI去發(fā)揮,依然可以生成類似的中國(guó)水墨畫風(fēng)格的作品。
如果要讓AI畫西方油畫風(fēng)格的作品,那繪制出的作品可能就有凡·高、莫奈、雷諾阿等印象派大師的影子。如果要讓AI畫科幻風(fēng)格的作品,那可能就會(huì)畫出像好萊塢科幻大片一樣的場(chǎng)景。
沒(méi)有任何繪畫基礎(chǔ)的人用AI程序生成這些高質(zhì)量畫作,只需要短短幾分鐘,而人類畫師則需要聚精會(huì)神地繪制數(shù)小時(shí)甚至數(shù)日才能完成這樣一幅作品。因此,AI繪畫問(wèn)世之后引起了很多爭(zhēng)議。有人認(rèn)為,AI繪畫沒(méi)有生命力;有人認(rèn)為,AI繪畫學(xué)習(xí)了很多藝術(shù)家的作品,藝術(shù)家的版權(quán)得不到保護(hù);還有人認(rèn)為,AI繪畫會(huì)導(dǎo)致大量畫師失業(yè)。但無(wú)論如何,AI繪畫已經(jīng)開(kāi)始投入商業(yè)運(yùn)用。國(guó)外一些雜志社開(kāi)始用AI創(chuàng)作的圖片來(lái)做雜志配圖,也有AI繪畫作品在拍賣行拍出幾十萬(wàn)美元的高價(jià),甚至連近日爆火的新型聊天機(jī)器人ChatGPT也具有繪畫功能。AI藝術(shù)創(chuàng)作的未來(lái)究竟會(huì)如何?讓我們拭目以待。