法國(guó)攝影師納達(dá)爾在《我的攝影師生涯》這本書里提到了作家巴爾扎克對(duì)攝影的理解,“所有的肉體都是由一層一層的幽靈般的圖像組成,由無(wú)數(shù)葉子般的皮膚層層疊加而成”,“重復(fù)曝光意味著不可避免地要失去這樣的一個(gè)幽靈層,也就是生命的本質(zhì)” [1]。在巴爾扎克看來(lái),攝影這樣基于客觀對(duì)象進(jìn)行拍攝的行為,是將由無(wú)數(shù)葉子構(gòu)成的肉體的靈光給去除掉了,身體在巴爾扎克的“幽靈說(shuō)”里變成了一個(gè)圖像的疊加體。巴爾扎克的看法意外地呼應(yīng)AI圖像的生成邏輯,即“一層一層的幽靈般的圖像”“無(wú)數(shù)葉子般的皮膚層層疊加”。AI這樣的數(shù)字幽靈,正是通過(guò)這樣的材料單元和工作方式,在大模型里接受文字指令,進(jìn)行疊加、渲染,最后生成圖像。所有生成的啟動(dòng)媒介,都是文字,這也反證出巴爾扎克作家身份之于AI生成邏輯的契合,他通過(guò)文字思維來(lái)理解圖像的生產(chǎn),AI也正是如此。關(guān)于“幽靈理論”,德里達(dá)也曾不斷闡述,但其幽靈理論更多是指向電影,他甚至認(rèn)為電影就是一個(gè)“鬼魂歸來(lái)”的藝術(shù)。而本文提及巴爾扎克的“幽靈理論”,一方面是想說(shuō)明這種基于新媒介的擔(dān)憂情緒,是與當(dāng)下人們對(duì)AI的緊張情緒相對(duì)應(yīng)的,另一方面是想回到文字的邏輯里理解圖像的生成。
在AI生成技術(shù)面向大眾的2023年里,它收獲了驚喜,也遭遇了詬病,驚喜的是AI意外的制圖能力,而其遭人詬病的原因,除了在于人們憂心其學(xué)習(xí)能力和主體意識(shí)的形成之外,還在于人們指認(rèn)其缺乏情感。這種憂心和指認(rèn)之間的悖謬,反映出人對(duì)媒介和其使用者的剝離和對(duì)AI的全能索求。事實(shí)上,所有的媒介都是中性且沒有情感的,它們不會(huì)說(shuō)話,也不會(huì)主動(dòng)表達(dá)。我們通常在媒介里看到的情感,是媒介的使用者通過(guò)媒介釋放出的某種情感。
一、圖像觀看經(jīng)驗(yàn)
AI生成圖像所能夠利用的是記憶與經(jīng)驗(yàn),“/ imagine:”指令框調(diào)動(dòng)的正是人們遺落和丟失的東西,所以“/imagine:”的動(dòng)作,既是勾起,又是找回,以此讓記憶和經(jīng)驗(yàn)在當(dāng)下的數(shù)據(jù)語(yǔ)境里重生。
首先,我們得面對(duì)關(guān)于真實(shí)的經(jīng)驗(yàn)以及真實(shí)的創(chuàng)傷經(jīng)驗(yàn),這是圖像觀看經(jīng)驗(yàn)的前提。人們理所當(dāng)然地認(rèn)為攝影圖像是現(xiàn)實(shí)的等價(jià)物,但正是圖像的工具化,使得圖像在社會(huì)的運(yùn)作中產(chǎn)生了分化,衍生出權(quán)力和意義。如約翰·塔格(John Tagg)所言,兩者“建立了互惠關(guān)系”,意義(知識(shí))塑造權(quán)力,而權(quán)力制造新的意義。在塔格看來(lái),“照片證據(jù)所屬的政體,是以管理和話語(yǔ)的復(fù)雜重構(gòu)過(guò)程為特征的,它取決于生產(chǎn)和占有的權(quán)力及優(yōu)勢(shì)與生成意義的負(fù)擔(dān)之間的社會(huì)分化?!盵2]經(jīng)由這樣的互惠過(guò)程,攝影所制造的圖像形成了新的話語(yǔ)和體制形式。所以,考察這樣的圖像,必須考察它的敘事主體(擁有者,或者闡釋者)。真實(shí)的容貌面具遭遇揭秘,人們長(zhǎng)期以來(lái)達(dá)成的對(duì)真實(shí)的共識(shí),卻帶給了自己如同情感背叛一樣的創(chuàng)傷經(jīng)驗(yàn)。我們?cè)诶斫狻暗葍r(jià)物”之初,就已經(jīng)做出了一個(gè)注定要受創(chuàng)傷的動(dòng)作,也即是說(shuō)在這個(gè)邏輯鏈里,我們把作者切割掉了,只保留了相機(jī)和現(xiàn)實(shí)世界的等價(jià)關(guān)系,而正是作者,使我們得以節(jié)制這種對(duì)于客觀真實(shí)的強(qiáng)烈熱忱。
當(dāng)我們觀看那些由“無(wú)數(shù)葉子般的皮膚”組成的身體與圖像時(shí),我們也應(yīng)該如此觀看那些由“無(wú)數(shù)葉子般的圖像”組成的AI圖像,只有將其從“真實(shí)”中打撈出來(lái),我們才可以卸掉重負(fù),在較為輕松的觀看行動(dòng)里識(shí)別和重構(gòu)新的圖像經(jīng)驗(yàn)。藝術(shù)家方政在其作品《截?cái)唷防镉幸饣煜爽F(xiàn)實(shí)圖像與AI圖像的邊界。他用手機(jī)拍攝了疫情期間及之后的很多日常圖像,以及其他現(xiàn)實(shí)景觀,然后將這些手機(jī)生產(chǎn)的圖像投喂給AI生成器,輔以文字指令,生成出新的AI圖像,最后打印在拍立得相紙上。在展覽現(xiàn)場(chǎng),尺寸小巧的物質(zhì)化圖像被完全打亂后,觀眾已經(jīng)難以分辨出手機(jī)拍攝的圖像與AI圖像之間的區(qū)別。方政將一個(gè)常常被忽略的知識(shí)盲區(qū)通過(guò)AI生成與攝影并置的形式展示出來(lái),從媒介發(fā)展的角度來(lái)講,方政展示的是兩種媒介巖層里的積液。
二、AI圖像生成與視覺養(yǎng)成
在AI圖像的生成過(guò)程中,除了底層大模型的數(shù)據(jù)儲(chǔ)備之外,AI指令需要調(diào)動(dòng)的碎片要么來(lái)自記憶,要么來(lái)自圖像經(jīng)驗(yàn)。腦神經(jīng)的機(jī)敏度、對(duì)于記憶的調(diào)取能力,以及圖像經(jīng)驗(yàn)里的歸納和統(tǒng)籌能力,無(wú)時(shí)無(wú)刻影響著AI指令的文字結(jié)構(gòu),而圖像經(jīng)驗(yàn)來(lái)自大眾文化、藝術(shù)史、自然現(xiàn)象及社會(huì)事件,在“無(wú)數(shù)葉子般的皮膚層層疊加而成”的生成場(chǎng)景里,這些經(jīng)驗(yàn)被調(diào)動(dòng)和組織。
筆者曾生成過(guò)許多個(gè)孤舟在游泳池中停泊的景象,其中一張(圖4),是一個(gè)穿著寬大西裝的中年男子和一個(gè)穿著露背裝的年輕女子背對(duì)鏡頭坐在泳池中的孤舟上的場(chǎng)景,靜默而曖昧。追溯起來(lái),這幅作品大致可以找到如下圖像經(jīng)驗(yàn):藝術(shù)家楊福東的攝影作品《客再遇 》第3號(hào),拍攝了兩個(gè)穿水兵服裝臉上有傷的男子坐在孤舟的兩端,而面容優(yōu)雅的女子坐在孤舟中間的場(chǎng)面;在翁奮的作品《看湖》中,幾個(gè)穿著學(xué)生裙的女中學(xué)生待在獨(dú)木舟上望著河對(duì)岸裸露出地面的山峰;馮立的作品《白夜》用強(qiáng)力閃光燈俯拍了一家三口在公園湖中劃孤舟的場(chǎng)景;在嚴(yán)明的新作《綠野仙蹤景區(qū)》中,一對(duì)情侶在漂滿綠藻、周圍有樹的網(wǎng)紅景區(qū)劃著孤舟;在荒木經(jīng)惟《感傷之旅》中,陽(yáng)子蜷縮著身體趴在獨(dú)木舟上小憩;在日本導(dǎo)演小林正樹的電影《怪談》中,一名日本男子站在獨(dú)木舟頭劃船,而女子坐在船尾側(cè)頭望向湖水中,昏黃的電影光推進(jìn)著詭異而不安的氣氛;加拿大藝術(shù)家彼得·多依格(Peter Doig)畫作中也頻繁出現(xiàn)紅色獨(dú)木舟……這些構(gòu)成了一個(gè)圖像經(jīng)驗(yàn)的微型數(shù)據(jù)庫(kù),主導(dǎo)了筆者的AI圖像生成的視覺養(yǎng)成,在眾多數(shù)據(jù)中,“孤舟”被提取為圖像劇場(chǎng)中的主導(dǎo)元素。
藝術(shù)家有自己的創(chuàng)作脈絡(luò)。武漢藝術(shù)家組合李郁&劉波的《2012新聞肖像》沿用他們以往的創(chuàng)作思路,在過(guò)去的創(chuàng)作中,他們以武漢當(dāng)?shù)貓?bào)紙上的一些驚悚而怪誕的新聞為依據(jù),找臨時(shí)演員,現(xiàn)場(chǎng)布景和布光,進(jìn)行拍攝。在《2012新聞肖像》中,他們依然以舊報(bào)紙上的新聞為底本,將這些新聞編輯成指令,在AI生成器中生成新的圖像。AI生成器于他們而言,與他們之前的創(chuàng)作脈絡(luò)一致,只是它更加快捷且低廉。
此外,歷史圖像也成為藝術(shù)家使用的視覺資源和敘事線索。藝術(shù)家傅為新的作品《本杰明之后》使用AI來(lái)模擬考古,該系列作品分為三個(gè)板塊:“消亡史”“本杰明之后”“假設(shè)的藝術(shù)”。藝術(shù)家以一個(gè)已經(jīng)滅絕的物種—袋狼—為線索,結(jié)合部分真實(shí)史料,想象并生成了三個(gè)板塊的圖像故事:第一個(gè)板塊講述了袋狼本杰明消亡之前人類的所作所為,第二個(gè)板塊講述了消失后人類試圖利用基因?qū)λM(jìn)行克隆的努力,這個(gè)故事最后以袋狼作為一個(gè)符號(hào)與藝術(shù)史和消費(fèi)社會(huì)結(jié)合的場(chǎng)景作結(jié)。
三、AI底層架構(gòu)師的文化設(shè)定
從過(guò)往的AI生成經(jīng)驗(yàn)來(lái)看,中國(guó)的數(shù)據(jù)在其中占比極少,無(wú)論是地理地貌、風(fēng)土人情,還是人種的面孔結(jié)構(gòu)、服飾裝扮,甚至是工種、食品、建筑或者樂器等都會(huì)在生成的過(guò)程中令創(chuàng)作者大費(fèi)腦筋。數(shù)據(jù)的占比也使得中國(guó)文化在AI的語(yǔ)境里遭遇邊緣化。在大部分情況下,即便我們?cè)谥噶罾锛尤搿爸袊?guó)”或“中國(guó)人”等文化限定詞,也多半會(huì)滑入“泛東亞”的文化圈。這就使得我們?cè)贏I生成過(guò)程中,需要不斷地投喂圖像數(shù)據(jù),以達(dá)到適度的平衡,這也逼迫我們要在生成的過(guò)程中揣摩AI底層架構(gòu)師的文化設(shè)定。
就目前流行的AI生成器來(lái)說(shuō),ChatGPT這樣的文字性生成器還允許使用漢語(yǔ),這至少保證了適度的語(yǔ)言環(huán)境,而AI繪圖Midjourney和Stable Diffusion則無(wú)一例外地使用英語(yǔ),雖然后者的理想操作是下載模型,進(jìn)行本地訓(xùn)練,但指令還是會(huì)在轉(zhuǎn)譯的過(guò)程中損失其文化表達(dá)的準(zhǔn)確性。以英語(yǔ)為母語(yǔ)編碼數(shù)據(jù)、編寫算法規(guī)則和語(yǔ)言程序的AI工程,在底層架構(gòu)師的文化設(shè)定和價(jià)值構(gòu)建里,依然秉持著既有的國(guó)際差異眼光和權(quán)重。
筆者曾經(jīng)生成了一張圖像《AI雙胞胎姐妹》,在這幅圖像中一對(duì)穿著紅色衣服的中國(guó)西北雙胞胎女孩,坐在停放在西北戈壁灘上的卡車上,女孩的表情、發(fā)型和穿著符合中國(guó)人的普遍性審美,不具有AI生成慣性中的時(shí)尚模特的商業(yè)化屬性。后來(lái),筆者將這幅圖像在Midjourney里進(jìn)行“/describe:”的指令操作,生成器根據(jù)上傳的這張圖像輸出4條不同的文字描述,再根據(jù)這4條文字分別生成4張圖像。這個(gè)過(guò)程中,筆者試圖通過(guò)反向操作來(lái)反推AI圖像生成中的邏輯習(xí)慣和文字描述的權(quán)重與規(guī)則,并且有意去測(cè)試AI圖像生成中的記憶與識(shí)別性,即由它生成的圖像是否還粘連著最初的文字信息,以及測(cè)試在反向“/describe:”生成文字的過(guò)程中,這些信息在多大程度上脫落。從中,我們可以間接地觀察到“圖生文”和“文生圖”的反復(fù)生成過(guò)程中的基因變異,并通過(guò)“反偵察”的方式試圖接近底層架構(gòu)師的設(shè)定邏輯。
從測(cè)試情況來(lái)看,由這張圖像生成的四條指令從一開始就將人物判定為亞洲女性,接著尋找風(fēng)格與之相對(duì)應(yīng)的藝術(shù)家的作品。在第四條指令里,AI生成器做出一個(gè)安全的指涉,指出這張圖像與韓流、日本古典風(fēng)格以及中國(guó)當(dāng)代藝術(shù)等有相關(guān)性。然而,當(dāng)我將4條指令分別輸入,生成的四張圖像時(shí),情況已然失控—原來(lái)樸素的雙胞胎變身為坐姿職業(yè)化、面容國(guó)際化且商業(yè)屬性濃烈的時(shí)裝模特,人物的膚色也變成了符合西方審美偏好的小麥色—即便這已經(jīng)是AI生成的系列圖像中較為接近初始圖像的一張(圖5)。
四、人機(jī)共創(chuàng)下的個(gè)性化與集體洪流
我們不妨簡(jiǎn)單描述一下AI圖像生成的過(guò)程。首先它有一個(gè)大數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)抓取了大量圖像作為基礎(chǔ)數(shù)據(jù),比如油畫、插圖、動(dòng)漫以及攝影,甚至是歷史圖像。在以大數(shù)據(jù)為基礎(chǔ)的大模型架構(gòu)完成之后,這些圖像全部會(huì)被程序打碎,然后被命名和編碼。當(dāng)指令送達(dá)時(shí),指令也會(huì)根據(jù)先后順序和權(quán)重被打碎,和這些底層被命名的碎片進(jìn)行基因匹配,有限的算力開始工作,為了展示算力的神奇性(當(dāng)然也可能是為了降低過(guò)久的算力壓力),架構(gòu)師們?cè)O(shè)定了算法耗費(fèi)的時(shí)間區(qū)間,在固定的時(shí)間里,圖像碎片堆疊的工作就已經(jīng)開始了。當(dāng)這個(gè)過(guò)程完成以后,我們就獲取了指令所換來(lái)的圖像。即便每個(gè)使用者都擁有一個(gè)個(gè)性化的頻道,但就云端數(shù)據(jù)庫(kù)而言,每個(gè)使用者生成的圖像最終會(huì)匯入大數(shù)據(jù)的集體洪流,再一次經(jīng)歷上述過(guò)程。我們不得不面對(duì)人機(jī)共創(chuàng)中的幾個(gè)重要問題:
(一)頻道特性與數(shù)據(jù)共用
一張圖像的生成,不單是一個(gè)人完成的,也不單是一個(gè)機(jī)器完成的,它涉及共同合作。長(zhǎng)時(shí)間對(duì)個(gè)人所占有的頻道進(jìn)行喂養(yǎng)或指令訓(xùn)練,大數(shù)據(jù)就會(huì)形成自己的記憶,并不斷討好頻道所有者。在某種程度上,頻道所有者看上去似乎具備主體意識(shí)和相應(yīng)的權(quán)力,但從大模型的角度來(lái)看,這些特性都會(huì)變成共用的數(shù)據(jù)。
(二)數(shù)據(jù)供養(yǎng)和圖像反饋
筆者在這里使用了“供養(yǎng)”一詞,是因?yàn)樵贏I里,如同在現(xiàn)實(shí)中,對(duì)于信仰人物的付出儀式一樣,需要時(shí)間、財(cái)力以及虔誠(chéng)度,而在大多數(shù)情況下,我們的付出和收獲從來(lái)不成正比。在不可操控的界面和算法下,即便我們輸入了很多限定性指令,也未必能夠獲得較為令人滿意的圖像。
(三)審美偏差和在線逃逸
意外總是頻繁發(fā)生,并令人驚喜。生成的圖像的成熟度和美學(xué)樣式,也經(jīng)常使我們亢奮。例如,當(dāng)我們看到生成出來(lái)的圖像跟我們最初想象的完全不一樣,但該畫面又特別驚艷的時(shí)候,到底是接受還是放棄這樣的結(jié)果?大部分人可能偏向于接受,而接受以后面臨的問題就在于人被數(shù)據(jù)訓(xùn)練,被數(shù)據(jù)喂養(yǎng),而不是在塑造它,長(zhǎng)此以往,就會(huì)形成舒適區(qū)。抵抗被馴養(yǎng)的辦法不是逃避,而是達(dá)成在線逃逸的目的。所謂“逃逸”就是通過(guò)不斷地修正指令,糾正審美偏差,使自身從AI設(shè)定的圖像邏輯和較流行的審美偏好中擺脫出來(lái),建立符合自己意志的圖像生成取向。
(四)時(shí)間黑洞與數(shù)據(jù)“勞工”
AI表面上的低廉和快捷,造成了很多圖像剩余。生成這些被我們看作廢棄物的圖像,消耗了大量的時(shí)間成本。就筆者生成圖像的體驗(yàn)來(lái)測(cè)算,最初訓(xùn)練頻道小模型,大致需要花費(fèi)一天的時(shí)間才有可能生成一張比較滿意的圖像,后期這種訓(xùn)練的時(shí)間會(huì)逐漸遞減,但這個(gè)過(guò)程無(wú)異于時(shí)間黑洞,創(chuàng)作者被其卷入。對(duì)于不斷地在升級(jí)和更新的AI來(lái)說(shuō),大量的使用者并不是利益攫取者,而是數(shù)據(jù)和模型大公司的數(shù)據(jù)勞工,每一個(gè)模型的豐富與升級(jí)均有賴于大量使用者的喂養(yǎng)和勞作,而數(shù)據(jù)和模型的開發(fā)者由此獲得用于改進(jìn)模型的參數(shù)。
五、攝影與AI圖像的關(guān)系思辨
攝影從業(yè)者需要將自己從媒介的焦慮里掙脫出來(lái),以較為坦然的心態(tài)面對(duì)AI生成技術(shù)。如果要形象地描述AI生成,筆者認(rèn)為它就是圖像的雜交,是圖像生物學(xué)意義上的混血樣本。讓攝影從業(yè)者焦慮的類攝影模型無(wú)非是對(duì)攝影的模擬—以攝影作為表象,并利用攝影的成像范式。
AI圖像與攝影的關(guān)系到底如何?我們不妨來(lái)對(duì)比一下。攝影調(diào)動(dòng)的人體器官是眼睛、手和腳,人們拿著相機(jī)走出去,用眼睛通過(guò)取景框觀看世界,在情動(dòng)之時(shí)用手按下快門。AI圖像不遵循這種工作邏輯,它動(dòng)用人的大腦和語(yǔ)言構(gòu)建一個(gè)畫面,人們要用文字表述指令。在攝影中,相機(jī)是人和世界的中介,在AI中,算法是人和數(shù)據(jù)的中介。攝影的結(jié)果是產(chǎn)生關(guān)于世界的圖像,被拍下的圖像是現(xiàn)實(shí)世界的鏡像,而我們反過(guò)來(lái)通過(guò)鏡像理解世界;AI的圖像應(yīng)該被看作是圖像的世界,因?yàn)樗褂么罅康膱D像形成了一個(gè)圖像的海洋,它是關(guān)于圖像的圖像。如果我們把攝影看成現(xiàn)實(shí)主義的倒影,那么AI圖像就是神秘主義的禱告。
自AI誕生之日起,其生成的結(jié)果就面臨著追問,尤其是版權(quán)問題。攝影是把世界進(jìn)行共享,攝影家通過(guò)操作相機(jī),提供主觀意志形成的圖像,而AI則是共享圖像碎片?,F(xiàn)實(shí)并沒有版權(quán),大家共享,圖像碎片也因?yàn)楸淮蛩槎チ税鏅?quán)的屬性。但是,我們?cè)贏I圖像的生成過(guò)程中看到,使用者們都是通過(guò)主觀意志和勞動(dòng),使AI能夠按照自己的指令去創(chuàng)造圖像,如果攝影有版權(quán),AI自然也應(yīng)該有版權(quán)。事實(shí)上,對(duì)于版權(quán)的追問,反而有悖于攝影這一媒介本身的延展,更遑論AI圖像。在芝加哥大學(xué)圖像學(xué)學(xué)者W.J.T.米歇爾看來(lái),“攝影既不是藝術(shù)、也不是非藝術(shù)(而是技術(shù)),它是一種新的生產(chǎn)形式,它改變了藝術(shù)的整個(gè)本質(zhì)”[3]。而美國(guó)“十月”學(xué)派的看法更具針對(duì)性,“攝影作為技術(shù)復(fù)制時(shí)代最具代表性的媒介之一,它的可復(fù)制性、非原創(chuàng)性已經(jīng)滲入藝術(shù)創(chuàng)作的底層邏輯?!盵4]這句話意味著,口口聲聲踐行攝影的人們,似乎執(zhí)意讓攝影這一去中心化的媒介回到少數(shù)人手中,而“原創(chuàng)”作為一種資本邏輯和術(shù)語(yǔ),在創(chuàng)作實(shí)踐中被提高到一個(gè)異常的地位。回顧“圖像的一代”里的辛迪-舍曼、芭芭拉-克魯格以及理查德-普林斯的實(shí)踐,我們就會(huì)明白《十月》雜志里的這句話似乎對(duì)大多數(shù)攝影從業(yè)者而言是一種嘲諷,而AI圖像似乎更應(yīng)該如此。
(海杰,獨(dú)立策展人、影像批評(píng)家,青島電影學(xué)院攝影藝術(shù)與技術(shù)系學(xué)科帶頭人)
注釋:
[1] [3] [4] 羅莎琳-克勞斯:《追溯納達(dá)爾》,載于李鑫、徐曠之編,《重塑攝影:〈十月〉與當(dāng)代攝影理論》,第42至43頁(yè)、第5頁(yè)、第5頁(yè),該書為內(nèi)部學(xué)術(shù)交流資料,尚未正式出版。
[2] [美]約翰-塔格:《表征的重負(fù):論攝影與歷史》,重慶大學(xué)出版社2018年版,第6頁(yè)。