人工智能雕塑的藝術(shù)形式本身即三維藝術(shù)的拓展,是依托計(jì)算機(jī)儲(chǔ)存器作為信息載體、通過處理器加載并運(yùn)用算法處理信息、在界面中產(chǎn)生雕塑造型的一種藝術(shù)創(chuàng)作方式。其本質(zhì)是對(duì)數(shù)據(jù)運(yùn)算處理的過程與結(jié)果的一種呈現(xiàn)方式,算法是作為人機(jī)交互之間的重要媒介,不同的算法決定了計(jì)算機(jī)如何處理人與可計(jì)算物之間的關(guān)系。
在計(jì)算機(jī)科學(xué)領(lǐng)域中,計(jì)算機(jī)學(xué)家與藝術(shù)對(duì)人工智能算法的研究有所區(qū)別。在計(jì)算機(jī)科學(xué)領(lǐng)域,專家們對(duì)人工智能的主要研究方向是識(shí)別與還原,但受制于計(jì)算機(jī)算力的發(fā)展,識(shí)別與還原需要依靠大量的計(jì)算機(jī)運(yùn)算成本。從上面的信息可以看到在計(jì)算機(jī)圖形學(xué)的發(fā)展上,二維平面的發(fā)展速度永遠(yuǎn)比三維立體的技術(shù)發(fā)展要更快。為了直觀地顯示差異,我們進(jìn)行一個(gè)簡單的計(jì)算比較。假設(shè)一張9×9的圖片是一個(gè)灰度圖(彩色圖片所含信息較多,為了公平比對(duì)此處只用灰度圖與白模進(jìn)行對(duì)比),每個(gè)像素占用一個(gè)字節(jié),那么這張圖片的大小是81字節(jié)。如果我們假設(shè)一個(gè)9×9×9的立方體是由27個(gè)小立方體組成,每個(gè)小立方體有8個(gè)頂點(diǎn)和6個(gè)面,那么這個(gè)立方體的頂點(diǎn)數(shù)是216個(gè),面數(shù)是162個(gè)。如果我們假設(shè)每個(gè)頂點(diǎn)占用12個(gè)字節(jié)(3個(gè)浮點(diǎn)數(shù)表示坐標(biāo)x、y、z),每個(gè)面占用12個(gè)字節(jié)(3個(gè)整數(shù)表示頂點(diǎn)索引),那么這個(gè)立方體的大小是3888字節(jié)。粗略估計(jì)運(yùn)算速度相差為48倍。
同時(shí)由于三維數(shù)據(jù)格式的不同,在算法上必須對(duì)網(wǎng)格、點(diǎn)云、體素等通過不同方式采集而來的三維數(shù)據(jù)進(jìn)行對(duì)齊、標(biāo)注后才能進(jìn)入深度學(xué)習(xí)環(huán)節(jié)。在還原的目的下,深度學(xué)習(xí)算法本質(zhì)上是以人類的意識(shí)再現(xiàn)人類的某些行為,在深度學(xué)習(xí)的算法中這種行為表現(xiàn)為“認(rèn)識(shí)”,是對(duì)客觀事物的識(shí)別,因此該學(xué)科也被計(jì)算機(jī)學(xué)科分類為計(jì)算機(jī)視覺,經(jīng)過深度學(xué)習(xí)之后,該數(shù)據(jù)集會(huì)生成一個(gè)算法模型,套用該算法模型即可對(duì)指定的物體進(jìn)行識(shí)別還原。
2014年論文《Depth Map Prediction from a Single Image using a Multi-Scale Deep Network》提出,經(jīng)過神經(jīng)積卷網(wǎng)絡(luò)算法(CNN)的深度學(xué)習(xí)訓(xùn)練,在NYU depth和kittl兩個(gè)數(shù)據(jù)集中進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,得到一個(gè)包含分為全局粗估計(jì)和局部精估計(jì),可以由粗到精估計(jì)的網(wǎng)絡(luò)。該網(wǎng)絡(luò)可以通過單張圖片,在三維空間中對(duì)物體的深度進(jìn)行復(fù)現(xiàn)。該算法模型通過對(duì)數(shù)據(jù)集中的物體集合進(jìn)行學(xué)習(xí),大致掌握了一類物體(如椅子)各部件間的深度關(guān)系,使得三維模型在重建過程中只需通過二維圖片中物體特征的大致頂點(diǎn)推斷出該部件功能性,并依此推導(dǎo)出與其關(guān)聯(lián)組件(如扶手與坐墊)的空間深度關(guān)系,達(dá)到還原照片三維造型的效果。以人類的視角去觀察整個(gè)學(xué)習(xí)過程,算法的作用在于使計(jì)算機(jī)“觸摸”到了我們所需要使其辨識(shí)的物體,圖示是起到檢索的作用,最后在三維空間中,計(jì)算機(jī)再次將這個(gè)“抽象”的形體重現(xiàn)。為何說這個(gè)“物體”是抽象的,在算法的作用下,計(jì)算機(jī)對(duì)數(shù)據(jù)集中的該物體(約100—300件)的頂點(diǎn)位置進(jìn)行標(biāo)記,最終得出的頂點(diǎn)位置是這個(gè)數(shù)據(jù)集所有物體的頂點(diǎn)位置平均值,最后識(shí)別與復(fù)現(xiàn)的物體并不是數(shù)百件物體中的一件,所以該形體是“抽象”的,神經(jīng)積卷網(wǎng)絡(luò)算法(CNN)的方式打開了人工智能開始從三維空間中學(xué)習(xí)造型與空間關(guān)系的基礎(chǔ)。
所謂計(jì)算機(jī)人工智能應(yīng)是將任務(wù)轉(zhuǎn)換為計(jì)算問題然后由計(jì)算機(jī)自行解決,因此在CNN算法的基礎(chǔ)上,2016年吳佳俊提出了對(duì)抗生成網(wǎng)絡(luò)(3D-GAN)進(jìn)行人工智能訓(xùn)練的方式,該方式對(duì)照單視圖生成三維模型有所擴(kuò)展。該算法主要有兩個(gè)神經(jīng)極端網(wǎng)絡(luò)算法嵌套組合而成,它們的功能各不相同,分別是生成與鑒別,實(shí)現(xiàn)無監(jiān)督或半監(jiān)督學(xué)習(xí)(對(duì)建模與元數(shù)據(jù)的相似程度通過鑒別器判別和打回),在單個(gè)CNN算法結(jié)構(gòu)中,為了保證生成模型的精度與質(zhì)量,數(shù)據(jù)中的三維數(shù)據(jù)需要進(jìn)行精準(zhǔn)的語義標(biāo)注,使計(jì)算機(jī)在深度學(xué)習(xí)過程中,能夠準(zhǔn)確檢索到正確的信息,是為有監(jiān)督學(xué)習(xí)。而無監(jiān)督學(xué)習(xí)中,用少量或者不標(biāo)注的方式進(jìn)行深度學(xué)習(xí),這種算法下生成的模型具有更大的隨機(jī)性,一般使用在GAN模型的數(shù)據(jù)不會(huì)進(jìn)行標(biāo)注,利用未標(biāo)注過的數(shù)據(jù)來訓(xùn)練模型,使其能夠發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式和規(guī)律,從而增加數(shù)據(jù)的可解釋性和價(jià)值。生成指令不再需要圖片輔助,通過指定的生成類型和隨機(jī)函數(shù),可以快速生成多種變化造型。這為日后通過自然語言生成3D模型打下了基礎(chǔ)。
2023年清華大學(xué)TSAIL團(tuán)隊(duì)開發(fā)名為ProlificDreamer的擴(kuò)散模型(圖一),該模型可以通過自然語言的文本方式進(jìn)行三維模型的生成,是結(jié)合了文本生成圖像算法與圖像生成三維模型的生成方式。與對(duì)抗生成網(wǎng)絡(luò)相比,對(duì)三維模型數(shù)據(jù)集的依賴變得更少,可以極大地縮小模型的體積與訓(xùn)練時(shí)間,更方便的部署方式使得大規(guī)模應(yīng)用成為可能,仔細(xì)觀察這幾年的變化,純?nèi)S的人工智能學(xué)習(xí)算法對(duì)比GAN的算法并未有更多提升,根本上局限于三維學(xué)習(xí)的數(shù)據(jù)集種類過少,數(shù)據(jù)分類與標(biāo)注對(duì)比二維圖像,無論技術(shù)還是算力上所需花費(fèi)的時(shí)間與人力與產(chǎn)生的效益難以成正比,因此不得已采取此種“曲線救國”的方式先行占據(jù)更多的應(yīng)用場景。但這種識(shí)別與還原為目的的人工智能算法在當(dāng)下的應(yīng)用場景還相對(duì)較少。在識(shí)別與還原的語境下,算法的媒介作用更多的在于模仿人類的思維學(xué)習(xí)模式,對(duì)于人工智能雕塑創(chuàng)作來說,為時(shí)尚早。
展望人工智能雕塑的未來發(fā)展趨勢和方向,算法的介入使得雕塑未來形態(tài)的展現(xiàn)方式可以跨越虛擬、實(shí)體、虛實(shí)混合三種空間形態(tài),極大地拓展了雕塑藝術(shù)的表達(dá)方式,成為雕塑形式生成的過程的重要驅(qū)動(dòng)力??偨Y(jié)現(xiàn)今人工智能雕塑的發(fā)展進(jìn)程,雖然在計(jì)算機(jī)科學(xué)方向與藝術(shù)研究方向的發(fā)展方向各不相同,但也并非涇渭分明,可喜的消息是,編程技術(shù)也在不斷優(yōu)化中,圖形化節(jié)點(diǎn)化的編程方式開始搭載到數(shù)字軟件之中,代碼的簡化和更多開源算法的分享,使得更多的藝術(shù)家可以更自由地分享實(shí)例與算法結(jié)構(gòu)。得益于算法模型的通用性,不同的算法模型間可以通過相同的代碼接口實(shí)現(xiàn)算法的匹配與嵌套,在充足的算力支持下,識(shí)別生成的人工智能算法模型完全可以與生成式人工智能算法模型進(jìn)行嵌套組合,通過算法媒介打破學(xué)科的壁壘。這種改變是有意義的,它豐富了雕塑藝術(shù)的表現(xiàn)手段和創(chuàng)作空間,也拓展了觀眾的欣賞視野和理解層次。它讓雕塑藝術(shù)不再局限于傳統(tǒng)的材料和形態(tài),而是能夠與現(xiàn)代科技和社會(huì)相結(jié)合,反映出當(dāng)下的時(shí)代精神和人類境遇。