黎坤
曾幾何時,“有圖有真相”這句話架起了互聯(lián)網(wǎng)用戶之間岌岌可危的信任橋梁,但在人工智能時代,這句話也已經(jīng)瀕臨失效的邊緣,因為人工智能畫的圖,雖然細(xì)節(jié)上如果非常認(rèn)真地甄別依然可以找到瑕疵,但精度已經(jīng)達(dá)到了照片級別。為了驗證它的真實性,我就將人工智能生成的風(fēng)景、街景和人像照片,和真實拍攝的照片放在一起,在電腦報編輯部做了一次“黑盒測試”,事實證明所有人都無法準(zhǔn)確判斷真?zhèn)?,雖然樣本不大,但也足夠說明人工智能在繪畫領(lǐng)域的“天賦”。
雖然人工智能畫圖并不是特別新鮮的產(chǎn)物,在2022年就已經(jīng)有大量的人工智能藝術(shù)作品以匿名的形式參加了各類比賽和展覽,但畢竟當(dāng)時只是少數(shù)人的玩具,而現(xiàn)在就不一樣了,基本上只要你有臺可以上網(wǎng)的電腦,就能玩到最新的人工智能畫圖軟件,比如最近十分火爆的Midjourney,它的出圈程度絲毫不亞于今年初的ChatGPT,因為可以生成以假亂真的圖片,甚至還出現(xiàn)了某國前總統(tǒng)的一系列連續(xù)劇式的“新聞?wù)掌保晒Α耙绷巳蚧ヂ?lián)網(wǎng)玩家的關(guān)注。
事實上Midjourney的本質(zhì)就是一個用文本生成圖像的人工智能算法,在今年3月升級到V5版本后,無論畫質(zhì)、細(xì)節(jié)、準(zhǔn)確性等各個關(guān)鍵要素的性能都得到了質(zhì)的飛躍。Midjourney最大的優(yōu)勢就是完全在線操作,只需要在聊天工具里為它提供提示詞,就能按它所理解的文本意圖來生成圖片內(nèi)容。根據(jù)我們的測試來看,它可以在一分鐘之內(nèi)就提供四張圖片,你可以選擇全部重新生成,或者選擇其中一張做微調(diào)或放大,圖像生成的效果直接取決于提示詞的精準(zhǔn)度,而且英文的準(zhǔn)確性遠(yuǎn)高于中文,所以大多數(shù)人都會使用GPT-4,比如新必應(yīng)瀏覽器自帶的版本來生成詳細(xì)的英文提示詞。
不過,Midjourney最大的問題是基本無法按用戶的需求去進(jìn)行精修,更多是傾向于“一次性操作”。除此之外,它為所有用戶提供了25張圖像的試用額度,超額后就需要購買訂閱才能繼續(xù)使用,而訂閱又按算力、版權(quán)許可等分為10/30/60美元每月這三個不同的價位,試用用戶的授權(quán)許可是CCBY-NC4.0,也就是發(fā)布需要署名(BY)且只能非商業(yè)性使用(NC),三個付費訂閱則可以無限制使用。
作為對比,另外一個人工智能畫圖“高手”StableDiffusion就不一樣了,打個不恰當(dāng)?shù)谋确剑篗idjourney就像是手機(jī)的一鍵美顏,任何人都是開箱即用,而StableDiffusion就是Photoshop,需要一定的技術(shù)基礎(chǔ),但功能更強(qiáng)大。它雖然也有線上免費版本,但如果想要使用全部功能就需要安裝本地應(yīng)用,而且安裝過程比較復(fù)雜,這也就排除掉了大多只是想嘗試玩玩的用戶。但在熟悉使用之后,StableDiffusion的優(yōu)勢就很突出了,比如它有上千個現(xiàn)成的模型可以調(diào)用,你也可以自己利用訓(xùn)練器訓(xùn)練自己想要的模型,畫面風(fēng)格遠(yuǎn)多于Midjourney,而且可以重新生成圖像的某一個部分,甚至還可以進(jìn)行畫面擴(kuò)展,與此同時,你可以給它投喂參考圖片,去模擬構(gòu)圖和人物姿勢。最重要的是StableDiffusion完全開源,既不需要付費訂閱就可以任意生成,也可以擁有圖像的商用許可。當(dāng)然,因為是本地運行,所以StableDiffusion對電腦性能是有一定要求的,尤其是顯卡顯存,會直接影響到輸出分辨率的高低。
雖然Midjourney和StableDiffusion都是全球范圍內(nèi)的“當(dāng)紅炸子雞”,但它們對于國內(nèi)用戶來說卻有著一定的使用鴻溝,比如全英文界面就足以勸退大多想湊個熱鬧的玩家。那如果你也想玩人工智能繪畫,有相應(yīng)的國產(chǎn)軟件選擇么?答案當(dāng)然是肯定的,比如百度的文心大模型和萬興科技的萬興愛畫。
百度文心大模型下的文心一格是目前國內(nèi)最具代表性的人工智能畫圖平臺,生成圖片就需要消耗“電量”,“電量”可以通過完成任務(wù)來領(lǐng)取,也可以直接按數(shù)量進(jìn)行購買。從生成效果來看,雖然主頁上通過精心篩選的優(yōu)秀作品看起來都還不錯,但自己生成時還是要摸索一下,比如圖像尺寸和生成數(shù)量的不同會產(chǎn)生不同的“電量”消耗,默認(rèn)的1024×1024分辨率單張要2個“電量”,最高2048×2048單張則需要6個“電量”,12個不同的畫圖風(fēng)格也會給出不一樣的圖像……從我們消耗了六個賬號近300個“電量”的體驗來看,文心一格目前并不太擅長寫實類的圖片生成,綜合效果和Midjourney等平臺還是有一定的差距。
至于萬興愛畫,它可以任意次數(shù)地免費生成隨機(jī)圖像,但從生成速度來看其實就是調(diào)用了其他用戶或系統(tǒng)預(yù)設(shè)的圖像而已,而每個賬號每天只免費提供2次自定義提示詞的創(chuàng)作機(jī)會,想要更多的創(chuàng)作就只能掏腰包按次數(shù)購買了,這個數(shù)量明顯連試錯都不夠用,再加上它生成的圖像分辨率只有1024×576或768×768,同時還無法回溯自己創(chuàng)作過的圖像,所以總體來說依然處于非常初級的階段。