自從ChatGPT一夜之間紅遍全球之后,AI出圖更是一發(fā)不可收拾成為公眾關(guān)注的焦點(diǎn)。不少企業(yè)甚至已經(jīng)開(kāi)始使用AI出圖代替部分設(shè)計(jì)師的工作,頗有“不會(huì)用AI就要被時(shí)代淘汰”的勢(shì)頭。當(dāng)然,雖然目前AI出圖在真實(shí)物體細(xì)節(jié)方面還有較大提升空間,但不能否認(rèn)的是在未來(lái)算力大幅升級(jí)、模型大幅進(jìn)化之后,AI是完全可以勝任部分設(shè)計(jì)工作的。所以,對(duì)AI應(yīng)用有興趣的朋友現(xiàn)在可以行動(dòng)起來(lái)開(kāi)始學(xué)習(xí)啦。不過(guò),工欲善其事必先利其器,那么玩AI出圖,應(yīng)該用什么電腦呢?
我們知道,目前AI出圖分了云端和本地兩種計(jì)算方式,簡(jiǎn)單來(lái)說(shuō)在線方式(例如大名鼎鼎的Midjourney)上手難度較低、對(duì)本地電腦硬件基本沒(méi)有要求,而且出圖質(zhì)量下限高,很容易就能制作出比較不錯(cuò)的圖,但是屏蔽了不少提示詞,所以自由度相對(duì)較低。此外,一般來(lái)講效果比較好的AI云端出圖高級(jí)服務(wù)都需要付費(fèi),而且國(guó)內(nèi)訪問(wèn)也可能受到一定限制。
而本地運(yùn)算方式,例如StableDiffusion雖然上手難度高,但擴(kuò)展性與提示詞的自由度極高,因此出圖質(zhì)量上限也極高。最重要的是,StableDiffusion本身以及可用的海量插件與模型都是免費(fèi)的,自己訓(xùn)練模型也比較方便,更適合廣大玩家嘗試。
當(dāng)然,既然是本地計(jì)算,要求效率高的話那電腦的硬件性能肯定不能低了。StableDiffusion本地AI出圖主要依靠GPU進(jìn)行計(jì)算(CPU也行,但在并行計(jì)算這方面顯然效率遠(yuǎn)不及GPU,差了幾個(gè)數(shù)量級(jí)),同時(shí)對(duì)整機(jī)的配置也有一定的要求。因此,想要玩AI出圖的朋友,升級(jí)或者干脆入手一臺(tái)高效的新電腦是非常有必要的。
延伸閱讀:StableDiffusion本地部署注意事項(xiàng)
StableDiffusion的本地部署教程其實(shí)很多了,隨便一搜一大把,我們這里只簡(jiǎn)單總結(jié)一下大家需要注意的幾個(gè)點(diǎn)。
●需要安裝GIT,這是安裝StableDiffusionWebUI的先決條件之一。下載地址:https://git-scm.com/download/win
●需要安裝Python3.10運(yùn)行環(huán)境。miniconda下載地址:https://docs.conda.io/en/main/miniconda.html
●使用NVIDIA卡需要安裝cuDNN(CUDA深度神經(jīng)網(wǎng)絡(luò)庫(kù))最新版,最新版才能讓RTX40系列發(fā)揮出真正的性能。下載地址:http://go.cpcw.com/cudnn2023
要是嫌自己部署太麻煩覺(jué)得無(wú)從下手,也可以直接下載整合包,解壓即可使用。整合包不但包含了StableDiffusion需要的運(yùn)行環(huán)境(如果運(yùn)行不正常,也可以按照前面的提示安裝GIT和Python),也設(shè)置了一些預(yù)設(shè)方案,照顧不同配置特別是不同顯存容量的用戶,使用起來(lái)確實(shí)比較方便,特別適合新手入門。
例如B站UP主“秋葉aaaki”制作的共享整合包,目前最新已經(jīng)升級(jí)到V4版,支持CPU和NVIDIA顯卡CUDA加速,大家可以自行去B站下載。此外,目前AMD顯卡在Windows下只能通過(guò)DirectML實(shí)現(xiàn)StableDiffusion的AI計(jì)算加速(Linux環(huán)境下支持面向GPU計(jì)算的ROCm開(kāi)放軟件平臺(tái),最近ROCm即將登陸Windows),效率遠(yuǎn)不及NVIDIA顯卡的CUDA,所以只有少數(shù)整合包加入了AMD顯卡需要的DirectML庫(kù)(用戶可自行添加),Intel顯卡也差不多是這個(gè)情況,因此要本地AI出圖,NVIDIA顯卡幾乎是唯一值得推薦的選擇。
前面已經(jīng)簡(jiǎn)單提到了本地AI出圖主要靠的是GPU計(jì)算,不過(guò)考慮到整個(gè)設(shè)計(jì)過(guò)程并非只包含AI出圖或訓(xùn)練模型、或者用戶裝臺(tái)電腦來(lái)也不是只針對(duì)AI應(yīng)用,很可能還包括其他設(shè)計(jì)或生產(chǎn)力應(yīng)用需求,所以對(duì)整機(jī)配件的選擇也是有一定要求的,主要涉及處理器、內(nèi)存和顯卡,而磁盤只要是SSD,足夠存放素材與模型文件就可以了,沒(méi)有特別的要求。
處理器
實(shí)際上,就算Intel酷睿i913900K這樣的旗艦級(jí)處理器,在StableDiffusion中出圖的效率也不過(guò)大約是NVIDIA顯卡旗艦RTX4090的1/256、RTX3090Ti的1/141,出一張768×768、采樣步數(shù)50的圖要費(fèi)時(shí)近13分鐘,實(shí)在談不上什么效率。所以只有在電腦沒(méi)有顯卡支持在StableDiffusion中開(kāi)啟硬件加速的情況下,才會(huì)輪到處理器臨時(shí)替補(bǔ)一下。因此,如果只針對(duì)AI出圖裝機(jī),對(duì)處理器的性能其實(shí)沒(méi)有什么太高的要求。
不過(guò),就算對(duì)處理器沒(méi)有特別的要求,但一是考慮到整套電腦的配置不能太老舊,必須要有足夠的擴(kuò)展性和升級(jí)性,二是考慮到整機(jī)還有可能完成其他生產(chǎn)力工作,所以在處理器方面我們制定了不同的選擇方向。
●注重性價(jià)比,千元級(jí)U即可
如果沒(méi)有其他大型生產(chǎn)力應(yīng)用的要求,那么一款最新的千元級(jí)U足以滿足裝機(jī)需求。Intel方面可以考慮酷睿i513400F,AMD方面可以考慮銳龍57600智酷版。為什么不用更便宜的U?一方面是這兩款都能支持PCIe5.0和DDR5內(nèi)存,未來(lái)平臺(tái)升級(jí)PCIe5.0顯卡(這一點(diǎn)很重要,按照NVIDIA和AMD現(xiàn)在的做法,以后中低端顯卡有很大概率只支持8個(gè)PCIe通道,如果處理器或主板不支持PCIe5.0,就會(huì)出現(xiàn)帶寬減半的問(wèn)題)與SSD、擴(kuò)展內(nèi)存容量更方便一些;另一方面是它們的性能應(yīng)付主流生產(chǎn)力應(yīng)用也是能夠勝任的,同時(shí)在價(jià)格上更加親民。
●注重全能性,可考慮高端多核U
如果電腦還要完成AI出圖之外配套的生產(chǎn)力工作(視頻剪輯、3D渲染輸出),那就對(duì)處理器的多線程性能提出了更高的要求,需要選擇核心數(shù)量更多的高端型號(hào)。在這里我們優(yōu)先推薦AMD的銳龍7000系列旗艦型號(hào),例如銳龍97950X和銳龍97900X,而Intel酷睿i913900系列和酷睿i713700系列則次之。
究其原因,就是我們?cè)趯?shí)測(cè)中發(fā)現(xiàn),擁有大量能效核的第13代酷睿在運(yùn)行包括StableDiffusion在內(nèi)的部分生產(chǎn)力軟件時(shí)會(huì)出現(xiàn)核心分配不正確的問(wèn)題,導(dǎo)致重負(fù)載進(jìn)程全部分配給了能效核,性能核則處于閑置狀態(tài),如此就會(huì)使得處理器的運(yùn)算效率大打折扣。相比之下全是大核的銳龍7000系列就不會(huì)出現(xiàn)這樣的問(wèn)題。
內(nèi)存
既然已經(jīng)決定了選擇銳龍7000或者第13代酷睿平臺(tái),那么DDR5內(nèi)存也是必選了。雖說(shuō)第13代酷睿也支持DDR4內(nèi)存,但考慮到整機(jī)未來(lái)的升級(jí)空間和對(duì)其他生產(chǎn)力應(yīng)用的需求,明顯也是選擇帶寬更高的DDR5內(nèi)存更合適。
容量方面,StableDiffusion不用處理器來(lái)出圖的話,也不怎么吃內(nèi)存,32GB綽綽有余。目前內(nèi)存價(jià)格比較給力,雙16GB對(duì)于主流整機(jī)來(lái)說(shuō)也沒(méi)什么壓力,也可以應(yīng)對(duì)更多的生產(chǎn)力應(yīng)用,所以強(qiáng)烈推薦再省也要上雙16GB。
頻率部分,雖說(shuō)更高的內(nèi)存帶寬確實(shí)能帶來(lái)更高的生產(chǎn)力效率,但也要綜合考慮性價(jià)比的問(wèn)題,超過(guò)DDR56400的內(nèi)存還是挺貴的,綜合下來(lái)DDR56400/6000是綜合性價(jià)比最高的型號(hào)。此外,如果選擇AMD銳龍7000平臺(tái),那么DDR56400也是極限了,不用考慮更高的型號(hào)。
顯卡
終于說(shuō)到StableDiffusion出圖的主角配件了。前面已經(jīng)提過(guò),StableDiffusion本地出圖首選CUDA生態(tài)圈無(wú)可替代的NVIDIA顯卡,用DirectML實(shí)現(xiàn)通用計(jì)算的AMD顯卡和Intel顯卡都屬于替補(bǔ)(可以期待AMD顯卡Windows版的ROCm實(shí)裝后會(huì)不會(huì)有所改善),效率和兼容性都難以與NVIDIA顯卡相提并論,與其花時(shí)間去解決A卡和I卡在StableDiffusion中的各種問(wèn)題還不如老老實(shí)實(shí)用N卡省事。
除了GPU的算力之外,StableDiffusion本地出圖最吃的就是顯存了,顯存越大,出圖分辨率也就可以設(shè)得越高。以本文后面的文生圖測(cè)試為例,入門推薦8GB起步,768×768分辨率夠用(大約最高占用到6.9GB);再高一些的1024×1024推薦選用12GB顯存的型號(hào)(最高占用約9GB);再往上可選的就是16GB/20GB/24GB的型號(hào)。當(dāng)然,市場(chǎng)中也有魔改的RTX2060/2080Ti可以做到12GB/22GB顯存,但是很明顯這類卡沒(méi)有質(zhì)保,所以不推薦普通用戶冒險(xiǎn)。然而擁有海量顯存(例如NVIDIAA10080GBPCIe)的專業(yè)計(jì)算卡就不是大眾玩家消費(fèi)得起的了,這里就不再多說(shuō)。
此外,最近NVIDIATeslaP40/M40等“古董級(jí)”純計(jì)算卡也是AI出圖玩家關(guān)注的焦點(diǎn),它們具備超大的24GB顯存,而且二手卡價(jià)格也非常誘人(M40僅需499元,P40還漲了一波從899元飆到1199元了)。但是,這類計(jì)算卡都是被動(dòng)散熱,玩家拿到手需要手動(dòng)改散熱器,而且老舊的Pascal與Maxwell架構(gòu)功耗也非常高,改起散熱來(lái)不但成本高,難度也不是普通用戶能夠HOLD住的。還有最重要的一點(diǎn),老架構(gòu)不支持FP16半精度計(jì)算,而StableDiffusion在半精度模式下可以大幅提升效率并節(jié)省顯存占用,這一點(diǎn)也讓這些老二手卡價(jià)值大打折扣,再加上沒(méi)有可靠的質(zhì)保,所以也不推薦普通玩家折騰。
當(dāng)然,也有一些方法可以降低StableDiffusion對(duì)顯存的占用,讓一些顯存不太夠的顯卡也可以支持更高分辨率出圖,例如Xformers、MultiDiffusionwithTiledVAE,這就不在本文討論范圍內(nèi)了,有興趣的朋友可以自行研究。
那么,我們正在使用的、可買到的NVIDIA顯卡在StableDiffusion中出圖效率到底如何呢?我們對(duì)此也進(jìn)行了一個(gè)橫向測(cè)試,大家可以參考一下。
如圖可以看到我們的StableDiffusion出圖設(shè)置,默認(rèn)使用NVIDIA官方提供的CKPT模型,采樣方式為Eulera,采樣步數(shù)設(shè)置為50,CFGScale(提示詞相關(guān)性)設(shè)置為7.5,生成批次為10,每批生成數(shù)量為2,圖像分辨率為768×768。提示詞為:“beautifulrenderofaTudorstylehousenearthewateratsunset,fantasyforest.Photorealistic,cinematiccomposition,cinematichighdetail,ultrarealistic,cinematiclighting,DepthofField,hyper-detailed,beautifullycolor-coded,8k,manydetails,chiaroscurolighting,++dreamlike,vignette”。
從測(cè)試結(jié)果來(lái)看,除了數(shù)據(jù)條短得都看不見(jiàn)的酷睿i913900K,顯卡這邊的出圖效率基本上就跟價(jià)格成正比了,不過(guò)RTX4070還是略勝了上代更貴的RTX3080,而且RTX4070本身?yè)碛?2GB顯存,相比RTX3080的10GB也更有優(yōu)勢(shì)一些。但是,雖說(shuō)在這樣的設(shè)置下RTX4070Ti比RTX3090略快,但不要忘了RTX3090有海量的24GB顯存,比RTX4070Ti的12GB多了一倍,所以在圖像分辨率提高到一定程度之后肯定是可以反超的。至于底部的GTX1660Ti,由于顯存只有6GB,測(cè)試中已經(jīng)爆顯存了,因此效率明顯低了很大一截,但即便如此速度也是處理器的7.7倍。
綜合來(lái)看,對(duì)于主流用戶來(lái)講,RTX3060其實(shí)是個(gè)綜合性價(jià)比相對(duì)突出的選擇,雖然算力不能與高端卡相提并論,但好在有12GB大顯存,甚至比一些高端卡顯存還大,可以避免一些爆顯存的情況。當(dāng)然,在資金充足的情況下,顯卡自然是越高級(jí)越好了,只是需要注意電源的搭配,畢竟出圖的時(shí)候GPU都是滿載狀態(tài),電源功率不夠那必然是要歇菜的。
經(jīng)過(guò)前面的分析,相信大家已經(jīng)對(duì)StableDiffusion的硬件需求有所了解了。如果還是不知道怎么選擇具體的裝機(jī)配件,我們也給出了低中高三套方案供大家按圖索驥。這三套方案除了可以滿足StableDiffusion的本地AI出圖需求,也能覆蓋不同檔次的生產(chǎn)力應(yīng)用。當(dāng)然,你要用它玩游戲體驗(yàn)也是不錯(cuò)的,畢竟“買前生產(chǎn)力,買后……”,懂的都懂。
基礎(chǔ)款:AI出圖+輕度生產(chǎn)力應(yīng)用
對(duì)于主流用戶來(lái)講,搭載千元U和RTX3060顯卡的方案完全夠用了。雖然前面我們說(shuō)過(guò)第13代酷睿大小核設(shè)計(jì)會(huì)導(dǎo)致一些生產(chǎn)力應(yīng)用負(fù)載只占用小核從而影響效率,但AI出圖主要靠的是顯卡,而且千元這個(gè)級(jí)別酷睿i513400F也確實(shí)是最新一代U中性價(jià)比最突出的了,何況我們遇到核心分配有問(wèn)題還可以手動(dòng)把負(fù)載分配給大核來(lái)解決。
顯卡部分當(dāng)然是AI出圖的重點(diǎn),從前面的測(cè)試可以看到RTX3060出圖效率只是略低于RTX3060Ti,但它擁有12GB大顯存,可以支持更高分辨率出圖,價(jià)格方面也要比RTX3060Ti低不少,如果從AI出圖需求來(lái)看,主流配置選用RTX3060性價(jià)比確實(shí)更高。這里我們選擇的是技嘉RTX3060風(fēng)魔12GB顯存版(注意RTX3060也有8GB顯存版,不要買錯(cuò)了),雙風(fēng)扇設(shè)計(jì)完全能HOLD住散熱,長(zhǎng)時(shí)間計(jì)算出圖不用擔(dān)心穩(wěn)定問(wèn)題。
主流款:全能型設(shè)計(jì)師電腦
全能型設(shè)計(jì)師電腦更多地考慮到了用戶對(duì)于AI出圖之外的生產(chǎn)力應(yīng)用需求,因此處理器方面選擇了全大核、12核24線程的銳龍97900智酷版,不存在進(jìn)程分配不正確的問(wèn)題,同時(shí)不帶X的銳龍97900不開(kāi)PBO滿載功率僅有90W,性能相對(duì)銳龍97900X差距不到10%,因此在2000元級(jí)U中性價(jià)比非常高,不管是視頻剪輯還是3D渲染輸出,都可以提供不錯(cuò)的效率。
顯卡部分則直接上了最新的RTX4070,從算力來(lái)講RTX4070已經(jīng)小超了10GB顯存版的RTX3080,而且它的滿載功率也不過(guò)200W水平,對(duì)散熱和供電的要求都低于RTX3080,長(zhǎng)時(shí)間AI出圖更穩(wěn)定、更節(jié)能。同時(shí)RTX4070顯存也多出2GB,價(jià)格也更低,綜合來(lái)看很明顯比RTX3080更值得選擇。技嘉RTX4070風(fēng)魔也是走性價(jià)比路線的甜品級(jí)RTX4070代表,3風(fēng)扇散熱設(shè)計(jì)對(duì)付200W功率的RTX4070毫無(wú)壓力,同時(shí)噪聲也可以控制到更低的程度。
旗艦款:高效生產(chǎn)力利器
旗艦款配置可以說(shuō)是一套高效生產(chǎn)力利器了,16核32線程的旗艦U銳龍97950X全大核設(shè)計(jì)不用擔(dān)心核心分配問(wèn)題,相比酷睿i913900K在某些生產(chǎn)力應(yīng)用中只能手動(dòng)分配8個(gè)大核的適應(yīng)性優(yōu)勢(shì)明顯,從這一點(diǎn)來(lái)看它確實(shí)比核心數(shù)量更多的酷睿i913900K更占優(yōu)勢(shì)。
顯卡部分,我們這里就選擇了RTX4080,擁有16GB超大顯存,高分辨率AI出圖效率更高。從前面的測(cè)試也可以看到,RTX4080的AI出圖效率已經(jīng)超越了RTX4070Ti大約30%。同時(shí),RTX4080這個(gè)級(jí)的旗艦N卡在視頻剪輯、3D設(shè)計(jì)方面的加速能力也是非常強(qiáng)大的,特別適合有高端設(shè)計(jì)需求的用戶選擇。RTX4080獵鷹則是技嘉RTX4080顯卡家族中的高性價(jià)比款,用不到萬(wàn)元的售價(jià)就做到了旗艦級(jí)的供電與散熱規(guī)格,長(zhǎng)時(shí)間滿載出圖也不用擔(dān)心散熱和穩(wěn)定性的問(wèn)題,這讓整套旗艦配置的購(gòu)買價(jià)值也得到了進(jìn)一步提升。
前有ChatGPT,后有AI出圖,今年AI應(yīng)用突然的大眾化讓我們感受到AI時(shí)代強(qiáng)烈的沖擊,AI甚至在某些應(yīng)用范圍內(nèi)已經(jīng)部分代替了人工(特別是視覺(jué)設(shè)計(jì)類和文案策劃類)。不過(guò),AI作為生產(chǎn)力工具,本來(lái)就是為人類服務(wù)的,我們現(xiàn)在要做的只是去學(xué)習(xí)如何使用這種高效的工具。在未來(lái),會(huì)用AI完成各種工作就像現(xiàn)在用Office軟件辦公一樣普及,可能也會(huì)成為就業(yè)的必備技能。因此,想要不落后于時(shí)代,就和AI一起進(jìn)化,做好準(zhǔn)備“戰(zhàn)未來(lái)”吧!