文|齊健
隨著數(shù)字技術(shù)的飛速發(fā)展,越來越多的行業(yè)對(duì)于專業(yè)可視化應(yīng)用的需求加速上漲。例如,在制造業(yè)應(yīng)用中,CAD設(shè)計(jì)階段對(duì)產(chǎn)品的整機(jī)建模,零部件復(fù)雜的大型裝配體設(shè)計(jì)等,CAE仿真過程中對(duì)材料的模擬、拓?fù)鋬?yōu)化以及多物理場(chǎng)仿真實(shí)驗(yàn)等,再到后期銷售和推廣階段的效果展示,都對(duì)圖形渲染效率和GPU運(yùn)算能力提出了嚴(yán)苛的要求。
在過去的20年中,專業(yè)圖形顯示技術(shù)的更新迭代日趨加快。NVIDIA在圖形顯卡領(lǐng)域,針對(duì)不同行業(yè)的用戶推出了眾多專業(yè)GPU產(chǎn)品與應(yīng)用解決方案,領(lǐng)域覆蓋了電視、娛樂、傳媒、現(xiàn)場(chǎng)直播、汽車制造、設(shè)計(jì)、大數(shù)據(jù)運(yùn)算、科學(xué)運(yùn)算、專業(yè)電影制作以及AI等。
近年來,NVIDIA推出的GPU架構(gòu),從Kepler到Maxwel、Pascal、Turing,再到最近發(fā)布的Ampere架構(gòu),NVIDIA最近發(fā)布的五代GPU架構(gòu)都在AEC、BIM、CADCAM以及仿真等領(lǐng)域推出了大量重要更新,以期提升NVIDIA GPU在更多專業(yè)應(yīng)用領(lǐng)域的性能表現(xiàn)。
2020年秋季推出的基于全新Ampere架構(gòu)的NVIDIA RTX A6000和NVIDIA A40,采用了全新的RT Core、Tensor Core和CUDA Core加速圖形、渲染、計(jì)算和AI。NVIDIA RTX A6000和NVIDIA A40通過突破性的技術(shù)向用戶提供更強(qiáng)大的性能,其中最重要的更新就是RTX GPU的升級(jí),作為第二代RTX GPU,Ampere架構(gòu)與前代RTX GPU的Turing架構(gòu)相比,主要有三方面優(yōu)勢(shì):首先,新一代的SM(新一代流式多處理器)架構(gòu)最高可以提供39TFLOPS的FP32算力。第二代RT Core相對(duì)于第一代Turing架構(gòu)里的RT Core最高可以提供76 TFLOPS光線追蹤算力。
RT Core是NVIDIA在Turing架構(gòu)中首次引入的專門針對(duì)光線追蹤的運(yùn)算單元,采用BVX算法,使用一個(gè)專門的電路運(yùn)算光線軌跡及當(dāng)前畫面里3D建模之間的鏡面反射、慢反射或者半折射等類似的復(fù)雜光線互動(dòng),使每一個(gè)畫面渲染精度更高,更加逼真。
Ampere架構(gòu)采用了第二代的RT Core,最高可提供2倍于上一代的吞吐量,以及并行光線追蹤、著色和計(jì)算功能。Ampere架構(gòu)針對(duì)BVX算法做了大量?jī)?yōu)化,例如Motion flow、陰影功能等。可以把很多需要分開處理的步驟,或需要由不同核心處理的任務(wù),整合在一起,利用GPU的不同使用周期處理運(yùn)算,提高工作負(fù)載。
除了SM之外,Ampere架構(gòu)還加入了針對(duì)AI應(yīng)用提供高性能的張量運(yùn)算核心Tensor Core,提供最多310個(gè)Tensor TFLOPS的算力,結(jié)合稀疏運(yùn)算特性,可以在圖形計(jì)算和圖形渲染過程中支持基于“深度學(xué)習(xí)”的超采樣抗鋸齒,以及基于AI的降噪等,比之上一代產(chǎn)品提供10倍的加速性能。
張量運(yùn)算核心的總體性能是固定的,運(yùn)算精度提高的同時(shí)運(yùn)算輸出量就會(huì)相應(yīng)降低,無論是FP16半精度,F(xiàn)P32單精度或者FP64以及更高的算法,都會(huì)帶來性能的相應(yīng)降低。第三代Tensor Core,采用FP32單精度運(yùn)算,并支持全新TF32和BF16數(shù)據(jù)格式,最高可提供5倍于上一代的吞吐量,2倍于上一代Turing架構(gòu)的運(yùn)算性能。NVIDIA中國區(qū)高級(jí)技術(shù)市場(chǎng)經(jīng)理施澄秋介紹說:“在今天的4K、8K顯示中,單個(gè)像素只是整個(gè)圖形中非常小的一個(gè)點(diǎn),對(duì)于一個(gè)每秒有30幀、60幀、甚至120幀的3D動(dòng)畫來說,單個(gè)像素點(diǎn)出錯(cuò)對(duì)于對(duì)于整個(gè)圖形無傷大雅,所以我們沒有必要用FP64或者更高的精度來進(jìn)行整個(gè)圖形運(yùn)算,用單精度浮點(diǎn)就足以應(yīng)付大部分情況下的圖形或者物理模擬運(yùn)算。在CAD、CAE或者其它比較復(fù)雜的3D設(shè)計(jì)圖形或者仿真工作流程里,采用FP32的精度進(jìn)行運(yùn)算可以有效提高性能功耗比。”
此外,全新Ampere架構(gòu)支持DDR6顯存,NVIDIA RTX A6000具備48GB GPU內(nèi)存,單個(gè)GPU可提供的最大內(nèi)存,通過NVLink連接兩個(gè)GPU可以擴(kuò)展到96GB;支持所有常規(guī)ISV應(yīng)用程序。通過ISV認(rèn)證,無論是工作站還是服務(wù)器,都更易于部署。虛擬化,通過添加NVIDIA虛擬工作站等NVIDIA虛擬GPU軟件,為遠(yuǎn)程用戶提供針對(duì)圖形工作負(fù)載和強(qiáng)大虛擬工作站實(shí)例的大規(guī)模支持,賦力高端設(shè)計(jì)、AI和計(jì)算工作負(fù)載的更大規(guī)模工作流程;PCIe Gen 4,提供2倍于上一代的帶寬,可以加速Lenovo ThinkStation P620等PCIe Gen 4服務(wù)器和工作站中數(shù)據(jù)密集型工作負(fù)載(如數(shù)據(jù)科學(xué)、混合渲染和視頻流)的GPU數(shù)據(jù)傳輸。
基于Ampere架構(gòu)推出了另一款GPU產(chǎn)品NVIDIA A40,與NVIDIA RTX A6000在產(chǎn)品性能和硬件配置方面相差不多,與NVIDIA RTX A6000采用的主動(dòng)式散熱方案不同,NVIDIA A40采用被動(dòng)式散熱方案,可以更好地節(jié)省空間,提升性能和功耗比,更適合于需要通過管理風(fēng)道,組建機(jī)架式服務(wù)器控制功耗、降低噪音,提高管理便利的數(shù)據(jù)中心場(chǎng)景中。
在NVIDIA的GTC 2020秋季發(fā)布會(huì)上,NVIDIA還宣布了NVIDIA Omniverse平臺(tái)進(jìn)入公測(cè)階段,并在2020年秋季開放下載。數(shù)千萬設(shè)計(jì)師、建筑師和其他領(lǐng)域的創(chuàng)作者將能通過該平臺(tái)實(shí)現(xiàn)本地或遠(yuǎn)程實(shí)時(shí)協(xié)作。NVIDIA Omniverse是首個(gè)基于NVIDIA RTX的3D仿真模擬和協(xié)作平臺(tái)。該平臺(tái)融合了物理和虛擬世界,能夠?qū)崟r(shí)模擬出細(xì)節(jié)逼真的現(xiàn)實(shí)世界。
作為一個(gè)跨軟件、跨應(yīng)用程序的在線合作式/分享式總體解決方案平臺(tái),用戶僅需利用NVIDIA Omniverse單一平臺(tái)就可以完成多個(gè)設(shè)計(jì)師/多個(gè)科學(xué)家/多個(gè)工作人員之間的協(xié)同式分布合作。
NVIDIA Omniverse整合了NVIDIA在圖形、仿真和AI領(lǐng)域的眾多技術(shù),例如光線追蹤、毛發(fā)、粒子、物理模擬和VR/AR等??梢岳肗VIDIA各式各樣的軟件堆疊,包括NVIDIA最重要的物理加速、材質(zhì)描述庫、MDL語言以及NVIDIA和PhysX合作的USD通用場(chǎng)景描述語言。用戶可以利用平臺(tái)存取數(shù)據(jù)資產(chǎn)讓各式各樣的第三方ISV、軟件專業(yè)工具程序進(jìn)行調(diào)用。一切工作都能在NVIDIA Omniverse平臺(tái)上實(shí)時(shí)一鍵分享、合作以及實(shí)現(xiàn)協(xié)同分布式遠(yuǎn)程辦公。
NVIDIA Omniverse還獲得了許多主要的軟件領(lǐng)導(dǎo)者 支 持, 例 如 Adobe、Autodesk、Bentley Systems、Robert McNeel & Associates和SideFX等。Blender正在與NVIDIA合作,通過加入U(xiǎn)SD功能實(shí)現(xiàn)Omniverse與其軟件的集成。NVIDIA還與其他領(lǐng)先的軟件供應(yīng)商合作,讓所有藝術(shù)家和設(shè)計(jì)師都可以在自己選擇的應(yīng)用上通過Omniverse開展協(xié)作。
借助NVIDIA Omniverse平臺(tái),無論用戶使用何種軟件、工具和平臺(tái),都能以NVIDIA Omniverse為入口,完成分發(fā)協(xié)調(diào)工作,并整合工作流程,讓所有用戶、設(shè)計(jì)師、科學(xué)家和工程人員都在同一個(gè)NVIDIA Omniverse平臺(tái)上完成分工和協(xié)作。遠(yuǎn)程團(tuán)隊(duì)可以通過該平臺(tái)同時(shí)開展項(xiàng)目協(xié)作,例如負(fù)責(zé)3D建筑設(shè)計(jì)迭代的建筑師、修改3D場(chǎng)景的動(dòng)畫師以及協(xié)作開發(fā)自動(dòng)駕駛汽車的工程師,整個(gè)協(xié)作就像是在線上共同編輯文檔一樣簡(jiǎn)單。
NVIDIA在為期一年的搶先體驗(yàn)計(jì)劃之后發(fā)布了公測(cè)版Omniverse。搶先體驗(yàn)項(xiàng)目期間,愛立信、Foster +Partners、工業(yè)光魔(ILM)和其他40多家公司以及多達(dá)400位個(gè)人創(chuàng)作者和開發(fā)者對(duì)該平臺(tái)進(jìn)行了評(píng)估并向NVIDIA工程團(tuán)隊(duì)提供了反饋。