NVIDIA更新Ampere架構(gòu)，全面提升GPU應(yīng)用性能

2020-11-26 19:28:10齊健

智能制造 2020年12期

文|齊健

隨著數(shù)字技術(shù)的飛速發(fā)展，越來越多的行業(yè)對(duì)于專業(yè)可視化應(yīng)用的需求加速上漲。例如，在制造業(yè)應(yīng)用中，CAD設(shè)計(jì)階段對(duì)產(chǎn)品的整機(jī)建模，零部件復(fù)雜的大型裝配體設(shè)計(jì)等，CAE仿真過程中對(duì)材料的模擬、拓?fù)鋬?yōu)化以及多物理場(chǎng)仿真實(shí)驗(yàn)等，再到后期銷售和推廣階段的效果展示，都對(duì)圖形渲染效率和GPU運(yùn)算能力提出了嚴(yán)苛的要求。

在過去的20年中，專業(yè)圖形顯示技術(shù)的更新迭代日趨加快。NVIDIA在圖形顯卡領(lǐng)域，針對(duì)不同行業(yè)的用戶推出了眾多專業(yè)GPU產(chǎn)品與應(yīng)用解決方案，領(lǐng)域覆蓋了電視、娛樂、傳媒、現(xiàn)場(chǎng)直播、汽車制造、設(shè)計(jì)、大數(shù)據(jù)運(yùn)算、科學(xué)運(yùn)算、專業(yè)電影制作以及AI等。

近年來，NVIDIA推出的GPU架構(gòu)，從Kepler到Maxwel、Pascal、Turing，再到最近發(fā)布的Ampere架構(gòu)，NVIDIA最近發(fā)布的五代GPU架構(gòu)都在AEC、BIM、CADCAM以及仿真等領(lǐng)域推出了大量重要更新，以期提升NVIDIA GPU在更多專業(yè)應(yīng)用領(lǐng)域的性能表現(xiàn)。

Ampere架構(gòu)全面提升GPU應(yīng)用性能

2020年秋季推出的基于全新Ampere架構(gòu)的NVIDIA RTX A6000和NVIDIA A40，采用了全新的RT Core、Tensor Core和CUDA Core加速圖形、渲染、計(jì)算和AI。NVIDIA RTX A6000和NVIDIA A40通過突破性的技術(shù)向用戶提供更強(qiáng)大的性能，其中最重要的更新就是RTX GPU的升級(jí)，作為第二代RTX GPU，Ampere架構(gòu)與前代RTX GPU的Turing架構(gòu)相比，主要有三方面優(yōu)勢(shì)：首先，新一代的SM（新一代流式多處理器）架構(gòu)最高可以提供39TFLOPS的FP32算力。第二代RT Core相對(duì)于第一代Turing架構(gòu)里的RT Core最高可以提供76 TFLOPS光線追蹤算力。

RT Core是NVIDIA在Turing架構(gòu)中首次引入的專門針對(duì)光線追蹤的運(yùn)算單元，采用BVX算法，使用一個(gè)專門的電路運(yùn)算光線軌跡及當(dāng)前畫面里3D建模之間的鏡面反射、慢反射或者半折射等類似的復(fù)雜光線互動(dòng)，使每一個(gè)畫面渲染精度更高，更加逼真。

Ampere架構(gòu)采用了第二代的RT Core，最高可提供2倍于上一代的吞吐量，以及并行光線追蹤、著色和計(jì)算功能。Ampere架構(gòu)針對(duì)BVX算法做了大量?jī)?yōu)化，例如Motion flow、陰影功能等。可以把很多需要分開處理的步驟，或需要由不同核心處理的任務(wù)，整合在一起，利用GPU的不同使用周期處理運(yùn)算，提高工作負(fù)載。

除了SM之外，Ampere架構(gòu)還加入了針對(duì)AI應(yīng)用提供高性能的張量運(yùn)算核心Tensor Core，提供最多310個(gè)Tensor TFLOPS的算力，結(jié)合稀疏運(yùn)算特性，可以在圖形計(jì)算和圖形渲染過程中支持基于“深度學(xué)習(xí)”的超采樣抗鋸齒，以及基于AI的降噪等，比之上一代產(chǎn)品提供10倍的加速性能。

張量運(yùn)算核心的總體性能是固定的，運(yùn)算精度提高的同時(shí)運(yùn)算輸出量就會(huì)相應(yīng)降低，無論是FP16半精度，F(xiàn)P32單精度或者FP64以及更高的算法，都會(huì)帶來性能的相應(yīng)降低。第三代Tensor Core，采用FP32單精度運(yùn)算，并支持全新TF32和BF16數(shù)據(jù)格式，最高可提供5倍于上一代的吞吐量，2倍于上一代Turing架構(gòu)的運(yùn)算性能。NVIDIA中國區(qū)高級(jí)技術(shù)市場(chǎng)經(jīng)理施澄秋介紹說：“在今天的4K、8K顯示中，單個(gè)像素只是整個(gè)圖形中非常小的一個(gè)點(diǎn)，對(duì)于一個(gè)每秒有30幀、60幀、甚至120幀的3D動(dòng)畫來說，單個(gè)像素點(diǎn)出錯(cuò)對(duì)于對(duì)于整個(gè)圖形無傷大雅，所以我們沒有必要用FP64或者更高的精度來進(jìn)行整個(gè)圖形運(yùn)算，用單精度浮點(diǎn)就足以應(yīng)付大部分情況下的圖形或者物理模擬運(yùn)算。在CAD、CAE或者其它比較復(fù)雜的3D設(shè)計(jì)圖形或者仿真工作流程里，采用FP32的精度進(jìn)行運(yùn)算可以有效提高性能功耗比。”

此外，全新Ampere架構(gòu)支持DDR6顯存，NVIDIA RTX A6000具備48GB GPU內(nèi)存，單個(gè)GPU可提供的最大內(nèi)存，通過NVLink連接兩個(gè)GPU可以擴(kuò)展到96GB；支持所有常規(guī)ISV應(yīng)用程序。通過ISV認(rèn)證，無論是工作站還是服務(wù)器，都更易于部署。虛擬化，通過添加NVIDIA虛擬工作站等NVIDIA虛擬GPU軟件，為遠(yuǎn)程用戶提供針對(duì)圖形工作負(fù)載和強(qiáng)大虛擬工作站實(shí)例的大規(guī)模支持，賦力高端設(shè)計(jì)、AI和計(jì)算工作負(fù)載的更大規(guī)模工作流程；PCIe Gen 4，提供2倍于上一代的帶寬，可以加速Lenovo ThinkStation P620等PCIe Gen 4服務(wù)器和工作站中數(shù)據(jù)密集型工作負(fù)載（如數(shù)據(jù)科學(xué)、混合渲染和視頻流）的GPU數(shù)據(jù)傳輸。

基于Ampere架構(gòu)推出了另一款GPU產(chǎn)品NVIDIA A40，與NVIDIA RTX A6000在產(chǎn)品性能和硬件配置方面相差不多，與NVIDIA RTX A6000采用的主動(dòng)式散熱方案不同，NVIDIA A40采用被動(dòng)式散熱方案，可以更好地節(jié)省空間，提升性能和功耗比，更適合于需要通過管理風(fēng)道，組建機(jī)架式服務(wù)器控制功耗、降低噪音，提高管理便利的數(shù)據(jù)中心場(chǎng)景中。

跨軟件、跨應(yīng)用程序的在線協(xié)作平臺(tái)NVIDIA Omniverse

在NVIDIA的GTC 2020秋季發(fā)布會(huì)上，NVIDIA還宣布了NVIDIA Omniverse平臺(tái)進(jìn)入公測(cè)階段，并在2020年秋季開放下載。數(shù)千萬設(shè)計(jì)師、建筑師和其他領(lǐng)域的創(chuàng)作者將能通過該平臺(tái)實(shí)現(xiàn)本地或遠(yuǎn)程實(shí)時(shí)協(xié)作。NVIDIA Omniverse是首個(gè)基于NVIDIA RTX的3D仿真模擬和協(xié)作平臺(tái)。該平臺(tái)融合了物理和虛擬世界，能夠?qū)崟r(shí)模擬出細(xì)節(jié)逼真的現(xiàn)實(shí)世界。

作為一個(gè)跨軟件、跨應(yīng)用程序的在線合作式/分享式總體解決方案平臺(tái)，用戶僅需利用NVIDIA Omniverse單一平臺(tái)就可以完成多個(gè)設(shè)計(jì)師/多個(gè)科學(xué)家/多個(gè)工作人員之間的協(xié)同式分布合作。

NVIDIA Omniverse整合了NVIDIA在圖形、仿真和AI領(lǐng)域的眾多技術(shù)，例如光線追蹤、毛發(fā)、粒子、物理模擬和VR/AR等?？梢岳肗VIDIA各式各樣的軟件堆疊，包括NVIDIA最重要的物理加速、材質(zhì)描述庫、MDL語言以及NVIDIA和PhysX合作的USD通用場(chǎng)景描述語言。用戶可以利用平臺(tái)存取數(shù)據(jù)資產(chǎn)讓各式各樣的第三方ISV、軟件專業(yè)工具程序進(jìn)行調(diào)用。一切工作都能在NVIDIA Omniverse平臺(tái)上實(shí)時(shí)一鍵分享、合作以及實(shí)現(xiàn)協(xié)同分布式遠(yuǎn)程辦公。

NVIDIA Omniverse還獲得了許多主要的軟件領(lǐng)導(dǎo)者支持，例如 Adobe、Autodesk、Bentley Systems、Robert McNeel & Associates和SideFX等。Blender正在與NVIDIA合作，通過加入U(xiǎn)SD功能實(shí)現(xiàn)Omniverse與其軟件的集成。NVIDIA還與其他領(lǐng)先的軟件供應(yīng)商合作，讓所有藝術(shù)家和設(shè)計(jì)師都可以在自己選擇的應(yīng)用上通過Omniverse開展協(xié)作。

借助NVIDIA Omniverse平臺(tái)，無論用戶使用何種軟件、工具和平臺(tái)，都能以NVIDIA Omniverse為入口，完成分發(fā)協(xié)調(diào)工作，并整合工作流程，讓所有用戶、設(shè)計(jì)師、科學(xué)家和工程人員都在同一個(gè)NVIDIA Omniverse平臺(tái)上完成分工和協(xié)作。遠(yuǎn)程團(tuán)隊(duì)可以通過該平臺(tái)同時(shí)開展項(xiàng)目協(xié)作，例如負(fù)責(zé)3D建筑設(shè)計(jì)迭代的建筑師、修改3D場(chǎng)景的動(dòng)畫師以及協(xié)作開發(fā)自動(dòng)駕駛汽車的工程師，整個(gè)協(xié)作就像是在線上共同編輯文檔一樣簡(jiǎn)單。

NVIDIA在為期一年的搶先體驗(yàn)計(jì)劃之后發(fā)布了公測(cè)版Omniverse。搶先體驗(yàn)項(xiàng)目期間，愛立信、Foster +Partners、工業(yè)光魔（ILM）和其他40多家公司以及多達(dá)400位個(gè)人創(chuàng)作者和開發(fā)者對(duì)該平臺(tái)進(jìn)行了評(píng)估并向NVIDIA工程團(tuán)隊(duì)提供了反饋。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

NVIDIA更新Ampere架構(gòu)，全面提升GPU應(yīng)用性能

Ampere架構(gòu)全面提升GPU應(yīng)用性能

跨軟件、跨應(yīng)用程序的在線協(xié)作平臺(tái)NVIDIA Omniverse

NVIDIA更新Ampere架構(gòu)，全面提升GPU應(yīng)用性能

跨軟件、跨應(yīng)用程序的在線協(xié)作平臺(tái)NVIDIA Omniverse