GPU：為何對(duì)HPC和AI越來(lái)越重要？

2018-11-02 07:00AndyPatrizioCharles

計(jì)算機(jī)世界 2018年30期

Andy Patrizio Charles

為什么原本用于電腦游戲的圖形處理芯片在企業(yè)計(jì)算中變得越來(lái)越重要了呢？答案可能在芯片之外。

很少有處理器能在其所設(shè)計(jì)應(yīng)用的領(lǐng)域之外獲得巨大成功，而圖形處理單元（GPU）正是如此。一款最初旨在加速游戲圖形的芯片，現(xiàn)在它的應(yīng)用幾乎包羅萬(wàn)象——從Adobe Prime和數(shù)據(jù)庫(kù)到高性能計(jì)算（HPC）和人工智能（AI），等等。

幾乎所有OEM大廠和外包供應(yīng)商的服務(wù)器上現(xiàn)在都有GPU，但它們并非用于圖形加速。這是因?yàn)镚PU本質(zhì)上是一個(gè)巨大的數(shù)學(xué)協(xié)處理器，現(xiàn)在被用來(lái)執(zhí)行從3D仿真到醫(yī)療成像，直至金融建模等計(jì)算量非常大的工作。

GPU與CPU

由于GPU設(shè)計(jì)用途單一，所以GPU的內(nèi)核要比CPU的內(nèi)核小得多，因此，GPU有數(shù)千個(gè)內(nèi)核，而CPU最多只有32個(gè)。對(duì)于一項(xiàng)任務(wù)而言，有5000個(gè)內(nèi)核可用，因此，這種設(shè)計(jì)非常適合于大規(guī)模并行處理。

Jon Peddie研究公司的主要業(yè)務(wù)針對(duì)圖形市場(chǎng)，其總裁Jon Peddie指出，對(duì)于任何需要并行處理的應(yīng)用程序，都是GPU計(jì)算的用武之地。

他說(shuō)：“過(guò)去，并行處理是由x86這樣大量的處理器來(lái)完成的，因此成本非常高，而且很難編程。GPU作為一種專用的單用途處理器，其計(jì)算密度更高，已經(jīng)被用于很多數(shù)學(xué)加速任務(wù)中?！?/p>

支持GPU的應(yīng)用程序

GPU在數(shù)據(jù)中心中的應(yīng)用開(kāi)始于本地開(kāi)發(fā)的應(yīng)用程序，這得益于Nvidia開(kāi)發(fā)的一種名為CUDA的語(yǔ)言。CUDA使用類似C語(yǔ)言的語(yǔ)法來(lái)調(diào)用GPU，而不是CPU，它不是一次調(diào)用，而是能夠并行執(zhí)行數(shù)千次。

隨著GPU性能的提高，以及處理器能夠應(yīng)用于非游戲任務(wù)，越來(lái)越多的打包應(yīng)用程序都開(kāi)始支持GPU。這包括Adobe Permieri等桌面應(yīng)用程序，還有服務(wù)器端的應(yīng)用程序，包括SQL數(shù)據(jù)庫(kù)。GPU非常適合用于加速SQL查詢處理，因?yàn)镾QL在指令集中的每一行都執(zhí)行相同的操作（通常是搜索）。GPU可以通過(guò)把一行數(shù)據(jù)分配給一個(gè)內(nèi)核來(lái)并行處理這一過(guò)程。

Brytlyt、SQream Technologies、MapD、Kinetica、PG-Strom和Blazegraph都在他們的數(shù)據(jù)庫(kù)中提供了GPU加速分析功能。甲骨文公司曾披露正在與Nvidia合作，但迄今為止似乎還沒(méi)有任何進(jìn)展。微軟在SQL服務(wù)器上不支持GPU加速。

GPU與高性能計(jì)算（HPC）

GPU在HPC上也得到了應(yīng)用，仿真、金融建模和3D渲染等很多任務(wù)在并行環(huán)境中運(yùn)行得非常好。據(jù)市場(chǎng)研究公司Intersect 360對(duì)HPC市場(chǎng)的調(diào)查數(shù)據(jù)，50個(gè)最受歡迎的HPC應(yīng)用軟件包中有34個(gè)提供GPU支持，包括所有排在前面的15個(gè)HPC應(yīng)用程序。

這包括化學(xué)應(yīng)用程序GROMACS、Gaussian和VASP，用于流體動(dòng)力學(xué)的ANSYS和OpenFOAM，用于結(jié)構(gòu)分析的Simulia Abaqus和用于天氣/環(huán)境建模的WRF等等。

分析師們?cè)趫?bào)告中說(shuō)：“我們相信GPU計(jì)算在HPC市場(chǎng)上已經(jīng)開(kāi)始從量變到質(zhì)變，這將鼓勵(lì)開(kāi)發(fā)者們不斷優(yōu)化應(yīng)用程序。”

GPU計(jì)算實(shí)例

GPU快速興起的市場(chǎng)是人工智能和機(jī)器學(xué)習(xí)，兩者都是大規(guī)模并行問(wèn)題。硬件供應(yīng)商Supermicro的GPU服務(wù)器部門的產(chǎn)品管理主任Sarosh Irani說(shuō)：“很多企業(yè)和首席信息官都在研究怎樣利用深度學(xué)習(xí)來(lái)解決自己的問(wèn)題。有些人只是涉獵；而有的人則深入其中。而深度學(xué)習(xí)的應(yīng)用是非常全面的，人們認(rèn)識(shí)到深度學(xué)習(xí)能夠幫助他們，他們需要一臺(tái)GPU服務(wù)器?！?/p>

如果你想在某項(xiàng)工作上變得聰明起來(lái)，只要有足夠多的樣本，人工智能就能讓你心想事成。人工智能系統(tǒng)學(xué)習(xí)識(shí)別某些東西，例如，癌細(xì)胞看起來(lái)是什么樣的，但是要做到這一點(diǎn)需要大量的數(shù)據(jù)，處理好這些數(shù)據(jù)，才能區(qū)分好壞。當(dāng)發(fā)現(xiàn)相關(guān)性時(shí)，可以建立算法，進(jìn)行分析。

例如，意大利能源公司Eni和美國(guó)的Stone Ridge科技能夠在不到一天的時(shí)間內(nèi)處理完油礦模型，而不是10天。使用3200個(gè)NVIDIA Tesla GPU和Stone Ridge的ECHELON軟件進(jìn)行基于GPU的油礦仿真，在大約15.5個(gè)小時(shí)內(nèi)就能處理了10萬(wàn)個(gè)油礦模型，每一個(gè)模型平均在28分鐘內(nèi)就能仿真了油礦15年的生產(chǎn)量。如果使用傳統(tǒng)的硬件和軟件，完成這項(xiàng)任務(wù)需要10天的時(shí)間。

油礦建模并非易事。通過(guò)從地球表面反射的聲波，尋找表明儲(chǔ)油量的回波來(lái)發(fā)現(xiàn)油礦。然后，反射波數(shù)據(jù)被轉(zhuǎn)換成圖像，地球科學(xué)家利用這些圖像來(lái)確定油礦是否含有碳?xì)浠衔?，以及碳?xì)浠衔镌趫D像中的位置。這就決定了是否值得開(kāi)采這一油礦。所有這些都需要繁重的數(shù)學(xué)處理，而這是GPU所擅長(zhǎng)的。

GPU制造商：Nvidia和AMD

與CPU一樣，GPU市場(chǎng)也有兩家參與者——Nvidia和AMD。據(jù)Jon Peddie研究公司稱，在消費(fèi)類游戲領(lǐng)域，競(jìng)爭(zhēng)相當(dāng)激烈，兩家公司的市場(chǎng)份額分別為60%和40%，Nvidia處于領(lǐng)先地位。

然而，在數(shù)據(jù)中心，兩家的差距非常大。Peddie報(bào)道說(shuō)，Nvidia占有90%的市場(chǎng)份額，而AMD只占10%。這是因?yàn)镹vidia在這一領(lǐng)域深耕了20多年，支持GPU在數(shù)據(jù)中心以及其他非游戲類的應(yīng)用。

GPU與CUDA編程

在21世紀(jì)初，一些斯坦福大學(xué)的研究人員開(kāi)始深入研究GPU的可編程和并行特性。Nvidia公司聘請(qǐng)這些研究人員開(kāi)發(fā)了CUDA編程語(yǔ)言，支持開(kāi)發(fā)人員采用C++編寫應(yīng)用程序，通過(guò)GPU進(jìn)行加速。

Peddie評(píng)論說(shuō)：“我非常信任Nvidia。他們資助了全世界的數(shù)百所大學(xué)來(lái)教授CUDA。因此，當(dāng)一名學(xué)生畢業(yè)時(shí)，他們成為經(jīng)過(guò)預(yù)培訓(xùn)的CUDA開(kāi)發(fā)人員，為CUDA進(jìn)入我們目前所熟知的行業(yè)奠定了基礎(chǔ)?！?/p>

CUDA團(tuán)隊(duì)有一名斯坦福教授Ian Buck，現(xiàn)在成為Nvidia加速計(jì)算業(yè)務(wù)部的副總裁。他表示，CUDA的目的是便于學(xué)習(xí)和使用。他說(shuō)：“任何知道C語(yǔ)言或者Fortran語(yǔ)言的人，我都能在一天內(nèi)教會(huì)他CUDA。我們?cè)缇鸵庾R(shí)到，我們不應(yīng)創(chuàng)造一種要求人們?nèi)W(xué)習(xí)新東西的全新的編程語(yǔ)言?！?/p>

因此，已經(jīng)在CPU上運(yùn)行的應(yīng)用程序能夠相對(duì)快速地進(jìn)行并行化處理。CUDA的主要變化在于不再像排序例程那樣只調(diào)用一次函數(shù)，而是調(diào)用數(shù)千次，每個(gè)內(nèi)核執(zhí)行一次。但是CUDA只適用于Nvidia GPU。要對(duì)AMD GPU編程，必須使用一個(gè)稱為OpenCL的庫(kù)，CUDA完全不支持它。

GPU與能耗

GPU在基本性能上是CPU強(qiáng)有力的替代者，但是性能和功耗之間有直接關(guān)系，所以兩者還保持著聯(lián)系。GPU的最大功率為300瓦。雖然Xeons的新一代版本Skylake功耗達(dá)到了200瓦，但CPU功耗平均低于100瓦。

最終，GPU因其規(guī)模而彌補(bǔ)了它的不足。因?yàn)樗鼈兛梢酝瓿蓭资畟€(gè)CPU的工作，所以需要更少的GPU來(lái)進(jìn)行同樣工作量的工作。Nvidia公司表示，進(jìn)行同樣的工作，新的DGX-2 GPU服務(wù)器系統(tǒng)的功耗只是傳統(tǒng)CPU HPC集群的1/8。

對(duì)于Supermicro來(lái)說(shuō)，這意味著它必須從頭開(kāi)始設(shè)計(jì)一款使用GPU的產(chǎn)品。Irani說(shuō)：“如果我把一個(gè)300瓦的GPU放在系統(tǒng)中，那么可能沒(méi)有足夠的功率容量或者散熱能力來(lái)支持它。8個(gè)GPU，絕對(duì)不可能。所以我需要一個(gè)定制的機(jī)架?！?/p>

如果數(shù)據(jù)中心的功率有限，那這就是個(gè)問(wèn)題。并不是每個(gè)人都能夠奢侈地建造足球場(chǎng)那么大的數(shù)據(jù)中心，而且旁邊必須有一條河，用于水力發(fā)電和冷卻。David Rosenberg是彭博（Bloomberg）首席技術(shù)官辦公室的數(shù)據(jù)科學(xué)家，他非常喜歡使用GPU來(lái)減輕計(jì)算工作，CPU需要一年的時(shí)間，而GPU一個(gè)周末就完成了。

但他也經(jīng)常有這樣的情況，整個(gè)機(jī)柜只有一兩個(gè)GPU機(jī)架，因?yàn)樗鼈兿牧藱C(jī)柜所能提供的全部功率。

他說(shuō)：“我們一直在關(guān)注功耗問(wèn)題。如果我們把500個(gè)GPU放到一個(gè)數(shù)據(jù)中心里，那就不能再放其他計(jì)算機(jī)了。與CPU相比，GPU所提供的計(jì)算能力更強(qiáng)。只是它們做的計(jì)算比CPU多得多，所以才占用了大量的功率?！?/p>

Andy Patrizio是南加州的一名自由撰稿人，20多年來(lái)一直從事計(jì)算機(jī)行業(yè)，他所擁有的每一臺(tái)x86個(gè)人計(jì)算機(jī)都是他自己組裝的，不包括筆記本計(jì)算機(jī)。

原文網(wǎng)址

https：//www.networkworld.com/article/3271077/servers/gpus-designed-for-gaming-now-crucial-to-hpc-and-ai.html

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

GPU：為何對(duì)HPC和AI越來(lái)越重要？

GPU：為何對(duì)HPC和AI越來(lái)越重要？