国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

GPU:為何對(duì)HPC和AI越來(lái)越重要?

2018-11-02 07:00AndyPatrizioCharles
計(jì)算機(jī)世界 2018年30期
關(guān)鍵詞:油礦內(nèi)核功耗

Andy Patrizio Charles

為什么原本用于電腦游戲的圖形處理芯片在企業(yè)計(jì)算中變得越來(lái)越重要了呢? 答案可能在芯片之外。

很少有處理器能在其所設(shè)計(jì)應(yīng)用的領(lǐng)域之外獲得巨大成功,而圖形處理單元(GPU)正是如此。一款最初旨在加速游戲圖形的芯片,現(xiàn)在它的應(yīng)用幾乎包羅萬(wàn)象——從Adobe Prime和數(shù)據(jù)庫(kù)到高性能計(jì)算(HPC)和人工智能(AI),等等。

幾乎所有OEM大廠和外包供應(yīng)商的服務(wù)器上現(xiàn)在都有GPU,但它們并非用于圖形加速。這是因?yàn)镚PU本質(zhì)上是一個(gè)巨大的數(shù)學(xué)協(xié)處理器,現(xiàn)在被用來(lái)執(zhí)行從3D仿真到醫(yī)療成像,直至金融建模等計(jì)算量非常大的工作。

GPU與CPU

由于GPU設(shè)計(jì)用途單一,所以GPU的內(nèi)核要比CPU的內(nèi)核小得多,因此,GPU有數(shù)千個(gè)內(nèi)核,而CPU最多只有32個(gè)。對(duì)于一項(xiàng)任務(wù)而言,有5000個(gè)內(nèi)核可用,因此,這種設(shè)計(jì)非常適合于大規(guī)模并行處理。

Jon Peddie研究公司的主要業(yè)務(wù)針對(duì)圖形市場(chǎng),其總裁Jon Peddie指出,對(duì)于任何需要并行處理的應(yīng)用程序,都是GPU計(jì)算的用武之地。

他說(shuō):“過(guò)去,并行處理是由x86這樣大量的處理器來(lái)完成的,因此成本非常高,而且很難編程。GPU作為一種專用的單用途處理器,其計(jì)算密度更高,已經(jīng)被用于很多數(shù)學(xué)加速任務(wù)中?!?/p>

支持GPU的應(yīng)用程序

GPU在數(shù)據(jù)中心中的應(yīng)用開(kāi)始于本地開(kāi)發(fā)的應(yīng)用程序,這得益于Nvidia開(kāi)發(fā)的一種名為CUDA的語(yǔ)言。CUDA使用類似C語(yǔ)言的語(yǔ)法來(lái)調(diào)用GPU,而不是CPU,它不是一次調(diào)用,而是能夠并行執(zhí)行數(shù)千次。

隨著GPU性能的提高,以及處理器能夠應(yīng)用于非游戲任務(wù),越來(lái)越多的打包應(yīng)用程序都開(kāi)始支持GPU。這包括Adobe Permieri等桌面應(yīng)用程序,還有服務(wù)器端的應(yīng)用程序,包括SQL數(shù)據(jù)庫(kù)。GPU非常適合用于加速SQL查詢處理,因?yàn)镾QL在指令集中的每一行都執(zhí)行相同的操作(通常是搜索)。GPU可以通過(guò)把一行數(shù)據(jù)分配給一個(gè)內(nèi)核來(lái)并行處理這一過(guò)程。

Brytlyt、SQream Technologies、MapD、Kinetica、PG-Strom和Blazegraph都在他們的數(shù)據(jù)庫(kù)中提供了GPU加速分析功能。甲骨文公司曾披露正在與Nvidia合作,但迄今為止似乎還沒(méi)有任何進(jìn)展。微軟在SQL服務(wù)器上不支持GPU加速。

GPU與高性能計(jì)算(HPC)

GPU在HPC上也得到了應(yīng)用,仿真、金融建模和3D渲染等很多任務(wù)在并行環(huán)境中運(yùn)行得非常好。據(jù)市場(chǎng)研究公司Intersect 360對(duì)HPC市場(chǎng)的調(diào)查數(shù)據(jù),50個(gè)最受歡迎的HPC應(yīng)用軟件包中有34個(gè)提供GPU支持,包括所有排在前面的15個(gè)HPC應(yīng)用程序。

這包括化學(xué)應(yīng)用程序GROMACS、Gaussian和VASP,用于流體動(dòng)力學(xué)的ANSYS和OpenFOAM,用于結(jié)構(gòu)分析的Simulia Abaqus和用于天氣/環(huán)境建模的WRF等等。

分析師們?cè)趫?bào)告中說(shuō):“我們相信GPU計(jì)算在HPC市場(chǎng)上已經(jīng)開(kāi)始從量變到質(zhì)變,這將鼓勵(lì)開(kāi)發(fā)者們不斷優(yōu)化應(yīng)用程序。”

GPU計(jì)算實(shí)例

GPU快速興起的市場(chǎng)是人工智能和機(jī)器學(xué)習(xí),兩者都是大規(guī)模并行問(wèn)題。硬件供應(yīng)商Supermicro的GPU服務(wù)器部門的產(chǎn)品管理主任Sarosh Irani說(shuō):“很多企業(yè)和首席信息官都在研究怎樣利用深度學(xué)習(xí)來(lái)解決自己的問(wèn)題。有些人只是涉獵;而有的人則深入其中。而深度學(xué)習(xí)的應(yīng)用是非常全面的,人們認(rèn)識(shí)到深度學(xué)習(xí)能夠幫助他們,他們需要一臺(tái)GPU服務(wù)器?!?/p>

如果你想在某項(xiàng)工作上變得聰明起來(lái),只要有足夠多的樣本,人工智能就能讓你心想事成。人工智能系統(tǒng)學(xué)習(xí)識(shí)別某些東西,例如,癌細(xì)胞看起來(lái)是什么樣的,但是要做到這一點(diǎn)需要大量的數(shù)據(jù),處理好這些數(shù)據(jù),才能區(qū)分好壞。當(dāng)發(fā)現(xiàn)相關(guān)性時(shí),可以建立算法,進(jìn)行分析。

例如,意大利能源公司Eni和美國(guó)的Stone Ridge科技能夠在不到一天的時(shí)間內(nèi)處理完油礦模型,而不是10天。使用3200個(gè)NVIDIA Tesla GPU和Stone Ridge的ECHELON軟件進(jìn)行基于GPU的油礦仿真,在大約15.5個(gè)小時(shí)內(nèi)就能處理了10萬(wàn)個(gè)油礦模型,每一個(gè)模型平均在28分鐘內(nèi)就能仿真了油礦15年的生產(chǎn)量。如果使用傳統(tǒng)的硬件和軟件,完成這項(xiàng)任務(wù)需要10天的時(shí)間。

油礦建模并非易事。通過(guò)從地球表面反射的聲波,尋找表明儲(chǔ)油量的回波來(lái)發(fā)現(xiàn)油礦。然后,反射波數(shù)據(jù)被轉(zhuǎn)換成圖像,地球科學(xué)家利用這些圖像來(lái)確定油礦是否含有碳?xì)浠衔?,以及碳?xì)浠衔镌趫D像中的位置。這就決定了是否值得開(kāi)采這一油礦。所有這些都需要繁重的數(shù)學(xué)處理,而這是GPU所擅長(zhǎng)的。

GPU制造商:Nvidia和AMD

與CPU一樣,GPU市場(chǎng)也有兩家參與者——Nvidia和AMD。據(jù)Jon Peddie研究公司稱,在消費(fèi)類游戲領(lǐng)域,競(jìng)爭(zhēng)相當(dāng)激烈,兩家公司的市場(chǎng)份額分別為60%和40%,Nvidia處于領(lǐng)先地位。

然而,在數(shù)據(jù)中心,兩家的差距非常大。Peddie報(bào)道說(shuō),Nvidia占有90%的市場(chǎng)份額,而AMD只占10%。這是因?yàn)镹vidia在這一領(lǐng)域深耕了20多年,支持GPU在數(shù)據(jù)中心以及其他非游戲類的應(yīng)用。

GPU與CUDA編程

在21世紀(jì)初,一些斯坦福大學(xué)的研究人員開(kāi)始深入研究GPU的可編程和并行特性。Nvidia公司聘請(qǐng)這些研究人員開(kāi)發(fā)了CUDA編程語(yǔ)言,支持開(kāi)發(fā)人員采用C++編寫應(yīng)用程序,通過(guò)GPU進(jìn)行加速。

Peddie評(píng)論說(shuō):“我非常信任Nvidia。他們資助了全世界的數(shù)百所大學(xué)來(lái)教授CUDA。因此,當(dāng)一名學(xué)生畢業(yè)時(shí),他們成為經(jīng)過(guò)預(yù)培訓(xùn)的CUDA開(kāi)發(fā)人員,為CUDA進(jìn)入我們目前所熟知的行業(yè)奠定了基礎(chǔ)?!?/p>

CUDA團(tuán)隊(duì)有一名斯坦福教授Ian Buck,現(xiàn)在成為Nvidia加速計(jì)算業(yè)務(wù)部的副總裁。他表示,CUDA的目的是便于學(xué)習(xí)和使用。他說(shuō):“任何知道C語(yǔ)言或者Fortran語(yǔ)言的人,我都能在一天內(nèi)教會(huì)他CUDA。我們?cè)缇鸵庾R(shí)到,我們不應(yīng)創(chuàng)造一種要求人們?nèi)W(xué)習(xí)新東西的全新的編程語(yǔ)言?!?/p>

因此,已經(jīng)在CPU上運(yùn)行的應(yīng)用程序能夠相對(duì)快速地進(jìn)行并行化處理。CUDA的主要變化在于不再像排序例程那樣只調(diào)用一次函數(shù),而是調(diào)用數(shù)千次,每個(gè)內(nèi)核執(zhí)行一次。但是CUDA只適用于Nvidia GPU。要對(duì)AMD GPU編程,必須使用一個(gè)稱為OpenCL的庫(kù),CUDA完全不支持它。

GPU與能耗

GPU在基本性能上是CPU強(qiáng)有力的替代者,但是性能和功耗之間有直接關(guān)系,所以兩者還保持著聯(lián)系。GPU的最大功率為300瓦。雖然Xeons的新一代版本Skylake功耗達(dá)到了200瓦,但CPU功耗平均低于100瓦。

最終,GPU因其規(guī)模而彌補(bǔ)了它的不足。因?yàn)樗鼈兛梢酝瓿蓭资畟€(gè)CPU的工作,所以需要更少的GPU來(lái)進(jìn)行同樣工作量的工作。Nvidia公司表示,進(jìn)行同樣的工作,新的DGX-2 GPU服務(wù)器系統(tǒng)的功耗只是傳統(tǒng)CPU HPC集群的1/8。

對(duì)于Supermicro來(lái)說(shuō),這意味著它必須從頭開(kāi)始設(shè)計(jì)一款使用GPU的產(chǎn)品。Irani說(shuō):“如果我把一個(gè)300瓦的GPU放在系統(tǒng)中,那么可能沒(méi)有足夠的功率容量或者散熱能力來(lái)支持它。8個(gè)GPU,絕對(duì)不可能。所以我需要一個(gè)定制的機(jī)架?!?/p>

如果數(shù)據(jù)中心的功率有限,那這就是個(gè)問(wèn)題。并不是每個(gè)人都能夠奢侈地建造足球場(chǎng)那么大的數(shù)據(jù)中心,而且旁邊必須有一條河,用于水力發(fā)電和冷卻。David Rosenberg是彭博(Bloomberg)首席技術(shù)官辦公室的數(shù)據(jù)科學(xué)家,他非常喜歡使用GPU來(lái)減輕計(jì)算工作,CPU需要一年的時(shí)間,而GPU一個(gè)周末就完成了。

但他也經(jīng)常有這樣的情況,整個(gè)機(jī)柜只有一兩個(gè)GPU機(jī)架,因?yàn)樗鼈兿牧藱C(jī)柜所能提供的全部功率。

他說(shuō):“我們一直在關(guān)注功耗問(wèn)題。如果我們把500個(gè)GPU放到一個(gè)數(shù)據(jù)中心里,那就不能再放其他計(jì)算機(jī)了。與CPU相比,GPU所提供的計(jì)算能力更強(qiáng)。只是它們做的計(jì)算比CPU多得多,所以才占用了大量的功率?!?/p>

Andy Patrizio是南加州的一名自由撰稿人,20多年來(lái)一直從事計(jì)算機(jī)行業(yè),他所擁有的每一臺(tái)x86個(gè)人計(jì)算機(jī)都是他自己組裝的,不包括筆記本計(jì)算機(jī)。

原文網(wǎng)址

https://www.networkworld.com/article/3271077/servers/gpus-designed-for-gaming-now-crucial-to-hpc-and-ai.html

猜你喜歡
油礦內(nèi)核功耗
我國(guó)首位女石油地質(zhì)勘探隊(duì)員
基于任務(wù)映射的暗硅芯片功耗預(yù)算方法
強(qiáng)化『高新』內(nèi)核 打造農(nóng)業(yè)『硅谷』
基于嵌入式Linux內(nèi)核的自恢復(fù)設(shè)計(jì)
Linux內(nèi)核mmap保護(hù)機(jī)制研究
揭開(kāi)GPU功耗的面紗
數(shù)字電路功耗的分析及優(yōu)化
微生物內(nèi)核 生態(tài)型農(nóng)資
彭德懷視察玉門油礦
優(yōu)化“油礦地質(zhì)學(xué)”實(shí)踐教學(xué)體系培養(yǎng)油氣地質(zhì)工程技術(shù)人才
河东区| 丹巴县| 无为县| 静安区| 容城县| 咸丰县| 长兴县| 新竹市| 招远市| 博客| 普宁市| 玉门市| 大同市| 九寨沟县| 西和县| 辽源市| 通榆县| 罗田县| 桂阳县| 枝江市| 延津县| 山东省| 宜城市| 沾化县| 大庆市| 抚宁县| 双柏县| 荣成市| 财经| 威海市| 莎车县| 穆棱市| 富顺县| 定州市| 山东省| 普宁市| 神木县| 嘉峪关市| 青铜峡市| 克山县| 阿瓦提县|