2017年9月26日,NVIDIA GTC CHINA2017大會(huì)在北京舉辦,NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛亮相大會(huì),展示了能夠加快人工智能大規(guī)模采用速度的全新技術(shù)。
這場(chǎng)為期三天的盛會(huì)吸引了超過3500名科學(xué)家、工程師和新聞界人士參加。黃仁勛向這3500多名參與者所做的演講標(biāo)志著GTC全球巡回之旅的啟程。在未來幾個(gè)月里,NVIDIA將陸續(xù)前往慕尼黑、特拉維夫、臺(tái)北、華盛頓和東京,向數(shù)以千計(jì)開發(fā)人員講述AI創(chuàng)新的故事。
黃仁勛在主題演講時(shí)提到,眾多互聯(lián)網(wǎng)公司競(jìng)相將深度學(xué)習(xí)AI引入受眾達(dá)數(shù)十億人的服務(wù)之中,還介紹了AI推理工作負(fù)載是如何呈指數(shù)級(jí)增長(zhǎng)等內(nèi)容。視頻領(lǐng)域,每日運(yùn)行的推理計(jì)算估計(jì)有3000億次;語音領(lǐng)域,每日運(yùn)行的推理計(jì)算估計(jì)達(dá)500億次以上;語言翻譯領(lǐng)域,每日運(yùn)行的推理計(jì)算更是達(dá)到約7000億次以上。
為滿足市場(chǎng)需求,NVIDIA發(fā)布了TensorRT 3 AI推理軟件。它不但能在生產(chǎn)環(huán)境中運(yùn)行經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò),還能夠大幅提升從云端向終端設(shè)備(包括無人駕駛汽車和機(jī)器人)的推理性能,降低成本。
若將NVIDIA GPU與TensorRT 3結(jié)合,便可以在所有框架上開展超快、超高效推理工作,進(jìn)一步實(shí)現(xiàn)眾多支持AI的服務(wù),例如圖像和語音識(shí)別、自然語言處理、視覺搜索和個(gè)性化建議等功能。據(jù)黃仁勛介紹,搭配Tesla V100 GPU加速器的TensorRT每秒能夠識(shí)別約5700張圖片,對(duì)比現(xiàn)今CPU每秒僅能識(shí)別140張圖片的速度其效率可見一斑。搭配NVIDIA最新GPU的一臺(tái)服務(wù)器頂?shù)蒙袭?dāng)前150臺(tái)CPU服務(wù)器。換個(gè)角度來說,采用GPU加速技術(shù)的一個(gè)數(shù)據(jù)中心所開展的推理工作相當(dāng)于13個(gè)僅采用CPU的數(shù)據(jù)中心。
黃仁勛宣布,阿里云、百度和騰訊均已在其云服務(wù)中部署Tesla V100 GPU加速器。另外,包括華為、浪潮和聯(lián)想在內(nèi)的中國(guó)頂尖OEM均已采用NVIDIA的HGX服務(wù)器架構(gòu)并使用Tesla V100 GPU來構(gòu)建新一代加速數(shù)據(jù)中心。