焦旭
增強(qiáng)網(wǎng)絡(luò)安全成為啟動(dòng)數(shù)字化轉(zhuǎn)型項(xiàng)目的推動(dòng)因素。然而,實(shí)施過(guò)程中如果出現(xiàn)錯(cuò)誤則會(huì)產(chǎn)生高昂的代價(jià)。
近年來(lái),高性能計(jì)算(HPC)領(lǐng)域的技術(shù)發(fā)展已經(jīng)漸漸走出純粹的計(jì)算技術(shù),在普遍性的行業(yè)應(yīng)用中產(chǎn)生價(jià)值。
以往HPC主要集中在傳統(tǒng)行業(yè)領(lǐng)域的研究,如石油、氣象、材料、物理和地球科學(xué)等。如今,隨著HPC技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)與傳統(tǒng)行業(yè)不斷地滲透和融合,推動(dòng)了工業(yè)4.0、智能語(yǔ)音、人臉識(shí)別、智慧醫(yī)療、可穿戴設(shè)備等各個(gè)領(lǐng)域的快速發(fā)展。隨著應(yīng)用領(lǐng)域越來(lái)越廣泛,HPC勢(shì)必走入一個(gè)全新的時(shí)代。
不久前,2018全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)(HPC China 2018)在山東青島舉行。本次會(huì)議以“HPC+一切皆可計(jì)算”為主題,有超過(guò)兩千名來(lái)自HPC領(lǐng)域的科研機(jī)構(gòu)、高校、廠商的專家代表參加了此次會(huì)議,共同圍繞HPC技術(shù)的研究進(jìn)展、應(yīng)用創(chuàng)新等主題,探討行業(yè)發(fā)展趨勢(shì)與應(yīng)用實(shí)踐經(jīng)驗(yàn),旨在促進(jìn)產(chǎn)、學(xué)、研各界的深度合作,推動(dòng)中國(guó)HPC技術(shù)與應(yīng)用的發(fā)展。
一切皆可以計(jì)算么
在HPC技術(shù)的實(shí)際應(yīng)用中,真的能夠?qū)崿F(xiàn)“一切皆可以計(jì)算”的美好愿景么?
事實(shí)上,HPC的技術(shù)發(fā)展還面臨著一些難題和挑戰(zhàn)。我們知道傳統(tǒng)HPC采用封閉計(jì)算,這是HPC普及的最大市場(chǎng)阻力。所以,基于開(kāi)放、標(biāo)準(zhǔn)的x86架構(gòu),以及利用集群技術(shù)實(shí)現(xiàn)HPC系統(tǒng)無(wú)疑已經(jīng)成為技術(shù)主流,而不具有開(kāi)放性的系統(tǒng)終將被淘汰或邊緣化。
其次,隨著對(duì)計(jì)算機(jī)系統(tǒng)性能的要求不斷提高,HPC平臺(tái)既需要提供模塊化部署,同時(shí),也應(yīng)具有較強(qiáng)的擴(kuò)展能力,可以方便地實(shí)現(xiàn)節(jié)點(diǎn)增加、系統(tǒng)擴(kuò)充和升級(jí)。HPC與應(yīng)用密切相關(guān),因此其架構(gòu)需要面對(duì)多樣化需求的挑戰(zhàn),也就是需要用靈活性應(yīng)對(duì)多樣化的應(yīng)用。
此外,功耗也是HPC發(fā)展面臨的重要挑戰(zhàn)之一,降低功耗是HPC硬件創(chuàng)新的重要方向。在數(shù)據(jù)量以EB級(jí)速度增長(zhǎng)的情況下,低成本、高效率的HPC將成為首選。
最后,HPC項(xiàng)目建設(shè)是一項(xiàng)復(fù)雜的系統(tǒng)工程,涉及面廣且技術(shù)門(mén)檻高。因此,從前期系統(tǒng)規(guī)劃到實(shí)施都需要技術(shù)支持在內(nèi)的端到端解決方案,包括從基礎(chǔ)架構(gòu)服務(wù)、驗(yàn)證到配置服務(wù),既要方便部署,又能簡(jiǎn)化維護(hù)和管理,減輕運(yùn)維人員負(fù)擔(dān)。
針對(duì)這些難題和挑戰(zhàn),英特爾院士、英特爾HPC戰(zhàn)略總監(jiān)Mark Seager在本次學(xué)術(shù)年會(huì)上作了題為《與人工智能(AI)相結(jié)合的HPC和高性能數(shù)據(jù)分析,是數(shù)字經(jīng)濟(jì)轉(zhuǎn)型的必要元素》的演講。
Mark Seager指出,AI市場(chǎng)將從2017年的25億美元成長(zhǎng)為2022年的80~100億美元,年復(fù)合增長(zhǎng)率達(dá)到30%。高速成長(zhǎng)的AI市場(chǎng)凸顯對(duì)計(jì)算力的需求,而現(xiàn)有IT基礎(chǔ)架構(gòu)甚至整個(gè)AI應(yīng)用生態(tài)都并不能很好地滿足AI市場(chǎng)的需求。
談及HPC能否用來(lái)支持AI對(duì)計(jì)算力的需求。Mark Seager表示,HPC是完全可以用于AI應(yīng)用的,包括訓(xùn)練和推理都可以發(fā)揮作用。比如,在計(jì)算領(lǐng)域有性能越來(lái)越強(qiáng)大的新至強(qiáng)可擴(kuò)展處理器,在網(wǎng)絡(luò)方面有高速通信網(wǎng)卡OPA,在存儲(chǔ)方面有創(chuàng)新的傲騰,它們都可以讓AI應(yīng)用受益?!癏PC+AI可以把所有產(chǎn)業(yè)都結(jié)合起來(lái),而AI很大程度上就是由數(shù)據(jù)驅(qū)動(dòng)的?!盡ark Seager如是說(shuō)。
HPC與AI:融合的未來(lái)
眼下,AI變革中最令人驚嘆的是其變化的速度。它已經(jīng)改變了各行各業(yè)的面貌,從健康和精準(zhǔn)醫(yī)療到交通運(yùn)輸再到自動(dòng)駕駛,無(wú)不受其變革性的影響。隨著AI技術(shù)日益成熟并得到廣泛運(yùn)用,我們將會(huì)看到更多的新奇應(yīng)用不斷涌現(xiàn),而且AI也將會(huì)與現(xiàn)有的工作負(fù)載和技術(shù)融合在一起。
HPC正在加速這種變革趨勢(shì),通過(guò)將AI的強(qiáng)大功能應(yīng)用于現(xiàn)有的高性能計(jì)算工作流程(HPC-on-AI),以及極大地?cái)U(kuò)展人工智能算法的規(guī)模以充分利用高性能計(jì)算系統(tǒng)的能力(AI-on-HPC),都取得了非常可喜的初步成果。
眾所周知,在AI領(lǐng)域“數(shù)據(jù)為王”,這意味著軟件和硬件可以“先放在一邊”。AI軟件的主要研發(fā)重點(diǎn)是為數(shù)據(jù)科學(xué)家提供幫助,使他們能夠使用熟悉的軟件工具,而這些軟件工具能在當(dāng)前和未來(lái)的硬件解決方案上隨時(shí)隨地運(yùn)行。大部分正在開(kāi)發(fā)的新硬件都是為了滿足當(dāng)前AI爆炸式發(fā)展所帶來(lái)的需求擴(kuò)大問(wèn)題。
鑒于此,可擴(kuò)展性變成為“AI與HPC”的關(guān)鍵,只有滿足這一要求,才能解決所面臨的大計(jì)算和大數(shù)據(jù)的挑戰(zhàn),并從現(xiàn)有大量的測(cè)量、建模和模擬數(shù)據(jù)中獲益。因此,HPC與AI的相互融合,可以在HPC硬件上運(yùn)行相同類型的數(shù)據(jù)和計(jì)算密集型工作負(fù)載,無(wú)論是尖端超級(jí)計(jì)算機(jī)、小型機(jī)構(gòu)群集還是在云端。
不管是HPC-on-AI,還是AI-on-HPC,目前所看到的成功已經(jīng)證明這種融合方式有著光明的前景,通過(guò)兩者強(qiáng)有力的協(xié)同效應(yīng),來(lái)促進(jìn)新的發(fā)現(xiàn)和創(chuàng)新。
英特爾高性能計(jì)算方案和銷售總經(jīng)理 Nash Palaniswamy表示:“現(xiàn)在主流的AI算法本質(zhì)上是矩陣乘,這在HPC的環(huán)境里已經(jīng)使用大概幾十年了,只不過(guò)現(xiàn)在我們有專門(mén)硬件來(lái)進(jìn)行矩陣乘的加速,但是這個(gè)方式也是一個(gè)非常傳統(tǒng)的HPC的方式?!?/p>
三大方式與一次性解決
不過(guò),一個(gè)不可回避的現(xiàn)實(shí)是,今天在大多數(shù)AI實(shí)際應(yīng)用中似乎與HPC關(guān)聯(lián)不大,不少AI都建起了一個(gè)新的硬件平臺(tái)。背后的原因在于這兩者在計(jì)算時(shí)具有明顯不同的特征,傳統(tǒng)HPC目前還不能很好地支持AI。
為此,英特爾提出了三種融合方案:在現(xiàn)有HPC基礎(chǔ)設(shè)施上運(yùn)行AI應(yīng)用;在建模與仿真工作流程中加入AI,以加速創(chuàng)新和發(fā)現(xiàn);將HPC與AI模式相結(jié)合。
Nash Palaniswamy指出,在整個(gè)AI開(kāi)發(fā)流程中,實(shí)際上訓(xùn)練工作大約占到了全部時(shí)間的30%,訓(xùn)練之前要花費(fèi)大量時(shí)間準(zhǔn)備數(shù)據(jù)、格式化數(shù)據(jù)、處理數(shù)據(jù)、再輸入進(jìn)去,把數(shù)據(jù)用不同方式呈現(xiàn)。但其實(shí),訓(xùn)練應(yīng)該只是整個(gè)流程中非常小的一個(gè)部分。英特爾希望搭建一個(gè)一致性的平臺(tái),不需要再去切換更多的平臺(tái),一次性解決AI開(kāi)發(fā)難題。
針對(duì)AI,英特爾也將在下一代至強(qiáng)處理器中加入深度學(xué)習(xí)的加速器英特爾DL Boost,在進(jìn)行INT8運(yùn)算時(shí),最高可以提升約11倍性能。除了硬件之外,軟件框架也是AI領(lǐng)域非常重要的一個(gè)基礎(chǔ)。今年3月,英特爾宣布開(kāi)源 nGraph,這是一個(gè)面向各種設(shè)備和框架的深度神經(jīng)網(wǎng)絡(luò)模型編譯器。
Nash Palaniswamy透露,英特爾最新一代至強(qiáng)可擴(kuò)展處理器Cascade Lake會(huì)在明年面世,該處理器會(huì)提供更強(qiáng)大的性能,同時(shí)還會(huì)增加一些人工智能深度學(xué)習(xí)加速器功能在里面,從而極大程度地提升INT8的性能。同樣,傲騰數(shù)據(jù)中心級(jí)持久內(nèi)存也是一個(gè)非常重要的創(chuàng)新,單根最大可以支持到512G,可以插在內(nèi)存插槽上。
“從英特爾的策略來(lái)講,將不僅僅關(guān)注AI,更要推動(dòng)整個(gè)數(shù)據(jù)中心化趨勢(shì)下基礎(chǔ)設(shè)施的更新和創(chuàng)新。未來(lái)通過(guò)對(duì)AI、HPC、BigDL等技術(shù)的持續(xù)投入,為用戶提供更加完善、更加強(qiáng)大的產(chǎn)品和解決方案?!盢ash Palaniswamy表示。英特爾在這些方面的改進(jìn)讓HPC和AI應(yīng)用受益匪淺。
注重開(kāi)發(fā)與人才培養(yǎng)
在整個(gè)生態(tài)中,英特爾還非常注重開(kāi)發(fā)者和人才的培養(yǎng),以及市場(chǎng)推廣,希望用開(kāi)源的方式推動(dòng)AI實(shí)現(xiàn)更快發(fā)展。目前,英特爾建立了AI學(xué)院和AI開(kāi)發(fā)者社區(qū),在全球已有超過(guò)11萬(wàn)個(gè)開(kāi)發(fā)者。同時(shí),英特爾與全球超過(guò)90個(gè)大學(xué)在AI領(lǐng)域達(dá)成了合作。
在本次學(xué)術(shù)年會(huì)期間,還舉辦了第六屆“英特爾杯”全國(guó)并行應(yīng)用挑戰(zhàn)賽(PAC2018)與第二屆國(guó)產(chǎn)CPU并行應(yīng)用挑戰(zhàn)賽(CPC2018)的決賽及頒獎(jiǎng)典禮、HPC China2018大會(huì)優(yōu)秀論文獎(jiǎng)與HPC Plus優(yōu)秀論壇頒獎(jiǎng)典禮。旨在激勵(lì)HPC領(lǐng)域人才不斷鉆研、刻苦奮進(jìn),積極為HPC發(fā)展貢獻(xiàn)力量。
據(jù)了解, PAC由中國(guó)計(jì)算機(jī)學(xué)會(huì)高性能計(jì)算專業(yè)委員會(huì)(CCF TCHPC)指導(dǎo)、教育部計(jì)算機(jī)類專業(yè)教學(xué)指導(dǎo)委員會(huì)聯(lián)合英特爾(中國(guó))有限公司、北京并行科技股份有限公司共同倡導(dǎo)發(fā)起。期間還進(jìn)行了諸如Analytics Zoo——大數(shù)據(jù)分析和人工智能流水線、中國(guó)銀聯(lián)國(guó)家實(shí)驗(yàn)室人工智能案例、ParateraHPC工具性能調(diào)優(yōu)等實(shí)踐案例的分享等。
組委會(huì)選擇華為云EI大數(shù)據(jù)MRS服務(wù)作為大賽結(jié)果評(píng)選的獨(dú)家評(píng)審平臺(tái),采用英特爾至強(qiáng)處理器作為推薦平臺(tái),由英特爾(中國(guó))有限公司提供圍繞并行計(jì)算以及英特爾至強(qiáng)的相關(guān)培訓(xùn)內(nèi)容,幫助參賽選手深入了解并順利運(yùn)用爾至強(qiáng)平臺(tái)進(jìn)行并行程序的開(kāi)發(fā)以及優(yōu)化。