由開放計(jì)算社區(qū)OCP及開放標(biāo)準(zhǔn)組織OCTC(中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會開放計(jì)算標(biāo)準(zhǔn)工作委員會)聯(lián)合主辦的2024開放計(jì)算中國峰會日前在北京召開。峰會以“開放協(xié)同:協(xié)作、智慧、創(chuàng)新”為主題,來自百度、阿里云、中國工商銀行、字節(jié)跳動、三星電子、浪潮信息、英偉達(dá)、英特爾等頭部企業(yè)的社區(qū)領(lǐng)袖、技術(shù)大咖、行業(yè)專家就數(shù)據(jù)中心基礎(chǔ)設(shè)施、人工智能創(chuàng)新、開放計(jì)算生態(tài)、綠色計(jì)算發(fā)展、開放系統(tǒng)&CXL(一種高速互聯(lián)協(xié)議)等熱點(diǎn)議題,與參會的千余名IT工程師和數(shù)據(jù)中心從業(yè)者進(jìn)行了深入、全面的技術(shù)探討和實(shí)踐分享,現(xiàn)場氛圍熱烈。
此外,大會上還有幾項(xiàng)重要的發(fā)布。大會宣布開放算力模組規(guī)范(OCM)正式啟動立項(xiàng),以CPU、內(nèi)存為核心構(gòu)建最小算力單元,兼容x86、ARM等多架構(gòu)芯片的多代處理器,從而方便用戶根據(jù)應(yīng)用場景靈活、快速組合。首批成員包括中國電子技術(shù)標(biāo)準(zhǔn)化研究院、百度、浪潮信息、英特爾、AMD、小紅書、聯(lián)想、超聚變等。本次大會,OCP首次設(shè)立了開放計(jì)算最佳創(chuàng)新獎、開放計(jì)算最佳實(shí)踐獎和開放計(jì)算生態(tài)貢獻(xiàn)獎,以此表彰在上述領(lǐng)域做出卓越貢獻(xiàn)的社區(qū)成員。首屆開放計(jì)算最佳創(chuàng)新獎由阿里云、三星和村田獲得,百度和字節(jié)跳動獲得開放計(jì)算最佳實(shí)踐獎,浪潮信息和安謀科技獲得開放計(jì)算生態(tài)貢獻(xiàn)獎。OCP和OCTC還在會上聯(lián)合發(fā)布了全球開放計(jì)算十大創(chuàng)新成果,包括超大規(guī)模數(shù)據(jù)中心部署指南、Evenstar開放式5G平臺、液冷式人工智能加速卡設(shè)計(jì)技術(shù)要求等等,進(jìn)一步體現(xiàn)出開放計(jì)算在數(shù)據(jù)中心領(lǐng)域所具備的創(chuàng)新活力。
開源開放意味著更高效的創(chuàng)新,因?yàn)榧夹g(shù)開放使得不同組織和個人能夠共享知識、代碼和工具,從而加速了技術(shù)的研發(fā)和創(chuàng)新過程。這種開放的環(huán)境鼓勵了更多的實(shí)驗(yàn)和試錯,促進(jìn)了新技術(shù)的快速迭代和成熟。而對于初創(chuàng)企業(yè)和小型開發(fā)者來說,他們可以基于已有的開源項(xiàng)目或平臺進(jìn)行二次開發(fā),大大降低了創(chuàng)新的門檻,使得更多的人才和資源能夠投入到創(chuàng)新活動中去。更為重要的是,開放有助于構(gòu)建開放的技術(shù)生態(tài),吸引更多的開發(fā)者、企業(yè)和用戶參與進(jìn)來。這種生態(tài)的形成促進(jìn)了產(chǎn)業(yè)鏈的上下游協(xié)作,推動了整個產(chǎn)業(yè)的快速發(fā)展,為產(chǎn)業(yè)升級提供了重要支撐。開源開放也成就了AI當(dāng)下的火熱,超過80%的AI項(xiàng)目使用開源框架進(jìn)行開發(fā)。
開放計(jì)算是全球數(shù)據(jù)中心領(lǐng)域在產(chǎn)業(yè)協(xié)同模式的創(chuàng)新,以開放計(jì)算組織為平臺和載體,實(shí)現(xiàn)IT基礎(chǔ)架構(gòu)產(chǎn)品、規(guī)范、知識產(chǎn)權(quán)等成果的共享,從而推動和加速技術(shù)創(chuàng)新,以更有效地支持各行業(yè)對IT基礎(chǔ)架構(gòu)不斷增長的需求。通過開放計(jì)算可以降低數(shù)據(jù)中心技術(shù)獲取成本,推動創(chuàng)新技術(shù)普及;激發(fā)創(chuàng)新活力,讓更多的組織和個人能獲益;并推動數(shù)據(jù)中心節(jié)能降碳,實(shí)現(xiàn)可持續(xù)發(fā)展。
正因?yàn)橐庾R到開放的力量,開放計(jì)算受到越來越多公司的支持并積極投身其中。在過去的三年中,OCP的成員數(shù)量從250多家增長至360多家,增幅接近50%,社區(qū)項(xiàng)目和子項(xiàng)目數(shù)量超過40個。與此同時(shí),OCTC的成員數(shù)量也在一年內(nèi)迅速翻倍,從40多家增長至近百家,快速構(gòu)建起包含基礎(chǔ)設(shè)施、測評與服務(wù)、運(yùn)維管理等在內(nèi)的標(biāo)準(zhǔn)框架,并將通用計(jì)算、柜計(jì)算、AI異構(gòu)、液冷等列入標(biāo)準(zhǔn)化建設(shè)的重點(diǎn)內(nèi)容。
以AIGC為代表的AI應(yīng)用的興起,使得算力需求呈爆炸式增長,多元算力成趨勢,AI芯片的多元化、通用服務(wù)器的多元化趨勢明顯,傳統(tǒng)算力基礎(chǔ)設(shè)施在性能上和效能上都已無法滿足應(yīng)用的需求。
浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥認(rèn)為,為應(yīng)對AI大模型的規(guī)模性和復(fù)雜性,算力等基礎(chǔ)設(shè)施需要在單系統(tǒng)性能提升(Scale up)和集群規(guī)模擴(kuò)展(Scale out)方面來解決挑戰(zhàn)。Scale up通過更強(qiáng)大或更多AI加速卡、處理器以及更高速互聯(lián)通信,來增加單個設(shè)備或節(jié)點(diǎn)的計(jì)算能力和計(jì)算效率;Scale out則通過不斷增加計(jì)算節(jié)點(diǎn)構(gòu)建大規(guī)模集群來滿足AI大模型的算力需求。
OCP推動了開放加速模塊規(guī)范(OAM)的落地,以實(shí)現(xiàn)多元算力芯片的適配兼容,降低資源投入,使算力部署和迭代提速,從而更好支撐AIGC應(yīng)用。據(jù)悉,目前已有20多家芯片企業(yè)支持OAM規(guī)范,市場上90% 高端AI芯片也是基于OAM規(guī)范設(shè)計(jì)。事實(shí)上,OAM已經(jīng)成為全球性的標(biāo)準(zhǔn)。
在AI時(shí)代,一切計(jì)算皆AI。x86、ARM、RISC-V等不同架構(gòu)的芯片高速發(fā)展,讓多元化算力的趨勢更加明顯。但是,不同CPU處理器的接口和管理協(xié)議都不同,這使得硬件開發(fā)、固件適配、部件測試資源等時(shí)間和成本激增,給算力系統(tǒng)設(shè)計(jì)帶來巨大挑戰(zhàn)。這也是上文提到的開放算力模組規(guī)范(OCM)正式啟動立項(xiàng)的價(jià)值與意義所在。
此次大會還就有一個熱點(diǎn)議題——CXL。當(dāng)前,內(nèi)存和I/O的擴(kuò)展能力已遠(yuǎn)落后于AI帶來的計(jì)算密度的增長,而CXL攻克了大規(guī)模高密度計(jì)算中內(nèi)存容量、帶寬及I/O延遲等難題,支持內(nèi)存擴(kuò)展與共享,并與GPU、FPGA等外設(shè)無縫對接,提供前所未有的數(shù)據(jù)交換與處理效率,能夠?qū)崿F(xiàn)計(jì)算性能飛躍。
推動OCM立項(xiàng),發(fā)布多款符合OAM規(guī)范的AI服務(wù)器,將CXL技術(shù)引入融合架構(gòu)3.0原型系統(tǒng)……作為開源開放的倡導(dǎo)者,浪潮信息在開放計(jì)算社區(qū)的參與度越來越深,貢獻(xiàn)設(shè)計(jì)規(guī)劃,牽頭標(biāo)準(zhǔn)制定,并希望聯(lián)合開放社區(qū)伙伴,通過技術(shù)的創(chuàng)新迭代帶動上下游產(chǎn)業(yè)的發(fā)展,為算力產(chǎn)業(yè)高質(zhì)量發(fā)展賦能。