楊潔
工信部等六部門(mén)日前印發(fā)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》,從計(jì)算力、運(yùn)載力、存儲(chǔ)力、應(yīng)用賦能等多方面提出算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展目標(biāo)。作為在用算力規(guī)模排名全國(guó)第一的城市,上海近年來(lái)在算力基礎(chǔ)設(shè)施布局及產(chǎn)業(yè)發(fā)展方面有哪些優(yōu)勢(shì),面臨哪些機(jī)遇和挑戰(zhàn)?中國(guó)證券報(bào)記者跟隨工信部新聞宣傳中心組織的“算力中國(guó)行”大型調(diào)研活動(dòng),走進(jìn)我國(guó)算力網(wǎng)絡(luò)重要樞紐節(jié)點(diǎn)城市上海,采訪算力產(chǎn)業(yè)上下游企業(yè)及主管單位了解到,隨著上海大力提升智能算力占比,智算產(chǎn)業(yè)生態(tài)日漸完善。同時(shí),在異構(gòu)算力資源調(diào)度和交易方面,上海正開(kāi)展新的探索。
供給更智能
記者來(lái)到位于上海臨港(10.890, 0.05, 0.46%)新片區(qū)的商湯科技人工智能計(jì)算中心(簡(jiǎn)稱“商湯AIDC”)。這座外觀設(shè)計(jì)形如芯片的大型建筑,是目前全亞洲規(guī)模最大的人工智能計(jì)算中心之一。
從2022年初投運(yùn)到現(xiàn)在,商湯AIDC匯集超過(guò)30000張GPU對(duì)外提供算力服務(wù),總算力規(guī)模達(dá)到6000Pflops,可支持20多個(gè)千億參數(shù)大模型同時(shí)訓(xùn)練。
當(dāng)前,國(guó)內(nèi)人工智能大模型層出不窮,打響“百模大戰(zhàn)”。
作為較早布局智算能力云服務(wù)的廠商,商湯對(duì)此感受尤其明顯。“我們的算力一直都是排滿的,客戶需要排隊(duì)。”商湯科技大裝置事業(yè)群生態(tài)總監(jiān)劉遠(yuǎn)輝告訴記者。
上海市在用和在建算力總規(guī)模超過(guò)14Eflops。據(jù)中國(guó)信通院今年8月發(fā)布的《中國(guó)綜合算力指數(shù)2023年》,上海算力綜合指數(shù)全國(guó)排名第三,在用算力規(guī)模全國(guó)排名第一,運(yùn)力單項(xiàng)指數(shù)全國(guó)排名第一。
即便作為優(yōu)等生的上海,同樣面臨智算供給不足。據(jù)上海市通信管理局調(diào)研排查,未來(lái)三年新增基礎(chǔ)算力需求與新增智算需求比例將達(dá)到約1:9。現(xiàn)階段上海的基礎(chǔ)算力規(guī)模與智能算力規(guī)模比例約為6:4。
上海市通信管理局信息通信發(fā)展處副處長(zhǎng)魏征向記者介紹,截至2022年底,共有超過(guò)52家持有互聯(lián)網(wǎng)數(shù)據(jù)中心經(jīng)營(yíng)許可的企業(yè)在上海建設(shè)并運(yùn)營(yíng)數(shù)據(jù)中心。在用數(shù)據(jù)中心標(biāo)準(zhǔn)機(jī)架達(dá)41.5萬(wàn)個(gè),在用算力總規(guī)模估算約8995Pflops,其中智算規(guī)模約5675Pflops;在建標(biāo)準(zhǔn)機(jī)架約20.5萬(wàn)個(gè),按照現(xiàn)有芯片算力水平估算,在建算力總規(guī)模約為5500Pflops,其中智算規(guī)模約5000Pflops。
上海市今年6月發(fā)布的《新型數(shù)據(jù)中心“算力浦江”行動(dòng)計(jì)劃2023年重點(diǎn)任務(wù)》提出,到2024年上海市數(shù)據(jù)中心算力供給將實(shí)現(xiàn)以超算算力與智算算力等高性能算力為主的多元算力協(xié)同,總算力將超過(guò)15Eflops,高性能算力占比達(dá)到35%。
在智算方面,魏征介紹,臨港商湯、松江騰訊、金山阿里、超算中心、臨港有孚等在建的五大智算中心正逐步投產(chǎn),總智算規(guī)模將超過(guò)10Eflops,建成并接入新型互聯(lián)網(wǎng)中心后,將形成“一平臺(tái)、五中心”的智算中心賦能應(yīng)用格局。
魏征表示,上海市通信管理局將在持續(xù)推進(jìn)“算力浦江”行動(dòng)計(jì)劃各項(xiàng)重點(diǎn)任務(wù)的基礎(chǔ)上,通過(guò)推動(dòng)制定算力基礎(chǔ)設(shè)施統(tǒng)籌推進(jìn)機(jī)制等,適度加大以智算為主的算力基礎(chǔ)設(shè)施供給,打造基于算力調(diào)度的服務(wù)能力,為滿足上海現(xiàn)代化產(chǎn)業(yè)體系對(duì)算力的高能級(jí)需求打下堅(jiān)實(shí)基礎(chǔ)。
記者注意到,算力基礎(chǔ)設(shè)施服務(wù)商聯(lián)合上游國(guó)內(nèi)GPU廠商共同完善算力生態(tài)。上海電信相關(guān)負(fù)責(zé)人表示,會(huì)拿出部分機(jī)架提供給國(guó)內(nèi)GPU廠商,并進(jìn)行專(zhuān)業(yè)的測(cè)評(píng)服務(wù),推動(dòng)國(guó)內(nèi)GPU的商業(yè)化和產(chǎn)業(yè)化。
按照工信部等六部門(mén)近日印發(fā)的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》提出的目標(biāo),到2025年,我國(guó)算力規(guī)模超過(guò)300Eflops,智能算力占比達(dá)到35%。中國(guó)信通院數(shù)據(jù)顯示,截至2023年6月底,我國(guó)算力規(guī)模達(dá)到197Eflops,其中智能算力規(guī)模占比達(dá)25%,智能算力規(guī)模同比增長(zhǎng)60%。
運(yùn)行更綠色
記者來(lái)到中國(guó)移動(dòng)(102.600,-0.82,-0.79%)長(zhǎng)三角(上海)臨港數(shù)據(jù)中心,這里共規(guī)劃建設(shè)3萬(wàn)個(gè)機(jī)架,其中已投產(chǎn)1.5萬(wàn)個(gè),并為國(guó)內(nèi)某大型互聯(lián)網(wǎng)公司定制打造了微模塊機(jī)房。每個(gè)微模塊單元方方正正,就像一個(gè)“大盒子”,門(mén)口有顯示屏,實(shí)時(shí)顯示各項(xiàng)運(yùn)行數(shù)據(jù)。記者看到一模塊單元的實(shí)時(shí)PUE值為1.1。
據(jù)上海移動(dòng)工作人員介紹,相較于傳統(tǒng)機(jī)房,智能高效的微模塊可以一體化部署管控各基礎(chǔ)設(shè)施,具有更高的運(yùn)行可靠性和效率,能夠精準(zhǔn)控制空間冷量,降低數(shù)據(jù)中心PUE。
數(shù)據(jù)中心能耗巨大,被稱為“不冒煙的工廠”。根據(jù)Gartner測(cè)算,在一個(gè)典型的數(shù)據(jù)中心TCO(總成本)構(gòu)成中,電力能耗占據(jù)成本的20%,而電力成本的41%在于散熱的消耗。
在上海這樣的一線城市,降低能耗、提高能效的需求更為迫切。上海移動(dòng)有關(guān)負(fù)責(zé)人表示,公司會(huì)依據(jù)機(jī)房PUE現(xiàn)狀,制定整體節(jié)能改造措施,積極應(yīng)用AI智能控制、CFD氣流組織優(yōu)化、永磁電機(jī)冷卻塔等新技術(shù),預(yù)計(jì)到2023年底,PUE降至1.5以下的機(jī)架數(shù)量會(huì)達(dá)到70%以上。同時(shí),實(shí)施老舊機(jī)房節(jié)能煥新計(jì)劃,預(yù)計(jì)可實(shí)現(xiàn)年節(jié)電量5100萬(wàn)度。
在算力供給端加強(qiáng)綠色節(jié)能技術(shù)應(yīng)用的同時(shí),算力應(yīng)用端也在想方設(shè)法通過(guò)軟件架構(gòu)和算法層面的改進(jìn)來(lái)提高算力使用效率,“綠色計(jì)算”概念由此應(yīng)運(yùn)而生。
螞蟻集團(tuán)高級(jí)技術(shù)專(zhuān)家宋順向記者解釋?zhuān)诜?wù)器層面,部分算力可能處于閑置狀態(tài)。比如,國(guó)內(nèi)服務(wù)器CPU利用率一般在20%左右,國(guó)際領(lǐng)先的廠商可以做到40%-50%。螞蟻通過(guò)分時(shí)調(diào)度技術(shù)、AI彈性預(yù)測(cè)技術(shù)、在離線混合部署技術(shù)等,逐漸實(shí)現(xiàn)計(jì)算資源的優(yōu)化高效利用,服務(wù)器CPU利用率從2017年不足10%提高到2022年的33%。2022年度“雙11”期間,螞蟻集團(tuán)通過(guò)“綠色計(jì)算”相關(guān)技術(shù)節(jié)省153.8萬(wàn)度電,減排947噸二氧化碳當(dāng)量。
魏征介紹,上海探索了“試點(diǎn)+改造”的綠色算力模式。一方面,推動(dòng)液冷、間接蒸發(fā)自然冷卻等節(jié)能技術(shù)的應(yīng)用,并在嘉定、青浦等地區(qū)的算力中心開(kāi)展試點(diǎn);推動(dòng)DPU芯片在基礎(chǔ)電信企業(yè)算力網(wǎng)絡(luò)中應(yīng)用,經(jīng)初步測(cè)試在數(shù)據(jù)傳送方面可降低35%以上能耗;推動(dòng)數(shù)據(jù)中心企業(yè)啟動(dòng)氫燃料電池等綠電在數(shù)據(jù)中心的試點(diǎn)應(yīng)用。另一方面,梳理上海10個(gè)“小散老舊”數(shù)據(jù)中心(約4000個(gè)標(biāo)準(zhǔn)機(jī)架),預(yù)計(jì)將于年底前全部完成數(shù)據(jù)中心改造任務(wù)。
《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》提出了促進(jìn)綠色低碳算力發(fā)展的重點(diǎn)任務(wù),鼓勵(lì)企業(yè)加強(qiáng)綠色設(shè)計(jì),加快高能效、低碳排的算網(wǎng)存設(shè)備部署,推動(dòng)軟硬件協(xié)同聯(lián)動(dòng)節(jié)能。
值得注意的是,相比通用算力,智算功耗要大得多,為滿足未來(lái)智算供給建設(shè)需求,需要統(tǒng)籌考慮能耗管理要求。業(yè)內(nèi)人士建議,能耗指標(biāo)政策適度向智算中心傾斜,同時(shí)優(yōu)化綠色能源能耗管理方式,對(duì)于數(shù)據(jù)中心所用的綠色能源,不再納入能耗總量和強(qiáng)度控制,用能管理逐漸從能耗“雙控”向碳排放“雙控”轉(zhuǎn)變。
調(diào)度更靈活
讓算力像水一樣流動(dòng)、易用,是算力行業(yè)從業(yè)人士的共同愿景,這離不開(kāi)高效協(xié)同的算力網(wǎng)絡(luò)調(diào)度體系。
在此前舉行的2023年中國(guó)算力大會(huì)上,中國(guó)工程院院士高文坦言,目前算力供應(yīng)呈現(xiàn)多元異構(gòu)的局面,云算力、智能算力、超算算力、混合算力等系統(tǒng)、接口、計(jì)費(fèi)方式等各不相同,給算力的統(tǒng)一協(xié)同應(yīng)用調(diào)度帶來(lái)挑戰(zhàn),國(guó)內(nèi)尚未形成有效的跨區(qū)域算力調(diào)度機(jī)制,算力交易結(jié)算及收益分配機(jī)制還在起步階段,需要加強(qiáng)跨主體算力資源對(duì)接以及標(biāo)準(zhǔn)制定等工作。
在算力資源調(diào)度方面,上海有自己的探索和嘗試?!渡虾J型七M(jìn)算力資源統(tǒng)一調(diào)度指導(dǎo)意見(jiàn)》明確,上海全市將開(kāi)展算力基礎(chǔ)設(shè)施及算力資源輸出能力摸排,形成算力清單;基于算力資源底數(shù),構(gòu)建一體化算力調(diào)度服務(wù)體系和平臺(tái)基礎(chǔ)框架,實(shí)現(xiàn)算力資源統(tǒng)一編排。
記者來(lái)到國(guó)家(上海)新型互聯(lián)網(wǎng)交換中心。該中心總經(jīng)理張茜演示了今年7月上線的算力調(diào)度交易平臺(tái)使用流程。
張茜介紹,今年7月,中心推出全國(guó)首個(gè)基于交換中心的算力調(diào)度交易平臺(tái),能夠?yàn)橛脩籼峁┧懔φ{(diào)度、算力托管業(yè)務(wù)服務(wù),緩解當(dāng)前算力結(jié)構(gòu)不均衡、算力供需不匹配以及算網(wǎng)協(xié)同性不強(qiáng)等問(wèn)題,目前已建成算網(wǎng)節(jié)點(diǎn)14個(gè),吸納入駐企業(yè)40家,歸攏算力資源超過(guò)156Pflops。張茜表示,算力調(diào)度交易平臺(tái)的底層包括多元異構(gòu)算力交互平臺(tái),能夠?qū)⒉煌黧w的算力網(wǎng)絡(luò)和平臺(tái)打通,提高數(shù)據(jù)交互效率,實(shí)現(xiàn)算力資源的充分利用和協(xié)同共享。
在北上廣深等城市運(yùn)營(yíng)16座大型數(shù)據(jù)中心的有孚,是該算力調(diào)度交易平臺(tái)首批入駐的算力供給方?!氨举|(zhì)上這是一個(gè)算力資源撮合交易平臺(tái)。我們?cè)谶@里放置算力資源,暫時(shí)閑置的零散算力放在平臺(tái)上對(duì)外提供服務(wù);當(dāng)我們自身算力資源不足時(shí),或自身算力的規(guī)格型號(hào)不匹配,可以作為需求方,在交易平臺(tái)上尋找合適的算力資源?!庇墟贑IO兼華東區(qū)總經(jīng)理鄭力告訴記者。
上海鐵塔有關(guān)負(fù)責(zé)人表示,目前鐵塔在上海全市擁有近3萬(wàn)個(gè)站址資源,這些是天然的邊緣計(jì)算節(jié)點(diǎn)。未來(lái)鐵塔將著力打造場(chǎng)景化的邊緣算力業(yè)務(wù)及解決方案,加快推進(jìn)“通信塔”變成“數(shù)字塔”,“通信機(jī)房”升級(jí)為“數(shù)據(jù)機(jī)房”,國(guó)家(上海)新型互聯(lián)網(wǎng)交換中心所提供的算力調(diào)度交易平臺(tái)可以成為公司邊緣算力對(duì)外提供服務(wù)的一個(gè)渠道。
魏征表示,上海市通信管理局將基于國(guó)家(上海)新型互聯(lián)網(wǎng)交換中心已經(jīng)完成頭部云服務(wù)企業(yè)接入的實(shí)際,結(jié)合國(guó)家重要信息通信基礎(chǔ)設(shè)施試點(diǎn)和算力調(diào)度業(yè)務(wù)的合規(guī)優(yōu)勢(shì),持續(xù)推動(dòng)上海其他算力資源全面接入算力交易平臺(tái),實(shí)現(xiàn)本市算力資源一體化調(diào)度和集中交易,提升算力資源利用率,形成“一點(diǎn)接入、全市調(diào)度”的新型算力供給服務(wù)模式。此外,支持交換中心開(kāi)展基于區(qū)塊鏈的算力交易平臺(tái)建設(shè),探索國(guó)際互聯(lián)網(wǎng)交換中心可行性方案,為上海國(guó)際數(shù)據(jù)港(20.000,-0.52,-2.53%)建設(shè)和跨境數(shù)據(jù)流動(dòng)提供支撐。