楊光
中科曙光面向用戶、合作伙伴及業(yè)界專業(yè)人士舉辦的大型創(chuàng)新分享活動(dòng)——2016中科曙光技術(shù)創(chuàng)新大會(huì)(IDIC2016)在京開幕。中國工程院院士、曙光公司董事長李國杰,曙光公司總裁歷軍,高級副總裁聶華,副總裁沙超群、邵宗有等曙光公司高管以及VMware、Intel等曙光公司合作伙伴代表先后登臺,圍繞“E級超算”挑戰(zhàn)下企業(yè)級計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全、能耗等一系列問題的解決之道展開演講,分享業(yè)界技術(shù)前沿、面向未來共話創(chuàng)新。中科曙光在大會(huì)上宣布,由其牽頭的E級高性能計(jì)算機(jī)(簡稱“E級超算” )原型系統(tǒng)項(xiàng)目正式發(fā)布。
中國E級超算“三頭并進(jìn)”
作為體現(xiàn)一個(gè)國家綜合國力和科技創(chuàng)新能力的重要標(biāo)志,各國在超算領(lǐng)域的競爭也日趨激烈。尤其是在“太湖之光”把最快計(jì)算機(jī)的持續(xù)計(jì)算速度刷新到93PFlops之后,E級超算已成為當(dāng)前各國競相角逐的戰(zhàn)略制高點(diǎn)。
目前,美國、歐洲、日本等國家和地區(qū)都提出了自己的E級超算研發(fā)計(jì)劃。中國也將百億億次超級計(jì)算機(jī)及相關(guān)技術(shù)的研究寫入了國家“十三五”規(guī)劃,希望在2020年左右實(shí)現(xiàn)這一宏偉研究計(jì)劃。在國家“十三五”高性能計(jì)算專項(xiàng)課題中,中科曙光、國防科技大學(xué)以及江南計(jì)算技術(shù)研究所同時(shí)獲批牽頭E級超算的原型系統(tǒng)研制項(xiàng)目,形成了中國E級超算“三頭并進(jìn)”的局面。
E級超算“原型系統(tǒng)研制”是在E級超算項(xiàng)目正式進(jìn)入日程之前的預(yù)研工作。中科院計(jì)算所研究員、中國計(jì)算機(jī)學(xué)會(huì)高性能計(jì)算專委會(huì)秘書長張?jiān)迫硎荆拖到y(tǒng)的研制可以驗(yàn)證一些關(guān)鍵的技術(shù)設(shè)想,對一些關(guān)鍵技術(shù)難點(diǎn)進(jìn)行測試和改進(jìn),為最后建造全部的系統(tǒng)掃清障礙,避免出現(xiàn)大的技術(shù)錯(cuò)誤和難題,類似的預(yù)研項(xiàng)目“非常必要”。
對于E級超算系統(tǒng)的建設(shè),國際上對運(yùn)算速度、能耗比等都有其公認(rèn)的標(biāo)準(zhǔn)。那么,國產(chǎn)E級超算可采取何種架構(gòu)、何種技術(shù)路線?能否實(shí)現(xiàn)10萬節(jié)點(diǎn)規(guī)模的擴(kuò)展能力?能效比能否有所突破?歷軍表示,基于原型機(jī)的研制與測試,類似上述疑問的謎底將一一被揭開。
開通“E級路線”
完成E級原型機(jī)系統(tǒng)
曙光副總裁沙超群在其“E級挑戰(zhàn)‘億觸即發(fā)”的大會(huì)報(bào)告中對中科曙光E級超算原型系統(tǒng)項(xiàng)目的規(guī)劃和研究路線進(jìn)行了詳細(xì)的解讀。他在大會(huì)上報(bào)告了曙光預(yù)研項(xiàng)目的任務(wù)目標(biāo):完成E級原型機(jī)系統(tǒng),驗(yàn)證E級機(jī)研制的關(guān)鍵技術(shù)和路線圖,形成E級機(jī)的完整方案,為國產(chǎn)E級超算的研制奠定技術(shù)基礎(chǔ)。
按照這一目標(biāo),曙光將憑借深耕高性能計(jì)算20余年的豐富經(jīng)驗(yàn),在體系結(jié)構(gòu)、計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、系統(tǒng)軟件、系統(tǒng)冷卻和可靠性等方面對未來E級超算的建設(shè)進(jìn)行有益探索。
在體系結(jié)構(gòu)方面,曙光提出了一種超融合自適應(yīng)并行處理體系結(jié)構(gòu)( HCAPP )?!肮?jié)點(diǎn)內(nèi)異構(gòu)架構(gòu)仍是未來頂級超算的主流?!鄙吵赫f,“先進(jìn)的6D-Torus高維網(wǎng)絡(luò)架構(gòu)和層次化網(wǎng)絡(luò)系統(tǒng),使系統(tǒng)具有10萬節(jié)點(diǎn)的擴(kuò)展能力,可以穩(wěn)定擴(kuò)展至E級規(guī)模?!?/p>
原型系統(tǒng)采用的存儲(chǔ)系統(tǒng),則是基于曙光承擔(dān)的863課題“曙光EB級云存儲(chǔ)系統(tǒng)研制”的研究成果。沙超群指出,層次多協(xié)議的高性能存儲(chǔ)系統(tǒng)具有超強(qiáng)的EB級擴(kuò)展性和支持千億級文件的存儲(chǔ)能力。
在節(jié)能方面,曙光擬采用目前最高效、最先進(jìn)的服務(wù)器冷卻技術(shù)——全浸沒式相變液冷技術(shù)。沙超群介紹說,絕緣冷媒的相變潛熱是比熱的一百倍,換熱效率高、安全性好,冷媒與發(fā)熱器件直接接觸,能一次性解決全部元件的散熱問題,同時(shí)能大幅提升系統(tǒng)的可靠性。
超算E勢力 助推全球發(fā)展
此外,曙光E級高性能計(jì)算系統(tǒng)原型機(jī),在完成E級系統(tǒng)關(guān)鍵技術(shù)驗(yàn)證的同時(shí),具有良好的生態(tài)環(huán)境和廣泛應(yīng)用適用性。沙超群稱,原型系統(tǒng)可以良好地支撐高性能計(jì)算、深度學(xué)習(xí)、大數(shù)據(jù)、云計(jì)算等領(lǐng)域應(yīng)用,加快技術(shù)成果產(chǎn)業(yè)化應(yīng)用,對我國高性能計(jì)算產(chǎn)業(yè)的發(fā)展有重大支撐作用。
“隨著科技的飛速發(fā)展,知識和技術(shù)創(chuàng)新成為經(jīng)濟(jì)、社會(huì)發(fā)展的主要驅(qū)動(dòng)力?!鄙吵褐赋?,“曙光原型機(jī)作為工業(yè)標(biāo)準(zhǔn)的高性能計(jì)算系統(tǒng),不僅可以為國家科技創(chuàng)新和產(chǎn)業(yè)轉(zhuǎn)型升級提供基礎(chǔ)設(shè)施保障,還將促進(jìn)中國高性能計(jì)算產(chǎn)業(yè)成果走向世界,推動(dòng)全球基礎(chǔ)科學(xué)研究、工業(yè)轉(zhuǎn)型升級、數(shù)字化行業(yè)發(fā)展等,為全人類進(jìn)步作出貢獻(xiàn)?!?/p>
“大曙光”格局推動(dòng)產(chǎn)業(yè)發(fā)展
曙光多業(yè)務(wù)協(xié)同創(chuàng)新正開展得有聲有色。圍繞今年4月發(fā)布的“數(shù)據(jù)中國加速計(jì)劃”重點(diǎn)布局的政府大數(shù)據(jù)、科學(xué)大數(shù)據(jù)、安全大數(shù)據(jù)、工業(yè)大數(shù)據(jù)等四類大數(shù)據(jù)業(yè)務(wù)方面,曙光的布局舉措和落地在IDIC2016上已經(jīng)得到了充分展現(xiàn)。在政府大數(shù)據(jù)方面,曙光易通創(chuàng)造性地利用生物特征識別與云計(jì)算技術(shù)相結(jié)合的“身份認(rèn)證云”為10億中國人提供身份認(rèn)證服務(wù);在科學(xué)大數(shù)據(jù)方面,中科星圖利用“互聯(lián)網(wǎng)+空天大數(shù)據(jù)”增值服務(wù)撬動(dòng)信息消費(fèi)市場;在安全大數(shù)據(jù)方面,中科睿光致力于打造最優(yōu)秀的國產(chǎn)云操作系統(tǒng)以“立足中國服務(wù)中國”……
歷軍表示,隨著中科睿光、曙光易通、中科三清、中科星圖、聯(lián)方云天等子公司的崛起,“大曙光”多元化發(fā)展道路的探索已嶄露頭角。
產(chǎn)業(yè)鏈協(xié)同創(chuàng)新方面,在近年來與Intel、VMware等合作伙伴共同成立“關(guān)鍵業(yè)務(wù)系統(tǒng)產(chǎn)業(yè)聯(lián)盟”、聯(lián)合實(shí)驗(yàn)室等基礎(chǔ)上,2016年曙光又與國內(nèi)眾多上下游伙伴發(fā)起“智慧城市產(chǎn)業(yè)聯(lián)合體”,創(chuàng)造性地開展“麥當(dāng)勞”加盟模式落地智慧城市領(lǐng)域。如今,這一計(jì)劃已取得第一批碩果:在本次大會(huì)的智慧城市分論壇現(xiàn)場,聶華與4座城市的合作伙伴簽署戰(zhàn)略合作協(xié)議,曙光云計(jì)算公司常務(wù)副總裁關(guān)宏明與7座城市的合作伙伴簽署連鎖加盟協(xié)議。
“以自主創(chuàng)新構(gòu)建核心競爭力,以協(xié)同創(chuàng)新推動(dòng)產(chǎn)業(yè)化發(fā)展?!笔锕饪偛脷v軍表示,中科曙光一系列面向未來創(chuàng)新始終堅(jiān)持一個(gè)主題,就是“讓全社會(huì)共享數(shù)據(jù)價(jià)值”。
曙光大數(shù)據(jù)技術(shù)優(yōu)勢
在曙光公司大數(shù)據(jù)總經(jīng)理宋懷明看來,曙光大數(shù)據(jù)技術(shù)有著如下的優(yōu)勢:第一,曙光的歷史相對比較久,從2003年就開始涉足大數(shù)據(jù),包括互聯(lián)網(wǎng)數(shù)據(jù)的監(jiān)控、數(shù)據(jù)分析、后端處理,曙光一直在做數(shù)據(jù)的存儲(chǔ)分析系統(tǒng),那時(shí)候規(guī)模非常大,在2004年曙光單一系統(tǒng)已經(jīng)到500TB以上。第二,曙光大數(shù)據(jù)對行業(yè)應(yīng)用的實(shí)踐比較成熟。尤其在網(wǎng)媒和環(huán)保氣象領(lǐng)域,曙光是和一些國家的權(quán)威機(jī)構(gòu)合作,能接收到核心的數(shù)據(jù),可以對一些國家監(jiān)測機(jī)構(gòu)、數(shù)據(jù)采評機(jī)構(gòu)的權(quán)威數(shù)據(jù)進(jìn)行分析,有應(yīng)用的基礎(chǔ)。這點(diǎn)跟互聯(lián)網(wǎng)企業(yè)是不一樣的。最后,曙光技術(shù)是完全自主可控的,并且充分利用完全吸收了開源技術(shù),任何一條代碼都是自己開發(fā)的,所以曙光對用戶的需求響應(yīng)非???,處理用戶的問題基本不會(huì)隔夜,當(dāng)然也與曙光內(nèi)部團(tuán)隊(duì)管理機(jī)制、解決問題機(jī)制有關(guān)系。同時(shí),代碼自主可控可以增強(qiáng)系統(tǒng)的可靠性。