曙光信息產(chǎn)業(yè)(北京)有限公司 寧雷
隨著信息化技術(shù)的發(fā)展,各行業(yè)都在馬不停蹄的進行著各自的信息化步伐。曙光5000A的出世,對于在我國計算機領(lǐng)域的發(fā)展來說可謂是歷史性的進展。百萬億次超級計算機的誕生不僅證明我國擁有自主研發(fā)超級計算機的能力,而且對于挑戰(zhàn)美國壟斷終于有了實際性的突破,有機會成為世界上密度最高的超級計算機。有力的推動了我國信息化時代的發(fā)展步伐。
深圳先進技術(shù)研究院是隸屬中國科學(xué)院的國家級研究所,研究院試圖通過信息領(lǐng)域核心技術(shù)的集成創(chuàng)新和學(xué)科交叉,提升我國現(xiàn)代制造業(yè)、現(xiàn)代服務(wù)業(yè)的自主創(chuàng)新能力。研究院以汽車電子、智能儀器儀表、先進制造裝備、電子設(shè)備、醫(yī)療儀器設(shè)備、家用電器等為重點應(yīng)用領(lǐng)域,以計算機、集成電路、軟件為學(xué)科基礎(chǔ),以人機交互集成技術(shù)、智能仿生集成技術(shù)為基礎(chǔ)性戰(zhàn)略性技術(shù)研究領(lǐng)域,以汽車電子集成技術(shù)、儀器儀表集成技術(shù)、先進制造設(shè)備集成技術(shù)、電子設(shè)備集成技術(shù)作為面向應(yīng)用的技術(shù)研發(fā)領(lǐng)域,集成智能控制、先進材料、光電子及微系統(tǒng)、基于超級計算的虛擬設(shè)計與模擬、工業(yè)設(shè)計等技術(shù),形成原始科學(xué)創(chuàng)新、關(guān)鍵技術(shù)創(chuàng)新、系統(tǒng)集成創(chuàng)新緊密結(jié)合的研發(fā)體系,促進我國以現(xiàn)代信息技術(shù)為核心的新興產(chǎn)業(yè)的發(fā)展。
隨著現(xiàn)代信息技術(shù)的發(fā)展,深圳先進技術(shù)研究院作為一家促進我國新興產(chǎn)業(yè)發(fā)展的機構(gòu)?;诟呒夹g(shù)和高密度的需求,因此對于計算機系統(tǒng)、存儲系統(tǒng)、以及操作系統(tǒng)有著極大的要求,而對于計算機系統(tǒng)的長時間持續(xù)服務(wù)能力的要求更是迫切。
該系統(tǒng)的建設(shè)要求具備高性能、可擴展、高可靠、易管理等特點,不僅要滿足現(xiàn)狀,還要擁有支持今后不斷更新和升級需要的伸縮性。
該系統(tǒng)須是一個具備先進性和成熟性、互聯(lián)性和開放性、高可靠性、高可用性、高可維護性、高節(jié)能性以及伸縮性和擴展性特點的集群系統(tǒng)。同時,要具備完善的管理措施和功能,以便于設(shè)備的安裝、配置和維護,以及對各種軟硬件資源的分配、調(diào)度和管理,已達到提高資源和資產(chǎn)利用率,減輕系統(tǒng)管理人員的工作負擔(dān)的目的。
深圳先進技術(shù)研究院之前已經(jīng)配置了一套 1.5Tflops曙光天潮 4000L集群系統(tǒng),包括數(shù)十個節(jié)點,運行了 CAE、CFD、計算物理化學(xué)等多個學(xué)科的應(yīng)用軟件。
此次采用曙光方案,曙光公司擁有得天獨厚的優(yōu)勢,可以根據(jù)用戶的要求整合深圳分院現(xiàn)有的曙光及其他超級計算資源,構(gòu)建本地區(qū)的綜合計算平臺,不存在任何兼容性問題和技術(shù)障礙。
曙光在對深圳先進技術(shù)研究院進行分析之后,為研究院量身定做了一套用于大規(guī)模高性能計算的本套集群系統(tǒng)——曙光天潮5000系列超級計算機高效能計算集群系統(tǒng)。
本方案從計算子系統(tǒng)、網(wǎng)絡(luò)通信子系統(tǒng)以及存儲子系統(tǒng)三個方面都進行了優(yōu)化設(shè)計,基于通用的集群架構(gòu),通過高速網(wǎng)絡(luò)將上百個節(jié)點的計算能力匯聚到一起,可以支持大規(guī)模并行計算任務(wù),充分適合多種類型應(yīng)用需求。
1、硬件方案:曙光公司為用戶提供的天潮5000高效能計算集群硬件系統(tǒng)包括計算子系統(tǒng)、存儲子系統(tǒng)、網(wǎng)絡(luò)子系統(tǒng)、管理診斷子系統(tǒng)、接入子系統(tǒng)以及基礎(chǔ)架構(gòu)子系統(tǒng)五個部分,系統(tǒng)整體架構(gòu)如下圖所示。
2、軟件系統(tǒng):曙光5000高效能能計算機提供豐富的軟件系統(tǒng),包括操作系統(tǒng)、編譯器、調(diào)試器、函數(shù)庫、并行通信庫、全局共享并行文件系統(tǒng)等基礎(chǔ)軟件,以及曙光公司專門為業(yè)內(nèi)高級用戶開發(fā)的 Gridview2.0綜合監(jiān)控管理系統(tǒng)、PowerConf智能功耗控制系統(tǒng)軟件和業(yè)界領(lǐng)先的Platform作業(yè)管理軟件。
曙光 5000高效能計算機為用戶提供了一個具有海量存儲能力和超級計算能力的高性能計算環(huán)境,包括登錄節(jié)點池、計算資源池以及存儲資源池等。高性能計算用戶還可以利用WEB、應(yīng)用集成GUI以及Scripts三種方式連接到集群登錄節(jié)點提交作業(yè),并通過全局共享的并行存儲資源池存儲應(yīng)用程序的輸入文件和輸出結(jié)果。
此外,為了能完全滿足客戶的需求,該解決方案還配用了一套強大的制冷系統(tǒng)——水冷機柜系統(tǒng)。該水冷機柜系統(tǒng)是通過采用水冷制冷技術(shù)、機柜封閉式設(shè)計、機柜底部內(nèi)置熱交換盤管、風(fēng)扇系統(tǒng)N+1冗余設(shè)計等多項業(yè)界領(lǐng)先技術(shù),來達到保障機組的可靠性和可用性。它由 40余臺水冷機柜及 10余臺冷水分配單元組成,無論是在技術(shù)先進性還是節(jié)能等方面,均能完全滿足深圳先進技術(shù)研究院的需求,而且還大幅度的提高了系統(tǒng)制冷效率。與傳統(tǒng)的機房冷卻系統(tǒng)相比,該系統(tǒng)的制冷效率提高了30%,與冷卻系統(tǒng)構(gòu)成了業(yè)界最完整的高熱密度解決方案,有效實現(xiàn)了客戶建設(shè)可靠、節(jié)能、環(huán)保的冷卻系統(tǒng)的目標(biāo)。
針對深圳研究院高技術(shù)和高密度的需求,該方案除了具備高性能、可擴展、高可靠、易管理等特點要求,滿足今后不斷更新和升級的需要。還具備以下的優(yōu)勢特點:
1、先進性和成熟性
充分采用符合國際標(biāo)準(zhǔn)的、先進并且成熟的計算機系統(tǒng)、存儲系統(tǒng)、以及操作系統(tǒng)等先進技術(shù)和產(chǎn)品。
2、互聯(lián)性和開放性
計算機系統(tǒng)選用開放式系統(tǒng),具有多平臺多系統(tǒng)的互聯(lián)支持能力,以滿足用戶開發(fā)和使用的要求。
3、高可靠性、高可用性、高可維護性
高效能計算系統(tǒng)要求 7×24小時的持續(xù)服務(wù)能力,因此在方案設(shè)計時,首先應(yīng)考慮選用穩(wěn)定可靠的產(chǎn)品和技術(shù),使其具有優(yōu)秀的RAS特性和必要的冗余容錯能力,為用戶提供高可用服務(wù)。要求系統(tǒng)在硬件配置、操作系統(tǒng)、以及系統(tǒng)管理等環(huán)節(jié)采取嚴(yán)格的安全可靠性措施,保證系統(tǒng)的正常運轉(zhuǎn)。
4、高節(jié)能性
此次選用的網(wǎng)絡(luò)能源的水冷機柜系統(tǒng),曾榮獲德國工業(yè)設(shè)計界“諾貝爾”獎——紅點大獎(reddot),在歐洲各國享有極高的聲譽并獲得了廣泛的應(yīng)用。其擁有的節(jié)能技術(shù)可有效實現(xiàn)客戶建設(shè)可靠、節(jié)能、環(huán)保的冷卻系統(tǒng)目標(biāo)。
5、可縮放性和可擴展性
系統(tǒng)不但要能滿足現(xiàn)階段的業(yè)務(wù)要求,而且要能滿足將來業(yè)務(wù)的增長和新技術(shù)發(fā)展的要求,要在原有設(shè)備繼續(xù)發(fā)揮作用的基礎(chǔ)上,保證用戶能方便地增加或調(diào)整設(shè)備,改善系統(tǒng)功能和性能,支持將來系統(tǒng)不斷更新和便于升級。系統(tǒng)結(jié)構(gòu)應(yīng)能支持主要的協(xié)議、標(biāo)準(zhǔn)和規(guī)范,應(yīng)能運行當(dāng)今流行的軟件環(huán)境下開發(fā)的各種應(yīng)用系統(tǒng)并可以在線軟件升級、調(diào)配;同時應(yīng)留有充分的擴展余地,并保證系統(tǒng)的完整性不受影響,保證系統(tǒng)可以平滑升級、擴容。
6、可管理性
系統(tǒng)具有完善的管理措施和功能,便于設(shè)備的安裝、配置和維護,以及對各種軟硬件資源的分配、調(diào)度和管理,提高資源和資產(chǎn)利用率,減輕系統(tǒng)管理人員的工作負擔(dān)。
曙光針對深圳先進技術(shù)研究院量身定制的大規(guī)模高性能計算的集群系統(tǒng)已經(jīng)部署完畢并投入實際運營中。此種大規(guī)模高性能計算的集群系統(tǒng),完全滿足了深圳研究院目前對于計算機超強計算能力的需求,甚至在性能上已經(jīng)超越了以往的預(yù)期,真正實現(xiàn)了高長時間的持續(xù)服務(wù)能力,有效的促進了深圳先進技術(shù)研究院并行算法設(shè)計、自動并行工具研制、數(shù)據(jù)模擬與仿真、應(yīng)用領(lǐng)域并行算法等方面的研究。
曙光為深圳先進技術(shù)研究院設(shè)計實施的解決方案經(jīng)過實際運營檢驗已經(jīng)獲得了用戶的高度肯定和一致認(rèn)可,十萬億級別的計算能力將有效地助力深圳研究院實現(xiàn)設(shè)備升級,達到了提升項目研究效率的目的。曙光高性能計算產(chǎn)品在深圳先進技術(shù)研究院的成功應(yīng)用對于我國以現(xiàn)代信息技術(shù)為核心的新興產(chǎn)業(yè)的發(fā)展有著重要的意義。
公司是一家在科技部、信息產(chǎn)業(yè)部、中科院大力推動下,以國家“863”計劃重大科研成果為基礎(chǔ)組建的高新技術(shù)企業(yè)。它以中科院計算所、國家智能計算機研究開發(fā)中心和國家高性能計算機工程中心為技術(shù)依托,擁有強大的技術(shù)實力。曙光系列產(chǎn)品的問世,為推動我國高性能計算機的發(fā)展做出了不可磨滅的貢獻。2008年6月,每秒運算233萬億次的超級計算機曙光5000A研制成功,于同年進入全球超級計算機TOP500排行榜前十名,成為美國之外速度最快的計算機,從而使中國成為繼美國之后,第二個能研制百萬億次高性能計算機的國家。
2006年7月,占地面積60余畝的曙光天津產(chǎn)業(yè)基地落成投產(chǎn),實現(xiàn)民族高性能計算機產(chǎn)業(yè)的歷史跨越。曙光高性能計算機連續(xù) 13年穩(wěn)居國產(chǎn)高性能計算機市場第一,擁有國產(chǎn)高性能70%以上的份額,并在高性能集群領(lǐng)域?qū)崿F(xiàn)了國產(chǎn)機對進口產(chǎn)品的超越。曙光公司生產(chǎn)的系列服務(wù)器以技術(shù)先進、性能卓越、服務(wù)優(yōu)良見長,曾獲“國家科技進步一等獎、二等獎”、“中科院科技創(chuàng)新特等獎”、“2001、2003、2004中國十大科技進展”等多項國家級殊榮。
長期以來,曙光始終專注于服務(wù)器領(lǐng)域的研發(fā)、生產(chǎn)與應(yīng)用,依托超級計算機的扎實功底,立足自主研發(fā),通過不斷技術(shù)創(chuàng)新,構(gòu)建出擁有完全自主知識產(chǎn)權(quán)的全系列精品服務(wù)器,能全面滿足用戶從超級計算機到普通PC服務(wù)器的各項應(yīng)用需求,在互聯(lián)網(wǎng)、金融、電信、生物、氣象、石油、科研、電力等多個行業(yè)有著大量成功應(yīng)用。