鄭曉歡 陳明奇 唐川 張娟 房俊民
高性能計算(high performance computing,HPC)是利用并行處理和互聯(lián)技術(shù)將多個計算節(jié)點連接起來,從而高效、可靠、快速地運行高級應用程序的過程,在許多情況下又被稱作超級計算(supercomputing),可以提供比普通臺式計算機或工作站更高的性能,以解決科學、工程或商業(yè)中的復雜問題,已成為解決科學研究、經(jīng)濟發(fā)展、國家安全等方面諸多重大難題的重要手段。發(fā)展高性能計算催生了許多高端技術(shù),并推動了下游產(chǎn)業(yè)的發(fā)展,因此各發(fā)達國家多年來均投入大量資金和人力發(fā)展高性能計算。
目前,我國已建成由17個高性能計算中心構(gòu)成的國家高性能計算服務環(huán)境,資源能力位居世界前列,尖端成果不斷涌現(xiàn)。我國研制的超級計算機已連續(xù)10次在以Linpack性能排名的HPC TOP500中奪冠,我國學者開發(fā)的超算應用還連續(xù)兩次獲得 ACM 戈登·貝爾獎,說明我國不但能造出世界上速度最快的計算機,而且能在超級計算機上實現(xiàn)其他國家還做不到的實際應用,高性能計算已像航天和高鐵一樣成為中國的“名片”。同時,各國紛紛加強高性能計算研發(fā)布局和應用拓展,我國已做好百億億次計算的戰(zhàn)略部署,新一輪競爭已經(jīng)開始。在此背景下,本文對全球高性能計算發(fā)展態(tài)勢進行了剖析和討論。
美國以“國家戰(zhàn)略性計算計劃”為主要綱領,由不同政府部門協(xié)同推進未來高性能計算,特別是百億億次計算研發(fā)與應用。
2015年 7月,美國正式啟動“國家戰(zhàn)略性計算計劃”(National Strategic Computing Initiative,NSCI),旨在使 HPC的研發(fā)與部署最大程度地造福于經(jīng)濟競爭與科學發(fā)現(xiàn)。NSCI確定了 HPC研發(fā)的指導原則與目標,界定了參與機構(gòu)的性質(zhì)與職責,并設立了協(xié)調(diào)機構(gòu)。2016年7月發(fā)布的“國家戰(zhàn)略性計算計劃戰(zhàn)略規(guī)劃”則在此基礎上,進一步明確了各機構(gòu)在每一項發(fā)展目標中的具體責任。該計劃設定的戰(zhàn)略目標有:加快可實際使用的百億億次計算系統(tǒng)的交付;加強建模、仿真技術(shù)與數(shù)據(jù)分析計算技術(shù)的融合;在15年內(nèi)為HPC系統(tǒng)乃至后摩爾時代的計算系統(tǒng)研發(fā)開辟一條可行的途徑;實施整體方案,綜合考慮聯(lián)網(wǎng)技術(shù)、工作流、向下擴展、基礎算法與軟件、可訪問性、勞動力發(fā)展等諸多因素的影響,提升國家HPC生態(tài)系統(tǒng)的可持續(xù)能力;創(chuàng)建一個可持續(xù)的公私合作關系,確保HPC研發(fā)的利益最大化,并實現(xiàn)美國政府、產(chǎn)業(yè)界、學術(shù)界間的利益共享。
此外,一些政府科研部門也有相應部署和投入,主要包括以下。
2.1.1 美國國家科學基金會超算系統(tǒng)投資計劃作為美國國家科學基金會(NSF)“極限數(shù)字發(fā)展計劃”(XD)的一部分,2014年11月,NSF宣布投資1620萬美元構(gòu)建兩套超算系統(tǒng),用于補充開放科學團體現(xiàn)有的資源,使研究人員能在更廣泛的前沿科學領域中利用HPC。這兩套超算系統(tǒng)被分別命名為“橋(bridges)”和“噴流(jetstream)”,并于 2016年投入使用。
(1)“橋”(bridges)。Bridges獲資960萬美元,位于匹茲堡大學的匹茲堡超級計算中心,重點幫助科學家解決需要處理和移動大量數(shù)據(jù)、對計算速度要求不高的科學問題,可針對不同的問題和數(shù)據(jù)量,為用戶提供定制化的內(nèi)存、數(shù)據(jù)帶寬、計算能力。
(2) “噴流” (jetstream)。Jetstream獲資660萬美元,分散安置于印第安那大學的泛在技術(shù)研究所和德州大學奧斯汀分校的德州先進計算中心(TACC),是全球最大的公共科技云之一,用于補充美國國家網(wǎng)絡基礎設施中基于云的計算能力,幫助研究人員按需訪問云計算和數(shù)據(jù)分析資源,以滿足科學與工程研究群體的多樣化計算需求。
2.1.2 美國陸軍研究實驗室 2015—2019年技術(shù)實施計劃2015年 1月,美國陸軍研究實驗室(ARL)發(fā)布“2015至 2019年技術(shù)實施計劃”,分別從技術(shù)研發(fā)和基礎設施建設兩個層面提出美國陸軍對高性能計算研發(fā)與建設的短、中、長期目標。
2.1.3 美國能源部下一代超級計算機研發(fā)項目針對“國家戰(zhàn)略性計算計劃”,美國能源部(DOE)于2016年4月推出了“百億億次計算項目”(Exascale Computing Project,ECP),將此前處于初期的“百億億次計算行動計劃”(Exascale Computing Initiative)逐步轉(zhuǎn)變?yōu)檎降腄OE項目。ECP旨在解決對未來百億億次系統(tǒng)的有效開發(fā)和部署至關重要的硬件、軟件、平臺和人才發(fā)展需求,使高性能計算為美國經(jīng)濟競爭力、國家安全和科學發(fā)現(xiàn)帶來最大程度的利益。ECP將開發(fā)運算性能是當前的千萬億次系統(tǒng)50~100倍甚至更高的超算系統(tǒng),提供突破性建模與仿真方案以在更短的時間內(nèi)分析更多數(shù)據(jù)。
作為10年期項目,ECP重點關注以下4個領域。
(1)應用開發(fā):使ECP的應用套件具備可擴展的性能,能在 ECP百億億次系統(tǒng)上有效執(zhí)行。
(2)軟件技術(shù):擴展現(xiàn)有的DOESC和NNSA軟件棧,使其能有效使用百億億次系統(tǒng)。同時開展工具與方法研發(fā),改進生產(chǎn)性能并提升可移植性。
(3)硬件技術(shù):資助超算供應商開展創(chuàng)建百億億次系統(tǒng)所需的硬件架構(gòu)設計研發(fā)。
(4)百億億次系統(tǒng):資助測試床和先進系統(tǒng)工程的開發(fā),關注采購功能性百億億次系統(tǒng)所需增量式現(xiàn)場準備和系統(tǒng)擴展的成本。
總額為3980萬美元的首輪經(jīng)費全額資助了15項應用開發(fā)項目和7項種子基金項目,涵蓋45家研究和學術(shù)機構(gòu),旨在開發(fā)側(cè)重于可移植性、可用性和可擴展性的先進建模和模擬解決方案,應對DOE在科學發(fā)現(xiàn)、清潔能源、國家安全和與國立衛(wèi)生研究院(NIH)的國家癌癥研究所(NCI)合作的精準醫(yī)療計劃等方面所面臨的具體挑戰(zhàn)。
2.2.1 ETP4HPC與歐盟高性能計算戰(zhàn)略研究議程歐洲高性能計算技術(shù)平臺(ETP4HPC)在歐洲HPC生態(tài)系統(tǒng)中發(fā)揮著“研發(fā)新技術(shù)、提升社會經(jīng)濟效益、協(xié)調(diào)機構(gòu)與項目間合作”等多重關鍵作用。2013年12月,ETP4HPC與歐盟委員會簽訂合同制公私伙伴關系(contractual public-private partnerships,cPPP),歐盟“地平線 2020”(H2020)計劃對 HPC投資 7億歐元,而ETP4HPC也將提供匹配研發(fā)資金。2015年9月,ETP4HPC與PRACE聯(lián)合啟動為期30個月的“歐洲極限數(shù)據(jù)與計算行動計劃”(EXDCI),以促進歐洲HPC生態(tài)系統(tǒng)中關鍵機構(gòu)和項目之間的合作。
2015年11月,ETP4HPC發(fā)布2015年版 HPC戰(zhàn)略研究議程(SRA),旨在提出歐洲百億億次計算的路線圖。該議程在原有的6大重點領域外,還提出了新的技術(shù)領域和新的概念,以及HPC技術(shù)研發(fā)四維度,具體包括:① 新技術(shù)研發(fā),為更廣泛的HPC市場提供更多具備競爭性和創(chuàng)新性的HPC系統(tǒng);② 通過為新技術(shù)提供增強的、合適的特性,解決極限規(guī)模需求;③ 開發(fā)新的 HPC應用,包括復雜系統(tǒng)(如電網(wǎng))控制、云模型、大數(shù)據(jù)等;④ 通過HPC技能培訓和服務支撐,提升HPC解決方案的可用性。
2.2.2 歐盟HPC公私合作伙伴關系2013年12月,歐盟委員會針對8個領域宣布與歐洲產(chǎn)業(yè)界建立合同性公私合作伙伴關系(cPPP),并通過“地平線 2020”計劃提供62億歐元,其中HPC cPPP獲得7億歐元的資助,用于攜手技術(shù)供應商和用戶開發(fā)下一代百億億次超級計算機技術(shù)、應用和系統(tǒng)。其預期成果是:制定對產(chǎn)業(yè)競爭力、可持續(xù)發(fā)展、社會和經(jīng)濟效益具有顯著影響的研究與創(chuàng)新戰(zhàn)略,促進涵蓋整個產(chǎn)業(yè)鏈的HPC生態(tài)系統(tǒng),通過提供HPC資源和技術(shù)使用的便利條件來擴大用戶群。
2016年5月,歐盟根據(jù)其2016—2017工作計劃,發(fā)布H2020計劃HPC領域招標公告,此次招標屬于未來新興技術(shù)(FET)前瞻計劃的一部分,旨在利用從千萬億次向百億億次計算過渡中出現(xiàn)的新機遇,創(chuàng)建下一代極限性能計算。
2.2.3 歐盟 1.4億歐元資助多個HPC項目和卓越中心2015年9月,歐盟宣布投資 1.4億歐元,資助 21項“邁向百億億次高性能計算”的HPC項目并新建8所面向計算應用的卓越中心。其中三個項目——ExaNest,ExaNode和 ECOSCALE于 2016年底合作完成了 ARM64+FPGA架構(gòu)的百億億次超算機原型。
2.2.4 歐盟框架計劃百億億次計算項目研究進展歐盟希望在2022年前能建造3臺全球頂級的超級計算機,為此H2020之前的FP7框架計劃(2007—2013)資助了 8項百億億次計算研究項目,且在2011—2016年間投入的資助超過5000萬歐元。這些項目主要用于解決算法和應用開發(fā)、系統(tǒng)軟件、能源效率、工具和硬件設計等方面的挑戰(zhàn)。
2016年9月,歐盟委員會發(fā)布百億億次計算研究概述報告,回顧了 FP7所資助計算項目的研究進展,包括:CRESTA,百億億次軟件、工具和應用的合作研究;DEEP/DEEP-ER,動態(tài)的百億億次入口平臺及其拓展;Mont-BlancI+II,面向節(jié)能 HPC的歐洲路徑,目前已經(jīng)進入第三階段,計劃在2019年前設計出一個新的高端HPC平臺,能以更低的能耗、更高的性能運行真實應用;EPiGRAM,百億億次編程模型,在消息傳遞接口(MPI)并行編程設計中引入和實現(xiàn)新概念,以實現(xiàn) MPI在執(zhí)行時間和內(nèi)存消耗方面的可擴展性;EXA2CT,百億億次算法與先進計算技術(shù);Numexas,面向工程和應用科學中關鍵百億億次計算挑戰(zhàn)的數(shù)值方法和工具等。
2013年12月,日本文部科學省推出百億億次超級計算機研發(fā)項目,旨在保持日本在計算科學和技術(shù)領域的領先優(yōu)勢。新的超級計算機“后京”(Post-K)預計于2020年投入使用,速度將是日本現(xiàn)有最快超級計算機“京”的100倍。新的百億億次超級計算機研發(fā)被文部科學省列為“旗艦 2020計劃”(Flagship 2020 Project),由日本理化學研究所(RIKEN)的計算科學研究機構(gòu)(AICS)負責實施。文部科學省2015年8月公布的2016年預算顯示,該計劃2016年獲得了76億日元的撥款,比前一年的39億日元增加了近一倍。
“后京”的研發(fā)秉持 4項基本的設計方針:能解決實際的社會和科學問題;在能效方面具備國際競爭力;最大程度地利用前任“京”確立的技術(shù)、人才和應用;2020年以后也能針對半導體技術(shù)的發(fā)展實現(xiàn)有效的性能擴展?;谶@4項方針,“后京”的開發(fā)將通過系統(tǒng)與應用的協(xié)同設計(Co-design)進行,一是開發(fā)下一代超算系統(tǒng)“后京”,二是面向“后京”的使用開發(fā)相應的應用,以解決革命性新藥開發(fā)、生命科學計算、災害預測、氣象預測、綠色能源系統(tǒng)實用、宇宙演化分析等9項重要的社會和科學問題。
“后京”的開發(fā)分為4個方面:架構(gòu)開發(fā)、協(xié)同設計推進、系統(tǒng)軟件開發(fā)、應用開發(fā),AICS為此設立了4個專職研發(fā)團隊。從預定的計劃來看,“后京”的研發(fā)將在2018年完成制造并開始量產(chǎn),2019年進行設置和調(diào)整,2020年投入運行。不過,2016年9月在美國奧斯汀舉行的HPC用戶論壇上,該項目負責人—— RIKEN的石川裕表示,正式運行的時間可能會延后 1~2年,但并未說明延后的原因。有報道稱,可能是由于半導體設計問題導致的 CMOS制造技術(shù)尚不成熟,或者是芯片開發(fā)的時間比預期要長。
法國的新一代超級計算機研發(fā)主要是通過國立科研機構(gòu)與企業(yè)的合作開展,部分研發(fā)項目如下。
法國布爾公司(Bull)于 2014年11月公布其百億億次計算的研發(fā)計劃,在提高處理器運算速度和數(shù)據(jù)處理能力的同時,開發(fā)超快的互聯(lián)技術(shù)和更好的冷卻技術(shù),提高能效,并從根本上重新設計軟件。該計劃擬開發(fā)一臺開放式、高度模塊化并具有最頂級互聯(lián)能力的百億億次超級計算機SEQUANA及其配套的軟件棧,以及一系列具有超高內(nèi)存性能,支持內(nèi)存數(shù)據(jù)庫、預處理、后處理和可視化等操作的服務器。
2015年 7月,法國源訊公司(Atos)與法國新能源與原子能委員會(CEA)簽訂合同,約定于2020年向CEA提供百億億次超級計算機“Tera1000”。系統(tǒng)的第一部分組件已在2015年4月交付,原型系統(tǒng)也在2017年建成并投入運行,其理論峰值達到9.3千萬億次/秒、實測峰值達 4.9千萬億次/秒(2017年11月)。CEA軍事應用科為其開發(fā)了一套生態(tài)系統(tǒng),使其能夠基于Atos的高性能計算技術(shù)提供具有競爭力的、耐用的、符合自身需求的超級計算能力。
2015年8月,IBM和法國國家大型計算中心(GENCI)宣布將開展一項合作,充分利用Open-POWER聯(lián)盟帶來的創(chuàng)新技術(shù),以及IBM基于Open-POWER生態(tài)系統(tǒng)開發(fā)的最先進HPC技術(shù),加快邁向百億億次計算的步伐。該合作得到 POWER加速設計中心的支持,主要致力于為超算系統(tǒng)編寫復雜的科學應用,這些系統(tǒng)的運算速度有望超越10億億次級并邁向百億億次級。此項合作將多點接口技術(shù)和共享存儲并行編程技術(shù)作為共享內(nèi)存多處理器編程的第一步,致力于理解編程模型的進化。由于系統(tǒng)邁向百億億次的過程中可能出現(xiàn)潛在變化,此項合作也將考察多種應用程序接口。
2015年10月,美國計算社區(qū)聯(lián)盟(CCC)在《下一代計算的機遇與挑戰(zhàn)》報告中指出,目前氣候建模與仿真等超算應用的精度受限于計算能力。各國都在大力研發(fā)下一代的百億億次計算,但科研界擔憂超算應用是否能跟上百億億次計算硬件的發(fā)展步伐,一個主要的困難就是沒有人確切地知道未來的百億億次計算架構(gòu)。多位科學家認為,超算應用面臨著正式建模、靜態(tài)分析與優(yōu)化、運行時分析與優(yōu)化、自主計算4大關鍵挑戰(zhàn),并建議基于百億億次系統(tǒng)目前的假設和可用的數(shù)據(jù),采取逐步改進的方式將現(xiàn)有超算應用移植到未來的百億億次計算系統(tǒng)上。
隨著高性能計算機的速度日益提升,能耗成為一個亟待解決的關鍵問題。各國目前制定的百億億次計算規(guī)劃基本將系統(tǒng)功耗目標設定為20 MW。但從目前各方面的技術(shù)水平來看,要在2020年左右實現(xiàn)這一目標仍存在相當大的困難。目前最“綠色”系統(tǒng)為日本理化所研制的 Shoubu system B(2017年 11月 Green500排名第 1),其能效為17 GFlops/w。由此推算,百億億次計算系統(tǒng)的功耗將達到58.8 MW,距離既定的能效指標尚有近3倍的差距。
2015年4月,在美國NSF與半導體研究聯(lián)盟(SRC)聯(lián)合舉行的高能效計算研討會上,與會專家展望了高能效計算研究的機遇。例如,相變的控制對研發(fā)能在極低壓下工作的計算設備而言是一條潛在的途徑,傳導則是其他有前景的低功率開關機制之一。在儲能線路中部署絕熱開關也是改善能效的一條途徑。此外,需要更多的關注更高級的架構(gòu)。例如,磁滯設備具備非易失性邏輯與存儲功能,可以改善現(xiàn)有架構(gòu)的性能;線性與非線性光學設備和緊湊型光發(fā)射器近年來在小型化與能效改善方面都獲得了巨大進步。其他架構(gòu)研究領域也可能利用新興的設備理念來大幅提升計算能效。相關研究主題包括:異構(gòu)系統(tǒng)的架構(gòu)、最大程度減少數(shù)據(jù)移動的架構(gòu)、神經(jīng)形態(tài)架構(gòu)、新的隨機計算方案、近似計算、認知計算等。
GPU已經(jīng)大幅提高了計算能力,但對新軟件和新算法的需求仍然迫切,一些重要問題包括:隨著晶片上集成的晶體管數(shù)量急劇增加,摩爾定律可能失效的推測將促使計算架構(gòu)發(fā)生重要變化,這就需要新的軟件和算法能來幫助新的計算架構(gòu)發(fā)揮最大效用;放寬對計算精確度“近乎完美”的要求可能開創(chuàng)一個“近似計算”的新時代,從而更好地解決系統(tǒng)故障。任何對網(wǎng)絡基礎設施的投資都需要考慮到軟件的更新和重新開發(fā),算法、數(shù)值方法、理論模型的創(chuàng)新對未來計算能力的提升可能發(fā)揮重要作用。另一方面,開展應用數(shù)學研究對促進軟件與算法開發(fā)也非常重要。只有在應用數(shù)學方面取得進展才能開發(fā)出高性能應用程序,從而應對百億億次計算面臨的大量科學與技術(shù)挑戰(zhàn)。美國著名計算科學家杰克·唐加拉(Jack Dongarra)建議美國能源部“先進科學計算研究”項目(ASCR)優(yōu)先開展針對百億億次計算的應用數(shù)學研究,以幫助DOE保持在先進計算方面的優(yōu)勢,包括:對新模型、抽象化、算法的研發(fā)投入大量經(jīng)費,以充分利用百億億次計算的巨大性能;利用應用數(shù)學方法尋找平衡點,以準確區(qū)分各項研究是否需要百億億次計算支持。
硬件架構(gòu)將更趨多樣化,分別以提升運算性能、能效和數(shù)據(jù)密集型處理能力為目標的各種架構(gòu)會陸續(xù)出現(xiàn)。處理器由多核向眾核發(fā)展,2016年6月的TOP500中96套系統(tǒng)使用了眾核加速器技術(shù),其中86套使用了協(xié)處理器,另外10套使用了最新的 Xeon Phi“Knights Landing”處理器作為主要的處理單元,它們是TOP500上首批將眾核技術(shù)作為獨立處理器使用的系統(tǒng)。就互連技術(shù)而言,206套系統(tǒng)采用了千兆以太網(wǎng)技術(shù),187套系統(tǒng)采用了InfiniBand技術(shù),28套系統(tǒng)采用了IntelOmni-Path技術(shù),該技術(shù)在2016年6月的TOP500榜單上首次出現(xiàn)。
此外,后摩爾時代的新型計算架構(gòu)是重要研究熱點?!?015國際半導體技術(shù)發(fā)展路線圖》認為,在經(jīng)歷50多年的不斷小型化發(fā)展之后,晶體管體積將在2021年停止縮減,屆時摩爾定律將失效,該路線圖自2016年起也已停止更新。2016年3月,英特爾宣布延長處理器研發(fā)周期,將傳統(tǒng)的研發(fā)周期從“制程—架構(gòu)”的兩步戰(zhàn)略變?yōu)椤爸瞥獭軜?gòu)—優(yōu)化”的三步走戰(zhàn)略,業(yè)內(nèi)認為這一策略的轉(zhuǎn)變意味著摩爾定律正式終結(jié)。
隨著摩爾定律的終結(jié),各國政府、企業(yè)和學術(shù)界都在加大力度研發(fā)新一代的計算架構(gòu)。例如,IBM公司在2014年7月宣布,將在未來5年投資 30億美元推動計算技術(shù)的發(fā)展,其中就涉及面向后硅時代的量子計算和神經(jīng)形態(tài)計算研發(fā);2015年1月,美國空軍研究實驗室提出了2015—2030年在超級計算領域的研發(fā)目標,長期目標之一就是實現(xiàn)量子計算、神經(jīng)形態(tài)計算和生物計算等新型計算模式與硬件的集成;美國高級情報研究計劃局正在致力于超導超級計算(包括低溫存儲)的研究;此外,美國桑迪亞國家實驗室正在開展一項名為“超越摩爾定律計算”的計劃,以開發(fā)后摩爾時代的計算技術(shù)。
為進一步在與各國的高性能計算競爭中取得先機,我國將百億億次(E級)超級計算機及相關技術(shù)的研究寫入了國家“十三五”規(guī)劃,希望在2020年左右實現(xiàn)這一宏偉研究計劃。在2016年啟動的國家“十三五”高性能計算專項課題中,國防科技大學、中科曙光和江南計算技術(shù)研究所同時獲批開展 E級超級計算原型系統(tǒng)的研制工作,形成了“三頭并進”的局面,擬通過賽馬機制打造我國自主的E級超算系統(tǒng)。
該專項總體目標是:在 E級計算機的體系結(jié)構(gòu),新型處理器結(jié)構(gòu)、高速互連網(wǎng)絡、整機基礎架構(gòu)、軟件環(huán)境、面向應用的協(xié)同設計、大規(guī)模系統(tǒng)管控與容錯等核心技術(shù)方面取得突破,依托自主可控技術(shù),研制適應應用需求的 E級高性能計算機系統(tǒng),使我國高性能計算機的性能在“十三五”末期保持世界領先水平。
4.2.1 研制能力顯著增強2016年11月公布的第48期全球超級計算機500強(TOP500)榜單上,使用中國自主芯片制造的“神威·太湖之光”以較大的運算速度優(yōu)勢輕松蟬聯(lián)冠軍,“天河二號”排名第2。中國超算總體表現(xiàn)出色,以171臺上榜數(shù)量與美國并列第 1。這見證了中國和美國并駕齊驅(qū)的超算優(yōu)勢,也反映了中國超算的快速崛起。
在一年后(2017年11月)發(fā)布的第50期TOP500榜單中,我國“神威·太湖之光”和“天河二號”依舊占據(jù)前兩名,其中“神威·太湖之光”的核心部件全部為國產(chǎn),凸顯中國在超算領域的自主研發(fā)能力。在入圍TOP500的系統(tǒng)數(shù)量方面,我國首次以顯著優(yōu)勢領先美國(202套:143套),呈現(xiàn)出全面爆發(fā)趨勢。在計算資源總量上,我國占到榜單上所有HPC系統(tǒng)總和的35.4%,高于美國的29.6%。
值得注意的是,我國HPC的研制能力已顯著增強,除了國防科技大學、江南計算技術(shù)研究所先后研制出最快超算系統(tǒng)外,在第 50期Top500榜單中,聯(lián)想、浪潮、曙光等3家中國廠商所研制的 HPC數(shù)6382.024量依次排名第 2、第 3和第5,與美國惠普(第1)和Cray(第4)共同構(gòu)成全球第一梯隊。另一方面,美國在 TOP500榜單上的成績已跌至歷史最差。但從HPC研制企業(yè)與核心技術(shù)看,美國依舊牢牢占據(jù)優(yōu)勢。最新TOP500榜單上有471套HPC使用了英特爾的芯片,比6個月前增加了7臺,另有14臺采用IBM的芯片。
4.2.2 多領域應用獲得豐碩成果隨著我國高性能計算的研制不斷取得進步以及相關學科快速發(fā)展,我國高性能計算的應用在近年取得了豐碩成果,有較大國際影響的包括以下。
(1)千萬核可擴展大氣動力學全隱式模擬
在 2016年 11月美國鹽湖城舉行的2016年全球超級計算大會上,中國憑借“千萬核可擴展大氣動力學全隱式模擬”研究成果一舉獲得“戈登·貝爾”獎。該研究由“神威·太湖之光”提供運算支撐,可有效開展全球公里級氣象預報,與國際主流的大氣動力模式相比,計算速度提升近10倍,與2015年獲得戈登·貝爾獎的項目相比,計算效率提升10倍以上。這是我國超算應用團隊首次獲得有著“超算應用諾獎”美譽的“戈登·貝爾”獎,標志著我國科研人員正將超級計算的速度優(yōu)勢轉(zhuǎn)化為應用優(yōu)勢。
(2)鈦合金微結(jié)構(gòu)演化相場模擬
鈦合金制備工藝復雜,微觀組織形成機制和規(guī)律難以通過實驗獲得,常借助于軟件模擬。相場法能夠模擬微觀組織的演化過程,廣泛應用于新材料的設計?;凇吧裢ぬ狻?,中國科學院計算機網(wǎng)絡信息中心自主開發(fā)了基于可擴展緊致指數(shù)時間差分算法庫的相場模擬軟件 ScETDPF,支持計算材料科學、計算物理、計算生命科學等學科的科研模擬。
該研究由網(wǎng)絡中心和中國科學院金屬研究所合作開展,首次實現(xiàn)了國際最大規(guī)模的鈦合金微結(jié)構(gòu)粗化相場模擬,顯著加快了我國新型鈦合金的設計和工藝優(yōu)化。計算擴展到800萬核,實現(xiàn)整機規(guī)模計算,最大性能達到 39.678 PFlops。該應用也入圍2016年“戈登·貝爾”獎提名。
(3)高分辨率海浪數(shù)值模擬
對于海洋模式模擬而言,分辨率的提高會帶來計算量的大幅提升。如果水平分辨率提高10倍,模式的計算量將增加數(shù)百乃至上千倍,是未來 E級計算機系統(tǒng)的驅(qū)動應用。
國家海洋局第一海洋研究所、青島海洋科學與技術(shù)國家實驗室與清華大學合作,在“神威·太湖之光”超級計算機實現(xiàn)了(1/60)。高分辨率的全球海洋模式,通過核加速、負載均衡、通信重疊和指令流水等優(yōu)化手段,模式成功擴展到了8,519,680核數(shù),達到最高30.07 PFlops的峰值性能,獲得了優(yōu)異的擴展性與并行效率。該應用同樣入圍2016年“戈登·貝爾”獎提名。
(4)非線性大地震模擬
基于“神威·太湖之光”的強大計算能力,由清華大學、國家超級計算無錫中心、山東大學、南方科技大學、中國科技大學、國家并行計算機工程技術(shù)研究中心組成的聯(lián)合團隊成功設計實現(xiàn)了高可擴展性的非線性大地震模擬工具。該工具充分發(fā)揮國產(chǎn)處理器在存儲、計算、通信資源等方面的優(yōu)勢,可以實現(xiàn)高達18.9 PFlops的非線性地震模擬,是國際上首次實現(xiàn)如此大規(guī)模下的高分辨率、高頻率、非線性塑性地震模擬,對未來的地震災害救援演習、預防預測等研究具有重要的借鑒意義?!胺蔷€性大地震模擬”贏得了2017年“戈登·貝爾”獎。
我國高性能計算近年取得了巨大發(fā)展,既反映了國家經(jīng)濟實力和創(chuàng)新能力的提升,也說明當前我國的研發(fā)與生產(chǎn)需求都十分強勁,尤其是互聯(lián)網(wǎng)領域?qū)τ嬎愕耐⑿枨蟠罅瓌恿宋覈咝阅苡嬎愕陌l(fā)展。但是,一些核心技術(shù)仍未實現(xiàn)突破,加之建設、運營、市場化經(jīng)驗有限,導致實際發(fā)展與建設目標存在一定差距,依然存在較多提升空間。
4.3.1 構(gòu)建“大”、“小”高性能計算創(chuàng)新生態(tài)系統(tǒng)我國高性能計算的發(fā)展到了關鍵時期,必須要在此階段建立起良好的生態(tài)系統(tǒng),方可實現(xiàn)全面領先和持續(xù)性進步。從狹義上說,“小”的創(chuàng)新生態(tài)系統(tǒng)是要面向處理器研發(fā)系統(tǒng)軟件、工具軟件和應用軟件,讓處理器得到廣泛應用。而“大”的創(chuàng)新生態(tài)系統(tǒng)是指產(chǎn)業(yè)界、學術(shù)界和應用部門之間的協(xié)調(diào),即把系統(tǒng)研發(fā)、應用研發(fā)和整個計算基礎設施的研發(fā)整合起來,真正形成具有世界競爭力的科學產(chǎn)業(yè)和基礎設施。需要通過在教育、研究和產(chǎn)業(yè)各個領域更好地開展合作來建設這更大的創(chuàng)新生態(tài)環(huán)境。
4.3.2 改善科研院所高性能計算設施建設盡管我國入圍TOP500榜單的高性能計算機數(shù)量已大幅超越美國,但其中大部分都排在榜單的后半部分,并且大多被部署在互聯(lián)網(wǎng)公司、云服務提供商、電信運營商、電力公司和政府部門,用于尖端研發(fā)的寥寥無幾。與此相對應的,美國大多數(shù)高性能計算機被部署在國家實驗室、大學以及研究機構(gòu)中,從事最尖端和前沿的研究。中國的大學和研究機構(gòu)需要高性能計算設施,應當加大在這方面的投資。
4.3.3 突破軟件瓶頸,釋放高性能計算設施價值高性能計算機的壽命通常只有5~7年,并且運行維護費用很高,因此必須快速研制出相關應用程序,才能最大程度發(fā)揮其價值。我國高性能計算長期重“硬”輕“軟”,導致基礎并行環(huán)境、基礎算法、高性能數(shù)學庫、操作系統(tǒng)等基礎與應用軟件的發(fā)展落后于計算機系統(tǒng)的發(fā)展,進而導致我國高性能計算設施難以充分發(fā)揮作用。目前,我國許多研究機構(gòu)、高等院校大量使用國外商業(yè)軟件、開源軟件,并導致諸多困難:一些軟件甚至只是目標程序,很難對物理模型、計算格式、算法進行調(diào)整、改進;計算規(guī)模受限制;計算精度、分辨率不高;關鍵應用受到限制。
要使高性能計算在實際應用中真正成為科技創(chuàng)新的重要手段,就必須堅持對基礎與應用軟件和高性能計算機系統(tǒng)的統(tǒng)籌規(guī)劃、均衡投資、協(xié)調(diào)發(fā)展。建議成立若干國家并行軟件工程中心,統(tǒng)籌、協(xié)調(diào)全國各行業(yè)并行軟件的研究、開發(fā)、推廣和應用,同時采用自研、開源、共享等多種手段,解決國產(chǎn)軟件缺乏和市場占有率低的問題。
4.3.4 大力培養(yǎng)高素質(zhì)跨學科人才高性能計算是一門典型的交叉學科,其內(nèi)容涉及計算機科學、計算數(shù)學、行業(yè)應用知識。我國高性能計算的研發(fā)人才已具備相當實力,但應用人才相對短缺,特別是缺乏應用軟件和系統(tǒng)軟件方面的專業(yè)人才。主要原因在于培養(yǎng)相關人才的門檻高、專業(yè)性強,學科交叉協(xié)作還未形成風氣,缺乏鼓勵學科交叉合作的具體機制和組織保障。
因此,培養(yǎng)高素質(zhì)跨學科人才顯得尤為迫切。應建立長期的人才培養(yǎng)戰(zhàn)略,通過科普讓更多年輕人接觸、了解高性能計算,同時擴大設置“高性能計算理論+多學科應用課程”的高校范圍,加大對“懂計算懂專業(yè)”的復合型人才培養(yǎng)力度,大力推動該領域多學科的交叉融合。要加強課程建設、師資隊伍建設,還要拓寬人才培養(yǎng)渠道、結(jié)合實踐培訓用戶來解決人才不足問題。?