孫家昶,李會元
(中國科學院 軟件研究所,北京 100190)
中國科學院首個C 類戰(zhàn)略性先導科技專項XDC01000000 主要目標已經(jīng)達到.在數(shù)值軟件層面,該先導專項第 1 階段的主要任務是在復雜異構先進計算系統(tǒng)上研制高水平的基準測試軟件 HPL(high performance Linpack)和HPCG(high performance conjugate gradients).
HPL 與HPCG 是國際上最受關注的用于評測高性能計算機浮點運算性能的兩款基準測試軟件.HPL 通過高斯消去法求解稠密線性代數(shù)方程組來評測高性能計算機浮點性能的實際持續(xù)峰值,是目前全球超級計算機TOP500 以及中國高性能計算機TOP100 排行榜的依據(jù).HPCG 是求解稀疏代數(shù)方程組的一種迭代算法.HPCG基準測試在國際上受到廣泛關注,與HPL 相比,在一定程度上更能真實地反映高性能計算機的實際應用性能.全球超級計算機TOP500 以及中國高性能計算機TOP100 均提供HPCG 性能排行榜.如今,以計算速度為目標的HPL 與HPCG 基準測試,不僅為高性能計算機性能排名提供一種依據(jù),更已成為一種被高性能計算提供商、研究機構與應用部門廣為接受的工業(yè)標準.
先導專項先后兩次開展了HPL 與HPCG 基準測試,其效率和可擴展性超過了先導專項的要求.據(jù)此,先導專項順利通過了中國高性能計算機性能TOP100 排行榜專家組的鑒定,并得到了中國計算機協(xié)會專家組的肯定.
為此,《軟件學報》編輯部特開設“國產(chǎn)復雜異構高性能數(shù)值軟件的研制與測試”專題.專題擬聚焦國產(chǎn)復雜異構先進計算系統(tǒng)下的高性能計算軟件、算法與測試技術,探討軟硬件總體結構與軟件在先進計算系統(tǒng)中的地位與作用.專題定向邀請參與先導專項的兄弟單位研究團隊,從學術層面交流復雜異構系統(tǒng)下的高性能計算基礎軟件的研制和優(yōu)化的各種關鍵技術,總結高性能計算軟件和應用研究中的挑戰(zhàn)與對策.內(nèi)容重點涵蓋先進計算系統(tǒng)基準評測軟件HPL、HPCG 等的研制、調(diào)優(yōu)與測試及相應BLAS 等基礎代數(shù)庫的優(yōu)化,也包含了若干高性能應用算法與軟件的研制進展.
專題收到8 篇投稿,先后邀請了十幾位領域?qū)<覅⑴c審稿,每篇稿件都由3 位專家歷經(jīng)2 輪或3 輪審稿,最終有7 篇論文入選本專題.
論文“異構HPL算法中CPU端高性能BLAS庫優(yōu)化”針對具體異構系統(tǒng)的體系結構以及HPL算法特點,利用多種技術手段優(yōu)化CPU端調(diào)用的各級BLAS(basic linear algebra subprograms)函數(shù),應用auto-tuning 技術優(yōu)化矩陣分塊參數(shù),從而形成了優(yōu)化的BLIS算法庫,以便更充分地利用通用CPU 計算能力,提高系統(tǒng)整體效率.
論文“復雜異構計算系統(tǒng)HPL 的優(yōu)化”針對異構先進計算機系統(tǒng),提出了一套CPU 與加速器計算任務分配方式,提出了平衡點理論指導HPL 性能優(yōu)化,實現(xiàn)了加速器、CPU、網(wǎng)絡等部件的高度并行,提高了加速器的利用率.
論文“國產(chǎn)異構系統(tǒng)上HPL 的優(yōu)化與分析”基于處理器-加速器異構系統(tǒng)提出了一個HPL 性能模型,設計了一種多線程細粒度異構HPL算法,完成了一個輕量級跨平臺異構加速框架,以實現(xiàn)跨平臺的HPL算法.
論文“面向異構計算機平臺的HPL 方案”嘗試為HPL 的優(yōu)化工作提供一種解決方案:Hetero-HPL.因為進程不再要求與(協(xié))處理器一一對應,單節(jié)點HPL 可以完全避免進程間數(shù)據(jù)傳輸開銷、完全利用物理節(jié)點的所有資源.
論文“國產(chǎn)異構系統(tǒng)上的HPCG 并行算法及高效實現(xiàn)”面向復雜異構超級計算機開展研究,提出了一種適用于結構化網(wǎng)格的圖著色算法用于HPCG 并行,提出一套更適用于HPCG 的任務劃分方法,并從稀疏矩陣存儲格式、稀疏矩陣重排、訪存等角度開展了細粒度的優(yōu)化.
論文“SW26010 眾核任務并行調(diào)度系統(tǒng)及其嵌套并行算法應用”提出了支持任務嵌套并行模式的通用運行時框架SWAN,并基于SWAN 框架在目標平臺上實現(xiàn)了若干典型的具有遞歸特性的嵌套并行算法.
論文“面向異構計算的高性能計算算法與軟件”對幾類典型高性能計算應用軟件開展并行計算算法特征分析,提煉出若干典型應用算法和軟件的共性問題,并面向國產(chǎn)異構計算體系結構對高性能計算算法與軟件進行了總結.
我們希望通過本專題的出版和傳播,凝聚科技界及軟件產(chǎn)業(yè)界對高性能計算基礎軟件和相應算法研究的重視,從而為后續(xù)異構計算機軟件研制及產(chǎn)業(yè)發(fā)展打下更堅實的基礎.