王瑋 張紅娜 張小林
摘 要:我國高端計算系統(tǒng)產(chǎn)業(yè)化項目運作模式為堅持政府引導、企業(yè)主導、產(chǎn)業(yè)鏈打造,并強調(diào)市場化推進,以達到多方共贏。實現(xiàn)“協(xié)議引進、輔助掌握、替換重構(gòu)和創(chuàng)新超越”的技術(shù)演進路徑,對其成功起著至關(guān)重要的作用。探索研究一種基于開放技術(shù)的可信多路高端計算系統(tǒng)已經(jīng)迫在眉睫。
關(guān)鍵詞:技術(shù)路線;技術(shù)原理;通信
中圖分類號:TP391 文獻標志碼:A
0 前言
目前,中方企業(yè)正在組織消化吸收核心技術(shù),并將與上下游產(chǎn)業(yè)鏈合作伙伴聯(lián)合推出在金融、電信、能源、交通、政府等行業(yè)的系統(tǒng)解決方案,共同打造可信開放的中國自主高端計算系統(tǒng)產(chǎn)業(yè)鏈。各方相關(guān)企業(yè)在業(yè)務(wù)拓展、行業(yè)協(xié)作、解決方案技術(shù)共享等方面加強合作,以建立更好的產(chǎn)業(yè)生態(tài)系統(tǒng)。
1 技術(shù)路線
本項目主要的研究內(nèi)容包括:多路高端計算系統(tǒng)硬件關(guān)鍵技術(shù)研究;系統(tǒng)軟件和應(yīng)用框架研究;結(jié)合第二代異構(gòu)計算技術(shù)的高端計算系統(tǒng)定制化技術(shù)研究。整體框架結(jié)構(gòu)是采用第二代異構(gòu)計算架構(gòu)CPU+FPGA,采用通用CPU 和Xilinx 20nm工藝的Xilinx Kintex UltraScale FPGA。Xilinx OpenCL軟件開發(fā)環(huán)境為SDAccel。
在CAPI體系下,CAPI加速器與CPU實現(xiàn)了對等訪問,共享虛擬地址,數(shù)據(jù)無須轉(zhuǎn)手,直接在加速器與應(yīng)用之間進行溝通。在實際使用時也很簡單,CAPI加速卡可以安裝在任何提供PCIe3.0接口的OpenPOWER Linux服務(wù)器上。應(yīng)用軟件只需要調(diào)用一個CAPI函數(shù),即可直接利用CAPI加速,而在對Linux更新驅(qū)動后,即可直接調(diào)用原有IM/GM等兼容接口函數(shù)。用FPGA取代了原來的GPU,使能耗比大幅提高。
傳統(tǒng)的FPGA加速設(shè)計,均是以I/O總線與CPU平臺相連,在實際的應(yīng)用中,對于應(yīng)用開發(fā)者本身來說仍然有較大的難度。這次CAPI的出現(xiàn),則從根本上解決了這個難題,從而讓FPGA的加速優(yōu)勢得以獲得更充分的發(fā)揮。
應(yīng)用XILINX Kintex UltraScale FPGA+CPU的架構(gòu)加速,理論上最高實現(xiàn)8181 Gb/s數(shù)字信號處理速度,理論上最大傳輸帶寬30.5Gb/s。同時功耗相比較CPU + GPU架構(gòu)也大大降低。體積方面也相應(yīng)減小很多,不像GPU那樣體積很大。數(shù)據(jù)訪問效率大幅提升。
應(yīng)用基于海量數(shù)據(jù),需對海量數(shù)據(jù)進行處理的情況,如變換、分析、篩選等。
具有較大的系統(tǒng)規(guī)模,系統(tǒng)處理器規(guī)模、節(jié)點規(guī)模、存儲器規(guī)模較大;系統(tǒng)的空間占有、能源消耗直接影響系統(tǒng)的擁有成本。
具有較高綜合能力的計算機系統(tǒng),高效能系統(tǒng)。它注重系統(tǒng)的實際應(yīng)用效果,注重性價比和總體擁有成本;用于有挑戰(zhàn)性的應(yīng)用領(lǐng)域,解決復雜問題;用于空間探索、生命科學、氣象模式、高能物理、理論化學等。
圖1為CAPI與FPGA加速功能圖,CPU+CAPI+FPGA實現(xiàn)大數(shù)據(jù)中深度學習算法通用加速平臺。數(shù)據(jù)分析是大數(shù)據(jù)的核心,海量的大數(shù)據(jù)經(jīng)過數(shù)據(jù)采集處理后,通過數(shù)據(jù)抽取、轉(zhuǎn)換剔除、數(shù)據(jù)修正等處理,建立符合需要的正確、完整、一致、完備、有效的數(shù)據(jù)。數(shù)據(jù)分析的目的是對這些數(shù)據(jù)進行分析計算,獲取到有用的數(shù)據(jù)。數(shù)據(jù)分析的方法有很多,如:數(shù)據(jù)挖掘,機器學習,深度學習等。
FPGA 擅長處理需要大量數(shù)據(jù)密集型運算的任務(wù),比如視覺模擬、超快數(shù)據(jù)庫事物、計算視覺和機器學習等任務(wù)。利用FPGA平臺對深度學習算法進行硬化實現(xiàn),是實現(xiàn)深度學習算法加速處理的有效途徑。CPU和FPGA的通信采用CAPI接口。采用CAPI后,和原來CPU和FPGA通信采用PCIE 比較,F(xiàn)PGA看到的不再是PCIE空間了,所以就省去了映射地址這一環(huán)節(jié)。這樣加快了速度,減少了延遲。針對深度學習算法中以向量運算和矩陣運算為主要操作要素的特點。在對各類深度學習算法進行分析的基礎(chǔ)上,采用一種協(xié)處理器的體系結(jié)構(gòu),為深度學習算法建立一個通用的加速平臺。
2 技術(shù)原理
在CAPI體系下,CAPI加速器與CPU實現(xiàn)了對等訪問,共享虛擬地址,數(shù)據(jù)無須轉(zhuǎn)手,直接在加速器與應(yīng)用之間進行溝通。在實際使用時也很簡單,CAPI加速卡可以安裝在任何提供PCIe3.0接口的OpenPOWER Linux服務(wù)器上。應(yīng)用軟件只需要調(diào)用一個CAPI函數(shù),即可直接利用CAPI加速,而在對Linux更新驅(qū)動后,即可直接調(diào)用原有IM/GM等兼容接口函數(shù)。
對系統(tǒng)的訪問進行嚴格的控制和檢查;同時確保網(wǎng)絡(luò)暢通和應(yīng)用透明。首先采用國產(chǎn)的可信處理器設(shè)計的可信計算模塊,從而實現(xiàn)硬件層面的可信和安全。其次,融合多種安全處理技術(shù),進一步提高設(shè)備的安全性和廣泛的適應(yīng)性。通過以上措施的實施,可實現(xiàn)FPGA的運算能力的大幅提升; CAPI緩存和訪問的一致性;可對高性能帶寬接口的支持;可實現(xiàn)開放技術(shù)的規(guī)模在10萬億次的可信多路高端計算系統(tǒng)。對系統(tǒng)的訪問進行嚴格的控制和檢查;確保網(wǎng)絡(luò)暢通和應(yīng)用透明。采用國產(chǎn)的可信處理器設(shè)計的可信計算模塊,實現(xiàn)硬件層面的可信和安全。融合多種安全處理技術(shù),進一步提高設(shè)備的安全性和廣泛的適應(yīng)性。
結(jié)語
本系統(tǒng)的設(shè)計是在政府引導、企業(yè)主導、產(chǎn)業(yè)鏈打造,并強調(diào)市場化推進,以達到多方共贏的前提下,運用上下游產(chǎn)業(yè)鏈合作伙伴聯(lián)合推出在金融、電信、能源、交通、政府等行業(yè)的系統(tǒng)解決方案,共同打造可信開放的中國自主高端計算系統(tǒng)產(chǎn)業(yè)鏈,具有一定的創(chuàng)新性。不僅能促進產(chǎn)業(yè)升級,而且能形成完整的產(chǎn)業(yè)鏈條,創(chuàng)造良好的經(jīng)濟效益和社會效益,為高端計算領(lǐng)域保持領(lǐng)先優(yōu)勢奠定堅實基礎(chǔ)。
參考文獻
[1]安寧鈺,王志皓,趙保華.可信計算技術(shù)在電力系統(tǒng)中的研究與應(yīng)用[J].信息安全研究,2017(4):353-358.
[2]雷濤.可信計算模式下P2P匿名通信系統(tǒng)設(shè)計[J].計算機測量與控制,2017(8):268-271.