隨著21世紀(jì)之門向人類徐徐開啟,超級計算機(jī)“并行計算時代”開始遭遇“寒流”。這股“寒流”的顯著標(biāo)志,就是單芯片性能提升受到制備工藝限制而大大放緩。也就是說,科學(xué)家們提高超級計算機(jī)系統(tǒng)的整體性能,只能依賴于加大系統(tǒng)規(guī)模。這樣一來,系統(tǒng)性能在突破每秒千萬億次后,就會出現(xiàn)一系列難以逾越的“高墻”:
比如體積,它將有幾個足球場那么大。
比如功耗,需要建一個專用的發(fā)電站,才能滿足它的功耗。
這一個個難以攻克的技術(shù)瓶頸,標(biāo)志著超級計算機(jī)純粹CPU超大規(guī)模并行計算技術(shù)路線已走進(jìn)“死胡同”,而需要新的體系結(jié)構(gòu)理論來支撐。
這意味著在高性能計算機(jī)新的技術(shù)高峰面前,中國等發(fā)展中國家的超級計算機(jī)發(fā)展,和美、日等發(fā)達(dá)國家都處于同一起跑線,我國在超級計算機(jī)領(lǐng)域決戰(zhàn)決勝、沖擊“珠峰”的時機(jī)已經(jīng)來臨!
為超級計算機(jī)技術(shù)“破冰”的東風(fēng)是什么?
超級計算機(jī)發(fā)展之路在何方?
在超級計算機(jī)技術(shù)發(fā)展的十字路口,有人在期待,有人在徘徊,有人在觀望,更多的人在躬身探索。
國防科技大學(xué)計算機(jī)學(xué)院大樓旁的銀河廣場上,一名身材魁梧、濃眉大眼、氣宇軒昂的中年軍人,時而慢慢踱步,時而駐足沉思,時而抬頭仰望一眼廣袤的太空。
他就是銀河系列超級計算機(jī)總設(shè)計師楊學(xué)軍教授。
楊學(xué)軍手上夾著香煙,一口接一口地抽著,一支接一支地點著。他的思緒,隨著緩緩?fù)鲁龅臒熿F,裊裊地飄向太空,飄向世界,飄向深邃的歷史……
什么樣的體系結(jié)構(gòu)可以破除超大規(guī)模并行超級計算機(jī)面臨的“高大難”(功耗高、體積大、技術(shù)實現(xiàn)難)窘境呢?
這個大大的問號,拽著楊學(xué)軍及其團(tuán)隊成員的思緒快速且不停歇地運(yùn)轉(zhuǎn)起來。為此,身兼行政領(lǐng)導(dǎo)、型號總師的楊學(xué)軍,無論工作有多忙,每周都要抽出兩天時間與大家交流討論學(xué)術(shù)問題,而且常常因此錯過吃飯時間。這時他就自掏腰包給大家改善伙食,在飯桌上邊吃邊繼續(xù)討論課題,經(jīng)常有意想不到的收獲。
平時,楊學(xué)軍和團(tuán)隊成員身上都帶著兩塊手機(jī)電池。一旦有新發(fā)現(xiàn),就打電話交流討論,常常一打就是一兩個小時,打到兩塊電池都沒電,打得手機(jī)燙耳朵。
他們終于發(fā)現(xiàn)了可用于科學(xué)與工程計算的64位流處理器,并成功應(yīng)用于大規(guī)模并行系統(tǒng)的構(gòu)建。這一研究成果,是名副其實的世界首創(chuàng)!
2007年6月,楊學(xué)軍帶領(lǐng)團(tuán)隊完成的流處理器研究論文《64位流處理器體系結(jié)構(gòu)研究》,發(fā)表在國際計算機(jī)系統(tǒng)結(jié)構(gòu)年會(ISCA)上,并被國際權(quán)威期刊《IEEE Transactions on Parallel and Distributed Systems》錄取。該論文介紹了國防科技大學(xué)自主設(shè)計的面向科學(xué)計算的64位流處理器和其編程方法。這是國際計算機(jī)系統(tǒng)結(jié)構(gòu)年會(ISCA)錄取的第一篇來自中國研究機(jī)構(gòu)、由中國學(xué)者獨立完成的學(xué)術(shù)論文,也是計算機(jī)發(fā)展史上第一個由中國人提出的體系結(jié)構(gòu)理論。
論文發(fā)表后,在國內(nèi)外計算機(jī)領(lǐng)域引起轟動。
CPU與64位流處理器異構(gòu)融合體系結(jié)構(gòu),為世界超級計算機(jī)技術(shù)突破“冰封期”提供了嶄新的思路。
楊學(xué)軍的《64位流處理器體系結(jié)構(gòu)研究》發(fā)表一年后,即2008年6月18日,美國突然宣布:IBM公司采用異構(gòu)融合體系結(jié)構(gòu)技術(shù)成功研制出一臺峰值速度每秒1.37578千萬億次的超級計算機(jī),并將其命名為“走鵑”。美國在異構(gòu)融合體系結(jié)構(gòu)技術(shù)領(lǐng)域捷足先登,打響了新一輪決戰(zhàn)的第一槍,世界強(qiáng)國在超級計算機(jī)領(lǐng)域新的較量正式拉開序幕!
21世紀(jì)的中國,別無選擇,唯有接招,準(zhǔn)備決戰(zhàn)!
進(jìn)攻目標(biāo)鎖定后,攻擊路線就是關(guān)鍵。
兩年前,楊學(xué)軍帶領(lǐng)大伙探討64位流處理器Imagine時,他的腦海里就同時思考著另一種與之有著異曲同工之妙的電子芯片——GPU的科學(xué)計算問題。也就是說,研制每秒千萬億次超級計算機(jī)可走既定的CPU+64位流處理器Imagine異構(gòu)融合技術(shù)路線、也可嘗試CPU(通用微處理器)+GPU(專用微處理器)異構(gòu)融合技術(shù)路線。
對于前者,團(tuán)隊已攻關(guān)多年,有著比較雄厚的技術(shù)積累,成功可能性比較大。而對后者,當(dāng)時國際上公認(rèn)GPU最高計算效能僅為20%,根本不可能用于研制超級計算機(jī)。
但使用GPU構(gòu)建超級計算機(jī)的優(yōu)勢顯而易見:它運(yùn)算速度快,比CPU高出6倍,能有效縮小機(jī)器空間;它能耗低,僅有CPU的五分之一,可有效解決超級計算機(jī)高能耗短板;它在市場上流通的品種很多,可供選擇性大,而且技術(shù)成熟;它價格便宜,可有效提高機(jī)器的性價比,讓用戶用得起……
而將GPU用于超級計算機(jī)研制的劣勢,同樣不容忽視:它能否用于高性能計算機(jī),還是個未知數(shù),探索之路將非常艱難,而且風(fēng)險很大。
以楊學(xué)軍為總設(shè)計師的總師組,經(jīng)過深入技術(shù)調(diào)研、反復(fù)權(quán)衡利弊,決定大膽嘗試CPU+GPU異構(gòu)融合技術(shù)之路。
從每秒10萬億次直接沖刺每秒1000萬億次,走別人沒有走過的CPU+GPU技術(shù)路線,他們的這一超常決策,在業(yè)內(nèi)引起一片嘩然。
“研制超級計算機(jī)一般都以10倍速度逐步遞增,這已成為國際慣例。從每秒10萬億次直接向每秒1000萬億次跨越,這一步是不是邁得大了點?能跨過去嗎?”
“就是把機(jī)器做出來了,應(yīng)用水平能跟上嗎?”
“GPU能否用于高性能計算還是個謎,用它研制超級計算機(jī),這是不是太冒險了?”
……
面對沸沸揚(yáng)揚(yáng)的疑問,楊學(xué)軍率領(lǐng)的總師組認(rèn)為,兩步并作一步走的事,雖然國際上少有,但對銀河人來說卻并不是什么新鮮事。當(dāng)年慈云桂帶領(lǐng)大家研制“遠(yuǎn)望一號”遠(yuǎn)洋測量船中心計算機(jī)時,不也是從每秒萬次直接向每秒100萬次沖刺的嘛。當(dāng)今世界,超級計算機(jī)每10年性能提升1000倍,在此情況下,若按照所謂“慣例”,按部就班、亦步亦趨,只能永遠(yuǎn)處于“跟班”“借鑒”“仰人鼻息”的被動局面。只有從荊棘叢中、險關(guān)狹隘另辟蹊徑,才能殺出重圍,率先“登頂”。至于用于圖像處理的GPU能否用于科學(xué)計算,楊學(xué)軍堅定地認(rèn)為,憑著團(tuán)隊數(shù)十年超級計算機(jī)教學(xué)科研積淀的厚實底蘊(yùn),和對64位流處理器研究取得的創(chuàng)新成果、技術(shù)基礎(chǔ),定能觸類旁通,攻克GPU計算效能這一世界難題。
國防科技大學(xué)黨委積極支持他們的跨越壯舉,向創(chuàng)新團(tuán)隊發(fā)出了“我們的胸懷有多寬,我們的事業(yè)就有多大”的動員令,鼓勵大家確立決戰(zhàn)決心,堅定決勝信心。
帶著國家重托、民族期望,國防科技大學(xué)超級計算機(jī)創(chuàng)新“航母編隊”,浩浩蕩蕩向著新的技術(shù)彼岸進(jìn)發(fā)!