許茜
在美國鹽湖城舉行的2016全球超級計算大會上,由中科院軟件所楊超率領(lǐng)的研究團隊,憑借“千萬核可擴展大氣動力學(xué)全隱式模擬”研究成果獲得“戈登·貝爾”獎,實現(xiàn)了我國在此獎項上零的突破……
“Ten Million……”
評委剛念出“Ten”,楊超“噌”就站了起來。從座位到領(lǐng)獎臺,他不知道自己是怎么“移動”過去的,也聽不清那些“Congratulation”(祝賀)從哪里來。當(dāng)?shù)貢r間11月17日,美國鹽湖城,有高性能計算“諾獎”之稱的“戈登·貝爾”獎迎來了首個中國面孔。
閃光燈晃個不停,37歲的楊超手捧證書,整個人有點懵,心里嘀咕:真的獲獎了……
“團長”變“旅長”
獲獎項目“千萬核可擴展大氣動力學(xué)全隱式模擬”如投入使用,理論上可大幅提升天氣預(yù)報的計算精度和運算速度。
在楊超眼中,“隱式”是得獎的“功臣”?!半[式”是隱式求解器的簡稱,而“求解器”就像高性能計算的“發(fā)動機”,讓程序“高速運轉(zhuǎn)”。楊超是研制“發(fā)動機”的工程師,也是這次獲獎團隊的“頭頭”。
由于公認(rèn)的技術(shù)難關(guān),學(xué)界一度并不看好隱式在新型超級計算機下的發(fā)展,“用它的人很少”;相比之下,顯式則更受同行青睞。但早在讀博時,楊超便看準(zhǔn)了隱式的潛力,“它更具優(yōu)勢”。
作為軟件的求解器,其本身無法展示效果,要結(jié)合具體領(lǐng)域的應(yīng)用。恰如“發(fā)動機”只有安裝在“汽車”上才能一顯身手,而楊超偏選了輛難開的“車”—大氣動力學(xué),把求解器運用在大氣動力學(xué)方程計算中。大氣是業(yè)內(nèi)公認(rèn)的“硬骨頭”,可楊超覺得“要做就做有挑戰(zhàn)的?!?/p>
博士畢業(yè)后,楊超開始了在大氣應(yīng)用領(lǐng)域的求解器研究??梢胲浖獞颍€得有硬件搭臺。今年的獲獎項目是搭載在千萬核的硬件環(huán)境中,可十年前國內(nèi)的硬件水平還很有限(“核”就是CPU的計算核心)。
“‘核就相當(dāng)于一個兵,帶領(lǐng)一千萬人的超級計算部隊,那是什么感覺?就像一個將軍在帶兵打仗?!倍藭r的楊超只是個“團長”,測試環(huán)境僅有幾千核。
“天河一號”的問世,讓“團長”變“旅長”,楊超做到了整機8萬核CPU模擬。
“天河一號”發(fā)布前3天,經(jīng)導(dǎo)師孫家昶介紹,楊超帶著研究了3年的應(yīng)用軟件去往天津。程序在“天河一號”運行的那一刻,8萬核的驚人速度,楊超感嘆“達到了頂峰”。
首次沖獎 只為理想而戰(zhàn)
很快,這次測試引起了業(yè)內(nèi)的關(guān)注,紛紛請楊超去作報告,其中就有清華大學(xué)計算機系副教授薛巍。楊超受邀去清華園,當(dāng)他展示出8萬核的計算結(jié)果時,有人說了句“這個應(yīng)該沖擊戈登·貝爾”!
“戈登·貝爾”獎是楊超心中的夢,很美,卻“遙不可及”。所以,當(dāng)時楊超“只當(dāng)是同行開了個玩笑”。
幾個月后,薛巍借鑒楊超8萬核CPU模擬中的關(guān)鍵方法,將其用在氣象應(yīng)用“GRAPES”上,效果很理想。看到應(yīng)用如此順暢,楊超心動了?!耙惠呑涌梢圆氖虑椴欢?,但戈登·貝爾算是一個。哪怕失敗了,曾經(jīng)為此努力過就夠了?!?/p>
“天河一號”是由7168顆CPU和7168塊GPU(圖像處理器)組成,而首次嘗試時楊超只用滿了CPU,GPU完全沒有用上。怎么能把GPU用起來?這成了“沖獎”的一道坎。
為了解決這一難題,薛巍引薦了一位GPU專家—當(dāng)時清華大學(xué)地球系統(tǒng)科學(xué)研究中心副教授付昊桓。2011年底“沖獎突擊隊”正式成立,此時距離交稿只有不到半年的時間?!耙话銢_獎最少也要三年,這幾乎是一項不可能完成的任務(wù)?!?/p>
進入“備戰(zhàn)”狀態(tài)的楊超,設(shè)立好階段性“小目標(biāo)”,每隔幾天他就向團隊成員匯報一次,“沒完成任務(wù)都不好意思見面”。那時,從中科院到清華園的成府路上,總會看到一位行色匆匆的學(xué)者,他沒有假期,只有全力以赴和夜以繼日。
趕在截止日期前,熬了幾個通宵的“突擊隊”,提交了論文。饑腸轆轆的三人來到一家拉面館,累得已經(jīng)吃不動了;盯著面發(fā)呆,記不得是誰說了句“再也不干了”!
找到“最后一枚碎片”
幾個月后,入圍名單公布,其中并沒有“突擊隊”,中國超算顆粒無收。
之后的幾年,團隊密切跟蹤國內(nèi)頂級高性能計算機的研發(fā)趨勢,先后在“天河一號”“天河二號”“神威·太湖之光”上進行關(guān)鍵技術(shù)研發(fā)和測試?!爸灰袡C器可用,就想方設(shè)法第一時間進行操練。就像蜜蜂聞到了蜂蜜,一下子就撲上去。”
另一方面,楊超不斷調(diào)試隱式求解器,卻一直找不到“發(fā)動機”的一個零件,無法超越顯式。當(dāng)時,隨著各類新型超級計算機的發(fā)展,顯式求解器在學(xué)界出盡風(fēng)頭,隱式則鮮有問津。難道真是無解嗎?
直到2015年11月,受國外一篇論文的啟發(fā),楊超找到了那個關(guān)鍵“零件”,他隨即通知其他成員:“我們拼圖的最后一枚碎片找到了!”“零件”的發(fā)現(xiàn)拉開了二沖“戈登·貝爾”獎的序幕。
然而,找到“零件”只是開始。怎么裝進去?是否適用?能否順暢運行?……一連串的問題都等著楊超去解答,“每一步都異常艱辛”。
那段時間,楊超常常工作到深夜,飯館、食堂都關(guān)了,餓了就去中科院旁的快餐廳。“我知道,北京晚上三點的肯德基、麥當(dāng)勞是什么樣?!?/p>
直到交稿前一周,他終于完成了“零件”調(diào)試和優(yōu)化工作。時隔4年的2016年4月,楊超再次提交了參賽論文。
與上一次沖獎相比,這次“沖獎小組”更有底氣,也得到多方的支持,但楊超依舊忐忑?!案甑恰へ悹柂勗O(shè)立近30年,中國團隊連入圍都沒有過,評委來自美國、日本,他們會認(rèn)可中國人嗎?”楊超心里沒底。
而更令他擔(dān)心的是,高性能計算技術(shù)迭代很快,倘若本次沖獎失利,目前的方法或迅速就被其他團隊學(xué)習(xí)或趕超。到那時,多年的心血將付之東流。
“打光了槍里的每一發(fā)子彈”
6月的一天,楊超的手機被打爆了?!坝袃山M中國團隊入圍了,咱們呢?”他連忙查郵件,笑容洋溢在他的臉上。
來不及慶祝,一項更艱巨的任務(wù)—優(yōu)化求解器在等著他們。入圍郵件寫明,要在8月10日前提交終稿。4月份上交的隱式求解器性能已超過顯式不少,但是卻未能充分體現(xiàn)隱式的優(yōu)越性。于是,楊超領(lǐng)隊再次揮師南下,在國家超算無錫中心,把程序里里外外修改、調(diào)試了一遍,“幾乎重寫了一篇論文”。最終,他們把隱式求解器的性能提升了4倍,達到同等顯式的89.5倍。
“這么短的時間,論文能有如此改進,超出想象!”評獎委員會副主席松崗聰教授如是評價。
七八月的無錫,酷暑難耐。38℃的機房,空調(diào)只供應(yīng)到下午4點。到了晚上,所有人只能靠電扇和清涼油解暑。沖刺階段,幾天沒合眼的楊超,感覺地都是軟的,整個人“飄飄欲仙”。
萬事俱備,只差最后一槍。美國時間11月17日上午,在2016全球超級計算大會上,楊超走上臺,鞠躬,點開第一頁PPT,開始了“豪情萬丈”的成果演示。
學(xué)術(shù)匯報的風(fēng)格大多低調(diào)、沉穩(wěn),但這次楊超一反常態(tài),把極致灌注在PPT的字里行間。他不想留遺憾,“要讓世界看到中國超算的風(fēng)采”。結(jié)束演講,他說“我打光槍里的每一發(fā)子彈”。
下臺后,評獎委員會主席蘇博哈什·塞尼博士握住楊超的手說:“Well done!”(做得很棒)
“這只是開始?!睏畛钢劆钫f。他說的是中國超算,更是自己—一顆顆子彈又開始上膛待發(fā)。
(本文轉(zhuǎn)自《科技日報》)