在再次位居最新TOP500排名榜首,喜獲世界超級(jí)計(jì)算機(jī)(下稱“超算”)“三連冠”后,“天河二號(hào)”于6月30日在廣州正式投入使用,進(jìn)入應(yīng)用階段。此外,“天河二號(hào)”已自7月起進(jìn)行一期系統(tǒng)升級(jí),預(yù)計(jì)將在明年底前完成全系統(tǒng)建設(shè)并投入運(yùn)行。與“銀河”系列定位不同的是,“天河”系列主要針對(duì)民用市場(chǎng),這也意味著“高大上”的“天河二號(hào)”即將走入尋常百姓家,為社會(huì)提供服務(wù)。
算一秒相當(dāng)于全民算千年
6月23日,在德國(guó)萊比錫舉行的HPC國(guó)際會(huì)議上發(fā)布了超算的最新排名,中國(guó)國(guó)防科學(xué)技術(shù)大學(xué)研制的“天河二號(hào)” 以比第二名美國(guó)“泰坦”快近一倍的速度再次問(wèn)鼎冠軍,榮獲全球超算運(yùn)算性能“TOP500項(xiàng)目”的“三連冠”。有美國(guó)專家預(yù)測(cè),在一年時(shí)間內(nèi),“天河二號(hào)”還會(huì)是全球最快的超算。
“天河二號(hào)”由16000個(gè)浪潮的節(jié)點(diǎn)組成,累計(jì)共有32000顆主處理器和48000個(gè)協(xié)處理器,總計(jì)有312萬(wàn)個(gè)計(jì)算核心。目前“天河二號(hào)”一期主機(jī)系統(tǒng)已調(diào)試完成并投入使用,同時(shí)還將開(kāi)始二期系統(tǒng)的建設(shè)。國(guó)家超級(jí)計(jì)算廣州中心主任袁學(xué)鋒介紹,“天河二號(hào)”一期的運(yùn)算速度為5.49億億次/秒,運(yùn)算一秒相當(dāng)于全中國(guó)人用計(jì)算器算一千年,待二期系統(tǒng)建成后,運(yùn)算速度還將提高一倍,達(dá)到10億億次/稱以上。
在普通人看來(lái),要提升計(jì)算機(jī)的計(jì)算能力,似乎只要把多個(gè)中央處理器(CPU)“綁”起來(lái)就行了。就好像要比10個(gè)人的小組工作快10倍,只要找100個(gè)人來(lái)就行了一樣。在計(jì)算機(jī)的研發(fā)中,這一過(guò)程卻復(fù)雜得多。但中國(guó)科學(xué)家只花了4年時(shí)間,就把超算的速度從每秒運(yùn)算速度相當(dāng)于全國(guó)13億人連續(xù)計(jì)算88年的數(shù)據(jù)提升到了相當(dāng)于全國(guó)13億人連續(xù)計(jì)算1000年的數(shù)據(jù)。
牛津超級(jí)計(jì)算中心主任喬·洛克利博士曾評(píng)價(jià),雖然中國(guó)超算研究的起步較晚,但這剛好提供了一個(gè)“很高的起點(diǎn)”:不需要浪費(fèi)資源去解決一些發(fā)展初期所要面對(duì)的瓶頸和難題。美國(guó)早在1990年就提出制造千萬(wàn)億次級(jí)巨型計(jì)算機(jī),但直到2009年,這一目標(biāo)才得以實(shí)現(xiàn)。而僅在幾個(gè)月之后,中國(guó)的計(jì)算機(jī)就達(dá)到了同樣的目標(biāo)。
袁學(xué)鋒認(rèn)同喬·洛克利的說(shuō)法,高起點(diǎn)的確加速了中國(guó)超算的進(jìn)程。但他認(rèn)為事實(shí)上中國(guó)一直不缺乏這方面的技術(shù)與人才,早在上世紀(jì)五六十年代就擁有計(jì)算機(jī)的中國(guó)在這方面的發(fā)展原本可以更快一些,只是因?yàn)榛A(chǔ)工業(yè)的原因,“我們的芯片跟不上,才導(dǎo)致這方面滯后了,所以全球經(jīng)濟(jì)一體化也是加速進(jìn)程的一個(gè)重要原因。”
算天算地算人算宇宙
自2013年6月研制成功后,“天河二號(hào)”在國(guó)防科技大學(xué)呆了僅僅3個(gè)月就被匆匆運(yùn)往廣州,從裝機(jī)、調(diào)試到設(shè)備正式運(yùn)行,為的就是趕在今年4月1日正式啟用,“大家都很著急,希望‘天河二號(hào)能盡快投入使用”,袁學(xué)鋒感慨道,以至于廣州超級(jí)計(jì)算機(jī)中心的辦公大樓里除了兩間會(huì)議室裝修完畢外,其他辦公室都是臨時(shí)搭建的,甚至一些技術(shù)人員的組建也尚未完成,但這并不影響這臺(tái)“超級(jí)大腦”幫助人們作出更精準(zhǔn)的天氣預(yù)報(bào)、設(shè)計(jì)更安全的汽車(chē),或者研發(fā)更有效的藥物等,它正在從各個(gè)方面直接或間接影響著每個(gè)人的生活。
從4月1日至6月中旬,“天河二號(hào)”已經(jīng)收獲了來(lái)自全國(guó)各地的120多位客戶,華大基因、廣東工業(yè)研究院、北京大學(xué)、中核集團(tuán)中國(guó)原子能科學(xué)研究院、英特爾(中國(guó))有限公司、浪潮集團(tuán)、華強(qiáng)文化科技集團(tuán)、中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心等“高大上”的企業(yè)都在其中。
袁學(xué)鋒表示,截至目前,“天河二號(hào)”已為用戶提供了300多項(xiàng)專業(yè)服務(wù),特別是在大型基因組組裝和基因測(cè)序、生物醫(yī)學(xué)、高通量藥物篩選、污染治理、大型飛機(jī)設(shè)計(jì)制造、高速列車(chē)設(shè)計(jì)制造、高超聲速發(fā)動(dòng)機(jī)燃燒模擬等工程中發(fā)揮了重要的支撐作用。“計(jì)算的內(nèi)容可以概括為算天、算地、算人、算宇宙?!痹瑢W(xué)鋒說(shuō)。
具體來(lái)說(shuō),例如中國(guó)商用飛機(jī)設(shè)計(jì)有限公司北京研究中心利用約2.4萬(wàn)CPU核開(kāi)展了大型民機(jī)全參數(shù)氣動(dòng)優(yōu)化設(shè)計(jì),在“天河二號(hào)”計(jì)算6天,完成了其自身計(jì)算平臺(tái)約需2年的工作量,極大地提高了工作效率。在其他應(yīng)用上,汽車(chē)研發(fā)機(jī)構(gòu)可使用它進(jìn)行反復(fù)穆尼安全碰撞試驗(yàn),減少設(shè)計(jì)誤差,提高汽車(chē)的質(zhì)量和安全性能,原本要使用20臺(tái)汽車(chē)碰撞的試驗(yàn),現(xiàn)在也許只需要使用兩到三臺(tái)就能達(dá)到最高標(biāo)準(zhǔn)。制藥企業(yè)在藥物研發(fā)中使用它對(duì)所有可能的分子組合進(jìn)行高速測(cè)試,從而篩選出十幾種甚至幾十種藥物進(jìn)行實(shí)驗(yàn)。超算出現(xiàn)之前,開(kāi)發(fā)一種新藥需經(jīng)過(guò)原理研究、動(dòng)物實(shí)驗(yàn)、志愿者實(shí)驗(yàn)等步驟,很多東西需要在現(xiàn)實(shí)中大量、反復(fù)地試驗(yàn),整個(gè)研制周期往往長(zhǎng)達(dá)十余年,耗費(fèi)的時(shí)間與精力可能不亞于登月工程。如今,很多基礎(chǔ)性的實(shí)驗(yàn)和計(jì)算工作可以通過(guò)超算模擬完成,研制周期可大大縮減,一種新藥三到五年就能研制出來(lái),而且也不用犧牲大量小白鼠了。動(dòng)漫企業(yè)和影視公司未來(lái)都將是“天河二號(hào)”的???,因?yàn)殡S著4K電視的普及,對(duì)影視、動(dòng)畫(huà)等的精度要求都將更高,普通的計(jì)算機(jī)根本無(wú)法達(dá)到渲染要求。一些金融機(jī)構(gòu)也可以使用它對(duì)股票期貨的投資進(jìn)行詳細(xì)模擬計(jì)算,從而將行動(dòng)建議精確到“幾分幾秒出手”。
袁學(xué)鋒解釋道,實(shí)際上“天河二號(hào)”是在創(chuàng)造一個(gè)和物理世界完全一樣的虛擬數(shù)字世界,就像美國(guó)大片《機(jī)械戰(zhàn)警》中的測(cè)試場(chǎng)景一樣,通過(guò)和物理世界完全一樣的虛擬數(shù)字世界去測(cè)試它的速度與反應(yīng)。
普通用戶每天只需24元
此前有科學(xué)家認(rèn)為,像“天河一號(hào)”這樣的千萬(wàn)億次級(jí)超算,由于CPU之間的相互協(xié)調(diào)需要大量能耗,普通程序未必能體現(xiàn)出它的強(qiáng)大能力,要充分發(fā)揮它的優(yōu)勢(shì),所需要的計(jì)算量一定要具有相當(dāng)規(guī)模,否則就是“大炮打蚊子”。這是否意味著無(wú)論運(yùn)算速度還是性能都比“天河一號(hào)”強(qiáng)大很多的“天河二號(hào)”也不應(yīng)該是普通玩家的“菜”?
對(duì)此袁學(xué)鋒并不贊同。他一直強(qiáng)調(diào),“天河二號(hào)”的使用并不局限在廣州地區(qū)。事實(shí)上,它還提供了24小時(shí)的網(wǎng)絡(luò)遠(yuǎn)程應(yīng)用服務(wù)。人們可以在得到超級(jí)計(jì)算中心的授權(quán)之后,從個(gè)人電腦通過(guò)互聯(lián)網(wǎng)連接到“天河二號(hào)”,上傳自己的程序,下載運(yùn)算數(shù)據(jù),從而“使有興趣的大、中學(xué)生也可以進(jìn)行課題研究”。
只是目前來(lái)看,使用超算仍有門(mén)檻,非專業(yè)人士進(jìn)入比較困難,但在袁學(xué)鋒暢想的未來(lái)中,超算絕不僅僅是技術(shù)玩家的專利。
對(duì)于酷愛(ài)科幻電影的袁學(xué)鋒而言,“天河二號(hào)”的開(kāi)局讓他滿意,但遠(yuǎn)不滿足。在眾多超級(jí)英雄中,他最看好小羅伯特·唐尼所飾演的鋼鐵俠,那個(gè)用手指在屏幕上指指點(diǎn)點(diǎn)然后設(shè)計(jì)出一套又一套帥氣盔甲的超級(jí)英雄也是他的目標(biāo),只是目前尚未達(dá)成,他希望有更多民間高手能一起來(lái)實(shí)現(xiàn)。
在英國(guó)曼徹斯特大學(xué)做科研時(shí),袁學(xué)鋒就開(kāi)始接觸3D打印,他會(huì)把一些虛擬數(shù)據(jù)利用3D打印出來(lái)做科學(xué)研究,但他發(fā)現(xiàn)自己的學(xué)生有時(shí)會(huì)用這些儀器打印私人自制的鑰匙扣、杯子等,從那時(shí)起,他就開(kāi)始有了這個(gè)想法,“天河二號(hào)”不僅只會(huì)做運(yùn)算,還會(huì)配有3D打印等“一條龍”設(shè)施。
至于費(fèi)用方面,是否普通人也能用得起?袁學(xué)鋒算了一筆賬,按10核/小時(shí)一元錢(qián)算,普通用戶如果使用一天也才24元錢(qián),價(jià)格甚至比使用個(gè)人電腦一天的費(fèi)用還要低。
功耗大散熱難缺軟件
“天河二號(hào)”在一年半內(nèi)連續(xù)三次登頂TOP500,它的峰值運(yùn)算速度33.86 petaflop/s,短時(shí)間內(nèi)其他超算難以對(duì)它構(gòu)成挑戰(zhàn)。但TOP500衡量的只是浮點(diǎn)計(jì)算能力,超算的基準(zhǔn)測(cè)試排名還有解析數(shù)據(jù)的Graph500和環(huán)境影響的Green500,而“天河二號(hào)”在這兩方面沒(méi)有任何優(yōu)勢(shì)。
一些研究人員表示,“天河二號(hào)”運(yùn)營(yíng)成本高,且缺乏相關(guān)軟件,對(duì)研究的助益有限?!疤旌佣?hào)”的能力與它的實(shí)用性不成正比。
專家表示,超算發(fā)展目前面臨的首要挑戰(zhàn)是功耗控制難導(dǎo)致的高成本。目前的集成水平和此前相比并沒(méi)有根本性改善,以現(xiàn)有技術(shù),極超級(jí)電腦的功耗會(huì)超過(guò)20兆瓦,建造費(fèi)用將超過(guò)2億美元,這將帶來(lái)一系列技術(shù)和運(yùn)營(yíng)問(wèn)題。例如“天河二號(hào)”全速運(yùn)算的話,電費(fèi)為每日40萬(wàn)人民幣至60萬(wàn)人民幣之間,一年下來(lái)僅電費(fèi)一項(xiàng)就超過(guò)1.5億元。如果還是按照老思路,依靠增加規(guī)模制造出極級(jí)超算,功耗可能會(huì)達(dá)到50兆瓦至100兆瓦,需要一個(gè)專門(mén)的核電站來(lái)給它供電,這樣的超算顯然沒(méi)有實(shí)用價(jià)值。同時(shí)這樣密集排列的大功率處理器,也會(huì)帶來(lái)無(wú)法解決的散熱問(wèn)題。因此國(guó)際上公認(rèn)的極級(jí)超算標(biāo)準(zhǔn)是,功耗必須控制在20兆瓦內(nèi),這就要求在制造工藝上有革命性突破。
另一個(gè)阻礙是缺乏軟件。“天河二號(hào)”迄今的投資主要用于硬件開(kāi)發(fā),客戶必須自己編寫(xiě)程序才能使用。中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心副主任遲學(xué)斌表示,“天河二號(hào)”就運(yùn)算能力來(lái)說(shuō)處于世界前沿,但功能仍遠(yuǎn)落后于美國(guó)和日本的超算。遲學(xué)斌表示,一些用戶或需要多年甚至十年時(shí)間編寫(xiě)必要的代碼。可靠性也是個(gè)問(wèn)題,將來(lái)超級(jí)電腦并發(fā)部件將超過(guò)10億,以現(xiàn)在的故障率,平均每過(guò)10至20分鐘系統(tǒng)就會(huì)報(bào)一次硬件錯(cuò)誤,而每次處理錯(cuò)誤需要半個(gè)小時(shí)。這顯然也是無(wú)法容忍的。
中國(guó)計(jì)算機(jī)學(xué)會(huì)高專委秘書(shū)長(zhǎng)、中科院計(jì)算所研究員張?jiān)迫硎荆氵€面臨數(shù)據(jù)的訪問(wèn)速度限制?,F(xiàn)在超級(jí)電腦運(yùn)行的速度愈來(lái)愈快,但現(xiàn)有存儲(chǔ)器讀取數(shù)據(jù)的速度卻無(wú)法跟上需求,這也成為超級(jí)電腦性能提升的瓶頸。因此美國(guó)有一批教授認(rèn)為應(yīng)該反思超算的發(fā)展方向,改變追求峰值運(yùn)算速度的模式,而注重實(shí)用價(jià)值。例如放棄通用型超算,而根據(jù)實(shí)際需求定制超算。
“全球計(jì)算機(jī)的發(fā)展非???一年時(shí)間可能什么都變了?!痹瑢W(xué)鋒認(rèn)為,“真正重要的還是把它們推廣應(yīng)用,產(chǎn)生實(shí)際效益?!保ū究C合)