莫依蓉
中國超級計算機快速發(fā)展的背后,隱藏著其應(yīng)用軟件平臺同步發(fā)展的瓶頸:運算速度連年高居榜首,市場應(yīng)用依然有較大空間
2016年6月20日,中國最新的超級計算機“神威·太湖之光”在新一期的世界計算機500強榜單中,運算速度超越了“天河二號”,一舉登上榜首。
“中國超算事業(yè)取得了進(jìn)步,引起了更多人關(guān)注,這是一件值得高興的事?!敝袊鴩页売嬎銖V州中心主任盧宇彤告訴《瞭望東方周刊》,“近年來國產(chǎn)超算系統(tǒng)發(fā)展所帶動和催生的國產(chǎn)超算應(yīng)用正在向好的方向發(fā)展。”
“天河二號”曾連續(xù)6年蟬聯(lián)世界超級計算機500強排行榜冠軍;接棒者“神威·太湖之光”更是將運算速度提高了兩倍。
然而,中國超級計算機快速發(fā)展的背后,尚存在超算應(yīng)用軟件平臺國產(chǎn)化程度偏低的問題:一方面硬件趕超速度驚人,占有量和運算速度連年高居榜首;另一方面,超算商用軟件大多為國外壟斷,導(dǎo)致其市場應(yīng)用缺位。
國家名片的“新話柄”
1946年,美國誕生了世界上第一臺電子計算機,運算速度為每秒5000次。
而超級計算機是一個由數(shù)百甚至數(shù)千的處理器(機)組成,能夠執(zhí)行一般個人電腦和服務(wù)器無法處理的大信息、高速運算的大型計算機。
超級計算機的出現(xiàn)將運算速度不斷刷新,美國一度在運算速度上擁有絕對優(yōu)勢,多年占據(jù)世界超級計算機500強排行榜單的榜首。
而2013年,“天河二號”用峰值計算速度每秒5.49億億次奪冠證明,中國人用30年實現(xiàn)了大超越,“天河二號”成為國家名片。
中國超級計算機的運算速度究竟有多快?
“如果把普通計算機的速度比喻成人步行,那超級計算機就是火箭速度。”盧宇彤告訴本刊記者,以“天河二號”為例,13億人用計算器算1000年才能達(dá)到其1小時的計算量。
在現(xiàn)有技術(shù)條件下,超級計算機的高運算自然不可避免地帶來高耗能。
讓盧宇彤沒想到的是,這個全球面臨的共同難題,竟成了外行人士詬病中國超算發(fā)展的“新話柄”。
據(jù)測算,“天河二號”峰值年耗電量達(dá)到2億度。目前,廣州超算中心的設(shè)備利用率達(dá)到60%,用戶中83%是政府機關(guān)、高校、科研院所,企業(yè)用戶只有17%。
在一些人看來,其市場效應(yīng)并不明顯。但盧宇彤認(rèn)為這顯然對中國超算很不公平,“我們要看超算中心的目標(biāo)與定位,是支持大科學(xué)發(fā)現(xiàn)、大工程技術(shù)突破,還是進(jìn)入市場化運行賺錢?”
“世界各大超算中心均只為科學(xué)研究服務(wù),但中國超算被賦予了更多的使命,既要支持科學(xué)研究、工程技術(shù),又要兼顧產(chǎn)業(yè)創(chuàng)新需求?!彼f,廣州超算的用戶中83%是科研機構(gòu)、高校、政府機關(guān),正在積極拓展企業(yè)用戶。
藍(lán)海彤翔集團副總裁高鵬東非常理解廣州超算中心的“煩惱”。
早在2011年,還在中國傳媒大學(xué)高性能計算中心工作的他,就已經(jīng)為“天河一號”進(jìn)行中間件的技術(shù)開發(fā)和服務(wù)工作,非常熟悉超級計算機。
“‘天河二號系統(tǒng)的冷卻充分利用了廣州市的城市供冷循環(huán)系統(tǒng),采用水風(fēng)冷相結(jié)合的先進(jìn)制冷技術(shù),避免了其他超算中心專門建設(shè)冷水塔的開銷,更加綠色環(huán)保?!彼f。
據(jù)了解,天河二號的能效比為1.9GFlops/W,與同時期世界排名前列的美國泰坦、紅杉系統(tǒng)相當(dāng),是日本“京”計算機(0.8GFlops/W)的2倍多,屬于同時期節(jié)能型的超級計算機。
有待開發(fā)的巨型市場
在高鵬東眼中,任何詬病都不算問題,因為擺在超級計算機面前的是一個無法估量的巨型市場。
“以《阿凡達(dá)》為例,其162分鐘的片子中運用了大量的特效,耗資3.5億美元?!彼f,“按24幀每秒的電影畫面計算,高峰時段每天要處理10000多個任務(wù),每秒鐘288M的成品源文件??仿∩踔猎谛挛魈m裝配了一個10000平方米的機房以完成這些渲染工作。”
隨著3D、4K技術(shù)的成熟,國內(nèi)觀眾對影視、動畫的精度要求也大幅提高,普通計算機渲染無法滿足要求。
2008年,基于高性能計算的技術(shù)以及中國傳媒大學(xué)在文創(chuàng)行業(yè)的經(jīng)驗,高鵬東與合伙人創(chuàng)辦了藍(lán)海彤翔集團,為文化創(chuàng)意行業(yè)提供云渲染和在線創(chuàng)作服務(wù)。
“三維動畫電影都需要渲染,即使是真人實拍的院線電影,90分鐘里也會有將近60分鐘的特效需要渲染?!痹诟啭i東看來,對于普通從業(yè)者來說,購買機器甚至建設(shè)機房開支巨大。
“影視行業(yè)對大量的計算資源和數(shù)字資產(chǎn)存儲資源的需求越來越大,而選擇超級計算機顯然更加劃算,這無疑是一個巨大的市場。”他說。
廣州優(yōu)榮資產(chǎn)管理有限公司總經(jīng)理邱瑞昌同樣看好超級計算機未來的市場。
“我們通過收集和挖掘金融大數(shù)據(jù),開發(fā)了一款智能投資顧問產(chǎn)品,幫助6000多個客戶篩選出優(yōu)質(zhì)基金?!鼻袢鸩嬖V本刊記者,“產(chǎn)品每天需要30萬個相關(guān)新聞頁面、28萬次相關(guān)交易數(shù)據(jù)、兩千頁調(diào)研報告和4萬條市場情緒信息。”
“4000多只基金,每天刷下來的數(shù)據(jù)就超過1個多G。”邱瑞昌說,這是一項巨大的工程,而“天河二號”恰恰為公司提供了高速且穩(wěn)定的運算資源。
在盧宇彤看來,高鵬東和邱瑞昌所代表的行業(yè),只是超級計算機市場的“冰山一角”。
據(jù)了解,“天河二號”幫助國產(chǎn)C919大型客機開展了高精度外流場氣動計算,6天完成了其自身計算平臺約需2年的工作量。此外,廣汽、廣船、海格等企業(yè)也在“天河二號”的幫助下進(jìn)行技術(shù)升級,大大縮短了研發(fā)時間,節(jié)約了研發(fā)成本。
“在大氣環(huán)境、海洋水文、天體物理、高精度數(shù)值模擬風(fēng)洞、新能源、新材料、工業(yè)制造、電子設(shè)備、生物醫(yī)藥、精準(zhǔn)醫(yī)療、機器學(xué)習(xí)、金融等領(lǐng)域,超級計算機都有著廣闊的應(yīng)用空間。”盧宇彤說。
幫企業(yè)省錢提效
對“天河二號”來說,市場夠大;但對企業(yè)來說,是否與之建立合作,取決于成本和效率。
廣東三維家信息科技有限公司總經(jīng)理徐明華告訴《瞭望東方周刊》,作為一家服務(wù)于整體家居軟件信息化業(yè)務(wù)的創(chuàng)業(yè)公司,在其開發(fā)的平臺上活躍著7萬多名設(shè)計師,有超過5萬多家家居門店入駐。
“平均每個門店每天就有8張家居效果圖需要渲染。每張效果圖的數(shù)據(jù)量都按G計算,我們需要巨大的運算資源和存儲資源。”他說。
徐明華首先想到的就是建設(shè)自己的服務(wù)器平臺。為此,他購買了300多臺服務(wù)器。
“僅購買服務(wù)器這一項,我們公司就累計花費了2000多萬元。除此之外,服務(wù)器的使用一般是2年,其維護(hù)和更新成本數(shù)倍于購買成本。”他說。
2016年,徐明華用“天河二號”的服務(wù)替換掉了將近四分之三的服務(wù)器,從而省去了大筆維護(hù)和更新費用。
除了效率,他還通過超算幫用戶多賺到了錢?!拔覀兊挠脩裘刻煨枰秩敬笈募揖有Ч麍D,以往需要一個小時渲染的效果圖,超算只需要3分鐘就可以搞定。因此設(shè)計師接單量也提高了3~6倍?!?/p>
而對于廣州市婦女兒童醫(yī)療中心而言,其正在進(jìn)行的基因組測序項目,正在經(jīng)歷大規(guī)模比對運算階段。
“人體遺傳物質(zhì)這個生命天書里面有30億個字母,一個或者少數(shù)幾個關(guān)鍵字母發(fā)生變化就可能會導(dǎo)致疾病的發(fā)生。我們想找出這些變化,就需要通過測序的方法?!贬t(yī)療中心的博士后劉廣建告訴《瞭望東方周刊》,“一個人的全基因組的數(shù)據(jù)就超過幾個G,我們需要先把其打斷成很多小碎片,然后測出每個小碎片的序列,最后在拼接比對過程中找到可能與疾病相關(guān)的地方?!?/p>
“這個拼接過程就需要運用大量的計算,個人電腦要算上甚至一年。而且在后續(xù)的機制研究中,還可以利用超級計算機進(jìn)行分子模擬,通過精準(zhǔn)的結(jié)構(gòu)預(yù)測進(jìn)行合理化藥物設(shè)計?!痹趧V建看來,超算是精準(zhǔn)醫(yī)療的基礎(chǔ)前提,提高了數(shù)據(jù)分析效率,為基因組學(xué)走向臨床應(yīng)用提供保障。
九成商業(yè)應(yīng)用軟件依賴國外
但大多數(shù)業(yè)內(nèi)人士指出,“市場想要,但超算難給”,這才是目前最“尷尬”的狀況,也是企業(yè)用戶難以充分利用超算資源的問題所在。
高鵬東把這種“尷尬”稱為商業(yè)應(yīng)用軟件的缺失。
“‘天河二號采用的是Linux運行系統(tǒng),并非所有的應(yīng)用都可以直接在其系統(tǒng)上運行,所有基于Windows系統(tǒng)或者串行開發(fā)的應(yīng)用軟件就必須重寫或修改?!彼f。
浪潮集團高性能產(chǎn)品部總經(jīng)理劉軍曾表示,中國九成以上的商用超算軟件都依賴國外進(jìn)口,“我國雖然擁有性能很強的大型超算系統(tǒng),卻缺乏相匹配的大規(guī)模并行軟件,很多大型超級計算機不得不拆分成小規(guī)模的集群來跑應(yīng)用,大系統(tǒng)并沒有發(fā)揮出應(yīng)有的價值?!?/p>
在高鵬東看來,這與中國科研開發(fā)模式有關(guān)。“國外對于超級計算機的開發(fā),硬件、軟件和基礎(chǔ)設(shè)施建設(shè)各占三分之一左右的經(jīng)費,而中國的超算中心建設(shè),硬件往往占據(jù)整個超算中心建設(shè)成本的85%以上,用于軟件采購和開發(fā)的費用少得可憐?!?/p>
“其實,超算中心有很多客戶找上門來,他們有各種各樣的需求。但用戶來自不同的學(xué)科領(lǐng)域,還缺乏超算應(yīng)用的基礎(chǔ),需要交叉領(lǐng)域的技術(shù)支持能力?!北R宇彤說。
為了解決這個難題,“天河二號”設(shè)計之初就考慮到了未來應(yīng)用的生態(tài)環(huán)境,采用了通用處理器。盧宇彤說,“我們在系統(tǒng)上面部署了很多領(lǐng)域的應(yīng)用軟件,打造了專業(yè)的團隊去搭建面向各領(lǐng)域的支撐平臺應(yīng)用。”
但在一位不愿透露姓名的專家看來,應(yīng)用軟件國產(chǎn)化程度不高造成超算資源閑置本身就是個偽命題?!半m然很多商業(yè)軟件被國外壟斷,但卻并非無軟件可用。造成超算計算資源閑置的主要原因是全機計算比較少,鮮有一個大應(yīng)用能夠使用全部資源?!?/p>
國策與市場兼得
國家為何耗巨資在超級計算機上?
中科院計算所研究員、中國計算機學(xué)會常務(wù)理事、高性能計算專委會秘書長張云泉曾表示,超級計算機是國家科技水平與綜合國力的標(biāo)志之一,其研發(fā)與應(yīng)用能力的投入不宜純粹商業(yè)化。
“國家級超算中心作為國家的戰(zhàn)略資源,作為國家的基礎(chǔ)設(shè)施,應(yīng)該由國家每年撥付運維費用,而不是以市場為主來獲取經(jīng)費。就像我國在大飛機、航天、高鐵等領(lǐng)域的長期堅持不懈的投入,才取得今天的成就,帶動了相關(guān)產(chǎn)業(yè)的大發(fā)展?!睆堅迫f。
而在盧宇彤看來,中國的國情給超算中心賦予了更多的意義和任務(wù)。
“除了國家科技部投資外,廣東省地方政府也有投資,所以除了支持超算傳統(tǒng)的科學(xué)工程應(yīng)用以外,還應(yīng)該支持廣東省和區(qū)域的科技創(chuàng)新和新型產(chǎn)業(yè)應(yīng)用。”她說。
實際上,自“天河二號”落戶以來,超過百萬核的大規(guī)模領(lǐng)域應(yīng)用有12個,萬核以上的應(yīng)用100多個,先后為國內(nèi)外1500多家用戶提供了高性能計算和云計算服務(wù)。
“不能因為任何原因否定像‘天河二號這樣的國產(chǎn)超算系統(tǒng)所帶來的巨大社會效益和經(jīng)濟效益?!北R宇彤強調(diào)說,“破解超算應(yīng)用瓶頸,需建立開放、合作、創(chuàng)新的中國超算可持續(xù)發(fā)展的生態(tài)環(huán)境?!?/p>
在她看來,超算中心應(yīng)該做超級計算系統(tǒng)與多領(lǐng)域科研、行業(yè)應(yīng)用之間的橋梁,“加快超算應(yīng)用所需的交叉學(xué)科人才培養(yǎng),加大高性能計算應(yīng)用軟件和支撐平臺的開發(fā)投入,促進(jìn)國產(chǎn)超算應(yīng)用軟件的商業(yè)化發(fā)展?!?