趙艷秋
牙膏、香皂、洗發(fā)水和紙尿褲與那些高速運(yùn)轉(zhuǎn)、需要大量空調(diào)降溫的超級計(jì)算機(jī)有關(guān)系嗎?Tom Lange是寶潔公司模擬與仿真研發(fā)部經(jīng)理,34年間一直穿梭在二者之間?!跋M(fèi)者會發(fā)現(xiàn),寶潔的產(chǎn)品相對來說都比較便宜,但是他們很難了解到,為了使這些產(chǎn)品保持較低價(jià)格,寶潔要采用很復(fù)雜的技術(shù)來進(jìn)行開發(fā)和生產(chǎn)。如果你看到這些復(fù)雜的機(jī)器和每臺機(jī)器上正在跳動的代碼行數(shù),你還以為我們在做飛機(jī)制造?!盩om Lange說。
洗發(fā)水和汽車模具
消費(fèi)者在貨架前徘徊,決定購買哪種洗發(fā)水時(shí),價(jià)格往往起到很重要的作用。如果產(chǎn)品定價(jià)不當(dāng),或者不能給消費(fèi)者帶來預(yù)期的價(jià)值,他們通常都不會動心。所以,Tom Lange領(lǐng)導(dǎo)的模擬與仿真團(tuán)隊(duì)要做的第一個(gè)關(guān)鍵工作,就是挑選產(chǎn)品原材料并設(shè)計(jì)生產(chǎn)工藝?!白罱K敲定的原材料和制造工藝要使公司生產(chǎn)的產(chǎn)品,消費(fèi)者能夠承擔(dān)得起?!彼f。
選定原材料或者制造工藝,是一件極為復(fù)雜的事。一種洗發(fā)水,Tom Lange要從上百種材料中挑選七八種來搭配,用計(jì)算機(jī)模擬搭配后的產(chǎn)品長得什么樣,在遇冷或遇熱后是否還能從瓶中很容易地倒出來……這些計(jì)算已經(jīng)超出了普通計(jì)算機(jī)的處理能力,通常需要128個(gè)甚至更多的CPU協(xié)同完成,被稱為“超級計(jì)算”,簡稱“超算”。
十多年間,超級計(jì)算在美國企業(yè)的設(shè)計(jì)生產(chǎn)中已成為關(guān)鍵環(huán)節(jié)。福特汽車?yán)盟鼇砟M汽車碰撞試驗(yàn),摩托羅拉用它來設(shè)計(jì)不同形狀的手機(jī),這些手機(jī)掉到地上不易損壞。
如今,中國企業(yè)也開始將超算用到實(shí)際生產(chǎn)中,汽車行業(yè)的相關(guān)企業(yè)是其中最早的應(yīng)用者之一。
陳惠濱,國內(nèi)最大的汽車模具企業(yè)——天津汽車模具股份有限公司CAE部長,是這家企業(yè)的核心技術(shù)骨干,他的工作是利用計(jì)算機(jī)來設(shè)計(jì)仿真汽車模具。現(xiàn)在,汽車需要越來越精細(xì)的模具,一個(gè)兩三米長的車身模具,每個(gè)關(guān)鍵面的公差都要控制在0.5毫米以下,這相當(dāng)于幾根頭發(fā)絲的直徑。這給模具設(shè)計(jì)制造帶來相當(dāng)?shù)碾y度,沖壓零件的精度合格率要求每提高幾個(gè)百分點(diǎn),設(shè)計(jì)的計(jì)算量就會成倍增長。陳惠濱10年前進(jìn)入這個(gè)行業(yè)以來,汽車模具設(shè)計(jì)中的CAE模擬工作量已經(jīng)至少增長了幾十倍。
計(jì)算量的井噴,讓陳惠濱順理成章地成為國家超級計(jì)算天津中心的首批客戶。利用超算中心為廠子分配了256個(gè)CPU,原來在廠內(nèi)計(jì)算機(jī)上要計(jì)算一兩天的模具模型,現(xiàn)在幾小時(shí)就完成了;原來一次只能設(shè)計(jì)一種方案,現(xiàn)在可以同時(shí)設(shè)計(jì)多種方案,然后挑出最優(yōu)化的結(jié)果。
除了效率提升,超算對于廠里的成本優(yōu)化相當(dāng)明顯。不同汽車制造廠對模具的合格率要求從90%到100%不等。在沒用超算之前,利用普通CAE(計(jì)算機(jī)輔助工程)設(shè)計(jì)結(jié)果做出的模具,合格率一般在60%~70%之間,這些模具要經(jīng)過反復(fù)修改、再加工,才能達(dá)到客戶要求。使用超算后,模具設(shè)計(jì)可以模擬得特別精細(xì),合格率都在90%左右,修改、重復(fù)加工和調(diào)試工作大幅降低,成本也隨之降低一半以上。
當(dāng)然,讓陳惠濱感到超算便利性的地方還有資料存儲問題。因?yàn)榇笮椭萍缯w側(cè)圍每次精確CAE成型模擬的結(jié)構(gòu)數(shù)據(jù)量都在10GB以上,以前公司內(nèi)部沒有足夠大的存儲空間,設(shè)計(jì)過程數(shù)據(jù)基本兩三天就要清除一次?,F(xiàn)在,公司內(nèi)大量的模擬文件都可以保存在超算中心的存儲平臺上,要做進(jìn)一步研發(fā)時(shí)就很方便。
使用者的“資格”
國內(nèi)外企業(yè)都用超算,但國內(nèi)找不到消費(fèi)品企業(yè)的超算案例。在國外,生產(chǎn)紙尿褲的企業(yè)會利用超算計(jì)算液體如何流動,產(chǎn)品怎樣設(shè)計(jì)才不淹孩子的屁股;生產(chǎn)薯片的企業(yè)會計(jì)算薯片從什么方向切,在運(yùn)輸中更不容易碎……但在國內(nèi),超算項(xiàng)目更多的是氣象、石油、航天等這類大型工程。
國內(nèi)企業(yè)很多時(shí)候發(fā)現(xiàn)國外同行的產(chǎn)品突然有了一個(gè)小拐角,但不知道為什么——是為了更結(jié)實(shí),還是節(jié)省成本?這些細(xì)微之處的背后很可能有超算。正因?yàn)槿绱?,大多?shù)“普普通通的國內(nèi)企業(yè)”在研發(fā)和成本控制方面并沒有用超算的打算。
但在陳惠濱看來,超算并不只是大企業(yè)、大項(xiàng)目的權(quán)利。他在意大利拜訪菲亞特的一個(gè)合作伙伴,發(fā)現(xiàn)在這個(gè)只有十幾個(gè)人的小公司里,每位員工都在用強(qiáng)大的計(jì)算平臺做工程仿真。陳惠濱感到,只要有計(jì)算需求,企業(yè)就完全可以用。
不過,現(xiàn)實(shí)中,中小企業(yè)用超算需要一定的“資格”。
第一個(gè)資格是數(shù)字化制造的普及。天津汽車模具在十年間積累了兩樣?xùn)|西——如何根據(jù)不同的模具設(shè)計(jì)方案設(shè)定輸入模型的參數(shù);如何評判仿真結(jié)果,解決問題——這兩樣?xùn)|西都是人和機(jī)器融合得到的經(jīng)驗(yàn),不是靠搭建軟硬件平臺和招收幾個(gè)員工就能得到的。
第二是資金。從經(jīng)濟(jì)角度衡量,大多數(shù)中小企業(yè)還用不起超算。陳惠濱算了一本賬,如果企業(yè)自己投資,每隔三四年,軟硬件的升級費(fèi)用就要上百萬元,多數(shù)企業(yè)目前經(jīng)受不起這樣的頻繁升級;按照超算中心目前對外的收費(fèi)模式——每個(gè)CPU按小時(shí)計(jì)費(fèi),超算一般要用到上百個(gè)CPU,這也是“接受不了的”。
云來統(tǒng)籌
在順利過渡到超算之后,現(xiàn)在陳惠濱會在晚上把作業(yè)和數(shù)據(jù)“丟”到超算中心,早上一上班就能看到各種設(shè)計(jì)結(jié)果。
這很像云計(jì)算,不管你在哪里,通過終端提交需求,再在終端上獲得結(jié)果。那么,超算和云計(jì)算有什么關(guān)聯(lián)?
胡松年,中科院北京基因組研究所研究員,他進(jìn)行的水稻、微生物和人類基因組等研究項(xiàng)目需要的計(jì)算量極為龐大,2008年,他就使用了10萬億次/秒的超算平臺,今年,他已開始用40萬億次/秒的超算平臺了,存儲容量也提升到1P以上。這樣的計(jì)算量是普通機(jī)器計(jì)算上百年可能都完不成的任務(wù)。
云雖然是一種商業(yè)概念,但支撐它的底層技術(shù),很多來自超算。同時(shí),超算成為云調(diào)度統(tǒng)籌的一部分,就需要摘下神秘面紗,更為親民。“即使是現(xiàn)在,企業(yè)要用超算,技術(shù)人員一般要在電腦上敲一堆字符命令,遠(yuǎn)程登陸,這跟消費(fèi)者天天接觸的云很不同?!崩顺奔瘓F(tuán)高性能服務(wù)器產(chǎn)品部總經(jīng)理劉軍說,“不過,我們正讓超算的專業(yè)化軟件更易于使用,包括改變作業(yè)的提交方式、監(jiān)控方式和數(shù)據(jù)輸入輸出方式。”
脆弱的應(yīng)用軟件環(huán)節(jié)
看上去,超算和人的互動將越來越美妙。不過,在很多時(shí)候,龐大的超算系統(tǒng)還很不給力。
電影《阿凡達(dá)2》要推遲上映了。大導(dǎo)演詹姆斯.卡梅隆承認(rèn),這個(gè)本來計(jì)劃2014年底上映的大片,觀眾最早也要等到2016年才能看到。這是因?yàn)樵诶m(xù)集中那些我們從未見過的神奇世界——潘多拉星球海洋——將完全在超算平臺上用虛擬化的方式創(chuàng)造出來??墒窍鄳?yīng)的電影制作軟件還在開發(fā)中,這次制作過程將是一個(gè)“非常艱苦的探索”。
即便是在超算已經(jīng)發(fā)展了30多年的美國,為了把這些計(jì)算峰值達(dá)到幾百萬億次/秒、幾千萬億次/秒的龐大機(jī)器真正調(diào)動起來,應(yīng)用軟件的開發(fā)也不是件輕松的事。而沒有好的軟件,那些硬件設(shè)備將只是一堆既占地又耗能的“大型沉寂物”。
在中國,超算的應(yīng)用環(huán)節(jié)更為脆弱,能夠數(shù)得出的超算軟件鳳毛麟角。
賴能和,中國石油東方地球物理公司研究院處理中心的總工程師,國內(nèi)最早一批涉足石油超算應(yīng)用的行業(yè)人士。上世紀(jì)80年代,當(dāng)中石油開始競標(biāo)國際石油勘探項(xiàng)目后,全球最大的石油勘探公司——西方地球物理公司就再也不把石油勘探軟件賣給中國人了。為此,中國石油東方地球物理公司投入了巨大的人力和財(cái)力,開發(fā)出自主全國產(chǎn)的石油勘探處理解釋一體化軟件GeoEast。
不過,業(yè)內(nèi)有個(gè)有意思的現(xiàn)象,僅僅是行業(yè)人士開發(fā)的應(yīng)用軟件,通常做不大——他們雖然了解自身需求,但對性能擴(kuò)展優(yōu)化并不在行。2011年,中石油東方地球物理公司和浪潮在委內(nèi)瑞拉的合作顯示出聯(lián)手的力量。當(dāng)時(shí),中石油在號稱“石油天堂”的委內(nèi)瑞拉勘探石油,不過,他們只能在租用的幾個(gè)賓館房間內(nèi)搭建一套原本龐大的超算系統(tǒng)。受限于環(huán)境,中石油只能在提高平臺效率上打主意,把原先的“大超算”變成“小超算”。
中石油東方地球物理公司提供軟件算法,浪潮將GPU加速技術(shù)引入,完成算法移植和優(yōu)化。最終,機(jī)器規(guī)模縮減到原來的1/5,而中石油也在委內(nèi)瑞拉規(guī)定的20天內(nèi)完成了2000平方公里的全部石油勘探工作。
這個(gè)項(xiàng)目也給劉軍很深的感觸。在超算行業(yè)打拼15年來,劉軍一直把美國ANSYS公司作為超算應(yīng)用軟件發(fā)展的目標(biāo)和夢想。在過去42年間,這家位于賓夕法尼亞的企業(yè)一直沒有停止積累的腳步,自主開發(fā)也好,兼并也罷,目前它在全球工程設(shè)計(jì)模擬仿真軟件領(lǐng)域獨(dú)霸一方。“中國要出現(xiàn)ANSYS,也要把時(shí)間尺度放長到二三十年。這不是大躍進(jìn)方式做的事,需要我們沉下心在算法研究、并行優(yōu)化、人才培育上做功課?!?/p>
目前浪潮有個(gè)幾十個(gè)人的團(tuán)隊(duì)與行業(yè)人士合作開發(fā)石油勘探、數(shù)值氣象預(yù)報(bào)、基因測序、金融風(fēng)險(xiǎn)分析、工程設(shè)計(jì)等應(yīng)用軟件。最近,浪潮還主辦了中國首屆大學(xué)生超級計(jì)算機(jī)競賽。劉軍說,通過大賽期間的鍛煉,他希望學(xué)生們在學(xué)校期間就能建立一種思維方式——超算不能只比拼硬件,要強(qiáng)調(diào)應(yīng)用,從應(yīng)用的角度來配置系統(tǒng)。這樣,當(dāng)這批年輕學(xué)生走入各個(gè)行業(yè),那個(gè)消費(fèi)者看不見的超算,才能讓我們的日常消費(fèi)體驗(yàn)更加美好。