胡亮塵
據(jù)最近公布的數(shù)據(jù)顯示,世界500強(qiáng)超級(jí)計(jì)算機(jī)系統(tǒng)中,使用Linux操作系統(tǒng)的。已占到了280席,而在我國(guó),越來(lái)越多行業(yè)中,Linux高性能計(jì)算產(chǎn)品也正得到廣泛的應(yīng)用。
所謂Linux集群,就是利用商品化的工業(yè)標(biāo)準(zhǔn)互聯(lián)網(wǎng)絡(luò)將各種普通Linux服務(wù)器連接起來(lái),通過(guò)特定的方法向用戶提供更高的系統(tǒng)計(jì)算性能、存儲(chǔ)性能和I/O性能,也就是具備單一系統(tǒng)映像(SSI)特征的分布式存儲(chǔ)MIMD(多指令流多數(shù)據(jù)流)并行計(jì)算機(jī)系統(tǒng)。Linux有大量的集群系統(tǒng)可供選擇,適合于不同的用途和需要。
通過(guò)幾十甚至幾百個(gè)運(yùn)行Linux操作系統(tǒng)的計(jì)算節(jié)點(diǎn),組成一個(gè)龐大的虛擬計(jì)算機(jī),提供強(qiáng)大的并行運(yùn)算能力,而價(jià)格卻比傳統(tǒng)小型機(jī)要便宜得多。
高可用性集群也可以在其節(jié)點(diǎn)之間均衡用戶負(fù)載,同時(shí)仍試圖維持高可用性程度。同樣,可以從要編入應(yīng)用程序的集群中找到一個(gè)并行集群,它可以在節(jié)點(diǎn)之間執(zhí)行負(fù)載均衡。
目前,Linux集群在石油行業(yè)的應(yīng)用主要集中在地震資料處理和油藏?cái)?shù)值模擬兩大領(lǐng)域。因數(shù)據(jù)量大、計(jì)算量大、通信量大等行業(yè)特點(diǎn),地震資料處理成為L(zhǎng)inux集群發(fā)揮自身優(yōu)勢(shì)最主要的平臺(tái)。
最早,遼河油田、新疆油田、青海油田等國(guó)內(nèi)企業(yè)采用了IBM公司具有Linux集群技術(shù)的LCl300系統(tǒng)。2002年10月,中國(guó)石油東方地球物理公司涿州物探研究院將曙光4000L Linux/PC Cluster作為應(yīng)用平臺(tái)。2004年涿州物探研究院和新疆油田公司把由IBMeServer BladeCenter刀片服務(wù)器組成的Linux集群用于石油勘探地震資料處理的高性能計(jì)算。兩地搭建的高性能計(jì)算平臺(tái)以該刀片服務(wù)器作為計(jì)算節(jié)點(diǎn),分別有194個(gè)節(jié)點(diǎn)和200多個(gè)節(jié)點(diǎn),主要負(fù)責(zé)地震勘探資料處理。同年7月,東方地球物理公司研究院大港分院采用HPProLiant BL20P G2刀片式服務(wù)器作為計(jì)算節(jié)點(diǎn)的高性能計(jì)算集群系統(tǒng)正式投產(chǎn)。該系統(tǒng)包括119個(gè)HP ProLiant BL20P計(jì)算節(jié)點(diǎn)和14個(gè)ProLiant DL380G2 I/O節(jié)點(diǎn),以集群技術(shù)組成的超級(jí)并行計(jì)算機(jī)作為地震資料處理的主機(jī)系統(tǒng)。整個(gè)系統(tǒng)共133個(gè)節(jié)點(diǎn)、266個(gè)處理器,安裝了CGG、Geodepth等先進(jìn)的處理軟件,能夠提供更精準(zhǔn)的地構(gòu)造及地下成像。
2006年10月,國(guó)內(nèi)最大規(guī)模的集群地震資料處理系統(tǒng)在大慶油田勘探開(kāi)發(fā)研究院正式投入使用。該地震資料處理系統(tǒng)采用了中國(guó)惠普公司開(kāi)發(fā)出的刀片服務(wù)器集群架構(gòu),集成了692臺(tái)惠普公司的第三代服務(wù)器產(chǎn)品——HPBL20PG3、HPDL380G3和HPDL580G3服務(wù)器,選用了1432個(gè)Intel至強(qiáng)中國(guó)刀片服務(wù)器集群系統(tǒng),是國(guó)內(nèi)處理規(guī)模最大、系統(tǒng)配置最優(yōu)、技術(shù)性能最好的地震資料處理CPU。
Linux集群在國(guó)內(nèi)石油企業(yè)中另一個(gè)主要應(yīng)用領(lǐng)域就是油藏?cái)?shù)值模擬。油藏?cái)?shù)值模擬在空間上可以描述油田全貌,在時(shí)間上可以重現(xiàn)油田開(kāi)發(fā)歷史、評(píng)價(jià)開(kāi)發(fā)效果并預(yù)測(cè)油田未來(lái)的開(kāi)發(fā)動(dòng)態(tài),實(shí)現(xiàn)對(duì)油田開(kāi)發(fā)過(guò)程的仿真模擬。它對(duì)于研究剩余油分布、促進(jìn)我國(guó)相當(dāng)部分已進(jìn)入高含水后期老油田的高產(chǎn)/穩(wěn)產(chǎn)具有重要意義。自問(wèn)世以來(lái),一直是石油工程師對(duì)油藏進(jìn)行分析和管理的有效方法。隨著油田開(kāi)發(fā)的深入,油藏模擬對(duì)硬件系統(tǒng)的性能需求越來(lái)越高:開(kāi)發(fā)后期的油藏剩余油分布和壓力分布等越來(lái)越復(fù)雜,模擬這種復(fù)雜的油藏需要把以前的模型網(wǎng)格尺寸成倍縮小,網(wǎng)格數(shù)也呈數(shù)量級(jí)增加,這就要求計(jì)算機(jī)有足夠大的內(nèi)存和足夠快的處理速度。而這些正是Linux集群的優(yōu)勢(shì)所在。
2006年6月,大慶油田選用60片IBM Blade-Center IS20刀片服務(wù)器搭建的高性能Linux集群應(yīng)用于油藏?cái)?shù)值模擬系統(tǒng)項(xiàng)目。BladeCenterIs20匯集了許多先進(jìn)技術(shù),將Linux和BladeCenter整合于一個(gè)十分可靠的高性能刀片服務(wù)器之中,有了提供2,2GHz雙內(nèi)核性能的64位PowerPC970處理器以及最高可支持8GB的ECCDDR內(nèi)存。Is20對(duì)運(yùn)行于Linux并基于A1tiVec技術(shù)優(yōu)化的高性能計(jì)算工作負(fù)載來(lái)說(shuō)是十分理想的。通過(guò)IBM刀片服務(wù)器,用戶應(yīng)用的油藏?cái)?shù)值模擬系統(tǒng)能夠在很小的物理空間內(nèi)部署強(qiáng)大的計(jì)算力。該平臺(tái)的成功上線可大大提高油藏?cái)?shù)值模擬結(jié)果的生成速度,改善油藏的勘測(cè)能力。
2006年10月,國(guó)內(nèi)最先進(jìn)的數(shù)值模擬微機(jī)集群處理系統(tǒng)在勝利地質(zhì)科學(xué)研究院投產(chǎn),標(biāo)志著勝利油田開(kāi)發(fā)計(jì)算機(jī)手段達(dá)到國(guó)內(nèi)領(lǐng)先水平。它使常規(guī)水驅(qū)模擬模型規(guī)模擴(kuò)大到百萬(wàn)級(jí),實(shí)現(xiàn)了整體建模、整體模擬和大規(guī)模并行化數(shù)值模擬。它使熱采及三采模型規(guī)模由井組、小區(qū)塊擴(kuò)大到全油藏。它提高了動(dòng)態(tài)模型的可靠性和描述精度,實(shí)現(xiàn)了整裝大油藏多指標(biāo)擬合的單井化,實(shí)現(xiàn)了整裝大油藏老區(qū)調(diào)整歷史擬合的精細(xì)化,改變了以往各自為政的應(yīng)用模式,實(shí)現(xiàn)了油田范圍內(nèi)硬件資源的共享、大型軟件資源的共享、基礎(chǔ)數(shù)據(jù)的共享和研究成果的共享,形成了油田的共享中心,提高了軟硬件的應(yīng)用效率,工作效率提高5~6倍。
無(wú)疑,Linux集群已經(jīng)在國(guó)內(nèi)石油行業(yè)得到了規(guī)?;膽?yīng)用,從盆地模擬、地震資料處理、全三維可視化解釋、油藏?cái)?shù)值模擬等許多方面幫助石油公司提高產(chǎn)值并減少成本。而對(duì)于醫(yī)藥、生命科學(xué)、基因解析、天氣分析等有密集運(yùn)算需求的企業(yè)和研究機(jī)構(gòu)來(lái)說(shuō),Linux集群系統(tǒng)解決方案也同樣是可以借鑒的。