吳堯 楊立根
摘 要:隨著地震勘探技術(shù)的發(fā)展和渤海油田勘探要求的提高,帶來了地震采集數(shù)據(jù)量大幅增長,對(duì)數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)安全和數(shù)據(jù)轉(zhuǎn)儲(chǔ)提出了更高的要求。本文主要對(duì)地震數(shù)據(jù)存儲(chǔ)介質(zhì)、轉(zhuǎn)儲(chǔ)方案進(jìn)行分析,提出一套轉(zhuǎn)儲(chǔ)體系方法,通過實(shí)際生產(chǎn)項(xiàng)目的應(yīng)用,表示該方法能夠滿足海量地震數(shù)據(jù)轉(zhuǎn)儲(chǔ)質(zhì)控的要求。
關(guān)鍵詞:地震數(shù)據(jù);高效轉(zhuǎn)儲(chǔ);MD5
中圖分類號(hào):P631.44 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2019)06-0159-02
0 引言
隨著渤海油田勘探技術(shù)的進(jìn)步,尤其是“兩寬一高”采集技術(shù)的應(yīng)用,地震數(shù)據(jù)呈指數(shù)級(jí)的快速增長。目前野外采集儀器記錄的原始單炮數(shù)據(jù)一般為SEGD或SEGY格式,選擇的存儲(chǔ)介質(zhì)一般為磁帶。就渤海油田1995年~2009年的采集工區(qū)來舉例,均使用3590磁帶作為存儲(chǔ)介質(zhì)。目前3590磁帶機(jī)已經(jīng)停產(chǎn),磁帶在使用過程中也發(fā)現(xiàn)粘連等問題,無法滿足目前勘探研究的需要。因此,必須對(duì)其記錄的地震數(shù)據(jù)進(jìn)行轉(zhuǎn)儲(chǔ)。
1 問題的提出與應(yīng)對(duì)
野外地震數(shù)據(jù)轉(zhuǎn)儲(chǔ)有其特殊性,一是地震數(shù)據(jù)容量非常大,面對(duì)海量地震數(shù)據(jù)的轉(zhuǎn)儲(chǔ)和質(zhì)控要求所采用的程序、方法高效;二是要求數(shù)據(jù)準(zhǔn)確,轉(zhuǎn)儲(chǔ)存檔后幾乎無法返工;三是兼容性,可以滿足各種處理軟件后期再使用的要求。
本文介紹一種行之有效的轉(zhuǎn)儲(chǔ)方案和質(zhì)控流程,能高效完成海量地震數(shù)據(jù)的轉(zhuǎn)儲(chǔ)工作,主要包括以下幾個(gè)方面:
1.1 轉(zhuǎn)儲(chǔ)介質(zhì)的選擇
參考國內(nèi)外各大石油公司的經(jīng)驗(yàn),優(yōu)選出兩種介質(zhì)。藍(lán)光光盤,優(yōu)點(diǎn)是保存時(shí)間長,理論上可以100年;缺點(diǎn)是使用中易產(chǎn)生劃痕,重復(fù)利用率低。移動(dòng)磁盤,優(yōu)點(diǎn)是方便使用,可反復(fù)讀取;缺點(diǎn)是保存年限短。綜合考慮地震數(shù)據(jù)的保存屬性和利用屬性,最終選取藍(lán)光光盤作為轉(zhuǎn)儲(chǔ)介質(zhì)。
1.2 轉(zhuǎn)儲(chǔ)的方案
為了與渤海油田數(shù)據(jù)處理軟件緊密結(jié)合,方便處理軟件的使用,選用tape2cgg拷貝軟件,該軟件能夠?qū)崿F(xiàn)磁帶數(shù)據(jù)的轉(zhuǎn)儲(chǔ)拷貝,輸出數(shù)據(jù)與原始磁帶數(shù)據(jù)保持完全一致(圖1、2)。軟件操作快捷高效,數(shù)據(jù)檢查方便準(zhǔn)確,適合大規(guī)模的原始磁帶轉(zhuǎn)儲(chǔ)質(zhì)控。
轉(zhuǎn)錄后數(shù)據(jù)本體沒有發(fā)生任何改變,為適應(yīng)不同處理軟件需要,也可以轉(zhuǎn)儲(chǔ)為“無間隔的磁盤文件”,即有效數(shù)據(jù)連續(xù)存放,沒有EOR和EOF標(biāo)記,用tpf索引文件描述有效數(shù)據(jù)的結(jié)構(gòu)。使用nerolinux12,主流的win7平臺(tái)下的刻錄軟件,圖形化界面操作,方便快捷,并支持刻錄數(shù)據(jù)驗(yàn)證。光盤刻錄兩份,同時(shí)生成MD5校驗(yàn)文件(圖3)。
1.3 質(zhì)量控制
1.3.1 MD5值校驗(yàn)
MD5即Message-Digest Algorithm 5(信息-摘要算法5),用于確保信息傳輸完整一致。是計(jì)算機(jī)廣泛使用的雜湊算法之一。其具備具有以下特點(diǎn):
(1)壓縮性:任意長度的數(shù)據(jù),算出的MD5值長度都是固定的;
(2)容易計(jì)算:從原數(shù)據(jù)計(jì)算出MD5值很容易;
(3)抗修改性:對(duì)原數(shù)據(jù)進(jìn)行任何改動(dòng),哪怕只修改1個(gè)字節(jié),所得到的MD5值都有很大區(qū)別;
(4)強(qiáng)抗碰撞:已知原數(shù)據(jù)和其MD5值,想找到一個(gè)具有相同MD5值的數(shù)據(jù)(即偽造數(shù)據(jù))是非常困難的。
通過比對(duì)原始磁帶介質(zhì)中數(shù)據(jù)和刻錄光盤中數(shù)據(jù)的MD5值,可以高速、有效的對(duì)轉(zhuǎn)儲(chǔ)數(shù)據(jù)的一致性進(jìn)行驗(yàn)證。
1.3.2 數(shù)據(jù)抽查
對(duì)抽查測線用第三方商業(yè)化處理系統(tǒng)軟件對(duì)3590原始磁帶和轉(zhuǎn)儲(chǔ)拷貝磁盤數(shù)據(jù)分別解編并進(jìn)行數(shù)據(jù)對(duì)比(圖4)。
2 應(yīng)用實(shí)例
基于以上的技術(shù)和方法,通過自主知識(shí)產(chǎn)權(quán)的海量數(shù)據(jù)轉(zhuǎn)儲(chǔ)軟件,對(duì)渤海油田1995年至2009年采集工區(qū)所記錄的3590磁帶轉(zhuǎn)儲(chǔ),涉及磁帶2萬7千余盤,數(shù)據(jù)量接近400T。通過一年的轉(zhuǎn)儲(chǔ)和質(zhì)控,該項(xiàng)目通過隨機(jī)抽查藍(lán)光光盤數(shù)據(jù)并和原始磁帶數(shù)據(jù)比對(duì)沒有發(fā)現(xiàn)任何問題和錯(cuò)誤,刻錄藍(lán)光光盤數(shù)據(jù)與原始磁帶數(shù)據(jù)MD5值對(duì)比完全一致。
3 結(jié)語
(1)地震數(shù)據(jù)的容量很大,實(shí)現(xiàn)高效轉(zhuǎn)儲(chǔ)需要分布式錄入集中存儲(chǔ)的并行工作方式。
(2)MD5值一致性比較作為地震數(shù)據(jù)轉(zhuǎn)儲(chǔ)的驗(yàn)證方式十分高效。
(3)本套轉(zhuǎn)儲(chǔ)體系方法,通過實(shí)際生產(chǎn)項(xiàng)目的應(yīng)用,能夠滿足海量地震數(shù)據(jù)轉(zhuǎn)儲(chǔ)以及質(zhì)控的要求。
參考文獻(xiàn)
[1] 朱偉林,米立軍,鐘鍇,等.油氣并舉 再攀高峰——中國近海2010年勘探回顧及“十二五”勘探展望[J].中國海上油氣,2011(1):1-6.
[2] 李振春.地震數(shù)據(jù)規(guī)則化重構(gòu)方法策略[J].中國石油大學(xué)學(xué)報(bào)(自然科學(xué)版),2018(01).
[3] 丁寧,李為沖,侯明雨,等. Geoframe地震工區(qū)備份技術(shù)研究與應(yīng)用標(biāo)準(zhǔn)[J].中國石油和化工標(biāo)準(zhǔn)與質(zhì)量,2017,37(22):14-15.
[4] 喻兵良,劉玉紅,劉戀.復(fù)雜勘探區(qū)地震資料處理的關(guān)鍵技術(shù)[J].山東煤炭科技,2017 (11):144-146.
[5] 張良,韓立國,劉爭光,等.基于壓縮感知和Contourlet變換的地震數(shù)據(jù)重建方法[J].石油物探,2017,56(06):804-811.