劉 歆 馮陶然 王天琦 劉瑞晶
1北京科技大學計算機與通信工程學院2中國地質(zhì)大學(北京)能源學院3大慶油田采油一廠4北京林業(yè)大學工學院
數(shù)據(jù)橋系統(tǒng)在油氣田數(shù)據(jù)管理中的應用
劉 歆1馮陶然2王天琦3劉瑞晶4
1北京科技大學計算機與通信工程學院2中國地質(zhì)大學(北京)能源學院3大慶油田采油一廠4北京林業(yè)大學工學院
數(shù)據(jù)橋系統(tǒng)是一套針對油氣田勘探開發(fā)等業(yè)務的數(shù)據(jù)管理系統(tǒng)。系統(tǒng)基于B/S架構(gòu),實現(xiàn)了數(shù)據(jù)自動采集、查詢和修改等功能。該軟件針對大港油田、吉林油田和大慶油田開發(fā)了專有的數(shù)據(jù)橋,并通過用戶管理功能實現(xiàn)了軟件的權限控制,保證各個油田的數(shù)據(jù)隔離。通過在油田的實際應用表明,系統(tǒng)可有效地解決各油田數(shù)據(jù)信息孤島的問題。數(shù)據(jù)橋系統(tǒng)在華北和冀東油田現(xiàn)場試用軟件,對356口井進行優(yōu)化和診斷,其中對95口井進行有桿泵優(yōu)化,系統(tǒng)效率由21.3%提高到26.9%;對50口井進行螺桿泵優(yōu)化,系統(tǒng)效率由30.2%提高到36.7%。
數(shù)據(jù)橋系統(tǒng);數(shù)據(jù)分類;系統(tǒng)架構(gòu);數(shù)據(jù)異構(gòu)
數(shù)據(jù)橋系統(tǒng)是一套針對油氣田勘探開發(fā)等業(yè)務的數(shù)據(jù)管理系統(tǒng)。系統(tǒng)基于B/S架構(gòu),實現(xiàn)了數(shù)據(jù)自動采集、查詢和修改等功能。該軟件針對大港油田、吉林油田和大慶油田開發(fā)了專有的數(shù)據(jù)橋,并通過用戶管理功能實現(xiàn)了軟件的權限控制,保證各個油田的數(shù)據(jù)隔離。通過在油田的實際應用表明,系統(tǒng)可有效地解決各油田數(shù)據(jù)信息孤島的問題。油田數(shù)據(jù)橋系統(tǒng)架構(gòu)見圖1。
圖1 油田數(shù)據(jù)橋系統(tǒng)架構(gòu)
油田圍繞油氣井對象進行優(yōu)化設計與診斷,需要大量的功能實現(xiàn)模塊協(xié)同來完成。而每個功能實現(xiàn)模塊又包括大量的科學計算與圖形展示,每一項科學計算對應廣泛的輸入?yún)?shù)數(shù)據(jù)和輸出參數(shù)數(shù)據(jù),包括油氣井設備數(shù)據(jù)、生產(chǎn)數(shù)據(jù)、單元區(qū)塊油氣藏數(shù)據(jù)、物性參數(shù)數(shù)據(jù)、井身結(jié)構(gòu)數(shù)據(jù)和其他用戶設置的特性數(shù)據(jù)等,不同科學計算之間存在共享數(shù)據(jù)的關系。針對這種數(shù)據(jù)類型廣泛的問題,需要設計并建立一個數(shù)據(jù)處理、數(shù)據(jù)集成和數(shù)據(jù)查詢的可擴展性強的總體數(shù)據(jù)平臺。
系統(tǒng)的本地數(shù)據(jù)庫采用混合策略,根據(jù)需求自頂向下分類整理歸納,得到系統(tǒng)中所涉及到的實體,然后根據(jù)系統(tǒng)的數(shù)據(jù)邏輯和數(shù)據(jù)字典中的數(shù)據(jù)項為各實體添加屬性及關系,采用自底向上策略進行各實體的總體集成。從系統(tǒng)中抽象出的部分實體如表1所示。
表1 系統(tǒng)實體描述字典
通過對各實體進行分析,參考PDPMIS標準中相關表的定義,并根據(jù)本系統(tǒng)中的需要,確定各實體屬性對各模塊的具體E—R圖并進行局部優(yōu)化和整合,系統(tǒng)初步設計的總體E—R圖,擴充時對系統(tǒng)各實體再進行細化。
數(shù)據(jù)橋的設計思路:①調(diào)研上層應用設計的數(shù)據(jù)項,進行數(shù)據(jù)分類;②調(diào)研數(shù)據(jù)源具體分布,考察現(xiàn)場數(shù)據(jù)與當前數(shù)據(jù)模型的映射關系;③根據(jù)映射關系,設計存儲池及規(guī)則庫;④結(jié)合數(shù)據(jù)日志,建立支持數(shù)據(jù)集成的底層數(shù)據(jù)庫結(jié)構(gòu)。
3.1 定義實體類
實體類包括映射規(guī)則類、數(shù)據(jù)日志類、適配器類、存儲池類、數(shù)據(jù)項字典類。映射規(guī)則包括采集規(guī)則、處理規(guī)則、傳輸規(guī)則,它們又被劃分為大港規(guī)則、華北規(guī)則、冀東規(guī)則;數(shù)據(jù)日志包括適配記錄、采集日志、處理日志、傳輸日志等,同樣按照油田公司劃分;存儲池分為采集、處理、傳輸三種存儲池,每種存儲池都有基于數(shù)據(jù)項字典的專屬存儲池,即存放井號信息、管柱結(jié)構(gòu)、井斜數(shù)據(jù)等。定義實體間的關系適配器、映射規(guī)則、數(shù)據(jù)日志、存儲池以“所屬單位”屬性和“數(shù)據(jù)表項”屬性為外鍵關系相聯(lián)系。
3.2 數(shù)據(jù)表設計
根據(jù)數(shù)據(jù)庫設計規(guī)范,定義數(shù)據(jù)表主鍵、外鍵,新建數(shù)據(jù)庫用戶、數(shù)據(jù)表空間、數(shù)據(jù)橋涉及數(shù)據(jù)表、關鍵字、索引等。
3.3 數(shù)據(jù)加載
加載適配信息至適配器相關表;根據(jù)數(shù)據(jù)模型和數(shù)據(jù)源數(shù)據(jù)對應關系,設計映射規(guī)則,加載規(guī)則至映射規(guī)則相關表;數(shù)據(jù)橋運行過程中將生成數(shù)據(jù)日志填充數(shù)據(jù)日志表,將采集的原始數(shù)據(jù)存放在存儲池中,并在對應存儲池中進行各種處理。
油氣田數(shù)據(jù)存在嚴重的結(jié)構(gòu)異構(gòu)問題。如抽油桿結(jié)構(gòu)數(shù)據(jù),1口井有1組抽油桿數(shù)據(jù);每根抽油桿包含桿長、桿徑、桿類型等信息。各油田數(shù)據(jù)庫的數(shù)據(jù)格式都有所不同,比如可能把3級桿長存成一個字段,也有可能是分3行記錄或者是1行中的3個字段來表示。針對不同的結(jié)構(gòu)異構(gòu),有三種解決方式,分別是字段轉(zhuǎn)換、字段拆分、字段組合。
4.1 字段轉(zhuǎn)換
由數(shù)據(jù)源字段通過映射關系直接轉(zhuǎn)換為統(tǒng)一格式。以華北油田的數(shù)據(jù)為例,數(shù)據(jù)源的結(jié)構(gòu)如表2所示,經(jīng)過數(shù)據(jù)橋轉(zhuǎn)換為統(tǒng)一格式,如表3所示。
表2 華北油田數(shù)據(jù)源結(jié)構(gòu)
表3 數(shù)據(jù)橋轉(zhuǎn)換統(tǒng)一格式
4.2 字段拆分
將一個字段拆分成多個字段,轉(zhuǎn)化為統(tǒng)一格式。以冀東油田的數(shù)據(jù)為例,數(shù)據(jù)源的結(jié)構(gòu)如表4所示,經(jīng)過數(shù)據(jù)橋轉(zhuǎn)換為統(tǒng)一格式,如表5所示。
表4 冀東油田數(shù)據(jù)源結(jié)構(gòu)
表5 數(shù)據(jù)橋轉(zhuǎn)換統(tǒng)一格式
4.3 字段組合
通過字段計算和組合,轉(zhuǎn)化為新的字段。以冀東油田的數(shù)據(jù)為例,數(shù)據(jù)源結(jié)構(gòu)如表6所示,經(jīng)過數(shù)據(jù)橋計算轉(zhuǎn)化為油層中深和層厚,如表7所示。
表6 冀東油田數(shù)據(jù)源結(jié)構(gòu)
表7 數(shù)據(jù)橋計算轉(zhuǎn)化
數(shù)據(jù)橋系統(tǒng)已經(jīng)在大慶、吉林、冀東、大港、華北等油田推廣應用,在華北和冀東油田現(xiàn)場試用軟件,對356口井進行優(yōu)化和診斷,其中對95口井進行有桿泵優(yōu)化,系統(tǒng)效率由21.3%提高到26.9%,平均提高5.6%;對50口井進行螺桿泵優(yōu)化,系統(tǒng)效率由30.2%提高到36.7%,平均提高6.5%。
應用數(shù)據(jù)橋系統(tǒng)可實現(xiàn)一鍵式數(shù)據(jù)更新。這套系統(tǒng)具有平滑的升級能力,可以遠程下載更新軟件包,自動升級最新版本。該系統(tǒng)可推廣應用到油氣田的各個業(yè)務系統(tǒng),包括勘探開發(fā)、煉油化工、銷售、管道儲運、工程技術等。
(欄目主持樊韶華)
10.3969/j.issn.1006-6896.2015.4.031