国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

分散存儲油氣生產(chǎn)動態(tài)大數(shù)據(jù)的優(yōu)化管理與快速查詢

2019-11-05 05:23:48王洪亮穆龍新時付更劉凱銘錢育蓉
石油勘探與開發(fā) 2019年5期
關(guān)鍵詞:低產(chǎn)數(shù)據(jù)倉庫水井

王洪亮,穆龍新,時付更,劉凱銘,錢育蓉

(1.中國石油勘探開發(fā)研究院,北京 100083;2.新疆大學(xué),烏魯木齊 830008)

0 引言

中國石油油氣水井生產(chǎn)數(shù)據(jù)管理系統(tǒng)(簡稱 A2系統(tǒng))是中國石油天然氣集團有限公司(以下簡稱“集團公司”)的大型信息系統(tǒng)之一。A2系統(tǒng)以油氣生產(chǎn)管理為核心,實現(xiàn)了油、氣、水井生產(chǎn)數(shù)據(jù)的采集、處理、統(tǒng)計、匯總、存儲、上報、發(fā)布等一體化管理。A2系統(tǒng)管理了36×104余口油、氣、水井的生產(chǎn)數(shù)據(jù),生產(chǎn)歷史近60年,數(shù)據(jù)記錄超過60×108條,結(jié)構(gòu)化數(shù)據(jù)量超過5 TB,并發(fā)用戶4 000多戶。由于生產(chǎn)數(shù)據(jù)量巨大、并發(fā)高和系統(tǒng)建設(shè)時技術(shù)所限,系統(tǒng)采用分散式部署,即16個油氣田公司各自部署一套系統(tǒng),管理著本油氣田公司的油、氣、水井生產(chǎn)數(shù)據(jù),共計16套數(shù)據(jù)庫。A2系統(tǒng)采用關(guān)系型數(shù)據(jù)庫,數(shù)據(jù)模型采用面向?qū)ο竽P瓦M行設(shè)計。A2系統(tǒng)主要包含基礎(chǔ)信息、生產(chǎn)測試、油氣生產(chǎn)、增產(chǎn)措施、采油工藝(井設(shè)備)、油氣集輸(站庫)6類數(shù)據(jù),共計362張數(shù)據(jù)表,9 512個數(shù)據(jù)項。A2系統(tǒng)已經(jīng)成為各油氣田公司油氣生產(chǎn)管理的日常工作平臺,取得了顯著的應(yīng)用效果。

集團公司在進行全局性油、氣、水井生產(chǎn)分析時,由于數(shù)據(jù)量巨大,暴露出A2系統(tǒng)查詢效率低、多個數(shù)據(jù)庫間存在信息孤島、人工收集數(shù)據(jù)時間長等問題:①系統(tǒng)采用關(guān)系型數(shù)據(jù)庫,數(shù)據(jù)表中數(shù)據(jù)記錄超過1.0×107條時,在多表聯(lián)合查詢時,查詢時間超過5 min,分析人員等待時間長;②系統(tǒng)間存在信息孤島問題,不能互聯(lián)互通,人工收集數(shù)據(jù)時間長。在集團公司層級進行油、氣、水井生產(chǎn)數(shù)據(jù)分析研究時,需要重復(fù)登錄16套系統(tǒng)收集數(shù)據(jù),再進行手工統(tǒng)計分析,存在重復(fù)勞動,不能高效進行全局分析。因此,迫切需要一個能夠?qū)崟r掌握全局性油、氣、水井生產(chǎn)動態(tài)的系統(tǒng),通過該系統(tǒng)可以深入透視分析數(shù)據(jù)背后潛在的有用信息,支撐油氣生產(chǎn)與研究工作。

國外大數(shù)據(jù)分析挖掘技術(shù)在石油工業(yè)中得到初步應(yīng)用。將油氣大數(shù)據(jù)作為資產(chǎn),基于數(shù)據(jù)驅(qū)動模型優(yōu)化油氣的勘探與生產(chǎn),降低石油公司生產(chǎn)成本[1-2]。雪佛龍公司使用 Hadoop技術(shù)進行地震數(shù)據(jù)分析來識別儲集層[3]。與此同時,中國油氣行業(yè)對大數(shù)據(jù)技術(shù)的研究與應(yīng)用也在持續(xù)深入推進。中國石油天然氣集團有限公司已建成約70個大型信息系統(tǒng)并上線運行,并正在推進智能油田建設(shè)[4]。魯帥帥[5]基于大數(shù)據(jù)環(huán)境建立油氣鉆井信息分布式數(shù)據(jù)倉庫;曲海旭[6]利用大數(shù)據(jù)技術(shù)進行油田生產(chǎn)經(jīng)營優(yōu)化;大數(shù)據(jù)與人工智能結(jié)合,在智能鉆井方案優(yōu)化、測井曲線生成、水平井地質(zhì)建模等方面的研究也取得了一定進展[7-10]。

為解決集團公司在進行全局性油、氣、水井生產(chǎn)動態(tài)分析時遇到的數(shù)據(jù)庫查詢分析效率低、多個數(shù)據(jù)庫間存在信息孤島、人工收集數(shù)據(jù)時間長等問題,利用大數(shù)據(jù)分布式存儲與并行計算、數(shù)據(jù)倉庫建模等技術(shù)構(gòu)建多維分析引擎數(shù)據(jù)管理平臺,實現(xiàn)一個系統(tǒng)管理 36×104余口油、氣、水井生產(chǎn)數(shù)據(jù),同時實現(xiàn)快速查詢與多維統(tǒng)計分析。

1 總體設(shè)計

1.1 架構(gòu)設(shè)計

由于單機部署服務(wù)器的處理能力有限,當(dāng)業(yè)務(wù)增長到一定程度的時候,單機的硬件資源將無法滿足業(yè)務(wù)需求[11-13]??紤]油、氣、水井生產(chǎn)數(shù)據(jù)總量巨大、增長速度快、計算機性能擴展與成本等方面的原因,本文選用Hadoop的分布式文件存儲系統(tǒng)(HDFS)和并行計算框架(MapReduce)作為本系統(tǒng)的基礎(chǔ)支撐架構(gòu)。利用 Hadoop大數(shù)據(jù)平臺,結(jié)合分布式數(shù)據(jù)倉庫(Hive)、多維分析引擎(Apache Kylin)、分布式實時數(shù)據(jù)倉庫(HBase)等技術(shù)構(gòu)建油氣生產(chǎn)多維分析系統(tǒng)(見圖1)。采用多維分析技術(shù)保證秒級響應(yīng),實現(xiàn)36×104余口油、氣、水井生產(chǎn)大數(shù)據(jù)的集中存儲與管理;基于油、氣、水井全樣本數(shù)據(jù)分析,開展油區(qū)生產(chǎn)運行跟蹤、重點油田生產(chǎn)預(yù)警、低產(chǎn)井和長停井現(xiàn)狀、分類油藏開發(fā)規(guī)律等分析研究工作;在集團公司層級進行統(tǒng)一的生產(chǎn)多維分析,并實現(xiàn)集團公司、油氣田公司、油氣田、區(qū)塊、單井信息的逐級追溯,滿足實時掌握油氣生產(chǎn)動態(tài)的需求。

圖1 油氣生產(chǎn)多維分析架構(gòu)圖

1.2 關(guān)鍵技術(shù)

1.2.1 MapReduce并行計算框架

MapReduce是一種并行計算框架,適用于大規(guī)模數(shù)據(jù)集的并行運算[14-19]。它的設(shè)計思想是將一個大的計算任務(wù)分為多個小的任務(wù),然后把這些小的任務(wù)分配到各個工作節(jié)點進行計算,每個子節(jié)點完成自己的計算任務(wù)后,把各個子節(jié)點的結(jié)果進行聚合操作,從而算出最后的結(jié)果(見圖2)。

圖2 并行計算過程

1.2.2 Hive數(shù)據(jù)倉庫

Hive是基于HDFS和MapReduce實現(xiàn)的,是一種構(gòu)建于Hadoop平臺上的數(shù)據(jù)倉庫[20-22]。Hive的設(shè)計思想是應(yīng)用簡單的類 SQL(結(jié)構(gòu)化查詢語言)來取代復(fù)雜的MapReduce編程過程,從而讓業(yè)務(wù)人員熟練使用。

Hive給用戶提供訪問數(shù)據(jù)倉庫的手段,通過客戶端提供的指令,控制臺檢索數(shù)據(jù)倉庫中的數(shù)據(jù);Hive同時也提供應(yīng)用程序接口進行訪問查詢。

Hive數(shù)據(jù)倉庫的服務(wù)端和客戶端之間的通信方式基于 Thrift框架實現(xiàn)。通信框架也負責(zé)把客戶端的類SQL語句發(fā)送給Driver解析器并同時返回解析器的處理結(jié)果。

1.2.3 Kylin多維分析引擎

Apache Kylin是一個開源的分布式多維分析計算引擎。Kylin是聯(lián)機分析技術(shù)(OLAP)在Hadoop上的一個應(yīng)用實例,可以提供基于HDFS多維數(shù)據(jù)的分析能力,本身數(shù)據(jù)處理計算的能力已經(jīng)達到 PB(1×250字節(jié))級別,能夠在亞秒范圍內(nèi)查詢數(shù)據(jù)倉庫中的信息。

Kylin設(shè)計的基本思想是多維數(shù)據(jù)的預(yù)計算,以存儲空間來換取查詢響應(yīng)時間[23]。Kylin本身并不存儲實際數(shù)據(jù),數(shù)據(jù)都存儲在 HDFS上。該引擎使用數(shù)據(jù)倉庫中的數(shù)據(jù)作為其數(shù)據(jù)輸入源,當(dāng)一批數(shù)據(jù)進入后,它會計算出高維數(shù)據(jù)所有維度組合下的數(shù)據(jù),并將預(yù)計算完成后的數(shù)據(jù)存儲在數(shù)據(jù)立方體中,最后以鍵值對的方式存儲在HBase數(shù)據(jù)庫中。當(dāng)操作人員進行數(shù)據(jù)訪問時,查詢服務(wù)就會轉(zhuǎn)換成HBase數(shù)據(jù)庫上的掃描過程,免除多表連接、聚合運算等高耗時的計算任務(wù),提高查詢響應(yīng)速度。

1.2.4 HBase實時查詢數(shù)據(jù)庫

HBase是基于列式存儲的非關(guān)系型數(shù)據(jù)庫,解決了 HDFS隨機讀寫訪問延時大的問題,其本身具備了HDFS的高容錯特點,適合用于大數(shù)據(jù)的實時查詢服務(wù)。

HBase作為NoSQL(非關(guān)系型數(shù)據(jù)庫)存儲系統(tǒng),本身可以存儲結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。HBase提供了簡單的數(shù)據(jù)庫操作方式。數(shù)據(jù)類型只有字符串一種類型,并且存儲表格可以設(shè)計得很大,行數(shù)可達1.0×108以上,列數(shù)可達1.0×106以上[24]。

2 技術(shù)實現(xiàn)

根據(jù)總體設(shè)計,技術(shù)實現(xiàn)主要包括數(shù)據(jù)倉庫建模、數(shù)據(jù)采集、多維分析和可視化4個步驟。

2.1 數(shù)據(jù)倉庫建模技術(shù)

油氣生產(chǎn)大數(shù)據(jù)多維分析主要包括油區(qū)生產(chǎn)運行跟蹤、重點油田生產(chǎn)預(yù)警、低產(chǎn)井和長停井現(xiàn)狀、分類油藏開發(fā)規(guī)律分析等主題(見表1)。每個主題的數(shù)據(jù)都是多維的,需要從不同的角度進行分析。本文以油區(qū)生產(chǎn)運行跟蹤分析主題的采出井生產(chǎn)數(shù)據(jù)分析為例,介紹Hive數(shù)據(jù)倉庫的建模過程。

表1 油氣生產(chǎn)多維分析主題表

采出井生產(chǎn)數(shù)據(jù)分析主要研究采出井及油氣生產(chǎn)單元的生產(chǎn)運行情況,它涵蓋的數(shù)據(jù)包括采出井基礎(chǔ)數(shù)據(jù)、采出井生產(chǎn)數(shù)據(jù)、采出井狀態(tài)數(shù)據(jù)、采出井措施數(shù)據(jù)、采出井機采數(shù)據(jù)、關(guān)井?dāng)?shù)據(jù)等。

多維模型主要包含事實表和維度表。事實表在數(shù)據(jù)倉庫結(jié)構(gòu)中處于多維模型的中央,包含維度、與維度關(guān)聯(lián)的外鍵和度量值。維度表是某一個維度屬性的集合,屬性的集合構(gòu)成一個維。維度是用戶分析問題時的一個重要工具,也是重要屬性,通過改變維度來改變觀察數(shù)據(jù)的角度,更容易獲取知識。通常對于簡單的數(shù)據(jù)模型,一個事實表就可以表示一個主題,一個事實表對應(yīng)多個維度表。

采出井生產(chǎn)數(shù)據(jù)分析的主要維度包括日期、井別、驅(qū)動類型、采出方式、油氣品種、井型、油藏類型、油氣單元、組織機構(gòu)等(見表2)。

表2 采出井維度表的維度層次描述

與采出井生產(chǎn)數(shù)據(jù)分析相關(guān)的主要生產(chǎn)指標(biāo)包括基礎(chǔ)數(shù)據(jù)、生產(chǎn)數(shù)據(jù)、狀態(tài)數(shù)據(jù)、機采數(shù)據(jù)、措施數(shù)據(jù)、關(guān)井?dāng)?shù)據(jù)等105項關(guān)鍵指標(biāo)(見表3)。

采出井生產(chǎn)數(shù)據(jù)多維分析屬于密集型計算,星型模型的優(yōu)點是數(shù)據(jù)集中運算速度快并且布置相對簡單,但存在數(shù)據(jù)冗余度較高的缺點,采用 MapReduce并行計算正好可以改善數(shù)據(jù)冗余度問題,因此本文采用星型模型。該模型中事實表與所有維度表相連,事實表占據(jù)中間位置(見圖3)。

表3 采出井生產(chǎn)事實表

圖3 采出井分析數(shù)據(jù)模型

2.2 數(shù)據(jù)采集技術(shù)

將大慶、吉林、西南等16個油氣田公司A2數(shù)據(jù)庫中的油、氣、水井生產(chǎn)數(shù)據(jù)加載到Hive數(shù)據(jù)倉庫中。將事務(wù)型數(shù)據(jù)轉(zhuǎn)變?yōu)槊嫦蛴蜌馍a(chǎn)主題的數(shù)據(jù)(見圖4)。

圖4 數(shù)據(jù)處理流程

16個油氣田公司數(shù)據(jù)庫中數(shù)據(jù)量巨大,抽取數(shù)據(jù)時需要設(shè)置一個數(shù)據(jù)緩存區(qū),將數(shù)據(jù)一次性地從數(shù)據(jù)庫中讀取出來。在數(shù)據(jù)抽取過程中,先將數(shù)據(jù)抽取到臨時數(shù)據(jù)存儲區(qū),然后進行數(shù)據(jù)的轉(zhuǎn)換和清洗。轉(zhuǎn)換工作是將生產(chǎn)數(shù)據(jù)中格式不一致、單位不統(tǒng)一的數(shù)據(jù)進行規(guī)整處理;清洗的工作主要是刪除重復(fù)信息、糾正存在錯誤的數(shù)據(jù)[25]。

本次作業(yè)流程中包括了日期、井別、驅(qū)動類型、采出方式、油氣品種、井型、油藏類型、油氣單元、組織機構(gòu)等維度與油氣生產(chǎn)事實表。這里對每個維度都進行相應(yīng)的定義,如時間維度,如果原數(shù)據(jù)是一個日期字段,要進行拆分,最小粒度為天,將時間拆分為年、季度、月、日。而其他維度按照上述規(guī)則,進行度量統(tǒng)一、空值處理、類型轉(zhuǎn)換等操作。經(jīng)過作業(yè)流程和轉(zhuǎn)換流程的協(xié)同工作,最后形成星型模型。

2.3 多維分析技術(shù)

數(shù)據(jù)預(yù)聚合主要是對Hive數(shù)據(jù)倉庫中的油氣生產(chǎn)數(shù)據(jù)進行數(shù)據(jù)預(yù)聚合處理操作,以滿足 OLAP查詢請求中較高響應(yīng)速度的要求。該模塊在Kylin引擎的基礎(chǔ)上進行二次開發(fā)實現(xiàn),通過Kylin對外提供的接口來使用其內(nèi)部功能,并在原有功能的基礎(chǔ)上進行系統(tǒng)功能擴展,以滿足對自動化運行、管理、監(jiān)控和報警等方面的需求。

多維立方體作為OLAP數(shù)據(jù)分析的重要對象,它是邏輯上的一種數(shù)據(jù)組織形式,本文采用四元組(D,M,A,F(xiàn))來對一個多維立方體進行定義。四元組中的不同元素從不同角度對該立方體的特征進行描述,其定義如下:

約束條件:①D∩M=?,表示維度集和測度集不會有交集;②?i,j且表示任意兩個維度的屬性集不會相交。

采出井生產(chǎn)數(shù)據(jù)多維立方體(Cube)的數(shù)據(jù)分析模型可定義為(Di,Mi,Ai,fi),其中維度集D包括日期、井別、驅(qū)動類型、采出方式、油氣品種、井型、油藏類型、油氣單元、組織機構(gòu)9個維度;測度集M包括井口產(chǎn)液量、井口產(chǎn)油量、井口產(chǎn)水量等生產(chǎn)動態(tài)數(shù)據(jù);屬性集A包括年、季度、月、旬、日、采油井、采氣井、一次采油、注水驅(qū)、化學(xué)驅(qū)、稠油熱采、自噴、抽油機、電泵、螺桿泵、射流泵、氣舉等屬性;f表示維度的層次。

Kylin的數(shù)據(jù)來源是 Hive數(shù)據(jù)倉庫,當(dāng)生產(chǎn)數(shù)據(jù)導(dǎo)入到Hive后,同時需要在Kylin中建立一個數(shù)據(jù)模型,并且與數(shù)據(jù)倉庫中的數(shù)據(jù)模型一致。模型中包括了一個事實表和任意多個維度表,以及事實表和維度表的關(guān)聯(lián)關(guān)系。

當(dāng)模型設(shè)置完成后,開始構(gòu)建 Cube引擎,讀取Hive中的數(shù)據(jù),插入到一個臨時的扁平表中。大量的油氣生產(chǎn)數(shù)據(jù)全部存儲在Hive中,為了更好地管理數(shù)據(jù),提高數(shù)據(jù)的查詢效率,Hive采用分區(qū)的方式,將數(shù)據(jù)按照時間存放。Kylin框架進行Cube計算的時候,也是根據(jù)時間安排進行運算,Cube的分區(qū)列和 Hive表的分區(qū)列相同,都是時間列。這樣,Hive可以跟著分區(qū)迅速找到需要進行計算的數(shù)據(jù),而不需要掃描所有的數(shù)據(jù)。

MapReduce的計算完成后,數(shù)據(jù)直接加載到HBase中。數(shù)據(jù)是以鍵值對結(jié)構(gòu)存儲在HBase中,在查詢的時候可以直接從HBase中讀取數(shù)據(jù)。

2.4 可視化技術(shù)

可視化是在數(shù)據(jù)分析中直觀展示數(shù)據(jù)關(guān)系的重要方式。本文采用 ASP.NET、Echarts3.0、WebGIS等可視化接口技術(shù)將分析結(jié)果展示給用戶,最終實現(xiàn)油、氣、水井生產(chǎn)大數(shù)據(jù)分析,滿足實時掌握油氣生產(chǎn)動態(tài)的需求。

3 應(yīng)用效果

本文利用Hadoop分布式存儲與并行計算技術(shù)、數(shù)據(jù)倉庫建模技術(shù)、Kylin多維分析引擎,基于油、氣、水井全樣本分析,實現(xiàn)油區(qū)生產(chǎn)運行跟蹤、重點油田生產(chǎn)預(yù)警、低產(chǎn)井和長停井現(xiàn)狀分析、分類油藏開發(fā)規(guī)律等應(yīng)用。在集團公司層級,油氣生產(chǎn)模式分析基本單元由原來的油田細化為單井,生產(chǎn)管理更為細致(見表4)。

表4 分析方式及效果對比表

與傳統(tǒng)手工分析方式相比:①免去了人工數(shù)據(jù)準(zhǔn)備的工作步驟;②將常用分析方法形成模板,實現(xiàn)了統(tǒng)一的多維分析圖表,大幅提升工作效率。以低產(chǎn)井生產(chǎn)分析為例,應(yīng)用分析時間由原來的1 d下降到現(xiàn)在的5 s。分析人員只需登錄一套系統(tǒng),即可實現(xiàn)低產(chǎn)井生產(chǎn)數(shù)據(jù)多維分析工作,快速掌握多維度的低產(chǎn)井生產(chǎn)狀況。分析結(jié)果可以按照集團公司、油田公司、油氣田、區(qū)塊、單井逐級向下追溯,分析結(jié)果更加全面和準(zhǔn)確,可滿足實時掌握油氣生產(chǎn)動態(tài)的需求。

3.1 油區(qū)生產(chǎn)運行跟蹤

實時跟蹤油區(qū)的總體生產(chǎn)運行情況,預(yù)判生產(chǎn)趨勢并提前發(fā)現(xiàn)生產(chǎn)異常(見圖5)。分析日產(chǎn)油、新井日產(chǎn)油、措施日增油、月平均含水、日注水、綜合遞減、自然遞減等指標(biāo),預(yù)判生產(chǎn)趨勢,及時發(fā)現(xiàn)生產(chǎn)異常,并逐級向油田、區(qū)塊、生產(chǎn)井進行追溯,快速、精準(zhǔn)定位目標(biāo)區(qū)塊,分析偏離生產(chǎn)計劃的原因,提出開發(fā)調(diào)整對策。

圖5 油區(qū)生產(chǎn)運行跟蹤分析圖

3.2 重點油田生產(chǎn)預(yù)警

建立定量化預(yù)警機制,實現(xiàn)一個人即可監(jiān)控全部油田的生產(chǎn)動態(tài)。主要對日產(chǎn)油、含水上升速度、開井率等主要開發(fā)指標(biāo)進行月度對比分析(見表5)。同時建立定量化油田開發(fā)動態(tài)預(yù)警監(jiān)控機制,通過收集油田生產(chǎn)動態(tài)信息,跟蹤指標(biāo)變動趨勢,評價油田開發(fā)風(fēng)險動態(tài),向決策層發(fā)出預(yù)警信號,提前采取預(yù)控對策。系統(tǒng)監(jiān)控對象已覆蓋集團公司全部油田,實現(xiàn)全方位、多角度開發(fā)監(jiān)控,全程跟蹤各油田生產(chǎn)形勢,對生產(chǎn)指標(biāo)異常的油田或區(qū)塊及時監(jiān)控預(yù)警,提出整改建議,及時指導(dǎo)生產(chǎn)。

表5 油田生產(chǎn)動態(tài)預(yù)警表

3.3 低產(chǎn)、長停井現(xiàn)狀

分析低產(chǎn)井、長停井現(xiàn)狀和治理效果,共享治理經(jīng)驗,利用大數(shù)據(jù)技術(shù)篩選出潛力井。目前大部分油田開發(fā)進入中后期,低產(chǎn)井、長停井?dāng)?shù)呈逐年上升的趨勢。采用該系統(tǒng)可實現(xiàn)低產(chǎn)井生產(chǎn)現(xiàn)狀、歷史變化趨勢及長停井關(guān)停原因等分析(見圖6—圖8),并可利用大數(shù)據(jù)技術(shù)篩選出治理效果顯著的潛力井,為集團公司低產(chǎn)和長停井治理、盤活油井資產(chǎn)利用率等提供借鑒。

圖6 不同開發(fā)方式低產(chǎn)井多維分析圖

圖7 不同舉升方式低產(chǎn)井多維分析圖

圖8 不同井型低產(chǎn)井多維分析圖

3.4 分類油藏開發(fā)規(guī)律

在集團公司內(nèi)實現(xiàn)不同油區(qū)、相同類型油藏開發(fā)指標(biāo)類比,對標(biāo)高效開發(fā)方式,充分挖掘油藏資源潛力。實時跟蹤中高滲透砂巖、低滲透砂巖、礫巖、稠油、特殊巖性油藏等的油、氣、水井生產(chǎn)情況,從已開發(fā)油藏中篩選出“雙高油藏(綜合含水大于等于80%,可采儲量采出程度大于等于60%的開發(fā)單元)”、“雙低油藏(采油速度小于等于0.5%、地質(zhì)儲量采出程度小于等于10%的開發(fā)單元)”和“雙負油藏(雙高和雙低油藏中利潤與現(xiàn)金流均為負值的開發(fā)單元)”。針對每類油藏,統(tǒng)計分析其開發(fā)方式、分布狀況、生產(chǎn)效果等,總結(jié)經(jīng)驗,支撐分類油藏治理工作(見表6)。

表6 分類油藏開發(fā)規(guī)律分析統(tǒng)計表

大數(shù)據(jù)分析系統(tǒng)實現(xiàn)了 36×104余口油、氣、水井生產(chǎn)數(shù)據(jù)的集中管理,為在集團公司層級實施油、氣、水井全樣本分析提供了技術(shù)支撐,同時也為數(shù)據(jù)挖掘奠定了基礎(chǔ),將來通過整合油氣田開發(fā)、數(shù)據(jù)挖掘和人工智能等技術(shù),定可深入透視分析油氣生產(chǎn)數(shù)據(jù)背后潛在的有用信息,提升數(shù)據(jù)資產(chǎn)的價值,更好地為油氣生產(chǎn)與科研服務(wù)。

4 結(jié)論

采用Hadoop分布式存儲與并行計算技術(shù)、數(shù)據(jù)倉庫建模技術(shù),構(gòu)建Kylin多維分析引擎數(shù)據(jù)管理平臺,實現(xiàn)了分散存儲油氣生產(chǎn)動態(tài)大數(shù)據(jù)的優(yōu)化管理與快速查詢,可集中管理36×104余口油、氣、水井的生產(chǎn)數(shù)據(jù)。

建立了油、氣、水井生產(chǎn)多維分析主題模型,對數(shù)據(jù)進行預(yù)處理,可實現(xiàn)系統(tǒng)的秒級響應(yīng);油區(qū)生產(chǎn)運行跟蹤、重點油田生產(chǎn)預(yù)警、低產(chǎn)井和長停井現(xiàn)狀、分類油藏開發(fā)規(guī)律等分析應(yīng)用等可取代傳統(tǒng)人工收集數(shù)據(jù)、手工分析的方式,工作效率大幅提升;油氣生產(chǎn)模式分析基本單元由原來的油田細化為單井,生產(chǎn)管理更為細致;分析結(jié)果可以按照集團公司、油田分公司、油氣田、區(qū)塊、單井逐級追溯,更加全面和準(zhǔn)確,滿足實時掌握油氣生產(chǎn)動態(tài)的需求。

符號注釋:

A——屬性集;ai——屬性名;D——維度集;di——維度名;F——維度集到屬性集的一對多映射;f——維度層次;i,j——維度序號;M——測度集;mi——測度名;n——子任務(wù)數(shù)量。

猜你喜歡
低產(chǎn)數(shù)據(jù)倉庫水井
山西發(fā)現(xiàn)一口2000余年前的大型木構(gòu)水井
低產(chǎn)棗園如何改造
水井的自述
基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
凡水井處皆聽單田芳
華人時刊(2018年17期)2018-12-07 01:01:52
成齡低產(chǎn)梨園改造豐產(chǎn)栽培技術(shù)
分布式存儲系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計
電子制作(2016年15期)2017-01-15 13:39:15
探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
烏龜與水井
低產(chǎn)“金絲4號”小棗密植園的改造
柳州市| 锦州市| 万载县| 商河县| 南昌县| 宁强县| 南汇区| 金堂县| 尉氏县| 新兴县| 阳曲县| 旺苍县| 通辽市| 舞钢市| 兴山县| 巴东县| 邵阳市| 团风县| 西乌珠穆沁旗| 古田县| 德清县| 临漳县| 黄冈市| 营口市| 礼泉县| 南丰县| 客服| 阳春市| 进贤县| 博湖县| 定远县| 巴中市| 绥化市| 靖西县| 吉木乃县| 诏安县| 蕉岭县| 蓝田县| 韩城市| 广河县| 庄浪县|