国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)分析技術在油田生產中的研究與應用

2015-06-08 11:24:54段澤英蔡賢明滕衛(wèi)衛(wèi)馬鈺河
中國管理信息化 2015年18期
關鍵詞:油井數(shù)據(jù)挖掘油田

段澤英,蔡賢明,滕衛(wèi)衛(wèi),游 莉,馬鈺河

(新疆油田公司采油二廠,新疆 克拉瑪依 834008)

新疆油田公司經過10多年的數(shù)字油田建設,于2008年建成數(shù)字油田,油田中心數(shù)據(jù)庫包括勘探、開發(fā)、儲運、生產輔助、經營管理等業(yè)務領域的各類數(shù)據(jù),涉及油田開發(fā)的數(shù)據(jù)包括單井、區(qū)塊的日月報數(shù)據(jù)、分析化驗數(shù)據(jù)、試井與生產測井數(shù)據(jù)、井下作業(yè)數(shù)據(jù)、井史數(shù)據(jù)以及地理信息數(shù)據(jù)等,種類豐富齊全,質量達到標準要求,為生產數(shù)據(jù)分析應用提供了數(shù)據(jù)資源基礎。2010年,新疆油田啟動智能化油田建設工作,包括油氣生產物聯(lián)網(A11)項目及單井問題診斷和優(yōu)化系統(tǒng)研發(fā)工作,加大了油田自動化數(shù)據(jù)采集的力度及智能化分析應用。通過近幾年的研究與實踐發(fā)現(xiàn),智能油田的全面感知、分析預測、優(yōu)化決策等均與大數(shù)據(jù)分析有關,根據(jù)油田大數(shù)據(jù)分析發(fā)現(xiàn)油水井生產規(guī)律,可以更好地指導油田生產及優(yōu)化決策。

1 油田大數(shù)據(jù)的概念及處理流程

大數(shù)據(jù)首先具有四個主要特點:數(shù)據(jù)量大(Volume)、產生速度快(Velocity)、數(shù)據(jù)類型多(Variety),數(shù)據(jù)的真實性(Veracity),合稱4V或4Vs。大數(shù)據(jù)由巨型數(shù)據(jù)集組成,其數(shù)據(jù)量超出人們采用常規(guī)方法在可接受時間內收集、使用、管理和處理數(shù)據(jù)的能力,但最終體現(xiàn)為價值,實現(xiàn)數(shù)據(jù)→信息→知識→智慧的轉變。在油田生產中大數(shù)據(jù)分析的概念可理解為:在油田生產、管理中產生的具有連續(xù)變化、能夠反映油田客觀規(guī)律的各類數(shù)據(jù),以及對這些數(shù)據(jù)的分析處理。

大數(shù)據(jù)的處理主要包括7個步驟,分別是:數(shù)據(jù)采集和提取集成、數(shù)據(jù)清洗、數(shù)據(jù)分析從而發(fā)現(xiàn)有價值的規(guī)律、建立分析預測模型、結果展示可視化和知識表達、結果驗證,以及對模型的效果評估優(yōu)化,如圖1所示。

圖1 油田生產大數(shù)據(jù)處理流程

結合目前新疆油田生產數(shù)據(jù)建設情況,以及油田生產應用需求,構建新疆油田大數(shù)據(jù)分析平臺及體系架構,如圖2所示,主要包

2 大數(shù)據(jù)分析平臺及體系架構研究

括數(shù)據(jù)抽取、分布式存儲、大數(shù)據(jù)分析及展示應用4層架構。

數(shù)據(jù)抽取層主要是實現(xiàn)分布在各數(shù)據(jù)庫或系統(tǒng)中的數(shù)據(jù)整合,并轉換成適合數(shù)據(jù)挖掘或建模的形式,構建樣本數(shù)據(jù)集;存儲層主要是實現(xiàn)匯總數(shù)據(jù)、模型數(shù)據(jù)、分析數(shù)據(jù)以及元數(shù)據(jù)等各類數(shù)據(jù)的存儲,相當于數(shù)據(jù)倉庫;分析層是基于大數(shù)據(jù)建模算法和工具,挖掘數(shù)據(jù)中隱藏的模式或關系,采用數(shù)據(jù)建模軟件(如SPSS Modeler、Hadoop等)建立分類或預測模型(規(guī)則、公式或方程式),從而生成預測結果,確定評估方法并利用測試樣本,結合專家經驗不斷提升模型精度,輔助油田生產決策;數(shù)據(jù)應用層將建立的數(shù)據(jù)模型封裝成可運行軟件,包括建模算法的實現(xiàn)、數(shù)據(jù)的可視化和界面設計等,最終展示給用戶使用,實現(xiàn)人機交互。

圖2 大數(shù)據(jù)分析平臺體系架構

通過上述研究分析總結出大數(shù)據(jù)分析需要的兩大技術:一是大數(shù)據(jù)抽取及預處理技術,二是大數(shù)據(jù)分析技術。

3 大數(shù)據(jù)分析技術研究

3.1 大數(shù)據(jù)抽取及預處理技術

數(shù)據(jù)抽取就是將多種結構和類型的數(shù)據(jù)抽取轉化為單一的或便于處理的結構類型。不同時間、不同地點、不同名稱的相同數(shù)據(jù)所表達的內涵和算法要求一致,是標準化、規(guī)范化的自然語言集合,便于計算機理解,是數(shù)據(jù)提取的關鍵。

數(shù)據(jù)清洗主要用于確定有用記錄和字段,檢查數(shù)據(jù)是否存在缺失、數(shù)值異常等情況,解決辦法可用剔除法或使用估計值、平均值填補,錯誤數(shù)據(jù)可利用邏輯關系手動替換。

數(shù)據(jù)構建是為了滿足大數(shù)據(jù)建模需求而創(chuàng)建的新字段,以作為特征參數(shù),如平均值。

數(shù)據(jù)變換是把原始數(shù)據(jù)轉換成為適合數(shù)據(jù)挖掘的形式,如歸一化處理(概念、時間、度量、語義)等。

3.2 大數(shù)據(jù)分析技術

大數(shù)據(jù)分析主要包括聚類分析、因子分析、相關分析、回歸分析、A/B測試以及數(shù)據(jù)發(fā)掘等,上述方法在油田常用的有聚類分析、因子分析、回歸分析和數(shù)據(jù)發(fā)掘。

聚類分析是把具有某種相似特征的物體或者事物歸為一類,目的在于辨別在某些特性上相似(但是預先未知)的事物,并按這些特性將樣本劃分成若干類,使在同一類內的事物具有高度同質性,而不同類的事物則有高度異質性。

因子分析是用少數(shù)幾個因子去描述多個指標或因素間的聯(lián)系,即將相互比較密切的幾個變量歸在同一類中,每一類變量就成為一個因子,以較少的幾個因子反映原數(shù)據(jù)的大部分信息。

回歸分析是在一組數(shù)據(jù)的基礎上,研究一個變量與其他變量之間的相關關系,尋找被隨機性掩蓋的變量之間的依存關系。通過回歸分析,可以把變量間復雜的、不確定的關系變得簡單化、有規(guī)律化。

數(shù)據(jù)挖掘是大數(shù)據(jù)時代的關鍵技術,是指從非完整的、海量的、有噪音的、模糊且隨機的數(shù)據(jù)中挖掘隱含在內且人們未提前得知的有用信息的過程。一般來說,數(shù)據(jù)挖掘的功能有兩類:描述和預測。描述性挖掘用于展現(xiàn)集體數(shù)據(jù)的一般特性,而預測性挖掘用于推算處理數(shù)據(jù),完成預測目的。數(shù)據(jù)挖掘功能同目標數(shù)據(jù)的類型有關,有些功能適用于不同類型的數(shù)據(jù),有些功能則只適用于某種特定數(shù)據(jù)。數(shù)據(jù)挖掘功能能夠讓人得知未知信息,提升數(shù)據(jù)價值,從而應用到不同領域。

4 大數(shù)據(jù)分析在油田生產中的應用研究

4.1 異常井自動識別

異常井作為影響產量的主要因素之一,目前被越來越多的油田生產管理人員重視,原來的異常井發(fā)現(xiàn)主要依靠人工發(fā)現(xiàn),需要人工查閱大量的油田生產資料才能最終確定,這種方式存在異常井檢索工作量大、發(fā)現(xiàn)周期長的弱點,影響異常井的及時診斷和措施制訂。采用聚類分析和數(shù)據(jù)發(fā)掘方法對異常井進行自動識別,根據(jù)異常井的定義:油井當天產量較上月產量波動大于正常范圍的井為異常井,排除作業(yè)井、調開井、常關井及停電井等因素影響,并采用ASP.NET技術實現(xiàn)算法的編譯,系統(tǒng)架構B/S模式進行發(fā)布,目前已廣泛應用于油田日常生產,實現(xiàn)了異常井的及時發(fā)現(xiàn),提高了進一步診斷的及時性,提高了員工工作效率,如圖3所示。

圖3 異常井識別及統(tǒng)計界面

4.2 異常井智能診斷

異常井診斷作為油田生產必須的一項日常工作一直困擾著油田生產業(yè)務人員,目前,大部分油田異常井診斷主要依靠人工完成,人工診斷工作量大且受人為經驗的影響,診斷符合率低,可能會導致后續(xù)措施制訂失誤,影響單井生產。因此,采用灰度圖像處理技術和人臉識別算法建立抽油井特征功圖庫,通過油井當前功圖與特征功圖的相似度對比,實現(xiàn)油井工況的自動診斷,由于一種工況可能有多種表現(xiàn)形式,導致功圖解釋存在多種情況,因此,可采用因子分析法,分析每種工況下所關聯(lián)的因子變化情況,建立參數(shù)診斷規(guī)則庫,通過相關因子的指標項對比分析,確診異常原因,如圖4所示,為制訂合理的進一步措施提供充分可靠的依據(jù),從而提高單井的生產時率。

4.3 間抽井開關井計劃制訂

隨著油田開發(fā)進入后期階段,地層能量逐年匱乏,目前越來越多供液不足的井涌現(xiàn)出來,我們將其定義為間抽井(間歇出油的井),目前,新疆油田主要由人工制訂下個月的間抽井開關井計劃,但計劃是否合理還需進一步驗證,因此,如何更好地控制間抽井開關時間,對于開源節(jié)流、節(jié)能減排起著至關重要的作用??刹捎靡蜃臃治龊突貧w分析方法,挖掘影響間抽井開關時間的因素,如動液面、沉沒度、液面上升速度等,建立分析預測模型,對模型曲線進行歸一化處理,從而供業(yè)務人員合理制定間抽井開關制度,達到節(jié)能減排、提質增效的目的。

圖4 異常井智能診斷界面

4.4 油井清防蠟預測

目前油田上對油井清蠟措施的實施都按照人工制訂的計劃執(zhí)行,平均每口井1個月清蠟1次,這導致有些井還未結蠟就提前清、有些井已結蠟還未清等不合理情況時有發(fā)生,不但浪費人力物力,而且影響油井生產。采用因子分析方法通過油井歷次結蠟周期、油井工況、清蠟方式以及用量等參數(shù)建立油井結蠟預測模型,采用回歸分析方法構建預測模型分析曲線,分析曲線上每個清蠟節(jié)點時間,推算出該井的合理清蠟周期,從而指導油井合理有序地清蠟,提高油田精細化管理水平。

5 結 語

通過大數(shù)據(jù)分析能發(fā)現(xiàn)油田生產作業(yè)規(guī)律,可以很好地解決油田生產業(yè)務問題;通過對油田管理數(shù)據(jù)的分析,能夠發(fā)現(xiàn)并解決管理中存在的問題和瓶頸;也可以通過各種相關數(shù)據(jù)的可視化對比分析,發(fā)現(xiàn)過去無法關注的問題,這些是大數(shù)據(jù)分析的核心價值所在,大數(shù)據(jù)應用的最終目標是預測未來,在認識客觀規(guī)律的基礎上進行分析預測,從而指導油田生產。

[1]葛春燕.數(shù)據(jù)挖掘技術在保險公司客戶評估中的應用研究[J].軟件,2013(1):116-118.

[2]楊澤民.數(shù)據(jù)挖掘中關聯(lián)規(guī)則算法的研究[J].軟件,2013(11):71-72.

[3]鐘瑛,張恒山.大數(shù)據(jù)的緣起、沖擊及其應對[J].現(xiàn)代傳播:中國傳媒大學學報,2013(7).

[4]April Reeve.大數(shù)據(jù)管理——數(shù)據(jù)集成的技術、方法與最佳實踐[M].余水清,潘黎萍,譯.北京:機械工業(yè)出版社,2014.

[5]鄔賀銓.大數(shù)據(jù)的機遇與挑戰(zhàn)[J].求是,2013(4).

[6]陳如明.大數(shù)據(jù)時代的挑戰(zhàn)、價值與應對策略[J].移動通信,2012(17).

[7]卓安.基于P2P可伸縮架構的大數(shù)據(jù)分析平臺研究與實現(xiàn)[D].北京:清華大學,2012.

猜你喜歡
油井數(shù)據(jù)挖掘油田
碳中和油田的未來之路
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
我國海上油田新發(fā)現(xiàn)
新型油井水泥消泡劑的研制
一種油井水泥用抗分散絮凝劑
基于并行計算的大數(shù)據(jù)挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
掘金油田環(huán)保
能源(2016年1期)2016-12-01 05:10:06
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
在低滲、低壓油田實施油田整體壓裂的探討
基于GPGPU的離散數(shù)據(jù)挖掘研究
兴安盟| 翁牛特旗| 西贡区| 襄樊市| 仁布县| 顺昌县| 桃园市| 乌什县| 卢湾区| 光山县| 陈巴尔虎旗| 舒兰市| 柳州市| 榆社县| 图片| 文安县| 宜丰县| 自治县| 宁强县| 灵武市| 葵青区| 南康市| 舟山市| 阿巴嘎旗| 基隆市| 桐梓县| 翼城县| 荥经县| 岳池县| 扎鲁特旗| 江永县| 山西省| 玉环县| 河南省| 喀喇| 鄯善县| 晋州市| 农安县| 嘉义县| 蕲春县| 广德县|