韓 宇,李俊峰,韓佳晟,劉志慶
(1東北石油大學(xué)現(xiàn)代教育技術(shù)中心 黑龍江 大慶 163318)
(2大慶采油一廠工程技術(shù)大隊(duì) 黑龍江 大慶 163318)
(3大慶采油一廠四礦 黑龍江 大慶 163318)
數(shù)據(jù)挖掘技術(shù)在石油工程的應(yīng)用
韓 宇1,李俊峰2,韓佳晟3,劉志慶2
(1東北石油大學(xué)現(xiàn)代教育技術(shù)中心 黑龍江 大慶 163318)
(2大慶采油一廠工程技術(shù)大隊(duì) 黑龍江 大慶 163318)
(3大慶采油一廠四礦 黑龍江 大慶 163318)
隨著信息技術(shù)的飛速發(fā)展,計(jì)算機(jī)技術(shù)在全球迅速普及,大數(shù)據(jù)時(shí)代已然來臨,各行業(yè)的信息化系統(tǒng)逐步建立起來,如何從海量數(shù)據(jù)中挖掘出真正有價(jià)值的信息成為數(shù)據(jù)挖掘研究的主要方向。本文謹(jǐn)以油田大數(shù)據(jù)時(shí)代為例,簡(jiǎn)要分析數(shù)據(jù)挖掘技術(shù)在石油工程行業(yè)應(yīng)用現(xiàn)狀,針對(duì)數(shù)據(jù)挖掘技術(shù)在石油工程行業(yè)的應(yīng)用提出幾點(diǎn)建議。
數(shù)據(jù)挖掘;石油工程;應(yīng)用
隨著計(jì)算機(jī)技術(shù)在全球的迅速普及,數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)海洋的變換發(fā)展,各行業(yè)、行業(yè)間的信息量、數(shù)據(jù)量正在迅速增長(zhǎng)和膨脹。在鋪天蓋地的數(shù)據(jù)狂潮中,如何通過不同方法從不同數(shù)據(jù)資料中分析尋找到有意義的信息,是需要數(shù)據(jù)挖掘來完成的重要任務(wù)。
1980年,人們發(fā)現(xiàn)大數(shù)據(jù)這一名詞,2009年,世界各國(guó)信息技術(shù)行業(yè)開始重視數(shù)據(jù)的分析和利用,2012年,美國(guó)政府投資2億美金推動(dòng)大數(shù)據(jù)發(fā)展,大數(shù)據(jù)發(fā)展迅速升級(jí)為國(guó)家戰(zhàn)略。很多著名的石油工程公司開始分析利用大數(shù)據(jù),寄希望于海量、高增長(zhǎng)率、多樣化的信息資產(chǎn)中可挖掘、待挖掘的信息,希望能夠在大數(shù)據(jù)時(shí)代中占據(jù)鰲頭,為企業(yè)運(yùn)行帶來更多的經(jīng)濟(jì)收益。在數(shù)據(jù)管理方面,國(guó)際石油公司中的油田數(shù)據(jù)管理已經(jīng)不再是傳統(tǒng)的數(shù)據(jù)庫管理模式,而是將自動(dòng)詞盤庫和磁盤陣列兩相結(jié)合的一種超大規(guī)模計(jì)算機(jī)存儲(chǔ)管理[1]。我國(guó)不斷提高的石油勘探技術(shù),使得石油工程行業(yè)內(nèi),可供分析的數(shù)據(jù)一直呈現(xiàn)出上漲的趨勢(shì),智能油網(wǎng)和互聯(lián)網(wǎng)之間聯(lián)系日益密切,大數(shù)據(jù)時(shí)代已然來臨,使用數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)分析對(duì)提高油田產(chǎn)量具有非凡的意義。
數(shù)據(jù)挖掘就是按企業(yè)既定業(yè)務(wù)目標(biāo),對(duì)大量的企業(yè)數(shù)據(jù)進(jìn)行分析,提取出隱藏的、未知的、潛在有用的信息和知識(shí),且進(jìn)一步將其模型化的過程。在實(shí)際工作中,數(shù)據(jù)挖掘任務(wù)通常被分為兩種:一種是描述,另一種是預(yù)測(cè)。描述性任務(wù)指的是以簡(jiǎn)潔概要的方式描述數(shù)據(jù),而預(yù)測(cè)性任務(wù)就是以當(dāng)前已有的數(shù)據(jù)集為基礎(chǔ),使用特定方法對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行分析,獲得一個(gè)或一組數(shù)據(jù)模型,并將該模型用于預(yù)測(cè)未來新數(shù)據(jù)相關(guān)性質(zhì)和發(fā)展趨勢(shì)。
在石油工程行業(yè)內(nèi),需要使用數(shù)據(jù)挖掘技術(shù),對(duì)現(xiàn)有大量油田生產(chǎn)實(shí)際數(shù)據(jù)進(jìn)行分析,生成數(shù)據(jù)模型;在進(jìn)行預(yù)測(cè)的過程中,用戶可以根據(jù)油田產(chǎn)量及發(fā)展趨勢(shì)選擇最適合的模型,用模型預(yù)測(cè)油田產(chǎn)量、指導(dǎo)油田生產(chǎn)。在輸入待分析的最終數(shù)據(jù)集時(shí),還需要輸入相應(yīng)模型生成過程各方面相關(guān)參數(shù)數(shù)據(jù)的最新資料,才能將油田產(chǎn)量作為最主要的變量數(shù)據(jù)進(jìn)行預(yù)測(cè);在分析關(guān)聯(lián)數(shù)據(jù)時(shí),還需要考慮特定的、已知的影響油田產(chǎn)量的因素。
首先選擇31口井,將這些井作為訓(xùn)練數(shù)據(jù),接著再選擇3口新井,用這3口新井的數(shù)據(jù)進(jìn)行結(jié)果驗(yàn)證。初步可以確定影響無阻流量的因素,其中包括:孔隙度、有效厚度、含氣飽和度、液氮量還有凈液量等。等到都確定了之后,運(yùn)用向量機(jī)回歸的辦法建立定量預(yù)測(cè)模型。在模型建立的過程中,對(duì)徑向基核函數(shù)進(jìn)行選擇,通過產(chǎn)生的相關(guān)圖表結(jié)果,對(duì)結(jié)果進(jìn)行研究分析,結(jié)合當(dāng)?shù)貙?shí)際油田的情況,確定向量機(jī)回歸方法存在的意義。
首先可以選擇28口井為訓(xùn)練的數(shù)據(jù),接著再選擇2口井進(jìn)行外表驗(yàn)證。在分析了可能影響堵水后含水量因素后,基本確定以下幾點(diǎn):堵劑用量、堵前累產(chǎn)液量、堵劑類型、工具類型、措施采取前日產(chǎn)液量、措施采取前含水量等。這時(shí)候運(yùn)用支持向量機(jī)回歸法,定性定量的對(duì)預(yù)測(cè)模型進(jìn)行建立,運(yùn)用多項(xiàng)式核函數(shù),保證數(shù)據(jù),發(fā)現(xiàn)2個(gè)數(shù)據(jù)的結(jié)果都比較好[2]。
首先采用26口井為訓(xùn)練數(shù)據(jù),接著再選擇3口井當(dāng)作外表驗(yàn)證數(shù)據(jù)。初步簡(jiǎn)單分析堵水后日產(chǎn)液量可能出現(xiàn)的影響因素的時(shí)候,發(fā)現(xiàn)影響因素主要有:堵水地質(zhì)類型、堵前累產(chǎn)液量、堵前累產(chǎn)液量、措施前日產(chǎn)液量、措施采取前的含水量等[3]。通過應(yīng)用支持向量機(jī)回歸法,對(duì)實(shí)驗(yàn)過程中可能出現(xiàn)的誤差數(shù)據(jù)進(jìn)行嚴(yán)格控制,得到比較好的結(jié)果。
在對(duì)訓(xùn)練產(chǎn)生的數(shù)據(jù)進(jìn)行選擇的時(shí)候,可以首先選擇58口油井接著再選擇3口新井,把得到的數(shù)據(jù)運(yùn)用到外表驗(yàn)證數(shù)據(jù)中,接著分析對(duì)碳酸巖油藏堵水所造成的影響,最后得出的結(jié)論包括堵前累計(jì)油、含水上升特征、堵水特質(zhì)模型和堵劑類型等。接著通過支持對(duì)向量機(jī)進(jìn)行分類的方法,智能優(yōu)化軟件系統(tǒng),規(guī)范創(chuàng)建分類模型,在建立分類模型的過程中,根據(jù)自身需要可以使用徑向基核函數(shù),最后根據(jù)得到的建模結(jié)果圖再對(duì)具體情況進(jìn)行實(shí)際分析。
綜上所述,在數(shù)字化迅速發(fā)展、科學(xué)技術(shù)日益進(jìn)步的當(dāng)今社會(huì),我國(guó)石油工程行業(yè)要想穩(wěn)定發(fā)展,擁有良好可觀的發(fā)展前景,需要掌握、分析和利用好現(xiàn)階段可使用的數(shù)據(jù),這也是提高我國(guó)石油工程行業(yè)競(jìng)爭(zhēng)力的重要手段。通過良好的科學(xué)技術(shù)對(duì)石油工程行業(yè)進(jìn)行改革、優(yōu)化,大力發(fā)展數(shù)據(jù)處理技術(shù),對(duì)數(shù)據(jù)進(jìn)行科學(xué)的分析預(yù)測(cè),解決實(shí)際出現(xiàn)的問題,我國(guó)石油工程行業(yè)必然能夠更快更好地發(fā)展。
[1]檀朝東,張恒汝,馬永忠,楊兵,王輝萍.油氣生產(chǎn)大數(shù)據(jù)挖掘系統(tǒng)的研究及應(yīng)用[J].數(shù)碼設(shè)計(jì),2016,06(01):49-52+5.
[2]張冬梅,周英操,紀(jì)榮藝,趙慶,蔣宏偉,王榮,盧靜.面向鉆井工程技術(shù)的數(shù)據(jù)倉庫應(yīng)用探討[J].信息技術(shù),2012,08(03):6-9.
[3]馬鵬鵬,周英操,蔣宏偉,連志龍,趙慶,趙亦朋.現(xiàn)代信息技術(shù)在石油鉆井中的應(yīng)用研究——關(guān)于鉆井信息工程學(xué)的探討[J].石油天然氣學(xué)報(bào),2014,12(07):89-95+6.
TP311.13 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1009-5624(2018)01-0005-02
韓宇(1973-),女,漢族,黑龍江省大慶市,碩士,高級(jí)工程師,研究方向:數(shù)據(jù)挖掘及云計(jì)算。