高書香
(承德石油高等??茖W(xué)校 石油工程系,河北 承德 067000)
隨著油氣田工程中斜井?dāng)?shù)量的增加,將產(chǎn)生超大量油井方面的工程數(shù)據(jù),對(duì)這些數(shù)據(jù)的研究和處理,將影響工程決策和實(shí)施過(guò)程[1]。而處理這些數(shù)據(jù)時(shí)行之有效的方法就是進(jìn)行數(shù)據(jù)挖掘;它能夠從超大量、有噪聲、模糊的、隨機(jī)的、不完整的實(shí)際生產(chǎn)數(shù)據(jù)中發(fā)現(xiàn)隱含的、事先未知的、卻是潛在有用的知識(shí)和信息。數(shù)據(jù)挖掘是數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)的一個(gè)主要步驟;知識(shí)發(fā)現(xiàn)可以分為5部分,即數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘、結(jié)論及驗(yàn)證[2]。
油田的生產(chǎn)運(yùn)營(yíng)應(yīng)該是以最大經(jīng)濟(jì)效益為目標(biāo),而不是以油井的系統(tǒng)效率、采油量、作業(yè)費(fèi)用等指標(biāo)的最大值為目標(biāo)。在有桿泵系統(tǒng)的生產(chǎn)管理中,確定各種管理措施的優(yōu)選方法也應(yīng)該以經(jīng)濟(jì)效益為指標(biāo)。因此通過(guò)數(shù)據(jù)挖掘來(lái)回答諸如“哪個(gè)管理方案是最優(yōu)的”等類似問(wèn)題,這是傳統(tǒng)評(píng)價(jià)方法無(wú)法具備的。在數(shù)據(jù)挖掘設(shè)計(jì)中,建議選擇單井生產(chǎn)成本作為目標(biāo)值或是響應(yīng)值。
影響單井生產(chǎn)成本的因素很多,在工藝分析的基礎(chǔ)上認(rèn)為,作業(yè)費(fèi)用、設(shè)備費(fèi)用、單井油氣產(chǎn)量等是主要影響因素。但是,作為一個(gè)生產(chǎn)系統(tǒng),油井的上述3 個(gè)主要因素分別受到地層參數(shù)、設(shè)備參數(shù)、流體參數(shù)、生產(chǎn)參數(shù)等眾多因素的影響。為了能充分進(jìn)行數(shù)據(jù)挖掘,必須首先保證數(shù)據(jù)的全面性。針對(duì)生產(chǎn)過(guò)程的每個(gè)環(huán)節(jié),設(shè)計(jì)各數(shù)據(jù)庫(kù)的字段時(shí),應(yīng)該保證數(shù)據(jù)之間的完整性,不能因?yàn)橛绊懸蜃有。鴮⒃摂?shù)據(jù)丟棄[3]。
簡(jiǎn)單說(shuō),有桿泵生產(chǎn)系統(tǒng)中的所有數(shù)據(jù)都可能會(huì)影響其生產(chǎn)成本。例如,導(dǎo)致桿管偏磨的因素很多[4],那么因桿管偏磨導(dǎo)致單井生產(chǎn)成本增加的因素就有很多。為了便于對(duì)超大量的數(shù)據(jù)進(jìn)行采集與歸類,借鑒文獻(xiàn)[4]的分類方法,將主要數(shù)據(jù)分成油層基礎(chǔ)數(shù)據(jù)、井眼軌跡數(shù)據(jù)、井下流體數(shù)據(jù)、井下工具數(shù)據(jù)、井下作業(yè)數(shù)據(jù)、地面設(shè)備數(shù)據(jù)、日常生產(chǎn)數(shù)據(jù)等7 大類數(shù)據(jù);每一大類數(shù)據(jù)又可以細(xì)分成多種數(shù)據(jù);具體分類見(jiàn)表1。
表1 有桿泵系統(tǒng)數(shù)據(jù)分類表
對(duì)固定的油井而言,油層基礎(chǔ)數(shù)據(jù)是定值,不必采集。但對(duì)數(shù)據(jù)挖掘技術(shù)而言,數(shù)據(jù)信息量越大,則其獲取知識(shí)的準(zhǔn)確度越高。另外,將油層基礎(chǔ)數(shù)據(jù)納入到超大量的數(shù)據(jù)信息中,既可以實(shí)現(xiàn)同一油藏的不同油井?dāng)?shù)據(jù)的共用,還可實(shí)現(xiàn)不同油田之間的油井?dāng)?shù)據(jù)共用。因此,有必要將油層基礎(chǔ)數(shù)據(jù)納入到數(shù)據(jù)庫(kù)系統(tǒng)中。
在數(shù)據(jù)庫(kù)設(shè)計(jì)中易出現(xiàn)空白數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)、重復(fù)數(shù)據(jù)等不規(guī)范現(xiàn)象和問(wèn)題,需要經(jīng)過(guò)統(tǒng)一的過(guò)濾和修正。因此數(shù)據(jù)預(yù)處理的主要目的是清洗錯(cuò)誤的、有沖突的、重復(fù)的數(shù)據(jù),避免數(shù)據(jù)的冗余或不統(tǒng)一,以利于數(shù)據(jù)搜索。
數(shù)據(jù)選擇是為了目標(biāo)而搜索和選擇相關(guān)數(shù)據(jù),其目的是辨別出待分析數(shù)據(jù)的集合,縮小處理范圍,提高數(shù)據(jù)挖掘質(zhì)量。例如,生產(chǎn)層巖性的數(shù)據(jù)值可按巖石深度分別賦予不同深度上的對(duì)應(yīng)值;桿柱材質(zhì)的數(shù)據(jù)值可按材質(zhì)類型分別賦予不同的數(shù)值;等等。
為了確保數(shù)據(jù)挖掘系統(tǒng)在信息和文字識(shí)別中能夠正確地分析和錄入數(shù)據(jù),應(yīng)必須找出數(shù)據(jù)庫(kù)中的空白數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)、重復(fù)數(shù)據(jù)等以便修改和完善。另外還要找出所有不完整的數(shù)據(jù),例如高含蠟量的油井?dāng)?shù)據(jù)中有清防蠟時(shí)間,但卻沒(méi)有加藥量和藥劑類型;措施后的油井?dāng)?shù)據(jù)中有措施名稱和新?lián)Q管柱數(shù)據(jù),但卻沒(méi)有措施后地面設(shè)備數(shù)據(jù)。上述情況下都會(huì)導(dǎo)致系統(tǒng)信息的不確定性,降低數(shù)據(jù)挖掘結(jié)果的可靠性。因此必須加以過(guò)濾或修改。
不同油田、不同油井、不同時(shí)間內(nèi)記錄的數(shù)據(jù)很可能存在單位上的不同;即使使用的是同一單位,其計(jì)量標(biāo)準(zhǔn)可能也會(huì)不同。例如,油井的油套壓數(shù)據(jù)在記錄時(shí),有的是用MPa 作單位,有的卻是用atm 作單位;油井的動(dòng)液面數(shù)據(jù)有的是以方補(bǔ)心為標(biāo)準(zhǔn)計(jì)量,有的數(shù)據(jù)卻是以井口位置為標(biāo)準(zhǔn)計(jì)量;等等。為使數(shù)據(jù)能夠進(jìn)行縱向、橫向的比較,需要把計(jì)量標(biāo)準(zhǔn)、數(shù)據(jù)單位等進(jìn)行全面統(tǒng)一。將統(tǒng)一后的結(jié)果進(jìn)行整理,以便查閱和使用。
石油生產(chǎn)中有很多一事多名的現(xiàn)象。例如,油層套管和生產(chǎn)套管在很多情況下混用;油層壓力、地層壓力、油藏壓力在很多表述中是同一個(gè)壓力;流壓、井底流動(dòng)壓力、流動(dòng)壓力在很多情況下是同一處的壓力,有時(shí)卻是折算出的不同點(diǎn)的壓力;等等。在數(shù)據(jù)庫(kù)的建立過(guò)程中,會(huì)出現(xiàn)大量的類似數(shù)據(jù),需要設(shè)定統(tǒng)一的使用規(guī)范和名稱,以保證數(shù)據(jù)的完整有效。需要將統(tǒng)一后的結(jié)果進(jìn)行整理和文檔化,以便查閱和使用。
在石油生產(chǎn)中,即便是同一家廠商的產(chǎn)品,在不同時(shí)間、不同生產(chǎn)單位的支出也是不同的。為了獲得較為客觀的數(shù)據(jù)挖掘結(jié)果,對(duì)所有產(chǎn)品、設(shè)備及作業(yè)費(fèi)用等設(shè)定一個(gè)具體數(shù)據(jù);而這些數(shù)據(jù)也是數(shù)據(jù)庫(kù)中的一部分。這樣既避免了因設(shè)備費(fèi)用差別而引起的方案優(yōu)選問(wèn)題,還可以利用數(shù)據(jù)挖掘獲得企業(yè)在不同設(shè)備上的支出費(fèi)用分析。
通過(guò)數(shù)據(jù)的預(yù)處理過(guò)程,數(shù)據(jù)庫(kù)中的數(shù)據(jù)成為統(tǒng)一標(biāo)準(zhǔn)的、無(wú)噪聲的數(shù)據(jù)。此后即可采用數(shù)據(jù)挖掘系統(tǒng)中的挖掘算法對(duì)相關(guān)問(wèn)題進(jìn)行知識(shí)和信息發(fā)掘。
[1]王學(xué)軍,田乃林,高書香.斜井抽油相關(guān)數(shù)據(jù)的處理方法[J].油氣田地面工程,2011(6):3 -4.
[2]唐笑林.數(shù)據(jù)挖掘技術(shù)的研究與應(yīng)用[J].華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(4):290 -295.
[3]王學(xué)軍,田乃林.斜井有桿泵抽油參數(shù)系統(tǒng)中的數(shù)據(jù)庫(kù)設(shè)計(jì)[J].油氣田地面工程,2011(3):81 -82.
[4]高書香,王學(xué)軍.抽油機(jī)井桿管偏磨因素分析[J].油氣田地面工程,2010(10):52 -53.
承德石油高等專科學(xué)校學(xué)報(bào)2012年4期