劉進博 朱志勇 洪將領 馮學章 楊應強 郭嬌嬌 王迪
1. 中國石油新疆油田公司采氣一廠;2. 中國石油大學(北京)石油工程教育部重點實驗室
隨著氣藏開發(fā)進入中后期,氣藏的氣水關系復雜性加劇、整體產(chǎn)水增加,現(xiàn)場低壓井、產(chǎn)水井井數(shù)增多,氣井生產(chǎn)管理難度增大。為了提高管理效率,現(xiàn)場通常對氣井實施分類管理,將具有相同生產(chǎn)特征的氣井進行歸類和分析,以揭示其共有的生產(chǎn)規(guī)律[1],從而快速分析氣井生產(chǎn)狀況、掌握氣井生產(chǎn)特征,及時制定有針對性的管理方案和治理措施,保障氣井正常生產(chǎn)。
目前,已經(jīng)有相當多的學者開展了氣井分類方面的研究,氣井分類也由靜態(tài)參數(shù)分類、動態(tài)參數(shù)分類,發(fā)展到了動靜參數(shù)結(jié)合的多指標綜合分類[1-8]。但當前的氣井分類仍然存在以下問題:(1)現(xiàn)有方法多是從產(chǎn)能評價角度進行氣井分類,未能夠充分考慮氣井生產(chǎn)狀況,從氣井生產(chǎn)管理角度開展氣井分類;(2)為全面反映氣井特征,在分類分析中納入了氣井的儲層參數(shù)、分析測試數(shù)據(jù),如孔滲情況、無阻流量等來反映氣井的供氣能力,這些數(shù)據(jù)在氣井生產(chǎn)過程中難以實時獲取,時效性差,從而在很大程度上影響分類效果;(3)絕大多數(shù)的分類方法需要基于現(xiàn)場管理認識,給出指定的分類界限,對管理經(jīng)驗要求較高的同時,還具有相當?shù)闹饔^性。因此,有必要建立新的氣井分類方法,從氣井生產(chǎn)管理角度開展氣井分類,同時考慮提升氣井分類工作的時效性、尋求更加便捷可靠的類型劃分方法,從而實現(xiàn)即時高效的氣井類型劃分,完成實時的氣井生產(chǎn)特征評價,為氣井管理策略的制定與實施提供有力支持。
值得注意的是,隨著氣井生產(chǎn)的進行,現(xiàn)場積累了大量的生產(chǎn)資料和管理經(jīng)驗,為開展數(shù)據(jù)分析研究創(chuàng)造了良好的基礎和條件。因此,筆者引入機器學習領域的LDA算法,提出了一種基于數(shù)據(jù)分析的氣井分類方法。該方法給定了考慮氣井管理策略制定的分類評估項目,完成了基于多因素的氣井生產(chǎn)狀態(tài)即時評價,從數(shù)據(jù)分析角度提出了氣井類型的劃分,從而實現(xiàn)了更具針對性、時效性和高效性的氣井分類,能夠為氣井管理策略的制定與實施提供更加準確可靠的指導。
線 性 判 別 分析(Linear Discriminant Analysis,LDA)算法,是模式識別領域的經(jīng)典算法,在1996年由Belhumeur引入模式識別和人工智能領域[9]。最近10年,國內(nèi)學者對LDA算法的研究呈現(xiàn)上升趨勢,LDA模型也被廣泛應用于文本信息檢索、主題發(fā)現(xiàn)和演化、圖像處理、聚類、推薦系統(tǒng)、過濾系統(tǒng)、預測系統(tǒng)、資源標識等諸多領域,并且取得了較為豐富的研究成果[10]。
LDA算法是一種有監(jiān)督的機器學習,它的基本思想是將高維的模式樣本投影到具有最佳鑒別能力的低維子空間,使得投影后的組合量在新的子空間實現(xiàn)“類內(nèi)方差最小”、“類間方差最大”,即投影后的同類樣本點之間盡可能地接近,每一類的中心點距離盡可能地大,以達到壓縮特征空間維數(shù)和抽取分離信息的效果[11]。也就是說,LDA算法能夠選擇分類性能最好的投影方向,在實現(xiàn)降維作用的同時,在新的子空間最大程度地區(qū)分不同類別的樣本[9]。因此,LDA算法在處理依賴均值的分類問題時具有更加優(yōu)秀的分析能力,能夠最大程度揭示不同類型樣本之間的區(qū)別,從而實現(xiàn)更加高效和深入的分類信息挖掘。
在當前的氣井分類工作中,同一類型的氣井樣本在給定分類項目下的特征指標量化值分布將具有明顯的聚集特性,表現(xiàn)出典型的依賴均值分類問題的特征。因此,本文引入LDA算法進行氣井的分類研究,基于對多維氣井分類樣本數(shù)據(jù)的分析挖掘,提出不同氣井類型的劃分界限,實現(xiàn)基于生產(chǎn)資料分析的氣井綜合分類。
(1)設數(shù)據(jù)集有M個類別:D1,D2,···,Di。計算每類樣本的類內(nèi)散度矩陣Sw
(2)計算各類樣本之間的類間散度矩陣Sb
(3)計算每個類別LDA轉(zhuǎn)化矩陣WL的矩陣值。提取矩陣值中最大的d個特征值和與其對應的特征向量,得到投影矩陣
(4)每個樣本可通過式(4)轉(zhuǎn)化為新的樣本集,則為降維后的數(shù)據(jù)集
本研究引入LDA算法進行氣井分類研究,建立基于氣井生產(chǎn)資料分析的氣井分類方法,實現(xiàn)氣井的綜合分類,具體的算法步驟如圖1所示。
圖1 氣井分類方法的算法步驟Fig. 1 Algorithm step of gas well classification method
建立的分類特征指標體系如果能夠在考慮多種因素影響的同時,確保各個評價指標能夠被即時獲取,將進一步提升氣井分類結(jié)果的準確性與可靠性,為氣井管理工作提供更加有效的指導。本文通過對大量氣井生產(chǎn)參數(shù)的整理分析,提出了一套基于氣井生產(chǎn)參數(shù)的氣井分類特征指標體系,在刻畫氣井多方面特征的同時,實現(xiàn)各評價指標的即時獲取,保證了氣井評價工作的時效性。
在深入分析現(xiàn)場氣井的生產(chǎn)參數(shù)特征的基礎上,綜合分析氣井分類所考慮的眾多因素,結(jié)合現(xiàn)場氣井管理策略實施所考察的重點,提出從氣井排液和液相產(chǎn)出兩個分類方面對氣井進行考察,選取了排液能力、產(chǎn)液強度兩個分類項目對氣井進行分類評估,并分別為兩個分類項目選取了相對應的分類指標,形成了氣井分類特征指標體系,如圖2所示。
圖2 氣井分類特征指標體系Fig. 2 Characteristic index system of gas well classification
2.2.1 排液能力特征指標
排液能力主要從氣井對產(chǎn)出水的排出能力方面對氣井進行評估分類,即考察當前氣井自身可用于自主或輔助排液能量的大小,具體從壓力保持水平、產(chǎn)氣能力、地層補充三個方面對氣井的排水能力進行衡量,建立的相應指標如下。
(1)評價指標1:剩余壓力。剩余壓力定義為氣井油壓水平與外排壓力的差值,其中油壓水平是指截至目前氣井油壓達到的最低值,體現(xiàn)當前油壓的絕對水平;外排壓力是指在油壓最低值時保證井口產(chǎn)出流體經(jīng)外輸管線排出所需的壓力,即對應井口節(jié)流后的壓力,反映地面設備及管線布局對油壓保持水平的要求。二者的差值表征了氣井壓力保持的相對水平,反映了油壓的可調(diào)整幅度。高剩余壓力表示當前氣井的壓力保持水平較高,氣井油壓具有較大的調(diào)節(jié)余量,在氣井攜液困難時可以通過調(diào)節(jié)油壓釋放產(chǎn)能滿足攜液需求,通過地面控制的調(diào)節(jié)方便地實現(xiàn)連續(xù)生產(chǎn),具有較高的排液能力;低剩余壓力表示氣井的壓力保持水平低,當前氣井不具備通過調(diào)節(jié)油壓增加產(chǎn)量滿足氣井攜液的能力,攜液困難時需實施另外的排液措施,排液能力低。
(2)評價指標2:當前產(chǎn)氣量。當前產(chǎn)氣量定義為當前穩(wěn)定生產(chǎn)階段氣井的平均產(chǎn)氣量,作為攜液的最直接條件,氣井的產(chǎn)氣量不僅表示著氣井的產(chǎn)氣能力,同時也生動反映了氣井的排液潛能。高產(chǎn)氣量條件下,氣井能夠攜帶相當?shù)乃砍掷m(xù)生產(chǎn),或者為排液工藝的實施提供較好的工作條件;低產(chǎn)氣量條件下,氣井攜帶液相能力差,排液措施的實施受限,排液能力低。
(3)評價指標3:關井地層補充氣量。關井地層補充氣量定義為一次關井復壓操作中,開井至油壓降落到關井前水平期間氣井所產(chǎn)出的累積氣量,該指標值的獲取要求存在一段較長時間的關井復壓時期,即應保證關井期間的壓力恢復已經(jīng)趨于平緩。關井地層補充氣量表示在當前生產(chǎn)階段,氣井由于關井操作所獲得的地層能量補充的大小,反映了地層能量恢復對氣井生產(chǎn)以及排液的影響。高的關井地層補充氣量,表示當前地層的條件較好,氣井經(jīng)過一次關井復壓能夠獲得較多的地層能量補充,在氣井出現(xiàn)攜液問題時,具有通過生產(chǎn)制度的調(diào)節(jié)恢復產(chǎn)量到一定水平上且持續(xù)較長時間的條件;低的關井地層補充氣量,表示氣井當前地層條件較差,經(jīng)過一次關井復壓能夠獲得的地層能量補充有限,攜液問題出現(xiàn)后難以通過生產(chǎn)制度的調(diào)節(jié)恢復生產(chǎn),需采取一定的輔助措施排液,排液能力低。
2.2.2 產(chǎn)液強度特征指標
產(chǎn)液強度主要依據(jù)氣井的產(chǎn)水特征進行評估分類,通過考察產(chǎn)水特征反映氣井的排液負荷,體現(xiàn)氣井的排液需求的大小,具體從產(chǎn)水量、產(chǎn)水變化趨勢兩個方面描述氣井的產(chǎn)液強度,建立的相應指標如下。
(1)評價指標1:當前產(chǎn)水量。當前產(chǎn)水量定義為當前穩(wěn)定生產(chǎn)階段氣井的平均產(chǎn)水量,作為當前氣井液量產(chǎn)出的直觀指標,產(chǎn)水量的大小直接反映了氣井排液的需求,一定程度上決定了所采取的排液措施。高產(chǎn)水量時,氣井排液負荷大,需要較大的排液強度才能實現(xiàn)攜液生產(chǎn),產(chǎn)液強度高;低產(chǎn)水量,氣井液相負荷小,僅依靠自身能量或較弱的輔助排液措施就能實現(xiàn)攜液生產(chǎn),產(chǎn)液強度低。
(2)評價指標2:水氣比標準差。水氣比標準差定義為初始水氣比、當前水氣比相對于整個生產(chǎn)過程的平均水氣比的標準差,表示生產(chǎn)過程中水產(chǎn)量的變化程度,反映氣井產(chǎn)水變化趨勢。高水氣比標準差,表示氣井在生產(chǎn)過程中產(chǎn)水不穩(wěn)定,產(chǎn)水上升風險大,氣井排液需求增加,產(chǎn)液強度高;低水氣比標準差,表示氣井截至目前產(chǎn)水穩(wěn)定,產(chǎn)水上升風險低,氣井排液需求穩(wěn)定,產(chǎn)液強度較低。
2.3.1 分析樣本的獲取
當前的氣井分類工作以指導氣井管理方案制定及治理措施優(yōu)選為目標,所以所選的分析樣本應當反映未實施排采措施的氣井的生產(chǎn)狀態(tài)。為了保證所選樣本涵蓋多種的氣井生產(chǎn)類型,同時增加樣本數(shù)量,本文選取未采取排液措施的自主生產(chǎn)井的生產(chǎn)資料,以及排液措施井在措施之前的生產(chǎn)資料構(gòu)建氣井分類的分析樣本集。
本文的分析以步入深度開發(fā)階段的X區(qū)塊的現(xiàn)場生產(chǎn)井數(shù)據(jù)為基礎,基于目標區(qū)塊氣井的生產(chǎn)資料獲得分析樣本。具體方法為,在氣井歷史生產(chǎn)數(shù)據(jù)中,選取氣井生產(chǎn)過程中存在關井復壓操作的生產(chǎn)階段作為一個氣井樣本。通過對現(xiàn)場氣井生產(chǎn)數(shù)據(jù)的處理,最終形成了由116個樣本組成的氣井樣本集。研究過程中,其中96個樣本將被用作分析樣本進行運算處理獲得分類界限,剩余的20個氣井樣本將作為評估樣本,用于分類方法提出之后的性能評估與驗證。
2.3.2 樣本特征提取
依據(jù)建立的氣井分類特征指標體系,對所選取的所有分析樣本進行評估,獲得用于分析計算的樣本特征指標值,部分樣本特征指標值見表1。
表1 部分分析樣本分類特征指標值Table 1 Classification characteristic index value of partial analysis samples
2.3.3 樣本先驗性分類
進行樣本學習之前,需要根據(jù)現(xiàn)場管理經(jīng)驗及認識,對樣本進行先驗性分類,給出分析樣本的分類標簽。由于部分處于氣井生產(chǎn)狀態(tài)轉(zhuǎn)變時期的樣本數(shù)據(jù)的類別屬性難以確定,予以剔除,最終開展了88個分析樣本分類工作。首先通過整體研究分析樣本的排液能力,結(jié)合實際管理需要,將分析樣本分為高排液能力、低排液能力兩類。逐一考察分析樣本所對應的工況,給出分析樣本的排液能力評價結(jié)果,完成對全部分析樣本的分類。依據(jù)分析樣本的3個排液能力特征指標值,將分析樣本繪制到三維坐標系內(nèi),并標記出相應的分類結(jié)果。由圖3可以看出,在建立的3個特征指標下,排液能力不同的分析樣本實現(xiàn)了很好的區(qū)分,這為后續(xù)的LDA降維提供了良好的數(shù)據(jù)基礎,保證了LDA學習的質(zhì)量。
圖3 分析樣本的排液能力分類展示Fig. 3 Classification display of drainage capacity of analysis samples
以相同的方式進行分析樣本產(chǎn)液強度的分類,經(jīng)過對其整體評估,結(jié)合實際管理需要,將分析樣本分為高產(chǎn)液強度、中產(chǎn)液強度、低產(chǎn)液強度三類。依據(jù)分析樣本的產(chǎn)液強度特征指標值,將分析樣本繪制到坐標系內(nèi),并標記出相應的分類結(jié)果。由圖4可以看出,產(chǎn)液強度的兩個指標也很好地實現(xiàn)了產(chǎn)液強度三個分類的區(qū)分,為后續(xù)的產(chǎn)液強度特征指標的降維工作提供了良好的數(shù)據(jù)基礎。
圖4 分析樣本的產(chǎn)液強度分類展示Fig. 4 Classification display of liquid producing intensity of analysis samples
使用LDA算法,對分析樣本數(shù)據(jù)進行降維處理,在保證投影后分類數(shù)據(jù)區(qū)分度最大的條件下,實現(xiàn)分析樣本向新的低維空間的映射,以達到壓縮特征空間維數(shù)和抽取分離信息的效果,從而完成對氣井分類樣本數(shù)據(jù)的分析挖掘,提出不同氣井類型的劃分界限。分別從排液能力、產(chǎn)液強度兩個分類方面對樣本數(shù)據(jù)進行降維,由于原始樣本數(shù)據(jù)的分類指標具有不同的量綱和量級,為進行不同數(shù)據(jù)的綜合對比,需要首先對分析數(shù)據(jù)進行歸一化處理,采用的歸一化方法為
式中,a為 指標歸一化之后的值,ao為相應指標的原始值,amin、amax分別為該指標在所有分析樣本中的最小、最大值。
經(jīng)降維處理后,得到了分析樣本在排液能力、產(chǎn)液強度兩個分類方面的低維度組合指標值,獲得了分析樣本在新的子空間分布(見圖5、圖6)。
圖5 排液能力低維指標值Fig. 5 Low-dimensional index value of drainage capacity
圖6 產(chǎn)液強度低維指標值Fig. 6 Low-dimensional index value of liquid producing intensity
降維過程中,通過對各自樣本分類數(shù)據(jù)的學習,得到排液能力、產(chǎn)液強度兩類特征指標對應的降維投影向量分別為(0.2766,0.9403,0.1981)T、(?0.9243、?0.3818)T。
在氣井管理對策制定過程中,需兼顧氣井的產(chǎn)液與排液特征實施氣井管理策略的優(yōu)選,本文綜合排液能力、產(chǎn)液強度兩方面的評估分類將氣井劃分為6個類型:高能力低強度類、高能力中強度類、高能力高強度類、低能力低強度類、低能力中強度類、低能力高強度類。將前述的分析樣本在兩個分類方面的降維結(jié)果繪制在同一坐標系內(nèi)進行同步展示,得到不同類型的分析樣本分布,如圖7所示。
圖7 不同氣井類型的分析樣本分布Fig. 7 Distribution of analysis samples of different gas well types
由不同類型分析樣本的分布可以看出,在兩個降維子空間組成的二維分類平面內(nèi),各個氣井分類的分析樣本之間區(qū)分明顯,具有較為清晰的類別界限,為進一步分析刻畫不同類型分析樣本的分布特征,提出氣井分類的界限提供了保證。
分別考察氣井樣本在兩個分類方面的特征,不同類型的分析樣本在降維子空間中的分布具有聚集特性,各個分類的樣本均值能夠很好地反映類型特征,所以提出以樣本均值刻畫不同的氣井類型。首先在兩個分類方面的任一方面下,基于分析樣本在該方面的組合指標值,求取各個子分類下所有樣本的指標均值,作為該子分類在降維投影空間內(nèi)的類別中心;然后以類別中心的分布為基準開展不同分類類型的劃分,提出在某一分類方面下,以相鄰類別中心的中點位置作為不同類型的分類界限;最后,將兩個分類方面的類別中心,以及對應的中點位置繪制在同一二維坐標內(nèi),并對相應元素進行組合擴展,獲得了兼顧排液能力、產(chǎn)液強度兩個分類方面的組合類別中心及對應的分類界限,形成了氣井綜合分類圖版,如圖8所示。
圖8 氣井綜合分類圖版Fig. 8 Composite classification chart of gas well
在進行氣井新樣本綜合分類時,以新樣本到各個組合類別中心的距離作為確定其類別屬性的標準,即將新樣本歸類為距離其最近的類別中心所代表的氣井類型。具體過程為:首先基于分類特征指標體系對新樣本進行評價,獲得新樣本在兩個分類方面的原始評價指標值;然后以數(shù)據(jù)分析獲得的、兩個分類方面各自的降維投影向量對相應的指標進行運算處理,實現(xiàn)原始評價指標的降維從而得到組合指標值;最后依據(jù)獲得的組合指標值考察新樣本到各個類別中心的距離,完成新樣本的分類。當做出氣井綜合分類圖版時,也可以依據(jù)獲得的組合指標值將新樣本繪制在綜合分類圖版中,直接觀察新樣本在圖版中的所處區(qū)域,實現(xiàn)氣井分類。
對預留的20個評估樣本實施分類,將分類結(jié)果與現(xiàn)場認識進行對比,以考察分類模型的準確性?;诜诸愄卣髦笜梭w系對20個評估樣本進行評價,獲得評估樣本的原始評價指標值即分類特征指標值,如表2所示。
表2 評估樣本分類特征指標值Table 2 Classification characteristic index value of evaluation samples
分別使用排液能力、產(chǎn)液強度兩個分類方面的降維投影向量(0.2766,0.9403,0.1981)T和(?0.9243、?0.3818)T對評估樣本的相應指標值進行處理,得到評估樣本在兩個分類方面降維后的組合評價指標值,如表3所示。根據(jù)獲得的兩個分類方面的組合指標值,將評估樣本繪制在氣井綜合分類圖版中,完成所有評估樣本的分類,如圖9所示。
圖9 評估樣本分類結(jié)果Fig. 9 Classification result of evaluation samples
表3 評估樣本降維后組合指標值Table 3 Combined index value of evaluation samples after dimension reduction
調(diào)查20個評估樣本所對應的實際生產(chǎn)狀況,從排液能力和產(chǎn)液強度兩個方面對所有評估樣本進行專家評估,與上述分類結(jié)果進行比對,評價氣井分類方法的性能。
經(jīng)過分析對比可以得出,本文建立的氣井分類方法給出的氣井分類結(jié)果合理可靠,與現(xiàn)場認識一致。而且,該方法在給出分類結(jié)果的同時,實現(xiàn)了氣井生產(chǎn)狀況的定量評價,并進行了可視化展示,從而在完成氣井分類工作的同時,進一步加深了對氣井生產(chǎn)狀況的認識,能夠更加便捷精確地指導現(xiàn)場氣井管理策略的制定與實施。
(1)建立的氣井分類方法以氣井的生產(chǎn)狀況評價及管理策略制定為出發(fā)點,提出排液能力、產(chǎn)液強度兩個分類評估項目,實現(xiàn)了分類工作對氣井管理策略的考慮;以易獲取的生產(chǎn)數(shù)據(jù)為基礎提出各個分類項目的特征評價指標,建立氣井特征評價體系,完成了考慮多因素的氣井生產(chǎn)狀態(tài)即時評價;通過對不同類型氣井分析樣本數(shù)據(jù)的分析挖掘,從數(shù)據(jù)分析角度給出了氣井類型劃分界限,實現(xiàn)了基于生產(chǎn)資料分析的氣井綜合分類。這一方法,為氣井分類提供了一種新思路,對氣井的分類研究工作具有一定的指導意義。
(2)基于LDA算法進行了氣井分類樣本的分析和挖掘,分別對兩個分類方面的特征指標進行了降維處理,獲得了分析樣本在新的低維子空間分布,為氣井類型劃分界限的提出提供了基礎。該算法在處理依賴均值的分類問題時具有優(yōu)秀的分析能力,能夠最大程度揭示不同類型樣本之間的區(qū)別,從而實現(xiàn)更加高效和深入的分類信息挖掘,具有一定的借鑒意義。
(3)建立的氣井分類方法在給出合理可靠的氣井分類結(jié)果的同時,實現(xiàn)了氣井生產(chǎn)狀況的定量評價,并進行了可視化展示,從而進一步加深了對氣井生產(chǎn)狀況的認識,能夠為現(xiàn)場氣井管理策略的制定與實施提供更加便捷精確的指導。