国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多粒度時序結(jié)構(gòu)表示的異常檢測算法在儲層含油性檢測中應(yīng)用

2021-09-09 08:09高德群賈文龍
計算機(jī)應(yīng)用 2021年8期
關(guān)鍵詞:含油粒度時序

孟 凡,陳 廣,王 勇,高 陽*,高德群,賈文龍

(1.南京大學(xué)計算機(jī)科學(xué)與技術(shù)系,南京 210023;2.中國石油化工股份有限公司江蘇油田分公司物探技術(shù)研究院,南京 210046;3.南京天技通信技術(shù)實(shí)業(yè)有限公司,南京 210019)

0 引言

石油作為當(dāng)今世界上舉足輕重的戰(zhàn)略物資,與國家的工業(yè)、農(nóng)業(yè)、交通、國防以及每個人的衣食住行息息相關(guān)。然而,近年來江蘇油田面對復(fù)雜嚴(yán)峻的生產(chǎn)經(jīng)營形勢,對巖層含油性勘測工作提出了更高的要求。傳統(tǒng)巖層含油性檢測任務(wù)是一項具有很大挑戰(zhàn)的勘探工作,主要受到以下三個方面制約:

1)領(lǐng)域性強(qiáng)。傳統(tǒng)含油性檢測方法需引入較強(qiáng)的專家先驗(yàn)知識進(jìn)行綜合研判,增加了實(shí)際勘探過程的不可復(fù)制性。即在實(shí)際含油性勘探工作中,通過傳統(tǒng)地球物理方法得到初步結(jié)果后,往往需要再進(jìn)行多輪專家綜合研判,方可進(jìn)行后續(xù)工程實(shí)施計劃的制定。

2)驗(yàn)證成本高。通過鉆井作業(yè)對給定工區(qū)含油性進(jìn)行驗(yàn)證經(jīng)濟(jì)開銷較大,且因誤判造成的損失高昂。在實(shí)際的含油性勘探任務(wù)中,對地下巖層含油儲層的誤判將產(chǎn)生高昂的勘測代價,這也是制約現(xiàn)有勘測工作的重要因素之一。因此以原始地震資料為基礎(chǔ),結(jié)合少量測井標(biāo)記信息對儲層含油性預(yù)測至今仍是油氣勘探開發(fā)與研究的熱點(diǎn)[1]。簡言之,探索一種能夠利用少量現(xiàn)有測井標(biāo)記信息且可降低假陽性和假陰性出現(xiàn)情況的方法將有著十分重要的社會價值和經(jīng)濟(jì)效益。

3)預(yù)測精度不理想。地下巖層存在著復(fù)雜的結(jié)構(gòu)關(guān)系,給傳統(tǒng)含油性勘測方法的預(yù)測精度帶來挑戰(zhàn)。傳統(tǒng)地層含油性勘測方法為利用地震波穿過地層時產(chǎn)生的相關(guān)地震屬性和地質(zhì)鉆井資料結(jié)合傳統(tǒng)地球物理方法進(jìn)行研判。但從實(shí)際檢測效果來看,精度仍有進(jìn)一步提高空間。

本文以實(shí)際含測井標(biāo)記的疊后地震道數(shù)據(jù)為研究對象,通過結(jié)合物探專業(yè)領(lǐng)域知識和機(jī)器學(xué)習(xí)方法,從以下3個方面對含油性檢測任務(wù)開展研究:

1)數(shù)據(jù)驅(qū)動學(xué)習(xí)?;趥鹘y(tǒng)地球物理學(xué)含油性檢測方法中涉及了大量專家領(lǐng)域知識進(jìn)行綜合研判,給實(shí)際勘探工作增加了不可復(fù)制性。因此,所設(shè)計算法需在一定程度上實(shí)現(xiàn)自動化檢測,盡量減少對專家領(lǐng)域知識的依賴性(針對制約1進(jìn)行探索)。

2)監(jiān)督信息少且類別不平衡。由于含油層通常較薄,本身厚度通常僅有1~4 m,受目前地震波采樣設(shè)備頻率限制,已鉆井驗(yàn)證后的地震道樣本與總體待檢測樣本相比極度稀少且類別不平衡。甚至油層在地震道數(shù)據(jù)樣本中往往僅體現(xiàn)為單個獨(dú)立點(diǎn)。因此所設(shè)計算法需針對極少量且類別不平衡的監(jiān)督信息進(jìn)行挖掘和研究,充分利用現(xiàn)有鉆井樣本集中的監(jiān)督信息(針對制約2進(jìn)行探索)。

3)數(shù)據(jù)呈時序性。疊后地震道數(shù)據(jù)是通過地震波為介質(zhì)進(jìn)行采集,由于其物理產(chǎn)生機(jī)制原因,該樣本內(nèi)數(shù)值之間是具有時序特性的地震屬性值。因此所設(shè)計算法需挖掘出其內(nèi)部潛在時序結(jié)構(gòu),并將此結(jié)構(gòu)融入后續(xù)的檢測過程中,進(jìn)而提高檢測精度(針對制約3進(jìn)行探索)。

基于以上3個研究動機(jī),本文從含油性儲層檢測任務(wù)中呈現(xiàn)的實(shí)際問題出發(fā),提出了一種基于多粒度時序結(jié)構(gòu)表示的異常檢測算法,并利用江蘇油田實(shí)際疊后地震資料進(jìn)行仿真實(shí)驗(yàn),本文主要包含以下3項工作:

1)針對地下儲層含油性樣本等監(jiān)督信息稀少且類別不平衡現(xiàn)狀,本文將該檢測問題建模為有監(jiān)督異常檢測任務(wù)。即將含油樣本視為異常樣本進(jìn)行檢測。

2)提出了一種基于多粒度時序結(jié)構(gòu)表示的異常檢測算法。該算法首先針對單地震道數(shù)據(jù)中存在的潛在時序結(jié)構(gòu),提出基于雙向長短期記憶(Bi-directional Long Short-Term Memory,BiLSTM)模型[2]的多粒度特征提取方法,捕捉了地震道內(nèi)不同粒度的時序結(jié)構(gòu);其次,將不同粒度的時序結(jié)構(gòu)及其特征進(jìn)行自動化融合,進(jìn)而形成了對單個地震道數(shù)據(jù)的多粒度時序融合特征;最后,針對該融合后的特征,利用代價敏感損失進(jìn)行含油性異常樣本的預(yù)測。

3)在江蘇油田真實(shí)地震資料上進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果從4個方面驗(yàn)證了本文所提出算法的有效性。

1 相關(guān)工作

近年來,隨著機(jī)器學(xué)習(xí)在視覺和語音數(shù)據(jù)等方面取得了突破性進(jìn)展[3-7],石油勘探領(lǐng)域研究團(tuán)隊逐漸開始研究和探索將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到儲層含油性檢測任務(wù)中。相比于傳統(tǒng)含油性檢測技術(shù),即聯(lián)合幾何地震學(xué)和物理地震學(xué)特征分析方法對地震目標(biāo)進(jìn)行處理、地震屬性提取優(yōu)化與分析,近年來國內(nèi)外研究人員不斷嘗試將機(jī)器學(xué)習(xí)方法和含油性檢測相結(jié)合。該類方法利用有限的已知地質(zhì)測井資料在疊后地震資料上構(gòu)建訓(xùn)練樣本,借助機(jī)器學(xué)習(xí)方法提取其中的潛在特征并建模。其中主要包括兩大類方法:基于淺層學(xué)習(xí)的含油性檢測方法[8-25]和基于深度學(xué)習(xí)的含油性檢測方法[1,26-30]。本文主要聚焦于基于深度學(xué)習(xí)的含油性檢測方法。

基于淺層學(xué)習(xí)方法在儲層含油性檢測場景中進(jìn)行應(yīng)用主要是利用機(jī)器學(xué)習(xí)技術(shù)中經(jīng)典的淺層模型在地震道數(shù)據(jù)中進(jìn)行訓(xùn)練和識別,其中涉及聚類分析[8]、人工神經(jīng)網(wǎng)絡(luò)[9-12,17-21]、模糊理論[13]、決策樹[14]、遺傳算法[15-16]、支持向量機(jī)[22]和概率模型等方法[23-25]。例如劉瑞林等[17]從監(jiān)督學(xué)習(xí)角度,梳理了利用測井密度和自然電位等測井?dāng)?shù)據(jù)作為監(jiān)督信息,用淺層神經(jīng)網(wǎng)路算法對含油性特征進(jìn)行分類等方法。陸文凱等[18]將測井資料作為監(jiān)督學(xué)習(xí)樣本,予以推廣全區(qū),進(jìn)而獲取橫向上的含油性預(yù)測分類結(jié)果。張等[19]結(jié)合自組織神經(jīng)網(wǎng)絡(luò)算法和粒子群算法,獲得地震相的聚類結(jié)果,該方法通過降低原始屬性維度,提高了計算效率。張向君等[20]構(gòu)建了基于結(jié)構(gòu)風(fēng)險最小化的神經(jīng)網(wǎng)絡(luò),對吉林油田的儲層油性特征進(jìn)行了預(yù)測。Mobebbi等[21]直接利用人工神經(jīng)網(wǎng)絡(luò)對測井?dāng)?shù)據(jù)進(jìn)行預(yù)測。張長開等[22]提出了基于支持向量機(jī)的特征選擇方法對地震屬性優(yōu)選并在此基礎(chǔ)上預(yù)測儲層。王波等[23]提出了基于斑塊飽和模型井控屬性融合法進(jìn)行含油性檢測。袁照威等[24]通過分析地震屬性與沉積相的關(guān)系,運(yùn)用馬爾可夫-貝葉斯模擬算法,對多地震屬性進(jìn)行融合,得到多變量融合概率場信息,進(jìn)而建立沉積相模型。宋建國等[25]以多種不同的地震屬性為基礎(chǔ),通過構(gòu)建井旁道地震屬性與特征參數(shù)的回歸森林模型進(jìn)行儲層預(yù)測。

以上基于淺層學(xué)習(xí)的方法在一定程度上緩解了對于專家領(lǐng)域知識的依賴。但由于儲層含油性識別問題實(shí)際需要求解測井?dāng)?shù)據(jù)與實(shí)際地質(zhì)中各組成部分之間的復(fù)雜映射關(guān)系,加之此種映射通常被認(rèn)為是高度非線性問題,因此淺層學(xué)習(xí)模型的復(fù)雜度可能成為潛在制約。而深度方法因其無需建立顯性復(fù)雜函數(shù)即可實(shí)現(xiàn)復(fù)雜非線性映射關(guān)系在近些年被進(jìn)一步探索?;谏疃葘W(xué)習(xí)方法在含油性檢測技術(shù)中進(jìn)行應(yīng)用主要為利用深度卷積網(wǎng)絡(luò)可隱式地構(gòu)建地震屬性與含油性儲層分布的復(fù)雜映射關(guān)系。例如Saikia等[26]對淺層和深度神經(jīng)網(wǎng)絡(luò)提取儲層含油性特征進(jìn)行了綜述。Gholami等[1]以原始地震數(shù)據(jù)為基礎(chǔ)獲得地震屬性進(jìn)行油性儲層預(yù)測。林年添等[27-28]通過引入卷積神經(jīng)網(wǎng)絡(luò),智能提取、分類并識別地震資料中含油性特征,同時利用不同卷積核卷積形成各類縱、橫波地震屬性,進(jìn)而對含油性儲層地震預(yù)測。付超等[29]提出了一種卷積神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)方法相結(jié)合的多波地震油氣儲層分布預(yù)測的深度學(xué)習(xí)方法。安鵬等[30]利用長短期記憶(Long Short-Term Memory,LSTM)模型捕捉測井參數(shù)和泥質(zhì)含量(孔隙度)之間非線性映射關(guān)系進(jìn)行儲層物性參數(shù)預(yù)測。

相對于淺層學(xué)習(xí)方法,雖將深度學(xué)習(xí)直接應(yīng)用于地震資料處理領(lǐng)域取得了一定的成效,但該類方法依然面臨著一些挑戰(zhàn):一方面由于地震道數(shù)據(jù)是地震波從激發(fā)點(diǎn)出發(fā),經(jīng)過地層濾波器返回到接收點(diǎn)的過程記錄,因而其本身存在較為復(fù)雜的時序等結(jié)構(gòu)關(guān)系,若忽略地震道數(shù)據(jù)之間結(jié)構(gòu)關(guān)系而直接將其應(yīng)用在深度網(wǎng)絡(luò)中,可能將會對檢測精度產(chǎn)生負(fù)面影響;另一方面由于井段驗(yàn)證樣本稀少,有油與無油樣本存在類別不平衡現(xiàn)象,為了防止深度模型陷入過學(xué)習(xí)或欠學(xué)習(xí)狀態(tài),現(xiàn)有方法往往過多依賴于人工經(jīng)驗(yàn)對于模型超參數(shù)進(jìn)行調(diào)測,若設(shè)置不當(dāng)會使能實(shí)際檢測性能產(chǎn)生較大波動。

針對以上分析,考慮到地震資料潛在時序結(jié)構(gòu)和類別不平衡特性,本文提出了將儲層含油性檢測問題建模為面向時序數(shù)據(jù)的有監(jiān)督異常檢測任務(wù),將含油性地震道樣本作為異常點(diǎn)進(jìn)行捕獲。同時,考慮到單個地震道數(shù)據(jù)包含振幅采樣點(diǎn)多和分布不均等特點(diǎn),若直接在原始時間序列上進(jìn)行含油性檢測可能無法有效表達(dá)出其特征,進(jìn)而出現(xiàn)判別精度不高現(xiàn)象。因此本文提出了一種基于多粒度時序結(jié)構(gòu)表示的異常檢測方法。

2 問題分析

本章主要介紹含測井標(biāo)記地震道數(shù)據(jù)符號表示以及對于含油性檢測任務(wù)形式化描述。

2.1 含測井標(biāo)記地震道數(shù)據(jù)

含測井標(biāo)記地震道數(shù)據(jù)是指利用原始疊后地震道數(shù)據(jù)對地下巖層進(jìn)行分析后,再通過實(shí)際測井工作對該區(qū)域巖性進(jìn)行實(shí)際驗(yàn)證后,所得到含有巖性標(biāo)記的地震資料。

圖1 原始地震道數(shù)據(jù)片段Fig.1 Fragment of raw seismic trace data

2.2 含油性檢測問題形式化描述

對于給定的未知地震道數(shù)據(jù)含油性檢測問題,本文將其建模為有監(jiān)督異常檢測任務(wù),可進(jìn)一步形式化為:當(dāng)給定一組已知含測井標(biāo)記地震道數(shù)據(jù)D,含油性異常檢測任務(wù)是通過學(xué)習(xí)目標(biāo)函數(shù)(1),對新給定的地震道數(shù)據(jù)Xi進(jìn)行含油性判別,即判別該地震道含油性概率。

3 算法設(shè)計

本文針對原始地震道數(shù)據(jù)中含油性檢測問題,提出了一種基于多粒度時序結(jié)構(gòu)表示的異常檢測算法。該方法主要包括以下兩個部分:1)多粒度時序結(jié)構(gòu)特征抽取模塊;2)基于多粒度時序結(jié)構(gòu)特征融合與判別模塊。

本文算法總體流程如圖2所示:首先,多粒度時序結(jié)構(gòu)提取模塊在疊后地震資料中取出單個地震道數(shù)據(jù),并對該道數(shù)據(jù)進(jìn)行長序列劃分。針對得到的長序列數(shù)據(jù)進(jìn)行趨勢性結(jié)構(gòu)、周期性結(jié)構(gòu)和局部性結(jié)構(gòu)提取并形成多個粒度的獨(dú)立特征。其次,在特征融合與判別模塊將針對多個已取得的獨(dú)立特征進(jìn)行融合,進(jìn)而在融合特征基礎(chǔ)上進(jìn)行異常判別。

圖2 本文算法總體流程Fig.2 Overall flow of the proposed algorithm

3.1 多粒度時序結(jié)構(gòu)特征抽取模塊

原始地震道數(shù)據(jù)是通過地震波進(jìn)行采集的,其內(nèi)部的時序性可從三個不同的時序粒度進(jìn)行刻畫。三個時序粒度分別是指地震道數(shù)據(jù)內(nèi)長時序呈現(xiàn)出的趨勢性、中時序呈現(xiàn)的周期性以及局部關(guān)鍵點(diǎn)周圍具有的局部性特征。通過以上三個粒度可從全局至中觀、再到局部以不同層次對原始地震資料中的潛在特征進(jìn)行學(xué)習(xí)和表示,進(jìn)而表達(dá)出地震道數(shù)據(jù)內(nèi)部存在的時序結(jié)構(gòu)。具體而言過程如下。

其中:fT(·)表示T-LSTM模型計算函數(shù),xitk表示第i個地震道數(shù)據(jù)中第tk個長序列,Wt和bt表示T-LSTM的參數(shù)。

T-LSTM采用經(jīng)典BiLSTM作為編碼器產(chǎn)生隱含層的編碼表示。后續(xù)兩個粒度的時序結(jié)構(gòu)提取模型與該處一致。

3.2 多粒度時序結(jié)構(gòu)特征融合與判別模塊

為了進(jìn)一步利用已勘測井段監(jiān)督信息對多粒度特征存在的代價敏感問題進(jìn)行處理,本文設(shè)計了對融合后的特征采用代價敏感的全連接分類器進(jìn)行學(xué)習(xí),其要求分類后的樣本與原樣本含油性標(biāo)記保持一致性的基礎(chǔ)上,考慮到假陽性樣本和假陰性樣本代價敏感影響。式(6)表示將融合后的多粒度特征通過全連接分類器進(jìn)行含油性判別:

3.3 算法模型參數(shù)優(yōu)化和損失函數(shù)

本文算法模型參數(shù)和損失分別可從兩個階段進(jìn)行分析:第一個階段是提取時序結(jié)構(gòu)時模型涉及的參數(shù)和損失;第二階段是融合各獨(dú)立特征和對該特性進(jìn)行含油性檢測判別時模型參數(shù)和損失。在本文算法訓(xùn)練過程,采用了隨機(jī)梯度下降的方法進(jìn)行參數(shù)優(yōu)化,具體由以下兩個部分組成:

1)多粒度時序結(jié)構(gòu)融合參數(shù)和損失。在多粒度時序結(jié)構(gòu)提取階段,模型參數(shù)涉及包括3個部分:分別是趨勢性結(jié)構(gòu)模型參數(shù)、周期性結(jié)構(gòu)模型參數(shù)和局部性結(jié)構(gòu)模型參數(shù)。其中,fT(?)、fP(?)和fL(?)分別表示3個粒度特征提取模型。(Wt,bt,Wp,bp,Wl,bl)分別表示該階段待優(yōu)化的模型參數(shù)。

2)基于多粒度融合表示代價敏感參數(shù)和損失。獲得多粒度融合特征后,將其輸入基于代價敏感的全連接分類器進(jìn)行判別模型,W表示該階段待優(yōu)化的模型參數(shù),fD(?)表示含油性預(yù)測模型。為了有效地區(qū)分有油和無油樣本,本文算法將損失函數(shù)建模為有監(jiān)督異常檢測模型。因此,損失函數(shù)在設(shè)計時加大了對假陽性樣本和假陰性樣本錯誤計算造成的損失,該基于代價敏感型損失函數(shù)如式(7):

其中C=(c1,c2,c3,c4)為代價敏感向量,本文代價敏感向量由物探領(lǐng)域?qū)<医Y(jié)合江蘇油田實(shí)際地質(zhì)特性進(jìn)行研判并作為模型先驗(yàn)領(lǐng)域知識。

4 實(shí)驗(yàn)與結(jié)果分析

本章將本文算法在江蘇油田實(shí)際地震資料上進(jìn)行了驗(yàn)證。

4.1 數(shù)據(jù)集描述

為進(jìn)一步驗(yàn)證本文所提出算法在真實(shí)地震資料上的預(yù)測結(jié)果,本次實(shí)驗(yàn)在江蘇油田實(shí)際地震資料數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。由于江蘇地區(qū)油田分布的自然局限性,導(dǎo)致鉆井?dāng)?shù)據(jù)本身稀少。本次實(shí)驗(yàn)數(shù)據(jù)集以真永聯(lián)三維地震資料為基礎(chǔ),該區(qū)域位于蘇北盆地高郵凹陷深凹帶。目前該區(qū)已發(fā)現(xiàn)真武、許莊、曹莊、肖劉莊和永安等多個油氣田,成藏條件較為有利,是江蘇油田主要產(chǎn)油區(qū)。該工區(qū)共擁有地震道數(shù)據(jù)221121條,經(jīng)過實(shí)際測井驗(yàn)證,共有81條含測井標(biāo)記的地震道數(shù)據(jù),其中含油性地震道數(shù)據(jù)為20條。經(jīng)預(yù)處理后,實(shí)驗(yàn)得到該工區(qū)地震道數(shù)據(jù)中含標(biāo)記信息480個時序點(diǎn),其中含油標(biāo)記點(diǎn)共有31個(單個地震道可存在多個含油性標(biāo)記點(diǎn)),有監(jiān)督的信息總量占比較少且類別不平衡。

4.2 對比方法

在實(shí)驗(yàn)方法對比方面,本文算法將分別與以下兩類算法進(jìn)行對比:

1)與油氣檢測領(lǐng)域所采用的機(jī)器學(xué)習(xí)算法對比。主要包括:神經(jīng)網(wǎng)絡(luò)(BackPropagation,BP)算法[20]、支持向量機(jī)(Support Vector Machine,SVM)算 法[22]、卷 積 神 經(jīng) 網(wǎng) 絡(luò)(Convolutional Neural Network,CNN)算法[28]和LSTM算法[30]。

2)與機(jī)器學(xué)習(xí)領(lǐng)域經(jīng)典淺層和深度算法進(jìn)行比對實(shí)驗(yàn),其中淺層算法包括k最近鄰(k-Nearest Neighbor,kNN),深度算法包括門控循環(huán)單元(Gated Recurrent Unit,GRU)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)算法。

從以上兩個方面進(jìn)行對比,方法選擇一方面因?yàn)槭俏锾筋I(lǐng)域研究團(tuán)隊在探索機(jī)器學(xué)習(xí)技術(shù)時較常用的經(jīng)典方法;另一方面,也是進(jìn)一步在真實(shí)地震資料上驗(yàn)證和探索本文所提出算法與其他經(jīng)典機(jī)器學(xué)習(xí)方法在性能上的差異性。此外,關(guān)于比對算法的超參數(shù)設(shè)置,本文在實(shí)驗(yàn)時對江蘇油田永真聯(lián)地震資料進(jìn)行了驗(yàn)證集劃分,通過其在驗(yàn)證集上的性能比較,選擇了最佳超參數(shù)進(jìn)行設(shè)置并開展后續(xù)實(shí)驗(yàn)與評估。

4.3 實(shí)驗(yàn)設(shè)置

本文所采用的單道地震波數(shù)據(jù)共包含6000個振幅值,形式如圖3所示。其中左側(cè)為靠近地面的地震波數(shù)據(jù),右側(cè)是遠(yuǎn)離地面的地震波數(shù)據(jù)。經(jīng)分析可發(fā)現(xiàn),左側(cè)振幅值的疏密程度高于右側(cè),主要原因是地震波自地面往地下傳導(dǎo)的過程中存在著衰減。根據(jù)對江蘇油田真永聯(lián)區(qū)域總共包含81條含油標(biāo)記地震波數(shù)據(jù)的分析,其中含油數(shù)據(jù)20條,無油數(shù)據(jù)61條。同時,油層分布較薄,最小出現(xiàn)的含油標(biāo)記點(diǎn)位置為2 041,最大的含油標(biāo)記點(diǎn)位置為2545,除2545點(diǎn)外含油點(diǎn)位于1 500~2 500。為有效地學(xué)習(xí)出其中特征,結(jié)合物探領(lǐng)域?qū)<医ㄗh,本次實(shí)驗(yàn)的趨勢序列、周期序列和局部序列之間的特征分別按如下規(guī)則取出數(shù)據(jù):

圖3 單道地震道可視化振幅Fig.3 Visualized amplitudeof single seismic trace

1)趨勢性序列劃分:重點(diǎn)針對1 000~4000的振幅值進(jìn)行劃分。

2)周期性序列劃分:重點(diǎn)針對1 500~3000的振幅值進(jìn)行劃分。

3)局部性序列劃分:重點(diǎn)針對2 000~2500的振幅值進(jìn)行劃分。

本次實(shí)驗(yàn)評價主要采用以下四個評價指標(biāo):

1)召回率(Recall)表示預(yù)測正確的含油性地震道數(shù)據(jù)與實(shí)際地震資料中所有含油性地震道數(shù)據(jù)的比率,依據(jù)真陽性(True Positive,TP)、假陽性(False Positive,F(xiàn)P)、真陰性(True Negative,TN)、假陰性(False Negative,F(xiàn)N)進(jìn)行計算,過程如式(8)所示:

2)準(zhǔn)確率(Accuracy)表示預(yù)測正確的含油性地震道數(shù)據(jù)與預(yù)測出所有含油性地震道數(shù)據(jù)的比率,計算過程如(9):

3)ROC(Receiver Operating Characteristic)曲線下方的面積(Area Under Curve,AUC)大小表示對預(yù)測算法的曲線下面積,AUC值越大的分類器,正確率越高。

4)收斂性表示判斷所提出算法和其他對比方法在永真聯(lián)三維地震資料中進(jìn)行訓(xùn)練是否可經(jīng)過多步迭代之后趨于某一固定值。

4.4 實(shí)驗(yàn)結(jié)果與分析

本次實(shí)驗(yàn)結(jié)果從四個方面對本文算法進(jìn)行評價。其中本文算法與對比算法(含加上不平衡代價設(shè)計)的召回率、準(zhǔn)確率和AUC分別如表2和表3所示,收斂性分析如圖4所示。

表2 不同算法的召回率、精度和AUC結(jié)果對比Tab.2 Comparison of different algorithms on Recall,Precision and AUC

表3 不同算法代價敏感性能對比結(jié)果Tab.3 Comparison results of cost-sensitive performance of different algorithms

1)召回率分析。表2結(jié)果表明:在經(jīng)典非時序類算法模型大多過擬合于無油,無法識別出有油的樣本,導(dǎo)致召回率較低。其中kNN、BP與CNN將測試集中所有的有油數(shù)據(jù)預(yù)測為無油,SVM識別出少量的含油數(shù)據(jù)?;跁r序的算法RNN,GRU和LSTM在性能上明顯高于其他經(jīng)典算法,表明捕捉數(shù)據(jù)內(nèi)部時序的重要性。本文提出的算法能夠捕捉多粒度的特征,在召回率上取得了最佳性能,且優(yōu)于對比算法的平均性能(平均性能召回率為0.36)。表3結(jié)果表明:將不平衡代價損失引入到經(jīng)典深度模型中,召回率相較之前有所提升。

2)準(zhǔn)確率分析。表2結(jié)果表明:本文方法準(zhǔn)確率優(yōu)于所對比算法的平均性能(平均性能準(zhǔn)確率為0.48),但未取得最佳性能。經(jīng)分析,由于無油數(shù)據(jù)在數(shù)據(jù)集中占據(jù)大多數(shù)的比例(類別不平衡),除本文方法之外其他對比模型大多將測試樣本直接預(yù)測為無油,所以使得本文方法的預(yù)測準(zhǔn)確率低于部分經(jīng)典方法。表3結(jié)果表明:將不平衡代價損失引入到經(jīng)典深度模型中,準(zhǔn)確率相較之前稍有下降。

3)AUC分析。表2結(jié)果表明:本文算法在AUC指標(biāo)上獲得了最佳性能,相對于第二名RNN和LSTM算法,得到了10%提高。此外,本文提出的算法優(yōu)于平均性能(平均性能AUC為0.52)。表3結(jié)果表明:將不平衡代價損失引入到經(jīng)典深度模型中,雖然召回率有所提高,但AUC結(jié)果并未發(fā)現(xiàn)有所提升。因此,未發(fā)現(xiàn)引入代價敏感策略對于原有經(jīng)典深度學(xué)習(xí)方法性能有本質(zhì)提升。

4)收斂性分析。本文提出算法和所對比的4類深度學(xué)習(xí)算法收斂性結(jié)果如圖4所示,從收斂性結(jié)果上而言,本文算法和對比方法能夠在給定地震資料上逐漸降低訓(xùn)練損失。同時,根據(jù)收斂性結(jié)果進(jìn)一步對比了本文方法與LSTM和GRU算法的訓(xùn)練耗時,本文方法耗時約是其三倍。由于本文算法采用3個BiLSTM作為特征提取器,耗時與單個算法模型訓(xùn)練耗時基本保持線性增加關(guān)系。

圖4 深度學(xué)習(xí)算法收斂性對比Fig.4 Convergence comparison of different deep learning based algorithms

5 結(jié)語

對地下儲層含油性勘測是石油勘探領(lǐng)域熱點(diǎn)研究方向之一。本文針對地下儲層含油性檢測問題進(jìn)行了探索,提出了一種基于多粒度時序結(jié)構(gòu)表示的異常檢測算法。該方法首先對于單個地震道數(shù)據(jù)提取多粒度時序結(jié)構(gòu)并形成獨(dú)立特征;其次,在提取多個粒度時序結(jié)構(gòu)基礎(chǔ)上進(jìn)行特征融合,形成對地震道數(shù)據(jù)的綜合表示;最后,通過對融合后特征進(jìn)行聯(lián)合訓(xùn)練與判別,得到對于該地震數(shù)據(jù)含油性檢測結(jié)果。本文算法在蘇北盆地高郵凹陷深凹帶實(shí)際地震資料上進(jìn)行了實(shí)驗(yàn)仿真,實(shí)驗(yàn)結(jié)果表明:本文算法相對比傳統(tǒng)機(jī)器學(xué)習(xí)方法能夠更有效地進(jìn)行儲層含油性預(yù)測。

地下巖層隨著深度和廣度的不斷增加,其地質(zhì)結(jié)構(gòu)也隨之存在潛在變化,如何更加有效地捕捉地震道數(shù)據(jù)內(nèi)和數(shù)據(jù)之間存在的潛在分布變化或概念漂移現(xiàn)象,并將其特征融入含油性判別任務(wù)中是值得進(jìn)一步探索的研究內(nèi)容。

猜你喜歡
含油粒度時序
顧及多種弛豫模型的GNSS坐標(biāo)時序分析軟件GTSA
清明
基于GEE平臺與Sentinel-NDVI時序數(shù)據(jù)江漢平原種植模式提取
你不能把整個春天都搬到冬天來
石蠟溶劑脫油裝置直接加工常減壓原料探討
油田含油污水處理技術(shù)探索
含油和含聚污水處理單元反沖洗助洗劑改進(jìn)研究及應(yīng)用
情感粒度
油田碎屑巖粒度分布情況測定中激光粒度分析儀應(yīng)用的價值
油田含油污泥處理技術(shù)研究進(jìn)展
乐东| 平山县| 莱芜市| 招远市| 海伦市| 台江县| 苏州市| 平顶山市| 民和| 阿拉善右旗| 伊春市| 商水县| 珠海市| 阜康市| 苗栗市| 故城县| 图们市| 赤城县| 中阳县| 北辰区| 定边县| 大埔县| 吉安县| 获嘉县| 林西县| 吴旗县| 华安县| 屏边| 理塘县| 磐安县| 通渭县| 武安市| 浏阳市| 吉木萨尔县| 平昌县| 乌鲁木齐县| 项城市| 剑川县| 凤翔县| 沈丘县| 泗水县|