劉力輝,陸 蓉,楊文魁
(北京諾克斯達(dá)石油科技有限公司,北京100083)
在地震儲(chǔ)層預(yù)測(cè)中,復(fù)雜巖性預(yù)測(cè)一直是一個(gè)難點(diǎn),如碎屑巖中鈣質(zhì)泥巖、碳酸鹽巖及火山巖[1-3]等。目前復(fù)雜巖性的預(yù)測(cè)技術(shù)[4]主要集中在疊前彈性參數(shù)反演,根據(jù)巖石物理多參數(shù)交會(huì)分析判定,但對(duì)于有些復(fù)雜巖性,難以找到線性相關(guān)且敏感有效的彈性參數(shù)。對(duì)于屬性或疊后反演分析復(fù)雜巖性來(lái)說(shuō)技術(shù)挑戰(zhàn)更大。通過(guò)研究地震波形的聚類(lèi)分析進(jìn)行復(fù)雜巖性的預(yù)測(cè)[5],需井震對(duì)比以建立巖性和波形的對(duì)應(yīng)關(guān)系,然而實(shí)際巖性與地震波形之間的關(guān)系存在著一系列復(fù)雜的響應(yīng)機(jī)制,很難一一對(duì)應(yīng),人工井震標(biāo)定方式轉(zhuǎn)化巖性反演結(jié)果多解性強(qiáng)。機(jī)器學(xué)習(xí)的非線性反演方法[6-7]通過(guò)計(jì)算特征曲線識(shí)別復(fù)雜巖性,常用機(jī)器學(xué)習(xí)的方法有BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等。這些學(xué)習(xí)方法都存在易陷入局部最小、效果不穩(wěn)定、多次實(shí)現(xiàn)結(jié)果相差很大的局限。
近年來(lái),深度學(xué)習(xí)受到國(guó)內(nèi)外學(xué)者的廣泛關(guān)注。深度學(xué)習(xí)的概念最早由HINTON等[8]提出,是指基于樣本數(shù)據(jù)通過(guò)一定的訓(xùn)練方法得到包含多個(gè)層級(jí)的深度網(wǎng)絡(luò)結(jié)構(gòu)的機(jī)器學(xué)習(xí)過(guò)程[9-10]。之后,深度學(xué)習(xí)率先在語(yǔ)音識(shí)別以及圖像識(shí)別中取得了杰出成果。如今,深度學(xué)習(xí)除了在圖像、語(yǔ)音、自然語(yǔ)言處理等方面繼續(xù)向前發(fā)展之外[11],在CTR(click through rate)預(yù)估、大數(shù)據(jù)特征提取、醫(yī)療、金融、無(wú)人駕駛等方面也得到廣泛應(yīng)用。同樣,在石油勘探領(lǐng)域,深度學(xué)習(xí)也受到了學(xué)者的青睞,如在2017年青島國(guó)際會(huì)議和SEG年會(huì)上開(kāi)設(shè)了專(zhuān)門(mén)的深度學(xué)習(xí)專(zhuān)題[12-14],一些大的石油公司也開(kāi)始利用這項(xiàng)技術(shù)解決地質(zhì)問(wèn)題。
深度學(xué)習(xí)通常面向大數(shù)據(jù)。大數(shù)據(jù)并非是單指海量數(shù)據(jù),除了需要大量數(shù)據(jù)外,更重要的是各種類(lèi)型的數(shù)據(jù)都應(yīng)具備,網(wǎng)絡(luò)模型才可能建得合理,即數(shù)據(jù)應(yīng)具備完備性。將深度學(xué)習(xí)用于非線性反演的關(guān)鍵是如何滿(mǎn)足數(shù)據(jù)的完備性要求。反演過(guò)程首先通過(guò)井旁地震道(屬性)與特征測(cè)井曲線建立的一一對(duì)應(yīng)的樣本集,再采用隨機(jī)采樣方式產(chǎn)生訓(xùn)練樣本集和測(cè)試樣本集,這種方式可能導(dǎo)致一些特殊巖性沒(méi)有被抽樣到而影響樣本集的完備性和代表性;其次,樣本集根據(jù)井點(diǎn)建立,井在空間分布不均勻,只根據(jù)井建立樣本集會(huì)漏掉一些巖性帶的抽樣,從而影響樣本集的完備性;再則,深度學(xué)習(xí)在大樣本(大數(shù)據(jù))上有明顯的優(yōu)勢(shì),但地震儲(chǔ)層預(yù)測(cè)中井震樣本往往是一個(gè)小樣本問(wèn)題,并不滿(mǎn)足深度學(xué)習(xí)大數(shù)據(jù)條件。
針對(duì)這些問(wèn)題,本文采用優(yōu)化樣本采樣、抽取相控偽井以及增量學(xué)習(xí)的策略解決上述問(wèn)題,提高了深度學(xué)習(xí)預(yù)測(cè)模型的精度。常規(guī)網(wǎng)絡(luò)學(xué)習(xí)多以測(cè)井特征曲線(伽馬曲線等)為目標(biāo)曲線,存在井震分辨率不匹配的問(wèn)題,為此,我們采用了地震巖相的概念[15],一是通過(guò)測(cè)井巖相解釋,對(duì)測(cè)井巖性曲線粗化,解決井震分辨率匹配問(wèn)題,二是通過(guò)地震地質(zhì)結(jié)合,合理劃分巖性-地震屬性可識(shí)別的巖相類(lèi)別,降低建模難度,增加樣本集的合理性。基于深度學(xué)習(xí)的地震巖相反演方法通過(guò)輸入地震的低、中、高頻分頻剖面及巖相曲線作為樣本集,經(jīng)過(guò)完備性采樣,訓(xùn)練獲得穩(wěn)定的深度網(wǎng)絡(luò),應(yīng)用于整個(gè)地震數(shù)據(jù)上,從而獲得高分辨率的地震巖相反演結(jié)果。
BP(back propagation)神經(jīng)網(wǎng)絡(luò),被稱(chēng)作多層感知機(jī)(multi-layer perceptron),但實(shí)際上是一種只含有一層隱層節(jié)點(diǎn)的淺層模型。其應(yīng)用于地震反演時(shí)存在的問(wèn)題是:①網(wǎng)絡(luò)結(jié)構(gòu)單一,非線性表征能力較差,容易出現(xiàn)過(guò)度擬合現(xiàn)象;②神經(jīng)網(wǎng)絡(luò)初始化中的隨機(jī)權(quán)值,導(dǎo)致網(wǎng)絡(luò)很容易收斂到局部最小值,隨機(jī)性強(qiáng)。BP神經(jīng)網(wǎng)絡(luò)代表的是“大數(shù)據(jù)+簡(jiǎn)單模型”的傳統(tǒng)工業(yè)界學(xué)習(xí)模式(圖1a)。較常規(guī)的BP神經(jīng)網(wǎng)絡(luò)而言,深度學(xué)習(xí)的網(wǎng)絡(luò)結(jié)構(gòu)更復(fù)雜,代表的是“大數(shù)據(jù)+復(fù)雜模型”的學(xué)習(xí)模式(圖1b),可以充分挖掘數(shù)據(jù)背后的信息,目前已經(jīng)成為主流模式。該模式通過(guò)組合低層特征形成更加抽象的高層特征,有效改善BP神經(jīng)網(wǎng)絡(luò)反演結(jié)果隨機(jī)性和容易陷入局部最小的缺點(diǎn)。
圖1 BP神經(jīng)網(wǎng)絡(luò)(a)和深度學(xué)習(xí)網(wǎng)絡(luò)(b)
目前深度學(xué)習(xí)的主流神經(jīng)網(wǎng)絡(luò)有很多種,其中常見(jiàn)的有卷積神經(jīng)網(wǎng)絡(luò)(convolution neutral network,CNN)、深度信念網(wǎng)絡(luò)(deep belief netwook,DBN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)等[16],不同的網(wǎng)絡(luò)結(jié)構(gòu)不同,適應(yīng)的任務(wù)不同。CNN主要用于圖像處理,也可用于其它類(lèi)型的輸入,如音頻,主要應(yīng)用有監(jiān)督場(chǎng)景。RNN是基于時(shí)間的前饋神經(jīng)網(wǎng)絡(luò),主要應(yīng)用于自然語(yǔ)言處理方面,同樣需要大量的有標(biāo)注的樣本信息進(jìn)行有監(jiān)督訓(xùn)練。上述兩種模型屬于有監(jiān)督的判別模型,而DBN是一種半監(jiān)督生成模型。所謂半監(jiān)督就是指DBN的訓(xùn)練需要通過(guò)“無(wú)監(jiān)督+有監(jiān)督”的方式分兩步進(jìn)行訓(xùn)練。首先,通過(guò)無(wú)監(jiān)督的方式訓(xùn)練其神經(jīng)元間的權(quán)重,整個(gè)神經(jīng)網(wǎng)絡(luò)按照最大概率生成數(shù)據(jù),形成聚類(lèi)信息,然后使用反向傳播指導(dǎo)DBN進(jìn)行微調(diào),即有監(jiān)督地進(jìn)行調(diào)優(yōu),賦予DBN具體類(lèi)別信息,最終建立樣本與類(lèi)別之間的聯(lián)合概率分布。
本文采用了DBN,原因如下:①巖相預(yù)測(cè)過(guò)程也可認(rèn)為是先聚類(lèi)再賦予類(lèi)別信息的過(guò)程;②井旁分頻數(shù)據(jù)及井巖相樣本數(shù)量少,采用有監(jiān)督方法難以取得有效成果;③面對(duì)巖相預(yù)測(cè)這樣的數(shù)值計(jì)算而言,相比于CNN以及RNN,DBN具有更強(qiáng)的適用性。
采用DBN對(duì)地震巖相進(jìn)行學(xué)習(xí)的過(guò)程是:①自下而上進(jìn)行RBM(restricted boltzmann machine)無(wú)監(jiān)督學(xué)習(xí),充分訓(xùn)練每一層,一層一層獲得各層網(wǎng)絡(luò)連線的權(quán)值參數(shù);②各層訓(xùn)練完成后,依靠樣本標(biāo)簽,將誤差自上而下反向傳遞進(jìn)行訓(xùn)練,對(duì)多層的連接權(quán)重參數(shù)調(diào)優(yōu),形成有監(jiān)督的訓(xùn)練過(guò)程,最終確定巖相學(xué)習(xí)的DBN網(wǎng)絡(luò)。再通過(guò)這個(gè)網(wǎng)絡(luò)進(jìn)行整個(gè)地震數(shù)據(jù)體范圍的巖相體反演。
首先將分頻屬性作為輸入,多井地震巖相曲線作為學(xué)習(xí)目標(biāo),也就是標(biāo)簽。然后利用深度學(xué)習(xí)方法,先從分頻數(shù)據(jù)出發(fā),從網(wǎng)絡(luò)底層開(kāi)始訓(xùn)練數(shù)據(jù),逐層將數(shù)據(jù)進(jìn)行抽象表征,直到網(wǎng)絡(luò)頂部,這是無(wú)監(jiān)督的訓(xùn)練過(guò)程;再?gòu)亩嗑卣饚r相曲線出發(fā),將誤差逐步以反向傳播的形式從網(wǎng)絡(luò)頂部傳遞至底部,逐層對(duì)網(wǎng)絡(luò)進(jìn)行調(diào)優(yōu),最終建立兩者之間的模型。之后進(jìn)行質(zhì)量監(jiān)控,進(jìn)一步根據(jù)結(jié)果對(duì)模型進(jìn)行調(diào)整。最終獲得成熟網(wǎng)絡(luò),可用于預(yù)測(cè),將分頻屬性轉(zhuǎn)化為地震巖相體。圖2是深度學(xué)習(xí)計(jì)算地震巖相的流程,其核心部分在于樣本集優(yōu)化方式,使得深度學(xué)習(xí)能充分發(fā)掘分頻屬性與多井地震巖相曲線之間的聯(lián)系,以下逐步詳述。
圖2 深度學(xué)習(xí)計(jì)算地震巖相的流程
2.2.1 以井及巖相為分組的均勻采樣方式提取樣本集
常規(guī)訓(xùn)練樣本及測(cè)試樣本是通過(guò)混合多井樣本點(diǎn)隨機(jī)抽樣的方式抽取,當(dāng)某些井樣本點(diǎn)少或者某種巖相的樣本點(diǎn)少,就容易漏采巖相。同時(shí)隨機(jī)抽樣也破壞了地震波形的完整性,影響了數(shù)據(jù)的完備性。為此,本文通過(guò)以井及巖相為分組的均勻采樣方式解決漏采某種巖相信息的問(wèn)題。以一口井為例,以巖相為分組均勻采樣(圖3)。井1中井巖相曲線分為3類(lèi),提取井旁道m(xù)個(gè)分頻數(shù)據(jù)組成一個(gè)向量(x1,x2,x3,…,xm),井旁道數(shù)按照時(shí)間順序(1,2,…,n)進(jìn)行編號(hào)。根據(jù)該向量對(duì)應(yīng)的巖相類(lèi)別,將其放置在對(duì)應(yīng)巖相集合中,這就是一條樣本。如圖3所示,巖相1集合中將會(huì)有4條樣本,分別是第1,2,3,9時(shí)間點(diǎn)處的數(shù)據(jù);巖相2集合中將會(huì)有6條樣本,分別是第4,5,6,7,14,15時(shí)間點(diǎn)處的數(shù)據(jù);巖相3將會(huì)有7條樣本,分別是第10,11,12,13,16,17,18時(shí)間點(diǎn)處的數(shù)據(jù)。經(jīng)過(guò)這樣的處理,形成3個(gè)集合的數(shù)據(jù)。最后分別從這3個(gè)集合中,對(duì)每個(gè)集合按照等時(shí)間間隔選取訓(xùn)練集及測(cè)試集。
2.2.2 相控偽井抽取樣本集
人工智能反演方法,依賴(lài)井點(diǎn)處地震數(shù)據(jù)與井?dāng)?shù)據(jù)之間的映射關(guān)系,如果井點(diǎn)稀疏,難以覆蓋整個(gè)反演工區(qū),勢(shì)必造成平面上有些相帶沒(méi)有抽取到樣本,影響數(shù)據(jù)的完備性,導(dǎo)致反演結(jié)果外推能力差、平面連續(xù)性差的問(wèn)題。這里,我們通過(guò)輸入基于相邊界控制下的巖相插值模型進(jìn)行平面控制,以平面網(wǎng)格化方式均勻抽取模型體作為偽井井曲線,填充樣本集,如圖4所示,一方面能夠解決井網(wǎng)分布不勻的問(wèn)題,擴(kuò)充樣本采樣在平面上的均勻性,樣本集受相帶約束,可確保反演結(jié)果的橫向穩(wěn)定性;另一方面樣本集中樣本個(gè)數(shù)大大增加,有利于深度學(xué)習(xí)建立準(zhǔn)確的網(wǎng)絡(luò)模型在一個(gè)相對(duì)穩(wěn)定的映射關(guān)系上進(jìn)行擾動(dòng)修正,獲得最優(yōu)解。
圖3 一口井巖相分組的均勻抽樣
圖4 偽井抽取示意
增量學(xué)習(xí)是指一個(gè)學(xué)習(xí)系統(tǒng)能不斷地從新樣本中學(xué)習(xí)新的知識(shí),并能保存大部分已經(jīng)學(xué)習(xí)到的知識(shí),根據(jù)新的知識(shí)會(huì)對(duì)舊知識(shí)進(jìn)行調(diào)優(yōu),從而使得整個(gè)系統(tǒng)更加趨于穩(wěn)定和全局最優(yōu),其過(guò)程如圖5所示。
圖5 增量學(xué)習(xí)策略
我們可以利用增量學(xué)習(xí)的思想,區(qū)別對(duì)待真井和偽井。利用偽井作為老知識(shí)進(jìn)行學(xué)習(xí),得到一個(gè)初始的網(wǎng)絡(luò)模型,然后在這個(gè)初始網(wǎng)絡(luò)模型的基礎(chǔ)上利用真井作為新知識(shí)對(duì)網(wǎng)絡(luò)進(jìn)一步學(xué)習(xí)調(diào)優(yōu),最終獲得成熟的網(wǎng)絡(luò)用于預(yù)測(cè)巖相。
研究區(qū)屬于典型的深水陸坡水道沉積,其中陸坡區(qū)主要發(fā)育的水道以及扇體等復(fù)合沉積體系為優(yōu)質(zhì)儲(chǔ)層。因?yàn)樗揽臻g展布形態(tài)復(fù)雜,常規(guī)層狀插值建模困難,影響了反演的精度。同時(shí)研究區(qū)巖性多樣,有灰?guī)r、鈣質(zhì)砂巖、砂巖和泥巖4種巖石類(lèi)型,其中灰?guī)r、鈣質(zhì)砂巖表現(xiàn)為高阻抗特征,砂巖和泥巖表現(xiàn)為低阻抗特征,巖石物理規(guī)律復(fù)雜,巖性區(qū)分困難。
如圖6所示,井A鉆遇鈣質(zhì)砂巖-干層,井B鉆遇砂巖-氣層。而兩口井之間發(fā)現(xiàn)一個(gè)巖性圈閉目標(biāo)(白圈中所示),該目標(biāo)巖性類(lèi)型成為儲(chǔ)層物性評(píng)價(jià)的關(guān)鍵。另外該目標(biāo)位于構(gòu)造底部位,井B已鉆遇氣水界面,因此該目標(biāo)巖性上傾方向是否尖滅是成藏的關(guān)鍵。綜合以上兩個(gè)問(wèn)題,本區(qū)勘探的重點(diǎn)為巖性分類(lèi)預(yù)測(cè)及砂巖邊界刻畫(huà)。以-90°地震數(shù)據(jù)以及20,30,40,50Hz分頻體作為輸入,以?xún)煽诰卣饚r相結(jié)果以及這兩口井相控插值建模結(jié)果抽取的偽井作為學(xué)習(xí)目標(biāo),如圖7所示。分別采用BP和深度學(xué)習(xí)方法進(jìn)行巖相反演。圖8為BP神經(jīng)網(wǎng)絡(luò)反演巖相體剖面,可以看出,經(jīng)過(guò)井震標(biāo)定,井點(diǎn)反演吻合率較高,但橫向外推能力欠佳,反演同相軸剖面連續(xù)性差,砂體邊界不清晰(紅色箭頭所示)。圖9為深度學(xué)習(xí)方法反演巖相體剖面,井震標(biāo)定結(jié)果表明,過(guò)井點(diǎn)反演結(jié)果與測(cè)井解釋結(jié)果基本吻合,同時(shí)井點(diǎn)外推效果較好,砂體邊界清楚,解釋目的層(白圈中所示位置)為砂巖沉積,且沿高部位上傾尖滅(紅色箭頭所示),與井B發(fā)育的砂巖為兩套油水界面,具備成藏條件。圖10為疊前彈性阻抗反演出聲波阻抗(AI)和橫波阻抗(SI),經(jīng)過(guò)巖石物理交會(huì)得到的地震巖相體剖面。和深度學(xué)習(xí)反演剖面相比,疊前反演巖性體剖面對(duì)巖相類(lèi)型區(qū)分不夠,鈣質(zhì)砂巖與灰?guī)r區(qū)分度不高,且分辨率低。
圖6 研究區(qū)重點(diǎn)井連井原始剖面
圖7 已知井建立巖相模型及偽井分布剖面
圖8 BP神經(jīng)網(wǎng)絡(luò)反演巖相體剖面
圖9 深度學(xué)習(xí)反演巖相體剖面
圖10 疊前反演巖相體剖面
基于DBN深度學(xué)習(xí)的地震巖相反演方法是復(fù)雜巖性預(yù)測(cè)的有效手段,優(yōu)點(diǎn)在于:①深度學(xué)習(xí)方式是包含多個(gè)隱層的深度結(jié)構(gòu)網(wǎng)絡(luò),可從大樣本中提取有效特征信息與巖相建立非線性關(guān)系進(jìn)行反演,比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)(如BP神經(jīng)網(wǎng)絡(luò))反演效果更為穩(wěn)定,不容易陷入局部最小;②深度學(xué)習(xí)有很強(qiáng)的非線性表征能力,通過(guò)分頻屬性即可反演出兩類(lèi)以上復(fù)雜巖性,和疊前彈性參數(shù)判定結(jié)果非常相似,但分辨率更高;③DBN善于處理分類(lèi)問(wèn)題,故將其應(yīng)用于巖相判定,實(shí)際資料應(yīng)用結(jié)果證實(shí)其巖相反演結(jié)果精度高。這種方法也存在一些局限:深度學(xué)習(xí)在大樣本上才能展現(xiàn)其優(yōu)勢(shì),但反演中樣本數(shù)受井?dāng)?shù)限制,一般為小樣本,所以該方法更適合在開(kāi)發(fā)區(qū)應(yīng)用;同時(shí)為了擴(kuò)大樣本量我們采用了相控插值模型抽取偽井,雖然使用了增量學(xué)習(xí)方法區(qū)別對(duì)待真井和偽井,但反演結(jié)果勢(shì)必受到模型精度影響。