伊小蝶 吳幫玉 孟德林 曹相湧
(西安交通大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,陜西西安 710049)
地震波阻抗反演將地震數(shù)據(jù)轉(zhuǎn)換成反映地層物性參數(shù)的阻抗信息,是巖層和儲(chǔ)層精細(xì)刻畫的關(guān)鍵技術(shù)。近半個(gè)世紀(jì)以來,阻抗反演技術(shù)從直接反演發(fā)展到基于模型的反演,從線性反演發(fā)展到非線性反演,從疊后反演發(fā)展到疊前反演,受到了廣泛的關(guān)注[1]。
近年來,以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為代表的深度學(xué)習(xí)方法在解決地震反演問題中得到了成功的應(yīng)用[2-8]。這類方法大多基于有監(jiān)督學(xué)習(xí),即利用網(wǎng)絡(luò)從給定的數(shù)據(jù)和反演結(jié)果(標(biāo)簽)憑經(jīng)驗(yàn)尋找二者之間的聯(lián)系,從而得到預(yù)測(cè)網(wǎng)絡(luò)模型。深度網(wǎng)絡(luò)由多隱藏層構(gòu)成,通過最小化網(wǎng)絡(luò)預(yù)測(cè)結(jié)果與標(biāo)簽之間的誤差迭代更新內(nèi)部參數(shù),該訓(xùn)練過程需要足夠多的標(biāo)簽。在標(biāo)簽足夠多和質(zhì)量足夠好的情況下,與傳統(tǒng)地球物理反演方法相比,深度學(xué)習(xí)方法可以產(chǎn)生精度更高的反演結(jié)果。Das等[9]利用Kennett反射率法產(chǎn)生合成數(shù)據(jù),結(jié)合阻抗標(biāo)簽訓(xùn)練CNN并測(cè)試了網(wǎng)絡(luò)模型的穩(wěn)健性;Mustafa等[10]把地震數(shù)據(jù)和聲波阻抗當(dāng)作序列數(shù)據(jù),使用時(shí)域卷積網(wǎng)絡(luò)(TCN)模型學(xué)習(xí)二者之間的映射關(guān)系;Du等[11]提出用殘差網(wǎng)絡(luò)進(jìn)行疊前反演,獲得了P波阻抗、S波阻抗等巖性和物性參數(shù);孫宇航等[12]基于序列數(shù)據(jù)假設(shè),利用測(cè)井?dāng)?shù)據(jù)訓(xùn)練門控單元(GRU)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)橫波速度;王俊等[13]將GRU網(wǎng)絡(luò)用于測(cè)井曲線重構(gòu)。
在前人基于深度學(xué)習(xí)的波阻抗反演研究中,網(wǎng)絡(luò)的訓(xùn)練樣本大多從合成數(shù)據(jù)中獲得,很難直接用于實(shí)際數(shù)據(jù)。而實(shí)際標(biāo)簽樣本從測(cè)井?dāng)?shù)據(jù)中生成,由于成本的原因,可用的測(cè)井曲線通常數(shù)量少,不足以充分訓(xùn)練網(wǎng)絡(luò),容易產(chǎn)生過擬合。因此,利用大量合成數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練后,應(yīng)用少量實(shí)際標(biāo)簽對(duì)網(wǎng)絡(luò)進(jìn)行遷移學(xué)習(xí),是提升網(wǎng)絡(luò)實(shí)際數(shù)據(jù)反演精度的有效策略[14-16]。
在制作合成數(shù)據(jù)標(biāo)簽時(shí),保證標(biāo)簽的典型性和多樣性,避免大量特征相近標(biāo)簽的出現(xiàn),是提升網(wǎng)絡(luò)收斂速度的關(guān)鍵。本文提出基于數(shù)據(jù)增廣和主動(dòng)學(xué)習(xí)的策略進(jìn)行波阻抗反演網(wǎng)絡(luò)訓(xùn)練。主動(dòng)學(xué)習(xí)[17-18]不僅可以有效減少標(biāo)簽數(shù)量,而且能夠優(yōu)選出典型標(biāo)簽。通過對(duì)這些優(yōu)選單道阻抗標(biāo)簽數(shù)據(jù)以內(nèi)插重采樣的方法進(jìn)行增廣,可對(duì)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行有效訓(xùn)練。Marmousi 2模型測(cè)試結(jié)果表明,僅用14道阻抗增廣后的數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),即可獲得整個(gè)模型3400道數(shù)據(jù)的高精度反演結(jié)果。
一般常用的增廣方式有裁剪、復(fù)制、增強(qiáng)特征、統(tǒng)計(jì)分布再抽樣等,通過增加數(shù)據(jù)多樣性提高網(wǎng)絡(luò)模型泛化能力。對(duì)于時(shí)間序列源數(shù)據(jù),增廣方式主要從采樣頻率和時(shí)間窗著手,常見的增廣方式有縮小采樣頻率的上采樣、放大采樣頻率的下采樣和同等采樣頻率的重采樣。插值方法也有許多種,常用的有線性插值、三次樣條插值等。為保證時(shí)間維度上的走勢(shì)一致性,本文采用三次樣條插值[19]。
用N維列向量d、r、I分別表示地震剖面的一道數(shù)據(jù)及對(duì)應(yīng)的反射系數(shù)序列和波阻抗,通過Toe-plitz型子波矩陣W,可將地震子波與反射系數(shù)序列的卷積運(yùn)算寫為[20-21]
d=W*r
(1)
I與r的關(guān)系可表示為
(2)
引入時(shí)移循環(huán)矩陣K為隨機(jī)核,與式(1)等號(hào)兩邊相乘。對(duì)于時(shí)不變地震子波,K與W可交換次序[22],可得
K*d=W*K*r
(3)
(4)
上述縱向內(nèi)插重采樣的具體步驟如下:
(1)任取一個(gè)N維波阻抗I,通過三次樣條插值為N*維波阻抗(本文實(shí)驗(yàn)中,取N*=10N);
在實(shí)際應(yīng)用中,子波在水平或垂直方向上經(jīng)常發(fā)生變化。地質(zhì)和巖性的非平穩(wěn)性變化會(huì)給估計(jì)子波帶來挑戰(zhàn)。本文增廣方法的最大優(yōu)勢(shì)是可以避開關(guān)于地震子波W的大量運(yùn)算,從而減小誤差[23]。
圖1 原始波阻抗曲線(紅色粗線)與增廣后曲線對(duì)比
圖2 增廣地震道(a)和反射系數(shù)(b)與原始曲線(紅色粗線)的對(duì)比
全卷積網(wǎng)絡(luò)(FCN)是一種沒有全連接層的卷積神經(jīng)網(wǎng)絡(luò),能夠根據(jù)任意大小的輸入進(jìn)行預(yù)測(cè),可用于解決反演問題[24]。在深度學(xué)習(xí)中,基于恒等映射的殘差網(wǎng)絡(luò)可緩解網(wǎng)絡(luò)隨著層數(shù)增加出現(xiàn)性能退化的現(xiàn)象[25]。結(jié)合這兩種網(wǎng)絡(luò)優(yōu)點(diǎn)而設(shè)計(jì)的全卷積殘差網(wǎng)絡(luò)(FCRN),在提高預(yù)測(cè)精度的同時(shí),緩解了網(wǎng)絡(luò)訓(xùn)練困難的問題[26]。
FCRN結(jié)構(gòu)如圖 3所示,由首尾兩個(gè)一維卷積 層(Conv)和中間三個(gè)殘差塊組成。首端卷積層由16個(gè)大小為300×1的核組成;每個(gè)殘差塊由兩個(gè)一維卷積層組成,其中第一層擁有16個(gè)大小為300×1的核,第二層擁有16個(gè)大小為3×1的核;末端卷積層擁有1個(gè)大小為3×1的核。所有卷積層中使用零填充,以保證每個(gè)卷積層的輸入和輸出大小相同。為了加快網(wǎng)絡(luò)收斂速度,F(xiàn)CRN選擇了整流線性激活單元(ReLU);并且除了最后一層外,對(duì)所有卷積層的輸出應(yīng)用了批量歸一化處理(BN)[27-28]。
圖3 FCRN結(jié)構(gòu)[24]
Wu等[26]提出的FCRN網(wǎng)絡(luò)是以單道對(duì)單道的形式進(jìn)行訓(xùn)練的,即在訓(xùn)練集中,一道地震數(shù)據(jù)輸入對(duì)應(yīng)一道波阻抗輸出。令I(lǐng)real(d)表示地震道d對(duì)應(yīng)的波阻抗真值,F(xiàn)表示訓(xùn)練出的反演網(wǎng)絡(luò),Θ表示網(wǎng)絡(luò)參數(shù)的集合,則可用FΘ(d)表示網(wǎng)絡(luò)預(yù)測(cè)出的一道波阻抗。網(wǎng)絡(luò)的損失函數(shù)可用均方誤差計(jì)算,定義為
(5)
由于小批量訓(xùn)練方法能夠提高網(wǎng)絡(luò)的泛化能力,本文設(shè)置Batch(批處理)大小為10;更新權(quán)重部分選擇Adam算法優(yōu)化網(wǎng)絡(luò)中的參數(shù),權(quán)重衰減設(shè)置為10-7;Epoch(訓(xùn)練集中的樣本遍歷次數(shù))的數(shù)目設(shè)為10,學(xué)習(xí)率設(shè)置為0.001。為避免過擬合,當(dāng)驗(yàn)證損失開始增加時(shí),停止網(wǎng)絡(luò)訓(xùn)練[29-30]。
主動(dòng)學(xué)習(xí)是機(jī)器學(xué)習(xí)算法之一。在數(shù)據(jù)集十分龐大時(shí),可利用較少的訓(xùn)練數(shù)據(jù),在更短時(shí)間內(nèi)獲得相同甚至更好的學(xué)習(xí)效果。減少標(biāo)簽數(shù)據(jù)、利用很少的數(shù)據(jù)訓(xùn)練出強(qiáng)泛化能力的模型,是主動(dòng)學(xué)習(xí)最大的優(yōu)勢(shì)。
在實(shí)際訓(xùn)練過程中,訓(xùn)練一次后的網(wǎng)絡(luò)盡管在訓(xùn)練集上表現(xiàn)良好,但在驗(yàn)證集上仍與目標(biāo)值存在一定差距。這時(shí)便需要借鑒主動(dòng)學(xué)習(xí)的思想,根據(jù)誤差對(duì)此次訓(xùn)練集中的數(shù)據(jù)進(jìn)行調(diào)整,直至下一次訓(xùn)練出的網(wǎng)絡(luò)在驗(yàn)證集上的誤差小于目標(biāo)誤差值。
2.2.1 初始選擇策略
2.2.2 網(wǎng)絡(luò)迭代方法
(6)
則第i次預(yù)測(cè)整體誤差為
(7)
為避免峰值誤差對(duì)判斷的負(fù)面影響,減少主動(dòng)學(xué)習(xí)迭代次數(shù),本文引入平滑窗的概念,對(duì)剖面上的單道誤差做平滑處理,改進(jìn)最大誤差的計(jì)算方法。
圖4 主動(dòng)學(xué)習(xí)每次迭代后選取新數(shù)據(jù)的流程藍(lán)線為單道預(yù)測(cè)誤差曲線,紅線為平均誤差曲線
(8)
圖5 反演網(wǎng)絡(luò)迭代總流程
本文實(shí)驗(yàn)的所有數(shù)據(jù)基于減采樣后的Mar-mousi 2模型[31](圖 6),橫向共有3400道,縱向有2800個(gè)時(shí)間采樣點(diǎn),采樣間隔為1ms。
圖6 Marmousi 2波阻抗模型及初始訓(xùn)練樣本位置(紅色豎線所示)
在網(wǎng)絡(luò)迭代之前,人工選取了7道作為訓(xùn)練樣本,其道號(hào)分別為249、599、1674、1799、2199、2499、2999。
圖7 網(wǎng)絡(luò)迭代誤差曲線隨迭代次數(shù)的變化
圖8 縱向數(shù)據(jù)增廣波阻抗預(yù)測(cè)剖面及誤差曲線
與縱向內(nèi)插重采樣不同,橫向數(shù)據(jù)增廣的過程如下。
假設(shè)現(xiàn)有7道波阻抗數(shù)據(jù),其位置與圖 6相同,將其按位置順序展開如圖9a所示。在橫向上,采用最簡單的線性內(nèi)插方法,內(nèi)插成7×100道作為示例,如圖9b所示。
圖9 7道波阻抗信息(a)及其橫向內(nèi)插結(jié)果(b)
當(dāng)主動(dòng)學(xué)習(xí)根據(jù)圖4流程完成一次對(duì)新位置的選取后,橫向增廣要將新位置按橫坐標(biāo)插入訓(xùn)練集中,再進(jìn)行內(nèi)插。橫向數(shù)據(jù)增廣和主動(dòng)學(xué)習(xí)的地震波阻抗反演的流程如圖10所示。
圖10 橫向內(nèi)插數(shù)據(jù)增廣和主動(dòng)學(xué)習(xí)的波阻抗反演流程
橫向內(nèi)插數(shù)據(jù)增廣和主動(dòng)學(xué)習(xí)的地震波阻抗反演8次迭代后得到的結(jié)果如圖11所示。其最大誤差為0.3139,整體誤差為0.1197,均高于圖8中的誤差。說明本文所提出的內(nèi)插重采樣波阻抗增廣方法優(yōu)于橫向內(nèi)插方法。
圖11 橫向數(shù)據(jù)增廣波阻抗預(yù)測(cè)剖面及其誤差曲線
與主動(dòng)學(xué)習(xí)不同,非主動(dòng)學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練方法采用隨機(jī)選擇初始訓(xùn)練樣本進(jìn)行數(shù)據(jù)增廣訓(xùn)練網(wǎng)絡(luò);且前后迭代之間并無任何關(guān)系,每一次的網(wǎng)絡(luò)訓(xùn)練都是獨(dú)立的,重新隨機(jī)選取訓(xùn)練樣本。
隨機(jī)迭代的效果在同樣規(guī)模的訓(xùn)練集下,預(yù)測(cè)精度低于主動(dòng)學(xué)習(xí)方法。將14×1000道的數(shù)據(jù)規(guī)模作為標(biāo)準(zhǔn),考察在同樣數(shù)據(jù)規(guī)模下的隨機(jī)選擇樣本網(wǎng)絡(luò)預(yù)測(cè)效果。但由于沒有借助主動(dòng)學(xué)習(xí)策略,其預(yù)測(cè)效果欠佳,并不具有可比性。
在隨機(jī)選擇140個(gè)位置,每個(gè)位置增廣100道數(shù)據(jù)時(shí),反演結(jié)果如圖12所示,最大誤差為0.0609,整體誤差為0.0218,比圖8的最大誤差和整體誤差略小。
對(duì)比圖12與圖8可知,雖然隨機(jī)迭代的整體預(yù)測(cè)效果與主動(dòng)學(xué)習(xí)迭代效果相近,但隨機(jī)迭代選取了140個(gè)位置的數(shù)據(jù),主動(dòng)學(xué)習(xí)迭代只選取了14個(gè)位置的數(shù)據(jù)。而且,基于隨機(jī)樣本選取的預(yù)測(cè)結(jié)果誤差主要集中于結(jié)構(gòu)復(fù)雜橫向變化劇烈的1600~2200道。該結(jié)果說明主動(dòng)學(xué)習(xí)迭代方式可挑選更為典型的訓(xùn)練樣本,使預(yù)測(cè)誤差在整個(gè)數(shù)據(jù)集上得到有效控制,而不是集中于少數(shù)變化強(qiáng)烈位置。
圖12 隨機(jī)迭代方法的波阻抗反演剖面及誤差
本文首先在理論上推導(dǎo)了單道內(nèi)插重采樣的增廣方法,生成了反演網(wǎng)絡(luò)訓(xùn)練集;然后應(yīng)用主動(dòng)學(xué)習(xí),配置了反演網(wǎng)絡(luò)參數(shù)并確定了參數(shù)更新方式。Marmousi 2模型實(shí)驗(yàn)結(jié)果表明,本文提出的算法只需14道真實(shí)的地震波阻抗信息,就可以反演出相對(duì)真實(shí)的波阻抗剖面。
本文并未對(duì)網(wǎng)絡(luò)性能提升以及泛化能力展開研究。首先,可以通過優(yōu)化FCRN網(wǎng)絡(luò)結(jié)構(gòu)的方式,提高反演精度,減少迭代次數(shù),并使反演誤差在整個(gè)剖面上較為均衡,更有利于實(shí)際應(yīng)用;其次,對(duì)實(shí)際數(shù)據(jù)進(jìn)行增廣,并與遷移學(xué)習(xí)結(jié)合,檢驗(yàn)本文方法在實(shí)際數(shù)據(jù)上波阻抗反演效果;再次,本文僅為單參數(shù)反演,在對(duì)多個(gè)彈性參數(shù)進(jìn)行反演時(shí)如何利用主動(dòng)學(xué)習(xí)策略對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,也是值得研究的方向之一。