馮其紅, 李玉潤(rùn), 王 森, 任佳偉, 周代余, 范 坤
(1.中國(guó)石油大學(xué)(華東)石油工程學(xué)院,山東青島 266580; 2.非常規(guī)油氣開(kāi)發(fā)教育部重點(diǎn)實(shí)驗(yàn)室(中國(guó)石油大學(xué)(華東)),山東青島 266580; 3.中國(guó)石油塔里木油田公司勘探開(kāi)發(fā)研究院,新疆庫(kù)爾勒 841000)
氣竄一直以來(lái)都是影響注氣開(kāi)發(fā)的主要因素,通過(guò)前期的地質(zhì)生產(chǎn)數(shù)據(jù)預(yù)測(cè)氣竄形成在注氣開(kāi)發(fā)中具有重要意義[1-2]。注入氣體(甲烷、CO2等)在油藏條件下的運(yùn)移受混溶、降黏、膨脹、傳質(zhì)等多種機(jī)制控制[3-7],氣竄形成需要考慮組分之間的相互作用,對(duì)于高維空間變量進(jìn)行數(shù)值模擬,對(duì)計(jì)算力的要求非常高,尤其是進(jìn)行大規(guī)模動(dòng)態(tài)預(yù)測(cè),實(shí)際應(yīng)用中會(huì)考慮使用代理模型進(jìn)行計(jì)算優(yōu)化。常規(guī)的代理模型,克里金法、監(jiān)督式機(jī)器學(xué)習(xí)等對(duì)于高維空間面臨著運(yùn)算量爆炸增長(zhǎng)的情況[8-10];正交分解、混沌多項(xiàng)式展開(kāi)等方法,根據(jù)實(shí)際的模型建立恰當(dāng)?shù)年P(guān)系式需要很高的技巧,不適用于復(fù)雜的映射情況[11-12]。近幾年,生成對(duì)抗神經(jīng)網(wǎng)絡(luò)模型在高維模型輸入和輸出域之間的映射關(guān)系表現(xiàn)出卓越的性能[9,13-14],Sun[15]利用SPID-GAN識(shí)別地層條件的狀態(tài)參數(shù)。Liu等[16-18]將深度卷積網(wǎng)絡(luò)引入對(duì)抗神經(jīng)網(wǎng)絡(luò)中,應(yīng)用自動(dòng)編碼和自動(dòng)解碼技術(shù),加強(qiáng)了GAN模型訓(xùn)練的穩(wěn)定性。筆者利用DC-GAN框架建立從原始的高維地層參數(shù)輸入到生產(chǎn)過(guò)程中高維地層信息輸出之間的映射關(guān)系(pix2pix),通過(guò)深度卷積網(wǎng)絡(luò)和反卷積網(wǎng)絡(luò),提取輸入?yún)?shù)的特征信息并建立映射關(guān)系,判別器采用交叉熵?fù)p失函數(shù),來(lái)實(shí)現(xiàn)注氣之后氣竄方向的判斷。
生成對(duì)抗網(wǎng)絡(luò)模型(GAN)是由Goodfellow等率先提出的,由一對(duì)生成器和鑒別器組成?;舅枷胧峭ㄟ^(guò)鑒別器和生成器的相互博弈、相互對(duì)抗尋找到高維參數(shù)空間的納什均衡點(diǎn)。GAN網(wǎng)絡(luò)構(gòu)建思路見(jiàn)圖1。生成器G(x)代表輸入圖像到生成圖像的映射關(guān)系G(x):X->Y,判別器D用于識(shí)別數(shù)據(jù)是來(lái)自于生成器生成的模型D(y)還是實(shí)際計(jì)算得到的模型D(G(x))。GAN的優(yōu)勢(shì)在于對(duì)于數(shù)據(jù)分布的假設(shè)要求低,既能適應(yīng)高維參數(shù)的映射又能夠突破高斯分布的限制[15]。在生產(chǎn)對(duì)抗神經(jīng)網(wǎng)絡(luò)中,生成器G和判別器D的代價(jià)函數(shù)V(G,D)表示為
圖1 GAN網(wǎng)絡(luò)構(gòu)建思路
minGmaxDV(D,G)=Ex~pd(x)×
[lgD(x)]+Ez~pz(z)[lg(1-D(G(z)))].
(1)
式中,Ex~pd(x)和Ez~pz(z)表示求解來(lái)自真實(shí)數(shù)據(jù)的期望和來(lái)自生產(chǎn)數(shù)據(jù)的期望;x為實(shí)際油藏的模擬飽和度,服從分布pd(x);z為輸入的油藏滲透率場(chǎng)數(shù)據(jù),服從滲透率的分布pz(z)。
生成器的作用是讓生成樣本盡可能接近真實(shí)樣本,即D(G(x))越接近1越好;判別器的作用是讓D(y)盡可能接近1,讓D(G(x))接近0。在訓(xùn)練過(guò)程中,GAN通過(guò)迭代計(jì)算不斷提高生成器和判別器的能力。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)由卷積層、激活層和池化層組成,通過(guò)提取圖像特征,引入非線性映射關(guān)系,降低圖像特征維數(shù),提高神經(jīng)網(wǎng)絡(luò)的性能和泛化性[19]。CNN中卷積層在提取圖像特征的同時(shí),能夠保留原始圖像中像素之間的空間關(guān)系。通過(guò)卷積核在圖片上的移動(dòng),讀取每一個(gè)小區(qū)域內(nèi)的像素之和獲得新的輸出,輸出的矩陣稱為特征圖。深度學(xué)習(xí)中的卷積內(nèi)核為2維權(quán)重的數(shù)組(例如2×2的單位矩陣)。每個(gè)2維權(quán)重?cái)?shù)組都作用于上一層的輸入通道,并進(jìn)一步生成多通道的圖像,然后將它們加在一起形成一個(gè)新的單個(gè)輸出特征圖。對(duì)所有權(quán)重?cái)?shù)組重復(fù)此過(guò)程,生成多個(gè)不同的特征圖作為新的輸出層。具有不同權(quán)重的卷積核將為同一輸入圖像生成不同的特征圖,前幾次卷積的卷積層主要從圖像中提取結(jié)構(gòu)細(xì)節(jié)和位置信息,高次卷積的特征圖包含較少的位置信息和更復(fù)雜的含義。整個(gè)過(guò)程不斷地使用反向誤差傳播,在訓(xùn)練過(guò)程中學(xué)習(xí)和優(yōu)化帶權(quán)重的卷積核[20]。卷積過(guò)程如圖2所示。
圖2 深度卷積網(wǎng)絡(luò)卷積過(guò)程
池化層的作用是在卷積和激活后對(duì)特征圖進(jìn)行下采樣操作降低其維數(shù),用時(shí)保留部分重要信息。池化層的結(jié)果是降低卷積后特征信息的維度,池化窗口的移動(dòng)也是擴(kuò)大每一個(gè)神經(jīng)元的感受野(receptive field)的過(guò)程。池化層的目的是緩解卷積層對(duì)位置的過(guò)度敏感性,改善整個(gè)神經(jīng)網(wǎng)絡(luò)的泛化能力,并使其能夠抵抗較小的變換、縮放和變形[21]。
全連接層是常規(guī)的多層感知器,并遵循softmax函數(shù)作為分類器。這種結(jié)構(gòu)將卷積模塊的輸出與常規(guī)神經(jīng)網(wǎng)絡(luò)分類器輸入連接在一起。全連接層使用卷積層提取的特征將輸入圖像分為不同的類別。完全連接層中的每個(gè)神經(jīng)元都連接到上一層中的所有神經(jīng)元。值得注意的是,可以將完全連接的層轉(zhuǎn)換為卷積層,因?yàn)檫@些層具有相同的功能形式。這些層之間的唯一區(qū)別是,卷積內(nèi)核連接到輸入層的本地區(qū)域,而完全連接的內(nèi)核覆蓋整個(gè)輸入?yún)^(qū)域。
深度卷積生產(chǎn)對(duì)抗網(wǎng)絡(luò)DC-GAN是GAN的一種變形,其思路與GAN框架相同。在對(duì)生成器進(jìn)行構(gòu)建的過(guò)程中使用了深度卷積網(wǎng)絡(luò)來(lái)代替?zhèn)鹘y(tǒng)的非線性映射,通過(guò)輸入高維參數(shù),經(jīng)過(guò)一系列卷積操作,包括卷積、偏置、歸一化、激活4個(gè)步驟,形成中間參數(shù)特征圖像,在通過(guò)一系列的反卷積操作進(jìn)行上采樣,形成高維映射后的圖像。生成器的設(shè)計(jì)遵循Ronneberger等[14]最初提出的U-net設(shè)計(jì)。設(shè)置卷積層和反卷積層的內(nèi)核均為4×4,步長(zhǎng)為2。濾波器數(shù)量隨著卷積層的增大而增大,設(shè)置最大數(shù)量為2 048,以此來(lái)學(xué)習(xí)圖像中不容易觀察到的細(xì)節(jié)。在反卷積過(guò)程中,將來(lái)自卷積的特征圖與來(lái)自編碼器的細(xì)粒度特征圖組合在一起。輸出層使用雙曲正切函數(shù)(tanh)作為激活函數(shù)來(lái)恢復(fù)連續(xù)值,并生成具有與輸入圖像大小相同的輸出圖像。具體過(guò)程如圖3所示。
圖3 構(gòu)建DC-GAN網(wǎng)絡(luò)識(shí)別優(yōu)勢(shì)通道
輸入圖像經(jīng)過(guò)6層卷積,卷積核、步長(zhǎng)和邊框分別為4、2、1,反卷積層的大小與通過(guò)線段連接的卷積層對(duì)應(yīng),卷積參數(shù)相同。左側(cè)通過(guò)卷積提取特征圖像,右側(cè)通過(guò)反卷積獲得真實(shí)圖形的信息。左側(cè)輸入滲透率圖像,右側(cè)輸出氣相飽和度圖像。生成器執(zhí)行圖像到圖像的轉(zhuǎn)換,而鑒別器是一個(gè)分類器,給出生成器輸出數(shù)據(jù)的真實(shí)程度。
在判別器構(gòu)建上,DC-GAN采用CNN網(wǎng)絡(luò)實(shí)現(xiàn),采用步長(zhǎng)卷積代替池化層的操作。步長(zhǎng)卷積的方法是通過(guò)建立上一層的感受野到下一層像素點(diǎn)的映射來(lái)反映采樣區(qū)域的特性。激活函數(shù)采用ReLU函數(shù),ReLU函數(shù)的特點(diǎn)是能夠過(guò)濾負(fù)值,保持負(fù)半軸始終為0。ReLU函數(shù)如圖4所示,在大多數(shù)情況下ReLU會(huì)比其他激活函數(shù)更快地訓(xùn)練神經(jīng)網(wǎng)絡(luò)[19],其中ReLU函數(shù)設(shè)置所有負(fù)值均為零。
圖4 激活函數(shù)圖形
在訓(xùn)練過(guò)程中交替地優(yōu)化生成模型和判別模型,在網(wǎng)絡(luò)訓(xùn)練中分別對(duì)鑒別器網(wǎng)絡(luò)D和生成器網(wǎng)絡(luò)G進(jìn)行交替優(yōu)化。用適應(yīng)性矩估計(jì)(adam)求解器采用降低學(xué)習(xí)速率選項(xiàng)減少出現(xiàn)數(shù)值振蕩。
通過(guò)結(jié)構(gòu)相似性指數(shù)(SSIM)方法計(jì)算兩個(gè)圖片之間的相似程度[21]。SSIM利用人類視覺(jué)提取信息的思想,考慮了圖像的結(jié)構(gòu)計(jì)算兩個(gè)圖片的相似程度,當(dāng)空間上的點(diǎn)距離越近,相關(guān)關(guān)系就會(huì)越凸顯。SSIM指數(shù)由3部分組成:亮度相似度l(x,y)、對(duì)比相似度c(x,y)和結(jié)構(gòu)相似性指數(shù)s(x,y)。其表達(dá)形式[22]為
SSIM(x,y)=[l(x,y)]α×[c(x,y)]β×[s(x,y)]γ.
(2)
通過(guò)使用x和y的樣本統(tǒng)計(jì)量計(jì)算這3個(gè)相似度。首先,通過(guò)比較樣本均值獲得亮度l(x,y)的相似度x和y,表示為
(3)
(4)
(5)
采用SSIM計(jì)算相似程度的優(yōu)點(diǎn)在于:①SSIM函數(shù)具有對(duì)稱性,SSIM(x,y)=SSIM(y,x);②SSIM閾值在[-1,1]之間;③SSIM最大值為1,當(dāng)且僅當(dāng)x=y。
在利用DC-GAN訓(xùn)練在油藏中注入氣體(烴氣)的驅(qū)替過(guò)程的替代模型中,假設(shè)在油藏中水相只有束縛水,氣相只有注入的氣體,采用達(dá)西滲流方程表征流量與儲(chǔ)層特性、流體特性和流體壓力之間的關(guān)系:
(6)
式中,下標(biāo)i表示相,包括油相和氣相;qi為相流量,m3/d;k為絕對(duì)滲透率,μm2;kr,i為相對(duì)磁導(dǎo)率;ρi為流體密度,kg/m3;μi為黏度,mPa·s;pi為某一相的流體壓力,MPa。
油氣組分的物質(zhì)平衡方程[23]可表示為
(7)
注入的天然氣與地層原油之間會(huì)發(fā)生相間傳質(zhì)現(xiàn)象,形成混相帶。通過(guò)油氣組分間的傳質(zhì)作用,原油與注入流體在流動(dòng)過(guò)程中不斷接觸而形成混相。在組分模擬中,質(zhì)量平衡用Rachford-Rice方程求解,表示為
(8)
式中,zi為組分i的總物質(zhì)的量分?jǐn)?shù);fv為氣相體積分?jǐn)?shù);Nc為組分?jǐn)?shù);Ki為組分的平衡比。
油氣組分分布可根據(jù)求解逸度的熱力學(xué)平衡方程實(shí)現(xiàn),處于平衡狀態(tài),滿足
fi,l(T,pl,xi)=fi,l(T,pv,yi).
(9)
式中,fi,l和fi,v分別為組分i在液相和氣相中的逸度,MPa;T為溫度,K;pl和pv分別為液相和氣相壓力,MPa。
可以使用Peng-Robinson狀態(tài)方程計(jì)算氣相和液相的逸度,表示為
Z3-(1-B)Z2+(A-3B2-2B)Z-(AB-B2-B3)=0.
(10)
式中,Z表示可壓縮性;A、B為與壓力、溫度和純組分有關(guān)的函數(shù)[24]。
基于塔里木油田實(shí)際情況,建立一系列的地質(zhì)模型。油藏尺寸為2 000 m×2 000 m×10 m,根據(jù)礦場(chǎng)實(shí)際井網(wǎng)條件設(shè)置兩口注氣井、3口采油井,井網(wǎng)分布如圖5中左圖所示(加箭頭的黑色圓圈表示注入井,紅色圓圈表示生產(chǎn)井),定流量100 m3/d(地下條件)注入;注入氣體為烴氣,油層深度為4 800 m,厚度為20 m,初始?jí)毫?9.8 MPa,生產(chǎn)壓差為8 MPa,巖石壓縮系數(shù)為2×10-4MPa-1,滲透率利用順序高斯生成器生成平均滲透率在(100~500)×10-3μm2的4 000個(gè)地質(zhì)圖像。預(yù)測(cè)的滲透率圖像和直方圖如圖5所示。模型的滲透率是使用高斯變異函數(shù)模型進(jìn)行模擬,頻率直方圖的間隔是10×10-3μm2。由于模型中設(shè)置的物理長(zhǎng)度不同,滲透率的分布并不是嚴(yán)格的高斯分布。對(duì)4 000組不同的滲透率分布模型進(jìn)行數(shù)值模擬,求解氣體飽和度,訓(xùn)練生成對(duì)抗神經(jīng)網(wǎng)絡(luò)。飽和度圖像每隔20 d輸出一次,孔隙度根據(jù)Carman-Kozeny公式.[25]計(jì)算得
(11)
式中,dm為孔隙直徑,取38.07 μm。
訓(xùn)練得到DC-GAN訓(xùn)練損失值與時(shí)間的關(guān)系如圖6所示。分析不同生產(chǎn)時(shí)間下訓(xùn)練損失值與迭代次數(shù)的關(guān)系,為了更好地觀察一開(kāi)始迭代達(dá)到平衡的狀態(tài),對(duì)于100、200、300和400 d的模型繪制了到第1 400步的生成器和判別器的損失函數(shù)值。設(shè)置最大訓(xùn)練迭代次數(shù)為3 000次,每一次的訓(xùn)練都包括對(duì)于生成器和判別器的獨(dú)立訓(xùn)練過(guò)程。對(duì)于多數(shù)模型,訓(xùn)練迭代次數(shù)在500次前,模型可以達(dá)到納什均衡的狀態(tài),即生成器和判別器形成了有效的對(duì)抗競(jìng)爭(zhēng)關(guān)系,模型的精確度在訓(xùn)練中達(dá)到平衡。在投產(chǎn)500 d的模型中,氣相的飽和度由于分布形態(tài)復(fù)雜,生產(chǎn)井多數(shù)已經(jīng)見(jiàn)氣,特征參數(shù)比之前的要復(fù)雜的多,需要更多的訓(xùn)練次數(shù)才能達(dá)到平衡,如圖6(e)所示。
在相同滲透率條件下,繪制出由DC-GAN模型訓(xùn)練生成的氣相飽和度,將其與油藏模擬器得到的氣相飽和度進(jìn)行對(duì)比,如圖7所示。計(jì)算訓(xùn)練結(jié)果與油藏組分模擬器結(jié)果的圖像相似度(SSIM值)進(jìn)行對(duì)比,當(dāng)訓(xùn)練次數(shù)達(dá)到2 000時(shí),圖像相似度可超過(guò)90%,訓(xùn)練結(jié)果與傳統(tǒng)數(shù)模結(jié)果一致(圖7最后兩行圖片)?;贒C-GAN框架訓(xùn)練得到的氣相飽和度分布能夠精確地提取氣相飽和度隨時(shí)間變化的分布特征,從而代替實(shí)際模型的注氣結(jié)果,體現(xiàn)了DC-GAN模型的可靠性。
對(duì)比分析圖7中t=400 d和t=500 d時(shí)的氣相飽和度可以得出,對(duì)于中心注氣井,在儲(chǔ)層的東北和西南方向,氣體存在明顯的突進(jìn)趨勢(shì)。對(duì)于西北方向的注氣井,由于地層滲透率低和中心注氣井的干預(yù)情況,難以形成較大的壓力梯度,氣體竄進(jìn)能力很弱。對(duì)于開(kāi)發(fā)條件類似的同類油藏,可通過(guò)DC-GAN模型快速地預(yù)測(cè)氣體竄流方向。
圖7 不同投產(chǎn)時(shí)間下訓(xùn)練次數(shù)對(duì)比
對(duì)比不同時(shí)間的圖像相似度(SSIM值)可知:迭代次數(shù)在400步之前,多數(shù)訓(xùn)練還停留在一個(gè)初步、混沌的映射狀態(tài);當(dāng)?shù)?00~1 000步的訓(xùn)練階段,訓(xùn)練結(jié)果多數(shù)達(dá)到了穩(wěn)定、高質(zhì)量的映射狀態(tài)(圖8中200、300、400、500 d的曲線),之后訓(xùn)練的相似度變化幅度浮動(dòng)很小。
圖8 不同訓(xùn)練次數(shù)下SSIM值波動(dòng)示意圖(平滑窗口10)
在投產(chǎn)100 d的訓(xùn)練模型中,當(dāng)訓(xùn)練次數(shù)約1 100時(shí),相似度(SSIM值)有明顯波動(dòng)現(xiàn)象,這是由于不同滲透率條件下所形成的氣相飽和度圖像差異性較小,生成器中的卷積層在提取特征時(shí)難以快速地獲取到圖像的不同特征,所需訓(xùn)練時(shí)間較長(zhǎng)。
在投產(chǎn)500 d的訓(xùn)練模型中,不同訓(xùn)練次數(shù)下的相似度(SSIM值)小于其他生產(chǎn)時(shí)間模型的相似度。與訓(xùn)練誤差的圖像(圖6)對(duì)比后,可以看出,對(duì)于在訓(xùn)練過(guò)程中有波動(dòng)的模型,在相似度的變化上也有所不同。訓(xùn)練的波動(dòng)情況在一定程度上能反應(yīng)SSIM值的大小,雖然最后都達(dá)到了穩(wěn)定狀態(tài),但是波動(dòng)情況劇烈的訓(xùn)練過(guò)程會(huì)導(dǎo)致較小的SSIM值。
圖6 不同時(shí)間下DC-GAN訓(xùn)練過(guò)程
(1)DC-GAN是一種深度學(xué)習(xí)模型,在學(xué)習(xí)高維映射方面有獨(dú)特的優(yōu)勢(shì)。通過(guò)GAN框架建立高維數(shù)值模擬的替代模型,訓(xùn)練好的代理模型,能夠快速準(zhǔn)確地預(yù)測(cè)氣相飽和度的分布,進(jìn)而判斷氣竄可能出現(xiàn)的方向,模型對(duì)于計(jì)算性能要求很低,計(jì)算時(shí)間短,可移植性強(qiáng)。
(2)DC-GAN模型通過(guò)預(yù)測(cè)氣相飽和度的分布得到氣竄方向,在不同時(shí)間段的訓(xùn)練中,模型結(jié)果與數(shù)值模擬結(jié)果對(duì)比,圖像的結(jié)構(gòu)相似性指數(shù)超過(guò)0.9,能夠代替油藏?cái)?shù)值模擬計(jì)算過(guò)程。
(3)利用DC-GAN框架,通過(guò)卷積層和反卷積層過(guò)程,可以精確地實(shí)現(xiàn)特征圖像的提取和實(shí)際圖像的構(gòu)建;可以不引入其他限制條件,實(shí)現(xiàn)高維數(shù)據(jù)之間的映射,是一種基于數(shù)據(jù)驅(qū)動(dòng)的代理模型構(gòu)建方法。
中國(guó)石油大學(xué)學(xué)報(bào)(自然科學(xué)版)2020年4期