張 挺, 王先武, 杜 奕, 彭 源
(1.上海電力大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 上海 200090;2.上海第二工業(yè)大學(xué) 工學(xué)部, 上海 201209)
隨著常規(guī)油氣資源的日益枯竭,頁巖氣等非常規(guī)油氣能源的勘探與開發(fā)越來越受到人們的重視。目前我國頁巖氣的主要產(chǎn)區(qū)是涪陵、長寧、威遠(yuǎn)等地,較多資源埋深超過3 500 m,地質(zhì)條件復(fù)雜,了解和掌握頁巖儲層的內(nèi)部結(jié)構(gòu)是開采頁巖氣的基礎(chǔ)[1]。頁巖儲層結(jié)構(gòu)復(fù)雜,其巖石組成包含有機(jī)質(zhì)、黏土礦物、石英等脆性礦物以及碳酸鹽礦物,并含有一定量的長石、云母、方解石、白云石、黃鐵礦等礦物。對頁巖儲層內(nèi)部結(jié)構(gòu)的評價存在著諸多問題,如孔隙和裂縫結(jié)構(gòu)非常復(fù)雜、非均質(zhì)性強(qiáng)、物性變化大等。目前可以通過CT成像的方式觀察頁巖內(nèi)部結(jié)構(gòu),但CT成像需要專用且昂貴的設(shè)備,且通常只能獲取所研究巖石樣本的小范圍圖像,難以重建較大區(qū)域的頁巖結(jié)構(gòu)。為了評估頁巖儲層,必須進(jìn)行大量物理實(shí)驗(yàn),以獲得更大范圍的分布情況,成本較大[2]??臻g數(shù)據(jù)建模已被廣泛用于巖石重構(gòu)。原始的空間數(shù)據(jù)建模方法依賴兩點(diǎn)概率函數(shù)度量空間變異性,使用訓(xùn)練圖像作為樣本特征提取的方式是目前空間數(shù)據(jù)建模方法的主流[3-5]。通常假定這些訓(xùn)練圖像具有平穩(wěn)的特征分布,并依賴學(xué)習(xí)訓(xùn)練圖像特征來重構(gòu)空間數(shù)據(jù)。
深度學(xué)習(xí)具有很強(qiáng)的提取特征能力,可以用于提取訓(xùn)練圖像的結(jié)構(gòu)特征,而生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GANs)是深度學(xué)習(xí)的一個重要分支。深度卷積生成對抗網(wǎng)絡(luò)(Deep Convolutional Generative Adversarial Networks,DCGANs)是GANs的一種主要變體,整體結(jié)構(gòu)與GANs基本相同,是一種無監(jiān)督機(jī)器學(xué)習(xí)方法,可在給定一組訓(xùn)練圖像的情況下重構(gòu)未知圖像。本文提出了一種基于DCGANs重建頁巖的新方法,雖然DCGANs的訓(xùn)練要確定一組相對穩(wěn)定的超參數(shù),但是用于生成圖像的參數(shù)集可以在訓(xùn)練后存儲,從而可以快速生成新的重構(gòu)樣本。
GANs是在深度學(xué)習(xí)的背景下提出的,是一種從訓(xùn)練圖像中學(xué)習(xí)高維概率分布表示的方法[6]。訓(xùn)練圖像呈現(xiàn)了圖像空間中表示概率分布的代表性樣本。GANs包含兩個可區(qū)分的函數(shù):鑒別器D和生成器G。生成器G將隨機(jī)變量從隨機(jī)噪聲z映射到圖像空間得到生成圖像G(z)。z通常由正態(tài)分布pz的獨(dú)立實(shí)數(shù)隨機(jī)組成,代表生成器的隨機(jī)輸入。鑒別器D的作用是計(jì)算隨機(jī)樣本來自“真實(shí)”數(shù)據(jù)的概率分布pdata。鑒別器嘗試正確標(biāo)記每個樣本,而生成器嘗試“欺騙”鑒別器,標(biāo)記生成圖像G(z)作為真實(shí)數(shù)據(jù)分布的一部分,即實(shí)現(xiàn)D(G(z))接近1。GANs結(jié)構(gòu)如圖1所示[7-8]。
圖1 GANs結(jié)構(gòu)
根據(jù)鑒別器輸出結(jié)果,得到GANs的損失。通常情況下把最小化GANs的損失函數(shù)當(dāng)作最小化-最大化問題,即
(1)
該優(yōu)化問題的解決方案為納什均衡[7],其中每個參與者就其參數(shù)而言達(dá)到其損失函數(shù)的局部最小值。利用可梯度下降的優(yōu)化方法訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)來表示G和D。訓(xùn)練分兩個步驟。
首先訓(xùn)練鑒別器函數(shù)使其最大化,即
J(D)=X~pdata(X)[lg(D(X))]+
(2)
然后固定生成器的參數(shù)。通過從100維正態(tài)分布的隱藏空間中抽取向量z來生成向量G(z),并訓(xùn)練生成器函數(shù)以使其最大化,即
J(G)=z~pz[lg(1-D(G(z)))]
(3)
保持鑒別器參數(shù)固定,通過式(3)的生成器來“欺騙”鑒別器,使其認(rèn)為樣本G(z)是真實(shí)數(shù)據(jù)樣本,使生成器盡可能接近實(shí)際數(shù)據(jù)分布pdata(X)的分布pg(X),其中pg(X)表示生成器所生成圖像的概率分布。當(dāng)達(dá)到收斂pg(X)=pdata(X)時,鑒別器的值變?yōu)?.5,無法再區(qū)分兩者。由于最初鑒別器D的性能明顯優(yōu)于生成器,訓(xùn)練生成器的梯度接近于零,因此保證lg(D(G(z)))最大化優(yōu)于保證生成器的lg(1-D(G(z)))最小化[7]。GANs需要進(jìn)行反復(fù)訓(xùn)練才能找到最佳的超參數(shù)集,以實(shí)現(xiàn)穩(wěn)定的訓(xùn)練。目前許多改進(jìn)方法可以加速GANs訓(xùn)練[8]。
DCGANs是GANs的一種主要變體,整體結(jié)構(gòu)與GANs類似,只是DCGANs的鑒別器和生成器都使用了卷積神經(jīng)網(wǎng)絡(luò)來替代GANs中的多層感知機(jī),同時為了使整個網(wǎng)絡(luò)可導(dǎo),采用全卷積神經(jīng)網(wǎng)絡(luò),避免在卷積層之后使用全連接層。在生成器和鑒別器中都添加了批量歸一化操作[9]。同時,生成器的輸出層使用Tanh激活函數(shù),其他層使用ReLU激活函數(shù)。鑒別器的所有層都使用LeakyReLU激活函數(shù)[10-11]。
步驟1 首先初始化生成器G和鑒別器D的超參數(shù)。
步驟2 由100維隨機(jī)噪聲向量z通過全連接層學(xué)習(xí),變形成4×4×1 024的矩陣輸出,之后通過4個反卷積層操作,重構(gòu)生成64×64×3的巖石圖像。生成器結(jié)構(gòu)如圖2所示,其中全卷積神經(jīng)網(wǎng)絡(luò)(Fully Convolutional Networks,FCNN)表示全連接神經(jīng)網(wǎng)絡(luò),DeConv2d表示反卷積。
圖2 生成器結(jié)構(gòu)示意
步驟3 鑒別器輸入64×64像素的圖像,經(jīng)過4次卷積,將分辨率降低為4×4像素,借用此功能來確定此圖像是來自真實(shí)圖像還是來自生成器。利用鑒別器反向傳播更新超參數(shù),提高鑒別器鑒別真實(shí)圖像與“假”圖像的能力。
步驟4 當(dāng)鑒別器具有較高鑒別能力時,固定鑒別器的超參數(shù),并不斷更新生成器超參數(shù)促使生成圖像的質(zhì)量逐漸接近于真實(shí)圖像。這樣鑒別器就難以區(qū)分真實(shí)圖像和生成圖像,即生成器達(dá)到“欺騙”鑒別器的效果。
步驟5 重復(fù)步驟3和步驟4,直至生成器G和鑒別器D達(dá)到納什平衡,模型收斂。
本文實(shí)驗(yàn)數(shù)據(jù)來自納米CT掃描獲取得到的真實(shí)頁巖圖像數(shù)據(jù)。圖3是一幅大小為1 016×1 024像素的二值化頁巖截面,分辨率為每像素65 nm。圖像邊緣四周的黑色部分作為無效數(shù)據(jù)進(jìn)行剔除,白色表示頁巖的骨架。
圖3 真實(shí)頁巖數(shù)據(jù)
頁巖內(nèi)部結(jié)構(gòu)復(fù)雜,很難定量描述其內(nèi)部特征。對頁巖重構(gòu)質(zhì)量進(jìn)行評價主要是考察其結(jié)構(gòu)特征是否得到重構(gòu),而并非在相同的位置具有相同的狀態(tài)值,即要求重構(gòu)數(shù)據(jù)可以體現(xiàn)出訓(xùn)練圖像的結(jié)構(gòu)特征。本文采取變差函數(shù)和孔隙度兩個巖石主要屬性對重構(gòu)質(zhì)量進(jìn)行評價[12]。
變差函數(shù)用于描述數(shù)據(jù)值的空間相關(guān)性。數(shù)據(jù)點(diǎn)在空間上的距離越遠(yuǎn),相關(guān)性就變得越小。變差函數(shù)的定義為:區(qū)域化變量Z(x)和Z(x+h)表示兩點(diǎn)之差的方差之半,其中x表示空間位置向量值,h表示空間向量值,具體含義可參見文獻(xiàn)[13]??紫抖仁侵笌r石中所有孔隙空間體積之和與巖石總體積的比值,以百分?jǐn)?shù)表示。變差函數(shù)與孔隙度是頁巖重要的特征參數(shù),利用變差函數(shù)和孔隙度對重構(gòu)質(zhì)量進(jìn)行評估,可有效地對頁巖重構(gòu)質(zhì)量進(jìn)行評估。
本文利用頁巖截面作為訓(xùn)練圖像進(jìn)行DCGANs訓(xùn)練,實(shí)現(xiàn)網(wǎng)絡(luò)能夠自行生成符合真實(shí)頁巖結(jié)構(gòu)特征的重構(gòu)圖像。通過CT掃描獲取1 021幅二值化頁巖截面圖像,從每幅圖中的相同(x,y)位置截取大小為64×64像素的圖像,作為實(shí)驗(yàn)所需的頁巖訓(xùn)練圖像,可得到1 021幅64×64像素的二值化真實(shí)圖像。真實(shí)圖像與重構(gòu)圖像比較如圖4所示,其中,藍(lán)色部分表示孔隙,白色表示骨架。對比Filstersim[14]重構(gòu)得到的頁巖圖像圖4(d),可以發(fā)現(xiàn)DCGANs與真實(shí)圖像結(jié)構(gòu)特征的相似性更高。
圖4 真實(shí)圖像與重構(gòu)圖像比較
圖5所示為重構(gòu)圖像與真實(shí)圖像的平均變差函數(shù)。相較于Filstersim重構(gòu)圖像,DCGANs重構(gòu)圖像在x和y方向平均變差函數(shù)與真實(shí)圖像更加接近。
圖5 真實(shí)圖像與重構(gòu)圖像的平均變差函數(shù)
表1為真實(shí)圖像和DCGANs及Filstersim重構(gòu)圖像的孔隙度。由表1可以發(fā)現(xiàn),重構(gòu)圖像與真實(shí)圖像孔隙度均較為接近。DCGANs訓(xùn)練結(jié)束后,由于超參數(shù)可以保存以避免再次訓(xùn)練參數(shù),因此后繼重構(gòu)頁巖時將無需再次進(jìn)行模型訓(xùn)練。這是DCGANs的一個優(yōu)勢。
表1 真實(shí)圖像與重構(gòu)圖像的孔隙度
本文提出了一種基于DCGANs的二維頁巖圖像重構(gòu)方法,即利用DCGANs生成與原始頁巖結(jié)構(gòu)特征相似的重構(gòu)圖像。實(shí)驗(yàn)證明,DCGANs可以提取頁巖圖像中的結(jié)構(gòu)特征,重構(gòu)圖像與訓(xùn)練圖像的變差函數(shù)和孔隙度相似。由于DCGANs網(wǎng)絡(luò)的超參數(shù)可以保存,因此這些參數(shù)可以多次重復(fù)使用,較傳統(tǒng)方法具有一定的優(yōu)勢。