張攀龍 李 堯 張?zhí)餄?岳景杭 董 銳 曹 帥 張慶松
(1.山東大學(xué)齊魯交通學(xué)院,山東濟(jì)南250061;2.山東大學(xué)巖土與結(jié)構(gòu)工程研究中心,山東濟(jì)南250061;3.齊魯交通發(fā)展集團(tuán)有限公司建設(shè)管理分公司,山東濟(jì)南250061)
目前,我國礦產(chǎn)資源埋藏普遍較深,開采方式以地下開采為主[1]。在資源開采的早期階段,工藝流程不規(guī)范、不先進(jìn)導(dǎo)致開采方式的規(guī)劃設(shè)計(jì)存在一定的盲目性,極少對采空區(qū)進(jìn)行充填等后續(xù)操作,導(dǎo)致大量采空區(qū)存在。而該類缺乏詳細(xì)資料標(biāo)明的遺留采空區(qū)往往隱伏于采場下危及人員和設(shè)備安全,造成了重大安全隱患[2]。因此,精確探明隱伏采空區(qū)的位置、規(guī)模和形態(tài),一方面對于指導(dǎo)礦山安全生產(chǎn),大幅降低人員傷亡和經(jīng)濟(jì)損失具有重大意義,一方面對于推進(jìn)深部礦產(chǎn)資源開發(fā),提高采礦生產(chǎn)單位效益和資源利用率也大有裨益[3]。此外,由于礦產(chǎn)資源在開采后圍巖被擾動,采空區(qū)的物理性質(zhì)與其周圍區(qū)域會存在較大差異,如彈性結(jié)構(gòu)、電磁等,從而可以從物性差異的角度通過地球物理手段進(jìn)行采空區(qū)探測[4]。當(dāng)前,高效精確的物探技術(shù),包括地震勘探、電法勘探、重力勘探和電磁勘探等都可以用于探測復(fù)雜的地下結(jié)構(gòu)[5]。在該類方法中,由于地震波勘探法的高效便捷、環(huán)境影響小、探測范圍廣等優(yōu)勢被廣泛應(yīng)用于不良地質(zhì)體探測,如隱伏采空區(qū)勘探等方面[6]。
在實(shí)際工作環(huán)境中,隨著采空區(qū)域地質(zhì)構(gòu)造日趨復(fù)雜,工程人員在試驗(yàn)中所獲取的地震勘探信號噪聲也越來越復(fù)雜,能否有效去除采空區(qū)地震數(shù)據(jù)中的噪聲已逐漸成為影響數(shù)據(jù)處理可靠性的關(guān)鍵因素之一[7]。多年來,不少學(xué)者一直致力于研究和改進(jìn)地震信號的噪聲去除方法。地震信號的噪聲可以分為規(guī)則信號和不規(guī)則信號兩類,去除時(shí)也應(yīng)該根據(jù)不同的噪聲類型和特點(diǎn)選取合理的方法[8-9]。近年來,傳統(tǒng)去噪方法發(fā)展十分迅速,其中針對規(guī)則噪聲的經(jīng)典去噪方法包括基于FT 變換的方法、F-K 濾波法、F-X 濾波法,小波變換去噪法以及基于線性Radon 變換的噪聲去除法;針對隨機(jī)噪聲的經(jīng)典去噪方法包括K-L 變換法、F-X 域預(yù)測濾波法、奇異值分解和多項(xiàng)式擬合去噪法等。近年來又發(fā)展了時(shí)頻分析域的曲波(Curvelet)變換法,S變換法、匹配追蹤(MP)等去噪方法。在前人研究的基礎(chǔ)上,二代曲波(Curvelet)變換于2002年被Candès 等提出[10],極大提高了曲波變換的計(jì)算速度。2003 年P(guān)innegar 等[11]從S 變換的窗函數(shù)入手,創(chuàng)造性地提出了一種雙曲窗函數(shù)的廣義S變換。在實(shí)際數(shù)據(jù)處理中,上述方法取得了一定的效果但也存在各自的不足,給信號去噪工作帶來了很大難度。此外,隨著人們對地震資料的高信噪比、高分辨率和高保真度的要求提高,傳統(tǒng)方法的去噪能力越來越無法滿足要求,亟需在其他領(lǐng)域另辟蹊徑,尋求去除數(shù)據(jù)噪聲的新思路、新方法。
目前,隨著當(dāng)前社會智能化程度的不斷提高,機(jī)器學(xué)習(xí)已經(jīng)被廣泛運(yùn)用于解決工程和科學(xué)領(lǐng)域的各種復(fù)雜問題。它吸取了人工智能、概率統(tǒng)計(jì)、控制和信息論、神經(jīng)生物等學(xué)科的成果,是一種數(shù)據(jù)驅(qū)動的非線性算法。隨著機(jī)器學(xué)習(xí)的快速發(fā)展,目前學(xué)術(shù)界涌現(xiàn)出相當(dāng)多的智能算法,例如支持向量機(jī)、隨機(jī)森林、貝葉斯網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)等方法。在機(jī)器學(xué)習(xí)的基礎(chǔ)上,越來越多的領(lǐng)域開始引入深度學(xué)習(xí)算法來解決相關(guān)問題。數(shù)十年來,從最初神經(jīng)元的引入到深度學(xué)習(xí)的不斷發(fā)展,該領(lǐng)域一直受到不同學(xué)科領(lǐng)域?qū)W者的廣泛關(guān)注。神經(jīng)網(wǎng)絡(luò)的概念可以追溯到1943 年McCulloch 和Pitts 的研究,他們關(guān)注點(diǎn)主要在于神經(jīng)網(wǎng)絡(luò)的強(qiáng)大計(jì)算能力[12]。1958 年,Rosenblatt F 創(chuàng)造性地提出了感知器的概念,開啟了神經(jīng)網(wǎng)絡(luò)算法的研究[13]。之后,Rumelhart 等[14]提出了神經(jīng)網(wǎng)絡(luò)的反向傳播算法。然而,由于計(jì)算的局限性,該類算法大多停留在理論階段。進(jìn)入21 世紀(jì),Hinton等[15-17]發(fā)表了一系列研究論文并提出了深度學(xué)習(xí)的概念,使得神經(jīng)網(wǎng)絡(luò)算法重新成為專家學(xué)者關(guān)注的焦點(diǎn)。
在這其中,深度學(xué)習(xí)是一種近年來熱門的多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,通過模擬人腦的分層模型結(jié)構(gòu),對輸入的數(shù)據(jù)逐級提取從底層到高層的特征,從而建立一種數(shù)據(jù)驅(qū)動的非線性映射關(guān)系。近年來,已經(jīng)有越來越多的學(xué)者開始使用深度學(xué)習(xí)方法來開展地震勘探領(lǐng)域的研究工作,包括數(shù)據(jù)處理、斷層識別、斷層掃描等。例如Zhang等[18]分別基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法實(shí)現(xiàn)了地質(zhì)斷層的自動識別和定位;Cao 等[19]使用改進(jìn)的深度置信網(wǎng)絡(luò)(DBN)從測井?dāng)?shù)據(jù)中識別碳酸鹽,準(zhǔn)確率高達(dá)83%,同時(shí)使用該網(wǎng)絡(luò)處理地震數(shù)據(jù)以獲取更多的信息;Huang等[20]設(shè)計(jì)了一個(gè)大數(shù)據(jù)平臺,將卷積神經(jīng)網(wǎng)絡(luò)和不同機(jī)器學(xué)習(xí)模型相結(jié)合來提高斷層的識別準(zhǔn)確率;Olivier等[21]提出了一種基于稀疏加權(quán)的矩陣分解方法,通過有監(jiān)督機(jī)器學(xué)習(xí)從相干背景噪聲源中分離出有源干擾信號;Jia 等[22]提出了一種基于支持向量回歸(SVR)的智能蒙特卡洛機(jī)器學(xué)習(xí)方法,用于地震數(shù)據(jù)的智能插值處理。此外,在國際勘探地球物理學(xué)家學(xué)會(SEG)第88 屆年會上,也涌現(xiàn)出了相當(dāng)多的將深度學(xué)習(xí)和地震勘探技術(shù)相結(jié)合的研究成果,這說明借鑒其它新興學(xué)科領(lǐng)域的新研究方法來處理地球物理領(lǐng)域的相關(guān)問題是可行的。
本研究以金屬礦山巷道采空區(qū)地震探測為研究背景,以地震數(shù)據(jù)研究為主要落腳點(diǎn),在充分考慮網(wǎng)絡(luò)運(yùn)行速度和去噪效果的基礎(chǔ)上,采用大量隨機(jī)模型正演得到的模擬數(shù)據(jù)加入高斯白噪聲作為網(wǎng)絡(luò)輸入,通過U-Net深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練并輸出去噪結(jié)果,形成由加噪數(shù)據(jù)到原始正演數(shù)據(jù)的非線性映射關(guān)系。該神經(jīng)網(wǎng)絡(luò)由卷積層、反卷積層、ReLU層和池化層組成,并由卷積子網(wǎng)和反卷積子網(wǎng)構(gòu)成一種對稱式的網(wǎng)絡(luò)結(jié)構(gòu)。訓(xùn)練完成后,分別采用主觀和客觀評價(jià)方法對噪聲去除結(jié)果進(jìn)行評估。
由于在實(shí)際地震探測中獲取的數(shù)據(jù)均含有不同程度的現(xiàn)場干擾噪聲,這些噪聲對后續(xù)的數(shù)據(jù)處理和成像均有很大的影響,為了進(jìn)一步提高探測的準(zhǔn)確度,去噪過程必不可少。
地震數(shù)據(jù)去噪的主要目的是從含有被噪聲掩蓋的數(shù)據(jù)中獲得數(shù)據(jù)的原始信息,去噪越徹底,恢復(fù)的原始信息越全面,越有利于后續(xù)的數(shù)據(jù)處理和分析。地震數(shù)據(jù)去噪過程可表示為
其中,g( x,y )為含有噪聲的數(shù)據(jù),為加入了高斯白噪聲的地震記錄;f( x,y )為不含任何噪聲的地震記錄;η( x,y )為添加的噪聲數(shù)據(jù)[23]。地震數(shù)據(jù)去噪就是要將添加部分的噪聲盡可能多地去除,得到原始輸入數(shù)據(jù)的估計(jì),并使得結(jié)果盡可能接近模型正演數(shù)據(jù)。
根據(jù)所研究問題的特點(diǎn),本研究發(fā)現(xiàn),地震去噪過程實(shí)際上是尋找加噪數(shù)據(jù)和期望數(shù)據(jù)之間的非線性映射關(guān)系的過程。深度學(xué)習(xí)方法的優(yōu)勢在于能夠挖掘海量數(shù)據(jù)之間復(fù)雜關(guān)系,因而可以將其引入地震數(shù)據(jù)去噪中。去噪過程中的關(guān)鍵點(diǎn)在于構(gòu)建高質(zhì)高量的數(shù)據(jù)集以及選取適宜的神經(jīng)網(wǎng)絡(luò)。首先深度學(xué)習(xí)是以海量數(shù)據(jù)為基礎(chǔ),挖掘數(shù)據(jù)抽象特征和尋找復(fù)雜映射關(guān)系的一類新方法,大量的數(shù)據(jù)有利于充分挖掘加噪數(shù)據(jù)和原始數(shù)據(jù)之間的非線性關(guān)系,對于提升去噪效果作用顯著。另外采用合理的網(wǎng)絡(luò)結(jié)構(gòu)不僅可以減少GPU 運(yùn)算時(shí)間和內(nèi)存占用,而且在學(xué)習(xí)噪聲數(shù)據(jù)特征與充分整合映射關(guān)系方面具有顯著優(yōu)勢,因此尋求合適的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對于去噪問題的解決至關(guān)重要。
結(jié)合上述分析,采用深度學(xué)習(xí)方法的地震數(shù)據(jù)去噪過程如圖1 所示。輸入端是加噪之后的正演數(shù)據(jù),通過網(wǎng)絡(luò)學(xué)習(xí)后得到去噪結(jié)果。比較期望輸出(也就是標(biāo)簽)和實(shí)際輸出的差值(損失函數(shù)值),并逐層反向傳播梯度從而更新網(wǎng)絡(luò)參數(shù),以達(dá)到學(xué)習(xí)目的即損失函數(shù)值最小,此時(shí)可以認(rèn)為實(shí)際輸出最接近預(yù)測輸出,從而達(dá)到去噪目標(biāo)。
卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)最初是根據(jù)人類天然形成的視覺系統(tǒng)提出的,在進(jìn)行圖像識別和特征提取方面具有天然優(yōu)勢。1989 年LeCun 最早提出“卷積”一詞用來描述該神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),卷積神經(jīng)網(wǎng)絡(luò)也由此得名[24]。卷積網(wǎng)絡(luò)最大的特點(diǎn)是輸出的特征圖與輸入圖之間形成非線性的對應(yīng)關(guān)系,因此可以將卷積神經(jīng)網(wǎng)絡(luò)視為一種復(fù)雜的濾波器。CNN 主要通過卷積、池化和全鏈接等操作來學(xué)習(xí)圖像在不同方面的特征,這與通過人類視野認(rèn)知圖像的過程較為符合。人類在觀察學(xué)習(xí)一幅圖像時(shí),首先關(guān)注它的亮度、對比度、顏色等宏觀信息,其次是棱角、線條等局部信息,然后是對幾何形狀、花紋等更復(fù)雜信息的提取,最后才在人腦中形成關(guān)于圖像的認(rèn)知。圖2 為典型卷積神經(jīng)網(wǎng)絡(luò)的主要組成部分。在圖像去噪領(lǐng)域,隨著卷積神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展,也涌現(xiàn)出了一大批包括BMD[25]、NCSR[26]、WNNM[27]等在內(nèi)的多種圖像去噪算法,該類算法的去噪結(jié)果都優(yōu)于傳統(tǒng)圖像去噪算法的處理效果。
U-Net深度神經(jīng)網(wǎng)絡(luò)是卷積神經(jīng)網(wǎng)絡(luò)的一種,它最早被應(yīng)用于醫(yī)學(xué)圖像的語義分割。得益于卷積神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域的種種優(yōu)勢,它目前已經(jīng)成為深度學(xué)習(xí)領(lǐng)域重要的應(yīng)用方法之一。該網(wǎng)絡(luò)模型是一種改進(jìn)的全卷積網(wǎng)絡(luò)結(jié)構(gòu),因該結(jié)構(gòu)畫出來形似字母U 而得名。典型的U-Net 神經(jīng)網(wǎng)絡(luò)如圖3 所示。壓縮通道(Contracting Path)和擴(kuò)展通道(Expansive Path)(分別稱之為編碼和解碼)是該神經(jīng)網(wǎng)絡(luò)的主要結(jié)構(gòu)。其中,壓縮通道是典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過重復(fù)采用卷積、池化等不同操作步驟將輸入的圖像進(jìn)行處理。每經(jīng)過一次卷積,特征圖的維數(shù)增大一倍以便于網(wǎng)絡(luò)從不同層次提取圖像特征。而每經(jīng)過一次池化操作,特征圖的尺寸變小,一方面減小了網(wǎng)絡(luò)的復(fù)雜程度,另一方面有助于提取圖中的主要紋理特征。對于擴(kuò)展通道,首先進(jìn)行一次與卷積操作邏輯相反的反卷積運(yùn)算,然后將對應(yīng)步驟的壓縮通道得到的特征圖進(jìn)行拼接,重新組成一個(gè)二倍于該特征圖維數(shù)的新特征圖,再采用卷積層進(jìn)行上采樣,并不斷進(jìn)行重復(fù),最終輸出與原來輸入圖像大小一致的結(jié)果圖。這種適用于圖像處理的網(wǎng)絡(luò)結(jié)構(gòu)同樣可以用來處理類似數(shù)據(jù)形式的地震探測數(shù)據(jù),因?yàn)閳D像只是矩陣可視化之后的結(jié)果,二者本質(zhì)上并無區(qū)別。
U-Net網(wǎng)絡(luò)結(jié)構(gòu)具有如下特點(diǎn):
首先,該模型可認(rèn)為是一個(gè)編碼和解碼的網(wǎng)絡(luò)結(jié)構(gòu),其中壓縮通道是一個(gè)編碼器,主要用于提取圖像不同層次的結(jié)構(gòu)特征,例如邊角、顏色、線條、紋理等信息;擴(kuò)展通道則是一個(gè)解碼器,主要用于還原圖像的結(jié)構(gòu)信息。并且該網(wǎng)絡(luò)層與層之間通常采用較多的卷積核進(jìn)行運(yùn)算,這樣能夠充分挖掘數(shù)據(jù)之間的聯(lián)系,有利于模型全面多樣地學(xué)習(xí)圖像特征。
其次,該網(wǎng)絡(luò)模型的對稱式結(jié)構(gòu)讓卷積和反卷積操作更加直觀、合理,另外多次進(jìn)行的拼接操作不僅能從形式上還原數(shù)據(jù),也幫助模型能夠從圖像的細(xì)部特征學(xué)習(xí)得到更加接近于預(yù)測結(jié)果的輸出圖。
最后,該模型在訓(xùn)練時(shí)采用批量學(xué)習(xí)方式可以大大加快學(xué)習(xí)進(jìn)度,縮短訓(xùn)練時(shí)間。該網(wǎng)絡(luò)采取有監(jiān)督學(xué)習(xí)模式,從含噪數(shù)據(jù)中隨機(jī)獲取小批量的數(shù)據(jù)集當(dāng)作訓(xùn)練數(shù)據(jù),計(jì)算與訓(xùn)練后的輸出數(shù)據(jù)之間的網(wǎng)絡(luò)損失,并通過隨機(jī)梯度優(yōu)化法進(jìn)行網(wǎng)絡(luò)參數(shù)調(diào)整。
卷積是全卷積神經(jīng)網(wǎng)絡(luò)U-Net 的核心步驟。本研究將每個(gè)模型正演得到的地震數(shù)據(jù)視為二維矩陣處理,因此所用到的卷積為二維卷積,即采用離散的二維濾波器(卷積核)與二維矩陣進(jìn)行卷積操作。二維卷積公式為[20]
該函數(shù)在生物學(xué)上類似于神經(jīng)元信號激勵(lì),其優(yōu)點(diǎn)在于不容易產(chǎn)生梯度爆炸現(xiàn)象,具有一定的稀疏性,導(dǎo)數(shù)計(jì)算速度快。
此外,在訓(xùn)練過程中,不同的卷積核可以提取圖像矩陣中不同的特征,例如邊角、曲線、顏色結(jié)構(gòu)等信息,在深層卷積神經(jīng)網(wǎng)絡(luò)中,卷積操作可以提取出從低級到高級的不同復(fù)雜特征。另外考慮到對特征圖進(jìn)行卷積運(yùn)算后會減小下一層特征圖的大小,為了避免該影響,在卷積運(yùn)算前先采用補(bǔ)邊的方式進(jìn)行擴(kuò)展,具體方式根據(jù)卷積核尺寸不同而略有不同。例如卷積核尺寸為kernel size,則需要擴(kuò)展的零矩陣尺寸為上下左右各(kernel size-1)/2 行或列。具體過程如圖4 所示。卷積操作時(shí)將卷積核從左上角向右滑動,滑動步長設(shè)定為1 個(gè)像素點(diǎn),范圍為W×H,分別為特征圖的寬和高。
為了使得輸入和輸出的數(shù)據(jù)形式不發(fā)生變化,在經(jīng)過壓縮通道后,需要使用反卷積和拼接操作對數(shù)據(jù)進(jìn)行擴(kuò)展,如圖3中部和右側(cè)箭頭所示。
池化別名下采樣或者降采樣,它是在上一步訓(xùn)練的基礎(chǔ)上將特征圖降維,壓縮數(shù)據(jù)量和減少參數(shù)量的一種主要手段,采用該方法可以明顯減少過擬合的可能性并且提高模型的魯棒性。池化一般可以分為平均池化和最大池化。前者是對鄰域內(nèi)特征點(diǎn)取平均值,可以較好地保留整體數(shù)據(jù)信息,更明顯地突出背景信息。后者是對數(shù)據(jù)鄰域內(nèi)的特征點(diǎn)取最大值,這樣可以盡可能多地保留圖像的紋理和結(jié)構(gòu)特征,更能反映整體的結(jié)構(gòu)信息,二者各有優(yōu)勢。圖5所示分別是為最大池化和平均池化的處理過程。
本研究選擇最大池化方法。根據(jù)地震數(shù)據(jù)的特征可知,科研人員關(guān)注的重點(diǎn)在于同相軸本身斜率以及出現(xiàn)的位置,對于除此之外的背景區(qū)域關(guān)注度并不高。因此,當(dāng)選擇最大池化方法時(shí),可以更有效地提取同相軸的位置和形態(tài)信息,同時(shí)弱化不相干的背景信息,盡可能完整地保留圖像的結(jié)構(gòu)特征。
地震數(shù)據(jù)雖然在本質(zhì)上與圖像數(shù)據(jù)類似,但兩者也有一定的區(qū)別。具體表現(xiàn)為:一方面,地震數(shù)據(jù)呈現(xiàn)出明顯的縱向和橫向關(guān)聯(lián)性,縱向關(guān)聯(lián)是指同一道的數(shù)據(jù)在時(shí)間縱軸上具有連續(xù)性,橫向關(guān)聯(lián)是指同一時(shí)刻各個(gè)道集接收到的數(shù)據(jù)也具有一定的相關(guān)性;另一方面,一般而言通過試驗(yàn)或者正演獲取的地震數(shù)據(jù)反映的淺層信息更為準(zhǔn)確豐富,但是由于地震波的衰減特性和大地的濾波特性,實(shí)際上檢波器收集到的深層信息十分有限。
為了更好地提取深層次的反射信息,在該網(wǎng)絡(luò)輸入數(shù)據(jù)時(shí)除了加噪的地震數(shù)據(jù)外,增加了一個(gè)深度加權(quán)信息層(與輸入數(shù)據(jù)大小一致的矩陣,越靠近底部數(shù)值越大),使得輸入數(shù)據(jù)的通道數(shù)變?yōu)?,從而在學(xué)習(xí)過程中使網(wǎng)絡(luò)更能充分地挖掘深部信息,提高數(shù)據(jù)去噪效果。
深度學(xué)習(xí)的訓(xùn)練過程需要大量的數(shù)據(jù)輸入和快速高效的計(jì)算平臺。一方面海量的數(shù)據(jù)有助于充分挖掘復(fù)雜的非線性映射關(guān)系,另一方面數(shù)據(jù)量的提升對于計(jì)算平臺的性能也提出了更高的要求。而在當(dāng)前的計(jì)算硬件中,由于圖形處理單元(Graphics Processing Unit,GPU)在高效并行和密集運(yùn)算方面顯現(xiàn)出巨大優(yōu)勢,已經(jīng)逐漸成為深度學(xué)習(xí)的首選計(jì)算平臺。因此本研究選用在GPU 上實(shí)現(xiàn)地震數(shù)據(jù)去噪的網(wǎng)絡(luò)學(xué)習(xí),所采用硬件為兩張NVIDIA Tesla P100協(xié)同工作,同時(shí)使用Pytorch深度學(xué)習(xí)框架進(jìn)行訓(xùn)練。
基于本研究探測金屬礦山采空區(qū)的工程背景,在獲取訓(xùn)練所需的數(shù)據(jù)集時(shí),一方面考慮到模型的合理性,采用按照一定規(guī)則“隨機(jī)”生成的地下采空區(qū)地質(zhì)模型作為正演數(shù)據(jù)來源;另一方面,考慮到地震波在實(shí)際地層中的傳播,采用二維彈性波正演方法獲取數(shù)據(jù)集。該數(shù)據(jù)集一共包括1 000 個(gè)隨機(jī)生成的采空區(qū)模型,并獲得了2 000組正演數(shù)據(jù)(包括X和Y 方向),其中包括1 600 組訓(xùn)練數(shù)據(jù)和200 組驗(yàn)證數(shù)據(jù)。為進(jìn)一步評估該網(wǎng)絡(luò)的去噪性能,又將剩余的200組數(shù)據(jù)用于去噪結(jié)果評價(jià)和測試。
圖6 所示是生成的代表性地質(zhì)模型。圖7 對應(yīng)正演獲取的數(shù)據(jù)結(jié)果。為了更直觀地看出采空區(qū)反射信息,所采用的訓(xùn)練數(shù)據(jù)均為在原始數(shù)據(jù)基礎(chǔ)上去掉直達(dá)波之后的結(jié)果。
在獲取了訓(xùn)練數(shù)據(jù)以后,針對本研究去噪問題,需要向該數(shù)據(jù)集中加入噪聲。在實(shí)際地震數(shù)據(jù)中,噪聲的來源和分布比較復(fù)雜。為簡單起見,本研究對去掉直達(dá)波后的地震數(shù)據(jù)加入高斯白噪聲,并以此作為輸入數(shù)據(jù)。高斯白噪聲從統(tǒng)計(jì)學(xué)上來看是隨機(jī)噪聲的一種,且頻譜分量均服從均勻分布,幅度服從高斯分布,在處理未知分布的噪聲時(shí)可以認(rèn)為是一種相對理想的信號[28-29]。此外,由于不同地質(zhì)模型獲取的數(shù)據(jù)大小存在差異,為了消除由于數(shù)據(jù)來源不同引起的差異化并便于進(jìn)行綜合對比,將所有獲取的數(shù)據(jù)按照如下規(guī)則進(jìn)行歸一化處理:
式中,D為歸一化之前的數(shù)據(jù);Dmin為該數(shù)據(jù)組的最小值;Dmax表示該數(shù)據(jù)組的最大值;Dˉ為歸一化后的數(shù)據(jù)。
在循環(huán)迭代過程中,為了更新、調(diào)整層與層之間的權(quán)重值,需要有一個(gè)參數(shù)用來估計(jì)實(shí)際輸出數(shù)據(jù)和預(yù)期輸出數(shù)據(jù)之間的不一致程度,即損失函數(shù)。它是一個(gè)非負(fù)值函數(shù),函數(shù)值越小代表實(shí)際輸出和預(yù)期輸出越接近,學(xué)習(xí)效果越好,最終的訓(xùn)練目的是使得誤差函數(shù)趨近于0。本研究采用均方誤差函數(shù)MSE來作為網(wǎng)絡(luò)更新的損失函數(shù),具體公式為
式中,Yij為實(shí)際輸出數(shù)據(jù);為預(yù)期輸出數(shù)據(jù);W和H分別表示數(shù)據(jù)體的寬和高。
本研究神經(jīng)網(wǎng)絡(luò)的具體參數(shù)設(shè)置為:①初始學(xué)習(xí)率設(shè)置為0.1,衰減系數(shù)為0.9;②動量參數(shù)為0.9;③權(quán)重衰減系數(shù)為0.000 1;④卷積核尺寸為3*3,卷積步長為1;⑤優(yōu)化器為隨機(jī)梯度下降法。
從輸入數(shù)據(jù)到預(yù)測結(jié)束,1 600 組正演數(shù)據(jù)訓(xùn)練過程共計(jì)花費(fèi)35 h,迭代中的批量大小為8,處理一組數(shù)據(jù)平均耗時(shí)70 s。得到的去噪結(jié)果如圖8所示。
由圖8可知:經(jīng)過網(wǎng)絡(luò)訓(xùn)練后基本上所有的噪聲干擾都被去除,放大圖形細(xì)節(jié)后依然很難看出噪聲存在。
圖9 為網(wǎng)絡(luò)訓(xùn)練過程中的誤差曲線圖。從該圖可以看出隨著迭代次數(shù)的增加,誤差整體呈現(xiàn)逐漸降低的趨勢。其中在前45 次迭代過程中,誤差下降幅度是整個(gè)訓(xùn)練過程中最大的一部分。在第75次迭代之后,誤差基本不再有較大范圍的變動而趨于穩(wěn)定,推測原因是在網(wǎng)絡(luò)訓(xùn)練的初期,學(xué)習(xí)范圍較小導(dǎo)致數(shù)據(jù)包含的特征較少,因此學(xué)習(xí)效率很高。但是隨著迭代次數(shù)的增加,數(shù)據(jù)范圍逐漸變大使得數(shù)據(jù)特征提取變得越來越困難,因此后期誤差基本不再發(fā)生變化。
圖10為網(wǎng)絡(luò)驗(yàn)證過程中的誤差曲線圖。從該圖可以看出隨迭代次數(shù)的增加,誤差曲線走勢基本和圖9 訓(xùn)練過程誤差走勢圖一致。這是因?yàn)槊坑?xùn)練完一次迭代之后,就進(jìn)行一次驗(yàn)證,此時(shí)采用的網(wǎng)絡(luò)參數(shù)都是按照訓(xùn)練集中的數(shù)據(jù)學(xué)習(xí)得來的,不會有很大出入。但由于更換數(shù)據(jù)集(訓(xùn)練集到驗(yàn)證集),得到的損失函數(shù)曲線也不如訓(xùn)練集中的曲線光滑。
為了對比U-Net神經(jīng)網(wǎng)絡(luò)的去噪結(jié)果,采用傳統(tǒng)F-X預(yù)測濾波方法對同樣的加噪數(shù)據(jù)進(jìn)行去噪,結(jié)果如圖11所示。
由圖11 可知:盡管F-X 預(yù)測濾波法可以在一定程度上去除噪聲,但是在沒有反射波存在的背景部分去噪效果不理想;另外,觀察第4部分可以發(fā)現(xiàn),去掉的部分?jǐn)?shù)據(jù)其實(shí)也包含了很多有效的反射波信息,這在一定程度上違背了去噪的初衷,即在不影響數(shù)據(jù)質(zhì)量的情況下去除無關(guān)信息。
由以上兩種方法的去噪結(jié)果可以直觀看出,神經(jīng)網(wǎng)絡(luò)的去噪效果優(yōu)于傳統(tǒng)F-X 方法。此外,本研究還采用主觀評價(jià)和客觀評價(jià)相結(jié)合的方式對兩者的去噪效果進(jìn)行評估。主觀評價(jià)是邀請10名不相干人員從人眼直觀感受方面對兩種方法的去噪效果進(jìn)行判斷。隨機(jī)抽取了10幅加噪數(shù)據(jù)圖以及對應(yīng)的神經(jīng)網(wǎng)絡(luò)去噪圖像和F-X 預(yù)測濾波去噪后的圖像分發(fā)給眾人(結(jié)果圖中并不顯示使用哪種方法),同時(shí)采用滿分10 分的打分制來評價(jià)去噪效果,最終匯總并求平均值如表1 所示。可以發(fā)現(xiàn)前者的評分明顯高于后者,說明從主觀方面來看,使用深度神經(jīng)網(wǎng)絡(luò)的去噪效果更優(yōu)。
?
客觀評價(jià)采用結(jié)構(gòu)相似性指標(biāo)(Structural Similarity,SSIM)作為評判標(biāo)準(zhǔn)。該指標(biāo)可從圖像的亮度、對比度和結(jié)構(gòu)三方面進(jìn)行相似程度判斷,分值范圍為0~1,越接近1 說明兩幅圖像越相近。計(jì)算公式為[30]
其中,x和y分別為兩幅圖像的數(shù)據(jù);μx和μy分別為指x 和y 圖像的均值;σxy為x 和y 圖像的協(xié)方差和分別為x 和y 圖像的方差;c1和c2為兩個(gè)常數(shù),避免除零。
本研究采用SSIM評價(jià)去噪結(jié)果和未加噪數(shù)據(jù)的相似程度,所得結(jié)果如表2所示。
?
此外,本研究還采用了信噪比對兩種方法的去噪效果進(jìn)行進(jìn)一步評價(jià)。定義去噪后結(jié)果與正演模擬數(shù)據(jù)的差值為信號所含噪聲,模擬數(shù)據(jù)與噪聲能量的比值作為信噪比,可以利用該參數(shù)衡量去噪效果,信噪比越高證明去噪效果越好。計(jì)算公式為[31]
分析表1、表2可知:盡管評價(jià)去噪結(jié)果的手段和對象不同,但是3 種方法的評價(jià)結(jié)果卻相當(dāng)吻合,即使用U-Net 深度神經(jīng)網(wǎng)絡(luò)方法得到的去噪結(jié)果明顯優(yōu)于使用傳統(tǒng)F-X濾波法的去噪結(jié)果。
有效的地震數(shù)據(jù)去噪是后續(xù)數(shù)據(jù)處理、分析、成像等步驟的基本前提和關(guān)鍵所在。本研究通過采用U-Net 深度神經(jīng)網(wǎng)絡(luò)方法對加入高斯白噪聲的采空區(qū)地震波正演數(shù)據(jù)進(jìn)行去噪處理,并在訓(xùn)練過程中進(jìn)行深度加權(quán)以提取深層反射信息,獲得了相較于傳統(tǒng)F-X 預(yù)測濾波方法效果更好的去噪結(jié)果,表明該網(wǎng)絡(luò)對于地震數(shù)據(jù)去噪處理具有很強(qiáng)的適用性。后續(xù)研究中一方面采用更多的不同種類、不同強(qiáng)度的噪聲進(jìn)行訓(xùn)練并繼續(xù)改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu),例如椒鹽噪聲或者實(shí)際噪聲等;二是通過調(diào)整訓(xùn)練數(shù)據(jù)集大小、數(shù)據(jù)格式和網(wǎng)絡(luò)超參數(shù)來尋找最高效的訓(xùn)練手段;此外,當(dāng)前采用的訓(xùn)練仍然是有監(jiān)督學(xué)習(xí),需要提供大量與輸入數(shù)據(jù)對應(yīng)的期望輸出數(shù)據(jù),可以繼續(xù)借鑒深度學(xué)習(xí)的思路并考慮使用無監(jiān)督學(xué)習(xí)方法實(shí)現(xiàn)海量無標(biāo)簽數(shù)據(jù)的特征學(xué)習(xí),從而提高該方法對于實(shí)際數(shù)據(jù)處理的適用性。