饒 溯 賈建忠
(中海石油國際能源服務(北京)有限公司 北京 100028)
生物是全球碳循環(huán)的中轉站,生物不但可以用于確定地層年代、反映古環(huán)境,還能改變環(huán)境,形成有利于有機質富集的條件。古生物分析作為油氣勘探中的重要一環(huán),通過古生物化石圖片的識別既可以厘定地層年代和沉積環(huán)境,也可以判斷烴源巖沉積期的有機質富集條件。生物的演化與油氣生成關系較為密切,主要原因是烴源巖供烴與當時生物大量繁殖有關。而有孔蟲的識別在海相油氣勘探中廣闊的應用前景,它可反應水深、海平面、溫度、古氣候的變化和當時的氧化還原條件。
目前,油氣勘探領域古生物人才較少,而且通常人工鑒別方法工作效率低下。對于鉆井數(shù)量龐大的實驗室鑒定人員來說,任務較為繁重。20 世80 年代末期,國內外對于基于知識圖譜的專家識別系統(tǒng)開展了相應的研究[1~2]。21 世紀初,機器學習方法例如多元統(tǒng)計分析、決策樹、人工神經網絡等也用于化石鑒定和分析[3~8]。隨著計算機硬件技術和大數(shù)據分析技術的快速發(fā)展,基于卷積神經網絡的深度學習技術已逐漸成為古生物識別的主流方法[9~10]。
基于圖像處理方法和深度學習技術,建立一項古生物化石智能化識別方法,對樣本進行分類,其分類準確率較高。該項識別方法在油氣勘探領域具有較強的實用價值和推廣前景。
為了保證古生物化石的識別精度,采用了圖像形態(tài)學方法、去霧處理方法、圖像常規(guī)處理方法來提高深度學習訓練模型的準確率。
圖像形態(tài)學方法是以圖像的形態(tài)特征為研究對象,通過腐蝕、膨脹、開運算和閉運算去度量和提取圖像的基本特征和結構元素[11]。
假設f(x)和g(x)為定義在二維離散空間F 和G 上的兩個函數(shù),其中f(x)為輸入圖片,g(x)為結構元素,則可定義f(x)關于g(x)的腐蝕和膨脹如下所示:
先進行腐蝕再膨脹可稱開運算,它通??捎糜谌コ肼暎幌冗M行膨脹再腐蝕可稱閉運算,它通??捎糜谔畛鋱D像上的空白小洞及小點。可定義f(x)關于g(x)的開運算和閉運算如下所示:
對于收集古生物圖片的上可以存在多個古生物化石樣本,需對其單個古生物化石樣本定位,可先通過微分算子檢測出其邊緣和骨架,再依次對其進行閉運算形態(tài)學操作,即先膨脹再腐蝕后獲得單個古生物化石樣本圖片的位置坐標,最后可根據坐標的最大最小值拆剪圖片,即獲得單個古生物圖片。
去霧處理方法認為在無霧圖像上每一個局部區(qū)域都很有可能會有一些暗通道,一旦圖像受到霧的影響,那么暗通道就變得灰白,通過估計霧的濃度來識別物體,可還原圖像的顏色和能見度[12]。
對于任意圖像G,可定義其暗通道如下所示:
其中,Gc為圖像G 的R、G、B 顏色通道,Ω(x)為像素x上的一個矩形窗,Gdark→0。
式(5)表示計算出圖像G 的R、G、B 分量中最小值,將最小值存入一幅與原始圖片大小相同的灰度圖中,然后對該幅灰度圖進行最小值濾波。
去霧方法公式可定義為
其中,J(x)為去霧后圖像,I(x)為待去霧圖像,A為已知的大氣光值,t(x) 為透射率,t0為閾值,取t0=1。
透射率t(x)的取值方法如式(7)所示:
其中,ω為權重因子,保留實際圖片上受粉塵顆粒影 響 產 生 的 霧,ω取 值 范 圍 為0~1 之 間,取ω=0.95。
本文研究中,圖像常規(guī)處理方法是特指圖像邊緣擴充處理、圖像旋轉處理、圖像縮放處理、圖像加噪處理。
1)圖像邊緣擴充處理。在對古生物圖片定位、圖片進行旋轉和圖片卷積運算之前,需先對原始圖片進行擴邊處理,相當于在圖片周圍創(chuàng)建有一定寬度的邊,并在邊上填充像素零值。
2)圖像旋轉處理。由于在鏡下觀察和拍照角度不同,故需對原始樣本圖片進行多角度的旋轉處理。
3)圖像縮放處理??紤]到收集到古生物化石樣本圖片像素大小有一定的差異,通過水平和垂直縮放系數(shù)來調整圖片像素。
4)圖像加噪處理。古生物樣本圖片不可忽略有噪聲的存在,本文對樣本圖片增加了高斯白噪聲。
深度學習是指具有深層次網絡結構的神經網絡,它模仿神經系統(tǒng)的層次結構,低層次表示細節(jié)特征,高層次表示更抽象的屬性類別或結構特征,以便挖掘和學習數(shù)據的本質信息。
目前,典型深度學習網絡結構主要包括卷積神經網絡、循環(huán)神經網絡和遞歸神經網絡。其中卷積神經網絡的設計靈感來源于感受野認知模型,為專門識別二維信號尤其是圖像而設計的網格模型,通過局部二維濾波器保持并提取圖像的局部空間特征。
本文研究是基于深度學習VGG16 架構進行古生物圖片的識別,如圖1所示。深度學習VGG16架構是一個用于大規(guī)模圖像分類與識別的深層次卷積神經網絡[13~15],該網絡由輸入層、13 個卷積層、ReLU 激活函數(shù)、池化層、3 個全連接層、Softmax 分類器組成。
圖1 深度學習VGG16架構的參數(shù)設置示意圖
基于文中闡述圖像處理領域的一系列方法和深度學習技術建立了一項古生物智能化識別方法,該方法如圖2所示。該方法主要包括以下幾項內容:
圖2 古生物智能化識別方法的技術流程圖
1)對于一張圖片上有多個古生物化石樣本,通過圖像擴邊處理和形態(tài)學方法閉運算定位出各個古生物化石樣本的角點坐標。
2)對于彩色、白色、灰色背景的古生物化石樣本圖片,通過形態(tài)學閉運算和去霧算法將不同背景色圖片轉成背景純色圖片。
3)對獲得單個古生物化石樣本圖片進行N 個角度旋轉、M個系數(shù)縮放和高斯加白噪聲處理。
4)選取訓練集樣本和測試集樣本,使用VGG16架構對訓練集樣本進行訓練。
本文研究中,如圖3 所示,共收集到種一級Globoquadrina dehiscens、Globorotalia fohsi、Globorotalia menardii 三類單個古生物化石樣本圖片共計384張。
圖3 三類單個古生物化石樣本圖片數(shù)量統(tǒng)計圖
對于多個古生物在同一張圖片,如圖4 所示,采用文中所述圖像形態(tài)學方法可以定位古生物化石樣本的位置。如圖6 所示,對于含有彩色、白色、灰色背景的樣本圖片,可將樣本圖片都歸一化成黑色背景。
圖4 單個古生物化石樣本的定位
圖5 不同色差的單個古生物化石樣本圖片
圖6 同色背景的單個古生物化石樣本圖片
對于384 張古生物化石樣本圖片,通過圖像擴邊處理、角度旋轉、系數(shù)縮放,樣本總數(shù)擴充了32倍,即12288張古生物圖片樣本。如圖7所示,第一行圖片為旋轉后圖片,第二行圖片為縮放后圖片,第三行圖片為不加噪聲和家噪聲圖片。
圖7 擴充后的單個古生物化石樣本圖片
選取最終樣本圖片中的90% 作為訓練集,另外10%的圖片作為測試集。如圖8 和圖9 所示,模型誤差和準確率分別隨著模型訓練的迭代次數(shù)增加而減小。在迭代次數(shù)約20 次左右時,訓練模型不容易過擬合,測試集也有較高的準確率,準確率可達92%以上。即本文提出的古生物化石智能化識別方法的識別率可高達92%以上,可推廣至輸入更多類古生物化石樣本進行方法試驗并應用。
圖8 模型誤差隨迭代次數(shù)的變化
圖9 準確率隨迭代次數(shù)的變化
本文建立了一套古生物化石智能化識別方法,以種一級Globoquadrina dehiscens、Globorotalia fohsi、Globorotalia menardii三類古生物樣為例,來訓練學習模型,并對該類別的古生物進行識別,其識別率較高,可用于古生物化石的鑒定工作。該方法的優(yōu)點和不足可以概括為以下幾點:
1)該方法可減少古生物專業(yè)人員的重復性工作,提高工作效率。
2)該方法可減少鑒定過程中不同古生物專業(yè)人員的主觀性。
3)該方法不同于知識圖譜的專家系統(tǒng)識別方法,它不用花大量時間用于建立古生物特征識別知識庫。
4)該方法有助于建立可靠的地質年代標尺,可以厘定地層年代和沉積環(huán)境和判斷烴源巖沉積期的有機質富集條件。
5)采用ResNet,AlexNet,Inception等卷積神經網絡的架構以及部分架構的變種,都可能進一步提高識別的準確率。
6)不同種屬的古生物化石樣本標注仍需耗費古生物專業(yè)人員大量的工作時間,且需在平時工作中不斷收集和補充樣本。
7)如果加入訓練集的樣本類別過多,由于數(shù)據擾動,可能會對識別率有所影響。
8)該方法要求加入訓練集中不同種屬的古生物化化石樣本數(shù)量必須是均衡的。
9)相比與傳統(tǒng)機器學習和統(tǒng)計學定量分析古生物化石樣本,深度學習原理仍缺乏解釋性。