曹志民 吳 云 韓 建 呂秀麗 宋鴻梅 趙麗華
(1.東北石油大學(xué)電子科學(xué)學(xué)院;2.大慶油田博士后科研工作站)
測(cè)井?dāng)?shù)據(jù)巖相分類的機(jī)器學(xué)習(xí)方法和大數(shù)據(jù)巖相分類探討①
曹志民1,2吳 云1韓 建1呂秀麗1宋鴻梅1趙麗華1
(1.東北石油大學(xué)電子科學(xué)學(xué)院;2.大慶油田博士后科研工作站)
對(duì)現(xiàn)有測(cè)井?dāng)?shù)據(jù)巖相分類的機(jī)器學(xué)習(xí)方法進(jìn)行歸納總結(jié),并針對(duì)大數(shù)據(jù)巖相分類的相關(guān)問(wèn)題進(jìn)行探討。
機(jī)器學(xué)習(xí) 巖相分類 儲(chǔ)層預(yù)測(cè) 測(cè)井?dāng)?shù)據(jù) 大數(shù)據(jù)
巖相是指一定沉積環(huán)境下形成的一系列具有特殊巖性(如礦物組成、沉積結(jié)構(gòu)及幾何結(jié)構(gòu)等)的巖石或巖石組。準(zhǔn)確可靠的巖相分析對(duì)于地層特性分析、地層學(xué)小層對(duì)比及儲(chǔ)層預(yù)測(cè)等油氣田勘探開(kāi)發(fā)應(yīng)用來(lái)說(shuō)至關(guān)重要[1~4]。巖相分類是油氣田開(kāi)發(fā)中地層特性分析、小層對(duì)比及儲(chǔ)層預(yù)測(cè)等應(yīng)用的關(guān)鍵環(huán)節(jié)。顯然,通過(guò)取心井提取巖心進(jìn)行巖相分析的精確度和可靠性是最高的,但是這種方法不但費(fèi)時(shí),而且成本非常高;特別的,對(duì)于密井網(wǎng)獲取的大量數(shù)據(jù)來(lái)說(shuō),這種方法根本就行不通。測(cè)井技術(shù)通過(guò)利用不同物理屬性(如自然伽馬、電阻率、自然電位、聲波速度、巖石體積密度、巖石中子減速及俘獲信息等)的測(cè)井手段可以獲取能夠直接反映地下連續(xù)巖相地質(zhì)信息的測(cè)井響應(yīng)數(shù)據(jù)(信息)??梢?jiàn),測(cè)井?dāng)?shù)據(jù)(信息)能夠直接用于巖相分析。然而,實(shí)際獲取的測(cè)井?dāng)?shù)據(jù)不可避免的會(huì)受到采集、記錄及地層環(huán)境等多種內(nèi)在或外在因素造成的噪聲和失真的干擾,從而導(dǎo)致測(cè)井信號(hào)降質(zhì),而且不同巖相的測(cè)井響應(yīng)往往具有一定的重疊特性,這就造成了利用測(cè)井曲線進(jìn)行巖相分類解譯往往依賴于解譯人員的經(jīng)驗(yàn),且解譯成果具有一定的多解性,而且人工測(cè)井?dāng)?shù)據(jù)巖相分類的效率還是太低。為此,在過(guò)去的20年里,樸素貝葉斯(Na?ve Bayes,NB)分類器[5]、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANNs)[6~11]、決策樹(shù)(Decision Tree,DT)[12]、支持向量機(jī)(Support Vector Machine,SVM)[13~15]、聯(lián)合/集成分類器(Combined Classifier,CC)[16,17]等(有監(jiān)督)機(jī)器學(xué)習(xí)方法不斷被成功應(yīng)用于各種不同地質(zhì)環(huán)境的巖相分類和識(shí)別應(yīng)用中。
隨著我國(guó)大部分油氣田已經(jīng)進(jìn)入開(kāi)發(fā)后期,地層結(jié)構(gòu)越來(lái)越復(fù)雜,油氣開(kāi)發(fā)成本越來(lái)越高,各種應(yīng)用都對(duì)巖相分類的精度和可靠性提出了越來(lái)越高的要求。為此,越來(lái)越多的機(jī)器學(xué)習(xí)方法被應(yīng)用到測(cè)井?dāng)?shù)據(jù)巖相分類的研究中。筆者對(duì)現(xiàn)有的主要巖相分類機(jī)器學(xué)習(xí)方法進(jìn)行歸納總結(jié),并針對(duì)大數(shù)據(jù)巖相分類的機(jī)器學(xué)習(xí)方法存在的問(wèn)題進(jìn)行了較為詳細(xì)的分析。
一般的,機(jī)器學(xué)習(xí)方法的基本流程如圖1所示。
圖1 機(jī)器學(xué)習(xí)方法基本流程
由圖1可知,在選定分類器的情況下,分類器分類性能直接取決于訓(xùn)練數(shù)據(jù)的構(gòu)建和特征提取/選擇?,F(xiàn)對(duì)基于ANNs分類器、基于SVM分類器和基于聯(lián)合/集成分類器3種典型的巖相分類機(jī)器學(xué)習(xí)方法,分別從分類器基本原理和典型應(yīng)用的訓(xùn)練數(shù)據(jù)構(gòu)建及特征提取/選擇等方面進(jìn)行介紹。
1.1 ANNs法
ANNs方法采用的是一種并行的分布式處理網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)多層神經(jīng)元結(jié)構(gòu)的加權(quán)組合構(gòu)成的前饋神經(jīng)網(wǎng)絡(luò)或誤差反向傳播神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))在巖相分類等地質(zhì)和地球物理勘探中都得到了較好的應(yīng)用。顯然,神經(jīng)網(wǎng)絡(luò)的基本元素是神經(jīng)元,圖2a給出了神經(jīng)元的基本結(jié)構(gòu),以此為基礎(chǔ),可以構(gòu)造如圖2b所示的多層神經(jīng)網(wǎng)絡(luò),圖2b中的每個(gè)圓形結(jié)構(gòu)代表一個(gè)圖2a給出的神經(jīng)元結(jié)構(gòu)。
圖2 神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)示意圖
由圖2可知,ANNs網(wǎng)絡(luò)的成功應(yīng)用需要對(duì)網(wǎng)絡(luò)中的參數(shù)組{Wi,Bi}進(jìn)行精確學(xué)習(xí),而這些參數(shù)精確學(xué)習(xí)的基礎(chǔ)是質(zhì)量良好的訓(xùn)練樣本。
文獻(xiàn)[9]在對(duì)法國(guó)拉希奧塔附近的南省盆地La Ciotat-1號(hào)井進(jìn)行巖相分析時(shí)采用孔隙度、密度、P波速度、S1波速度、S2波速度、礦化基質(zhì)體積模量、礦化基質(zhì)剪切模量及各種礦物含量等19種特征,對(duì)石灰?guī)r、石英、純凈砂巖及碳酸鹽砂巖等巖相進(jìn)行分類。所采用的ANNs網(wǎng)絡(luò)為一個(gè)三層BP ANNs:一個(gè)輸入層,一個(gè)隱層和一個(gè)輸出層。實(shí)驗(yàn)結(jié)果表明該井的ANNs巖相預(yù)測(cè)精度達(dá)到了85.62%。
盡管ANNs法可以通過(guò)學(xué)習(xí)實(shí)現(xiàn)較高的分類精度,但仍然具有對(duì)不同數(shù)據(jù)集的泛化能力很弱、參數(shù)過(guò)多,以及學(xué)習(xí)時(shí)間長(zhǎng)甚至達(dá)不到學(xué)習(xí)效果等缺陷。
1.2 SVM法
SVM法是一種基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化等嚴(yán)格理論基礎(chǔ)的間隔最大準(zhǔn)則下的分類方法,如圖3所示。
SVM法的判別函數(shù)f(x)=ωTx+b,在間隔最大準(zhǔn)則下通過(guò)引入支持向量的概念,最優(yōu)判別參數(shù)求解的優(yōu)化問(wèn)題通過(guò)對(duì)偶轉(zhuǎn)化為易于求解的如下二次規(guī)劃問(wèn)題:
圖3 SVM法分類劃分示意圖
s.t.yi(ωTxi+b)≥1,i=1,…,N
(1)
構(gòu)造拉格朗日函數(shù):
(2)
s.t. αi≥0,i=1,…,N
(3)
最終,可以根據(jù)下式給出最優(yōu)SVM參數(shù):
(4)
上述SVM分類原理是針對(duì)線性SVM分類器而言的,對(duì)于非線性分類問(wèn)題,僅需引入核函數(shù),通過(guò)對(duì)上述優(yōu)化問(wèn)題進(jìn)行核擴(kuò)展即可。顯然,SVM方法與ANNs方法相比,學(xué)習(xí)參數(shù)要少很多,并且具有更好的泛化性能。
文獻(xiàn)[13]在對(duì)中東某砂巖儲(chǔ)層開(kāi)展的關(guān)于測(cè)井曲線巖相分類研究中,以井徑CAL、自然伽馬GA、光電PEF、中子孔隙度NPHI、聲吶孔隙度DT、體積密度RHOB、深側(cè)向電阻率LLD、淺側(cè)向電阻率LLS和微球聚焦電阻率MSFL共9種測(cè)井曲線為輸入特征,對(duì)純凈砂巖、砂礫巖和砂頁(yè)巖3種巖相進(jìn)行分類。結(jié)果表明,與ANNs法相比,SVM法具有更好的分類性能。
SVM法雖然已經(jīng)較為成功地應(yīng)用于巖相分類等應(yīng)用中,但是面對(duì)復(fù)雜數(shù)據(jù)集,核函數(shù)的選擇等問(wèn)題制約了該方法的泛化能力。
1.3 聯(lián)合/集成學(xué)習(xí)法
雖然各種專家系統(tǒng)和單分類器機(jī)器學(xué)習(xí)系統(tǒng)在測(cè)井曲線巖相識(shí)別、分類等研究中已經(jīng)取得了較多的成功經(jīng)驗(yàn),然而,隨著大多數(shù)油氣田開(kāi)發(fā)已經(jīng)進(jìn)入中晚期,地層地質(zhì)環(huán)境越來(lái)越復(fù)雜,儲(chǔ)層預(yù)測(cè)難度和開(kāi)采成本不斷增加,為了更好地實(shí)現(xiàn)對(duì)復(fù)雜環(huán)境下專家知識(shí)和實(shí)際測(cè)試數(shù)據(jù)的有效集成,有必要開(kāi)展更復(fù)雜的機(jī)器學(xué)習(xí)方法來(lái)提高系統(tǒng)預(yù)測(cè)和分析的準(zhǔn)確度和可靠性。
聯(lián)合/集成機(jī)器學(xué)習(xí)法是通過(guò)多個(gè)同類或異類學(xué)習(xí)機(jī)器構(gòu)成一個(gè)學(xué)習(xí)網(wǎng)絡(luò),進(jìn)而,通過(guò)綜合各個(gè)學(xué)習(xí)機(jī)器的判決結(jié)果實(shí)現(xiàn)最終判決,圖4給出了該類方法的基本框圖。
圖4 聯(lián)合/集成機(jī)器學(xué)習(xí)方法基本框圖
可見(jiàn),該類方法主要由兩部分組成,即學(xué)習(xí)機(jī)器的選擇和決策規(guī)則的制定。根據(jù)學(xué)習(xí)機(jī)器的構(gòu)成情況,可以有神經(jīng)網(wǎng)絡(luò)委員會(huì)法、集成學(xué)習(xí)法及異構(gòu)機(jī)器聯(lián)合學(xué)習(xí)法等。
文獻(xiàn)[17]對(duì)巴西亞馬遜油田相關(guān)儲(chǔ)層進(jìn)行的巖相識(shí)別研究中,利用自然伽馬GR、感應(yīng)測(cè)井ILD、聲吶DT和密度RHOB共4種測(cè)井曲線進(jìn)行砂屑灰?guī)r、無(wú)水石膏、頁(yè)巖和巖鹽4種巖相,分別采用多層感知器、SVM、kNN、決策樹(shù)J48及邏輯回歸等單個(gè)分類法以及所有這些方法集成的集成分類法進(jìn)行巖相分類研究。實(shí)驗(yàn)結(jié)果表明,集成分類法在6組測(cè)試中的4組分類精度最高,而且相關(guān)統(tǒng)計(jì)結(jié)果表明,在改變訓(xùn)練數(shù)據(jù)的情況下,集成分類法的性能最穩(wěn)定。
隨著勘探開(kāi)發(fā)進(jìn)程的推進(jìn),國(guó)內(nèi)外油氣田勘探開(kāi)發(fā)均已進(jìn)入大數(shù)據(jù)時(shí)代[18~20]。所謂大數(shù)據(jù)就是指數(shù)據(jù)量和數(shù)據(jù)屬性變化已經(jīng)超出現(xiàn)有數(shù)據(jù)庫(kù)與相關(guān)軟件工具的采集、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集。具體的,大數(shù)據(jù)主要體現(xiàn)為數(shù)據(jù)量大、數(shù)據(jù)質(zhì)量不統(tǒng)一及數(shù)據(jù)結(jié)構(gòu)多樣化等多源、異構(gòu)且多時(shí)相特點(diǎn)。顯然,油氣田勘探開(kāi)發(fā)過(guò)程中測(cè)井?dāng)?shù)據(jù)本身就是一種大數(shù)據(jù),利用測(cè)井?dāng)?shù)據(jù)可以進(jìn)行巖相分類、巖相相關(guān)的沉積微相分類、小層對(duì)比等多種任務(wù),且不同開(kāi)發(fā)區(qū)塊,不同沉積相下的巖相種類變化多樣等問(wèn)題,都為機(jī)器學(xué)習(xí)方法在測(cè)井?dāng)?shù)據(jù)巖相分類等應(yīng)用中的大數(shù)據(jù)分析提出了很多亟待解決的難題。
綜合考慮,面對(duì)大數(shù)據(jù)的應(yīng)用需求,傳統(tǒng)機(jī)器學(xué)習(xí)方法主要存在如下問(wèn)題:
a. 機(jī)器學(xué)習(xí)分類方法的魯棒性問(wèn)題。利用某個(gè)數(shù)據(jù)庫(kù)或數(shù)據(jù)域的樣本訓(xùn)練得到的學(xué)習(xí)機(jī)器很難適用于其他數(shù)據(jù)庫(kù)或數(shù)據(jù)域中的數(shù)據(jù)。
b. 類別確定性問(wèn)題。傳統(tǒng)機(jī)器學(xué)習(xí)方法的訓(xùn)練數(shù)據(jù)往往是針對(duì)有限已知類別進(jìn)行的,而隨著數(shù)據(jù)的快速變化,類別多變性問(wèn)題很難得到解決。
c. 傳統(tǒng)機(jī)器學(xué)習(xí)方法一般是針對(duì)單任務(wù)學(xué)習(xí),不適合大數(shù)據(jù)環(huán)境下的多任務(wù)學(xué)習(xí)和知識(shí)遷移的需求。
顯然,大數(shù)據(jù)分類技術(shù)需要重點(diǎn)著眼于多領(lǐng)域表示學(xué)習(xí)技術(shù),在數(shù)據(jù)聯(lián)合表示、聯(lián)合特征提取與選擇、跨領(lǐng)域知識(shí)遷移等方面進(jìn)行深入研究。
面對(duì)日益復(fù)雜的地質(zhì)地理?xiàng)l件,測(cè)井?dāng)?shù)據(jù)在巖相分類相關(guān)應(yīng)用的研究中越來(lái)越迫切的需要人工智能與機(jī)器學(xué)習(xí)方法的參與。針對(duì)測(cè)井?dāng)?shù)據(jù)巖相分類問(wèn)題,對(duì)現(xiàn)有機(jī)器學(xué)習(xí)方法進(jìn)行了歸納,重點(diǎn)對(duì)ANNs、SVM和聯(lián)合/集成分類法進(jìn)行了介紹,并對(duì)測(cè)井?dāng)?shù)據(jù)巖相分類大數(shù)據(jù)分析的機(jī)器學(xué)習(xí)方法存在的問(wèn)題進(jìn)行了探討。顯然,聯(lián)合/集成學(xué)習(xí)方法是今后勘探開(kāi)發(fā)大數(shù)據(jù)分析的一個(gè)主流發(fā)展方向,在特征選擇、分類器選擇及分類決策等多方面還存在較多問(wèn)題需要解決。而對(duì)于測(cè)井大數(shù)據(jù)來(lái)說(shuō),重點(diǎn)在于多任務(wù)聯(lián)合特征和知識(shí)的應(yīng)用潛能挖掘。
[1] Rogers S J,Fang J H,Karr C L,et al.Determination of Lithology from Well Logs Using a Neural Network[J].AAPG Bulletin,1992,5(5):731~739.
[2] A Kadkhodaie Ilkhchi,Rezaee M,Moallemi S A.A Fuzzy Logic Approach for Estimation of Permeability and Rock Type from Conventional Well Log Data:An Example from the Kangan Reservoir in the Iran Offshore Gas Field[J]. Journal of Geophysics & Engineering,2006,3(4):356~369.
[3] Dong S Q,Wang Z Z,Zeng L B.Lithology Identification Using Kernel Fisher Discriminant Analysis with Well Logs[J].Journal of Petroleum Science and Engineering,2016,143:95~102.
[4] 趙顯令,王貴文,周正龍,等.地球物理測(cè)井巖性解釋方法綜述[J].地球物理學(xué)進(jìn)展,2015,30(3):1278~1287.
[5] Li Y M,Richard A S.Facies Identification from Well Logs:A Comparison of Discriminant Analysis and Na?ve Bayes Classifier[J].Journal of Petroleum Science and Engineering,2006,53(3-4):149~157.
[6] Derek H,Johns R,Pasternack E.Comparative Study of a Backpropagation Neural Network and Statistical Pattern Recognition Techniques in Identifying Sandstone Lithofacies[C].Processdings 1990 Conference on Artificial Intelligence in Petroleum Exploration and Production.Houston,TX(United States):Knowledge Systems, Inc,1990:41~49.
[7] Bhatt A,Helle H.Determination of Facies from Well Logs Using Modular Neural Networks[J].Pet Geosci,2002,8(3):217~228.
[8] Dubois M K,Bohling G C,Chakrabarti S.Comparison of Four Approaches to a Rock Facies Classification Problem[J].Computers & Geosciences,2007,33(5):599~617.
[9] Adrielle A S,Irineu A L.Artificial Neural Networks to Support Petrographic Classification of Carbonate-Siliciclastic Rocks Using Well Logs and Textural Information[J].Journal of Applied Geophysics,2015,117:118~125.
[10] 張強(qiáng),許少華,富宇.基于過(guò)程神經(jīng)網(wǎng)絡(luò)的儲(chǔ)層微觀孔隙結(jié)構(gòu)類型預(yù)測(cè)[J].化工自動(dòng)化及儀表,2015,42(8):893~897.
[11] Sasmita S,Madan K J.Pattern Recognition in Lithology Classification:Modeling Using Neural Networks,Self-Organizing Maps and Genetic Algorithms[J].Hydrogeol J(Springer Online),2016,(1):20.
[12] 石寧,李洪奇,羅偉平.數(shù)據(jù)挖掘與測(cè)井解釋:應(yīng)用于礫巖儲(chǔ)層[J].應(yīng)用地球物理(英文版),2015,12(2):263~272.
[13] Anazi A A,Gates I D.On the Capability of Support Vector Machines to Classify Lithology from Well Logs[J].Natural Resources Research,2010,19(2):125~139.
[14] Sebtosheikh M A,Motafakkerfard R.Support Vector Machine Method,A New Technique for Lithology Prediction in an Iranian Heterogeneous Carbonate Reservoir Using Petrophysical Well Logs[J].Carbonates Evaporites,2015,30:59~68.
[15] Fatai A,Suli A.Integrating Seismic and Log Data for Improved Petroleum Reservoir Properties Estimation Using Non-linear Feature-selection Based Hybrid Computational Intelligence Models[J].Journal of Petroleum Science and Engineering,2016,145:230~237.
[16] Christopher M G,Arvin A.Collaborative Multi-agent Rock Facies Classification from Wireline Well Log Data[J].Engineering Applications of Artificial Intelligence,2010,23:1158~1172.
[17] Joacir Marques de Oliveira Jnior,Eulanda Miranda dos Santos.Ensemble of Heterogeneous Classifiers Applied to Lithogacies Classification Using Logs from Different Wells[C].Neural Networks (IJCNN),The 2013 International Joint Conference on.Piscataway,NJ:IEEE,2013:1~6.
[18] 崔海福,何貞銘,王寧.大數(shù)據(jù)在石油行業(yè)中的應(yīng)用[J].石油化工自動(dòng)化,2016,52(2):43~45.
[19] 李洪奇,郭海峰,郭海敏,等.復(fù)雜儲(chǔ)層測(cè)井評(píng)價(jià)數(shù)據(jù)挖掘方法研究[J].石油學(xué)報(bào),2009,30(4):542~548.
[20] Johnston J,Guichard A.New Findings in Drilling and Wells Using Big Data Analytics[C].Offshore Technology Conference.Calgary,Canada:Society of Petroleumn Engineers(SPE),2015:OTC-26021-MS 1~8.
MachineLearningMethodsforLogDataLithofaciesClassificationandBigDataLithologyClassificationDiscussion
CAO Zhi-min1,2, WU Yun1, HAN Jian1, LV Xiu-li1, SONG Hong-mei1, ZHAO Li-hua1
(1.SchoolofElectronicScience;NortheastPetroleumUniversity;2.PostdoctoralResearchStation,DaqingOilfield)
The existing machine learning methods for lithofacies classification of the log data were summarized and issues relating to big data lithofacies classification were discussed.
machine learning, lithofacies classification, reservoir prediction, log data, big data
TH865
A
1000-3932(2017)08-0717-05
2016-12-28,
2017-04-20)
曹志民(1980-),講師,博士后,從事多源信號(hào)融合及模式識(shí)別、大數(shù)據(jù)儲(chǔ)層預(yù)測(cè)及油藏描述的研究,dahai0464@sina.com。