程希,宋新愛(ài),李國(guó)軍,包德洲,陳琪泉
(1.西安石油大學(xué)地球科學(xué)與工程學(xué)院,陜西西安710065;2.西安石油大學(xué)院士專家工作站,陜西西安710065;3.中國(guó)石油集團(tuán)測(cè)井有限公司技術(shù)中心,陜西西安710077)
近幾年,人工智能(Artificial Intelligence,AI)在科學(xué)、工程界掀起了巨大的浪潮。斯坦福大學(xué)的MARKUS等[1]和KARIANNE等[2]分別提出了數(shù)據(jù)模型驅(qū)動(dòng)的地球科學(xué)知識(shí)發(fā)現(xiàn)思想。國(guó)際巖石物理學(xué)家與測(cè)井職業(yè)分析家學(xué)會(huì)的Xu等[3]提出了“數(shù)據(jù)驅(qū)動(dòng)的巖石物理學(xué)”思想。2018年陸大衛(wèi)在測(cè)井年會(huì)上指出測(cè)井已進(jìn)入“智能測(cè)井”階段。程希等[4-5]提出“測(cè)井方法、儀器制造、測(cè)井作業(yè)、巖石物理以及測(cè)井綜合解釋”一體化和“新一代集成化測(cè)井系統(tǒng)”的思想及利用“數(shù)值模擬方法驅(qū)動(dòng)的數(shù)據(jù)流過(guò)套管電阻率測(cè)井技術(shù)”,提高過(guò)套管地層電阻率校正的精度和速度。程希等[6]發(fā)表了人工智能測(cè)井發(fā)展現(xiàn)狀和趨勢(shì)的報(bào)告??锪⒋旱萚7]展望了人工智能在石油勘探開(kāi)發(fā)領(lǐng)域的應(yīng)用前景。
中國(guó)石油大學(xué)(北京)、西南石油大學(xué)相繼建立了人工智能研究院,西安石油大學(xué)在2020年秋季開(kāi)始招收第一屆人工智能專業(yè)本科生。中國(guó)石油長(zhǎng)慶油田分公司探索在成熟區(qū)塊應(yīng)用人工智能算法替代人完成儲(chǔ)層測(cè)井解釋和質(zhì)量監(jiān)測(cè),并取得初步成效。中國(guó)石油勘探開(kāi)發(fā)研究院成立了人工智能研究所,探索把AI算法應(yīng)用于測(cè)井成像、裂縫識(shí)別等應(yīng)用中。中國(guó)石油天然氣集團(tuán)有限公司正在研發(fā)的勘探開(kāi)發(fā)夢(mèng)想云平臺(tái),通過(guò)統(tǒng)一數(shù)據(jù)湖、統(tǒng)一技術(shù)平臺(tái)、通用應(yīng)用推進(jìn)油氣勘探開(kāi)發(fā)的智能化[8-10]。李寧等[11]提出了人工智能技術(shù)在測(cè)井技術(shù)中的應(yīng)用構(gòu)想。
中國(guó)石油集團(tuán)測(cè)井有限公司把智能絞車(chē)投入現(xiàn)場(chǎng)使用,該公司擁有包括巖石物理測(cè)試數(shù)據(jù)在內(nèi)的超過(guò)30 TB的數(shù)據(jù)庫(kù),為人工智能測(cè)井奠定數(shù)據(jù)基礎(chǔ)。斯倫貝謝公司2019年建立DELFI云平臺(tái)勘探開(kāi)發(fā)認(rèn)知環(huán)境,提出“通過(guò)DELFI認(rèn)知E&P環(huán)境發(fā)揮機(jī)器學(xué)習(xí)和人工智能的力量”,將數(shù)字化更深入到智能油藏描述,推進(jìn)油氣服務(wù)的智能化。貝克休斯公司建立了以測(cè)井解釋為核心,結(jié)合錄井、油井監(jiān)測(cè)、地層測(cè)試的綜合大數(shù)據(jù)平臺(tái),促進(jìn)在石油和天然氣行業(yè)中應(yīng)用人工智能技術(shù)。AI算法引起國(guó)外油田公司和服務(wù)公司研究人員在非常規(guī)油氣勘探與開(kāi)發(fā)、測(cè)井?dāng)?shù)據(jù)處理以及巖石物理、測(cè)井模擬、測(cè)井解釋方面的興趣[12-16]。
本文分析測(cè)井大數(shù)據(jù)形成的基礎(chǔ)。從數(shù)據(jù)模型、物理模擬算法以及人工智能測(cè)井生態(tài)闡述人工智能測(cè)井的可行性,由大數(shù)據(jù)平臺(tái)、機(jī)器學(xué)習(xí)到深度學(xué)習(xí)、智能儀器等信息技術(shù)的發(fā)展,結(jié)合油田勘探開(kāi)發(fā)的應(yīng)用需求和人工智能的發(fā)展趨勢(shì),得出人工智能測(cè)井發(fā)展必經(jīng)的3個(gè)階段。
測(cè)井?dāng)?shù)據(jù)的記錄和存儲(chǔ)由最初的點(diǎn)測(cè)井手繪、光電記錄筆、描圖曬圖、716格式的磁帶記錄,到目前的磁盤(pán)記錄,各種形式的解釋報(bào)告圖件,不同測(cè)井服務(wù)公司不同存儲(chǔ)格式的測(cè)井?dāng)?shù)據(jù)。模擬測(cè)井手描的裸眼井測(cè)井曲線藍(lán)圖、數(shù)字測(cè)井磁帶記錄裸眼井?dāng)?shù)據(jù)和過(guò)套管電阻率測(cè)井在內(nèi)的生產(chǎn)測(cè)井?dāng)?shù)據(jù),錄井?dāng)?shù)據(jù),巖心、地層水分析數(shù)據(jù),試井測(cè)試數(shù)據(jù),隨鉆測(cè)井、錄井記錄數(shù)據(jù),后校正和處理解釋的數(shù)據(jù),這些形成了測(cè)井大數(shù)據(jù)的來(lái)源。
分布式永久性井下傳感器數(shù)據(jù)是測(cè)井大數(shù)據(jù)的另一個(gè)基礎(chǔ)。分布式溫度傳感器、離散分布式應(yīng)變傳感器和分布式聲波傳感器等分布式井下傳感器數(shù)據(jù),具有容量大、多樣性、迅速、準(zhǔn)確和可視化的特點(diǎn)。目前,分布式井下傳感數(shù)據(jù)的傳輸、儲(chǔ)存、處理、存檔、檢索和解釋可在測(cè)井大數(shù)據(jù)庫(kù)中完成。新的傳感器技術(shù)已能夠?qū)⒋笕萘?、多尺度和高維巖石物理數(shù)據(jù)實(shí)時(shí)流式傳輸?shù)綌?shù)據(jù)庫(kù)中[3]。
測(cè)井?dāng)?shù)字曲線、陣列數(shù)據(jù)、測(cè)井圖像、文本和表格都是巖石物理測(cè)井?dāng)?shù)據(jù)的類型,可以用深度(連續(xù)或離散)或時(shí)間對(duì)應(yīng)采集的數(shù)據(jù)。測(cè)井?dāng)?shù)據(jù)具有多尺度的特點(diǎn),例如,巖心掃描數(shù)據(jù)具有微米到厘米尺度,電聲成像數(shù)據(jù)具有毫米到厘米尺度;探測(cè)深度也不同,例如,微電阻率、聲波時(shí)差、密度、中子和自然伽馬等測(cè)井探測(cè)深度在厘米尺度,側(cè)向類測(cè)井探測(cè)深度在1 m尺度內(nèi),感應(yīng)類測(cè)井探測(cè)深度在2 m尺度內(nèi),過(guò)套管電阻率測(cè)井探測(cè)深度在1~10 m,井間聲波和電磁測(cè)井探測(cè)深度在幾百米到1 km內(nèi)。由于測(cè)井歷史累積和成像測(cè)井的大規(guī)模應(yīng)用,形成海量測(cè)井?dāng)?shù)據(jù);以上數(shù)據(jù)既具有體積屬性,也具有多樣性、可變性、可視化和價(jià)值等大數(shù)據(jù)的特征。這些都是測(cè)井大數(shù)據(jù)的基礎(chǔ),也是人工智能測(cè)井大數(shù)據(jù)基礎(chǔ)。
正向反向傳播和隨機(jī)梯度下降算法的提出,極大地推動(dòng)深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,為智能測(cè)井奠定技術(shù)基礎(chǔ)。Keith Holdday針對(duì)地球物理數(shù)據(jù),提出了數(shù)據(jù)驅(qū)動(dòng)的軟計(jì)算技術(shù)概念[17],將AI學(xué)習(xí)、計(jì)算神經(jīng)學(xué)、模式識(shí)別、統(tǒng)計(jì)學(xué)、數(shù)據(jù)科學(xué)以及數(shù)據(jù)庫(kù)等應(yīng)用技術(shù)交叉,實(shí)現(xiàn)數(shù)據(jù)清洗、分割、轉(zhuǎn)換以及建模,將建模成果應(yīng)用于地球物理中。本文提出的人工智能測(cè)井(Artificial Intelligence Logging,AIL)可以從3方面理解:①能學(xué)習(xí)地球物理測(cè)井和相關(guān)知識(shí);②能從不同格式的中大型測(cè)井?dāng)?shù)據(jù)中得出解釋結(jié)論;③能模仿人類的思維能力,從包括巖石物理模型、理論模擬結(jié)果、分析測(cè)試以及測(cè)井解釋結(jié)果等大數(shù)據(jù)分析中發(fā)現(xiàn)潛在因果規(guī)律,形成新知識(shí)和新解決方案,通過(guò)智能測(cè)井儀器解決勘探開(kāi)發(fā)中新的問(wèn)題。綜上所述,人工智能測(cè)井是測(cè)井專家和人工智能學(xué)家賦予機(jī)器綜合判斷、分析和學(xué)習(xí)能力,并使機(jī)器利用人工智能算法、計(jì)算機(jī)儲(chǔ)存與算力在測(cè)井大數(shù)據(jù)生態(tài)云中感知發(fā)現(xiàn)新知識(shí)并自我學(xué)習(xí)完善,形成人機(jī)相互學(xué)習(xí)協(xié)作解決勘探開(kāi)發(fā)中復(fù)雜測(cè)井問(wèn)題的方法技術(shù)。
人工智能測(cè)井技術(shù)是以硬件算力和測(cè)井大數(shù)據(jù)私有云為支撐,數(shù)據(jù)模型與物理模型為核心驅(qū)動(dòng),以測(cè)井應(yīng)用層為落腳點(diǎn),形成的人工智能測(cè)井生態(tài)有機(jī)體。
人工智能測(cè)井生態(tài)由智能測(cè)井儀器完成測(cè)井?dāng)?shù)據(jù)的采集、預(yù)處理,在測(cè)井大數(shù)據(jù)綜合平臺(tái)上通過(guò)人工智能和物理模擬算法完成測(cè)井?dāng)?shù)據(jù)的學(xué)習(xí)、模型的應(yīng)用、知識(shí)的發(fā)現(xiàn)和決策,由智能儀器完成現(xiàn)場(chǎng)實(shí)施。它由運(yùn)行在測(cè)井大數(shù)據(jù)上的智能算法、用于數(shù)據(jù)采集與決策實(shí)施的智能儀器以及測(cè)井大數(shù)據(jù)的管理與應(yīng)用層組成。人工智能測(cè)井的應(yīng)用層由測(cè)井大數(shù)據(jù)管理與知識(shí)發(fā)現(xiàn)、人工智能算法與模型評(píng)價(jià)、智能儀器、測(cè)井?dāng)?shù)據(jù)處理與評(píng)價(jià)組成。
測(cè)井大數(shù)據(jù)管理包括數(shù)據(jù)的分割、計(jì)算、更新、補(bǔ)充、可視化、圖表化、標(biāo)準(zhǔn)化等;知識(shí)發(fā)現(xiàn)系統(tǒng)包括數(shù)據(jù)交會(huì)、校正、分析、總結(jié)等。測(cè)井大數(shù)據(jù)私有云的數(shù)據(jù)輸入/輸出接口與分布式存儲(chǔ)和處理系統(tǒng)的接口通過(guò)光交換機(jī)連接,提交給人工智能測(cè)井云系統(tǒng)用于分析的數(shù)據(jù),優(yōu)化模型輸入權(quán)重,從數(shù)據(jù)中提取特征的卷積或循環(huán)神經(jīng)網(wǎng)絡(luò)逐漸修改給出的權(quán)重,在神經(jīng)網(wǎng)絡(luò)的某些模型中優(yōu)化學(xué)習(xí)。人工智能算法與模型評(píng)價(jià)系統(tǒng)中,包括監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)(半監(jiān)督學(xué)習(xí))、強(qiáng)化學(xué)習(xí)算法,從知識(shí)提取角度,包括分類學(xué)習(xí)算法、回歸學(xué)習(xí)、聚類學(xué)習(xí)。模型包括預(yù)測(cè)模型和描述模型。預(yù)測(cè)模型包括決策樹(shù)、基因模型、線性回歸、隨機(jī)森林等;描述模型用相關(guān)算法、路徑分析、K平均、束算法等。模型評(píng)價(jià)方法包括混淆矩陣、接收數(shù)據(jù)特征曲線、得分、訓(xùn)練與驗(yàn)證等。此外,大數(shù)據(jù)、云計(jì)算以及物聯(lián)網(wǎng)技術(shù)的發(fā)展,使測(cè)井方法、測(cè)井儀器設(shè)計(jì)與制造、巖石物理、測(cè)井?dāng)?shù)據(jù)采集、測(cè)井解釋、錄井、地質(zhì)、地震、鉆井以及永久監(jiān)測(cè)傳感器數(shù)據(jù)通過(guò)物聯(lián)網(wǎng)連接,通過(guò)邊緣計(jì)算上傳到大數(shù)據(jù)系統(tǒng)的云端,進(jìn)行大數(shù)據(jù)分析與學(xué)習(xí)、資源調(diào)配與決策。智能儀器則包括儀器的中樞、外部傳感接口、中低級(jí)運(yùn)動(dòng)操作系統(tǒng)、內(nèi)外硬件組成。本質(zhì)上,人工智能測(cè)井的發(fā)展是由大數(shù)據(jù)AI學(xué)習(xí)和物理模擬算法為內(nèi)核驅(qū)動(dòng)而發(fā)展的,以分類、回歸和預(yù)測(cè)為特征的各類AI學(xué)習(xí)算法的發(fā)展為這些測(cè)井大數(shù)據(jù)的價(jià)值挖掘、特性發(fā)現(xiàn)和趨勢(shì)預(yù)測(cè)提供了技術(shù)手段。
人工智能測(cè)井的硬件算力通常由邏輯處理器、運(yùn)行存儲(chǔ)器、網(wǎng)絡(luò)服務(wù)器組成。邏輯處理器通常由中央處理器CPU(Central Processing Unit,CPU)、圖像處理器(Graphic Processing Unit,GPU)、復(fù)雜門(mén)陣列或?qū)S脺y(cè)井功能芯片構(gòu)成,其中,CPU為人工智能測(cè)井的中央處理器,GPU為圖像處理單元,用于優(yōu)化測(cè)井大數(shù)據(jù)的處理,以利于機(jī)器學(xué)習(xí)算法的應(yīng)用;運(yùn)行存儲(chǔ)器用于臨時(shí)計(jì)算或使用存儲(chǔ)短期記憶數(shù)據(jù),通常由大量的動(dòng)態(tài)存儲(chǔ)記憶器組成;網(wǎng)絡(luò)服務(wù)器用于測(cè)井井場(chǎng)和處理中心的網(wǎng)絡(luò)交換機(jī)、路由器和其他用于鏈接服務(wù)器的設(shè)備,以連接測(cè)井云服務(wù)器和各種巖石物理測(cè)試、測(cè)井儀器、探測(cè)器、傳感器等邊緣設(shè)備。
具有圖像渲染的GPU尤為關(guān)鍵,目前最新的Titan RTX GPU數(shù)據(jù)通道傳輸率達(dá)1 Gbit/s,并且可以并行處理AI任務(wù)。深度學(xué)習(xí)所設(shè)計(jì)的模型,可以由數(shù)十億個(gè)軟件神經(jīng)元和數(shù)萬(wàn)億個(gè)連接并行訓(xùn)練,這種學(xué)習(xí)模型需要新的計(jì)算機(jī)平臺(tái)來(lái)高效運(yùn)行。相比于基于CPU的學(xué)習(xí)平臺(tái),GPU在深度學(xué)習(xí)訓(xùn)練數(shù)據(jù)時(shí),在速度和能源效率方面更具優(yōu)勢(shì),這是因?yàn)樯窠?jīng)網(wǎng)絡(luò)由大量相同的神經(jīng)元?jiǎng)?chuàng)建,本質(zhì)上是高度平行的。在私有云環(huán)境中通過(guò)訓(xùn)練平臺(tái)應(yīng)用AIL學(xué)習(xí)算法實(shí)現(xiàn)數(shù)據(jù)訓(xùn)練、測(cè)試及建模。
測(cè)井大數(shù)據(jù)私有云至少配置1個(gè)主節(jié)點(diǎn)、2個(gè)從節(jié)點(diǎn),實(shí)現(xiàn)對(duì)稱管理與分布式測(cè)井大數(shù)據(jù)存儲(chǔ)。其算力配置:至強(qiáng)48核處理器,256 GB內(nèi)存,10個(gè)SDD磁盤(pán),總存儲(chǔ)數(shù)據(jù)量10 TB(可擴(kuò)容),數(shù)據(jù)交換速度10 GBit/s;訓(xùn)練平臺(tái)配置:i9處理器(8核16線程),64 GB內(nèi)存,AI學(xué)習(xí)模塊(TensorFlow、PyTorch、Caffe、Keras、CUDA),8 GB顯存的獨(dú)立顯卡。通過(guò)電腦、智能手機(jī)、衛(wèi)星、智能儀器終端上傳數(shù)據(jù)后獲取問(wèn)題處理結(jié)果,測(cè)井大數(shù)據(jù)私有云學(xué)習(xí)訓(xùn)練平臺(tái)與應(yīng)用關(guān)系見(jiàn)圖1。
圖1 測(cè)井大數(shù)據(jù)私有云學(xué)習(xí)訓(xùn)練平臺(tái)與應(yīng)用關(guān)系圖
在復(fù)雜的井況和地層情況下,計(jì)算機(jī)快速建??梢园l(fā)揮最大的作用。對(duì)地層電聲特性和地層結(jié)構(gòu)進(jìn)行建模,通過(guò)正演迭代得到地層真實(shí)的電、聲、核特性參數(shù)或?qū)y(cè)井?dāng)?shù)據(jù)進(jìn)行校正。多物理場(chǎng)模擬可用于全面表征或預(yù)測(cè)測(cè)井響應(yīng)特性與測(cè)井儀器設(shè)計(jì),各種電、聲測(cè)井模擬方法的特點(diǎn)見(jiàn)表1。在研發(fā)中,存在尚不了解地層聲、電、核響應(yīng)特性和測(cè)井模擬過(guò)程的情況,將物理算法模型與AI學(xué)習(xí)技術(shù)集成,有效地改善模型的精度和速度。AI學(xué)習(xí)可以揭示未知的基本行為,使測(cè)井模擬速度更快、地層參數(shù)反演更精確、動(dòng)態(tài)變化更具有解釋性和預(yù)測(cè)性。
表1 測(cè)井模擬方法特點(diǎn)
AI學(xué)習(xí)算法通過(guò)已有的測(cè)井?dāng)?shù)據(jù)構(gòu)建分類、回歸或預(yù)測(cè)模型,實(shí)現(xiàn)巖性或儲(chǔ)層分類、含油氣變化的未來(lái)預(yù)測(cè),這與蒙特卡洛算法使用隨機(jī)數(shù)輸入到專家構(gòu)建的模型預(yù)測(cè)概率類似。AI學(xué)習(xí)最適合基于觀察已知結(jié)果對(duì)新數(shù)據(jù)進(jìn)行快速、自動(dòng)預(yù)測(cè)。實(shí)際應(yīng)用中,AI學(xué)習(xí)可以很方便地測(cè)試和優(yōu)化仿真模型。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,主要用來(lái)進(jìn)行回歸、聚類和預(yù)測(cè),具有人工智能的特點(diǎn),能模仿人腦的數(shù)據(jù)處理和決策功能,能夠從未知數(shù)據(jù)或未標(biāo)記的數(shù)據(jù)中學(xué)習(xí)知識(shí),并不需要監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),也稱為深度神經(jīng)學(xué)習(xí)或深度神經(jīng)網(wǎng)絡(luò)。對(duì)深度學(xué)習(xí)而言,卷積神經(jīng)網(wǎng)絡(luò)在處理復(fù)雜數(shù)據(jù)時(shí),使用卷積濾波器,神經(jīng)元代表特定內(nèi)核,在后傳播過(guò)程中降低了節(jié)點(diǎn)數(shù),形成卷積序列以利于提取特征值。具有隱含層的循環(huán)神經(jīng)網(wǎng)絡(luò)能模擬數(shù)據(jù)流,通過(guò)長(zhǎng)短記憶法處理未知數(shù)據(jù)的過(guò)程事件,通過(guò)不同算法共享系數(shù)降低了需要學(xué)習(xí)的參數(shù)數(shù)量。AI分類學(xué)習(xí)算法特點(diǎn)與測(cè)井適用性見(jiàn)表2。
表2 AI分類學(xué)習(xí)算法特點(diǎn)與測(cè)井適用性
AI學(xué)習(xí)使系統(tǒng)能夠從已有大量數(shù)據(jù)中自動(dòng)學(xué)習(xí)并從經(jīng)驗(yàn)中進(jìn)行改進(jìn),無(wú)需人工干預(yù)。其過(guò)程始于觀察學(xué)習(xí)數(shù)據(jù),根據(jù)實(shí)例形成模式,進(jìn)行預(yù)測(cè),做出更好的決策,處理流程見(jiàn)圖2。測(cè)井解釋中,分類算法主要用于測(cè)井巖性識(shí)別。分類樹(shù)、回歸樹(shù)AI學(xué)習(xí)算法具有統(tǒng)一的函數(shù),利用交叉驗(yàn)證可以測(cè)試新樹(shù)在新數(shù)據(jù)上的準(zhǔn)確率或精度,估計(jì)生成樹(shù)的預(yù)測(cè)精度,更好地了解樹(shù)對(duì)新數(shù)據(jù)的預(yù)測(cè)準(zhǔn)確性。集成學(xué)習(xí)方法將許多弱學(xué)習(xí)的結(jié)果融合到高質(zhì)量的整體預(yù)測(cè)器中,根據(jù)需求探索求取預(yù)測(cè)精度最好的方法。評(píng)價(jià)學(xué)習(xí)質(zhì)量的方法,可以在獨(dú)立的測(cè)試集上評(píng)估整體,也可以通過(guò)交叉驗(yàn)證來(lái)評(píng)估整體。例如,循環(huán)神經(jīng)網(wǎng)絡(luò)長(zhǎng)短相記憶法(LSTM)主要用于模型復(fù)雜的空間物理模擬及時(shí)間序列變化趨勢(shì)預(yù)測(cè)。LSTM模型在時(shí)間序列或空間序列數(shù)據(jù)學(xué)習(xí)上比循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)具有更好的表現(xiàn),它在輸入長(zhǎng)短向量序列數(shù)據(jù)時(shí),加入了循環(huán)神經(jīng)網(wǎng)絡(luò),對(duì)數(shù)據(jù)進(jìn)行優(yōu)化處理。該方法最常使用梯度下降的反向傳播學(xué)習(xí)算法,先隨機(jī)初始化權(quán)重,再使用梯度下降法調(diào)整權(quán)重使誤差最小化,學(xué)習(xí)過(guò)程包括連續(xù)多次前進(jìn)和后退。在前向傳遞中,通過(guò)多個(gè)隱藏的非線性層將輸入向輸出轉(zhuǎn)換,并最終將計(jì)算出的輸出與相應(yīng)輸入的實(shí)際輸出進(jìn)行比較、優(yōu)化。在后向傳遞中,相對(duì)于網(wǎng)絡(luò)參數(shù)誤差的導(dǎo)數(shù)用于在反向傳播中調(diào)整權(quán)重,以使輸出的誤差最小。根據(jù)誤差要求,該過(guò)程可持續(xù)多次,直到模型預(yù)測(cè)滿足改進(jìn)要求為止。機(jī)器學(xué)習(xí)通常由監(jiān)督式學(xué)習(xí)、無(wú)人監(jiān)督式學(xué)習(xí)和強(qiáng)化學(xué)習(xí)組成。強(qiáng)化學(xué)習(xí)涉及智能儀器應(yīng)如何在井孔環(huán)境下采取行動(dòng),最大限度地提高累積獎(jiǎng)勵(lì)的概念。智能儀器通過(guò)強(qiáng)化學(xué)習(xí)從測(cè)井專家和現(xiàn)場(chǎng)獲取經(jīng)驗(yàn),以提高數(shù)據(jù)獲取、測(cè)井資料處理應(yīng)用和現(xiàn)場(chǎng)決策的準(zhǔn)確度。
圖2 AI學(xué)習(xí)數(shù)據(jù)分析流程
目前Python語(yǔ)言的數(shù)據(jù)處理能力和豐富的學(xué)習(xí)庫(kù),使其具有良好的多樣性和擴(kuò)展性,這種設(shè)計(jì)架構(gòu)有利于開(kāi)展測(cè)井大數(shù)據(jù)管理、測(cè)井模擬仿真與測(cè)井?dāng)?shù)據(jù)處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、人工智能。同樣具有強(qiáng)大數(shù)據(jù)統(tǒng)計(jì)分析函數(shù)和AI學(xué)習(xí)功能包的R語(yǔ)言也正引起廣泛關(guān)注??傊?Python語(yǔ)言以其獨(dú)有的全球支持、免費(fèi)開(kāi)源、兼容性好、移植性強(qiáng)、可混合編程、簡(jiǎn)單易學(xué)和具有強(qiáng)大的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)模塊的優(yōu)點(diǎn),正受到越來(lái)越多工程師和研究人員的青睞。
目前測(cè)井大數(shù)據(jù)管理系統(tǒng)有2種:①Hadoop大數(shù)據(jù)平臺(tái),其內(nèi)核是基于Java建立的可擴(kuò)展系統(tǒng),通常由分布式文件管理系統(tǒng)(HDFS)、YARN、Apache Hives和Map Reduce組成,能在不受時(shí)間、地域限制的數(shù)十臺(tái)計(jì)算機(jī)上進(jìn)行分布式數(shù)據(jù)存儲(chǔ)。HDFS數(shù)據(jù)結(jié)構(gòu)可以提供高吞吐量的數(shù)據(jù)訪問(wèn),適用于具有大數(shù)據(jù)集的應(yīng)用程序,可實(shí)現(xiàn)對(duì)文件系統(tǒng)數(shù)據(jù)的流式訪問(wèn)。YARN模塊為分布式數(shù)據(jù)存儲(chǔ)和處理測(cè)井大數(shù)據(jù)平臺(tái)提供資源和進(jìn)程管理。Map Reduce作業(yè),將數(shù)據(jù)組織到分布式文件系統(tǒng)的表中,并在集群上運(yùn)行處理,它的映射步驟是1個(gè)主節(jié)點(diǎn)接受輸入并將其劃分為較小的子問(wèn)題,然后將其分配給工作程序節(jié)點(diǎn),映射步驟完成后,主節(jié)點(diǎn)將獲取所有子問(wèn)題的答案,并將其組合以輸出結(jié)果。這是測(cè)井大數(shù)據(jù)存儲(chǔ)、處理和輸出的基本原理。②以在Hadoop大數(shù)據(jù)平臺(tái)基礎(chǔ)上建立的Spark系統(tǒng)為代表的測(cè)井大數(shù)據(jù)存儲(chǔ)與處理系統(tǒng),提供分布式任務(wù)分配、結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)調(diào)度和基本數(shù)據(jù)輸入、輸出功能;Spark使用稱為彈性分布式數(shù)據(jù)集的特殊基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),把存儲(chǔ)在不同機(jī)器上的數(shù)據(jù)形成邏輯數(shù)據(jù)集,從而形成內(nèi)存式處理數(shù)據(jù),免受磁盤(pán)數(shù)據(jù)傳輸率的影響。
人工智能測(cè)井隨著信息技術(shù)和油氣勘探開(kāi)發(fā)對(duì)測(cè)井技術(shù)的要求而發(fā)展。由于實(shí)際地層的復(fù)雜性,為滿足現(xiàn)場(chǎng)需求和測(cè)井儀器研發(fā),地層模型設(shè)計(jì)越來(lái)越復(fù)雜,模擬網(wǎng)格形狀和網(wǎng)格數(shù)越來(lái)越多,現(xiàn)有的計(jì)算資源難以滿足現(xiàn)場(chǎng)需求。隨著勘探的深入,非常規(guī)油氣正引起石油公司的關(guān)注,傳統(tǒng)的儲(chǔ)層模型難以滿足復(fù)雜的非常規(guī)油氣儲(chǔ)層的建模和評(píng)價(jià)需求,以人工智能為內(nèi)核的智能測(cè)井技術(shù)更適合解決這種非常規(guī)資源評(píng)價(jià)及開(kāi)發(fā)。從現(xiàn)場(chǎng)需求角度,人工智能測(cè)井的應(yīng)用可以貫穿油氣勘探和開(kāi)發(fā)全階段。
成熟區(qū)塊有成熟的解釋模型,需要機(jī)器學(xué)習(xí)等智能算法從老井解釋結(jié)果或巖石物理測(cè)試結(jié)果中學(xué)習(xí)獲取參數(shù),實(shí)現(xiàn)測(cè)井解釋智能化,即人工智能測(cè)井發(fā)展的第一階段:針對(duì)單口或多口井?dāng)?shù)據(jù)的AI學(xué)習(xí)和建模驅(qū)動(dòng)助力測(cè)井專家的人工智能測(cè)井初級(jí)階段。由于面對(duì)的是小中型數(shù)據(jù),人工智能測(cè)井的應(yīng)用包括測(cè)井?dāng)?shù)據(jù)質(zhì)量控制與標(biāo)準(zhǔn)化、地層對(duì)比、巖性識(shí)別、力學(xué)評(píng)價(jià)、缺失數(shù)據(jù)修復(fù)、區(qū)域測(cè)井曲線的深度匹配等工作。
隨著井況和安全環(huán)保的要求提高,評(píng)價(jià)地層變得越來(lái)越復(fù)雜,需要具有蛇結(jié)構(gòu)的爬行臂,在井孔環(huán)境下能夠受系統(tǒng)導(dǎo)航自主移動(dòng)測(cè)井儀器以適應(yīng)井下?tīng)顩r,自適應(yīng)探測(cè)器和功率組合,即人工智能測(cè)井發(fā)展的第二階段:自主測(cè)井儀器具有學(xué)習(xí)建模和預(yù)測(cè)評(píng)價(jià)的人工智能測(cè)井中級(jí)階段。由于測(cè)井?dāng)?shù)據(jù)和其他油氣工業(yè)數(shù)據(jù)量的增加及算力提升,以數(shù)據(jù)和物理模擬驅(qū)動(dòng)的人工智能測(cè)井將智能獲取地層真參數(shù),對(duì)相同沉積環(huán)境巖心的巖石物理參數(shù)預(yù)測(cè)。
具有數(shù)字孿生的智能機(jī)器在測(cè)井大數(shù)據(jù)生態(tài)云中實(shí)現(xiàn)儀器探測(cè)參數(shù)調(diào)整、地層電聲核真測(cè)井值獲取、測(cè)井知識(shí)與規(guī)律的發(fā)現(xiàn)、人機(jī)交互學(xué)習(xí)、科學(xué)決策實(shí)施、深度強(qiáng)化學(xué)習(xí)完善和提高AIL的能力。進(jìn)入人工智能測(cè)井發(fā)展的第三階段:人工智能測(cè)井高級(jí)階段。隨著智能儀器的發(fā)展,人工智能生態(tài)云的發(fā)展和完善,能夠?qū)崿F(xiàn)隨鉆測(cè)井虛擬仿真導(dǎo)向、油藏智能描述、動(dòng)態(tài)監(jiān)測(cè)與壽命預(yù)測(cè)、虛擬測(cè)井儀器與地層真參數(shù)提取。
(1)以測(cè)井大數(shù)據(jù)平臺(tái)支撐、數(shù)據(jù)模型和物理模擬為核心的人工智能測(cè)井生態(tài)云的建立,標(biāo)志著人工智能測(cè)井時(shí)代的來(lái)臨。
(2)人工智能測(cè)井將打破儀器制造、方法研究、巖石物理實(shí)驗(yàn)、測(cè)井?dāng)?shù)據(jù)采集和測(cè)井解釋的界限,以數(shù)據(jù)為紐帶貫穿整個(gè)測(cè)井過(guò)程。
(3)信息技術(shù)的發(fā)展和油氣勘探開(kāi)發(fā)的需求,促使人工智能測(cè)井的發(fā)展必將經(jīng)歷作為測(cè)井專家助手為特征的AIL初級(jí)階段;自主移動(dòng)儀器和建立在測(cè)井大數(shù)據(jù)基礎(chǔ)上的數(shù)據(jù)模型與物理模擬結(jié)合驅(qū)動(dòng)的復(fù)雜模型建立為特征的AIL中級(jí)階段;以智能儀器和知識(shí)發(fā)現(xiàn)、深度強(qiáng)化學(xué)習(xí)完成智能測(cè)井體自我完善和提高為特征的AIL高級(jí)階段。