智勤功
中國石油化工股份有限公司勝利油田分公司石油工程技術(shù)研究院
目前,我國大部分油田都處在開發(fā)的中后期,油井供液不足現(xiàn)象越來越嚴重[1]。對于供液不足油井而言,充滿程度不足通常會引起空抽和液擊工況。這樣不僅對抽油設(shè)備造成損耗,而且會消耗很多的電能,顯著提高了油田的開發(fā)成本。
針對供液不足油井的變化情況,目前采用的方法有:①利用動液面監(jiān)測判別油井供液不足的程度[2-3],但傳統(tǒng)的動液面監(jiān)測無法做到實時監(jiān)測,由于井下環(huán)境復(fù)雜,監(jiān)測誤差也較大。②根據(jù)示功圖判斷油井供液不足的程度,但該方法缺乏有效的識別方法,無法進行自動化分析,主要依靠工作人員經(jīng)驗來判斷油井供液不足的程度,缺乏穩(wěn)定性和權(quán)威性。以往的特征提取比較依賴先驗知識,隨著深度學(xué)習(xí)的快速發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNN)可以學(xué)習(xí)性地提取由訓(xùn)練數(shù)據(jù)驅(qū)動的特征描述,使其更加有變通性和通用性。CNN被看作達成深度學(xué)習(xí)的關(guān)鍵手段,但早期的CNN 由于缺乏大數(shù)據(jù)支持且硬件性能不佳,無法處理復(fù)雜的問題。隨著大規(guī)模ImageDatabase 的孕育和硬件條件的發(fā)展,CNN 已成為研究的熱點并得到迅速發(fā)展。近年來,主要的CNN結(jié)構(gòu)有AlexNet[4]、LeNet-5[5]和VGGNet[6]等。在實際運用中,隨著油田生產(chǎn)信息化的全面推進,目前已實現(xiàn)油井生產(chǎn)數(shù)據(jù)的采集監(jiān)控,數(shù)據(jù)的實時傳輸上傳,視頻監(jiān)控的全面覆蓋,大數(shù)據(jù)資源已初步形成[7-8]。CNN 已在圖像分類[9-10]、目標檢測、目標跟蹤、文本識別這些領(lǐng)域獲得了極大的成就。
因此,基于油田大數(shù)據(jù)資源的完備和CNN 良好的特征提取性能,本文提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的油井供液不足程度量化分析方法,同時使用Softmax 分類器構(gòu)建識別模型,很好地解決了傳統(tǒng)分析方法的不足。經(jīng)現(xiàn)場應(yīng)用,此方法能夠滿足油田實際應(yīng)用需求。
隨著深度學(xué)習(xí)的快速發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)已在石油工程領(lǐng)域展示出其突出的優(yōu)勢[11-12]。針對油井供液不足程度識別的問題,本文選用卷積神經(jīng)網(wǎng)絡(luò)作為識別模型。
卷積神經(jīng)網(wǎng)絡(luò)識別圖像的基本原理是[13-14]:首先輸入待識別的圖像,采用卷積操作對待識別圖像進行特征提??;然后采用Max-pooling 方法對圖像降維,接著經(jīng)過多個卷積層與池化層,充分提取待識別圖像特征;最后在全連接層中將提取到的所有特征參數(shù)合并,完成對待識別圖像的辨別與分類。卷積操作是對待識別的示功圖圖像X進行計算并獲取其特征參數(shù),用Hi表示卷積神經(jīng)網(wǎng)絡(luò)第i層的特征參數(shù)(H0=X),即
式中:Wi為網(wǎng)絡(luò)模型第i層卷積核的權(quán)值向量;bi為網(wǎng)絡(luò)模型第i層卷積核的偏移向量;f(x)為激活函數(shù)。
將提取到的特征參數(shù)經(jīng)過池化窗口(n×n)操作之后,原尺寸收縮為先前的(1/n)×(1/n)。
1998年,YANN LECUN提出了LeNet-5網(wǎng)絡(luò)模型,網(wǎng)絡(luò)結(jié)構(gòu)為:第一、二層為卷積層,卷積層后各自連接池化層;第三層也是卷積層,后連接兩個全連接層。作為第一代經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)模型,在油井供液不足示功圖程度識別研究中,其網(wǎng)絡(luò)結(jié)構(gòu)、激活函數(shù)和卷積核尺寸等方面存在可以繼續(xù)提升的空間。
AlexNet 由KRIZHEVSKY 等人創(chuàng)建,它贏得了2012年的ImageNet競賽。該模型由8層組成,其優(yōu)勢在圖像分類上表現(xiàn)卓越。
2014 年,牛津大學(xué)計算機視覺組的研究員一起研發(fā)出新的CNN 模型(VGGNet),同時贏得了ILSVRC 2014比賽分類項目的亞軍和定位項目的冠軍。VGGNet的模型結(jié)構(gòu)[11]如圖1所示。
圖1 VGGNet神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 VGGNet neural network structure
VGGNet 模型分為6 種不同的網(wǎng)絡(luò)架構(gòu),每個結(jié)構(gòu)有5個卷積組,每個卷積組使用一個3×3的卷積核,后面跟著一個2×2 最大的池化層,接著是三個全連接層,最終結(jié)合Softmax 分類器構(gòu)建網(wǎng)絡(luò)模型。
VGGNet 網(wǎng)絡(luò)模型與LeNet-5 網(wǎng)絡(luò)模型對比:首先在VGGNet 模型中采用了局部響應(yīng)歸一化機制,局部響應(yīng)歸一化機制可以在模型中對局部神經(jīng)元創(chuàng)建權(quán)重參數(shù),使得網(wǎng)絡(luò)模型在對圖像識別的過程中,更加具有針對性和目的性;然后卷積層中采用RELU激活函數(shù)取代了Tanh和Sigmoid[15-16],使識別準確率大大提升;接著池化層中采用Max-pooling方法代替了Avg-pooling 方法,從而避免了在特征提取的過程中出現(xiàn)圖像模糊的情況;最后在全連接層中增加了dropout 層,有效防止了過擬合現(xiàn)象的產(chǎn)生。
VGGNet 網(wǎng)絡(luò)模型與AlexNet 網(wǎng)絡(luò)模型對比:VGGNet模型是對AlexNet模型的進一步優(yōu)化,網(wǎng)絡(luò)層數(shù)更深;VGGNet 使用的卷積核為3×3,而非AlexNet的11×11或5×5,準確率更高。
但其相對龐大的網(wǎng)絡(luò)結(jié)構(gòu)在圖像識別的過程中花費了大量時間。
針對診斷油井供液不足程度的問題,選用了改良后的VGGNet 結(jié)構(gòu),它不僅可以滿足識別準確率的要求,還可以減少識別時間。改良后的VGGNet結(jié)構(gòu)主要有以下優(yōu)點:
(1)改良后的VGGNet 模型輸出層由1 000 個神經(jīng)元變?yōu)?0個神經(jīng)元輸出。
(2)改良后的VGGNet 網(wǎng)絡(luò)模型由4 層卷積、4 層池化和3 層全連接構(gòu)成,減少了訓(xùn)練時間,提高了收斂速度。
輸入的目標圖像大小為100×200,改良后的VGGNet網(wǎng)絡(luò)參數(shù)如表1所示。
表1 改良后的VGGNet網(wǎng)絡(luò)參數(shù)Tab.1 Prameters of improved VGGNet network
基于CNN 的油井供液不足程度示功圖的識別方法(圖2)如下:將訓(xùn)練樣本集放入CNN網(wǎng)絡(luò)模型中進行訓(xùn)練;將待識別的驗證樣本集放入已訓(xùn)練好的CNN模型中進行驗證。
圖2 基于CNN的油井供液不足程度示功圖識別方法流程Fig.2 Identification method flow of indicator diagram of liquid supply deficiency degree based on CNN
基于CNN 的油井供液不足程度示功圖識別原理為:以識別圖像像素點代替識別圖像,完成圖像的分割。對于分割后的圖像先以部分圖像為單位提取特征值,再將局部小特征進行匯總,最終完成整個圖像識別過程。因此,在圖像中出現(xiàn)的所有多余信息都將影響卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果,考慮到繪制出的示功圖還包含橫坐標(位移)、縱坐標(載荷)以及坐標線等冗余信息,需要先對示功圖進行預(yù)處理[17-18]。預(yù)處理的質(zhì)量決定了樣本集的水平,以及網(wǎng)絡(luò)的訓(xùn)練效果,具體步驟如下:
(1)實驗數(shù)據(jù)。本實驗采集了某油田現(xiàn)場n余口井的有桿泵懸點載荷、位移等數(shù)據(jù),通過對數(shù)據(jù)質(zhì)量的篩選和清洗,繪制成統(tǒng)一的標準化示功圖圖像:圖像的大小為100×200 像素,DPI 為50 像素/英寸,曲線線寬為2.5 mm;接著對示功圖進行分類和篩選,從而建立油井供液不足示功圖樣本集(圖3)。
圖3 實驗中用到的油井供液不足示功圖Fig.3 Indicator diagram of insufficient liquid supply for oil wells used in the experiment
(2)像素歸一化。輸入的原始示功圖的像素位于0 到255 之間,像素的不同會干擾神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力,無形中制造了誤差。因此,根據(jù)示功圖像素的最大值及最小值,本文采用了最大、最小值歸一化方法,其公式如下:
式中:xi為像素點值,像素的最大和最小值分別是max(x)和min(x)。
通過常規(guī)的歸一化方法處理圖像,將像素回歸至0 到1 之間,不改變圖像特征,排除了井間差異,使得所需信息更加突出,隱匿噪聲信息,節(jié)省了訓(xùn)練時間。
本文基于傳統(tǒng)的VGGNet 模型,提出了一種改良的VGGNet 模型,用于識別油井供液不足程度。首先構(gòu)建了油井供液不足程度示功圖數(shù)據(jù)集,然后將Max-pooling為采樣方法、RELU為激活函數(shù),建立了4 層卷積層、4 層池化層和3 層全連接層的網(wǎng)絡(luò)模型,采用反向傳播算法優(yōu)化其網(wǎng)絡(luò)模型。訓(xùn)練好的網(wǎng)絡(luò)模型不僅能夠滿足油井供液不足程度識別準確率要求,又能大大減少識別時間。改進的VGGNet模型結(jié)構(gòu)如圖4所示。
圖4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Convolutional neural network structure
Softmax 分類器在卷積神經(jīng)網(wǎng)絡(luò)領(lǐng)域中已取得了良好的應(yīng)用效果,并作為一種泛化能力強的通用學(xué)習(xí)算法廣泛應(yīng)用于多類圖像識別領(lǐng)域。本文選取Softmax 分類器對示功圖圖像進行訓(xùn)練和驗證,檢驗示功圖圖像特征提取的效果。
本次實驗基于64位的Win10系統(tǒng),CPU為Intel(R)Core(TM)i7-10750K,CPU 的主頻為2.59 GHz,內(nèi)存為16 GB?;贙eras 深度學(xué)習(xí)框架和GPU[19],利用Anaconda 下基于Python 語言的pycharm 進行代碼編制[20]。
步驟1:通過油田生產(chǎn)現(xiàn)場采集到的載荷、位移數(shù)據(jù),繪制成示功圖。對于不符合油井供液不足示功圖的圖像進行清洗工作,將得到的8 000 張示功圖分為10個供液不足等級。
步驟2:打亂樣本集,將樣本集按8∶2比例劃分訓(xùn)練集和驗證集。根據(jù)油井供液不足示功圖特點,創(chuàng)建卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),利用訓(xùn)練集對神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練和優(yōu)化。
步驟3:利用反向傳播算法優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)權(quán)值參數(shù),獲取合適的識別準確率,并保存訓(xùn)練好的模型。
步驟4:用保存好的模型對驗證集示功圖圖像進行識別。
步驟5:若識別錯誤,則修正錯誤的識別結(jié)果;將修正過的示功圖放入對應(yīng)分類樣本集,再次訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),通過強化學(xué)習(xí),不斷更新卷積神經(jīng)網(wǎng)絡(luò)模型參數(shù)。
在訓(xùn)練過程中設(shè)定批處理尺寸為200,迭代次數(shù)為200,學(xué)習(xí)率為0.000 1。訓(xùn)練集包含6 400 張圖像,驗證集包含1 600 張圖像。訓(xùn)練集和驗證集的準確率如圖5所示。
圖5 訓(xùn)練集和驗證集準確率Fig.5 Training set and validation set accuracy
本次實驗采用GPU 訓(xùn)練CNN 網(wǎng)絡(luò)模型。訓(xùn)練時間在有GPU 訓(xùn)練情況下需要8 min 左右,而無GPU訓(xùn)練情況下需要56 min。
從圖5可以看出,開始階段訓(xùn)練準確率呈上升趨勢,經(jīng)過一段時間后,準確率均保持在98%以上。由此可知,本次實驗訓(xùn)練集網(wǎng)絡(luò)模型是比較成功的。接著利用驗證集對訓(xùn)練好的模型進行驗證,驗證集的準確率基本都在98%以上,能夠滿足實際的功能需求。
為了驗證CNN 識別油井供液不足程度示功圖的性能[21],本文還測驗了其他方法對示功圖圖像的識別效果,包括不同的網(wǎng)絡(luò)結(jié)構(gòu)和迭代次數(shù)訓(xùn)練下所識別的油井供液不足程度示功圖的準確率。
3.5.1 迭代次數(shù)對比
本次實驗選取迭代次數(shù)為100、200和300,每次迭代示功圖圖像200張。若迭代次數(shù)太少,將造成驗證準確率較低;若迭代次數(shù)太多,不僅不能提高正確識別率,而且將增加訓(xùn)練時間;因此,選取迭代次數(shù)為200時,可以使模型能充分學(xué)習(xí)圖像特征并收斂(表2)。
表2 不同卷積層神經(jīng)網(wǎng)絡(luò)層數(shù)對比Tab.2 Comparison of numbers of neural network layers of different convolutional layers
3.5.2 網(wǎng)絡(luò)結(jié)構(gòu)對比
在深度學(xué)習(xí)中,隨著網(wǎng)絡(luò)層數(shù)增加,CNN模型學(xué)習(xí)能力將更強,但層數(shù)過多,將會導(dǎo)致網(wǎng)絡(luò)模型出現(xiàn)過擬合現(xiàn)象;隨著網(wǎng)絡(luò)層數(shù)減少又會出現(xiàn)CNN模型欠擬合現(xiàn)象。因此,在選擇卷積層數(shù)時,本文采用一層一層增加直到識別率不會隨著層數(shù)增加而發(fā)生顯著變化的方法來確定最佳層數(shù)。第一層使用了16個尺為3×3的卷積核,池化層使用2×2的池化核;第二層使用32 個尺寸為3×3 的卷積核,池化層使用2×2 的池化核;第三層使用64 個尺寸為3×3 的卷積核,池化層使用2×2 的池化核;第四層使用64 個尺寸為3×3 的卷積核;第五層使用128個尺寸為3×3的卷積核。
不同卷積層神經(jīng)網(wǎng)絡(luò)層數(shù)對比結(jié)果如表3 所示。當層數(shù)增加,準確率也慢慢增加,然后保持不變或下降。為此,CNN 網(wǎng)絡(luò)結(jié)構(gòu)選擇4 層最合適,收斂耗時短,準確率也更高。
表3 不同卷積層神經(jīng)網(wǎng)絡(luò)層數(shù)對比Tab.3 Comparison of numbers of neural network layers of different convolutional layers
以某管理區(qū)塊為例,該區(qū)塊具有常溫、高壓、低孔、特低滲透油藏的特點。對于該區(qū)塊某口油井,通過訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)模型,對采集的示功圖進行識別分析,實現(xiàn)了此油井供液程度定量化評估。油井供液不足示功圖數(shù)據(jù)的采集頻率為每30 min 一次,本文選取6 h 跨度的示功圖圖像樣本進行評估。
從圖6,圖7 可以看出,通過基于卷積神經(jīng)網(wǎng)絡(luò)的油井供液程度智能識別方法,可以準確地反映出隨時間不斷變化的油井供液程度。結(jié)果表明,該油井供液能力較差,亟需對油井生產(chǎn)參數(shù)進行調(diào)控。
圖6 示功圖圖像樣本Fig.6 Sample of indicator diagram image
圖7 基于示功圖的油井供液程度量化評估Fig.7 Quantitative assessment of oil well fluid supply degree based on indicator diagram
通過基于深度學(xué)習(xí)的油井供液不足程度量化分析方法監(jiān)測油井供液情況,根據(jù)油井供液情況進行遠程動態(tài)調(diào)頻生產(chǎn),供液能力較差時減低生產(chǎn)參數(shù),供液能力變好后調(diào)高生產(chǎn)參數(shù),保障油井供液的穩(wěn)定性和泵筒的高充滿系數(shù)。2020 年6—8 月,在該管理區(qū)塊3口油井上進行了生產(chǎn)參數(shù)自適應(yīng)調(diào)控試驗,均取得了較好的效果。
從表4可以看出,平均沖速下降0.55 min-1,日產(chǎn)液量增加1.28 m3,日產(chǎn)油量增加0.91 m3,節(jié)電58 kWh/d,節(jié)約電費59.16元/d。
表4 生產(chǎn)參數(shù)調(diào)控試驗前后對比Tab.4 Comparison before and after the production parameter control test
針對油井供液不足程度分析,建立了一套示功圖樣本集,設(shè)計了包含4層卷積層、4層池化層和3層全連接層的卷積神經(jīng)網(wǎng)絡(luò)模型,準確率達98.58%,訓(xùn)練完成的卷積神經(jīng)網(wǎng)絡(luò)模型能夠高效準確識別供液不足程度。礦場應(yīng)用進一步表明,采用所建立的油井供液不足程度量化分析方法監(jiān)測油井供液情況并進行遠程動態(tài)調(diào)頻生產(chǎn),能夠?qū)崿F(xiàn)抽油機沖速與油井供液程度的合理匹配,有效減少了電能浪費。