孫 挺, 趙 穎, 楊 進, 殷啟帥, 汪文星, 陳 緣
(中國石油大學(北京)安全與海洋工程學院,北京 102249)
提高鉆井時效是降本增效的重要手段,但目前通常對鉆井時效進行事后人工分析,具有主觀性和滯后性。隨著機器學習和大數(shù)據技術的迅速發(fā)展,國內外很多學者開展了大數(shù)據和人工智能方法在石油工程中的應用研究,A. M. Alsalama 等人[1]提出了一個包含所需數(shù)據挖掘和分析工具的集成系統(tǒng),大大縮短了傳統(tǒng)方法進行預警的時間;K. Balaji 等人[2]從基礎、理論和應用方面總結了數(shù)據驅動方法在石油天然氣工程中的發(fā)展;劉剛[3]建立了基于多源信息的SVM 自適應鉆井井下故障預警模型;袁野[4]提出了基于SVM 的井眼軌跡智能預測方法,建立了井眼的三維可視圖,可以有效地控制井眼軌跡;孫萬海[5]提出了一種基于PSO-SVM 的鉆井故障智能預警系統(tǒng),提高了鉆井質量;王江萍等人[6]提出應用神經網絡技術對井漏、井塌、井涌及井噴等井下故障進行診斷??梢?,目前國內外主要是運用大數(shù)據和機器學習對鉆井故障進行預測及預防或研究相關理論問題,對工況識別的研究較少,且存在數(shù)據量小和缺乏現(xiàn)場實例驗證等問題。YIN Qishuai 等人[7]提出了一種基于程序的工況識別方法,很好地消除了人員對鉆井工況識別的影響,但該方法基于編程語言,沒有考慮前后數(shù)據之間的聯(lián)系和鉆井數(shù)據可能存在波動等問題。為此,筆者提出了一種普遍適用的純數(shù)據驅動方法,利用支持向量機(support vector machine,SVM)識別鉆井工況,減少不可見非生產時間,提高鉆井作業(yè)效率;采用訓練-測試的方式,訓練數(shù)據為綜合錄井提供的實時數(shù)據,解決了傳統(tǒng)方法對人員依賴大的缺點;在鉆井工況識別中應用機器學習與數(shù)據驅動方法,同時允許數(shù)據存在一定的波動,克服了編程語言識別帶來的問題。
支持向量機是一種監(jiān)督式學習模型,可以用于模式識別、分類和回歸問題的分析。該模型是基于統(tǒng)計學習理論和結構風險最小化原則建立的,主要思想是建立一個線性分離超平面,將非線性輸入映射到高維特征空間中,使正例和反例之間的隔離邊緣被最大化[8-15]。支持向量機的原理如圖1 所示。圖1 中,x1和x2代表輸入參數(shù)特征,w 為核函數(shù),b 為偏置,l2代表數(shù)據分類的最佳方案。模型的輸入為鉆頭位置、大鉤載荷、機械鉆速、鉆壓、大鉤載荷、轉速、扭矩、出口排量和立管壓力等9 種參數(shù),輸出包括倒劃眼、接立柱、下套管、下鉆及旋轉鉆進5 種正常工況和鉆塞等復雜工況。根據9 種輸入參數(shù)的特征,采用SVM 將它們分為6 種輸出結果。
圖 1 支持向量機原理示意Fig. 1 Principle schematic diagram of support vector machine
針對非線性分類問題,B. E. Boser 等人[16]提出了將核技巧應用于最大邊界超平面,從而創(chuàng)建非線性分類器的方法。經過不斷發(fā)展,應用于SVM 的核函數(shù)主要包括以下幾種類型[17]。
線性核函數(shù):
多項式核函數(shù):
徑向基核函數(shù):
兩層感知器核函數(shù):
式中: xi,xj為空間中的2 個向量;k 為核函數(shù);d,γ,κ,c為系數(shù)。
通過核函數(shù)處理,將非線性問題轉化為線性問題,如圖2 所示。
筆者在研究中,利用SVM 進行6 個鉆井工況的識別,識別結構如圖3 所示。收集現(xiàn)場22 種鉆井工況的錄井數(shù)據,選擇具有代表性的倒劃眼、接立柱、下套管、下鉆及旋轉鉆進等5 種正常工況和鉆塞等復雜工況共6 種工況進行分析。結合研究中數(shù)據的使用情況,選取的參數(shù)包括鉆頭位置、大鉤載荷、機械鉆速、鉆壓、大鉤高度、轉速、扭矩、出口排量和立管壓力。
圖 2 核函數(shù)作用示意Fig.2 Functional schematic diagram of the kernel function
圖 3 支持向量機的識別結構示意Fig. 3 Recognition structure of support vector machine
為了提高工況識別的準確率,首先對數(shù)據進行[0,1]歸一化處理,然后優(yōu)選SVM 核函數(shù)類型,并進行交叉驗證,優(yōu)化模型。
應用SVM 時,關鍵是選擇核函數(shù),不同的核函數(shù)適用于不同的問題,對準確率有很大的影響。采用不同的核函數(shù),對不同工況進行歸一化處理,輸出的結果如圖4—圖7 所示。
4 種核函數(shù)的識別準確率和計算時間的對比情況見表1。
圖 4 線性核函數(shù)的識別結果Fig. 4 Identification results of linear kernel function
圖 5 多項式核函數(shù)的識別結果Fig. 5 Identification results of polynomial kernel function
圖 6 徑向基核函數(shù)的識別結果Fig. 6 Identification results of radial basis kernel functions
圖 7 兩層感知器核函數(shù)的識別結果Fig. 7 Identification results of kernel functions by two-layer perceptron
由表1 可知,兩層感知器核函數(shù)的識別準確率最低,且耗費時間最長;徑向基核函數(shù)的識別準確率較高。
利用SVM 進行鉆井工況識別時,得到的模型需要具有高的準確率和魯棒性,采用交叉驗證的方法,將原始數(shù)據分成K 組,隨機選取一組子集做驗證集,其余K-1 組子集做訓練集,得到K 個模型,最后選擇準確率最高模型的性能指標[16]作為最終SVM的參數(shù)。
表 1 不同核函數(shù)計算結果對比Table 1 Comparisons of calculation results with different kernel functions
通過交叉驗證可以選出最佳的懲罰函數(shù)c 和核函數(shù)參數(shù)g,交叉驗證的結果如圖8 所示(圖8 中,不同等高線表示c 和g 不同取值對應的準確率)。
圖 8 交叉驗證結果Fig. 8 Cross validation results
由圖8 可知,時,準確率可達到97%以上,此時選取c 最小的那組數(shù)據(這是因為,c 值過高會出現(xiàn)過學習現(xiàn)象,即訓練集的準確率滿足一定的要求,但測試集準確率很低),即c=0.353 6,g=1.534 0(見圖8 中點A)。準確識別鉆井工況后,就可以對鉆井作業(yè)進行事后分析,識別不可見非生產時間,提高鉆井效率,從而提高鉆井的安全性和經濟性。
選取4 口井進行模型驗證,以其中2 口井的錄井數(shù)據為訓練集,其他2 口井的錄井數(shù)據為測試集,訓練集和測試集SVM 的識別結果如圖9 所示。從圖9 可以看出,訓練集的識別準確率高于測試集,測試集中接立柱和旋轉鉆進的識別準確率最高,達到了97%,工況識別準確率總體達到95%以上,說明該方法在新樣本中有很好的泛化性。
圖 9 最終的工況識別結果Fig. 9 Final identification results of working condition
海上導管架平臺因作業(yè)空間受限,通常在一個導管架平臺上布置數(shù)十口井,這種井槽集中在一個區(qū)域的布井方式,形成了“批鉆(一次性完成同一開次鉆井作業(yè))”作業(yè)模式。由于這些井的地層情況、鉆井設計方案、鉆井設備、施工隊伍相似,所以在“批鉆”模式下,同一井段的時效具有可比性。因此,采用基于支持向量機的鉆井工況實時智能識別方法,進行工況識別、時效分析和時效輔助決策,實現(xiàn)提質增效。以南海某平臺批鉆作業(yè)為例,首先對一口井的三開錄井數(shù)據進行學習,訓練得到工況識別模型;然后根據其余14 口已鉆井的三開錄井數(shù)據識別接立柱工況和分析鉆井時效,從而指導待鉆井的施工,提高接立柱的效率。具體應用步驟如下:
1)工況識別。利用B1 井的三開錄井數(shù)據,訓練得到最優(yōu)模型,然后使用該模型對其余14 口已鉆井的三開工況進行識別,并統(tǒng)計接立柱作業(yè)時間。
2)時效分析。為了得到三開中接立柱的平均時間,統(tǒng)計了前15 口已鉆井的三開接立柱時間(見圖10)。由圖10 可知,10%的接立柱作業(yè)可在1.3 min 內完成,50%的接立柱作業(yè)可在2.1 min 內完成,90%的接立柱作業(yè)可在4.9 min 內完成,接立柱作業(yè)的平均完成時間為2.5 min。
3)輔助決策。按照三開接立柱順序分為4 個階段,第1 階段為第1—12 根立柱,第2 階段為第13—24 根立柱,第3 階段為第25—36 根立柱,第4 階段為第37 至最后所有的立柱,前15 口井三開4 個階段的平均接立柱時間為2.5 min。
圖 10 接立柱做作業(yè)完成時間分布Fig. 10 Completion time distribution to pick up stands
將得到的模型應用到新井中,實時判斷得到第1—12 根立柱的平均作業(yè)時間為2.7 min,大于前15 口井的時間2.5 min,此時實時監(jiān)測中心向平臺發(fā)送“作業(yè)效率有待提高”的指令,指導下一階段(第13—24 根立柱)作業(yè),并以此類推,完成全井段的時效分析,保證作業(yè)效率(見表2)。
表 2 不同層位接立柱時間統(tǒng)計Table 2 Time statistics for making up a stand of drill pip
4)現(xiàn)場施工應用。將該方法應用到6 口新鉆井的鉆井施工中(包含上面提到的新鉆井),各井三開接立柱作業(yè)的平均完成時間的變化如圖11 所示。由圖11 可以看出,每口新鉆井的平均接立柱時間穩(wěn)步下降,效率穩(wěn)步提高,實現(xiàn)了提質增效。
1)將機器學習的SVM 方法應用于石油工程的鉆井工況識別中,以提高鉆井效率。
2)提出一種純數(shù)據驅動的方法,并充分利用油田現(xiàn)場數(shù)據,減少了傳統(tǒng)方法對人員經驗的依賴,提高了識別準確率,縮短了工況識別所需時間。
3)利用SVM 對6 種鉆井工況進行識別,通過優(yōu)選核函數(shù)類型、進行交叉驗證,逐步優(yōu)化智能識別模型,不斷提高模型識別的準確率,最終將識別準確率提高到了95%。
圖 11 接立柱作業(yè)平均完成時間的變化情況Fig. 11 Average completion time variation to pick up stands