国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于支持向量回歸的抽油機(jī)井檢泵周期預(yù)測(cè)研究?

2023-11-21 06:17:54劉新平楊鵬磊
關(guān)鍵詞:檢泵抽油機(jī)準(zhǔn)確率

鄧 杰 劉新平 楊鵬磊

(中國(guó)石油大學(xué)(華東)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 青島 266580)

1 引言

目前,在我國(guó)機(jī)械采油工藝中,有桿泵采油方式在原油開采中占據(jù)著十分重要的地位。有效降低油井檢泵率,提高油井利用率是采油工程控制成本的一個(gè)有效途徑。研究人員在抽油機(jī)井檢泵預(yù)測(cè)方面做了大量的研究工作,分析了影響油井檢泵周期的因素并提出了預(yù)防措施[1~5]。影響抽油機(jī)井檢泵因素較多。其中,文獻(xiàn)[6~7]從抽油桿壽命方面進(jìn)行了深入的研究,文獻(xiàn)[8]研究了抽油機(jī)桿懸點(diǎn)載荷對(duì)檢泵周期的影響,文獻(xiàn)[9]開展了抽油機(jī)游動(dòng)凡爾罩?jǐn)嗔褭C(jī)理及防治對(duì)策研究,文獻(xiàn)[10]分析了抽汲參數(shù)調(diào)整對(duì)油井檢泵率的影響。由于抽油機(jī)井生產(chǎn)參數(shù)較多(實(shí)際檢測(cè)的生產(chǎn)參數(shù)20 余種),各類參數(shù)與抽油機(jī)井的檢泵因素有著直接關(guān)聯(lián)關(guān)系,但是各類生產(chǎn)參數(shù)之間以及各類檢泵因素之間存在耦合影響和非線性因素,難以判斷各類生產(chǎn)參數(shù)對(duì)抽油機(jī)檢泵周期的影響權(quán)重。同時(shí),基于機(jī)理分析的預(yù)測(cè)模型需要與生產(chǎn)實(shí)際情況相結(jié)合,準(zhǔn)確率和有效性有待進(jìn)一步提高。因此,結(jié)合現(xiàn)場(chǎng)經(jīng)驗(yàn),從數(shù)據(jù)挖掘的角度出發(fā),利用油田生產(chǎn)數(shù)據(jù)和油井作業(yè)數(shù)據(jù),建立抽油機(jī)井檢泵周期與各生產(chǎn)要參數(shù)的關(guān)系模型預(yù)測(cè)抽油機(jī)井檢泵周期,對(duì)有效降低檢泵率具有重要的研究意義。

常用的數(shù)據(jù)挖掘技術(shù)主要涉及機(jī)器學(xué)習(xí)和深度學(xué)習(xí)[11],如線性回歸、支持向量機(jī)(SVM)[12]、卷積神經(jīng)網(wǎng)絡(luò)[13]、循環(huán)神經(jīng)網(wǎng)絡(luò)[14]等算法。其中,支持向量回歸(SVR)[15~16]是支持向量機(jī)在回歸領(lǐng)域的應(yīng)用,它在解決非線性和高維問(wèn)題中表現(xiàn)出許多特有的優(yōu)勢(shì),被廣泛應(yīng)用于各種預(yù)測(cè)問(wèn)題。

本文采用SVR 算法開展抽油機(jī)井檢泵周期的研究,通過(guò)對(duì)抽油機(jī)井生產(chǎn)數(shù)據(jù)的預(yù)處理,基于灰度關(guān)聯(lián)方法優(yōu)選主要生產(chǎn)參數(shù),建立抽油機(jī)井檢泵周期與主要生產(chǎn)參數(shù)的關(guān)系模型。

2 數(shù)據(jù)預(yù)處理

2.1 數(shù)據(jù)采集

與抽油機(jī)井檢泵因素相關(guān)的數(shù)據(jù)來(lái)源于抽油機(jī)井生產(chǎn)數(shù)據(jù)和檢泵作業(yè)數(shù)據(jù)。主要包括生產(chǎn)時(shí)間、日產(chǎn)液量、日產(chǎn)油量、含水率、上行電流、下行電流、油壓、套壓、流壓、泵徑、泵深、沖程、沖次、動(dòng)液面、累產(chǎn)油量、累產(chǎn)水量、最大載荷、最小載荷、檢泵作業(yè)時(shí)間等。由于抽油機(jī)井原始生產(chǎn)數(shù)據(jù)存在多源、異構(gòu)、缺失、重復(fù)、不準(zhǔn)確以及各類生產(chǎn)參數(shù)量綱不同等情況。需要對(duì)數(shù)據(jù)預(yù)處理后開展實(shí)驗(yàn)研究,有效提高模型的準(zhǔn)確性。

2.2 數(shù)據(jù)預(yù)處理

1)數(shù)據(jù)清洗

統(tǒng)計(jì)分析各類生產(chǎn)參數(shù)的特征,掌握各類數(shù)據(jù)的范圍,有效去除各類奇異數(shù)據(jù)和錯(cuò)誤數(shù)據(jù),提高模型的有效性和準(zhǔn)確性。抽油機(jī)井的生產(chǎn)參數(shù)較多,以日產(chǎn)液量數(shù)據(jù)統(tǒng)計(jì)為例,如圖1 所示,某一區(qū)域的抽油機(jī)井單井日產(chǎn)液量集中在15~45(t/d)范圍內(nèi)。因此,當(dāng)日產(chǎn)液量超出這個(gè)范圍后,需要分析產(chǎn)液量降低或是升高的因素。從而統(tǒng)計(jì)正常生產(chǎn)情況下的抽油機(jī)井的編號(hào)及數(shù)量。

圖1 日產(chǎn)液量數(shù)據(jù)分布圖

基于此方法,統(tǒng)計(jì)生產(chǎn)參數(shù)正常情況下的油井的型號(hào)和數(shù)量,清洗掉奇異數(shù)據(jù),生成有效數(shù)據(jù)體,作為訓(xùn)練和預(yù)測(cè)數(shù)據(jù),提高預(yù)測(cè)模型的準(zhǔn)確性和實(shí)用性。同時(shí),基于程序判斷去除重復(fù)數(shù)據(jù),若某一屬性缺失值較多,則直接刪除該屬性,若缺失值較少,則進(jìn)行填充。對(duì)于數(shù)值型變量,采用中位數(shù)進(jìn)行填充,對(duì)于類別型數(shù)據(jù)直接填充為“空”。

2)去量綱

抽油機(jī)井生產(chǎn)參數(shù)較多,數(shù)據(jù)單位不統(tǒng)一,如:體積單位(/m3),壓力單位(/Mpa),時(shí)間單位(/d)等。為了便于不同單位或量級(jí)的指標(biāo)能夠進(jìn)行比較和加權(quán)。將數(shù)據(jù)統(tǒng)一變換為無(wú)單位(統(tǒng)一單位)的數(shù)據(jù)集,采用最大-最小標(biāo)準(zhǔn)化方法消除量綱:

式(1)中:x為數(shù)據(jù)清洗后的樣本數(shù)據(jù),xmin,xmax為樣本數(shù)據(jù)中最大值和最小值,x*表示歸一化后的樣本數(shù)據(jù)。

3 主要參數(shù)提取

各類生產(chǎn)參數(shù)對(duì)抽油機(jī)井檢泵周期影響權(quán)重不同。如果將全部生產(chǎn)參數(shù)作為自變量會(huì)增加計(jì)算負(fù)擔(dān),提高模型的復(fù)雜程度,降低準(zhǔn)確率。因此,采用灰度關(guān)聯(lián)方法優(yōu)選與檢泵周期關(guān)聯(lián)性較大的參數(shù)做為自變量。通過(guò)灰度關(guān)聯(lián)分析算法,可得到特征值(子序列)與周期(母序列)關(guān)聯(lián)度大小的排序,關(guān)聯(lián)度越高則表示兩個(gè)因素變化的趨勢(shì)具有強(qiáng)一致性,即同步變化程度越高。子序列的各個(gè)指標(biāo)與母序列的關(guān)聯(lián)系數(shù)計(jì)算方法如下:

式(2)中,ρ為分辨系數(shù),0<ρ<1,若ρ越小,關(guān)聯(lián)系數(shù)間差異越大,區(qū)分能力越強(qiáng),通常ρ取0.5;x0(k)和xi(k)分別表示母序列第k 個(gè)數(shù)和子序列第i個(gè)特征值的第k個(gè)數(shù);ζi(k)則表示第i個(gè)特征的第k個(gè)值與母序列第k個(gè)值的關(guān)聯(lián)系數(shù)。通過(guò)關(guān)聯(lián)系數(shù)來(lái)計(jì)算關(guān)聯(lián)度再進(jìn)行最后的排序。其中關(guān)聯(lián)度得計(jì)算如下:

式(3)中,ri為第i個(gè)特征與母序列的關(guān)聯(lián)度大小,n 為樣本數(shù)量?;谟?jì)算結(jié)果,對(duì)所有ri進(jìn)行排序即可得到關(guān)聯(lián)度排序。通過(guò)使用灰度關(guān)聯(lián)分析算法選擇的主要參數(shù)為日產(chǎn)液量、沖程、沖次、泵徑、泵深、沉沒度、含水率、最大載荷、最小載荷。其所選參數(shù)與因變量之間關(guān)聯(lián)度如表1所示。

表1 特征參數(shù)關(guān)聯(lián)度表

4 預(yù)測(cè)模型

基于SVR的油井檢泵周期預(yù)測(cè)模型的函數(shù)為

式中,w為權(quán)值向量,?(x)為非線性映射函數(shù),b 為偏置向量。由于SVR存在容忍偏差ε,于是SVR問(wèn)題可形式化為

其中,C為正則化常數(shù),Loss為損失函數(shù):

為了確保大部分?jǐn)?shù)據(jù)參與模型訓(xùn)練,引入松弛變量ζi和,則式(5)優(yōu)化為

由拉格朗日乘子法可得拉格朗日函數(shù):

在KKT條件下,拉格朗日的對(duì)偶形式為

將其對(duì)偶形式求解獲得回歸函數(shù)為

其中,K(xi,xj)=φ(xi)Tφ(xj)為核函數(shù)。在SVR 周期預(yù)測(cè)模型中,核函數(shù)K(x,x)的類型對(duì)模型的性能影響較大,可以通過(guò)比較不同核函數(shù)的性能情況來(lái)選擇最佳的和函數(shù)類型。

5 實(shí)驗(yàn)結(jié)果

將原始數(shù)據(jù)經(jīng)過(guò)清洗、歸一化以及參數(shù)優(yōu)選后開展周期預(yù)測(cè)建模實(shí)驗(yàn)。對(duì)數(shù)據(jù)樣本進(jìn)行隨機(jī)劃分,訓(xùn)練集占70%,測(cè)試集占30%。如果經(jīng)過(guò)生產(chǎn)參數(shù)優(yōu)選,控制算法參與遍歷優(yōu)化后仍不能達(dá)到預(yù)期準(zhǔn)確率(預(yù)期準(zhǔn)確率為85%以上),重新開展數(shù)據(jù)預(yù)處理和主要參數(shù)提取步驟,過(guò)程如圖2所示。

圖2 模型構(gòu)建流程圖

實(shí)驗(yàn)分別測(cè)試了在不同核函數(shù)下以及不同的算法下的模型準(zhǔn)確率。常見的核函數(shù)類型有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基RBF 核函數(shù)和Sigmoid核函數(shù)。當(dāng)選取不同的核函數(shù)時(shí),模型準(zhǔn)確率如表2所示。

表2 核函數(shù)的選取

選擇SVR 模型的核函數(shù)為Rbf,遍歷SVR 模型參數(shù)C 的范圍為(0.01,100)此時(shí)參數(shù)gamma 設(shè)置為默認(rèn)值,即:1/n_features,其中n_features 為輸入特征數(shù)量,從圖3 可知當(dāng)C 為9 時(shí)準(zhǔn)確率最高,為86.55%。

圖3 遍歷參數(shù)C實(shí)驗(yàn)圖

確定C 值后,再遍歷參數(shù)gamma 的范圍為(0.01,10),從圖4可知gamma為1.8時(shí)結(jié)果最優(yōu)。

圖4 遍歷參數(shù)gamma實(shí)驗(yàn)圖

確定各項(xiàng)參數(shù)后,仿真結(jié)果如圖5 所示,模型預(yù)測(cè)結(jié)果準(zhǔn)確率高達(dá)90.76%。

圖5 SVR預(yù)測(cè)示意圖

基于實(shí)驗(yàn)數(shù)據(jù),測(cè)試了多元線性回歸算法,BP神經(jīng)網(wǎng)絡(luò)算法,并將模型預(yù)測(cè)結(jié)果與SVR算法相比較。實(shí)驗(yàn)結(jié)果如表3所示。

表3 三種算法預(yù)測(cè)誤差對(duì)比情況

模型的平均絕對(duì)誤差值:

模型的平均相對(duì)誤差值:

其中m 為數(shù)據(jù)量,h(xi)和yi分別為預(yù)測(cè)值和真實(shí)值?;赟VR 的檢泵周期預(yù)測(cè)結(jié)果準(zhǔn)確率率為達(dá)到了預(yù)期目標(biāo),與多元線性回歸算法和BP 神經(jīng)網(wǎng)絡(luò)算法相比較,獲得了較好的預(yù)測(cè)結(jié)果。

6 結(jié)語(yǔ)

本文從數(shù)據(jù)挖掘的角度出發(fā),采用灰度關(guān)聯(lián)算法,優(yōu)選了抽油機(jī)井主要生產(chǎn)參數(shù),基于SVR 算法開展了抽油機(jī)井檢泵周期預(yù)測(cè)的實(shí)驗(yàn)研究,建立了檢泵周期與生產(chǎn)參數(shù)之間的關(guān)系模型,獲得了較好的實(shí)驗(yàn)結(jié)果。將大數(shù)據(jù)分析方法與油田措施業(yè)務(wù)相結(jié)合,充分挖掘數(shù)據(jù)價(jià)值的可行性和有效性,為智慧油田建設(shè)提供了新的研究方向,拓展了解決工程技術(shù)難題的思路和方法。同時(shí),在實(shí)驗(yàn)過(guò)程中,由于數(shù)據(jù)噪聲的影響,人工檢泵質(zhì)量不同,多因素檢泵等因素共存,對(duì)檢泵周期的預(yù)測(cè)和分析影響極大。

猜你喜歡
檢泵抽油機(jī)準(zhǔn)確率
抽油機(jī)井泵效影響因素的確定方法*
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
油田井下作業(yè)管桿同步固定裝置和管桿同步提撈裝置的研制與應(yīng)用
抽油機(jī)井合理檢泵時(shí)機(jī)的確定
抽油機(jī)管桿偏磨機(jī)理與防治
探析新井下泵及檢泵施工
化工管理(2016年9期)2016-03-13 14:56:05
沁水盆地南部煤層氣井抽油機(jī)偏磨防治分析
衡山县| 措勤县| 巴东县| 吴川市| 依安县| 左云县| 鄂温| 勐海县| 龙山县| 介休市| 张家界市| 竹北市| 集贤县| 邹平县| 萨迦县| 南昌县| 瑞昌市| 微山县| 溆浦县| 陆川县| 西畴县| 建始县| 凤台县| 时尚| 靖宇县| 太谷县| 宽城| 长沙市| 崇礼县| 资源县| 上饶县| 彰化市| 阳西县| 都安| 昌乐县| 松潘县| 拜泉县| 漯河市| 新蔡县| 长沙县| 当阳市|