李博文,宋文廣,徐加軍
(1.長江大學 計算機科學學院,湖北 荊州 434023; 2.中石化勝利油田分公司勝利采油廠,山東 東營 257000)
目前,油田逐漸走向數(shù)字化,抽油機常被應用于偏遠野外地區(qū)進行采油工作。油田環(huán)境復雜多變、惡劣,且井下存在諸多不明因素,造成抽油機故障,導致采油效率低下,浪費人力和物力資源,增加采油成本,甚至可能引發(fā)安全事故。因此,抽油機工況高效率、高精度的診斷,對于保障油田采油率及安全生產(chǎn)具有重大的意義。
國內(nèi)外普遍采用示功圖分析法、專家系統(tǒng)診斷法、計算機診斷法及神經(jīng)網(wǎng)絡診斷法[1]。陳妍等[2]的研究表明,井下示功圖分析法操作較為復雜,地面示功圖分析法過于依賴于理論,專家系統(tǒng)診斷法運用專業(yè)知識和經(jīng)驗也存在不穩(wěn)定性。張仙偉等[3]的研究表明,采用計算機診斷法處理抽油機碰泵等故障,仍需根據(jù)人工經(jīng)驗判斷,效率不高。王瓊[4]經(jīng)研究發(fā)現(xiàn),隨著神經(jīng)網(wǎng)絡診斷法的發(fā)展,其無須依賴人工經(jīng)驗,在消耗少量資源的情況下,綜合分析抽油機工況數(shù)據(jù),就能完成故障診斷。Zhou等[5]使用UKF-RBF模型研制智能油田故障診斷系統(tǒng),在多故障分類上有較好的效果,但計算雅可比矩陣易產(chǎn)生線性化誤差,導致最終結(jié)果與實際存在偏差。徐通等[6]使用PSO-RBF 模型研制智能油田故障診斷系統(tǒng),檢測精度達到90%以上,但粒子群算法易早熟陷入局部最優(yōu),導致最終結(jié)果與實際存在偏差。
徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡的優(yōu)勢為可自主尋求數(shù)據(jù)中心,結(jié)構(gòu)相較于反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡等更簡單,同時硬件要求低[7-8]。為提高RBF 的訓練速度,解決其易陷入局部最優(yōu)的問題,可優(yōu)化RBF 以取得更好的效果。目前,被應用較為廣泛的有粒子群搜索(particle swarm optimization,PSO)、遺傳算法(genetic algorithm,GA)和布谷鳥搜索(cuckoo search,CS)等。文獻[9-10]表明,PSO 易早熟,GA操作復雜,CS 的健壯性和尋優(yōu)能力在多峰值優(yōu)化上更強。但CS在迭代后期易出現(xiàn)在全局最優(yōu)值附近震蕩的缺陷及缺乏活力的現(xiàn)象。因此,提出引入動態(tài)發(fā)現(xiàn)概率和自適應步長來解決CS 的不足,然后優(yōu)化RBF,最后診斷抽油機故障,在加速訓練速度的同時,提高診斷的精度。
RBF神經(jīng)網(wǎng)絡總體結(jié)構(gòu)由網(wǎng)絡輸入層、網(wǎng)絡隱含層及網(wǎng)絡輸出層[11]3 部分組成。RBF 的輸出表達式如下:
式中:x為輸入特征;p為輸入特征數(shù)量;yj為輸出層的第j個神經(jīng)元的輸出;δi為與第i個神經(jīng)元相關的寬度參數(shù);ci為與第i個神經(jīng)元關聯(lián)的中心;w為隱含層到輸出層的連接權(quán)值;h為總神經(jīng)元數(shù)量。
因此RBF 神經(jīng)網(wǎng)絡模型的效果受中心點、寬度及連接權(quán)值影響,可通過使用改進的CS 算法來優(yōu)化目標參數(shù)。
布谷鳥搜索算法存在收斂速度慢、后期缺乏活力的不足之處。為彌補其缺陷,提高其性能,本文引入動態(tài)發(fā)現(xiàn)概率和自適應步長因子進行優(yōu)化。CS 算法模擬自然界中布谷鳥通過借其他鳥類的巢穴寄生鳥蛋的習性,尋求最優(yōu)解。受布谷鳥寄生的宿主發(fā)現(xiàn),蛋異常的概率設定為pa,pa∈[0,1]?;谝陨弦?guī)則,布谷鳥通過Levy 飛行尋宿主的鳥巢位置,其表達式如下:
式中:為第i個鳥巢在第t輪迭代的位置;α為步長因子;L(λ)為Levy隨機搜索路徑[12-13]。
L(λ)的表達式如下:
式中:u~N(0,σ2),v~N(0,1),u、v為服從正態(tài)分布的隨機數(shù);為第b個鳥巢在第t輪迭代中最優(yōu)異的鳥巢位置。
鳥巢的位置更新后,生成隨機數(shù)r∈[0,1]。當r>pa時,再次隨機更新鳥巢位置。
通過整體對CS 算法進行分析,當發(fā)現(xiàn)概率pa保持不變時,無論鳥巢優(yōu)劣,均會以同等概率被替換,造成了一定的尋優(yōu)損失。同時受u、v影響,L(λ)步長隨機性強。如全程采用大步長,會導致結(jié)果陷入局部最優(yōu);如全程采用小步長,雖然結(jié)果更優(yōu),但會犧牲搜索效率。因此經(jīng)綜合考慮,引入一種動態(tài)發(fā)現(xiàn)概率Pd和自適應步長s,使得更優(yōu)的鳥巢易被保留,同時在不同的搜索階段,令搜索效率和精度保持平衡狀態(tài),進而達到最佳效果。
動態(tài)發(fā)現(xiàn)概率表達式如下:
式中:pmax、pmin分別為最大和最小發(fā)現(xiàn)概率;gmax、g分別為CS初始最大和當前迭代數(shù)。
根據(jù)當前搜索值距離全局最優(yōu)值的距離,自適應調(diào)整步長s的大小,其中第t+1 代搜索路徑的步長表達式如下:
式中:f為當前最佳鳥巢的目標函數(shù)值;f'為下一輪更新后,擇優(yōu)所選鳥巢位置對應的目標函數(shù)值;為第t代搜索路徑的步長。
可得到優(yōu)化后的PSCS算法如下:
通過式(6)可知,當目標函數(shù)快速收斂時,|1-f'/f|會相應地增大,使得CS保持大步長狀態(tài)進行尋優(yōu);相反,當目標函數(shù)收斂緩慢時,搜索步長也會相應地縮小,避免遺漏全局最優(yōu)值。因此與CS的尋優(yōu)效果相比,PSCS 可最大限度地淘汰劣質(zhì)結(jié)果,并提高尋優(yōu)的效率。
經(jīng)動態(tài)發(fā)現(xiàn)概率和自適應步長改進后的PSCS算法,可優(yōu)化RBF神經(jīng)網(wǎng)絡,具體內(nèi)容如下。
(1) 對CS 的參數(shù)包括鳥巢的總數(shù)量n、目標函數(shù)f(x)、最大迭代次數(shù)gmax等進行初始化。根據(jù)RBF 的3 層結(jié)構(gòu),確定n個鳥巢的初始位置,以及代表RBF 神經(jīng)網(wǎng)絡的心點c、寬度δ、連接權(quán)值w等需尋優(yōu)的參數(shù)。
(2) 計算當前初始化后的鳥巢的目標函數(shù),然后選出最小的目標函數(shù)值并標記為f,記錄該鳥巢對應的位置x。
(3) 通過式(1)引入自適應步長,動態(tài)調(diào)整迭代的速度,更新鳥巢位置,再次計算該組鳥巢的目標函數(shù),選出最小的目標函數(shù),并與f對比,將更優(yōu)的值賦值給f'。
(4) 此時1 組隨機數(shù)r被生成,其中r∈[0,1]。比較r與Pd的大小值,當r>Pd時,再次更新鳥巢位置,并計算目標函數(shù)值,選擇最小的記為f',記錄其對應的位置x'。比較f'與f,選擇出最小值賦值給f,并將其鳥巢位置賦值給x;當r (5) 通過循環(huán)更新迭代,當目標函數(shù)值滿足要求且達到最大迭代數(shù)gmax時,將會得到最優(yōu)目標函數(shù)f,并將其對應的鳥巢位置x解編作為RBF 神經(jīng)網(wǎng)絡的心點c、寬度δ以及連接權(quán)值w等參數(shù)。 油田的抽油機實際工作中,通常會因操作不當、環(huán)境復雜、內(nèi)部機械磨損的積累、化學成分腐蝕等各種不可預料的因素,導致故障的產(chǎn)生。抽油機在井下工作時出現(xiàn)不同的故障,都會反映成對應形狀的示功圖,可基于此分析常規(guī)的抽油機故障。目前,將抽油機故障劃分為氣影響、油井出沙、游動凡爾漏失等10 余種類型[14-15],不同的故障對應不同形狀的示功圖。如抽油桿由于疲勞破損、化學腐蝕、卡死等原因出現(xiàn)故障;當油氣混流,導致油氣比顯著升高,引發(fā)氣影響故障;當井下油層的供液量與深井泵的排除量不匹配,造成柱塞脫離液面時,顯示為供液不足故障。 本次實驗選擇勝利油田共計1 278 組10 種常見類型的抽油機示功圖作為實驗樣本,將改進后的PSCS-RBF 算法應用于抽油機故障診斷。將2/3 的實驗數(shù)據(jù)作為訓練樣本集,對神經(jīng)網(wǎng)絡進行訓練,其他1/3 數(shù)據(jù)用于檢測所提方法的最終效果,主要步驟如下。 (1) 通過Max-Min 算法,將本次實驗采集的示功圖數(shù)據(jù)進行歸一化處理。 (2) 為減小示功圖變換對結(jié)果的影響,提高圖像識別的穩(wěn)定性和精度,采用形狀不變矩與傅里葉描述子結(jié)合法,對歸一化后的數(shù)據(jù)進行特征提取,作為RBF神經(jīng)網(wǎng)絡的輸入層信息。 (3)用引入動態(tài)發(fā)現(xiàn)概率和自適應步長改進的CS 進行尋優(yōu),得到RBF 的中心矢量c、寬度δ、連接權(quán)值w等參數(shù)。 (4) 本次實驗樣本數(shù)據(jù)集有抽油機正常狀態(tài)和9 種常見故障類型,因此規(guī)定輸出層神經(jīng)元數(shù)量為10。 (5) 采用最終得到的PSCS-RBF 模型,訓練后對抽油機進行故障診斷,對比輸出層的診斷結(jié)果與抽油機故障類型,最為接近的是為該抽油機所屬的故障類型。抽油機故障編號見表1。 表1 抽油機故障類型編號Tab.1 Pumping machine working condition type number table 為驗證研究中所提出的PSCS-RBF 抽油機故障診斷法的實際檢測效果及優(yōu)越性,本文使用勝利油田1 278 組10 種常見類型的抽油機示功圖數(shù)據(jù),分別使用PSCS-RBF 與CS-RBF、PSO-BP、UKFRBF、CS-BP 等目前被應用于抽油機故障診斷的主流方法,在同一平臺進行試驗和綜合對比。 經(jīng)實驗可得,算法的訓練誤差和迭代次數(shù)對比如圖1 所示。在同等情況下,對比PSCS-RBF 與CS-RBF 可知,經(jīng)研究改進后的PSCS 算法,其尋優(yōu)能力得到明顯的提升。從整體上比較,PSCS-RBF在尋優(yōu)前期速度更優(yōu),同時在迭代了約50 次逐漸趨于平緩,并得到了全局最優(yōu)值,證明PSCS的尋優(yōu)速度最快,效果最好。 圖1 算法尋優(yōu)曲線對比Fig.1 Comparison of algorithm search curves 采用6種診斷模型診斷所選抽油機的9種故障類型,所得精度曲線對比如圖2 所示。故障類型編號與表1 的抽油機故障類型編號對應。抽油機故障診斷結(jié)果見表2。由表2 可知,改進后的PSCSRBF抽油機故障診斷法縮減了模型的總體耗時,平均精度可達約95.9%,體現(xiàn)優(yōu)化后的RBF 相比于DBN、BP等算法,更適合于抽油機的故障診斷。 圖2 算法診斷精度對比Fig.2 Algorithm diagnostic accuracy comparison 表2 抽油機故障診斷結(jié)果Tab.2 Pumping machine fault diagnosis results 本文針對當前抽油機故障診斷問題,提出一種改進的PSCS-RBF 診斷方法。引入動態(tài)發(fā)現(xiàn)概率和自適應步長,使CS能夠優(yōu)先淘汰劣等值,并能根據(jù)目標函數(shù)收斂速度自動調(diào)整步長,進而避免陷入局部最優(yōu)。然后用改進的PSCS 算法尋優(yōu)得到RBF 的相關參數(shù),最后將PSCS-RBF 診斷模型用于抽油機的故障診斷實驗,證實該方法的優(yōu)越性。盡管在油田抽油機故障診斷的實際應用中,環(huán)境等因素較為復雜,不可避免地會出現(xiàn)診斷錯誤,但采用該方法診斷所得的結(jié)果具備一定的參考性,同時可為后續(xù)研究提供新的思路。2 實驗方案驗證
2.1 故障類型分析
2.2 故障診斷流程
2.3 實驗結(jié)果
3 結(jié)語