楊光喬 李 穎 王國程 劉明魁 柳小勤 鄧云楠
(1.中國石油長慶油田分公司第三采油廠 2.昆明理工大學(xué)機(jī)電工程學(xué)院)
油田注水能夠彌補原油開采造成的地下虧空,保持或提高油層壓力進(jìn)而穩(wěn)定油田產(chǎn)能,提高采收率。柱塞泵作為油田開發(fā)過程中的關(guān)鍵設(shè)備,其運行中存在壓力高、能耗高、故障率高、安全風(fēng)險高等問題,監(jiān)控不當(dāng)容易造成事故發(fā)生,成為油田設(shè)備管理的難點和重點[1-2]。保障柱塞泵系統(tǒng)安全穩(wěn)定生產(chǎn)、提高設(shè)備運行可靠度,對于提高油田開發(fā)經(jīng)濟(jì)效益具有重要意義。近年來,隨著基于振動信號處理的在線監(jiān)測系統(tǒng)建設(shè)日益成熟,柱塞泵在線監(jiān)測系統(tǒng)逐漸取代周期性人力現(xiàn)場檢修,承擔(dān)著油田的注水系統(tǒng)維護(hù)任務(wù)[3-4]。振動信號包含大量機(jī)械運行狀態(tài)信息及機(jī)組運行狀態(tài)信息,不同的故障特征、運行參數(shù)都能夠映射到振動數(shù)據(jù)特征中。在柱塞泵系統(tǒng)運行過程中完成數(shù)據(jù)實時傳輸及在線診斷能夠幫助維護(hù)人員及時掌握機(jī)組運行狀態(tài),對于故障缺陷能夠快速響應(yīng)并調(diào)整運行策略,做到發(fā)現(xiàn)故障并及時處理。然而,生產(chǎn)計劃的頻繁變動往往導(dǎo)致柱塞泵機(jī)組的運行工況產(chǎn)生波動,進(jìn)一步導(dǎo)致振動強度發(fā)生波動[5]。由于故障缺陷和運行參數(shù)都影響著振動數(shù)據(jù)特征數(shù)值,油田柱塞泵振動信號特征往往受到工況擾動,傳統(tǒng)方法對故障特征的捕捉和學(xué)習(xí)能力較弱,難以對故障特征進(jìn)行診斷,進(jìn)而出現(xiàn)“不預(yù)警”或“錯誤預(yù)警”等威脅設(shè)備運行安全的問題。因此,探索高精度的智能化故障診斷方法是保障油田柱塞泵故障診斷準(zhǔn)確率,提高油田運行監(jiān)測效率的關(guān)鍵[6]。
近年來,深度學(xué)習(xí)優(yōu)秀的自適應(yīng)故障特征學(xué)習(xí)能力成為故障診斷領(lǐng)域的熱點方向,并在機(jī)械設(shè)備故障診斷領(lǐng)域得到廣泛關(guān)注。大量研究表明,基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的故障診斷在工業(yè)場景具有關(guān)鍵意義,通過對工業(yè)數(shù)據(jù)強關(guān)聯(lián)特性的學(xué)習(xí)和表征,CNN能對工業(yè)環(huán)境下高溫、嘈雜等負(fù)面因素對故障診斷的干擾進(jìn)行消除,實現(xiàn)魯棒特征的學(xué)習(xí)能力[7-9]。由于一維卷積神經(jīng)網(wǎng)絡(luò)(One-dimensional Convolutional Neuyql Network,1D-CNN)相比傳統(tǒng)二維卷積神經(jīng)網(wǎng)絡(luò)具有輸入簡單、運算速度快,能夠獲取輕量化模型而受到廣泛關(guān)注[10-12]。卷積核在一維數(shù)據(jù)的連續(xù)滑動令1D-CNN能夠適用于各類傳感器數(shù)據(jù)的時間序列分析,并發(fā)掘出深層非線性特征用于表征目標(biāo)的性能,從而在保證預(yù)測精度的基礎(chǔ)上簡化模型結(jié)構(gòu),提高模型訓(xùn)練效率。但柱塞泵體積較大、振動傳播路徑復(fù)雜,導(dǎo)致故障特征在信號中受到大量干擾而難以被提取。
目前關(guān)于油田柱塞泵故障診斷的深度學(xué)習(xí)方法尚未被探索,且現(xiàn)有基于深度學(xué)習(xí)的故障診斷方法缺乏對振動信號的有效數(shù)據(jù)特征強化,多通道特征不具備有效的深度交互。鑒于此,本文提出基于高效通道注意力(Efficient Channel Attention,ECA)改進(jìn)1D-CNN的油田柱塞泵故障診斷方法,針對柱塞泵體積大、振動傳播路徑復(fù)雜導(dǎo)致傳統(tǒng)方法在振動故障信號特征提取中的局限,基于深度學(xué)習(xí)方法開展油田柱塞泵故障診斷智能模型研究。使用1D-CNN作為故障診斷基準(zhǔn)模型,并引入ECA,通過增強通道特征交互實現(xiàn)深層次柱塞泵振動信號特征挖掘,提高模型預(yù)測精度。在某采油廠的柱塞泵實際運行在線監(jiān)測數(shù)據(jù)中進(jìn)行試驗,通過實際的應(yīng)用和驗證結(jié)果,展示了本文方法在柱塞泵監(jiān)測應(yīng)用中的魯棒性和準(zhǔn)確性。
卷積神經(jīng)網(wǎng)絡(luò)通過稀疏連接和權(quán)值參數(shù)共享將數(shù)據(jù)的簡單特征映射到更復(fù)雜的高維模式。其組成部分描述如下。
CNN主要由不同卷積參數(shù)的卷積層組成并對輸入數(shù)據(jù)進(jìn)行一系列卷積運算以獲取卷積特征,其數(shù)學(xué)表達(dá)為:
(1)
由于分布統(tǒng)一的數(shù)據(jù)能讓模型更容易學(xué)習(xí)到數(shù)據(jù)之中的規(guī)律,卷積處理后的數(shù)據(jù)通常需要批量歸一化(Batch Normalization,BN)處理,使隱含神經(jīng)元趨于標(biāo)準(zhǔn)正態(tài)分布,從而減少數(shù)據(jù)特征分布差異并有效緩解梯度消失問題。BN通過獨立的方式使每一個特征向量具有零均值和單位方差。當(dāng)卷積層輸出d維空間向量,則BN輸入X=(x(1),…,x(d))。為減小內(nèi)部協(xié)變量轉(zhuǎn)移,將對每一維特征歸一化,可以被表示為:
(2)
式中:E[x(i)]為x(i)的期望值;Var[x(i)]為x(i)的方差。
使用式(2)對特征進(jìn)行歸一化會影響模型的表征能力,于是引入重構(gòu)參數(shù)γi和βi對歸一化值進(jìn)行調(diào)整,恢復(fù)原始網(wǎng)絡(luò)的特征分布,上述過程可以描述如下:
(3)
對數(shù)據(jù)進(jìn)行BN規(guī)范化后,采用激活函數(shù)對數(shù)據(jù)實施非線性映射。選用Rectified linear unit(ReLU)激活函數(shù)對輸入特征進(jìn)行處理得到輸出:
(4)
隨后進(jìn)行池化(Pooling)操作減小模型規(guī)模、提高運算速度,同時提高所提取特征的魯棒性,實現(xiàn)目標(biāo)區(qū)域特征提取并減少參數(shù)數(shù)量,防止模型過擬合。本文采用最大池化操作,函數(shù)表示如下:
(5)
經(jīng)過最大池化后的特征將被展平處理輸入全連接層,其表達(dá)式如下:
(6)
式中:wh表示相鄰層之間的權(quán)重矩陣;bh為偏置;dm表示輸入數(shù)據(jù);σ(·)是激活函數(shù)。
在全連接層之后,通過SoftMax函數(shù)實現(xiàn)類別分類,即有:
(7)
式中:fk(y)是SoftMax函數(shù)對每個類別的預(yù)測值;k為目標(biāo)的輸出類別索引;C為訓(xùn)練中所涉及的樣本總數(shù)。
同時,模型訓(xùn)練采用交叉熵作為損失函數(shù),公式如下:
(8)
式中:θ為模型的訓(xùn)練參數(shù);hk為第k個目標(biāo)的輸出類別;fk(θ)為第k類樣本預(yù)測概率值;L(θ)為誤差損失值。
高效通道注意力(ECA)[13]是在SENet[14]的基礎(chǔ)上做出改進(jìn),提出一種不降維的局部跨通道交互策略和自適應(yīng)選擇一維卷積核尺寸的方法。ECA通過不降低維數(shù)的通道級全局平均池化操作,將特征圖由二維矩陣壓縮成為單個數(shù)值,從而獲取特征圖的全局感受野信息。當(dāng)給定特征y∈RC,高效通道注意力可以被表示為:
ω=σ(Wy)
(9)
其中:W為學(xué)習(xí)通道注意力帶狀矩陣,被表示為:
(10)
W包含p×C個參數(shù),相比原始通道注意力機(jī)制更少。其中每個通道特征yn的權(quán)重wn可以通過與鄰域內(nèi)p個參數(shù)的交互,該過程被表示為:
(11)
所有通道的特征權(quán)重共享,即共同使用wv,此時可以通過以卷積核尺寸為p的一維卷積來表示式(11)中的計算,即有:
w=σ(Conv1Dp(y))
(12)
式中:Conv1D表示一維卷積操作。
式(12)即為ECA的計算表達(dá)式,詳細(xì)模塊架構(gòu)如圖1所示。
圖1 注意力機(jī)制Fig.1 Attention mechanism
1.3.1 模型構(gòu)建
在1D-CNN的基礎(chǔ)上引入高效通道注意力模塊,基于1D-CNN從油田柱塞泵振動信號中學(xué)習(xí)各類故障的多層次特征;然后引入高效通道注意力模塊對特征通道的重要程度進(jìn)行提取,根據(jù)這個重要程度實現(xiàn)故障特征增強,對無效的特征進(jìn)行抑制,使網(wǎng)絡(luò)獲得魯棒性更高的分類線索。其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖2所示。
圖2 ECA改進(jìn)的1D-CNN油田柱塞泵故障診斷模型結(jié)構(gòu)Fig.2 Structure of fault diagnosis model for oilfield plunger pump based on ECA improved 1D-CNN
故障診斷模型主要由輸入層、隱含層、注意力層以及全連接層組成。輸入層以油田柱塞泵一維振動信號樣本作為輸入,隱含層包括卷積層、BN層、池化層,本文設(shè)計的網(wǎng)絡(luò)結(jié)構(gòu)包含2個隱含層。輸入數(shù)據(jù)經(jīng)過卷積操作后生成特征圖,隨后經(jīng)過卷積核尺寸為2的最大池化操作得到第1個隱含層的輸出;其次經(jīng)過第2隱含層經(jīng)過卷積和池化操作;隨后將隱含層輸出送入ECA模塊進(jìn)行通道交互;進(jìn)一步地,將ECA輸出展平進(jìn)行全連接計算,通過激活函數(shù)獲得模型輸出;最后將標(biāo)記好的特征序列送到SoftMax分類器中實現(xiàn)柱塞泵故障分類。
1.3.2 油田柱塞泵故障診斷流程
基于ECA改進(jìn)的1D-CNN故障診斷流程如圖3所示。將ECA引入1D-CNN實現(xiàn)網(wǎng)絡(luò)模型構(gòu)建,然后進(jìn)行模型參數(shù)θ初始化設(shè)定,采用SoftMax分類器映射輸出特征,以交叉熵作為損失函數(shù)L(θ)更新模型參數(shù);通過迭代計算損失函數(shù)判斷其收斂特性,最后完成模型訓(xùn)練并保存模型參數(shù)。具體步驟信息如下:
(1)信號采集。采用HY-107Z測振系統(tǒng)對油田柱塞泵振動加速度信號進(jìn)行采集,用于狀態(tài)分析和診斷模型構(gòu)建。
(2)數(shù)據(jù)集準(zhǔn)備。按預(yù)設(shè)比例將油田柱塞泵振動加速度數(shù)據(jù)劃分為訓(xùn)練集和測試集。
(3)模型構(gòu)建與訓(xùn)練。設(shè)計故障診斷模型架構(gòu)并初始化模型參數(shù),基于訓(xùn)練集數(shù)據(jù)對模型進(jìn)行訓(xùn)練,并利用前向傳播和反向傳播迭代求取梯度、更新模型參數(shù),完成指定迭代次數(shù)后,結(jié)束訓(xùn)練保存最優(yōu)模型。
(4)故障診斷測試。以訓(xùn)練獲取的最優(yōu)模型進(jìn)行測試,基于測試集數(shù)據(jù)開展模型的性能驗證和評估。
本文在某油田柱塞泵上開展信號采集分析試驗,以驗證提出的故障預(yù)警技術(shù)。柱塞泵型號為5DSB,主要信息如圖4所示。
圖4 油田柱塞泵實物及傳感器安裝示意圖Fig.4 Schematic diagram of oilfield plunger pump and installed sensors
5DSB系列柱塞泵裝置主要由驅(qū)動電機(jī)、皮帶輪、柱塞泵及基座組成,其中柱塞泵分為動力端與液力端2部分。傳感器安裝位置如下:電機(jī)驅(qū)動端軸承垂直方向2V-a;泵前軸承垂直方向3V-a;泵后軸承垂直方向4V-a。文中所有數(shù)據(jù)均來自3V測點。
試驗數(shù)據(jù)為通過油田日常運行與檢修維護(hù)獲取的現(xiàn)場在線監(jiān)測數(shù)據(jù),包含油田柱塞泵3種狀態(tài):正常狀態(tài)、連桿斷裂故障、軸承斷裂故障,在文中用F1~F3來表示3種狀態(tài)。油田柱塞泵數(shù)據(jù)采集及分析使用上海華陽檢測器進(jìn)行狀態(tài)監(jiān)測,具體為:設(shè)備的振動數(shù)據(jù)采集選用的儀器為華陽檢測公司研發(fā)的HY-107Z工作測振儀。本次測量采用機(jī)械振動狀態(tài)監(jiān)測中加速度參數(shù),單位為m/s2,取有效值;數(shù)據(jù)的采樣頻率為12.8 kHz,單次采樣點數(shù)為8 192個點,采樣間隔為5 min。每類柱塞泵狀態(tài)數(shù)據(jù)在試驗中共選取300組信號作為總樣本數(shù)據(jù),其中訓(xùn)練集隨機(jī)選擇信號總樣本數(shù)據(jù)的70%,其余30%的信號樣本數(shù)據(jù)作為測試集。具體信息如表1所示。
表1 油田柱塞泵健康狀態(tài)及數(shù)據(jù)參數(shù)Table 1 Health status and data parameters of oilfield plunger pump
針對所處理油田柱塞泵振動加速度信號,設(shè)計2層卷積層,以保證故障診斷性能的同時避免參數(shù)過多導(dǎo)致算法效率下降。考慮到在線監(jiān)測數(shù)據(jù)的工況波動特性,設(shè)計較少的卷積層以避免對當(dāng)前數(shù)據(jù)分布的過擬合。輸入層所輸入的是原始一維振動信號,因此在卷積層1中設(shè)計了寬卷積核以抑制干擾特征[15]。
為了覆蓋更多參數(shù)組合的選擇及降低人工選擇參數(shù)引入的隨機(jī)性,引入了網(wǎng)格搜索算法來尋最優(yōu)模型的參數(shù),即將各個參數(shù)可能的取值進(jìn)行排列與組合,然后使用各參數(shù)組合對構(gòu)建的模型進(jìn)行訓(xùn)練,通過交叉驗證對模型診斷性能進(jìn)行測試[16-17]。擬合函數(shù)遍歷所有的參數(shù)組合后,自動選擇最佳參數(shù)組合。參數(shù)優(yōu)化結(jié)果如表2所示。
表2 模型主要參數(shù)Table 2 Main parameters of the model
此外,試驗Batchsize設(shè)為64,訓(xùn)練Epoch為30,正則化選用L2范數(shù)。優(yōu)化器設(shè)置為Adam(學(xué)習(xí)率為0.000 1),最后保存最優(yōu)的模型進(jìn)行測試。
導(dǎo)出系統(tǒng)中的油田注水泵振動加速度數(shù)據(jù)進(jìn)行波形和頻譜分析。試驗中F1正常狀態(tài)數(shù)據(jù)來源于2021年12月的在線監(jiān)測數(shù)據(jù),F(xiàn)2連桿斷裂故障及F3軸承斷裂故障數(shù)據(jù)來源于2022年1月在線監(jiān)測數(shù)據(jù)。信號時域波形、頻譜如圖5所示。
圖5 柱塞泵不同狀態(tài)下的數(shù)據(jù)波形和頻譜Fig.5 Data waveform and spectrum of plunger pump under different states
從圖5的時域信號可以看出,受到實際運行環(huán)境中的各類干擾因素影響,信號波形呈現(xiàn)出復(fù)雜、多變的特征,即使相近時間段內(nèi)的數(shù)據(jù)特征也可能出現(xiàn)較大差異。從3種狀態(tài)數(shù)據(jù)的頻譜來看,頻帶能量分布的不確定性更加顯著,相同狀態(tài)在不同頻帶均可能出現(xiàn)顯著的能量分布。
上述分析表明,傳統(tǒng)故障特征分析難以在環(huán)境復(fù)雜、背景嘈雜、工況多變的油田柱塞泵實際運行監(jiān)測中實現(xiàn)及時、準(zhǔn)確的故障診斷,基于學(xué)習(xí)能力更強、魯棒性更優(yōu)的深度學(xué)習(xí)方法進(jìn)行故障診斷對于油田生產(chǎn)具有重要意義。
通過引入回調(diào)函數(shù),結(jié)合模型在訓(xùn)練過程中的表現(xiàn),進(jìn)行預(yù)先保存,得到最佳的模型參數(shù)。訓(xùn)練集數(shù)據(jù)和測試集數(shù)據(jù)的故障診斷準(zhǔn)確率及損失率分別如圖6a和圖6b所示。
圖6 診斷準(zhǔn)確率曲線Fig.6 Diagnostic accuracy curve
從圖6可以看出,模型驗證性能良好,經(jīng)過40次的循環(huán)迭代,測試集的準(zhǔn)確率能夠達(dá)到93.7%。為了進(jìn)一步地評價構(gòu)建的模型對油田柱塞泵故障的診斷效果,引入多分類混淆矩陣對試驗結(jié)果進(jìn)行詳細(xì)分析。基于高效通道注意力的一維卷積神經(jīng)網(wǎng)絡(luò)與1D-CNN混淆矩陣如圖7所示。
圖7 多分類混淆矩陣Fig.7 Multi-classification confusion matrix
從圖7可以看出,測試集300個樣本中,本文提出的方法只有F1的5個樣本被誤判為連桿斷裂狀態(tài),其余的數(shù)據(jù)都能達(dá)到100%的診斷正確率,這表明本文提出的模型有較高的故障識別率。對比之下,1D-CNN在F1狀態(tài)的診斷中出現(xiàn)了15個誤判,F(xiàn)2的預(yù)測中出現(xiàn)了3個誤判,出現(xiàn)了較多診斷失效的案例。
為了驗證本文構(gòu)建模型的性能,將廣泛應(yīng)用的1D-CNN、全連接神經(jīng)網(wǎng)絡(luò)(FCNN)和多尺度卷積神經(jīng)網(wǎng)絡(luò)(MC-CNN)[18-19]對數(shù)據(jù)進(jìn)行分析和試驗結(jié)果比較。激活函數(shù)、優(yōu)化器、損失函數(shù)、Dropout的比例和迭代次數(shù)等均和本文構(gòu)建的模型設(shè)置相同。所應(yīng)用的模型試驗結(jié)果如表3所示。
表3 4種模型的故障診斷準(zhǔn)確率Table 3 Fault diagnosis accuracy of 4 models
從表3可以看出,本文模型、1D-CNN,MC-CNN及FCNN的診斷準(zhǔn)確率分別為98.1%、93.3%、93.4%及67.6%,本文構(gòu)建的模型診斷準(zhǔn)確率顯著優(yōu)于其他模型,并且本文在F1和F3的診斷中達(dá)到100%的正確率。這表明本文提出的方法具有較高精度的同時泛化性能也較好。狀態(tài)F2數(shù)據(jù)的診斷正確率相比其余狀態(tài)表現(xiàn)不高,主要是被誤判為F1狀態(tài),這可能是網(wǎng)絡(luò)特征提取能力不足造成的。相比其他算法,本文提出的算法具有顯著的性能優(yōu)勢。
本文提出基于高效通道注意力的一維卷積神經(jīng)網(wǎng)絡(luò)故障診斷方法,研究得出以下結(jié)論:
(1)針對柱塞泵體積大、振動傳播路徑復(fù)雜導(dǎo)致傳統(tǒng)方法在振動故障信號特征提取中的局限性,開發(fā)了基于深度學(xué)習(xí)的油田柱塞泵故障診斷智能模型,有效提高了油田柱塞泵故障診斷效率。
(2)使用1D-CNN作為故障診斷基準(zhǔn)模型,并引入高效通道注意力,通過增強通道特征交互實現(xiàn)網(wǎng)絡(luò)性能改進(jìn),從而實現(xiàn)深層次柱塞泵振動信號特征挖掘,成功改善了柱塞泵故障診斷模型的預(yù)測性能。
(3)通過油田生產(chǎn)在線監(jiān)測數(shù)據(jù)的試驗驗證,與當(dāng)前其他深度學(xué)習(xí)模型相比,基于高效通道注意力的1D-CNN模型具有出色的診斷精度和魯棒性,具備理論指導(dǎo)意義和工程實用價值。