仲志丹,樊浩杰,李鵬輝
(1.河南科技大學(xué) 機(jī)電工程學(xué)院,河南 洛陽(yáng) 471003;2.洛陽(yáng)乾禾儀器有限公司,河南 洛陽(yáng) 471000)
目前,有桿泵抽油機(jī)井在中國(guó)石油開(kāi)采中占有舉足輕重的地位[1]。抽油機(jī)井發(fā)生故障時(shí),不僅會(huì)造成石油開(kāi)采不能有序的進(jìn)行,影響進(jìn)度目標(biāo),嚴(yán)重時(shí)還會(huì)造成安全事故。因此,準(zhǔn)確地對(duì)抽油機(jī)井故障進(jìn)行診斷很有必要。
抽油機(jī)井故障診斷主要是根據(jù)抽油機(jī)懸點(diǎn)處載荷和位移的變化數(shù)據(jù)所繪制的示功圖的形狀來(lái)判斷。傳統(tǒng)方式中巡井工人根據(jù)平時(shí)的經(jīng)驗(yàn)來(lái)識(shí)別示功圖形狀,但這種方法效率和準(zhǔn)確度低、不能滿足油田現(xiàn)代化生產(chǎn)的需要[2-3]。近年來(lái),隨著計(jì)算機(jī)識(shí)別技術(shù)的發(fā)展,越來(lái)越多的計(jì)算機(jī)識(shí)別模型被應(yīng)用在示功圖識(shí)別上,如反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)[4-5]、支持向量機(jī)(Support Vector Machine,SVM)[6-7]等。這些模型識(shí)別示功圖主要通過(guò)人工預(yù)先選取示功圖幾何特征,然后根據(jù)特征進(jìn)行示功圖分類(lèi)識(shí)別。人工選取的示功圖不變矩、矢量曲線等幾何特征,經(jīng)常受到人為因素的干擾,導(dǎo)致特征提取不準(zhǔn)確,降低了分類(lèi)精度。并且這些模型都是利用有監(jiān)督學(xué)習(xí)的方式,用大量有標(biāo)簽的示功圖數(shù)據(jù)(即已知示功圖類(lèi)別)進(jìn)行模型訓(xùn)練。這些有標(biāo)簽示功圖數(shù)據(jù)的獲取需要大量的人力和專(zhuān)家知識(shí)對(duì)示功圖進(jìn)行標(biāo)定,造成人力浪費(fèi)以及人為可能標(biāo)定失誤帶來(lái)的識(shí)別錯(cuò)誤率上升。
近年來(lái),隨著人工智能的熱浪襲來(lái),Hinton等提出一種“自編碼器”的深度學(xué)習(xí)模型受到人們的關(guān)注[8]。該模型采用無(wú)監(jiān)督學(xué)習(xí)[9]的方式,用大量不需要標(biāo)簽的圖像數(shù)據(jù)(未知圖像類(lèi)別)來(lái)學(xué)習(xí)輸入圖像特征且能夠從高維輸入圖像數(shù)據(jù)學(xué)習(xí)出低維圖像特征,被廣泛應(yīng)用于人臉識(shí)別[10]、醫(yī)學(xué)圖像檢測(cè)[11]等各個(gè)領(lǐng)域,取得了顯著的成果。其中,稀疏自編碼器[12-13](SAE)不僅能夠自動(dòng)提取圖像像素特征,解決了人工選取示功圖幾何特征的不準(zhǔn)確,還能夠利用無(wú)監(jiān)督方式學(xué)習(xí)得到數(shù)據(jù)特征的稀疏簡(jiǎn)明表達(dá),節(jié)省了給圖像賦予類(lèi)別標(biāo)簽的人力勞動(dòng)且降低分類(lèi)任務(wù)的復(fù)雜度,提高了后續(xù)softmax分類(lèi)器的分類(lèi)精度[14]?;诖耍岢鲆环N基于稀疏自編碼神經(jīng)網(wǎng)絡(luò)的示功圖識(shí)別模型,對(duì)抽油機(jī)井故障進(jìn)行智能診斷。
稀疏自編碼神經(jīng)網(wǎng)絡(luò)(SAENN)是由稀疏自編碼器和softmax分類(lèi)器組成。稀疏自編碼器主要負(fù)責(zé)自動(dòng)提取圖像稀疏特征過(guò)程,softmax分類(lèi)器負(fù)責(zé)特征分類(lèi)過(guò)程。
圖1 自編碼器結(jié)構(gòu)Fig.1 Auto-encoder structure
自編碼器提取的特征不能簡(jiǎn)明表達(dá)輸入層數(shù)據(jù)。于是Olshausen等提出了一種稀疏編碼的理論,通過(guò)研究人類(lèi)大腦的非監(jiān)督學(xué)習(xí)過(guò)程,發(fā)現(xiàn)人類(lèi)通過(guò)大腦中的神經(jīng)元學(xué)習(xí)外界事物的過(guò)程中,大部分神經(jīng)元都是處于休眠狀態(tài),只有少部分神經(jīng)元受到刺激而被激活,即神經(jīng)元的響應(yīng)是稀疏的[17]。正因?yàn)槿绱?,人腦才具有更好學(xué)習(xí)數(shù)據(jù)特征的能力,這對(duì)于自編碼器同樣適用。加上稀疏性限制后構(gòu)成稀疏自編碼器能夠?qū)W習(xí)到特征的稀疏表達(dá),使提取的特征更具有可分性。稀疏性限制就是當(dāng)神經(jīng)元輸出函數(shù)的值無(wú)限接近于1的時(shí)候,輸出被激活,無(wú)限接近于0的時(shí)候,輸出被抑制,大部分輸出被抑制的情況叫做稀疏性限制。
自編碼器的損失函數(shù)為
增加懲罰因子后進(jìn)行稀疏性限制的稀疏自編碼器的損失函數(shù)表示為
式中β為控制稀疏性懲罰因子的權(quán)重;s為隱藏層節(jié)點(diǎn)的數(shù)量。
重構(gòu)誤差的大小間接體現(xiàn)了編碼過(guò)程提取稀疏特征的有效性。由于以稀疏自編碼器的損失函數(shù)來(lái)評(píng)價(jià)重構(gòu)誤差的大小,故通過(guò)反向傳播算法最小化公式(4)可以得到最優(yōu)的權(quán)重矩陣W偏置矩陣b,最終可以得到輸入數(shù)據(jù)的隱藏層稀疏表達(dá)特征[19]。
由圖1隱藏層學(xué)習(xí)到的更具稀疏可分性的特征作為分類(lèi)器的輸入,通過(guò)分類(lèi)器可最終得到分類(lèi)結(jié)果,這一過(guò)程是有監(jiān)督學(xué)習(xí)的。由于文中研究的是多種工況下示功圖的識(shí)別,所以這是一個(gè)多分類(lèi)問(wèn)題,故選用softmax分類(lèi)器根據(jù)稀疏自編碼器學(xué)習(xí)到的特征對(duì)示功圖進(jìn)行分類(lèi)。
softmax分類(lèi)器是邏輯回歸分類(lèi)器在多分類(lèi)問(wèn)題上的推廣[20],在多分類(lèi)問(wèn)題上類(lèi)別標(biāo)簽可以取多個(gè)值。經(jīng)過(guò)softmax分類(lèi)器的分類(lèi),可以在輸出層計(jì)算出輸入示功圖屬于各分類(lèi)標(biāo)簽的概率,其中概率最大的即為分類(lèi)結(jié)果。
通過(guò)安裝在延長(zhǎng)油田抽油機(jī)上的120臺(tái)QH101-2型無(wú)線遠(yuǎn)程示功圖測(cè)量?jī)x(如圖2所示)每隔一定時(shí)間進(jìn)行數(shù)據(jù)采集,把采集的數(shù)據(jù)壓縮打包后,通過(guò)自身所帶的SIM900A模塊利用GPRS網(wǎng)絡(luò)傳輸給遠(yuǎn)程數(shù)據(jù)服務(wù)器中心。通過(guò)計(jì)算機(jī)登陸服務(wù)器就可以看到保存在服務(wù)器中的示功圖數(shù)據(jù)。
圖2 QH101-2型無(wú)線遠(yuǎn)程示功圖測(cè)量?jī)xFig.2 QH101-2 wireless remote indicator dynamometer
原始的示功圖數(shù)據(jù)是測(cè)量的抽油機(jī)上下沖程過(guò)程中n個(gè)采樣點(diǎn)的懸點(diǎn)位移和懸點(diǎn)載荷。然后分別以位移作為橫坐標(biāo),載荷作為縱坐標(biāo),將測(cè)量的n個(gè)采樣點(diǎn)繪制在直角坐標(biāo)系中并連成一條封閉的曲線,即示功圖,圖3為供液不足工況下的示功圖,不同形狀的示功圖直接反應(yīng)了抽油機(jī)井的不同工作狀況。
圖3 抽油機(jī)井供液不足示功圖Fig.3 Indicator diagram of insufficient liquid supply in pumping well
為了減少稀疏自編碼器訓(xùn)練時(shí)間,提高網(wǎng)絡(luò)學(xué)習(xí)中收斂速度,保證示功圖的形狀不變,實(shí)驗(yàn)中通過(guò)MATLAB仿真軟件將測(cè)量的示功圖原始數(shù)據(jù)處理成64pixel×64pixel的二值化示功圖圖像。
選擇從延長(zhǎng)油田獲取的示功圖數(shù)據(jù)并處理后的8 000張二值化示功圖圖像作為樣本。其中,有3 200張8種典型工況的無(wú)標(biāo)簽樣本作為稀疏自編碼器無(wú)監(jiān)督訓(xùn)練的訓(xùn)練樣本。余下的4 800張8種不同工況的有標(biāo)簽樣本,每一種工況有600張示功圖圖像。這8種不同工況類(lèi)別的示功圖分別為正常示功圖、供液不足、氣體影響、示功圖異常、氣鎖、油井結(jié)蠟、活塞脫出、固定凡爾漏失,具體示功圖形狀如圖4所示。每一種工況樣本的2/3作為softmax分類(lèi)器有監(jiān)督訓(xùn)練的訓(xùn)練集,1/3作為測(cè)試集。那么所有工況的有標(biāo)簽訓(xùn)練集樣本為3 200,測(cè)試集樣本為1 600.
圖4 8種不同工況類(lèi)別示功圖形狀Fig.4 Shapes of indicator diagram in eight different working conditions
1.1節(jié)與1.2節(jié)已經(jīng)介紹了稀疏自編碼器與softmax分類(lèi)器,本節(jié)將主要介紹稀疏自編碼神經(jīng)網(wǎng)絡(luò)在示功圖識(shí)別中的具體流程,如圖5所示。詳細(xì)步驟如下
1)設(shè)定期望平均稀疏激活度參數(shù)ρ,訓(xùn)練學(xué)習(xí)速率η,隨機(jī)初始化權(quán)重矩陣W和偏置矩陣b;
2)設(shè)定前向傳播中分批次訓(xùn)練樣本數(shù)、訓(xùn)練迭代周期次數(shù)等,執(zhí)行前向傳播過(guò)程;
3)對(duì)輸出層的每一個(gè)節(jié)點(diǎn),計(jì)算加入稀疏性限制之后的損失函數(shù);
4)使用反向傳播算法求出最終輸出層與各層神經(jīng)元的“殘差”,利用梯度下降法不斷更新權(quán)重矩陣W和偏置矩陣b,最終得到最優(yōu)的W和b.
1)用(1)中得到的權(quán)重矩陣W(1)和偏置矩陣b(1)等參數(shù)初始化稀疏自編碼器特征提取層;
2)設(shè)置softmax分類(lèi)器正則化參數(shù)λ,輸出層節(jié)點(diǎn)數(shù),執(zhí)行前向傳播算法,提取特征并進(jìn)行分類(lèi);
3)使用反向傳播算法求出最終輸出層與各層神經(jīng)元的“殘差”,利用梯度下降法不斷更新權(quán)值和偏置,對(duì)整個(gè)稀疏自編碼神經(jīng)網(wǎng)絡(luò)進(jìn)行微調(diào)。
1)計(jì)算輸入數(shù)據(jù)屬于每個(gè)分類(lèi)標(biāo)簽的概率,選取概率最大的作為分類(lèi)結(jié)果;
2)用輸出分類(lèi)結(jié)果與實(shí)際輸入結(jié)果作對(duì)比,計(jì)算識(shí)別準(zhǔn)確率。
本實(shí)驗(yàn)所用硬件平臺(tái)為Intel i5-3210M 2.5 GHz CPU,內(nèi)存8 GB的64位計(jì)算機(jī),所使用的軟件平臺(tái)為Matlab2014a.
稀疏自編碼神經(jīng)網(wǎng)絡(luò)的參數(shù)選擇與示功圖識(shí)別精度息息相關(guān)。文中稀疏自編碼器輸入層神經(jīng)元個(gè)數(shù)由示功圖圖像像素點(diǎn)個(gè)數(shù)決定即64×64=4 096.令稀疏自編碼器的隱藏層神經(jīng)元個(gè)數(shù)為600,softmax分類(lèi)器輸出層神經(jīng)元個(gè)數(shù)為8,根據(jù)文獻(xiàn)[7]設(shè)置學(xué)習(xí)速率η=0.5.稀疏自編碼器迭代次數(shù)達(dá)到200次時(shí),重構(gòu)誤差趨于穩(wěn)定,因此設(shè)定迭代次數(shù)為200.在實(shí)驗(yàn)中發(fā)現(xiàn)不同的期望平均稀疏激活度參數(shù)ρ和正則化參數(shù)λ對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生很大影響,圖6反映的是不同期望平均稀疏激活度參數(shù)ρ對(duì)測(cè)試集樣本識(shí)別準(zhǔn)確率的影響。從圖6可知,期望平均稀疏激活度參數(shù)ρ=0.035的時(shí)候示功圖識(shí)別精度最高。
圖5 稀疏自編碼神經(jīng)網(wǎng)絡(luò)識(shí)別示功圖流程Fig.5 Flowchart of sparse auto-encoder neural network for indicator diagram recognition
圖6 期望平均稀疏激活度參數(shù)對(duì)識(shí)別準(zhǔn)確率影響Fig.6 Influence of expected average sparsity activation parameter on recognition accuracy
在ρ=0.035的條件下,softmax分類(lèi)器不同正則化參數(shù)與訓(xùn)練集樣本識(shí)別準(zhǔn)確率、測(cè)試集樣本識(shí)別準(zhǔn)確率的關(guān)系,如圖7所示。當(dāng)λ=1×10-5時(shí)訓(xùn)練集樣本識(shí)別準(zhǔn)確率和測(cè)試集樣本識(shí)別準(zhǔn)確率都已達(dá)到峰值,故設(shè)定優(yōu)化后的正則化參數(shù)λ=1×10-5.
圖7 正則化參數(shù)與識(shí)別準(zhǔn)確率的關(guān)系Fig.7 Relationship between regularization parameter and recognition accuracy
利用1 600張實(shí)測(cè)示功圖測(cè)試集樣本對(duì)訓(xùn)練完成后的稀疏自編碼神經(jīng)網(wǎng)絡(luò)模型進(jìn)行測(cè)試,由于篇幅限制,選取了部分示功圖故障識(shí)別結(jié)果,見(jiàn)表1.
為了評(píng)價(jià)稀疏自編碼神經(jīng)網(wǎng)絡(luò)模型的識(shí)別性能,通過(guò)把相同的1 600張測(cè)試集樣本分別輸入到BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)、稀疏自編碼神經(jīng)網(wǎng)絡(luò)模型進(jìn)行測(cè)試對(duì)比,測(cè)試結(jié)果見(jiàn)表2.其中BP神經(jīng)網(wǎng)絡(luò)采用單隱層結(jié)構(gòu)(600個(gè)隱藏層神經(jīng)元),SVM采用徑向基函數(shù)作為核函數(shù)。BP神經(jīng)網(wǎng)絡(luò)需要人工選取示功圖不變矩特征,支持向量機(jī)需要人工選取示功圖矢量曲線特征,二者都不能實(shí)現(xiàn)對(duì)示功圖的準(zhǔn)確表達(dá),而稀疏自編碼器通過(guò)網(wǎng)絡(luò)學(xué)習(xí)自動(dòng)提取圖像稀疏特征,能夠?qū)崿F(xiàn)對(duì)示功圖簡(jiǎn)明有效表達(dá)。而提取的稀疏特征能夠準(zhǔn)確地區(qū)分不同示功圖之間差別,大大提高了softmax分類(lèi)器的識(shí)別精度。由實(shí)驗(yàn)結(jié)果可知,稀疏自編碼神經(jīng)網(wǎng)絡(luò)模型測(cè)試識(shí)別準(zhǔn)確度高達(dá)99.44%,性能遠(yuǎn)優(yōu)于BP,SVM等識(shí)別模型,故該模型在抽油機(jī)井故障診斷中具有明顯優(yōu)勢(shì)。
表1 實(shí)測(cè)示功圖故障識(shí)別結(jié)果Table 1 Fault recognition result of actual indicator diagrams
表2 各種模型識(shí)別性能對(duì)比Table 2 Comparison of various models’s recognition accuracy
將基于稀疏自編碼神經(jīng)網(wǎng)絡(luò)的抽油機(jī)井故障診斷方法應(yīng)用于通過(guò)Labwindows/CVI開(kāi)發(fā)環(huán)境開(kāi)發(fā)的抽油機(jī)井故障智能診斷系統(tǒng)中,該系統(tǒng)已經(jīng)在勝利油田、江漢油田、新疆油田得到應(yīng)用,系統(tǒng)可視化界面如圖8所示。該系統(tǒng)可以對(duì)實(shí)測(cè)示功圖數(shù)據(jù)進(jìn)行實(shí)時(shí)繪制,并根據(jù)繪制的示功圖及時(shí)給出診斷結(jié)果與處理建議。油田工作人員可以根據(jù)診斷結(jié)果對(duì)抽油機(jī)井故障及時(shí)進(jìn)行處理,極大程度降低了由故障造成的油田停產(chǎn)、減產(chǎn)、抽油設(shè)備損壞等現(xiàn)象。
圖8 抽油機(jī)井故障智能診斷系統(tǒng)Fig.8 Intelligent fault diagnosis system for pumping well
1)借助人工智能思想,提出稀疏自編碼神經(jīng)網(wǎng)絡(luò)模型識(shí)別示功圖。稀疏自編碼器訓(xùn)練過(guò)程采用無(wú)監(jiān)督學(xué)習(xí)方式,代替了傳統(tǒng)有監(jiān)督模型訓(xùn)練需要人工標(biāo)定大量示功圖標(biāo)簽的過(guò)程,大大減少了人力勞動(dòng),避免了人為標(biāo)定錯(cuò)誤;
2)稀疏自編碼神經(jīng)網(wǎng)絡(luò)自動(dòng)提取示功圖數(shù)據(jù)特征,避免了BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等傳統(tǒng)模型人工預(yù)先提取示功圖幾何特征的繁瑣與特征選取的不當(dāng);
3)稀疏自編碼神經(jīng)網(wǎng)絡(luò)提取的稀疏可分性示功圖數(shù)據(jù)特征能夠提高示功圖的識(shí)別準(zhǔn)確率,為抽油機(jī)井故障診斷帶來(lái)了新思路,解決了長(zhǎng)期以來(lái)困擾油井工作人員不能有效地診斷抽油機(jī)井故障的難題,提高了油田作業(yè)效率,進(jìn)一步提升了石油產(chǎn)量。