沈煜佳,陳夕松,夏 峰,姜 磊
(1.東南大學(xué)自動化學(xué)院,江蘇南京 210096;2.南京富島信息工程有限公司,江蘇南京 210061)
在采油工程領(lǐng)域,抽油機(jī)是機(jī)械采油時(shí)代最主要的開采設(shè)備,開發(fā)抽油機(jī)井工況檢測診斷系統(tǒng)對于管控油田采油作業(yè)的安全高效進(jìn)行、提高油田產(chǎn)量具有重要意義。在目前大數(shù)據(jù)背景下,通過深度學(xué)習(xí)網(wǎng)絡(luò)提取示功圖特征并建立診斷模型,實(shí)現(xiàn)示功圖的工況監(jiān)測、異常識別與自動診斷已逐漸成為抽油機(jī)故障診斷技術(shù)研究的重要方向[1]。
由于地質(zhì)情況等條件的影響,大部分抽油機(jī)示功圖都難以接近工程原理中標(biāo)準(zhǔn)工況下的示功圖。以典型示功圖為分類標(biāo)準(zhǔn)進(jìn)行故障診斷往往會導(dǎo)致多數(shù)識別結(jié)果為異常,誤報(bào)率較高。出于工程適用性考慮,目前業(yè)內(nèi)通常以抽油機(jī)長期平穩(wěn)運(yùn)行時(shí)的示功圖作為該設(shè)備的標(biāo)準(zhǔn)示功圖,只有出現(xiàn)與之不相似的示功圖時(shí)才判定檢測到故障。常用的重疊面積法[2]、統(tǒng)計(jì)分析法等相似識別方法雖能實(shí)現(xiàn)故障檢測,但仍需工藝專家進(jìn)行標(biāo)定或通過進(jìn)一步訓(xùn)練來診斷故障類型。為解決上述問題,本文研究了基于深度學(xué)習(xí)相似識別的抽油機(jī)井故障檢測與診斷一體化方法,能通過識別示功圖變化檢測故障,并檢索出故障特征庫進(jìn)行診斷,指導(dǎo)油田科學(xué)穩(wěn)定生產(chǎn)。同時(shí),通過數(shù)據(jù)融合的方式提高相似匹配模型準(zhǔn)確率,具有較好的應(yīng)用價(jià)值。
采用深度學(xué)習(xí)網(wǎng)絡(luò)提取示功圖特征進(jìn)行訓(xùn)練,首先需要對示功圖原始二維數(shù)據(jù)進(jìn)行預(yù)處理,然后依據(jù)圖形相似性對示功圖樣本集進(jìn)行分類,建立二分類和三元組模型的訓(xùn)練集和驗(yàn)證集,分別輸入對應(yīng)網(wǎng)絡(luò)訓(xùn)練,獲得二分類和三元組相似識別模型。最后建立抽油機(jī)的標(biāo)準(zhǔn)庫與故障庫,應(yīng)用訓(xùn)練好的模型進(jìn)行實(shí)時(shí)故障檢測,并在故障庫中檢索故障類型以實(shí)現(xiàn)診斷。
對示功圖原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理、坐標(biāo)歸一化并映射到網(wǎng)格中,采用OpenCV 將示功圖二維原始數(shù)據(jù)轉(zhuǎn)化為圖像輸入。主要步驟如下:
(1)由于傳感器等不穩(wěn)定因素,抽油機(jī)的示功圖原始二維數(shù)據(jù)可能存在部分異常數(shù)據(jù),因此需要進(jìn)行異常數(shù)據(jù)過濾處理,主要包括位移或載荷數(shù)據(jù)為空、全為零或近似為零、位移與載荷數(shù)據(jù)采樣點(diǎn)數(shù)不一致、位移超出最大沖程或載荷超出最大載荷、生產(chǎn)設(shè)備故障五類。
(3)新建的m×n 二維網(wǎng)格,將坐標(biāo)歸一化后的二維數(shù)據(jù)映射到網(wǎng)格并向下取整,得到網(wǎng)格化后位移、載荷數(shù)據(jù)對應(yīng)的二維像素點(diǎn)數(shù)據(jù)和:
式中:m 表示每個(gè)示功圖原始樣本數(shù)據(jù)集中位移x和載荷f 的采樣點(diǎn)數(shù),j 表示樣本數(shù)據(jù)的第j 個(gè)數(shù)據(jù)點(diǎn),在相似識別這類細(xì)粒度分類的問題中,為兼顧圖像特征量和計(jì)算量,一般設(shè)置n=224,作為深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的輸入層大小。
(4)將示功圖二維坐標(biāo)點(diǎn)兩兩相連至最后一點(diǎn),最后將首尾相接形成示功圖封閉曲線。
本文方法融合了二分類和基于三元組損失的相似識別模型。其中,二分類模型建立過程主要包括如下步驟:
(1)以示功圖圖形相似性為依據(jù),將示功圖樣本集分為不同類別的子樣本集,各子樣本集互不相交且并集為整個(gè)集合,類別內(nèi)的示功圖彼此相似,類別間的示功圖彼此不相似,并采用增加隨機(jī)擾動的方法進(jìn)行數(shù)據(jù)增強(qiáng)[3],均衡樣本數(shù)量較少的類別。
(2)在每個(gè)類別內(nèi)確定由工藝專家標(biāo)定的標(biāo)準(zhǔn)示功圖,即錨點(diǎn)。
(3)以對第1 類示功圖為例,對類內(nèi)除錨點(diǎn)外的示功圖進(jìn)行無放回抽樣,用兩種顏色將錨點(diǎn)和隨機(jī)選取的示功圖疊加繪制成同一張圖像,重復(fù)此步驟得到二分類正樣本集,標(biāo)簽τbinary為1;相反地,將任一類示功圖錨點(diǎn)與對類外任意樣本類別進(jìn)行無放回抽樣所得的示功圖疊加繪制成同一張圖像,重復(fù)此步驟得到二分類負(fù)樣本集,標(biāo)簽τbinary為0。
(4)采用留出法將總樣本集劃分成訓(xùn)練集和驗(yàn)證集,采用Caffe 下的ResNet50 網(wǎng)絡(luò)為基礎(chǔ)進(jìn)行數(shù)據(jù)訓(xùn)練和驗(yàn)證。激活函數(shù)為ReLu,池化方法為Max pooling、Global Average pooling,優(yōu)化算法為SGD,損失函數(shù)采用SoftmaxWithLoss 函數(shù),其余訓(xùn)練參數(shù)(見表1)。
(5)將訓(xùn)練好的二分類模型部署到各臺抽油機(jī)的邊緣計(jì)算網(wǎng)關(guān)。
表1 二分類網(wǎng)絡(luò)訓(xùn)練參數(shù)
基于三元組損失的相似識別模型建立過程主要包括如下步驟:
(1)采用留出法將前述分類后的相似性樣本集劃分訓(xùn)練集和驗(yàn)證集,采用Caffe 下的ResNet50 網(wǎng)絡(luò)為基礎(chǔ)進(jìn)行訓(xùn)練和驗(yàn)證,激活函數(shù)為ReLu,池化方法為Max pooling、Global Average pooling,優(yōu)化算法為SGD,batch_size 為24。
(2)在全連接層后得到特征向量[4],引入L2NORM層求出L2 歸一化的單位特征向量。
(3)在L2NORM 層后引入三元組選擇層,從分類后的相似性樣本集中隨機(jī)選取類別p 并從中隨機(jī)選取l 個(gè)圖像作為原始示功圖錨點(diǎn)集合A,對A 內(nèi)的每一個(gè)錨點(diǎn),隨機(jī)選擇類別p 內(nèi)的樣本作為正樣本,隨機(jī)選擇除p 類外任意類別并從中隨機(jī)選取負(fù)樣本,得到三元組(),重復(fù)上述步驟得到三元組集合T=。
(4)在三元組選擇層之后引入三元組損失[5]層,損失函數(shù)為:
式中:α 表示三元組損失邊距值,+表示[]內(nèi)的值大于零的時(shí)候,取該值為損失,否則取損失為零。計(jì)算參數(shù)梯度并進(jìn)行反向傳播,更新網(wǎng)絡(luò)參數(shù)。
(5)將訓(xùn)練好的三元組相似識別模型部署到各臺抽油機(jī)的邊緣計(jì)算網(wǎng)關(guān)。
使用訓(xùn)練好的相似識別模型進(jìn)行抽油機(jī)故障檢測,采用數(shù)據(jù)融合的方式分析檢測結(jié)果,并由工藝專家標(biāo)定抽油機(jī)設(shè)備的標(biāo)準(zhǔn)庫與故障庫,對故障示功圖進(jìn)行實(shí)時(shí)診斷,流程(見圖1)步驟如下:
(1)對任一抽油機(jī)設(shè)備,由工藝專家標(biāo)定其標(biāo)準(zhǔn)示功圖庫與故障示功圖庫,輸入三元組相似識別模型轉(zhuǎn)換為標(biāo)準(zhǔn)與故障示功圖特征庫,并將故障信息記錄在油井信息庫中。
(2)實(shí)時(shí)采集抽油機(jī)示功圖數(shù)據(jù),過濾異常數(shù)據(jù)并進(jìn)行預(yù)處理生成示功圖。
(3)根據(jù)設(shè)備生產(chǎn)參數(shù)進(jìn)行預(yù)檢測,若出現(xiàn)示功圖最大、最小載荷變化超過基準(zhǔn)值,或是示功圖面積小于基準(zhǔn)面積的情況,直接判斷檢測到故障,計(jì)算特征向量并轉(zhuǎn)入步驟(5)。
(4)將實(shí)時(shí)示功圖與標(biāo)準(zhǔn)示功圖以疊加繪制樣本與樣本對的形式分別輸入二分類模型和三元組相似識別模型,得到分類標(biāo)簽τbinary和余弦相似度ξ+,ξ+超過標(biāo)定閾值Th 時(shí)對應(yīng)不相似標(biāo)簽τtriplet=0,否則對應(yīng)相似標(biāo)簽τtriplet=1,若τtriplet=τbinary=0 則判定檢測到故障。
(5)對檢測到故障的示功圖進(jìn)行故障檢索:查詢計(jì)算實(shí)時(shí)示功圖特征與各故障示功圖特征之間相似度ξ-,若ξ-均超過標(biāo)定閾值Th,表示檢測到新故障,需要標(biāo)定并更新故障庫,否則返回相似度最高的故障示功圖對應(yīng)的故障信息,進(jìn)行報(bào)警并通知現(xiàn)場人員采取措施。
本文選取某原油開采企業(yè)20 臺抽油機(jī)的示功圖原始數(shù)據(jù)進(jìn)行實(shí)驗(yàn),該企業(yè)油田環(huán)境復(fù)雜,抽油機(jī)出現(xiàn)供液不足、平衡塊過重等故障的概率較高。以2019 年6 月至2020 年7 月的數(shù)據(jù)構(gòu)建訓(xùn)練集、驗(yàn)證集及對照測試集,分析本文方法對抽油機(jī)故障的檢測與診斷作用。
選取2019 年6 月至2020 年6 月之間的示功圖數(shù)據(jù)進(jìn)行預(yù)處理,以示功圖圖形相似性為依據(jù),將示功圖樣本集劃分為42 個(gè)不同類別,選取其中34 個(gè)類別并采用增加隨機(jī)擾動的方法均衡樣本數(shù)量較少的類別,總樣本數(shù)為174 398 個(gè)。
采用前述方法選取樣本對進(jìn)行疊加繪制,構(gòu)建二分類樣本集,共計(jì)112 342 個(gè),其中正樣本集58 659個(gè),負(fù)樣本集53 683 個(gè)。劃分出10 000 張樣本作為驗(yàn)證集,其余作為訓(xùn)練集,輸入二分類網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練集和驗(yàn)證集損失率(見圖2(a))。在34 個(gè)類別的樣本中劃分出6 008 個(gè)作為驗(yàn)證集,其余168 390 個(gè)作為訓(xùn)練集,輸入基于三元組損失的相似識別網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練集和驗(yàn)證集損失率(見圖2(b))。
圖2 訓(xùn)練結(jié)果
圖3 對照測試集示例
表2 融合二分類和三元組的測試結(jié)果
以2020 年7 月的示功原始數(shù)據(jù)作為測試數(shù)據(jù)并進(jìn)行示功圖預(yù)處理,為驗(yàn)證模型的泛化能力,引入未用于訓(xùn)練的8 個(gè)圖形類別的示功圖樣本加入測試數(shù)據(jù),由工藝專家標(biāo)定各臺設(shè)備的標(biāo)準(zhǔn)示功圖庫與故障示功圖庫,生成基于三元組和二分類模型的對照測試集。兩個(gè)測試集樣本均為8 833 個(gè),圖3(a)、圖3(b)為對照測試集示例。
標(biāo)定生產(chǎn)參數(shù)預(yù)檢測的基準(zhǔn)值為標(biāo)準(zhǔn)值的65%,三元組相似識別閾值為0.95,輸入本文模型進(jìn)行測試,故障檢測準(zhǔn)確率及診斷結(jié)果示例(見表2、表3)。
由表2、表3 可知,本文方法能夠?qū)Τ橛蜋C(jī)井故障起到較好的檢測作用,并能在檢測到異常時(shí)檢索故障庫實(shí)現(xiàn)故障類型檢索與更新,可以幫助油田現(xiàn)場人員及時(shí)發(fā)現(xiàn)設(shè)備故障并采取措施,這對管控生產(chǎn)、穩(wěn)定產(chǎn)量具有十分重要的意義。
本文提出了一種基于相似識別的抽油機(jī)井故障檢測與診斷方法,融合二分類網(wǎng)絡(luò)和基于三元組損失的相似識別網(wǎng)絡(luò),檢測出與平穩(wěn)工況下的示功圖不相似的故障示功圖,減少了故障誤報(bào)與漏報(bào)。同時(shí),通過建立故障特征庫,在檢測到異常工況時(shí)能夠檢索故障特征庫實(shí)現(xiàn)故障類型診斷。實(shí)驗(yàn)結(jié)果表明,該方法能夠有效識別示功圖趨勢變化,檢測抽油機(jī)故障并診斷出故障類別,提供了一種抽油機(jī)井故障檢測與診斷的解決方案。