李興,朱蘇青,劉松林
(中國石化股份有限公司 江蘇油田分公司,江蘇 揚州 225009)
隨著油田生產信息化深入發(fā)展,生產現場管理在逐步向自動化、無人化的方式轉變,油水井生產參數監(jiān)測、視頻巡回檢查等手段得到了充分利用,并在生產現場管理中發(fā)揮越來越重要的作用。當前油田生產信息化系統(tǒng)對于現場抽油機設備的監(jiān)控存在以下問題: 設備監(jiān)控手段較少,僅有視頻或電參儀設備;抽油機故障初期產生的聲音異常,很難在中心控制室視頻巡查中發(fā)現和辨別,當通過視頻發(fā)現異常時,故障已嚴重化、事故化。在油井日常管理中發(fā)現抽油機出現故障前都會產生一些典型的預警聲音,如皮帶打滑時的嘯叫聲,平衡塊固定螺絲松動產生的撞擊聲,若超負荷運行時,電動機振動導致抽油機振動,游梁與橫梁連接部位脫落,或其他部件發(fā)生變形、損壞,平衡塊松動,造成的各種異常響聲等[1]。如果在故障初期及時發(fā)現和識別,可以防范小故障演化成大故障、更能避免機械事故的發(fā)生。
隨著人工智能、信號處理、智能信息處理等新技術的出現,開展抽油機故障音頻診斷及預警技術研究與應用,利用物聯網、機器學習、大數據分析等技術,推動油田的安全生產具有十分重要意義。
在抽油機合適位置安裝音頻智能采集器,對抽油機音頻進行智能分析研究,傳統(tǒng)的識別方法[2-3]普遍存在實現困難和識別精度不高難以達到工業(yè)現場要求的缺點。隨著近些年深度學習的發(fā)展,深度學習的卷積神經網絡在圖像識別處理中表現出了越來越高的準確度。本文將音頻數據轉換為特征圖像(語譜圖),利用深度學習的卷積神經網絡對圖像分類識別,從音頻信號中提取梅爾頻率倒譜系數(MFCC),將音頻信號轉換為語譜圖,通過深度卷積神經網絡提取圖像特征,應用遷移學習和知識蒸餾等多種學習方法,結合深度殘差網絡進行抽油機音頻故障分類。
通過研究音頻智能采集器在不同安裝位置所獲取的音頻數據,排除來自其他方向的干擾音頻信號,選擇監(jiān)測能表征抽油機工作狀態(tài)的聲音信號。
聲源定位系統(tǒng)主要包括: 麥克風陣列、多通道聲波信號同步采集儀(聲相儀)和聲波信號分析平臺。麥克風陣列分為規(guī)則幾何形狀和非常規(guī)陣列,通過麥克風陣列可以計算聲源的角度和距離,從而實現對聲源的跟蹤以及后續(xù)的聲音定向拾取。聲相儀使用高性能動態(tài)數據采集卡,可完成多通道大量數據的精確采集。聲波信號分析平臺處理聲波信號形成聲圖像,直觀顯示聲波定位信息。
某油田項目前期做了大量實驗,在抽油機多個部位安裝抽油機音頻智能采集器,但資金投入大,逐步簡化為帶有雙路麥克風的抽油機音頻智能采集器,具有很好的應用效果。
抽油機音頻采集技術所使用的前端硬件主要是音頻智能采集器,由電源模塊、拾音模塊和采音模塊組成,拾音模塊接收外部的聲音,降噪處理后傳輸至采音模塊,采用海思Hi3518E芯片作為該采集器的微控制單元(MCU),配置時鐘電路、存儲器、音頻接口、RJ-45接口、JTAG接口和RS-485接口,具有Micro SD卡擴展功能,音頻智能采集器通過采音模塊的RJ-45接口連接油田內網,將處理后的音頻數據傳輸至遠程數據庫服務器。雙路麥克風抽油機音頻智能采集器硬件架構如圖1所示。
Hi3518E芯片具有回音消除和自動增益功能,同時采用了低功耗工藝和內部的低功耗架構設計。
該采集器的拾音模塊的前置放大電路的主芯片采用TL971,具有較低噪聲和較高共模抑制比。對于較遠距離傳來的音頻信號使用較大放大倍數,對于近處音頻信號使用較小放大倍數,以防止削峰失真。當輸入信號較弱時,呈線性放大趨勢,增益較大;當輸入信號強時,增益隨著輸入信號的增強而減小。
拾音模塊的有源帶通濾波器采用兩個Sallen-Key 結構的二階有源帶通濾波器串聯構成,優(yōu)點是可以通過內部增益來改變品質因子,而不改變中心頻率,缺點是品質因子和增益不能獨立調節(jié)。
利用Hi3518E芯片自帶的回音消除模塊(AEC)消除回音,無需外接回音消除芯片,可以更好地控制成本。自動增益模塊(AGC)通過反饋控制直放站的增益來控制輸出電平,當聲音輸入音量有大小變化時,能將輸出音量控制在比較一致的范圍內。
音頻識別算法的主要過程[4-5]包括: 音頻輸入、預處理、特征提取、模型匹配、輸出結果。預處理主要是分割音頻數據,即打點切分音頻。音頻切分完成后,將切分得到的各音頻片段加以分類,使之后的音頻處理有據可循。
語譜圖和MFCC[6]是音頻識別中常用的特征類型。
3.1.1語譜圖
語譜圖[7]是一種頻率隨時間變化的三維圖譜,它通過二維平面圖來表達三維圖譜信息,其縱坐標為頻率,橫坐標為時間,時間和頻率所對應的像素點的值可以反映出相應時刻和頻率的能量。語譜圖也是一種可查看信號特性的二維平面圖,可以查看到聲源點的共振特性與聲音在自然界的特點。顏色深淺反映了語譜圖所表示聲紋幅度的大小,幅度越大顏色越深。
3.1.2梅爾頻率倒譜系數
MFCC基于人類聽覺特性的特征,主要應用于語音識別等領域的音頻數據特征提取與運算維度的降低。由于人耳感知的聲音高低與聲音的頻率成非線性關系,而與聲音頻率的對數成線性相關,因此提出與赫茲頻率成非線性對應關系的梅爾頻率。
3.1.3音頻處理
3.1.3.1 音頻處理流程
結合MFCC和語譜圖特征的音頻處理流程,如圖2所示。首先對音頻信號進行預加重、分幀處理與加窗操作,然后將每一個短時分析窗經過快速傅里葉變換(FFT)得出相應的頻譜;將該頻譜經過梅爾濾波器組得出梅爾頻譜,再做倒譜分析;對其取對數,逆變換處理,一般采用 離散余弦變換(DCT)來實現[8-9]。
圖2 音頻處理流程示意
音頻處理流程[8-9]是在標準語譜圖的實現過程中,將能量密度譜處理環(huán)節(jié)用梅爾濾波器組、對數運算和DCT變換代替。
3.1.3.2 音頻處理主要步驟
音頻處理的主要步驟如下:
1)音頻信號分幀。整體上看,抽油機音頻信號的特性及能表示其本質特性的參數都是隨時間變化的,其過程在長時間范圍內是非平穩(wěn)態(tài)的,通常用來處理平穩(wěn)音頻信號的數字信號處理技術對其并不適用。然而,由于不同的抽油機音頻是由抽油機部件運動產生的,而部件運動相對于音頻來說是非常緩慢的,所以在一個短時間范圍內的抽油機音頻信號特性基本不變,也就是“短時”相對穩(wěn)定,因而可以將其看作是一個準穩(wěn)態(tài)過程,即抽油機音頻信號具有“短時”平穩(wěn)性。在“短時”的基礎上,對抽油機的音頻信號進行分幀分析和處理,如圖3所示。
圖3 信號分幀處理示意
傅里葉變換要求有平穩(wěn)的輸入信號,它既要保證足夠短且平穩(wěn)的幀內信號,又要保證足夠多的信號周期,只有重復足夠多次才能分析頻率。
2)加窗處理。音頻信號分幀后對每一幀加一個“窗函數”,以獲得較好的旁瓣下降幅度。窗函數公式如式(1)所示:
(1)
式中:w(n)——樣本索引n處的窗口系數;0.54——抵消期限;0.46——縮放項;N——窗口長度。
音頻信號加窗處理原理如圖4所示。加窗即信號與一個“窗函數”相乘,加窗是為了讓一幀信號的幅度在兩端逐漸變到0,使其在此時間長度內為周期信號,滿足了FFT變換處理的周期性要求,減少頻譜泄漏。
圖4 音頻信號加窗處理示意
3)FFT變換。對分幀加窗后的各幀信號進行FFT變換得到各幀的頻譜,并對音頻信號的頻譜取模平方得到音頻信號的功率譜,從而得到頻譜上的能量分布。頻譜能量分布如圖5所示。
圖5 頻譜能量分布示意
由圖5看出該幀音頻信號在0.490 kHz和0.585 kHz附近的能量比較強?!鞍j”是連接圖中小峰峰頂的平滑曲線。“包絡”上的峰叫共振峰,4個共振峰,分別在0.5 kHz,1.7 kHz,2.45 kHz,3.8 kHz附近,共振峰代表了音頻的種類。
4)MFCC提取。將FFT變換處理后的音頻信號功率譜,通過梅爾濾波器將每個濾波器中的能量相加。再取所有濾波器組能量的對數,經DCT變換后得到MFCC。
第二天,紫云來了,她還在打自己的小算盤,催促蔣浩德結婚,也好搬進蔣家,名正言順地照顧老人。蔣浩德開始疏遠她,給她交了個底:“紫云啊,你還是趁早找個人吧!我是不長久的?!?/p>
5)生成語譜圖。映射MFCC的頻率幅值,通過量化的方式,0表示白,255表示黑色,幅值越大,相應的區(qū)域越黑,映射后得到語譜圖如圖6所示。語譜圖表達了時間、頻率和聲音級功率(LW)三個維度信息。
圖6 映射后得到的語譜圖示意
目前國內音頻識別領域的應用算法以循環(huán)神經網絡(RNN)為主,而圖像領域專注卷積神經網絡(CNN)。借鑒圖像識別在近些年的成果,以及語音與圖像在模型訓練上的共通性,成功的將深層卷積神經網絡技術應用于該項目領域的抽油機音頻識別研究。
算法研究的第一個關鍵點是采用更深層次的神經網絡。從ImageNet 競賽和谷歌的研究可以看出,更深的卷積網絡層級,能提取更為抽象的特征,進而在逐漸增多的數據中,學習到更多的知識。
算法研究的第二個關鍵點是在少量標簽上,提高學習效果。相對于圖像識別擁有的巨大訓練數據量,語音識別領域的一個很大的困難就是訓練數據不足。如何盡可能充分利用少量的標簽數據,是模型成功的關鍵。但是如果標簽過少,將無法達到好的泛化效果。
對于音頻識別采用以下幾種方式:
1)深度殘差網絡。傳統(tǒng)的深度學習網絡,當網絡深度足夠深時,會出現深度越深學習率越低的情況。深度殘差網絡作為一種卷積神經網絡的變化形式,借鑒了高速網絡的跨層鏈接思想,具有跳躍式的結構,該網絡的設計[10],解決了網絡深度加深使學習率變低的問題,有效提升了準確率,解決了網絡退化問題,也帶來了更為豐富全面的信息或維度(特征值)作為參考?;谠摼W絡,系統(tǒng)可以學習到更加豐富、全面的信息。
2)特征抽取。先將殘差網絡在ImageNet的有標注數據集上預訓練,預訓練模型內部包括多個殘差塊,接著刪除最頂層的分類層,把中間的輸出層作為特征抽取模塊。
3)模型訓練。模型訓練時,用遷移學習提高模型的泛化能力和穩(wěn)定性。先將殘差網絡在ImageNet 的有標注數據集上預訓練,以該預訓練參數作為初始參數進行遷移學習,可使模型獲得一定與圖像相關的先驗知識。
該項目在現場錄取了近6.0×103條特征音頻數據,并在相鄰區(qū)塊112口井推廣應用,實現了抽油機音頻信號的實時采集與傳輸,通過抽油機故障音頻實時診斷技術,實現了設備故障處理的實時響應。
抽油機音頻數據采集流程如圖7所示,該采集器安裝在靠近抽油機電機的位置,通過無線接入點(AP)與交換機連接,井場的監(jiān)控球機也與交換機連接,交換機利用光纖收發(fā)器接入油田內網的光纖鏈路,油田管理區(qū)通過音頻數據轉儲軟件,將抽油機音頻信息存儲至中國石化勘探開發(fā)業(yè)務協同平臺(EPBP)的MongoDB數據庫服務器,由音頻診斷程序進行診斷,并輸出診斷結果,由用戶查詢程序查看結果。
圖7 抽油機音頻數據采集流程示意
通過該音頻智能采集器生成語譜圖的三個維度信息可用于分析設備故障原因。從像素的灰度值大小反映相應時刻和相應頻率的信號能量,顏色越深表示該點的語音能量越強。
4.2.1電機正常運行語譜圖
電機正常啟動過程中,聲音隨轉速的頻率增大而變大,特征頻率點隨著時間,形成向上的弧線。在停電機過程中,隨著轉動變慢,對應的特征頻率點,隨著時間降低形成向下的弧線。電機啟停正常運行聲音語譜圖如圖8所示。
圖8 電機啟停正常運行聲音語譜示意
4.2.2皮帶打滑語譜圖
皮帶相對于機械部位,相對頻率較高,皮帶發(fā)出的聲音對應于1~4 kHz間的波紋,間隔約1 s出現雙扇形紋。皮帶打滑語譜圖如圖9所示。
圖9 皮帶打滑語譜圖示意
4.2.3壓杠松語譜圖
壓杠松動造成的撞擊聲音,從低頻到高頻都有,對應于圖形上一個短時間的柱狀條,間隔約1 s出現柱狀干擾。壓杠松語譜圖如圖10所示。
圖10 壓杠松語譜圖示意
4.2.4電機軸承干磨語譜圖
干磨的獨特聲音,對應于柵欄狀的紋理,密集出現柱狀干擾,但強度低。電機軸承干磨語譜圖如圖11所示。
圖11 電機軸承干磨語譜圖示意
4.2.5支架松語譜圖
支架松動導致的故障聲音,也是類似柵欄狀,但是和干磨的周期、頻率范圍不同,形成密集出現柱狀,強度高的另一種柵欄狀語譜圖。支架松語譜圖如圖12所示。
圖12 支架松語譜圖示意
本文使用語譜圖技術,把音頻轉為視頻圖像,用圖像領域的深度卷積網絡來處理音頻數據。通過深度殘差網絡模型有效地對信息完整性做了保護,網絡深度加深導致的學習率變低問題得以有效解決。在項目實現過程中,基于遷移學習,復用預訓練的復雜網絡,提高了模型穩(wěn)定性,在小樣本數據集上,也能得到高準確率、高穩(wěn)定性的結果。