席 慧,鄭 陽,安宇晨,游仕豪,陳 盛,陳啟卷
(武漢大學動力與機械學院,武漢430072)
水電機組在電網(wǎng)中負責調(diào)峰調(diào)頻任務,機組出力范圍朝著0~100%方向發(fā)展,由于水輪機自身水力特性的影響,不同型號水輪機普遍存在部分負荷區(qū)間運行時振動強烈的現(xiàn)象[1,2],機組長期處于振動強烈區(qū)域運行,會導致結構部件損壞,因此,研究機組運行振動區(qū)的需求十分迫切[3,4]。
傳統(tǒng)的振動區(qū)劃分方法是通過若干個特征水頭工況下的穩(wěn)定性試驗,采用國家或行業(yè)標準中的限值作為振動區(qū)劃分的絕對閾值。翟曉陽等[5]通過樂灘水電站4 號機組穩(wěn)定性試驗,分析試驗結果,實現(xiàn)機組運行振動區(qū)劃分。夏琳等[6]通過某水電廠機組的變負荷試驗,分析機組在不同水頭下不同部位的振動、擺度、壓力脈動,將機組的運行區(qū)劃分為低負荷區(qū)、強渦帶工況區(qū)、穩(wěn)定運行區(qū)等3個區(qū)域。
近年來隨著信號分析方法的發(fā)展,國內(nèi)外許多學者將時頻分析方法應用到振動區(qū)劃分,陳國青等[7]提出將振動信號灰度矩值作為表征振動信號強弱的特征值,并以實際數(shù)據(jù)對云南某電廠水電機組振動區(qū)劃分。樊玉林等[8]通過短時傅里葉變換對水輪機升負荷過程的水導擺度信號進行分析,根據(jù)渦帶頻率隨負荷的變化規(guī)律劃分運行工況區(qū)。隨著工業(yè)大數(shù)據(jù)時代來臨,機組在線狀態(tài)監(jiān)測系統(tǒng)數(shù)據(jù)被應用到振動區(qū)劃分,婁強等[9]提出一種基于機組在線監(jiān)測數(shù)據(jù)、輔以穩(wěn)定性試驗分析的運行區(qū)精細劃分方法,較傳統(tǒng)的劃分方法在渦帶區(qū)邊界、識別渦帶區(qū)范圍等方面有優(yōu)勢。嚴耀亮等[10]對水布埡電廠4臺機組狀態(tài)監(jiān)測系統(tǒng)采集的海量數(shù)據(jù)進行挖掘、整理和分析,對機組運行區(qū)提出規(guī)劃建議。在線狀態(tài)監(jiān)測系統(tǒng)數(shù)據(jù)具有種類豐富、數(shù)據(jù)量大的特點,而絕大多數(shù)穩(wěn)定性參數(shù)測點峰峰值沒有超過國標限值,數(shù)據(jù)處理過程會浪費大量時間精力,如何快速有效獲取機組狀態(tài)數(shù)據(jù)信息顯得尤為重要。
本文針對在線狀態(tài)監(jiān)測系統(tǒng)海量數(shù)據(jù)信息的快速有效挖掘問題,通過穩(wěn)定性參數(shù)超標次數(shù)統(tǒng)計的方法篩選能夠反映機組穩(wěn)定性狀態(tài)的關鍵測點,將在線狀態(tài)監(jiān)測系統(tǒng)中各工況區(qū)間穩(wěn)定運行數(shù)據(jù)作為樣本,構建基于極限學習機分類器的機組振動區(qū)劃分模型,研究基于數(shù)據(jù)挖掘和ELM 的水電機組振動區(qū)劃分方法。
基于數(shù)據(jù)驅動和ELM 的水電機組振動區(qū)劃分模型,首先通過數(shù)據(jù)庫獲取在線狀態(tài)監(jiān)測系統(tǒng)的海量數(shù)據(jù)中全工況區(qū)間數(shù)據(jù),廣泛統(tǒng)計各穩(wěn)定性參數(shù)測點峰峰值超出國家或行業(yè)標準限值的次數(shù),并根據(jù)各測點越限頻次選取能夠真實反映機組運行狀態(tài)的穩(wěn)定性參數(shù)測點。進一步,以篩選的穩(wěn)定性參數(shù)測點峰峰值和工況量為特征向量集,構建基于ELM 分類器的機組運行狀態(tài)判別模型,最終實現(xiàn)機組全工況區(qū)間振動區(qū)劃分。
水電機組是結構復雜、部件繁多的非線性系統(tǒng),在線狀態(tài)監(jiān)測系統(tǒng)實時對機組運行過程中各方面數(shù)據(jù)和信息進行采集和存儲,其數(shù)據(jù)種類豐富。傳統(tǒng)的水電機組振動區(qū)劃分以機組幾個特征水頭下的變負荷試驗數(shù)據(jù)為數(shù)據(jù)來源,本文考慮將在線狀態(tài)監(jiān)測系統(tǒng)數(shù)據(jù)作為數(shù)據(jù)來源,不僅包括了變負荷試驗數(shù)據(jù),而且還包括機組日常發(fā)電運行數(shù)據(jù)。但是在線狀態(tài)監(jiān)測系統(tǒng)中穩(wěn)定性參數(shù)測點較多,需要根據(jù)機組實際運行情況,篩選能夠明顯反映機組運行狀態(tài)的測點。
本文以浙江省某電廠混流式機組為研究對象,機組單機容量為55 MW,額定轉速200 r/min,設計水頭69.0 m,最大水頭85 m,最小水頭60.5 m。該水電廠搭建了振動區(qū)劃分數(shù)據(jù)庫,對在線狀態(tài)監(jiān)測系統(tǒng)中穩(wěn)定性參數(shù)測點峰峰值和工況量以數(shù)據(jù)表的形式進行存儲。數(shù)據(jù)庫自2018年12月投入運行以來,已經(jīng)累計存儲機組穩(wěn)定負荷運行數(shù)據(jù)1 821 730條,剔除其中由于數(shù)據(jù)庫安裝調(diào)試、傳感器損壞和通信中斷等原因導致的錯誤數(shù)據(jù),最終可以用來振動區(qū)劃分的數(shù)據(jù)為1 568 902條。本文對各穩(wěn)定性參數(shù)測點峰峰值超過國家或行業(yè)中規(guī)定限值的次數(shù)進行統(tǒng)計,各測點超標次數(shù)進行排序如表1 所示。從表1 可知,穩(wěn)定性參數(shù)測點超標次數(shù)超過10 000 次的測點有水導X向擺度、定子機架垂直振動、頂蓋X向水平振動、頂蓋Y向水平振動等四個測點,其他測點超標次數(shù)與以上4 個測點超標次數(shù)相比數(shù)量明顯較少,可以忽略不計,因此,本文將以上4 個測點峰峰值作為表征機組運行穩(wěn)定性狀態(tài)的特征和振動區(qū)劃分數(shù)據(jù)來源。
表1 測點超標次數(shù)排序表Tab.1 Ranking table of the number of outliers of test points
極限學習機(Extreme Learning Machine-ELM)是一種學習速率快且泛化性能強的高效預測智能算法[11]。ELM 是由輸入層、隱含層和輸出層組成的經(jīng)典單隱層前饋神經(jīng)網(wǎng)絡模型[12,13],極限學習機的網(wǎng)絡結構如圖1 所示,隨機選取輸入層權重和隱藏層偏置,輸出層權重通過最小化由訓練誤差項和輸出層權重范數(shù)的正則項構成的損失函數(shù),依據(jù)Moore-Penrose(MP)廣義逆矩陣理論計算解析求出[14]。
圖1 極限學習機網(wǎng)絡結構圖Fig.1 Extreme learning machine network structure diagram
極限學習機算法具體原理如下:對于有N個訓練樣本(xi,yi),xi=[xi1,xi2,…,xin]T?Rn和yi=[yi1,yi2,…,yin]T?Rm分別為樣本輸入數(shù)據(jù)和輸出數(shù)據(jù)。對于一個有L個隱層神經(jīng)節(jié)點數(shù),激勵函數(shù)為g(x)的極限學習機表達式為[15]:
式中:βi為輸出權重;wi=[wi1,wi2,…,win]T為輸入權重;bi為第i層隱含節(jié)點閾值。
極限學習機的目的是使輸出誤差最小,即通過最小化近似平方差的方法對連接隱藏層和輸出層的權重(β)進行求解,目標函數(shù)如下:
式中:H是隱藏層的輸出矩陣;T是訓練數(shù)據(jù)的目標矩陣。
通過線代和矩陣論的知識可推導得公式(3)的最優(yōu)解為:
式中:H+為矩陣H的Moore-Penrose廣義逆矩陣。
這時問題就轉化為求計算矩陣H的Moore-Penrose廣義逆矩陣,該問題主要的幾種方法有正交投影法、正交化法、迭代法和奇異值分解法(SVD)。當HTH為非奇異(可逆)時可使用正交投影法,這時可得計算結果是:
采用美國西儲大學軸承數(shù)據(jù)中心的數(shù)據(jù)驗證ELM 分類器的可靠性,實驗平臺中驅動端軸承型號為6205-2RSJEMSKF 深溝球軸承,采樣頻率為12 kHz,通過電火花加工技術設置軸承不同的單點故障,振動信號由放置在軸承座上方的加速度傳感器采集,驅動端軸承數(shù)據(jù)類型包括正常數(shù)據(jù)、內(nèi)圈故障數(shù)據(jù)、外圈故障數(shù)據(jù)和滾動體故障數(shù)據(jù)[16]。
本文選取負荷為1 470 W、電機轉速為1 730 r/min、采樣頻率為12 kHz、故障直徑為0533 4 mm、故障深度為0.279 4 mm時,以上四種運行狀態(tài)驅動端軸承振動波形數(shù)據(jù),將其振動峰峰值數(shù)據(jù)作為ELM 算法輸入數(shù)據(jù),4 種運行狀態(tài)標簽作為ELM算法輸出數(shù)據(jù)。對ELM 算法中隱層神經(jīng)元節(jié)點數(shù)設置為20個,4 種狀態(tài)分別隨機抽取100 組峰峰值數(shù)據(jù)作為樣本數(shù)據(jù),將400組樣本數(shù)據(jù),按照訓練集數(shù)目:測試集數(shù)目=6∶4比例隨機分配,模型訓練30次。以第15次訓練結果為例,本次ELM 算法訓練集準確率和測試集準確率分別為0.987 5和0.981 2,表2為每種狀態(tài)40個不同樣本的故障識別結果,從表中可知軸承正常狀態(tài)和內(nèi)圈故障狀態(tài)的識別率達到了100%,外圈故障狀態(tài)有一個樣本沒有被正確識別,識別率為97.5%,滾動體故障狀態(tài)有兩個樣本沒有被正確識別,識別率為95%,整體平均識別率為98.12%。
表2 ELM算法故障識別結果Tab.2 ELM Algorithm fault identification results
ELM 分類器進行30 次獨立實驗,經(jīng)數(shù)據(jù)統(tǒng)計后,測試集最大準確率為0.993 8,最小準確率為0.975 0,平均準確率為0.985 0。因此,將ELM 分類器應用到測點峰峰值故障數(shù)據(jù)分類識別中可信度較高。
水電機組是一個水機電耦合的系統(tǒng),在不同水頭和不同負荷區(qū)間內(nèi)運行時,機組穩(wěn)定性表現(xiàn)不同,因此,極限學習機的特征向量集除了能夠反映機組穩(wěn)定性的測點峰峰值數(shù)據(jù)以外,還應包括機組運行水頭和負荷。本文對23 個穩(wěn)定性參數(shù)測點峰峰值數(shù)據(jù)清理、篩選和統(tǒng)計后,將水導X向擺度、定子機架Z向振動、頂蓋X向水平振動、頂蓋Y向水平振動峰峰值用來反映機組振動穩(wěn)定性,將以上六種特征量作為ELM 分類器的輸入特征向量集,輸出標簽為機組穩(wěn)定性狀態(tài),模型示意圖如圖2所示。
圖2 基于數(shù)據(jù)驅動和ELM的水電機組振動區(qū)劃分模型示意圖Fig.2 Schematic diagram of data-driven and ELM-based vibration zoning model for hydropower units
機組穩(wěn)定性狀態(tài)通過4 個穩(wěn)定性參數(shù)超標測點數(shù)目反映,當沒有測點超標時,機組運行工況區(qū)間為“建議運行區(qū)”;當有一個測點超標時,機組運行工況區(qū)間為“限制運行區(qū)”;當有兩個及以上測點超標時,機組運行工況區(qū)間為“規(guī)避運行區(qū)”。樣本數(shù)據(jù)包括訓練集樣本數(shù)據(jù)和測試集樣本數(shù)據(jù),其中訓練集樣本特征量為機組各個工況區(qū)間穩(wěn)定運行時隨機選取相同數(shù)量數(shù)據(jù),訓練集樣本標簽為訓練集樣本中穩(wěn)定性參數(shù)測點超標數(shù)目,即機組穩(wěn)定性狀態(tài);測試集樣本特征量為數(shù)據(jù)庫中機組各個工況區(qū)間最近運行數(shù)據(jù),測試集樣本期望輸出為測試集中穩(wěn)定性參數(shù)測點超標數(shù)目。
采用ELM 分類器對訓練集樣本特征量和標簽進行分類訓練,當訓練集準確率達到90%以上時訓練完成,然后將測試集樣本特征量作為ELM 分類器輸入,對測試集樣本進行分類,輸出結果為各工況區(qū)間機組穩(wěn)定性狀態(tài),根據(jù)輸出結果劃出機組振動區(qū)基于數(shù)據(jù)挖掘和ELM 的水電機組振動區(qū)劃分模型流程圖,如圖3所示。
圖3 基于數(shù)據(jù)驅動和ELM的水電機組振動區(qū)劃分建模流程圖Fig.3 Flow chart of data-driven and ELM-based model for vibration zoning of hydropower units
2.2.1 樣本數(shù)據(jù)選取
通過數(shù)據(jù)庫隨機選取機組在不同工況區(qū)間內(nèi)相同數(shù)量數(shù)據(jù),ELM 分類器特征向量集包括水頭、負荷、水導X向擺度峰峰值、定子機架Z向振動峰峰值、頂蓋X向水平振動峰峰值和頂蓋Y向水平振動峰峰值共6 個向量,樣本覆蓋不同水頭和負荷的454 個工況區(qū)間,覆蓋工況區(qū)間如圖4 所示。訓練集樣本為每個工況區(qū)間隨機選取5 條數(shù)據(jù),其中部分工況區(qū)間數(shù)據(jù)小于兩條則不考慮該工況區(qū)間,訓練集樣本數(shù)據(jù)共有2 022 條,訓練集標簽為機組穩(wěn)定運行狀態(tài)。測試集樣本為每個工況區(qū)間內(nèi)一條最近運行數(shù)據(jù),所有測試集樣本數(shù)據(jù)共有454條數(shù)據(jù)。
圖4 樣本覆蓋工況區(qū)間Fig.4 Sample covering operating range
2.2.2 模型訓練
基于數(shù)據(jù)驅動和ELM 的水電機組振動區(qū)劃分模型,對訓練集樣本進行分類訓練時,需要設定ELM 分類器的隱含層神經(jīng)元個數(shù),構建了隱層神經(jīng)元節(jié)點個數(shù)為1~100 的ELM 分類器,然后對每個分類器對訓練集樣本訓練50次,分別計算不同神經(jīng)元數(shù)目的訓練模型準確率的平均值,訓練集和測試集平均準確率如圖5 所示。從圖5 中可知訓練集準確度隨隱層神經(jīng)元節(jié)點數(shù)目的增加先增大后基本保持不變,當隱層神經(jīng)元節(jié)點數(shù)目大于20 個時,訓練集準確率大于90%,符合模型搭建的需要,因此,本文將ELM算法的隱層神經(jīng)元節(jié)點個數(shù)設置為20。
圖5 不同數(shù)目隱層神經(jīng)元節(jié)點準確度Fig.5 Accuracy of hidden layer neurons with different number of nodes
對隱層神經(jīng)元節(jié)點數(shù)目為20 個的ELM 分類器進行100 次獨立實驗,準確率如表3 所示。從圖表中可知,經(jīng)過100 次獨立實驗后,訓練集平均準確度為93.71%,測試集平均準確度為90.63%。
表3 100次獨立實驗準確率 %Tab.3 100 independent experiments
2.2.3 振動區(qū)劃分
傳統(tǒng)的振動區(qū)劃分方法通過變負荷試驗,采用國家或行業(yè)標準規(guī)定的限制值劃分振動區(qū),該電站機組在2017年完成增容改造后,在低、中、高3 個水頭區(qū)間分別選取一個特征水頭進行變負荷試驗,振動區(qū)劃分結果如圖6所示。圖中綠色區(qū)域為“建議運行區(qū)”,表示機組在該工況區(qū)間內(nèi)運行穩(wěn)定性狀態(tài)良好;黃色區(qū)域為“限制運行區(qū)”,表示機組在該工況區(qū)間內(nèi)運行穩(wěn)定性狀態(tài)一般;紅色區(qū)域為“規(guī)避運行區(qū)”,表示機組在該工況區(qū)間內(nèi)運行穩(wěn)定性狀態(tài)較差。從圖中可知傳統(tǒng)的振動區(qū)劃分結果較為粗糙,覆蓋工況區(qū)間有限,不能對機組全工況運行區(qū)進行劃分。
圖6 基于變負荷試驗的振動區(qū)劃分結果Fig.6 Results of vibration zoning based on variable load test
將在線狀態(tài)監(jiān)測系統(tǒng)中機組所有穩(wěn)定運行數(shù)據(jù),按照國家或行業(yè)標準規(guī)定的限值劃分振動區(qū)結果,如圖7 所示,對比圖6可知,將在線監(jiān)測系統(tǒng)數(shù)據(jù)應用到振動區(qū)劃分中,覆蓋工況區(qū)間更廣,劃分結果較為細致。
圖7 基于在線監(jiān)測系統(tǒng)的振動區(qū)劃分結果Fig.7 Results of vibration zoning based on on-line monitoring system
將測試集樣本通過ELM 模型反復進行100 次實驗,選取測試集準確率最高的輸出作為機組各個工況區(qū)間穩(wěn)定性狀態(tài)分類結果,如圖8 所示。對比圖6 和圖7 可知,該方法較傳統(tǒng)變負荷試驗的振動區(qū)劃分結果覆蓋工況區(qū)間更廣,與基于在線監(jiān)測系統(tǒng)數(shù)據(jù)的振動區(qū)劃分結果基本一致。該方法對在線監(jiān)測系統(tǒng)數(shù)據(jù)進行初步篩選后,最終應用于振動區(qū)劃分模型實現(xiàn)的數(shù)據(jù)量僅為在線監(jiān)測系統(tǒng)數(shù)據(jù)量的0.2%,因此該方法具有較高的運算效率。
圖8 基于數(shù)據(jù)驅動和ELM的振動區(qū)劃分結果Fig.8 Results of vibration zoning based on data-driven and ELM
本文構建了基于數(shù)據(jù)驅動和ELM 的水電機組振動區(qū)劃分模型,對機組在線狀態(tài)監(jiān)測系統(tǒng)數(shù)據(jù),通過數(shù)據(jù)庫隨機篩選全工況區(qū)間數(shù)據(jù),獲取用于表征機組穩(wěn)定性狀態(tài)的測點有效數(shù)據(jù),通過訓練集樣本對振動區(qū)劃分模型進行分類訓練,根據(jù)測試集樣本判別機組目前在各工況區(qū)間的穩(wěn)定性狀態(tài),實現(xiàn)機組振動區(qū)的精確劃分。實際應用表明,基于數(shù)據(jù)驅動和ELM 的水電機組振動區(qū)劃分方法可以高效快速利用海量在線監(jiān)測系統(tǒng)數(shù)據(jù),劃分結果可靠性高,對指導電廠安全穩(wěn)定運行具有重要意義。 □