国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多尺度特征融合的光伏電站故障診斷

2022-05-19 13:31:46那峙雄來廣志張長志
計算機工程與應(yīng)用 2022年10期
關(guān)鍵詞:尺度故障診斷卷積

那峙雄,孫 濤,來廣志,王 棟,張長志

1.國網(wǎng)電子商務(wù)有限公司,北京 100053 2.國網(wǎng)天津市電力公司 電力科學(xué)研究院,天津 300220

太陽能是一種清潔、可再生的能源,在我國新能源發(fā)展戰(zhàn)略中占有重要地位,而光伏發(fā)電是目前利用太陽能最廣泛、最有效的方式。分布式光伏電站是光伏發(fā)電的一種基礎(chǔ)設(shè)施,特指在用戶場地附近建設(shè),運行方式為用戶側(cè)自發(fā)自用、多余電量上網(wǎng)的光伏發(fā)電設(shè)施。分布式光伏電站能夠有效緩解局部用電緊張的狀況,并且滿足無噪聲、無污染的要求。但隨著分布式光伏發(fā)電設(shè)備部署規(guī)模的發(fā)展,其運維難度也顯著增大。以某分布式光伏發(fā)電站為例,該電站年發(fā)電量約為220萬千瓦時,光伏設(shè)備眾多,設(shè)備位置分散,所處環(huán)境多變,對其進行人工巡檢效率低,成本高,出現(xiàn)故障后難以及時發(fā)現(xiàn),嚴重影響光伏電站的正常運行。因此,自動化的光伏設(shè)備故障診斷算法具有極高的研究和應(yīng)用價值。

目前的故障診斷算法可以分為基于設(shè)備電氣特性和基于機器學(xué)習(xí)兩大類?;谠O(shè)備電氣特性的算法依賴于特定的、準確的電氣數(shù)據(jù)進行數(shù)學(xué)建模,而獲得這些數(shù)據(jù)需要復(fù)雜的硬件支持以及人力維護,因此難以在實際生產(chǎn)中廣泛應(yīng)用?;跈C器學(xué)習(xí)的診斷算法能夠從不同類型的輸入數(shù)據(jù)中挖掘故障設(shè)備的特征,并且能夠容忍數(shù)據(jù)輸入的噪聲。但是目前的故障診斷算法研究都采用了設(shè)備之間沒有差異、不同日期的天氣條件沒有差異的假設(shè)。這個假設(shè)只適用于集中式光伏電站,而分布式光伏電站中,設(shè)備的設(shè)置地點、放置角度、投入使用時間等都存在著較大差異。另外,已有的機器學(xué)習(xí)算法往往只能利用交流電流、交流電壓、直流電流、直流電壓四項數(shù)據(jù),而實際監(jiān)測數(shù)據(jù)中往往包含十多項條目,其中蘊含大量信息可以挖掘利用。

針對已有算法的問題,本文首先提出了一種矯正設(shè)備因素差異、天氣條件差異的數(shù)據(jù)規(guī)范化方法。通過同一日期內(nèi)所有設(shè)備的運行情況衡量當天的天氣條件,計算天氣條件矯正因子;通過同一設(shè)備的歷史運行情況衡量該設(shè)備的健康狀況,計算設(shè)備矯正因子。借助這兩個矯正因子,將監(jiān)測數(shù)據(jù)的絕對數(shù)值轉(zhuǎn)化為相對數(shù)值,從而減弱設(shè)備、天氣差異對故障診斷的影響。在此基礎(chǔ)上,本文提出了一種基于多尺度時序特征的故障診斷深度學(xué)習(xí)模型。首先,針對分布式光伏電站監(jiān)測數(shù)據(jù)數(shù)值波動大、噪點多的數(shù)據(jù)特點,模型通過多尺度鄰域特征提取單元實現(xiàn)平滑輸入、消除噪點的效果,同時又避免了平滑過度、信息丟失的問題;然后,使用帶有注意力機制的長短時記憶單元(long short-term memory,LSTM)[1]提取序列特征,以應(yīng)對監(jiān)測數(shù)據(jù)序列長、維度高的特點;最后,使用度量學(xué)習(xí)的方法訓(xùn)練模型,增強模型的辨別能力,提高對難樣本的診斷效果。

本文的研究成果可以概括為以下三點:

(1)針對分布式光伏電站設(shè)備差異較大、天氣條件差異較大的問題,提出了一種矯正差異的數(shù)據(jù)規(guī)范化方法。

(2)針對分布式光伏電站監(jiān)測數(shù)據(jù)數(shù)值波動大、噪點多的特點,提出了融合多時序尺度特征的故障診斷模型。

(3)針對分布式光伏電站故障樣本數(shù)量不均衡的問題,遷移使用了一種度量學(xué)習(xí)的損失函數(shù)進行輔助訓(xùn)練,進一步提升模型辨別能力。

本文在某分布式光伏電站的實際監(jiān)測數(shù)據(jù)上對提出的數(shù)據(jù)規(guī)范化算法、故障診斷模型進行了實驗,證明了其在實際應(yīng)用場景下的有效性。

1 相關(guān)工作

1.1 光伏設(shè)備故障診斷算法

光伏設(shè)備的I-V曲線體現(xiàn)了光伏設(shè)備的輸出特性,能夠反映設(shè)備的故障情況[2-3],是經(jīng)常用于故障診斷的電氣特性。Liu[4]和Ding等[5]對熱斑組件I-V曲線進行建模,借助曲線的特征對光伏陣列健康狀態(tài)進行定量評估。Liu等[6]提出等效電路法,利用伏安特性進行故障診斷,通過光伏陣列等效電路模型中串聯(lián)等效電路來判斷系統(tǒng)中是否存在故障組件。由于實際應(yīng)用場景中難以獲得精確的I-V曲線,這類算法很難達到理想的效果。

光伏電站不間斷產(chǎn)生的大量監(jiān)測數(shù)據(jù)為基于機器學(xué)習(xí)和深度學(xué)習(xí)的故障診斷算法提供了很好的支持。Lin等[7]和Ye等[8]分別采用支持向量機和級聯(lián)隨機森林模型對監(jiān)測數(shù)據(jù)進行分類來實現(xiàn)故障診斷。Zhu[9]和Lu[10]將聚類算法應(yīng)用到光伏故障檢測上,先將光伏設(shè)備根據(jù)其環(huán)境特征進行聚類,然后比較同一類中的設(shè)備,從而篩選出故障設(shè)備。除了傳統(tǒng)機器學(xué)習(xí)算法外,深度學(xué)習(xí)模型也被應(yīng)用到該領(lǐng)域內(nèi)。Zhang等[11]采用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和雙向門控循環(huán)單元(bidirectional gate recurrent unit,biGRU)的雙分支結(jié)構(gòu)處理電站監(jiān)測數(shù)據(jù),雙分支各自提取不同的特征,最后拼接形成整體特征用于故障檢測。Wu等[12]使用經(jīng)驗?zāi)B(tài)分解算法和CNN對時間序列進行分類,從而得到診斷結(jié)果。基于機器學(xué)習(xí)和深度學(xué)習(xí)的故障檢測算法不需要對設(shè)備電氣特性進行分析,可以直接作用在監(jiān)測數(shù)據(jù)上并產(chǎn)生診斷結(jié)果,有較強的抗干擾能力。

1.2 時序特征提取

傳統(tǒng)的時序特征提取算法主要是通過分析時序數(shù)據(jù)的波形來提取特征。Baydogan等[13]提出了時間序列特征包(time series bag of features,TSBF)算法,使用特征袋(bag of features,BoF)集成來自時間序列各部分的局部信息,將各個序列片段的特征組成整個時序數(shù)據(jù)的特征包。Keogh等[14]提出了Shaplets的概念,僅將時間序列中最易區(qū)分的特征提取出來,拼接形成序列特征,從而減弱噪聲的干擾。基于Shaplets的算法大都沒有考慮更高維度的特征,因此在處理長序列或多維數(shù)的數(shù)據(jù)時效果都不盡人意。

循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)是常見的處理序列數(shù)據(jù)的深度學(xué)習(xí)模型,而LSTM是RNN的一個變種,其門控機制能夠有效避免RNN在處理長序列輸入時的梯度消失或梯度爆炸的問題。在循環(huán)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,Sutskever等[15]提出了編碼器-解碼器(encoder-decoder)模型,實現(xiàn)了序列輸入到序列輸出的轉(zhuǎn)換;Bahdanau等[16]提出了注意力機制來解決編碼器和解碼器之間的信息損失問題,使得網(wǎng)絡(luò)能夠自適應(yīng)地關(guān)注序列的局部信息。

1.3 度量學(xué)習(xí)方法

度量學(xué)習(xí)(metric learning)是樣本特征之間的距離學(xué)習(xí),目標是同類樣本的特征盡可能相似,而類間的特征距離盡可能遠。Liu[17]、Wang[18]、Deng[19]等的一些系列研究將全連接層權(quán)重視作各個類別的中心特征,從而將softmax分類損失轉(zhuǎn)化為特征向量與中心特征之間余弦距離損失。Song等[20]將行人重識別問題視為行人特征差向量的二分類問題,并采用馬氏距離優(yōu)化樣本特征的相似性。

除了直接優(yōu)化距離損失函數(shù)的方式外,還可以通過正負樣本對比的方式實現(xiàn)度量學(xué)習(xí)。Hadsell等[21]設(shè)計了對比損失函數(shù),通過歐式距離優(yōu)化所得特征。Schroff等[22]提出了三元組損失函數(shù),在網(wǎng)絡(luò)的每次迭代中選擇一組同類樣本、一組異類樣本進行訓(xùn)練,從而提升度量學(xué)習(xí)的效率。Feng等[23]在三元組損失函數(shù)的基礎(chǔ)上,為正樣本之間的距離設(shè)置了閾值,訓(xùn)練時過濾掉低于閾值的樣本,從而避免了過小的類內(nèi)距離導(dǎo)致網(wǎng)絡(luò)收斂緩慢的問題。

2 基于多尺度時序特征的故障檢測算法

2.1 光伏電站監(jiān)測數(shù)據(jù)規(guī)范化算法

受設(shè)備投入使用時間、所處位置等因素的影響,即使在相同的天氣條件下,兩組正常運行的設(shè)備都可能產(chǎn)生不同的數(shù)據(jù),如圖1所示。由于天氣變化、季節(jié)更替的影響,即使相同的設(shè)備,在不同日期正常運行時產(chǎn)生的數(shù)據(jù)也可能不同,如圖2所示。

圖1 不同設(shè)備同一日期的交流功率曲線Fig.1 AC power curve of different equipments on same date

圖2 同一設(shè)備不同日期的交流功率曲線Fig.2 AC power curve of same equipment on different dates

這種現(xiàn)象會給故障診斷帶來很大的困難。設(shè)備安裝位置較差、投入使用時間較長或者當天的天氣條件較差都會造成較低發(fā)電量,但這些情況不應(yīng)當被診斷為設(shè)備故障。相反,一臺設(shè)備某天的發(fā)電量監(jiān)測數(shù)據(jù)在正常范圍內(nèi),但其可能仍發(fā)生了故障,只是其安裝位置、天氣條件較為優(yōu)越,即使存在故障,仍可以達到發(fā)電量的平均水平。因此,僅僅根據(jù)單獨一臺設(shè)備在某個日期產(chǎn)生的監(jiān)測數(shù)據(jù)對其進行診斷很容易造成誤判。

針對這個問題,本文設(shè)計了一種可以消除不同設(shè)備、不同天氣等差異帶來的影響的數(shù)據(jù)規(guī)范化算法,其流程如圖3所示。該算法利用設(shè)備之間的橫向?qū)Ρ瘸C正設(shè)備差異,利用日期之間的縱向?qū)Ρ瘸C正天氣因素差異,從而消除設(shè)備、天氣等因素的影響。算法將同一設(shè)備不同日期的監(jiān)測數(shù)據(jù)平均值作為日期矯正因子,將不同設(shè)備同一日期的監(jiān)測數(shù)據(jù)平均值作為設(shè)備校正因子。通過計算實際監(jiān)測數(shù)據(jù)與這兩個校正因子的比值關(guān)系,將監(jiān)測數(shù)據(jù)轉(zhuǎn)化為相對數(shù)值。該相對數(shù)值是設(shè)備之間對比、日期之間對比的量化結(jié)果,從而修正了監(jiān)測數(shù)據(jù)中設(shè)備差異、天氣差異等因素帶來的固有偏差。

圖3 數(shù)據(jù)規(guī)范化算法流程Fig.3 Data normalization algorithm workflow

以發(fā)電量這一項數(shù)據(jù)為例來說明,用wi,j,k表示第i天第j組設(shè)備在當天第k個時刻監(jiān)測到的發(fā)電量數(shù)據(jù)。計算當天各個時刻發(fā)電量的平均值wˉi,j來衡量第i天第j組設(shè)備的發(fā)電量水平,即:其中,K表示每天記錄數(shù)據(jù)的時刻數(shù)。這個數(shù)值是同時受設(shè)備因素和天氣條件因素干擾的,需要綜合設(shè)備歷史運行情況和其他設(shè)備當天運行情況對其矯正。用第i天中所有設(shè)備發(fā)電量的平均值′作為日期因素的矯正因子,用第j組設(shè)備在所有日期下發(fā)電量的平均值作為設(shè)備因素的矯正因子,即:

其中,I表示有數(shù)據(jù)記錄的日期數(shù),J表示設(shè)備數(shù)。通過這兩個矯正因子,可以計算不受日期差異和設(shè)備差異影響的時序數(shù)據(jù)即:

對其他數(shù)據(jù)項也做相同的處理,隨后拼接起來形成二維張量F∈RK×N,其中N表示所有數(shù)據(jù)項維度之和。

本方法并沒有從局部的數(shù)值特征入手,而是將設(shè)備固有的發(fā)電水平、不同日期的發(fā)電條件等因素考慮進來,通過橫、縱向?qū)Ρ鹊姆椒?,將各項監(jiān)控數(shù)據(jù)轉(zhuǎn)化為相對數(shù)值關(guān)系,從而使得監(jiān)測數(shù)據(jù)中的異常更容易被分析挖掘。在轉(zhuǎn)化為相對數(shù)值的過程中,可能存在少量信息的損失,對整個診斷系統(tǒng)的靈敏性造成影響。但實際監(jiān)測數(shù)據(jù)包含的項目眾多且采樣頻繁,一定程度的信息損失并不會對診斷系統(tǒng)造成太大的干擾。

2.2 故障診斷網(wǎng)絡(luò)

總體上,本模型采用多尺度特征提取模塊輔助LSTM提取序列特征的設(shè)計,整體結(jié)構(gòu)如圖4所示。多尺度卷積能夠通過不同尺度鄰域內(nèi)的加權(quán)求和運算平滑輸入,過濾噪點,從而降低后續(xù)網(wǎng)絡(luò)的學(xué)習(xí)難度。而帶有注意力機制的LSTM可以處理長序列、高維度的輸入數(shù)據(jù),能夠提取出時序數(shù)據(jù)中的特征。網(wǎng)絡(luò)的訓(xùn)練過程中,除了常規(guī)的分類監(jiān)督,還使用了度量學(xué)習(xí)的損失函數(shù),從而進一步增強模型的辨別能力,提升其對難樣本的診斷效果。

圖4 融合多尺度時序特征的故障檢測算法流程Fig.4 Workflow of fault diagnosis algorithm based on multi-scale time serial features fusion

2.2.1 多尺度鄰域特征提取模塊

卷積神經(jīng)網(wǎng)絡(luò)最初是應(yīng)用在圖像領(lǐng)域中的模型,但其局部特征提取的思想同樣可以應(yīng)用到時序數(shù)據(jù)分析中。一個卷積核大小為3的時序卷積結(jié)構(gòu)如圖5所示,對于時序數(shù)據(jù)輸入,卷積核以滑動窗口的形式沿時間維度移動,并輸出每個時序片段內(nèi)數(shù)據(jù)的加權(quán)和。每個卷積單元堆疊了多個卷積核從而輸出多維特征。大卷積核會從大尺度時序鄰域內(nèi)提取特征,其中鄰域內(nèi)每項數(shù)值產(chǎn)生的影響更小,從而減弱輸入數(shù)據(jù)的波動,減輕其中噪點對輸出特征的影響。但大尺度卷積核減弱了數(shù)值變化的差異,容易導(dǎo)致平滑過度的問題,使得輸出特征失去判別能力。與之相對的,小尺度卷積核能夠較好地保留輸入數(shù)據(jù)中的信息,但是也更容易受到其中噪點的干擾??紤]到不同尺度卷積的特點,組合使用不同大小的卷積單元提取不同時序尺度的特征。然后采用特征拼接的方式完成特征融合,從而得到多尺度鄰域特征。通過這種方式,輸出的特征既包含了平滑后的特征,也保存了原始輸入的特征。在模型的訓(xùn)練過程中,后續(xù)的網(wǎng)絡(luò)結(jié)構(gòu)可以學(xué)習(xí)分析這兩種特征,從而在一定程度上實現(xiàn)了平滑輸入數(shù)據(jù)并且避免信息丟失。

圖5 時序卷積單元Fig.5 Time series convolution unit

本文使用卷積核分別為3、5、7的三種時序卷積組成多尺度時序特征提取單元。時序卷積C由卷積層、批歸一化層(batch normalization,BN)、修正線性單元(rectified linear unit,ReLU)組成,其運算可以表示為:

其中,x和h分別表示時序卷積單元的輸入和輸出;W和b分別表示卷積核內(nèi)可訓(xùn)練的權(quán)重和偏移;?表示卷積操作;BN(·)表示批歸一化層,能夠使網(wǎng)絡(luò)訓(xùn)練更加穩(wěn)定、迅速;ReLU(·)表示激活函數(shù),使得模型能夠擬合非線性映射,同時避免梯度消失的問題。多尺度時序特征提取單元M可表示為:

其中,C1×k表示卷積核為1×k的卷積單元,x和y分別表示輸入和輸出。cat(·)表示特征拼接操作,即將維數(shù)分別為d1、d2和d3的向量,拼接成d1+d2+d3維的向量。將特征直接相加或使用最大池化也可以實現(xiàn)特征融合,但這兩種方式都會帶來信息損失。

2.2.2 時間特征提取模塊

光伏電站監(jiān)測數(shù)據(jù)有序列長、維度高的特點,因此時間特征提取模塊需要具備較強的表征能力和特征提取能力。為此,本模型采用了兩層LSTM組成的“編碼器-解碼器”(encoder-decoder)結(jié)構(gòu)來實現(xiàn),可表示如下:

其中,x1,x2,…,x K和y1,y2,…,y K分別表示時間特征提取模塊的輸入與輸出;K表示序列長度;c表示編碼器最后一次迭代的輸出向量。從上式中可以看出,編碼器到解碼器之間的信息傳遞都通過向量c實現(xiàn),其中不可避免地存在信息損失。

為了解決這個問題,在二者之間增加了注意力機制,從而由網(wǎng)絡(luò)自主學(xué)習(xí)哪部分信息可以丟棄,哪部分信息需要關(guān)注。添加注意力機制的網(wǎng)絡(luò)結(jié)構(gòu)可以描述為:

其中,h i表示編碼器第i次迭代的輸出;ci表示第i次迭代的上下文信息,其計算方式為:

其中,attention()表示注意力機制網(wǎng)絡(luò),由一層全連接網(wǎng)絡(luò)實現(xiàn);αij表示第i次迭代時h j的權(quán)重;計算c1時使用零向量作為c0。

2.2.3 損失函數(shù)

最后的特征分類由兩層全連接網(wǎng)絡(luò)實現(xiàn),接收LSTM最后一次迭代的輸出向量,經(jīng)線性運算后得到一個P+1維的向量y,其中P表示故障類別數(shù)。在進行診斷時,向量y通過softmax函數(shù)后得到預(yù)測q,其每一維可作為對應(yīng)類別的概率,其中概率最大的類別作為最終的診斷結(jié)果。在進行訓(xùn)練時,使用了度量學(xué)習(xí)和分類監(jiān)督兩種損失函數(shù),分別作用在第一、二層全連接網(wǎng)絡(luò)的輸出上,如圖4所示。

分類監(jiān)督使用的是加權(quán)交叉熵損失函數(shù)。因為實際應(yīng)用中的監(jiān)測數(shù)據(jù)往往存在類別不均衡的問題,即大部分樣本都是正常運行時的監(jiān)測數(shù)據(jù),只有少部分是故障樣本。如果使用一般的交叉熵損失函數(shù)進行訓(xùn)練,模型會忽略故障樣本,傾向于將所有樣本都診斷為正常樣本,這樣模型也可以取得較高的診斷準確率,但存在故障診斷召回率低的問題。所以需要對不同類別的損失進行加權(quán),給數(shù)量較少的故障樣本設(shè)置較高的權(quán)重。權(quán)重的計算方式為:

其中,wl表示類別l的權(quán)重;nl表示類別l的樣本總數(shù)。則用于訓(xùn)練的加權(quán)交叉熵損失可表示為:

其中,M表示訓(xùn)練樣本總數(shù);p i表示樣本的標簽,即樣本i屬于第pi類故障狀態(tài);y(i)表示第i個樣本輸入時模型最后一層全連接層的輸出,表示取向量y(i)的第j項數(shù)值。

模型的度量學(xué)習(xí)監(jiān)督是將ArcFace損失函數(shù)遷移到故障檢測任務(wù)上實現(xiàn)的。首先為各個故障類別維護中心特征矩陣W∈R(P+1)×D,其中D表示中心特征的維數(shù)。然后將常規(guī)的交叉熵損失函數(shù)拆解成樣本特征f與中心特征的向量積的形式:

其中,p i表示樣本的標簽;W j表示第j類的中心特征;f(i)表示第i個樣本的特征,在本模型中即為第一層全連接層的輸出向量。又因為向量余弦距離可以定義為:

當固定中心特征W的模長為1,樣本特征f的模長為s時,交叉熵損失可以進一步轉(zhuǎn)換為:

在這個形式下,交叉熵損失函數(shù)可以視作中心特征和樣本特征夾角的損失函數(shù)。為了著重優(yōu)化這個角度,增加對其的懲罰項m,最終度量學(xué)習(xí)的損失函數(shù)形式為:

最終用于訓(xùn)練模型的損失函數(shù)Lfinal為:

其中,λ是度量損失函數(shù)的權(quán)重,實驗中設(shè)置為0.5,表示以分類損失為主,度量學(xué)習(xí)起輔助作用。

2.2.4 模型訓(xùn)練設(shè)置

網(wǎng)絡(luò)訓(xùn)練采用Adam優(yōu)化算法[24],如算法1所示。該算法使用滑動平均的方式估計梯度的一階矩m和二階矩v。然后將梯度的一階矩視作動量,減弱了鞍點對訓(xùn)練的影響;將梯度的二階矩作為梯度的修正因子,增強優(yōu)化的穩(wěn)定性。模型訓(xùn)練的初始學(xué)習(xí)率為0.001,訓(xùn)練共進行20周次,分別在第10、15周次將學(xué)習(xí)率衰減為原來的1/10。

3 實驗驗證

3.1 實驗數(shù)據(jù)集

實驗所使用的數(shù)據(jù)集來自某分布式光伏發(fā)電站2018年的監(jiān)測數(shù)據(jù)。其中有效數(shù)據(jù)包含了352天內(nèi)對34個設(shè)備組串的發(fā)電量、溫度、交流端數(shù)據(jù)、直流端數(shù)據(jù)的記錄,具體的數(shù)據(jù)項如表1所示。各項數(shù)據(jù)不間斷地每15 min記錄一次,但在沒有陽光的時段中,監(jiān)測數(shù)據(jù)沒有實際意義且存在大量缺失,因此這里只采用了5:00到21:00之間的64次記錄。

表1 監(jiān)測數(shù)據(jù)項目說明Table 1 Monitoring data description

常見的光伏設(shè)備故障可分為四類,分別是光伏板遮擋故障、逆變器運行故障、逆變器短路故障和電壓數(shù)值異常故障,這也是實驗中進行診斷的故障類別。光伏板遮擋故障是由于雜物遮擋光伏板,導(dǎo)致光照面積減小,表現(xiàn)為逆變器電流明顯減?。荒孀兤鬟\行故障往往表現(xiàn)為輸出端三相不平衡、電流異常或者電壓較大;逆變器短路故障一般會導(dǎo)致輸出端交流電流顯著增大;電壓數(shù)值異常故障表現(xiàn)為輸出端三相阻抗數(shù)值異常,導(dǎo)致三相電壓偏高。在實驗數(shù)據(jù)集中,四種類別的故障樣本以及正常樣本數(shù)量如表2所示。實驗中隨機地將這些樣本按照4∶1的比例劃分成訓(xùn)練集和測試集。

表2 各類別樣本數(shù)量Table 2 Number of samples in each category

3.2 實驗環(huán)境及評估指標

實驗基礎(chǔ)硬件平臺為一臺搭載了Intel Xeon E5處理器、Nvidia GTX 1080ti顯卡的服務(wù)器。采用Pytorch深度學(xué)習(xí)框架實現(xiàn)本文提出的模型(以下簡稱Multi-Conv+LSTM)。

實驗中使用故障診斷準確率(accuracy)作為主要的評估指標,即診斷正確的樣本占全部測試樣本的比率。為了更全面地說明MultiConv+LSTM模型的診斷效果,還使用了精確率(precision)、召回率(recall)以及F1得分三個更精細的評估指標。這三個評估指標的定義是由二分類任務(wù)拓展而來的??紤]多分類任務(wù)中的一個類別,將屬于該類別的樣本稱為正樣本,不屬于該類別的樣本稱為負樣本。再將被預(yù)測正確的正樣本數(shù)量記為TP(true positive),被預(yù)測正確的負樣本數(shù)量記為TN(true negative),被預(yù)測錯誤的正樣本數(shù)量記為FN(false negative),被預(yù)測錯誤的負樣本數(shù)量記為FP(false positive)。在此基礎(chǔ)上,以上評估指標可用下式進行計算:

3.3 實驗結(jié)果分析

3.3.1 數(shù)據(jù)規(guī)范化算法對比

在實驗過程中,分別在原始數(shù)據(jù)和規(guī)范化后的數(shù)據(jù)上訓(xùn)練了MultiConv+LSTM模型,實驗結(jié)果如表3所示。可以看出使用數(shù)據(jù)規(guī)范化后,故障診斷準確率有了大幅提升。在原始數(shù)據(jù)上,單條記錄的數(shù)值大小對于故障診斷沒有意義,模型只能挖掘出三相不平衡、直流串間不平衡這類癥狀,而漏檢、錯檢大量樣本。數(shù)據(jù)規(guī)范化算法將絕對數(shù)值轉(zhuǎn)換為相對大小,使模型可以利用數(shù)據(jù)的絕對數(shù)值大小進行故障診斷。

將檢測數(shù)據(jù)轉(zhuǎn)化為相對數(shù)值的做法能夠使異常數(shù)據(jù)更明顯地暴露出來,也能夠降低數(shù)據(jù)對于天氣、設(shè)備差異等因素的敏感性。圖6展示了數(shù)據(jù)集中兩個逆變器五月份每天平均交流功率的原始數(shù)據(jù)和矯正后數(shù)據(jù)。逆變器1在5月24日產(chǎn)生故障,交流功率明顯下降。但在原始數(shù)據(jù)上,其數(shù)值大小仍然與逆變器2接近,這導(dǎo)致模型無法診斷出逆變器1發(fā)生了故障;而在矯正后的數(shù)據(jù)上,通過設(shè)備矯正因子的影響,逆變器1交流功率的下降十分明顯地表現(xiàn)出來,從而易于模型進行診斷。另外,5月5日到5月9日,兩臺逆變器的發(fā)電量都相對較低,從單個逆變器發(fā)電量上看,容易將其誤判為發(fā)生了故障。但同時考慮這兩臺逆變器的數(shù)據(jù),就能發(fā)現(xiàn)這段時間的低發(fā)電量更有可能是天氣原因?qū)е碌?。通過算法矯正后,數(shù)據(jù)在這段時間的波動被平滑到了相對較小的范圍內(nèi),能夠明顯地與異常數(shù)據(jù)的波動區(qū)別開。因此,提出的矯正算法能夠有效降低故障診斷對無關(guān)條件的敏感性,從而增強診斷效果的穩(wěn)定性。

圖6 數(shù)據(jù)規(guī)范化算法暴露異常數(shù)據(jù)的效果Fig.6 Effect of exposing abnormal data of data normalization method

3.3.2 時序分析算法對比

在規(guī)范化后的數(shù)據(jù)集上對傳統(tǒng)算法LearningShapelet算法[25]、K最近鄰算法(K-nearest neighbors,KNN),以及深度學(xué)習(xí)算法LSTM模型、全卷積神經(jīng)網(wǎng)絡(luò)(fully convolution network,F(xiàn)CN)模型[26-27]和biGRU+CNN進行了實驗。為了保證對比的公平性,所有深度學(xué)習(xí)方法都使用相同的訓(xùn)練設(shè)置,只使用加權(quán)交叉熵函數(shù)作為損失函數(shù)。

在本實驗中,所有算法都在規(guī)范化后的數(shù)據(jù)上進行訓(xùn)練和測試。表4對比了MultiConv+LSTM與其他時序數(shù)據(jù)分析算法的故障診斷準確率。可以看出深度學(xué)習(xí)算法整體領(lǐng)先于傳統(tǒng)算法,可以體現(xiàn)出深度學(xué)習(xí)算法在有大規(guī)模數(shù)據(jù)支持時的優(yōu)越性。在深度學(xué)習(xí)算法中,LSTM和FCN分別代表兩種基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。LSTM是經(jīng)典的循環(huán)網(wǎng)絡(luò)結(jié)構(gòu),將數(shù)據(jù)按次序進行一輪迭代處理后輸出特征;FCN則由卷積神經(jīng)單元逐層組成,每層網(wǎng)絡(luò)只提取特征的局部信息,多層網(wǎng)絡(luò)疊加后才能得到最終特征。單獨使用這兩種網(wǎng)絡(luò)分別可以達到91.12%和92.76%的診斷準確率。而biGRU+CNN和Multi-Conv+LSTM都組合使用了這兩種基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu),并且都在診斷準確率上有一定的提升。biGRU+CNN采用了雙分支的并行結(jié)構(gòu),意味著兩個分支都需要學(xué)習(xí)原始數(shù)據(jù)到高層特征的映射,并沒有實現(xiàn)兩種結(jié)構(gòu)的互補。而MultiConv+LSTM單分支串聯(lián)起兩種網(wǎng)絡(luò),較淺的卷積單元設(shè)計用于平滑數(shù)據(jù),提取鄰域特征,而后續(xù)的LSTM從處理后的數(shù)據(jù)中提取高層特征。從結(jié)果上看,MultiConv+LSTM也取得了一定的優(yōu)勢。另外,加上度量學(xué)習(xí)損失函數(shù)后,診斷準確率進一步提升了1.26個百分點。

表4 各算法故障診斷準確率對比Table 4 Comparison on fault diagnosis accuracy of different algorithms

另外,使用精確率、召回率和F1得分三個指標評估MultiConv+LSTM模型的結(jié)果如表5所示。受各類樣本數(shù)量不均衡的影響,模型對于正常運行類別的樣本能夠達到較高的精確率和召回率,而逆變器運行故障和逆變器短路故障這兩類的召回率相對較低。但總體上,MultiConv+LSTM仍然達到了不錯的效果。

表5 MultiConv+LSTM的其他指標評估Table 5 Evaluations on other metrics of MultiConv+LSTM

3.3.3 多尺度特征提取對比實驗

表6展示了組合不同尺度卷積單元時的故障診斷準確率。表中卷積單元數(shù)量為1時,網(wǎng)絡(luò)結(jié)構(gòu)就是沒有使用多尺度特征提取機制的普通卷積單元。使用尺度為3的卷積時,診斷準確率為92.74%,而尺度為3、5的多尺度卷積使準確率提升至95.6%;尺度為5的普通卷積和尺度為5、7的多尺度卷積也有明顯的準確率提升。從中可以看出,組合卷積單元進行多尺度特征提取能夠有效提升模型的診斷準確率。另外,尺度為3的卷積核在本模型中起到了重要作用,只使用尺度為5、7的卷積核時,模型的表現(xiàn)甚至低于LSTM,說明大尺度卷積核確實存在信息丟失的問題,也證明了多尺度特征提取的必要性。

表6 不同尺度卷積組合的準確率對比Table 6 Comparison on accuracy of different scale combinations of convolutional units

從表6中可以看出,卷積單元數(shù)量為3,卷積尺度為3、5、7時,算法效果最佳。而將卷積單元數(shù)量增加到5時,診斷準確率有所下降,原因是5組卷積特征拼接得到的多尺度特征維數(shù)過高,給LSTM的訓(xùn)練增加了負擔(dān)。

3.3.4 加權(quán)損失函數(shù)對模型訓(xùn)練的影響

本實驗探究了加權(quán)交叉熵損失函數(shù)對診斷模型的作用。分別使用了加權(quán)交叉熵損失函數(shù)與常規(guī)交叉熵損失對模型進行了訓(xùn)練,實驗結(jié)果如圖7所示。因為訓(xùn)練數(shù)據(jù)中大部分為正常運行樣本,少部分為故障樣本,所以使用不帶權(quán)重的交叉熵損失函數(shù)訓(xùn)練時,網(wǎng)絡(luò)傾向于將樣本預(yù)測為正常運行。這個問題不會體現(xiàn)在故障診斷準確率上,但對故障樣本的召回率有很大影響。加權(quán)交叉熵損失函數(shù)為數(shù)量較少的樣本加上較大的權(quán)重,從而產(chǎn)生較大的梯度,使得這些樣本能夠?qū)?shù)的學(xué)習(xí)產(chǎn)生更大的影響。從圖7可以看出,加權(quán)交叉熵損失函數(shù)能夠有效提升故障類別的召回率。

圖7 加權(quán)交叉熵損失對故障診斷召回率的提升Fig.7 Recall of fault diagnosis w/o weighted cross entropy loss

4 總結(jié)

本文提出了一種基于多尺度時序特征的光伏系統(tǒng)故障診斷模型,實現(xiàn)了對正常運行設(shè)備、光伏板遮擋故障、逆變器運行故障、逆變器短路故障和電壓數(shù)值異常故障這五種狀態(tài)的精準診斷。本文設(shè)計了數(shù)據(jù)規(guī)范化算法,以矯正設(shè)備差異、天氣差異給故障診斷帶來的影響;設(shè)計了多尺度鄰域特征提取模塊,以解決光伏電站監(jiān)測數(shù)據(jù)波動大、噪點多的問題。實驗結(jié)果證明了本文提出的數(shù)據(jù)規(guī)范化算法的有效性,也表明了MultiConv+LSTM模型已經(jīng)足夠滿足實際應(yīng)用場景的要求。

基于本文的研究仍有一些方向值得探索。一方面,可以考慮細化故障的分類,實現(xiàn)更具體的故障診斷;另一方面,可以考慮在故障樣本數(shù)量有限的情況下,進一步提升模型對故障樣本的召回率。

猜你喜歡
尺度故障診斷卷積
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
財產(chǎn)的五大尺度和五重應(yīng)對
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于傅里葉域卷積表示的目標跟蹤算法
宇宙的尺度
太空探索(2016年5期)2016-07-12 15:17:55
因果圖定性分析法及其在故障診斷中的應(yīng)用
9
一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法
基于LCD和排列熵的滾動軸承故障診斷
基于WPD-HHT的滾動軸承故障診斷
機械與電子(2014年1期)2014-02-28 02:07:31
肥乡县| 云梦县| 南华县| 丹凤县| 琼结县| 从化市| 化隆| 永定县| 和田县| 白山市| 平顶山市| 安平县| 新建县| 长宁县| 资中县| 当雄县| 麻阳| 福海县| 五常市| 沧州市| 陵水| 镇雄县| 长沙县| 遂溪县| 平阴县| 黎城县| 洱源县| 宿州市| 绥江县| 舟山市| 梧州市| 高邑县| 南川市| 曲周县| 胶南市| 洛南县| 金华市| 婺源县| 乐昌市| 老河口市| 汕头市|