曲曉峰 苗東旭 王樹(shù)新 王振羽 甄宏 劉爍
摘 要:蓄能設(shè)備是發(fā)電廠削峰填谷的重要手段之一。針對(duì)發(fā)電廠蓄能設(shè)備故障種類和原因復(fù)雜,提出一種基于運(yùn)行數(shù)據(jù)和機(jī)器學(xué)習(xí)方法的蓄能設(shè)備故障預(yù)測(cè)方法。該方法以管理系統(tǒng)監(jiān)控的歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)為基礎(chǔ),首先對(duì)數(shù)據(jù)集進(jìn)行特征提取和充放電周期識(shí)別,然后建立隨機(jī)森林分類器,訓(xùn)練分類器模型參數(shù),以實(shí)現(xiàn)蓄能設(shè)備運(yùn)行過(guò)程中是否存在故障以及故障類別的預(yù)測(cè)。在實(shí)際運(yùn)行數(shù)據(jù)中驗(yàn)證了所提方法能夠在故障發(fā)生的早期有效識(shí)別故障類型。
關(guān)鍵詞: 蓄能設(shè)備;故障預(yù)測(cè);機(jī)器學(xué)習(xí);支持向量機(jī)
【Abstract】 Energy storage equipment is one of the key devices for peak cutting in a power station. Aiming at the complex types and causes of energy storage device faults in power station, a fault assessment method based on profile data and machine learning method is proposed. In order to predict the faults and their types in the operation of energy storage equipment, based on profile historical data and real-time data, the feature extraction and charge-discharge cycle identification of profile data sets are carried out first. Then a support vector machine classifier is established and trained to obtain the model parameters. The results on the actual operation data of energy storage device verify that the proposed method can effectively identify the fault type in the early stage of fault occurrence.
【Key words】 ?energy storage device; fault prediction; machine learning; support vector machine
0 引 言
蓄能設(shè)備的管理與診斷是蓄能設(shè)備應(yīng)用技術(shù)中的核心之一,及時(shí)、準(zhǔn)確地診斷蓄能設(shè)備故障、保證蓄能設(shè)備容量的準(zhǔn)確估計(jì),可以延長(zhǎng)蓄能設(shè)備使用壽命、提高蓄能設(shè)備一致性及可靠性[1]。在產(chǎn)生嚴(yán)重的故障之前,微小緩變故障往往提早發(fā)生,并一步一步演變?yōu)閲?yán)重故障,因此,及時(shí)檢測(cè)出早期緩變故障對(duì)于能源管理與維護(hù)有著重要的現(xiàn)實(shí)意義??紤]到蓄能設(shè)備診斷的故障現(xiàn)象、故障原因及故障機(jī)理的復(fù)雜性和模糊性,難以借助確定的數(shù)學(xué)模型來(lái)描述,也難以借助確定性的特殊判據(jù)來(lái)診斷。在安全評(píng)估方法中,模糊理論、人工神經(jīng)網(wǎng)絡(luò)、基因遺傳算法等方法被廣泛應(yīng)用[2]。但是,由于微小緩變故障相比于嚴(yán)重故障信號(hào)特征不明顯,淺層的機(jī)器學(xué)習(xí)算法和一般的統(tǒng)計(jì)方法辨識(shí)這些故障十分困難[3]。
故障定義為系統(tǒng)由于出現(xiàn)至少一個(gè)或多個(gè)參數(shù)、特性低于正常指標(biāo),導(dǎo)致了系統(tǒng)喪失正常使用功能的行為[4]。故障診斷是通過(guò)各種能夠檢查和測(cè)試的方法,指對(duì)發(fā)生不正常狀態(tài)的部位進(jìn)行診斷,查明其功能失調(diào)的原因,對(duì)系統(tǒng)出現(xiàn)的異常情況進(jìn)行判斷,確定故障的原因、類型、大小、位置和發(fā)生時(shí)間[5]。利用蓄能設(shè)備管理系統(tǒng)的監(jiān)測(cè)數(shù)據(jù)來(lái)及時(shí)對(duì)蓄能設(shè)備組的多種故障進(jìn)行預(yù)測(cè),達(dá)到目的檢測(cè)故障,提出設(shè)備事故預(yù)防措施是控制領(lǐng)域的研究熱點(diǎn)[6]。故障診斷技術(shù)的主要任務(wù)是能快速準(zhǔn)確地對(duì)故障做出評(píng)價(jià)和決策,系統(tǒng)能及時(shí)判斷故障的大小、位置和發(fā)生的時(shí)間。一般而言,故障檢測(cè)容易且耗時(shí)少,而故障診斷由于要判斷出系統(tǒng)發(fā)生故障的位置、時(shí)間原因等,而耗費(fèi)時(shí)間長(zhǎng)[7]。
現(xiàn)有技術(shù)中,專家系統(tǒng)是一種通過(guò)現(xiàn)有知識(shí)來(lái)推理實(shí)際問(wèn)題的程序,結(jié)合專家經(jīng)驗(yàn)和知識(shí)求解那些復(fù)雜問(wèn)題?,F(xiàn)有的方法建立在專家?guī)熘?,根?jù)輸入的故障信息結(jié)合相應(yīng)計(jì)算機(jī)算法進(jìn)行推理分類,完成故障診斷和決策,準(zhǔn)確度依賴于專家?guī)斓耐晟瞥潭龋葱枰罅康墓こ探?jīng)驗(yàn)知識(shí),存在專家系統(tǒng)中容錯(cuò)率低,對(duì)于不確定信息的診斷準(zhǔn)確率低、專家知識(shí)經(jīng)驗(yàn)獲取困難,以及維護(hù)難度大等問(wèn)題[8]。
神經(jīng)網(wǎng)絡(luò)主要是基于神經(jīng)元而建立的一種數(shù)學(xué)模型,輸入和輸出信息之間通過(guò)這些神經(jīng)元連接。神經(jīng)網(wǎng)絡(luò)模型由于其本身特性,對(duì)處理不確定性信息的診斷優(yōu)勢(shì)較大,但由于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要大量的樣本,大量的故障信息樣本數(shù)據(jù)難以獲得,通過(guò)結(jié)合模糊集理論或區(qū)域分區(qū)來(lái)減少樣本數(shù)據(jù)獲取的難度的研究還不夠深入,不能很好地適用于蓄能設(shè)備故障診斷系統(tǒng)[8]。
貝葉斯網(wǎng)絡(luò)將概率論和圖形理論相結(jié)合,用來(lái)推理和解決不確定性知識(shí),在電網(wǎng)故障診斷中處理不確定性信息診斷效果良好[9]?,F(xiàn)有研究中電網(wǎng)故障診斷關(guān)于貝葉斯網(wǎng)絡(luò)診斷方法的研究多結(jié)合粗糙集相關(guān)理論。貝葉斯網(wǎng)絡(luò)節(jié)點(diǎn)賦值需要統(tǒng)計(jì)分析或?qū)嶋H觀察確定,如何解決貝葉斯網(wǎng)絡(luò)在處理復(fù)雜情況下的建模、網(wǎng)絡(luò)訓(xùn)練等問(wèn)題仍然存在困難[10]。
借助系統(tǒng)的數(shù)學(xué)模型,利用一定的技術(shù)方法,讓系統(tǒng)產(chǎn)生殘差信號(hào),再利用生成的殘差信號(hào)應(yīng)用相應(yīng)的評(píng)價(jià)規(guī)則,或者直接讓其與給定閾值進(jìn)行比較,從而達(dá)到故障分類的目的。其中包括參數(shù)辨識(shí)法、狀態(tài)估計(jì)法和等價(jià)空間法,主要缺點(diǎn)是依賴于系統(tǒng)的數(shù)學(xué)模型,數(shù)學(xué)模型的精確程度將影響故障診斷的效果。而等價(jià)空間法的缺點(diǎn)是大部分只能在線性系統(tǒng)中得以運(yùn)用,因此在非線性系統(tǒng)中就難以發(fā)揮作用[10]。
有向圖法和故障樹(shù)法,實(shí)質(zhì)上就是利用故障種類和故障原因之間的因果邏輯關(guān)系對(duì)系統(tǒng)故障進(jìn)行分類。大型復(fù)雜系統(tǒng)的故障診斷時(shí),由于系統(tǒng)的故障種類繁多、故障相關(guān)性復(fù)雜等客觀原因,導(dǎo)致其故障診斷準(zhǔn)確性難以保證[11]。
本文針對(duì)早期緩變故障特征不明顯等特點(diǎn),以多種機(jī)器學(xué)習(xí)技術(shù)為核心,以數(shù)據(jù)驅(qū)動(dòng)方法為基礎(chǔ),利用數(shù)據(jù)采集管理系統(tǒng)采集的大量動(dòng)力蓄能設(shè)備運(yùn)行和EV工況數(shù)據(jù),通過(guò)逐層特征提取進(jìn)行安全評(píng)估。
1 數(shù)據(jù)集
本文采用實(shí)際運(yùn)行的數(shù)據(jù)采集管理系統(tǒng)采集的4組共3 470 191條有效數(shù)據(jù)為數(shù)據(jù)源,上述數(shù)據(jù)集具有如下特點(diǎn):
(1)19個(gè)國(guó)家標(biāo)準(zhǔn)報(bào)警分類:溫度差異報(bào)警,高溫報(bào)警,蓄能設(shè)備類型過(guò)壓報(bào)警,蓄能設(shè)備類型欠壓報(bào)警,SOC低報(bào)警,單體蓄能設(shè)備過(guò)壓報(bào)警,單體蓄能設(shè)備欠壓報(bào)警,SOC過(guò)高報(bào)警,SOC跳變報(bào)警,可充電蓄能系統(tǒng)不匹配報(bào)警,蓄能設(shè)備單體一致性差報(bào)警,絕緣報(bào)警,DC-DC溫度報(bào)警,制動(dòng)系統(tǒng)報(bào)警,DC-DC狀態(tài)報(bào)警,驅(qū)動(dòng)電機(jī)控制器溫度報(bào)警,高壓互鎖報(bào)警,驅(qū)動(dòng)電機(jī)溫度報(bào)警,蓄能設(shè)備類型過(guò)充。
(2)24個(gè)特征:設(shè)備狀態(tài),充電狀態(tài),運(yùn)行模式,車速,累計(jì)里程,總電壓,總電流,SOC,DC-DC狀態(tài),檔位,加速踏板行程值,制動(dòng)踏板狀態(tài),燃料蓄能設(shè)備電壓,最高電壓蓄能設(shè)備子系統(tǒng)號(hào),最高電壓蓄能設(shè)備單體代號(hào),蓄能設(shè)備單體電壓最高值,最低電壓蓄能設(shè)備子系統(tǒng)號(hào),最低電壓蓄能設(shè)備單體代號(hào),蓄能設(shè)備單體電壓最低值,最高溫度子系統(tǒng)號(hào),最高溫度探針序號(hào),最高溫度值,最低溫度子系統(tǒng)號(hào),最低溫度探針序號(hào)。
2 分類器模型
2.1 支持向量機(jī)分類器
采用支持向量機(jī)實(shí)現(xiàn)單個(gè)分類器的故障分類功能,實(shí)現(xiàn)過(guò)程可表述如下。
3 基于機(jī)器學(xué)習(xí)分類器的故障預(yù)測(cè)方法
結(jié)合圖1所示,本項(xiàng)目給出一種蓄能設(shè)備故障的診斷方法,包括:以單分類器為基礎(chǔ),構(gòu)造集成分類器,建立蓄能設(shè)備故障分類預(yù)測(cè)模型;從蓄能設(shè)備數(shù)據(jù)采集管理系統(tǒng)中提取特征,并作為蓄能設(shè)備故障分類預(yù)測(cè)模型的輸入。
4 實(shí)驗(yàn)結(jié)果與分析
目前蓄能設(shè)備開(kāi)放性項(xiàng)目包括NASA的開(kāi)源數(shù)據(jù)集,馬里蘭大學(xué)先進(jìn)壽命周期工程中心的鋰電池?cái)?shù)據(jù)集,上海市30萬(wàn)輛新能源設(shè)備大數(shù)據(jù)平臺(tái)及服務(wù)能力建設(shè)項(xiàng)目等。本實(shí)驗(yàn)環(huán)境采用Python 3.6版本,在NVIDIA GeForce GTX 1050 Ti上運(yùn)行程序。
由于充電過(guò)程中,總電壓、單體電壓均處于上升狀態(tài),無(wú)法準(zhǔn)確辨別蓄能設(shè)備本身真實(shí)性能狀態(tài),所以實(shí)驗(yàn)截取出蓄能設(shè)備運(yùn)行的每一個(gè)放電周期作為訓(xùn)練集的一條樣本。根據(jù)模式識(shí)別分析,實(shí)驗(yàn)選擇每個(gè)放電周期的最低總電壓、最低單體電壓最低值、最高單體最高最低電壓壓差值作為特征輸入,報(bào)警信息作為標(biāo)簽。
由于實(shí)驗(yàn)需要測(cè)試模型精度,需要預(yù)先對(duì)數(shù)據(jù)進(jìn)行標(biāo)注。實(shí)驗(yàn)將標(biāo)簽分為4類:0表示正常無(wú)任何報(bào)警;1表示單體欠壓與蓄能設(shè)備類型欠壓復(fù)合報(bào)警;2表示單體欠壓與單體一致性差復(fù)合報(bào)警;3表示其它報(bào)警。為排除數(shù)據(jù)采集管理系統(tǒng)傳輸數(shù)據(jù)丟失或誤報(bào)警情況對(duì)標(biāo)簽的影響,實(shí)驗(yàn)基于蓄能設(shè)備標(biāo)準(zhǔn)安全閾值對(duì)單體一致性差報(bào)警、蓄能設(shè)備欠壓復(fù)合報(bào)警進(jìn)行了重新標(biāo)注,保證訓(xùn)練集與測(cè)試集的標(biāo)簽都基于故障模式準(zhǔn)確標(biāo)注。
數(shù)據(jù)經(jīng)處理后得到完整樣本集,共6 865個(gè)樣本。其中,正常無(wú)報(bào)警5 198條;單體欠壓與蓄能設(shè)備類型欠壓復(fù)合報(bào)警200條;單體欠壓與單體一致性差復(fù)合報(bào)警47條;其它報(bào)警1 420條。
考慮到其它報(bào)警情況對(duì)輸入特征的影響較為復(fù)雜,除掉其它報(bào)警得到樣本集1,共5 445個(gè)樣本。此時(shí)正負(fù)例比達(dá)到21:1,嚴(yán)重樣本失衡。
刪除正例樣本,直至與負(fù)例樣本平衡,得到樣本集2,共447條樣本。其中,正常無(wú)報(bào)警231條;單體欠壓與蓄能設(shè)備類型欠壓復(fù)合報(bào)警200條;單體欠壓與單體一致性差復(fù)合報(bào)警47條。
各機(jī)器學(xué)習(xí)分類器精度表現(xiàn)見(jiàn)表1。
分類器最主要的目的在于準(zhǔn)確識(shí)別出故障蓄能設(shè)備,而不是識(shí)別正常蓄能設(shè)備模式。各機(jī)器學(xué)習(xí)分類器在樣本集1上表現(xiàn)出的高精度是基于大量正例樣本的條件,而對(duì)于負(fù)例樣本診斷的準(zhǔn)確率很差。
在研究中的3個(gè)樣本集上,表現(xiàn)最好的為支持向量機(jī),在完整樣本集上,SVM分類器預(yù)測(cè)1 373個(gè)樣本,其中44個(gè)負(fù)例樣本,預(yù)測(cè)錯(cuò)誤29個(gè);在樣本集1上,SVM分類器預(yù)測(cè)1 089個(gè)樣本,其中51個(gè)負(fù)例樣本,預(yù)測(cè)錯(cuò)誤39個(gè);而在樣本集2上,SVM分類器預(yù)測(cè)96個(gè)樣本,其中42個(gè)負(fù)例樣本,預(yù)測(cè)錯(cuò)誤1個(gè)。其它2個(gè)分類器雖然性能弱于支持向量機(jī),但在經(jīng)過(guò)平衡化處理的樣本集1和樣本集2上,其對(duì)負(fù)例樣本的分類性能均有提高。
由此可見(jiàn),在平衡樣本集上,分類器準(zhǔn)確率雖然沒(méi)有達(dá)到0.9,但對(duì)于故障的評(píng)估是十分精確的。
5 結(jié)束語(yǔ)
本文探討了基于集成學(xué)習(xí)進(jìn)行特征重要度排序的原理,并利用集成學(xué)習(xí)boosting算法XGBoost以及bagging算法隨機(jī)森林對(duì)蓄能設(shè)備的故障特征進(jìn)行了重要度排序,得到對(duì)蓄能設(shè)備報(bào)警影響程度最高的幾個(gè)特征:蓄能設(shè)備單體電壓最高/低值、總電壓(總電流)、SOC、累計(jì)里程、設(shè)備狀態(tài)、充電狀態(tài)、DC-DC狀態(tài),以及對(duì)蓄能設(shè)備類型欠壓報(bào)警影響程度最高的幾個(gè)特征:蓄能設(shè)備單體電壓最高/低值、總電壓、SOC、累計(jì)里程。未來(lái)工作中將進(jìn)一步討論其它故障與數(shù)據(jù)采集管理系統(tǒng)數(shù)據(jù)的相關(guān)性。進(jìn)而通過(guò)提高發(fā)電廠蓄能設(shè)備健康管理水平來(lái)保障發(fā)電廠削峰填谷能力。
參考文獻(xiàn)
[1]蘇偉,鐘國(guó)彬,沈佳妮,等. 鋰電子電池故障診斷技術(shù)進(jìn)展[J]. 儲(chǔ)能科學(xué)與技術(shù),2019,8(2):225-236.
[2]GAO Zuchang,CHENG S C,WOO W L,et al. Genetic algorithm based back-propagation neural network approach for fault diagnosis in lithium-ion battery system[C]//6th IEEE International Conference on Power Electronics Systems and Applications (PESA). Hong Kong: IEEE,2016:1-6.
[3]CHEN Wen,CHEN Weitian,SAIF M,et al. Simultaneous fault isolation and estimation of lithium-ion batteries via synthesized design of Luenberger and learning observes[J]. IEEE Transactions on Control Systems Technology,2014,22(1):290-298.
[4]徐佳寧,梁棟濱,魏國(guó),等. 串聯(lián)電池組接觸電阻故障診斷分析[J]. 電工技術(shù)學(xué)報(bào),2017,32(18):106-112.
[5]XU Jianing,LIANG Dongbin,WEI Guo,et al. Series battery packs contact resistance fault diagnosis analysis[J]. Transactions of China Electrotechnical Society,2017,32(18):106-112.
[6]YANG Ruixin,XIONG Rui,HE Hongwen,et al. A fractional-order model-based battery external short circuit fault diagnosis approach for all-climate electric vehicles application[J]. Journal of Cleaner Production,2018,187:950-959.
[7]GAO Wenkai,ZHENG Yuejiu,OUYANG Minggao,et al. Micro-short circuit diagnosis for series-connected lithium-ion battery packs using mean-difference model[J]. IEEE Transactions on Industrial Electronics,2019,66(3):2132-2142.
[8]劉文杰,齊國(guó)光. 基于模糊理論的電池故障診斷專家系統(tǒng)[J]. 吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2005,23(6):670-674.
[9]HONG Jichao,WANG Zhenpo,LIU Peng. Big-data-based thermal runaway prognosis of battery systems for electric vehicles[J]. Energies,2017,10(7):919.
[10]王一卉. 純電動(dòng)汽車鋰電池故障診斷系統(tǒng)的研究[D]. 長(zhǎng)春:長(zhǎng)春工業(yè)大學(xué),2015.
[11]應(yīng)澤霖.鋰電池組充放電管理系統(tǒng)[D]. 杭州:杭州電子科技大學(xué),2017.