肖浩逸,何曉霞,梁佳佳,李春麗
(武漢科技大學(xué)理學(xué)院,湖北 武漢 430065)
在環(huán)境污染、新冠疫情、國際局勢等一系列不確定性因素的背景下,伴隨著石油價格的上漲,能源和儲能系統(tǒng)變得至關(guān)重要。鋰離子電池由于具有能量密度高、污染低、充電快、重量輕、性能好等優(yōu)點,已經(jīng)廣泛應(yīng)用到一系列電子設(shè)備中,在航空航天、移動通信和新能源電動汽車等各個領(lǐng)域都是主要的能源來源[1-2]。但是伴隨著電池使用次數(shù)和充放電循環(huán)次數(shù)的增加,電池性能會下降,容量通常會降低,安全性也大幅下降,甚至可能會導(dǎo)致一些災(zāi)難[3]。因此為了確保電子設(shè)備的安全性和可靠性,有必要對鋰電池的健康狀況(state of health,SOH)進(jìn)行有效的控制和管理[3-4]。其中電池剩余使用壽命(remaining useful life,RUL)是電池健康管理的重要指標(biāo),剩余使用壽命的預(yù)測能提高電源性能,對于優(yōu)化電池管理系統(tǒng)設(shè)計和終生校準(zhǔn)保護(hù)至關(guān)重要[1,5]。
對于RUL 的預(yù)測方法,目前多數(shù)文獻(xiàn)采取數(shù)據(jù)驅(qū)動方法?;跀?shù)據(jù)驅(qū)動方法可以直接從電池的監(jiān)控測量指標(biāo)中去分析與挖掘電池性能退化趨勢的影響因素[6],該方法能回避一些電化學(xué)反應(yīng)的復(fù)雜和專業(yè)性問題,具有較強(qiáng)的普適性[7]。關(guān)于數(shù)據(jù)驅(qū)動的方法的文獻(xiàn)層出不窮[8-10],其中有使用傳統(tǒng)統(tǒng)計學(xué)方法,如指數(shù)模型、多項式模型甚至是混合模型去擬合容量衰減的軌跡[11]。文獻(xiàn)[12]采用了經(jīng)驗指數(shù)和多項式回歸融合,并加入粒子濾波(particle filtering,PF)等算法融合,還有高斯過程回歸(Gaussian process regression,GPR)[7,13],自回歸移動平均(auto-regressive moving average,ARMA)[14]等等方法做出電池剩余壽命的預(yù)測。
起源于人工智能領(lǐng)域的機(jī)器學(xué)習(xí)技術(shù),擁有著極其強(qiáng)大的預(yù)測能力,在電池壽命預(yù)測領(lǐng)域也有廣泛的應(yīng)用。文獻(xiàn)[15]使用電池早期循環(huán)數(shù)據(jù),構(gòu)建WOA-XGBoost的混合模型進(jìn)行壽命預(yù)測,文獻(xiàn)[16]使用相關(guān)向量機(jī)(relevance vector machine,RVM)進(jìn)行預(yù)測,還有時間規(guī)整圖和支持向量機(jī)回歸(support vector machine regression,SVR)的結(jié)合[17]等?;谏疃葘W(xué)習(xí)的高精度預(yù)測算法被認(rèn)為是最適合的預(yù)測模型[1]。神經(jīng)網(wǎng)絡(luò)系列算法由于具有強(qiáng)大的特征學(xué)習(xí)和非線性趨勢擬合的能力,同樣也被廣泛運用于RUL 預(yù)測。文獻(xiàn)[18]采用長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)進(jìn)行電池壽命預(yù)測,文獻(xiàn)[2]采用4 種神經(jīng)網(wǎng)絡(luò)對比研究,發(fā)現(xiàn)長短期記憶網(wǎng)絡(luò)預(yù)測效果最佳。因此很多學(xué)者都會基于改進(jìn)的LSTM網(wǎng)絡(luò)方法去預(yù)測電池剩余使用壽命[19-20]?;贚STM 網(wǎng)絡(luò)改進(jìn)的門控單元循環(huán)神經(jīng)網(wǎng)絡(luò)(gated recurrent unit,GRU)也經(jīng)常在電池壽命預(yù)測中被采用[21]。同樣有將傳統(tǒng)方法與神經(jīng)網(wǎng)絡(luò)結(jié)合起來去預(yù)測電池壽命[22-23],甚至是采用不同種類的神經(jīng)網(wǎng)絡(luò)融合的方法[24-26]。
電池在充放電循環(huán)中會出現(xiàn)一定的容量再生的現(xiàn)象,并且受到一些客觀因素(溫度、電化學(xué)反應(yīng)、測量設(shè)備誤差等)的影響,電池容量的原始數(shù)據(jù)總是充滿噪音的,高頻動態(tài)和非線性容量曲線會影響神經(jīng)網(wǎng)絡(luò)準(zhǔn)確學(xué)習(xí)電池容量的衰退特征[27]。針對該現(xiàn)象,現(xiàn)有的大量文獻(xiàn)都使用經(jīng)驗?zāi)B(tài)分解(EMD)對電池容量數(shù)據(jù)進(jìn)行分解降噪處理,然后再采用ARMA[28]、GPR[29]或神經(jīng)網(wǎng)絡(luò)[30-32]等方法進(jìn)行RUL預(yù)測。基于EMD 改進(jìn)的自適應(yīng)白噪聲完整集成經(jīng)驗?zāi)B(tài)分解(complete ensemble empirical mode decomposition with adaptive noise analysis,CEEMDAN)廣泛應(yīng)用于股票投資、生物醫(yī)學(xué)等時間序列數(shù)據(jù)的領(lǐng)域[33],采用CEEMDAN進(jìn)行降噪得到趨勢項,然后再構(gòu)建神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測會得到更好的預(yù)測效果。
然而大多數(shù)的文獻(xiàn)對容量曲線進(jìn)行EMD 分解之后只保留了趨勢項進(jìn)行預(yù)測,而對雖然充滿噪音卻同樣也可能含有一部分真實特征信息的高頻波動分量進(jìn)行了舍棄。為了得到更準(zhǔn)確的預(yù)測效果,分量里面的信息同樣應(yīng)給予一定的權(quán)重。文獻(xiàn)[28]對每個波動分量進(jìn)行白噪聲檢驗,然后利用皮爾遜相關(guān)系數(shù)進(jìn)行加權(quán)重構(gòu)。文獻(xiàn)[30]采用灰色關(guān)聯(lián)度分析(grey relation analysis,GRA)進(jìn)行了特征篩選,文獻(xiàn)[34]對電池原始特征提取和變換后,采用隨機(jī)森林(random forest,RF)篩選出重要性高的特征。
基于上述分析,本工作采用電池容量作為健康狀況的指標(biāo)。首先采用CEEMDAN 分解電池容量的序列數(shù)據(jù)進(jìn)行降噪,為了準(zhǔn)確度量波動分量對原始數(shù)據(jù)信息的解釋程度,本工作提出了使用RF 回歸去得到每個分量對原始數(shù)據(jù)解釋能力的權(quán)重。然后對每個不同頻率的波動分量構(gòu)建不同的神經(jīng)網(wǎng)絡(luò)模型得到預(yù)測結(jié)果,再與RF 得到的重要性的權(quán)重數(shù)值進(jìn)行加權(quán)整合重構(gòu)。這樣既避免了波動分量中噪音對模型預(yù)測能力的影響,且未完全拋棄波動分量里面的特征信息。最后本工作對預(yù)測表現(xiàn)較好的兩種網(wǎng)絡(luò)——LSTM 和GRU 引入了一種簡單編碼解碼(simple encoder-decoder)的機(jī)制,讓其更好地學(xué)習(xí)到序列數(shù)據(jù)全局時間上的特征和遠(yuǎn)程的依賴關(guān)系。使用美國國家航天局(NASA)的鋰離子電池公開數(shù)據(jù)集驗證該模型的有效性。實驗結(jié)果表明,CEEMDAN-RF-SED-LSTM 在電池的RUL 預(yù)測上表現(xiàn)效果好,加入了RF和SED的組合模型預(yù)測結(jié)果具有更高的精度。
電池的健康狀況是表示電池當(dāng)前性能退化程度的重要指標(biāo)[27]。隨著電池使用次數(shù)增多,最大可用容量會不斷降低。電池剩余使用壽命由容量比定義。
式中,C0表示初始額定容量,Ct表示t時刻測量的容量。一般認(rèn)為電池壽命達(dá)到原始容量的70%~80%時,則認(rèn)為其壽命終止。而電池RUL就是指在電池使用過程中容量達(dá)到初始容量70%~80%之前剩余還能使用的循環(huán)充放電次數(shù)。
CEEMDAN 是基于EMD 的改進(jìn)的算法[35],常用于處理非平穩(wěn)非線性的數(shù)據(jù)。它將原始數(shù)據(jù)中加入白噪聲,可以放大各個模態(tài)之間的不相關(guān)程度,便于將原始數(shù)據(jù)的模態(tài)分解開,具有運算速度快、屏蔽迭代次數(shù)少、更好的模態(tài)分解效果等優(yōu)點。其步驟主要分為如下幾步:
(1)向數(shù)據(jù)里加入振幅為εk-1的高斯白噪聲εk-1Ek-1ωi(t),(i= 1,2,…,I),Ek(·) 表示經(jīng)過EMD分解后得到的第k個模態(tài)分量。
(2)將每個加入了白噪聲的數(shù)據(jù)Rk-1(t)+εk-1Ek-1[]ωi(t) ,(i= 1,2,…,I),進(jìn)行EMD 分解,得到每個第一個模態(tài)分量IMFki,然后取均值,得到本輪分解出來的模態(tài)分量IMFk。
(3)更新本輪的殘差Rk(t)=Rk-1(t)-IMFk,然后確定下一輪的白噪聲幅值εk-1,重復(fù)步驟(1)和(2),直到最后的殘差無法分解停止。
隨機(jī)森林最早由Breiman[36]提出,其思想來自于集成學(xué)習(xí)法。隨機(jī)森林采用了隨機(jī)特征選擇的策略。使用重采樣的樣本,但是在每棵決策樹的一個節(jié)點分裂時,僅隨機(jī)從p個特征變量里選取m個變量進(jìn)行分裂,每棵決策樹都如此。這樣就盡可能降低了決策樹之間的相關(guān)性。然而在每棵決策樹分裂時未使用全部特征變量的信息,無疑會增大偏差。但是會換取方差更大幅度地減小,從而整體上降低總誤差即均方誤差。
在決策樹進(jìn)行節(jié)點分裂的時候,每次使用了一個變量。可以考察該變量分裂使得損失函數(shù)即殘差平方和下降的幅度。對于所有變量,可以度量隨機(jī)森林的每棵決策樹由該變量分裂導(dǎo)致的損失函數(shù)的下降幅度,再對每個下降幅度進(jìn)行每棵決策樹平均,可以作為該變量重要性的度量。
隨機(jī)森林算法在篩選變量方面具有優(yōu)良的性質(zhì),不易過擬合,準(zhǔn)確性高,適用于高維數(shù)據(jù),并且不會受到自變量之間存在著多重共線性的影響。作為非線性非參數(shù)的方法,很適合用來作為模態(tài)分解后的波動分量的重要性度量,能準(zhǔn)確衡量每個分量對于原始數(shù)據(jù)的解釋能力,并以此得到每個分量的重要性度量。
本工作采用了5種神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)模型,分別為多層感知機(jī)(multi-layer perceptron,MLP)、一維卷積神經(jīng)網(wǎng)絡(luò)(1D CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)、門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(GRU)。每種網(wǎng)絡(luò)的基本架構(gòu)簡介如下。
1.4.1 多層感知機(jī)
MLP是指在神經(jīng)網(wǎng)絡(luò)中加入一個或者多個隱藏層去克服線性模型的限制,能夠更普遍地處理函數(shù)關(guān)系。原理公式為:
1.4.2 一維卷積神經(jīng)網(wǎng)絡(luò)
一維卷積神經(jīng)網(wǎng)絡(luò)可以用于處理序列數(shù)據(jù)問題,而且計算代價小。本工作一維卷積網(wǎng)絡(luò)如圖1所示。
圖1 一維CNN結(jié)構(gòu)圖Fig.1 A 1D CNN structural diagram
輸入序列數(shù)據(jù)經(jīng)過卷積核做互相關(guān)運算,得到局部一維序列子段,然后采用最大池化層提取每一小段的信息,保留主要的特征同時減少參數(shù),最后采用全連接層得到xt+1的估計量。
1.4.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)對具有序列特性的數(shù)據(jù)十分有效,它能挖掘數(shù)據(jù)中的時序信息。其原理見圖2。
圖2 RNN結(jié)構(gòu)圖Fig.2 An RNN structural diagram
可以看出每步的輸出O不僅受到輸入x的影響,還會受到上一時刻的隱狀態(tài)H的影響。當(dāng)前時間步隱藏變量由當(dāng)前輸入和前一時刻隱藏變量一起計算時得出:
1.4.4 門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)
GRU 和LSTM 改進(jìn)了RNN 梯度爆炸或是消失等缺點,并且通過“門”的機(jī)制可以控制隱藏狀態(tài)。GRU 具備重置門、更新門和候選隱狀態(tài)。重置門讓GRU 獲取序列中的短期依賴關(guān)系,而更新門有助于學(xué)習(xí)序列中的長期依賴關(guān)系,其內(nèi)部神經(jīng)元結(jié)構(gòu)如圖3所示。
圖3 GRU神經(jīng)元內(nèi)部結(jié)構(gòu)圖Fig.3 Internal structure diagram showing the GRU neuron
其原理公式為:
1.4.5 長短期記憶神經(jīng)網(wǎng)絡(luò)
雖然相比GRU,LSTM 的計算代價要大一些,但許多文獻(xiàn)表明LSTM是在序列數(shù)據(jù)預(yù)測中表現(xiàn)最為良好的循環(huán)神經(jīng)網(wǎng)絡(luò)[1-2]。LSTM同樣具備學(xué)習(xí)序列數(shù)據(jù)之間的長期和短期的特征。它具備輸入門、遺忘門、輸出門和候選記憶元,其內(nèi)部神經(jīng)元結(jié)構(gòu)如圖4所示。
圖4 LSTM神經(jīng)元內(nèi)部結(jié)構(gòu)圖Fig.4 Internal structure diagram showing the LSTM neuron
其原理公式為:
1.4.6 簡單編碼解碼
本工作引入了一種簡單編碼解碼(SED)的結(jié)構(gòu)以便讓神經(jīng)網(wǎng)絡(luò)能在預(yù)測時間步長上通過解碼器的隱藏狀態(tài)更好地學(xué)習(xí)序列數(shù)據(jù)全局時間上特征和遠(yuǎn)程依賴關(guān)系。編碼器中的輸出作為隱藏狀態(tài)神經(jīng)元放入解碼器再次進(jìn)行循環(huán)神經(jīng)網(wǎng)絡(luò)的隱藏層運算,其結(jié)構(gòu)如圖5所示。
圖5 簡單編碼解碼結(jié)構(gòu)圖Fig.5 A simple encoding and decoding structural diagram
本工作提出的RUL預(yù)測的流程如圖6所示,其主要步驟如下。
圖6 整體預(yù)測方法框架Fig.6 The Overall Forecasting Methodology Framework
(1)選取一個電池的所有電容量數(shù)據(jù)進(jìn)行CEEMDAN分解為N個分量IMFi,然后將每條分量進(jìn)行神經(jīng)網(wǎng)絡(luò)擬合,得到每條分量的神經(jīng)網(wǎng)絡(luò)模型。
(2)將每條分量作為特征變量,原始數(shù)據(jù)作為響應(yīng)變量,進(jìn)行隨機(jī)森林回歸,得到每個分量的變量重要性的數(shù)值,作為權(quán)重。
(3)將每條分量的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測,得到所有分量的預(yù)測值,然后利用隨機(jī)森林的變量重要性權(quán)重進(jìn)行加權(quán)重構(gòu),得到原始數(shù)據(jù)的估計值。最后和真實數(shù)據(jù)進(jìn)行評價指標(biāo)的計算,作為預(yù)測模型性能的評價準(zhǔn)則。
對于模型的預(yù)測結(jié)果采用如下4 個指標(biāo)進(jìn)行評價,分別是平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RSME)、平均絕對百分比誤差(mean absolute percentage error,MAPE)和相對誤差(relative error,RE)。其計算公式定義見式(16)~(19)。
其中,n為序列的長度,xt為整個序列的取值,RULpred和RULtrue代表預(yù)測的剩余使用壽命和真實的剩余使用壽命。
本工作使用的是美國國家航天局(NASA)的鋰離子電池公開數(shù)據(jù)集。選取第一組4個電池作為研究對象,編號為B0005、B0006、B0007、B0018。其測試的溫度為24 ℃,充電過程是以1.5 A的恒定電流進(jìn)行充電,直到電池電壓達(dá)到4.2 V,然后以恒定電壓充電,直至充電電流降至20 mA。放電過程是以2 A 的恒定電流模式進(jìn)行放電,直到電池5、6、7 和18 的電壓降到2.7 V、2.5 V、2.2 V和2.5 V時停止。電池達(dá)到壽命的情況為額定容量下降到初始容量的70%,即4塊電池的額定容量從2 Ah到1.4 Ah時,可認(rèn)為其壽命終止。4塊電池的容量隨充放電循環(huán)次數(shù)的變化見圖7。
圖7 NASA數(shù)據(jù)集電池容量退化曲線Fig.7 The NASA dataset battery capacity degradation curve
使用CEEMDAN對4組電池的容量數(shù)據(jù)進(jìn)行分解,B0005和B0006電池容量分解結(jié)果如圖8所示。
如圖8所示,實驗過程中每個電池都分解出了四條分量,其中IMF4 為趨勢項,其他IMF1 到IMF3 為高頻分量,這些分量包含噪音,但也可能包含一部分真實信息。分量依次按照頻率的高低進(jìn)行排列。并且每條分量的最大值和最小值,即波動幅度都不完全相同。下文通過隨機(jī)森林對分量進(jìn)行權(quán)重優(yōu)化。
圖8 B0005和B0006電池容量分解的模態(tài)分量Fig.8 Modal components of B0005 and B0006 battery capacity decomposition
將每個電池的IMF1至IMF4作為特征變量,原始數(shù)據(jù)作為響應(yīng)變量進(jìn)行隨機(jī)森林回歸,然后進(jìn)行變量重要性計算和排序,得到數(shù)值結(jié)果見表1。
表1 隨機(jī)森林回歸結(jié)果Table 1 Random forest regression results
所有電池的隨機(jī)森林回歸的擬合優(yōu)度是99%以上,意味著分解出來的分量對于原始數(shù)據(jù)有非常好地解釋能力。IMF4 是趨勢項,因此權(quán)重固定為1,由此計算得到的每個高頻波動分量的權(quán)重系數(shù)如表1所示。從表中可以得出每條分量對于原始數(shù)據(jù)的解釋能力是不一樣的,而且不一定頻率越低的分量對原始數(shù)據(jù)的解釋能力越高,例如B0006電池的IMF1的重要性系數(shù)比IMF2高,B0007電池的IMF2的重要性系數(shù)比IMF3要高。因此對于每個分量的權(quán)重系數(shù)調(diào)整是有必要的。
本工作首先采用單獨神經(jīng)網(wǎng)絡(luò)、CEEMDAN+神經(jīng)網(wǎng)絡(luò)、CEEMDAN+RF+神經(jīng)網(wǎng)絡(luò)3 種方法在B0005號和B0006號電池上進(jìn)行測試,比較5種不同網(wǎng)絡(luò)的預(yù)測性能,以及加入了CEEMDAN 和RF進(jìn)行優(yōu)化后的模型的性能對比。計算每個模型的預(yù)測4個評價指標(biāo)以及運行時間如表2和表3所示。
表2 B0005預(yù)測評價指標(biāo)結(jié)果Table 2 B0005 prediction and evaluation index results
表3 B0006預(yù)測評價指標(biāo)結(jié)果Table 3 B0006 prediction and evaluation index results
從表2 和表3 中,首先對比5 種不同神經(jīng)網(wǎng)絡(luò)在B0005 和B0006 的預(yù)測表現(xiàn),無論是單獨使用神經(jīng)網(wǎng)絡(luò)或是采用不同的組合方法,5 種神經(jīng)網(wǎng)絡(luò)的性能均為LSTM 和GRU 最佳,其中LSTM 在精度上略優(yōu)于GRU,但同時計算時間也略有增多。CNN 和MLP 在預(yù)測精度上表現(xiàn)中等,但其計算時間要顯著低于其他3 種網(wǎng)絡(luò)。表現(xiàn)最差的網(wǎng)絡(luò)是RNN,無論從精度還是運算時間上來看,都不如其他4 種網(wǎng)絡(luò)。這可能是電池數(shù)據(jù)中的高頻動態(tài)和非線性容量曲線影響了其性能。
再從方法組合的角度進(jìn)行對比,采取了CEEMDAN 分解之后再去進(jìn)行神經(jīng)網(wǎng)絡(luò)的預(yù)測基本上會比單獨神經(jīng)網(wǎng)絡(luò)模型得到的結(jié)果具有更低的誤差,并且模型加上RF 進(jìn)行分量的權(quán)重調(diào)整預(yù)測結(jié)果后,從MAE、RMSE、MAPE、RE 四組誤差指標(biāo)上進(jìn)行比較,全面優(yōu)于只采用CEEMDAN+神經(jīng)網(wǎng)絡(luò)方法的精度。此外,4 組誤差指標(biāo)在每一個神經(jīng)網(wǎng)絡(luò)的模型上都是進(jìn)一步下降的,這說明采用RF進(jìn)行分量權(quán)重調(diào)整的策略是有效的。
下文對表現(xiàn)較好的兩種網(wǎng)絡(luò)——LSTM 和GRU 引入了簡單編碼解碼(SED)的機(jī)制,讓其更好地學(xué)習(xí)到序列數(shù)據(jù)全局時間上的特征和遠(yuǎn)程的依賴關(guān)系。圖9 比較所有的組合方法在B0005 和B0006上的預(yù)測性能表現(xiàn)。
由于LSTM 網(wǎng)絡(luò)表現(xiàn)最佳,圖9 中只展示了LSTM 網(wǎng)絡(luò)在不同方法組合中的4 組評價指標(biāo),其他網(wǎng)絡(luò)也類似圖9 中結(jié)果??梢钥闯鲈谝肓撕唵尉幋a解碼(SED)的機(jī)制后,在電池B0005 和B0006 上進(jìn)行訓(xùn)練與預(yù)測,所有誤差指標(biāo)都再次進(jìn)一步下降,并且下降幅度較大,說明在進(jìn)行簡單編碼解碼后,神經(jīng)網(wǎng)絡(luò)模型能更好地學(xué)習(xí)到電池容量序列數(shù)據(jù)在全局時間上退化的特征。對4組電池使用組合模型得到的預(yù)測評價指標(biāo)計算如表4 所示,其CEEMDAN-RF-SED-LSTM 擬合效果圖見圖10。
圖9 所有組合方法的評價指標(biāo)對比Fig.9 Comparison between the evaluation indicators for all combination methods
圖10 四組電池的CEEMDAN-RF-SED-LSTM模型擬合圖Fig.10 Fitting diagram showing the CEEMDAN-RFSED-LSTM model for the four understudied groups of batteries
結(jié)合表2、表3 和表4 可知,CEEMDAN-RFSED-LSTM 方法相比單一的LSTM 模型,誤差指標(biāo)平均下降了40%~50%,相比CEEMDANLSTM 方法,誤差指標(biāo)下降了30%~40%。并且在其他神經(jīng)網(wǎng)絡(luò)上也具有類似的表現(xiàn)。四組電池的預(yù)測誤差指標(biāo)MAE 和RMSE 都控制在5%以內(nèi),具有較高的預(yù)測精度。
表4 四組電池預(yù)測評價指標(biāo)結(jié)果Table 4 Prediction and evaluation index results of the four groups of batteries
實驗結(jié)果表明,本工作提出的CEEMDAN-RF-SED-LSTM 在電池的RUL 預(yù)測上表現(xiàn)效果好,預(yù)測結(jié)果相比單一模型具有較高的精度。
本工作采用模態(tài)分解和機(jī)器學(xué)習(xí)算法,提出了一種CEEMDAN-RF-SED-LSTM 方法框架去預(yù)測RUL。選取電池容量作為健康因子,使用隨機(jī)森林回歸對自適應(yīng)白噪聲完整集成經(jīng)驗?zāi)B(tài)分解(CEEMDAN)方法分解出來的電池容量的序列數(shù)據(jù)每條波動分量計算它們對原始數(shù)據(jù)的解釋程度,得到每個分量的重要性排序和數(shù)值,然后與不同頻率的波動分量的神經(jīng)網(wǎng)絡(luò)模型得到預(yù)測進(jìn)行加權(quán)整合重構(gòu)。進(jìn)而得到鋰離子電池剩余使用壽命的預(yù)測。選取NASA 數(shù)據(jù)集驗證該模型的精度,得到結(jié)論如下:
(1)電池數(shù)據(jù)由于容量再生和一些客觀因素的影響,原始數(shù)據(jù)總是充滿噪音的,高頻動態(tài)和非線性容量曲線會影響模型準(zhǔn)確地學(xué)習(xí)電池容量的衰退特征。而采用CEEMDAN 分解對電池數(shù)據(jù)進(jìn)行降噪處理是有效的,能進(jìn)一步幫助模型提高精度。
(2)分解出來的高頻分量雖然充滿噪音,卻同樣可能含有部分?jǐn)?shù)據(jù)真實特征信息。實驗結(jié)果表明,本工作使用隨機(jī)森林回歸去調(diào)整每條波動分量權(quán)重的方法是有效的,5 種神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果的誤差都進(jìn)一步下降。
(3)在時間序列數(shù)據(jù)的預(yù)測問題上,5 種神經(jīng)網(wǎng)絡(luò)中LSTM 和GRU 兩種網(wǎng)絡(luò)表現(xiàn)最為良好,一維CNN 由于其計算代價小、速度快,綜合考慮同樣也具有不錯的效果。
(4)對神經(jīng)網(wǎng)絡(luò)引入簡單編碼解碼(SED)的機(jī)制,可以讓其更好地學(xué)習(xí)到序列數(shù)據(jù)全局時間上的特征和遠(yuǎn)程的依賴關(guān)系。結(jié)果表明使用SED 機(jī)制可以讓LSTM 和GRU 神經(jīng)網(wǎng)絡(luò)的預(yù)測誤差指標(biāo)進(jìn)一步下降。
實驗結(jié)果表明,在相同的預(yù)測條件下,CEEMDAN-RF-SED-LSTM 模型在電池RUL 預(yù)測上表現(xiàn)最為優(yōu)良,預(yù)測誤差最低,該模型為現(xiàn)有電池RUL預(yù)測研究提供了參考。