国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

強(qiáng)化學(xué)習(xí)長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)用于狀態(tài)預(yù)測*

2020-12-08 02:03:02湯寶平王家序
振動、測試與診斷 2020年5期
關(guān)鍵詞:隱層趨勢軸承

李 鋒, 陳 勇, 湯寶平, 王家序, 3

(1. 四川大學(xué)機(jī)械工程學(xué)院 成都, 610065) (2. 重慶大學(xué)機(jī)械傳動國家重點(diǎn)實(shí)驗(yàn)室 重慶, 400044)

(3. 四川大學(xué)空天科學(xué)與工程學(xué)院 成都, 610065)

引 言

旋轉(zhuǎn)機(jī)械廣泛應(yīng)用于各種關(guān)鍵的設(shè)備中,其性能狀態(tài)直接決定著設(shè)備能否長期安全可靠地運(yùn)行[1]。由于目前對許多旋轉(zhuǎn)機(jī)械建立物理失效預(yù)測模型十分困難[2],基于數(shù)據(jù)驅(qū)動的狀態(tài)預(yù)測方法獲得了越來越多的關(guān)注和研究?;跀?shù)據(jù)驅(qū)動的狀態(tài)退化趨勢預(yù)測方法一般分為:現(xiàn)代模型預(yù)測方法(例如灰色模型(grey model,簡稱GM)),數(shù)值分析預(yù)測方法(例如最小二乘支持向量機(jī)(least squares support vector machine,簡稱LSSVM)等)和人工智能預(yù)測方法(例如專家系統(tǒng)和神經(jīng)網(wǎng)絡(luò)等)。文獻(xiàn)[3]采用小波GM開發(fā)了一種用來預(yù)測旋轉(zhuǎn)機(jī)械故障的分析儀。文獻(xiàn)[4]在時(shí)序數(shù)據(jù)的特征空間上將預(yù)測當(dāng)做高斯過程,利用貝葉斯預(yù)測模型(Bayesian prediction model,簡稱BPM)進(jìn)行風(fēng)力發(fā)電機(jī)組軸承失效預(yù)測。文獻(xiàn)[5]利用模糊神經(jīng)網(wǎng)絡(luò)對軸承進(jìn)行剩余壽命預(yù)測。然而,以上預(yù)測方法仍存在很多缺陷。對于GM,驅(qū)動變量之間的互相作用關(guān)系不明確,未考慮在作用期內(nèi)驅(qū)動變量對系統(tǒng)行為序列的作用強(qiáng)度隨時(shí)間變化的問題,使得GM很難得到精確的預(yù)測結(jié)果。由于BPM通常無法及時(shí)找到最需要推理的因素,不能及時(shí)得到該因素的預(yù)測值。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)如LSTMNN和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,簡稱RNN)的隱層層數(shù)和隱層節(jié)點(diǎn)數(shù)的選擇沒有完善的理論指導(dǎo)[6],一般只能靠經(jīng)驗(yàn)選擇,導(dǎo)致神經(jīng)網(wǎng)絡(luò)的預(yù)測精度和計(jì)算效率都不佳。作為一種解決序貫決策問題的機(jī)器學(xué)習(xí)框架,強(qiáng)化學(xué)習(xí)采用不斷的“交互-試錯”機(jī)制[7],實(shí)現(xiàn)決策函數(shù)和環(huán)境的持續(xù)交互,從而學(xué)得完成任務(wù)的最優(yōu)策略,契合了人類提升智能的行為決策方式[8-13]。針對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的隱層層數(shù)和隱層節(jié)點(diǎn)數(shù)根據(jù)經(jīng)驗(yàn)選擇導(dǎo)致泛化性能和非線性逼近能力不可控的問題,結(jié)合強(qiáng)化學(xué)習(xí)在行為決策方面的優(yōu)勢,在長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,筆者提出了強(qiáng)化學(xué)習(xí)三態(tài)組合長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)。RL-3S-LSTMNN具有較好的泛化性能、非線性逼近能力和收斂速率。

利用所提出的RL-3S-LSTMNN的優(yōu)勢,筆者提出了基于RL-3S-LSTMNN的狀態(tài)預(yù)測方法。將該方法用于旋轉(zhuǎn)機(jī)械狀態(tài)退化趨勢預(yù)測,可獲得較理想的預(yù)測精度和較快的計(jì)算效率。

1 強(qiáng)化學(xué)習(xí)三態(tài)組合長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)

1.1 RL-3S-LSTMNN的理論模型

RL-3S-LSTMNN模型通過構(gòu)造單調(diào)趨勢識別器將時(shí)序數(shù)據(jù)分為3個趨勢單元(平穩(wěn)、下降和上升),再采用強(qiáng)化學(xué)習(xí)分別為每個趨勢單元選取一個隱層層數(shù)和隱層節(jié)點(diǎn)數(shù)與其變化規(guī)律相適應(yīng)的長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)。該模型如圖1所示。

圖1 RL-3S-LSTMNN模型Fig.1 Model of RL-3S-LSTMNN

RL-3S-LSTMNN模型具體的思路如下:

x=ht+b

(1)

平方擬合誤差為

(2)

為了求出最優(yōu)擬合方程,依據(jù)微積分求極值原理,需滿足以下條件

(3)

其中:λ<0且μ>0。以上就是最小二乘回歸單調(diào)趨勢識別器的構(gòu)造過程。

將上述3種趨勢狀態(tài)作為強(qiáng)化學(xué)習(xí)的環(huán)境狀態(tài),決策函數(shù)依據(jù)當(dāng)前的趨勢狀態(tài),從動作集a里選取執(zhí)行一個動作,動作集a如表1所示。

表1 動作集aTab.1 Action set a

在選取動作的過程中,采用由狀態(tài)集s與動作集a構(gòu)成的Q表替代折扣累積獎勵期望值,如表2所示。

表2 Q表Tab.2 Q table

根據(jù)Q表(Q表用于保存獎勵,Q值即動作選擇的依據(jù),每次執(zhí)行動作獲得的獎勵再反饋更新Q值,經(jīng)過多次動作執(zhí)行后,Q表里的Q值會趨于穩(wěn)定,因此穩(wěn)定的Q值儲存了學(xué)習(xí)獲得的經(jīng)驗(yàn)),利用決策函數(shù)為每個狀態(tài)選取一個相對應(yīng)的動作,決策函數(shù)的表達(dá)式為

(4)

其中:a*(si)∈a1,a2,…,ad,i∈1,2,3表示在狀態(tài)si下決策函數(shù)選取的動作。

得到狀態(tài)si下相應(yīng)的動作a*(si)后,再根據(jù)a*(si)表示的網(wǎng)絡(luò)隱層層數(shù)和隱層節(jié)點(diǎn)數(shù)對一個LSTMNN進(jìn)行設(shè)置,就得到一個與時(shí)序xt(即趨勢狀態(tài)si)對應(yīng)的長短時(shí)神經(jīng)網(wǎng)絡(luò),記作i-LSTMNN。

(5)

(6)

(7)

根據(jù)矩陣運(yùn)算法則可知,隱層節(jié)點(diǎn)數(shù)和輸入向量維數(shù)共同決定權(quán)值和活性值維度,因此式中各門的權(quán)值和活性值的維度為t×m。為了簡化網(wǎng)絡(luò)的更新過程,將各偏置量簡略,因此只需對權(quán)值與活性值進(jìn)行更新。

(8)

(9)

(10)

(11)

1.2 RL-3S-LSTMNN的學(xué)習(xí)算法

RL-3S-LSTMNN的學(xué)習(xí)過程劃分為兩步:①強(qiáng)化學(xué)習(xí)Q表的更新;②與每個趨勢狀態(tài)相對應(yīng)的最終i-LSTMNN權(quán)值和活性值的更新。

1.2.1 強(qiáng)化學(xué)習(xí)Q表的更新

(12)

在狀態(tài)si下,結(jié)合輸出誤差,選取動作a得到的獎勵r由下式計(jì)算

(13)

其中:e為自然指數(shù)。

顯然r∈(0,1)且與輸出誤差成負(fù)相關(guān)(即輸出誤差越大,獎勵值越小)。

再根據(jù)貝爾曼方程和獎勵值更新Q表中狀態(tài)si下選取動作的Q值

q(si,a)′=

(14)

1.2.2 最終i-LSTMNN權(quán)值和活性值的更新

這里通過隨機(jī)梯度下降法來更新權(quán)值和活性值,如果最終i-LSTMNN隱層層數(shù)為1,由式(5~9)、式(12)和鏈?zhǔn)角髮?dǎo)法可得到各權(quán)值和活性值的梯度,再根據(jù)如下公式進(jìn)行更新

(15)

其中:W′和U′為更新后的權(quán)值和活性值;ψ為學(xué)習(xí)率。

2 基于RL-3S-LSTMNN的狀態(tài)退化趨勢預(yù)測方法

2.1 基于RL-3S-LSTMNN的狀態(tài)退化趨勢預(yù)測方法實(shí)現(xiàn)過程

如圖2所示,基于RL-3S-LSTMNN的旋轉(zhuǎn)機(jī)械狀態(tài)退化趨勢預(yù)測方法的實(shí)現(xiàn)過程如下。

圖2 基于RL-3S-LSTMNN的狀態(tài)退化預(yù)測方法實(shí)現(xiàn)過程Fig.2 Implementation of the proposed state degradation trend prediction method based on RL-3S-LSTMNN

1) 使用奇異譜熵[14]對旋轉(zhuǎn)機(jī)械全壽命振動數(shù)據(jù)進(jìn)行特征提取。

2) 通過滑動平均方法對奇異譜熵進(jìn)行降噪處理,并將降噪后的奇異譜熵作為旋轉(zhuǎn)機(jī)械狀態(tài)退化特征。

3) 將此特征輸入到RL-3S-LSTMNN進(jìn)行訓(xùn)練。由文中1.2節(jié)的學(xué)習(xí)過程可知,RL-3S-LSTMNN的訓(xùn)練過程分為:采用單調(diào)趨勢識別器判別輸入序列的趨勢、訓(xùn)練強(qiáng)化學(xué)習(xí)和訓(xùn)練最終與趨勢狀態(tài)相對應(yīng)的i-LSTMNN。

4) 通過訓(xùn)練好的與趨勢狀態(tài)對應(yīng)的i-LSTMNN來預(yù)測旋轉(zhuǎn)機(jī)械狀態(tài)退化趨勢。

RL-3S-LSTMNN的訓(xùn)練過程如下:取一段奇異譜熵序列[xb,xb+1,…,xb+(l+1)t-1]作為訓(xùn)練樣本,然后對此序列進(jìn)行分解

T1=[xb,xb+1,…,xb+t-1]?

T2=[xb+t,xb+t+1,…,xb+2t-1]?

?

Tl=[xb+(l-1)t,xb+(l-1)t+1,…,xb+lt-1]?

把樣本依次輸入RL-3S-LSTMNN中,根據(jù)1.2節(jié)Q表的更新過程實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)的訓(xùn)練。首先,采用單調(diào)趨勢識別器判別l組訓(xùn)練輸入樣本的趨勢狀態(tài);然后,根據(jù)強(qiáng)化學(xué)習(xí)最終更新的Q表選取最優(yōu)動作,分別為3種趨勢狀態(tài)選擇最終對應(yīng)的i-LSTMNN(1-LSTMNN、2-LSTMNN、3-LSTMNN)。接下來,通過隨機(jī)梯度下降法分別對選取的i-LSTMNN訓(xùn)練M次,即在每次訓(xùn)練之前從狀態(tài)si的訓(xùn)練樣本中隨機(jī)地選取一組樣本輸入對應(yīng)的i-LSTMNN,再根據(jù)1.2節(jié)i-LSTMNN的更新法則,完成i-LSTMNN的一次訓(xùn)練。重復(fù)上述訓(xùn)練過程M次,就完成了RL-3S-LSTMNN的完整訓(xùn)練過程。

2.2 奇異譜熵機(jī)理

在正常狀態(tài)下,滾動軸承的振動時(shí)域信號近似為高斯分布,這時(shí)信號主要源自保持架轉(zhuǎn)頻和軸頻,以及保持架相對軸旋轉(zhuǎn)產(chǎn)生的微弱調(diào)制,信號頻率成分簡單,能量集中在少數(shù)幾個頻率分量中,使奇異值分解結(jié)果集中在少數(shù)幾個模式上,因此信號的奇異譜熵[14]較??;隨著滾動軸承出現(xiàn)最細(xì)微的狀態(tài)退化,信號中產(chǎn)生了微弱的故障頻率以及引起微弱的共振頻率,信號能量開始分散,奇異值分解結(jié)果也隨著分散,從而奇異譜熵開始增加;當(dāng)出現(xiàn)明顯的狀態(tài)退化時(shí),噪聲信號的頻率成分所占的比例迅速增加,能量加劇分散,使奇異譜熵增大?;谝陨戏治觯娈愖V熵可以作為旋轉(zhuǎn)機(jī)械的狀態(tài)退化特征來描述其振動時(shí)域信號的變化趨勢,即能反映旋轉(zhuǎn)機(jī)械狀態(tài)的退化趨勢。

3 實(shí)例分析

使用Cincinnati大學(xué)實(shí)測的滾動軸承狀態(tài)退化數(shù)據(jù)對所提方法進(jìn)行驗(yàn)證[15]。圖3所示為實(shí)驗(yàn)裝置,軸承實(shí)驗(yàn)臺的轉(zhuǎn)軸上安裝4個航空用軸承,這些航空軸承是Rexnord公司生產(chǎn)的型號為ZA-2115的雙列滾子軸承,實(shí)驗(yàn)中軸承被施加了6 000 lbs的徑向載荷,交流電機(jī)通過帶傳動使轉(zhuǎn)軸以2 000 r / min的恒定轉(zhuǎn)速旋轉(zhuǎn)。采樣的頻率為20 kHz,采樣長度為20 480,每10 min采集一次軸承的振動加速度數(shù)據(jù),軸承持續(xù)運(yùn)轉(zhuǎn)直到出現(xiàn)故障。

圖3 滾動軸承性態(tài)退化實(shí)驗(yàn)裝置Fig.3 Test equipment of the performance degradation of rolling bearings

實(shí)驗(yàn)臺持續(xù)運(yùn)行21 560 min后,3號軸承出現(xiàn)內(nèi)圈故障。這里采用3號軸承的振動加速度數(shù)據(jù)驗(yàn)證所提方法。3號軸承的全壽命振動數(shù)據(jù)有2 156組,每組20 480個數(shù)據(jù),分別提取每一組前10 000個振動加速度數(shù)據(jù)進(jìn)行矩陣重組得到維數(shù)1 000×10的矩陣并計(jì)算奇異譜熵(無量綱量),如圖4(a)所示。對奇異譜熵序列執(zhí)行滑動平均降噪處理得到降噪后的奇異譜熵序列,如圖4(b)所示。從圖4(b)可看出,從起始點(diǎn)到第200點(diǎn)的奇異譜熵快速上升,軸承處在跑合階段;從第200~1 700點(diǎn)的奇異譜熵變化緩慢,奇異譜熵曲線較為平直,軸承處在運(yùn)行平穩(wěn)的階段;第1 700點(diǎn)之后的奇異譜熵變化速率持續(xù)加快,奇異譜熵曲線開始急劇上升,軸承處在故障加劇即狀態(tài)退化加劇階段,直到失效。由于3號軸承失效是內(nèi)圈故障逐步惡化造成,因此在平穩(wěn)階段的后期(即從第1 300~1 700點(diǎn)區(qū)間),3號軸承實(shí)際就處在早期故障階段即初始退化階段。將處在初始退化階段的第1 301~1 500點(diǎn)(共計(jì)200個點(diǎn))的奇異譜熵作為訓(xùn)練樣本;依據(jù)第2節(jié)表述的RL-3S-LSTMNN預(yù)測過程來預(yù)測第1 501~2 156點(diǎn)(即最后656個點(diǎn))的奇異譜熵。

圖4 3號軸承的全壽命奇異譜熵Fig.4 Singular spectral entropy in the whole life of the third bearing

RL-3S-LSTMNN的參數(shù)設(shè)置如下:狀態(tài)趨勢識別器的臨界值λ=-7×10-6,μ=7×10-6;強(qiáng)化學(xué)習(xí)過程訓(xùn)練輪數(shù)P=5、選取動作的參考值ε=[0.9,0.7,0.5,0.3,0.1];每輪訓(xùn)練的次數(shù)Kρ=100ερ;動作集是由可選隱層層數(shù)[1,2,3]與可選隱層節(jié)點(diǎn)數(shù)3~10兩兩組合共計(jì)24種動作組成的集合;Q表中各Q值的初始值為區(qū)間[0,1]內(nèi)的隨機(jī)數(shù);Q值更新的折扣因子γ=0.001,Q值更新的調(diào)節(jié)系數(shù)α=0.1;i-LSTMNN的學(xué)習(xí)率ψ=0.001和訓(xùn)練次數(shù)M=2 000;訓(xùn)練樣本組數(shù)l=49;預(yù)測回合數(shù)V=164;各回合預(yù)測次數(shù)(即輸入節(jié)點(diǎn)數(shù),也即樣本維數(shù))t=4;輸出的節(jié)點(diǎn)數(shù)為1。圖5為RL-3S-LSTMNN的預(yù)測結(jié)果。

圖5 RL-3S-LSTMNN預(yù)測的奇異譜熵曲線Fig.5 Singular spectral entropy prediction curve obtained by RL-3S-LSTMNN

為驗(yàn)證筆者提出的基于RL-3S-LSTMNN的旋轉(zhuǎn)機(jī)械狀態(tài)退化趨勢預(yù)測方法的優(yōu)勢,首先采用一種常用的退化特征——排列熵(無量綱量)與文中選用的奇異譜熵的預(yù)測效果進(jìn)行比較,其中排列熵嵌入維數(shù)d=5,延遲時(shí)間τ=3。如圖6(a)為3號軸承的全壽命過程的排列熵,對排列熵序列進(jìn)行滑動平均降噪處理得到降噪后的排列熵序列,如圖6(b)所示。同樣地,取圖6(b)第1 301~1 500點(diǎn)(共計(jì)200個點(diǎn))作為訓(xùn)練樣本;根據(jù)第2節(jié)闡述的RL-3S-LSTMNN預(yù)測過程來預(yù)測第1~501~2 156點(diǎn)(即最后656個點(diǎn))的排列熵。RL-3S-LSTMNN參數(shù)設(shè)置保持不變,預(yù)測結(jié)果如圖7所示。

圖6 3號軸承的全壽命排列熵Fig.6 Permutation entropy in the whole life of the third bearing

圖7 RL-3S-LSTMNN預(yù)測的排列熵曲線Fig.7 Permutation entropy prediction curve obtained by RL-3S-LSTMNN

由圖7可知,盡管RL-3S-LSTMNN預(yù)測的排列熵曲線與實(shí)際的排列熵曲線十分接近,但如圖6所示,排列熵所描述的狀態(tài)退化過程沒有明顯區(qū)分出3個退化階段(即平穩(wěn)階段、初始退化階段和故障加劇階段)。而如圖4(b)所示,文中選用的奇異譜熵能較清晰地區(qū)分出個這3個退化階段。因此,筆者選用的奇異譜熵比排列熵更能清晰反映軸承的退化趨勢。

圖8 LSTMNN,MK-LSSVM,GA-BPNN和ELM預(yù)測的奇異譜熵曲線Fig.8 Singular spectral entropy prediction curves obtained by LSTMNN, MK-LSSVM, GA-BPNN and ELM

為更好地評價(jià)模型的預(yù)測效果,采用納什系數(shù)(Nash-sutcliffe efficiency coefficient,簡稱NSE)、均方根誤差(root mean square error,簡稱RMSE)以及平均絕對百分比誤差(mean absolute percentage error,簡稱MAPE)作為預(yù)測精度的評估指標(biāo),即

表3 5種狀態(tài)退化趨勢預(yù)測方法的預(yù)測性能對比Tab.3 The prediction performance comparison of five state degradation trend prediction methods

然后,在3號軸承原始的全壽命振動加速度信號中加入白噪聲以驗(yàn)證奇異譜熵具有較強(qiáng)的容噪能力。圖9(a,c,e)分別為隨機(jī)抽取的加入噪聲后的平穩(wěn)階段、初始退化階段和故障加劇階段的一組振動加速度數(shù)據(jù)的時(shí)域圖,圖9(b,d,f)為對應(yīng)的功率譜分析結(jié)果(其中功率為無量綱量)。圖10(a)為加入白噪聲后的全壽命過程的奇異譜熵,圖10(b)為滑動平均降噪后的奇異譜熵。RL-3S-LSTMNN對滑動降噪后的奇異譜熵的預(yù)測結(jié)果如圖11所示。

圖9 3號軸承加噪聲后的振動加速度數(shù)據(jù)及對應(yīng)的頻譜分析Fig.9 Vibration acceleration data of the third bearing after adding noise and corresponding spectrum analysis

圖10 3號軸承加噪聲后的全壽命奇異譜熵Fig.10 Singular spectral entropy in the whole life of the third bearing after adding noise

圖11 加入噪聲后RL-3S-LSTMNN預(yù)測的奇異譜熵曲線Fig.11 Singular spectral entropy prediction curve obtained by RL-3S-LSTMNN after adding noise

圖10表明:在原始振動數(shù)據(jù)中加入背景噪聲后,計(jì)算得到的奇異譜熵經(jīng)過滑動降噪后,依然能較清晰地描述3號軸承所經(jīng)歷的跑合、平穩(wěn)、初始退化和故障加劇這4個完整的退化過程,這表明奇異譜熵具有較強(qiáng)的噪聲容納能力。圖11表明,由RL-3S-LSTMNN預(yù)測的奇異譜熵曲線與實(shí)際的奇異譜熵曲線很接近,而且與圖5所示的沒有加背景噪聲下預(yù)測的狀態(tài)退化趨勢整體一致,因此RL-3S-LSTMNN具有較好的適用性和魯棒性。

最后,再用LSTMNN,GA-BPNN,MK-LSSVM和ELM完成狀態(tài)退化趨勢預(yù)測所花費(fèi)的計(jì)算時(shí)間(即訓(xùn)練時(shí)間和預(yù)測時(shí)間之和)與RL-3S-LSTMNN所花費(fèi)的計(jì)算時(shí)間進(jìn)行比較,結(jié)果見圖12。RL-3S-LSTMNN的計(jì)算時(shí)間僅為14.782 s,LSTMNN消耗的時(shí)間為10.866 s,GA-BPNN的計(jì)算時(shí)間為35.636 s,MK-LSSVM的計(jì)算時(shí)間為26.051 s,ELM的計(jì)算時(shí)間為22.374 s。很明顯,RL-3S-LSTMNN的計(jì)算時(shí)間比GA-BPNN,MK-LSSVM和ELM都短,僅比LSTMNN略長(但兩者仍在同一數(shù)量級)。由上述的比較結(jié)果可知:將RL-3S-LSTMNN應(yīng)用于雙列滾子軸承的狀態(tài)退化趨勢預(yù)測,其收斂速率和計(jì)算效率比GA-BPNN,MK-LSSVM和ELM更高。

圖12 5種狀態(tài)退化趨勢預(yù)測方法消耗時(shí)間對比結(jié)果Fig.12 The comparison results of computation time taken by five state degradation trend prediction methods

4 結(jié)束語

RL-3S-LSTMNN通過構(gòu)造的單調(diào)趨勢識別器判別輸入序列的趨勢,用不同隱層層數(shù)及隱層節(jié)點(diǎn)數(shù)和3種趨勢狀態(tài)分別表示Q表的動作和狀態(tài),依據(jù)最終更新的Q表來選擇最優(yōu)動作(即選取隱層層數(shù)和隱層節(jié)點(diǎn)數(shù)與各趨勢單元最適應(yīng)的長短時(shí)記憶神經(jīng)網(wǎng)絡(luò))。所以,RL-3S-LSTMNN獲得了較高的泛化性能和非線性逼近能力。在強(qiáng)化學(xué)習(xí)訓(xùn)練過程中,為明確強(qiáng)化學(xué)習(xí)的學(xué)習(xí)目的(即使得輸出誤差較小),利用輸出誤差構(gòu)造獎勵函數(shù),可避免決策函數(shù)在Q表更新過程中盲目搜索動作,以提高RL-3S-LSTMNN的收斂速率。由于RL-3S-LSTMNN在泛化性能、非線性逼近能力、收斂速率上的優(yōu)勢,所提出的基于RL-3S-LSTMNN的旋轉(zhuǎn)機(jī)械狀態(tài)退化趨勢預(yù)測方法具有較理想的預(yù)測精度和計(jì)算效率。雙列滾子軸承的狀態(tài)退化趨勢預(yù)測實(shí)例驗(yàn)證了所提出方法的有效性。

猜你喜歡
隱層趨勢軸承
軸承知識
哈爾濱軸承(2022年2期)2022-07-22 06:39:32
軸承知識
哈爾濱軸承(2022年1期)2022-05-23 13:13:24
軸承知識
哈爾濱軸承(2021年2期)2021-08-12 06:11:46
軸承知識
哈爾濱軸承(2021年1期)2021-07-21 05:43:16
趨勢
基于RDPSO結(jié)構(gòu)優(yōu)化的三隱層BP神經(jīng)網(wǎng)絡(luò)水質(zhì)預(yù)測模型及應(yīng)用
人民珠江(2019年4期)2019-04-20 02:32:00
初秋唇妝趨勢
Coco薇(2017年9期)2017-09-07 21:23:49
SPINEXPO?2017春夏流行趨勢
趨勢
汽車科技(2015年1期)2015-02-28 12:14:44
基于近似結(jié)構(gòu)風(fēng)險(xiǎn)的ELM隱層節(jié)點(diǎn)數(shù)優(yōu)化
清丰县| 南华县| 盐山县| 宁武县| 苗栗市| 泸西县| 阳信县| 鄂温| 崇仁县| 墨竹工卡县| 荆门市| 开阳县| 桐梓县| 元谋县| 苏尼特右旗| 武穴市| 怀化市| 筠连县| 广汉市| 漯河市| 太和县| 滕州市| 六安市| 鸡西市| 永登县| 商水县| 同江市| 佛山市| 循化| 贵港市| 晴隆县| 青浦区| 博白县| 遵化市| 宁津县| 荃湾区| 平湖市| 拜泉县| 河曲县| 永康市| 邢台市|