韓 靜
(山西大學(xué)商務(wù)學(xué)院 理學(xué)系,山西 太原 030031)
壽命分析的目的是定量地把握系統(tǒng)或部件壽命的性狀,并把所獲取的信息反饋到設(shè)計(jì)、制造或使用維修中去,以期改善可靠性。從統(tǒng)計(jì)學(xué)的角度來(lái)看,可認(rèn)為這些產(chǎn)品來(lái)自于不同的兩個(gè)或多個(gè)子總體,我們稱其為混合分布?;跇O大似然估計(jì)(Maximum Likelihood Estimate,MLE)的方法能獲得對(duì)參數(shù)較高精度的估計(jì),因此極大似然法往往被用于混合分布的參數(shù)估計(jì)。EM算法雖然可研究混合分布在正常工作條件下的參數(shù)估計(jì)問(wèn)題,但EM 算法可能會(huì)收斂到局部最優(yōu)值[1-2]。針對(duì)極大似然估計(jì)計(jì)算量較大的缺陷,文獻(xiàn)[3-4]結(jié)合遺傳算法(Genetic Algorithm,GA)實(shí)現(xiàn)參數(shù)的優(yōu)化估計(jì)。然而,遺傳算法容易過(guò)早收斂產(chǎn)生早熟現(xiàn)象。為了克服其不足,文中將模擬退火技術(shù)(Simulated Annealing,SA)引入遺傳算法中,基于極大似然估計(jì)模型利用退火遺傳算法 (Simulated Annealing Genetic Algorithm,SAGA)實(shí)現(xiàn)壽命分布參數(shù)的最優(yōu)估計(jì)。
設(shè)壽命分布為雙參數(shù)混合指數(shù)分布,t1,t2,t3,…,tN是來(lái)自母體t的一個(gè)樣本,定義其聯(lián)合概率密度為:
即
其中,σi≥0,λi分別稱為位置參數(shù)和尺度參數(shù)。記
一般采用二重或三重的混合(即i=2或3),多重混合之所以不常見(jiàn),主要是模型參數(shù)過(guò)多,參數(shù)估計(jì)困難,也極少需要[5]。
當(dāng)獲得n個(gè)樣本數(shù)據(jù)t1,t2,…,tn之后,樣本的似然函數(shù)為:
要求得此極大似然估計(jì)值,傳統(tǒng)的做法是直接將對(duì)數(shù)似然函數(shù)
關(guān)于各參數(shù)求偏導(dǎo),使其為零,即
極大似然估計(jì)存在的問(wèn)題是,對(duì)于許多具體問(wèn)題不能構(gòu)造似然函數(shù)解析式,或者似然函數(shù)表達(dá)式過(guò)于復(fù)雜而導(dǎo)致求解超越方程組(8)非常困難,因此必須借助于其它方法。下面介紹的退火遺傳算法就是一種有效的方法。
退火遺傳算法(Simulated Annealing Genetic Algorithm,SAGA),一般而言,首先考慮遺傳算法GA和模擬退火算法SA兩種算法,但是,這兩種算法都各自具有本身的局限性。文中嘗試將兩種算法結(jié)合,豐富其優(yōu)化過(guò)程,從而更有效率地搜索全局最優(yōu)解。
退火遺傳算法按以下主要步驟進(jìn)行:
1)初始化控制參數(shù),包括種群規(guī)模n,進(jìn)化代數(shù)g,交叉概率pc,變異概率pm,溫度下降因子δ,初始溫度t0。
2)隨機(jī)產(chǎn)生一個(gè)由確定長(zhǎng)度的特征串組成的初始群體。采用實(shí)數(shù)編碼,即每個(gè)染色體表示一個(gè)θ的估計(jì),也就是說(shuō),每個(gè)染色體由s個(gè)基因位組成,第k個(gè)基因位表示θ的第k個(gè)分量(k=1,2,…,s),為方便記,以下將θ的分量統(tǒng)一用x表示,即θ=(x1,x2,…,xs),并將它與式(4)定義的θ等同對(duì)待。
3)計(jì)算每個(gè)個(gè)體xi的適應(yīng)度函數(shù)值f(xi)。
4)根據(jù)適應(yīng)度值生成新的下一代。
5)根據(jù)交叉概率pc和變異概率pm進(jìn)行交叉與變異操作。
6)利用退火函數(shù)Tk+1=vTk,v∈(0,1)執(zhí)行退火操作。
7)決策是否滿足停止迭代的條件,如滿足,輸出最后結(jié)果。否則,轉(zhuǎn)步驟3)。
8)算法結(jié)束。
為了驗(yàn)證退火遺傳算法在估計(jì)混合指數(shù)分布參數(shù)時(shí)的效率,文中提出的雙參數(shù)指數(shù)混合分布模型在加速應(yīng)力水平下壽命試驗(yàn)完全數(shù)據(jù)場(chǎng)合下進(jìn)行了模擬,在計(jì)算機(jī)上產(chǎn)生了100個(gè)模擬數(shù)據(jù)[7]。
加速應(yīng)力水平為S1=160K,S2=395K,S3=438K,S4=503K,正常應(yīng)力水平S0=325K。采用Arrenius加速模型,在每一個(gè)應(yīng)力水平上進(jìn)行定數(shù)截尾壽命試驗(yàn),得到一組模擬數(shù)據(jù),其中ri為截尾數(shù)。
由數(shù)據(jù)的經(jīng)驗(yàn)分布可知,符合指數(shù)類型分布模型如圖1所示。
圖1 數(shù)據(jù)的經(jīng)驗(yàn)分布曲線
進(jìn)行擬合優(yōu)度檢驗(yàn)。首先進(jìn)行指數(shù)分布檢驗(yàn),結(jié)果見(jiàn)表1。
表1 基于χ2分布的擬合優(yōu)度檢驗(yàn)Ⅰ(單參數(shù)指數(shù)分布擬合)
其中,置信水平為α=0.1,拒絕域W= {χ2<
由表1可以看出,該數(shù)據(jù)不符合單一指數(shù)分布。接下來(lái)進(jìn)行雙參數(shù)指數(shù)分布擬合檢驗(yàn),結(jié)果見(jiàn)表2。
表2 基于χ2分布的擬合優(yōu)度檢驗(yàn)Ⅱ(雙參數(shù)指數(shù)分布擬合)
由表2可以看出,該分布也不能用單一的雙參數(shù)指數(shù)分布來(lái)表示。
記θ=[p,q,λ1,λ2,σ1,σ2],這里,選取 p=0.6,λ1=0.5,λ2=0.6,σ1=2,σ2=2.5,分別取種群大小n=20,40,60,80,100(即樣本數(shù)目),最大進(jìn)化代數(shù)為5 000;交叉概率pc=0.5;變異概率pm=0.05;采用算術(shù)交叉和非均勻變異,非均勻變異的系統(tǒng)參數(shù)為0.01;初始溫度t0=100℃,溫度冷卻系數(shù)δ=0.95,利用提出的退火遺傳算法對(duì)混合分布的極大似然模型進(jìn)行參數(shù)估計(jì)。分別在樣本容量為20,40,60,80,100的時(shí)候各重復(fù)1 000次試驗(yàn)。第i次試驗(yàn)得到的估計(jì)記為
則
估計(jì)結(jié)果及誤差見(jiàn)表3。
表3 完全數(shù)據(jù)場(chǎng)合下的估計(jì)結(jié)果
由表3可以看出,文中采用退火遺傳算法解決極大似然優(yōu)化估計(jì)問(wèn)題,所得到的壽命分布參數(shù)與真值幾乎吻合,隨著樣本的增加,估計(jì)也越準(zhǔn)確,從而證明了文中所提出的方法的有效性。
基于最大似然估計(jì)法和優(yōu)化理論的基本原理以對(duì)數(shù)似然函數(shù)為目標(biāo)函數(shù),建立了可靠性壽命分布參數(shù)的最大似然估計(jì)模型,并使用退火遺傳算法求解。該方法既可以克服傳統(tǒng)優(yōu)化技術(shù)易陷入局部最優(yōu)解的缺點(diǎn),又能夠改善遺傳算法容易早熟的局限性。文中提出的方法具有普遍適用性,可由計(jì)算機(jī)軟件實(shí)現(xiàn),計(jì)算精度和效率較高,適用于各種儀器及電工電子元件的可靠性壽命分布參數(shù)的估計(jì)。
[1] 張士峰.混合正態(tài)分布參數(shù)極大似然估計(jì)的EM算法[J].飛行器測(cè)控學(xué)報(bào),2004,23(4):125-128.
[2] 王建康,蓋鈞鎰.混合分布理論及應(yīng)用[J].生物數(shù)學(xué)學(xué)報(bào),1995,10(3):67-70.
[3] 方華元,胡昌花,李瑛.基于遺傳算法的威布爾分布的參數(shù)估計(jì)及MATLAB實(shí)現(xiàn)[J].戰(zhàn)術(shù)導(dǎo)彈控制技術(shù),2007,15(1):100-103.
[4] 方華元,胡昌華,樊紅東,等.基于GA的可靠性壽命分布參數(shù)的極大似然優(yōu)化估計(jì)[J].上海航天,2006,23(2):50-53.
[5] Euan W,Mc Gookin,David J,et al.Submarine manoeuvring controllers'optimisation using simulated annealing and genetic algorithms[J].Control Engineering Practice,2006,14(1):1-15.
[6] 孫雅芳,王曉丹,徐俊彥,等.基于視覺(jué)認(rèn)知的全局優(yōu)化算法[J].長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2010,31(6):609-612.
[7] Marvin A,Arostegui Jr,Sukran N,et al.An empirical comparison of tabu search,simulated annealing,and genetic algorithm for facilities location problem[J].International Journal of Production E-conomics,2006,103(2):742-754.