王二威,瞿 英,吳祈宗,3
(1.北京理工大學(xué)珠海學(xué)院,廣東 珠海 519088;2.河北科技大學(xué)經(jīng)濟(jì)管理學(xué)院,石家莊 050018;3.北京理工大學(xué) 管理與經(jīng)濟(jì)學(xué)院,北京 100081)
基于信息熵的軟件可靠性多模型動態(tài)預(yù)測方法
王二威1,瞿 英2,吳祈宗1,3
(1.北京理工大學(xué)珠海學(xué)院,廣東珠海 519088;2.河北科技大學(xué)經(jīng)濟(jì)管理學(xué)院,石家莊 050018;3.北京理工大學(xué)管理與經(jīng)濟(jì)學(xué)院,北京 100081)
針對經(jīng)典軟件可靠性預(yù)測模型中的不一致問題和“變點(diǎn)”問題,研究了一種基于信息熵的軟件可靠性多模型動態(tài)預(yù)測方法,采用固定步長滑動窗口的動態(tài)賦權(quán)策略,運(yùn)用信息熵對多個(gè)經(jīng)典模型預(yù)測性能進(jìn)行動態(tài)融合,實(shí)現(xiàn)了軟件可靠性的綜合預(yù)測。試驗(yàn)結(jié)果表明,在一定步長情況下,基于信息熵的軟件可靠性多模型動態(tài)預(yù)測方法比單個(gè)經(jīng)典模型有更好的預(yù)測性能。
軟件可靠性預(yù)測;動態(tài)賦權(quán);多模型綜合;信息熵
軟件日益成為影響社會生活、經(jīng)濟(jì)、軍事、政治的重要因素:一方面,計(jì)算機(jī)軟件的應(yīng)用日益廣泛,人們對計(jì)算機(jī)軟件的依賴性日益增強(qiáng);另一方面,軟件的規(guī)模、復(fù)雜程度、關(guān)鍵程度日益提高,尤其體現(xiàn)在那些關(guān)系國計(jì)民生的大型工程以及高精尖工程中(如銀行系統(tǒng)、醫(yī)護(hù)檢測系統(tǒng)、水利工程、核工程、航天工程等)。這就對軟件的可靠性要求越來越高,因?yàn)橐坏┯?jì)算機(jī)軟件發(fā)生故障,將會因產(chǎn)生連鎖反應(yīng)而帶來災(zāi)難性的后果。在美國航天史上發(fā)生了很多次事故,事后調(diào)查,多數(shù)是由于軟件問題造成的[1]。軟件可靠性的研究開始于20世紀(jì)60年代“軟件危機(jī)”出現(xiàn)之后,其量化評估和預(yù)測日漸成為研究者們關(guān)注的焦點(diǎn)。
軟件可靠性的研究是伴隨著“軟件危機(jī)”的出現(xiàn),于20世紀(jì)60年代興起的,軟件可靠性模型是軟件可靠性研究中備受關(guān)注、成果最多、最活躍的一個(gè)領(lǐng)域[1]。軟件可靠性建模的基本方法是:以軟件的歷史失效數(shù)據(jù)為依據(jù),通過對其失效規(guī)律的擬合,進(jìn)而預(yù)測軟件的未來行為。
早期的研究者們多是采用概率統(tǒng)計(jì)的理論和方法,將軟件失效過程看作一個(gè)隨機(jī)過程,自第一個(gè)軟件可靠性模型發(fā)表以來,公開發(fā)表的軟件可靠性模型已達(dá)數(shù)百種之多(文中將基于隨機(jī)過程的模型稱為“經(jīng)典模型”)。但經(jīng)典模型存在兩個(gè)非常明顯的缺陷:一是采用經(jīng)典模型對軟件可靠性進(jìn)行評估和預(yù)測時(shí)存在假設(shè)條件,這些假設(shè)條件是固定不變的,而且無從證明;二是經(jīng)典模型僅僅考慮了輸入的隨機(jī)性,對于軟件實(shí)際運(yùn)行時(shí)存在的各種隨機(jī)因素(如測試工具、測試人員、計(jì)算機(jī)環(huán)境等)未予考慮。實(shí)踐證明:經(jīng)典模型在軟件可靠性評估和預(yù)測時(shí)存在不一致的問題,即對某一個(gè)軟件有較高的預(yù)測準(zhǔn)確性而對其他的軟件則預(yù)測效果很差[2],此外預(yù)測精度也不夠理想。
隨著軟件可靠性研究的深入,更多的研究者將新的理論和方法(如模糊理論[3]、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)[4]、遺傳算法、灰色理論[5]、混沌理論[6-7]、未確知理論[8]等)應(yīng)用于軟件可靠性的建模和優(yōu)化,產(chǎn)生了許多新的預(yù)測方法:Karunanith等最早將神經(jīng)網(wǎng)絡(luò)系統(tǒng)理論應(yīng)用到軟件的可靠性預(yù)測,取得了良好的效果[9-12];Khoshgoftaar等將神經(jīng)網(wǎng)絡(luò)理論運(yùn)用到軟件測試中以預(yù)測軟件失效[13-14];Sitte在比較了傳統(tǒng)的回歸參數(shù)模型和基于神經(jīng)網(wǎng)絡(luò)的軟件可靠性預(yù)測模型的預(yù)測性能后,發(fā)現(xiàn)基于神經(jīng)網(wǎng)絡(luò)的軟件可靠性模型不僅更簡單,而且具有更好的預(yù)測效果[15]?;谏窠?jīng)網(wǎng)絡(luò)的軟件可靠性模型可以對不同軟件環(huán)境、不同失效數(shù)據(jù)、不同復(fù)雜情況有針對性地構(gòu)建模型,但也存在3個(gè)缺陷:①網(wǎng)絡(luò)權(quán)重解釋難[8],神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、采用的歸一化方法、選擇的激勵(lì)函數(shù)等都會對模型預(yù)測性能產(chǎn)生較大的影響;②計(jì)算復(fù)雜性會隨著神經(jīng)元個(gè)數(shù)的增長而快速增長;③容易出現(xiàn)過度擬合。Cai等在大量對比實(shí)驗(yàn)的基礎(chǔ)上指出:大多數(shù)情況下,神經(jīng)網(wǎng)絡(luò)方法很難得出滿意的量化預(yù)測結(jié)果[16]。
Lyu等在進(jìn)行了多輪次實(shí)驗(yàn)的基礎(chǔ)上得出:通過綜合多個(gè)經(jīng)典模型進(jìn)行的預(yù)測,較單個(gè)經(jīng)典模型預(yù)測的效果更好,而且抗數(shù)據(jù)“噪聲”能力強(qiáng),不但對短期預(yù)測有效,長期預(yù)測效果更為明顯[2,17]。多模型綜合預(yù)測具有更高的預(yù)測精度,且穩(wěn)健性好。之后的研究人員先后采用聚類方法[18-19]、貝葉斯方法[20]、神經(jīng)網(wǎng)絡(luò)[21-24]、時(shí)間序列[25-26]、組合評價(jià)[27-28]等用于軟件可靠性多模型綜合預(yù)測,取得了良好的效果。然而以上方法均是靜態(tài)賦權(quán),將多個(gè)經(jīng)典模型的預(yù)測性能進(jìn)行綜合,缺乏動態(tài)考慮。Bev Littlewood通過研究發(fā)現(xiàn)了軟件可靠性預(yù)測中“變點(diǎn)”的存在,即在一個(gè)失效數(shù)據(jù)集中從失效時(shí)刻1至失效時(shí)刻20大致可以用一個(gè)模型來描述,從失效時(shí)刻21至失效時(shí)刻60則可以用另一個(gè)模型來描述[29],因此不同的經(jīng)典模型在不同的時(shí)期預(yù)測效果不一樣,需要動態(tài)的賦權(quán)來綜合經(jīng)典模型的預(yù)測性能,以消除數(shù)據(jù)噪聲、提高預(yù)測算法的穩(wěn)定性和魯棒性。
本文提出了一種基于信息熵的軟件可靠性多模型動態(tài)預(yù)測方法,采用固定步長滑動窗口的策略,運(yùn)用信息熵的方法動態(tài)地對各經(jīng)典模型的預(yù)測結(jié)果進(jìn)行信息融合,更準(zhǔn)確地預(yù)測軟件的可靠性。
軟件可靠性多模型綜合預(yù)測問題可描述為
針對該組合預(yù)測問題,首先確定參與預(yù)測的經(jīng)典模型,然后確定各單個(gè)經(jīng)典模型的權(quán)重,即可計(jì)算出多模型綜合預(yù)測值。因此,如何計(jì)算各經(jīng)典模型的權(quán)重是解決問題的關(guān)鍵。
2.1權(quán)重確定的方法
軟件可靠性綜合預(yù)測最關(guān)鍵的環(huán)節(jié)之一是各單個(gè)經(jīng)典模型權(quán)重的計(jì)算,目前關(guān)于權(quán)重確定的方法可以歸納為靜態(tài)賦權(quán)方法和動態(tài)賦權(quán)方法。Bev Littlewood的研究表明,不能期望用某一個(gè)模型來描述軟件的失效過程,并提出了“變點(diǎn)”的思想。因此,對于軟件可靠性綜合預(yù)測,采用動態(tài)賦權(quán)法能夠取得更理想的預(yù)測效果。本文采用固定步長滑動窗口的動態(tài)賦權(quán)方法。
2.2基于信息熵的權(quán)重計(jì)算
若用m個(gè)單一經(jīng)典模型進(jìn)行預(yù)測,對每個(gè)單一經(jīng)典模型采用n個(gè)指標(biāo)進(jìn)行評價(jià),得評價(jià)矩陣
式中:A為m個(gè)單一模型,n個(gè)指標(biāo)的評價(jià)矩陣;aij為第i個(gè)經(jīng)典模型的第j個(gè)指標(biāo)的評價(jià)值。
對評價(jià)矩陣中所有元素進(jìn)行歸一化,得歸一化評價(jià)矩陣
其中
則由信息熵定義知,第i個(gè)經(jīng)典模型的信息熵為
其中:Si為第i個(gè)經(jīng)典模型的信息熵;bij是第i個(gè)經(jīng)典模型第j個(gè)指標(biāo)的評價(jià)值在m個(gè)模型中所占的比重。
信息熵用來測度系統(tǒng)紊亂程度,因此經(jīng)典模型在綜合預(yù)測中的擾動程度可以用該模型的信息熵來衡量:信息熵越大,帶來的擾動就越大,則該模型獲得的綜合預(yù)測權(quán)重應(yīng)該越小。因此,第i個(gè)經(jīng)典模型在綜合預(yù)測中的權(quán)重為
3.1一般步驟
基于信息熵的軟件可靠性多模型動態(tài)預(yù)測是在Lyu提出的軟件可靠性多模型綜合預(yù)測思想的基礎(chǔ)上,融入“變點(diǎn)”的思想,采用信息熵的方法動態(tài)地對經(jīng)典模型的預(yù)測結(jié)果進(jìn)行信息融合,其步驟如下:
Step1:選擇經(jīng)典模型;
Step2:確定固定步長h,令t=h;
Step3:選擇模型預(yù)測效果的評價(jià)指標(biāo);
Step4:采用各單個(gè)經(jīng)典模型,分別計(jì)算得出0~T時(shí)刻預(yù)測軟件失效數(shù)序列(T是一個(gè)給定的較長時(shí)間,t為某個(gè)時(shí)刻,t包含于[0,T]);
Step5:根據(jù)各單個(gè)經(jīng)典模型t-h+1到t時(shí)刻預(yù)測軟件失效數(shù)和實(shí)際失效數(shù),采用信息熵的方法計(jì)算預(yù)測t+1時(shí)刻軟件失效數(shù)時(shí)各單個(gè)經(jīng)典模型的權(quán)重wi,t+1;
Step6:利用Step5確定的權(quán)重對t+1時(shí)刻的軟件失效數(shù)進(jìn)行綜合預(yù)測;
Step7:令t=t+1,返回Step5。
3.2模型預(yù)測效果評價(jià)指標(biāo)
對軟件可靠性模型預(yù)測效果進(jìn)行評價(jià)最主要的是看模型的有效性,它可以用定量的方法來測量。本文采用的評價(jià)指標(biāo)如下。
①平均絕對誤差:模型預(yù)測的誤差均值,只能針對同一數(shù)據(jù)進(jìn)行比較。平均絕對誤差越小,模型的預(yù)測效果越好。
②平均絕對誤差百分比:平均絕對誤差百分比越小,模型的預(yù)測效果越好。
③均方誤差:模型預(yù)測值和實(shí)際值距離,均方誤差值越小,模型的擬合度越高,預(yù)測性能越好。
④均方誤差百分比:均方誤差百分比越小,模型的擬合度越高,預(yù)測性能越好。
⑤Pearson相關(guān)系數(shù):表示實(shí)際序列與預(yù)測序列曲線相似程度,其值在0~1,Pearson相關(guān)系數(shù)越大,模型的預(yù)測效果越好。
前4項(xiàng)評價(jià)指標(biāo)屬于損失性指標(biāo),第5項(xiàng)指標(biāo)屬于效益性指標(biāo),為了便于進(jìn)行綜合評價(jià),將第5項(xiàng)指標(biāo)變換為損失性指標(biāo)R′。
3.3實(shí)例分析
試驗(yàn)數(shù)據(jù):選取Lyu提供的數(shù)據(jù)包[30]中一軟件失效數(shù)據(jù)作為實(shí)例進(jìn)行預(yù)測分析,這組數(shù)據(jù)是在實(shí)際軟件工程中獲取的軟件可靠性數(shù)據(jù)。
經(jīng)典模型選擇:選用 JM、GO、LV、YO 4個(gè)經(jīng)典模型。它們都有很好的預(yù)測效果,并在工程中有廣泛的應(yīng)用。其中:JM是馬爾科夫過程模型,GO和YO是非齊次泊松過程模型,LV是貝葉斯模型,GO、LV模型預(yù)測結(jié)果比較樂觀,JM、YO模型預(yù)測結(jié)果有悲觀也有樂觀,4個(gè)模型的預(yù)測偏好正好可以相互抵消。
單個(gè)經(jīng)典模型預(yù)測效果評價(jià)指標(biāo):采用3.2節(jié)確定的5項(xiàng)指標(biāo)。
采用本文提出的預(yù)測方法,分別固定步長為3、4、5進(jìn)行預(yù)測,其預(yù)測結(jié)果見表1,各模型預(yù)測性能評價(jià)見表2。
表1 軟件失效預(yù)測數(shù)據(jù)Table 1 Predicted results of software failure data
從表1可以看出,該失效數(shù)據(jù)存在“變點(diǎn)”的問題,在第5~7個(gè)時(shí)刻,JM和LV模型預(yù)測相對誤差較小,比較適用;從第8~12個(gè)時(shí)刻,LV和GO模型預(yù)測相對誤差較小,比較適用;13個(gè)時(shí)刻點(diǎn)后沒有特別合適的模型。
如表2、圖1所示,基于信息熵的軟件可靠性多模型動態(tài)預(yù)測方法,采用固定步長滑動窗口的策略,不斷感知數(shù)據(jù)的變化,減小數(shù)據(jù)噪聲,對各時(shí)刻各分模型的權(quán)重進(jìn)行調(diào)整,使得整個(gè)測試過程中對失效數(shù)的預(yù)測更為準(zhǔn)確,體現(xiàn)出了比單個(gè)經(jīng)典模型更好的預(yù)測性能。然而隨著固定步長h的增大,帶來的數(shù)據(jù)噪聲也越大,預(yù)測性能反而有所降低,因此需要確定合適的步長以提高預(yù)測效果。
表2 各模型預(yù)測性能評價(jià)Table 2 Estimated performance evaluation of models
圖1 各模型預(yù)測性能比較Fig.1 Estimated performance comparison of models
綜合以上實(shí)例分析可以得出:多模型綜合預(yù)測方法融合了諸多經(jīng)典模型的優(yōu)勢,能夠提高預(yù)測算法的穩(wěn)定性和魯棒性,且具備更高的預(yù)測精度。
針對軟件可靠性預(yù)測中的“變點(diǎn)”問題,本文采用固定步長滑動窗口的動態(tài)賦權(quán)策略,運(yùn)用信息熵方法將多個(gè)經(jīng)典模型的預(yù)測性能進(jìn)行融合,提出了基于信息熵的軟件可靠性多模型動態(tài)預(yù)測方法。試驗(yàn)分析表明,在步長合適的情況下,該方法預(yù)測性能顯著地優(yōu)于單個(gè)經(jīng)典模型的預(yù)測性能。
[1]蔡開元.軟件可靠性工程基礎(chǔ)[M].北京:清華大學(xué)出版社,1995.
[2]Lyu M R,Nikora A.Applying reliability models more effectively[J].IEEE Software,1992,9(4):43-52.
[3]王二威,侯福均,鄭述招.基于隸屬度的軟件可靠性綜合預(yù)測方法[J].微型機(jī)與應(yīng)用,2011,30(15):4-7.
[4]崔正斌,湯光明,樂峰.遺傳優(yōu)化支持向量機(jī)的軟件可靠性預(yù)測模型[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(36):71 -74.
[5]靳昂,江建慧,樓俊剛,等.基于灰色模型的軟件可靠性建模 [J].計(jì)算機(jī)應(yīng)用,2009,29(3):690-694.
[6]鄒豐忠,李傳湘.軟件可靠性混沌模型[J].計(jì)算機(jī)學(xué)報(bào),2001,24(3):281-291.
[7]張柯,張德平,汪帥.軟件可靠性混沌神經(jīng)網(wǎng)絡(luò)模型[J].計(jì)算機(jī)科學(xué),2014,41(4):172-177.
[8]張永強(qiáng),孫勝娟.基于未確知理論的軟件可靠性建模[J].軟件學(xué)報(bào),2006,27(8):1681-1687.
[9]Karunanithi N,Malaiya Y K,Whitley D.Prediction of software reliability using neural networks[C]//1991 IEEE International Symposium on Software Reliability Engineering. IEEE,1991:124-130.
[10]Karunanithi N,Whitley D,Malaiya Y K.Prediction of software reliability using connectionist models[J].IEEE Transactions on Software Engineering,1992,18(7):563-574.
[11]Karunanithi N,Whitley D,Malaiya Y K.Using neural networks in reliability prediction[J].IEEE Software,1992,9(4):53-59.
[12]Karunanithi N,Whitley D.Prediction of software reliability using feedforward recurrent neural nets[C]//1992 International Joint Conference on Neural Networks.IEEE,1992:800-805.
[13]Khoshgoftaar T M,Pandya A S,More H B.A neural network approach for predicting software development faults[C]// Proceedings of the Third International Symposium on Software Reliability Engineering.IEEE,1992:83-89.
[14]Khoshgoftaar T M,Szabo R M.Using neural networks to predict software faults during testing[J].IEEE Trasactions on Reliability,1996,45(3):456-462.
[15]Sitte R.Comparison of software-reliability-growth predictions: Neural networks vs parametric-recalibration[J].IEEE Trasactions on Reliability,1999,48(3):285-291.
[16]Cai K Y,Cai L,Wang W D,et al.On the neural network approach in software reliability modeling[J].The Journal of Systems and Software,2001,58(1):47-62.
[17]Lyu M R,Nikora A.CASRE:A computer-aided software reliability estimation tool[C]//International Workhop on Computer-Aided Software Engineering Proceedings.IEEE,1992:264-275.
[18]馬颯颯,陳自力,趙守偉.軟件可靠性及可靠性多模型綜合研究[J].微計(jì)算機(jī)信息,2006,22(18):263-265.
[19]緱艷陽.基于模型聚類的軟件可靠性混合模型研究[J].甘肅聯(lián)合大學(xué)學(xué)報(bào):自然科學(xué)版,2013,27(5):89-92.
[20]鄒豐忠,徐仁佐.軟件可靠性多模型綜合評估[J].同濟(jì)大學(xué)學(xué)報(bào),2002,30(10):1183-1185.
[21]Su Y S,Huang C Y,Chen Y S,et al.An artificial neuralnetwork-based approach to software reliability assessment[C]//TENCON 2005IEEE,Region 10Conference. IEEE,2005:1-6.
[22]Su Y S,Huang C Y.Neural-network-based approaches for software reliability estimation using dynamic weighted combinational models[J].The Journal of Systems and Software,2007,80(4):606-615.
[23]尹乾.基于神經(jīng)網(wǎng)絡(luò)的軟件可靠性模型研究[D].北京:北京師范大學(xué),2006.
[24]王高祖,李偉華,徐艷玲.基于神經(jīng)網(wǎng)絡(luò)組合模型的軟件可靠性評估研究 [J].計(jì)算機(jī)仿真,2010,27(8):176 -180.
[25]滕云龍,師奕兵,康榮雷.軟件可靠性組合預(yù)測模型研究[J].計(jì)算機(jī)應(yīng)用,2008,28(12):3092-3094.
[26]李克文,劉洪太.基于時(shí)序數(shù)據(jù)的軟件可靠性模型組合新方法[J].計(jì)算機(jī)應(yīng)用,2014,34(S2):208-210,249.
[27]韓坤,吳緯,曹軍海,等.基于組合模型的軟件可靠性預(yù)計(jì)方法[J].系統(tǒng)工程與電子技術(shù),2013,35(12):2661-2664.
[28]林琳,馮喆.空管自動化系統(tǒng)軟件可靠性的模糊綜合評價(jià) [J].沈陽工業(yè)大學(xué)學(xué)報(bào),2014,36(6):694-700.
[29]Phame H.Reliability Handbook[K].NewYork:Springer Verlag,2002.
[30]Lyu M R.Handbook of software reliability engineering/software reliability tools and data[BD/OL].(2013-11-26). http://www.cse.cuhk.edu.hk/~lyu/book/reliability/.
Multi-model dynamic prediction method of software reliability based on information entropy
WANG Er-wei1,QU Ying2,WU Qi-zong1,3
(1.Zhuhai Campus,Beijing Institute of Technology,Zhuhai 519088,China;2.Department of Economics and Management,Hebei University of Science and Technology,Shijiazhuang 050018,China;3.Department of Management and E-conomics,Beijing Institute of Technology,Beijing 100081,China)
Multi-model dynamic prediction method of software reliability based on information entropy was proposed to solve the inconsistency problem and“change points”of classical prediction models.Based on information entropy theory,using dynamic weighted strategy by fixed step sliding window,the combined prediction method of software reliability was obtained which enhanced the prediction results by fushing the prediction performances of classical models dynamically.Test results show that the multi-model dynamic prediction method of software reliability based on information entropy is better than classical ones under the right step condition.
prediction of software reliability;dynamic weight;combinational models;information entropy
TP311
A
1674-9057(2016)03-0603-06
10.3969/j.issn.1674-9057.2016.03.030
2015-06-30
國家自然科學(xué)基金項(xiàng)目(71301044)
王二威 (1985—),男,碩士,講師,管理科學(xué)與工程專業(yè),wodezazhi@126.com。
引文格式:王二威,瞿英,吳祈宗.基于信息熵的軟件可靠性多模型動態(tài)預(yù)測方法[J].桂林理工大學(xué)學(xué)報(bào),2016,36(3):603-608.