国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于優(yōu)化SVR 的軍用軟件可靠性預(yù)測方法*

2020-01-08 03:33馬振宇劉福勝
火力與指揮控制 2019年11期
關(guān)鍵詞:軍用度量網(wǎng)格

馬振宇,張 威,吳 緯,韓 坤,劉福勝

(1.陸軍裝甲兵學院,北京 100072;2.解放軍63963 部隊,北京 100071)

0 引言

當今信息化、現(xiàn)代化發(fā)展迅猛,部隊為了保證自身的戰(zhàn)斗力不受削減,適應(yīng)新時代的作戰(zhàn)需求,也在不斷地普及信息化,因此,許多規(guī)模較大,復(fù)雜程度較高的系統(tǒng)軟件都嵌入到部隊裝備當中,例如火控系統(tǒng)、制導(dǎo)系統(tǒng)以及控制系統(tǒng)等。為了保證軍用軟件和裝備在一起使用時,不會出現(xiàn)由于軟件的失效而導(dǎo)致裝備無法使用的情況,這就要求軍用軟件自身具有較高的可靠性[1-3]。如果軟件在備裝部隊之前,能夠及時準確地預(yù)估軟件可靠性,就能夠保障軟件今后的正常使用。

文中首先通過相關(guān)分析,找到對軍用軟件可靠性影響較大的5 個度量元。然后通過數(shù)據(jù)歸一化以及隨機排序的方法對這5 個度量元進行數(shù)據(jù)預(yù)處理。接著利用網(wǎng)格尋優(yōu)法對SVR 算法中的參數(shù)進行尋優(yōu),以此為基礎(chǔ)構(gòu)建出基于優(yōu)化SVR 算法的軍用軟件可靠性預(yù)測方法。最后通過案例分析,證明了該方法的可行性和有效性。

1 相關(guān)準備工作

1.1 度量元采集

軟件一般含有多種屬性,軟件度量是度量對軟件自身可靠性造成影響的屬性,而這些屬性一般稱為軟件度量元[4]。度量元可以用來處理模塊缺陷分類、模塊缺陷數(shù)分類和遺留等問題,因此,通過選擇度量元,找到與軍用軟件可靠性指標之間內(nèi)在的聯(lián)系,構(gòu)建出軍用軟件可靠性預(yù)測模型,是提升軟件可靠性行之有效的辦法。

本文使用靜態(tài)分析工具Logiscope 獲取軟件度量元數(shù)據(jù)[5]。Logiscope 是一款優(yōu)秀的軟件靜態(tài)分析工具,能夠采集應(yīng)用程序級、文件級、類級和函數(shù)級4 級代碼度量,共有44 個度量元,其中應(yīng)用程序級11 個、文件級10 個、類級11 個、函數(shù)級12 個,如表1 所示。

1.2 數(shù)據(jù)預(yù)處理

在進行軍用軟件可靠性預(yù)測之前,需對相關(guān)數(shù)據(jù)進行預(yù)處理,避免在預(yù)測過程中由于某些“問題點”之間數(shù)值差過大,造成結(jié)果的不理想。數(shù)據(jù)歸一化就是把原始數(shù)據(jù)規(guī)范到[0,1]這個區(qū)間的過程,其表達式如下所示:

其中,valuemax為原始數(shù)據(jù)中最大值;valuemin為原始數(shù)據(jù)中的最小值。

另外,樣本數(shù)據(jù)的不同排序一定會導(dǎo)致不同預(yù)測結(jié)果的發(fā)生。采用隨機取樣法,對訓練集與測試集進行隨機排序,一是可以保證預(yù)測結(jié)果不失一般性,更具有說服力;二是避免因為訓練集和測試集中的“問題點”影響實驗結(jié)果的準確性。

1.3 相關(guān)性分析

為了取得較好的預(yù)測效果,需要對度量元進行優(yōu)選,本文通過相關(guān)性分析來選擇度量元[6-7]。通用的有兩種相關(guān)性分析指標,一種是Pearson 相關(guān)系數(shù),一種是Spearman 秩相關(guān)系數(shù)[8-9]。Pearson 相關(guān)系數(shù)適用于有線性關(guān)系的數(shù)據(jù),且整體上滿足正態(tài)分布的連續(xù)變量;Spearman 秩相關(guān)系數(shù)對原始變量的分類不作硬性規(guī)定,也就是說不需要符合任意分布規(guī)律,就可以通過秩相關(guān)系數(shù)很好地量化彼此間的關(guān)聯(lián)程度。因此,該方法通用性、適用性、靈活性很好,在當今的領(lǐng)域里得到廣泛應(yīng)用。本文提取的度量元和軍用軟件可靠性指標沒有明確的線性關(guān)系,因此,本文選擇Spearman 秩相關(guān)系數(shù)進行分析。其計算表達式如下:

表1 四級代碼度量元

相關(guān)程度依據(jù)相關(guān)系數(shù)的絕對值進行分類,一般分成5 個等級,如表2 所示。當r>0,說明度量元和軍用軟件可靠性指標關(guān)系為正相關(guān);反之r<0,則為負相關(guān)。特別指出:當r=1,則為完全正相關(guān);r=-1,則為完全負相關(guān);當r=0,則不存在關(guān)系。

表2 相關(guān)程度等級劃分

2 基于優(yōu)化SVR 的軟件可靠性預(yù)測模型

2.1 SVR 算法的預(yù)測模型

支持向量機是由Corinna Cortes 和Vapnik 的科研團隊在20 世紀末初次提出的有別于其他機器學習的算法[10-12],其方法在使用初期主要用于處理模式識別問題,隨后它在處理小樣本、非線性以及高維度空間識別里體現(xiàn)出許多獨有的優(yōu)勢[13]。Vapnik在接下來的科研工作里,提出損失函數(shù)概念,把SVM 應(yīng)用到非線性回歸估計和曲線擬合當中,得到一種專門針對曲線擬合回歸估計的模型算法,即ε不敏感支持向量回歸[14]。該算法在非線性這一類問題當中有著很好的實驗結(jié)果,所以SVR 逐漸成為SVM 函數(shù)回歸領(lǐng)域的研究熱點。

其中,w 是權(quán)重系數(shù),b 為偏置項。

先定義由Vapnik 提出的ε 不敏感損失函數(shù):

其中,ε 稱作不敏感系數(shù),其主要用于調(diào)控擬合度。

不妨假設(shè)全部訓練集的擬合誤差率最大為ε(所有輸入訓練集的點到高維空間平面的距離最大為ε),即:

使用相同的優(yōu)化算法求解對偶最優(yōu)問題:

從而得到最終的最優(yōu)回歸估計函數(shù):

2.2 參數(shù)尋優(yōu)

SVR 算法中包含許多種影響計算結(jié)果的參數(shù),并且這些參數(shù)都有默認的初始值[15]。然而在尋找具體問題的最優(yōu)值時,設(shè)定的參數(shù)值往往不能滿足實際的需求。因此,需要針對具體問題進行參數(shù)尋優(yōu),找到最優(yōu)值。

本文主要對SVR 算法中兩個比較重的參數(shù)C和g 進行尋優(yōu)。C 是懲罰因子,表示的是對誤差的寬容度。其值越大,表明越不能接受出現(xiàn)誤差,容易過擬合;其值越小,容易出現(xiàn)欠擬合。C 值過大或者過小都會導(dǎo)致泛化能力變低。g 是調(diào)節(jié)RBF 的核函數(shù)中σ 的參數(shù),它決定著數(shù)據(jù)映射到新的特征空間以后的分布。其值越大,支持向量越少,反之,則越多。支持向量的個數(shù)決定著模型預(yù)測的準確性。這兩個參數(shù)沒有確定的最優(yōu)值,需要依據(jù)具體問題尋找最優(yōu)值。

網(wǎng)格尋優(yōu)法是一種遍歷搜索的方法,其根據(jù)步長將數(shù)值分割成若干個小網(wǎng)格塊,再將所有分割出來的網(wǎng)格塊進行分組并取盡它所有的可能值。通過這種遍歷的方法找到最優(yōu)的一組值。該方法的優(yōu)點是每個網(wǎng)格相互獨立,便于并行計算。具體尋優(yōu)過程如下:

第1 步:對參數(shù)C 和g 進行初始化,并組成二維數(shù)組對(C,g)。同時給定分割步長的長度。

第2 步:根據(jù)確定的分割步長,將參數(shù)C 和g分別分割成m 和n 個數(shù)值。

第3 步:將分割出的數(shù)值依次進行相互配對,共形成m*n 個二維數(shù)組對(C,g)。

第4 步:將每一組二維數(shù)組對,帶入SVR 模型中,得到預(yù)測結(jié)果。

第5 步:直到將所有二維數(shù)組對都遍歷完成以后,尋找預(yù)測結(jié)果中精度最高值所對應(yīng)的二維數(shù)組對,作為參數(shù)的最優(yōu)值。

3 實驗結(jié)果及分析

實驗原始數(shù)據(jù)來自通用裝備保障軟件評測中心的實測結(jié)果,通過采用LogiScope 對33 組原始數(shù)據(jù)進行度量,得到4 級44 個度量元。通過Spearman相關(guān)系數(shù)分析與軟件可靠性指標的相關(guān)系數(shù),結(jié)果如表3 所示。

本文選擇與軟件可靠性指標的相關(guān)系數(shù)絕對值大于0.4(中等相關(guān))以上的度量元,共有5 個:ap_cof,struc_pg,cu_cdusers,cu_cdused 和in_noc,即耦合因子、違反結(jié)構(gòu)化編程數(shù)量、使用某個類的類數(shù)量、某個類使用的類數(shù)量和子類數(shù)量。

對33 組軟件數(shù)據(jù)進行隨機取樣,選取出22 組數(shù)據(jù)作為訓練集,剩余的作為測試集。為了很好地衡量該算法預(yù)測效果,本文選取均方根誤差,平均絕對誤差,相對平方根誤差和相對絕對誤差這4 個指標進行分析。

本文首先分別用ε-SVR 模型和v-SVR 模型進行軍用軟件可靠性的預(yù)測。接著通過網(wǎng)格尋優(yōu)法對v-SVR 預(yù)測模型中(C,g)參數(shù)進行搜索,預(yù)期找到參數(shù)的最優(yōu)值,最優(yōu)值如圖1 所示,其中C 的最優(yōu)值是8,g 的最優(yōu)值為0.5。最后將尋優(yōu)后的v-SVR模型和其他5 種機器學習算法的實驗結(jié)果進行對比,如下頁表4 所示。

表3 度量元和軟件可靠性指標的相關(guān)性

圖1 SVR 參數(shù)尋優(yōu)圖

表4 軟件可靠性指標預(yù)測結(jié)果分析

通過表4 可以得到以下結(jié)果:

1)v-SVR 模型較ε-SVR 模型預(yù)測結(jié)果更優(yōu),證明了v-SVR 模型具有使ε 自動最小化,并且可以根據(jù)數(shù)據(jù)集調(diào)整精度級別的優(yōu)勢。對v-SVR 模型進行參數(shù)尋優(yōu)后的預(yù)測結(jié)果精度的確有所提高,說明了優(yōu)化SVR 算法的有效性。

2)與其他算法相比,本文的優(yōu)化SVR 算法在預(yù)測軍用軟件可靠性方面有著較大的優(yōu)勢。優(yōu)化后的SVR 算法在4 個指標評價方面的誤差值都是最小的。

3)相關(guān)系數(shù)表示的是度量元和可靠性指標之間的相關(guān)程度。相關(guān)系數(shù)越大,度量元與軟件可靠性指標相關(guān)性越大。由于不同算法構(gòu)建預(yù)測模型的機理不同,所以預(yù)測精度和相關(guān)系數(shù)之間不存在正比關(guān)系。但是在相似的算法當中,如支持向量回歸算法,其預(yù)測效果越精準,度量元和軟件可靠性指標相關(guān)程度越大。

4 結(jié)論

本文首先通過使用LogiScope 軟件,對實測的33 組軟件進行度量元提取,共獲得4 級44 個度量元。然后對提取出來的度量元進行數(shù)據(jù)預(yù)處理,經(jīng)過相關(guān)性分析,找出5 個與軍用軟件可靠性關(guān)聯(lián)程度較大的度量元。然后通過網(wǎng)格尋優(yōu)法對SVR 算法中的參數(shù)進行尋優(yōu),在此基礎(chǔ)之上,構(gòu)建出基于優(yōu)化SVR 算法的軍用軟件可靠性預(yù)測方法。最后通過案例分析,證明了網(wǎng)格優(yōu)化SVR 參數(shù)在軟件可靠性預(yù)測方面的可行性和有效性。

本文采用的樣本數(shù)為33 組,相對而言,樣本數(shù)偏少,在今后的研究工作中,需要進一步收集測試樣本,提高模型的預(yù)測精度;對更多參數(shù)進行組合優(yōu)化,同時簡化算法本身,提高運算效率。

猜你喜歡
軍用度量網(wǎng)格
鮑文慧《度量空間之一》
國外超疏水材料最新進展及其軍用潛力分析
網(wǎng)格架起連心橋 海外僑胞感溫馨
威力無比的軍用霰彈槍
追逐
突出知識本質(zhì) 關(guān)注知識結(jié)構(gòu)提升思維能力
度 量
三參數(shù)射影平坦芬斯勒度量的構(gòu)造
猜謎
邯郸市| 铜山县| 汉寿县| 诸城市| 永康市| 房产| 南木林县| 綦江县| 鲁山县| 宝坻区| 邻水| 元氏县| 五莲县| 清水县| 邵武市| 内江市| 赤水市| 新竹市| 华亭县| 泊头市| 阿城市| 金山区| 葫芦岛市| 齐齐哈尔市| 三原县| 罗平县| 连州市| 宜兴市| 米泉市| 铜陵市| 青铜峡市| 安仁县| 图们市| 八宿县| 稷山县| 乐至县| 兴化市| 清丰县| 昭觉县| 临颍县| 新宁县|