国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

艦船裝備維修費(fèi)預(yù)測(cè)的數(shù)據(jù)預(yù)處理技術(shù)研究

2010-03-06 03:24:38魏汝祥于偉宗
中國(guó)艦船研究 2010年6期
關(guān)鍵詞:維修費(fèi)原始數(shù)據(jù)艦船

謝 力 魏汝祥 于偉宗 黎 利

1海軍工程大學(xué) 裝 備經(jīng)濟(jì)管理系,湖北 武 漢 430033

2中國(guó)人民解放軍92848部隊(duì)財(cái)務(wù)辦,遼寧 大 連 116041

3中國(guó)人民解放軍91224部隊(duì)辦公室,上海 200235

艦船裝備維修費(fèi)預(yù)測(cè)的數(shù)據(jù)預(yù)處理技術(shù)研究

謝 力1魏汝祥1于偉宗2黎 利3

1海軍工程大學(xué) 裝 備經(jīng)濟(jì)管理系,湖北 武 漢 430033

2中國(guó)人民解放軍92848部隊(duì)財(cái)務(wù)辦,遼寧 大 連 116041

3中國(guó)人民解放軍91224部隊(duì)辦公室,上海 200235

在預(yù)測(cè)艦船裝備維修費(fèi)時(shí),收集足夠多的、準(zhǔn)確的費(fèi)用數(shù)據(jù)是關(guān)鍵。根據(jù)艦船裝備維修費(fèi)的影響因素,將艦船裝備維修費(fèi)預(yù)測(cè)的相關(guān)原始數(shù)據(jù)分為基礎(chǔ)數(shù)據(jù)、使用數(shù)據(jù)、維修數(shù)據(jù)和宏觀經(jīng)濟(jì)數(shù)據(jù),確定了相應(yīng)的數(shù)據(jù)收集渠道。分析了收集到的原始數(shù)據(jù)可能存在噪聲、缺失或異常數(shù)據(jù)、沖擊擾動(dòng)數(shù)據(jù)、不一致數(shù)據(jù)的問(wèn)題,針對(duì)性地提供了相應(yīng)的數(shù)據(jù)預(yù)處理技術(shù),經(jīng)過(guò)處理后的數(shù)據(jù)可以為艦船裝備維修費(fèi)預(yù)測(cè)提供良好基礎(chǔ),進(jìn)一步提高預(yù)測(cè)的有效性。

艦船裝備;維修費(fèi)預(yù)測(cè);數(shù)據(jù)預(yù)處理

1 引言

在艦船裝備維修費(fèi)預(yù)測(cè)中,存在的問(wèn)題之一是很難收集到足夠多的、準(zhǔn)確的費(fèi)用數(shù)據(jù)。因此在費(fèi)用預(yù)測(cè)之前應(yīng)做好數(shù)據(jù)的收集與預(yù)處理。如果沒(méi)有充足的、有價(jià)值的數(shù)據(jù),費(fèi)用預(yù)測(cè)將很難達(dá)到預(yù)期的效果。

數(shù)據(jù)預(yù)處理是應(yīng)用模型對(duì)數(shù)據(jù)處理分析的第一步。數(shù)據(jù)預(yù)處理期望達(dá)到的目的主要有4個(gè)[1]:1)提高數(shù)據(jù)的質(zhì)量。通過(guò)對(duì)數(shù)據(jù)的預(yù)處理,發(fā)現(xiàn)不符合要求的數(shù)據(jù)并將其剔除,從而提高數(shù)據(jù)的整體質(zhì)量;2)轉(zhuǎn)換數(shù)據(jù)格式。有的模型要求一定格式的數(shù)據(jù),對(duì)于不符合格式要求的數(shù)據(jù),可以通過(guò)對(duì)數(shù)據(jù)格式的變換,達(dá)到模型的要求;3)提高處理效率。這是數(shù)據(jù)預(yù)處理的主要目的。通常數(shù)據(jù)預(yù)處理后,數(shù)據(jù)一般格式更為整齊,也更加簡(jiǎn)單,因此會(huì)提高模型的處理效率;4)進(jìn)行簡(jiǎn)單的數(shù)據(jù)分析。一些簡(jiǎn)單的數(shù)據(jù)分析功能也歸入到數(shù)據(jù)預(yù)處理模型中,比如簡(jiǎn)單統(tǒng)計(jì)量的計(jì)算,自定義函數(shù)等。目前,數(shù)據(jù)預(yù)處理常用于許多領(lǐng)域的數(shù)據(jù)分析中,如化工試驗(yàn)和處理[2-4]、變量選擇[5]、色譜分析[6-7]、信號(hào)處理[8]、模式識(shí)別[9]、曲線擬合[10]、數(shù)據(jù)挖掘[11],以及預(yù)測(cè)[12-14]、決策[15]等方面。 而其中涉及到的數(shù)據(jù)預(yù)處理技術(shù),都是從具體的背景出發(fā),從數(shù)據(jù)分析和建模需要的角度對(duì)特定的數(shù)據(jù)進(jìn)行的預(yù)處理,研究相對(duì)片面,并不適于推廣應(yīng)用。

本文將針對(duì)艦船裝備維修費(fèi)預(yù)測(cè)收集到的原始數(shù)據(jù)中可能出現(xiàn)的幾種問(wèn)題,嘗試應(yīng)用不同的數(shù)據(jù)預(yù)處理技術(shù),為艦船裝備維修費(fèi)的預(yù)測(cè)提供良好的數(shù)據(jù)。

2 原始數(shù)據(jù)的收集

艦船裝備維修費(fèi)具有時(shí)間跨度大、影響因素多及費(fèi)用數(shù)據(jù)離散等特點(diǎn)。原始數(shù)據(jù)的獲取是艦船裝備維修費(fèi)預(yù)測(cè)過(guò)程中最困難、最花費(fèi)時(shí)間的活動(dòng)之一。在進(jìn)行原始數(shù)據(jù)的收集前,首先必須對(duì)所需的數(shù)據(jù)進(jìn)行分類,然后根據(jù)不同數(shù)據(jù)的類型確定數(shù)據(jù)收集的來(lái)源。根據(jù)艦船裝備維修費(fèi)的影響因素,可以將艦船裝備維修費(fèi)原始數(shù)據(jù)分為:基礎(chǔ)數(shù)據(jù)、使用數(shù)據(jù)、維修數(shù)據(jù)和宏觀經(jīng)濟(jì)數(shù)據(jù)。

1)基礎(chǔ)數(shù)據(jù)

艦船裝備維修費(fèi)預(yù)測(cè)的基礎(chǔ)數(shù)據(jù),是指艦船裝備生產(chǎn)后交付部隊(duì)使用時(shí)所具有的一些基本數(shù)據(jù),它不隨艦船裝備的使用而發(fā)生變化。如艦船裝備的造價(jià)、排水量、下水時(shí)間以及艦船裝備的固有可靠性、維修性等。

2)使用數(shù)據(jù)

艦船裝備維修費(fèi)預(yù)測(cè)的使用數(shù)據(jù),是指在艦船裝備的使用過(guò)程中反映艦船裝備所處狀態(tài)的數(shù)據(jù),它隨著艦船裝備的使用而發(fā)生變化,是動(dòng)態(tài)性的數(shù)據(jù)。如艦船裝備的新舊程度和使用強(qiáng)度等。

3)維修數(shù)據(jù)

艦船裝備維修費(fèi)預(yù)測(cè)的維修數(shù)據(jù),是指在維修過(guò)程中反映艦船裝備維修情況的數(shù)據(jù)以及各分項(xiàng)維修費(fèi)用的具體數(shù)據(jù)。如艦船裝備的維修級(jí)別、維修輪次、維修批量、維修地域、維修制度等。

4)宏觀經(jīng)濟(jì)數(shù)據(jù)

艦船裝備維修費(fèi)實(shí)質(zhì)上是維修過(guò)程中的一種經(jīng)濟(jì)活動(dòng)的反映,任何經(jīng)濟(jì)活動(dòng)都是在其宏觀經(jīng)濟(jì)條件下進(jìn)行的。艦船裝備維修費(fèi)預(yù)測(cè)的宏觀經(jīng)濟(jì)數(shù)據(jù),是指影響裝備維修費(fèi)的國(guó)家宏觀經(jīng)濟(jì)數(shù)據(jù)。如物價(jià)指數(shù)、反映資金的時(shí)間價(jià)值的基準(zhǔn)利率等。

對(duì)于不同類型的數(shù)據(jù),需要明確其相應(yīng)的數(shù)據(jù)來(lái)源,便于有的放矢地收集數(shù)據(jù)。數(shù)據(jù)類型及相應(yīng)的來(lái)源見(jiàn)表1所示。

表1 數(shù)據(jù)類型及來(lái)源

3 原始數(shù)據(jù)可能存在的問(wèn)題

由于艦船裝備維修費(fèi)預(yù)測(cè)中原始數(shù)據(jù)自身的一些特點(diǎn)以及數(shù)據(jù)收集過(guò)程中的一些特殊因素的影響,收集到的原始數(shù)據(jù)與最終數(shù)據(jù)分析時(shí)所需要的數(shù)據(jù)還存在一些差距,表現(xiàn)在作為統(tǒng)計(jì)過(guò)程,對(duì)數(shù)據(jù)表現(xiàn)形式和完整性的要求是很高的,而直接獲得的數(shù)據(jù)往往達(dá)不到這些要求,也就是收集到的原始數(shù)據(jù)可能存在一些不利于艦船裝備維修費(fèi)預(yù)測(cè)的問(wèn)題。

1)噪聲

由于種種能控制的或不能控制的主客觀條件的影響,以及數(shù)據(jù)傳輸過(guò)程中的錯(cuò)誤等,使收集到的艦船裝備維修費(fèi)原始數(shù)據(jù)中可能會(huì)存在噪聲。排除原始數(shù)據(jù)中噪聲的影響,把真正有用的信息從原始數(shù)據(jù)中提取出來(lái),再對(duì)信息作進(jìn)一步的分析,才能得到更加可靠的艦船裝備維修費(fèi)預(yù)測(cè)結(jié)果。

2)缺失或異常

由于艦船裝備計(jì)劃修理的周期性,收集到的原始數(shù)據(jù)可能是不連續(xù)的,此外,由于資料上的管理不善或數(shù)據(jù)收集者認(rèn)為某些屬性不重要而在數(shù)據(jù)記錄時(shí)忽略等原因也可能造成數(shù)據(jù)的缺失。數(shù)據(jù)的缺失可能會(huì)影響艦船裝備維修費(fèi)預(yù)測(cè)的順利進(jìn)行。由于一些特殊的情況的出現(xiàn),有些原始數(shù)據(jù)可能并不能反映維修費(fèi)變化的基本規(guī)律,也就是維修費(fèi)預(yù)測(cè)中原始數(shù)據(jù)的異常值。這些異常值,可能會(huì)將艦船裝備維修費(fèi)預(yù)測(cè)引導(dǎo)偏離真實(shí)規(guī)律的軌道。

3)沖擊擾動(dòng)

收集到的艦船裝備維修費(fèi)原始數(shù)據(jù),有時(shí)會(huì)由于受到政策和環(huán)境的沖擊擾動(dòng)而失真,亦即艦船裝備維修費(fèi)數(shù)據(jù)序列未能確切地反映維修費(fèi)真實(shí)變化規(guī)律。在這種情況下,如果不事先排除沖擊干擾,而用業(yè)已失真的數(shù)據(jù)直接建模、預(yù)測(cè),則得到的定量預(yù)測(cè)結(jié)果很可能與人們直觀的定性分析結(jié)論大相徑庭,從而使預(yù)測(cè)結(jié)果令人感到難以置信。

4)不一致

由于艦船裝備維修費(fèi)預(yù)測(cè)中的原始數(shù)據(jù)來(lái)源于多個(gè)不同的單位,信息龐雜,采集和加工的方法有別,數(shù)據(jù)描述的格式也各不相同,缺乏統(tǒng)一的標(biāo)準(zhǔn)。在這種情況下,如果不事先對(duì)原始數(shù)據(jù)進(jìn)行處理,就沒(méi)法有效地對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的分析或?qū)е聦?duì)艦船裝備維修費(fèi)的預(yù)測(cè)過(guò)程偏離實(shí)際。

4 數(shù)據(jù)預(yù)處理技術(shù)

根據(jù)上面的分析,由于艦船裝備維修費(fèi)原始數(shù)據(jù)可能會(huì)存在一些問(wèn)題,而影響其維修費(fèi)預(yù)測(cè)。因此,要對(duì)所收集到的數(shù)據(jù)進(jìn)行處理。

4.1 噪聲數(shù)據(jù)的預(yù)處理技術(shù)

造成原始數(shù)據(jù)噪聲的原因有很多,針對(duì)噪聲問(wèn)題,可以采用數(shù)據(jù)的橫向或縱向比較,對(duì)數(shù)據(jù)進(jìn)行平滑處理[16]。橫向比較就是與同時(shí)期的類似裝備的比較,縱向比較就是不同時(shí)期樣本的變化規(guī)律的比較。

1)界限平滑

界限平滑,是指在比較過(guò)程中,通過(guò)設(shè)定一定的范圍(如±10%),當(dāng)某個(gè)變量的數(shù)據(jù)超出(或低于)設(shè)定的范圍,則以該范圍的上限(或下限)來(lái)代替該變量值,以平滑噪聲對(duì)數(shù)據(jù)過(guò)大的影響。

2)指數(shù)平滑

指數(shù)平滑,是指通過(guò)設(shè)定一個(gè)加權(quán)系數(shù),在原始數(shù)據(jù)與相應(yīng)的正常數(shù)據(jù)之間進(jìn)行加權(quán)求和。

式中,α是加權(quán)系數(shù),根據(jù)原始數(shù)據(jù)特征設(shè)定;x0是正常數(shù)據(jù),對(duì)于橫向那個(gè)比較來(lái)說(shuō),它是最相近艦船裝備相應(yīng)的數(shù)據(jù),對(duì)于縱向比較來(lái)說(shuō),它是前一時(shí)期的樣本值。

4.2 缺失值的預(yù)處理技術(shù)

對(duì)于缺失值的處理一般有兩種處理方式:放棄和插值。由于艦船裝備維修費(fèi)樣本數(shù)據(jù)具有小樣本的特征,放棄缺失值會(huì)進(jìn)一步減小原始數(shù)據(jù)的樣本量,這顯然是預(yù)測(cè)者所不愿意的。此外,由于艦船裝備影響因素眾多,不同樣本中因素?cái)?shù)據(jù)的缺失可能是不同的,如果因?yàn)闃颖局袀€(gè)別因素的缺失而放棄整個(gè)樣本,未免代價(jià)太大。因此,對(duì)艦船裝備維修費(fèi)預(yù)測(cè)中缺失值主要考慮插值處理技術(shù)。

插值是指人為地為缺失的數(shù)據(jù)插入一個(gè)數(shù)值,參與運(yùn)算。根據(jù)插值方法的不同,可以有許多種類型。

1)純隨機(jī)插值

這是根據(jù)統(tǒng)計(jì)中的“同等無(wú)知原則”,不考慮所獲得的數(shù)據(jù)的情況,僅根據(jù)可能的選項(xiàng),對(duì)缺失數(shù)據(jù)進(jìn)行隨機(jī)賦值,例如對(duì)于艦船裝備使用強(qiáng)度假設(shè)有4種可能的情況(高、中、一般、低),缺失樣本中具體插什么值應(yīng)當(dāng)由計(jì)算機(jī)隨機(jī)完成,盡量不要有人為因素介入。純隨機(jī)插值沒(méi)有考慮選項(xiàng)實(shí)際的分布情況,如果各個(gè)選項(xiàng)的實(shí)際比例相差較大,則插值是非常不嚴(yán)格的。

2)就近插值

利用與缺失樣本相鄰近的樣本的值替代缺失樣本的真實(shí)值,這種插值法的理論依據(jù)是相鄰樣本在某些方面具有相似性,例如同型號(hào)艦船裝備相鄰兩次塢修費(fèi)可能相差并不大。

3)按比例插值

根據(jù)提供的其他樣本原始數(shù)據(jù)的情況,對(duì)樣本中各種情況出現(xiàn)的頻率進(jìn)行統(tǒng)計(jì),然后按各種情況的比例對(duì)缺失值進(jìn)行插值;或者根據(jù)各樣本中變量之間統(tǒng)計(jì)的相對(duì)穩(wěn)定的比例關(guān)系,來(lái)對(duì)缺失值進(jìn)行插值;或者根據(jù)缺失值鄰近的兩個(gè)值以一定的比例進(jìn)行綜合,來(lái)對(duì)缺失值進(jìn)行插值等。這種方式糾正了純隨機(jī)插值中不考慮原始分布情況的問(wèn)題,也克服了就近插值只考慮了單邊鄰近值的缺陷,相對(duì)更具有科學(xué)性。

4)擬合插值

根據(jù)艦船裝備維修費(fèi)影響因素之間的相關(guān)性,有針對(duì)性地對(duì)缺失部分進(jìn)行預(yù)測(cè)建模,然后用建立的模型對(duì)缺失值進(jìn)行擬合,用擬合值代替缺失值。這種插值方法有一定量的樣本要求。

4.3 沖擊擾動(dòng)數(shù)據(jù)的預(yù)處理技術(shù)

針對(duì)沖擊擾動(dòng)系統(tǒng)數(shù)據(jù)序列在建模預(yù)測(cè)過(guò)程中常常出現(xiàn)的定量預(yù)測(cè)結(jié)果與定性分析結(jié)論不符的問(wèn)題,20世紀(jì)80年代末,劉思峰教授提出了緩沖算子的概念,可以有效地解決這一問(wèn)題[17]。下面介紹兩種緩沖算子預(yù)處理技術(shù):弱化緩沖算子和強(qiáng)化緩沖算子。弱化緩沖算子數(shù)據(jù)預(yù)處理技術(shù),適合于原始數(shù)據(jù)由于受到?jīng)_擊擾動(dòng)而導(dǎo)致其變化速度先快后慢的情況;強(qiáng)化緩沖算子數(shù)據(jù)預(yù)處理技術(shù),適合于原始數(shù)據(jù)由于受到?jīng)_擊擾動(dòng)而導(dǎo)致其變化速度先慢后快的情況。

1)弱化緩沖算子

設(shè) X=(x(1),x(2),Λ,x(n))為系統(tǒng)行為數(shù)據(jù)序列,令 XD= (x(1)d,x(2)d,Λ,x(n)d)其中,

稱XD為X的一階弱化緩沖算子生成序列[18]。

稱XD2為X的二階弱化緩沖算子生成序列。

繼續(xù)進(jìn)行弱化緩沖算子運(yùn)算,可以相應(yīng)地得到三階弱化緩沖算子,一直可以作用到r階算子,分別記為 XD3,…,XDr。

2)強(qiáng)化緩沖算子

設(shè) X= (x(1),x(2),Λ,x(n))為系統(tǒng)行為數(shù)據(jù)序列,令 XD= X= (x(1)d,x(2)d,Λ,x(n)d),其中

稱XD為X的一階強(qiáng)化緩沖算子生成序列[19]。令XD2= XDD = (x(1)d2,x(2)d2,Λ,x(n)d2),式中

稱XD2為X的二階強(qiáng)化緩沖算子生成序列。

繼續(xù)進(jìn)行強(qiáng)化緩沖算子運(yùn)算,可以相應(yīng)地得到三階強(qiáng)化緩沖算子,一直可以作用到r階算子,分別記為 XD3,…,XDr。

緩沖算子的性質(zhì)及其證明,見(jiàn)文獻(xiàn)[20]。其他形式的強(qiáng)化緩沖算子[21-22]和弱化緩沖算子[23-25]的構(gòu)建及其證明也得到了進(jìn)一步的研究。

對(duì)于沖擊擾動(dòng)數(shù)據(jù)的預(yù)處理技術(shù),在具體的應(yīng)用中,首先要考慮在具體的數(shù)據(jù)收集背景中,沖擊對(duì)數(shù)據(jù)變化趨勢(shì)的影響,進(jìn)行定性分析,然后再考慮采用哪一種緩沖算子技術(shù)進(jìn)行處理,使這種定性的分析融入到數(shù)據(jù)序列中,便于進(jìn)一步的定量分析,實(shí)現(xiàn)定性與定量的綜合。

4.4 不一致數(shù)據(jù)的預(yù)處理技術(shù)

筆者認(rèn)為,艦船裝備維修費(fèi)原始數(shù)據(jù)的不一致主要表現(xiàn)為定性信息與定量數(shù)據(jù)的不一致、極端樣本數(shù)據(jù)與一般樣本數(shù)據(jù)的不一致、原始數(shù)據(jù)量綱的不一致。下面分別針對(duì)這幾種情況,介紹相應(yīng)的數(shù)據(jù)預(yù)處理技術(shù)。

1)定性信息的量化處理

在收集到的艦船裝備維修費(fèi)原始數(shù)據(jù)中,某些變量的數(shù)據(jù)可能會(huì)存在一些主觀的判斷,對(duì)于這些主觀的判斷需要將其轉(zhuǎn)化為量化的數(shù)據(jù),才能夠進(jìn)行進(jìn)一步的預(yù)測(cè)模型的分析。

(1)統(tǒng)計(jì)近似處理

某些艦船裝備維修費(fèi)影響因素,盡管難以收集到直接的定量數(shù)據(jù),但是可以通過(guò)其他相關(guān)數(shù)據(jù)的統(tǒng)計(jì),近似地得到相應(yīng)的量化信息,這種量化處理方式,我們稱其為統(tǒng)計(jì)近似處理。如維修地區(qū)的差異對(duì)艦船裝備維修費(fèi)的影響的量化處理。

(2)模糊隸屬度函數(shù)

某些艦船裝備維修費(fèi)影響因素,收集到的數(shù)據(jù)只是一些定性上的判斷,這些判斷可以劃分為不同的等級(jí)。對(duì)于這種情況,我們可以采用設(shè)定模糊隸屬度函數(shù)的方式,將其轉(zhuǎn)化為明確的定量數(shù)據(jù)。如使用強(qiáng)度、維修任務(wù)的量化處理。

(3) 專家打分

有時(shí)某些影響因素很難或根本不能用適當(dāng)?shù)慕y(tǒng)計(jì)數(shù)據(jù)來(lái)衡量其優(yōu)劣,也難以明確地將其劃分為不同的等級(jí),就可以采用專家打分的方式來(lái)對(duì)其進(jìn)行量化處理。如艦船裝備維修費(fèi)預(yù)測(cè)中的維修制度的量化處理。

2)數(shù)據(jù)的無(wú)量綱化處理

影響艦船裝備維修費(fèi)的因素很多,不同的影響因素從不同的側(cè)面反映了艦船裝備維修費(fèi)的大小,由于大部分影響因素都具有各自不同的度量單位,導(dǎo)致這些因素之間不具有可比性,不利于比較它們對(duì)艦船裝備維修費(fèi)影響的分析;此外,有些預(yù)測(cè)方法對(duì)輸入的變量具有一些特殊的要求,如神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)。下面分別介紹幾種常用的無(wú)量綱化處理技術(shù)。

(1)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化處理可以使得各個(gè)變量數(shù)據(jù)的均值為0,標(biāo)準(zhǔn)差為1。處理公式為:

(2)極差正規(guī)化

極差正規(guī)化處理可以使得每個(gè)變量的最大值為1,最小值為0。處理公式為:

(3)數(shù)據(jù)百分化

數(shù)據(jù)百分化就是計(jì)算各個(gè)變量的百分比,處理后變量的和為1。公式為:

(4)向量規(guī)范化

向量規(guī)范化處理也是線性變化,處理后的變量滿足向量的模為1。

以上幾種數(shù)據(jù)的無(wú)量綱化處理技術(shù)各有特點(diǎn),在艦船裝備維修費(fèi)預(yù)測(cè)過(guò)程中,可以根據(jù)不同方法的要求,選擇合適的方法進(jìn)行處理。

3)極端樣本數(shù)據(jù)的處理

有些時(shí)候各個(gè)樣本的原始數(shù)據(jù)往往相差極大,或者由于某種特殊的原因,只有某個(gè)樣本的原始數(shù)據(jù)特別突出,如果不作適當(dāng)?shù)奶幚?,?huì)使整個(gè)艦船裝備維修費(fèi)預(yù)測(cè)結(jié)果發(fā)生嚴(yán)重扭曲。為此可以采用類似與評(píng)分法的統(tǒng)計(jì)平均-方法。具體的做法有很多,其中之一是設(shè)定一個(gè)百分制平均值M,將樣本集X中各個(gè)方案該變量的均值定位于M,再用下式進(jìn)行變換[19]:

5 數(shù)據(jù)預(yù)處理舉例

為了便于上面所給出的方法在工程實(shí)際上得到應(yīng)用,下面采用模擬的一組艦船裝備維修費(fèi)相關(guān)原始數(shù)據(jù),并對(duì)其進(jìn)行適當(dāng)?shù)臄?shù)據(jù)預(yù)處理。假定經(jīng)分析影響某單位艦船裝備維修費(fèi)的主要因素為A和B,且收集到A、B以及艦船裝備維修費(fèi)Y的原始數(shù)據(jù)如表1所示。

表1 維修費(fèi)及其影響因素A和B原始數(shù)據(jù)(單位為基數(shù))

從表1中的數(shù)據(jù),我們發(fā)現(xiàn)因素A的增長(zhǎng)率波動(dòng)幅度較大,特別是2004年的增長(zhǎng)率達(dá)到54.08%,而 2003 年的增長(zhǎng)率為 9.22%,可以認(rèn)為這主要是由于噪聲引起的,這里采用使用界限平滑法對(duì)A進(jìn)行平滑處理,設(shè)定界限范圍為±25%,處理后的數(shù)據(jù)見(jiàn)表2(如處理后2004年的數(shù)據(jù)為3186× (1+25%)=3823.2)。

同時(shí),在因素B原始數(shù)據(jù)中,2001、2002和2007年的數(shù)據(jù)缺失,這里采用相鄰兩個(gè)數(shù)據(jù)的等比例進(jìn)行插值,插值后的數(shù)據(jù)見(jiàn)表2(如處理后2004 年的數(shù)據(jù)為 0.5×1083+0.5×1920=1501.5)。

對(duì)于維修費(fèi)Y的數(shù)據(jù),容易發(fā)現(xiàn)其前期增長(zhǎng)率較小,而后期增長(zhǎng)率較大,可以認(rèn)為是由于沖擊的擾動(dòng)所致,這里采用一階強(qiáng)化緩沖算子對(duì)其進(jìn)行處理,處理后的值見(jiàn)表2(如處理后2004年的數(shù)據(jù)為(8-5+1)×712/(71+77+85+94)≈61.66)。

表2 預(yù)處理后的數(shù)據(jù)(單位為基數(shù))

經(jīng)過(guò)上述數(shù)據(jù)的預(yù)處理,表2中的數(shù)據(jù)已可以用于艦船裝備維修費(fèi)的預(yù)測(cè)。此外,根據(jù)某些預(yù)測(cè)方法(如神經(jīng)網(wǎng)絡(luò)方法)的要求,有時(shí)還需要對(duì)表2中經(jīng)過(guò)預(yù)處理后的數(shù)據(jù)進(jìn)行無(wú)量綱化處理,這里采用向量規(guī)范化方法進(jìn)行處理,見(jiàn)表3。

如2004年Y的數(shù)據(jù)計(jì)算如下:

表3 數(shù)據(jù)的無(wú)量綱化處理

6 結(jié)束語(yǔ)

本文根據(jù)艦船裝備維修費(fèi)的特點(diǎn),將原始數(shù)據(jù)分為基礎(chǔ)數(shù)據(jù),使用數(shù)據(jù),維修數(shù)據(jù)和宏觀經(jīng)濟(jì)數(shù)據(jù),并匯總了各種數(shù)據(jù)收集的來(lái)源。根據(jù)不同艦船裝備維修費(fèi)預(yù)測(cè)方法對(duì)輸入數(shù)據(jù)的要求以及收集到數(shù)據(jù)自身的特點(diǎn),分析了原始數(shù)據(jù)可能存在影響預(yù)測(cè)效果的一些問(wèn)題,根據(jù)艦船裝備維修費(fèi)預(yù)測(cè)的需要,針對(duì)每一種問(wèn)題提供了相應(yīng)的幾種數(shù)據(jù)預(yù)處理技術(shù),通過(guò)預(yù)處理后的數(shù)據(jù)可以為艦船裝備維修費(fèi)預(yù)測(cè)提供良好的數(shù)據(jù)基礎(chǔ),更好地保證預(yù)測(cè)效果。同時(shí),本文歸納的各種艦船裝備維修費(fèi)數(shù)據(jù)預(yù)處理技術(shù),也可以推廣用于其他預(yù)測(cè)過(guò)程中存在類似問(wèn)題的數(shù)據(jù)預(yù)處理中。

[1]張偉,顧朝林.城市與區(qū)域規(guī)劃模型系統(tǒng)[M].南京:東南大學(xué)出版社,2000.

[2]RICARDO J N,SILVA da B,F(xiàn)IGUEIREDO H,et al.E-valuation of sample processing and sub-sampling performance[J].Analytica Chimica Acta,2003,477:169-185.

[3]AZZOUZ T,PUIGDOMéNECH A,ARAGAY M,et al.Comparison between different data pre-treatment methods in the analysis of forage samples using near-infrared diffuse reflectance spectroscopy and partial least-squares multivariate calibration method[J].Analytica Chimica Acta,2003,484:121-134.

[4]GABRIELSSON J,JONSSON H,AIRIAU C,et al.OPLS methodology for analysis of pre-processing effects on spectroscopic data[J].Chemometrics and Intelligent Laboratory Systems,2006,84:153-158.

[5]PAPADOKONSTANTAKIS S, MACHEFER S, SCHNITZLEIN K,et al.Variable selection and data pre-processing in NN modelling of complex chemical processes[J].Computers and Chemical Engineering,2005(29):1647-1659.

[6]YAMAUCHI Y,NAKAMURA A,KOHNO I,et al.Quasiflow injection analysis for rapid determination of caffeine in tea using the sample pre-treatment method with a cartridge column filled with polyvinylpolypyrrolidone [J].Journal of Chromatography A,2008,1177:190-194.

[7]IDBORG H,ZAMANI L,EDLUND P O,et al.Metabolic fingerprinting of rat urine by LC /MS Part 2.Data pretreatment methods for handling of complex data[J].Journal of Chromatography B,2005,828:14-20.

[8]GNANI D,GUIDI V,F(xiàn)ERRONI M,et al.High-precision neural pre-processing for signal analysis of a sensor array[J].Sensors and Actuators B,1998,47:77-83.

[9]KUZ'NIAR K,WASZCZYSZYN Z.Neural analysis of vibration problems of real flat buildings and data pre-processing[J].Engineering Structures,2002,24:1327-1335.

[10]HARLEY M D,TURNER I L.A simple data transformation technique for pre-processing survey data at embayed beaches[J].Coastal Engineering,2008,55:63-68.

[11]安淑芝.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社,2005.

[12]ESEN H,INALLI M,SENGUR A,et al.Forecasting of a ground-coupled heat pump performance using neural networks with statistical data weighting pre-processing[J].International Journal of Thermal Sciences,2008,47:431-441.

[13]張文哲,陳剛,吳迎霞.基于小波理論對(duì)負(fù)荷預(yù)測(cè)中不良數(shù)據(jù)的處理[J].重慶大學(xué)學(xué)報(bào),2004,27(6):77-81.

[14]韋鋼,王飛,張永健,等.負(fù)荷預(yù)測(cè)中歷史數(shù)據(jù)缺損處理[J].電力科學(xué)與工程,2004(1):16-19.

[15]TERABE M,WASHIO T,MOTODA H,et al.Attribute generation based on association rules [J].Knowledge and Information Systems,2002(4):329-349.

[16]胡上序,陳德釗.觀測(cè)數(shù)據(jù)的分析與處理[M].杭州:浙江大學(xué)出版社,1996:85-106.

[17]劉思峰.沖擊擾動(dòng)系統(tǒng)預(yù)測(cè)陷阱與緩沖算子[J].華中理工大學(xué)學(xué)報(bào),1997,25(1):25-27.

[18]黨耀國(guó),劉思峰,劉斌,等.關(guān)于弱化緩沖算子的研究[J].中國(guó)管理科學(xué),2004,12(2):108-111.

[19]黨耀國(guó),劉斌,關(guān)葉青.關(guān)于強(qiáng)化緩沖算子的研究[J].控制與決策,2005,20(12):1332-1336.

[20]劉思峰,黨耀國(guó),方志耕.灰色系統(tǒng)理論及其應(yīng)用[M].第 3 版.北京:科學(xué)出版社,2004:26-49.

[21]崔杰,黨耀國(guó).一類新的弱化緩沖算子的構(gòu)造及其應(yīng)用[J].控制與決策,2008,23(7):741-744,750.

[22]關(guān)葉青,劉思峰.關(guān)于弱化緩沖算子序列的研究[J].中國(guó)管理科學(xué),2007,15(4):89-92.

[23]謝乃明,劉思峰.強(qiáng)化緩沖算子的性質(zhì)與若干實(shí)用強(qiáng)化算子的構(gòu)造[J].統(tǒng)計(jì)與決策,2006(4):9-10.

[24]關(guān)葉青,劉思峰.強(qiáng)化緩沖算子序列與m階算子作用研究[J].云南師范大學(xué)學(xué)報(bào),2007,27(1):32-35.

[25]關(guān)葉青,劉思峰.基于輔助函數(shù)的強(qiáng)化緩沖算子及其作用[J].統(tǒng)計(jì)與決策,2007(6):20-21.

Data Pre-Processing Techniques for Maintenance Cost Prediction of Ship Equipment

Xie Li1 Wei Ru-xiang1 Yu Wei-zong2 Li Li3
1 Department of Economic Management,Naval University of Engineering,Wuhan 430033,China
2 Finance Affair Office of the 92848thUnit of PLA,Dalian 116041,China
3 The 91224thUnit of PLA,Shanghai 200235,China

To collect data precisely and adequately is key concern to the maintenance cost prediction of ship equipment.This paper incorporates pre-processing techniques to deal with the cost prediction-related data.As a wide range of data will affect the prediction, data are to be categorized into different groups, such as basic data, operational data, maintenance data and macroeconomic data.However, by what means data acquisition can be achieved efficiently should be confirmed.The original data from different sources will likely to be of noise, default or abnormity and discrepancy.Various pre-processes are needed to handle these data respectively.The pre-processed data may provide a good basis for the maintenance cost prediction and improving the efficiency.

ship equipment; maintenance cost prediction; data pre-processing

U672.7

A

1673-3185(2010)06-87-06

10.3969/j.issn.1673-3185.2010.06.018

2009-09-07

海工自然科學(xué)基金(HGDQNJJ041)

謝 力(1980- ),男,博士研究生。 研究方向:系統(tǒng)工程,裝備經(jīng)濟(jì)管理。E-mail:xieli_h(yuǎn)g@ yahoo.com.cn

猜你喜歡
維修費(fèi)原始數(shù)據(jù)艦船
艦船通信中的噪聲消除研究
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
艦船測(cè)風(fēng)傳感器安裝位置數(shù)值仿真
受特定變化趨勢(shì)限制的傳感器數(shù)據(jù)處理方法研究
農(nóng)村飲水工程用水管理的初步探討
探討醫(yī)院維修費(fèi)的管理
電信運(yùn)營(yíng)商維修費(fèi)精細(xì)化管理應(yīng)用探索
全新Mentor DRS360 平臺(tái)借助集中式原始數(shù)據(jù)融合及直接實(shí)時(shí)傳感技術(shù)實(shí)現(xiàn)5 級(jí)自動(dòng)駕駛
汽車零部件(2017年4期)2017-07-12 17:05:53
艦船腐蝕預(yù)防與控制系統(tǒng)工程
世界經(jīng)濟(jì)趨勢(shì)
双流县| 安福县| 清涧县| 余庆县| 安仁县| 南汇区| 牙克石市| 浮梁县| 峨眉山市| 通州市| 什邡市| 日土县| 安西县| 宁波市| 通山县| 昭苏县| 安国市| 扎兰屯市| 安远县| 武城县| 霍邱县| 正蓝旗| 收藏| 晴隆县| 兴安县| 曲靖市| 崇义县| 青铜峡市| 咸宁市| 托里县| 镇平县| 奇台县| 海安县| 成都市| 永济市| 内乡县| 牟定县| 冀州市| 宁波市| 北辰区| 民和|