馬可欣,李喬揚,李籽圻,王 煒,高成強
(1.解放軍61486 部隊,上海 200072;2.火箭軍工程大學(xué),西安 710025)
隨著信息化的深入發(fā)展,智能化、無人化時代逐步到來,作戰(zhàn)形式由傳統(tǒng)的海、陸、空三位一體,逐步轉(zhuǎn)變?yōu)楹!㈥?、空、天、電(磁)等多維一體,戰(zhàn)場環(huán)境態(tài)勢更是瞬息萬變。先進裝備作為未來作戰(zhàn)的核心支撐,對打擊敵方重要目標(biāo)和扭轉(zhuǎn)戰(zhàn)局等起著關(guān)鍵性作用。因此,必須完善裝備儲存和使用數(shù)據(jù)的管理與運用,深入開展相關(guān)技術(shù)研究與應(yīng)用,為裝備作戰(zhàn)運用和管理保障決策提供科學(xué)依據(jù)。
為了戰(zhàn)時急需,各類裝備必須保持足夠的儲備量、達到要求的戰(zhàn)備完好率,這就迫切需要對裝備儲存和使用過程中的管理保障進行優(yōu)化。
裝備數(shù)據(jù)的種類繁多、體量龐大,裝備儲存和使用過程中的管理保障優(yōu)化需要充分利用各類數(shù)據(jù)。然而海量數(shù)據(jù)的價值密度較低,很多情況下,難以直接發(fā)揮價值。因此,需要通過一些先進的技術(shù)方法,從大量、模糊、有干擾甚至矛盾的數(shù)據(jù)中,提取隱含在其中但無法直接觀測、卻又具有潛在價值的信息和知識,即數(shù)據(jù)挖掘。
在裝備儲存和使用中應(yīng)用數(shù)據(jù)挖掘技術(shù),可以有效地解決模擬仿真、建模解析較為復(fù)雜和可信度低的問題。
在裝備的儲存和使用中,已經(jīng)獲取并記錄了大量的多類型數(shù)據(jù),但是這些數(shù)據(jù),并沒有被有效管理、充分利用。如圖1 所示,以裝備測試數(shù)據(jù)為例,就存在以下主要問題。
圖1 裝備儲存和使用中測試數(shù)據(jù)管理與運用存在的主要問題
目前,大部分裝備的測試數(shù)據(jù)都記錄在紙上,或者僅僅存儲于專用的載體或數(shù)據(jù)庫,并沒有一個可以共享的數(shù)據(jù)庫來儲存和管理這些累積的測試數(shù)據(jù),造成了人員、裝備數(shù)據(jù)等資源的浪費。不利于分析測試數(shù)據(jù)的變化趨勢和數(shù)據(jù)信息的應(yīng)用,導(dǎo)致大量蘊含價值的數(shù)據(jù)被浪費,在戰(zhàn)時也會耽誤寶貴的保障時間,貽誤戰(zhàn)機。
在對儲存和使用的某些裝備進行單元測試時,過程過于繁瑣復(fù)雜,而對整個系統(tǒng)的貢獻不夠明顯。同時,存在一些不同測試操作但具有相同目的和結(jié)論的多余測試問題。且在得到相關(guān)數(shù)據(jù)后,核查人員對各指標(biāo)分別進行檢驗分析,簡單地將所有指標(biāo)的測試值與標(biāo)準(zhǔn)值進行對比,增加了工作量,忽視了指標(biāo)數(shù)據(jù)間的關(guān)聯(lián)性。若在戰(zhàn)時,進行這樣的數(shù)據(jù)普查,會增加裝備準(zhǔn)備時間,難以達到隨時能戰(zhàn)的要求。
對儲存和使用裝備出現(xiàn)的故障和問題,都有完備的全流程解決方案,但從整體上來看,也都相對獨立。沒有對故障及問題進行歸類分析和管理,現(xiàn)有分類方式較為簡單粗糙,不利于在實際中進行故障排查和問題解決。為了對同類問題進行統(tǒng)一處理、對類似故障進行分類排除,合理分配系統(tǒng)資源,而不重復(fù)占用和浪費保障資源,需要對裝備儲存和使用中出現(xiàn)的相近或類似的故障問題和數(shù)據(jù)進行聚類分析、歸類管理,對故障的問題類別不斷評估和完善,再進一步優(yōu)化分類,以持續(xù)提高裝備保障效能。
在對裝備狀態(tài)進行監(jiān)測時,可以得到表征裝備健康狀態(tài)指標(biāo)的過去值和現(xiàn)在值。從監(jiān)測記錄中可以發(fā)現(xiàn),裝備過去的問題和關(guān)鍵指標(biāo)的穩(wěn)定性狀況,據(jù)此對已發(fā)生的故障和問題及時修復(fù)和排除。但是,僅僅研究過去和現(xiàn)在的狀態(tài)無法保證戰(zhàn)時裝備的可用性,因此,實時監(jiān)測有必要但還不夠。為了使裝備在戰(zhàn)時能夠達成作戰(zhàn)目的,研究的重點應(yīng)聚焦于健康狀態(tài)指標(biāo)的將來值,即預(yù)測值。預(yù)測值越精確,戰(zhàn)時決策準(zhǔn)確性和可信性就越高,甚至可以決定一場戰(zhàn)斗的結(jié)局。
大部分部件指標(biāo)的測試值總是在一個正常區(qū)間內(nèi)上下波動,偶爾會出現(xiàn)不在正常區(qū)間內(nèi)的值,這都是常見的。但是對于一些關(guān)鍵部件,其異常的少量數(shù)據(jù),即離群點,可能對于判斷裝備狀態(tài)也是有價值的信息。這些離群點,可能表示裝備設(shè)計中的缺陷,也可能是預(yù)示著裝備狀態(tài)變化或異常的一個轉(zhuǎn)折點。然而按照傳統(tǒng)的處理方法,就會忽略這樣的離群點,等到缺陷或異常狀態(tài)演變?yōu)楣收蠒r,再進行排查和處理,就顯得相對滯后。因此,對關(guān)鍵部件測試數(shù)據(jù)的離群點加以關(guān)注和分析,有利于未雨綢繆,避免故障判定的滯后性,保證裝備必要的戰(zhàn)備完好性。
現(xiàn)有的裝備數(shù)據(jù)應(yīng)用于作戰(zhàn)決策的形式較為簡單,即將測試數(shù)據(jù)與正常值對比,以判斷裝備的合格率,從而開展裝備維修、補給保障活動。對于決策者而言,裝備數(shù)據(jù)分析結(jié)果表現(xiàn)形式單一,不利于指揮決策以及裝備管理優(yōu)化。
為了解決裝備儲存和使用中數(shù)據(jù)管理與運用存在的問題,需要運用現(xiàn)代信息技術(shù),優(yōu)化裝備儲存和使用。設(shè)計基于數(shù)據(jù)挖掘的裝備儲存和使用總體架構(gòu)如下頁圖2 所示,主要包括數(shù)據(jù)收集層、數(shù)據(jù)存儲層、數(shù)據(jù)質(zhì)量分析層、數(shù)據(jù)預(yù)處理層、數(shù)據(jù)分析層和數(shù)據(jù)應(yīng)用層。
圖2 基于數(shù)據(jù)挖掘的裝備儲存和使用總體架構(gòu)
數(shù)據(jù)收集層采集的數(shù)據(jù)通常是多源異構(gòu)的,主要來源于平時的測試數(shù)據(jù)、使用與維修數(shù)據(jù)、日常管理與統(tǒng)計數(shù)據(jù)、監(jiān)測傳感器采集數(shù)據(jù)等,通過傳感器和數(shù)據(jù)采集系統(tǒng),獲取裝備在儲存和使用中的有關(guān)參數(shù)指標(biāo)數(shù)據(jù),還要收集一些局域(部分裝備或部分單位)的相關(guān)數(shù)據(jù)庫資料,形成總的裝備狀態(tài)數(shù)據(jù)庫。為了解決數(shù)據(jù)源多樣、數(shù)據(jù)體量龐大、數(shù)據(jù)值持續(xù)更新等問題,數(shù)據(jù)收集層可以在數(shù)據(jù)源和數(shù)據(jù)庫之間構(gòu)建數(shù)據(jù)收集Agent 網(wǎng)絡(luò)。為了保證數(shù)據(jù)的安全,可以采取必要的安全加密措施。數(shù)據(jù)采集過程中,對一些連續(xù)性參數(shù),可以根據(jù)實際需要采用抽樣方法,采集離散的數(shù)據(jù)點。常用方法包括簡單隨機抽樣、系統(tǒng)抽樣、整群抽樣和分層抽樣等。這些方法都屬于單階段抽樣,應(yīng)用時需要根據(jù)實際情況將抽樣過程劃分階段,分別進行抽樣,即多階段抽樣,如圖3 所示。
圖3 數(shù)據(jù)抽樣流程
數(shù)據(jù)存儲層主要對收集的各類數(shù)據(jù)進行存儲管理。數(shù)據(jù)存儲層可采用分布式管理系統(tǒng),包括HDFS(hadoop distributed file system)和Hbase。HDFS 用來完成大數(shù)據(jù)的讀取和寫入。HDFS 采用扁平化網(wǎng)絡(luò)結(jié)構(gòu),由主節(jié)點機器、備份節(jié)點以及若干個從節(jié)點組成。主節(jié)點機器用于存儲節(jié)點的元數(shù)據(jù),以及從節(jié)點的信息;備份節(jié)點用于備份主節(jié)點的數(shù)據(jù),是防止主節(jié)點出現(xiàn)故障后數(shù)據(jù)庫失效的措施;從節(jié)點用于存儲文件內(nèi)容和相關(guān)映射關(guān)系。
較大體量的數(shù)據(jù)可能會包含值錯誤、缺失或其他質(zhì)量問題。因此,在數(shù)據(jù)分析前通常需要對數(shù)據(jù)進行全面質(zhì)量分析。數(shù)據(jù)質(zhì)量分析以確保數(shù)據(jù)的正確性和有效性為目標(biāo)。常用的方法包括值分析、統(tǒng)計分析、頻次與直方圖分析等。
在數(shù)據(jù)正確性分析方面,通??紤]以下4 種可能的問題。
1)缺失值。缺失的數(shù)據(jù)值可能是空白或者是無意義的值,如null。
2)數(shù)據(jù)錯誤。通常為輸入數(shù)據(jù)錯誤。
3)度量標(biāo)準(zhǔn)錯誤。由于同指標(biāo)樣本數(shù)據(jù)的不同度量方法而造成的錯誤。
4)編碼不一致。通常為非標(biāo)準(zhǔn)度量單位或者單位不一致的問題。
在數(shù)據(jù)的有效性分析方面,主要關(guān)注數(shù)據(jù)的統(tǒng)計特性,用以表示數(shù)據(jù)包含的無法直接觀測的統(tǒng)計信息。
由于采集到的數(shù)據(jù)存在缺失、噪聲和不一致等問題。因此,在質(zhì)量分析之后,需要對數(shù)據(jù)進行預(yù)處理。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)歸約和數(shù)據(jù)變換等,如圖4 所示。數(shù)據(jù)“清洗”是通過補充缺失的值、光滑噪聲數(shù)據(jù)、識別或刪除離群點和解決不一致等方式完成數(shù)據(jù)“清洗”處理。數(shù)據(jù)集成是把不同來源、性質(zhì)和格式的數(shù)據(jù)在數(shù)學(xué)或者邏輯上有機地集合,以便于數(shù)據(jù)挖掘應(yīng)用。數(shù)據(jù)歸約是通過維歸約和數(shù)值歸約將數(shù)據(jù)集進行簡化表示。數(shù)據(jù)變換是將數(shù)據(jù)的表現(xiàn)形式進行轉(zhuǎn)變的過程。數(shù)據(jù)預(yù)處理技術(shù)可以進一步提高數(shù)據(jù)的質(zhì)量,從而提高數(shù)據(jù)挖掘的準(zhǔn)確率和效率。
圖4 數(shù)據(jù)預(yù)處理方法示意圖
數(shù)據(jù)分析層主要運用數(shù)據(jù)挖掘的理論和方法,借助開發(fā)環(huán)境和相關(guān)框架,結(jié)合Apriori、FPGrowth、回歸、貝葉斯網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)、支持向量機、灰色聚類、粗糙集等模型,完成關(guān)聯(lián)性分析、聚類分類、狀態(tài)預(yù)測和離群點分析等目標(biāo)。
數(shù)據(jù)應(yīng)用層主要根據(jù)數(shù)據(jù)分析層得到的結(jié)果,為裝備儲存和使用提供裝備儲存和使用數(shù)據(jù)共享庫,測試指標(biāo)相關(guān)性分析,問題歸類管理,預(yù)測性狀態(tài)監(jiān)測,基于關(guān)鍵部件離群點數(shù)據(jù)的故障判別和智能輔助決策等應(yīng)用。裝備決策者要將數(shù)據(jù)挖掘結(jié)果與經(jīng)驗相結(jié)合,作出正確決策。
劣質(zhì)數(shù)據(jù)和噪聲數(shù)據(jù)會影響數(shù)據(jù)總體質(zhì)量。一個可用的大數(shù)據(jù)集需滿足5 個性質(zhì):一致性、精確性、完整性、時效性和實體同一性。因此,需要開展數(shù)據(jù)的可用性研究。在數(shù)據(jù)收集、獲取階段對數(shù)據(jù)質(zhì)量進行監(jiān)控和預(yù)判,研究高質(zhì)量數(shù)據(jù)獲取方法和評估模型。在數(shù)據(jù)預(yù)處理階段,研究對錯誤數(shù)據(jù)和噪聲數(shù)據(jù)的檢測判別方法以及數(shù)據(jù)修復(fù)技術(shù)和完善機制。對于一些無法修復(fù)或修復(fù)效果不理想的數(shù)據(jù),采用各類數(shù)據(jù)分布近似計算理論進行數(shù)值模擬,以完成對數(shù)據(jù)的處理,使數(shù)據(jù)達到規(guī)定的可用性。
大體量的數(shù)據(jù)存儲,單臺服務(wù)器無法保證數(shù)據(jù)存儲的有效性和效率,以及故障情況下數(shù)據(jù)庫的應(yīng)急使用能力。因此,大數(shù)據(jù)存儲采用分布式存儲策略,構(gòu)建可擴展和具有并行操作能力的系統(tǒng)。采用分布式存儲,在大量多類型數(shù)據(jù)、操作頻繁、計算要求高的環(huán)境下,快速響應(yīng)并完成相應(yīng)操作,并保障數(shù)據(jù)儲存安全可靠。
為了實現(xiàn)數(shù)據(jù)的快速處理,更好地發(fā)揮數(shù)據(jù)挖掘的優(yōu)勢,必須提高大規(guī)模數(shù)據(jù)的計算能力。為了突破單計算機系統(tǒng)的計算限制,可以將云計算應(yīng)用到數(shù)據(jù)計算中,即通過網(wǎng)絡(luò)按需獲得資源或服務(wù)并進行數(shù)據(jù)處理和共享。目前云計算在工商業(yè)領(lǐng)域取得了一定的成效,但在軍事領(lǐng)域的應(yīng)用尚在探索階段,如何將云計算應(yīng)用到裝備儲存和使用,并保證云計算的安全可靠性是研究的重點之一。
目前數(shù)據(jù)挖掘有很多的算法模型。如何將現(xiàn)有的算法模型應(yīng)用到裝備儲存和使用中,并保證方法與數(shù)據(jù)的兼容性也是一個研究重點。針對裝備數(shù)據(jù)的特殊性,需要對相關(guān)算法模型進行優(yōu)化和改進。由于部分裝備數(shù)據(jù)需要依靠作戰(zhàn)試驗來獲取,對于部分?jǐn)?shù)據(jù)較少的參數(shù)指標(biāo)和分析目標(biāo),可以考慮采用遷移學(xué)習(xí)的思路,降低數(shù)據(jù)集的體量要求,以獲取和大數(shù)據(jù)集效果相同的分析結(jié)果。
由于原始大數(shù)據(jù)集具有多維屬性,且數(shù)據(jù)挖掘的結(jié)果可能較為復(fù)雜,不利于操作人員和決策者直接觀察或決策運用。因此,需要建立一個合適的多維度數(shù)據(jù)之間的映射關(guān)系,并采用必要的可視化工具進行處理。對于數(shù)據(jù)處理過程及數(shù)據(jù)挖掘的結(jié)果,也可以通過圖表或者標(biāo)度關(guān)系圖等方法進行轉(zhuǎn)換。在對數(shù)據(jù)挖掘的結(jié)果進行可視化處理時,也需要研發(fā)應(yīng)用有關(guān)的技術(shù)方法和工具手段。
為了使裝備儲存和使用的相關(guān)決策更加科學(xué)合理,考慮到數(shù)據(jù)挖掘的部分結(jié)果不可視化和難理解性,因此,需要開展智能輔助決策技術(shù)研發(fā)與應(yīng)用。讓系統(tǒng)對處理后的結(jié)果進行自我理解并根據(jù)裝備管理、保障和作戰(zhàn)等實際目標(biāo),進行智能輔助決策。決策者可以根據(jù)輔助決策系統(tǒng)給出的結(jié)論,結(jié)合作戰(zhàn)經(jīng)驗和戰(zhàn)場實際,進行綜合決策。實現(xiàn)裝備儲存和使用數(shù)據(jù)的一體化、全流程、全壽命周期的管理與應(yīng)用。
為了解決裝備在儲存和使用中存在的不科學(xué)、不合理的判斷、操作和運用決策,充分利用包含大量測試記錄在內(nèi)的裝備大數(shù)據(jù),本文構(gòu)建了基于數(shù)據(jù)挖掘的裝備儲存和使用總體架構(gòu),并分析討論其涉及的關(guān)鍵技術(shù)。初步建立了裝備儲存和使用數(shù)據(jù)的處理流程,但相關(guān)技術(shù)尚在不斷發(fā)展與完善階段,有待進一步開展相關(guān)理論研究與實踐探索。