劉 杰
(中國人民解放軍91388部隊91分隊 湛江 524022)
水面艦反潛魚雷發(fā)現(xiàn)概率是水面艦反潛作戰(zhàn)能力的一個重要指標,發(fā)現(xiàn)概率的高低直接決定了水面艦打擊潛艇的效果。魚雷出管后,能否發(fā)現(xiàn)目標,受到多方面因素的影響,主要包括發(fā)射時刻敵我態(tài)勢、本艦和目標運動參數(shù)、魚雷射擊諸元和預設(shè)定參數(shù)、魚雷性能、海洋環(huán)境、目標潛艇類型、目標是否采取對抗措施、系統(tǒng)解算誤差、魚雷航行誤差等。在水面艦綜合反潛火控設(shè)備顯控臺上能夠看到魚雷攻擊潛艇的實時發(fā)現(xiàn)概率,對指揮員的指揮決策起到輔助作用,但是目前由于受到計算方法的限制,可參考性不強。
大數(shù)據(jù)分析算法就是對海量的各種各樣的數(shù)據(jù)進行計算,找出數(shù)據(jù)之間的相關(guān)關(guān)系,與針對“小數(shù)據(jù)量”的傳統(tǒng)算法相比,避免了在采樣過程中信息的丟失以及算法本身的誤差。利用水面艦在試驗、訓練、演習等過程中收集的有關(guān)使用魚雷反潛的大量數(shù)據(jù)進行分析計算,能夠更加準確地預測當前條件下水面艦反潛魚雷的實時發(fā)現(xiàn)概率。
大數(shù)據(jù)的定義為無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合。是信息網(wǎng)絡(luò)技術(shù)發(fā)展的一個必然產(chǎn)物,其沖擊對于任何領(lǐng)域和行業(yè)都無法避免,軍事領(lǐng)域也是如此[1~4]。
大數(shù)據(jù)的第一個特點就是“大”,即數(shù)據(jù)總量巨大。數(shù)據(jù)大小通常都在PetaBytes到ExaBytes,至少在GigaBytes;第二個特點是數(shù)據(jù)高速增長。隨著信息技術(shù)的發(fā)展,任何事物都可以被數(shù)據(jù)化,數(shù)據(jù)量呈現(xiàn)爆炸式的增長,數(shù)據(jù)更新速度非常快,因此,對很多實時數(shù)據(jù)要進行快速處理,平衡數(shù)據(jù)量和處理速度之間的關(guān)系也是大數(shù)據(jù)分析的一個難點;第三個特點是數(shù)據(jù)種類繁多,關(guān)系復雜。隨著數(shù)據(jù)收集能力的提高,收集到的數(shù)據(jù)類型也越來越多,質(zhì)量參差不齊,各種數(shù)據(jù)之間都相互作用,簡單地剔除較差的數(shù)據(jù)會導致數(shù)據(jù)的大量浪費;第四個特點是有價值數(shù)據(jù)占的比例較小,即價值密度較低。
上述四個典型特點可以用4V表示,分別為總量(volume)、速度(velocity)、多樣性(variety)、價值(value)[5]。
由于大數(shù)據(jù)的特點,傳統(tǒng)的統(tǒng)計學方法無法對其進行處理,因此,出現(xiàn)了一系列的大數(shù)據(jù)處理技術(shù),即系列使用非傳統(tǒng)的工具來處理大量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),從而獲得分析和預測結(jié)果的一系列數(shù)據(jù)處理技術(shù)[6]。
數(shù)據(jù)挖掘也稱為現(xiàn)代統(tǒng)計學,是對大數(shù)據(jù)進行分析處理的一門方法,是對傳統(tǒng)統(tǒng)計方法的延伸和擴展,最早是由Fayyad在1995年[7]知識發(fā)現(xiàn)會議上所提出來的他認為數(shù)據(jù)挖掘是一個自動或半自動化地從大量數(shù)據(jù)中發(fā)現(xiàn)有效的、有意義的、潛在有用的、易于理解的數(shù)據(jù)模式的復雜過程。數(shù)據(jù)挖掘的核心任務(wù)是對數(shù)據(jù)特征和關(guān)系的探索、建立。根據(jù)要探索的數(shù)據(jù)關(guān)系是否有目標,可以將數(shù)據(jù)挖掘的功能分為兩大類,一類稱為有指導的學習,是對預設(shè)目標的概率學習和建模,主要由分類、估計和預測三方面的功能構(gòu)成,其中分類是較為基礎(chǔ)的,用于概念的識別,估計是對概念量的認識,預測則是對未知情況的判斷;另一類是無指導的學習,旨在尋找和刻畫數(shù)據(jù)的概念結(jié)構(gòu),主要由關(guān)聯(lián)分組、聚類和可視化三方面的內(nèi)容構(gòu)成,主要任務(wù)是提煉數(shù)據(jù)中潛在的模式,探索數(shù)據(jù)之間的聯(lián)系和內(nèi)在結(jié)構(gòu)[8~12]。本文的數(shù)據(jù)模型主要采用聚類的方法找出影響魚雷發(fā)現(xiàn)概率的所有因素之間的聯(lián)系。
發(fā)現(xiàn)概率是對魚雷出管后,按照預設(shè)定參數(shù)和設(shè)定的射擊諸元進行動作,發(fā)現(xiàn)目標情況的定量描述。
影響水面艦反潛魚雷發(fā)現(xiàn)概率的因素可分為本艦、目標、魚雷、探測系統(tǒng)、環(huán)境等五個方面,每一方面都包含多種因素,具體如下所示:
本艦:類型、工作狀態(tài)、運動參數(shù)、發(fā)射時刻與目標的相對態(tài)勢、系統(tǒng)解算誤差、系統(tǒng)工作方式等;
目標:類型、性能、運動參數(shù)、是否采取對抗等;
魚雷:類型、性能、發(fā)射方式、預設(shè)定參數(shù)、射擊諸元、航行(飛行)誤差等;探測系統(tǒng):類型、性能、使用方式、使用狀態(tài)等;環(huán)境:水文、氣象、海況、海區(qū)深度、海底底質(zhì)等。
魚雷發(fā)射出去后能否發(fā)現(xiàn)目標主要由發(fā)射時魚雷射擊諸元是否正確、發(fā)射后魚雷的執(zhí)行能力、目標的性能及是否采取對抗等決定,因為對反潛武器系統(tǒng)來說,目標是否會采取對抗措施以及采取何種對抗措施,在實際作戰(zhàn)中很難提前預料,所以,本文在模型構(gòu)設(shè)時假定目標不采取對抗措施。
水面艦每發(fā)射一條魚雷,就用一個特征向量P表示魚雷攻擊目標的過程數(shù)據(jù),形式如式(1)所示。
式中a1,a2,…,a5分別表示上述影響魚雷發(fā)現(xiàn)目標的五個方面,即本艦、目標、魚雷、探測系統(tǒng)和環(huán)境,每個方面包含的因素都用一個變量表示,?表示本次魚雷發(fā)射后是否發(fā)現(xiàn)目標,0表示未發(fā)現(xiàn),1表示發(fā)現(xiàn)。
設(shè)訓練樣本集為X,共包含n個特征向量,每個特征向量用 Pi=(ai1,ai2,…,ai5,?i) 表示,其 中(i=1,2,…,n),使用歐式距離來計算系統(tǒng)魚雷發(fā)現(xiàn)概率。
對所有di<β(β是一個判斷樣本相似性的閾值,根據(jù)實際使用進行確定)的數(shù)據(jù)按式(3)統(tǒng)計魚雷發(fā)現(xiàn)概率δ:
式中m表示di<β的特征向量總數(shù),?k表示其對應(yīng)的發(fā)現(xiàn)目標情況(是否發(fā)現(xiàn))。
歐式距離判斷方法需要對樣本集中的每個樣本進行計算,計算效率比較低,不適用于大規(guī)模數(shù)據(jù)集。當訓練樣本集中的樣本量非常大時,可以采用聚類分析(二分k-均值算法或BIRCH算法等)的方法先將訓練樣本集劃分成K類(K根據(jù)實際使用進行確定)[8],聚類的原則是使類內(nèi)樣本的相似度達到最大,而類間樣本的相似度達到最小,然后計算與每個類的聚類中心的歐式距離,選擇距離最小的類作為的類別,再按式(3)計算魚雷發(fā)現(xiàn)概率δ,此時式中的m表示所屬類別中特征向量的總數(shù)。計算流程詳見圖1所示。
圖1 魚雷發(fā)現(xiàn)概率計算流程圖
本文的計算模型是否可行,主要受數(shù)據(jù)和數(shù)據(jù)處理方法兩個方面的影響。目前基于互聯(lián)網(wǎng)的大數(shù)據(jù)分析技術(shù)已經(jīng)在不同領(lǐng)域得到了應(yīng)用,并取得了很好的效果,數(shù)據(jù)挖掘方法日趨完善,能夠很好地對大規(guī)模數(shù)據(jù)進行組織、分析和存儲。近年來,我海軍艦船數(shù)量迅速增加,外出執(zhí)行訓練、演習、試驗以及其他任務(wù)頻繁,發(fā)射了大量的反潛魚雷,期間產(chǎn)生的數(shù)據(jù)量急劇增加,多年來積累了大量與魚雷發(fā)現(xiàn)目標相關(guān)的數(shù)據(jù),因此,從理論上來說,本文計算模型可行。
但是想在水面艦反潛武器系統(tǒng)中實現(xiàn)該模型,還存在計算量和訓練樣本集實時更新的難題,要實現(xiàn)對大數(shù)據(jù)的實時處理,需要大量的存儲設(shè)備和處理設(shè)備,目前互聯(lián)網(wǎng)中解決該問題的方式主要是采用云計算,通過大眾參與的方式來處理大規(guī)模數(shù)據(jù)。因此,海軍艦船可以參考云計算的概念,通過某種方式將所有艦船上的計算和存儲設(shè)備進行共享,充分利用各艦船閑置的存儲和處理數(shù)據(jù)的能力,實時處理大規(guī)模數(shù)據(jù),得到反潛魚雷發(fā)現(xiàn)概率以及更新訓練樣本集的目的。同時隨著計算機處理和存儲數(shù)據(jù)能力的提升,將來大數(shù)據(jù)實時處理的難題應(yīng)該能夠得到更好的解決。
數(shù)據(jù)就是信息,如何利用日益增加的數(shù)據(jù)來提升我軍裝備的戰(zhàn)斗力,是一個需長期研究的過程。數(shù)據(jù)是客觀的,當數(shù)據(jù)量足夠大時,就一定能夠從中找出我們需要的信息。本文提出的計算模型是基于大數(shù)據(jù)的預測能力,充分利用了艦船在執(zhí)行各項任務(wù)期間所產(chǎn)生的有用數(shù)據(jù),但是在實際作戰(zhàn)中,魚雷的發(fā)現(xiàn)概率還會受到人為的影響,尤其是聲納兵的能力,且本文的模型未考慮目標機動的情況,這些都是下一步需要研究的重點。