基于CSAGA-LSSVM算法的坦克駕駛模擬訓(xùn)練數(shù)據(jù)分類挖掘

2022-02-16 11:12鄧青，薛青，翟凱

山東科技大學(xué)學(xué)報(bào)(自然科學(xué)版) 2022年1期

鄧青，薛青，翟凱

(1. 陸軍裝甲兵學(xué)院演訓(xùn)中心，北京 100072; 2. 68303部隊(duì)，青海格爾木 816099)

坦克駕駛模擬訓(xùn)練是裝甲兵掌握駕駛技能的重要途徑，對(duì)提高裝甲分隊(duì)?wèi)?zhàn)場(chǎng)快速機(jī)動(dòng)能力具有重要意義[1-2]。坦克駕駛模擬訓(xùn)練數(shù)據(jù)包括訓(xùn)練操作數(shù)據(jù)、受訓(xùn)人員數(shù)據(jù)等，這些數(shù)據(jù)之間蘊(yùn)含著復(fù)雜的關(guān)系。傳統(tǒng)的坦克駕駛模擬訓(xùn)練結(jié)果由人工進(jìn)行統(tǒng)計(jì)分析[3]，易受分析人員專業(yè)知識(shí)、個(gè)人偏好的主觀影響，對(duì)訓(xùn)練的影響因素考慮不全，無法精確指導(dǎo)受訓(xùn)人員，也難以從這些復(fù)雜的數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的訓(xùn)練規(guī)律。為解決這一問題，提出將分類挖掘引入坦克駕駛模擬訓(xùn)練數(shù)據(jù)分析中，以期從中獲取訓(xùn)練指導(dǎo)規(guī)律。

Robinson等[4]運(yùn)用主成分分析方法對(duì)通信指揮模擬訓(xùn)練數(shù)據(jù)進(jìn)行分析，為實(shí)施作戰(zhàn)指揮提供支持，但需要事先提取指揮員的能力特征表示，不同場(chǎng)景下的概念描述比較繁雜。Cady[5]選擇裝甲裝備模擬訓(xùn)練系統(tǒng)中的地形條件、任務(wù)樣式、敵人屬性等作為輸入數(shù)據(jù)，運(yùn)用定制的聚類算法和最小二乘法進(jìn)行分析，得出殺傷力、戰(zhàn)損率等結(jié)果與輸入數(shù)據(jù)之間的關(guān)系，但算法細(xì)節(jié)沒有描述。Wang等[6]采用聚類方法分析裝甲兵模擬訓(xùn)練數(shù)據(jù)，通過發(fā)現(xiàn)數(shù)據(jù)分布的簇特征，去除離群值，計(jì)算車輛位置的平均值，得出中心點(diǎn)移動(dòng)速度與各車速度之間的關(guān)系，為機(jī)動(dòng)力評(píng)估提供依據(jù)，但均值計(jì)算存在有偏估計(jì)問題。鄧桂龍等[7]運(yùn)用關(guān)聯(lián)規(guī)則方法分析某型空地作戰(zhàn)系統(tǒng)模擬訓(xùn)練數(shù)據(jù)，提取雷達(dá)連續(xù)照射時(shí)間、打擊導(dǎo)彈陣地種類與作戰(zhàn)效果之間的強(qiáng)關(guān)聯(lián)規(guī)則，輔助作戰(zhàn)分析人員獲取更多有用的知識(shí)，但生成規(guī)則的數(shù)量龐大，需要人工篩選。唐志武等[8]采集了裝甲兵模擬訓(xùn)練系統(tǒng)在特殊想定條件下的交戰(zhàn)數(shù)據(jù)，運(yùn)用多變量決策樹進(jìn)行分析，得到機(jī)動(dòng)、防護(hù)等作戰(zhàn)能力指標(biāo)的影響因素，但決策樹的分叉比較繁瑣。貝葉斯網(wǎng)絡(luò)運(yùn)用有向圖模型來描述和計(jì)算變量之間的概率依賴關(guān)系，利用先驗(yàn)知識(shí)更新后驗(yàn)概率，但往往需要專家確定初始值[9]，而坦克駕駛模擬訓(xùn)練數(shù)據(jù)在很多情況下無法提前確定先驗(yàn)概率。決策樹分類具有原理簡(jiǎn)單、抗噪音強(qiáng)等優(yōu)點(diǎn)[10]，主要適用于小樣本數(shù)據(jù)集的分類，在面對(duì)海量高維度數(shù)據(jù)時(shí)易產(chǎn)生無效節(jié)點(diǎn)。深度學(xué)習(xí)在圖像識(shí)別、自然語言理解領(lǐng)域有著廣泛運(yùn)用[11]，適合從高維度數(shù)據(jù)中提取特征，但由于內(nèi)部的“黑盒”，對(duì)提取特征可解釋性較差。最小二乘支持向量機(jī)(least squares support vector machine，LSSVM)利用核函數(shù)、特征空間等處理高維數(shù)據(jù)，實(shí)現(xiàn)從樣本空間到特征空間的映射，具有良好的分類能力[12-13]。

坦克駕駛模擬訓(xùn)練數(shù)據(jù)具有時(shí)序性的特點(diǎn)，不能直接輸入LSSVM進(jìn)行分類，而要提取相應(yīng)的特征后進(jìn)行分類，同時(shí)LSSVM存在的超參選擇難問題也需要解決。本研究在LSSVM中引入Shapelets并進(jìn)行組合以提取原始數(shù)據(jù)特征，設(shè)計(jì)自適應(yīng)遺傳算法(adaptive genetic algorithm，AGA)實(shí)現(xiàn)超參數(shù)的最優(yōu)選擇，最終得到一個(gè)組合Shapelets的自適應(yīng)遺傳最小二乘支持向量機(jī)算法(combination shapelets adaptive genetic algorithm-least squares support vector machine, CSAGA-LSSVM)，將其應(yīng)用于坦克駕駛模擬訓(xùn)練操作數(shù)據(jù)分析，通過分類得到標(biāo)準(zhǔn)的駕駛操作動(dòng)作集合，更好地對(duì)受訓(xùn)人員進(jìn)行指導(dǎo)。

1 坦克駕駛模擬訓(xùn)練數(shù)據(jù)分類挖掘問題描述

坦克駕駛模擬訓(xùn)練數(shù)據(jù)中的知識(shí)和信息是分析決策的有效依據(jù)。對(duì)這些數(shù)據(jù)進(jìn)行分類挖掘，除了具有傳統(tǒng)意義上的分類挖掘含義外，更重要的目標(biāo)是從中發(fā)現(xiàn)有意義的模式。

從模擬器的數(shù)據(jù)采集分系統(tǒng)中抽取數(shù)據(jù)集B=(B1,B2,…,Bn)，將B劃分為若干個(gè)不重復(fù)的記錄，其中每個(gè)元組都對(duì)應(yīng)相同數(shù)量的條件屬性和類別屬性，假設(shè)條件屬性值的集合為C={C1,C2,…,Cn}，類別屬性值的集合為D={D1,D2,…,Dn}，則分類挖掘問題為發(fā)現(xiàn)從C到D的映射f:C→D[14]。在此基礎(chǔ)上，將坦克駕駛模擬訓(xùn)練數(shù)據(jù)分類挖掘描述如下：

假設(shè)P={P(k)|k=1,2,…,N}為坦克駕駛模擬訓(xùn)練數(shù)據(jù)的N維特征空間U?RN中所包含的非空模式集，其中任一子集族記為S={S(l)|l=1,2,…,c,1≤c≤N}，若約束條件

(1)

成立，則稱S是對(duì)N維特征空間劃分所形成的一個(gè)子類，即S為P中的一個(gè)分類。

2 CSAGA-LSSVM分類挖掘算法

TS={vt1,vt2,…,vti,…,vtn}是一個(gè)實(shí)值時(shí)間序列，其中vti為時(shí)間序列點(diǎn)，n為時(shí)間序列長(zhǎng)度；記為|TS|。通常相鄰時(shí)間序列點(diǎn)之間是等間隔的，時(shí)間序列簡(jiǎn)記為TS={v1,v2,…,vi,…,vn}。時(shí)間序列的子序列TSj,l={vtj,vtj+1,…,vtj+l-1}是一個(gè)從TS取出起始位置為j、長(zhǎng)度為l的連續(xù)序列。m個(gè)時(shí)間序列TS組成的集合稱作時(shí)間序列數(shù)據(jù)集，記為DTS={TS1,TS2,…,TSi,…,TSm}，其中時(shí)間序列數(shù)據(jù)集的實(shí)例數(shù)|DTS|=m。

Shapelets是時(shí)間序列TS中能夠最大程度確定該序列所屬類標(biāo)簽的特征表示，也是最具有辨識(shí)性和可解釋性的局部時(shí)序模式。一個(gè)長(zhǎng)度為k的Shapelets={s1,s2,…,sk}是時(shí)間序列TS={v1,v2,…,vi,…,vn}的一個(gè)子序列。在時(shí)間序列分類問題中，從時(shí)間序列數(shù)據(jù)DTS集中每次學(xué)習(xí)獲得的時(shí)間序列Shapelets長(zhǎng)度并不相同。

2.1 基于關(guān)鍵點(diǎn)的Shapelets快速獲取

Shapelets獲取是整個(gè)分類算法的第一步，通過定義關(guān)鍵點(diǎn)篩選子序列，減少產(chǎn)生的候選Shapelets個(gè)數(shù)，從而快速獲取Shapelets[15]。

關(guān)鍵點(diǎn)是從時(shí)間序列點(diǎn)內(nèi)部產(chǎn)生的，并能夠表達(dá)時(shí)間序列的主要特征和變化趨勢(shì)。本研究的關(guān)鍵點(diǎn)包括時(shí)間序列的起始點(diǎn)、結(jié)束點(diǎn)、階躍點(diǎn)和極值點(diǎn)。

(2)

(3)

其中k是極值點(diǎn)附近鄰域的大小。

確定關(guān)鍵點(diǎn)后，按以下步驟產(chǎn)生Shapelets：

1)Key為存儲(chǔ)關(guān)鍵點(diǎn)的數(shù)組，Dsup為存儲(chǔ)Shapelets的字典，初始化均為空。設(shè)定初始鄰域k、閾值ρ。TS={v1,v2,…,vn}為一時(shí)間序列，n為時(shí)間序列長(zhǎng)度，i=1；

2) 判斷點(diǎn)vi是否為時(shí)間序列的起始點(diǎn)，若是則將點(diǎn)vi存入數(shù)組Key中，轉(zhuǎn)步驟6)；

3) 判斷點(diǎn)vi是否滿足vi-k≤vi且vi+k≤vi或vi≤vi-k且vi≤vi+k，若是則將點(diǎn)vi存入數(shù)組Key中，轉(zhuǎn)步驟6)；

4) 判斷點(diǎn)vi是否滿足(vi+1-vi)/(vi-vi-1)≥ρ，若是則將點(diǎn)vi存入數(shù)組Key中，轉(zhuǎn)步驟6)；

5) 判斷點(diǎn)vi是否為時(shí)間序列的結(jié)束點(diǎn)，若是則將點(diǎn)vi存入數(shù)組Key中，轉(zhuǎn)步驟7)；

6) 結(jié)束對(duì)點(diǎn)vi的處理，i=i+1，轉(zhuǎn)步驟2)；

7) 對(duì)關(guān)鍵點(diǎn)數(shù)組Key進(jìn)行遍歷，按順序依次從Key中取出兩個(gè)元素構(gòu)成Shapelets的兩個(gè)端點(diǎn)，并將該Shapelets及其所在的序號(hào)存入Dsup。

2.2 組合Shapelets特征生成

通過坦克駕駛模擬器可以進(jìn)行各種駕駛操作練習(xí)，對(duì)油門、離合等部件的操作有明確的先后次序和時(shí)間間隔要求，因此受訓(xùn)人員的駕駛動(dòng)作識(shí)別屬于多維時(shí)間序列分類問題。而之前獲取的Shapelets由于忽略不同序列之間的操作時(shí)間、邏輯組合等關(guān)系，難以達(dá)到準(zhǔn)確的辨識(shí)效果。因此將多個(gè)Shapelets進(jìn)行組合，并加入時(shí)間間隔，以增強(qiáng)組合Shapelets的分類能力，并通過信息增益評(píng)價(jià)最優(yōu)Shapelets組合，以提高分類的準(zhǔn)確性。

對(duì)于長(zhǎng)度均為n的TS1和TS2，采用歐氏距離

(4)

作為兩個(gè)時(shí)間序列之間的距離，來度量?jī)烧唛g的差異。

對(duì)于Shapelets子序列s與TSi的距離shpdis(s,TSi)，采用滑動(dòng)窗口方式在TSi上生成(n-s+1)個(gè)與s等長(zhǎng)的序列TSi,|s|，按式(4)計(jì)算距離，由動(dòng)態(tài)彎曲距離比對(duì)原則取最小值作為s與TS1之間的距離度量，即：

shpdis(s,TSi)=min(dis(s,TSi,|s|)) 。

(5)

對(duì)于時(shí)間序列數(shù)據(jù)集DTS={TS1,TS2,…,TSi,…,TSm}，類標(biāo)簽的個(gè)數(shù)為C，設(shè)某一類ci在時(shí)間序列數(shù)據(jù)集DTS中有ni個(gè)時(shí)間序列，則時(shí)間序列數(shù)據(jù)集DTS的熵表示為：

(6)

隨機(jī)選擇s1、s2兩個(gè)Shapelets進(jìn)行合取操作，按式(5)分別計(jì)算s1、s2與DTS={TS1,TS2,…,TSi,…,TSm}中每一個(gè)時(shí)間序列之間的距離。合取后的s1∧s2同時(shí)含有s1、s2的特征，則s1∧s2與TSi的距離comshpdis(s1∧s2,TSi)應(yīng)取兩者中較大的值進(jìn)行度量：

comshpdis(s1∧s2,TSi)=max(shpdis(s1,TSi),shpdis(s2,TSi)) 。

(7)

對(duì)s1∧s2與DTS={TS1,TS2,…,TSi,…,TSm}中時(shí)間序列的距離按遞增順序存入一維數(shù)組Discshp。設(shè)定閾值δ，遍歷數(shù)組Discshp元素并與δ比較，將時(shí)間序列數(shù)據(jù)集DTS分成DTSleft、DTSright兩部分：

DTSleft={TSi|TSi∈DTS,Discshp[i]≤δ}，

(8)

DTSright={TSi|TSi∈DTS,Discshp[i]>δ}。

(9)

通過式(6)計(jì)算DTSleft、DTSright數(shù)據(jù)集的熵，得到s1∧s2的信息增益

(10)

以對(duì)s1∧s2進(jìn)行評(píng)估，并將對(duì)應(yīng)的子序列加入候選組合Shapelets，記作Canshp。

為增強(qiáng)組合Shapelets的分類能力，參照決策樹的構(gòu)建思想，將Shapelets之間的時(shí)間間隔作為分類的輔助特征，減少單純使用距離度量分為兩個(gè)數(shù)據(jù)集DTSleft、DTSright所產(chǎn)生的分類誤差。在式(5)中，通過求取s與TSi的距離最小值，找到最佳匹配初始位置記作Bpos(s,TSi)，TSi(Bpos(s,TSi),Bpos(s,TSi)+s-1)表示時(shí)間序列TSi從初始位置Bpos(s,TSi)開始，長(zhǎng)度為|s|的子序列，則有：

shpdis(s,TSi)=dis(s,TSi(Bpos(s,TSi),Bpos(s,TSi)+s-1)) 。

(11)

設(shè)Bpos(s1,TSi)、Bpos(s2,TSi)分別表示s1、s2與TSi的最佳匹配初始位置，并且Bpos(s1,TSi)

Itime(s1∧s2)=Bpos(s2,TSi)-Bpos(s1,TSi) 。

(12)

對(duì)Canshp中的所有組合Shapelets按式(12)計(jì)算相應(yīng)子序列的時(shí)間間隔，得到時(shí)間間隔集合

SItime={Itime(si∧sj)|Itime(si∧sj)=Bpos(sj,TS)-Bpos(si,TS),si,sj∈Canshp} 。

(13)

(14)

(15)

通過式(6)、(10)計(jì)算得到信息增益

(16)

選擇信息增益最大的子序列作為組合Shapelets。

2.3 基于自適應(yīng)遺傳算法的LSSVM超參數(shù)尋優(yōu)

考慮到用LSSVM分類時(shí)，核參數(shù)σ和懲罰因子C的取值對(duì)分類算法的性能有重要影響，而且遺傳算法具有良好的魯棒性，故本節(jié)采用遺傳算法進(jìn)行參數(shù)尋優(yōu)。但傳統(tǒng)的遺傳算法存在早熟收斂等問題，故采用自適應(yīng)遺傳算法改進(jìn)交叉、變異操作，避免陷入局部最優(yōu)。具體步驟如下。

1) 交叉操作

采用單點(diǎn)交叉算子，隨機(jī)選擇兩個(gè)父代個(gè)體，并設(shè)置每一對(duì)個(gè)體的基因位置用于交叉操作。隨著進(jìn)化代數(shù)的增加，按式(17)自動(dòng)調(diào)整交叉概率pc，然后在交叉點(diǎn)進(jìn)行染色體互換，生成兩個(gè)新的子個(gè)體。這種自適應(yīng)變化克服了因采用固定交叉概率而導(dǎo)致的后期不易保留優(yōu)秀個(gè)體的問題，有利于維護(hù)種群的多樣性。

(17)

式中：τ為進(jìn)化代數(shù)，psize為種群數(shù)量，len為染色體長(zhǎng)度。

2) 變異操作

變異操作促使產(chǎn)生新個(gè)體，可以提高算法的局部搜索能力，變異概率設(shè)定過高容易破壞適應(yīng)度最優(yōu)的個(gè)體，導(dǎo)致收斂變慢；過低不利于產(chǎn)生新個(gè)體，容易陷入早熟。根據(jù)個(gè)體的適應(yīng)度變化動(dòng)態(tài)調(diào)整變異概率pm，對(duì)于適應(yīng)度較小的個(gè)體賦予較大的變異概率，促進(jìn)個(gè)體向更優(yōu)解進(jìn)化，反之賦予較小概率，即：

(18)

式中：fitmax為種群中的最大適應(yīng)度值，fitmin為種群中的最小適應(yīng)度值，fiti為種群中個(gè)體i的適應(yīng)度值，λ為調(diào)整系數(shù)，pm0為初始概率常數(shù)。

2.4 基于組合Shapelets的AGA-LSSVM分類

在獲得組合Shapelets的基礎(chǔ)上，利用Shapelets轉(zhuǎn)換概念[16-17]計(jì)算原始時(shí)間序列與Shapelets之間的距離，將原始序列映射到新的特征空間，通過AGA-LSSVM算法進(jìn)行分類。

假設(shè)xk∈Rn為經(jīng)轉(zhuǎn)換后的輸入，yk∈R為類標(biāo)簽，則LSSVM將分類轉(zhuǎn)化為如下優(yōu)化問題：

(19)

式中：ω為權(quán)重矩陣，b為偏倚變量，ek為訓(xùn)練誤差，C為懲罰因子。

對(duì)式(19)的優(yōu)化問題采用拉格朗日泛函得到下式：

(20)

(21)

結(jié)合卡庫(kù)塔條件(Karush-Kuhn-Tucker，KKT)，將式(21)轉(zhuǎn)換為矩陣形式所表示的線性方程組：

(22)

令A(yù)=Ω+C-1I，最終求得α和b分別為：

α=A-1(Y-bH)，

(23)

(24)

根據(jù)α和b的值，對(duì)任意輸入樣本x的分類函數(shù)為：

(25)

對(duì)于多維時(shí)間序列數(shù)據(jù)集DTS={TS1,TS2,…,TSi,…,TSm}的任一維TSi，其輸入樣本子集可采用AGA-LSSVM方法學(xué)習(xí)訓(xùn)練出分類器，根據(jù)符號(hào)函數(shù)sgn()計(jì)算輸出類標(biāo)簽，為：

(26)

通過以上對(duì)CSAGA-LSSVM分類挖掘算法四個(gè)階段的描述，得到CSAGA-LSSVM算法具體流程如圖1所示。

圖1 CSAGA-LSSVM分類挖掘算法流程圖Fig. 1 Flow chart of CSAGA-LSSVM classification mining algorithm

3 實(shí)驗(yàn)與對(duì)比分析

為了驗(yàn)證CSAGA-LSSVM分類挖掘算法性能，設(shè)計(jì)多維時(shí)間序列數(shù)據(jù)的分類實(shí)驗(yàn)，分析該算法的分類精度和執(zhí)行效率。

實(shí)驗(yàn)用計(jì)算機(jī)配置：處理器Intel(R) Core(TM) i7-4510@2.60 GHz，硬盤1 TB+128 GB SSD，顯卡NVIDIA GetForce 840 M，內(nèi)存8 GB DDR3，操作系統(tǒng)Windows 7 64位，編程環(huán)境為Python 3.7。選擇公開數(shù)據(jù)集Trace、ItalyPower、Wafer和Coffee進(jìn)行對(duì)比實(shí)驗(yàn)，數(shù)據(jù)集的簡(jiǎn)要說明如表1所示。

表1 實(shí)驗(yàn)數(shù)據(jù)集Tab. 1 Experiment data set

實(shí)驗(yàn)中分別利用基于采樣Shapelets[18](S-Shapelets)、邏輯Shapelets[19](L-Shapelets)和本研究的組合Shapelets(C-Shapelets)對(duì)原始數(shù)據(jù)進(jìn)行特征提取，其中S-Shapelets通過劃分子類得到中心序列，選擇與中心序列距離之和最小的序列作為采樣數(shù)據(jù)，從而減少候選Shapelets的產(chǎn)生；L-Shapelets采用加速技術(shù)與剪枝方法過濾具有相似形狀的Shapelets，從而增加更多有辨別能力的Shapelets用于數(shù)據(jù)轉(zhuǎn)換，大大提高了分類的準(zhǔn)確度。分別采用LSSVM、GA-LSSVM和AGA-LSSVM建立分類模型，共形成9種不同的分類方法。選取分類準(zhǔn)確率和運(yùn)行時(shí)間兩個(gè)指標(biāo)，對(duì)9種分類方法的性能進(jìn)行實(shí)驗(yàn)測(cè)試對(duì)比。實(shí)驗(yàn)中采用8折交叉驗(yàn)證法將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集，通過訓(xùn)練集對(duì)每個(gè)分類算法進(jìn)行迭代訓(xùn)練，然后在測(cè)試集上進(jìn)行檢驗(yàn)，取平均值作為兩個(gè)評(píng)價(jià)指標(biāo)的最終結(jié)果。

1) 分類準(zhǔn)確率

分類準(zhǔn)確率是測(cè)試集上正確識(shí)別的樣本數(shù)與數(shù)據(jù)對(duì)象總數(shù)的比值。9個(gè)分類方法在不同數(shù)據(jù)集上的準(zhǔn)確率對(duì)比見表2。

表2 9個(gè)分類方法在不同數(shù)據(jù)集上的分類準(zhǔn)確率對(duì)比Tab. 2 Comparison of classification accuracy of 9 classification methods on different data sets %

從表2可見，CSAGA-LSSVM分類方法的準(zhǔn)確率要優(yōu)于其他分類方法，且采用C-Shapelets的同一分類模型具有最高的準(zhǔn)確率，說明C-Shapelets通過引入不同Shapelets之間的時(shí)間間隔對(duì)子序列進(jìn)行組合，并根據(jù)信息增益選擇最優(yōu)的子序列，可以有效增強(qiáng)Shapelets的辨識(shí)能力，提高分類精度。同時(shí)基于C-Shapelets的AGA-LSSVM通過自適應(yīng)遺傳操作，比LSSVM、GA-LSSVM能搜索到更優(yōu)的超參數(shù)解，對(duì)原始時(shí)間序列數(shù)據(jù)有更完整的特征表示，表現(xiàn)出更好的分類能力。另外，利用S-Shapelets的LSSVM在Trace數(shù)據(jù)集上的分類準(zhǔn)確率較低，說明直接采用單個(gè)Shapelets對(duì)較長(zhǎng)的時(shí)間序列進(jìn)行分類，容易忽略不同子序列之間的關(guān)聯(lián)，導(dǎo)致分類效果下降。而L-Shapelets采用剪枝策略對(duì)相似的Shapelets進(jìn)行過濾，增加其他特征的Shapelets，具有較高的分類精度。

2) 運(yùn)行時(shí)間

通過調(diào)用Python中time模塊的時(shí)鐘函數(shù)返回當(dāng)前時(shí)間，用來計(jì)算算法運(yùn)行的時(shí)間。表3為9個(gè)分類方法在不同數(shù)據(jù)集上的運(yùn)行時(shí)間對(duì)比。

表3 9個(gè)分類方法在不同數(shù)據(jù)集上的運(yùn)行時(shí)間對(duì)比Tab. 3 Comparison of running time of 9 classification methods on different data sets s

從表3可知，直接采用S-Shapelets的LSSVM分類方法所需時(shí)間最少，原因在于S-Shapelets沒有進(jìn)行不同Shapelets之間的組合運(yùn)算，而是通過子類劃分產(chǎn)生候選Shapelets，計(jì)算過程比L-Shapelets、C-Shapelets簡(jiǎn)單，并且LSSVM不進(jìn)行參數(shù)尋優(yōu)，因此整個(gè)算法的運(yùn)行時(shí)間最少?；贑-Shapelets的時(shí)間序列表示充分利用具有顯著特征的關(guān)鍵點(diǎn)，能夠快速產(chǎn)生候選Shapelets，減少了相應(yīng)子序列的搜索時(shí)間，從而算法的運(yùn)行效率高。L-Shapelets在所有可能的子序列空間搜索候選Shapelets，空間復(fù)雜度較大，在產(chǎn)生Shapelets后還要進(jìn)行迭代剪枝操作，故大多數(shù)情況下基于L-Shapelets的AGA-LSSVM所花費(fèi)時(shí)間較多。另外AGA-LSSVM和GA-LSSVM采用遺傳操作對(duì)LSSVM超參進(jìn)行尋優(yōu)，需要反復(fù)迭代直至全局收斂或達(dá)到規(guī)定的代數(shù)，因此運(yùn)行時(shí)間相比傳統(tǒng)的LSSVM要長(zhǎng)，但準(zhǔn)確率有所提高。

綜上，CSAGA-LSSVM分類方法在準(zhǔn)確率方面具有明顯優(yōu)勢(shì)，適用于不同規(guī)模和密度的數(shù)據(jù)集，說明所提出的組合Shapelets能對(duì)原始時(shí)間序列進(jìn)行更完整的特征表示。在運(yùn)行時(shí)間上，基于C-Shapelets的AGA-LSSVM分類方法比S-Shapelets的LSSVM長(zhǎng)，但比采用L-Shapelets的GA-LSSVM、AGA-LSSVM運(yùn)行時(shí)間要少。綜合考慮分類準(zhǔn)確率的影響及分類模型訓(xùn)練的時(shí)間要求，CSAGA-LSSVM分類方法是可行的。

4 基于CSAGA-LSSVM的坦克駕駛模擬訓(xùn)練操作數(shù)據(jù)分析

4.1 數(shù)據(jù)來源

通過安裝在某型坦克駕駛模擬器上的位移傳感器、光電傳感器實(shí)時(shí)記錄受訓(xùn)人員的操作數(shù)據(jù)，模擬器系統(tǒng)幀頻為25 fps，每運(yùn)行1幀采集數(shù)據(jù)1次，即每秒采集25組數(shù)據(jù)。采集的操作數(shù)據(jù)主要包括起動(dòng)開關(guān)、變速裝置擋位、加油踏板、離合器踏板等。

為便于分析，對(duì)坦克駕駛操作分為基本操作和組合操作。基本操作是指駕駛過程只有一個(gè)操縱部件的狀態(tài)發(fā)生變化，是駕駛操作的“元?jiǎng)幼鳌?。組合操作是由若干個(gè)基本操作按不同的順序組成的動(dòng)作序列，與動(dòng)作次序、完備程度、完成時(shí)間等密切相關(guān)。換擋操作是適應(yīng)不同路面環(huán)境下的機(jī)動(dòng)要求，是坦克駕駛操作的一項(xiàng)重要內(nèi)容。下面以“一擋換二擋”為例，運(yùn)用CSAGA-LSSVM算法進(jìn)行模擬訓(xùn)練結(jié)果分析。

在坦克駕駛模擬訓(xùn)練實(shí)驗(yàn)中，選擇1 200名受訓(xùn)人員(二級(jí)坦克駕駛員、三級(jí)坦克駕駛員、初級(jí)坦克駕駛員和無等級(jí)人員各300名)在某型坦克駕駛模擬教室進(jìn)行“一擋換二擋”操作訓(xùn)練，每名受訓(xùn)人員進(jìn)行6次換擋操作，通過傳感器和模擬訓(xùn)練系統(tǒng)采集到的駕駛員部分操作過程數(shù)據(jù)如表4所示。

表4 坦克駕駛模擬器“一擋換二擋”操作數(shù)據(jù)Tab. 4 Data of the tank driving simulator in “shifting from the first to the second gear” operation

4.2 最優(yōu)分類解獲取

從表4可以看出，油門踏板位移、離合器踏板位移和制動(dòng)器踏板位移屬于一元時(shí)間序列數(shù)據(jù)，變量取值隨時(shí)間連續(xù)變化形成多變量時(shí)間序列。本次實(shí)驗(yàn)共產(chǎn)生7 200個(gè)樣本，選擇油門踏板位移、離合器踏板位移、制動(dòng)器踏板位移、擋位值為特征變量，對(duì)操作成績(jī)離散化處理為類標(biāo)簽y，形成決策表，如表5所示。

表5 坦克駕駛模擬器操作數(shù)據(jù)分析決策表Tab. 5 Data analysis decision of the tank driving simulator operations

從表5中隨機(jī)選取80%的數(shù)據(jù)作為訓(xùn)練集進(jìn)行分類器訓(xùn)練，余下的20%作為測(cè)試集。首先通過Shapelets特征提取方法對(duì)換擋操作的多維時(shí)間序列進(jìn)行表示，求解組合Shapelets，再依次計(jì)算油門踏板位移、離合器踏板位移等時(shí)序數(shù)據(jù)與組合Shapelets之間的距離，實(shí)現(xiàn)換擋操作數(shù)據(jù)變換，用于后續(xù)分類輸入；然后運(yùn)用AGA求得最優(yōu)超參數(shù)C=65.8，σ=0.25?；谡{(diào)優(yōu)后的分類模型對(duì)時(shí)序數(shù)據(jù)進(jìn)行分類，最終得出分類結(jié)果如表6所示。

表6 結(jié)果數(shù)據(jù)Tab. 6 Statistics of Results

4.3 結(jié)果分析

以表6為依據(jù)，結(jié)合坦克駕駛換擋操作的理論與實(shí)踐，對(duì)得到的最終解分析如下：

1) “一擋換二擋”操作成績(jī)合格所對(duì)應(yīng)的Shapelets：油門踏板時(shí)序數(shù)據(jù)Shapeletsacr[1]∧Shapeletsacr[2]={00,01,00}∧{00,01}，離合器踏板位移時(shí)序數(shù)據(jù)Shapeletsclu[1]∧Shapeletsclu[2]={000,010,011,110,111}∧{111,100,011,010,000}，擋位時(shí)序數(shù)據(jù)Shapeletsgear={1,2}，表示換擋前應(yīng)平穩(wěn)踩下油門踏板至適當(dāng)位置，然后松開油門踏板同時(shí)將離合器踏板由初始位置踩到最大位置，迅速將變速桿由1擋推向2擋位置，掛擋后松回離合器踏板應(yīng)做到前快后穩(wěn)，同時(shí)均勻踩下油門踏板。

2) “一擋換二擋”操作成績(jī)不合格所對(duì)應(yīng)的Shapelets：制動(dòng)器踏板位移時(shí)序數(shù)據(jù)Shapeletsbrk={00,01，11}，油門踏板時(shí)序數(shù)據(jù)Shapeletsacr={00}，擋位時(shí)序數(shù)據(jù)Shapeletsgear={1}，表示“一擋換二擋”過程中踩下了制動(dòng)器踏板，而未踩油門踏板進(jìn)行沖車，車輛擋位值沒有發(fā)生變化；油門踏板時(shí)序數(shù)據(jù)Shapeletsacr[1]∧Shapeletsacr[2]={00,01,00}∧{00,01}，離合器踏板位移時(shí)序數(shù)據(jù)Shapeletsclu={000}，擋位時(shí)序數(shù)據(jù)Shapeletsgear={1}，表示“一擋換二擋”過程中未踩下離合器踏板，換擋操作不合格。

將“一擋換二擋”操作成績(jī)?yōu)楹细袼鶎?duì)應(yīng)的Shapelets組合可建立相應(yīng)的標(biāo)準(zhǔn)操作動(dòng)作模式，作為“一擋換二擋”操作技能水平的評(píng)價(jià)等級(jí)，對(duì)受訓(xùn)人員的駕駛動(dòng)作進(jìn)行精確分析。比如，隨機(jī)選取一名受訓(xùn)人員的訓(xùn)練樣本數(shù)據(jù)進(jìn)行預(yù)處理生成相應(yīng)的Shapelets，其中離合器踏板位移時(shí)序數(shù)據(jù)Shapeletsclu[1]={000,011,100,110}，擋位時(shí)序數(shù)據(jù)Shapeletsgear={1}。通過計(jì)算與標(biāo)準(zhǔn)操作動(dòng)作模式之間的距離，可以發(fā)現(xiàn)該名受訓(xùn)人員在換擋過程中沒有將離合器踏板踩到底，導(dǎo)致?lián)跷粻顟B(tài)仍為1擋，掛擋不成功，表明該受訓(xùn)人員掌握動(dòng)作要領(lǐng)較差，需要在今后的訓(xùn)練中加強(qiáng)理論學(xué)習(xí)，熟記換擋的關(guān)鍵動(dòng)作和操作流程，同時(shí)注重模擬器基本駕駛動(dòng)作訓(xùn)練，反復(fù)體會(huì)換擋要領(lǐng)。

5 結(jié)論

本研究為挖掘坦克駕駛模擬訓(xùn)練數(shù)據(jù)，提出一種CSAGA-LSSVM分類挖掘算法。先根據(jù)起始點(diǎn)、結(jié)束點(diǎn)、階躍點(diǎn)、極值點(diǎn)快速獲取候選Shapelets，減少產(chǎn)生的候選Shapelets數(shù)量；再通過選擇距離和時(shí)間間隔對(duì)Shapelets進(jìn)行組合操作，并計(jì)算信息增益評(píng)價(jià)最優(yōu)組合，增強(qiáng)特征的辨識(shí)能力，提升分類的準(zhǔn)確性；然后設(shè)計(jì)了自適應(yīng)遺傳算法，通過動(dòng)態(tài)調(diào)整交叉和變異概率來加速搜索LSSVM超參數(shù)的全局最優(yōu)解，減少分類挖掘時(shí)間；最后，利用CSAGA-LSSVM算法分析某型坦克駕駛模擬器換擋操作數(shù)據(jù)，提取不同訓(xùn)練水平人員的操作特征，從而更好地發(fā)現(xiàn)訓(xùn)練問題，促進(jìn)個(gè)性化訓(xùn)練的開展。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡