国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CSAGA-LSSVM算法的坦克駕駛模擬訓(xùn)練數(shù)據(jù)分類挖掘

2022-02-16 11:12青,薛青,翟
關(guān)鍵詞:模擬訓(xùn)練時(shí)序踏板

鄧 青,薛 青,翟 凱

(1. 陸軍裝甲兵學(xué)院 演訓(xùn)中心,北京 100072; 2. 68303部隊(duì),青海 格爾木 816099)

坦克駕駛模擬訓(xùn)練是裝甲兵掌握駕駛技能的重要途徑,對(duì)提高裝甲分隊(duì)?wèi)?zhàn)場(chǎng)快速機(jī)動(dòng)能力具有重要意義[1-2]。坦克駕駛模擬訓(xùn)練數(shù)據(jù)包括訓(xùn)練操作數(shù)據(jù)、受訓(xùn)人員數(shù)據(jù)等,這些數(shù)據(jù)之間蘊(yùn)含著復(fù)雜的關(guān)系。傳統(tǒng)的坦克駕駛模擬訓(xùn)練結(jié)果由人工進(jìn)行統(tǒng)計(jì)分析[3],易受分析人員專業(yè)知識(shí)、個(gè)人偏好的主觀影響,對(duì)訓(xùn)練的影響因素考慮不全,無法精確指導(dǎo)受訓(xùn)人員,也難以從這些復(fù)雜的數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的訓(xùn)練規(guī)律。為解決這一問題,提出將分類挖掘引入坦克駕駛模擬訓(xùn)練數(shù)據(jù)分析中,以期從中獲取訓(xùn)練指導(dǎo)規(guī)律。

Robinson等[4]運(yùn)用主成分分析方法對(duì)通信指揮模擬訓(xùn)練數(shù)據(jù)進(jìn)行分析,為實(shí)施作戰(zhàn)指揮提供支持,但需要事先提取指揮員的能力特征表示,不同場(chǎng)景下的概念描述比較繁雜。Cady[5]選擇裝甲裝備模擬訓(xùn)練系統(tǒng)中的地形條件、任務(wù)樣式、敵人屬性等作為輸入數(shù)據(jù),運(yùn)用定制的聚類算法和最小二乘法進(jìn)行分析,得出殺傷力、戰(zhàn)損率等結(jié)果與輸入數(shù)據(jù)之間的關(guān)系,但算法細(xì)節(jié)沒有描述。Wang等[6]采用聚類方法分析裝甲兵模擬訓(xùn)練數(shù)據(jù),通過發(fā)現(xiàn)數(shù)據(jù)分布的簇特征,去除離群值,計(jì)算車輛位置的平均值,得出中心點(diǎn)移動(dòng)速度與各車速度之間的關(guān)系,為機(jī)動(dòng)力評(píng)估提供依據(jù),但均值計(jì)算存在有偏估計(jì)問題。鄧桂龍等[7]運(yùn)用關(guān)聯(lián)規(guī)則方法分析某型空地作戰(zhàn)系統(tǒng)模擬訓(xùn)練數(shù)據(jù),提取雷達(dá)連續(xù)照射時(shí)間、打擊導(dǎo)彈陣地種類與作戰(zhàn)效果之間的強(qiáng)關(guān)聯(lián)規(guī)則,輔助作戰(zhàn)分析人員獲取更多有用的知識(shí),但生成規(guī)則的數(shù)量龐大,需要人工篩選。唐志武等[8]采集了裝甲兵模擬訓(xùn)練系統(tǒng)在特殊想定條件下的交戰(zhàn)數(shù)據(jù),運(yùn)用多變量決策樹進(jìn)行分析,得到機(jī)動(dòng)、防護(hù)等作戰(zhàn)能力指標(biāo)的影響因素,但決策樹的分叉比較繁瑣。貝葉斯網(wǎng)絡(luò)運(yùn)用有向圖模型來描述和計(jì)算變量之間的概率依賴關(guān)系,利用先驗(yàn)知識(shí)更新后驗(yàn)概率,但往往需要專家確定初始值[9],而坦克駕駛模擬訓(xùn)練數(shù)據(jù)在很多情況下無法提前確定先驗(yàn)概率。決策樹分類具有原理簡(jiǎn)單、抗噪音強(qiáng)等優(yōu)點(diǎn)[10],主要適用于小樣本數(shù)據(jù)集的分類,在面對(duì)海量高維度數(shù)據(jù)時(shí)易產(chǎn)生無效節(jié)點(diǎn)。深度學(xué)習(xí)在圖像識(shí)別、自然語言理解領(lǐng)域有著廣泛運(yùn)用[11],適合從高維度數(shù)據(jù)中提取特征,但由于內(nèi)部的“黑盒”,對(duì)提取特征可解釋性較差。最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)利用核函數(shù)、特征空間等處理高維數(shù)據(jù),實(shí)現(xiàn)從樣本空間到特征空間的映射,具有良好的分類能力[12-13]。

坦克駕駛模擬訓(xùn)練數(shù)據(jù)具有時(shí)序性的特點(diǎn),不能直接輸入LSSVM進(jìn)行分類,而要提取相應(yīng)的特征后進(jìn)行分類,同時(shí)LSSVM存在的超參選擇難問題也需要解決。本研究在LSSVM中引入Shapelets并進(jìn)行組合以提取原始數(shù)據(jù)特征,設(shè)計(jì)自適應(yīng)遺傳算法(adaptive genetic algorithm,AGA)實(shí)現(xiàn)超參數(shù)的最優(yōu)選擇,最終得到一個(gè)組合Shapelets的自適應(yīng)遺傳最小二乘支持向量機(jī)算法(combination shapelets adaptive genetic algorithm-least squares support vector machine, CSAGA-LSSVM),將其應(yīng)用于坦克駕駛模擬訓(xùn)練操作數(shù)據(jù)分析,通過分類得到標(biāo)準(zhǔn)的駕駛操作動(dòng)作集合,更好地對(duì)受訓(xùn)人員進(jìn)行指導(dǎo)。

1 坦克駕駛模擬訓(xùn)練數(shù)據(jù)分類挖掘問題描述

坦克駕駛模擬訓(xùn)練數(shù)據(jù)中的知識(shí)和信息是分析決策的有效依據(jù)。對(duì)這些數(shù)據(jù)進(jìn)行分類挖掘,除了具有傳統(tǒng)意義上的分類挖掘含義外,更重要的目標(biāo)是從中發(fā)現(xiàn)有意義的模式。

從模擬器的數(shù)據(jù)采集分系統(tǒng)中抽取數(shù)據(jù)集B=(B1,B2,…,Bn),將B劃分為若干個(gè)不重復(fù)的記錄,其中每個(gè)元組都對(duì)應(yīng)相同數(shù)量的條件屬性和類別屬性,假設(shè)條件屬性值的集合為C={C1,C2,…,Cn},類別屬性值的集合為D={D1,D2,…,Dn},則分類挖掘問題為發(fā)現(xiàn)從C到D的映射f:C→D[14]。在此基礎(chǔ)上,將坦克駕駛模擬訓(xùn)練數(shù)據(jù)分類挖掘描述如下:

假設(shè)P={P(k)|k=1,2,…,N}為坦克駕駛模擬訓(xùn)練數(shù)據(jù)的N維特征空間U?RN中所包含的非空模式集,其中任一子集族記為S={S(l)|l=1,2,…,c,1≤c≤N},若約束條件

(1)

成立,則稱S是對(duì)N維特征空間劃分所形成的一個(gè)子類,即S為P中的一個(gè)分類。

2 CSAGA-LSSVM分類挖掘算法

TS={vt1,vt2,…,vti,…,vtn}是一個(gè)實(shí)值時(shí)間序列,其中vti為時(shí)間序列點(diǎn),n為時(shí)間序列長(zhǎng)度;記為|TS|。通常相鄰時(shí)間序列點(diǎn)之間是等間隔的,時(shí)間序列簡(jiǎn)記為TS={v1,v2,…,vi,…,vn}。時(shí)間序列的子序列TSj,l={vtj,vtj+1,…,vtj+l-1}是一個(gè)從TS取出起始位置為j、長(zhǎng)度為l的連續(xù)序列。m個(gè)時(shí)間序列TS組成的集合稱作時(shí)間序列數(shù)據(jù)集,記為DTS={TS1,TS2,…,TSi,…,TSm},其中時(shí)間序列數(shù)據(jù)集的實(shí)例數(shù)|DTS|=m。

Shapelets是時(shí)間序列TS中能夠最大程度確定該序列所屬類標(biāo)簽的特征表示,也是最具有辨識(shí)性和可解釋性的局部時(shí)序模式。一個(gè)長(zhǎng)度為k的Shapelets={s1,s2,…,sk}是時(shí)間序列TS={v1,v2,…,vi,…,vn}的一個(gè)子序列。在時(shí)間序列分類問題中,從時(shí)間序列數(shù)據(jù)DTS集中每次學(xué)習(xí)獲得的時(shí)間序列Shapelets長(zhǎng)度并不相同。

2.1 基于關(guān)鍵點(diǎn)的Shapelets快速獲取

Shapelets獲取是整個(gè)分類算法的第一步,通過定義關(guān)鍵點(diǎn)篩選子序列,減少產(chǎn)生的候選Shapelets個(gè)數(shù),從而快速獲取Shapelets[15]。

關(guān)鍵點(diǎn)是從時(shí)間序列點(diǎn)內(nèi)部產(chǎn)生的,并能夠表達(dá)時(shí)間序列的主要特征和變化趨勢(shì)。本研究的關(guān)鍵點(diǎn)包括時(shí)間序列的起始點(diǎn)、結(jié)束點(diǎn)、階躍點(diǎn)和極值點(diǎn)。

(2)

(3)

其中k是極值點(diǎn)附近鄰域的大小。

確定關(guān)鍵點(diǎn)后,按以下步驟產(chǎn)生Shapelets:

1)Key為存儲(chǔ)關(guān)鍵點(diǎn)的數(shù)組,Dsup為存儲(chǔ)Shapelets的字典,初始化均為空。設(shè)定初始鄰域k、閾值ρ。TS={v1,v2,…,vn}為一時(shí)間序列,n為時(shí)間序列長(zhǎng)度,i=1;

2) 判斷點(diǎn)vi是否為時(shí)間序列的起始點(diǎn),若是則將點(diǎn)vi存入數(shù)組Key中,轉(zhuǎn)步驟6);

3) 判斷點(diǎn)vi是否滿足vi-k≤vi且vi+k≤vi或vi≤vi-k且vi≤vi+k,若是則將點(diǎn)vi存入數(shù)組Key中,轉(zhuǎn)步驟6);

4) 判斷點(diǎn)vi是否滿足(vi+1-vi)/(vi-vi-1)≥ρ,若是則將點(diǎn)vi存入數(shù)組Key中,轉(zhuǎn)步驟6);

5) 判斷點(diǎn)vi是否為時(shí)間序列的結(jié)束點(diǎn),若是則將點(diǎn)vi存入數(shù)組Key中,轉(zhuǎn)步驟7);

6) 結(jié)束對(duì)點(diǎn)vi的處理,i=i+1,轉(zhuǎn)步驟2);

7) 對(duì)關(guān)鍵點(diǎn)數(shù)組Key進(jìn)行遍歷,按順序依次從Key中取出兩個(gè)元素構(gòu)成Shapelets的兩個(gè)端點(diǎn),并將該Shapelets及其所在的序號(hào)存入Dsup。

2.2 組合Shapelets特征生成

通過坦克駕駛模擬器可以進(jìn)行各種駕駛操作練習(xí),對(duì)油門、離合等部件的操作有明確的先后次序和時(shí)間間隔要求,因此受訓(xùn)人員的駕駛動(dòng)作識(shí)別屬于多維時(shí)間序列分類問題。而之前獲取的Shapelets由于忽略不同序列之間的操作時(shí)間、邏輯組合等關(guān)系,難以達(dá)到準(zhǔn)確的辨識(shí)效果。因此將多個(gè)Shapelets進(jìn)行組合,并加入時(shí)間間隔,以增強(qiáng)組合Shapelets的分類能力,并通過信息增益評(píng)價(jià)最優(yōu)Shapelets組合,以提高分類的準(zhǔn)確性。

對(duì)于長(zhǎng)度均為n的TS1和TS2,采用歐氏距離

(4)

作為兩個(gè)時(shí)間序列之間的距離,來度量?jī)烧唛g的差異。

對(duì)于Shapelets子序列s與TSi的距離shpdis(s,TSi),采用滑動(dòng)窗口方式在TSi上生成(n-s+1)個(gè)與s等長(zhǎng)的序列TSi,|s|,按式(4)計(jì)算距離,由動(dòng)態(tài)彎曲距離比對(duì)原則取最小值作為s與TS1之間的距離度量,即:

shpdis(s,TSi)=min(dis(s,TSi,|s|)) 。

(5)

對(duì)于時(shí)間序列數(shù)據(jù)集DTS={TS1,TS2,…,TSi,…,TSm},類標(biāo)簽的個(gè)數(shù)為C,設(shè)某一類ci在時(shí)間序列數(shù)據(jù)集DTS中有ni個(gè)時(shí)間序列,則時(shí)間序列數(shù)據(jù)集DTS的熵表示為:

(6)

隨機(jī)選擇s1、s2兩個(gè)Shapelets進(jìn)行合取操作,按式(5)分別計(jì)算s1、s2與DTS={TS1,TS2,…,TSi,…,TSm}中每一個(gè)時(shí)間序列之間的距離。合取后的s1∧s2同時(shí)含有s1、s2的特征,則s1∧s2與TSi的距離comshpdis(s1∧s2,TSi)應(yīng)取兩者中較大的值進(jìn)行度量:

comshpdis(s1∧s2,TSi)=max(shpdis(s1,TSi),shpdis(s2,TSi)) 。

(7)

對(duì)s1∧s2與DTS={TS1,TS2,…,TSi,…,TSm}中時(shí)間序列的距離按遞增順序存入一維數(shù)組Discshp。設(shè)定閾值δ,遍歷數(shù)組Discshp元素并與δ比較,將時(shí)間序列數(shù)據(jù)集DTS分成DTSleft、DTSright兩部分:

DTSleft={TSi|TSi∈DTS,Discshp[i]≤δ},

(8)

DTSright={TSi|TSi∈DTS,Discshp[i]>δ}。

(9)

通過式(6)計(jì)算DTSleft、DTSright數(shù)據(jù)集的熵,得到s1∧s2的信息增益

(10)

以對(duì)s1∧s2進(jìn)行評(píng)估,并將對(duì)應(yīng)的子序列加入候選組合Shapelets,記作Canshp。

為增強(qiáng)組合Shapelets的分類能力,參照決策樹的構(gòu)建思想,將Shapelets之間的時(shí)間間隔作為分類的輔助特征,減少單純使用距離度量分為兩個(gè)數(shù)據(jù)集DTSleft、DTSright所產(chǎn)生的分類誤差。在式(5)中,通過求取s與TSi的距離最小值,找到最佳匹配初始位置記作Bpos(s,TSi),TSi(Bpos(s,TSi),Bpos(s,TSi)+s-1)表示時(shí)間序列TSi從初始位置Bpos(s,TSi)開始,長(zhǎng)度為|s|的子序列,則有:

shpdis(s,TSi)=dis(s,TSi(Bpos(s,TSi),Bpos(s,TSi)+s-1)) 。

(11)

設(shè)Bpos(s1,TSi)、Bpos(s2,TSi)分別表示s1、s2與TSi的最佳匹配初始位置,并且Bpos(s1,TSi)

Itime(s1∧s2)=Bpos(s2,TSi)-Bpos(s1,TSi) 。

(12)

對(duì)Canshp中的所有組合Shapelets按式(12)計(jì)算相應(yīng)子序列的時(shí)間間隔,得到時(shí)間間隔集合

SItime={Itime(si∧sj)|Itime(si∧sj)=Bpos(sj,TS)-Bpos(si,TS),si,sj∈Canshp} 。

(13)

(14)

(15)

通過式(6)、(10)計(jì)算得到信息增益

(16)

選擇信息增益最大的子序列作為組合Shapelets。

2.3 基于自適應(yīng)遺傳算法的LSSVM超參數(shù)尋優(yōu)

考慮到用LSSVM分類時(shí),核參數(shù)σ和懲罰因子C的取值對(duì)分類算法的性能有重要影響,而且遺傳算法具有良好的魯棒性,故本節(jié)采用遺傳算法進(jìn)行參數(shù)尋優(yōu)。但傳統(tǒng)的遺傳算法存在早熟收斂等問題,故采用自適應(yīng)遺傳算法改進(jìn)交叉、變異操作,避免陷入局部最優(yōu)。具體步驟如下。

1) 交叉操作

采用單點(diǎn)交叉算子,隨機(jī)選擇兩個(gè)父代個(gè)體,并設(shè)置每一對(duì)個(gè)體的基因位置用于交叉操作。隨著進(jìn)化代數(shù)的增加,按式(17)自動(dòng)調(diào)整交叉概率pc,然后在交叉點(diǎn)進(jìn)行染色體互換,生成兩個(gè)新的子個(gè)體。這種自適應(yīng)變化克服了因采用固定交叉概率而導(dǎo)致的后期不易保留優(yōu)秀個(gè)體的問題,有利于維護(hù)種群的多樣性。

(17)

式中:τ為進(jìn)化代數(shù),psize為種群數(shù)量,len為染色體長(zhǎng)度。

2) 變異操作

變異操作促使產(chǎn)生新個(gè)體,可以提高算法的局部搜索能力,變異概率設(shè)定過高容易破壞適應(yīng)度最優(yōu)的個(gè)體,導(dǎo)致收斂變慢;過低不利于產(chǎn)生新個(gè)體,容易陷入早熟。根據(jù)個(gè)體的適應(yīng)度變化動(dòng)態(tài)調(diào)整變異概率pm,對(duì)于適應(yīng)度較小的個(gè)體賦予較大的變異概率,促進(jìn)個(gè)體向更優(yōu)解進(jìn)化,反之賦予較小概率,即:

(18)

式中:fitmax為種群中的最大適應(yīng)度值,fitmin為種群中的最小適應(yīng)度值,fiti為種群中個(gè)體i的適應(yīng)度值,λ為調(diào)整系數(shù),pm0為初始概率常數(shù)。

2.4 基于組合Shapelets的AGA-LSSVM分類

在獲得組合Shapelets的基礎(chǔ)上,利用Shapelets轉(zhuǎn)換概念[16-17]計(jì)算原始時(shí)間序列與Shapelets之間的距離,將原始序列映射到新的特征空間,通過AGA-LSSVM算法進(jìn)行分類。

假設(shè)xk∈Rn為經(jīng)轉(zhuǎn)換后的輸入,yk∈R為類標(biāo)簽,則LSSVM將分類轉(zhuǎn)化為如下優(yōu)化問題:

(19)

式中:ω為權(quán)重矩陣,b為偏倚變量,ek為訓(xùn)練誤差,C為懲罰因子。

對(duì)式(19)的優(yōu)化問題采用拉格朗日泛函得到下式:

(20)

(21)

結(jié)合卡庫(kù)塔條件(Karush-Kuhn-Tucker,KKT),將式(21)轉(zhuǎn)換為矩陣形式所表示的線性方程組:

(22)

令A(yù)=Ω+C-1I,最終求得α和b分別為:

α=A-1(Y-bH),

(23)

(24)

根據(jù)α和b的值,對(duì)任意輸入樣本x的分類函數(shù)為:

(25)

對(duì)于多維時(shí)間序列數(shù)據(jù)集DTS={TS1,TS2,…,TSi,…,TSm}的任一維TSi,其輸入樣本子集可采用AGA-LSSVM方法學(xué)習(xí)訓(xùn)練出分類器,根據(jù)符號(hào)函數(shù)sgn()計(jì)算輸出類標(biāo)簽,為:

(26)

通過以上對(duì)CSAGA-LSSVM分類挖掘算法四個(gè)階段的描述,得到CSAGA-LSSVM算法具體流程如圖1所示。

圖1 CSAGA-LSSVM分類挖掘算法流程圖Fig. 1 Flow chart of CSAGA-LSSVM classification mining algorithm

3 實(shí)驗(yàn)與對(duì)比分析

為了驗(yàn)證CSAGA-LSSVM分類挖掘算法性能,設(shè)計(jì)多維時(shí)間序列數(shù)據(jù)的分類實(shí)驗(yàn),分析該算法的分類精度和執(zhí)行效率。

實(shí)驗(yàn)用計(jì)算機(jī)配置:處理器Intel(R) Core(TM) i7-4510@2.60 GHz,硬盤1 TB+128 GB SSD,顯卡NVIDIA GetForce 840 M,內(nèi)存8 GB DDR3,操作系統(tǒng)Windows 7 64位,編程環(huán)境為Python 3.7。選擇公開數(shù)據(jù)集Trace、ItalyPower、Wafer和Coffee進(jìn)行對(duì)比實(shí)驗(yàn),數(shù)據(jù)集的簡(jiǎn)要說明如表1所示。

表1 實(shí)驗(yàn)數(shù)據(jù)集Tab. 1 Experiment data set

實(shí)驗(yàn)中分別利用基于采樣Shapelets[18](S-Shapelets)、邏輯Shapelets[19](L-Shapelets)和本研究的組合Shapelets(C-Shapelets)對(duì)原始數(shù)據(jù)進(jìn)行特征提取,其中S-Shapelets通過劃分子類得到中心序列,選擇與中心序列距離之和最小的序列作為采樣數(shù)據(jù),從而減少候選Shapelets的產(chǎn)生;L-Shapelets采用加速技術(shù)與剪枝方法過濾具有相似形狀的Shapelets,從而增加更多有辨別能力的Shapelets用于數(shù)據(jù)轉(zhuǎn)換,大大提高了分類的準(zhǔn)確度。分別采用LSSVM、GA-LSSVM和AGA-LSSVM建立分類模型,共形成9種不同的分類方法。選取分類準(zhǔn)確率和運(yùn)行時(shí)間兩個(gè)指標(biāo),對(duì)9種分類方法的性能進(jìn)行實(shí)驗(yàn)測(cè)試對(duì)比。實(shí)驗(yàn)中采用8折交叉驗(yàn)證法將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,通過訓(xùn)練集對(duì)每個(gè)分類算法進(jìn)行迭代訓(xùn)練,然后在測(cè)試集上進(jìn)行檢驗(yàn),取平均值作為兩個(gè)評(píng)價(jià)指標(biāo)的最終結(jié)果。

1) 分類準(zhǔn)確率

分類準(zhǔn)確率是測(cè)試集上正確識(shí)別的樣本數(shù)與數(shù)據(jù)對(duì)象總數(shù)的比值。9個(gè)分類方法在不同數(shù)據(jù)集上的準(zhǔn)確率對(duì)比見表2。

表2 9個(gè)分類方法在不同數(shù)據(jù)集上的分類準(zhǔn)確率對(duì)比Tab. 2 Comparison of classification accuracy of 9 classification methods on different data sets %

從表2可見,CSAGA-LSSVM分類方法的準(zhǔn)確率要優(yōu)于其他分類方法,且采用C-Shapelets的同一分類模型具有最高的準(zhǔn)確率,說明C-Shapelets通過引入不同Shapelets之間的時(shí)間間隔對(duì)子序列進(jìn)行組合,并根據(jù)信息增益選擇最優(yōu)的子序列,可以有效增強(qiáng)Shapelets的辨識(shí)能力,提高分類精度。同時(shí)基于C-Shapelets的AGA-LSSVM通過自適應(yīng)遺傳操作,比LSSVM、GA-LSSVM能搜索到更優(yōu)的超參數(shù)解,對(duì)原始時(shí)間序列數(shù)據(jù)有更完整的特征表示,表現(xiàn)出更好的分類能力。另外,利用S-Shapelets的LSSVM在Trace數(shù)據(jù)集上的分類準(zhǔn)確率較低,說明直接采用單個(gè)Shapelets對(duì)較長(zhǎng)的時(shí)間序列進(jìn)行分類,容易忽略不同子序列之間的關(guān)聯(lián),導(dǎo)致分類效果下降。而L-Shapelets采用剪枝策略對(duì)相似的Shapelets進(jìn)行過濾,增加其他特征的Shapelets,具有較高的分類精度。

2) 運(yùn)行時(shí)間

通過調(diào)用Python中time模塊的時(shí)鐘函數(shù)返回當(dāng)前時(shí)間,用來計(jì)算算法運(yùn)行的時(shí)間。表3為9個(gè)分類方法在不同數(shù)據(jù)集上的運(yùn)行時(shí)間對(duì)比。

表3 9個(gè)分類方法在不同數(shù)據(jù)集上的運(yùn)行時(shí)間對(duì)比Tab. 3 Comparison of running time of 9 classification methods on different data sets s

從表3可知,直接采用S-Shapelets的LSSVM分類方法所需時(shí)間最少,原因在于S-Shapelets沒有進(jìn)行不同Shapelets之間的組合運(yùn)算,而是通過子類劃分產(chǎn)生候選Shapelets,計(jì)算過程比L-Shapelets、C-Shapelets簡(jiǎn)單,并且LSSVM不進(jìn)行參數(shù)尋優(yōu),因此整個(gè)算法的運(yùn)行時(shí)間最少?;贑-Shapelets的時(shí)間序列表示充分利用具有顯著特征的關(guān)鍵點(diǎn),能夠快速產(chǎn)生候選Shapelets,減少了相應(yīng)子序列的搜索時(shí)間,從而算法的運(yùn)行效率高。L-Shapelets在所有可能的子序列空間搜索候選Shapelets,空間復(fù)雜度較大,在產(chǎn)生Shapelets后還要進(jìn)行迭代剪枝操作,故大多數(shù)情況下基于L-Shapelets的AGA-LSSVM所花費(fèi)時(shí)間較多。另外AGA-LSSVM和GA-LSSVM采用遺傳操作對(duì)LSSVM超參進(jìn)行尋優(yōu),需要反復(fù)迭代直至全局收斂或達(dá)到規(guī)定的代數(shù),因此運(yùn)行時(shí)間相比傳統(tǒng)的LSSVM要長(zhǎng),但準(zhǔn)確率有所提高。

綜上,CSAGA-LSSVM分類方法在準(zhǔn)確率方面具有明顯優(yōu)勢(shì),適用于不同規(guī)模和密度的數(shù)據(jù)集,說明所提出的組合Shapelets能對(duì)原始時(shí)間序列進(jìn)行更完整的特征表示。在運(yùn)行時(shí)間上,基于C-Shapelets的AGA-LSSVM分類方法比S-Shapelets的LSSVM長(zhǎng),但比采用L-Shapelets的GA-LSSVM、AGA-LSSVM運(yùn)行時(shí)間要少。綜合考慮分類準(zhǔn)確率的影響及分類模型訓(xùn)練的時(shí)間要求,CSAGA-LSSVM分類方法是可行的。

4 基于CSAGA-LSSVM的坦克駕駛模擬訓(xùn)練操作數(shù)據(jù)分析

4.1 數(shù)據(jù)來源

通過安裝在某型坦克駕駛模擬器上的位移傳感器、光電傳感器實(shí)時(shí)記錄受訓(xùn)人員的操作數(shù)據(jù),模擬器系統(tǒng)幀頻為25 fps,每運(yùn)行1幀采集數(shù)據(jù)1次,即每秒采集25組數(shù)據(jù)。采集的操作數(shù)據(jù)主要包括起動(dòng)開關(guān)、變速裝置擋位、加油踏板、離合器踏板等。

為便于分析,對(duì)坦克駕駛操作分為基本操作和組合操作。基本操作是指駕駛過程只有一個(gè)操縱部件的狀態(tài)發(fā)生變化,是駕駛操作的“元?jiǎng)幼鳌?。組合操作是由若干個(gè)基本操作按不同的順序組成的動(dòng)作序列,與動(dòng)作次序、完備程度、完成時(shí)間等密切相關(guān)。換擋操作是適應(yīng)不同路面環(huán)境下的機(jī)動(dòng)要求,是坦克駕駛操作的一項(xiàng)重要內(nèi)容。下面以“一擋換二擋”為例,運(yùn)用CSAGA-LSSVM算法進(jìn)行模擬訓(xùn)練結(jié)果分析。

在坦克駕駛模擬訓(xùn)練實(shí)驗(yàn)中,選擇1 200名受訓(xùn)人員(二級(jí)坦克駕駛員、三級(jí)坦克駕駛員、初級(jí)坦克駕駛員和無等級(jí)人員各300名)在某型坦克駕駛模擬教室進(jìn)行“一擋換二擋”操作訓(xùn)練,每名受訓(xùn)人員進(jìn)行6次換擋操作,通過傳感器和模擬訓(xùn)練系統(tǒng)采集到的駕駛員部分操作過程數(shù)據(jù)如表4所示。

表4 坦克駕駛模擬器“一擋換二擋”操作數(shù)據(jù)Tab. 4 Data of the tank driving simulator in “shifting from the first to the second gear” operation

4.2 最優(yōu)分類解獲取

從表4可以看出,油門踏板位移、離合器踏板位移和制動(dòng)器踏板位移屬于一元時(shí)間序列數(shù)據(jù),變量取值隨時(shí)間連續(xù)變化形成多變量時(shí)間序列。本次實(shí)驗(yàn)共產(chǎn)生7 200個(gè)樣本,選擇油門踏板位移、離合器踏板位移、制動(dòng)器踏板位移、擋位值為特征變量,對(duì)操作成績(jī)離散化處理為類標(biāo)簽y,形成決策表,如表5所示。

表5 坦克駕駛模擬器操作數(shù)據(jù)分析決策表Tab. 5 Data analysis decision of the tank driving simulator operations

從表5中隨機(jī)選取80%的數(shù)據(jù)作為訓(xùn)練集進(jìn)行分類器訓(xùn)練,余下的20%作為測(cè)試集。首先通過Shapelets特征提取方法對(duì)換擋操作的多維時(shí)間序列進(jìn)行表示,求解組合Shapelets,再依次計(jì)算油門踏板位移、離合器踏板位移等時(shí)序數(shù)據(jù)與組合Shapelets之間的距離,實(shí)現(xiàn)換擋操作數(shù)據(jù)變換,用于后續(xù)分類輸入;然后運(yùn)用AGA求得最優(yōu)超參數(shù)C=65.8,σ=0.25?;谡{(diào)優(yōu)后的分類模型對(duì)時(shí)序數(shù)據(jù)進(jìn)行分類,最終得出分類結(jié)果如表6所示。

表6 結(jié)果數(shù)據(jù)Tab. 6 Statistics of Results

4.3 結(jié)果分析

以表6為依據(jù),結(jié)合坦克駕駛換擋操作的理論與實(shí)踐,對(duì)得到的最終解分析如下:

1) “一擋換二擋”操作成績(jī)合格所對(duì)應(yīng)的Shapelets:油門踏板時(shí)序數(shù)據(jù)Shapeletsacr[1]∧Shapeletsacr[2]={00,01,00}∧{00,01},離合器踏板位移時(shí)序數(shù)據(jù)Shapeletsclu[1]∧Shapeletsclu[2]={000,010,011,110,111}∧{111,100,011,010,000},擋位時(shí)序數(shù)據(jù)Shapeletsgear={1,2},表示換擋前應(yīng)平穩(wěn)踩下油門踏板至適當(dāng)位置,然后松開油門踏板同時(shí)將離合器踏板由初始位置踩到最大位置,迅速將變速桿由1擋推向2擋位置,掛擋后松回離合器踏板應(yīng)做到前快后穩(wěn),同時(shí)均勻踩下油門踏板。

2) “一擋換二擋”操作成績(jī)不合格所對(duì)應(yīng)的Shapelets:制動(dòng)器踏板位移時(shí)序數(shù)據(jù)Shapeletsbrk={00,01,11},油門踏板時(shí)序數(shù)據(jù)Shapeletsacr={00},擋位時(shí)序數(shù)據(jù)Shapeletsgear={1},表示“一擋換二擋”過程中踩下了制動(dòng)器踏板,而未踩油門踏板進(jìn)行沖車,車輛擋位值沒有發(fā)生變化;油門踏板時(shí)序數(shù)據(jù)Shapeletsacr[1]∧Shapeletsacr[2]={00,01,00}∧{00,01},離合器踏板位移時(shí)序數(shù)據(jù)Shapeletsclu={000},擋位時(shí)序數(shù)據(jù)Shapeletsgear={1},表示“一擋換二擋”過程中未踩下離合器踏板,換擋操作不合格。

將“一擋換二擋”操作成績(jī)?yōu)楹细袼鶎?duì)應(yīng)的Shapelets組合可建立相應(yīng)的標(biāo)準(zhǔn)操作動(dòng)作模式,作為“一擋換二擋”操作技能水平的評(píng)價(jià)等級(jí),對(duì)受訓(xùn)人員的駕駛動(dòng)作進(jìn)行精確分析。比如,隨機(jī)選取一名受訓(xùn)人員的訓(xùn)練樣本數(shù)據(jù)進(jìn)行預(yù)處理生成相應(yīng)的Shapelets,其中離合器踏板位移時(shí)序數(shù)據(jù)Shapeletsclu[1]={000,011,100,110},擋位時(shí)序數(shù)據(jù)Shapeletsgear={1}。通過計(jì)算與標(biāo)準(zhǔn)操作動(dòng)作模式之間的距離,可以發(fā)現(xiàn)該名受訓(xùn)人員在換擋過程中沒有將離合器踏板踩到底,導(dǎo)致?lián)跷粻顟B(tài)仍為1擋,掛擋不成功,表明該受訓(xùn)人員掌握動(dòng)作要領(lǐng)較差,需要在今后的訓(xùn)練中加強(qiáng)理論學(xué)習(xí),熟記換擋的關(guān)鍵動(dòng)作和操作流程,同時(shí)注重模擬器基本駕駛動(dòng)作訓(xùn)練,反復(fù)體會(huì)換擋要領(lǐng)。

5 結(jié)論

本研究為挖掘坦克駕駛模擬訓(xùn)練數(shù)據(jù),提出一種CSAGA-LSSVM分類挖掘算法。先根據(jù)起始點(diǎn)、結(jié)束點(diǎn)、階躍點(diǎn)、極值點(diǎn)快速獲取候選Shapelets,減少產(chǎn)生的候選Shapelets數(shù)量;再通過選擇距離和時(shí)間間隔對(duì)Shapelets進(jìn)行組合操作,并計(jì)算信息增益評(píng)價(jià)最優(yōu)組合,增強(qiáng)特征的辨識(shí)能力,提升分類的準(zhǔn)確性;然后設(shè)計(jì)了自適應(yīng)遺傳算法,通過動(dòng)態(tài)調(diào)整交叉和變異概率來加速搜索LSSVM超參數(shù)的全局最優(yōu)解,減少分類挖掘時(shí)間;最后,利用CSAGA-LSSVM算法分析某型坦克駕駛模擬器換擋操作數(shù)據(jù),提取不同訓(xùn)練水平人員的操作特征,從而更好地發(fā)現(xiàn)訓(xùn)練問題,促進(jìn)個(gè)性化訓(xùn)練的開展。

猜你喜歡
模擬訓(xùn)練時(shí)序踏板
顧及多種弛豫模型的GNSS坐標(biāo)時(shí)序分析軟件GTSA
清明
基于GEE平臺(tái)與Sentinel-NDVI時(shí)序數(shù)據(jù)江漢平原種植模式提取
你不能把整個(gè)春天都搬到冬天來
模擬訓(xùn)練(二)
鋼琴踏板的基本用法
模擬訓(xùn)練(十一)
模擬訓(xùn)練(十)
論鋼琴踏板的正確使用
鋼琴踏板的產(chǎn)生與運(yùn)用