耿宏楊,郇 戰(zhàn),梁久禎,侯振杰,高 歌,呂士云
(常州大學(xué) 計(jì)算機(jī)與人工智能學(xué)院,江蘇 常州 213164)
近年來,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,微電子和集成電路向著體積小和性能高的趨勢發(fā)展,嵌入式設(shè)備也會變得更加廉價(jià)、實(shí)用.智能手機(jī)、可穿戴設(shè)備逐漸被人們廣泛使用,基于傳感器的活動識別研究也在許多科學(xué)和應(yīng)用領(lǐng)域逐漸成為研究熱點(diǎn)[1].
基于傳感器的人類活動識別主要研究來自手機(jī)或可穿戴設(shè)備中監(jiān)測到的人類活動信號,運(yùn)用各種機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方法對信號中的動作信息進(jìn)行預(yù)測和識別.文獻(xiàn)[2]使用在語音識別方面具有良好表現(xiàn)的隱馬爾科夫模型(Hidden Markov Model,HMM),并結(jié)合支持向量機(jī)(Support Vector Machines,SVM)對傳統(tǒng)的隱馬爾可夫(HMM)模型進(jìn)行改進(jìn),對不同的人類活動類別具有良好的效果.文獻(xiàn)[3]引入一種基于自我訓(xùn)練(ST)方法的半監(jiān)督主動學(xué)習(xí)(SSAL)來進(jìn)行人類活動識別,部分自動化注釋來提高分類器效率,可運(yùn)用于監(jiān)督和非監(jiān)督的方法中,保證識別效果的同時(shí)提高效率.除了機(jī)器學(xué)習(xí)方法外,深度學(xué)習(xí)方法也被應(yīng)用與人類活動識別(Human Activity Recognition,HAR),并取得很不錯效果.文獻(xiàn)[4]采用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)[5]進(jìn)行特征學(xué)習(xí)的方法相比于基線模型動作分類的速度和效率明顯提高.文獻(xiàn)[6]針對日常動作信號提出一種深度長短時(shí)記憶網(wǎng)絡(luò)提取高級特征,將監(jiān)督和非監(jiān)督的損失并在一起,充分利用了未標(biāo)記的數(shù)據(jù),從而獲得好的識別效果.另一方面,相關(guān)的數(shù)據(jù)集建立也是對基于傳感器的人類活動識別研究做出巨大貢獻(xiàn),如文獻(xiàn)[7,8]等.論文中將活動分為靜態(tài)動作,過渡動作,動態(tài)動作3類[9],在參考前人工作的基礎(chǔ)上,主要集中在解決動作與動作之間的過渡問題和動作狀態(tài)轉(zhuǎn)換關(guān)系問題.論文的主要工作如下:
1)針對復(fù)雜且連續(xù)的人類活動,提出一種基于時(shí)間序列信號的運(yùn)動狀態(tài)轉(zhuǎn)移識別(MSTR,Motion State Transition Recognition)模型,該模型可將靜態(tài)動作(坐、站立、躺)、動態(tài)動作(走、上樓梯、下樓梯)及靜態(tài)動作之間轉(zhuǎn)換的過渡動作檢測并標(biāo)定出來,精度可達(dá)到采樣點(diǎn)級別.
2)根據(jù)靜態(tài)動作序列信號平穩(wěn)的特點(diǎn),將靜態(tài)信號進(jìn)行檢測和定位,目的是更準(zhǔn)確地定位靜態(tài)動作區(qū)域和區(qū)分靜態(tài)動作之間的過渡動作.在靜態(tài)動作被定位的前提下,引入有限狀態(tài)機(jī)的思想,通過動作與動作之間的上下文依賴關(guān)系,來確定過渡動作片段.
3)論文實(shí)驗(yàn)將在用于人類活動研究的Human Activity Recognition Using Smartphones(HARuS)數(shù)據(jù)集進(jìn)行.此外,實(shí)驗(yàn)結(jié)果將會與已知方法進(jìn)行對比,來說明論文所提方法的優(yōu)越性.
大多數(shù)日常行為研究主要致力于單個(gè)動作識別(例如走、站、坐、跑等).然而,真正的人類日?;顒油菑?fù)雜的、連續(xù)的,且總是存在多個(gè)不同或相同動作狀態(tài)之間的轉(zhuǎn)換.基本的日常動作往往是復(fù)雜的,其復(fù)雜性就體現(xiàn)在動作狀態(tài)轉(zhuǎn)換之間存在的過渡動作,過渡動作往往是短暫且伴隨著劇烈變化,許多HAR研究都會忽略對過渡動作的識別[10].通過可穿戴傳感器監(jiān)測日常行為生活,運(yùn)用機(jī)器學(xué)習(xí)的相關(guān)方法對監(jiān)測的活動進(jìn)行分割,且只對基本動作進(jìn)行檢測和分割[11].Dafne San-Segundo等人[12],提出的人類活動識別分割系統(tǒng)只針對連續(xù)信號中的6種不同的基礎(chǔ)動作(走、上樓梯、下樓梯、坐、站、躺)進(jìn)行分割識別,并未對連續(xù)信號中存在的過渡動作進(jìn)行分割和識別.Li等人[13],使用貪婪高斯分割(GGS)來識別動作過渡時(shí)產(chǎn)生的間斷點(diǎn)并通過XGboost模型來預(yù)測每個(gè)窗口內(nèi)的人類活動,同時(shí)忽略過渡動作的識別.
但是,也有針對過渡動作的分割方法的研究.Fidad等人[14],測試不同長度的窗口,選擇對短時(shí)間活動(坐、站和過渡)和長時(shí)間活動(走、上樓梯下樓梯)識別最優(yōu)的窗口,該分割方法獲取了高于90%的準(zhǔn)確率.將連續(xù)活動數(shù)據(jù)進(jìn)行切片,獲取的動作數(shù)據(jù)段通過分類的方式來獲取段的動作信息[9].這種方法可以將連續(xù)動作中的某些動作識別出來,但是考慮到人類活動的實(shí)際情況時(shí),固定長度的滑動窗口難免會出現(xiàn)一個(gè)窗口內(nèi)包含兩個(gè)或者兩個(gè)以上動作的情況.這種情況常出現(xiàn)于動作段與過渡段之間,即影響分類準(zhǔn)確性,也降低了分割準(zhǔn)確度.文獻(xiàn)[15]克服固定滑動窗口分割局限性問題,提出自適應(yīng)的滑動窗口方法,根據(jù)窗口內(nèi)動作的概率大小自適應(yīng)地拓展窗口,以提高分類準(zhǔn)確性,并取得很好的識別率.該算法需要選定基礎(chǔ)的固定窗口,且只能動態(tài)放大,如果可以自適應(yīng)地放大縮小,就可以更加精細(xì)地分割動作邊界.
無論是固定的還是自適應(yīng)的滑動窗口,還是需要考慮不同動作狀態(tài)之間存在的過渡轉(zhuǎn)換問題,這將決定分割和識別的準(zhǔn)確率.因此,這些問題也是論文即將要解決的問題.
針對復(fù)雜動作進(jìn)行分割識別的整體構(gòu)架,如圖1所示.該框架主要包括兩個(gè)步驟:第1部分,通過使用固定長度的滑動窗口對連續(xù)動作序列進(jìn)行分割識別,為了規(guī)避滑動窗口對過渡動作識別效果差的弊端,這里只對非過渡動作進(jìn)行訓(xùn)練識別,最終將復(fù)雜連續(xù)動作中的動態(tài)動作和靜態(tài)動作標(biāo)定出來.第2部分,檢測靜態(tài)動作(坐、站、躺)的邊界,將兩類靜態(tài)動作之間存在的過渡動作進(jìn)行標(biāo)定,再根據(jù)有限狀態(tài)機(jī)可以確定動作狀態(tài)之間存在的過渡動作類別.
圖1 模型總體框架
滑動窗口法用于分割識別,被廣泛應(yīng)用于HAR研究,使分割的步行、跑步、站立、坐姿、上樓梯和下樓梯等動作有很好的識別效果[16,17].具體步驟如圖2所示,對復(fù)雜運(yùn)動序列進(jìn)行粗分割,主要包括模型訓(xùn)練和連續(xù)動作序列信號的預(yù)測和識別.
圖2 粗分割流程圖
3.1.1 數(shù)據(jù)預(yù)處理
通過具有內(nèi)置慣性傳感器的手機(jī)或者可穿戴設(shè)備采集的人體行為數(shù)據(jù)存在許多噪聲和異常值.濾波是去除噪聲的關(guān)鍵步驟之一,噪聲大多由各種來源反射的高頻分量(例如設(shè)備連接松動,放錯位置,外界的電磁干擾等)[18].針對信號中存在的噪聲,使用3階巴特沃思濾波器去除基線漂移噪聲[19].PSD是一種估計(jì)功率在頻率上的分布的度量,并且已被廣泛用于評估帶有基線漂移噪聲的高頻濾波器[20],通過對原始信號計(jì)算功率譜密度(PSD)進(jìn)行截止頻率的選擇.
3.1.2 特征提取
基于慣性傳感器的動作識別中,由于標(biāo)準(zhǔn)分類模型不適用于此類數(shù)據(jù),因此我們需要在提取特征之前將傳感器數(shù)據(jù)劃分為多個(gè)段.在處理時(shí)間序列數(shù)據(jù)時(shí),滑動窗口[21]技術(shù)得到了廣泛的應(yīng)用,并被證明是有效的[22].通過對原始數(shù)據(jù)求導(dǎo)得到新的6組數(shù)據(jù)(包括加速度和角速度的每一軸信號),其次,對原始加速度和角速度數(shù)據(jù)求歐幾里得范數(shù)得到新的2組數(shù)據(jù).因此,總共獲得14組數(shù)據(jù)(包括6組原始數(shù)據(jù)和8組新的數(shù)據(jù)).候選固定長度為0.5秒、1.28秒、2.56秒、3秒的滑動窗口[23],并以50%重疊的方式截取6種基本動作的慣性傳感器信號.對每個(gè)窗口的14組數(shù)據(jù)中每一組提取包含6組時(shí)域特征(均值、標(biāo)準(zhǔn)差、最大值、最小值、眾數(shù)和過零點(diǎn)個(gè)數(shù))和4組頻域特征(均值、方差、偏度和峰度),這樣每個(gè)滑動窗口可以獲取140個(gè)特征.
3.1.3 分類器
LightGBM是起源于微軟亞洲研究院,由Guolin Ke等人提出的.其算法和XGboost[24]類似,都是基于梯度提升決策樹(GBDT)[25]框架所提出的.該框架在GBDT基礎(chǔ)上結(jié)合基于梯度的單邊采樣(GOSS)和互斥特征捆綁(EFB)以及深度限制,使其在訓(xùn)練速度,內(nèi)存使用率優(yōu)化,分類準(zhǔn)確性等方面的性能大大提升[26,27].LightGBM分類器在整個(gè)模型中用作基本動作的分類,為后續(xù)工作提供動作類別的先驗(yàn)知識.
論文提出的運(yùn)動狀態(tài)轉(zhuǎn)移模型(Motion State Transition Model,MSTM),通過運(yùn)動狀態(tài)之間轉(zhuǎn)換關(guān)系來識別過渡動作,此模型針對靜態(tài)動作之間的狀態(tài)轉(zhuǎn)換.該模型主要包括靜態(tài)動作檢測和有限狀態(tài)機(jī).
3.2.1 靜態(tài)動作檢測
靜態(tài)動作信號為受試者靜止不動的情況下記錄的傳感器信號,包括坐、站、躺3種動作,加速度傳感器均受到重力的影響,在垂直方向會有一個(gè)加速度值,其余兩個(gè)方向的加速度值都是在零值上下震動.相較于陡峭明顯且波動較大的過渡信號,靜態(tài)信號就顯得平穩(wěn)且波動小.
根據(jù)以上分析,靜態(tài)動作相較于其他動作擁有較小的變化率,檢測并保留變化率較小的信號區(qū)域,以實(shí)現(xiàn)對靜態(tài)動作與非靜態(tài)動作信號的分割.為了減少靜態(tài)動作信號中存在的離群點(diǎn)和隨機(jī)噪聲造成的干擾,使用一階濾波器對信號進(jìn)行平滑,濾除靜止動作中存在的毛刺信號如圖3(a)所示.其次,對濾波后的信號進(jìn)行差分處理,靜態(tài)動作的差分值波動較小,然而,過渡動作的差分值波動變化大,可以設(shè)置允許靜態(tài)動作波動的閾值α來分離這兩類信號.
閾值α的設(shè)定對于區(qū)分靜態(tài)動作和過渡動作至關(guān)重要.理想情況下,靜態(tài)動作信號差分波動的最大幅值小于相鄰的過渡信號的波動的最小幅值,這樣閾值α可以完全將兩種動作分開.實(shí)際情況下,在持續(xù)的靜態(tài)動作中難免出現(xiàn)由于身體抖動或者其他原因造成短暫的信號突變.如圖3(a)中所示,可以看出濾波后的信號明顯變得平滑.另一方面,由靜態(tài)動作向過渡動作進(jìn)行轉(zhuǎn)換的起始時(shí)段變化率和靜態(tài)動作的變化率相似,所以這部分信號很難進(jìn)行區(qū)分.在此引入統(tǒng)計(jì)學(xué)中的第三四分位數(shù)(Q3)的思想[28],統(tǒng)計(jì)訓(xùn)練樣本中的靜態(tài)動作信號差分絕對值集合,將其以從小到大順序排列,取其中的第三四分位數(shù)點(diǎn)(第75%位置點(diǎn)),相同地,對過渡動作信號差分絕對值集合取第25%位置的點(diǎn),依次取靜態(tài)和過渡動作信號第80%和第10%,第85%和第15%,第90%和第10%,第95%和第5%的差分絕對值分位點(diǎn)進(jìn)行統(tǒng)計(jì)比較.在HARuS數(shù)據(jù)集[29]中,統(tǒng)計(jì)5組分位數(shù)情況下靜態(tài)動作信號和過渡動作信號差分絕對值的均值.如圖4所示,第95%和第5%情況下,靜態(tài)動作的最大值大于過渡動作的最小值,所以很難將兩種情況分離.因此,取靜態(tài)動作差分幅值第90%位置點(diǎn)均值為閾值α的取值,如圖3(b)所示.
圖3
圖4 靜態(tài)動作差分幅值均值最大與過渡動作差分幅值均值最小在不同分位情況下的對比
根據(jù)文獻(xiàn)[14]的工作經(jīng)驗(yàn)所知過渡活動的持續(xù)時(shí)間有限,平均為3.37±1.2s,那么只需統(tǒng)計(jì)符合在零值上下α波動且連續(xù)的采樣點(diǎn),并超過過渡動作可持續(xù)時(shí)間的最大限度即可,本文設(shè)置為5s.最后,把符合條件的信號的序列起始位置記錄下來.為了從差分序列的界限轉(zhuǎn)換到原始序列,需要將記錄下來的末尾邊界加一作為彌補(bǔ),對應(yīng)到原始靜態(tài)動作起始如圖3(c)所示.詳細(xì)算法流程如下所示:
算法1.靜態(tài)動作分割算法
輸入:低通濾波后的加速度數(shù)據(jù)Fdata;
輸出:靜態(tài)動作起始索引集合static_index
1.設(shè)置變量參數(shù)Threshold=α,count=0;
2.dFdata=diff(Fdata)/*對Fdata進(jìn)行差分操作*/
3.forifrom1 to length(dFdata)do
4.ifabs(dFdata(i)) 5. count=count+1 6.else 7. if count>5*50then/*判斷序列是否滿足靜態(tài)持續(xù)時(shí)長*/ 8. static_index([i-count,i+1] /*保存索引 */ 9. count=0 10.else 11. count=0 12.endif 13.endif 14.endfor 15.returnstatic_index 3.2.2 有限狀態(tài)機(jī) 有限狀態(tài)機(jī)(finite-state machine)又稱有限狀態(tài)自動機(jī),簡稱狀態(tài)機(jī),表示有限個(gè)狀態(tài)以及在這些狀態(tài)之間的轉(zhuǎn)移和動作等行為的數(shù)學(xué)模型[30].靜態(tài)動作之間存在一些未知情況主要分為兩種:1)同種靜態(tài)動作狀態(tài)之間的轉(zhuǎn)換.受試者在靜止不動的時(shí)候難免存在身體的顫動,或者受到某些外界的干擾或影響,使得整個(gè)靜態(tài)動作之間存在著幅度小且短暫的無用信號如圖5框中標(biāo)記所示;2)不同種類靜態(tài)動作之間的轉(zhuǎn)換.正常的動作轉(zhuǎn)換必不可少存在過渡動作,持續(xù)時(shí)間是大于無用信號持續(xù)時(shí)間的.本文設(shè)置了9種狀態(tài),分別為: 圖5 靜態(tài)動作中出現(xiàn)的干擾信號 S0:表示坐狀態(tài); S1:表示站狀態(tài); S2:表示躺狀態(tài); S3,S4:坐到站和站到坐的過渡狀態(tài); S5,S6:站到躺和躺到站的過渡狀態(tài); S7,S8:躺到坐和坐到躺的過渡狀態(tài); 動作狀態(tài)之間的轉(zhuǎn)換條件如圖6所示.假設(shè)S={Si|i=1,…,n}表示檢測出來的n段靜態(tài)動作信號,A={Si,j|i≠j;i=1,…,n;j=1,…,n}表示兩個(gè)靜態(tài)動作狀態(tài)Si和Sj之間的過渡動作狀態(tài),ΔT為相鄰兩個(gè)靜態(tài)動作狀態(tài)Si-1和Si之間的時(shí)間間隔,Sk靜態(tài)動作之間的未知動作狀態(tài),不同的ΔT體現(xiàn)不同的運(yùn)動狀態(tài)Sk如公式(1)所示.當(dāng)ΔT<1s時(shí),表示未知段為同類靜態(tài)動作的干擾部分;當(dāng)1s<ΔT<5s時(shí),表示未知段為過渡動作;當(dāng)ΔT>5s時(shí),說明中間存在一個(gè)靜態(tài)動作與ΔT設(shè)定矛盾,所以不考慮. 圖6 FSM動作狀態(tài)轉(zhuǎn)換過程 (1) 論文的實(shí)驗(yàn)數(shù)據(jù)來源于UCI(UC Irvine,加州大學(xué)歐文分校)機(jī)器學(xué)習(xí)存儲庫中的“使用智能手機(jī)進(jìn)行人類活動識別”數(shù)據(jù)集.該數(shù)據(jù)集包含30位年齡段在19-48歲的志愿者,每一位志愿者在腰間佩戴智能手機(jī)(三星Galaxy S II)進(jìn)行連續(xù)的6個(gè)活動(步行,上樓梯,下樓梯,坐,站立,躺).使用其嵌入式加速度計(jì)和陀螺儀,以50 Hz的恒定速率采樣3軸線性加速度和3軸角速度.數(shù)據(jù)集包含13182s的記錄,包括來自30個(gè)用戶的400個(gè)活動實(shí)例[29]. 4.2.1 數(shù)據(jù)預(yù)處理 根據(jù)3.1節(jié),針對人類活動相關(guān)的慣性傳感器數(shù)據(jù),使用3階巴特沃斯低通濾波器.對HARuS數(shù)據(jù)集中的動作數(shù)據(jù)計(jì)算功率譜密度(PSD),如圖7所示,給出了加速度X軸信號和角速度X軸的PSD曲線,可以看出信號能量主要分布在0Hz-15Hz之間,大于15Hz的部分逐漸趨于0值,因此選擇15Hz作為截止頻率. 圖7 HARuS數(shù)據(jù)集加速度 4.2.2 滑動窗口和分類器選擇 不同長度的滑動窗口截取的動作樣本,決定分類器的訓(xùn)練效果,另外,分類器選擇也將影響整個(gè)分類的效果,同時(shí)動作分類的準(zhǔn)確度也將決定預(yù)分割的效果.使用固定長度為0.5秒、1.28秒、2.56秒、3秒的滑動窗口作為候選窗口,并以50%重疊的方式提取6個(gè)基本動作信號,然后每個(gè)窗口提取140個(gè)統(tǒng)計(jì)特征(具體參考3.1節(jié)特征提取部分). 為了體現(xiàn)所提及的LightGBM分類器的分類效果,使之與經(jīng)典分類器隨機(jī)森林(Random Forest,RF)、SVM、K-近鄰法(K Nearst Neighbors,KNN)、樸素貝葉斯(Naive Bayes,NB)、GBDT[25]、XGboost[24]進(jìn)行對比,并且每一個(gè)分類器訓(xùn)練使用十折交叉驗(yàn)證的形式度量模型的泛化性.在表1中展示4個(gè)不同窗口長度下的不同分類器對應(yīng)的分類準(zhǔn)確率(Accuracy). 表1 不同窗口長度和分類器的準(zhǔn)確率 根據(jù)表1所示,4種不同長度的滑動窗口對比下,LightGBM和XGBoost分類優(yōu)勢明顯,平均識別可到達(dá)98%.其中,GBDT和XGBoost分類器的識別效果與LightGBM相差很小,但是,分類器訓(xùn)練的時(shí)候發(fā)現(xiàn)GBDT和XGBoost分類器的訓(xùn)練過程耗時(shí)比較長如表2所示,因此,說明LightGBM作為整個(gè)模型中的分類器是比較合適.其中,當(dāng)滑動窗口長度為2.56s時(shí)分類識別效果最好,總體識別率高達(dá)98.69%,對于每個(gè)動作的識別率達(dá)到97%以上. 表2 不同分類器訓(xùn)練時(shí)間對比 4.3.1 評價(jià)方法 論文所要解決的問題是動作分割,精準(zhǔn)地檢測每個(gè)活動的起始位置,為了評估所提方法的性能選擇評價(jià)指標(biāo)[31]:精度(Precision),召回率(Recall)和F1,各個(gè)指標(biāo)定義如公式(2)-公式(5)所示: (2) (3) (4) (5) 4.3.2 實(shí)驗(yàn)結(jié)果 論文將從HARuS數(shù)據(jù)中30位受試者的60個(gè)樣本中隨機(jī)抽取其中的5組作為測試,其余的數(shù)據(jù)作為LightGBM分類器的訓(xùn)練樣本.其中,5組測試樣本是完整連續(xù)動作序列,剩下的55組訓(xùn)練樣本進(jìn)行分類訓(xùn)練,同時(shí),根據(jù)2.2節(jié)所提方法統(tǒng)計(jì)出閾值α=0.0011.實(shí)驗(yàn)的實(shí)驗(yàn)平臺在搭載了Intel? CoreTMi7-4710HQ 2.5GHz CPU和NVIDIA GeForce? GTX 850M 2G GPU的ASUS筆記本電腦上進(jìn)行,操作系統(tǒng)是Windows 8.1,使用開源編程語言Python 3.6.0進(jìn)行實(shí)驗(yàn)測試. 表3所示,5組測試樣本所對應(yīng)4種評價(jià)方法(Precision、Recall、F1)的結(jié)果,Accuracy最高可達(dá)到了98%以上,最低為95%左右,其余都達(dá)到97%以上,說明絕大多數(shù)的動作類別點(diǎn)都被正確識別.其中,S5樣本在Accuracy和F1表現(xiàn)最優(yōu).12種類別的混淆矩陣如表4所示,基本動作的分割準(zhǔn)確率都比較高,過渡動作坐到躺和站到躺的查全率(recall)達(dá)到100%.在圖8中,展示的是S5樣本的加速度X軸信號數(shù)據(jù)散點(diǎn)圖,對3類動態(tài)動作、過渡動作和靜態(tài)動作分別用5類不同顏色的點(diǎn)進(jìn)行標(biāo)定.其中圖8(a)為樣本分割效果圖,不同的動作已用對應(yīng)的顏色進(jìn)行標(biāo)定.圖8(b)是圖8(a)對應(yīng)的GroundTruth樣本對比圖,其中,對HARuS數(shù)據(jù)庫中未經(jīng)標(biāo)定動作的段留白,防止對其他動作造成干擾.從圖8(a)中可以看出靜態(tài)動作、動態(tài)動作和過渡動作都準(zhǔn)確地被標(biāo)定出來,一些錯誤標(biāo)定的部分出現(xiàn)在無用段,不作為評價(jià)對象,再者就是一些過渡段與靜態(tài)動作的前后連接處往往不能精確地區(qū)分出來,因?yàn)槿祟愑梢粋€(gè)動作向另一個(gè)動作過渡時(shí),很難界定過渡動作的起始時(shí)刻. 表3 5個(gè)測試樣本不同評價(jià)指標(biāo)下的結(jié)果 圖8 S5實(shí)驗(yàn)對比圖 表4 S5測試樣本每個(gè)動作分割結(jié)果混淆矩陣 4.3.3 實(shí)驗(yàn)結(jié)果對比 通過對比前人的研究成果來體現(xiàn)所提方法的優(yōu)越性.所提出的模型在HARuS數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),所以選取的對比研究同樣是在HARuS數(shù)據(jù)集上進(jìn)行的.具體體現(xiàn)在表5和表6中,分別對每個(gè)動作類別的準(zhǔn)確率和召回率進(jìn)行對比. 表5 提出的方法與其他方法精確率的對比 表6 提出的方法與其他方法召回率的對比 文獻(xiàn)[15]提出AW-TD算法,根據(jù)每一類動作信號屬于特定的概率,建立多元高斯函數(shù)來自適應(yīng)地調(diào)整窗口大小.不同的是論文所提出的模型可以檢測UCI數(shù)據(jù)庫中所有的12類動作,而文獻(xiàn)[15]只對其中走、坐、站、站到坐、坐到站、坐到躺、躺到坐動作進(jìn)行分割識別.同樣的,文獻(xiàn)[32]結(jié)果也是來自文獻(xiàn)[15]只對7種動作進(jìn)行分割識別,且兩種的分割識別方法表現(xiàn)出很好的效果,AW-TD算法對走、坐、站的分割精確率達(dá)到了95%以上,召回率也是高于90%,兩者遠(yuǎn)遠(yuǎn)高于GD算法.另外,論文所提方法對坐、站、站到坐、坐到站躺到坐動作的分割精確率均高于AW-TD算法表現(xiàn),整體識別率也是達(dá)到98%以上,高于AW-TD的96.5%和GD的91.9%. 論文針對復(fù)雜動作的分割識別,提出了狀態(tài)轉(zhuǎn)移識別模型,可以分割并識別復(fù)雜動作序列中的基本動作和過渡動作,并將每個(gè)動作數(shù)據(jù)點(diǎn)進(jìn)行類別的標(biāo)定,將動作分割精確到采樣點(diǎn)級別.整個(gè)模型分兩個(gè)部分:第1部分,根據(jù)滑動窗口分割方法分割識別基本動作(動態(tài)動作和靜態(tài)動作),將其中周期較強(qiáng)的動態(tài)動作的分割識別結(jié)果保留,另外,將靜態(tài)動作作為動作先驗(yàn)保留.第2部分,根據(jù)靜態(tài)動作信號變化率接近零值的特性,通過統(tǒng)計(jì)法給定靜態(tài)動作信號波動閾值,將進(jìn)一步細(xì)分靜態(tài)動作區(qū)域,再根據(jù)有限狀態(tài)機(jī)和動作先驗(yàn)可將過渡動作精準(zhǔn)分割.本模型在UCI公開的HARuS數(shù)據(jù)集上進(jìn)行研究實(shí)驗(yàn),從結(jié)果可以看出,提出的模型可以很好地分割識別出動態(tài)動作、靜態(tài)動作和過渡動作,并且整體準(zhǔn)確率達(dá)到98%以上.另外,與已知的在同一個(gè)數(shù)據(jù)集上并做相同的研究相比,整體準(zhǔn)確率比GD方法高6.3%,比AW-TD方法高1.7%. 盡管,提出的模型在復(fù)雜動作分割和識別取得相對較好的效果,但是模型本身存在許多問題,尤其是模型的魯棒性和在線分割識別方面存在不足.接下來的探索將會在模型的基礎(chǔ)上開發(fā)自適應(yīng)的分割方法,并在其他的相關(guān)公共數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)來優(yōu)化模型,提高查準(zhǔn)率的同時(shí)兼顧查全率,增加其魯棒性.4 實(shí)驗(yàn)及結(jié)果分析
4.1 數(shù)據(jù)集介紹
4.2 分類訓(xùn)練
4.3 實(shí)驗(yàn)設(shè)置與結(jié)果分析
5 結(jié) 論