王忠民, 曹 棟
(西安郵電大學(xué) 計(jì)算機(jī)學(xué)院, 陜西 西安 710121 )
基于蟻群算法的行為識(shí)別特征優(yōu)選方法
王忠民, 曹 棟
(西安郵電大學(xué) 計(jì)算機(jī)學(xué)院, 陜西 西安 710121 )
為了降低特征冗余,提高移動(dòng)用戶行為識(shí)別的準(zhǔn)確率,提出一種基于蟻群算法的移動(dòng)用戶行為識(shí)別加速度信號(hào)特征優(yōu)選方法。首先對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理,根據(jù)特征對(duì)不同行為的分類敏感度進(jìn)行初次優(yōu)選,降低特征搜索空間的維度;然后利用蟻群算法結(jié)合神經(jīng)網(wǎng)絡(luò)分類器,以特征的分類準(zhǔn)確度為評(píng)價(jià)準(zhǔn)則對(duì)特征集合進(jìn)行了二次優(yōu)選。實(shí)驗(yàn)結(jié)果表明,該方法優(yōu)選出的特征集具有較好的識(shí)別性能。
蟻群優(yōu)化;行為識(shí)別;特征提??;特征優(yōu)選
行為識(shí)別研究是人工智能領(lǐng)域的一個(gè)重要課題。早期的研究主要通過(guò)構(gòu)建智能空間,特制各種可穿戴傳感器在實(shí)驗(yàn)室環(huán)境開展的。隨著移動(dòng)通信技術(shù)的快速發(fā)展和移動(dòng)智能終端制造水平的不斷提高,內(nèi)置于智能手機(jī)內(nèi)的各類傳感器使開展基于智能手機(jī)的移動(dòng)用戶行為識(shí)別研究成為可能[1]。為了增強(qiáng)用戶體驗(yàn),目前智能手機(jī)都有內(nèi)置加速度傳感器,近年來(lái)國(guó)內(nèi)外有不少學(xué)者開展了基于加速度信息的人體行為識(shí)別研究,但手機(jī)所放置的位置和方位,以及人的行為差異等都會(huì)對(duì)加速度信號(hào)產(chǎn)生影響[2-4]。如何從加速度信號(hào)的時(shí)域、頻域和時(shí)頻域特征中優(yōu)選出與手機(jī)放置位置和方位無(wú)關(guān)、算法復(fù)雜度低、與人體運(yùn)動(dòng)行為敏感度高的特征子集成為本領(lǐng)域急需解決的關(guān)鍵技術(shù)難題。
特征優(yōu)選方法已經(jīng)有很多研究,文獻(xiàn)[5]從搜索策略和評(píng)價(jià)準(zhǔn)則兩個(gè)角度對(duì)特征選擇方法進(jìn)行了分析和總結(jié);文獻(xiàn)[6]利用相關(guān)分析和K-NN 算法進(jìn)行組合式特征選擇;文獻(xiàn)[7]提出了基于相關(guān)性和冗余度的聯(lián)合特征選擇算法;文獻(xiàn)[8]將互信息和模糊粗糙集結(jié)合提出最大互信息最大相關(guān)熵標(biāo)準(zhǔn),并基于這一標(biāo)準(zhǔn)設(shè)計(jì)了一種新的特征選擇算法;文獻(xiàn)[9] 針對(duì)入侵檢測(cè)的需求,設(shè)計(jì)了一種攻擊特征的在線選擇方法。但以上方法針對(duì)移動(dòng)用戶行為識(shí)別特征選擇這一特定問(wèn)題,還缺乏有效的解決方法。
本文在蟻群算法[10-12]的基礎(chǔ)上,提出一種移動(dòng)用戶行為識(shí)別特征優(yōu)選方法,把對(duì)某種行為最敏感的特征作為候選特征,使用蟻群算法進(jìn)行特征子集優(yōu)選,并以神經(jīng)網(wǎng)絡(luò)分類器的分類效果作為特征子集優(yōu)劣的評(píng)價(jià)準(zhǔn)則,根據(jù)分類錯(cuò)誤率更新特征的信息素來(lái)指導(dǎo)搜索過(guò)程。
1.1 行為敏感特征選擇
加速度信號(hào)的時(shí)域、頻域和時(shí)頻特征很多,首先要從眾多的特征中迅速剔除冗余特征、選出敏感特征,以降低特征集維數(shù),從而縮小后續(xù)基于蟻群算法的特征子集二次優(yōu)選時(shí)的搜索空間。在對(duì)人體行為模式進(jìn)行識(shí)別的過(guò)程中,每種特征值對(duì)于每種行為模式的識(shí)別度不同,提取對(duì)每種行為模式最敏感的特征值,剔除冗余特征,可降低無(wú)關(guān)特征影響,縮短算法搜索時(shí)間。
將候選特征集合中的特征值a所對(duì)應(yīng)特征向量樣本放入分類器訓(xùn)練和測(cè)試,獲取特征值a對(duì)行為模式k的識(shí)別率r(a,k)以及特征值a致使其他行為模式錯(cuò)分至行為模式k的錯(cuò)分率w(a,k)。評(píng)價(jià)函數(shù)為
q(a,k)=r(a,k)-l×w(a,k)
(1)
其中l(wèi)為激勵(lì)因子,當(dāng)q(a,k)高于規(guī)定閾值Q時(shí),特征值a對(duì)行為模式k敏感,將特征值a添加進(jìn)候選特征集合。遍歷每種特征值之后,得到最終候選特征集合H。
1.2 基于蟻群算法的特征子集優(yōu)選
1.2.1 問(wèn)題描述
圖1 蟻群算法示意圖
1.2.2 螞蟻的路徑選擇
每只螞蟻搜索結(jié)束之后,得到一個(gè)局部解,每個(gè)解包含n個(gè)不同的特征值。每只螞蟻從隨機(jī)一個(gè)特征點(diǎn)出發(fā),根據(jù)信息素的強(qiáng)度和啟發(fā)規(guī)則選擇下一個(gè)特征點(diǎn),直到尋找到n個(gè)特征值。每只螞蟻選擇特征點(diǎn)的轉(zhuǎn)移規(guī)則為
(2)
對(duì)于每一只螞蟻,p(j)為螞蟻選擇特征點(diǎn)j的概率值,概率值大的優(yōu)先選擇;u(j)為特征點(diǎn)j的信息素水平;ξ(j)為特征點(diǎn)的分類敏感度;α為信息素啟發(fā)因子,β為期望啟發(fā)因子,如果設(shè)為0,則表示此階段暫時(shí)不考慮特征值的分類敏感度;K為螞蟻的可選子集,即除了已被選擇剩余的特征集合。
螞蟻i搜索結(jié)束后,將每個(gè)局部解所對(duì)應(yīng)的特征向量樣本輸入分類器進(jìn)行訓(xùn)練和測(cè)試,得到分類正確率τ(i),用以評(píng)價(jià)特征子集的優(yōu)劣。
1.2.3 信息素更新策略
當(dāng)蟻群完成一次搜索后,更新各特征點(diǎn)上的信息素。信息素更新規(guī)則為
(3)
其中ρ信息素參數(shù),τ(i)為最優(yōu)解的分類正確率,ε為概率變化系數(shù)。反復(fù)迭代MI次,以得到最優(yōu)特征子集及其分類正確率。
1.3 算法描述
優(yōu)選算法描述如下。
輸入:數(shù)據(jù)集S,候選特征集合H,特征全集G,閾值Q,激動(dòng)因子I,行為模式B,螞蟻個(gè)數(shù)m,初始信息素水平u0,迭代次數(shù)MI,特征值個(gè)數(shù)n,蟻群算法的各參數(shù);
輸出:選擇的最優(yōu)特征子集F以及最終分類結(jié)果。
算法流程:
(1)H={};//初始化特征候選子集;
(3)ifq(a,k)>Q;//利用式(1);
(4)ifa?H;
(6)End for;
(7)?i∈H,ui=u0,u0∈[0,1],k=1;//初始化信息素,使每個(gè)節(jié)點(diǎn)的信息素相同;
(8)fori=1:n;//對(duì)于不同的特征值個(gè)數(shù),進(jìn)行循環(huán);
(9)while (k 生成m個(gè)螞蟻,隨機(jī)選擇m個(gè)特征值,每只螞蟻根據(jù)式(2)選擇下一個(gè)概率值大的特征點(diǎn); (10)k++; (11)End whlie; (12)用分類器評(píng)估每個(gè)解的優(yōu)劣,返回分類的正確率; (13)通過(guò)返回的最優(yōu)解的分類正確率進(jìn)行信息素的更新,利用式(3); (14)重復(fù)(9)至(13),迭代MI次,得到最優(yōu)特征子集F及其分類正確率; (15)End for (16)得到最終的最優(yōu)特征子集FF及其分類正確率。 2.1 實(shí)驗(yàn)數(shù)據(jù)集 所有實(shí)驗(yàn)數(shù)據(jù)均利用Android智能手機(jī)采集。選取閾值為-2g~2g(g=9.8 m/s2)加速度傳感器的智能手機(jī)HTC G2,華為U8608等,由4名實(shí)驗(yàn)人員分別利用這些智能手機(jī)對(duì)靜止、走路、跑步、上樓、下樓、乘車6種行為模式的加速度數(shù)據(jù)進(jìn)行采集。實(shí)驗(yàn)人員在不同的時(shí)間段,手機(jī)處于不同位置和不同方向的情況下,做了780次實(shí)驗(yàn),其中每種模式各進(jìn)行了130次實(shí)驗(yàn),每次采集的持續(xù)時(shí)間為10 s,采樣頻率為20 Hz。不同的時(shí)間段主要考慮車流量對(duì)采集數(shù)據(jù)的影響,不同的位置主要分為手中,褲兜中,上衣口袋中以及包中,不同的方向主要分為手機(jī)橫放,顛倒放置,平放等。為了保證數(shù)據(jù)的有效性,并去除一定的噪音,只取每次采樣數(shù)據(jù)的第4~6 s之間的數(shù)據(jù)。對(duì)采樣數(shù)據(jù)頻譜分析發(fā)現(xiàn),六種行為采集到的加速度信號(hào)的能量主要處于1~5 Hz之間(如圖2所示)。因此,通過(guò)低通濾波對(duì)原始數(shù)據(jù)進(jìn)行了去噪聲濾波。 圖2 行為模式濾波前后頻譜分析圖 2.2 實(shí)驗(yàn)方法 實(shí)驗(yàn)初始特征集合為{最大值,最小值,范圍,方差,均值,主系數(shù)和,直流分量,中間值,均方根},根據(jù)特征選擇方法,在對(duì)數(shù)據(jù)進(jìn)行預(yù)處理之后,先進(jìn)行了第一次行為敏感特征優(yōu)選,得到蟻群算法的初始特征全集,通過(guò)蟻群算法的二次優(yōu)選,得到最終特征集合。行為敏感特征選擇中參數(shù)設(shè)置為 l=0.8,Q=0.85, 蟻群算法的參數(shù)設(shè)置為 MI=5,u0=0.5,n=1,2,…,5, 2.3 實(shí)驗(yàn)結(jié)果分析 實(shí)驗(yàn)首先進(jìn)行初次特征選擇,每種特征值的正確率和錯(cuò)分率分別如表1和表2所示,其中Std代表標(biāo)準(zhǔn)差,Max代表最大值,Min代表最小值,Range代表范圍,Var代表方差,Mean代表均值,Sum代表主系數(shù)和,Dc代表直流分量,Med代表中間值,Rms代表均方根。經(jīng)過(guò)計(jì)算之后,選取{標(biāo)準(zhǔn)差,最大值,最小值,范圍,均方根}作為下階段的特征集合。 表1 每種特征值的正確率 表2 每種特征值的錯(cuò)分率 確定特征候選集合之后,實(shí)驗(yàn)利用蟻群算法進(jìn)行二次特征選擇,經(jīng)過(guò)多次統(tǒng)計(jì)之后,得出最終結(jié)果如表3。 表3 蟻群算法測(cè)試結(jié)果 特征子集{范圍,標(biāo)準(zhǔn)差,最大值,均方根}為選出的最優(yōu)子集,正確率可達(dá)89%。相比單獨(dú)使用蟻群算法,時(shí)間復(fù)雜度得到了大幅度下降,證明了算法的有效性。 通過(guò)行為敏感特征選擇算法及蟻群算法從加速度信息中選出特征子集,利用BP神經(jīng)網(wǎng)絡(luò)算法對(duì)所選出的特征子集的有效性進(jìn)行了驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,該特征優(yōu)選方法可提高行為識(shí)別的正確率,證明了方法的有效性。 [1] Zheng Yu, Liu Like, Wang Long hao, et al.Learning transportation mode from raw gps data for geographic applications on the web[C]//World Wide Web.ACM Press,2008:247-256. [2] Wang Shuang quan , Chen Can feng , Ma Jian . Accelerometer based transportation mode recognition on mobile phones[C]//Asia-Pacific Conference on Wearable Computing Systems. ShenZhen: IEEE Press,2010:44-46. [3] Reddy S, Mun M,Burke J,et al.Using Mobile Phones to Determine Transportation Modes[J].ACM Transactions on Sensor Networks, 2010,6(2):13-27. [4] Davide F,Pedro C D,Diogo R F, et al.Preprocessing techniques for context recognition from accelerometer data[J].Pers Ubiquit Comput,2010,14(7):645-662. [5] 姚旭,王曉丹,張玉璽,等.特征方法綜述[J].控制與決策,2012,27(2):161-166. [6] Uncu O,Turksen IB. A novel feature selection approach: Combining feature wrappers and filters [J]. Information Sciences (S0020-0255), 2007, 177(2): 449-466. [7] 周城,葛斌,唐九陽(yáng),等.基于相關(guān)性和冗余度的聯(lián)合特征選擇方法[J].計(jì)算機(jī)科學(xué),2012,39(4)181-184. [8] 趙軍陽(yáng),張志利.基于最大互信息最大相關(guān)熵的特征選擇方法[J].計(jì)算機(jī)應(yīng)用研究,2009,26(1):233-235. [9] 朱莉,李玲娟.攻擊特征在線選擇方法的研究[J].西安郵電學(xué)院學(xué)報(bào),2009,14(3):72-74. [10] 溫文波,杜維.蟻群算法概述[J].石油化工自動(dòng)化,2002,1(19):19-22. [11] 王璐,邱桃榮,何妞,等.基于粗糙集和蟻群優(yōu)化算法的特征選擇方法[J].南京大學(xué)學(xué)報(bào),2010,5(46):487-493. [12] 黃丹鳳,祁云嵩,許姍娜.基于粗糙集和蟻群算法的特征基因選擇方法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2012,6(22):68-74. [責(zé)任編輯:祝劍] A feature selection method for behavior recognition based on ant colony algorithm WANG Zhongmin, CAO Dong (School of Computer Science and Technology, Xi’an University of Posts and Telecommunications, Xi’an 710121, China) To reduce redundancy features and improve accuracy of mobile user behavior recognition, an acceleration signal feature selection method is proposed for mobile user behavior recognition based on ant colony algorithm. The sample data is preprocessed and features are optimized initially according to the classification sensitivity of every feature of the different behavior to reduce dimension of the feature search space. Then, ant colony algorithm combined with neural network classifier is used to make a secondary optimization and feature classification accuracy for evaluation criteria. Experiment results show that the feature set selected by the method has a better recognition performance. ant colony algorithm, behavior recognition, feature selection, feature optimization 10.13682/j.issn.2095-6533.2014.01.016 2013-11-26 國(guó)家自然科學(xué)基金資助項(xiàng)目(61100166);陜西省教育廳產(chǎn)業(yè)化培育基金資助項(xiàng)目(2012JC22) 王忠民(1967- ),男,博士,教授, 從事智能信息處理研究。E-mail:wzm_678@163.com 曹棟(1988- ),男,碩士研究生,研究方向?yàn)榍度胧较到y(tǒng)設(shè)計(jì)與開發(fā)。E-mail:395812022@qq.com TP391 A 2095-6533(2014)01-0073-052 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
α=0.8,β=0,ρ=0.3,
ε=0.9,m=3。3 結(jié)束語(yǔ)