熊文滔 鄭建立
關(guān)鍵詞:跌倒檢測;擴(kuò)展孤立森林;個性化;異常檢測;可穿戴設(shè)備
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A
1引言(Introduction)
根據(jù)國家統(tǒng)計局2021 年發(fā)布的第七次全國人口普查結(jié)果顯示:全國人口共14.11億,其中60歲以上的人口為2.64億,大約占總?cè)丝诘?8.7%,與2010 年相比上升了5.44%[1],中國正逐步邁入老齡化社會。在過去的幾年里,所有與老年人健康相關(guān)的研究都得到了極大的關(guān)注,跌倒檢測就是其中的一個熱門的研究領(lǐng)域。隨著年齡的增長,老年人的身體機(jī)能、認(rèn)知能力和感官功能逐漸衰退,因此極易發(fā)生跌倒事件。據(jù)統(tǒng)計,約1/3的老年人每年會發(fā)生一次意外跌倒[2],跌倒也成為老年人因傷致死的重要原因[3]。如果老年人在跌倒后能盡早地被發(fā)現(xiàn)并治療,將對其后期的康復(fù)有很大的幫助[4]。因此,設(shè)計一個準(zhǔn)確且高效的跌倒檢測算法十分必要。
2研究現(xiàn)狀(Research status)
目前的跌倒檢測算法主要分為三大類:基于視頻的跌倒檢測算法、基于環(huán)境傳感器的跌倒檢測算法和基于可穿戴設(shè)備的跌倒檢測算法?;谝曨l的跌倒檢測算法主要依靠安裝在屋內(nèi)或者室外的攝像頭對老年人的行為圖像數(shù)據(jù)進(jìn)行采集,并通過機(jī)器視覺的方法判斷老人出現(xiàn)的行為是否為跌倒行為[5]。該算法的優(yōu)點是準(zhǔn)確率高,但是運算開銷大,有應(yīng)用盲區(qū)。基于環(huán)境傳感器的跌倒檢測主要是指在老年人的活動場所內(nèi)安裝紅外線[6]、超聲波[7]等環(huán)境傳感器,通過判斷老年人周圍環(huán)境狀況的變化進(jìn)而判斷其是否跌倒。該算法對設(shè)備使用者的隱私侵犯風(fēng)險較小,但由于需要在環(huán)境中安裝大量的傳感器,因此系統(tǒng)的便捷性不夠,使用場景受限?;诳纱┐髟O(shè)備的跌倒檢測算法是指通過穿戴在身體某個部位的傳感器收集原始數(shù)據(jù)后,使用跌倒檢測算法進(jìn)行處理,并判斷設(shè)備使用者是否跌倒。與基于視頻和環(huán)境傳感器的跌倒檢測算法相比,可穿戴設(shè)備易安裝、成本低,并且受應(yīng)用場景限制小。
基于可穿戴傳感器的跌倒監(jiān)測算法按照檢測方法的不同可以分為兩大類:閾值法和機(jī)器學(xué)習(xí)法。閾值法是通過比較特征值和選定閾值的大小關(guān)系判斷是否出現(xiàn)跌倒行為。這種方法的漏報誤報率較高,檢測結(jié)果不準(zhǔn)確。基于機(jī)器學(xué)習(xí)的算法將跌倒檢測看作一個分類問題,使用機(jī)器學(xué)習(xí)算法構(gòu)建跌倒檢測模型。季祥[8]基于慣性傳感器計算人體的俯仰角與橫滾角,結(jié)合足底壓力,利用支持向量機(jī)判斷是否出現(xiàn)跌倒行為。段美玲等[9]、趙舉等[10]利用加速度傳感器結(jié)合雙向長短期記憶網(wǎng)絡(luò)算法進(jìn)行特征提取與分類判別。YACCHIREMA等[11]使用加速度計和陀螺儀數(shù)據(jù),設(shè)計了一個基于決策樹的跌倒檢測模型。雖然目前研究人員已基于可穿戴傳感器提出了多種跌倒檢測算法,但是這些算法仍然存在以下問題:一是缺乏老年人的跌倒數(shù)據(jù)。目前,被大量使用的監(jiān)督學(xué)習(xí)算法主要針對跌倒行為進(jìn)行建模和檢測,這對跌倒數(shù)據(jù)的質(zhì)量要求較高。老年人跌倒是一種高危的行為,因此在現(xiàn)實中很難獲取老年人真實的跌倒數(shù)據(jù),大部分實驗都是采用年輕志愿者參與跌倒實驗獲得的數(shù)據(jù)進(jìn)行訓(xùn)練,這必然導(dǎo)致實驗結(jié)果與真實情況出現(xiàn)偏差。因此,被大量使用的監(jiān)督學(xué)習(xí)算法只是在理論上取得較好的結(jié)果,但是在實際應(yīng)用中的效果不佳。二是使用通用模型,不考慮不同個體之間的差異。由于不同人的身高、體重及行為習(xí)慣不同,即使在做出相同的跌倒動作時,也會有很大的差別[12]。圖1展示了三個志愿者模擬“走路時不小心向后滑倒”這一動作時三軸合加速度的變化情況,其中橫軸表示時間,縱軸表示合加速度數(shù)據(jù),虛線框內(nèi)部為跌倒時采集的數(shù)據(jù)。從圖1中可以清晰地看出,不同的人在做出相同跌倒行為時,加速度的極值、方差和跌倒持續(xù)時間具有很大的差異,如果忽略這些差異,那么跌倒檢測的準(zhǔn)確率很難得到保障。
為解決以上問題,本文提出了一種基于擴(kuò)展孤立森林的跌倒檢測算法。針對老年人跌倒數(shù)據(jù)獲取困難的問題,研究人員使用數(shù)據(jù)挖掘中的異常檢測技術(shù),將跌倒檢測看作一個二分類異常檢測問題,使用擴(kuò)展孤立森林算法對大量易于采集的正常行為數(shù)據(jù)進(jìn)行建模,當(dāng)數(shù)據(jù)不符合正常行為數(shù)據(jù)特征的時候,即可判定出現(xiàn)跌倒行為。針對個性化適配問題,本文使用無監(jiān)督的建模方式,為每個人采集到的正常行為序列數(shù)據(jù)建立不同的跌倒檢測模型,解決了不同個體的個性化適配問題。本文在公開數(shù)據(jù)集SisFall上驗證了算法的可行性和優(yōu)越性。
3相關(guān)方法(Correlation method)
3.1擴(kuò)展孤立森林算法
孤立森林(Isolation Forest, IForest)算法是由TING等[13]提出的一種基于集成學(xué)習(xí)的無監(jiān)督異常檢測算法,其主要依賴于特征選擇和循環(huán)隨機(jī)分割;它并不是直接處理所有的數(shù)據(jù)點,而是使用超平面對數(shù)據(jù)進(jìn)行隨機(jī)分割,這就使得其具有線性的時間復(fù)雜度以及較低的內(nèi)存需求。算法將異常數(shù)據(jù)標(biāo)記為“少數(shù)且容易被孤立”的數(shù)據(jù),即分布稀疏且離群的點,這與跌倒數(shù)據(jù)發(fā)生少且與正常行為數(shù)據(jù)差異較大的特征相符。
盡管標(biāo)準(zhǔn)的孤立森林算法的計算效率很高,但由于其切割超平面是軸平行的,這就導(dǎo)致在具有多個聚類中心的數(shù)據(jù)集中,算法會因為切割條件的重疊而難以檢測到局部異常點,從而導(dǎo)致模型的檢測精度下降[14]。HARIRI等[15]提出了一種擴(kuò)展孤立森林(Extended Isolation Forest, EIF)算法,其使用具有隨機(jī)斜率的超平面替代軸平行的超平面,克服了標(biāo)準(zhǔn)孤立森林的局限性。
在一個二維空間中的EIF算法切割方式如圖2所示。對于圖2(a)中的異常點x0,只需要少數(shù)幾次切割就能到達(dá)二叉樹的葉子節(jié)點,而對于圖2(b)中的正常點x1,則需要更多的切割次數(shù)。
從圖5中可以看出,由于個體存在差異性(身高、體重、行為習(xí)慣等),所以使用個性化模型的分類結(jié)果要好于使用非個性化的模型。具體來說,平均準(zhǔn)確率從91.89%提升到了96.76%,平均敏感度從93.84%提升到了97.91%,平均特異度從88.44%提升到了94.72%。
表4展示了其他常見的無監(jiān)督異常檢測算法與本文使用的EIF算法在跌倒檢測模型中的性能對比。從表4可以看出,在跌倒檢測任務(wù)中,EIF算法的準(zhǔn)確率、敏感度和特異度均是最高的。
5 結(jié)論(Conclusion)
本文提出了一種基于擴(kuò)展孤立森林算法的跌倒檢測模型,利用佩戴在人體腰部的三軸加速度傳感器采集人的日常活動數(shù)據(jù),使用濾波算法對原始數(shù)據(jù)進(jìn)行降噪處理,通過滑動窗口進(jìn)行特征提取,對每一個人提取好的特征數(shù)據(jù)使用無監(jiān)督的EIF算法進(jìn)行個性化建模。解決了傳統(tǒng)監(jiān)督學(xué)習(xí)算法獲取老年人跌倒數(shù)據(jù)困難以及個性化適配的問題。該模型在公開數(shù)據(jù)集SisFall上進(jìn)行實驗,驗證了算法的有效性,同時與其他算法相比具有更高的識別精度。
作者簡介:
熊文滔(1998-),男,碩士生.研究領(lǐng)域:數(shù)據(jù)挖掘.鄭建立(1965-),男,博士,副教授.研究領(lǐng)域:醫(yī)學(xué)信息系統(tǒng)與集成技術(shù).