国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于體感識(shí)別技術(shù)的運(yùn)動(dòng)訓(xùn)練輔助系統(tǒng)設(shè)計(jì)

2022-01-06 12:33:08鄭永權(quán)張飛云周帥
電子設(shè)計(jì)工程 2021年24期
關(guān)鍵詞:攝像頭卷積人體

鄭永權(quán),張飛云,周帥

(西安交通大學(xué)城市學(xué)院,陜西西安 710018)

隨著經(jīng)濟(jì)水平的提高,人們更加注重身心健康,積極參與運(yùn)動(dòng)鍛煉[1-2]。隨著無(wú)線通信和圖像處理技術(shù)的迅速發(fā)展,新型運(yùn)動(dòng)裝備以智能化的互動(dòng)方式正改變著人們的運(yùn)動(dòng)習(xí)慣[3-5]。傳統(tǒng)的運(yùn)動(dòng)裝備只是簡(jiǎn)單地記錄運(yùn)動(dòng)者的運(yùn)動(dòng)時(shí)間、距離等物理信息,并根據(jù)簡(jiǎn)單的統(tǒng)計(jì)學(xué)計(jì)算得出相關(guān)運(yùn)動(dòng)建議[6]。而以Kinect、VR 為代表的新型運(yùn)動(dòng)裝備具有捕捉人的運(yùn)動(dòng)姿態(tài)、豐富運(yùn)動(dòng)場(chǎng)景等功能,增強(qiáng)了運(yùn)動(dòng)的趣味性。

體感識(shí)別是指通過(guò)某些裝置識(shí)別人的肢體動(dòng)作,從而實(shí)現(xiàn)某些功能,其被應(yīng)用于多種場(chǎng)景,常見的有運(yùn)動(dòng)類游戲、手勢(shì)拍照、人臉支付等[7-9]。迄今為止,業(yè)界學(xué)者對(duì)于體感技術(shù)的分類主要基于其實(shí)現(xiàn)原理來(lái)進(jìn)行劃分,通常分為慣性感測(cè)、光學(xué)感測(cè)、慣性與光學(xué)聯(lián)合感測(cè)以及其他方式感測(cè)。其中,應(yīng)用最廣泛的體感設(shè)備是由日本索尼公司開發(fā)的EYE TOY[10-16]。

該文將體感識(shí)別技術(shù)應(yīng)用于常規(guī)運(yùn)動(dòng)訓(xùn)練中,以Kinect V2 為運(yùn)動(dòng)數(shù)據(jù)采集設(shè)備,利用分隔策略降低數(shù)據(jù)量,同時(shí)精簡(jiǎn)骨骼關(guān)節(jié)個(gè)數(shù)從而降低動(dòng)作識(shí)別的復(fù)雜度,并通過(guò)尋找標(biāo)準(zhǔn)化模量的方法來(lái)降低絕對(duì)數(shù)據(jù)引發(fā)的偏差。采用堆疊模型和VGG 卷積神經(jīng)網(wǎng)絡(luò)將二維關(guān)節(jié)數(shù)據(jù)轉(zhuǎn)換成人體姿態(tài)圖,并將其作為模型的訓(xùn)練樣本,完成訓(xùn)練和參數(shù)優(yōu)化后,最終得到運(yùn)動(dòng)動(dòng)作識(shí)別模型。

1 基于體感識(shí)別技術(shù)的運(yùn)動(dòng)訓(xùn)練輔助系統(tǒng)框架

文中利用Kinect V2 配備的攝像頭傳感器、計(jì)算機(jī)、顯示設(shè)備、云服務(wù)器來(lái)進(jìn)行運(yùn)動(dòng)訓(xùn)練輔助系統(tǒng)的硬件設(shè)計(jì),具體硬件連接如圖1 所示。首先,計(jì)算機(jī)作為整個(gè)系統(tǒng)程序的執(zhí)行中心,負(fù)責(zé)接收用戶的身份認(rèn)證信息和Kinect V2 攝像頭傳感器采集的數(shù)據(jù),然后將相應(yīng)數(shù)據(jù)傳送至顯示設(shè)備和云服務(wù)器;Kinect V2 攝像頭傳感器負(fù)責(zé)采集用戶的肢體動(dòng)作,并將數(shù)據(jù)傳輸至計(jì)算機(jī);顯示設(shè)備負(fù)責(zé)顯示運(yùn)動(dòng)訓(xùn)練輔助系統(tǒng)的用戶登入界面、訓(xùn)練實(shí)時(shí)動(dòng)作識(shí)別結(jié)果、訓(xùn)練日記等信息;云服務(wù)器負(fù)責(zé)接收用戶上傳的運(yùn)動(dòng)訓(xùn)練數(shù)據(jù)和系統(tǒng)更新數(shù)據(jù)包等。

圖1 硬件連接示意圖

文中所述運(yùn)動(dòng)訓(xùn)練輔助系統(tǒng)采用C/S 框架,考慮到用戶較多,因此采用多個(gè)客戶端與一個(gè)服務(wù)端進(jìn)行設(shè)計(jì)。其中,客戶端在功能上涉及對(duì)用戶實(shí)時(shí)運(yùn)動(dòng)動(dòng)作的識(shí)別、動(dòng)作分析、用戶信息采集、數(shù)據(jù)儲(chǔ)存與服務(wù)端的通信等;而服務(wù)端主要位于云服務(wù)器,涉及客戶端的系統(tǒng)更新、歷史運(yùn)動(dòng)訓(xùn)練數(shù)據(jù)儲(chǔ)存等。系統(tǒng)框架如圖2 所示。該系統(tǒng)軟硬件之間通過(guò)USB 3.0 進(jìn)行數(shù)據(jù)的傳輸;客戶端與服務(wù)端之間的通信采用TCP/IP 通信協(xié)議。

圖2 系統(tǒng)框架示意圖

2 運(yùn)動(dòng)識(shí)別算法與實(shí)現(xiàn)

2.1 人體動(dòng)作數(shù)據(jù)采集

當(dāng)人在運(yùn)動(dòng)時(shí),通過(guò)Kinect V2 攝像頭傳感器采集到的視頻數(shù)據(jù)通常具有較大的容量,不適合直接進(jìn)行動(dòng)作分析;另外,由于人物所處環(huán)境較為復(fù)雜,濾除背景可提高人物動(dòng)作的識(shí)別精度,因此需要進(jìn)行數(shù)據(jù)預(yù)處理。

Kinect V2 采用紅外發(fā)射器投射經(jīng)過(guò)調(diào)制后的近紅外光,通過(guò)解析近紅外光經(jīng)物體反射回來(lái)的時(shí)間差來(lái)得到物體與Kinect V2 攝像頭傳感器的距離,使用近紅外光線可有效降低光線變化對(duì)成像質(zhì)量的影響。另外,在識(shí)別人體動(dòng)作時(shí)采用分隔策略將人物從背景中分離出來(lái),并在后續(xù)識(shí)別過(guò)程中只保留人物的圖像,以降低人物動(dòng)作識(shí)別計(jì)算量。

由此得到的人物深度圖中通過(guò)機(jī)械學(xué)習(xí)算法可以識(shí)別人物的骨骼點(diǎn),骨骼點(diǎn)的移動(dòng)表示人物身體各個(gè)部分的移動(dòng)。如圖3 所示,將人體簡(jiǎn)化為18 個(gè)關(guān)節(jié)部位,通過(guò)觀察這18 個(gè)點(diǎn)的位置移動(dòng)來(lái)判斷人體的動(dòng)作。任何運(yùn)動(dòng)動(dòng)作的識(shí)別均基于人體肢體的基礎(chǔ)動(dòng)作,這些基礎(chǔ)動(dòng)作包含肢體彎曲、關(guān)節(jié)扭轉(zhuǎn)等。由于人體身體構(gòu)造的限制,肢體轉(zhuǎn)動(dòng)的角度均不超過(guò)180°,因此可以選擇余弦函數(shù)作為肢體轉(zhuǎn)動(dòng)角度函數(shù)。

圖3 人體關(guān)節(jié)示意圖

2.2 多目標(biāo)動(dòng)作追蹤

通過(guò)攝像頭傳感器采集人體6 個(gè)基礎(chǔ)動(dòng)作的18個(gè)關(guān)節(jié)點(diǎn)的位置信息,這些位置信息將作為基礎(chǔ)動(dòng)作要素。每一個(gè)關(guān)節(jié)點(diǎn)的位置信息均由二維坐標(biāo)組成,將一段時(shí)間的關(guān)節(jié)點(diǎn)位置信息組成數(shù)據(jù)集,即可得到諸如跳躍、站立等基礎(chǔ)動(dòng)作的數(shù)據(jù)模板。當(dāng)人在做復(fù)雜動(dòng)作時(shí),則需要使用多目標(biāo)跟蹤來(lái)捕捉關(guān)節(jié)點(diǎn)位置數(shù)據(jù)。其具體流程如圖4 所示。

圖4 多目標(biāo)跟蹤算法流程圖

文中使用Deep Sort 多目標(biāo)算法進(jìn)行關(guān)節(jié)點(diǎn)位置信息的獲取。該算法對(duì)攝像頭采集到的每一幀畫面進(jìn)行目標(biāo)檢測(cè),并將檢測(cè)結(jié)果經(jīng)有權(quán)值的匹配算法處理后與之前運(yùn)動(dòng)軌跡相比較,形成關(guān)節(jié)的運(yùn)動(dòng)軌跡。其中,權(quán)值的確定需要通過(guò)點(diǎn)和運(yùn)動(dòng)軌跡的馬氏距離來(lái)計(jì)算,而馬氏距離則通過(guò)Kalman 濾波函數(shù)計(jì)算。當(dāng)前軌跡與之前軌跡是否匹配,需要設(shè)定一個(gè)閾值來(lái)進(jìn)行比較,該閾值被定義為相鄰時(shí)刻畫面的軌跡匹配成功所用的時(shí)間差。當(dāng)該時(shí)間差大于閾值時(shí),表明相鄰時(shí)刻畫面的軌跡長(zhǎng)時(shí)間匹配不成功,則認(rèn)為該動(dòng)作已停止。在匹配過(guò)程中可根據(jù)不同特征的最大響應(yīng)數(shù)值來(lái)分配權(quán)重值,具體計(jì)算公式為:

式中,f(Zb)、f(Zs)表示圖像邊緣特征的梯度角度以及色度飽和度的響應(yīng)輸出向量。

上文提取到的關(guān)節(jié)骨骼位置數(shù)據(jù)中包含著大量的噪聲數(shù)據(jù)和無(wú)用數(shù)據(jù),在進(jìn)行動(dòng)作識(shí)別前需要進(jìn)行數(shù)據(jù)預(yù)處理來(lái)提高有用數(shù)據(jù)的比例。文中使用尋找標(biāo)準(zhǔn)化模量的方法,來(lái)降低絕對(duì)數(shù)據(jù)引發(fā)的偏差。人體固有肢體結(jié)構(gòu)數(shù)據(jù)所提取的向量因受人體動(dòng)作變化影響較小,故可作為標(biāo)準(zhǔn)向量。通過(guò)調(diào)用Open Skeleton Frame()函數(shù),可實(shí)現(xiàn)骨骼數(shù)據(jù)的獲取。

2.3 運(yùn)動(dòng)訓(xùn)練實(shí)時(shí)動(dòng)作識(shí)別模型

利用上文獲取的多目標(biāo)骨骼數(shù)據(jù),文中以自下而上的順序?qū)﹃P(guān)鍵關(guān)節(jié)進(jìn)行檢測(cè),并依據(jù)關(guān)鍵關(guān)節(jié)的分布位置來(lái)確定人的姿態(tài)。為了實(shí)現(xiàn)更精準(zhǔn)的人體姿態(tài)識(shí)別結(jié)果,文中將VGG 和卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合進(jìn)行關(guān)鍵關(guān)節(jié)的檢測(cè)。其具體結(jié)構(gòu)如圖5 所示。首先將Kinect V2 攝像頭采集到的畫面輸入至VGG中進(jìn)行特征向量F的提?。辉賹⑻卣飨蛄縁作為卷積神經(jīng)網(wǎng)絡(luò)第一階段的輸入,通過(guò)多個(gè)階段的回歸得到該圖片的關(guān)鍵關(guān)節(jié),并在第二階段利用貪心推理識(shí)別各個(gè)關(guān)鍵關(guān)節(jié)的相對(duì)位置,形成人體骨骼的姿態(tài)。

圖5 人體姿態(tài)估計(jì)算法結(jié)構(gòu)圖

為了實(shí)現(xiàn)實(shí)時(shí)連續(xù)動(dòng)作的識(shí)別,需要對(duì)每一個(gè)畫面的人體姿態(tài)進(jìn)行綜合分析。該文利用上文得到人體姿態(tài)圖,通過(guò)搭建堆疊模型來(lái)實(shí)現(xiàn)實(shí)時(shí)運(yùn)動(dòng)動(dòng)作的識(shí)別。具體過(guò)程如下:

1)將每一幀的人體姿態(tài)圖進(jìn)行預(yù)處理,得到數(shù)字圖像特征,并用one-hot encoding 進(jìn)行編碼;

2)將線性堆疊模型和VGG 卷積神經(jīng)網(wǎng)絡(luò)聯(lián)合訓(xùn)練,使用Relu 作為激活函數(shù),Soft max 作為分類函數(shù);

3)使用Compile 對(duì)模型參數(shù)進(jìn)行設(shè)置,并在樣本數(shù)據(jù)訓(xùn)練時(shí)進(jìn)行參數(shù)調(diào)優(yōu);

4)使用測(cè)試數(shù)據(jù),驗(yàn)證模型對(duì)訓(xùn)練動(dòng)作識(shí)別的準(zhǔn)確度。

在上述堆疊模型中融入Batch Nor maization,該函數(shù)可將數(shù)據(jù)歸一化,使得每個(gè)數(shù)字圖像特征的分布均值為0、方差為1。由于實(shí)時(shí)采集的圖像數(shù)據(jù)較多,為了增強(qiáng)實(shí)時(shí)識(shí)別效率,利用數(shù)據(jù)的規(guī)范化和線性變換來(lái)實(shí)現(xiàn)VGG 卷積神經(jīng)網(wǎng)絡(luò)中不同層之間的解耦,最終實(shí)現(xiàn)整個(gè)人體運(yùn)動(dòng)動(dòng)作識(shí)別模型的學(xué)習(xí)速度。

堆疊模型在規(guī)范化數(shù)據(jù)時(shí),具體表達(dá)式為:

對(duì)于動(dòng)作識(shí)別的精度,分類器的選擇尤為重要。文中將Softmax 作為動(dòng)作識(shí)別分類器,該函數(shù)的表達(dá)式為:

該函數(shù)將VGG 卷積神經(jīng)網(wǎng)絡(luò)的神經(jīng)元輸出映射為(0,1)之間的實(shí)數(shù),且總和為1。式(4)中Vi表示Softmax 分類器前級(jí)神經(jīng)元的輸出,i表示動(dòng)作的類別,C為動(dòng)作類別的總數(shù),Si表示當(dāng)前動(dòng)作分類的概率值與所有動(dòng)作分類概率和的比值。

3 測(cè)試與驗(yàn)證

為了驗(yàn)證該文所述方案的有效性和可行性,文中使用揮手、踢腿、彎腰和蹲4 個(gè)動(dòng)作進(jìn)行驗(yàn)證。測(cè)試過(guò)程中使用Intel(R)Core(TM)i7-3470 CPU@3.2 GHz,16 GB 的計(jì)算機(jī);代碼編輯器使用Sublime Text。首先選擇5 名男生、5 名女生作為志愿者,為了保證較高的模型識(shí)別精準(zhǔn)度,該10 名志愿者應(yīng)具有不同的身高、體重等外形。分別讓這10 名志愿者做100 組上述4 種動(dòng)作,并按照8∶2 的比例劃分為樣本訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)。由于動(dòng)作識(shí)別數(shù)據(jù)多分類問題,需要對(duì)上述動(dòng)作進(jìn)行編碼,即將揮手、踢腿、彎腰和蹲分別使用0、1、2、3 表示。圖6 給出了訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)的訓(xùn)練精度結(jié)果對(duì)比。從圖中可以看出,通過(guò)增加訓(xùn)練次數(shù),訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)的精度曲線逐漸重合并趨向于0.86,這表明該文所述方案具有較好的穩(wěn)定性和魯棒性。

圖6 訓(xùn)練數(shù)據(jù)與驗(yàn)證數(shù)據(jù)的訓(xùn)練精度對(duì)比結(jié)果

另外,為了驗(yàn)證該文所述方案的實(shí)用性,使用LSTM 動(dòng)作識(shí)別算法作為對(duì)照組進(jìn)行對(duì)比試驗(yàn),對(duì)照組與實(shí)驗(yàn)組使用相同的軟件、硬件設(shè)備和訓(xùn)練數(shù)據(jù)。表1 給出了實(shí)驗(yàn)組和對(duì)比組的4 種動(dòng)作識(shí)別準(zhǔn)確率結(jié)果。由表可知,文中所述方案比LSTM 動(dòng)作識(shí)別算法具有更高的識(shí)別準(zhǔn)確率,這表明該文所述方案具有一定的可行性和實(shí)用性。值得注意的是,兩種動(dòng)作識(shí)別算法對(duì)彎腰和蹲的識(shí)別準(zhǔn)確率均較低。這主要是由于做這兩種動(dòng)作時(shí),關(guān)節(jié)存在重疊現(xiàn)象,僅靠一個(gè)攝像頭采集的數(shù)據(jù)難以有較高的區(qū)分度。

表1 實(shí)驗(yàn)組和對(duì)比組的4種動(dòng)作識(shí)別準(zhǔn)確率結(jié)果

4 結(jié)束語(yǔ)

該文將體感識(shí)別技術(shù)與機(jī)器學(xué)習(xí)中的VGG 卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于運(yùn)動(dòng)訓(xùn)練輔助系統(tǒng)的設(shè)計(jì)中,以提高對(duì)人體實(shí)時(shí)動(dòng)作的識(shí)別準(zhǔn)確率。該運(yùn)動(dòng)訓(xùn)練輔助系統(tǒng)將采集到的實(shí)時(shí)畫面進(jìn)行人物與背景分離,并采用18 個(gè)關(guān)鍵關(guān)節(jié)的數(shù)據(jù)使用VGG 卷積神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建人體姿態(tài)圖,并利用堆疊模型實(shí)現(xiàn)實(shí)時(shí)連續(xù)動(dòng)作的識(shí)別。通過(guò)驗(yàn)證實(shí)驗(yàn),證明了文中所述方案具有一定的魯棒性和可行性。

猜你喜歡
攝像頭卷積人體
浙江首試公路非現(xiàn)場(chǎng)執(zhí)法新型攝像頭
人體“修補(bǔ)匠”
攝像頭連接器可提供360°視角圖像
人體冷知識(shí)(一)
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
排便順暢,人體無(wú)毒一身輕
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
奇妙的人體止咳點(diǎn)
特別健康(2018年3期)2018-07-04 00:40:10
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
奔馳360°攝像頭系統(tǒng)介紹
正蓝旗| 理塘县| 察哈| 会宁县| 光山县| 新巴尔虎左旗| 三明市| 灵山县| 平泉县| 泗洪县| 许昌县| 沾益县| 崇礼县| 广灵县| 阳高县| 明星| 大同市| 夏河县| 甘泉县| 习水县| 黄梅县| 长汀县| 和平区| 平塘县| 临朐县| 海城市| 乌什县| 民县| 梁河县| 阿荣旗| 内黄县| 夹江县| 定襄县| 武宣县| 奇台县| 崇阳县| 华池县| 武威市| 德昌县| 巩义市| 长春市|