體育運(yùn)動動作識別是通過在時(shí)域上跟蹤一些關(guān)鍵點(diǎn)的運(yùn)動以記錄人體運(yùn)動,并轉(zhuǎn)換為可用的數(shù)學(xué)方式表達(dá)運(yùn)動的過程,對于競技訓(xùn)練和全民健身均具有重要意義。傳統(tǒng)的動作識別技術(shù)有機(jī)械式、聲學(xué)式、電磁式、光學(xué)式等。機(jī)械式技術(shù)采用外置傳感器和剛性支架,會影響肢體活動。聲學(xué)式和電磁式技術(shù)則存在易受外界環(huán)境干擾、有較大時(shí)間延遲、測試精度不高等問題。傳統(tǒng)的光學(xué)式技術(shù)較為精準(zhǔn),但也存在價(jià)格昂貴、數(shù)據(jù)處理耗時(shí)較長等不足。近年來,基于加速度計(jì)、陀螺儀、磁力計(jì)等慣性測量技術(shù)和基于肌電圖的可穿戴技術(shù)發(fā)展迅速,但也存在設(shè)備可能影響運(yùn)動表現(xiàn)、無法在比賽環(huán)境中使用等局限。
計(jì)算機(jī)視覺利用攝像機(jī)和計(jì)算機(jī)對目標(biāo)進(jìn)行捕捉、跟蹤、測量,并通過人工智能算法實(shí)現(xiàn)動作自動識別,突破了傳統(tǒng)動作識別技術(shù)的諸多局限。2019年,澳大利亞學(xué)者Cust等總結(jié)了機(jī)器學(xué)習(xí)在動作識別中的應(yīng)用,系統(tǒng)匯總了支持向量機(jī)SVM、卷積神經(jīng)網(wǎng)絡(luò)CNN等算法在計(jì)算機(jī)視覺中的應(yīng)用。值得關(guān)注的是,一些新的姿態(tài)估計(jì)算法不斷涌現(xiàn)。OpenPose是當(dāng)前最常用的多人人體姿態(tài)估計(jì)算法之一,采用自底向上的方法,首先檢測出圖像中所有人的關(guān)鍵點(diǎn),然后將檢出的關(guān)鍵點(diǎn)分配給每個(gè)對應(yīng)的人。RMPEAlphaPose是一種自頂向下的姿態(tài)估計(jì)算法,通過使用對稱空間變換網(wǎng)絡(luò)SSTN從不準(zhǔn)確的候選框中抽取高質(zhì)量的單人區(qū)域。MaskRCNN作為一個(gè)流行的語義和實(shí)例分割架構(gòu),可同時(shí)預(yù)測圖像中多個(gè)物體的候選框位置,并分割其語義信息的掩碼,從而確定每個(gè)人的位置,再通過位置信息和特征點(diǎn)集合識別人體運(yùn)動姿態(tài)。
從普通相機(jī)到深度相機(jī),從固定區(qū)域到無限區(qū)域,從固定視角到自由視角,從單人捕捉到多人識別,從單一技術(shù)到計(jì)算機(jī)視覺、慣性傳感器、肌電圖、虛擬現(xiàn)實(shí)等技術(shù)的交叉融合,技術(shù)在不斷革新。計(jì)算機(jī)視覺在體育中的應(yīng)用也有望從動作識別逐漸向運(yùn)動效果智能評估、技戰(zhàn)術(shù)智能分析、運(yùn)動損傷智能預(yù)測等領(lǐng)域拓展和深入,推動體育運(yùn)動的智能化發(fā)展。
浙江大學(xué)溫煦,王軼凡