摘 要:【目的】為了給用戶提供個(gè)性化健身指導(dǎo),設(shè)計(jì)出一種基于LLM大語(yǔ)言模型和計(jì)算機(jī)視覺(jué)(CV)的AI個(gè)人健身教練系統(tǒng)?!痉椒ā坎捎肞P-TinyPose進(jìn)行關(guān)鍵點(diǎn)匹配,并使用微調(diào)后的InternLM2大語(yǔ)言模型,使系統(tǒng)能通過(guò)攝像頭捕捉用戶運(yùn)動(dòng)姿態(tài)并進(jìn)行分析,從而提供個(gè)性化的健身指導(dǎo)?!窘Y(jié)果】測(cè)試結(jié)果表明,該系統(tǒng)能準(zhǔn)確識(shí)別運(yùn)動(dòng)姿態(tài),并提供實(shí)時(shí)反饋和建議,顯著提高健身效果。【結(jié)論】基于PP-TinyPose和微調(diào)后的InternLM2模型的AI健身教練系統(tǒng)能為用戶提供有效的個(gè)性化健身指導(dǎo),具有廣泛的應(yīng)用前景。
關(guān)鍵詞:人工智能;PP-TinyPose;XTuner;InternLM2;個(gè)人健身教練
中圖分類號(hào):TP18;TP391.41" "文獻(xiàn)標(biāo)志碼:A" "文章編號(hào):1003-5168(2025)02-0024-05
DOI:10.19968/j.cnki.hnkj.1003-5168.2025.02.005
Abstract:[Purposes] To provide personalized fitness guidance to users, an artificial intelligence (AI) personal fitness coach system based on a large language model (LLM) and computer vision (CV) is proposed. [Methods] The system utilizes PP-TinyPose for key point detection and a fine-tuned InternLM2 large language model. By capturing and analyzing users' exercise postures through the camera, the system generates personalized fitness guidance.[Findings] The test results demonstrate that the system can accurately recognize exercise postures and provide real-time feedback and suggestions, significantly improving fitness outcomes. [Conclusions] The AI fitness coach system proposed in this paper, based on PP-TinyPose and the fine-tuned InternLM2 model, effectively provides users with personalized fitness guidance and shows great potential for wide application.
Keywords: AI; PP-TinyPose; XTuner; InternLM2; certified personal trainer
0 引言
隨著健康知識(shí)的普及和生活水平的提升,人們?cè)絹?lái)越重視身體健康。然而,對(duì)于缺乏專業(yè)指導(dǎo)的初學(xué)者,想要掌握正確的運(yùn)動(dòng)姿勢(shì)和有效的訓(xùn)練方法并不容易,而健身教練現(xiàn)場(chǎng)指導(dǎo)的高昂費(fèi)用和時(shí)間、地點(diǎn)的限制一直困擾著健身愛(ài)好者。AI個(gè)人健身教練系統(tǒng)作為新型的“AI+體育”[1]健身指導(dǎo)方式,能提供個(gè)性化、低成本的服務(wù)。通過(guò)AI和CV技術(shù),可開(kāi)發(fā)出虛擬AI個(gè)人健身教練系統(tǒng),通過(guò)嵌入式設(shè)備和輔助系統(tǒng)[2]提供實(shí)時(shí)、個(gè)性化的指導(dǎo),幫助用戶糾正動(dòng)作,制定科學(xué)的健身計(jì)劃,提高訓(xùn)練效果,減少受傷風(fēng)險(xiǎn)。這種方式不僅成本低,還能極大地提高健身的便利性和可達(dá)性。
本研究利用大語(yǔ)言模型實(shí)現(xiàn)對(duì)話功能,提供個(gè)性化健身建議和指導(dǎo)。研究?jī)?nèi)容如下:基于健身訓(xùn)練特點(diǎn),利用大語(yǔ)言模型原理和實(shí)現(xiàn)方法進(jìn)行優(yōu)化;構(gòu)建健身訓(xùn)練對(duì)話數(shù)據(jù)集,利用大語(yǔ)言模型進(jìn)行訓(xùn)練和優(yōu)化;根據(jù)用戶問(wèn)題和需求,實(shí)現(xiàn)個(gè)性化回答和建議,提供實(shí)時(shí)交互和幫助。在實(shí)際應(yīng)用中,健身訓(xùn)練數(shù)據(jù)的個(gè)性化和特殊性可能導(dǎo)致大語(yǔ)言模型無(wú)法直接應(yīng)用。利用XTuner[3]微調(diào)技術(shù),對(duì)大語(yǔ)言模型進(jìn)行少量數(shù)據(jù)集微調(diào),提高用戶訓(xùn)練效果和體驗(yàn)。通過(guò)以上研究,本研究可實(shí)現(xiàn)基于計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理技術(shù)的AI個(gè)人健身教練系統(tǒng),從而為初學(xué)者提供個(gè)性化、實(shí)時(shí)和高精度的健身訓(xùn)練指導(dǎo)和幫助。
1 關(guān)鍵技術(shù)
PaddlePaddle擁有豐富的模型庫(kù)和工具鏈路支持,PP-TinyPose能實(shí)時(shí)檢測(cè)人體關(guān)鍵點(diǎn),InternLM2結(jié)合XTuner微調(diào)技術(shù),可對(duì)健身場(chǎng)景進(jìn)行場(chǎng)景優(yōu)化,從而提供自然流暢的多輪對(duì)話體驗(yàn)。
1.1 PaddlePaddle
PaddlePaddle是由百度研發(fā)并維護(hù)的開(kāi)源深度學(xué)習(xí)框架。在AI個(gè)人健身教練項(xiàng)目中,使用PaddlePaddle對(duì)人體姿態(tài)估計(jì)模型進(jìn)行訓(xùn)練和部署。
1.2 PP-TinyPose和PPicoDet
PP-TinyPose是一種為移動(dòng)和實(shí)時(shí)應(yīng)用設(shè)計(jì)的輕量級(jí)人體姿態(tài)估計(jì)模型,是PaddleDetection項(xiàng)目中基于PicoDet優(yōu)化的實(shí)時(shí)關(guān)鍵點(diǎn)檢測(cè)模型,適用于移動(dòng)設(shè)備上的多人姿態(tài)估計(jì)任務(wù)。使用PP-Tinypose[4]算法對(duì)人物身體關(guān)鍵點(diǎn)進(jìn)行檢測(cè)和匹配,結(jié)果如圖1所示。該算法用于檢測(cè)和匹配關(guān)鍵點(diǎn),并基于匹配結(jié)果識(shí)別和評(píng)估健身動(dòng)作,為用戶提供實(shí)時(shí)反饋和指導(dǎo)。
PP-PicoDet由百度公司開(kāi)發(fā),具有低參數(shù)量、高效率和高準(zhǔn)確率的目標(biāo)檢測(cè)性能,其關(guān)鍵技術(shù)包括網(wǎng)絡(luò)架構(gòu)優(yōu)化、特征融合策略、動(dòng)態(tài)標(biāo)簽分配策略、損失函數(shù)優(yōu)化、神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索及其他策略。
PP-PicoDet架構(gòu)如圖2所示。PP-PicoDet在移動(dòng)設(shè)備上具有優(yōu)異的目標(biāo)檢測(cè)性能,其小模型(PicoDet-S)在保持0.99 M參數(shù)量的同時(shí),達(dá)到30.6%的mAP,超越了其他輕量級(jí)模型。
1.3 InternLM2大語(yǔ)言模型
InternLM2[5]由上海人工智能實(shí)驗(yàn)室、商湯科技集團(tuán)和香港中文大學(xué)聯(lián)合開(kāi)發(fā),是一個(gè)開(kāi)源的大型語(yǔ)言模型(LLM),在長(zhǎng)文本建模和開(kāi)放式主觀評(píng)估方面表現(xiàn)卓越。
1.4 XTuner
XTuner是一個(gè)高效、靈活、全能的輕量化大模型微調(diào)工具庫(kù),支持大語(yǔ)言模型和多模態(tài)圖文模型的預(yù)訓(xùn)練和微調(diào),適用于8 GB顯存下的7 B模型和多節(jié)點(diǎn)跨設(shè)備的更大尺度模型。
2 設(shè)計(jì)與實(shí)現(xiàn)
2.1 系統(tǒng)架構(gòu)
AI個(gè)人健身教練系統(tǒng)由多個(gè)模塊組成,包括數(shù)據(jù)采集模塊、姿態(tài)估計(jì)模塊、對(duì)話生成模塊、模型微調(diào)模塊和反饋模塊。系統(tǒng)架構(gòu)如圖3所示。
數(shù)據(jù)采集模塊通過(guò)攝像頭實(shí)時(shí)獲取用戶的健身視頻,并將視頻幀傳輸至姿態(tài)估計(jì)模塊中進(jìn)行處理。
模型微調(diào)模塊使用Xtuner對(duì)預(yù)訓(xùn)練的大語(yǔ)言模型進(jìn)行微調(diào),確保其能準(zhǔn)確生成針對(duì)健身和營(yíng)養(yǎng)的建議和對(duì)話。
反饋模塊結(jié)合用戶的動(dòng)作識(shí)別結(jié)果和對(duì)話生成結(jié)果,實(shí)時(shí)提供個(gè)性化健身指導(dǎo)和營(yíng)養(yǎng)建議。該模塊通過(guò)API與其他模塊進(jìn)行數(shù)據(jù)交換,實(shí)現(xiàn)系統(tǒng)的整體功能。
2.2 姿態(tài)估計(jì)與識(shí)別
2.4 系統(tǒng)實(shí)現(xiàn)
系統(tǒng)界面和姿態(tài)識(shí)別如圖5所示。系統(tǒng)采用Qt開(kāi)發(fā),提供跨平臺(tái)的圖形用戶界面,利用模塊化設(shè)計(jì),各模塊通過(guò)API通信,保證靈活性和可擴(kuò)展性。實(shí)現(xiàn)過(guò)程如下。
①前端界面。使用Qt開(kāi)發(fā),提供用戶友好的交互界面,支持跨平臺(tái)操作。
②后端服務(wù)。采用Python和Flask框架實(shí)現(xiàn)處理數(shù)據(jù)采集、姿態(tài)估計(jì)和對(duì)話生成等功能。
③數(shù)據(jù)處理。系統(tǒng)不存儲(chǔ)用戶數(shù)據(jù),所有數(shù)據(jù)處理均在內(nèi)存中進(jìn)行,確保用戶隱私和數(shù)據(jù)安全。
系統(tǒng)整體架構(gòu)保證了高效的數(shù)據(jù)處理和實(shí)時(shí)反饋,為用戶提供個(gè)性化的健身指導(dǎo)和營(yíng)養(yǎng)建議。
2.5 PP-Tinypose關(guān)鍵點(diǎn)匹配的算法和XTuner微調(diào)的實(shí)現(xiàn)
在處理骨骼點(diǎn)數(shù)據(jù)時(shí),首先根據(jù)人體檢測(cè)框?qū)?shù)據(jù)進(jìn)行歸一化處理,實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化,確保不同尺寸和姿態(tài)的人體數(shù)據(jù)能進(jìn)行有效比較。其次使用余弦距離計(jì)算不同骨骼點(diǎn)數(shù)據(jù)之間的相似度,從而快速評(píng)估兩個(gè)姿態(tài)或動(dòng)作的相似性。上述過(guò)程的實(shí)現(xiàn)代碼如下。
3.2 結(jié)果分析
對(duì)LLM個(gè)性化對(duì)話表現(xiàn)分析后發(fā)現(xiàn),InternLM2模型通過(guò)XTuner微調(diào)后,在健身指導(dǎo)對(duì)話中表現(xiàn)出色,能準(zhǔn)確理解用戶需求,并提供個(gè)性化建議,展示出大語(yǔ)言模型在個(gè)性化對(duì)話指導(dǎo)中的潛力。未來(lái),可優(yōu)化對(duì)話數(shù)據(jù)集,增強(qiáng)復(fù)雜對(duì)話場(chǎng)景表現(xiàn)。
對(duì)帕梅拉動(dòng)作識(shí)別表現(xiàn)分析后發(fā)現(xiàn),PP-TinyPose模型在動(dòng)作識(shí)別中具有高精度和實(shí)時(shí)性的特點(diǎn),表明其在健身指導(dǎo)中具有廣闊的應(yīng)用前景。然而,在復(fù)雜動(dòng)作或快速運(yùn)動(dòng)中,檢測(cè)精度仍需提升。未來(lái),可引入多樣化數(shù)據(jù)集和改進(jìn)模型結(jié)構(gòu),提高動(dòng)作識(shí)別的準(zhǔn)確性和魯棒性。
4 結(jié)語(yǔ)
本研究使用Python和計(jì)算機(jī)視覺(jué)技術(shù)開(kāi)發(fā)出AI個(gè)人健身教練系統(tǒng),通過(guò)PaddlePaddle深度學(xué)習(xí)框架和PP-Tinypose人體姿態(tài)估計(jì)算法,完成健身動(dòng)作的關(guān)鍵點(diǎn)檢測(cè)和匹配;采用XTuner微調(diào)技術(shù),提高大模型的健身動(dòng)作識(shí)別準(zhǔn)確性。通過(guò)對(duì)LLM和PP-TinyPose模型的測(cè)試與分析,驗(yàn)證AI個(gè)人健身教練系統(tǒng)在個(gè)性化對(duì)話和動(dòng)作識(shí)別方面的有效性。在項(xiàng)目實(shí)現(xiàn)過(guò)程中,還設(shè)計(jì)了用戶友好界面,支持自定義健身計(jì)劃,并提供實(shí)時(shí)的健身動(dòng)作反饋和糾錯(cuò)建議。測(cè)試結(jié)果顯示,優(yōu)化和微調(diào)后的模型能提供準(zhǔn)確、實(shí)時(shí)和個(gè)性化的健身指導(dǎo),并帶來(lái)良好的用戶體驗(yàn)。未來(lái),可聚焦于提升模型的泛化能力和用戶交互體驗(yàn),進(jìn)一步完善AI健身教練系統(tǒng)。
參考文獻(xiàn):
[1]張榜顯.“AI+體育”助力全民健身公共服務(wù)數(shù)字創(chuàng)新發(fā)展研究[C]//中國(guó)體育科學(xué)學(xué)會(huì).第十三屆全國(guó)體育科學(xué)大會(huì)論文摘要集:墻報(bào)交流(體育信息分會(huì)).2023:163-165.
[2]王暢.基于人體姿態(tài)估計(jì)的嵌入式AI健身輔助訓(xùn)練系統(tǒng)研究[D].重慶:西南大學(xué),2024.
[3]HU E J,SHEN Y L,WALLIS P,et al.LoRA: Low-rank adaptation of large language models[J].arXiv,2021.
[4]YU G H,CHANG Q Y,LV W Y,et al.PP-PicoDet: A better real-time object detector on mobile devices[J].arXiv,2021.
[5]CAI Z,CAO M S,CHEN H J,et al.Internlm2 technical report[J].arXiv,2024.