劉錦偉
摘 要:體育行業(yè)的信息化產(chǎn)生了海量數(shù)據(jù),迫切需要數(shù)據(jù)挖掘技術推動行業(yè)的深度發(fā)展。本文基于數(shù)據(jù)挖掘技術,詳細介紹了數(shù)據(jù)挖掘技術的含義和常用方法,并根據(jù)體育訓練的需要分別從需求分析、系統(tǒng)設計、需求實現(xiàn)等方面介紹了訓練質(zhì)量監(jiān)控和臨場戰(zhàn)術統(tǒng)計系統(tǒng)。在系統(tǒng)的研究上,以某高校羽毛球隊的訓練情況為研究對象,利用運動訓練臨場監(jiān)控與統(tǒng)計模塊,根據(jù)Apriori算法得到有效的訓練結果信息,為教練組制定和調(diào)整訓練計劃起輔助決策作用。該系統(tǒng)的應該將改善傳統(tǒng)體育訓練模式,對提高體育訓練效率和質(zhì)量、及時調(diào)整臨場戰(zhàn)術提高成績都將起到積極作用。
關鍵詞: 數(shù)據(jù)挖掘; 體育; 訓練模式; Apriori算法
中圖分類號:
文獻標志碼:
Abstract: The informationization of sports industry has produced a large amount of data, hence it urgently needs data mining technology to promote the in-depth development of the industry. Based on data mining technology, this paper introduces the meaning and common methods of data mining technology in detail, and according to the needs of sports training, it introduces the training quality monitoring and on-the-spot tactical statistics system from the aspects of demand analysis, system design, demand realization, etc. In the system research, taking the training situation of a college badminton team as the research object, using the on-the-spot monitoring and statistics module of sports training, according to the Apriori algorithm, we can get the effective training result information, and play an auxiliary decision-making role for the coach group to make and adjust the training plan. The system can improve the traditional sports training mode, improve the efficiency and quality of sports training, and adjust the on-the-spot tactics in time to improve the performance.
Key words: data mining; sports; training mode; Apriori algorithm
0 引言
在競技體育中,提高運動員競技水平的最直接有效的途徑就是加強訓練。目前采用的訓練模式仍主要根據(jù)教練員的經(jīng)驗和運動員個人的身體條件制定訓練計劃,缺乏科學有效的數(shù)據(jù)信息作為計劃制定的依據(jù)[1-3]。另外,在目前的訓練計劃中,訓練內(nèi)容以力量、速度、耐力等體能訓練為主,而在有針對性的技戰(zhàn)術訓練方面存在嚴重不足,不能夠以完善的戰(zhàn)術評價體系進行評定。可見,搜集、統(tǒng)計、分析運動員在訓練和實戰(zhàn)中的數(shù)據(jù),制定有針對性的訓練方案,提高運動員競技水平已變得尤為重要。
隨著數(shù)據(jù)庫、數(shù)據(jù)挖掘等現(xiàn)代計算機技術的深入發(fā)展,體育領域也已經(jīng)得以應用。針對運動員的個人成長和選材、日常訓練、實戰(zhàn)比賽等進行大量的數(shù)據(jù)收集工作,匯總形成多種數(shù)據(jù)庫,通過整合利用這些數(shù)據(jù)進行深度挖掘,整理分析后得到潛在規(guī)律,從而獲得有價值的信息,為體育管理部門、教練員、運動員等各方提供科學有效的參考數(shù)據(jù)。
1 數(shù)據(jù)挖掘技術的含義與方法
(1) 數(shù)據(jù)挖掘技術的含義[3-5]
數(shù)據(jù)挖掘于1989年8月在第十一屆國際聯(lián)合人工智能學術會議上被首次提出。數(shù)據(jù)挖掘?qū)儆谥R發(fā)現(xiàn)過程的一個步驟,即從大量的、不完全的、模糊的、未知的、隨機的數(shù)據(jù)中,提取隱藏在其中的、不為人知的、具有潛在價值的信息和知識的過程[6-7]。
數(shù)據(jù)挖掘的對象主要包括關系數(shù)據(jù)庫、數(shù)據(jù)倉庫、時空數(shù)據(jù)庫、事務數(shù)據(jù)庫、多媒體數(shù)據(jù)庫以及文本數(shù)據(jù)庫。數(shù)據(jù)挖掘的過程通常按照圖1所示過程進行。
(2) 數(shù)據(jù)挖掘技術的基本方法[8]
數(shù)據(jù)挖掘技術作為一類跨學科應用的技術,涵蓋了統(tǒng)計學、人工智能、模糊分析等多學科內(nèi)容,形成了根據(jù)具體問題經(jīng)數(shù)據(jù)分析后獲取知識的體系。根據(jù)具體問題,數(shù)據(jù)挖掘技術可分為以下幾種方法:
1) 統(tǒng)計分析法
該方法被廣泛應用于數(shù)據(jù)庫中,即利用回歸分析、相關
分析等數(shù)學方法將事物間的潛在關系聯(lián)系在一起,從而發(fā)現(xiàn)其中蘊含的潛在關系。
2) 遺傳算法[6,8]
該方法借鑒了生物界的自然遺傳機制,是一種模擬生物進化過程的計算模型。該方法是通過模擬進化,產(chǎn)生一系列解,通過一定的篩選原則去掉相關度較低的解,如此往復,最終得到最優(yōu)解。特別是在工業(yè)工程、交通運輸、經(jīng)濟等多個領域的優(yōu)化問題方面有廣泛應用。
3) 決策樹法
該方法是一類分析預測模型,以樹枝狀的形態(tài)展示已有數(shù)據(jù),建立一棵決策樹,在此基礎上進行下一步的預測。這一方法能幫助決策者更好地理解、分析問題。
4) 可視化技術
這一方法就是將已有數(shù)據(jù)進行圖形化、圖表化,以更加生動、直觀的方式展示數(shù)據(jù)間的關系,在數(shù)據(jù)挖掘中起到至關重要的作用。
5) Bayes網(wǎng)絡
該方法主要針對不確定信息問題而提出的,通過圖形方式建立各要素節(jié)點之間的相互聯(lián)系,在信息不完全、不確定的情況下進行解決問題,被廣泛應用于非固定信息的系統(tǒng)中。
6) 概念樹法[9]
該方法屬于一種抽象化的數(shù)據(jù)處理,可進行數(shù)據(jù)的分類整理,是一種數(shù)據(jù)預處理方式。
2 訓練質(zhì)量監(jiān)控和臨場戰(zhàn)術統(tǒng)計系統(tǒng)的需求分析
訓練質(zhì)量監(jiān)控和臨場戰(zhàn)術統(tǒng)計系統(tǒng)是對將教練員積累的比賽數(shù)據(jù)的文檔資料進行統(tǒng)計,并收集運動員在以往進行的訓練和比賽數(shù)據(jù),為后期進行的數(shù)據(jù)挖掘積累了大量的數(shù)據(jù)資料。
(1) 問題分析
在以往的訓練過程中,教練員的數(shù)據(jù)采集過程主要集中在運動員的日常訓練和比賽中,且主要依靠現(xiàn)場觀察和自身經(jīng)驗,從而確定運動員的訓練水平和質(zhì)量及臨場發(fā)揮情況。長此以往,教練員手中會積累大量的數(shù)據(jù)資料,但這些數(shù)據(jù)的離散性強、統(tǒng)計效果差、缺乏準確性和全面性,分析深度嚴重不足,同時,數(shù)據(jù)的存放分散,不易攜帶,使得大量的第一手資料沒有充分發(fā)揮作用。
訓練質(zhì)量監(jiān)控和臨場戰(zhàn)術統(tǒng)計系統(tǒng)的設計則能夠很好地解決上述問題,可以利用移動終端作為信息收集和使用工具,便攜方便,數(shù)據(jù)也能夠完整全面的得到保存。同時,通過對所建數(shù)據(jù)庫的數(shù)據(jù)進行深度挖掘分析,得到準確的統(tǒng)計分析結果,為教練員的訓練計劃的制定、訓練質(zhì)量的監(jiān)控和臨場戰(zhàn)術的調(diào)整提供數(shù)據(jù)支持。
(2) 數(shù)據(jù)流程分析[10]
數(shù)據(jù)流程分析則是針對系統(tǒng)內(nèi)數(shù)據(jù)的流動情況,以系統(tǒng)的實體劃分為依托,主要涵蓋外部文檔、移動用戶端、移動功能端、服務器功能端和數(shù)據(jù)庫等部分,如圖2所示。本系統(tǒng)中的主要數(shù)據(jù)流動方向為:移動用戶端和外部文檔作為數(shù)據(jù)的主要來源;移動功能端既能作為展示數(shù)據(jù)結果的數(shù)據(jù)輸出端,也能將流入的數(shù)據(jù)上傳至服務器功能端進行數(shù)據(jù)深化處理;服務器功能端則可以接收外部文檔的數(shù)據(jù)輸入,也可將數(shù)據(jù)分析結果進行輸出,且可將數(shù)據(jù)存儲在數(shù)據(jù)庫中。
(3) 功能需求分析
在數(shù)據(jù)流程分析的基礎上,移動端的功能則是滿足運動員在日常訓練和比賽時的數(shù)據(jù)采集的需求,能夠很方便的實現(xiàn)教練員在訓練時的數(shù)據(jù)信息輸入,包括訓練計劃、分數(shù)統(tǒng)以及戰(zhàn)術安排等,然后將搜集得到的數(shù)據(jù)上傳至服務器。服務器的功能則是在獲得移動端的數(shù)據(jù)后進行數(shù)據(jù)信息分類整理并存儲,與以往的數(shù)據(jù)資料進行整合,進一步上傳至綜合信息處理平臺??梢?,該系統(tǒng)所需的具體功能模塊主要包括訓練質(zhì)量監(jiān)控及統(tǒng)計模塊、臨場戰(zhàn)術統(tǒng)計模塊、戰(zhàn)術展示板模塊、訓練計劃管理模塊、綜合信息處理模塊。
3 訓練質(zhì)量監(jiān)控和臨場戰(zhàn)術統(tǒng)計系統(tǒng)的系統(tǒng)設計
以羽毛球訓練項目為例,該系統(tǒng)設計的網(wǎng)絡拓撲圖,如圖3所示。
在無線網(wǎng)絡環(huán)境下,教練組可利用移動終端對運動員的訓練情況、比賽情況進行錄入,利用網(wǎng)絡技術,數(shù)據(jù)資源可在其他環(huán)境下進行提取,實現(xiàn)整個數(shù)據(jù)資源的的綜合利用。這些數(shù)據(jù)會上傳至服務器,里面存在著海量的教練員、運動員的訓練計劃、訓練成果等信息,為確保數(shù)據(jù)信息的安全性,在服務器前端增設防火墻。根據(jù)對羽毛球訓練系統(tǒng)的需求,設置的系統(tǒng)框架,如圖4所示。
從圖4可以看出,系統(tǒng)主要包括移動端和服務器端兩個主要部分,均包含五個應用模塊。根據(jù)運動員的訓練情況和臨場表現(xiàn),利用移動端對相關數(shù)據(jù)信息可直接錄入,即刻便能了解運動員的訓練水平和比賽時的得分、戰(zhàn)術執(zhí)行情況、接發(fā)球得分率等重要指標,對運動員和教練員及時作出調(diào)整提供準確的技術數(shù)據(jù)參考,從而幫助改善訓練效果和提高比賽成績。移動端的詳細流程,如圖5所示。服務器端則是建立的一個龐大的羽毛球信息綜合數(shù)據(jù)庫,接收來自移動端傳輸?shù)娜粘S柧殧?shù)據(jù)、比賽數(shù)據(jù)及教練員整理的其他類型數(shù)據(jù)資料,存儲并維護這些信息。在這一平臺下,高效快捷的信息化管理系統(tǒng)能夠極大地解決數(shù)據(jù)的深度挖掘的問題,提供更加科學、有效的數(shù)據(jù)分析結果。
4 訓練質(zhì)量監(jiān)控和臨場戰(zhàn)術統(tǒng)計系統(tǒng)的系統(tǒng)實現(xiàn)
(1) 臨場監(jiān)控與統(tǒng)計功能
利用這一功能,教練員可對運動員的日常訓練效果進行監(jiān)控。在移動端,教練員可根據(jù)每組訓練進行實時打分。選定受訓運動員和訓練內(nèi)容,根據(jù)每一拍進行訓練質(zhì)量打分,確定結束后,即可得到運動員在總拍數(shù)、平均分、失誤率等方面的得分情況,如圖6所示。
(2) 臨場得失分統(tǒng)計功能
利用這一功能,教練員可通過移動端記錄運動員在比賽時最后一拍情況進行統(tǒng)計分析。通過填入比賽名稱、時間、地點、運動員信息等基本數(shù)據(jù),比賽時羽毛球的起、落點分別采用數(shù)字1~12和字母A~J表示,輸入后,系統(tǒng)會自行判斷“記錄選手”和“選擇區(qū)域”,同時,系統(tǒng)還會給出具體的“得分類型”和“技術類型”,方便教練員的點選輸入,方便快捷。
(3) 通信功能
通信功能的實現(xiàn)是移動端將數(shù)據(jù)信息傳遞至JavaBean對象中,經(jīng)序列化、包裝、壓縮等過程后進行數(shù)據(jù)傳輸,再經(jīng)反向操作轉(zhuǎn)換成相應的數(shù)據(jù)類型,最終傳至服務器端數(shù)據(jù)庫中,如圖7所示。
針對上述過程,其中移動端主要部分代碼如下:
public void onClickView v{
ClockstasService cs=new ClockstasService(getApplicationContext());
List〈clockstas〉listclock=cs.upLoad();
JSNOArray jsonArray=new JSONArray();
try {forclockstas c:listclock{
HashMap〈String,String〉hm=new HashMap〈String,String〉();
hm.put("cid",c.getClock_id().toString()); hm.put("score",c.getScore().toString());
jsonArray.puthm;}
String strlist=jsonArray.toString();
String strlistok=compressstrlisst;
HttpPost httpPost=new HttpPost (http://222.195.151.13.8080/
Badminton.Server/JsonClockstas);
HttpParams httpParams=new BasicHttpParams();
List〈NameValuePair〉nameValuePair=new Arrylist〈NameValuePair〉();
nameValuePair.addnew BasicNameValuePair"json1",Strlistok;
httpPost.setEntitynew UrlEncodedFormEntitynameValuePair;
httpPost.setParamshttpParams;
HttpThread ht=new Http ThreadhttpPost;
ht.start();
} coach Excepetion e{
e.printStackTrace();
throw new RuntimeExceptione;}}
服務器端主要部分代碼如下:
public ststic String unCompressString str throws IOException{
if(null==str‖str.length()<=return str;
ByteArrayOutputStream out=new ByteArrayOutputStream();
ByteArrayInputStream in=new ByteArrayInputStream(str.getBytes("ISO-8859-1"));
GZIPInputStream gzip=new GZIPInputStreamin;
byte[] buffer=new byte[256];
int n=0;
whilen=gzip.readbuffer>=0{//將未壓縮數(shù)據(jù)讀入字節(jié)數(shù)組
out.writebuffer,0,n;}
return out.toString"GBK";}
5 數(shù)據(jù)挖掘技術的應用
以運動訓練臨場監(jiān)控與統(tǒng)計模塊為例,根據(jù)Apriori算法,對輸入的運動員日常訓練數(shù)據(jù)進行分析可得到不同運動員間有相同結果特性的屬性集,這即可作為研究訓練中出現(xiàn)的問題的出發(fā)點,供教練組作為數(shù)據(jù)參考,便于及時調(diào)整訓練計劃和比賽策略,是較為準確、全面的決策依據(jù)。
接下來以某高校羽毛球隊的訓練情況為研究對象,球隊的日常訓練內(nèi)容,如表1所示。
以上24項訓練內(nèi)容的合格標準由教練組自主設定,體現(xiàn)了系統(tǒng)的靈活性。上述24項訓練項目數(shù)據(jù)輸入系統(tǒng)中,經(jīng)整理后進行數(shù)據(jù)挖掘分析處理,利用臨場監(jiān)控與統(tǒng)計模塊得到的數(shù)據(jù)結果為教練組制定和調(diào)整訓練計劃起輔助決策作用。
從圖8可以看出,根據(jù)數(shù)據(jù)庫中的訓練項目數(shù)據(jù),通過Apriori算法,在支持度和置信度均為90時,系統(tǒng)給出了2017-06-15至2017-09-20期間訓練項目的結果信息。由此可知,上網(wǎng)步法、后退步法和全場綜合步法訓練可合并為一項,手上專項訓練和搓球技術訓練可合并為一項。這是人機交互與數(shù)據(jù)挖掘綜合分析的結果,為教練組的訓練計劃提供了輔助決策依據(jù)。
6 總結
隨著行業(yè)數(shù)據(jù)量的迅速增加及對其所蘊含的潛在信息的需求,數(shù)據(jù)挖掘技術應運而生。借助數(shù)據(jù)挖掘技術對體育行業(yè)數(shù)據(jù)進行深度研究,不僅具有很高的科研價值,也具有很好的社會意義,能夠很大程度上推動體育信息化的發(fā)展。本文結合羽毛球訓練,通過構建訓練質(zhì)量監(jiān)控和臨場戰(zhàn)術統(tǒng)計系統(tǒng),將訓練和比賽數(shù)據(jù)進行匯總處理分析,利用數(shù)據(jù)挖掘技術進行深度挖掘潛在有價值信息。根據(jù)Apriori算法實現(xiàn)仿真實驗,對運動員日常訓練數(shù)據(jù)進行分析,給教練組提供科學有效的數(shù)據(jù)依據(jù),起到協(xié)作制定訓練計劃、調(diào)整臨場戰(zhàn)術等輔助決策的作用,實現(xiàn)了訓練模式的優(yōu)化。
參考文獻
[1] 蔡曉菲,謝永力.數(shù)據(jù)挖掘技術在體育訓練中的研究與應用[J].黑河學院學報,2018,9(11):124-126.
[2] 徐建敏,區(qū)木華,熊金志.數(shù)據(jù)挖掘技術在體育訓練中的應用綜述與分析[J].電腦知識與技術,2012,8(22):5492-5495.
[3] 黃謙,石勇.數(shù)據(jù)挖掘在體育訓練指導中的應用研究[J].廣州體育學院學報,2009,29(6):106-110.
[4] 遲殿委. 基于數(shù)據(jù)挖掘的決策支持系統(tǒng)的研究與實現(xiàn)[D].南昌:南昌大學,2008.
[5] 宋香君.基于關聯(lián)規(guī)則的運動訓練輔助決策支持系統(tǒng)設計[J].自動化與儀器儀表,2019(7):91-94.
[6] 許薈蓉.基于數(shù)據(jù)挖掘的體育成績管理系統(tǒng)的設計[J].自動化與儀器儀表,2017(11):240-242.
[7] 尹亞晶.基于數(shù)據(jù)挖掘的體育評價決策支持系統(tǒng)開發(fā)與研究[J].現(xiàn)代電子技術,2017,40(9):108-111.
[8] 周駿. 大數(shù)據(jù)時代網(wǎng)絡體育新聞數(shù)據(jù)的分析[D].西安:西安體育學院,2015.
[9] 周凱.數(shù)據(jù)挖掘技術在體育數(shù)據(jù)分析中的應用[J].電大理工,2015(1):32-34.
[10] 謝向陽.數(shù)據(jù)挖掘在體育數(shù)據(jù)分析中的研究與應用[J].當代體育科技,2013,3(23):9-10.
(收稿日期: 2020.02.12)