黃云
摘 要: 未能深度挖掘出評(píng)價(jià)指標(biāo)之間的關(guān)聯(lián)性是造成排球訓(xùn)練方案評(píng)價(jià)效果不好的主要原因,為此,設(shè)計(jì)了基于數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型。介紹了數(shù)據(jù)挖掘進(jìn)行排球訓(xùn)練效率值提取的步驟,通過效率值分析排球訓(xùn)練動(dòng)作對(duì)訓(xùn)練成果的影響,選出模型評(píng)價(jià)指標(biāo)。利用數(shù)據(jù)挖掘?qū)δP驮u(píng)價(jià)指標(biāo)進(jìn)行量化和關(guān)聯(lián),確定指標(biāo)權(quán)值,為訓(xùn)練方案打分。使用VFP 6.0軟件對(duì)模型進(jìn)行開發(fā),設(shè)計(jì)模型功能。最后通過實(shí)驗(yàn)證明所設(shè)計(jì)的模型具有評(píng)價(jià)效果好的優(yōu)勢(shì)。
關(guān)鍵詞: 數(shù)據(jù)挖掘; 訓(xùn)練方案; 評(píng)價(jià)模型; 關(guān)聯(lián)規(guī)則
中圖分類號(hào): TN98?34; G842 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)15?0101?04
Abstract: The relevance among the evaluation indexes can′t be mined deeply is the main reason causing the poor evaluation effect of the volleyball training program, therefore the data mining based evaluation model of volleyball training program scheme was designed. The step using data mining to extract the volleyball training efficiency value is introduced. The influence of volleyball training action on training effect is analyzed according to the efficiency value to choose the model evaluation index. The data mining is used to quantize and associate with the model evaluation index, determine the index weight, and grade the training program. The VFP 6.0 software is adopted to develop the model, and design the model function. The experimental results verify that the model has the good evaluation effect.
Keywords: data mining; training program; evaluation model; association rule
0 引 言
體育競(jìng)技極具觀賞性,是當(dāng)代人休閑娛樂的項(xiàng)目之一。在排球比賽中,運(yùn)動(dòng)員的競(jìng)技能力包括攻防方式、傳球技能和團(tuán)隊(duì)合作能力等,在很大程度上會(huì)受到訓(xùn)練方案的影響,訓(xùn)練方案對(duì)排球運(yùn)動(dòng)的發(fā)展具有導(dǎo)向功能,是排球比賽取得實(shí)質(zhì)性勝利的關(guān)鍵點(diǎn)[1]。排球訓(xùn)練方案對(duì)球隊(duì)和運(yùn)動(dòng)員的適宜程度一般無法通過肉眼觀察出來,需要采用特定方法對(duì)其進(jìn)行評(píng)價(jià)。
定性評(píng)價(jià)和定量評(píng)價(jià)是最傳統(tǒng)的排球訓(xùn)練方案評(píng)價(jià)方法,定性評(píng)價(jià)通過收集教練和專家的排球比賽經(jīng)驗(yàn)對(duì)運(yùn)動(dòng)員訓(xùn)練方案進(jìn)行評(píng)價(jià),定量評(píng)價(jià)從多種具有代表性的排球比賽中挖掘運(yùn)動(dòng)員行為數(shù)據(jù)評(píng)價(jià)訓(xùn)練方案[2]。兩種設(shè)計(jì)方法的處理方向均正確,但人為的主觀分析過多,難免出現(xiàn)誤差,不符合當(dāng)代社會(huì)的科學(xué)技術(shù)發(fā)展觀念。文獻(xiàn)[3]采用人工神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)排球訓(xùn)練方案評(píng)價(jià)模型,運(yùn)用計(jì)算機(jī)仿真手段結(jié)合定性評(píng)價(jià)和定量評(píng)價(jià)的優(yōu)勢(shì),通過人工神經(jīng)網(wǎng)絡(luò)迭代提取訓(xùn)練方案與實(shí)際比賽進(jìn)程的不相關(guān)性得到了杰出的評(píng)價(jià)效果,其最大缺陷是模型反應(yīng)出的數(shù)據(jù)量不多,未能找尋到訓(xùn)練項(xiàng)目與比賽成績(jī)之間的關(guān)聯(lián)性,評(píng)價(jià)效果仍存在可提升余地。通過以上分析,采用數(shù)據(jù)挖掘技術(shù)[4]設(shè)計(jì)排球訓(xùn)練方案評(píng)價(jià)模型,明確指出各項(xiàng)模型指標(biāo)的關(guān)聯(lián)性,為排球教練提供決策平臺(tái)。
1 數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)指標(biāo)
數(shù)據(jù)挖掘起源于計(jì)算機(jī)科學(xué)中的人工智能,其基本處理步驟包括指標(biāo)設(shè)定以及指標(biāo)數(shù)據(jù)的管理、挖掘、提取與解析,通過挖掘數(shù)據(jù)集中指標(biāo)數(shù)據(jù)之間的關(guān)聯(lián)性來歸納指標(biāo)特征與結(jié)構(gòu),再對(duì)特征與結(jié)構(gòu)進(jìn)行量化,對(duì)比得出指標(biāo)的優(yōu)劣性,進(jìn)而分析、提取并顯示數(shù)據(jù)關(guān)系。
基于數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型使用數(shù)據(jù)挖掘從大量的、不確定的排球訓(xùn)練方案數(shù)據(jù)中查找可以促進(jìn)排球訓(xùn)練得分的特征進(jìn)行評(píng)價(jià)。在進(jìn)行評(píng)價(jià)之前,使用馬爾科夫鏈[5]在模型中建立排球訓(xùn)練方案數(shù)據(jù)庫,從中選擇評(píng)價(jià)指標(biāo)作為評(píng)價(jià)排球訓(xùn)練方案的切入點(diǎn)。排球訓(xùn)練方案數(shù)據(jù)庫的數(shù)據(jù)出處是近8年的各種大型排球比賽視頻以及臨場(chǎng)訓(xùn)練方案。排球訓(xùn)練的效率值與勝率成正比,通過數(shù)據(jù)挖掘從數(shù)據(jù)庫中提取效率值的步驟如圖1所示。
提取排球訓(xùn)練方案效率值時(shí),將比賽與臨場(chǎng)訓(xùn)練方案看成一個(gè)擁有多種數(shù)據(jù)特征的數(shù)據(jù)集,將數(shù)據(jù)集轉(zhuǎn)化為戰(zhàn)術(shù)數(shù)據(jù)表征的過程,滿足馬爾科夫鏈,排球訓(xùn)練方案的效率值由數(shù)據(jù)集中各數(shù)據(jù)特征的轉(zhuǎn)化效率計(jì)算而得[6]。表示數(shù)據(jù)特征轉(zhuǎn)化成數(shù)據(jù)特征的轉(zhuǎn)化效率,是起點(diǎn)數(shù)據(jù)特征轉(zhuǎn)化成終點(diǎn)特征的轉(zhuǎn)化效率,有:
排球訓(xùn)練效率值的計(jì)算步驟為:首先式(1)的計(jì)算結(jié)果為一個(gè)矩陣,為矩陣中所有數(shù)據(jù)項(xiàng)加一個(gè)增量,然后利用式(1)計(jì)算得出一個(gè)增量矩陣。排球訓(xùn)練效率值是兩個(gè)矩陣之差,其值越小對(duì)應(yīng)的數(shù)據(jù)特征對(duì)排球比賽勝率的影響就越小。排球訓(xùn)練得分和失分影響圖如圖2所示。
排球訓(xùn)練中運(yùn)動(dòng)員的每一個(gè)動(dòng)作都會(huì)造成得分與失分,并且都有一個(gè)穩(wěn)定的得失步驟。在圖2中,任意一個(gè)影響都會(huì)導(dǎo)致步驟的停止,停止即表示得分或失分。馬爾科夫鏈指出,某一時(shí)間段的狀態(tài)會(huì)對(duì)之后的狀態(tài)給出指引,之前的狀態(tài)對(duì)之后狀態(tài)產(chǎn)生的影響可忽略不計(jì)[7]。將運(yùn)動(dòng)員訓(xùn)練動(dòng)作設(shè)為時(shí)間段狀態(tài),通過分析各狀態(tài)的效率值可得,對(duì)排球訓(xùn)練結(jié)果有重要影響的排球訓(xùn)練方案評(píng)價(jià)模型評(píng)價(jià)指標(biāo)包括發(fā)球、快攻、強(qiáng)攻、一傳和二傳,如表1所示。
2 數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型
2.1 評(píng)價(jià)指標(biāo)權(quán)值的確定
使用數(shù)據(jù)挖掘?qū)ε徘蛴?xùn)練方案評(píng)價(jià)指標(biāo)進(jìn)行量化的目的是為了尋找評(píng)價(jià)指標(biāo)之間的差別和關(guān)聯(lián),并進(jìn)行差異補(bǔ)償[8],即構(gòu)造評(píng)價(jià)指標(biāo)權(quán)值,以反應(yīng)出排球訓(xùn)練方案中的戰(zhàn)術(shù)水平,加強(qiáng)訓(xùn)練方案的可用度。為了將理論與實(shí)際進(jìn)行結(jié)合,挖掘定量方法中的排球訓(xùn)練方案實(shí)際情況對(duì)模型評(píng)價(jià)指標(biāo)進(jìn)行量化,量化結(jié)果記錄在表2中,可見模型評(píng)價(jià)指標(biāo)的量化結(jié)果為得分率、失分率和組合率,結(jié)構(gòu)清晰,理解起來非常方便,能夠正確顯示出排球訓(xùn)練方案與比賽結(jié)果之間的關(guān)聯(lián)性,以及各評(píng)價(jià)指標(biāo)之間的差別。
關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的關(guān)鍵技術(shù)點(diǎn),只有準(zhǔn)確提取到數(shù)據(jù)之間的關(guān)聯(lián)性才能得到有用的深層信息。對(duì)表2中的量化結(jié)果進(jìn)行關(guān)聯(lián),設(shè)量化結(jié)果為模型評(píng)價(jià)指標(biāo)用集合表示,指標(biāo)的可信度與支持度用和表示,估計(jì)指標(biāo)的關(guān)聯(lián)結(jié)果用表示,關(guān)聯(lián)度集合為對(duì)于量化結(jié)果中的任意量化值而言,如果同時(shí)滿足且那么數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則[9]為表示存在關(guān)聯(lián),有:
由排球教練設(shè)置訓(xùn)練方案評(píng)價(jià)指標(biāo)臨界值當(dāng),表示關(guān)聯(lián)結(jié)果可信,輸出可信的關(guān)聯(lián)結(jié)果進(jìn)行歸一化,得出模型評(píng)價(jià)指標(biāo)權(quán)值。如果關(guān)聯(lián)結(jié)果為線性,采用式(3)進(jìn)行歸一化處理;若為指數(shù),用式(4)進(jìn)行歸一化處理。
式中MAX和MIN分別代表的最大值和最小值。
表2中數(shù)據(jù)關(guān)聯(lián)度的歸一化結(jié)果見表3。
基于數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型對(duì)各項(xiàng)指標(biāo)的綜合評(píng)價(jià)打分公式表示為:
式中代表權(quán)重。
2.2 模型的開發(fā)
對(duì)基于數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型的開發(fā)使用VFP 6.0(Visual FoxPro 6.0)軟件,這是一款進(jìn)行中、小型數(shù)據(jù)庫管理與開發(fā)的工具,是目前的主流開發(fā)工具,具有開發(fā)周期短、程序代碼編寫簡(jiǎn)單、運(yùn)營(yíng)方便、調(diào)用速度快的特點(diǎn),并且對(duì)計(jì)算機(jī)硬件的要求不高,可與日常辦公軟件進(jìn)行數(shù)據(jù)交互,用戶也可根據(jù)自身需要修改初始程序代碼。VFP 6.0軟件的程序代碼接口性能完善,能夠引進(jìn)不同類型和功能的編輯器(必須是32位的)對(duì)主控文件和數(shù)據(jù)庫進(jìn)行建立,支持C/S結(jié)構(gòu)數(shù)據(jù)庫的開發(fā),并提供程序更新入口。圖3描述的是VFP 6.0軟件開發(fā)出的模型功能結(jié)構(gòu)圖。
由圖3可得,基于數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型擁有數(shù)據(jù)錄入、數(shù)據(jù)處理、數(shù)據(jù)查詢、報(bào)表輸出和系統(tǒng)維護(hù)五個(gè)功能模塊,囊括了所有的數(shù)據(jù)挖掘處理流程和排球訓(xùn)練方案打分流程的錄入、顯示以及維護(hù)等功能。
3 實(shí)驗(yàn)與結(jié)果討論
在以往的排球訓(xùn)練方案評(píng)價(jià)模型開發(fā)成果中,定性評(píng)價(jià)、定量評(píng)價(jià)和人工神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)比較常用,三種模型均有著不同的優(yōu)勢(shì)和缺點(diǎn)。本文將基于數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型與上述三項(xiàng)開發(fā)成果進(jìn)行對(duì)比,測(cè)試本文模型的評(píng)價(jià)效果。實(shí)驗(yàn)現(xiàn)場(chǎng)如圖4所示,是一個(gè)常規(guī)仿真實(shí)驗(yàn)室。
理論偏移由排球訓(xùn)練方案評(píng)價(jià)模型中的估計(jì)差值計(jì)算產(chǎn)生,是一種隨機(jī)變量。由于排球訓(xùn)練方案的易變性,理論偏移必然使評(píng)價(jià)模型產(chǎn)生計(jì)算誤差[10],計(jì)算誤差來源于模型指標(biāo)及其權(quán)值與實(shí)際訓(xùn)練情況的偏移,決定了模型的評(píng)價(jià)效果。模型評(píng)價(jià)效果的表達(dá)式為:
實(shí)驗(yàn)開始之前對(duì)我國(guó)4個(gè)省級(jí)排球隊(duì)的日常訓(xùn)練方案進(jìn)行收集,共計(jì)88個(gè)訓(xùn)練樣本,樣本中包括訓(xùn)練過程中所進(jìn)行的排球比賽進(jìn)攻方案和比賽分?jǐn)?shù),將以上兩項(xiàng)組成實(shí)際偏移,對(duì)訓(xùn)練樣本進(jìn)行評(píng)價(jià)。表4~表7分別記錄了定性評(píng)價(jià)、定量評(píng)價(jià)、人工神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)和基于數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型的評(píng)價(jià)效果,其中,比賽分?jǐn)?shù)的評(píng)價(jià)效果來源于各模型對(duì)評(píng)價(jià)指標(biāo)的組合率。
分析表4~表7可得,四種設(shè)計(jì)成果中,定量評(píng)價(jià)的評(píng)價(jià)效果最差,其次是定性評(píng)價(jià),造成評(píng)價(jià)效果差的可能原因如下:
(1) 排球進(jìn)攻方案的數(shù)據(jù)采集樣本數(shù)量過少,引起各種進(jìn)攻類型之間特性的混淆,評(píng)價(jià)過程中無法正確區(qū)分進(jìn)攻類型;
(2) 未將比賽分?jǐn)?shù)與進(jìn)攻方案結(jié)合起來進(jìn)行評(píng)價(jià),樣本數(shù)據(jù)關(guān)聯(lián)性挖掘不足;
(3) 排球訓(xùn)練方案中的不可控因素過多,評(píng)價(jià)之前未能對(duì)這些因素進(jìn)行準(zhǔn)確過濾。
人工神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)和基于數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型的評(píng)價(jià)效果都很好。人工神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)對(duì)進(jìn)攻方案的評(píng)價(jià)效果要高于其對(duì)比賽分?jǐn)?shù)的評(píng)價(jià)效果,間接體現(xiàn)了數(shù)據(jù)關(guān)聯(lián)性挖掘不足的缺點(diǎn),因而評(píng)價(jià)效果不如本文設(shè)計(jì)的基于數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型。
4 結(jié) 論
為了提高排球訓(xùn)練方案的實(shí)用性,設(shè)計(jì)基于數(shù)據(jù)挖掘的排球訓(xùn)練方案評(píng)價(jià)模型,改善傳統(tǒng)評(píng)價(jià)方式的評(píng)價(jià)效果。通過實(shí)驗(yàn)測(cè)試本文模型的可行性,測(cè)試方法是將定性評(píng)價(jià)、定量評(píng)價(jià)和人工神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)與本文模型進(jìn)行對(duì)比,以理論偏移與實(shí)際偏移的差異量表示評(píng)價(jià)效果,實(shí)驗(yàn)結(jié)果表明,本文模型的評(píng)價(jià)效果最好。
參考文獻(xiàn)
[1] 唐磊.學(xué)校排球隊(duì)員的訓(xùn)練與教學(xué)之我見[J].科技資訊,2014,12(11):166?167.
[2] 劉江,李毅鈞.排球多元組合訓(xùn)練的生理生化監(jiān)控及實(shí)施研究:以四川省男子排球隊(duì)為例[J].廣州體育學(xué)院學(xué)報(bào),2016,36(1):102?105.
[3] 林鋒.高校排球運(yùn)動(dòng)員體能評(píng)價(jià)體系的構(gòu)建[J].福建教育學(xué)院學(xué)報(bào),2014,15(4):59?61.
[4] 周程.人工智能推理引擎在微博數(shù)據(jù)挖掘中的應(yīng)用[J].現(xiàn)代電子技術(shù),2016,39(15):99?102.
[5] 趙偉強(qiáng),黃新波,趙隆,等.輸電線路絕緣子表面鹽密在線監(jiān)測(cè)系統(tǒng)[J].西安工程大學(xué)學(xué)報(bào),2016,30(1):86?92.
[6] 鄶淑娥.基于數(shù)據(jù)挖掘技術(shù)的超市顧客忠誠(chéng)度評(píng)價(jià)模型的構(gòu)建[J].中國(guó)管理信息化,2015,18(19):63?65.
[7] 鄧芳.大型物聯(lián)網(wǎng)電子設(shè)備的海量數(shù)據(jù)高效挖掘方法研究[J].現(xiàn)代電子技術(shù),2016,39(4):159?162.
[8] 王學(xué)峰,齊曉爽.CUVA排球運(yùn)動(dòng)員訓(xùn)練期自我效能狀況的實(shí)驗(yàn)研究[J].安徽體育科技,2016,37(1):50?53.
[9] 李菲.基于數(shù)據(jù)挖掘的商務(wù)智能系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2016,39(11):152?155.
[10] 季惠芬.“排球”微課程的模型設(shè)計(jì)建構(gòu)與實(shí)施策略[J].體育教學(xué),2016,36(4):28?30.