巫文佳,李云鵬 ,閻 鉦,趙 紅
網(wǎng)球運(yùn)動(dòng)是一項(xiàng)把競(jìng)爭(zhēng)性、文化性、觀賞性和參與性有機(jī)融合在一起的體育項(xiàng)目[1]。隨著我國(guó)社會(huì)政治、經(jīng)濟(jì)、文化的不斷發(fā)展,特別是李娜法網(wǎng)奪冠后,國(guó)內(nèi)掀起了一股網(wǎng)球運(yùn)動(dòng)熱潮。在網(wǎng)球運(yùn)動(dòng)不斷創(chuàng)新和改革的大潮下,網(wǎng)球基礎(chǔ)訓(xùn)練除了要研究國(guó)外優(yōu)秀選手的動(dòng)作技術(shù)及相關(guān)的文化外,更要研究如何采取先進(jìn)的訓(xùn)練方法、手段及其科學(xué)的訓(xùn)練內(nèi)容,滿足人們參與網(wǎng)球運(yùn)動(dòng)的需求。訓(xùn)練方法要符合他們的實(shí)際情況,使他們的網(wǎng)球技能在短時(shí)間內(nèi)得到提高。我國(guó)學(xué)者田麥久[2]認(rèn)為,基礎(chǔ)訓(xùn)練是全程系統(tǒng)性多年訓(xùn)練過(guò)程的第一個(gè)環(huán)節(jié),是指運(yùn)動(dòng)員在進(jìn)行專項(xiàng)訓(xùn)練之前,先進(jìn)行一段時(shí)間系統(tǒng)、全面的身體訓(xùn)練和體力訓(xùn)練,同時(shí)結(jié)合基本技術(shù)、心理和智能訓(xùn)練,使他們既能健康成長(zhǎng),又能具備基礎(chǔ)的體能和技能,為將來(lái)攀登運(yùn)動(dòng)成績(jī)高峰打下堅(jiān)實(shí)基礎(chǔ)的教育訓(xùn)練過(guò)程。在進(jìn)行專項(xiàng)訓(xùn)練之前,應(yīng)安排一段時(shí)間的基礎(chǔ)訓(xùn)練,并且要根據(jù)專項(xiàng)需要原則進(jìn)行身體訓(xùn)練。
近些年來(lái),我國(guó)網(wǎng)球項(xiàng)目研究集中在網(wǎng)球項(xiàng)目的現(xiàn)狀與發(fā)展趨勢(shì)、網(wǎng)球運(yùn)動(dòng)員競(jìng)技能力與專項(xiàng)素質(zhì)、訓(xùn)練方法和訓(xùn)練理論、運(yùn)動(dòng)損傷和疲勞、專項(xiàng)訓(xùn)練和技術(shù)訓(xùn)練等方面。由于我國(guó)網(wǎng)球運(yùn)動(dòng)開(kāi)展得較晚,從事網(wǎng)球項(xiàng)目科學(xué)研究的人員較少,目前和網(wǎng)球項(xiàng)目基礎(chǔ)訓(xùn)練密切相關(guān)的研究并不多。如何使網(wǎng)球基礎(chǔ)訓(xùn)練更加科學(xué)合理,是網(wǎng)球基礎(chǔ)訓(xùn)練面臨的新課題。
本文將數(shù)據(jù)挖掘方法[6],特別是粒計(jì)算方法[5]運(yùn)用到網(wǎng)球基礎(chǔ)訓(xùn)練的數(shù)據(jù)分析中。數(shù)據(jù)挖掘[6]能從數(shù)據(jù)中提取出隱含的過(guò)去未知的有價(jià)值的潛在信息。而粒計(jì)算方法[5]能自動(dòng)地在不同粒度層次之間進(jìn)行跳轉(zhuǎn),并發(fā)現(xiàn)有意義的規(guī)律。近年來(lái),基于粗糙集[3-4]的粒計(jì)算理論[5]在許多學(xué)科和工程應(yīng)用領(lǐng)域都取得了廣泛的應(yīng)用。將這些新方法用于網(wǎng)球基礎(chǔ)訓(xùn)練研究,是體育項(xiàng)目研究的一種有意義的嘗試。在網(wǎng)球基礎(chǔ)訓(xùn)練過(guò)程中進(jìn)行有針對(duì)性的數(shù)據(jù)采集與挖掘,運(yùn)用粒計(jì)算方法統(tǒng)計(jì)分析,制定量化標(biāo)準(zhǔn)評(píng)價(jià)指標(biāo),掌握并合理運(yùn)用網(wǎng)球基礎(chǔ)訓(xùn)練規(guī)律。通過(guò)對(duì)網(wǎng)球基礎(chǔ)訓(xùn)練內(nèi)容體系進(jìn)行深入的研究,解決網(wǎng)球基礎(chǔ)訓(xùn)練問(wèn)題,制定網(wǎng)球基礎(chǔ)訓(xùn)練量化評(píng)價(jià)標(biāo)準(zhǔn)。這些都為今后我國(guó)從事相關(guān)研究與實(shí)踐提供了理論參考,有望促進(jìn)我國(guó)網(wǎng)球基礎(chǔ)訓(xùn)練水平的提高。
網(wǎng)球數(shù)據(jù)挖掘研究工作的基礎(chǔ)是網(wǎng)球基礎(chǔ)訓(xùn)練中的數(shù)據(jù)。因此,我們的首要工作就是采集網(wǎng)球基礎(chǔ)訓(xùn)練中的各項(xiàng)數(shù)據(jù)。首先要做的是明確需要采集的數(shù)據(jù)指標(biāo)。其次要設(shè)計(jì)合理的數(shù)據(jù)采集方案,以確保采集數(shù)據(jù)的真實(shí)性和正確性,進(jìn)而保證粒計(jì)算方法研究的科學(xué)性。
根據(jù)網(wǎng)球基礎(chǔ)訓(xùn)練過(guò)程目標(biāo)的需要,我們主動(dòng)進(jìn)行有針對(duì)性的網(wǎng)球基礎(chǔ)訓(xùn)練數(shù)據(jù)挖掘與采集,制定數(shù)據(jù)采集量表,以期獲得我們想要的數(shù)據(jù)指標(biāo)。例如針對(duì)球拍選擇、運(yùn)動(dòng)選材、訓(xùn)練方式,設(shè)計(jì)了三個(gè)指標(biāo)采集數(shù)據(jù)集,分別為不同人群、不同打法類型選擇的球拍統(tǒng)計(jì)量表、身體素質(zhì)與運(yùn)動(dòng)成績(jī)統(tǒng)計(jì)量表、不同訓(xùn)練方式統(tǒng)計(jì)量表。身體素質(zhì)所采用數(shù)據(jù)指標(biāo)能夠代表人體在網(wǎng)球運(yùn)動(dòng)中所表現(xiàn)的力量、速度、耐力、柔韌及靈敏身體機(jī)能,運(yùn)用粒計(jì)算方法統(tǒng)計(jì)分析,挖掘他們之間的關(guān)聯(lián)。球拍選擇所采用數(shù)據(jù)指標(biāo)能夠反映出不同人、不同打法類型的人選擇何種球拍的量化指標(biāo),運(yùn)用粒計(jì)算方法統(tǒng)計(jì)分析,從而挖掘其中的關(guān)聯(lián)。不同訓(xùn)練方式與訓(xùn)練成效的量化指標(biāo),運(yùn)用粒計(jì)算方法統(tǒng)計(jì)分析,挖掘其中的關(guān)聯(lián)。網(wǎng)球基礎(chǔ)訓(xùn)練數(shù)據(jù)指標(biāo)的測(cè)量與評(píng)價(jià)包括:測(cè)量可靠性、有效性及客觀性檢驗(yàn)、項(xiàng)目分析如指標(biāo)的難易度與區(qū)分度檢驗(yàn),成套測(cè)驗(yàn)的組內(nèi)相關(guān)分析、測(cè)量尺度、評(píng)分評(píng)價(jià)表的制定與評(píng)價(jià)。
只有進(jìn)行合理的需求分析,制定合適的數(shù)據(jù)格式,并采取合適的數(shù)據(jù)采集方法,才能獲得有意義的數(shù)據(jù),并從中挖掘出規(guī)律。由于相關(guān)數(shù)據(jù)的規(guī)模比較小,因此在小樣本上進(jìn)行學(xué)習(xí),使決策支持軟件與教練員進(jìn)行良好交互,是相當(dāng)困難的工作。
網(wǎng)球基礎(chǔ)訓(xùn)練數(shù)據(jù)采集包含一次性采集和累積采集。如球拍選擇量表數(shù)據(jù)采用一次性問(wèn)卷采集,身體素質(zhì)與網(wǎng)球運(yùn)動(dòng)成績(jī)量表數(shù)據(jù)中身體素質(zhì)數(shù)據(jù)采用一次性的測(cè)量,運(yùn)動(dòng)成績(jī)數(shù)據(jù)采用一次性考核或在比賽進(jìn)行中采集,不同訓(xùn)練方式量表數(shù)據(jù)采取累積測(cè)量與評(píng)價(jià)。
所謂帶回饋機(jī)制的數(shù)據(jù)就是通過(guò)對(duì)上次數(shù)據(jù)采集分析,發(fā)現(xiàn)有冗余及未被采集的關(guān)聯(lián)數(shù)據(jù)時(shí),要對(duì)采集數(shù)據(jù)指標(biāo)進(jìn)行調(diào)整。如在對(duì)網(wǎng)球基礎(chǔ)訓(xùn)練身體素質(zhì)數(shù)據(jù)采集分析中,有些數(shù)據(jù)通過(guò)統(tǒng)計(jì)分析不具有相關(guān)性就需要?jiǎng)h除,有些關(guān)聯(lián)數(shù)據(jù)指標(biāo)沒(méi)有被納入需要采集的范圍中就需要補(bǔ)充進(jìn)來(lái),從而建立一個(gè)主動(dòng)的、帶上下反饋機(jī)制的數(shù)據(jù)采集方法。
建立回饋機(jī)制的主動(dòng)數(shù)據(jù)指標(biāo)采集機(jī)制。采用《人體測(cè)量與評(píng)價(jià)》[7]等相關(guān)資料,確定采集數(shù)據(jù)指標(biāo),制定科學(xué)采集方法。在進(jìn)行下一輪的數(shù)據(jù)采集過(guò)程前,先對(duì)上一輪的數(shù)據(jù)指標(biāo)進(jìn)行統(tǒng)計(jì)分析,對(duì)冗余指標(biāo)予以刪除,對(duì)有用卻沒(méi)有被采集到的指標(biāo)進(jìn)行補(bǔ)充,以期使采集到的指標(biāo)科學(xué)化[8]。
我們運(yùn)用粒計(jì)算方法來(lái)挖掘網(wǎng)球基礎(chǔ)訓(xùn)練中的數(shù)據(jù)。數(shù)據(jù)挖掘的粒計(jì)算方法包括分類[9-10]、粒關(guān)聯(lián)規(guī)則[11-13]、屬性選擇[14]以及代價(jià)敏感[15]等。這些研究所得出的結(jié)論可以用于指導(dǎo)我們的網(wǎng)球基礎(chǔ)訓(xùn)練和選拔運(yùn)動(dòng)員等非常有意義的工作。
通過(guò)數(shù)據(jù)挖掘中的分類方法[16]找出網(wǎng)球基礎(chǔ)訓(xùn)練數(shù)據(jù)之間的各種關(guān)系。例如,我們可以研究球員的各項(xiàng)指標(biāo)對(duì)其成績(jī)的影響。具體地說(shuō),是找出哪些指標(biāo)對(duì)球員成績(jī)有比較大的影響,哪些指標(biāo)影響較小甚至可以忽略不計(jì)。其意義在于指導(dǎo)網(wǎng)球教學(xué)和訓(xùn)練工作。在此研究中,自變量,即條件屬性,是球員各項(xiàng)技術(shù)指標(biāo)(例如:靈敏性、速度、耐力等);因變量,即決策屬性,是球員的成績(jī),在進(jìn)行分類前需要對(duì)其進(jìn)行離散化(例如:優(yōu)秀、良好、一般等)。還可以找出其它各種關(guān)系,比如訓(xùn)練方法對(duì)成績(jī)提高的影響,球員屬性對(duì)球拍選擇的影響。
針對(duì)網(wǎng)球基礎(chǔ)訓(xùn)練數(shù)據(jù)特性的分類方法所得出的結(jié)論可以被用來(lái)指導(dǎo)我們的網(wǎng)球教學(xué)和訓(xùn)練工作。例如,我們通過(guò)分類方法得出,球員的靈活性是影響球員成績(jī)至關(guān)重要的因素,那么,我們?cè)诰W(wǎng)球訓(xùn)練時(shí)就增加對(duì)球員靈活性方面的訓(xùn)練。假設(shè)我們得出,球員握拍方式對(duì)球員成績(jī)沒(méi)有顯著影響,那么,我們?cè)诮虒W(xué)中就可以忽略對(duì)這個(gè)因素的考慮。這樣的好處是可以集中教學(xué)資源,重點(diǎn)訓(xùn)練對(duì)球員成績(jī)有較大影響的技術(shù)指標(biāo)。同理,使用分類方法所得出的規(guī)則來(lái)作為選拔運(yùn)動(dòng)員的依據(jù)。例如,我們從實(shí)驗(yàn)數(shù)據(jù)中求得規(guī)則<靈活性=好,耐力=好>=><運(yùn)動(dòng)員成績(jī)=高>。那么,我們?cè)谶x拔運(yùn)動(dòng)時(shí),就會(huì)優(yōu)先選擇靈活性好和耐力好的球員。經(jīng)典的分類方法有很多,我們主要采用高效的決策樹(shù)[17-19]來(lái)進(jìn)行分類。
粒關(guān)聯(lián)規(guī)則用于從數(shù)據(jù)庫(kù)多對(duì)多關(guān)系中挖掘有用的關(guān)聯(lián),它比在單個(gè)表中進(jìn)行挖掘更有挑戰(zhàn)性。同時(shí),復(fù)雜的數(shù)據(jù)類型及關(guān)聯(lián)的多變性帶來(lái)一系列的科學(xué)問(wèn)題,例如,評(píng)分機(jī)制使得基礎(chǔ)數(shù)據(jù)不能以多對(duì)多關(guān)系來(lái)存儲(chǔ)于數(shù)據(jù)庫(kù)。由于粒關(guān)聯(lián)規(guī)則的復(fù)雜性,需要從簡(jiǎn)單的情況開(kāi)始考慮,包括基本的二元關(guān)系、名詞型數(shù)據(jù)等,然后逐步考慮評(píng)分值、數(shù)值型值、鄰域、區(qū)間值等一般情況。從數(shù)據(jù)模型出發(fā),逐漸考慮計(jì)算模型以及不同的規(guī)則形式,使得每種規(guī)則適用于一定的范圍,循序漸進(jìn)地建立良好的系統(tǒng)。
粒關(guān)聯(lián)規(guī)則可以顯露出在關(guān)系表中隱含的、有用的、尚未發(fā)現(xiàn)的多值關(guān)系。給定兩個(gè)信息表和一個(gè)關(guān)系表,粒關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的問(wèn)題就是源覆蓋、目標(biāo)覆蓋、源置信度、目標(biāo)置信度分別大于等于我們?cè)O(shè)定的4個(gè)指標(biāo)閥值,即最小源覆蓋(ms)、最小目標(biāo)覆蓋值(mt)、最小源置信度值(mc)、最小目標(biāo)置信度值(tc)。問(wèn)題的解決就是先產(chǎn)生大于等于4個(gè)指標(biāo)閥值的頻繁項(xiàng)目集,然后通過(guò)頻繁項(xiàng)目集產(chǎn)生規(guī)則,最后從產(chǎn)生的規(guī)則中確定出有價(jià)值的規(guī)則。規(guī)則中的項(xiàng)目數(shù)據(jù)類型可以是數(shù)值型或符號(hào)型的。對(duì)于數(shù)值型數(shù)據(jù),我們先將其離散化成符號(hào)型數(shù)據(jù),再繼續(xù)進(jìn)行規(guī)則挖掘。例如根據(jù)所采集到的網(wǎng)球基礎(chǔ)訓(xùn)練數(shù)據(jù),分別包括球員信息表、球拍信息表和球員對(duì)球拍的評(píng)分關(guān)系表,我們運(yùn)用粒關(guān)聯(lián)規(guī)則挖掘方法,通過(guò)所設(shè)置的4個(gè)指標(biāo)閾值,挖掘出有價(jià)值的規(guī)則。通過(guò)這些規(guī)則的研究,我們可以得到不同身體素質(zhì)和打法的球員更愿意選擇的球拍,從而為以后球員對(duì)球拍的選擇提供科學(xué)的參考。
獲得球員技術(shù)指標(biāo)中對(duì)球員成績(jī)最有影響效度的屬性。例如,我們測(cè)試一個(gè)球員,需要測(cè)量其很多技術(shù)指標(biāo),包括身高、體重、擊球習(xí)慣和所用球拍等。但并不是所有這些屬性都對(duì)球員的成績(jī)有至關(guān)重要的影響。在本研究中,我們利用粒計(jì)算(主要是粗糙集)方法從中選擇出一部分屬性(屬性子集即屬性約簡(jiǎn))作為所有這些指標(biāo)的代表。這樣,在實(shí)際中,我們就可以只測(cè)量這些關(guān)鍵指標(biāo)而不需要測(cè)量所有指標(biāo)。
找出一種合適的網(wǎng)球基礎(chǔ)訓(xùn)練方案,能使我們獲得最小化訓(xùn)練代價(jià)。例如,這里有兩種訓(xùn)練方案,一是先訓(xùn)練正手后訓(xùn)練反手,另一是先訓(xùn)練反手后訓(xùn)練正手。我們通過(guò)數(shù)據(jù)發(fā)現(xiàn),方案二比方案一在訓(xùn)練球員達(dá)到相同的成績(jī)的條件下,所需要的時(shí)間少,那么我們會(huì)選擇方案二。因?yàn)闀r(shí)間也是一種代價(jià)。
代價(jià)敏感學(xué)習(xí)[20-21]是數(shù)據(jù)挖掘中的挑戰(zhàn)性問(wèn)題之一。網(wǎng)球訓(xùn)練數(shù)據(jù)的獲取需要一定的測(cè)試代價(jià),如測(cè)試球員的1000米成績(jī)需要花費(fèi)相應(yīng)時(shí)間,測(cè)試燈光環(huán)境下的各項(xiàng)技術(shù)需要耗費(fèi)電能。訓(xùn)練中進(jìn)行各種分類會(huì)涉及誤分類代價(jià),如將優(yōu)秀球員劃分為一般球員,可能會(huì)阻礙其進(jìn)一步發(fā)展。如何依據(jù)網(wǎng)球基礎(chǔ)訓(xùn)練的實(shí)際情況來(lái)合理考慮這些代價(jià),并且考慮這些代價(jià)之間的權(quán)衡是我們必須應(yīng)對(duì)的問(wèn)題。
用統(tǒng)計(jì)方法確定各類測(cè)試代價(jià),用調(diào)查問(wèn)卷方式確定基礎(chǔ)的誤分類代價(jià),并采用動(dòng)態(tài)調(diào)整的方法逐步獲得更合理的設(shè)置。利用已有的粒計(jì)算、粗糙集、決策樹(shù)等理論和方法,設(shè)計(jì)新的代價(jià)敏感學(xué)習(xí)算法,并根據(jù)其效果進(jìn)行參數(shù)的學(xué)習(xí)。
運(yùn)用粒計(jì)算進(jìn)行網(wǎng)球訓(xùn)練數(shù)據(jù)采集與挖掘具有重要的理論和現(xiàn)實(shí)意義。一方面,在網(wǎng)球基礎(chǔ)訓(xùn)練過(guò)程中進(jìn)行有針對(duì)性的數(shù)據(jù)采集與挖掘,運(yùn)用粒計(jì)算進(jìn)行統(tǒng)計(jì)分析,制定各種問(wèn)題分類的評(píng)價(jià)量化標(biāo)準(zhǔn),為網(wǎng)球基礎(chǔ)訓(xùn)練提供科學(xué)的理論依據(jù),推動(dòng)網(wǎng)球基礎(chǔ)訓(xùn)練方法研究;另一方面,通過(guò)粒計(jì)算方法對(duì)網(wǎng)球基礎(chǔ)訓(xùn)練針對(duì)性采集的數(shù)據(jù)進(jìn)行科學(xué)定量分析,制定網(wǎng)球基礎(chǔ)訓(xùn)練各階段的考核評(píng)價(jià)標(biāo)準(zhǔn),教練員可以對(duì)不同階段的運(yùn)動(dòng)員的訓(xùn)練水平進(jìn)行評(píng)價(jià)和監(jiān)督,指導(dǎo)基礎(chǔ)訓(xùn)練階段的訓(xùn)練工作。
[1]李興昌.快易網(wǎng)球在高校網(wǎng)球教學(xué)中的應(yīng)用研究[J].體育科技,2011,32(2):135-138.
[2]田麥久.運(yùn)動(dòng)訓(xùn)練學(xué)詞解[M].北京:北京體育大學(xué)出版社,2002:27-28.
[3]Z.Pawlak,Rough sets[J].International Journal of Computer and Information Sciences,1982,11:341-356.
[4]W.Zhu and F.Wang, Reduction and axiomization of covering generalized rough sets[J].Information Sciences, 2003, 152(1):217-230.
[5]T.Y.Lin, Granular computing on binary relations: data mining and neighborhood systems, II: rough set representations and belief functions, in: RSKD, 1998, 107-140.
[6]J.W.Han and M.Kamber,Data mining:concepts and techniques,Elsevier,1996.
[7]人體測(cè)量與評(píng)價(jià)編寫組.人體測(cè)量與評(píng)價(jià)[M].北京:高等教育出版社,1999,97-161.
[8]曹潔.青少年網(wǎng)球運(yùn)動(dòng)員基礎(chǔ)訓(xùn)練調(diào)查研究[J].湖北體育科技,2011,30(1):77-79.
[9]D.Nejman.A rough set based method of handwritten numbers classification.Institute of Computer Science Reports [R].Warsaw:Warsaw University o f Technology, 1994.
[10]P.D.Turney.Cost-sensitive classification: empirical evaluation of a hybrid genetic decision tree induction algorithm[J].Journal of Artificial Intelligence Research, 1995, 2:369-409.
[11]F.Min, Q.H.Hu, W.Zhu, Granular association rules with four subtypes, in: Proceedings of the 2011 IEEE International Conference on Granular Computing, 2012.
[12]F.Min,Q.H.Hu,W.Zhu,Granular association rules on two universes with four measures,arXiv:1209.5598.
[13]X.He, F.Min, W.Zhu, A comparative study of discretization approaches for granular association rule mining, arXiv: 1212.0190.
[14]C.Cornelisa, R.Jensen.G.Hurtado and D.Slezak, Attribute selection with fuzzy decision reducts, Information Sciences, 2010, 180(2): 209-224.
[15]F.Min, H.P.He, Y.H.Qian, and W.Zhu, Test-cost-sensitive attribute reduction, Information Sciences, 2011, 181: 4928-4942.
[16]S.Ji, L.Carin.Cost-sensitive feature acquisition and classification, Pattern Recognition, 2007, 40, 1474-1485.
[17]J.Quinlan,Induction of decision trees,Machine learning,1986:81-106.
[18]C.X.Ling, V.S.Sheng, Q.Yang.Test strategies for cost-sensitive decision trees, IEEE Transactions on Knowledge and Data Engineering, 2006, 18(8):1055-1067.
[19]J.Du, Z.Cai, C.X.Ling.Cost-sensitive decision trees with pre-pruning, in Canadian AI’07, 2007, 171-179.
[20]P.D.Turney, Types of cost in inductive concept learning, in: Proceedings of the Workshop on Cost-Sensitive Learning at the 17th ICML, 2000:1-7.
[21]M.Tan,Cost-sensitive learning of classification knowledge and its applications in robotics,Machine Learning1993,13(1):7-33.