劉煥海+葉劍鋒+阿斯耶姆
摘 要:介紹了自組織映射網(wǎng)絡(luò)聚類分析方法,以2012年以來全世界女子排球最重要的七次大賽成績?yōu)橐罁?jù),提高世錦賽、世界杯、奧運(yùn)會權(quán)重,建立了相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型,并對世界九支女排強(qiáng)隊成績進(jìn)行6個級別分類。在訓(xùn)練過程中減小關(guān)聯(lián)度較小的樣本影響,提高了預(yù)測精度、訓(xùn)練速度。使用Matlab工具箱函數(shù)進(jìn)行仿真,面對網(wǎng)絡(luò)媒體中眾多的世界排名,推測預(yù)知,提出了相對科學(xué)的數(shù)據(jù)分析方法。
關(guān)鍵詞:女子排球;SOM自組織特征映射;聚類分析
DOIDOI:10.11907/rjdk.162467
中圖分類號:TP391
文獻(xiàn)標(biāo)識碼:A文章編號:1672-7800(2016)012-0133-03
0 引言
2016年8月21日里約奧運(yùn)女排決賽,中國女排終于不負(fù)眾望,逆轉(zhuǎn)塞爾維亞隊獲勝。中國女排的比賽一直牽動著廣大球迷的心,中國女排起步于20世紀(jì)50年代,到了60至70年代有著東洋魔女”之稱的日本女排取代蘇聯(lián)女排獲得了世界皇者地位。然而在90年代時候中國女排成績一直不夠理想,縱觀世界女排的風(fēng)云變幻,輝煌與失落并舉,在智能算法高速發(fā)展的今天有必要科學(xué)統(tǒng)計世界女排各隊的比賽數(shù)據(jù),如實展示各國女排強(qiáng)隊水平和實力。
1 神經(jīng)網(wǎng)絡(luò)建模
聚類不需要預(yù)先知道部分球隊的水平和實力,只需要給定分類的類別數(shù)量N,算法就會將所有樣本按照相似性的原則劃分為N類[1]。當(dāng)訓(xùn)練結(jié)束時,同一個競爭層的輸入樣本就被歸為同一類別,自組織神經(jīng)網(wǎng)絡(luò)模型如圖1所示。
要獲得較準(zhǔn)確的聚類結(jié)果,關(guān)鍵在于以下兩點:
(1) 選擇恰當(dāng)?shù)臉颖咎卣?。將國際性正式大賽的表現(xiàn)納入考慮范疇,并提高高級別比賽的權(quán)重[2]。本文選取近年來的七場世界級大賽——2012年奧運(yùn)會、2013年大獎賽、2014年錦標(biāo)賽、2015年大獎賽、2015年世界杯、2016年大獎賽、2016年奧運(yùn)會的參賽成績作為衡量實際水平的依據(jù)。
選擇9支球隊進(jìn)行聚類,分別為中國、塞爾維亞、美國、俄羅斯、日本、意大利、荷蘭、巴西、德國。每個球隊用一個七維向量x=[x1,x2,x3,x4,x5,x6,x7],向量的各分量分別表示2012年奧運(yùn)會成績、2013年大獎賽成績、2014年錦標(biāo)賽成績、2015年大獎賽成績、2015年世界杯成績、2016年大獎賽成績、2016年奧運(yùn)會成績。
成績的具體編碼如下:①對于奧運(yùn)會參賽隊12支,如果取得四強(qiáng),則取其最終排名(1~4),如果進(jìn)入八強(qiáng)編碼為5,排名9和10,編碼為9;排名11、12,編碼是11;②對于世界杯參賽隊固定為12支,如果取得四強(qiáng),則取其最終排名(1~4),如果進(jìn)入八強(qiáng)編碼為5,排名9和10,編碼為9;排名11、12,編碼是11,未獲得世界杯參賽資格的隊伍編碼是14;③對于世錦賽參賽隊固定為24支,如果取得四強(qiáng),則取其最終排名(1~4),如果進(jìn)入八強(qiáng)編碼為5,八強(qiáng)往后依次按照獲得的名次為編碼,對于未獲得世界杯參賽資格的隊伍編碼為26;④對于大獎賽賽參賽隊為28支,如果取得四強(qiáng),則取其最終排名(1~4),如果進(jìn)入八強(qiáng)編碼為5,八強(qiáng)往后依次按照獲得的名次為編碼,對于未獲得大獎賽參賽資格的隊伍編碼為30。注:大獎賽每年舉辦一次,較前面的世錦賽、世界杯、奧運(yùn)會四年舉辦一次而言,大獎賽分量稍輕故在權(quán)值上面乘以系數(shù)0.5,特此說明。
因此,對于這9支球隊,求其特征向量如表1所示,數(shù)字越小表示成績越好[3]。
(2)選擇適當(dāng)?shù)木垲悈?shù),這里的參數(shù)主要是聚類的類別個數(shù)。采用自組織特征映射網(wǎng)絡(luò)進(jìn)行聚類時,設(shè)置競爭層為2*3結(jié)構(gòu),即類別數(shù)為6類。組線條的分類意義并不大,會把很多隊分為一類,為了區(qū)別開來選擇相對細(xì)一些的分類。
由于向量維數(shù)為7,因此網(wǎng)絡(luò)的輸入層包含7個神經(jīng)元節(jié)點。競爭層也包含7個節(jié)點,訓(xùn)練完畢后,每一個輸入向量屬于一個競爭層節(jié)點。
2 排球水平聚類實現(xiàn)
排球水平可抽象為對9個7維向量聚類的問題。使用Matlab工具箱函數(shù)SELFFORG,流程如圖2所示[4]。
(1)定義樣本。聚類共涉及9個國家,每個國家的球員成績(大獎賽加權(quán)重)用一個七維向量表示。
(2)創(chuàng)建網(wǎng)絡(luò)。
(3)網(wǎng)絡(luò)訓(xùn)練。
(4)測試。當(dāng)測試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)相同時,為了得到每個樣本的分類標(biāo)簽需要將用于訓(xùn)練的矩陣輸入到網(wǎng)絡(luò)中。
(5)顯示聚類結(jié)果。聚類完成時,分為同一類的樣本被賦予相同的分類標(biāo)簽,但不同類別使用什么數(shù)字作為分類標(biāo)簽則是隨機(jī)的。為了得到正確結(jié)果,統(tǒng)計每個聚類類別的特征向量數(shù)值之和,由于數(shù)值越低表示水平越高,因此根據(jù)統(tǒng)計結(jié)果就可以判斷不同類別孰優(yōu)孰劣[5]。
用圖例說明如下:圖3為自組織網(wǎng)絡(luò)結(jié)構(gòu)圖,圖4為7個權(quán)值的輸入值,圖5為SOM相鄰權(quán)重值,圖6為SOM的權(quán)重位置,圖7為Matlab仿真計算結(jié)果。
Matlab仿真結(jié)果:
分析:球隊分為6個類別:
世界一流強(qiáng)隊。包括中國、美國,這一點可以從世界杯、世錦賽、奧運(yùn)會成績中看出來,中國隊在四大賽中,有3次進(jìn)入決賽并取得了兩個冠軍,一個亞軍和一個第五名,成績相對穩(wěn)定,大獎賽成績也不錯,均進(jìn)入八強(qiáng)。美國隊有兩次進(jìn)入到?jīng)Q賽,且成績不錯,而且在大獎賽中取得一個冠軍一個亞軍還有一個第七名的優(yōu)異成績。
世界二流強(qiáng)隊。只有一個巴西隊,四大賽中有一次進(jìn)入決賽,并取得一個冠軍一個季軍,大獎賽中兩個冠軍,因為較四大賽含金量稍低,且在2015年世界杯中成績不佳。故排名較中國隊、美國隊稍后。
世界三流強(qiáng)隊。包括俄羅斯、日本隊,日本四大賽中一次進(jìn)入半決賽,其它均進(jìn)入八強(qiáng)。俄羅斯隊四大賽中均進(jìn)入八強(qiáng)。
世界四流強(qiáng)隊。只有一個塞爾維亞隊,四大賽中兩次進(jìn)入決賽,可是在2012年奧運(yùn)會成績11,拉低了塞爾維亞的排名,若從2013年至今排名,相信塞爾維亞隊會在日本隊和俄羅斯隊之上。正如中國隊教練郎平所說,塞爾維亞隊是一支不容小覷的世界強(qiáng)隊。
世界五流強(qiáng)隊。包括意大利、德國隊,意大利隊四大賽中一次進(jìn)入四強(qiáng)、一次八強(qiáng)。而德國隊則無一進(jìn)入八強(qiáng)。
世界六流強(qiáng)隊。只有一個荷蘭隊,在16年大獎賽和奧運(yùn)會中表現(xiàn)突出,可之前的賽事中表現(xiàn)較差,浮動較大。成績居然落到了意大利隊、德國隊之后。
由于神經(jīng)網(wǎng)絡(luò)包含一定的隨機(jī)性,而且多個樣本向量非常接近,因此多次運(yùn)行,可能產(chǎn)生不一樣的聚類結(jié)果。
對此總結(jié)如下:
聚類中較為穩(wěn)定的球隊:①一流:中國、美國;②二流:巴西、俄羅斯、日本;③三流:塞爾維亞;④四流:意大利、德國。
荷蘭隊介于三流四流之間。通過上述分析可以看出,中國女排位于世界一流強(qiáng)隊。
3 結(jié)語
本文基于近七年世界女排大賽成績的實際數(shù)據(jù),采用SOM自組織特征映射神經(jīng)網(wǎng)絡(luò),對總樣本進(jìn)行分類分析,探討了各影響因子對世界女排水平影響程度。同時采用SOM網(wǎng)絡(luò)模型對女排成績進(jìn)行聚類分析,得出如下結(jié)論:①與統(tǒng)計分類方法相比,SOM自組織映射特征神經(jīng)網(wǎng)絡(luò)能實現(xiàn)分類智能化,使分類結(jié)果客觀、可靠;②利用SOM自組織映射特征神經(jīng)網(wǎng)絡(luò)方法,對總樣本進(jìn)行分類,能減少關(guān)聯(lián)不大的樣本在訓(xùn)練時的相互影響,從而使得訓(xùn)練速度和預(yù)測精度都有所提高;③在現(xiàn)有數(shù)據(jù)上只考慮了7個指標(biāo)(7次世界大賽)的影響,樣本不夠大。在今后的研究中,可進(jìn)一步探索影響目標(biāo)數(shù)據(jù)的其它因素,以進(jìn)一步提高預(yù)測的準(zhǔn)確性。
參考文獻(xiàn):
[1] 陳明.Matlab神經(jīng)網(wǎng)絡(luò)原理與實例[M].北京:清華大學(xué)出版社,2013:45-49.
[2] 周志華.神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[M].北京:清華大學(xué)出版社,2004:23-30.
[3] 孫霞.基于自組織神經(jīng)網(wǎng)絡(luò)SOM和K-means聚類算法的圖像修復(fù)[J].科學(xué)技術(shù)與工程,2012(6):34-35.
[4] 蔣卓強(qiáng).SOM神經(jīng)網(wǎng)絡(luò)在農(nóng)業(yè)旱情評價中的應(yīng)用[J].重慶大學(xué)學(xué)報,2014(5):51-52.
[5] 劉京京.基于LVQ算法的SOM神經(jīng)網(wǎng)絡(luò)在入侵檢測系統(tǒng)中的應(yīng)用[D].南京:南京理工大學(xué),2015(10):65-67.
(責(zé)任編輯:孫 娟)