馮其明
(四川文理學(xué)院,體育學(xué)院, 四川,達(dá)州 635000)
目前,教育數(shù)據(jù)預(yù)測(cè)領(lǐng)域的熱點(diǎn)研究方向之一是體育成績(jī)預(yù)測(cè)研究[1],以相關(guān)已知信息預(yù)測(cè)未來(lái)的學(xué)習(xí)成績(jī)數(shù)據(jù),在成績(jī)、分?jǐn)?shù)、排名等方面均有應(yīng)用[2]。近年來(lái),在體育精神的弘揚(yáng)及體育運(yùn)動(dòng)員的擴(kuò)招下,體育教學(xué)規(guī)模不斷變大,導(dǎo)致相關(guān)數(shù)據(jù)及信息不能及時(shí)、準(zhǔn)確地獲取[3],在很大程度上阻礙了教學(xué)質(zhì)量的提升。在此條件下,分析和研究更可行、更有效率的學(xué)生成績(jī)預(yù)測(cè)方法在體育教學(xué)的發(fā)展中更有應(yīng)用性和實(shí)踐性。
普遍使用的成績(jī)預(yù)測(cè)方法大體上可分為基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法[4]和基于融合知識(shí)圖譜和協(xié)同過(guò)濾的預(yù)測(cè)方法[5]。前者利用神經(jīng)網(wǎng)絡(luò)建立預(yù)測(cè)模型進(jìn)行目標(biāo)預(yù)測(cè),后者分別使用基于鄰節(jié)點(diǎn)的方法和基于知識(shí)圖譜表示學(xué)習(xí)的方法進(jìn)行目標(biāo)預(yù)測(cè)。兩種預(yù)測(cè)方法在預(yù)測(cè)過(guò)程中均未考慮預(yù)測(cè)時(shí)間序列的非平穩(wěn)性[6],導(dǎo)致預(yù)測(cè)結(jié)果存在明顯誤差。針對(duì)這一問(wèn)題,本文提出了基于時(shí)間序列分析法的體育成績(jī)預(yù)測(cè)方法,有效提升預(yù)測(cè)結(jié)果精度。
基于時(shí)間序列分析法的體育成績(jī)預(yù)測(cè)原理框圖見(jiàn)圖1。體育成績(jī)預(yù)測(cè)過(guò)程中,針對(duì)體育成績(jī)時(shí)間序列的非平穩(wěn)性,利用奇異值分解濾波算法(SVDFA)將其劃分成隨機(jī)成分和趨勢(shì)成分。利用GM模型以及PSO-RBFNN(粒子群優(yōu)化—徑向基函數(shù)神經(jīng)網(wǎng)絡(luò))模型分別對(duì)2種成分進(jìn)行預(yù)測(cè),最終融合兩種成分的預(yù)測(cè)結(jié)果,得到體育成績(jī)預(yù)測(cè)結(jié)果。
圖1 體育成績(jī)預(yù)測(cè)原理框圖
SVDFA的主要優(yōu)勢(shì)體現(xiàn)在數(shù)值穩(wěn)定性、降維壓縮性等方面[7]。因此,利用該算法在貯存的體育成績(jī)記錄中優(yōu)選相關(guān)信息時(shí)可獲取較好的數(shù)據(jù)分離和去噪效果。矩陣能量分布情況可體現(xiàn)奇異值大小[8],奇異值對(duì)應(yīng)的成分占據(jù)矩陣的比重隨著奇異值的變化而變化,并在變化中得出體育成績(jī)數(shù)據(jù)的趨勢(shì)信息。若以達(dá)成對(duì)弱信號(hào)的分離和去噪為目的,需運(yùn)用較大的特征值重組數(shù)據(jù)[9]。均值化的貯存體育成績(jī)數(shù)據(jù)序列{A1,A2,…,An}的SVDFA過(guò)程如下。
1.1.1 構(gòu)造矩陣
利用一個(gè)N×h的體育成績(jī)數(shù)據(jù)矩陣描述一組n元數(shù)據(jù)序列:
(1)
式中,N和h分別等于n-h+1和[(n+1)/2],[]表示取整。
1.1.2 奇異值分解
存在正交矩陣U∈RN×N、V∈Rh×h和對(duì)角陣Σ,運(yùn)用奇異值分解體育成績(jī)數(shù)據(jù)序列A可得:
A=UΣVT
(2)
(3)
其中,Δq×q=diag(σ1,σ2,…,σq),σ1,≥σ1,≥…≥σq>0和q=min(N,h)分別為矩陣A奇異值和秩。
1.1.3 門(mén)限控制
將濾波門(mén)限設(shè)定為η(0<η<1),在求解關(guān)于r的方程時(shí)運(yùn)用最小平方和近似矩陣:
(4)
其中,r為正整數(shù),將q-r個(gè)較小的奇異設(shè)0,得出:
(5)
由式(5)可得,Δr×r=diag(σ1,σ2,…,σr)。
1.1.4 濾波輸出
對(duì)矩陣A′=UΣ′VT進(jìn)行重組,運(yùn)用求平均的方法對(duì)A′中時(shí)刻對(duì)應(yīng)元素進(jìn)行運(yùn)算[10],以此得出濾波輸出序列{T1,T2,…,Tn}。
對(duì)已知的體育成績(jī)數(shù)據(jù)序列A(0)={A(0)(1),A(0)(2),…A(0)(n)}中A(0)一次累計(jì)生成,得出生成序列A(1)={A(1)(1),A(1)(2),…A(1)(n)},由此獲取原時(shí)間序列:
(6)
此時(shí)由A(1)構(gòu)造背景值序列Z(1)={Z(1)(2),Z(1)(3),…Z(1)(n)},得出:
Z(1)(k)=a′A(1)(k-1)+(1-a′)A(1)(k)
(7)
其中,k=2,3,…,n,發(fā)展系數(shù)a′=0.5。
若設(shè)定A(1)存在近似指數(shù)變化規(guī)律[11],可得出白化方程為
(8)
對(duì)式(8)進(jìn)行離散化處理,令其由微分改變?yōu)椴榉?,得出GM(1,1)灰微分方程:
A(0)(k)+aZ(1)(k)=i
(9)
由式(9)可知,序列A(0)的增長(zhǎng)速度由發(fā)展系數(shù)a的大小體現(xiàn),灰作用量(內(nèi)生變量)為i。為確定式(9)中參數(shù)a、i,運(yùn)用最小二乘法求解式中參數(shù)a、i。由此可得出A(1)的預(yù)測(cè)公式:
(10)
式中,k=0,1,2,…,n。則預(yù)測(cè)公式A(0)為
(11)
由輸入層、隱含層、輸出層組成的RBFNN是前向神經(jīng)網(wǎng)絡(luò)[12]。隱含層空間構(gòu)建是將徑向基函數(shù)作為隱含層單元的基,以此令數(shù)據(jù)在低維空間內(nèi)的線(xiàn)性不可分轉(zhuǎn)換為高維空間中的線(xiàn)性可分[13]。設(shè)1為RBFNN內(nèi)輸入層和隱含層的連接權(quán)值,隱含層的作用是優(yōu)化激活函數(shù)的參數(shù),輸出層的作用是優(yōu)化連接權(quán)值?;瘮?shù)的中心、隱含層的寬度、隱含層到輸出層的連接權(quán)值是RBFNN需要求解的3個(gè)參數(shù)[14]。RBFNN中常用基函數(shù)是高斯函數(shù),利用式(12)可表示RBFNN的激活函數(shù):
(12)
式中,輸入樣本為xp,p=1,2,3,…,N,樣本總數(shù)為N,隱層網(wǎng)絡(luò)節(jié)點(diǎn)的中心為ci,i=1,2,3,…,H,其中H表示隱含層節(jié)點(diǎn)數(shù)。
利用式(13)可表示神經(jīng)網(wǎng)絡(luò)輸出yp:
(13)
高斯函數(shù)的方差σ可描述隱含層的寬度參數(shù),RBFNN中的難點(diǎn)為隱含層與輸出層權(quán)值的確定,可采用粒子群算法確定。利用粒子群算法確定RBFNN內(nèi)隱含層與輸出層權(quán)值的過(guò)程如圖2所示。
圖2 粒子群訓(xùn)練法
濾波的關(guān)鍵是確定門(mén)限η,以保證隨機(jī)成分穩(wěn)定性為基礎(chǔ),最大限度提升趨勢(shì)成分的平滑性。具體步驟如下:
(1) 以Δη∈(0,0.01]表示較小步長(zhǎng);
(2) 對(duì)濾波門(mén)限η=1-Δη進(jìn)行初始化處理,k=1為循環(huán)次數(shù);
(3) 為了分解序列,運(yùn)用奇異值分解算法,{T1,T2,…,Tn}為趨勢(shì)成分的標(biāo)記,{R1,R2,…,Rn}為隨機(jī)成分標(biāo)記;
(4) 在檢驗(yàn)隨機(jī)成分的平穩(wěn)性時(shí)選取“逆序”法,如{R1,R2,…,Rn}為不平穩(wěn)狀態(tài),則直接轉(zhuǎn)入步驟(6);
(5)k=k+1,η=1-k·Δη,重復(fù)步驟(3)至步驟(5);
(6) 獲取最終選定的濾波門(mén)限η=1-(k-1)·Δη,并輸出該值。
為驗(yàn)證本文所提出的基于時(shí)間序列分析法的體育成績(jī)預(yù)測(cè)方法的適用性,以某體育學(xué)校為研究對(duì)象,對(duì)本文方法進(jìn)行實(shí)例分析。在研究對(duì)象內(nèi)隨機(jī)選取1個(gè)游泳運(yùn)動(dòng)員體育成績(jī)時(shí)間序列進(jìn)行分析,以該體育成績(jī)時(shí)間序列內(nèi)的前50個(gè)成績(jī)數(shù)據(jù)作為樣本序列,利用本文方法中的GM(1,1)模型和PSO-RBFNN模型分別實(shí)施訓(xùn)練,利用后15個(gè)成績(jī)數(shù)據(jù)檢測(cè)本文方法的預(yù)測(cè)性能,預(yù)測(cè)結(jié)果與均方差描述。設(shè)定初始Δη為0.003,在本文方法的濾波門(mén)限算法下獲取η=0.92。利用本文分析獲取體育成績(jī)時(shí)間序列的趨勢(shì)成分和隨機(jī)成分,如圖3所示。
利用本文方法中的GM(1,1)模型和PSO-RBFNN模型分別對(duì)圖3(a)所示的隨機(jī)成分和圖3(b)所示的趨勢(shì)成分進(jìn)行預(yù)測(cè),綜合2個(gè)模型的預(yù)測(cè)結(jié)果,即可得到本文方法的最終預(yù)測(cè)結(jié)果。對(duì)比本文方法所得預(yù)測(cè)結(jié)果與所選體育成績(jī)時(shí)間序列內(nèi)后15個(gè)數(shù)據(jù)間的均方差,結(jié)果如圖4所示。分析圖4得到,本文方法預(yù)測(cè)結(jié)果的均方差控制在1.54×10-5至2.03×10-5之間,誤差均值約為1.78×10-5。實(shí)驗(yàn)結(jié)果充分說(shuō)明本文方法能夠較高地預(yù)測(cè)體育成績(jī)。
(a) 隨機(jī)成分
為進(jìn)一步說(shuō)明本文方法的預(yù)測(cè)性能,用文獻(xiàn)[4]方法和文獻(xiàn)[5]預(yù)測(cè)方法進(jìn)行對(duì)比實(shí)驗(yàn),利用對(duì)比方法對(duì)所選體育成績(jī)時(shí)間序列進(jìn)行分析,預(yù)測(cè)數(shù)據(jù)序列內(nèi)后15個(gè)數(shù)據(jù),所得預(yù)測(cè)結(jié)果的均方差如圖5所示。分析圖5得到,文獻(xiàn)[4]方法和文獻(xiàn)[5]方法2種方法預(yù)測(cè)結(jié)果的均方誤差分別為2.42×10-5和2.08×10-5。雖然文獻(xiàn)[5]方法預(yù)測(cè)結(jié)果的均方差均值低于文獻(xiàn)[4]方法,但文獻(xiàn)[5]方法預(yù)測(cè)結(jié)果的均方差波動(dòng)較為劇烈。對(duì)比圖4和圖5中不同預(yù)測(cè)方法所預(yù)測(cè)結(jié)果的均方差能夠得到,本文方法的預(yù)測(cè)精度顯著優(yōu)于2種對(duì)比方法。
圖4 本文方法預(yù)測(cè)結(jié)果
圖5 對(duì)比方法預(yù)測(cè)結(jié)果
采用本文方法進(jìn)行成績(jī)預(yù)測(cè)過(guò)程中,基于已有數(shù)據(jù)得到不同η值下的預(yù)測(cè)結(jié)果均方差,所得結(jié)果如圖6所示。分析圖6得到,隨著η值的提升,體育成績(jī)預(yù)測(cè)結(jié)果的均方差整體表現(xiàn)為下降趨勢(shì)。在η值低于6的條件下,本文方法預(yù)測(cè)結(jié)果均方差從1.94×10-5下降至1.8×10-5;當(dāng)η值由6提升至11時(shí),本文方法預(yù)測(cè)結(jié)果均方差從1.8×10-5下降至1.74×10-5。在η值高于11的條件下,本文方法預(yù)測(cè)結(jié)果均方差維持在1.74×10-5不變。實(shí)驗(yàn)結(jié)果表明,采用本文方法預(yù)測(cè)體育成績(jī),η取值為11時(shí),本文方法預(yù)測(cè)精度最高。
圖6 不同η值下的預(yù)測(cè)結(jié)果均方差
為了獲得理想的體育成績(jī)預(yù)測(cè)結(jié)果,本文提出了基于時(shí)間序列分析法的體育成績(jī)預(yù)測(cè)方法,分別利用GM模型和PSO-RBFNN模型對(duì)時(shí)間序列數(shù)據(jù)的隨機(jī)成分和趨勢(shì)成分進(jìn)行預(yù)測(cè),綜合預(yù)測(cè)結(jié)果得到最終預(yù)測(cè)結(jié)果,并通過(guò)實(shí)例分析證明了本文方法的可行性。