張岑
【摘要】實現(xiàn)教育教學(xué)過程中對教師教學(xué)水平公正、準(zhǔn)確、快速地評價,是學(xué)校實施現(xiàn)代化教學(xué)管理的重要前提,傳統(tǒng)的教學(xué)評價方法存在著主觀性大、精準(zhǔn)度差操作復(fù)雜等問題。本文提出了基于支持向量機的數(shù)據(jù)挖掘算法與學(xué)校教師的評價指標(biāo)相結(jié)合的改進方案,利用SVM對樣本數(shù)據(jù)進行分類,通過在評價系統(tǒng)中對樣本數(shù)據(jù)的訓(xùn)練形成訓(xùn)練模型,并進一步利用該模型完成對預(yù)測數(shù)據(jù)的職能分析和評測。實驗證明,同傳統(tǒng)方法相比,方案具有綜合性能優(yōu)勢及應(yīng)用價值。
【關(guān)鍵詞】教學(xué)評價SVM懲罰因子核函數(shù)
【中圖分類號】G71 【文獻標(biāo)識碼】A 【文章編號】2095-3089(2014)03-0024-02
教育教學(xué)系統(tǒng)的評估已經(jīng)成為了國內(nèi)外學(xué)者的研究熱點。針對教師綜合教學(xué)的評價體系有了快速發(fā)展,而目前大多的研究主要基于傳統(tǒng)的數(shù)據(jù)統(tǒng)計方法,復(fù)雜的評估參數(shù)及繁重的計算方法無法滿足當(dāng)今科學(xué)測量、評價的發(fā)展需求。支持向量機通過把非線性分類問題轉(zhuǎn)換成線性分類問題,較好解決了傳統(tǒng)算法中訓(xùn)練集誤差最小而測試集誤差仍較大的問題,且算法具有較高的效率和精度,目前在分類和回歸模型中被廣泛應(yīng)用。提出一種基于SVM的教學(xué)評價模型,充分利用機器學(xué)習(xí)方法的分類優(yōu)勢,訓(xùn)練SVM智能、準(zhǔn)確反映教師的教學(xué)水平。
1.SVM學(xué)習(xí)算法
SVM從線性可分情況下的最優(yōu)分類面發(fā)展而來:假設(shè)訓(xùn)練樣本輸入為xi(i = 1,2,……n),期望輸出yi∈{+1,-1},超平面ωxi+b =0需滿足約束條件yi(ωxi+b)-1≥0)以實現(xiàn)樣本的正確分類。使最大化分類間隔2/||ω||獲得最小值的分類面即為最優(yōu)分類面,滿足|(ωxi)+b|=1的樣本點為支持向量。對于非線性的情況,可以將非線性變化轉(zhuǎn)化為另一個高維特征空間的線性問題,然后在這個高維空間中求最優(yōu)分類面,其分類函數(shù)為f(x)=sgn(ωx+b)=sgn(■a■■yiK(xix)+b■■)。
表1 精確度隨γ值的變化情況表
2.基于數(shù)據(jù)挖掘技術(shù)的教學(xué)評價
2.1評價系統(tǒng)指標(biāo)標(biāo)準(zhǔn)化
教學(xué)系統(tǒng)評價為多層次、多指標(biāo)的問題[3,4],本文建立了12個評價指標(biāo),即每個樣本數(shù)據(jù)的特征向量共有12個屬性。281個樣本數(shù)據(jù)來自于對教師教學(xué)質(zhì)量的隨機調(diào)查評分,并分為3個等級。按SVM指定格式對各指標(biāo)進行歸一化處理,使數(shù)據(jù)范圍為[-1,1]。選取200個數(shù)據(jù)作為訓(xùn)練樣本,其余作測試樣本,然后調(diào)用SVM分類器進行評價。標(biāo)準(zhǔn)化過程如下:
Function normal = normalization(x, kind)
if margin < 2
Kind = 2;% kind = 1 or 2 for the first class or second class of normalized
End
[m,n] = size(x);
Normal = zeros (m, n);
%% normalize the data x to [0,1]
if kind == 1
for i = 1:m
ma = max( x(i,:) );
mi = min( x(i,:) )
normal(i,:) = ( x(i,:)-mi )./( ma-mi );
end
end
2.2核函數(shù)選擇與參數(shù)確定
圖1給出了3種核函數(shù)在相同γ值條件下,精確度隨C值變化的對比曲線。隨著C值的增加3種核函數(shù)的精確度隨之增長,然而當(dāng)懲罰因子到達某一特定值時,算法精準(zhǔn)度增加緩慢或出現(xiàn)停滯,因此最終確定實驗中的核函數(shù)為RBF,懲罰因子C=27。γ是影響精確度的重要參數(shù),表1中的實驗結(jié)果顯示精確度在γ∈[0.01,0.09]時,隨著γ值的連續(xù)增長有所提高,在γ=0.0833(1/n)時獲得最大值94.3529%。
2.3基于SVM的訓(xùn)練
提取數(shù)據(jù)庫中其余的樣本數(shù)據(jù),采用SVM Predict對訓(xùn)練結(jié)果進行驗證以獲得較好的匹配比率。實現(xiàn)代碼如下:
load training_scale;
data = training_scale_inst;
label = training_scale_label;
% Build classification model
model = svmtrain (label, data, ' -s 0 -t 2 -c 27 -g
0.0833');
model = Parameters: [5x1 double]
nr_class: 3
totalSV: 281
rho: 0.4951
Label: [3x1 double]
ProbA: []
ProbB: []
SVM: [3x1 double]
sv_coef: [281x1 double]
SVS: [281x12 double]
通過調(diào)用database、配置文件中的參數(shù)及事先構(gòu)造的二類分類器對錄入數(shù)據(jù)進行訓(xùn)練和評價。根據(jù)評價所得結(jié)果判斷,如果某個類別擁有的同一數(shù)據(jù)較多,則認為該數(shù)據(jù)屬于這一類別。如出現(xiàn)不確定結(jié)果,則由人工評價結(jié)果繼續(xù)進行判斷對比,或重新采集數(shù)據(jù)樣本并訓(xùn)練,直至獲得匹配率較高的訓(xùn)練機,得到符合要求的準(zhǔn)確結(jié)果。
3.實驗分析與結(jié)論
實驗中加入了PLSR模型和神經(jīng)網(wǎng)絡(luò)模型,與SVM模型一起進行預(yù)測結(jié)果與實際值的誤差測試,如圖2所示。同時考察3種算法的耗時指標(biāo),結(jié)果如圖3所示。
圖2 模型最終預(yù)測結(jié)果
實驗結(jié)論為:基于PLSR的預(yù)測效果最差,平均超過實際值在5%以上,該算法求解時的迭代運算也造成了相當(dāng)?shù)臅r間消耗。SVM和神經(jīng)網(wǎng)絡(luò)模型的預(yù)測誤差相對令人滿意,平均誤差均控制在3%以下,但是神經(jīng)網(wǎng)絡(luò)模型的求解算法過于復(fù)雜,其耗時分別達到了SVM的15倍及PLSR的90倍。而SVM拓撲結(jié)構(gòu)相對簡單,通常只由幾個支持向量決定,提高了運算速度。
圖3 預(yù)測結(jié)果耗時對比
4.結(jié)語
教學(xué)質(zhì)量與各評價指標(biāo)之間定量的非線性函數(shù)關(guān)系難以顯示表達,影響了教學(xué)評價的公平性和準(zhǔn)確性?;赟VM的模型具有逼近任意非線性輸入輸出關(guān)系的能力,具有訓(xùn)練樣本量少,預(yù)測精度高,學(xué)習(xí)性強等特點。訓(xùn)練后的SVM評價模型可以代替?zhèn)鹘y(tǒng)的基于主觀的評價機制,有助于提高教師教學(xué)能力和學(xué)校整體的教學(xué)水平。
參考文獻:
[1]王沖林,高齊圣.高等學(xué)校教師教學(xué)質(zhì)量的統(tǒng)計評價方法研究[J].教學(xué)研究,2008,5:33-35.
[2]徐高歡.SVM在教師教學(xué)質(zhì)量評價中的應(yīng)用[J].浙江水利水電專科學(xué)校學(xué)報,2007,3(19):66-68.
endprint
【摘要】實現(xiàn)教育教學(xué)過程中對教師教學(xué)水平公正、準(zhǔn)確、快速地評價,是學(xué)校實施現(xiàn)代化教學(xué)管理的重要前提,傳統(tǒng)的教學(xué)評價方法存在著主觀性大、精準(zhǔn)度差操作復(fù)雜等問題。本文提出了基于支持向量機的數(shù)據(jù)挖掘算法與學(xué)校教師的評價指標(biāo)相結(jié)合的改進方案,利用SVM對樣本數(shù)據(jù)進行分類,通過在評價系統(tǒng)中對樣本數(shù)據(jù)的訓(xùn)練形成訓(xùn)練模型,并進一步利用該模型完成對預(yù)測數(shù)據(jù)的職能分析和評測。實驗證明,同傳統(tǒng)方法相比,方案具有綜合性能優(yōu)勢及應(yīng)用價值。
【關(guān)鍵詞】教學(xué)評價SVM懲罰因子核函數(shù)
【中圖分類號】G71 【文獻標(biāo)識碼】A 【文章編號】2095-3089(2014)03-0024-02
教育教學(xué)系統(tǒng)的評估已經(jīng)成為了國內(nèi)外學(xué)者的研究熱點。針對教師綜合教學(xué)的評價體系有了快速發(fā)展,而目前大多的研究主要基于傳統(tǒng)的數(shù)據(jù)統(tǒng)計方法,復(fù)雜的評估參數(shù)及繁重的計算方法無法滿足當(dāng)今科學(xué)測量、評價的發(fā)展需求。支持向量機通過把非線性分類問題轉(zhuǎn)換成線性分類問題,較好解決了傳統(tǒng)算法中訓(xùn)練集誤差最小而測試集誤差仍較大的問題,且算法具有較高的效率和精度,目前在分類和回歸模型中被廣泛應(yīng)用。提出一種基于SVM的教學(xué)評價模型,充分利用機器學(xué)習(xí)方法的分類優(yōu)勢,訓(xùn)練SVM智能、準(zhǔn)確反映教師的教學(xué)水平。
1.SVM學(xué)習(xí)算法
SVM從線性可分情況下的最優(yōu)分類面發(fā)展而來:假設(shè)訓(xùn)練樣本輸入為xi(i = 1,2,……n),期望輸出yi∈{+1,-1},超平面ωxi+b =0需滿足約束條件yi(ωxi+b)-1≥0)以實現(xiàn)樣本的正確分類。使最大化分類間隔2/||ω||獲得最小值的分類面即為最優(yōu)分類面,滿足|(ωxi)+b|=1的樣本點為支持向量。對于非線性的情況,可以將非線性變化轉(zhuǎn)化為另一個高維特征空間的線性問題,然后在這個高維空間中求最優(yōu)分類面,其分類函數(shù)為f(x)=sgn(ωx+b)=sgn(■a■■yiK(xix)+b■■)。
表1 精確度隨γ值的變化情況表
2.基于數(shù)據(jù)挖掘技術(shù)的教學(xué)評價
2.1評價系統(tǒng)指標(biāo)標(biāo)準(zhǔn)化
教學(xué)系統(tǒng)評價為多層次、多指標(biāo)的問題[3,4],本文建立了12個評價指標(biāo),即每個樣本數(shù)據(jù)的特征向量共有12個屬性。281個樣本數(shù)據(jù)來自于對教師教學(xué)質(zhì)量的隨機調(diào)查評分,并分為3個等級。按SVM指定格式對各指標(biāo)進行歸一化處理,使數(shù)據(jù)范圍為[-1,1]。選取200個數(shù)據(jù)作為訓(xùn)練樣本,其余作測試樣本,然后調(diào)用SVM分類器進行評價。標(biāo)準(zhǔn)化過程如下:
Function normal = normalization(x, kind)
if margin < 2
Kind = 2;% kind = 1 or 2 for the first class or second class of normalized
End
[m,n] = size(x);
Normal = zeros (m, n);
%% normalize the data x to [0,1]
if kind == 1
for i = 1:m
ma = max( x(i,:) );
mi = min( x(i,:) )
normal(i,:) = ( x(i,:)-mi )./( ma-mi );
end
end
2.2核函數(shù)選擇與參數(shù)確定
圖1給出了3種核函數(shù)在相同γ值條件下,精確度隨C值變化的對比曲線。隨著C值的增加3種核函數(shù)的精確度隨之增長,然而當(dāng)懲罰因子到達某一特定值時,算法精準(zhǔn)度增加緩慢或出現(xiàn)停滯,因此最終確定實驗中的核函數(shù)為RBF,懲罰因子C=27。γ是影響精確度的重要參數(shù),表1中的實驗結(jié)果顯示精確度在γ∈[0.01,0.09]時,隨著γ值的連續(xù)增長有所提高,在γ=0.0833(1/n)時獲得最大值94.3529%。
2.3基于SVM的訓(xùn)練
提取數(shù)據(jù)庫中其余的樣本數(shù)據(jù),采用SVM Predict對訓(xùn)練結(jié)果進行驗證以獲得較好的匹配比率。實現(xiàn)代碼如下:
load training_scale;
data = training_scale_inst;
label = training_scale_label;
% Build classification model
model = svmtrain (label, data, ' -s 0 -t 2 -c 27 -g
0.0833');
model = Parameters: [5x1 double]
nr_class: 3
totalSV: 281
rho: 0.4951
Label: [3x1 double]
ProbA: []
ProbB: []
SVM: [3x1 double]
sv_coef: [281x1 double]
SVS: [281x12 double]
通過調(diào)用database、配置文件中的參數(shù)及事先構(gòu)造的二類分類器對錄入數(shù)據(jù)進行訓(xùn)練和評價。根據(jù)評價所得結(jié)果判斷,如果某個類別擁有的同一數(shù)據(jù)較多,則認為該數(shù)據(jù)屬于這一類別。如出現(xiàn)不確定結(jié)果,則由人工評價結(jié)果繼續(xù)進行判斷對比,或重新采集數(shù)據(jù)樣本并訓(xùn)練,直至獲得匹配率較高的訓(xùn)練機,得到符合要求的準(zhǔn)確結(jié)果。
3.實驗分析與結(jié)論
實驗中加入了PLSR模型和神經(jīng)網(wǎng)絡(luò)模型,與SVM模型一起進行預(yù)測結(jié)果與實際值的誤差測試,如圖2所示。同時考察3種算法的耗時指標(biāo),結(jié)果如圖3所示。
圖2 模型最終預(yù)測結(jié)果
實驗結(jié)論為:基于PLSR的預(yù)測效果最差,平均超過實際值在5%以上,該算法求解時的迭代運算也造成了相當(dāng)?shù)臅r間消耗。SVM和神經(jīng)網(wǎng)絡(luò)模型的預(yù)測誤差相對令人滿意,平均誤差均控制在3%以下,但是神經(jīng)網(wǎng)絡(luò)模型的求解算法過于復(fù)雜,其耗時分別達到了SVM的15倍及PLSR的90倍。而SVM拓撲結(jié)構(gòu)相對簡單,通常只由幾個支持向量決定,提高了運算速度。
圖3 預(yù)測結(jié)果耗時對比
4.結(jié)語
教學(xué)質(zhì)量與各評價指標(biāo)之間定量的非線性函數(shù)關(guān)系難以顯示表達,影響了教學(xué)評價的公平性和準(zhǔn)確性?;赟VM的模型具有逼近任意非線性輸入輸出關(guān)系的能力,具有訓(xùn)練樣本量少,預(yù)測精度高,學(xué)習(xí)性強等特點。訓(xùn)練后的SVM評價模型可以代替?zhèn)鹘y(tǒng)的基于主觀的評價機制,有助于提高教師教學(xué)能力和學(xué)校整體的教學(xué)水平。
參考文獻:
[1]王沖林,高齊圣.高等學(xué)校教師教學(xué)質(zhì)量的統(tǒng)計評價方法研究[J].教學(xué)研究,2008,5:33-35.
[2]徐高歡.SVM在教師教學(xué)質(zhì)量評價中的應(yīng)用[J].浙江水利水電專科學(xué)校學(xué)報,2007,3(19):66-68.
endprint
【摘要】實現(xiàn)教育教學(xué)過程中對教師教學(xué)水平公正、準(zhǔn)確、快速地評價,是學(xué)校實施現(xiàn)代化教學(xué)管理的重要前提,傳統(tǒng)的教學(xué)評價方法存在著主觀性大、精準(zhǔn)度差操作復(fù)雜等問題。本文提出了基于支持向量機的數(shù)據(jù)挖掘算法與學(xué)校教師的評價指標(biāo)相結(jié)合的改進方案,利用SVM對樣本數(shù)據(jù)進行分類,通過在評價系統(tǒng)中對樣本數(shù)據(jù)的訓(xùn)練形成訓(xùn)練模型,并進一步利用該模型完成對預(yù)測數(shù)據(jù)的職能分析和評測。實驗證明,同傳統(tǒng)方法相比,方案具有綜合性能優(yōu)勢及應(yīng)用價值。
【關(guān)鍵詞】教學(xué)評價SVM懲罰因子核函數(shù)
【中圖分類號】G71 【文獻標(biāo)識碼】A 【文章編號】2095-3089(2014)03-0024-02
教育教學(xué)系統(tǒng)的評估已經(jīng)成為了國內(nèi)外學(xué)者的研究熱點。針對教師綜合教學(xué)的評價體系有了快速發(fā)展,而目前大多的研究主要基于傳統(tǒng)的數(shù)據(jù)統(tǒng)計方法,復(fù)雜的評估參數(shù)及繁重的計算方法無法滿足當(dāng)今科學(xué)測量、評價的發(fā)展需求。支持向量機通過把非線性分類問題轉(zhuǎn)換成線性分類問題,較好解決了傳統(tǒng)算法中訓(xùn)練集誤差最小而測試集誤差仍較大的問題,且算法具有較高的效率和精度,目前在分類和回歸模型中被廣泛應(yīng)用。提出一種基于SVM的教學(xué)評價模型,充分利用機器學(xué)習(xí)方法的分類優(yōu)勢,訓(xùn)練SVM智能、準(zhǔn)確反映教師的教學(xué)水平。
1.SVM學(xué)習(xí)算法
SVM從線性可分情況下的最優(yōu)分類面發(fā)展而來:假設(shè)訓(xùn)練樣本輸入為xi(i = 1,2,……n),期望輸出yi∈{+1,-1},超平面ωxi+b =0需滿足約束條件yi(ωxi+b)-1≥0)以實現(xiàn)樣本的正確分類。使最大化分類間隔2/||ω||獲得最小值的分類面即為最優(yōu)分類面,滿足|(ωxi)+b|=1的樣本點為支持向量。對于非線性的情況,可以將非線性變化轉(zhuǎn)化為另一個高維特征空間的線性問題,然后在這個高維空間中求最優(yōu)分類面,其分類函數(shù)為f(x)=sgn(ωx+b)=sgn(■a■■yiK(xix)+b■■)。
表1 精確度隨γ值的變化情況表
2.基于數(shù)據(jù)挖掘技術(shù)的教學(xué)評價
2.1評價系統(tǒng)指標(biāo)標(biāo)準(zhǔn)化
教學(xué)系統(tǒng)評價為多層次、多指標(biāo)的問題[3,4],本文建立了12個評價指標(biāo),即每個樣本數(shù)據(jù)的特征向量共有12個屬性。281個樣本數(shù)據(jù)來自于對教師教學(xué)質(zhì)量的隨機調(diào)查評分,并分為3個等級。按SVM指定格式對各指標(biāo)進行歸一化處理,使數(shù)據(jù)范圍為[-1,1]。選取200個數(shù)據(jù)作為訓(xùn)練樣本,其余作測試樣本,然后調(diào)用SVM分類器進行評價。標(biāo)準(zhǔn)化過程如下:
Function normal = normalization(x, kind)
if margin < 2
Kind = 2;% kind = 1 or 2 for the first class or second class of normalized
End
[m,n] = size(x);
Normal = zeros (m, n);
%% normalize the data x to [0,1]
if kind == 1
for i = 1:m
ma = max( x(i,:) );
mi = min( x(i,:) )
normal(i,:) = ( x(i,:)-mi )./( ma-mi );
end
end
2.2核函數(shù)選擇與參數(shù)確定
圖1給出了3種核函數(shù)在相同γ值條件下,精確度隨C值變化的對比曲線。隨著C值的增加3種核函數(shù)的精確度隨之增長,然而當(dāng)懲罰因子到達某一特定值時,算法精準(zhǔn)度增加緩慢或出現(xiàn)停滯,因此最終確定實驗中的核函數(shù)為RBF,懲罰因子C=27。γ是影響精確度的重要參數(shù),表1中的實驗結(jié)果顯示精確度在γ∈[0.01,0.09]時,隨著γ值的連續(xù)增長有所提高,在γ=0.0833(1/n)時獲得最大值94.3529%。
2.3基于SVM的訓(xùn)練
提取數(shù)據(jù)庫中其余的樣本數(shù)據(jù),采用SVM Predict對訓(xùn)練結(jié)果進行驗證以獲得較好的匹配比率。實現(xiàn)代碼如下:
load training_scale;
data = training_scale_inst;
label = training_scale_label;
% Build classification model
model = svmtrain (label, data, ' -s 0 -t 2 -c 27 -g
0.0833');
model = Parameters: [5x1 double]
nr_class: 3
totalSV: 281
rho: 0.4951
Label: [3x1 double]
ProbA: []
ProbB: []
SVM: [3x1 double]
sv_coef: [281x1 double]
SVS: [281x12 double]
通過調(diào)用database、配置文件中的參數(shù)及事先構(gòu)造的二類分類器對錄入數(shù)據(jù)進行訓(xùn)練和評價。根據(jù)評價所得結(jié)果判斷,如果某個類別擁有的同一數(shù)據(jù)較多,則認為該數(shù)據(jù)屬于這一類別。如出現(xiàn)不確定結(jié)果,則由人工評價結(jié)果繼續(xù)進行判斷對比,或重新采集數(shù)據(jù)樣本并訓(xùn)練,直至獲得匹配率較高的訓(xùn)練機,得到符合要求的準(zhǔn)確結(jié)果。
3.實驗分析與結(jié)論
實驗中加入了PLSR模型和神經(jīng)網(wǎng)絡(luò)模型,與SVM模型一起進行預(yù)測結(jié)果與實際值的誤差測試,如圖2所示。同時考察3種算法的耗時指標(biāo),結(jié)果如圖3所示。
圖2 模型最終預(yù)測結(jié)果
實驗結(jié)論為:基于PLSR的預(yù)測效果最差,平均超過實際值在5%以上,該算法求解時的迭代運算也造成了相當(dāng)?shù)臅r間消耗。SVM和神經(jīng)網(wǎng)絡(luò)模型的預(yù)測誤差相對令人滿意,平均誤差均控制在3%以下,但是神經(jīng)網(wǎng)絡(luò)模型的求解算法過于復(fù)雜,其耗時分別達到了SVM的15倍及PLSR的90倍。而SVM拓撲結(jié)構(gòu)相對簡單,通常只由幾個支持向量決定,提高了運算速度。
圖3 預(yù)測結(jié)果耗時對比
4.結(jié)語
教學(xué)質(zhì)量與各評價指標(biāo)之間定量的非線性函數(shù)關(guān)系難以顯示表達,影響了教學(xué)評價的公平性和準(zhǔn)確性?;赟VM的模型具有逼近任意非線性輸入輸出關(guān)系的能力,具有訓(xùn)練樣本量少,預(yù)測精度高,學(xué)習(xí)性強等特點。訓(xùn)練后的SVM評價模型可以代替?zhèn)鹘y(tǒng)的基于主觀的評價機制,有助于提高教師教學(xué)能力和學(xué)校整體的教學(xué)水平。
參考文獻:
[1]王沖林,高齊圣.高等學(xué)校教師教學(xué)質(zhì)量的統(tǒng)計評價方法研究[J].教學(xué)研究,2008,5:33-35.
[2]徐高歡.SVM在教師教學(xué)質(zhì)量評價中的應(yīng)用[J].浙江水利水電??茖W(xué)校學(xué)報,2007,3(19):66-68.
endprint