趙曉寧,張 寧
(遼寧省大數(shù)據(jù)管理中心,遼寧 沈陽 110002)
隨著科技水平的不斷發(fā)展,教育信息化已經(jīng)深入教育教學(xué)的各個(gè)領(lǐng)域,積極開發(fā)并充分應(yīng)用信息技術(shù)和信息資源,能夠促進(jìn)教育的現(xiàn)代化,培養(yǎng)滿足社會(huì)需求的高等人才.教育信息化是現(xiàn)代高校教育管理的基本任務(wù),是實(shí)現(xiàn)教育現(xiàn)代化的必經(jīng)之路.教育管理是現(xiàn)代教育發(fā)展的重要組成部分,教育管理信息化是實(shí)現(xiàn)現(xiàn)代教育的重要技術(shù)手段[1].
高校教育管理的根本任務(wù)就在于保證實(shí)現(xiàn)高等教育的目標(biāo),完成各項(xiàng)教育教學(xué)任務(wù).高校教育管理過程以育人為中心的這一特點(diǎn)要求高校管理者必須科學(xué)地確定培育人才任務(wù)的管理目標(biāo),制訂規(guī)劃和計(jì)劃;把全校教職工組織起來實(shí)施規(guī)劃和計(jì)劃;檢查監(jiān)督計(jì)劃的實(shí)行;總結(jié)工作績(jī)效、評(píng)價(jià)學(xué)生素質(zhì)水平.信息化技術(shù)為現(xiàn)代高校教育管理中的信息收集、過程監(jiān)督和績(jī)效評(píng)估等環(huán)節(jié)提供了工具和手段,在現(xiàn)代高校教育管理中必不可少[2-3].
然而,隨著各種數(shù)字信息的不斷增加,如何有效管理、評(píng)估各種信息化系統(tǒng)(如,學(xué)生信息、教師信息和員工信息等)的優(yōu)劣、讓管理人員依據(jù)使用者需求選擇更適合其高校發(fā)展的信息化系統(tǒng)成為目前亟須解決的問題.本文應(yīng)用神經(jīng)網(wǎng)絡(luò)技術(shù)提出一種服務(wù)系統(tǒng)的評(píng)估方法,用于幫助高校管理人員有效評(píng)估各類信息系統(tǒng).
神經(jīng)網(wǎng)絡(luò)是由大量處理單元互連而成的網(wǎng)絡(luò),是人腦的抽象、簡(jiǎn)化和模擬,反映人腦的基本特性[4-5].一般來說,神經(jīng)元模型應(yīng)具備3個(gè)要素:
(1)一組突觸或連接,用wij表示神經(jīng)元i和神經(jīng)元j之間的連接強(qiáng)度;
(2)反映生物神經(jīng)元時(shí)空整合功能的輸入信號(hào)累加器;
(3)一個(gè)激勵(lì)函數(shù)f(·)用于限制神經(jīng)元輸出,
其中,yi是神經(jīng)元i的輸出,xj是神經(jīng)元j的輸入,bi表示偏差.
一個(gè)信息系統(tǒng)的質(zhì)量往往取決于使用者的行為,因此,度量一個(gè)系統(tǒng)的質(zhì)量維度會(huì)隨著系統(tǒng)的服務(wù)對(duì)象和服務(wù)屬性而變化.信息系統(tǒng)用途和組件的多樣性使它的質(zhì)量控制和改進(jìn)變得更加困難,因此,系統(tǒng)質(zhì)量的評(píng)估維度需要隨著系統(tǒng)變化而改變.在高校教育管理背景下,研究者對(duì)信息系統(tǒng)質(zhì)量評(píng)估指標(biāo)做了一系列研究,基于文獻(xiàn)中信息技術(shù)領(lǐng)域?qū)<业囊庖姾蛯?duì)使用者的調(diào)研,本研究設(shè)計(jì)完成一個(gè)包含43項(xiàng)調(diào)查項(xiàng)目的調(diào)查問卷(部分項(xiàng)目如表1所示).
表1 高校教育管理系統(tǒng)的評(píng)價(jià)指標(biāo)
該項(xiàng)研究選取兩個(gè)高校的計(jì)算機(jī)專業(yè)和非計(jì)算機(jī)專業(yè)師生共計(jì)2 320人進(jìn)行了問卷調(diào)查,收集了2 320條數(shù)據(jù)進(jìn)行數(shù)據(jù)倉庫構(gòu)建.由于數(shù)據(jù)中存在一些問題數(shù)據(jù),因此,必須進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)轉(zhuǎn)換才能滿足評(píng)估分析算法的需要.
在調(diào)查問卷中,一些師生由于某些原因(如未使用過系統(tǒng)某些功能)缺少一些數(shù)據(jù)或數(shù)據(jù)填寫不真實(shí),對(duì)這些不完整的數(shù)據(jù)和噪聲數(shù)據(jù)需要進(jìn)行清理操作.因?yàn)樵肼晹?shù)據(jù)在整個(gè)樣本中所占比例相對(duì)較小,直接采用刪除策略,即直接丟棄.噪聲數(shù)據(jù)清理之后,共包含2 249個(gè)優(yōu)良問卷.在本研究中,這些數(shù)據(jù)被按照4∶6的比例劃分為訓(xùn)練樣本和測(cè)試樣本,經(jīng)過隨機(jī)選擇,選出900條記錄作為訓(xùn)練樣本,1 349條作為測(cè)試樣本.
數(shù)據(jù)的質(zhì)量直接決定了模型的可預(yù)測(cè)性和通用性.因此,數(shù)據(jù)預(yù)處理被定義為使用某些標(biāo)準(zhǔn)方法的一些初步數(shù)據(jù)表征和處理步驟.由于數(shù)據(jù)中不同特征的量綱可能不一致,而且各值之間存在較大的差異,因此本研究首先對(duì)其進(jìn)行了歸一化處理,避免了預(yù)測(cè)結(jié)果存在較大偏差.針對(duì)兩個(gè)樣本集,本研究將各個(gè)屬性的數(shù)據(jù)值均轉(zhuǎn)化到[0,1]范圍內(nèi).
本研究采用RBF神經(jīng)網(wǎng)絡(luò)構(gòu)建高校管理系統(tǒng)的系統(tǒng)評(píng)估模型,該模型共分為4層,包括輸入層、歸一化層、隱藏層和輸出層,系統(tǒng)評(píng)估模型如圖1所示.
圖1 系統(tǒng)評(píng)估模型
首先,依據(jù)測(cè)試數(shù)據(jù)進(jìn)行模型訓(xùn)練,對(duì)模型參數(shù)進(jìn)行初始化;其次,利用Affinity Propagation聚類算法(AP)計(jì)算系統(tǒng)評(píng)估模型的隱藏層節(jié)點(diǎn)數(shù)量,以便找到隱藏層的數(shù)據(jù)中心;最后,在輸出層和隱藏層之間進(jìn)行權(quán)重優(yōu)化,迭代訓(xùn)練隱藏層和輸出層權(quán)重w,當(dāng)誤差滿足模型要求時(shí)建立網(wǎng)絡(luò)參數(shù),完成模型訓(xùn)練.
Affinity Propagation聚類算法是Frey等[6]提出來的一種聚類算法,該算法的主要原理是通過構(gòu)造整個(gè)樣本集的相似度矩陣,并且通過迭代的方法分別計(jì)算出吸引度和歸屬度;然后,通過判斷吸引度與歸屬度的和是否滿足一定的條件去計(jì)算樣本成為類代表點(diǎn)的可能性;最后,直到產(chǎn)生k個(gè)高質(zhì)量的聚類中心將數(shù)據(jù)點(diǎn)分配到相應(yīng)的聚類中.由于該算法具有聚類速度快、準(zhǔn)確性高等特點(diǎn),因此,基于RBF神經(jīng)網(wǎng)絡(luò)構(gòu)建的高校管理系統(tǒng)的評(píng)估模型使用該算法計(jì)算隱藏層節(jié)點(diǎn)數(shù)量,查找隱藏層的數(shù)據(jù)中心.本文所提出的系統(tǒng)評(píng)估模型構(gòu)建算法如下:
輸入:測(cè)試數(shù)據(jù)集V,聚類中心Ac,方差σc
輸出:評(píng)估值R
02.β1=0.98,β2=0.98,ε=0.08,α=0.01;
03.zdW=0,sdW=0,zdb=0,sdb=0,t=0;
04.whileW,b不收斂時(shí),
ifW,b收斂,then break;
end while
06.returnR
在系統(tǒng)評(píng)估模型構(gòu)建算法中,公式
用于計(jì)算隱藏層的隱藏節(jié)點(diǎn)個(gè)數(shù),其中,Vi=(v1,v2,…,vn)表示第i個(gè)測(cè)試樣本;vj表示一個(gè)測(cè)試樣本中的第j個(gè)指標(biāo),一共有n個(gè)指標(biāo);φ表示該模型滿足高斯分布;f表示誤差函數(shù);‖Vi-Ac‖表示向量Vi到聚類中心點(diǎn)Ac的距離;初始化參數(shù)β1、β2為指數(shù)衰減率,初始值均設(shè)為0.98;ε用于避免除數(shù)變?yōu)?;α表示模型的學(xué)習(xí)率;z表示梯度更新的指數(shù)移動(dòng)均值;s表示梯度方差.
這里,利用動(dòng)量算法的更新思想:
zdW=β1zdW+(1-β1)dW,
zdb=β1zdb+(1-β1)db,
sdW=β2sdW+(1-β2)(dW)2,
sdb=β2sdb+(1-β2)(db)2.
其中,W=(w1,w2,…,wm)是m個(gè)權(quán)重向量;dW表示成本函數(shù),是對(duì)權(quán)重W的更新;db表示成本函數(shù),是對(duì)閾值b的更新.因?yàn)檫@些移動(dòng)均值初始化為0向量,所以會(huì)導(dǎo)致z偏向于0,特別是訓(xùn)練期間.因此,本研究利用偏差修正估計(jì)來解決訓(xùn)練初期問題,令
最后,通過公式
和
更新梯度參數(shù),使模型從梯度均值及梯度平方兩個(gè)角度進(jìn)行自適應(yīng)的調(diào)節(jié),同時(shí)起到一定的退火作用.
在公式
中,Ri表示整個(gè)模型得到的最終估計(jì)值,隱藏層和輸出層之間的權(quán)重用W表示,wc是從第c個(gè)隱節(jié)點(diǎn)連接到輸出節(jié)點(diǎn)的相應(yīng)權(quán)重.
利用系統(tǒng)評(píng)估模型構(gòu)建算法將系統(tǒng)評(píng)估模型中的參數(shù)值確定后,整個(gè)模型構(gòu)建完成.下一步利用測(cè)試樣本對(duì)整個(gè)評(píng)估系統(tǒng)的性能進(jìn)行測(cè)試、分析.
為驗(yàn)證所提出的高校教育管理系統(tǒng)評(píng)估模型的有效性,本研究設(shè)置了相應(yīng)的實(shí)驗(yàn)環(huán)境,硬件平臺(tái)中央處理器為8核、主頻2.60 GHz,內(nèi)存為8 G,系統(tǒng)平臺(tái)為Windows10,開發(fā)環(huán)境為Python 3.7,使用Tensorflow 1.10.0和Matlab R2019b 學(xué)習(xí)框架.
通過收集、整理的包含2 320條數(shù)據(jù)的數(shù)據(jù)集構(gòu)建和測(cè)試所提出的高校教育管理系統(tǒng)評(píng)估模型,其中隨機(jī)選取900條數(shù)據(jù)作為訓(xùn)練樣本,1 349條作為測(cè)試樣本.根據(jù)評(píng)估結(jié)果對(duì)模型進(jìn)行驗(yàn)證,可以較直觀地說明模型的有效性,實(shí)驗(yàn)使用均方根誤差RMSE和平均絕對(duì)誤差MAE來評(píng)估提出的方法.
這里,
通過將1 349條測(cè)試數(shù)據(jù)放入構(gòu)建好的模型中進(jìn)行計(jì)算評(píng)估,并與測(cè)試樣本的實(shí)際值進(jìn)行比較分析,評(píng)估的平均準(zhǔn)確率達(dá)到83.07%,評(píng)估準(zhǔn)確度符合預(yù)期目標(biāo).
信息化時(shí)代下我國高等教育管理在不斷朝著信息化、智能化發(fā)展.高校教育管理系統(tǒng)已經(jīng)成為現(xiàn)代高校管理必不可少的技術(shù)手段.高校教育管理系統(tǒng)應(yīng)盡可能地滿足使用者的專業(yè)化、個(gè)性化需求,如何有效評(píng)估管理系統(tǒng)的實(shí)用性和專業(yè)性成為目前高校管理者的迫切需求.通過構(gòu)建一個(gè)有效、專業(yè)的評(píng)估體系和評(píng)估模型,能夠幫助高校教育管理者提高工作效率和服務(wù)水平,為高等教育發(fā)展做出貢獻(xiàn).