萬(wàn)梅芬
摘要:高等教育的發(fā)展以及教育質(zhì)量的高低,與教學(xué)評(píng)價(jià)有著密切的聯(lián)系。但是這些十分重要的數(shù)據(jù)在實(shí)際的教學(xué)管理過(guò)程中并沒(méi)有被充分的利用。該文主要闡述的是在教學(xué)領(lǐng)域中引人數(shù)據(jù)挖掘,并對(duì)一系列的教學(xué)數(shù)據(jù)進(jìn)行分析從中提取出,從而促進(jìn)教學(xué)管理服務(wù)的進(jìn)一步提高。
關(guān)鍵詞:數(shù)據(jù)挖掘;教學(xué)評(píng)價(jià)
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)29-0012-02
雖然高等院校經(jīng)過(guò)多年的教學(xué)實(shí)踐已經(jīng)積累了很多教學(xué)管理的數(shù)據(jù),但是對(duì)這些數(shù)據(jù)的利用還只是停留在分析表面信息的階段,而且教師的評(píng)優(yōu)評(píng)先也是以此為依據(jù)的。然而實(shí)際上,有很多重要的信息都隱藏在這些數(shù)據(jù)中。所以,怎樣深入的利用這些數(shù)據(jù),并將其轉(zhuǎn)化為可以為學(xué)校管理者提供決策支持的信息,是目前教學(xué)領(lǐng)域中急需解決的問(wèn)題。
1數(shù)據(jù)挖掘概述
人們通常數(shù)據(jù)挖掘(Data Mining)稱(chēng)為數(shù)據(jù)的開(kāi)采,以全新的角度將相關(guān)的技術(shù)領(lǐng)域緊密結(jié)合是其建立的主要基礎(chǔ),而在這其中則主要包含了數(shù)據(jù)庫(kù)技術(shù)、知識(shí)發(fā)現(xiàn)技術(shù)(KDD技術(shù))、數(shù)據(jù)統(tǒng)計(jì)技術(shù)等。將相關(guān)的數(shù)據(jù)通過(guò)數(shù)據(jù)庫(kù)進(jìn)行搜索,同時(shí)對(duì)搜索出的數(shù)據(jù)進(jìn)行深入的挖掘分析后,對(duì)其中利用價(jià)值以及具備潛在利用價(jià)值的進(jìn)行存儲(chǔ),這樣對(duì)數(shù)據(jù)進(jìn)行挖掘以及高級(jí)處理就是數(shù)據(jù)挖掘主要的工作原理。而數(shù)據(jù)挖掘則可以從以下兩個(gè)方面進(jìn)行詳細(xì)的解釋?zhuān)菏紫?,在淺層次上。在進(jìn)行數(shù)據(jù)挖掘時(shí)可以充分的利用數(shù)據(jù)庫(kù)管理系統(tǒng)的數(shù)據(jù)查詢(xún)功能、數(shù)據(jù)探索功能以及數(shù)據(jù)報(bào)表功能等,進(jìn)相關(guān)數(shù)據(jù)分析的結(jié)合使用,其中通常會(huì)應(yīng)用多維數(shù)據(jù)分析法和數(shù)據(jù)統(tǒng)計(jì)分析法,進(jìn)行聯(lián)機(jī)數(shù)據(jù)分析的處理,從而獲得所需要的相關(guān)參考數(shù)據(jù)。其次在深層次上。其主要的目的是將在數(shù)據(jù)庫(kù)中隱蔽性極強(qiáng)的數(shù)據(jù)探索出來(lái)。在針對(duì)高校數(shù)據(jù)的挖掘和索取時(shí)應(yīng)用這一方法,不但可以將更加全面的參考數(shù)據(jù)提供給人們,同時(shí)也實(shí)現(xiàn)了對(duì)相關(guān)數(shù)據(jù)的科學(xué)合理的應(yīng)用。
2數(shù)據(jù)挖掘方法
2.1傳統(tǒng)統(tǒng)計(jì)分析方法
傳統(tǒng)的統(tǒng)計(jì)分析方法主要有:判別分析、回歸分析、聚類(lèi)分析、探索分析以及支持量分析等幾方面的數(shù)據(jù)分析。而先由用戶提供所需要假設(shè)的相關(guān)數(shù)據(jù),而后再通過(guò)系統(tǒng)對(duì)相關(guān)的參數(shù)進(jìn)行數(shù)據(jù)驗(yàn)證,就是傳統(tǒng)的統(tǒng)計(jì)分析的主要原理。而且傳統(tǒng)的統(tǒng)計(jì)分析方法自身存在的弊端也相對(duì)較多,比如相關(guān)的數(shù)據(jù)必須經(jīng)過(guò)驗(yàn)證之后才能進(jìn)行使用,而且為了確保數(shù)據(jù)探索時(shí)的真實(shí)性,需要用戶不斷地進(jìn)行操作。而在廣泛應(yīng)用的統(tǒng)計(jì)學(xué)理論中,支撐矢量機(jī)(SVM)就是人們探索出的新型的學(xué)習(xí)方法,其主要是以風(fēng)險(xiǎn)相對(duì)較小的計(jì)算學(xué)習(xí)理論結(jié)構(gòu)為基礎(chǔ)的,其目的是為了推動(dòng)學(xué)習(xí)機(jī)的廣泛應(yīng)用能力。
2.2機(jī)器學(xué)習(xí)方法
歸納學(xué)習(xí)法、以范例為推理基礎(chǔ)的方法以及貝葉斯網(wǎng)絡(luò)方法等是機(jī)器學(xué)習(xí)方法最常用的三種方法。以范例為推理基礎(chǔ)的方法其主要的原理就是利用實(shí)驗(yàn)的方式對(duì)已經(jīng)制定的問(wèn)題進(jìn)行解答。就目前的情況而言,將范例推理和最近鄰原理相結(jié)合是我國(guó)機(jī)器學(xué)習(xí)法研究和探索的主要方向。另外,一多關(guān)聯(lián)規(guī)則為基礎(chǔ)的分類(lèi)算法也是效率相對(duì)較高且適應(yīng)功能較強(qiáng)的機(jī)器學(xué)習(xí)法。
2.3數(shù)據(jù)庫(kù)方法
數(shù)據(jù)庫(kù)方法主要有以可視化多維數(shù)據(jù)分析為基礎(chǔ)的方法、OLAP方法以及面向?qū)傩缘臍w納方法等三種方法。
3數(shù)據(jù)挖掘在教學(xué)評(píng)價(jià)中的應(yīng)用
按照一定的教學(xué)規(guī)范標(biāo)準(zhǔn)和教學(xué)目標(biāo),對(duì)學(xué)院教育學(xué)的相關(guān)情況進(jìn)行系統(tǒng)的檢測(cè)與考核是教學(xué)評(píng)價(jià)的主要依據(jù),同時(shí)根據(jù)教學(xué)效果和教學(xué)目標(biāo)實(shí)現(xiàn)的程度,對(duì)其進(jìn)行相應(yīng)的改進(jìn)。
3.1數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)準(zhǔn)備包括數(shù)據(jù)選擇和數(shù)據(jù)預(yù)處理。1)數(shù)據(jù)選擇。確定最終的任務(wù)對(duì)象并根據(jù)相關(guān)用戶的需要,提取原始數(shù)據(jù)庫(kù)的數(shù)據(jù)形成實(shí)際的目標(biāo)數(shù)據(jù)就是數(shù)據(jù)選擇的最終目的。一般情況下教師的工號(hào)、職稱(chēng)、學(xué)歷、年齡以及教齡等基本信息都是從院校的教務(wù)系統(tǒng)中提取的,相關(guān)數(shù)據(jù)提取完成之后再提取最終的評(píng)價(jià)數(shù)據(jù)。2)數(shù)據(jù)預(yù)處理。去除噪聲、缺失值以及刪除一些無(wú)效的數(shù)據(jù)就是數(shù)據(jù)處理的主要內(nèi)容。比如,如果學(xué)生對(duì)教師評(píng)價(jià)時(shí)出現(xiàn)了極端的0分或者100分的話,就必須對(duì)這些數(shù)據(jù)進(jìn)行相應(yīng)的處理。此外,如果因?yàn)閷W(xué)生的學(xué)號(hào)或者班級(jí)號(hào)等內(nèi)容出現(xiàn)了缺失,而造成的缺失值可以對(duì)其予以忽略;一旦造成最終評(píng)價(jià)結(jié)果的缺失,那么就必須對(duì)相關(guān)的數(shù)據(jù)及時(shí)的進(jìn)行處理。
3.2數(shù)據(jù)挖掘
將已經(jīng)獲得的所有的數(shù)據(jù)進(jìn)行挖掘就是我們所說(shuō)的數(shù)據(jù)挖掘。1)內(nèi)部挖掘。當(dāng)前,學(xué)生評(píng)價(jià)是高校教學(xué)評(píng)價(jià)體系的主體,其主要是針對(duì)教師水平、教學(xué)內(nèi)容、教學(xué)態(tài)度以及教學(xué)模式進(jìn)行評(píng)價(jià),經(jīng)過(guò)對(duì)學(xué)生評(píng)價(jià)數(shù)據(jù)中的相關(guān)指標(biāo)進(jìn)行挖掘分析,就可以將其在的關(guān)鍵指標(biāo)明確。2)內(nèi)部與外部特征之間的關(guān)聯(lián)規(guī)則挖掘。通過(guò)采用關(guān)聯(lián)規(guī)則,實(shí)現(xiàn)了對(duì)學(xué)生評(píng)價(jià)數(shù)據(jù)和教師基本信息的掌握,而對(duì)高校教師的教學(xué)效果、教師的學(xué)歷、年齡以及支撐等數(shù)據(jù)之間關(guān)系的研究,可以將挖掘過(guò)程主要分為以下三步:第一,數(shù)據(jù)準(zhǔn)備。通過(guò)隨機(jī)抽取某高校的500份學(xué)生評(píng)教數(shù)據(jù),并將職稱(chēng)、年齡以及評(píng)教分?jǐn)?shù)等相關(guān)的數(shù)據(jù)信息調(diào)入數(shù)據(jù)庫(kù)。一般情況下評(píng)定分?jǐn)?shù)以及年齡都屬于數(shù)值型數(shù)據(jù),而職稱(chēng)則為文本型數(shù)據(jù),那么就可以將這些數(shù)據(jù)先轉(zhuǎn)換為布爾型,然后再進(jìn)行相關(guān)數(shù)據(jù)的離散處理,并對(duì)評(píng)定分?jǐn)?shù)和年齡進(jìn)行分組,例如將年齡分為M1[24,29],M2[30,39],M3[40,49],M4[50,60]四組;評(píng)定分?jǐn)?shù)分為N1[90,100],N2[80,89],N3[60,79],N4[0,59]四組;將職稱(chēng)的級(jí)別分為G1初級(jí),G2中級(jí),G3副高,G4t高。從而實(shí)現(xiàn)了在數(shù)據(jù)準(zhǔn)備的階段就奠定了以上三者之間的關(guān)系基礎(chǔ)。第二,關(guān)聯(lián)規(guī)則挖掘。如果所獲得的評(píng)定分?jǐn)?shù)為[90,100],那么就證明其課堂效果相對(duì)較好,同過(guò)挖掘技術(shù)以及關(guān)聯(lián)規(guī)則算法的應(yīng)用,可以及時(shí)的發(fā)現(xiàn)并掌握教師課堂效果的基本信息。第三,模式評(píng)估,就是對(duì)關(guān)聯(lián)規(guī)則信息進(jìn)行初步的挖掘。例如表1是某高校應(yīng)用B/S結(jié)構(gòu),經(jīng)過(guò)對(duì)原始的數(shù)據(jù)片段進(jìn)行網(wǎng)上評(píng)教,得出實(shí)際的數(shù)據(jù),表2是教師基本情況。
其中SID是學(xué)生編號(hào),TID是教師編號(hào),CID是課程編號(hào),--I是各種評(píng)教指標(biāo),J是總評(píng),數(shù)字代表對(duì)應(yīng)的分?jǐn)?shù)。這里以表1中的B列指標(biāo)為例,建立關(guān)聯(lián)函數(shù)。
按照上面所講述的關(guān)聯(lián)函數(shù)的相關(guān)內(nèi)容,就可以很容易的計(jì)算出教師學(xué)生評(píng)教的平均分?jǐn)?shù)為89,而這項(xiàng)指標(biāo)的平均分?jǐn)?shù)為10,總分?jǐn)?shù)應(yīng)該為15,而對(duì)其中影響較大關(guān)鍵因素的百分比必須至少達(dá)到a=9%,則x=10/89=11%,b=15/89=17%,X0=<9%,11%>,X=<0,17%>代入關(guān)聯(lián)函數(shù),得f(x)=0.48>0,這樣也就進(jìn)一步證明了這項(xiàng)指標(biāo)對(duì)教學(xué)評(píng)價(jià)所帶來(lái)的影響。然后,將相關(guān)的重要因素與教師的基本信息進(jìn)行關(guān)聯(lián)。同時(shí)將職稱(chēng)、年齡以及評(píng)教分?jǐn)?shù)存入相應(yīng)的數(shù)據(jù)庫(kù),并將其轉(zhuǎn)化為布爾型-引。通過(guò)對(duì)相關(guān)數(shù)據(jù)庫(kù)的搜索,發(fā)現(xiàn)在所有的數(shù)據(jù)中一共有5條大魚(yú)或者等于90的評(píng)定分?jǐn)?shù),如果將其最小支持度設(shè)定為5%,那么其最小的可信度就是18%,經(jīng)過(guò)這樣的數(shù)據(jù)挖掘,可以看出實(shí)際年齡M2[30,39]所取得的評(píng)定分?jǐn)?shù)為Nl[90,100]的可能性是36%,支持度是9%”,“職稱(chēng)為G2中級(jí),評(píng)定分?jǐn)?shù)為N1[90,100]的可能性是27%,支持度是10%”初步結(jié)果。最后再利用相關(guān)的模式評(píng)估,通過(guò)進(jìn)一步挖掘發(fā)現(xiàn)31-49歲年齡段的教師其課堂教學(xué)的經(jīng)驗(yàn)十分的豐富,而且其所獲得的支持度和可信度也相對(duì)較高,這些都為高校的管理部門(mén)提供了重要的決策支持,對(duì)于可續(xù)合理的安排和調(diào)配師資資源為學(xué)生服務(wù)具有極大的幫助。
4結(jié)束語(yǔ)
在高校教學(xué)評(píng)價(jià)中充分利用數(shù)據(jù)挖掘,有效地促進(jìn)了高校獲取有用信息能力的提升。本文主要是以學(xué)評(píng)教信息和教師的基本信息為基礎(chǔ),詳細(xì)地闡述了如何挖掘內(nèi)部與外部關(guān)聯(lián)性知識(shí)的辦法。目的是為了促進(jìn)數(shù)據(jù)挖掘在教學(xué)領(lǐng)域的進(jìn)一步應(yīng)用,并為以后的繼續(xù)研究奠定基礎(chǔ),同時(shí)也將挖掘方法計(jì)算機(jī)化作為了今后研究的重點(diǎn)。