国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于ID3決策樹算法的高職教學(xué)評(píng)價(jià)分析

2021-11-28 02:53:05陳瀟瀟
電腦知識(shí)與技術(shù) 2021年28期
關(guān)鍵詞:決策支持決策樹教學(xué)評(píng)價(jià)

陳瀟瀟

摘要:學(xué)校每學(xué)期都要積累大量的教學(xué)評(píng)價(jià)信息,但對教學(xué)評(píng)價(jià)數(shù)據(jù)的處理主要停留在數(shù)值計(jì)算,沒有深入挖掘數(shù)據(jù)背后的邏輯關(guān)系。該文使用數(shù)據(jù)挖掘算法——ID3決策樹算法,分析高職教學(xué)評(píng)價(jià)與教師年齡、職稱、學(xué)位的關(guān)聯(lián),挖掘出有價(jià)值的信息,為教學(xué)管理部門提供決策支持,更好地提升教學(xué)質(zhì)量。

關(guān)鍵詞:教學(xué)評(píng)價(jià);數(shù)據(jù)挖掘;決策樹;決策支持;教學(xué)質(zhì)量

中圖分類號(hào):TP311? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2021)28-0199-02

開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

教學(xué)評(píng)價(jià)是指在一定教育價(jià)值觀的指導(dǎo)下,依據(jù)確立的教學(xué)目標(biāo),使用一定的技術(shù)和方法,對所實(shí)施的各種教學(xué)活動(dòng)、教學(xué)過程和教學(xué)結(jié)果進(jìn)行科學(xué)判定的過程。教學(xué)評(píng)價(jià)一般包括教學(xué)過程中教師、學(xué)生、教學(xué)內(nèi)容、教學(xué)方法手段、教學(xué)環(huán)境、教學(xué)管理等因素的評(píng)價(jià)。參考高職的課程類別,可將教學(xué)評(píng)價(jià)分為:理論教學(xué)評(píng)價(jià)、實(shí)踐教學(xué)評(píng)價(jià)、理實(shí)一體化教學(xué)評(píng)價(jià)。理論教學(xué)評(píng)價(jià)項(xiàng)目[1]包括:講課水平、教學(xué)態(tài)度、外語及新技術(shù)滲透、學(xué)生到課率、聽課檢查結(jié)果、學(xué)生評(píng)教結(jié)果、課堂互動(dòng)、期末成績等。實(shí)踐教學(xué)評(píng)價(jià)項(xiàng)目[1]包括:方案及準(zhǔn)備、操作及說明、總結(jié)及報(bào)告、考核及鑒定等?!袄韺?shí)一體化”課程的特點(diǎn)為:在人才培養(yǎng)中注重理論教學(xué)與實(shí)踐教學(xué)的深度融合,通過理論與實(shí)踐的相互促進(jìn)提高學(xué)生的專業(yè)綜合能力和實(shí)踐能力,現(xiàn)已成為當(dāng)前應(yīng)用型高校人才培養(yǎng)的一個(gè)發(fā)展趨向[2-4]。根據(jù)其特點(diǎn),理實(shí)一體化教學(xué)評(píng)價(jià)項(xiàng)目[1]包括:教學(xué)設(shè)計(jì)、教學(xué)準(zhǔn)備、講課水平、教學(xué)態(tài)度、外語、新技術(shù)滲透、學(xué)生到課率、課堂互動(dòng)、教學(xué)任務(wù)完成情況、考核等。

傳統(tǒng)的處理教學(xué)評(píng)價(jià)數(shù)據(jù)的方法多采取數(shù)值計(jì)算。包括“點(diǎn)估計(jì)法”“等差增值法”“算術(shù)平均值法”“加權(quán)平均值法”[5]。為了讓不同學(xué)科評(píng)價(jià)具有可比性,霍本瑤等[6]提出了模糊綜合評(píng)價(jià)法。但隨著教學(xué)評(píng)價(jià)數(shù)據(jù)的日益增多,教學(xué)評(píng)價(jià)數(shù)據(jù)已逐漸呈現(xiàn)出大數(shù)據(jù)3V[7]的現(xiàn)象。不管是過程數(shù)據(jù)還是結(jié)果數(shù)據(jù)都已達(dá)到了一定的容量,院校雖有處理數(shù)據(jù),但缺乏動(dòng)態(tài)地整合和梳理過程。因此,蘊(yùn)含在數(shù)據(jù)中的規(guī)律無法發(fā)揮潛在的價(jià)值,而數(shù)據(jù)挖掘技術(shù)的出現(xiàn)解決了這一難題。

數(shù)據(jù)挖掘(Data Mining),是一門在大數(shù)據(jù)背景下應(yīng)運(yùn)而生的學(xué)科。數(shù)據(jù)挖掘是基于數(shù)據(jù)庫技術(shù)、可視化技術(shù)、人工智能技術(shù)、可視化技術(shù)等演變而來,通過對大量的、多維度的數(shù)據(jù)進(jìn)行計(jì)算,從而揭示數(shù)據(jù)間潛在的關(guān)聯(lián)關(guān)系,為決策者提供決策支持。數(shù)據(jù)挖掘技術(shù),包括關(guān)聯(lián)規(guī)則挖掘、K-Means聚類分析、貝葉斯分類分析、人工神經(jīng)網(wǎng)絡(luò)分析、決策樹分類分析等。近年來,這些數(shù)據(jù)挖掘技術(shù),在教學(xué)評(píng)價(jià)上的研究也日益廣泛。研究通常是在深入研究數(shù)據(jù)挖掘理論和教學(xué)評(píng)價(jià)體系建構(gòu)的基礎(chǔ)上,設(shè)計(jì)挖掘算法模型的框架,針對運(yùn)用教學(xué)評(píng)價(jià)過程中積累的大量評(píng)教數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘。

李橋[8]等使用關(guān)聯(lián)規(guī)則Apriori算法,對編號(hào)、年齡、性別、職稱、學(xué)歷和評(píng)定分?jǐn)?shù)六項(xiàng)輸入樣本進(jìn)行規(guī)則挖掘,最后得出年齡在36~49歲,職稱為副教授,具有研究生學(xué)歷的教師教學(xué)效果好。董萍[9]使用K-Means算法,對教學(xué)評(píng)價(jià)結(jié)果進(jìn)行聚類分析,并將聚類結(jié)果分為四類:優(yōu)、良、中、差,反映出了不同資質(zhì)的老師在教學(xué)質(zhì)量上的差距。趙萬芹[10]等使用BP神經(jīng)網(wǎng)絡(luò)對教學(xué)質(zhì)量進(jìn)行了分析,文章中提到的訓(xùn)練輸入數(shù)據(jù)由“主觀評(píng)價(jià)體系”“教學(xué)評(píng)價(jià)體系”組成,預(yù)期輸出數(shù)據(jù)由線性加權(quán)法求得,實(shí)際輸出數(shù)據(jù)由BP神經(jīng)網(wǎng)絡(luò)模型得出,實(shí)際輸出與預(yù)期輸出的誤差率較小,證實(shí)了使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行教學(xué)評(píng)價(jià)的可行性。

本文通過使用ID3決策樹算法,發(fā)現(xiàn)影響教師教學(xué)的因素,為教師提高教學(xué)水平和教學(xué)質(zhì)量提供決策依據(jù),為高職學(xué)校教學(xué)管理提供趨勢性、可操作性、有價(jià)值的建議和措施,推動(dòng)高職教育內(nèi)涵式發(fā)展。

1 ID3決策樹算法思想

在構(gòu)建決策樹前,首先介紹兩個(gè)重要的術(shù)語:熵和信息增益。熵是對隨機(jī)變量不確定性的一種度量。如果變量的不確定性越高,則熵值越高;如果變量越穩(wěn)定,則熵值越低。在決策樹分類任務(wù)中,通常希望分類后變量的熵值較低,即分類效果純度較高。信息增益則是衡量熵值下降的程度。例如,原始熵值為20,做完一個(gè)決策之后,熵值變?yōu)?,則信息增益就是20減8等于12。通常情況下,信息增益越大,熵的減小量越大,決策樹的節(jié)點(diǎn)就趨向于更純。在建立決策樹的時(shí)候,會(huì)選擇這兩個(gè)特征進(jìn)行遍歷,通過計(jì)算熵值,選取使得信息增益值最大的特征,這個(gè)特征將優(yōu)先作為決策樹的節(jié)點(diǎn),依次類推,最終將形成決策樹。

設(shè)[S]是訓(xùn)練樣本集,它包括[n]個(gè)類別的樣本,這些類別分別用[C1]、[C2][…][Cn]表示,那么[S]的熵或者期望信息為:

[entropy(S)=-i=0npilog2pi]? ? ? ? ? ? ? ? ? ? ? ? (1)

其中,[pi]表示類[Ci]的概率。

設(shè)屬性[A]將[S]劃分成[m]份,根據(jù)[A]劃分的子集的熵或期望信息由下式給出:

[entropy(S,A)=i=0mSiSentropy(Si)]? ? ? ? ? ? ? ? ? (2)

其中,[Si]表示根據(jù)屬性[A]劃分的[S]的第[i]個(gè)子集;[S]和[Si]分別表示[S]和[Si]中的樣本書數(shù)目。信息增益用來衡量熵的期望減少值,因此,使用屬性[A]對[S]進(jìn)行劃分獲得的信息增益為:

[gain(S,A)=entropy(S)-entropy(S,A)]? ? ? ? ? ? ? ? ? ?(3)

[gain(S,A)]是指因?yàn)橹缹傩訹A]的值后導(dǎo)致的熵的期望壓縮。

2 實(shí)驗(yàn)過程與結(jié)果分析

實(shí)驗(yàn)流程參照一般的數(shù)據(jù)挖掘過程:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、規(guī)律尋找、規(guī)律展示四個(gè)步驟。如圖1所示,為本實(shí)驗(yàn)的流程。

2.1 數(shù)據(jù)采集與預(yù)處理

數(shù)據(jù)采集是根據(jù)任務(wù)目的,選取數(shù)據(jù)集。通過前期調(diào)研,收集到了某校100位老師的教學(xué)評(píng)價(jià)信息。信息包括4個(gè)維度:教師年齡、教師職稱、教師學(xué)歷、教學(xué)評(píng)價(jià)分?jǐn)?shù)。前三個(gè)維值度作為輸入特征數(shù)據(jù),最后一個(gè)維度的值作為輸出標(biāo)簽數(shù)據(jù)。

數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、數(shù)據(jù)規(guī)約、數(shù)據(jù)變換、數(shù)據(jù)集成。獲取存有教師年齡、職稱、學(xué)歷、學(xué)評(píng)教分?jǐn)?shù)的Excel表data1。為方便后續(xù)過程的處理,將教師年齡在35歲及以下的設(shè)置為“青年教師”,特征值標(biāo)記為“young”,其余情況標(biāo)記為“old”。針對學(xué)評(píng)教分?jǐn)?shù)85分以下的情況,將標(biāo)簽值為“l(fā)ow”,85分及以上標(biāo)簽值為“high”。表1展示了處理后的部分教師評(píng)價(jià)信息。

2.2 尋找規(guī)律

尋找規(guī)律。尋找規(guī)律的目的是采用某種方法把數(shù)據(jù)集里面的規(guī)律找出來,實(shí)驗(yàn)使用Python編程語言實(shí)現(xiàn)ID3決策樹算法。

步驟一:導(dǎo)數(shù)據(jù)。使用pandas庫中“read_excel”函數(shù)將data1數(shù)據(jù)導(dǎo)入程序中。

步驟二:數(shù)據(jù)轉(zhuǎn)換。先將年齡、職稱、學(xué)歷特征下的數(shù)據(jù)轉(zhuǎn)換為字典類型,然后使用DictVectorizer函數(shù)對數(shù)據(jù)進(jìn)行特征抽取和向量化,使得特征值最終變?yōu)椤?”或“1”。代碼如下所示。

x=x.to_dict(orient="records")? ? ? ? ? ? ? ?(代碼1)

transfer=DictVectorizer()? ? ? ? ? ? ? ? ? ? ? (代碼2)

x=transfer.fit_transform(x)? ? ? ? ? ? ? ? ? ?(代碼3)

步驟三:設(shè)計(jì)決策樹。決策樹使用的策略是“熵”,層數(shù)為3層。代碼如下所示。

estimator=DecisionTreeClassifier(criterion='entropy',max_depth=3)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (代碼4)

步驟四:實(shí)現(xiàn)模型訓(xùn)練。調(diào)用fit函數(shù),將輸入特征向量與輸出標(biāo)簽作為它的參數(shù)。最終得到estimator決策樹模型。代碼如下所示。

estimator.fit(x,y)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(代碼5)

2.3 規(guī)律展示

規(guī)律展示是盡可能采用用戶可理解的方式將數(shù)據(jù)規(guī)律展示出來,例如圖形圖表方式。實(shí)驗(yàn)中,使用export_graphviz函數(shù)將決策樹模型以dot形式輸出,并在cmd客戶端將dot文件轉(zhuǎn)換為png文件,從而以可視化的方式展示規(guī)律。代碼如下,最終得到的決策樹模型如圖2所示。

dot -Tpng C:\Users\Desktop\allElectronicsData.dot -o example.png? (代碼6)

由決策樹的根節(jié)點(diǎn)可以得出:value值左側(cè)數(shù)據(jù)代表得分為high的樣本數(shù)量,右側(cè)數(shù)據(jù)代表得分為low的樣本數(shù)量。在決策樹的第二層,有熵值為0的葉子節(jié)點(diǎn)。此葉子節(jié)點(diǎn)反映的信息為:年輕的,學(xué)位不是博士學(xué)位的老師,學(xué)評(píng)教分?jǐn)?shù)較低。這是因?yàn)?,年輕的教師剛接觸工作崗位,不管在教學(xué)方法還是科研領(lǐng)域,都缺乏一定的經(jīng)驗(yàn)。學(xué)校教務(wù)管理部門、人力資源部門,可以為每位青年教師配備一名導(dǎo)師進(jìn)行教學(xué)指導(dǎo),并定期開展青年教師說課大賽,舉辦教學(xué)、科研講座,組織青年教師參與培訓(xùn),提升青年教師在教學(xué)、科研方面的業(yè)務(wù)能力。

隨著人工智能與大數(shù)據(jù)技術(shù)的發(fā)展,大學(xué)教學(xué)內(nèi)容的科學(xué)性逐步加強(qiáng),跨學(xué)科內(nèi)容增多,尤其對于一些新興前沿的知識(shí),更需要扎實(shí)的學(xué)術(shù)背景。擁有高學(xué)歷的教師,具有較高的科研水平,在運(yùn)用合理的教學(xué)方法的同時(shí),可以帶領(lǐng)學(xué)生進(jìn)行知識(shí)的鉆研,指導(dǎo)學(xué)生進(jìn)行科學(xué)探究,提升了課堂學(xué)習(xí)的積極性。這也是高學(xué)歷教師教學(xué)評(píng)價(jià)分?jǐn)?shù)較高的原因。

3 結(jié)語

本文詳細(xì)介紹了用ID3決策樹算法分析教學(xué)評(píng)價(jià)的過程。同時(shí)對挖掘過程進(jìn)行了分析,找出影響教學(xué)評(píng)價(jià)的因素,真正實(shí)現(xiàn)了“以評(píng)促學(xué)、以評(píng)促教”,教學(xué)相長,提高教學(xué)質(zhì)量的目的,為教學(xué)改革提供了重要的參考價(jià)值。數(shù)據(jù)挖掘算法是一個(gè)很有前景的領(lǐng)域,未來勢必在教育管理方面發(fā)揮出更深遠(yuǎn)的影響。

參考文獻(xiàn):

[1] 賈文雅.數(shù)據(jù)挖掘在高職教學(xué)質(zhì)量評(píng)價(jià)體系構(gòu)建中的研究與應(yīng)用[M].長春:吉林科學(xué)技術(shù)出版社, 2019:209-211.

[2] 施曉秋,徐贏穎.工程教育認(rèn)證與產(chǎn)教融合共同驅(qū)動(dòng)的人才培養(yǎng)體系建設(shè)[J].高等工程教育研究,2019(2):33-56.

[3] 鄒心遙.創(chuàng)新能力導(dǎo)向的高職理實(shí)一體化實(shí)訓(xùn)室建設(shè)[J].實(shí)驗(yàn)室研究與探索,2017,36(4):225-228.

[4] 王昌輝.高職院校理實(shí)一體化教育及其課程教學(xué)質(zhì)量評(píng)價(jià)體系研究[J].教育理論與實(shí)踐,2015,35(33):28-30.

[5] 李榮英. 高職高專教學(xué)評(píng)價(jià)數(shù)據(jù)處理方法探討[J]. 教育與職業(yè), 2006(30):178-180.

[6] 霍本瑤, 郝艷莉.高職教師課堂教學(xué)質(zhì)量評(píng)價(jià)的現(xiàn)狀及對策[J]. 職教論壇, 2009(14):56-57.

[7] 中央政府門戶網(wǎng)站.國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知[EB/OL].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm,2015-09-05.

[8] 李橋, 陽春華. 關(guān)聯(lián)規(guī)則Apriori算法在教學(xué)評(píng)價(jià)中的應(yīng)用[J]. 計(jì)算機(jī)與數(shù)字工程, 2010(6):49-51.

[9] 董萍. 聚類分析在教學(xué)評(píng)價(jià)中的應(yīng)用[J]. 湖南工程學(xué)院學(xué)報(bào)(自然科學(xué)版), 2010(1):74-77.

[10] 趙萬芹, 孔令超. 基于BP神經(jīng)網(wǎng)絡(luò)的教學(xué)質(zhì)量評(píng)價(jià)的探討[J]. 化工高等教育, 2011(1):101-105.

【通聯(lián)編輯:李雅琪】

猜你喜歡
決策支持決策樹教學(xué)評(píng)價(jià)
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
商業(yè)智能分析模式在醫(yī)保病人住院化管理當(dāng)中的應(yīng)用研究
信息技術(shù)—Internet實(shí)用教程教學(xué)設(shè)計(jì)的思考與實(shí)踐
對農(nóng)村小學(xué)數(shù)學(xué)課堂教學(xué)評(píng)價(jià)的認(rèn)識(shí)和看法
考試周刊(2016年85期)2016-11-11 01:23:32
網(wǎng)絡(luò)環(huán)境下高職英語課程多維度評(píng)價(jià)方式研究
小學(xué)數(shù)學(xué)“反思型” 教學(xué)的探索與實(shí)踐
考試周刊(2016年76期)2016-10-09 09:08:16
建立跨區(qū)域、多維度、品種一體化預(yù)算管控體系
秦山核電應(yīng)急決策支持系統(tǒng)開發(fā)與研究
科技視界(2016年15期)2016-06-30 00:32:07
基于決策樹的出租車乘客出行目的識(shí)別
奈曼旗| 丹阳市| 五大连池市| 临夏县| 房产| 沧州市| 奉化市| 康平县| 巨野县| 手游| 潼南县| 怀宁县| 镇巴县| 木兰县| 鄯善县| 兴化市| 和林格尔县| 五峰| 前郭尔| 仁怀市| 疏勒县| 抚顺县| 大埔区| 日土县| 通榆县| 蚌埠市| 大庆市| 墨脱县| 姜堰市| 花莲市| 浪卡子县| 江阴市| 赤水市| 鄯善县| 三明市| 龙胜| 页游| 古田县| 邻水| 凤翔县| 于都县|