苗維誠
(蚌埠醫(yī)學(xué)院 數(shù)理教研室,安徽 蚌埠 233030)
C4.5算法在提高物理實(shí)驗(yàn)教學(xué)效果中的應(yīng)用
苗維誠
(蚌埠醫(yī)學(xué)院 數(shù)理教研室,安徽 蚌埠 233030)
針對醫(yī)用物理學(xué)實(shí)驗(yàn)課的教學(xué)現(xiàn)狀進(jìn)行了問卷調(diào)查,應(yīng)用決策樹C4.5算法對問卷的數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)影響教學(xué)效果的關(guān)鍵因素、建立決策樹模型,為實(shí)驗(yàn)教學(xué)的改革提供思路和參考.
物理實(shí)驗(yàn);問卷調(diào)查;數(shù)據(jù)挖掘;教學(xué)改革
蚌埠醫(yī)學(xué)院開設(shè)醫(yī)用物理學(xué)實(shí)驗(yàn)課程,每年實(shí)驗(yàn)課時數(shù)1000余學(xué)時.為了切實(shí)提高學(xué)生的實(shí)驗(yàn)水平和科學(xué)素養(yǎng),將C4.5算法應(yīng)用在提高醫(yī)用物理學(xué)實(shí)驗(yàn)教學(xué)效果的研究中,為教學(xué)改革提供參考[1].
設(shè)D是類標(biāo)記元組訓(xùn)練集,類標(biāo)號屬性具有m個不同值,m 個不同類 C(i=1,2,…,m),CiD 是 D 中 C 類的元組的集合,|D|和|CiD|分別是D和CD中的元組個數(shù).對D中的元組分類所需的期望信息記為Info(D),也叫作D的熵,公式為:
假定按照屬性A劃分D中的元組,且屬性A將D劃分成v個不同的類,還需要計(jì)算D關(guān)于屬性A的熵EntropyA(D).
原來的信息需求與新需求之間的差定義為信息增益Gain(A),即:
將D劃分成對應(yīng)于屬性A測試的v個輸出的v個劃分產(chǎn)生的信息,這個值記為SplitInfoA(D),公式為:
信息增益率(GainRatio)是C4.5算法的分枝準(zhǔn)則,它選擇具有最高信息增益的屬性來作為節(jié)點(diǎn)N的分裂屬性[2].公式為:
2.1.1 問卷調(diào)查與分析.數(shù)據(jù)挖掘的原始數(shù)據(jù)來自《醫(yī)用物理學(xué)教學(xué)效果調(diào)查問卷》,問卷調(diào)查的對象為2016級臨床醫(yī)學(xué)專業(yè)的學(xué)生,共收回有效問卷296份,調(diào)查結(jié)果具有較強(qiáng)的代表性.(1)Q1對物理實(shí)驗(yàn)是否感興趣?選擇“感興趣”占30%;“一般”占42%;“不感興趣”占28%.Q2實(shí)驗(yàn)課的學(xué)習(xí)目標(biāo)是?選擇“掌握實(shí)驗(yàn)技能,提高綜合素質(zhì)”占25%;“應(yīng)付課程考試”占60%;“沒有目標(biāo)”占15%.由Q1、Q2看到,對物理實(shí)驗(yàn)課不反感的學(xué)生占到了70%以上,但是有明確學(xué)習(xí)目標(biāo)的學(xué)生只有25%,大多數(shù)學(xué)生對于為什么要學(xué)習(xí)物理實(shí)驗(yàn)并不清楚.由此把“學(xué)習(xí)目的”作為一個關(guān)鍵因素.(2)Q3上實(shí)驗(yàn)課前您預(yù)習(xí)嗎?選擇“經(jīng)常預(yù)習(xí)”占42%;“偶爾預(yù)習(xí)”占37%;“不預(yù)習(xí)”占21%.Q4若預(yù)習(xí),所花時間為?選擇“10分鐘之內(nèi)”占22%;“20分鐘左右”占42%;“30分鐘以上”占36%.由Q3、Q4看到,大約40%的學(xué)生有按時預(yù)習(xí)的習(xí)慣,進(jìn)一步調(diào)研發(fā)現(xiàn),每次預(yù)習(xí)時間都在20分鐘以上的學(xué)生大約只占總?cè)藬?shù)的30%.這里把經(jīng)常預(yù)習(xí)且時間大于20分鐘的學(xué)生歸為“認(rèn)真預(yù)習(xí)”,把“認(rèn)真預(yù)習(xí)”作為一個關(guān)鍵因素.(3)Q5您認(rèn)為在實(shí)驗(yàn)課的學(xué)習(xí)過程中,以下哪個因素對您幫助最大?選擇“實(shí)驗(yàn)教材”占16%;“教師的講解”占75%;“同學(xué)的幫助”占9%.由Q5看到,老師對學(xué)生的學(xué)習(xí)效果起到了決定因素.根據(jù)調(diào)查問卷和學(xué)校對教師教學(xué)評價中學(xué)生評價的數(shù)據(jù),把“教學(xué)評價”作為一個關(guān)鍵因素.(4)Q6您在實(shí)驗(yàn)過程中,有沒有遇到過問題?選擇“經(jīng)常遇到”占76%;“偶然遇到”占18%;“沒有遇到”占6%.Q7若實(shí)驗(yàn)過程中出現(xiàn)問題,您的做法是?選擇“獨(dú)立解決”占37%;“同學(xué)幫助”占27%;“立即向老師報(bào)告”占36%.由Q6、Q7看到,在實(shí)驗(yàn)過程中遇到問題,只有37%的學(xué)生有獨(dú)立解決問題的意識,大部分學(xué)生面對困難總想找別人解決,自己的思維能力、實(shí)踐能力得不到鍛煉.這里把“實(shí)驗(yàn)操作”作為一個關(guān)鍵因素.
2.1.2 數(shù)據(jù)預(yù)處理.通過分析問卷,已經(jīng)提取出C4.5算法的四個決策屬性:“學(xué)習(xí)目的”“認(rèn)真預(yù)習(xí)”“教學(xué)評價”和“實(shí)驗(yàn)操作”.我們把學(xué)習(xí)目的分為“明確”和“不明確”兩類;認(rèn)真預(yù)習(xí)分為“是”和“否”;教學(xué)評價分為“優(yōu)”和“一般”;實(shí)驗(yàn)操作分為“好”和“不好”.根據(jù)調(diào)查問卷、學(xué)生實(shí)驗(yàn)報(bào)告和期末成績,三者的數(shù)據(jù)結(jié)合起來分析,得出實(shí)驗(yàn)課教學(xué)效果的情況,把教學(xué)效果分為“好”和“一般”.對數(shù)據(jù)進(jìn)行處理共獲得296條有效數(shù)據(jù),將數(shù)據(jù)分為兩部分:訓(xùn)練數(shù)據(jù)集220條,測試數(shù)據(jù)集76條.
首先計(jì)算樣本分類所需的期望信息量,即熵值.訓(xùn)練數(shù)據(jù)集220條數(shù)據(jù),教學(xué)效果好的有66條,一般的有154條;
由公式①得:
然后計(jì)算每一個決策屬性的信息增益率.
(1)屬性“學(xué)習(xí)目的”,由訓(xùn)練集得,學(xué)習(xí)目的=“明確”有55條,其中50條教學(xué)效果好,5條教學(xué)效果不好.
學(xué)習(xí)目的=“不明確”有165條,其中16條教學(xué)效果好,149條教學(xué)效果不好;
由公式②計(jì)算其熵值為:
由公式③計(jì)算其信息增益為:
由公式④計(jì)算分裂信息:
最終公式⑤計(jì)算:
(2)屬性“認(rèn)真預(yù)習(xí)”,認(rèn)真預(yù)習(xí)=“是”有72條,其中46條教學(xué)效果好,26條教學(xué)效果不好;認(rèn)真預(yù)習(xí)=“否”有148條,其中20條教學(xué)效果好,128條教學(xué)效果不好.
(3)屬性“教學(xué)評價”,教學(xué)評價=“優(yōu)”有93條,其中51條教學(xué)效果好,42條教學(xué)效果不好;教學(xué)評價=“一般”有127條,其中15條教學(xué)效果好,112條教學(xué)效果不好.
(4)屬性“實(shí)驗(yàn)操作”,實(shí)驗(yàn)操作=“好”有61條,其中49條教學(xué)效果好,12條教學(xué)效果不好;實(shí)驗(yàn)操作=“不好”有159條,其中17條教學(xué)效果好,142條教學(xué)效果不好.
由上面計(jì)算出的每個決策屬性信息增益率的值,來確定決策樹的根結(jié)點(diǎn),生成決策樹,再對決策樹進(jìn)行剪枝.剪枝采用自下而上的方式,最后生成一棵教學(xué)效果決策樹[5].
從決策樹可以得到分類規(guī)則如下:
IF學(xué)習(xí)目的=“明確”AND實(shí)驗(yàn)操作=“好”THEN教學(xué)效果=“好”;IF學(xué)習(xí)目的=“明確”AND實(shí)驗(yàn)操作=“不好”THEN教學(xué)效果=“一般”;IF學(xué)習(xí)目的=“不明確”AND實(shí)驗(yàn)操作=“好”AND認(rèn)真預(yù)習(xí)=“是”THEN教學(xué)效果=“好”;IF學(xué)習(xí)目的=“不明確”AND實(shí)驗(yàn)操作=“好”AND認(rèn)真預(yù)習(xí)=“否”AND教學(xué)評價=“優(yōu)”THEN教學(xué)效果=“好”;IF學(xué)習(xí)目的=“不明確”AND實(shí)驗(yàn)操作=“好”AND認(rèn)真預(yù)習(xí)=“否”AND教學(xué)評價=“一般”THEN教學(xué)效果=“一般”.
IF學(xué)習(xí)目的=“不明確”AND實(shí)驗(yàn)操作=“不好”AND認(rèn)真預(yù)習(xí)=“是”AND教學(xué)評價=“優(yōu)”THEN教學(xué)效果=“好”;IF學(xué)習(xí)目的=“不明確”AND實(shí)驗(yàn)操作=“不好”AND認(rèn)真預(yù)習(xí)=“是”AND教學(xué)評價=“一般”THEN教學(xué)效果=“一般”;IF學(xué)習(xí)目的=“不明確”AND實(shí)驗(yàn)操作=“不好”AND認(rèn)真預(yù)習(xí)=“否”THEN教學(xué)效果=“一般”.
由以上規(guī)則可以看出,要提高實(shí)驗(yàn)課的教學(xué)效果,首先要使學(xué)生明確實(shí)驗(yàn)課的學(xué)習(xí)目的,其次要提高學(xué)生實(shí)驗(yàn)操作的主動性,激發(fā)學(xué)生發(fā)現(xiàn)問題、解決問題的能力,第三要使學(xué)生認(rèn)真預(yù)習(xí),最后要提高教師的教學(xué)水平.
〔1〕呂道文,魏杰,張擁軍.我院醫(yī)學(xué)物理學(xué)實(shí)驗(yàn)現(xiàn)狀的調(diào)查與思考[J].中國醫(yī)學(xué)物理學(xué)雜志,2006,23(1):30,79-80.
〔2〕吳信東,庫瑪爾.數(shù)據(jù)挖掘十大算法[M].北京:清華大學(xué)出版社,2013.
〔3〕羅玉梅,白小東,何顯儒,周松,趙春霞.專業(yè)綜合實(shí)驗(yàn)教學(xué)現(xiàn)狀問卷調(diào)查分析[J].高教學(xué)刊,2017(3):33-35.
〔4〕吳陳,林炎鐘.C4.5算法在高校老師評價中的應(yīng)用研究[J].信息技術(shù),2010(1):17-19.
〔5〕王黎黎,劉學(xué)軍.決策樹C4.5算法在成績分析中的應(yīng)用[J].海南工程學(xué)院學(xué)報(bào),2014,26(4):69-73.
G642.0
A
1673-260X(2017)12-0014-02
2017-09-13
校級重大教學(xué)改革項(xiàng)目(2016jyxm07)