付 裕
模糊聚類(lèi)分析在高校分層次教學(xué)中的探索
付 裕
本文以一個(gè)班級(jí)學(xué)生學(xué)習(xí)成績(jī)?yōu)閿?shù)據(jù)樣本,使用R語(yǔ)言進(jìn)行模糊聚類(lèi)的分析,進(jìn)而對(duì)學(xué)生分層次教學(xué)管理提出一定的理論建議。
模糊聚類(lèi) R語(yǔ)言 分層次教學(xué)
隨著高等教育轉(zhuǎn)變成大眾教育,單獨(dú)招生的規(guī)模在各個(gè)高職高專(zhuān)院校都有所擴(kuò)大,高職高專(zhuān)學(xué)校在校學(xué)生的數(shù)量也不斷增長(zhǎng),伴隨著的是學(xué)生的質(zhì)量千差萬(wàn)別。學(xué)校為了提高對(duì)學(xué)生教學(xué)管理的質(zhì)量,做到因材施教,倡導(dǎo)分層次教學(xué)的管理模式。傳統(tǒng)的聚類(lèi)方法屬于一種硬性劃分即對(duì)象不是屬于這一類(lèi)就是屬于另外的類(lèi)。這種劃分在研究聚類(lèi)的很多文獻(xiàn)中都提到他的局限性。本文在參考了眾多文獻(xiàn)的基礎(chǔ)上,試圖使用模糊聚類(lèi)分析的軟劃分方法以學(xué)生成績(jī)?yōu)橐罁?jù)對(duì)學(xué)生進(jìn)行分層次[1]。為后續(xù)的學(xué)校的分層次教學(xué)管理提供理論支撐。
本文選自供電班2016-2017學(xué)年第一學(xué)期的期末考試成績(jī)?yōu)樗治龅臄?shù)據(jù)集,其源自于學(xué)校教務(wù)處,數(shù)據(jù)具有真實(shí)性、可靠性。該數(shù)據(jù)集共有37個(gè)樣本,每個(gè)樣本具有四個(gè)屬性,其值分別為高等數(shù)學(xué)、英語(yǔ)、電工測(cè)量、電子技術(shù)四門(mén)課程的考試成績(jī)。部分?jǐn)?shù)據(jù)如表1所示。具有4個(gè)屬性的37個(gè)樣本形成了一個(gè)37行4列的矩陣??梢允褂肦的read.table()函數(shù)載入數(shù)據(jù)集,使用Matrix()函數(shù)將其轉(zhuǎn)化成可以進(jìn)行模糊聚類(lèi)處理的矩陣。
表1 供電班部分學(xué)生期末考試數(shù)據(jù)
加載fclust包之后,使用R中的FKM()函數(shù)對(duì)該數(shù)據(jù)集進(jìn)行模糊聚類(lèi)。FKM函數(shù)執(zhí)行的是模糊C均值[1]算法。該算法是通過(guò)最小化目標(biāo)函數(shù)來(lái)實(shí)現(xiàn)樣本的劃分。FKM函數(shù)有8個(gè)參數(shù),對(duì)前三個(gè)參數(shù)進(jìn)行必要的設(shè)置,第一個(gè)參數(shù)X為樣本數(shù)據(jù)集,選擇的是供電班期末考試成績(jī);第二個(gè)參數(shù)K為聚類(lèi)的數(shù)目,選擇聚為3類(lèi),第三個(gè)參數(shù)M為加權(quán)指數(shù),對(duì)聚類(lèi)效果有很大的影響,在許多文獻(xiàn)中對(duì)該參數(shù)都有所研究,其最佳的選取范圍在[1.5-2.5]之間。
FKM函數(shù)輸出為一個(gè)數(shù)據(jù)框,包含有類(lèi)的成員及其數(shù)量、相關(guān)隸屬度矩陣、迭代次數(shù)、計(jì)算時(shí)間等相關(guān)聚類(lèi)結(jié)果。
選取不同的M值,對(duì)類(lèi)中成員的數(shù)量起著決定性的作用。本文在下文中會(huì)選取3個(gè)不同的加權(quán)指數(shù)值對(duì)學(xué)生四門(mén)課的期末考試成績(jī)進(jìn)行聚類(lèi)分析比較。通過(guò)對(duì)聚類(lèi)結(jié)果的比較,探索出一個(gè)比較適合于分層次教學(xué)管理的加權(quán)指數(shù)。
(一)M=2
選取加權(quán)指數(shù)M的值為2,聚類(lèi)數(shù)目K的值為3。類(lèi)的成員及數(shù)量如表2所示,部分成員保留兩位數(shù)的隸屬度及最有可能被劃分的類(lèi)如表3所示。
表2 類(lèi)的成員及數(shù)量
2 12 3 13
表3 部分成員隸屬度及最大隸屬類(lèi)
通過(guò)分析表2,發(fā)現(xiàn)類(lèi)1有12個(gè)成員,類(lèi)2有12個(gè)成員,類(lèi)3有13個(gè)成員,基本實(shí)現(xiàn)了類(lèi)之間成員平均分配。分析表3發(fā)現(xiàn),成員屬性值接近的基本上聚在一類(lèi),并且根據(jù)隸屬度給出了將成員劃分在哪一類(lèi)中理論建議。通過(guò)分析所有成員的隸屬度及最有可能被劃分的類(lèi)并結(jié)合成員的屬性值進(jìn)一步發(fā)現(xiàn),類(lèi)1中成員的成績(jī)普遍較高,類(lèi)2中成員的成績(jī)普遍較低,類(lèi)3中成員的成績(jī)處于類(lèi)1與類(lèi)2之間。如果將該班級(jí)分成3個(gè)小班進(jìn)行層次教學(xué),則建議類(lèi)1中的成員為1個(gè)班,在授課時(shí)可以適當(dāng)加深一些理論教學(xué)。類(lèi)2中的成員為1個(gè)班,因?yàn)槠淅碚撜n成績(jī)普遍較低,則在授課時(shí)適當(dāng)偏重實(shí)踐教學(xué)內(nèi)容,減少理論教學(xué)內(nèi)容。類(lèi)3中的成員為1個(gè)班,該班的理論成績(jī)表現(xiàn)得一般,授課時(shí)則按正常教學(xué)內(nèi)容進(jìn)行。
(二)M=1.5
選取加權(quán)指數(shù)M的值為1.5,聚類(lèi)數(shù)目K的值同樣為3。通過(guò)聚類(lèi)分析結(jié)果發(fā)現(xiàn),類(lèi)1的成員數(shù)為12,類(lèi)2的成員數(shù)為17,類(lèi)3的成員數(shù)為8。類(lèi)之間的成員數(shù)沒(méi)有平均分布,如果按此結(jié)果進(jìn)行分層次教學(xué),則會(huì)出現(xiàn)班級(jí)人數(shù)相差大,教學(xué)資源分配不均等的情況。通過(guò)把成員隸屬度矩陣、最有可能被劃分到的類(lèi)與原始數(shù)據(jù)相結(jié)合分析后發(fā)現(xiàn),在加權(quán)指數(shù)M=1.5的情況下,一些被認(rèn)為應(yīng)該劃分到類(lèi)3中的成員被劃分到了類(lèi)2中。其給出的理論指導(dǎo)具有誤導(dǎo)性。
(三)M=2.0
選取加權(quán)指數(shù)M的值為2.5,聚類(lèi)數(shù)目K的值仍然為3。其類(lèi)中的成員數(shù)仍然相差比較大,類(lèi)3的成員個(gè)數(shù)達(dá)到15個(gè)比類(lèi)2要多5個(gè)。并且同樣造成了本應(yīng)該劃分到類(lèi)2中的成員被建議劃分到類(lèi)3中,其理論指導(dǎo)同樣具有誤導(dǎo)性。
本文通過(guò)R語(yǔ)言的FCM函數(shù)對(duì)一個(gè)班級(jí)37個(gè)成員的期末考試成績(jī)進(jìn)行模糊聚類(lèi)分析。展現(xiàn)了模糊聚類(lèi)技術(shù)為分層次教學(xué)提供理論依據(jù)的可行性。并通過(guò)選取不同的加權(quán)指數(shù)對(duì)聚類(lèi)結(jié)果進(jìn)行了比較分析。初步得出了加權(quán)指數(shù)M=2時(shí)具有重要的理論指導(dǎo)價(jià)值。
[1]James C,Bezdek,Robert Ehrlich,etal.FCM:The Fuzzy C-means Cluster Algorithm[J].Computers & Geosciences,1984(10):191~203.
(作者單位:陜西國(guó)防工業(yè)職業(yè)技術(shù)學(xué)院)