史鳳波
摘要:在數(shù)據(jù)挖掘中,應用關聯(lián)規(guī)則可以挖掘一個事物和其它事物之間存在的相關性。本文使用“基于布爾矩陣的Apriori算法”來分析課程之間的相互關聯(lián),進而為教務管理者提供準確的決策支持。
關鍵詞:數(shù)據(jù)挖掘;關聯(lián)規(guī)則;Apriori algorithm
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2017)10-0099-02
2 使用關聯(lián)規(guī)則對學生成績進行分析
2.1 確定挖掘對象和目標
本應用的目標是根據(jù)學生的期末考試成績,分析這些課程之間的相關性,發(fā)現(xiàn)類似“高等數(shù)學成績優(yōu)秀進而C語言成績優(yōu)秀”這樣的關系。從而指導教務管理者安排教學計劃[3]。
2.2 數(shù)據(jù)準備
(1)數(shù)據(jù)選擇。是根據(jù)所確定的挖掘對象和目標,選擇相關的數(shù)據(jù),形成目標數(shù)據(jù)。(2)數(shù)據(jù)預處理。取自不同系統(tǒng)的目標數(shù)據(jù)在類型、度量等很多方面可能存在差異。其主要工作是對噪聲數(shù)據(jù)、不完整數(shù)據(jù)、不一致數(shù)據(jù)進行再處理。(3)數(shù)據(jù)變換。是為課程的不同等級設置相應的代碼,這里用x1、x2、x3、x4、x5分別表示Photoshop平面設計的成績優(yōu)秀、良好、中等、及格、不及格。同樣y1、y2、y3、y4、y5表示網(wǎng)頁制作的成績等級,z1、z2、z3、z4表示多媒體課件制作的成績等級。應用相應代碼將數(shù)據(jù)轉為事務數(shù)據(jù)庫。
首先將連續(xù)的數(shù)值型數(shù)據(jù)轉換為布爾型數(shù)據(jù),以適合數(shù)據(jù)挖掘的需要。用相應代碼將連續(xù)型數(shù)據(jù)轉換成布爾型數(shù)據(jù)。轉換后部分數(shù)據(jù)描述如圖1所示。
2.3 數(shù)據(jù)挖掘
這里用改進的、基于布爾矩陣的Apriori算法進行挖掘。
(1)產(chǎn)生頻繁項集。設最小支持度為0.06,通過對處理后的布爾矩陣數(shù)據(jù)進行計算,得到結果如圖2所示。
(2)生成關聯(lián)規(guī)則。在第一步找出頻繁項集的基礎上就可以產(chǎn)生關聯(lián)規(guī)則了。
如果設最小置信度為0.06,則可輸出以下的關聯(lián)規(guī)則,如表1所示。
2.4 結果評估與知識整合
從產(chǎn)生的關聯(lián)規(guī)則可以看到,三門課程之間存在著一定的聯(lián)系:規(guī)則1:《網(wǎng)頁制作》、《Photoshop 平面設計》兩門成績都在90分以上的同學,《多媒體課件制作》成績?yōu)?0分的可能性是63%。規(guī)則2:《網(wǎng)頁制作》成績在80到90分之間,《Photoshop 平面設計》成績在90分以上的同學,《多媒體課件制作》成績在80分到90分之間的的可能性是79.5%。規(guī)則3:《網(wǎng)頁制作》成績在70到80分之間,《Photoshop 平面設計》成績在90分以上的同學,《多媒體課件制作》成績在80分到90分之間的的可能性是76.5%。
通過以上規(guī)則可以看到,《網(wǎng)頁制作》、《Photoshop 平面設計》這兩門課程對《多媒體課件制作》課程是有一定的影響的。所以,應先開設《網(wǎng)頁制作》、《Photoshop 平面設計》課程,再開設《多媒體課件制作》課程。
3 結語
學習是個循序漸進的過程,課程之間存在著一定的關聯(lián)與前后順序關系,課程開設的前后順序影響著學生對知識的掌握。如果教務管理者了解課程之間的這種關系,那么,他們所做出的決策也就有了客觀依據(jù),所制定的教學計劃勢必能夠更好地指導教學工作,進而達到提高教學質量和學生對知識的掌握效果的目的。
參考文獻
[1]范明.數(shù)據(jù)挖掘導論[M].北京:人民郵電出版社,2007.
[2]陳文偉,趙新翌.數(shù)據(jù)挖掘技術[M].北京:北京工業(yè)出版社,2007.
[3]陳曉玲,李宏,張爭.關聯(lián)規(guī)則在學分制成績管理中的應用[J].湖南科技學院學報,2008,(8):106-108.endprint