陳康 王丹丹
摘 要:伴隨日常教學(xué)管理的向前發(fā)展,各高校網(wǎng)絡(luò)系統(tǒng)積累了大量的關(guān)于學(xué)生、教師、教學(xué)活動(dòng)等方面的數(shù)據(jù),這些數(shù)據(jù)存在很大的利用價(jià)值,可為高校進(jìn)一步發(fā)展提供決策依據(jù)。然而,各高校網(wǎng)絡(luò)系統(tǒng)當(dāng)中的數(shù)據(jù)多用于進(jìn)行簡(jiǎn)單的信息查詢或是報(bào)表統(tǒng)計(jì),而未對(duì)數(shù)據(jù)的深層信息進(jìn)行挖掘,導(dǎo)致數(shù)據(jù)利用不充分,未發(fā)揮系統(tǒng)數(shù)據(jù)應(yīng)有的作用。文章簡(jiǎn)單闡述了數(shù)據(jù)挖掘的基本概念及其方法,并就數(shù)據(jù)挖掘在高校管理中的應(yīng)用展開了討論。
關(guān)鍵詞:數(shù)據(jù)挖掘;高校管理;應(yīng)用
在實(shí)際工作當(dāng)中,各行業(yè)數(shù)據(jù)庫(kù)系統(tǒng)只是提供了部分極其簡(jiǎn)單的數(shù)據(jù)管理和處理功能。而隨著社會(huì)的發(fā)展,人們漸漸意識(shí)到數(shù)據(jù)的重要性和作用,對(duì)于數(shù)據(jù)分析及處理的要求也越來(lái)越高。面對(duì)數(shù)據(jù)庫(kù)中的海量數(shù)據(jù),人們急需一種系統(tǒng)而科學(xué)的數(shù)據(jù)處理及分析技術(shù),以深入開發(fā)并利用這些數(shù)據(jù),為決策服務(wù)提供數(shù)據(jù)支持。
1 數(shù)據(jù)挖掘概述
1.1 數(shù)據(jù)挖掘的基本概念
數(shù)據(jù)挖掘就是指在大量的數(shù)據(jù)或是數(shù)據(jù)庫(kù)當(dāng)中將人們所需要或感興趣的數(shù)據(jù)進(jìn)行提取和分析的過程[ 1 ]。由數(shù)據(jù)挖掘的概念可知,數(shù)據(jù)挖掘是一個(gè)在大量未加工的數(shù)據(jù)系統(tǒng)當(dāng)中發(fā)現(xiàn)有價(jià)值數(shù)據(jù)的過程。這些數(shù)據(jù)存在潛在的價(jià)值,可為決策服務(wù)提供信息支持,這類數(shù)據(jù)的存在形式包括概念、規(guī)則、規(guī)律、模式等。
數(shù)據(jù)挖掘是一門交叉性的綜合學(xué)科,其集機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析及數(shù)據(jù)庫(kù)技術(shù)于一體,將數(shù)據(jù)應(yīng)用從簡(jiǎn)單的查詢功能提升至數(shù)據(jù)當(dāng)中挖掘有價(jià)值的信息,以為決策提供數(shù)據(jù)支持[2]。現(xiàn)數(shù)據(jù)挖掘已廣泛應(yīng)用于各領(lǐng)域,包括醫(yī)藥、農(nóng)業(yè)、電信、金融、互聯(lián)網(wǎng)、市場(chǎng)營(yíng)銷等,且在各領(lǐng)域發(fā)揮著非常重要的作用。
1.2 數(shù)據(jù)挖掘的方法
數(shù)據(jù)挖掘是將數(shù)據(jù)庫(kù)技術(shù)與人工智能相互結(jié)合而產(chǎn)生的一種新型數(shù)據(jù)技術(shù),數(shù)據(jù)挖掘的方法多數(shù)來(lái)源于機(jī)器,通過不斷改進(jìn),很多機(jī)器學(xué)習(xí)、人工智能的常規(guī)技術(shù)都可成為數(shù)據(jù)挖掘的方法[ 3 ]??傮w而言,數(shù)據(jù)挖掘的方法主要包括以下幾類:
第一,粗糙集法。粗糙集理論是將集合論進(jìn)行擴(kuò)展而形成的,其主要用于對(duì)不確定性問題進(jìn)行研究,包括各種研究未完全、信息描述不完整等數(shù)據(jù),是近些年來(lái)逐步興起的一種問題解決理論。利用粗糙集法可在數(shù)據(jù)先驗(yàn)知識(shí)不足的情況下,基于對(duì)數(shù)據(jù)分類能力進(jìn)行考察而實(shí)現(xiàn)各種模糊或是具強(qiáng)不確定性的分析和處理。粗糙集法操作簡(jiǎn)單,現(xiàn)有很多數(shù)據(jù)挖掘工具都是在粗糙集法的基礎(chǔ)上而建立的。
第二,聚類法。聚類法是指將所要分析的對(duì)象分成多個(gè)群體,每個(gè)群體當(dāng)中的對(duì)象存在很大的相似性,而不同的群體之間其相似性則相對(duì)較小。通常來(lái)說(shuō),一個(gè)群體就一個(gè)類別,但相比于分類,聚類法有所不同。聚類的結(jié)果其所針對(duì)的數(shù)據(jù)是當(dāng)前要進(jìn)行處理的數(shù)據(jù),在聚類之前是不知道數(shù)據(jù)的類目結(jié)構(gòu)及對(duì)象的類別的。聚類是數(shù)據(jù)挖掘的第一個(gè)步驟,其將數(shù)據(jù)以群體方式進(jìn)行了分類,以方便后期進(jìn)行進(jìn)一步分析。
第三,決策樹法。決策樹法主要用于解決分類問題。決策樹法分為兩個(gè)階段:構(gòu)造樹和修剪樹。構(gòu)造樹是指利用訓(xùn)練數(shù)據(jù)形成測(cè)試函數(shù),依照取值的不同來(lái)建立分支,然后在每個(gè)分支下再建立下層分支,通過這樣重復(fù)的不斷建立從而形成一棵決策樹。修剪樹是指在構(gòu)造樹之后對(duì)其進(jìn)行修剪,將決策樹轉(zhuǎn)化為一定的規(guī)則,并利用所得到的規(guī)則將新事例進(jìn)行分類。相比于其他分類法,利用決策樹法進(jìn)行分類速度較快、規(guī)則形成簡(jiǎn)單容易且易于轉(zhuǎn)化為數(shù)據(jù)庫(kù)查詢語(yǔ)言,特別是對(duì)維數(shù)高的問題進(jìn)行分類可取得良好的結(jié)果。
第四,人工神經(jīng)網(wǎng)絡(luò)法。人工神經(jīng)網(wǎng)絡(luò)法是一種軟計(jì)算方法,神經(jīng)網(wǎng)絡(luò)可以管理或是非管理模式進(jìn)行學(xué)習(xí)。若采取管理模式,則需對(duì)已有的示例可能會(huì)產(chǎn)生的結(jié)果進(jìn)行預(yù)測(cè),比較預(yù)測(cè)結(jié)果及目標(biāo)答案并通過錯(cuò)誤實(shí)現(xiàn)學(xué)習(xí)的目標(biāo)。神經(jīng)網(wǎng)絡(luò)的管理模式主要用于解決預(yù)測(cè)、分類及時(shí)間序列等問題。非管理模式的神經(jīng)網(wǎng)絡(luò)法多用于解決數(shù)據(jù)描述類問題,而不適應(yīng)于結(jié)果預(yù)測(cè)類問題。神經(jīng)網(wǎng)絡(luò)在采取非管理模式時(shí)需建立其類描述、合法性驗(yàn)證及操作,其無(wú)關(guān)于數(shù)據(jù)模式。人工神經(jīng)網(wǎng)絡(luò)法需較長(zhǎng)時(shí)間,其行為類似黑盒,因此其可能無(wú)法滿足商業(yè)分析的相關(guān)要求。
第五,進(jìn)化計(jì)算法。進(jìn)化計(jì)算法主要是指對(duì)生物進(jìn)化模式進(jìn)行模仿的計(jì)算方法的總稱,有遺傳算法、遺傳編程、進(jìn)化策略、進(jìn)化規(guī)劃等方法。進(jìn)化計(jì)算法是基于適應(yīng)度函數(shù)約束而進(jìn)行的智能化搜索,在不斷的搜索當(dāng)中逐步接近目標(biāo),從而將目標(biāo)數(shù)據(jù)提取出來(lái)。進(jìn)化計(jì)算法的操作具雜交性和變異性,其搜索范圍非常廣,因此利用進(jìn)化計(jì)算法所得到的結(jié)果可以說(shuō)是所有結(jié)果當(dāng)中的最優(yōu)解,同時(shí)因其為框架式結(jié)構(gòu),所以利用此方法一般只需要選擇適應(yīng)度函數(shù)并完成相關(guān)編碼,其余操作則可由系統(tǒng)自動(dòng)完成。
2 數(shù)據(jù)挖掘在高校管理中的應(yīng)用
2.1 挖掘?qū)W生特征
根據(jù)系統(tǒng)當(dāng)中現(xiàn)有的學(xué)生信息,如基本信息、學(xué)習(xí)歷史、學(xué)習(xí)成績(jī)、學(xué)習(xí)偏好及知識(shí)結(jié)構(gòu)等,對(duì)學(xué)生的特征進(jìn)行挖掘,以幫助學(xué)生及時(shí)改善學(xué)習(xí)行為。通過比較學(xué)生特征的分析結(jié)果和已制定的學(xué)生行為目標(biāo),教師可及時(shí)了解學(xué)生的學(xué)習(xí)狀況及變化,幫助學(xué)生修正不良的學(xué)習(xí)行為,從而提高學(xué)生的學(xué)習(xí)能力,促進(jìn)學(xué)生人格健全及全方面發(fā)展。
2.2 干預(yù)師生行為
高校教學(xué)數(shù)據(jù)庫(kù)當(dāng)中存有大量學(xué)生及教師的學(xué)習(xí)、教學(xué)、社會(huì)活動(dòng)、獎(jiǎng)懲情況等數(shù)據(jù),利用數(shù)據(jù)挖掘當(dāng)中的關(guān)聯(lián)分析可找到學(xué)生與教師之間各種活動(dòng)的內(nèi)在聯(lián)系,如“當(dāng)A、B同時(shí)存在時(shí)可以得到C結(jié)論”等類似的規(guī)則,即若同時(shí)發(fā)生A和B行為,則可判斷C行為的出現(xiàn)。將此理論應(yīng)用于實(shí)際情境當(dāng)中,即當(dāng)發(fā)現(xiàn)學(xué)生或教師存在A和B行為時(shí),則可立即分析C行為產(chǎn)生的可能性,并采取措施提前預(yù)防C行為的出現(xiàn)。
2.3 課程設(shè)置合理化
在教學(xué)過程當(dāng)中,課程的設(shè)置都是循序漸進(jìn)的,各課程之間相互聯(lián)系且有一定的前后順序。通常來(lái)說(shuō),高級(jí)課程的教學(xué)會(huì)安排在各種基礎(chǔ)課程之后,若基礎(chǔ)課程未很好地掌握,那么后續(xù)高級(jí)課程的學(xué)習(xí)必然受到影響。此外,因教師及班級(jí)文化存在差異,所以即使是同一年級(jí)、同一課程,不同班級(jí)的整體成績(jī)也在存在很大差異。將學(xué)校數(shù)據(jù)庫(kù)中歷屆學(xué)生的學(xué)習(xí)成績(jī)數(shù)據(jù)提取出來(lái),并利用數(shù)據(jù)挖掘中的關(guān)聯(lián)分析及時(shí)間序列分析等功能,可從大量數(shù)據(jù)當(dāng)中挖掘出價(jià)值相對(duì)較高的數(shù)據(jù),通過對(duì)這些數(shù)據(jù)之間的相關(guān)性、回歸性等進(jìn)行分析就可獲得很多有用的規(guī)則和信息,從而找到學(xué)生成績(jī)的影響因素。了解原因之后,學(xué)校便可對(duì)課程設(shè)置進(jìn)行調(diào)整,使課程設(shè)置更加合理、科學(xué)。
2.4 教學(xué)評(píng)價(jià)
教學(xué)評(píng)價(jià)包括學(xué)生的學(xué)習(xí)評(píng)價(jià)及教師的課堂教學(xué)評(píng)價(jià)。對(duì)學(xué)生學(xué)習(xí)行為進(jìn)行評(píng)價(jià)既是激發(fā)學(xué)生學(xué)習(xí)動(dòng)機(jī)的主要方式,也是檢測(cè)課程設(shè)置、教學(xué)程序是否合理的重要手段。利用數(shù)據(jù)挖掘,通過分析學(xué)生的學(xué)習(xí)成績(jī)、學(xué)習(xí)行為、獎(jiǎng)懲情況等可獲取學(xué)生評(píng)價(jià)結(jié)果,及時(shí)修正學(xué)生的學(xué)習(xí)行為。此外,這種方式還可有效克服教師主觀方面評(píng)價(jià)存在的不公正和不客觀等缺點(diǎn)。
課堂教學(xué)評(píng)價(jià)是高校進(jìn)行教學(xué)管理的重要內(nèi)容,在高校教學(xué)過程當(dāng)中發(fā)揮著控制、指導(dǎo)等作用,也是評(píng)價(jià)教師教學(xué)工作效果的重要方式。利用數(shù)據(jù)挖掘可提取大量的課堂教學(xué)評(píng)價(jià)數(shù)據(jù),分析教學(xué)效果與教師年齡、職稱、教學(xué)方法等方面之間的聯(lián)系,為教學(xué)部門制定教學(xué)評(píng)價(jià)體系提供了信息支持,使高校能更好地開展教學(xué)工作,提高課堂教學(xué)效率。
2.5 招生就業(yè)管理
招生方面:利用數(shù)據(jù)挖掘可了解和分析學(xué)生的高考成績(jī)、個(gè)人資料、在校成績(jī)等基本信息,在此基礎(chǔ)上,各高校可建立高效、科學(xué)的招生管理系統(tǒng)。這樣既簡(jiǎn)化了招生工作的流程,又提高了學(xué)校的生源素質(zhì),同時(shí)還可加強(qiáng)學(xué)校招生計(jì)劃的科學(xué)性,為高校招生工作的各方面決策提供了信息支持。
就業(yè)方面:利用數(shù)據(jù)挖掘可對(duì)學(xué)生就業(yè)情況進(jìn)行分析,了解就業(yè)與學(xué)生學(xué)歷、專業(yè)、性別、生源地等因素之間的關(guān)聯(lián)。通過分析結(jié)果,高校學(xué)生就業(yè)指導(dǎo)部門就可制定科學(xué)合理的人才培養(yǎng)方案,從而提高學(xué)生的就業(yè)能力及競(jìng)爭(zhēng)實(shí)力。
2.6 建設(shè)智能化校園網(wǎng)絡(luò)
利用數(shù)據(jù)挖掘發(fā)現(xiàn)Web數(shù)據(jù)中潛在的價(jià)值高的模式或信息,是當(dāng)前數(shù)據(jù)挖掘的研究熱點(diǎn)和重點(diǎn),即Web數(shù)據(jù)挖掘[4]。Web數(shù)據(jù)挖掘可為高校校園網(wǎng)絡(luò)建設(shè)提供指導(dǎo),促進(jìn)校園網(wǎng)絡(luò)建設(shè)的個(gè)性化和智能化。首先,可根據(jù)用戶的使用記錄來(lái)建立用戶模型,并通過分析用戶的基本信息來(lái)了解用戶的使用習(xí)慣、個(gè)人愛好等,從而為用戶提供個(gè)性化服務(wù)。其次,利用Web數(shù)據(jù)挖掘可了解用戶的行為記錄及反饋情況,以此為基礎(chǔ),設(shè)計(jì)人員便可有針對(duì)性地改善站點(diǎn),如頁(yè)面的連接、頁(yè)面的訪問等,優(yōu)化校園網(wǎng)絡(luò);再次,利用即Web數(shù)據(jù)挖掘可了解用戶的擁塞記錄,從而發(fā)現(xiàn)站點(diǎn)存在的不足之處,并提示點(diǎn)點(diǎn)管理人員及時(shí)進(jìn)行改善,以提高校園網(wǎng)絡(luò)的智能化。
3 結(jié)語(yǔ)
隨著時(shí)間的不斷推移,高校管理的系統(tǒng)數(shù)據(jù)會(huì)不斷增加,數(shù)據(jù)量不斷加大的同時(shí)數(shù)據(jù)復(fù)雜性也會(huì)不斷增強(qiáng)。在這種情況下,利用數(shù)據(jù)挖掘可將大量數(shù)據(jù)當(dāng)中的有用、價(jià)值高的數(shù)據(jù)提取出來(lái)并進(jìn)行分析,以為高校管理決策提供良好的數(shù)據(jù)支持,提高高校的管理水平及管理層次,推動(dòng)高校的進(jìn)一步發(fā)展。為此,在平時(shí)的工作當(dāng)中,各高校應(yīng)特別重視數(shù)據(jù)的挖掘,根據(jù)學(xué)校的實(shí)際情況,采取切實(shí)可行的措施,深入挖掘校園網(wǎng)絡(luò)系統(tǒng)當(dāng)中的數(shù)據(jù),將有價(jià)值的數(shù)據(jù)提取出來(lái)并將其轉(zhuǎn)化為知識(shí),從而提高高校的管理水平及教學(xué)質(zhì)量,促進(jìn)教育體制的改革及完善。
[參考文獻(xiàn)]
[1]李霞,蔣盛益.數(shù)據(jù)挖掘在高校教學(xué)和管理中的應(yīng)用研究[J].廣東外語(yǔ)外貿(mào)大學(xué)學(xué)報(bào),2012(14):88.
[2]江敏,徐艷.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)管理中的應(yīng)用[J].電腦知識(shí)與技術(shù),2012(14):77-78.
[3]劉美玲,李熹.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)與管理中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2010(14):88.
[4]陽(yáng)馨.高校管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)的途徑研究[J].數(shù)字技術(shù)與應(yīng)用,2016(14):77-78.
Data Mining and Its Application in University Management
Chen Kang, Wang Dandan
(Zhengzhou Institute of Finance and Economics, Zhengzhou 450000, China)
Abstract: With the daily teaching management forward, the university network system has accumulated a large amount of data about aspects of students, teachers, teaching activities, the data there is great value in use, can provide scientific basis for the further development of university. However, now the university network system among the data used for simple statistical information query or report, without in-depth information on data mining, data utilization leading to insufficient data system did not play its due role. This paper briefly describes the basic concepts and methods of data mining, and on the application of data mining in University Management discussed.
Key words: data mining; university management; application