萬(wàn)陽(yáng)洋
摘要:隨著信息技術(shù)的廣泛應(yīng)用,高校中的各類管理信息系統(tǒng)積累了大量的數(shù)據(jù),但是對(duì)這些數(shù)據(jù)的處理還只是停留在簡(jiǎn)單查詢和統(tǒng)計(jì)報(bào)表等階段,并沒有采取有效的手段充分利用數(shù)據(jù)為教育管理工作提供有效的決策支持。在教學(xué)和管理工作中采用數(shù)據(jù)挖掘技術(shù),能夠充分利用這些數(shù)據(jù),發(fā)現(xiàn)教育現(xiàn)象之間的相互關(guān)聯(lián)和規(guī)則,指導(dǎo)校園信息化建設(shè),從而可以更好地做出教育預(yù)測(cè)和實(shí)施教育決策。
關(guān)鍵詞:大數(shù)據(jù);信息技術(shù);數(shù)據(jù)挖掘;信息化
中圖分類號(hào):TP391 ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
隨著高等教育招生規(guī)模的不斷擴(kuò)大,各高校的教學(xué)與管理均面臨著前所未有的挑戰(zhàn),教育信息化建設(shè)自然而然被提上日程。目前絕大部分高校在學(xué)生成績(jī)、學(xué)籍、教學(xué)、人事、圖書檔案、招生就業(yè)、教學(xué)科研等方面均已采用了先進(jìn)的系統(tǒng)進(jìn)行管理和維護(hù)。而在信息化建設(shè)取得業(yè)績(jī)的同時(shí),也存在一個(gè)不容忽視的現(xiàn)象,即在龐大的信息化建設(shè)數(shù)據(jù)量之后,往往隱藏著許多并沒有被充分挖掘和利用的寶貴信息。
面對(duì)海量數(shù)據(jù),教育部門迫切需要智能、高效的信息技術(shù)來處理數(shù)據(jù),從而挖掘出對(duì)管理決策有價(jià)值的信息,數(shù)據(jù)挖掘技術(shù)的應(yīng)用為此提供了解決方法。數(shù)據(jù)挖掘技術(shù)是指能從海量的信息中得到有用知識(shí),用來輔助管理者制定一些戰(zhàn)略決策,在其他行業(yè),如金融、電信、商場(chǎng)銷售等行業(yè)都取得了廣泛的應(yīng)用,因此,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到校園信息化建設(shè)中,進(jìn)一步深入挖掘這些數(shù)據(jù)背后所隱藏的寶貴價(jià)值,實(shí)現(xiàn)數(shù)據(jù)的重新開發(fā)和利用,并使其轉(zhuǎn)化為有用的知識(shí),具有重要意義。利用數(shù)據(jù)挖掘技術(shù)構(gòu)建教育領(lǐng)域的相關(guān)模型,探索教育變量之間的相關(guān)關(guān)系,為教育教學(xué)決策提供有效的支持,進(jìn)而實(shí)現(xiàn)提高高校教學(xué)質(zhì)量及大學(xué)生的綜合素質(zhì)[1]。
1 數(shù)據(jù)挖掘及其相關(guān)算法介紹
數(shù)據(jù)挖掘也稱為從數(shù)據(jù)中發(fā)現(xiàn)知識(shí),具體來講就是從大規(guī)模海量數(shù)據(jù)中抽取人們所感興趣的、非平凡的、隱含的、事先未知的和具有潛在用途的模式或者知識(shí)。數(shù)據(jù)挖掘的過程包括以下幾個(gè)主要步驟:第一,將存放在數(shù)據(jù)庫(kù)中的數(shù)據(jù)經(jīng)過數(shù)據(jù)清洗、數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)集成等預(yù)處理過程存入數(shù)據(jù)倉(cāng)庫(kù)中;第二,將清洗過的數(shù)據(jù)再次經(jīng)數(shù)據(jù)抽取或者集成等過程,獲得任務(wù)相關(guān)數(shù)據(jù);第三,在此基礎(chǔ)上進(jìn)一步進(jìn)行數(shù)據(jù)挖掘過程,獲得潛在的有價(jià)值的模式或者規(guī)律;第四,進(jìn)行模式評(píng)估,評(píng)估所獲得知識(shí)的有效性,以此最終獲得相關(guān)知識(shí)。以下列舉利用數(shù)據(jù)挖掘技術(shù)可以實(shí)現(xiàn)的主要功能及算法。
1.1 相關(guān)性與關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘領(lǐng)域中研究最為廣泛也是最為活躍的方法之一。最初的研究動(dòng)機(jī)是針對(duì)購(gòu)物籃分析問題提出的,目的是為了解決發(fā)現(xiàn)交易數(shù)據(jù)庫(kù)中不同商品之間的聯(lián)系規(guī)則。關(guān)聯(lián)規(guī)則挖掘一般可以劃分為兩個(gè)子問題,即發(fā)現(xiàn)頻繁項(xiàng)目集和由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則。最經(jīng)典的頻繁項(xiàng)集挖掘算法是Apriori算法。
1.2 分類和預(yù)測(cè)
數(shù)據(jù)挖掘相關(guān)的研究工作中常常還力圖構(gòu)建一個(gè)模型或者描述函數(shù)來刻畫或者區(qū)分不同的類型與概念,以實(shí)現(xiàn)對(duì)于未來潛在的預(yù)測(cè)需求。分類和預(yù)測(cè)是兩種數(shù)據(jù)分類形式,它們可以用于提取能夠描述重要數(shù)據(jù)的集合或預(yù)測(cè)未來數(shù)據(jù)趨勢(shì)的模型。分類用于預(yù)測(cè)數(shù)據(jù)對(duì)象的離散類別,預(yù)測(cè)則用于預(yù)測(cè)數(shù)據(jù)對(duì)象的連續(xù)取值。常用的分類方法有決策樹分類(ID3、C4.5)、貝葉斯分類、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等。
1.3 聚類分析
在具體的分類類型信息未知的情況下,往往會(huì)采用聚類方法對(duì)數(shù)據(jù)進(jìn)行分類。聚類是通過一定的算法將原始數(shù)據(jù)劃分為多個(gè)數(shù)據(jù)簇的過程。典型的聚類分析方法有基于分割的聚類(K-均值算法、K-中心點(diǎn)算法),基于層次的聚類,基于密度的聚類,基于網(wǎng)格的聚類等。
2 數(shù)據(jù)挖掘在校園信息化中的應(yīng)用
為了提高高校校園信息化水平,充分使用學(xué)生在校行為數(shù)據(jù)創(chuàng)建智慧校園、數(shù)字校園,可通過網(wǎng)絡(luò)平臺(tái)收集高校學(xué)生和教師教學(xué)大數(shù)據(jù),基于數(shù)據(jù)挖掘技術(shù)設(shè)計(jì)相關(guān)研究模型。
2.1 數(shù)據(jù)挖掘在成績(jī)管理中的應(yīng)用
隨著教育理念的轉(zhuǎn)變和當(dāng)今信息技術(shù)的廣泛應(yīng)用,各高校都構(gòu)建了各自的成績(jī)管理系統(tǒng),實(shí)現(xiàn)了學(xué)生信息、成績(jī)等大量數(shù)據(jù)的存儲(chǔ)、查詢、報(bào)表和簡(jiǎn)單的統(tǒng)計(jì)功能,提高了教學(xué)管理的效率。但傳統(tǒng)的學(xué)生學(xué)習(xí)成績(jī)分析大多只是將學(xué)生的考試成績(jī)做簡(jiǎn)單的排序和分析,以作為評(píng)判學(xué)生課業(yè)成績(jī)、畢業(yè)評(píng)定的基礎(chǔ)依據(jù),沒有將教育教學(xué)過程中的諸多因素與學(xué)生成績(jī)數(shù)據(jù)的關(guān)系做深入的分析。缺乏綜合分析和輔助決策能力,更不能對(duì)積存的數(shù)據(jù)進(jìn)行歸納與深層次挖掘,使得管理人員在決策時(shí)缺少切實(shí)的數(shù)據(jù)支持,而數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)的結(jié)合為學(xué)生成績(jī)分析提供了必要的技術(shù)手段。
挖掘課程設(shè)置與課程成績(jī)之間的關(guān)系,將改進(jìn)的關(guān)聯(lián)規(guī)則挖掘算法應(yīng)用到學(xué)生成績(jī)分析中,發(fā)現(xiàn)隱藏在課程與成績(jī)之間的關(guān)系,進(jìn)而對(duì)得出的有價(jià)值的知識(shí)進(jìn)行分析,找出教學(xué)中各方面的成效得失及影響學(xué)生成績(jī)的內(nèi)在因素,能為學(xué)生選課和教師教學(xué)及教學(xué)管理工作等提供決策支持[2]。
課程關(guān)聯(lián)規(guī)則挖掘,某些課程的掌握程度將會(huì)很大程度影響后續(xù)課程的學(xué)習(xí),最終會(huì)對(duì)就業(yè)核心技能產(chǎn)生影響,挖掘課程之間的聯(lián)系,將會(huì)指導(dǎo)專業(yè)對(duì)課程的授課學(xué)時(shí)、授課教師、授課方法等做出決策,挖掘課程與就業(yè)之間的關(guān)系,將會(huì)指導(dǎo)學(xué)生將精力投放到影響系數(shù)較大的課程上,使學(xué)生有的放矢,也能支持學(xué)生在前期學(xué)習(xí)成績(jī)分析的基礎(chǔ)上了解自身的學(xué)習(xí)情況。
增加引入課時(shí)維、教師職稱維等,能比較出相同的學(xué)科在不同的課時(shí)安排下,學(xué)生掌握情況的好壞,如適當(dāng)增加實(shí)驗(yàn)課時(shí)在某門課程中的比重,學(xué)生對(duì)某些知識(shí)點(diǎn)掌握得更好,這樣,在以后制定課時(shí)安排的時(shí)候,就很有針對(duì)性,并考慮在不同的專業(yè)、不同的考試要求的情況下,適合分配給哪類職稱的教師來講授。
針對(duì)學(xué)生未來課程成績(jī)預(yù)警的問題上,構(gòu)建學(xué)生行為、個(gè)人屬性及過往學(xué)習(xí)成績(jī)的特征向量并根據(jù)不同課程的特點(diǎn)進(jìn)行動(dòng)態(tài)選取,結(jié)合支持向量機(jī)來學(xué)習(xí)得到不同課程的預(yù)警模型,可自動(dòng)發(fā)現(xiàn)學(xué)習(xí)狀態(tài)不佳的同學(xué)并給予警示,此方法可有效提高學(xué)業(yè)監(jiān)督效率,對(duì)于提高學(xué)生的個(gè)性化管理水平具有推動(dòng)作用。
對(duì)教學(xué)質(zhì)量評(píng)價(jià)是教育管理過程中的重要環(huán)節(jié)。將決策樹算法運(yùn)用于教學(xué)評(píng)價(jià)之中,可以提高教學(xué)評(píng)價(jià)技術(shù)水平,使之更好地為教學(xué)服務(wù)。在建立評(píng)價(jià)體系的時(shí)候,應(yīng)更多考慮以學(xué)生作為評(píng)價(jià)主體,在此基礎(chǔ)上建立多元評(píng)價(jià)體系,以課堂教學(xué)評(píng)價(jià)為主體,輔以教師自評(píng)、教研室評(píng)價(jià)及學(xué)科組評(píng)價(jià)。在生成決策樹后,可以方便地提取決策樹描述的知識(shí),從根節(jié)點(diǎn)到葉節(jié)點(diǎn)的每一條路徑相應(yīng)地對(duì)應(yīng)一條決策規(guī)則,并用語(yǔ)句表示分類規(guī)則。
2.2 數(shù)據(jù)挖掘在網(wǎng)絡(luò)教學(xué)平臺(tái)個(gè)性化推薦中的應(yīng)用
為了使學(xué)生在網(wǎng)絡(luò)學(xué)習(xí)過程中充分使用碎片化時(shí)間,隨時(shí)隨地進(jìn)行學(xué)習(xí),大部分高校開始創(chuàng)建了自身數(shù)字化教學(xué)資源與網(wǎng)絡(luò)教學(xué)平臺(tái)。從技術(shù)層面上說,學(xué)習(xí)者在互聯(lián)網(wǎng)等媒體上留下的任何數(shù)據(jù)痕跡,都可以進(jìn)行分析,可以發(fā)現(xiàn)數(shù)據(jù)背后隱藏的學(xué)習(xí)者相關(guān)學(xué)習(xí)特征、興趣愛好、行為傾向,與教育教學(xué)相關(guān)的狀態(tài)信息都將一覽無余。未來的教育發(fā)展方向就是應(yīng)用數(shù)據(jù)挖掘等大數(shù)據(jù)技術(shù)去實(shí)現(xiàn)精準(zhǔn)的個(gè)性化教育。
運(yùn)用聚類算法結(jié)合協(xié)作推薦技術(shù)功能來分析學(xué)習(xí)者學(xué)習(xí)的課程內(nèi)容數(shù)據(jù),如登錄課程次數(shù)、發(fā)帖次數(shù)、學(xué)習(xí)筆記、閱讀課堂教材的次數(shù)、閱讀試題庫(kù)次數(shù)、提交作業(yè)、學(xué)習(xí)成績(jī)、在線時(shí)長(zhǎng),研究數(shù)據(jù)分析中學(xué)生學(xué)習(xí)偏好、態(tài)度,預(yù)測(cè)學(xué)習(xí)過程中的問題?;诖藬?shù)據(jù),實(shí)現(xiàn)課程精準(zhǔn)教學(xué)支持,實(shí)現(xiàn)學(xué)習(xí)任務(wù)及教學(xué)決策的優(yōu)化,幫助目標(biāo)學(xué)習(xí)者制定特色的學(xué)習(xí)計(jì)劃。
通過改進(jìn)的關(guān)聯(lián)規(guī)則算法實(shí)現(xiàn)訪問日志的挖掘,找出訪問頻度較高的知識(shí)點(diǎn)網(wǎng)頁(yè),確定學(xué)生的興趣點(diǎn)及知識(shí)點(diǎn)中的難點(diǎn)。進(jìn)一步挖掘出若干知識(shí)點(diǎn)之間的訪問順序,找出學(xué)生頻繁查看的知識(shí)點(diǎn)序列,教學(xué)平臺(tái)則可以根據(jù)這些規(guī)則進(jìn)行網(wǎng)頁(yè)內(nèi)容調(diào)整,更好地為用戶提供個(gè)性化服務(wù)。
2.3 數(shù)據(jù)挖掘在圖書館管理中的應(yīng)用
如今網(wǎng)絡(luò)信息、數(shù)字資源豐富,移動(dòng)閱讀等新型閱讀模式的興起改變著人們傳統(tǒng)的閱讀模式。導(dǎo)致館藏資源受到冷落,圖書館作為知識(shí)載體及知識(shí)傳播媒介的功能受到限制。運(yùn)用數(shù)據(jù)挖掘相關(guān)技術(shù)對(duì)圖書館用戶行為進(jìn)行研究,有助于提高圖書館的使用率,降低圖書館的成本支出。因?yàn)榉?wù)是圖書館的根本,而服務(wù)的對(duì)象為用戶,只有通過認(rèn)清用戶、分析用戶行為、感知用戶需求,才能夠提供更好的服務(wù)以吸引用戶。通過對(duì)圖書管理系統(tǒng)采集到的數(shù)據(jù)進(jìn)行分析,對(duì)用戶數(shù)據(jù)、館藏?cái)?shù)據(jù)及用戶行為數(shù)據(jù)等進(jìn)行比較詳細(xì)的研究。將用戶在圖書館中發(fā)生的進(jìn)館、借還書等行為進(jìn)行梳理,區(qū)分不同學(xué)科、專業(yè)學(xué)生在圖書館使用方面的不同習(xí)慣,以期對(duì)不同的用戶制定不同的管理?xiàng)l例,滿足個(gè)性化條件,增加圖書館的利用率;同時(shí)可采用K-means聚類模型對(duì)用戶的現(xiàn)有價(jià)值和潛在價(jià)值進(jìn)行分析,區(qū)別活躍用戶、價(jià)值用戶和潛在用戶等;運(yùn)用決策樹模型對(duì)用戶從進(jìn)入圖書館的門禁系統(tǒng)到發(fā)生借書行為、再到具體所借書目等各個(gè)環(huán)節(jié)的聯(lián)動(dòng)分析,了解用戶在進(jìn)入圖書館后行為動(dòng)向,區(qū)分各學(xué)院學(xué)生的借閱偏好,挖掘不同年級(jí)在用戶行為流程中的差異,以期指導(dǎo)圖書館資源的優(yōu)化配置等[3]。
另外,在高校學(xué)生工作中應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行分析研究,可為學(xué)??茖W(xué)決策提供參考、為學(xué)生全面發(fā)展提供指導(dǎo)。例如,通過分析學(xué)生食堂吃飯、宿舍洗澡、教學(xué)樓打水和進(jìn)出圖書館的行為數(shù)據(jù),探求學(xué)生校園生活的規(guī)律性,預(yù)測(cè)學(xué)業(yè)表現(xiàn)、識(shí)別孤獨(dú)人群;通過挖掘一卡通消費(fèi)數(shù)據(jù),識(shí)別經(jīng)濟(jì)困難學(xué)生,結(jié)合線下學(xué)生表現(xiàn)進(jìn)行綜合研判后,直接發(fā)放經(jīng)濟(jì)補(bǔ)助[4]。
總之,通過數(shù)據(jù)挖掘可以對(duì)教育數(shù)據(jù)進(jìn)行從微觀到宏觀的統(tǒng)計(jì)、分析、綜合和推理,加快校園信息化建設(shè)進(jìn)程,指導(dǎo)教育教學(xué)實(shí)際問題的解決,發(fā)現(xiàn)教育現(xiàn)象之間的相互關(guān)聯(lián)和規(guī)則,從而可以更好地做出教育預(yù)測(cè)和實(shí)施教育決策,促進(jìn)教育教學(xué)的變革與創(chuàng)新,引領(lǐng)教育教學(xué)發(fā)展的新方向。
參考文獻(xiàn)
[1] 徐華.數(shù)據(jù)挖掘:方法與應(yīng)用[M].北京:清華大學(xué)出版社,2017.
[2] 劉科生,倪義坤.高校學(xué)生工作數(shù)據(jù)挖掘的研究和實(shí)踐[J/OL].北京航空航天大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版).(2019-01-04)[2019-06-05].https://doi.org/10.13766/j.bhsk.1008-2204.2019.0017.
[3] 王菲.數(shù)據(jù)挖掘在圖書館用戶行為分析上的應(yīng)用研究[D].上海:上海交通大學(xué),2013.
[4] 劉陽(yáng).數(shù)據(jù)挖掘在高校學(xué)生管理系統(tǒng)中的應(yīng)用[D].哈爾濱:哈爾濱工程大學(xué),2013.