文益民,易新河,李憂喜 ,文博奚
(桂林電子科技大學(xué) 1.計(jì)算機(jī)與信息安全學(xué)院;2.現(xiàn)代教育技術(shù)中心,廣西 桂林 541004)
?
·項(xiàng)目論文·
高校人才培養(yǎng)全過程與信息技術(shù)深度融合中的數(shù)據(jù)挖掘
文益民1,2,易新河1,李憂喜1,文博奚1
(桂林電子科技大學(xué)1.計(jì)算機(jī)與信息安全學(xué)院;2.現(xiàn)代教育技術(shù)中心,廣西桂林541004)
摘要:針對當(dāng)前我國高校對教育數(shù)據(jù)挖掘重視程度不夠,教育數(shù)據(jù)挖掘的應(yīng)用范圍不廣,教育數(shù)據(jù)挖掘的研究成果還沒有得到很有效應(yīng)用的現(xiàn)狀,以高校人才培養(yǎng)過程為線索,綜述了高校人才培養(yǎng)全過程的五個階段中的數(shù)據(jù)挖掘研究工作,并分析了數(shù)據(jù)挖掘?qū)Ω咝=逃畔⒒娜齻€新要求。
關(guān)鍵詞:教育數(shù)據(jù)挖掘;大數(shù)據(jù);人才培養(yǎng)
引言
維克托·邁爾-舍恩伯格和肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》提出大數(shù)據(jù)具有4V特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)[1]。目前大數(shù)據(jù)已得到各國學(xué)術(shù)界、政府機(jī)構(gòu)和企業(yè)界的高度重視。國際著名學(xué)術(shù)期刊Nature和Science分別于2008年和2011年推出大數(shù)據(jù)??幻绹?012年啟動了大數(shù)據(jù)研究與發(fā)展計(jì)劃,提出“通過收集、處理龐大而復(fù)雜的數(shù)據(jù)信息,從中獲得知識和洞見,提升能力,加快科學(xué)、工程領(lǐng)域的創(chuàng)新步伐,強(qiáng)化美國國土安全,轉(zhuǎn)變教育和學(xué)習(xí)模式”;沃爾瑪利用語義數(shù)據(jù)進(jìn)行文本分析、機(jī)器學(xué)習(xí)和同義詞挖掘等,使得在線購物完成率提升了10%-15%;PredPol公司利用大數(shù)據(jù)分析算法預(yù)測犯罪發(fā)生的幾率,可以精確到500平方英尺的范圍。在洛杉磯運(yùn)用該算法的地區(qū),盜竊罪和暴力犯罪分別下降了33%和21%。大數(shù)據(jù)讓人清醒地認(rèn)識到了數(shù)據(jù)的價值。
在教育領(lǐng)域也積累了大量數(shù)據(jù)[2],美國于2012年發(fā)布的《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》介紹了美國國內(nèi)大數(shù)據(jù)教育應(yīng)用領(lǐng)域和案例及應(yīng)用實(shí)施所面臨的挑戰(zhàn);《新媒體聯(lián)盟地平線報(bào)告(2014高等教育版)》提出:教育范式正在向包含更多的在線學(xué)習(xí)、混合式學(xué)習(xí)和協(xié)作學(xué)習(xí)的方向轉(zhuǎn)移,“翻轉(zhuǎn)課堂”和“學(xué)習(xí)分析”一年內(nèi)漸被采納。到目前為止,教育數(shù)據(jù)挖掘已經(jīng)引起了國際學(xué)術(shù)界的高度重視,成立了國際教育數(shù)據(jù)挖掘協(xié)會,發(fā)起了國際教育數(shù)據(jù)挖掘會議,發(fā)表了多篇關(guān)于教育數(shù)據(jù)挖掘的綜述[3-9]和專著[10,11]。2013年中國高等教育學(xué)會院校研究分會專門舉辦了“院校研究數(shù)據(jù)分析的對象、內(nèi)容和方法”研討會[12]。
我國《教育信息化十年發(fā)展規(guī)劃(2011-2020年)》提出:重點(diǎn)推進(jìn)信息技術(shù)與高等教育的深度融合,促進(jìn)教育內(nèi)容、教學(xué)手段和方法現(xiàn)代化,創(chuàng)新人才培養(yǎng)、科研組織和社會服務(wù)模式,推動文化傳承創(chuàng)新,促進(jìn)高等教育質(zhì)量的全面提高。MOOC、SPOC及在線教育正在中國快速發(fā)展。這些都表明:信息技術(shù)日益成為高校人才培養(yǎng)過程中不可或缺的重要組成。數(shù)據(jù)挖掘是現(xiàn)代信息技術(shù)的一種,以發(fā)現(xiàn)數(shù)據(jù)中的知識為目的[13]。本文以高校人才培養(yǎng)全過程為線索,綜述數(shù)據(jù)挖掘在高校人才培養(yǎng)全過程中的種種應(yīng)用,并分析數(shù)據(jù)挖掘給高校教育信息化帶來的新要求。本文的主要貢獻(xiàn)在于:從高校人才培養(yǎng)的角度對數(shù)據(jù)挖掘在高校人才培養(yǎng)過程中的應(yīng)用提供了一個較完整的介紹,并分析了數(shù)據(jù)挖掘給高校教育信息化帶來的三個新要求,使得我們可以更好地從大系統(tǒng)的高度來進(jìn)行高校人才培養(yǎng)與信息技術(shù)相融合的頂層設(shè)計(jì)。
一、高校人才培養(yǎng)全過程的內(nèi)涵
高校人才培養(yǎng)是個系統(tǒng)工程。到目前為止,關(guān)于高校人才培養(yǎng)模式和人才培養(yǎng)全過程,學(xué)術(shù)界并沒有給出規(guī)范的定義。劉獻(xiàn)君等提出人才培養(yǎng)模式不僅僅關(guān)涉“教學(xué)”過程,更關(guān)涉“教育”過程,它涉及到了教育的全過程,遠(yuǎn)遠(yuǎn)超出教學(xué)的范疇……人才培養(yǎng)模式的創(chuàng)新,要樹立以學(xué)生為本的核心理念[14];鐘秉林提出人才培養(yǎng)模式改革是高等學(xué)校內(nèi)涵建設(shè)的核心,深化高校人才培養(yǎng)模式改革需從如下方面著手:科學(xué)定位,明確人才培養(yǎng)目標(biāo)和規(guī)格;加強(qiáng)專業(yè)建設(shè)和改革,建立科學(xué)的專業(yè)體系;優(yōu)化課程體系和教學(xué)內(nèi)容;重視能力培養(yǎng);改革教學(xué)方法和教學(xué)手段;倡導(dǎo)教學(xué)科研融合;完善內(nèi)部質(zhì)量保障體系[15]。
參考以上理論,本文按照時間順序?qū)⒏咝H瞬排囵B(yǎng)全過程劃分為如下五個階段:人才培養(yǎng)方案設(shè)計(jì)階段、招生階段、學(xué)生在校學(xué)習(xí)與生活階段、學(xué)生就業(yè)階段以及校友跟蹤調(diào)查階段。人才培養(yǎng)方案設(shè)計(jì)階段包括:人才需求及需求標(biāo)準(zhǔn)設(shè)置、人才培養(yǎng)目標(biāo)確定、課程設(shè)置與教學(xué)方法選擇。招生是高校人才培養(yǎng)工作的入口?!秶H工程教育認(rèn)證通用標(biāo)準(zhǔn)》提出學(xué)校要具有吸引優(yōu)秀生源的制度和措施。招生階段包括:招生宣傳及新生招錄。學(xué)生在校學(xué)習(xí)與生活階段包括:專業(yè)選擇、課堂學(xué)習(xí)、第二課堂學(xué)習(xí)、參加考試、參與科研與創(chuàng)新創(chuàng)業(yè)活動、參加各種學(xué)科競賽、參加各種文化活動及在校消費(fèi)。學(xué)生就業(yè)階段包括:學(xué)校人才供給信息發(fā)布、就業(yè)信息推送、學(xué)生就業(yè)單位選擇、學(xué)生創(chuàng)業(yè)及畢業(yè)生調(diào)查。校友跟蹤調(diào)查階段包括:校友調(diào)查和用人單位調(diào)查。在這五個階段中最關(guān)鍵的是學(xué)生在校生活與學(xué)習(xí)階段。
二、高校人才培養(yǎng)全過程中的數(shù)據(jù)挖掘
1.人才培養(yǎng)方案設(shè)計(jì)階段
專業(yè)人才培養(yǎng)方案是高校實(shí)施人才培養(yǎng)的綱領(lǐng)性文件。在這個階段中,對新專業(yè)建設(shè)而言,高校首先要從行業(yè)、企業(yè)及社會獲得專業(yè)人才需求的數(shù)量、發(fā)展趨勢、職位要求及專業(yè)聲譽(yù)等信息,然后要結(jié)合高等教育本身的規(guī)律、國家或者區(qū)域的發(fā)展規(guī)劃、學(xué)校開辦這個專業(yè)的基礎(chǔ)等去回答一個專業(yè)是否值得辦,是否能辦,進(jìn)而設(shè)計(jì)專業(yè)的人才培養(yǎng)目標(biāo)、畢業(yè)標(biāo)準(zhǔn)、課程設(shè)置及適用的教學(xué)方法等。對于已有專業(yè)而言,則需要利用這些信息對專業(yè)人才培養(yǎng)方案進(jìn)行調(diào)整。
當(dāng)前,用人單位一般都在招聘網(wǎng)站上發(fā)布各類職位招聘信息,這些信息可為高校專業(yè)人才培養(yǎng)方案設(shè)計(jì)提供豐富的基礎(chǔ)數(shù)據(jù)。Carlson等利用信息抽取技術(shù)從招聘網(wǎng)站提取職位名稱、工作地點(diǎn)、職位類型、職位提供者、職位要求、職位發(fā)布時間等[16];王靜等提出利用樹型結(jié)構(gòu)分層條件隨機(jī)從智聯(lián)招聘、中國人才招聘網(wǎng)和中國英才網(wǎng)提取招聘網(wǎng)頁中的招聘單位名稱、職位名稱、職位描述、薪金和職位要求等信息[17];廖樂健等利用本體與規(guī)則相結(jié)合的方法,消解招聘網(wǎng)頁中詞的歧義,以提取更準(zhǔn)確的招聘信息[18];王西鋒等利用中文命名實(shí)體的識別方法提取招聘單位名稱、職位名稱[19];俞琰利用隱馬爾科夫方法從招聘網(wǎng)站提取招聘職位名稱、專業(yè)名稱、招聘人數(shù)及職位對年齡、性別、工齡、專業(yè)、學(xué)歷及技能的要求[20]。
從網(wǎng)頁中抽取到相關(guān)數(shù)據(jù)后,便可以利用數(shù)據(jù)挖掘算法進(jìn)行深入分析,為專業(yè)人才培養(yǎng)方案設(shè)計(jì)提供參考。鐘曉旭等[21]利用從招聘網(wǎng)站獲取的招聘數(shù)據(jù)分析職位與學(xué)歷的關(guān)系、職位與專業(yè)的關(guān)系;本文作者則利用從招聘網(wǎng)站上爬取到的工作地點(diǎn)、招聘人數(shù)、學(xué)歷、職位職責(zé)及職位要求等數(shù)據(jù),根據(jù)自建的課程名稱庫,分析課程之間的關(guān)聯(lián)關(guān)系,分析職位需求的熱點(diǎn)區(qū)域,還進(jìn)行職位聚類以設(shè)計(jì)針對一類職位的課程,為專業(yè)的課程設(shè)置提供依據(jù)。但是,到目前為止,這方面的研究工作還不多。
2.招生階段
招生階段的核心工作是完成招錄指標(biāo)任務(wù),招錄到質(zhì)量高的新生。招生宣傳是宣傳學(xué)校,吸引考生的重要措施。任湘郴等以大一學(xué)生為調(diào)查對象,發(fā)放調(diào)查問卷,主要涉及高考志愿填報(bào)及錄取期間對高考的意義、高校的認(rèn)知、宣傳渠道的偏好、宣傳方式方法的選擇、宣傳效果的主觀認(rèn)定等14個項(xiàng)目,對其進(jìn)行主成份分析,發(fā)現(xiàn)如下因素會較大地影響招生宣傳的效果:考生對高等教育及高校的認(rèn)知和價值判斷,獲取信息的有效渠道,考生在獲取信息時對其呈現(xiàn)方式的偏好及考生對高校宣傳活動的感受和認(rèn)可情況[22]。
根據(jù)第35次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告,截至2014年12月,我國網(wǎng)民10-19歲和40-49歲年齡段分別達(dá)到22.8%和12.3%。這說明高校招生網(wǎng)站已經(jīng)成為高考考生和其父母收集高校及其專業(yè)信息的主要渠道之一。費(fèi)志勇等提出了基于本體的招生信息揭示方法,通過分面組配來大大減少考生或考生家長從招生網(wǎng)站上獲取相關(guān)信息的步驟,以提高招生宣傳信息揭示的效率[23]。網(wǎng)站分析是通過網(wǎng)站獲取用戶信息的重要手段。曹梅等利用網(wǎng)站的連接特征指標(biāo)、流量指標(biāo)等網(wǎng)絡(luò)計(jì)量指標(biāo),分析31個省級教育門戶網(wǎng)站的影響力[24];張勇進(jìn)等提出通過用戶的網(wǎng)絡(luò)屬性、社會屬性和注冊內(nèi)容等分析判斷用戶需求被滿足的程度,進(jìn)而識別用戶公共需求[25]。如果能對高校招生網(wǎng)站進(jìn)行類似的分析,就能更準(zhǔn)確地了解用戶需求,從而決定招生宣傳及招生指標(biāo)投放的重點(diǎn)區(qū)域,以有效提升高校招生網(wǎng)站的影響力和用戶體驗(yàn)感。
楊悅等提出利用數(shù)據(jù)挖掘方法可進(jìn)行考生成績分析、錄取預(yù)測、學(xué)生綜合素質(zhì)分類、招生計(jì)劃分配及考生專業(yè)需求變化發(fā)現(xiàn)等[26];侯亞榮等利用高考成績分析考生語文、數(shù)學(xué)、外語、綜合這四門課程及課程成績等級之間的關(guān)聯(lián)關(guān)系[27];何小明等分析了考生填報(bào)的專業(yè)之間的關(guān)聯(lián)性,以用于指導(dǎo)志愿填報(bào)[28];俸世洲等利用關(guān)聯(lián)規(guī)則分析工具分析考生填報(bào)專業(yè)之間的關(guān)聯(lián)關(guān)系,以優(yōu)化高考指標(biāo)投放分配[29];孫曉瑩利用河南某普通高校歷年的招生數(shù)據(jù),對其重構(gòu)后使用支持向量機(jī)預(yù)測招生人數(shù)[30];李敬文等利用學(xué)生的高考錄取批次、生源地、對學(xué)校的喜歡程度、錄取省控制線、招生計(jì)劃及上線一志愿報(bào)考人數(shù),利用模糊灰色模型預(yù)測高校的高考錄取分?jǐn)?shù)線[31];劉思宏等使用學(xué)生的高考成績、性別、戶口類別、考生類別、地區(qū)、專業(yè)和錄取批次,利用決策樹方法分析影響學(xué)生報(bào)到的因素,以預(yù)測學(xué)生是否會來校報(bào)到[32]。
3.學(xué)生在校學(xué)習(xí)與生活階段
學(xué)生在校學(xué)習(xí)與生活階段是高校人才培養(yǎng)的關(guān)鍵階段。利用這階段產(chǎn)生的數(shù)據(jù)可以進(jìn)行:學(xué)習(xí)內(nèi)容選擇分析、線上學(xué)習(xí)行為分析、線下學(xué)習(xí)行為分析、學(xué)習(xí)狀況分析與評價及在校消費(fèi)行為分析等。
學(xué)習(xí)內(nèi)容選擇分析是指根據(jù)學(xué)生自身特點(diǎn)、學(xué)習(xí)目標(biāo)、學(xué)習(xí)環(huán)境及歷史學(xué)習(xí)行為分析學(xué)生的學(xué)習(xí)特點(diǎn),并根據(jù)此特點(diǎn)向?qū)W生推薦課程或者學(xué)習(xí)路徑,以提高學(xué)習(xí)效率和學(xué)習(xí)效果。周麗娟等對課程進(jìn)行聚類,以構(gòu)建無缺失的課程評價矩陣,在此基礎(chǔ)上根據(jù)學(xué)生對相似課程的評分預(yù)測學(xué)生的興趣愛好,為學(xué)生提供個性化的課程推薦[33];沈苗等利用學(xué)生基本信息對學(xué)生進(jìn)行分類和對課程進(jìn)行加權(quán)[34],潘偉利用學(xué)生與課程的交互行為對學(xué)生進(jìn)行聚類[35],然后利用協(xié)同過濾算法實(shí)施課程推薦;Parameswaran等研究了選課系統(tǒng)對學(xué)生選課有約束的情形下對課程的協(xié)同過濾推薦[36]。Chen考慮了學(xué)習(xí)者的水平、課程的難易程度和學(xué)習(xí)內(nèi)容的連續(xù)性,提出了個性化學(xué)習(xí)路徑推薦系統(tǒng)。該系統(tǒng)可根據(jù)預(yù)先測試的學(xué)習(xí)者個人的不正確測試反應(yīng)生成相應(yīng)的學(xué)習(xí)路徑[37];Durand等利用學(xué)習(xí)者的學(xué)習(xí)對象、學(xué)習(xí)領(lǐng)域、學(xué)習(xí)路徑的最大長度、學(xué)習(xí)者的成績、學(xué)習(xí)者當(dāng)前的能力、期望達(dá)到的能力水平及學(xué)習(xí)方式等構(gòu)造了基于馬爾科夫模型的學(xué)習(xí)推薦系統(tǒng)來推薦學(xué)習(xí)路徑[38];程巖利用學(xué)習(xí)者的學(xué)習(xí)風(fēng)格與學(xué)習(xí)水平、學(xué)習(xí)對象的知識表達(dá)特征與難度系數(shù),以及各學(xué)習(xí)者以往的學(xué)習(xí)路徑,利用蟻群算法給學(xué)習(xí)者推薦個性化學(xué)習(xí)路徑[39]。
線上學(xué)習(xí)行為包括學(xué)生使用和選擇各類數(shù)字化教學(xué)資源的行為,在學(xué)習(xí)過程中開展交流的各種行為及學(xué)習(xí)工具的使用行為,甚至包括學(xué)生在進(jìn)行線上學(xué)習(xí)時的情感反應(yīng)等。彭文輝等將線上學(xué)習(xí)行為分為信息檢索行為、信息加工行為、信息發(fā)布行為及溝通交流等四種,以及高、中、底三個層次[40]。線上學(xué)習(xí)行為分析與學(xué)習(xí)分析關(guān)系密切。世界學(xué)習(xí)分析研究會(SoLAR)認(rèn)為學(xué)習(xí)分析是對學(xué)生學(xué)習(xí)過程和學(xué)習(xí)環(huán)境信息的測量、收集、分析及報(bào)告,以更好地理解并優(yōu)化學(xué)生學(xué)習(xí)過程和學(xué)習(xí)環(huán)境。Ferguson對到2012年為止的學(xué)習(xí)分析研究成果進(jìn)行了綜述[41];傅鋼善等采集了在校學(xué)生的學(xué)習(xí)時間跨度、學(xué)習(xí)總時長、學(xué)習(xí)次數(shù)、在線學(xué)習(xí)時長、重復(fù)學(xué)習(xí)率、討論交流、學(xué)習(xí)筆記及接收短信數(shù)量等八種學(xué)習(xí)行為特征,利用數(shù)據(jù)挖掘方法和統(tǒng)計(jì)方法分析其與學(xué)習(xí)效果之間的關(guān)系[42];田娜等采集了學(xué)生完成的課時、作業(yè)分?jǐn)?shù)、教學(xué)材料的瀏覽次數(shù)、登陸次數(shù)、頁面瀏覽時間、發(fā)帖回帖的次數(shù)等數(shù)據(jù),分析這些學(xué)習(xí)行為與課程成績之間的關(guān)系[43];魏順平采集了學(xué)生在線學(xué)習(xí)時登陸學(xué)習(xí)平臺的次數(shù)、各教學(xué)資源的瀏覽情況來分析學(xué)習(xí)平臺各模塊之間的訪問跳轉(zhuǎn)及學(xué)生學(xué)習(xí)群體特征[44];蔣卓軒等采集了學(xué)生選修北京大學(xué)在Coursera上開設(shè)的6門慕課的學(xué)習(xí)行為數(shù)據(jù),對學(xué)習(xí)者的成績進(jìn)行預(yù)測[45];Thai-Nghe等使用學(xué)生在導(dǎo)教系統(tǒng)中產(chǎn)生的數(shù)據(jù),利用矩陣分解模型來預(yù)測學(xué)生掌握了多少知識,是否能完成練習(xí)[46];Liu等提出了一個能分析學(xué)生閱讀文獻(xiàn)時的信息需求,并能給學(xué)生推薦視頻、PPT、程序源代碼等教學(xué)資源的算法[47];黎孟雄等采集學(xué)生對教學(xué)資源的復(fù)制、下載、打印、瀏覽時間等行為后進(jìn)行用戶模糊聚類,以實(shí)現(xiàn)對教學(xué)資源的推薦[48]。
線下學(xué)習(xí)行為是指學(xué)生不在在線學(xué)習(xí)平臺上展開的學(xué)習(xí)行為。這些學(xué)習(xí)行為包括學(xué)生的圖書借閱行為、在教室里的各類學(xué)習(xí)行為,比如舉手回答問題、抬頭看黑板、低頭閱讀學(xué)習(xí)內(nèi)容等,還包括學(xué)生應(yīng)用所學(xué)知識解決實(shí)際問題時產(chǎn)生的行為。舒忠梅等采用回歸分析方法得到關(guān)于學(xué)生學(xué)習(xí)滿意度的20個獨(dú)立變量:學(xué)生生源情況、學(xué)校學(xué)習(xí)資源提供、學(xué)生學(xué)習(xí)投入、校園文化、學(xué)生學(xué)習(xí)成果等,然后使用決策樹方法分析學(xué)生的學(xué)習(xí)滿意度與各獨(dú)立變量之間的關(guān)系,為學(xué)校改進(jìn)教學(xué)工作提高學(xué)生學(xué)習(xí)滿意度提供參考[49]。在以上提及的線下學(xué)習(xí)行為中,除了圖書借閱行為便于采集以外,其他目前還不便于采集。學(xué)生的圖書借閱行為能反映學(xué)生的閱讀興趣、學(xué)習(xí)態(tài)度和職業(yè)追求,但目前這方面的研究成果尚少。錢強(qiáng)等使用借閱信息,如:讀者證號、控制號、條形碼、借出時刻、應(yīng)還時刻、實(shí)還時刻、續(xù)借次數(shù)及圖書信息,使用SOM算法將學(xué)生聚類成九類,發(fā)現(xiàn)各類學(xué)生在借閱內(nèi)容、借閱次數(shù)上有著較明顯的差別[50]。根據(jù)學(xué)生的圖書借閱行為,可以分析學(xué)生的閱讀偏好,從而進(jìn)行圖書推薦。董坤提取讀者借閱書目、學(xué)科專業(yè)、學(xué)歷、角色等信息計(jì)算相似讀者,使用協(xié)同過濾算法進(jìn)行圖書推薦[51];李樹青等利用大學(xué)生在圖書館的圖書借閱數(shù)據(jù)構(gòu)造二分網(wǎng)絡(luò),以此為基礎(chǔ)設(shè)計(jì)了一種測度圖書可推薦質(zhì)量的迭代算法,結(jié)合圖書類別目錄層次、標(biāo)題語義信息的提取處理方法、基于加權(quán)XML模型的用戶個性化模式表達(dá)方法及其權(quán)值擴(kuò)散策略,提出了三種圖書館個性化圖書推薦算法[52];付沙、田元等根據(jù)讀者借閱圖書記錄,利用關(guān)聯(lián)規(guī)則挖掘方法進(jìn)行圖書的關(guān)聯(lián)分析,以實(shí)現(xiàn)圖書推薦[53,54];李克潮等結(jié)合讀者專業(yè)、性別、年級及借還時間間隔計(jì)算讀者之間基于云的相似度,向讀者推薦有復(fù)本的圖書[55]。
學(xué)習(xí)狀況分析與評價包括:考試成績分析、學(xué)業(yè)預(yù)警及生源質(zhì)量分析等??荚囀钱?dāng)前高校評價學(xué)生學(xué)習(xí)效果的重要手段之一,分析影響考試成績的因素是考試分析的主要任務(wù)。武森等根據(jù)學(xué)生若干門課程的成績將學(xué)生聚類,分析各類學(xué)生的強(qiáng)勢課程和弱勢課程,并分析選擇專業(yè)之后各類學(xué)生的強(qiáng)勢課程和弱勢課程的變化[56];丁智斌等利用含學(xué)號、性別、英語成績、社會活動情況、文體活動情況、平均成績、名次等這些數(shù)據(jù)庫字段分析影響高校學(xué)生學(xué)習(xí)成績的因素[57]。學(xué)業(yè)預(yù)警是指根據(jù)學(xué)生前一階段的表現(xiàn)預(yù)測學(xué)生是否會輟學(xué)。學(xué)業(yè)預(yù)警使得教師能盡早實(shí)施干預(yù),促使學(xué)生順利完成學(xué)業(yè)。Bayer等通過電子郵件和論壇產(chǎn)生的學(xué)生社會行為數(shù)據(jù),構(gòu)建一個社交圖來預(yù)測學(xué)生的輟學(xué)和上學(xué)失敗率[58];萬星火等針對高校招生規(guī)模擴(kuò)大,學(xué)生整體素質(zhì)下滑,學(xué)業(yè)完成情況惡化等教育問題,選擇普通話成績、計(jì)算機(jī)二級成績、英語四級成績、績點(diǎn)、選修課、已修學(xué)分、累積不及格課程門數(shù)及累積所欠學(xué)分等數(shù)據(jù),利用核主成分分析方法建立了大學(xué)生學(xué)業(yè)預(yù)警模型,實(shí)現(xiàn)對大學(xué)生學(xué)業(yè)的動態(tài)定性預(yù)警與定量預(yù)警[59]。利用學(xué)生進(jìn)入大學(xué)后的成績,結(jié)合高考數(shù)據(jù)可進(jìn)行生源質(zhì)量分析。鄧溪瑤等對K大學(xué)畢業(yè)的16320名本科生的四年GPA與其省份來源數(shù)據(jù)進(jìn)行分析,構(gòu)建了EI指數(shù)以評測K大學(xué)學(xué)生群體在地域維度上的學(xué)業(yè)表現(xiàn)差異,以科學(xué)合理地確定分省招生計(jì)劃[60];邢濤采集了新生入學(xué)數(shù)據(jù)庫和學(xué)生成績數(shù)據(jù)庫(含競賽類和科研類成績)中的相關(guān)數(shù)據(jù),利用小波閾值聚類算法對學(xué)生進(jìn)行聚類,在聚類后進(jìn)行關(guān)聯(lián)分析,從而評價生源質(zhì)量[61]。
學(xué)生消費(fèi)信息能為高校人才培養(yǎng)提供更全面的信息。從學(xué)生消費(fèi)中可以了解學(xué)生的消費(fèi)習(xí)慣、生活價值觀及課余時間使用等信息。蔡建偉等采集了家庭月均收入、每月消費(fèi)總支出、食物支出、衣著支出、娛樂支出、學(xué)習(xí)支出和通訊支出等在校消費(fèi)數(shù)據(jù),對大學(xué)生在校消費(fèi)水平與消費(fèi)結(jié)構(gòu)進(jìn)行量化分析,采用聚類分析方法將三類家庭的大學(xué)生分成高、中、低三類消費(fèi)水平,并分析各類學(xué)生的消費(fèi)特征[62]。當(dāng)前很多高校都裝備了一卡通系統(tǒng),然而到目前為止還基本沒有看到對一卡通數(shù)據(jù)進(jìn)行挖掘分析的研究成果。
4.學(xué)生就業(yè)階段
這個階段的主要工作是促進(jìn)學(xué)生就業(yè),為學(xué)生就業(yè)選擇提供充足信息,并對畢業(yè)生進(jìn)行調(diào)查為改進(jìn)人才培養(yǎng)方案提供參考。薛瑞峰等以師范學(xué)院大學(xué)生的專業(yè)綜合成績、計(jì)算機(jī)水平、學(xué)生是否就業(yè)及就業(yè)單位的性質(zhì)等數(shù)據(jù)分析學(xué)生的就業(yè)去向與其成績之間的關(guān)系[63];張曉萍等利用高校就業(yè)信息數(shù)據(jù)表中的數(shù)據(jù),采用量化關(guān)聯(lián)方法分析畢業(yè)生在校表現(xiàn)與其就業(yè)質(zhì)量之間的關(guān)系[64];楊克玉等利用院系名稱、專業(yè)名稱、職業(yè)名稱、工作城市名稱、獲得第一份工作的渠道等數(shù)據(jù)分析學(xué)生專業(yè)與職業(yè)及職業(yè)與職業(yè)之間的關(guān)聯(lián)關(guān)系[65];樊春蘭等采集了畢業(yè)生信息及學(xué)生是否就業(yè)等數(shù)據(jù),訓(xùn)練神經(jīng)網(wǎng)絡(luò)以實(shí)現(xiàn)對成功就業(yè)的預(yù)測[66];劉玉華等采集學(xué)生個人信息、從事行業(yè)及從事崗位、企業(yè)信息及招聘崗位等數(shù)據(jù),進(jìn)行聚類分析和關(guān)聯(lián)分析,以實(shí)現(xiàn)面向畢業(yè)生的就業(yè)信息推薦和面向企業(yè)的人才信息推薦[67]。畢業(yè)生調(diào)查可為學(xué)校進(jìn)一步改進(jìn)人才培養(yǎng)方案提供有效的參考,但目前還未見到相關(guān)研究成果。
5.校友跟蹤調(diào)查階段
校友資源的綜合開發(fā)與研究已成為高等教育研究的一個熱門話題。賀美英等提出校友畢業(yè)后的工作經(jīng)歷和體驗(yàn),對學(xué)校人才培養(yǎng)和教學(xué)改革起著重要的推動作用[68];李歡等認(rèn)為從校友那里獲得的反饋可為更新人才培養(yǎng)方案提供非常重要的參考[69]。范靜波等利用回歸分析方法進(jìn)行實(shí)證研究發(fā)現(xiàn)高等教育生源質(zhì)量和教育質(zhì)量確實(shí)對工作收入存在顯著的影響[70];李永山通過對校友的問卷調(diào)查,發(fā)現(xiàn)社會實(shí)踐、學(xué)習(xí)動機(jī)、校風(fēng)學(xué)風(fēng)、社會環(huán)境、個性特征、發(fā)展機(jī)遇等六種要素對于大學(xué)生成長成才具有非常重要的作用[71];鞏建閩等通過設(shè)計(jì)調(diào)查問卷獲得校友對專業(yè)能力和職業(yè)素質(zhì)對其從事行業(yè)的重要性、校友對剛就業(yè)學(xué)生的專業(yè)能力和職業(yè)素質(zhì)的評價、校友對在校期間開設(shè)的一些主要課程的評價及校友個人信息,分析了大學(xué)開設(shè)的課程對“繼續(xù)深造學(xué)生”和“直接工作學(xué)生”的重要程度,對畢業(yè)生應(yīng)該具備的能力進(jìn)行了聚類分析[72]。
當(dāng)前我國高校教育信息化已經(jīng)取得巨大成果,這為利用數(shù)據(jù)挖掘技術(shù)對高校人才培養(yǎng)進(jìn)行深入分析提供了很好的基礎(chǔ)。但從以上分析來看還存在不少問題:第一,對數(shù)據(jù)挖掘的重視程度不夠。主要體現(xiàn)在高校對數(shù)據(jù)挖掘在人才培養(yǎng)過程中的支持作用認(rèn)識不到位。比如,各高校已經(jīng)積累了大量的教學(xué)管理數(shù)據(jù),但當(dāng)前這些數(shù)據(jù)主要用于記錄學(xué)生的學(xué)習(xí)過程,很少對其進(jìn)行深入分析后反饋學(xué)生或者教師。另外,關(guān)于高校人才培養(yǎng)數(shù)據(jù)挖掘的研究成果很少發(fā)表在高水平的學(xué)術(shù)刊物上,哪怕是教育類的重要刊物也較少發(fā)表這方面的論文。第二,針對人才培養(yǎng)數(shù)據(jù)挖掘的研究與應(yīng)用不平衡。目前高校對學(xué)生在校學(xué)習(xí)與生活階段進(jìn)行數(shù)據(jù)挖掘的研究工作較多,而對人才培養(yǎng)全過程中其他階段的研究較少。第三,數(shù)據(jù)挖掘的研究成果對高校人才培養(yǎng)的貢獻(xiàn)還不夠大。目前主要停留在研究階段,實(shí)實(shí)在在地利用這些研究成果去指導(dǎo)、改革高校人才培養(yǎng)工作的成果還很少。
三、數(shù)據(jù)挖掘?qū)Ω咝=逃畔⒒男乱?/p>
從以上文獻(xiàn)綜述可以知道,數(shù)據(jù)挖掘適用于高校人才培養(yǎng)各個階段中的數(shù)據(jù)分析,可讓高校更準(zhǔn)確地了解學(xué)生或更好地為學(xué)生提供各項(xiàng)服務(wù),大學(xué)管理要形成用數(shù)據(jù)“說話”的理性決策思維[73]。但是要充分發(fā)揮數(shù)據(jù)挖掘在高校人才培養(yǎng)中的作用,還有賴于高校教育信息化水平質(zhì)的提升。
1.提升高校人才培養(yǎng)全過程中各階段的數(shù)據(jù)采集能力
要進(jìn)行教育數(shù)據(jù)挖掘,首先需要數(shù)據(jù)。因此,高校需以人才培養(yǎng)全過程為主線,切實(shí)構(gòu)建各階段的數(shù)據(jù)采集能力。除了要繼續(xù)完善已建立的各類數(shù)據(jù)庫系統(tǒng)外,高校還要重視開發(fā)各類數(shù)據(jù)采集軟件,以從現(xiàn)有的服務(wù)器日志系統(tǒng)、一卡通系統(tǒng)、移動設(shè)備后臺系統(tǒng)、校園監(jiān)控系統(tǒng)、招生招聘網(wǎng)站、網(wǎng)絡(luò)教學(xué)系統(tǒng)、各類教學(xué)軟件等提取人才培養(yǎng)分析所需的數(shù)據(jù)。比如:招生網(wǎng)站要有采集用戶瀏覽行為的功能,課堂教學(xué)質(zhì)量監(jiān)控系統(tǒng)要有采集學(xué)習(xí)與教學(xué)行為數(shù)據(jù)的功能。另外,對一些不便于使用計(jì)算機(jī)軟件采集的數(shù)據(jù)要做好抽樣調(diào)查。這就要求高校在推進(jìn)教育信息化過程中要有良好的數(shù)據(jù)素養(yǎng)與數(shù)據(jù)采集意識,在開發(fā)各類教育教學(xué)信息化平臺時對于數(shù)據(jù)采集予以充分重視。另外,還需特別重視數(shù)據(jù)的積累,數(shù)據(jù)的歷史積累能夠?yàn)楹芏嗳瞬排囵B(yǎng)相關(guān)問題的分析帶來很大好處。
2.詳細(xì)設(shè)計(jì)對高校人才培養(yǎng)全過程實(shí)施數(shù)據(jù)挖掘所需的各類數(shù)據(jù)
要以高等教育學(xué)原理為指導(dǎo),詳細(xì)設(shè)計(jì)以人才培養(yǎng)為中心的數(shù)據(jù)體系及數(shù)據(jù)標(biāo)準(zhǔn),以實(shí)現(xiàn)對高校人才培養(yǎng)全過程的“全息”測量。這里的“全息”要求在縱向上覆蓋大學(xué)生接受教育的各階段,在橫向上覆蓋大學(xué)生在校學(xué)習(xí)、生活的各方面。另外,采集的數(shù)據(jù)在粒度上要有層次。比如,成績管理系統(tǒng)不能只存儲課程考試總成績,還需在更細(xì)的粒度上存儲學(xué)生各道測試題的得分,甚至還要記錄與各道測試題相關(guān)的知識點(diǎn);視頻教學(xué)系統(tǒng)不能只簡單記錄學(xué)生看了多少次,還需詳細(xì)記錄學(xué)生觀看視頻時的倒退次數(shù)及倒退發(fā)生的時間等行為,等等。人才培養(yǎng)的復(fù)雜性對這種“全息”數(shù)據(jù)提出了迫切需求。各種移動應(yīng)用為采集人才培養(yǎng)“全息”數(shù)據(jù)提供了有力且有效的技術(shù)支持;國務(wù)院《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》(國發(fā)(2015)50號)提出“要實(shí)現(xiàn)學(xué)生學(xué)籍檔案在不同教育階段的縱向貫通”,為采集人才培養(yǎng)“全息”數(shù)據(jù)也提供了政策支持。
3.創(chuàng)新機(jī)制促進(jìn)高校人才培養(yǎng)全過程數(shù)據(jù)的校內(nèi)共享和校際共享
由于管理體制的原因,當(dāng)前要想獲得高校內(nèi)部各部門關(guān)于人才培養(yǎng)的數(shù)據(jù)不是件容易的事,至于要實(shí)現(xiàn)校際之間的數(shù)據(jù)共享更是難事。然而,不這么做就無法通過數(shù)據(jù)挖掘從數(shù)據(jù)中獲得可信度高的規(guī)律與模式,也無法有效地驗(yàn)證這些規(guī)律與模式。因此,教育行政管理部門和各高校應(yīng)該打破私心,積極創(chuàng)新促進(jìn)高校人才培養(yǎng)全過程數(shù)據(jù)共享的機(jī)制。比如:通過制定校內(nèi)或者校際的數(shù)據(jù)管理辦法,對數(shù)據(jù)的采集、使用、成果發(fā)布及應(yīng)用做出明確規(guī)定。同時,還需加強(qiáng)教育教學(xué)數(shù)據(jù)標(biāo)準(zhǔn)的研制工作。2012年教育部發(fā)布了7個教育管理信息行業(yè)標(biāo)準(zhǔn),4個教育資源建設(shè)方面的標(biāo)準(zhǔn)。目前與學(xué)習(xí)者、虛擬實(shí)驗(yàn)與學(xué)習(xí)、多媒體教學(xué)環(huán)境、在線課程等相關(guān)的數(shù)據(jù)標(biāo)準(zhǔn)正在研究或者測試中。但這些標(biāo)準(zhǔn)中所描述的數(shù)據(jù)其實(shí)還不足以覆蓋高校人才培養(yǎng)全過程的各個階段,還不能覆蓋各個階段的縱深,還不能完全滿足新一代信息技術(shù)條件下開展教育教學(xué)活動的要求。
(責(zé)任編輯:梁京章)
(感謝華中科技大學(xué)教育科學(xué)研究院張俊超副教授對本文提出的寶貴意見!)
參考文獻(xiàn):
[1]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶. 大數(shù)據(jù)時代[M]. 杭州:浙江人民出版社,2013.
[2]顧小清,林仕麗,袁海軍. 教育數(shù)據(jù)30年:從CMI 到DDDM[J].電化教育研究,2010(9): 55-63.
[3]BAKER R S J D,YACEF K. The state of educational data mining in 2009: A review and future vision[J]. Journal of educational data mining,2009,1(1): 1-15.
[4]SHU-HSIEN L,PEI-HUI C,PEI-YUAN H. Data mining techniques and applications-a decade review from 2000 to 2011[J]. Expert Systems with Applications,2012,39(12): 11303-11311.
[5]ROMERO C,VENTURA S. Educational data mining: a review of the state of the art[J]. IEEE Transaction on systems,man,and cybernetics,part C: applications and reviews,2010,40(6):601-618.
[6]ROMERO C,VENTURA S. Educational data mining: a survey from 1995 to 2005[J]. Expert Systems with Applications,2007,33(1): 135-146.
[7]ALEJANDRO P A. Educational data mining: A survey and a data mining-based analysis of recent works[J]. Expert Systems with Applications,2014,41(4): 1432-1463.
[8]李婷,傅鋼善. 國內(nèi)外教育數(shù)據(jù)挖掘研究現(xiàn)狀及趨勢分析[J]. 現(xiàn)代教育技術(shù),2010,20(10): 21-25.
[9]周慶,牟超,楊丹.教育數(shù)據(jù)挖掘研究進(jìn)展綜述[J].軟件學(xué)報(bào),2015,26(11):3026-3042.
[10]ROMERO C,VENTURA S,PECHENIZKIY M,et al. Handbook of Educational Data Mining[M]. Ohio,CRC Press,2010.
[11]葛道凱,張少剛,魏順平.教育數(shù)據(jù)挖掘:方法與應(yīng)用[M]. 北京: 教育科學(xué)出版社,2012.
[12]張俊超. 院校研究如何通過數(shù)據(jù)分析為大學(xué)管理決策服務(wù)[J].高等教育研究,2013,34(8):105-109.
[13]韓家煒,KAMBER M,裴健. 數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2012.
[14]劉獻(xiàn)君,吳洪富.人才培養(yǎng)模式改革的內(nèi)涵、制約與出路[J].高等教育研究,2009(12):10-13.
[15]鐘秉林. 人才培養(yǎng)模式改革是高等學(xué)校內(nèi)涵建設(shè)的核心[J]. 高等教育研究,2013,34(11): 71-76.
[16]CARLSON A,SCHAFER C. Bootstrapping Information Extraction from Semi-structured Web Pages[C]//the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases,Antwerp ,2008:195-210.
[17]王靜,劉志鏡. 基于概率模型的Web信息抽取[J]. 模式識別與人工智能,2010,23(6): 847-855.
[18]廖樂健,曹元大,李新穎. 基于Ontology的信息抽取[J]. 計(jì)算機(jī)工程與應(yīng)用,2002(23):109-113.
[19]王西鋒,張曉孿. Web招聘信息抽取中命名實(shí)體識別的研究[J]. 計(jì)算機(jī)與數(shù)字工程,2012,40(5): 34-37.
[20]俞琰. 基于隱馬爾可夫模型的招聘網(wǎng)絡(luò)信息抽取[J]. 北京電子科技學(xué)院學(xué)報(bào),2008,16(4): 93-98.
[21]鐘曉旭,胡學(xué)鋼. 基于數(shù)據(jù)挖掘的Web 招聘信息相關(guān)性分析[J]. 安徽建筑工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版),2010,18(4): 93-96.
[22]任湘郴,何志祥,蔣陽飛,等.高教改革視野下招生宣傳績效評價與解讀[J]. 大學(xué)教育科學(xué),2013(6): 44-47.
[23]費(fèi)志勇,趙新力. 基于本體驅(qū)動的高校網(wǎng)站招生信息分面組配揭示[J]. 圖書情報(bào)工作,2008,52(12): 81-84.
[24]曹梅,閔宇鋒. 教育網(wǎng)站影響力評價的實(shí)證研究——基于我國31個省級教育門戶網(wǎng)站的網(wǎng)絡(luò)計(jì)量[J].開放教育研究,2011,17(6):104-110.
[25]張勇進(jìn),楊道玲. 基于用戶體驗(yàn)的政府網(wǎng)站優(yōu)化:精準(zhǔn)識別用戶需求[J].電子政務(wù),2012(8): 19-27.
[26]楊悅,郭大勇.數(shù)據(jù)挖掘在高校招生工作中的應(yīng)用前景[J].教育科學(xué),2007,23(5):66-68.
[27]侯亞榮,萬雅奇,張書杰. 教育考試數(shù)據(jù)挖掘的研究與實(shí)現(xiàn)[J]. 計(jì)算機(jī)工程與應(yīng)用,2008,44( 16): 132-134.
[28]何小明,張自力,肖燦,等. 基于OLAP與數(shù)據(jù)挖掘的高考招生數(shù)據(jù)分析[J]. 計(jì)算機(jī)科學(xué),2012,39(6):175-178.
[29]俸世洲,周尚波. 關(guān)聯(lián)規(guī)則在獨(dú)立學(xué)院招生決策中的應(yīng)用[J].計(jì)算機(jī)科學(xué)與工程,2012,34(1): 119-123.
[30]孫曉瑩,郭飛燕. 數(shù)據(jù)挖掘在高校招生預(yù)測中的應(yīng)用研究[J].計(jì)算機(jī)仿真,2012,29(4):387-391.
[31]李敬文,陳志鵬,李宜義,等. 組合預(yù)測模型在高考數(shù)據(jù)預(yù)測中的應(yīng)用研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2014,50(7): 259-262.
[32]劉思宏,余飛. 決策樹技術(shù)在高校招生決策中的研究與應(yīng)用[J]. 齊齊哈爾大學(xué)學(xué)報(bào),2014,30(5): 24-28.
[33]周麗娟,徐明升,張研研,等.基于協(xié)同過濾的課程推薦模型[J].計(jì)算機(jī)應(yīng)用研究,2010,27(4):1315-1318.
[34]沈苗,來天平,王素美,等. 北京大學(xué)課程推薦引擎的設(shè)計(jì)和實(shí)現(xiàn)[J]. 智能系統(tǒng)學(xué)報(bào),2015,10(3): 1-6.
[35]潘偉. 基于協(xié)同過濾技術(shù)的個性化課程推薦系統(tǒng)研究[J].現(xiàn)代情報(bào),2009,29(5): 193-196.
[36]PARAMESWARAN A,VENETIS P,GARCIA-MOLINA H. Recommendation systems with complex constraints: A course recommendation perspective[J]. ACM Transactions on Information Systems,2011,29(4):20-33.
[37]CHEN C M.Intelligent web-based learning system with personalized learning path guidance[J].Computers & Education,2008(51):787-814.
[38]DURAND G,LAPLANTE F,KOP R. A learning design recommendation system based on Markov decision processes[C]//The the 17th ACM SIGKDD Conference on Knowledge Discovery and Data Mining workshop,San Diego,2011: 69-76.
[39]程巖.在線學(xué)習(xí)中基于群體智能的學(xué)習(xí)路徑推薦方法[J].系統(tǒng)管理學(xué)報(bào).2011,20(2):232-237.
[40]彭文輝,楊宗凱,黃克斌. 網(wǎng)絡(luò)學(xué)習(xí)行為分析及其模型研究[J]. 中國電化教育,2006(10):31-35.
[41]FERGUSON R. Learning analytics:drivers,developments and challenges[J]. International Journal of Technology Enhanced Learning ,2012,4(5/6),304-317.
[42]傅鋼善,王改花.基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)學(xué)習(xí)行為與學(xué)習(xí)效果研究[J].電化教育研究,2014(9):53-57.
[43]田娜,陳明選.網(wǎng)絡(luò)教學(xué)平臺學(xué)生學(xué)習(xí)行為聚類分析[J].中國遠(yuǎn)程教育,2014(11):38-41.
[44]魏順平.在線學(xué)習(xí)行為特點(diǎn)及其影響因素分析研究[J]. 開放教育研究,2012,18(4):81-90.
[45]蔣卓軒,張巖,李曉明.基于MOOC數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測[J].計(jì)算機(jī)研究與發(fā)展,2015,52(3):614-628.
[46]THAI-NGHE N,HORVáTH T,SCHMIDT-THIEME L. Factorization models for forecasting student performance[C]//The 4th international conference on educational data mining ,Eindhoven,2011: 11-20.
[47]LIU X Z,JIANG Z R,GAO L C. Scientific Information Understanding via Open Educational Resources (OER)[C]// The 38th Annual ACM SIGIR Conference,Santiago,2015:654-654.
[48]黎孟雄,郭鵬飛. 基于模糊聚類的教學(xué)資源自適應(yīng)推薦研究[J]. 中國遠(yuǎn)程教育,2012(7):89-92.
[49]舒忠梅,徐曉東. 學(xué)習(xí)分析視域下的大學(xué)生滿意度教育數(shù)據(jù)挖掘機(jī)分析[J]. 電化教育研究,2014(5):39-43.
[50]錢強(qiáng),李英. 數(shù)據(jù)挖掘技術(shù)在圖書館讀者分析中的應(yīng)用[J].圖書情報(bào)工作,2009(6):121-124.
[51]董坤.基于協(xié)同過濾算法的高校圖書館圖書推薦系統(tǒng)研究[J].現(xiàn)代圖書情報(bào)技術(shù),2011(11):44-47.
[52]李樹青,徐俠許,敏佳.基于讀者借閱二分網(wǎng)絡(luò)的圖書可推薦質(zhì)量測度方法及個性化圖書推薦服務(wù)[J].中國圖書館學(xué)報(bào),2013,39(205):83-95.
[53]付沙. 基于序列模式挖掘的圖書館用戶借閱行為分析[J]. 情報(bào)理論與實(shí)踐,2014,37(6): 103-106.
[54]田元,李佳,宋緯華. 一種基于用戶層次信息的關(guān)聯(lián)規(guī)則圖書推薦系統(tǒng)[J]. 現(xiàn)代情報(bào),2010,30(12):73-76.
[55]李克潮,藍(lán)冬梅,凌霄娥. 云模型和多特征的高校讀者借閱偏好不確定性圖書推薦研究[J]. 現(xiàn)代圖書情報(bào)技術(shù),2013(5): 54-58.
[56]武森,俞曉莉,倪宇,等. 數(shù)據(jù)挖掘中的聚類技術(shù)在學(xué)生成績分析中的應(yīng)用[J].中國管理信息化,2009,12(15): 45-47.
[57]丁智斌,袁方,董賀偉. 數(shù)據(jù)挖掘在高校學(xué)生學(xué)習(xí)成績分析中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2006,27(4):590-592.
[58]BAYER J,BYDZOVSKá H,GéRYK J,et al. Predicting drop-out from social behaviour of students[C]//The 5th international conference on educational data mining,Chania,2012: 103-109.
[59]萬星火,鄭俊玲,金永超.基于KPCA 的高校學(xué)業(yè)預(yù)警模型及其應(yīng)用[J].數(shù)學(xué)理論與應(yīng)用,2014,33(4):99-104.
[60]鄧溪瑤,喬天一,于曉磊,等. 高校分省招生計(jì)劃的效率判據(jù)——學(xué)生群體學(xué)業(yè)表現(xiàn)地域差異大數(shù)據(jù)研究[J]. 中國高教研究,2014(12):23-27.
[61]邢濤. 小波聚類算法在本科招生生源質(zhì)量分析中的應(yīng)用[J]. 南京航空航天大學(xué)學(xué)報(bào),2009,41(6):823-827.
[62]蔡建偉,曾生達(dá),修德茂,等.大學(xué)生消費(fèi)水平與消費(fèi)結(jié)構(gòu)分析[J].經(jīng)濟(jì)視角,2012(5):106-108.
[63]薛瑞峰,彭墩陸. 數(shù)據(jù)挖掘技術(shù)在本科畢業(yè)生就業(yè)指導(dǎo)中的應(yīng)用研究[J]. 中國管理信息化,2013,16(3): 108-109.
[64]張曉萍,朱玉全,陳耿.量化關(guān)聯(lián)規(guī)則在高校就業(yè)信息數(shù)據(jù)中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013,23(11):199-212.
[65]楊克玉,劉斌. 數(shù)據(jù)挖掘技術(shù)在高職畢業(yè)生跟蹤調(diào)查中的應(yīng)用[J]. 電腦知識與技術(shù),2014,10(31): 7256-7259.
[66]樊春蘭,高殿軍. BP 神經(jīng)網(wǎng)絡(luò)的大學(xué)畢業(yè)生就業(yè)信息分析——以遼寧工程技術(shù)大學(xué)為例[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會科學(xué)版),2011,13(3):272-274.
[67]劉玉華,陳建國,張春燕. 基于數(shù)據(jù)挖掘的國內(nèi)大學(xué)生就業(yè)信息雙向推薦系統(tǒng)[J]. 沈陽大學(xué)學(xué)報(bào)( 自然科學(xué)版),2015,27(3):226-232.
[68]賀美英,郭樑,錢錫康. 對高校校友資源的再認(rèn)識[J]. 清華大學(xué)教育研究,2004,25(6): 78-82.
[69]李歡,孫建三,袁本濤. 基于校友數(shù)據(jù)庫的高校人才培養(yǎng)質(zhì)量控制系統(tǒng)模型[J].高等工程教育研究,2011(2):82-86.
[70]范靜波. 高等教育生源質(zhì)量與教育質(zhì)量對個人收入的影響[J]. 教育科學(xué),2013,29(3): 71-75.
[71]李永山. 論影響大學(xué)生成長成才的因素[J]. 合肥工業(yè)大學(xué)學(xué)報(bào)(社會科學(xué)版),2009,23(3): 6-9.
[72]鞏建閩,蕭蓓蕾,董文娜.基于校友反饋的人才培養(yǎng)質(zhì)量問卷及案例分析[J]. 高等工程教育研究,2012(5): 121-126.
[73]張俊超.大數(shù)據(jù)時代的院校研究與大學(xué)管理[J].高等工程教育研究,2014(1):128-135.
Data Mining in the Process of In-depth Integration of ICT with Talent Training in Chinese Universities
WEN Yi-min1,2,YI Xin-he2,LI You-xi,WEN Bo-xi1
(1.School of Computer Science and Information Security;2.Research Center of Modern Education Technology,Guilin University of Electronic Technology,Guilin 541004,China)
Abstract:For the reasons of paying less attention to educational data mining(EDM),limited application of EDM,and being not fully used of the achievements of EDM in Chinese universities,we took the process of talent training as indices to survey the research works of educational data mining in the five stages in the process of talent training,and proposed three new problems which Chinese universities should to consider during the development of education informationization.
Key Words:educational data mining;big data;talent training
中圖分類號:G642
文獻(xiàn)標(biāo)識碼:A
文章編號:1671-9719(2016)4-0018-07
作者簡介:文益民(1969-),男,教授,博士,碩士生導(dǎo)師,現(xiàn)代教育技術(shù)中心副主任,研究方向?yàn)榻逃龜?shù)據(jù)挖掘。
收稿日期:2016-01-20修稿日期:2016-02-19
基金項(xiàng)目:中國高教學(xué)會教育信息化專項(xiàng)課題“利益相關(guān)者理論視域下全日制本科在線課程建設(shè)研究”(2014XXH1205YB);廣西高等教育教學(xué)改革工程項(xiàng)目“全日制本科在線課程建設(shè)研究與實(shí)現(xiàn)”(2014JGZ116);教育部在線教育研究基金(全通教育)課題“全日制本科SPOC教學(xué)模式創(chuàng)新及關(guān)鍵支撐技術(shù)研究”(2016YB155)。