国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)引領(lǐng)教育未來(lái):從成績(jī)預(yù)測(cè)談起

2015-03-17 03:32呂紅胤,連德富,聶敏
大數(shù)據(jù) 2015年4期
關(guān)鍵詞:規(guī)律性預(yù)測(cè)算法

大數(shù)據(jù)引領(lǐng)教育未來(lái):從成績(jī)預(yù)測(cè)談起

Big Data Drives a New Epoch of Education: A Case Study of Academic Performance Prediction

呂紅胤,女,電子科技大學(xué)副研究員,主要研究方向?yàn)榻逃髷?shù)據(jù)理論與實(shí)踐研究、社會(huì)圈層研究。

連德富,男,電子科技大學(xué)講師、教育大數(shù)據(jù)研究所副所長(zhǎng),主要研究方向?yàn)闄C(jī)器學(xué)習(xí)、時(shí)空數(shù)據(jù)挖掘、推薦系統(tǒng)、教育數(shù)據(jù)挖掘。在ACM Trans.、KDD、Ubicomp、ICDM、WWW等國(guó)際頂級(jí)期刊和會(huì)議上發(fā)表論文10余篇。

聶敏,男,電子科技大學(xué)教育大數(shù)據(jù)研究所博士生,主要研究方向?yàn)榇笠?guī)模分布式計(jì)算、教育數(shù)據(jù)挖掘?,F(xiàn)任成都尋道科技有限公司總經(jīng)理,致力于教育大數(shù)據(jù)平臺(tái)級(jí)產(chǎn)品研發(fā),有多年大數(shù)據(jù)相關(guān)技術(shù)經(jīng)驗(yàn)。

夏虎,男,電子科技大學(xué)副研究員、教育大數(shù)據(jù)研究所所長(zhǎng),主要研究方向?yàn)閿?shù)據(jù)挖掘、社會(huì)網(wǎng)絡(luò)、文本挖掘。

周濤,男,電子科技大學(xué)教授,主要研究方向?yàn)榻y(tǒng)計(jì)物理與復(fù)雜性科學(xué),發(fā)表SCI論文200余篇,引用12 000余次,H指數(shù)為53。

近年來(lái),大數(shù)據(jù)已經(jīng)在教育領(lǐng)域的管理與引導(dǎo)等諸多方面被廣泛運(yùn)用。例如,智能教學(xué)系統(tǒng)(ITS)[1]基于與學(xué)生間交互的日志數(shù)據(jù)進(jìn)行個(gè)性化知識(shí)診斷,分析學(xué)生的知識(shí)掌握情況,發(fā)現(xiàn)學(xué)生的薄弱點(diǎn),從而自適應(yīng)地幫扶學(xué)生更好地獲取知識(shí)和技能[2,3]??突荆–arnegie Learning)的“認(rèn)知導(dǎo)引”系統(tǒng)便是一個(gè)典型的ITS[4],它根據(jù)學(xué)生對(duì)先前問(wèn)題的回答情況制定后續(xù)的提問(wèn)內(nèi)容。這樣,就可以找出學(xué)生的問(wèn)題并深入了解它們。經(jīng)過(guò)嚴(yán)格測(cè)試,發(fā)現(xiàn)使用該系統(tǒng)的學(xué)生要比接受傳統(tǒng)教學(xué)的學(xué)生節(jié)約12%的學(xué)習(xí)時(shí)間。國(guó)外的edX、Coursera、Udacity和國(guó)內(nèi)的學(xué)堂在線等多家大規(guī)模在線課堂平臺(tái),圍繞在線教育中高輟學(xué)率的嚴(yán)峻問(wèn)題,基于學(xué)生人口統(tǒng)計(jì)學(xué)數(shù)據(jù)和學(xué)生注冊(cè)課程、觀看視頻、完成課后作業(yè)、參與論壇討論等行為數(shù)據(jù),旨在發(fā)現(xiàn)影響學(xué)生輟學(xué)的重要因素,從而制定相應(yīng)的干預(yù)策略引導(dǎo)學(xué)生,降低在線教育的輟學(xué)率[5]。保羅·艾倫實(shí)驗(yàn)室致力于自動(dòng)化答題的研究:從題目中抽取知識(shí)和前提條件,基于在訓(xùn)練集上構(gòu)建的知識(shí)圖譜,利用多種統(tǒng)計(jì)推斷和邏輯推理的方法來(lái)選擇或者生成可能準(zhǔn)確的答案[8,9]。針對(duì)該任務(wù),該實(shí)驗(yàn)室在2015年10月發(fā)起了一項(xiàng)名為“你的模型比8年級(jí)學(xué)生更聰明嗎”的大數(shù)據(jù)競(jìng)賽。更重要的是,包括中、美、日在內(nèi)的國(guó)家均已設(shè)立了答題機(jī)器人的國(guó)家級(jí)重大項(xiàng)目,計(jì)劃讓機(jī)器人在不久的將來(lái)參加高考,在3~5年內(nèi)考上“一本”。而且,目前該項(xiàng)目已經(jīng)取得可喜進(jìn)展。

除此以外,傳統(tǒng)中小學(xué)教育和高等教育中積累的人口統(tǒng)計(jì)學(xué)信息、過(guò)往考試成績(jī)、缺曠課、問(wèn)卷調(diào)查等數(shù)據(jù)也曾被用于分析與學(xué)生綜合績(jī)點(diǎn)、能否順利畢業(yè)等因變量之間的關(guān)系,并且構(gòu)建相關(guān)的預(yù)測(cè)模型[10]?;陬A(yù)測(cè)模型,教育管理者便可以優(yōu)先找出未來(lái)可能需要重點(diǎn)關(guān)注的學(xué)生。然而,這些數(shù)據(jù)要么可能只是來(lái)源于小部分學(xué)生的問(wèn)卷調(diào)查,要么數(shù)據(jù)的字段數(shù)太少。更重要的是這些數(shù)據(jù)缺乏實(shí)時(shí)性,無(wú)法進(jìn)行實(shí)時(shí)預(yù)測(cè),從而可能無(wú)法達(dá)到預(yù)期的干預(yù)結(jié)果。為此,本文基于學(xué)生在校園內(nèi)學(xué)習(xí)、生活時(shí)產(chǎn)生的實(shí)時(shí)行為數(shù)據(jù),結(jié)合問(wèn)卷調(diào)查、人口統(tǒng)計(jì)學(xué)等相關(guān)的數(shù)據(jù)來(lái)進(jìn)行成績(jī)預(yù)測(cè)等相關(guān)的大數(shù)據(jù)研究。

成績(jī)預(yù)測(cè)在教育管理中起到重要的作用。當(dāng)前,掛科現(xiàn)象在大學(xué)生中非常普遍,甚至有人認(rèn)為不掛科的大學(xué)生活是不完整的。然而,掛科可能會(huì)造成學(xué)生無(wú)法按時(shí)畢業(yè)或者無(wú)法找到心儀工作的后果。因而如果能提前發(fā)現(xiàn)學(xué)生的學(xué)習(xí)異常,通過(guò)引導(dǎo)和干預(yù)就有可能阻止這些不幸事情的發(fā)生。學(xué)習(xí)異常的發(fā)生可能源自于學(xué)習(xí)態(tài)度或者學(xué)習(xí)目標(biāo)的轉(zhuǎn)變,而這種轉(zhuǎn)變是可以在學(xué)生的日常生活中表現(xiàn)出來(lái)的。大學(xué)校園本身就是一個(gè)小型的社會(huì)系統(tǒng),其內(nèi)部服務(wù)體系幾乎可以滿足學(xué)生絕大多數(shù)的需求。而校園服務(wù)的實(shí)現(xiàn),如食堂吃飯、超市購(gòu)物、圖書(shū)館借書(shū)、出入宿舍、教學(xué)樓打水等,大多數(shù)是通過(guò)校園“一卡通”來(lái)完成的。因而學(xué)生在校園中的食堂、超市、教學(xué)樓、宿舍樓、圖書(shū)館之間的日常生活軌跡就通過(guò)“一卡通”以數(shù)字化的形式記錄下來(lái)。然而,大家并不知道行為和成績(jī)之間的關(guān)系,也不知道行為變化和成績(jī)變化之間的關(guān)系。

針對(duì)這種需求,基于這些“一卡通”記錄下來(lái)的行為信息,特別設(shè)計(jì)了學(xué)生畫(huà)像系統(tǒng)。該系統(tǒng)量化了心理學(xué)中影響學(xué)生成績(jī)最重要的兩個(gè)指標(biāo):努力程度和生活規(guī)律性,作為系統(tǒng)中的畫(huà)像因子。努力程度包括去教學(xué)樓、圖書(shū)館消費(fèi)的次數(shù),對(duì)應(yīng)到學(xué)生上自習(xí)或者上課的次數(shù),反映了學(xué)生花在學(xué)習(xí)上的時(shí)間多少。而生活規(guī)律性包括出入宿舍的規(guī)律性、吃飯?zhí)貏e是吃早飯的時(shí)間規(guī)律性、洗澡洗衣服的時(shí)間規(guī)律性、購(gòu)物的規(guī)律性等,與學(xué)生的自我控制與自我約束能力密切相關(guān)。通過(guò)分析這些畫(huà)像因子和成績(jī)之間的關(guān)系,發(fā)現(xiàn)努力程度和生活規(guī)律性與成績(jī)呈顯著正相關(guān)性。特別地,針對(duì)某個(gè)年級(jí)的4年數(shù)據(jù)使用相關(guān)性計(jì)算,發(fā)現(xiàn)去圖書(shū)館的次數(shù)和成績(jī)的序相關(guān)性達(dá)到0.3(p<0.01),而洗澡規(guī)律性和成績(jī)的序相關(guān)性稍弱,為0.17(p<0.01)。圖1展示了目前研究的所有努力程度和行為規(guī)律性的指標(biāo)與成績(jī)的相關(guān)性。更進(jìn)一步地,分析行為變化和成績(jī)變化之間的關(guān)系,發(fā)現(xiàn)努力程度和生活規(guī)律性的增加也會(huì)導(dǎo)致學(xué)習(xí)成績(jī)的提升。因而,對(duì)于學(xué)習(xí)越努力、生活越規(guī)律的學(xué)生,他們的學(xué)習(xí)成績(jī)?cè)胶谩M瑫r(shí),基于學(xué)生在同一地點(diǎn)共現(xiàn)的次數(shù),構(gòu)建學(xué)生在校園內(nèi)的社交關(guān)系網(wǎng)絡(luò),并分析每個(gè)學(xué)生的學(xué)習(xí)成績(jī)和朋友間的學(xué)習(xí)成績(jī)之間的關(guān)系。筆者發(fā)現(xiàn),每個(gè)學(xué)生的成績(jī)和朋友的平均成績(jī)呈正相關(guān)的關(guān)系。這不僅驗(yàn)證了社會(huì)學(xué)中的成績(jī)上的同質(zhì)性,還能幫助構(gòu)建準(zhǔn)確率更高的成績(jī)預(yù)測(cè)系統(tǒng)。

針對(duì)努力程度、生活規(guī)律性和社交關(guān)系網(wǎng)絡(luò)以及過(guò)往的學(xué)習(xí)成績(jī),設(shè)計(jì)了多任務(wù)遷移學(xué)習(xí)算法來(lái)進(jìn)行未來(lái)成績(jī)的預(yù)測(cè)。該算法不僅通過(guò)多任務(wù)特性考慮了特征相關(guān)性存在學(xué)院之間的差異性,而且還通過(guò)遷移學(xué)習(xí)特點(diǎn)考慮了不同學(xué)期之間相關(guān)性的變化。同時(shí),為了更好地保護(hù)學(xué)生隱私,將成績(jī)變換成排名,并進(jìn)行歸一化,利用排序?qū)W習(xí)算法來(lái)進(jìn)行學(xué)習(xí)。當(dāng)學(xué)生的數(shù)據(jù)缺乏或者缺失時(shí),該算法利用朋友的加權(quán)預(yù)測(cè)成績(jī)作為學(xué)生的預(yù)測(cè)結(jié)果輸出。在測(cè)試時(shí),給定前5個(gè)學(xué)期的數(shù)據(jù)作為訓(xùn)練集,預(yù)測(cè)第6個(gè)學(xué)期的成績(jī)排名,以預(yù)測(cè)排名和實(shí)際排名的序相關(guān)性作為預(yù)測(cè)算法性能評(píng)價(jià)的指標(biāo)。最終預(yù)測(cè)算法的序相關(guān)性高達(dá)0.9,這讓算法在實(shí)際中被廣泛運(yùn)用成為可能。而且,基于“一卡通”對(duì)于記錄行為的實(shí)時(shí)性設(shè)計(jì)的成績(jī)預(yù)測(cè)模型,可以幫助教育管理者及時(shí)發(fā)現(xiàn)學(xué)生的學(xué)習(xí)和生活異常情況,從而能對(duì)學(xué)生進(jìn)行及時(shí)的干預(yù)和引導(dǎo),從而實(shí)現(xiàn)從傳統(tǒng)教育中的后置性應(yīng)急到前置性預(yù)警引導(dǎo)的轉(zhuǎn)變,實(shí)現(xiàn)從離線靜態(tài)分析到自適應(yīng)性地動(dòng)態(tài)分析的轉(zhuǎn)變。

除了發(fā)現(xiàn)這些行為數(shù)據(jù)在預(yù)測(cè)成績(jī)方面起到的重要作用以外,筆者還發(fā)現(xiàn)了它們?cè)谪毨鷻z測(cè)、畢業(yè)去向預(yù)測(cè)、館藏圖書(shū)推薦等方面的價(jià)值。不同家庭經(jīng)濟(jì)條件的學(xué)生在消費(fèi)行為方面可能呈現(xiàn)較大差異,因而消費(fèi)行為數(shù)據(jù)對(duì)于貧困生檢測(cè)存在一定的作用。學(xué)生畢業(yè)時(shí)的去向由很多原因決定,不僅取決于學(xué)生的成績(jī),還包括實(shí)習(xí)和科研等課外活動(dòng)的經(jīng)歷、生活作息的規(guī)律性、家庭的經(jīng)濟(jì)狀況等。而行為數(shù)據(jù)的存在給館藏圖書(shū)推薦帶來(lái)較大變化,不僅可以區(qū)分男女生在借書(shū)上的差異性,也可以區(qū)分成績(jī)不同的學(xué)生在圖書(shū)借閱上的偏好;反過(guò)來(lái),通過(guò)學(xué)生借閱的圖書(shū)信息,也能輔助確定學(xué)生的成績(jī)信息。通過(guò)這些研究發(fā)現(xiàn),當(dāng)前的大學(xué)校園內(nèi),已經(jīng)積存了很多對(duì)學(xué)校教育管理具有重要戰(zhàn)略價(jià)值的數(shù)據(jù)。雖然對(duì)這些數(shù)據(jù)的價(jià)值已做了初步探討,但是仍然還有待進(jìn)一步的探索與發(fā)現(xiàn)。

圖1 行為規(guī)律性和努力程度與成績(jī)的序相關(guān)性

[1] Anderson J R, Boyle C F, Reiser B J. Intelligent tutoring systems. Science, 1985, 228(4698): 456~462

[2] Romero C, Ventura S. Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews, 2010, 40(6): 601~618

[3] Lindsey R V, Khajah M, Mozer M C. Automatic discovery of cognitive skills to improve the prediction of student learning. Advances in Neural Information Processing Systems, 2014:1386~1394

[4] Ritter S, Anderson J R, Koedinger K R,et al. Cognitive tutor: applied research in mathematics education. Psychonomic Bulletin & Review, 2007,14(2): 249~255

[5] Qiu J Z, Tang J, Liu T X,et al. Modeling and predicting learning behavior in MOOCs. Proceedings of the 9th ACM International Conference on Web Search and Data Mining (WSDM'16), San Francisco, USA, 2016 Accepted

[6] Ramesh A, Goldwasser D, Huang B,et al. Learning latent engagement patterns of students in online courses. Proceedings of the 28th AAAI Conference on Artificial Intelligence, Quebec City, Canada, 2014

[7] Anderson A, Huttenlocher D, Kleinberg J,et al. Engaging with massive online courses. Proceedings of the 23rd International Conference on World Wide Web, Seoul, Korea, 2014: 687~698

[8] Seo M, Hajishirzi H, Farhadi A,et al. Solving geometry problems: combining text and diagram interpretation. Proceedings of EMNLP, Lisbon, Portugal, 2015

[9] Hosseini M J, Hajishirzi H, Etzioni O,et al. Learning to solve arithmetic word problems with verb categorization. Proceedings of EMNLP, Doha, Qatar, 2014

[10] Tamhane A, Ikbal S, Sengupta B,et al. Predicting student risks through longitudinal analysis. Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, New York, USA, 2014: 1544~1552 □

10.11959/j.issn.2096-0271.2015045

猜你喜歡
規(guī)律性預(yù)測(cè)算法
無(wú)可預(yù)測(cè)
選修2-2期中考試預(yù)測(cè)卷(A卷)
選修2-2期中考試預(yù)測(cè)卷(B卷)
What Is the Hidden Card?
基于MapReduce的改進(jìn)Eclat算法
Travellng thg World Full—time for Rree
進(jìn)位加法的兩種算法
不必預(yù)測(cè)未來(lái),只需把握現(xiàn)在
公證改革發(fā)展若干規(guī)律性認(rèn)識(shí)
新媒體時(shí)代下新聞傳播的規(guī)律性探析
台中市| 同德县| 丹阳市| 郯城县| 翁源县| 宜都市| 沿河| 新龙县| 鄂伦春自治旗| 北流市| 扎鲁特旗| 聂荣县| 琼中| 仙桃市| 五家渠市| 林口县| 泰来县| 安仁县| 双流县| 商水县| 石首市| 弋阳县| 英吉沙县| 涟水县| 沧州市| 福贡县| 田东县| 齐河县| 二连浩特市| 绥芬河市| 淮安市| 深州市| 宜宾县| 许昌县| 通道| 铅山县| 高要市| 金塔县| 常熟市| 屏南县| 孟州市|