国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高校成績分析模型及應(yīng)用研究

2017-05-18 17:58陸冷飛
中國教育信息化·高教職教 2017年5期
關(guān)鍵詞:分析模型數(shù)據(jù)挖掘

陸冷飛

摘 要:大數(shù)據(jù)時代,高校越來越重視從海量的學(xué)生成績數(shù)據(jù)中分析挖掘出有用的信息,為高校的人才培養(yǎng)模式改革、教學(xué)改革、管理決策等提供有力的數(shù)據(jù)支撐。本文從高校學(xué)生成績分析的現(xiàn)狀出發(fā),基于大數(shù)據(jù)挖掘理念,將多元統(tǒng)計方法引入高校成績分析,介紹了相關(guān)分析、因子分析、聚類分析等方法在高校成績分析中的應(yīng)用,建立了高校多維成績分析模型,并以中國藥科大學(xué)2014級藥物化學(xué)專業(yè)的成績分析為例詳細闡述了該模型的應(yīng)用。

關(guān)鍵詞:多元統(tǒng)計;數(shù)據(jù)挖掘;成績分析;分析模型

中圖分類號:G424.7 文獻標志碼:A 文章編號:1673-8454(2017)09-0062-04

高校學(xué)生成績一直是直接評價學(xué)生學(xué)業(yè)水平的重要指標,也是間接評價高校教師教學(xué)效果及高校教學(xué)管理水平的指標之一。目前各高校常用的成績分析主要集中于課程成績總分、平均分、及格率、優(yōu)秀率、方差、成績分布曲線(柱狀)圖等簡單的一些分析與統(tǒng)計,對學(xué)生的評價一般采取各科成績加權(quán)平均后再排名,這些統(tǒng)計與排名能從一定程度上反映課程的教學(xué)情況及學(xué)生學(xué)習(xí)效果,但是學(xué)科的多樣性、題目的難易程度、題目分值高低、教學(xué)方式、學(xué)生自身等因素對學(xué)生取得的成績存在不同程度的影響,因此傳統(tǒng)的成績分析是比較片面和籠統(tǒng)的,不能全面反映學(xué)生各學(xué)科學(xué)習(xí)的優(yōu)劣,以及學(xué)生學(xué)習(xí)的效果。本文基于大數(shù)據(jù)挖掘的理念,在成績分析中引入多元統(tǒng)計分析的常用方法,構(gòu)建了較為全面的高校成績分析通用模型,基于該模型和大數(shù)據(jù)挖掘方法的應(yīng)用使成績分析比傳統(tǒng)方法更全面、更具有指導(dǎo)意義。

一、成績分析的常用方法

因?qū)W生成績數(shù)據(jù)量巨大,要從海量的成績數(shù)據(jù)中挖掘出隱藏、有用的信息,需采用基于大數(shù)據(jù)挖掘的數(shù)據(jù)分析方法,才能有效全面地反映學(xué)生的學(xué)習(xí)情況。常用的可應(yīng)用于成績分析的方法主要有相關(guān)性分析、因子分析、聚類分析等多元統(tǒng)計分析方法。

1.相關(guān)性分析

相關(guān)性分析,百度百科中的解釋是研究樣本對象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機變量之間相關(guān)關(guān)系的一種統(tǒng)計方法。根據(jù)相關(guān)分析的定義、特點以及學(xué)生成績影響因素的多樣性,可以利用相關(guān)分析方法進行學(xué)生成績與各影響因素之間相關(guān)性的分析,揭示各因素對學(xué)生成績的影響規(guī)律,根據(jù)發(fā)現(xiàn)的規(guī)律,通過對影響因素的正向干預(yù),提高學(xué)生學(xué)習(xí)效果,促進學(xué)生學(xué)業(yè)的發(fā)展。

2.因子分析

因子分析是根據(jù)相關(guān)性大小把變量分組,使同組內(nèi)的變量之間相關(guān)性較高,但不同組變量相關(guān)性較低,每組變量代表一個基本結(jié)構(gòu),這個基本結(jié)構(gòu)稱為公共因子。對于所研究的問題就可試圖用最少個數(shù)不可測的所謂公共因子的線性函數(shù)與特殊因子之和來描述原來觀測的每一變量。[1]由此可知,分析得出的公共因子跟原始因子是關(guān)系緊密的,公共因子能反映絕大部分原始信息,通過提取公共因子,從而簡化對事物的認識與分析。在成績分析中,比如一個學(xué)生某學(xué)科的成績非常好,則其他成績也非常好,這些課程之間就存在一種隱藏的共性因子關(guān)系。各專業(yè)培養(yǎng)方案設(shè)置是否合理,培養(yǎng)了學(xué)生哪些方面的能力,采用因子分析方法就能方便地得出結(jié)論,從而使對學(xué)生的評價更加合理、簡單、清晰易懂。

3.聚類分析

聚類分析是一種探索性的分析方法。它是將一批樣本或變量按照它們在性質(zhì)上的親疏程度加以分類,實質(zhì)是按照距離遠近將數(shù)據(jù)分為若干個類別, 以使類別內(nèi)數(shù)據(jù)的差異盡可能小、類別間的差異盡可能大。[2]比如可以采用聚類分析方法對學(xué)生成績進行聚類分析,根據(jù)結(jié)果反映每位學(xué)生在各方面的能力發(fā)展狀況——是否有偏科、是否有某些方面特長等,便于學(xué)校開展針對性的學(xué)生學(xué)業(yè)支持與輔導(dǎo)工作,幫助學(xué)生彌補不足,平衡各學(xué)科的學(xué)習(xí)。

二、高校多維成績分析模型

高校成績分析涉及的對象、因素紛繁復(fù)雜。學(xué)生成績一方面反映學(xué)生的學(xué)習(xí)行為及其知識掌握程度,另一方面反映專業(yè)課程設(shè)置及教師在課程教學(xué)過程中的知識傳授能力和教學(xué)質(zhì)量。因此,為理清影響學(xué)生成績各因素之間的關(guān)系,明確高校成績分析的方向,筆者建立了如圖1所示的多維成績分析模型,學(xué)生成績分析工作可以從三個維度來進行,即以成績本身為中心的分析、以學(xué)生為中心的分析、以課程為中心的分析。

1.以成績?yōu)橹行牡姆治?/p>

以成績?yōu)橹行牡姆治鍪侵笇Τ煽冏陨淼慕y(tǒng)計規(guī)律性分析,主要是頻數(shù)和直方圖分析,包括峰度、偏度、最高分、最低分、平均分、標準差、方差、優(yōu)良中差的頻數(shù)、區(qū)分度等分析。從對某課程成績頻數(shù)和直方圖的一些分析,可以得出該課程學(xué)生成績的大致分布、試卷難易程度、區(qū)分度等信息,使教學(xué)單位對該門課程的教學(xué)有一個基本了解,為以后教學(xué)、考核評價的調(diào)整等提供決策依據(jù)。以成績?yōu)橹行牡姆治鍪悄壳案鞲咝W罨?、最常?guī)的成績分析模型,各高校一般明確規(guī)定教研室或任課教師在期末考試成績錄入之后,就要對課程成績進行頻數(shù)和直方圖的分析,結(jié)合試卷分析,最后得出結(jié)論并書面存檔。

2.以課程為中心的成績分析

課堂教學(xué)的四大要素是學(xué)生、教師、教學(xué)內(nèi)容、教學(xué)媒體。課堂教學(xué)中課堂的組織形式、教師的教學(xué)、教學(xué)媒體的選擇等都是為課程內(nèi)容服務(wù)的,即它們提供給學(xué)生學(xué)習(xí)的一切有利內(nèi)容和條件。因此課堂教學(xué)中除學(xué)生之外的三大要素均可以歸納為課程這一要素,以課程為中心的成績分析是指從課程各要素出發(fā),采用大數(shù)據(jù)分析方法進行成績分析,包括分析課程知識點的難易程度不同、任課教師不同、上課對象不同、教學(xué)內(nèi)容呈現(xiàn)的媒介不同、教師教學(xué)方法和教學(xué)模式不同、考試難度不同、評價方式不同(總結(jié)性評價還是過程性評價)等對學(xué)生課程成績或知識掌握程度的影響。

以課程為中心的成績分析模型能夠真實反映課程教學(xué)內(nèi)容設(shè)置、教師教學(xué)方法、教學(xué)模式等因素對學(xué)生學(xué)習(xí)效果產(chǎn)生的影響,因此能夠為學(xué)校的專業(yè)培養(yǎng)方案設(shè)置以及課程內(nèi)容改革、教學(xué)方法改革、師資配置等提供良好的決策參考。

3.以學(xué)生為中心的成績分析

以學(xué)生為中心的成績分析是指從學(xué)生角度出發(fā),分析學(xué)生個人特性、學(xué)習(xí)習(xí)慣等方面的特征和行為與課程成績之間的關(guān)系,以及學(xué)生個體各方面能力的發(fā)展情況。比如分析學(xué)生的個性、上網(wǎng)行為、圖書借閱行為等對課程成績的影響;學(xué)生的民族、地域、生源地分布與課程成績之間的關(guān)系、學(xué)生的學(xué)習(xí)過程努力程度、考勤等對課程成績的影響;分析學(xué)生所有課程成績之間的關(guān)系,找出公共能力因子,分析得出學(xué)生各項能力的發(fā)展,并根據(jù)其聚類結(jié)果對學(xué)生進行分類,評估每位學(xué)生各項能力(德智體)如研究能力、實踐能力、身體素質(zhì)等的發(fā)展情況,分析專業(yè)培養(yǎng)方案設(shè)置的合理性,確定對學(xué)習(xí)困難生的幫扶輔導(dǎo)計劃等。

上述模型中三個維度的成績分析基本涵蓋了學(xué)生成績分析的各方面因素,它們各自側(cè)重點不同,可以單獨進行,也可以聯(lián)合進行。在實際的成績分析中,想要通過成績挖掘出教與學(xué)各方面較為全面的隱性知識,通常需要涉及多個維度的成績分析,它們相互聯(lián)系、相互影響。

三、以學(xué)生為中心的成績分析應(yīng)用

以中國藥科大學(xué)2014級藥物化學(xué)專業(yè)34門必修課成績?yōu)槔M行成績分析,使用SPSS 22.0統(tǒng)計軟件,利用因子分析、聚類分析的統(tǒng)計方法對成績數(shù)據(jù)進行挖掘,旨在分析出有利于教學(xué)管理和學(xué)生評價的有效信息。

1.數(shù)據(jù)準備

以2014級藥物化學(xué)專業(yè)大一至大三共計6個學(xué)期的必修課成績及加權(quán)平均分為樣本,刪除幾名留級學(xué)生之后,共87名學(xué)生,35門必修課。課程包括程序設(shè)計語言、大學(xué)英語(一)、大學(xué)英語(二)、大學(xué)英語(三)、大學(xué)英語(四)、分析化學(xué)(上)、分析化學(xué)(下)、分析化學(xué)實驗(上)、分析化學(xué)實驗(下)、高等數(shù)學(xué)(一)、高等數(shù)學(xué)(二)、計算機應(yīng)用基礎(chǔ)、馬克思主義基本原理概論、毛澤東思想和中國特色社會主義理論體系概論、生物化學(xué)與分子生物學(xué)、生物化學(xué)與分子生物學(xué)實驗、數(shù)理統(tǒng)計、思想道德修養(yǎng)與法律基礎(chǔ)、體育(一)、體育(二)、體育(三)、體育(四)、無機化學(xué)、無機化學(xué)實驗、物理化學(xué)(上)、物理化學(xué)(下)、物理化學(xué)實驗、物理學(xué)(一)、物理學(xué)(二)、物理學(xué)實驗、有機化學(xué)(一)、有機化學(xué)(二)、有機化學(xué)實驗(一)、有機化學(xué)實驗(二)、中國近現(xiàn)代史綱要。成績?yōu)槿笨嫉目颇恳?分計。

2.因子分析

用SPSS22.0打開學(xué)生成績表,進入“分析-降維-因子分析”菜單,在打開的界面中分別設(shè)置相關(guān)參數(shù)。相關(guān)性矩陣選擇“KMO和Bartlett的球形度檢驗”,因子分析抽取方法采用“主成分”分析方法,提取特征值大于1的因子旋轉(zhuǎn)方法選擇“最大方差法”并輸出旋轉(zhuǎn)解和載荷圖,最后將因子得分保存為變量,確定后得到以下輸出及分析結(jié)果。

(1)因子分析的可行性分析。如表1所示,KMO的結(jié)果為0.858,接近1,說明成績變量間存在較強的相關(guān)性;Bartlett球形檢驗結(jié)果P值為0,小于0.01,因此該樣本適合做因子分析。

(2)采用主成分分析法進行抽取和最大方差法旋轉(zhuǎn)后得到的總方差解釋矩陣結(jié)果如表2所示,共提取了8個特征值大于1的因子,累計方差貢獻率72.165%,說明35門必修課共抽取了8個公共因子,這8個因子能解釋原始變量72.165%的信息。

(3)根據(jù)旋轉(zhuǎn)后的成分矩陣(略)中各門必修課在各因子上載荷值的大小,可以分析得出各因子所代表的學(xué)生習(xí)得的潛在能力,即教學(xué)培養(yǎng)學(xué)生各方面的能力。物理學(xué)(一)、物理學(xué)(二)、數(shù)理統(tǒng)計、高等數(shù)學(xué)(一)、高等數(shù)學(xué)(二)、有機化學(xué)(一)、有機化學(xué)(二)、分析化學(xué)(上)、分析化學(xué)(下)、無機化學(xué)、物理化學(xué)(上)、物理化學(xué)(下)、生物化學(xué)與分子生物學(xué)等課程在第一個因子上載荷值較高,反映的是學(xué)生在物理、數(shù)學(xué)等學(xué)科基礎(chǔ)之上向?qū)I(yè)基礎(chǔ)能力發(fā)展的課程,可以將第一個因子命名為專業(yè)基礎(chǔ)能力因子;大學(xué)英語(一)、大學(xué)英語(二)、大學(xué)英語(三)、大學(xué)英語(四)在第二個因子上載荷值較高,可以命名為英語能力因子;物理學(xué)實驗、有機化學(xué)實驗(—)、有機化學(xué)實驗(二)、分析化學(xué)實驗(上)、分析化學(xué)實驗(下)、生物化學(xué)與分子生物學(xué)實驗、無機化學(xué)實驗、物理化學(xué)實驗等實驗類課程在第三和第四個因子上載荷值較高,同樣的實驗課分布在2個因子上,可能是因為實驗的性質(zhì)、內(nèi)容或考核評價的方式差異導(dǎo)致的,可以將第三、四個因子合并命名為專業(yè)實踐操作能力因子;馬克思主義基本原理概論、毛澤東思想和中國特色社會主義理論體系概論、中國近現(xiàn)代史綱要課程在第五個因子上載荷值較高,可以命名為人文社科素養(yǎng)因子;體育(二)、體育(四)在第六個因子,體育(一)、體育(三)在第七個因子上載荷值較高,可以合并命名為身體素質(zhì)能力因子;第八個因子只有思想道德修養(yǎng)與法律基礎(chǔ)載荷值較高,可以命名為學(xué)生的思想修養(yǎng)與法律能力因子。至此我們可以得出中國藥科大學(xué)2014級藥物化學(xué)專業(yè)前3年的培養(yǎng)方案,從6個方面培養(yǎng)學(xué)生的能力,可以看出該專業(yè)的前3年培養(yǎng)方案較為全面地培養(yǎng)了學(xué)生德智體各方面的能力,能讓學(xué)生得到均衡發(fā)展。

在以上分析的基礎(chǔ)上,可以根據(jù)表2旋轉(zhuǎn)載荷平方和里的方差貢獻率以及綜合因子得分公式計算得出每位學(xué)生的綜合因子得分,根據(jù)得分進行綜合排名,可以與傳統(tǒng)的加權(quán)平均分排名進行對比,從中可發(fā)現(xiàn)傳統(tǒng)排名無法反映出來的一些問題,因篇幅所限,此過程不再贅述。

3.聚類分析

在上述因子分析過程中,得到了8個反應(yīng)學(xué)生成績信息的公共因子,利用保存的8個公共因子得分系數(shù)進行聚類分析,將學(xué)生進行快速聚類,可根據(jù)最終分類進一步對學(xué)生的學(xué)業(yè)發(fā)展提供針對性的指導(dǎo)。

在SPSS 22.0軟件中,選擇“分析-分類-K平均值聚類”,進入操作界面,選擇因子分析過程中保存的8個公共因子,最大迭代次數(shù)輸入20,統(tǒng)計選項選擇初始聚類中心和ANOVA表,保存每位學(xué)生的聚類及距離為變量。分別以K=2、3、4、5進行快速聚類分析,根據(jù)各輸出結(jié)果中ANOVA表中的F值和顯著性檢驗值對比分析,當K=3時,各類別之間的差異性最顯著,因此將此樣本分為3類比較合適。當K=3時,最終聚類中心如表3所示,每個類別中的個案數(shù)量如表4所示。

從表3、表4可以分析得出,第一類學(xué)生共45人,這類學(xué)生除人文社科素養(yǎng)能力、身體素養(yǎng)能力較弱之外,其他各方面的能力發(fā)展較為均衡,基本上不存在太多偏科現(xiàn)象,各學(xué)科均衡發(fā)展,屬于穩(wěn)定發(fā)展型人才,應(yīng)該繼續(xù)保持,建議適當加強人文社科素養(yǎng)、身體素養(yǎng)方面的培養(yǎng)。第二類學(xué)生共32人,這類學(xué)生與第一類學(xué)生恰好相反,人文社科素養(yǎng)與身體素養(yǎng)能力較強,但專業(yè)基礎(chǔ)能力、實踐操作能力等一般,需加強專業(yè)學(xué)科、英語能力等方面的學(xué)習(xí)。第三類學(xué)生人數(shù)較少,共10人,這類學(xué)生存在較明顯的偏科現(xiàn)象,除專業(yè)基礎(chǔ)能力的學(xué)科較好之外,其他各項能力方面的課程成績一般,尤其英語能力、實踐操作能力、身體素養(yǎng)能力等較差,需加強這方面課程的學(xué)習(xí),建議校學(xué)生學(xué)業(yè)指導(dǎo)中心重點關(guān)注這類學(xué)生,提供必要的學(xué)業(yè)指導(dǎo)和支持,以促進他們能夠均衡發(fā)展。

四、結(jié)束語

信息化時代,通過建立多維成績分析模型,采用大數(shù)據(jù)挖掘方法,對學(xué)生成績進行全面的多元統(tǒng)計分析,可以避免傳統(tǒng)成績分析存在的問題。多維成績分析模型在高校中的應(yīng)用,能使學(xué)校及時掌握學(xué)生的學(xué)習(xí)狀態(tài)及能力發(fā)展水平,發(fā)現(xiàn)和解決教師教學(xué)和學(xué)生學(xué)習(xí)中潛在的問題,為教師開展課程內(nèi)容、教學(xué)模式改革,考核評價方式改革,管理部門的教學(xué)管理、人才培養(yǎng)方案改革,學(xué)風(fēng)建設(shè),學(xué)業(yè)支持與輔導(dǎo)等工作提供數(shù)據(jù)支撐,從而提高高校教學(xué)質(zhì)量和人才培養(yǎng)質(zhì)量。

參考文獻:

[1]李新蕊.主成分分析、因子分析、聚類分析的比較與應(yīng)用[J].山東教育學(xué)院學(xué)報,2007(6):24.

[2]田宏,于曉秋.因子分析與聚類分析在學(xué)生成績綜合評價中的應(yīng)用[J].牡丹江師范學(xué)院學(xué)報(自然科學(xué)版),2009(3):9.

(編輯:王天鵬)

猜你喜歡
分析模型數(shù)據(jù)挖掘
基于BERT-VGG16的多模態(tài)情感分析模型
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
層次分析模型在結(jié)核疾病預(yù)防控制系統(tǒng)中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
全啟發(fā)式語言分析模型
大功率型EPS控制器熱分析模型的研究
數(shù)據(jù)挖掘的分析與探索
基于GPGPU的離散數(shù)據(jù)挖掘研究
IFC4結(jié)構(gòu)分析模型應(yīng)用技術(shù)
大學(xué)英語需求分析模型的理論構(gòu)建
改则县| 遵义县| 阳西县| 博野县| 任丘市| 巴林左旗| 襄垣县| 泸定县| 政和县| 淮北市| 太原市| 公安县| 邢台县| 珠海市| 芜湖县| 当阳市| 清水县| 出国| 双桥区| 孙吴县| 阳朔县| 罗江县| 松潘县| 台东市| 建湖县| 湘西| 富宁县| 宜君县| 南雄市| 伊金霍洛旗| 南开区| 防城港市| 蛟河市| 广安市| 凤阳县| 体育| 枞阳县| 兰考县| 武功县| 萨嘎县| 肥西县|