国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SQL Server數(shù)據(jù)挖掘的學(xué)生成績(jī)預(yù)警預(yù)報(bào)研究

2015-09-11 11:39宋紹云
電腦知識(shí)與技術(shù) 2015年17期
關(guān)鍵詞:學(xué)生成績(jī)關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘

宋紹云

摘要:目前高等學(xué)校中對(duì)學(xué)生成績(jī)的預(yù)警預(yù)報(bào)沒(méi)有一種比較有效和可行的系統(tǒng),為此提出一種基于SQL Server關(guān)聯(lián)規(guī)則挖掘的學(xué)生成績(jī)預(yù)警方法,并設(shè)計(jì)一種對(duì)學(xué)生成績(jī)預(yù)警和預(yù)報(bào)的數(shù)據(jù)挖掘模型,在預(yù)設(shè)一定的支持度和可信度的條件下,由SQL Analysis Services系統(tǒng)找出具有一定內(nèi)在聯(lián)系和不同支持度和可信度的課程成績(jī)之間的關(guān)聯(lián)規(guī)則,以便對(duì)學(xué)生課程學(xué)習(xí)成績(jī)進(jìn)行預(yù)警預(yù)報(bào)。實(shí)踐表明,該方法對(duì)提高教學(xué)質(zhì)量起到了重要作用。

關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;學(xué)生成績(jī);預(yù)警;預(yù)報(bào)

中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)17-0018-03

1 前言

要提高高等學(xué)校的教學(xué)質(zhì)量和就業(yè)率,學(xué)生的成績(jī)的預(yù)測(cè)預(yù)報(bào)是關(guān)鍵因素。由于信息系統(tǒng)在教務(wù)管理中的廣泛應(yīng)用,積累大量的學(xué)生成績(jī)數(shù)據(jù),其中隱含了學(xué)生學(xué)習(xí)成績(jī)的知識(shí)和規(guī)律,通過(guò)對(duì)成績(jī)數(shù)據(jù)的挖掘,發(fā)現(xiàn)隱藏其中的知識(shí)和規(guī)律,能夠促進(jìn)高校教務(wù)管理水平和對(duì)學(xué)生成績(jī)的預(yù)警預(yù)報(bào),我們用SQL Server Analysis Services技術(shù)對(duì)學(xué)生成績(jī)的數(shù)據(jù)庫(kù)進(jìn)行挖掘,找出學(xué)生成績(jī)之間關(guān)聯(lián)規(guī)則。通過(guò)學(xué)生成績(jī)之間的關(guān)聯(lián)性,對(duì)學(xué)生未來(lái)成績(jī)提出預(yù)警預(yù)報(bào),使學(xué)生預(yù)知自己未來(lái)的學(xué)科成績(jī),以便學(xué)生根據(jù)自己的學(xué)習(xí)情況,安排和調(diào)整自己的學(xué)習(xí)計(jì)劃提供參考。

2 課程關(guān)聯(lián)性及其預(yù)警

通過(guò)對(duì)玉溪師范學(xué)院信息技術(shù)工程學(xué)院的課程設(shè)置和培養(yǎng)目標(biāo)而制定的一系列的專(zhuān)業(yè)課程進(jìn)行分析。從課程性質(zhì)分必修課和專(zhuān)業(yè)選修課兩類(lèi);從知識(shí)結(jié)構(gòu)的方面可分為基礎(chǔ)理論課程、專(zhuān)業(yè)課程和通識(shí)課程等類(lèi)型。實(shí)施教學(xué)的課程具有一定順序性,并且課程之間是相互關(guān)聯(lián)的。有部分專(zhuān)業(yè)課程的學(xué)習(xí),必須有一定的先修課程的基礎(chǔ)知識(shí),才能學(xué)習(xí)好該門(mén)課程。通過(guò)分析找出課程之間的關(guān)聯(lián)性。如果有一門(mén)課程需要一門(mén)課程或多門(mén)先修課程,如果這些先修課程出現(xiàn)考試分?jǐn)?shù)偏低或不及格,我們對(duì)被影響到的那門(mén)課程提出預(yù)警信息。這樣就有利于學(xué)生及時(shí)準(zhǔn)確的掌握課程狀態(tài),避免考試成績(jī)出現(xiàn)分?jǐn)?shù)偏低的狀況。

每個(gè)學(xué)生的學(xué)習(xí)動(dòng)機(jī)是不同的,它是每個(gè)學(xué)生的學(xué)習(xí)成績(jī)不同的因素之一,不同的學(xué)習(xí)動(dòng)機(jī)會(huì)對(duì)學(xué)習(xí)的進(jìn)程和學(xué)習(xí)的效果產(chǎn)生不同的影響,也會(huì)使得學(xué)生的個(gè)性和心理有不同的發(fā)展軌跡。每個(gè)學(xué)生提前預(yù)知自己課程成績(jī)的情況也會(huì)促使學(xué)生更好地調(diào)整學(xué)習(xí)這門(mén)課程的學(xué)習(xí)狀態(tài),因此課程預(yù)警的提出可以對(duì)學(xué)生的學(xué)習(xí)動(dòng)機(jī)產(chǎn)生一定的影響。學(xué)生需要具有良好的學(xué)習(xí)動(dòng)機(jī)才能很好的完成學(xué)習(xí)和調(diào)整自身的心理狀態(tài),也是學(xué)生全面發(fā)展的重要保障。

每個(gè)學(xué)生能夠順利完成學(xué)業(yè)是一種認(rèn)知和自我實(shí)現(xiàn)的需求。學(xué)生對(duì)自己學(xué)業(yè)和就業(yè)具有自身的需求,如果學(xué)業(yè)受到威脅,必然會(huì)努力學(xué)習(xí)。課程成績(jī)的提高起到一種激勵(lì)的作用。當(dāng)對(duì)學(xué)生提出學(xué)習(xí)預(yù)警,使學(xué)生知道對(duì)其學(xué)業(yè)將會(huì)受到影響時(shí)候,學(xué)生就會(huì)明確自己的學(xué)習(xí)動(dòng)機(jī),使得學(xué)生有實(shí)現(xiàn)較高層次的學(xué)習(xí)目標(biāo)的動(dòng)力,有利于學(xué)生積極的學(xué)習(xí)有預(yù)警信息的課程。表1是部分專(zhuān)業(yè)課程的成績(jī)。

2 準(zhǔn)備數(shù)據(jù)

我們從學(xué)校教務(wù)系統(tǒng)中獲取2010級(jí)計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè)學(xué)生的各門(mén)專(zhuān)業(yè)課成績(jī),并整理為如表1所示的Excel表格。在SQL Server 2005中新建數(shù)據(jù)庫(kù)StudentDM,并創(chuàng)建具有相應(yīng)字段的SQL Server數(shù)據(jù)庫(kù)表StudentScore。打開(kāi)SQL Server Management Studio,通過(guò)數(shù)據(jù)庫(kù)引擎連接好SQL Server服務(wù)器,在創(chuàng)建好的數(shù)據(jù)庫(kù)上單擊鼠標(biāo)右鍵→任務(wù)→導(dǎo)入數(shù)據(jù),然后按照向?qū)б徊揭徊降夭僮鲗?dǎo)入excel數(shù)據(jù)到數(shù)據(jù)庫(kù)StudentDM的StudentScore表中。也可直接復(fù)制Excel數(shù)據(jù)到打開(kāi)的SQL Server數(shù)據(jù)庫(kù)表StudentScore中。

3 創(chuàng)建挖掘模型及數(shù)據(jù)挖掘

3.1數(shù)據(jù)準(zhǔn)備

SQL Server 2005 的Business Intelligence Development Studio,即商業(yè)智能開(kāi)發(fā)平臺(tái),是用于創(chuàng)建商業(yè)智能解決方案的工具。使用該平臺(tái)可以創(chuàng)建包含分析服務(wù)對(duì)象定義的分析服務(wù)項(xiàng)目。我們使用該工具對(duì)學(xué)生課程成績(jī)進(jìn)行關(guān)聯(lián)規(guī)則的挖掘。

我們先把玉溪師范學(xué)院信息技術(shù)工程學(xué)院近年來(lái)學(xué)生專(zhuān)業(yè)課成績(jī)錄入到MS Excel表格中。其次,在SQL Server中建立數(shù)據(jù)庫(kù)StudentDM,并創(chuàng)建數(shù)據(jù)庫(kù)表StudentScore,最后把 MS Excel數(shù)據(jù)導(dǎo)入到SQL Server數(shù)據(jù)庫(kù)表StudentScore中。下面將給出學(xué)生課程成績(jī)關(guān)聯(lián)規(guī)則的挖掘步驟。

3.2 操作步驟

3.2.1 創(chuàng)建 Analysis Services項(xiàng)目

從 Microsoft SQL Server 2005中打開(kāi) SQL Server Business Intelligence Development Studio窗口。

在“文件”菜單中選擇“新建”-“項(xiàng)目”。

在“新建項(xiàng)目”對(duì)話(huà)框中,選擇項(xiàng)目類(lèi)型中商業(yè)智能項(xiàng)目的Analysis Services。

更改項(xiàng)目名稱(chēng)為StudentScoreDM,也就是更改解決方案名稱(chēng),然后單擊“確定”。

3.2.2 數(shù)據(jù)源的創(chuàng)建

在SQL Server Business Intelligence Development Studio中用鼠標(biāo)右擊解決方案資源管理器中的“數(shù)據(jù)源”,再選擇“新建數(shù)據(jù)源”。

選擇“下一步”按鈕,再選擇“新建”,打開(kāi)“連接管理器”窗口。

在“連接管理器”窗口中,從“提供程序”中選擇“本機(jī) OLE DB\ SQL Native Client”;服務(wù)器名稱(chēng)輸入“l(fā)ocalhost”;在“登錄到服務(wù)器”中選擇“使用Windows身份驗(yàn)證”;選擇數(shù)據(jù)庫(kù)名稱(chēng)“StudentDM”,單擊“確定”按鈕。

在“數(shù)據(jù)連接”下面選擇“l(fā)ocal.StudentScore”數(shù)據(jù)庫(kù)表。

在數(shù)據(jù)向?qū)У哪M信息窗口中選擇“默認(rèn)值”,再選擇“完成”。

3.2.3 數(shù)據(jù)源視圖的創(chuàng)建

在SQL Server Business Intelligence Development Studio中用鼠標(biāo)右擊右邊的“數(shù)據(jù)源視圖”,再選擇“新建數(shù)據(jù)源視圖”和“下一步”,單擊“完成”。

3.2.4 關(guān)聯(lián)規(guī)則挖掘結(jié)構(gòu)的創(chuàng)建

在SQL Server Business Intelligence Development Studio中用鼠標(biāo)右擊右邊的“挖掘結(jié)構(gòu)”,再選擇“下一步”。

在“選擇定義方法”窗口中選擇“從現(xiàn)有關(guān)系數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)”,單擊“下一步”。

在“數(shù)據(jù)挖掘技術(shù)”窗口中選擇“Microsoft關(guān)聯(lián)規(guī)則”,再單擊兩次“下一步”。

在“制定定型數(shù)據(jù)”窗口中的“挖掘模型結(jié)構(gòu)”下面,選擇“建”(關(guān)鍵字段),“輸入”(用于預(yù)測(cè)的字段,例如:高等數(shù)學(xué)Ⅰ和高等數(shù)學(xué)Ⅱ),“可預(yù)測(cè)”(輸出字段,及預(yù)測(cè)結(jié)果字段,例如:數(shù)據(jù)結(jié)構(gòu))。

單擊 “下一步”,再單擊“下一步”,并選擇“允許鉆取”,最后單擊“完成”。

4 挖掘結(jié)果及預(yù)警分析

SQL Server Business Intelligence Development Studio的挖掘模型查看器的作用是用可視化方式給出挖掘模型及其算法結(jié)果。挖掘模型查看器具有項(xiàng)集、規(guī)則及依賴(lài)關(guān)系網(wǎng)絡(luò)選項(xiàng)卡。圖1是根據(jù)StudentScore數(shù)據(jù)庫(kù)表挖掘得到的關(guān)聯(lián)規(guī)則。

關(guān)聯(lián)規(guī)則是指數(shù)據(jù)項(xiàng)之間(課程成績(jī)之間)的關(guān)聯(lián)程度,也就是從一個(gè)事務(wù)中某些項(xiàng)的出現(xiàn)可導(dǎo)出另外項(xiàng)在同一事務(wù)中出現(xiàn)的程度,即隱藏在數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)規(guī)則。在SQL SERVER 2005 中采用的關(guān)聯(lián)規(guī)則算法是Apriori算法。下面我們解釋一下算法中的關(guān)鍵指標(biāo),如表1所示。

從圖1可以看出,數(shù)據(jù)結(jié)構(gòu)課程的學(xué)生成績(jī)與高等數(shù)學(xué)Ⅰ和高等數(shù)學(xué)Ⅱ的課程成績(jī)有密切的關(guān)系,如果高等數(shù)學(xué)的成績(jī)較差,則數(shù)據(jù)庫(kù)結(jié)構(gòu)課程的成績(jī)將可能不及格。表2中的概率是關(guān)聯(lián)規(guī)則挖掘中的可信度,重要性是支持度。從表2可以看出,若高等數(shù)學(xué)Ⅰ或高等數(shù)學(xué)Ⅱ的成績(jī)?nèi)舻陀?8分,則數(shù)據(jù)結(jié)構(gòu)將于可行度為100%,支持度大于34%的可能性不及格。

依賴(lài)關(guān)系網(wǎng)絡(luò)可以呈現(xiàn)產(chǎn)學(xué)生課程成績(jī)之間的的相關(guān)性,并通過(guò)圖形直觀(guān)了解課程成績(jī)之間的相關(guān)性。如圖2所示。其實(shí)關(guān)系依賴(lài)網(wǎng)絡(luò)也是對(duì)數(shù)據(jù)項(xiàng)進(jìn)行粗糙的分類(lèi),若數(shù)據(jù)項(xiàng)之間關(guān)聯(lián)性很強(qiáng),則可以分為一類(lèi)。圖2中數(shù)據(jù)結(jié)構(gòu)預(yù)測(cè)的成績(jī)?cè)?1到65分的就歸為一類(lèi)。我們對(duì)這部學(xué)生將提出預(yù)警,告知這部學(xué)生他們的數(shù)據(jù)結(jié)構(gòu)課程成績(jī)可能不及格(可信度100%,支持度34%)。

5 結(jié)論

通過(guò)SQL Server Analysis Services步驟進(jìn)行數(shù)據(jù)挖掘,創(chuàng)建 Analysis Services 項(xiàng)目,定義數(shù)據(jù)源,將 StudentScore 數(shù)據(jù)庫(kù)表定義為數(shù)據(jù)挖掘的數(shù)據(jù)源。最后定義數(shù)據(jù)源視圖為來(lái)自StudentScore 數(shù)據(jù)庫(kù)中選定表的元數(shù)據(jù)定義一個(gè)統(tǒng)一視圖。我們將得到課程成績(jī)之間的關(guān)聯(lián)規(guī)則,而且對(duì)每個(gè)學(xué)生都能得到預(yù)測(cè)結(jié)果。

我們使用我校信息技術(shù)工程學(xué)院的學(xué)生成績(jī)進(jìn)行挖掘,并預(yù)測(cè)和預(yù)報(bào)學(xué)生數(shù)據(jù)結(jié)構(gòu)的成績(jī),通過(guò)在我們的實(shí)際教學(xué)中的應(yīng)用,發(fā)現(xiàn)結(jié)果準(zhǔn)確率較高(高于95%),成績(jī)預(yù)警信息可具體到每一個(gè)學(xué)生,應(yīng)用SQL Server Analysis Services關(guān)聯(lián)規(guī)則挖掘技術(shù)解決了學(xué)生成績(jī)預(yù)警預(yù)報(bào)的問(wèn)題。對(duì)我校信息技術(shù)工程學(xué)院提高教學(xué)質(zhì)量起到了較大的作用。

參考文獻(xiàn):

[1] 陳元,陳文偉. 基于數(shù)據(jù)抽取器實(shí)現(xiàn)數(shù)據(jù)挖掘[J].計(jì)算機(jī)工程,2010(10).

[2] 陳高鋒,劉元?jiǎng)? 基于SQL選擇語(yǔ)句的聚類(lèi)分析[J].現(xiàn)代電子技術(shù),2012(14) .

[3] Jiawei Han. Micheline Kamber DataMining: concepts and techniques 2001.

[4] Deli Zhu. SQL Server 2005 Data Mining and Business Intelligence Solution 2007.

[5] 王欣,徐騰飛,唐連章.SQLServer 2005數(shù)據(jù)挖掘?qū)嵗治鯷M].北京:中國(guó)水利水電出版社,2008.

猜你喜歡
學(xué)生成績(jī)關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
淺析數(shù)據(jù)挖掘技術(shù)在學(xué)生管理系統(tǒng)中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究
阿拉尔市| 新建县| 大冶市| 民县| 桃江县| 宿迁市| 镇安县| 宁德市| 宁陕县| 民县| 板桥市| 林口县| 赤壁市| 张家界市| 廊坊市| 德兴市| 湾仔区| 宿迁市| 岳阳县| 泗水县| 巩义市| 商水县| 武陟县| 岱山县| 土默特左旗| 宁德市| 交城县| 南投市| 芒康县| 乃东县| 长乐市| 吴堡县| 山东省| 西宁市| 石首市| 车致| 临沂市| 富民县| 时尚| 台东市| 黑龙江省|