国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于關(guān)聯(lián)規(guī)則的計(jì)算機(jī)基本操作能力影響因素分析

2012-09-14 01:13李靜
關(guān)鍵詞:基本操作項(xiàng)集數(shù)據(jù)挖掘

李靜

(忻州師范學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)系,山西忻州034000)

基于關(guān)聯(lián)規(guī)則的計(jì)算機(jī)基本操作能力影響因素分析

李靜

(忻州師范學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)系,山西忻州034000)

以目前高校為非計(jì)算機(jī)專(zhuān)業(yè)學(xué)生開(kāi)設(shè)的計(jì)算機(jī)應(yīng)用基礎(chǔ)課程為研究對(duì)象,首先對(duì)關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了分析,而后將處理后的樣本數(shù)據(jù),由Excel工作表導(dǎo)入SQL Server 2008,生成數(shù)據(jù)挖掘庫(kù),并以VB 6.0作為前端開(kāi)發(fā)工具,采用Apriori算法進(jìn)行頻集挖掘,找出計(jì)算機(jī)基本操作能力各影響因素間的潛在關(guān)聯(lián)性,進(jìn)一步為學(xué)校、教師及學(xué)生的教學(xué)活動(dòng)提供有價(jià)值的參考建議。

關(guān)聯(lián)規(guī)則;Apriori算法;計(jì)算機(jī)基本操作能力;影響因素分析

隨著科學(xué)技術(shù)的飛速發(fā)展,計(jì)算機(jī)及其應(yīng)用技術(shù)已經(jīng)滲透到我們工作和生活的方方面面。作為21世紀(jì)的大學(xué)生,掌握過(guò)硬的計(jì)算機(jī)操作技能,尤其是常用的辦公自動(dòng)化軟件,已成為必備的就業(yè)條件。為此,全國(guó)各大高?;旧隙紴榉怯?jì)算機(jī)專(zhuān)業(yè)學(xué)生開(kāi)設(shè)了計(jì)算機(jī)基礎(chǔ)課程。目的在于普及計(jì)算機(jī)基礎(chǔ)知識(shí),側(cè)重于培養(yǎng)學(xué)生的計(jì)算機(jī)基本操作能力,提高學(xué)生的就業(yè)競(jìng)爭(zhēng)力。文章以幾種常用的辦公自動(dòng)化軟件為例,考查學(xué)生計(jì)算機(jī)基本操作的掌握情況,并使用關(guān)聯(lián)規(guī)則的Apriori算法,挖掘出影響計(jì)算機(jī)基本操作能力的各因素間的潛在聯(lián)系,從而為學(xué)校管理層制定有效的人才培養(yǎng)方案提供依據(jù),同時(shí),幫助教師合理制定教學(xué)計(jì)劃,指導(dǎo)學(xué)生合理分配學(xué)習(xí)時(shí)間。

1 關(guān)聯(lián)規(guī)則挖掘算法

在數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘中,關(guān)聯(lián)規(guī)則就是發(fā)現(xiàn)大量數(shù)據(jù)庫(kù)中項(xiàng)集之間的關(guān)聯(lián)關(guān)系[1]。更確切地說(shuō),關(guān)聯(lián)規(guī)則是通過(guò)量化的數(shù)字找出影響事件發(fā)生的諸多因素中,因素甲的出現(xiàn)對(duì)因素乙的出現(xiàn)有多大的影響。

關(guān)聯(lián)規(guī)則的形式化定義描述如下:

設(shè)I={i1,i2,i3,…,im}是由影響學(xué)生計(jì)算機(jī)基本操作能力的m個(gè)不同因素組成的集合。記D為事務(wù)的集合,即學(xué)生成績(jī)數(shù)據(jù)庫(kù),其中的每一個(gè)事務(wù),即每一個(gè)學(xué)生的成績(jī)信息是數(shù)據(jù)項(xiàng)I的一個(gè)子集。目的就是找出形如“X?Y”的關(guān)聯(lián)規(guī)則,其中X?I,Y?I,X∩Y=?,表示滿(mǎn)足X中條件的記錄也一定滿(mǎn)足Y[2]。

關(guān)聯(lián)規(guī)則挖掘算法主要基于兩個(gè)階段來(lái)實(shí)現(xiàn),第一,找出支持度大于最小支持度的項(xiàng)集,產(chǎn)生頻繁集;第二,由第一階段產(chǎn)生的頻繁集總結(jié)出有用的關(guān)聯(lián)規(guī)則。其中,第一階段頻繁集的產(chǎn)生主要用經(jīng)典的Apriori算法[3],通過(guò)多次掃描數(shù)據(jù)庫(kù),由連接操作和剪枝操作多次遞推實(shí)現(xiàn)。

2 利用關(guān)聯(lián)規(guī)則分析計(jì)算機(jī)基本操作能力的影響因素

2.1 數(shù)據(jù)準(zhǔn)備

主要結(jié)合筆者的工作實(shí)際,以忻州師范學(xué)院法律系二年級(jí)學(xué)生第一學(xué)期計(jì)算機(jī)應(yīng)用基礎(chǔ)課程的成績(jī)作為研究對(duì)象??紤]到就業(yè)需要,以打字速度、Windows XP操作系統(tǒng)及幾種常用的辦公自動(dòng)化軟件作為對(duì)計(jì)算機(jī)基本操作能力的影響因素進(jìn)行考查,分別記錄學(xué)生各部分成績(jī)。而將計(jì)算機(jī)基礎(chǔ)課程的期末考試成績(jī)作為學(xué)生計(jì)算機(jī)基本操作能力的綜合評(píng)價(jià),目的在于發(fā)現(xiàn)各影響因素間有價(jià)值的聯(lián)系。

2.2 數(shù)據(jù)的采集及預(yù)處理

所使用的數(shù)據(jù)中,打字速度通過(guò)金山打字通軟件,記錄學(xué)生在20分鐘內(nèi)的平均打字速度,由于學(xué)生打字的正確率普遍在95%以上,所以剔除個(gè)別打字正確率較低的學(xué)生記錄。Windows XP操作系統(tǒng)、Word2003、Excel2003和PowerPoint2003及課程期末考試成績(jī)的采集都使用各自統(tǒng)一的考試系統(tǒng),完全模擬軟件真實(shí)的運(yùn)行環(huán)境,按照規(guī)定時(shí)間上機(jī)測(cè)試,成績(jī)由考試系統(tǒng)自動(dòng)閱卷產(chǎn)生,整個(gè)過(guò)程能真實(shí)有效地反映學(xué)生對(duì)計(jì)算機(jī)基本操作的掌握情況。對(duì)于個(gè)別缺值記錄,通過(guò)求解其余記錄該字段平均值的方法獲取替代值。此次共采集到樣本數(shù)據(jù)103條,部分樣本數(shù)據(jù)如下表所示。

表1 采集到的部分樣本數(shù)據(jù)

在使用Apriori算法進(jìn)行頻集挖掘前,首先對(duì)采集到的數(shù)據(jù)樣本進(jìn)行離散化處理。根據(jù)用人單位對(duì)應(yīng)聘學(xué)生打字速度的相關(guān)要求,將學(xué)生的打字速度按每分鐘60字以上,45~59字,25~44字,低于24字劃分為“A”,“B”,“C”,“D”;其余操作課成績(jī)根據(jù)實(shí)踐經(jīng)驗(yàn),確定邊界值為:90≤A≤100,80≤A≤89,60≤A≤79,D≤59。轉(zhuǎn)換成邏輯型數(shù)據(jù)后的部分樣本數(shù)據(jù)如表2所示。

表2 離散化處理后的部分樣本數(shù)據(jù)

2.3 建立計(jì)算機(jī)基本操作能力學(xué)生成績(jī)數(shù)據(jù)挖掘庫(kù)

由于采集到的原始數(shù)據(jù)被存放在Excel文件中,所以利用MicrosoftSQLServer 2008中提供的導(dǎo)入和導(dǎo)出數(shù)據(jù)功能(DTS數(shù)據(jù)轉(zhuǎn)換服務(wù))將計(jì)算機(jī)基本操作能力學(xué)生成績(jī)。xls文件導(dǎo)入到SQL Server數(shù)據(jù)庫(kù)中[5],導(dǎo)入/導(dǎo)出向?qū)瓿山缑嫒鐖D1所示。

圖1 Excel文件導(dǎo)入SQL Server數(shù)據(jù)庫(kù)操作完成界面

2.4 開(kāi)發(fā)環(huán)境的設(shè)計(jì)

本文采用VB 6.0作為SQL Server 2008的前端開(kāi)發(fā)工具,實(shí)現(xiàn)關(guān)聯(lián)規(guī)則的挖掘。具體操作中,通過(guò)VB 6.0環(huán)境下的數(shù)據(jù)庫(kù)管理器以O(shè)DBC方式連接SQL Server。首先創(chuàng)建ODBC數(shù)據(jù)源,配置界面如下圖:

圖2 ODBC數(shù)據(jù)源的配置界面

創(chuàng)建ODBC數(shù)據(jù)源后,執(zhí)行VB 6.0中的“可視化數(shù)據(jù)管理器”命令,以O(shè)DBC方式打開(kāi)計(jì)算機(jī)基本操作能力學(xué)生成績(jī)數(shù)據(jù)庫(kù),從而建立VB與SQL Server數(shù)據(jù)庫(kù)的連接[4]。

2.5 產(chǎn)生頻繁項(xiàng)集與關(guān)聯(lián)規(guī)則

通過(guò)為工程添加數(shù)據(jù)環(huán)境設(shè)計(jì)器,設(shè)置Connection對(duì)象與學(xué)生成績(jī)表相連,并定義Command對(duì)象對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行操作。

本次分析中,主要采用Apriori挖掘算法,對(duì)與計(jì)算機(jī)基本操作能力相關(guān)的各因素中成績(jī)不及格(即為D)的項(xiàng)進(jìn)行分析,從而找出影響操作能力提高的內(nèi)在因素及各影響因素的相互關(guān)聯(lián)程度。

輸入忻州師范學(xué)院法律系二年級(jí)103個(gè)學(xué)生第一學(xué)期計(jì)算機(jī)應(yīng)用基礎(chǔ)課程的各項(xiàng)成績(jī),設(shè)最小支持度為3,刪去候選1-項(xiàng)集中支持度小于3的元素,產(chǎn)生頻繁1-項(xiàng)集L1如表3所示。

表3 頻繁1-項(xiàng)集L1

其次,利用“And”運(yùn)算求頻繁-K項(xiàng)集,本次試驗(yàn)產(chǎn)生頻繁-2項(xiàng)集L2時(shí)結(jié)束,L2如表4所示。

表4 頻繁2-項(xiàng)集L2

由L2產(chǎn)生關(guān)聯(lián)規(guī)則如表5所示。

表5 頻繁項(xiàng)集生成關(guān)聯(lián)規(guī)則

3 挖掘結(jié)果分析

若設(shè)最小置信度為0.3,則第2,4,6,7,8,10條為強(qiáng)關(guān)聯(lián)規(guī)則。分析各條強(qiáng)關(guān)聯(lián)規(guī)則,得到計(jì)算機(jī)基本操作能力各影響因素間的潛在聯(lián)系如下。

第一,規(guī)則2,4說(shuō)明:對(duì)于Windows模塊和Word模塊不及格的學(xué)生,打字速度慢的占多數(shù),這與實(shí)際情況相符。打字速度的測(cè)試采用金山打字通軟件進(jìn)行,而該軟件是運(yùn)行于Windows環(huán)境下的,不能熟練掌握Windows操作,在打字過(guò)程中,就會(huì)出現(xiàn)諸如無(wú)法添加、切換輸入法,標(biāo)點(diǎn)符號(hào)格式錯(cuò)誤,找不到指定輸入字符等問(wèn)題,而這些都會(huì)影響打字的正確率及速度;作為應(yīng)用軟件,Word涵蓋了其余應(yīng)用軟件的大部分基本操作,而且同樣是一種文字處理軟件,所以,Word操作不及格的情況下,學(xué)生對(duì)金山打字通軟件的使用一定也存在問(wèn)題,進(jìn)而影響打字速度的提高。

第二,規(guī)則7,8,10說(shuō)明:在Windows模塊和Word模塊不及格的情況下,學(xué)生期末成績(jī)不及格的概率較大。究其原因,Windows模塊是計(jì)算機(jī)應(yīng)用基礎(chǔ)這門(mén)課中學(xué)生最先接觸到的操作部分,存在入門(mén)難的問(wèn)題。同時(shí),Windows是一種系統(tǒng)軟件,是學(xué)習(xí)后續(xù)三種應(yīng)用軟件的平臺(tái)。對(duì)操作環(huán)境不熟悉,勢(shì)必會(huì)影響到期末的綜合測(cè)評(píng);Word是各行各業(yè)都會(huì)用到的軟件,為了使學(xué)生更好地適應(yīng)工作環(huán)境,期末考試中對(duì)Word操作考查的較深入,所占分值也較大。

4 相關(guān)建議

通過(guò)挖掘結(jié)果分析,可以得到如下啟示:Windows和Word是系統(tǒng)軟件和應(yīng)用軟件操作的基礎(chǔ),學(xué)校管理部門(mén)在修訂教學(xué)計(jì)劃時(shí)要予以體現(xiàn),以引起師生的重視。同時(shí),在教學(xué)過(guò)程中,教師要因材施教,采用多種教學(xué)手段和方法幫助學(xué)生夯實(shí)基礎(chǔ),而不是一帶而過(guò)。 學(xué)生在學(xué)習(xí)過(guò)程中,更要認(rèn)識(shí)到其基礎(chǔ)性地位,有的放矢地學(xué)習(xí),并能學(xué)以致用,不斷提高計(jì)算機(jī)基本操作技能。

[1]陳文偉,黃金才.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M].北京:人民郵電出版社,2005.

[2]夏火松.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)[M].北京:科學(xué)出版社,2004.

[3]張峰,胡學(xué)鋼.基于關(guān)聯(lián)規(guī)則的高職學(xué)生成績(jī)分析應(yīng)用研究[J].滁州學(xué)院學(xué)報(bào),2011,13(2):105-106.

[4]鄭阿奇.SQL Server實(shí)用教程[M].北京:電子工業(yè)出版社,2003.

[5]李杰.數(shù)據(jù)挖掘技術(shù)在學(xué)生成績(jī)分析中的應(yīng)用研究[D].西安:西安石油大學(xué),2010.

〔責(zé)任編輯 高?!?/p>

Analysis of Influence Factors on Basic Com puter Operating Ability b ased on Association Rules

L I Jing
(Departmentof Computer Science and Technology,Xinzhou Teachers′University,Xinzhou Shanxi,034000)

The paper researches into Basis of Computer Application that is opened to non computer majors by colleges and universities.It analyses association rulesmining algorithm at first.Then,handled sample data are imported to SQL Server 2008 from Excel,and generate a database.After that,frequent set is found by Apriori algorithm,and potential correlation among influence factors is observed.At last,references are provided to schools,teachers and students.

association rules;Apriorialgorithm;basic computer operating ability;influence factors analysis

TP311

A

1674-0874(2012)03-0010-03

2012-02-05

李靜(1983-),女,山西靜樂(lè)人,碩士,助教,研究方向:計(jì)算機(jī)科學(xué)與技術(shù)。

猜你喜歡
基本操作項(xiàng)集數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
致廣大 盡精微——實(shí)驗(yàn)基本操作與氧氣的實(shí)驗(yàn)室制取
點(diǎn)擊化學(xué)實(shí)驗(yàn)基本操作
不確定數(shù)據(jù)的約束頻繁閉項(xiàng)集挖掘算法
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
化學(xué)常用儀器與基本操作考查
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
鉗工的基本技術(shù)與基本操作的分析與研究
基于GPGPU的離散數(shù)據(jù)挖掘研究
一種新的改進(jìn)Apriori算法*