国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘技術(shù)的五年制高職錄取

2015-12-10 11:33徐敏芝
電腦知識(shí)與技術(shù) 2015年26期
關(guān)鍵詞:錄取分?jǐn)?shù)關(guān)聯(lián)規(guī)則成績

徐敏芝

摘要:錄取分?jǐn)?shù)一直是衡量生源質(zhì)量的主要標(biāo)準(zhǔn),該文旨在以某五年制高職校學(xué)生錄取分?jǐn)?shù)與在校成績表現(xiàn)為研究對(duì)象,運(yùn)用基于Microsoft SQL Server Analysis Service平臺(tái)的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法,分析錄取分?jǐn)?shù)與在校表現(xiàn)的內(nèi)在關(guān)聯(lián),旨在了解入學(xué)成績對(duì)在校成績的影響程度,為分析五年制高職教學(xué)質(zhì)量評(píng)價(jià)體系提供參考依據(jù)。

關(guān)鍵詞:錄取分?jǐn)?shù);成績;關(guān)聯(lián)規(guī)則

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)26-0010-02

1 前言

江蘇省五年一貫制制高等職業(yè)教育經(jīng)過10余年發(fā)展,取得了令人矚目的成績,目前已進(jìn)入由規(guī)模發(fā)展到內(nèi)涵發(fā)展的關(guān)鍵時(shí)期。五年制高職教育的突出優(yōu)勢在于貫通中、高職教育,整體設(shè)計(jì)和統(tǒng)籌安排學(xué)生的知識(shí)、能力、素質(zhì)以及技能的訓(xùn)練和培養(yǎng),在得到社會(huì)普遍認(rèn)可的同時(shí),低于普高錄取分?jǐn)?shù)線的生源在進(jìn)入高職院校后,能否符合五年制高職教育培養(yǎng)要求,能否最終成為適應(yīng)和滿足地方區(qū)域經(jīng)濟(jì)社會(huì)發(fā)展要求的高素質(zhì)技能型人才,一直不乏爭議之聲。本文擬突破傳統(tǒng)數(shù)據(jù)分析方式,應(yīng)用基于Microsoft SQL Server Analysis Service平臺(tái)的數(shù)據(jù)挖掘技術(shù),根據(jù)信息化平臺(tái)積累的原始數(shù)據(jù),分析五年制高職學(xué)生錄取分?jǐn)?shù)與在校成績之間的相關(guān)性,揭示隱藏在其中,但又有潛在有價(jià)值的信息。

2 數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則

數(shù)據(jù)挖掘是指以某種方式分析數(shù)據(jù)源,從中發(fā)現(xiàn)一些潛在的有用的信息,因此數(shù)據(jù)挖掘又稱作知識(shí)發(fā)現(xiàn),由于關(guān)聯(lián)規(guī)則可以有效發(fā)現(xiàn)數(shù)據(jù)之間的重要聯(lián)系,且規(guī)則易于解釋和理解,因而關(guān)聯(lián)規(guī)則挖掘迅速成為數(shù)據(jù)挖掘研究的重要分支,它能從數(shù)據(jù)背后發(fā)現(xiàn)事物之間可能存在的關(guān)聯(lián)或者聯(lián)系。舉個(gè)例子,顧客在超市買床上用品,其中30%的顧客會(huì)同時(shí)購買床單和枕套,而購買床單的人中有80%購買了枕套,這里面就隱藏了一條關(guān)聯(lián):床單—>枕套,也就是說很大一部分顧客會(huì)同時(shí)購買床單和枕套,那么對(duì)于商場來說,可以把床單和枕套放在同一個(gè)購物區(qū),那樣既能方便顧客購物,也能增加枕套的銷量。由于下面介紹關(guān)聯(lián)規(guī)則的一些重要概念以及如何從數(shù)據(jù)中挖掘出關(guān)聯(lián)規(guī)則。

關(guān)聯(lián)規(guī)則:用來發(fā)現(xiàn)在同一事件中出現(xiàn)的不同項(xiàng)的相關(guān)性,D表示事務(wù)數(shù)據(jù)庫,關(guān)聯(lián)規(guī)則的挖掘任務(wù)就是找到事務(wù)數(shù)據(jù)庫D中支持度和置信度分別滿足用戶指定的最小支持度和最小置信度的規(guī)則A—>B,關(guān)聯(lián)規(guī)則挖掘可以大致分為兩步:

1)從事務(wù)數(shù)據(jù)庫D中找出頻繁項(xiàng)目集;

2)從頻繁項(xiàng)目集合中生成滿足最低置信度的關(guān)聯(lián)規(guī)則。

最出名的關(guān)聯(lián)規(guī)則挖掘算法是Apriori算法,它是后來絕大多數(shù)關(guān)聯(lián)規(guī)則挖掘算法的基礎(chǔ)。Apriori性質(zhì)的內(nèi)容是頻繁項(xiàng)集的所有非空子集也都必須是頻繁的。Apriori算法將發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的過程分為:第一,通過迭代檢索出所有頻繁項(xiàng)集,即支持度不低于用戶設(shè)定的閾值的項(xiàng)集;第二,利用第一步中的頻繁項(xiàng)集構(gòu)造出滿足用戶最小置信度的規(guī)則。

3 數(shù)據(jù)采集與預(yù)處理

研究的數(shù)據(jù)以2011年和2013年兩年某五年制高職校683名無錫錄取的新生的中考分?jǐn)?shù)和在校課程成績?yōu)樵紨?shù)據(jù)。這些數(shù)據(jù)來自于異構(gòu)數(shù)據(jù)庫,而且比較“臟”,存在雜質(zhì)、噪聲、不一致、不規(guī)范、遺漏等情況,需要根據(jù)分析主題進(jìn)行ETL(Extract/Transformation/Load),即從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)清洗、轉(zhuǎn)換等,按照預(yù)先定義的數(shù)據(jù)倉庫建模,為數(shù)據(jù)挖掘構(gòu)建純凈分析環(huán)境。本次數(shù)據(jù)處理工作分錄取分?jǐn)?shù)和在校成績兩方面。

1)錄取分?jǐn)?shù):

數(shù)據(jù)來源:“錄取分?jǐn)?shù)”是指學(xué)生的入學(xué)考試成績,五年一貫制高職學(xué)校招生的對(duì)象是初中生,錄取分?jǐn)?shù)即中考成績。因江蘇各地中考總分不同,且部分地區(qū)錄取成績沒有電子檔案,不易采集,為保證研究的可行性和準(zhǔn)確性,數(shù)據(jù)采自《無錫市高級(jí)中等學(xué)校招生錄取名冊(cè)》,以2011級(jí)和2013級(jí)別兩屆無錫本地生源為對(duì)象。

數(shù)據(jù)轉(zhuǎn)換:無錫市兩年中考總分不同,各科總分也有差異,例如語文總分為130,體育總分為35,需統(tǒng)一將采集原始數(shù)據(jù)轉(zhuǎn)換為百分制。

2)在校成績

分析對(duì)象涉及某校所有高職專業(yè),課程性質(zhì)不同,學(xué)分不同,為了能較直觀且客觀地衡量學(xué)生成績表現(xiàn),筆者將學(xué)生在校學(xué)習(xí)期間的所有課程分?jǐn)?shù)乘以相應(yīng)的學(xué)分?jǐn)?shù)的求和除以所有課程學(xué)分的總和,得到該生的平均學(xué)分績,再根據(jù)課程性質(zhì)不同,劃分為公共課平均學(xué)分績和專業(yè)課平均學(xué)分績,以便體現(xiàn)職業(yè)院校學(xué)生的學(xué)習(xí)特征

再按照百分制分?jǐn)?shù),將“90~100”定義為優(yōu)秀,80~90定義為良好,70~80定義為中等,60~70定義為合格,60以下為不合格,最終構(gòu)建出服務(wù)于本次分析的數(shù)據(jù)倉庫。

圖1 錄取分?jǐn)?shù)與在校成績相關(guān)性分析數(shù)據(jù)倉庫

4 學(xué)生錄取分?jǐn)?shù)與在校成績相關(guān)性數(shù)據(jù)挖掘分析

1)項(xiàng)集分析

將預(yù)處理后的數(shù)據(jù)庫導(dǎo)入Microsoft SQL Server Analysis Services項(xiàng)目進(jìn)行數(shù)據(jù)挖掘的關(guān)聯(lián)分析,得到項(xiàng)集如圖2所示:

圖2 項(xiàng)集圖

圖2說明支持“體育=優(yōu)秀”的學(xué)生有419人,支持“平均學(xué)分績=良好,公共課平均學(xué)分績=良好”為247人。

2)規(guī)則分析

圖3 “語文”規(guī)則

以語文為先導(dǎo)為例,入學(xué)語文成績優(yōu)秀與否都有大概率趨向在校成績中等。以外語成績?yōu)橄葘?dǎo),若僅僅外語成績較好,而其他科目中等,則也有大概率趨向在校成績中等。若以數(shù)學(xué)成績?yōu)橄葘?dǎo),若入學(xué)數(shù)學(xué)成績優(yōu)秀,其他科目優(yōu)秀與否都有大概率趨向在校成績優(yōu)秀。若以入學(xué)總分為先導(dǎo),入學(xué)總分和數(shù)學(xué)均偏低的學(xué)生在校各門課程成績差強(qiáng)人意。

3)依賴關(guān)系網(wǎng)絡(luò)圖分析

初始關(guān)系圖錯(cuò)綜復(fù)雜,為了更直觀顯示,保留較強(qiáng)關(guān)聯(lián)得到圖4。

圖4 依賴關(guān)系網(wǎng)絡(luò)圖

由圖可見,入學(xué)總分中等或者良好的學(xué)生在專業(yè)課學(xué)習(xí)上,取得優(yōu)秀或者中等成績的概率各半;入學(xué)總分偏低的學(xué)生往往在校表現(xiàn)也不理想;僅僅外語優(yōu)秀或者語文良好的學(xué)生專業(yè)課成績反而不理想;理化成績優(yōu)秀或者良好的學(xué)生,專業(yè)課成績較好。

5 結(jié)論

上述研究以“五年制高職學(xué)生錄取分?jǐn)?shù)與在校成績相關(guān)性”為研究對(duì)象,以某校2011年和2013年683名無錫錄取新生的中考分?jǐn)?shù)和在校課程成績?yōu)樵紨?shù)據(jù),基于Microsoft SQL Server Analysis Services項(xiàng)目平臺(tái)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,取得研究結(jié)論如下:

1)兩屆無錫學(xué)生在五年制高職院校學(xué)習(xí)期間,成績總體表現(xiàn)合格率為100%,其中達(dá)到良好及以上的比例高達(dá)58.4%,僅1.4%的學(xué)生為合格(平均學(xué)分績60~70)。說明絕大多數(shù)學(xué)生符合五年制高職教育的培養(yǎng)標(biāo)準(zhǔn),在校成績表現(xiàn)較好。

2)中考各個(gè)科目對(duì)高職階段課程學(xué)習(xí)影響程度不同,被語文和外語成績拖累入學(xué)總分的學(xué)生,如果數(shù)學(xué)或理化成績較好,在專業(yè)課程學(xué)習(xí)階段,取得優(yōu)秀成績的概率達(dá)到70%以上;數(shù)學(xué)成績較好的新生,不論其他課程成績是否優(yōu)秀,專業(yè)課程成績往往較好;入學(xué)體育成績優(yōu)秀的學(xué)生在校總體成績較好。

3)學(xué)生錄取分?jǐn)?shù)確實(shí)在一定程度上影響在校成績,但相關(guān)性并不強(qiáng)。例如總分僅在合格水平的新生在高職院校的各科成績也偏低,但總分達(dá)到中等及以上水平的學(xué)生入校后均有大概率取得優(yōu)秀或良好成績。

參考文獻(xiàn):

[1] 蔣留生.五年制高職和三年制高職質(zhì)量與效益狀況的對(duì)比研究[J].徐州師范大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,2012(6):151-156.

[2] 謝邦昌.SQL Server 2008 R2數(shù)據(jù)挖掘與商業(yè)智能基礎(chǔ)及高級(jí)案例實(shí)戰(zhàn)[M].北京:中國水利水電出版社,2011:3-8.

[3] Jiawei Han, Micheline Kamber. 數(shù)據(jù)挖掘概念與技術(shù)[M].2版. 范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2007:3-17.

[4] 張興會(huì).數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:清華大學(xué)出版社,2011:2-5.

猜你喜歡
錄取分?jǐn)?shù)關(guān)聯(lián)規(guī)則成績
K-Means聚類分析在高職高專院校招生中的應(yīng)用
學(xué)在財(cái)校,終得成材
學(xué)在財(cái)校,終得成材
示范校建設(shè)對(duì)高職院校生源質(zhì)量的影響
論如何提高高中化學(xué)成績
關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
剖析累進(jìn)評(píng)分法對(duì)體育成績?cè)u(píng)定的必要性及其應(yīng)用
影響高中體育特長生成績的因素及對(duì)策分析
關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
基于關(guān)聯(lián)規(guī)則的計(jì)算機(jī)入侵檢測方法