国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在計算機專業(yè)課程設置中的應用研究

2023-12-05 02:50:10輝,張
關(guān)鍵詞:項集雙高數(shù)據(jù)挖掘

陳 輝,張 玲

(1.淮南職業(yè)技術(shù)學院圖書館, 安徽 淮南 232001; 2.淮南職業(yè)技術(shù)學院經(jīng)濟管理學院, 安徽 淮南 232001)

2019年12日,教育部和財政部正式公布了我國197所“雙高計劃”建設名單,包括56所高水平學校建設高校和141所高水平專業(yè)群建設高校。“雙高計劃”也被一些人稱為是職業(yè)教育版的“雙一流” 工程,每五年一個支持周期,2019年啟動第一輪建設。安徽省教育廳于2023年1月啟動了省級雙高計劃——安徽省高水平高職學校和專業(yè)群建設計劃。省內(nèi)高校的“雙高計劃”的遴選工作和申報工作也相應展開,A院校為了搭上“雙高計劃”的快車,開啟學?!半p高計劃”的申報工作,學校內(nèi)部的提質(zhì)增效活動開展起來,提升教學管理工作也提上日程。應該通過合理的課程設置,提升學校的教學質(zhì)量,為申報“雙高計劃”提供扎實的支撐。

1 數(shù)據(jù)挖掘簡介

1.1 數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘就是從紛繁復雜的大量數(shù)據(jù)中,找到隱藏在其中的有用數(shù)據(jù)。隨著數(shù)據(jù)庫系統(tǒng)的廣泛應用和網(wǎng)絡技術(shù)的高速發(fā)展,社會產(chǎn)生大量數(shù)據(jù),在數(shù)據(jù)爆發(fā)時代的條件下,數(shù)據(jù)挖掘技術(shù)應運而生的。數(shù)據(jù)挖掘的對象可以是任何類型的數(shù)據(jù)源,在對數(shù)據(jù)源采取數(shù)據(jù)挖掘之前,需要事先制定計劃,設計好每一步的動作,最后要達到什么樣的目的,這樣才能保證數(shù)據(jù)挖掘有條不紊地實施并取得成功。數(shù)據(jù)挖掘分為有指導的數(shù)據(jù)挖掘和無指導的數(shù)據(jù)挖掘,具體而言,分類、估值和預測屬于有指導的數(shù)據(jù)挖掘,關(guān)聯(lián)規(guī)則和聚類屬于無指導的數(shù)據(jù)挖掘。

1.2 數(shù)據(jù)挖掘理論

一是項與項集。假設集合項集l={元素1, 元素2, …, 元素n},其中,元素m(m=1,2,…,n)是項集l中的項。這樣的集合稱為項的集合,即項集,包含n個項的項集稱為n項集。二是事務與事務集。每個事務T是一個項集,它是項集l的一個子集,使用唯一標識符Tid標記。不同的事務組成事務集D,它是關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的事務數(shù)據(jù)庫。三是關(guān)聯(lián)規(guī)則。所謂關(guān)聯(lián)規(guī),就是形如集合X=>Y的蘊涵式,其中集合X、Y是項集的子集且不能為空集,而X與Y交集為空。四是置信度(confidence)。在關(guān)聯(lián)規(guī)則下,置信度的定義如下:

五是支持度(support)。在關(guān)聯(lián)規(guī)則下,支持度是用來表示事務包含集合X和Y進行并集運算得到的結(jié)果,是集合X和Y中項的概率。六是頻繁項集(frequent itemset)。需要事先定義最小出現(xiàn)頻度(支持度計數(shù))閾值,使用閾值過濾掉項集l中低于它的項,則項集l中滿足的項是頻繁項集。 六是項集的出現(xiàn)頻度(support count)。它是包含項集的事務數(shù),也就是項集的頻度、支持度計數(shù)或計數(shù)。 7是強關(guān)聯(lián)規(guī)則。滿足最小支持度和最小置信度的關(guān)聯(lián)規(guī)則,即待挖掘的關(guān)聯(lián)規(guī)則。

2 計算機專業(yè)課程設置存在的問題

2.1 沒有做到統(tǒng)一管理

高職學校的課程設置和教學安排一般分配到二級學院設置,但是學時分配、教學資源分配、師資力量分配等受到學院主管部門或?qū)W校現(xiàn)有資源制衡,難以做到最優(yōu)搭配,專業(yè)建設目標和課程建設目標,因所處角度不同呈現(xiàn)多元化發(fā)展,有時還走回頭路,不能綜合利用現(xiàn)有的社會大數(shù)據(jù)資源。

2.2 課程領域分布不合理

高職學校的課程領域分布不合理,通識課和專業(yè)課分布雖然受限于上級文件,但是也存在要么廣度過于寬廣,要么深度過深的問題,體現(xiàn)學校想讓學生什么都學和什么都會的心情,不能在廣度和深度中準確把握度的問題,體現(xiàn)在課程設置中就是課程領域分布不合理。

2.3 課程實施不精細

高職學校的課程實施比較粗獷。大學課程的關(guān)聯(lián)性相對減弱,在課程實施的過程中不能統(tǒng)籌管理或缺乏統(tǒng)籌管理,具體表現(xiàn)就是理論課和實踐課課時分配不合理、專業(yè)課課程教學實施順序錯亂、通識課占比不合理等。

2.4 課程設置反饋機制不敏感

高職學校的課程教學反饋機制比較成熟,但是課程設置反饋機制不敏感,學校只注重學生的課程教學成績反饋,對于課程設置的反饋不敏感,某些課程設置不合理,往往要延遲幾年才能改正,開課順序合理不合理更沒有相關(guān)依據(jù),只是一味憑借經(jīng)驗開設。

3 數(shù)據(jù)挖掘在高校計算機專業(yè)課程設置中的運用——以A院校計算機專業(yè)部分學生的課程成績?yōu)槔?/h2>

3.1 數(shù)據(jù)解釋需求

從A學院教務系統(tǒng)下載基礎數(shù)據(jù),運用數(shù)據(jù)挖掘技術(shù)處理樣本數(shù)據(jù),求出課程之間的關(guān)聯(lián)性,用以指導課程開設順序。

3.2 基礎數(shù)據(jù)準備

以A院校計算機專業(yè)2021級部分學生2022~2023第二學期的課程成績?yōu)槔?進行初步數(shù)據(jù)清洗,取出樣本數(shù)據(jù),見表1。

表1 2022~2023第二學期的課程成績數(shù)據(jù)表

3.3 數(shù)據(jù)格式化

數(shù)據(jù)挖掘需要數(shù)值型數(shù)據(jù),所以要把表1中文本型數(shù)據(jù)格式化成數(shù)值型數(shù)據(jù),依據(jù)數(shù)值型關(guān)聯(lián)規(guī)則,把表1中數(shù)據(jù)格式化成2進制數(shù)據(jù),比如以80分以上(包含80分)格式化成“1”,否則為“0”,則表1格式化成二進制數(shù)據(jù),見表2。

表2 格式化成二進制型數(shù)據(jù)表

3.4 Apriori 算法

Apriori算法是目前最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的算法之一,也是挖掘算法中最經(jīng)典的算法。它的核心思想是利用逐層搜索的迭代方法找出數(shù)據(jù)庫中項集的關(guān)系,以形成規(guī)則,其迭代算法過程由連接(類矩陣運算)與剪枝(去掉那些沒必要的中間結(jié)果)組成。該算法中項集的概念即為項的集合。為進一步規(guī)范數(shù)據(jù),將課程成績作為數(shù)據(jù)挖掘的商品進行編號,生成數(shù)據(jù)庫,見表3。對表3進行關(guān)聯(lián)運算,關(guān)聯(lián)規(guī)則為min support=6/10。

表3 數(shù)據(jù)庫事務列表D

3.4.1 關(guān)聯(lián)運算步驟

圖1 C1表

圖2 L1表

圖3 C2

圖4 L2

圖5 C3

圖6 L3

3.4.2 Apriori算法結(jié)論

Apriori算法的最終結(jié)果是:L=L1∪L4∪L5或L=L3∪L4∪L5。產(chǎn)生的關(guān)聯(lián)表如圖7所示。進一步計算關(guān)聯(lián)規(guī)則,可挖掘出強關(guān)聯(lián)規(guī)則:

規(guī)則1=>4

Support=support({1,4})=60%

Confidence=support({1,4})/support({1})=100%

規(guī)則4=>1

Support=support({1,4})=60%

Confidence=support({1,4})/support({4})=66.7%

規(guī)則1,4=>5

Support=support({1,4})=60%

Confidence=support({1,4,5})/support({1,4})=100%

同理,可以計算出每個規(guī)則。假定min confidence=3/4=85%,通過分析,發(fā)現(xiàn)滿足X.Confidence>min Confidence 條件的關(guān)聯(lián)規(guī)則有:1?4,1?5,3?4, 3?5, 4?5,5?4,{1, 4}?5, {3, 4}?5這些規(guī)則都成為強關(guān)聯(lián)規(guī)則。

圖7 Apriori算法產(chǎn)生的關(guān)聯(lián)規(guī)則

4 結(jié)語

運用數(shù)據(jù)挖掘技術(shù),針對A院校計算機專業(yè)2021級部分學生2022~2023第二學期的課程成績進行分析,發(fā)現(xiàn)計算機應用基礎和計算機網(wǎng)絡概論、圖形化編程技術(shù)基礎課程相互關(guān)聯(lián)、相互影響;計算機網(wǎng)絡概論和圖形化編程技術(shù)基礎課程相互關(guān)聯(lián)、相互影響。綜上可知計算機應用基礎和計算機網(wǎng)絡概論、圖形化編程技術(shù)基礎三門課程聯(lián)系緊密,設置課程時,可關(guān)聯(lián)參考。

猜你喜歡
項集雙高數(shù)據(jù)挖掘
山東商業(yè)職業(yè)技術(shù)學院學報(2022年5期)2022-11-03 08:30:50
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
我校2020年“雙高計劃”建設研究成果展
我校隆重召開“雙高計劃”建設啟動大會
牽手教育: 中等職業(yè)學?!八脑⑴e, 德技雙高” 的校本實踐
廣東教育(2020年3期)2020-04-03 02:03:18
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
卷宗(2014年5期)2014-07-15 07:47:08
一種頻繁核心項集的快速挖掘算法
計算機工程(2014年6期)2014-02-28 01:26:12
基于GPGPU的離散數(shù)據(jù)挖掘研究
自治县| 娱乐| 武胜县| 洛南县| 沂源县| 莱州市| 玉环县| 河东区| 许昌县| 旬邑县| 乌审旗| 潜江市| 柏乡县| 宁蒗| 长兴县| 云安县| 天气| 永宁县| 华阴市| 日喀则市| 维西| 泾川县| 乐业县| 潜江市| 绩溪县| 七台河市| 车致| 益阳市| 广平县| 团风县| 台北市| 项城市| 塔城市| 乃东县| 福海县| 神池县| 龙海市| 德安县| 胶州市| 沭阳县| 乌海市|