国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向應用型本科的“數(shù)據(jù)挖掘?qū)д摗闭n程建設(shè)研究

2024-06-18 12:21:54楊曉杏蘇建敏梅逢城
現(xiàn)代信息科技 2024年7期
關(guān)鍵詞:課程建設(shè)教學模式

楊曉杏 蘇建敏 梅逢城

收稿日期:2023-09-15

基金項目:深圳技術(shù)大學校級教學改革研究項目(20231056010014)

DOI:10.19850/j.cnki.2096-4706.2024.07.037

摘? 要:作為一個多學科交叉的新興學科,數(shù)據(jù)挖掘在各領(lǐng)域得到了廣泛應用,成為學術(shù)界與工業(yè)界的研究熱點和焦點,數(shù)據(jù)挖掘?qū)I(yè)人才在大數(shù)據(jù)行業(yè)日益發(fā)展的環(huán)境下顯得供不應求,因此各高校高度重視數(shù)據(jù)挖掘人才的培養(yǎng),開設(shè)“數(shù)據(jù)挖掘?qū)д摗毕嚓P(guān)課程。然而,傳統(tǒng)教學偏重理論,無法滿足應用型人才的培養(yǎng)要求。針對當前課程教學中存在的問題,分析面向應用型本科的“數(shù)據(jù)挖掘?qū)д摗闭n程建設(shè),探索課程的教學內(nèi)容及考核方式。

關(guān)鍵詞:數(shù)據(jù)挖掘?qū)д?;課程建設(shè);教學模式

中圖分類號:G642.0? ? 文獻標識碼:A? ? 文章編號:2096-4706(2024)07-0189-05

Research on“Introduction to Data Mining”Course Construction for

Application-oriented Undergraduate Programs

YANG Xiaoxing1, SU Jianmin2, MEI Fengcheng1

(1.Shenzhen Technology University, Shenzhen? 518118, China; 2.Wuyi University, Jiangmen? 529020, China)

Abstract: As an emerging discipline of multidisciplinary intersection, data mining has been widely used in various fields, and has become a research hotspot and focus in academia and industry field, and data mining professionals appear to be in short supply in the environment of the growing development of the Big Data industry. So colleges and universities have attached great importance to the cultivation of data mining talents, and have opened the“Introduction to Data Mining”related courses. However, traditional teaching favors theory and cannot meet the training requirements of application-oriented talents. We analyze the construction of the“Introductory to Data Mining”course for application-oriented undergraduates and explore the teaching content and assessment methods of the course in view of the problems existing in the teaching of the current course.

Keywords: Introduction to Data Mining; course construction; teaching mode

0? 引? 言

大數(shù)據(jù)已經(jīng)滲透到各個行業(yè),如何從海量數(shù)據(jù)中發(fā)現(xiàn)潛在有價值的規(guī)律與知識,并應用于經(jīng)濟生產(chǎn)、行業(yè)管理和社會服務等,是一個重要的課題。作為一個多學科交叉的新興學科,數(shù)據(jù)挖掘在各領(lǐng)域得到了越來越多的應用,已經(jīng)成為學術(shù)界與工業(yè)界的研究熱點和焦點,數(shù)據(jù)挖掘?qū)I(yè)人才在大數(shù)據(jù)行業(yè)日益發(fā)展的環(huán)境顯得供不應求,因此各高校高度重視數(shù)據(jù)挖掘人才的培養(yǎng),開設(shè)“數(shù)據(jù)挖掘?qū)д摗毕嚓P(guān)課程。如何通過“數(shù)據(jù)挖掘?qū)д摗闭n程的建設(shè)培養(yǎng)具有數(shù)據(jù)思維能力的應用型人才是值得探索的重要教學問題。

應用型本科院校的培養(yǎng)目標是培養(yǎng)高素質(zhì)應用型人才,提高學生的創(chuàng)新、創(chuàng)業(yè)能力,服務于地方經(jīng)濟的發(fā)展,為社會各行業(yè)發(fā)展提供充足的人才支撐和保障[1]。應用型人才培養(yǎng)目標的實現(xiàn),必須落實在課程教學設(shè)計和設(shè)置中。在應用型本科教育中的“數(shù)據(jù)挖掘?qū)д摗闭n程,應該更加注重培養(yǎng)學生的實踐能力。通過實際案例、項目和實驗,使學生能夠親自動手處理真實世界的數(shù)據(jù),運用數(shù)據(jù)挖掘算法解決實際問題。

1? 課程現(xiàn)狀

“數(shù)據(jù)挖掘?qū)д摗闭n程是一門多學科交叉的課程,學生需了解數(shù)值計算方法與優(yōu)化、概率論與數(shù)理統(tǒng)計、數(shù)據(jù)庫及編程語言等基本知識[2]。其涉及的理論較為復雜,各種數(shù)據(jù)挖掘任務往往可以形式化為不同性質(zhì)的數(shù)學問題,研究求解這些數(shù)學問題的算法或理解相關(guān)數(shù)學問題都需要不同領(lǐng)域的復雜數(shù)學理論[3]。

傳統(tǒng)教學偏重理論,無法滿足應用型人才的培養(yǎng)要求。針對傳統(tǒng)教學的問題,已有一些學者提出不同的教學模式。如衛(wèi)志華等[4]對新工科背景下數(shù)據(jù)挖掘課程綜合性實驗進行了設(shè)計,劉彤等[5]提出數(shù)據(jù)挖掘翻轉(zhuǎn)課堂混合式教學模式,對線上+線下的混合式教學模式進行補充,提出“四模塊三階段二層面”教學方法等。

也有學者針對不同專業(yè)對數(shù)據(jù)挖掘課程教學方式進行了深入探索,王偉[6]通過對網(wǎng)絡課程學員在線學習路徑的挖掘,識別管理類數(shù)據(jù)挖掘人才的市場需求,提出了課程改革的建議。通過引入先進的教學理念,對數(shù)據(jù)挖掘課程進行改革,黃發(fā)良等[7]基于CDIO理念,設(shè)計以數(shù)據(jù)思維能力培養(yǎng)為核心的教學目標,提出了面向理論創(chuàng)新的教學內(nèi)容與項目驅(qū)動的實驗教學方法。林華靈等[8]提出基于CDIO和OBE融合教育理念的課程教學改革思路。按照“以學生為中心,以成果為導向”和工程教育理念對教學目標、教學內(nèi)容、教學手段、授課形式和考核方式等教學過程進行重構(gòu)。周長敏[9]等提出“問題引導+案例分析”的理論實驗貫穿式教學方法,圍繞案例對教學內(nèi)容和教學過程進行設(shè)計,讓學生通過解決問題獲得成就感和學習內(nèi)驅(qū)力。趙曉凡[10]對公安高等院校開設(shè)數(shù)據(jù)挖掘課程提出了改革措施。

教學實踐表明這些方法在一定程度上有效地激發(fā)了學生的學習熱情,提高了教學質(zhì)量。因此,通過學習、引進、組合這些先進的教學理念,分析面向應用型本科的“數(shù)據(jù)挖掘?qū)д摗闭n程建設(shè),開展教學內(nèi)容和考核方式等探索,尤為重要。

2? 教學內(nèi)容

“數(shù)據(jù)挖掘?qū)д摗闭n程的內(nèi)容涵蓋了數(shù)據(jù)預處理、特征選擇、分類與回歸、聚類分析、關(guān)聯(lián)規(guī)則挖掘等基本概念和方法。

作為面向應用型本科的“數(shù)據(jù)挖掘?qū)д摗闭n程,既要考慮數(shù)據(jù)挖掘涉及的理論基礎(chǔ),也要考慮數(shù)據(jù)挖掘的具體應用,因此,共安排了54個學時,其中36學時為理論課,18學時為實驗課,此外,布置一次課外實踐,進一步加強學生使用理論知識解決實際問題的能力。

經(jīng)過探索,教學內(nèi)容設(shè)置如圖1所示。

2.1? 理論課程內(nèi)容設(shè)計

“數(shù)據(jù)挖掘?qū)д摗闭n程涉及的知識較為廣泛,讓學生掌握數(shù)據(jù)挖掘的理論、常用算法以及應用場景等相關(guān)知識尤為重要??紤]到學生相關(guān)知識儲備、課時安排以及實際應用的需求,安排理論課程內(nèi)容如下。

2.1.1? 數(shù)據(jù)挖掘的基本概念

通過講述數(shù)據(jù)挖掘的基本概念、基本任務、發(fā)展歷史、最新進展以及發(fā)展趨勢等內(nèi)容,使得學生對數(shù)據(jù)挖掘有基本的概念。

2.1.2? 數(shù)據(jù)的相關(guān)概念

通過講述數(shù)據(jù)類型、數(shù)據(jù)質(zhì)量、相似性和相異性的度量等相關(guān)內(nèi)容,使學生了解數(shù)據(jù)的相關(guān)概念以及數(shù)據(jù)的重要性,此外,通過講述基本的數(shù)據(jù)預處理技術(shù),使得學生掌握相關(guān)技術(shù),能夠?qū)?shù)據(jù)進行相關(guān)處理。

2.1.3? 分類的概念及算法

分類任務是數(shù)據(jù)挖掘的基本任務之一,是研究熱點,應用十分廣泛,因此作為“數(shù)據(jù)挖掘?qū)д摗闭n程的重點內(nèi)容。首先講述解決分類問題的一般方法,然后介紹經(jīng)典的分類算法,包括決策樹、基于規(guī)則的分類器、最近鄰分類器、貝葉斯分類器、人工神經(jīng)網(wǎng)絡、支持向量機、組合方法,最后講述分類模型的過分擬合問題、分類器的評價指標、比較分類器的統(tǒng)計方法、不平衡分類問題、多類分類問題等內(nèi)容。

2.1.4? 關(guān)聯(lián)分析的概念及算法

關(guān)聯(lián)分析也是數(shù)據(jù)挖掘的基本任務之一,首先講述關(guān)聯(lián)規(guī)則問題的定義,講述關(guān)聯(lián)規(guī)則的概念:項集、k-項集、空集、支持度計數(shù)、支持度、置信度、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、候選集、頻繁項集等。然后,通過講述候選項集的暴力破解法、先驗算法Apriori,F(xiàn)k-1*Fk-1方法等,引導學生掌握頻繁項集的產(chǎn)生。通過介紹生成候選規(guī)則的暴力破解法、基于Apriori的候選規(guī)則產(chǎn)生方法,引導學生掌握規(guī)則的產(chǎn)生。通過介紹最大頻繁項集以及FP增長算法,引導學生了解頻繁項集的緊湊表示以及FP增長算法。最后通過介紹主觀興趣度量和客觀興趣度量等,拿到學生掌握關(guān)聯(lián)規(guī)則模式評估的相關(guān)方法。

2.1.5? 聚類的概念及算法

聚類是數(shù)據(jù)挖掘中的一種無監(jiān)督學習方法,用于將數(shù)據(jù)對象根據(jù)它們的相似性進行分組或聚集。聚類的目標是在不需要先驗知識的情況下,發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式和結(jié)構(gòu)。幾種常見的聚類算法包括:K-means算法、層次聚類算法、密度聚類算法、基于概率模型的聚類算法、基于網(wǎng)格的聚類算法。每種算法都有其獨特的優(yōu)缺點和適用場景。在實際應用中,選擇適合具體問題需求和數(shù)據(jù)特征的聚類算法非常重要。

2.2? 實驗課程內(nèi)容設(shè)計

從上述的理論課程內(nèi)容可以看到,“數(shù)據(jù)挖掘?qū)д摗闭n程的知識點龐雜,如果只講述理論,學生難以消化,雖然通過設(shè)計案例能提高學生的理解能力,但是還需要實驗課程,使得學生學以致用。實驗課程旨在讓學生使用數(shù)據(jù)挖掘的理論、常用算法解決實際問題,加強理論與實踐的聯(lián)系?!皵?shù)據(jù)挖掘?qū)д摗睂嶒炚n程為18個課時,通過設(shè)計合適的實驗,可以幫助學生鞏固理論知識、掌握數(shù)據(jù)挖掘技術(shù),并培養(yǎng)實踐能力。

目前,隨著技術(shù)的迭代,出現(xiàn)了越來越多的數(shù)據(jù)挖掘工具,可以進行數(shù)據(jù)分析與挖掘。常用的三種方案包括:1)使用R語言進行數(shù)據(jù)挖掘;2)使用Python語言進行數(shù)據(jù)挖掘;3)使用WEKA(Waikato Environment for Knowledge Analysis)進行數(shù)據(jù)挖掘。WEKA是基于Java環(huán)境下開源的機器學習以及數(shù)據(jù)挖掘軟件,具有圖形用戶界面,易于操作,并且自帶示例數(shù)據(jù)集。鑒于部分同學沒有接觸過R語言、Python語言以及Java語言,實驗教學中采用開源的數(shù)據(jù)挖掘工具WEKA作為示例,使得每位同學都能較容易地完成實驗。然而,實驗教學中,雖然使用WEKA作為示例,但是允許學生自由選擇具體的工具實現(xiàn)實驗課程內(nèi)容,如直接使用Python語言實現(xiàn)等。實驗課程內(nèi)容主要包括以下部分:數(shù)據(jù)、分類算法的應用、關(guān)聯(lián)分析算法的應用、聚類算法的應用。

2.2.1? 數(shù)據(jù)

這部分實驗內(nèi)容主要是讓學生熟悉WEKA的使用。WEKA匯集了多種機器學習算法、數(shù)據(jù)預處理方法以及數(shù)據(jù)可視化圖形用戶界面。WEKA可以讀取arff、csv等格式的數(shù)據(jù)文件。其中arff是一種WEKA專用文件格式。這部分實驗內(nèi)容以weather.nominal.arff為例子,讓學生了解如何載入數(shù)據(jù),如何觀察數(shù)據(jù)的特征以及標簽,如何刪除或者增加特征等操作。

2.2.2? 分類算法的應用

這部分實驗內(nèi)容主要是讓學生掌握分類器的構(gòu)造,以及分類問題的一般解決過程。

首先,以iris.arff為例子,讓學生掌握如何選取不同的分類算法,設(shè)置不同的參數(shù),以及采用不同的測試方法,讓學生學會觀察結(jié)果,如圖2所示。

其次,布置一個分類問題,讓學生使用不同的分類算法解決,比較分析結(jié)果,并完成實驗報告。

2.2.3? 關(guān)聯(lián)分析算法的應用

這部分實驗內(nèi)容主要是讓學生掌握關(guān)聯(lián)規(guī)則挖掘及其具體應用,掌握關(guān)聯(lián)規(guī)則模式評估的相關(guān)方法。

首先,以supermarket.arff為例子,讓學生掌握如何選取不同的關(guān)聯(lián)分析算法,設(shè)置不同的參數(shù),讓學生學會觀察結(jié)果,如圖3所示。

其次,布置一個關(guān)聯(lián)分析問題,讓學生使用不同的算法,比較分析運行結(jié)果并完成實驗報告。

2.2.4? 聚類算法的應用

這部分實驗內(nèi)容主要是讓學生掌握使用聚類算法進行聚類,掌握聚類模型的評估方法。先以glass.arff為例子做示范,然后布置一個聚類任務,讓學生使用不同聚類算法,比較分析結(jié)果并完成實驗報告。

2.3? 實踐內(nèi)容設(shè)計

在課程實踐部分,學生將面臨一個具體的實際應用問題,例如推薦系統(tǒng)、輿情分析等。學生需要收集相關(guān)數(shù)據(jù),并運用所學的數(shù)據(jù)挖掘技術(shù)來解決問題。這個實驗可以讓學生將所學的知識應用到實際場景中,培養(yǎng)解決實際問題的能力。

實踐內(nèi)容選自Kaggle的案例。為了讓學生更好地根據(jù)自身的情況進行課外實踐,學生可以從Kaggle上自選案例,既可以使用不同的算法在參賽訓練集上做分析,也可以直接參與比賽,看比賽的排名及分數(shù)。

3? 課程考核

課程考核是檢驗教學效果、培養(yǎng)人才的重要環(huán)節(jié)。傳統(tǒng)的數(shù)據(jù)挖掘考核方式單一,主要以卷面成績(期末考試),或者以教師主觀對課程論文的打分來衡量學生對本課程的掌握情況。而應用型人才不僅要求學生掌握理論知識,還需要學生具備較強的實踐操作能力。為了綜合評估,課程考核應該使用多元化考核,并且應該覆蓋課程開始到課程結(jié)束的全過程。經(jīng)過探索,我們整理出具體的考核評價指標,如表1所示。

其中,課堂小測是在學期中進行,主要考察學習過程中理論知識的掌握程度。實驗以及實踐是以小組為單位的,實驗報告主要考察學生使用WEKA進行相關(guān)實驗、整理報告的能力(也可以使用其他工具),實踐及展示主要是考察學生的應用能力,即直接使用所學解決實際問題的能力,以及學生展示成果的能力。二者均反應團隊合作能力。期末論文則以個人為單位,可以進一步考察學生解決問題的實踐能力,包括對于問題的理解、思路、實驗、結(jié)果整理以及論文編寫的綜合能力。每個人都進行答辯,答辯過程,教師和學生都能提問和討論,以激發(fā)學生的創(chuàng)造力。

4? 課程成效

在2022—2023年第一學期,2019級物聯(lián)網(wǎng)專業(yè)共有90余名學生選修“數(shù)據(jù)挖掘?qū)д摗闭n程。經(jīng)過一個學期的實施,主要取得以下成效:

1)學生掌握了經(jīng)典的算法。通過課堂小測以及課堂討論,學生掌握了經(jīng)典算法的原理,并且能夠以例子說明算法的求解過程。

2)學生掌握了使用WEKA進行數(shù)據(jù)分析,可以進行分類器的構(gòu)建、聚類分析以及關(guān)聯(lián)分析。

實驗報告反應,學生能夠使用WEKA進行數(shù)據(jù)分析(包括特征增減等),能夠使用WEKA應用多種分類算法、聚類算法、關(guān)聯(lián)分析方法于相關(guān)的數(shù)據(jù)集并且進行相關(guān)分析。部分同學能使用Python語言進行相關(guān)的建模及分析。

3)學生完成了實踐內(nèi)容,并較好地展示結(jié)果。學生以小組的形式進行實踐內(nèi)容,所有小組注冊了Kaggle賬號并提交了分析結(jié)果,部分小組提交的成績在前30%,部分小組則進行了算法對比分析。各小組針對所選的問題,進行問題分析、數(shù)據(jù)預處理、特征選擇、構(gòu)建模型、結(jié)果分析、結(jié)果展示,體驗了數(shù)據(jù)挖掘基本流程,也反映了團隊合作能力。

4)學生高質(zhì)量完成期末論文并且進行相關(guān)答辯匯報。學生自選課題,進行了檢索文獻、撰寫論文到答辯匯報,從結(jié)果看來,學生對問題分析、解決的能力都得到了提升,有部分同學以期末論文為依托,進行了畢業(yè)設(shè)計。

5? 結(jié)? 論

綜上所述,數(shù)據(jù)挖掘是一門實用性很強的學科,注重將理論知識與實際應用相結(jié)合。在筆者的教學設(shè)計中,學生通過掌握理論、上機實驗、再到針對實際問題進行實踐,逐步遞進的掌握數(shù)據(jù)挖掘的基本原理和方法。同時,數(shù)據(jù)挖掘往往需要多個領(lǐng)域的專業(yè)知識和技能的協(xié)同,筆者鼓勵學生進行團隊合作,模擬真實工作環(huán)境中的跨領(lǐng)域團隊合作,通過與其他專業(yè)學生的合作,學生可以從不同角度思考問題,提高解決問題的能力和團隊合作的技巧。

在“新工科”背景下,為了培養(yǎng)同時具有扎實理論基礎(chǔ)、綜合實踐能力以及良好創(chuàng)新能力的應用型人才,筆者對“數(shù)據(jù)挖掘?qū)д摗闭n程的理論教學內(nèi)容、實驗教學內(nèi)容、實踐內(nèi)容和考核方式進行了探索和改革,力求能發(fā)揮課程對學生專業(yè)學習的啟蒙作用。在未來的教學實踐中,將繼續(xù)累積經(jīng)驗,不斷完善課程教學,提高教學成效,確保達成應用型人才培養(yǎng)的目標。

參考文獻:

[1] 潘懋元,周群英.從高校分類的視角看應用型本科課程建設(shè) [J].中國大學教學,2009(3):4-7.

[2] 唐培培,吳明暉.基于Kaggle競賽數(shù)據(jù)的“數(shù)據(jù)挖掘技術(shù)”課程建設(shè)探索與實踐研究 [J].工業(yè)和信息化教育,2021(3):85-88.

[3] 黃發(fā)良,鐘世華,何萬莉.基于CDIO理念的數(shù)據(jù)挖掘課程教學探索 [J].南寧師范大學學報:自然科學版,2021,38(2):191-196.

[4] 衛(wèi)志華,孔思尹,丁志軍,等.新工科背景下數(shù)據(jù)挖掘課程綜合性實驗設(shè)計 [J].計算機教育,2020(3):127-135.

[5] 劉彤,馬夢冉,倪維健.數(shù)據(jù)挖掘翻轉(zhuǎn)課堂混合式教學模式研究 [J].軟件導刊,2021,20(8):200-204.

[6] 王偉.融合學習路徑的管理類數(shù)據(jù)挖掘課程教學改革 [J].福建電腦,2021,37(2):33-36.

[7] 黃發(fā)良,鐘世華,何萬莉.基于CDIO理念的數(shù)據(jù)挖掘課程教學探索 [J].南寧師范大學學報:自然科學版,2021,38(2):191-196.

[8] 林華靈,丁杰,卓琳,等.關(guān)于應用型本科“數(shù)據(jù)挖掘”課程改革的探索與思考 [J].福建金融管理干部學院學報,2020(4):58-62.

[9] 周長敏,佘佐明,楊光臨.應用型本科數(shù)據(jù)挖掘技術(shù)課程教學方法的探索 [J].凱里學院學報,2022,40(3):104-108.

[10] 趙曉凡.公安高等院校數(shù)據(jù)挖掘課程教改研究 [J].計算機教育,2018(1):39-42.

作者簡介:楊曉杏(1984—),女,漢族,廣東云浮人,助理教授,博士,研究方向:軟件缺陷預測、數(shù)據(jù)挖掘;蘇建敏(1982—),男,漢族,湖北仙桃人,講師,博士,研究方向:多傳感器數(shù)據(jù)融合;梅逢城(1990—),男,漢族,江西南昌人,實驗師,碩士,研究方向:物聯(lián)網(wǎng)應用設(shè)計。

猜你喜歡
課程建設(shè)教學模式
群文閱讀教學模式探討
“思”以貫之“學、練、賽、評”教學模式的實踐探索
體育教學(2022年4期)2022-05-05 21:26:58
“以讀帶寫,以寫促讀”教學模式的實踐探索
甘肅教育(2020年12期)2020-04-13 06:25:48
高職機械類專業(yè)“CAD圖形設(shè)計”課程建設(shè)
中國市場(2016年36期)2016-10-19 05:00:13
《海圖學》課程的建設(shè)與實踐
科技視界(2016年21期)2016-10-17 18:25:28
“誤差理論與數(shù)據(jù)處理”課程建設(shè)的實踐與思考
科技視界(2016年21期)2016-10-17 18:17:51
基于卓越計劃的金屬結(jié)構(gòu)材料課程實踐化改革與建設(shè)
大學教育(2016年9期)2016-10-09 08:49:28
資源、生態(tài)與環(huán)境學科群體系下普通地質(zhì)學課程建設(shè)思考
大學教育(2016年9期)2016-10-09 08:36:39
中高職一體化課程體系建設(shè)的探索與實踐
成才之路(2016年25期)2016-10-08 10:20:01
“一精三多”教學模式的探索與實踐
屏边| 龙海市| 舞钢市| 九龙县| 五华县| 明水县| 桑日县| 太湖县| 陕西省| 彭泽县| 广安市| 闸北区| 云梦县| 小金县| 栾城县| 许昌县| 湘阴县| 广东省| 聊城市| 双鸭山市| 扎赉特旗| 大庆市| 宿迁市| 广平县| 岢岚县| 湟源县| 扶风县| 尉氏县| 乌海市| 慈利县| 基隆市| 揭西县| 南开区| 盐亭县| 法库县| 额尔古纳市| 台中市| 交城县| 徐汇区| 塔河县| 平乡县|