国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于TDC模式的數(shù)據(jù)挖掘課程教學新方法

2015-05-30 08:40:10石向榮
經(jīng)濟師 2015年5期
關鍵詞:任務驅(qū)動法數(shù)據(jù)挖掘

摘 要:文章通過對目前“數(shù)據(jù)挖掘”課程教學中存在問題的調(diào)研,結(jié)合實際工作中的見聞與思考,并匯總相關文獻的研究結(jié)論,提出解決教學中所存在問題的整體方案。該方案可歸結(jié)為以“理論”、“數(shù)據(jù)”、“代碼”為核心的TDC教學模式,從而提出一種大學數(shù)據(jù)挖掘課程的新式教學方法。

關鍵詞:數(shù)據(jù)挖掘 任務驅(qū)動法 TDC教學模式

中圖分類號:F222 文獻標識碼:A

文章編號:1004-4914(2015)05-253-02

一、引言

數(shù)據(jù)挖掘作為一門新興的學科,是高等數(shù)學、統(tǒng)計學以及數(shù)據(jù)庫技術等交叉發(fā)展的產(chǎn)物,它廣泛應用于商業(yè)、工程、醫(yī)學、農(nóng)學等諸多領域。隨著我國社會經(jīng)濟的發(fā)展,各行業(yè)信息化程度不斷提升,產(chǎn)生了可供分析挖掘的海量數(shù)據(jù)。因此,如何充分利用這些數(shù)據(jù)并從中提煉有價值的信息,成為學術界日益關注的焦點問題。近年來,為緊跟社會發(fā)展的步伐,國內(nèi)外高校紛紛開設數(shù)據(jù)挖掘課程,該課程具有鮮明的時代特點和較強的實用性,受到了學生們的廣泛歡迎,但又由于課程內(nèi)容復雜、模型眾多、理論較抽象、對數(shù)學基礎要求較高,在教學過程中也暴露出一些問題,主要表現(xiàn)為:

一是課程理論部分內(nèi)容特別豐富,且呈不斷膨脹趨勢,如果不適時地改革傳統(tǒng)教學方式,新內(nèi)容將使學習者應接不暇,對授課教師也形成不小的壓力。

二是適合于課堂教學并且生動有趣的實例數(shù)據(jù)相對較少。由于有價值的數(shù)據(jù)資源大多存在于金融、電信、保險等行業(yè),而這些數(shù)據(jù)往往涉及行業(yè)機密,因此,尋找合適的數(shù)據(jù)資源以供課堂教學使用并非易事。

三是適合于課堂教學使用的示例程序相對較少。目前可以呈現(xiàn)數(shù)據(jù)挖掘效果的軟件有不少,可方便地從輸入數(shù)據(jù)中挖掘出結(jié)果,適合于商業(yè)使用,但對于以學習原理為目的的學生而言并無補益。

針對上述諸多問題,一些教學研究者從不同的角度提出了改革建議,如:覃義(2012)提出數(shù)據(jù)挖掘的教學應與實驗相結(jié)合,并且應與驗證式的實驗形成區(qū)別,避免給學生提供數(shù)據(jù)而讓學生按照步驟進行挖掘的方式,以培養(yǎng)學生的實踐能力;王麗麗(2013)提出以CDIO(構(gòu)思、設計、實施、運作,Conceive, Design, Implement,Operate)理念為指導,以CDIO過程為主導,以項目驅(qū)動法為方法,改革課程教學方式,對教學目標、教學內(nèi)容、教學方式進行重設,增加項目教學,實踐證明,上述改革舉措能有效培養(yǎng)學生思考和主動學習的能力、提升工程實踐和團隊合作能力。而黃嵐(2014)從教學資源的角度出發(fā),提出通過構(gòu)建三大類挖掘資源庫以輔助教學的模式。但這些新的改革方案都是從某一特定角度出發(fā),解決了當前數(shù)據(jù)挖掘教學中存在的某些具體問題,具有局限性,正如李衛(wèi)華(2014)指出,項目驅(qū)動法僅適用于小班化教學,當班級人數(shù)超過50時,該方法無法順利開展,其局限性顯而易見。

為了對數(shù)據(jù)挖掘課程的整個教學模式進行根本性、徹底性的變革,筆者經(jīng)過反復思考,結(jié)合與授課同學交流的體會,提出一種T(理論,Theory)、D(數(shù)據(jù),Data)、C(代碼,Code)相結(jié)合的新式教學方法。T為大綱規(guī)定的理論性內(nèi)容,D為精心準備的各行業(yè)案例數(shù)據(jù),C為實現(xiàn)具體算法的程序代碼。該教學法讓同學們在編程實戰(zhàn)中學會并掌握數(shù)據(jù)挖掘的基本理論,同時還初步掌握1~2門編程語言。整套改革方案包括如下相互聯(lián)系的幾個組成部分。

二、重設課程教學大綱

當前,數(shù)據(jù)挖掘課程教育界有一套公認為標準的教學大綱,是2006年由美國計算機學會數(shù)據(jù)挖掘?qū)iT興趣小組(ACM SIGKDD)擬定的。SIGKDD的大綱從數(shù)據(jù)庫、數(shù)據(jù)預處理、統(tǒng)計推理等8個方面入手,將課程教學內(nèi)容分為基礎和高級兩個專題。其中,基礎部分包括:導論、數(shù)據(jù)預處理、數(shù)據(jù)倉庫與OLAP、關聯(lián)規(guī)則與頻繁模式挖掘、分類、聚類與孤立點分析、時間序列與序列模式、文本與Web挖掘、數(shù)據(jù)挖掘的可視化、數(shù)據(jù)挖掘應用10章;高級部分包含基礎部分后9章的全部內(nèi)容,另外還引入了更復雜的算法及數(shù)據(jù)流挖掘、時空與多媒體數(shù)據(jù)挖掘等內(nèi)容。

可見,大綱規(guī)定的內(nèi)容,特別是高級專題部分,具有隨社會發(fā)展不斷膨脹的特點,而本文所提出的教學改革方案,是以不增加課堂教學總學時為前提的。不僅如此,還將考慮增加程序設計部分的講授內(nèi)容,由此要求對“標準版”大綱的內(nèi)容實施裁減,新的大綱以“讓學生掌握基本的數(shù)據(jù)挖掘理論”為前提,適當刪減理論部分的內(nèi)容,增加課程實踐部分的學時。例如,在決策樹分類算法部分,介紹ID3算法這一典型即可,對其變種C4.5可交給同學自學,綜合而言,對標準版大綱的重新組織方案可參看表1。

按照這種方案對教學內(nèi)容刪減之后,并不會削弱同學們對數(shù)據(jù)挖掘基本理論的理解,這是由于這些算法中,所保留的基本算法或原型算法往往能體現(xiàn)某一大類算法的本質(zhì)特點,而所刪減部分的內(nèi)容只是在細節(jié)問題上和原型算法有一些差異,無關算法的核心內(nèi)容,這就解決了Theory部分的教學問題,而利用所節(jié)余的時間,輔以程序?qū)崿F(xiàn)(Code)的教學,反過來還能進一步夯實所學的理論,加深理解。

三、全方位多角度改革教學方式

(一)搜集有價值的案例數(shù)據(jù)

數(shù)據(jù)在數(shù)據(jù)挖掘課程中的重要性也許是所有課程中最重要的,2014年,學者黃嵐專門研究了課程數(shù)據(jù)資源庫的建立之于課堂教學的重要意義。為取得良好的教學效果,激發(fā)學習熱情,須要精心選擇一批好的案例,搜集一批具有一定規(guī)模的數(shù)據(jù),避免紙上談兵。例如,用于頻繁模式發(fā)現(xiàn)的數(shù)據(jù),其事務條數(shù)至少應達到上百或以上規(guī)模,才能體現(xiàn)本課程的價值。當然,這些實例數(shù)據(jù)的來源應當真實可靠,有說服力,并且和社會普遍關注的問題有一定相關性,這樣才能更好地抓住受眾的眼球。例如在講授時間序列分析時,可采集一批股票或期貨市場的價格數(shù)據(jù)。為做好數(shù)據(jù)準備工作,任課教師團隊須要投入一定的時間精力與學術界、企業(yè)界交流,爭取他們在數(shù)據(jù)上對大學教學工作的支持。

(二)選擇合適的輔助學習軟件

傳統(tǒng)的教學方式側(cè)重于講授理論,為加深對理論的理解,會有一些書面練習,但是數(shù)據(jù)挖掘課程的特點決定了其數(shù)據(jù)規(guī)模往往較龐大,因此通過計算器和草稿紙的傳統(tǒng)演算方式來完成計算任務并不切實際,因而亟待引入專門的計算軟件輔助挖掘工作的開展。

目前能勝任數(shù)據(jù)挖掘任務的程序并不少見,如馬守東(2013)所推薦采用的SAS軟件,以及曾垂?。?014)在教學中使用的Clementine軟件。但是,這些軟件設計的初衷是為了解決工業(yè)上的數(shù)據(jù)挖掘?qū)嶋H問題,而非為了輔助教學,對教學而言,這些軟件的弊端是過于“重量級”。另一方面,其工作方式往往是,經(jīng)過簡單的參數(shù)配置,同時確保輸入數(shù)據(jù)格式符合要求,即可在短時間內(nèi)輸出挖掘結(jié)果。如此過程對于學生而言無異于黑箱操作,學習者無法深入領會挖掘算法的原理、來龍去脈,因而無助于培養(yǎng)動手實踐能力,副作用很明顯。

另一種可能考慮的方案是選擇諸如Java、C、C++之類的主流程序設計語言,但是如果選擇它們,同樣會有一些問題,如:上述高級語言的學習本身即是一個復雜的過程,如果在課堂上講解語言本身,可能會沖淡課程的主題,顧此失彼。而如果不講,則對于沒有經(jīng)過有效訓練的同學,難以在短時間內(nèi)掌握,徒增對課程的畏懼心理;課程學習對象未必是接受過專門訓練的計算機專業(yè)同學,甚至并不具備程序設計基礎,因此受眾的軟件開發(fā)能力可能參差不齊,由此會帶來教學效果的大打折扣。

例如,對于經(jīng)管類專業(yè)本科生而言,數(shù)據(jù)挖掘的教學內(nèi)容對他們有著較強的吸引力,但相對薄弱的計算機編程基礎卻使他們對課程望而卻步,因此選擇一款合適的軟件開發(fā)工具很有必要,這樣的工具既能有效地體現(xiàn)算法的內(nèi)涵,展現(xiàn)整個算法實現(xiàn)過程的全貌,又能相對比較直觀,不需要具備底層的計算機知識即可快速上手,易學易用。筆者在教學實踐中發(fā)現(xiàn),由MathWorks公司推出的科學計算軟件matlab符合上述要求,使用matlab輔助課程教學,效果良好。近年來,一款和matlab有著類似風格的統(tǒng)計工具軟件R語言逐漸風靡起來,并且在數(shù)據(jù)挖掘界也受到好評,又由于它相對matlab更輕量級且開源、免費,因此可以預料R同樣能夠勝任數(shù)據(jù)挖掘的輔助教學任務。

(三)引入豐富的現(xiàn)代教學方式

數(shù)據(jù)挖掘?qū)儆谛屡d的信息技術類課程,目前,優(yōu)質(zhì)教師資源匱乏,適合本科生使用的優(yōu)秀參考書也不多見,并且課程的鮮明特點是:西方發(fā)達國家的數(shù)據(jù)挖掘技術領先于我們,其教學工作也比我國更有成效。為此,可充分利用網(wǎng)絡資源,將分散在互聯(lián)網(wǎng)上的優(yōu)秀材料匯集起來,引薦給同學,包括原版的電子教材、課件甚至教學視頻;還可以開通微信公共號或群,在公共平臺上一方面可以推送反映數(shù)據(jù)挖掘技術最新進展的科技短文,激發(fā)同學興趣和學習熱情,還可以利用平臺開展課程答疑,增強同學們對課程的認同感、向心力;為彌補課堂教學學時的不足,可利用提供翻轉(zhuǎn)教學的MOOC平臺,將某些知識點翻轉(zhuǎn)到課前講授、在課中僅作答疑或?qū)嵺`。

(四)改革課程考核方式

課程的考核須要體現(xiàn)學生對基本原理、基本理論的了解掌握程度和應用能力,因此,對本課程而言,如果將考卷設計成記憶概念、代入公式這樣的風格,并不合適;同樣,基于數(shù)據(jù)規(guī)模的考慮,傳統(tǒng)的集中考查方式也無法勝任,一道題的計算工作量可能耗費數(shù)小時。在一些類似課程中,教師們往往采用“大作業(yè)”或“完成某具體任務”的方式來檢查學生掌握知識的水平,但這種開放式的檢查方式難以防范舞弊行為,會帶來不公平。因此,如何科學地評判同學接受知識的真實水平成為一個難題,一個初步設想是,考慮設計出基于數(shù)據(jù)挖掘的課程考評系統(tǒng),利用同學們上機時所采集的信息,如點擊、停留時間等,結(jié)合平時測驗成績建立模型,最終獲得每個同學的合理分數(shù)。當然,這項工作目前還處于設想階段,其可行性如何有待進一步論證。

四、結(jié)束語

為解決數(shù)據(jù)挖掘課程教學中遇到的一系列問題,本文提出一種基于TDC模式的教學新方法。但數(shù)據(jù)挖掘畢竟是一門新興課程,本文所提的方法其效果究竟如何,還有待實踐的檢驗。注意到高校課程表中存在這樣一些課程,如“運籌學”、“人工智能”、“模式識別”等,雖然與“數(shù)據(jù)挖掘”內(nèi)容不同,但其共同點是理論性強、內(nèi)容抽象、需要案例展現(xiàn)、需要程序?qū)崿F(xiàn)。因此了解和借鑒這些課程相關專家教授的先進經(jīng)驗,為我所用,不失為提高教學效果的可行方法。

本文提出的TDC模式中,一個值得注意的細節(jié)問題是T和 C的比例分配問題。如果過多強調(diào)程序設計的語法、方法、技巧會喧賓奪主,而少了又達不到應有的效果。因此,如何科學地規(guī)劃理論授課和編程實踐的比例,才能獲得最佳的教學效果,這是一個值得進一步深入研究的問題。

參考文獻:

[1] 覃義,楊丹江,劉憶寧.《數(shù)據(jù)挖掘》本科教學的體舍與創(chuàng)新.科技信息,2012(10)

[2] 王麗麗.CDIO視角下項目驅(qū)動法在“數(shù)據(jù)倉庫與數(shù)據(jù)挖掘”教學中的應用.電子商務,2013(9)

[3] 黃嵐.數(shù)據(jù)挖掘課程實踐教學資源庫建設.計算機教育,2014(12)

[4] 李衛(wèi)華.數(shù)據(jù)挖掘與數(shù)據(jù)倉庫教學改革探討.惠州學院學報, 2014(12)

[5] SIGKDD.Data Mining Curriculum:A Proposal.2006; Available from:http://www.sigkdd.org/curriculum/index.html.

[6] 馬守東,龔永峰.關于數(shù)據(jù)挖掘課程教學探索.電腦編程技巧與維護,2013(24)

[7] 曾垂省.生物信息學專業(yè)之數(shù)據(jù)挖掘教學實踐與思考.廣東化工, 2014(7)

(作者單位:浙江財經(jīng)大學信息學院 浙江杭州 310018)

(作者簡介:石向榮,工學博士,講師,研究方向:數(shù)據(jù)挖掘和分析。)

(責編:賈偉)

猜你喜歡
任務驅(qū)動法數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
巧用任務驅(qū)動法,提高中職財會專業(yè)教學水平
教師·下(2016年10期)2016-12-03 09:46:38
數(shù)據(jù)挖掘技術在中醫(yī)診療數(shù)據(jù)分析中的應用
任務驅(qū)動法在計算機教學中的應用研究
膠囊劑的制備課程教學設計
物流運輸管理課程教學改革探討
大學教育(2016年11期)2016-11-16 20:19:21
任務驅(qū)動法在土木工程測量教學中的應用
科教導刊(2016年26期)2016-11-15 20:15:08
任務驅(qū)動法在車工教學中的應用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
新巴尔虎左旗| 雷州市| 图们市| 溆浦县| 北票市| 新兴县| 元江| 恩施市| 平凉市| 兴和县| 耒阳市| 从江县| 吴忠市| 故城县| 都昌县| 建湖县| 宁波市| 淳安县| 涿鹿县| 贵南县| 罗甸县| 保靖县| 邹平县| 霍邱县| 祁连县| 高安市| 莫力| 句容市| 敦煌市| 望城县| 山阳县| 湘潭市| 榕江县| 陇南市| 贡嘎县| 拜城县| 石屏县| 华亭县| 湘潭市| 广灵县| 丰都县|