周蕾 王留洋 洪龍
摘? ? 要:作為一個多學(xué)科交叉的新興學(xué)科,目前數(shù)據(jù)科學(xué)專業(yè)的人才培養(yǎng)和專業(yè)建設(shè)工作還在不斷的探索中。合格的數(shù)據(jù)科學(xué)專業(yè)畢業(yè)生應(yīng)該擁有基本的專業(yè)特征和良好的數(shù)據(jù)敏銳能力。針對這個培養(yǎng)目標(biāo),文章設(shè)計了一個通用的基于數(shù)據(jù)敏銳的數(shù)據(jù)科學(xué)專業(yè)課程體系框架,框架以數(shù)據(jù)敏銳極小課程集來保證學(xué)生的專業(yè)特征,輔以數(shù)據(jù)科學(xué)關(guān)鍵概念領(lǐng)域集合中的眾多課程、實踐課程以及其他領(lǐng)域知識課程。為更好地培養(yǎng)學(xué)生的數(shù)據(jù)敏銳能力,文章從課程實施角度探討了數(shù)據(jù)敏銳愿景下的數(shù)據(jù)科學(xué)專業(yè)人才培養(yǎng)路徑,提出強化極小課程集中的課程教學(xué)來夯實專業(yè)基礎(chǔ),重視大數(shù)據(jù)實踐教學(xué),加強專業(yè)和不同領(lǐng)域不同學(xué)科之間的合作,以更好地滿足社會對數(shù)據(jù)科學(xué)人才的需求。
關(guān)鍵詞:數(shù)據(jù)科學(xué);數(shù)據(jù)敏銳;極小課程集;課程體系;強化教學(xué)
中圖分類號:G642? ? ? ? ? 文獻標(biāo)識碼:A? ? ? ? ? 文章編號:1002-4107(2024)02-0046-04
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,社交網(wǎng)絡(luò)、電子商務(wù)等各種應(yīng)用的普及,數(shù)據(jù)以前所未有的速度增長,各行各業(yè)都迫切需要數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)管理和決策等各類數(shù)據(jù)人才。在此背景下,全球各大高校紛紛開設(shè)數(shù)據(jù)科學(xué)相關(guān)專業(yè),包括密歇根大學(xué)、史密斯學(xué)院、墨爾本大學(xué)、愛丁堡大學(xué)等眾多名校。我國最早在2016年開設(shè)大數(shù)據(jù)專業(yè),截至到2022年,中國教育部批準(zhǔn)設(shè)立“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”和“大數(shù)據(jù)管理與應(yīng)用”這兩個本科專業(yè)的高等學(xué)校分別達到679所和141所。
對學(xué)校而言,開設(shè)數(shù)據(jù)科學(xué)專業(yè)首先需要制定這個新專業(yè)的人才培養(yǎng)目標(biāo)和教學(xué)方案,以“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)為例,不同的高校人才培養(yǎng)目標(biāo)和定位不同,相應(yīng)的人才培養(yǎng)方案也有很大的區(qū)別。美國國家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)對此給出了建議[1],它認(rèn)為數(shù)據(jù)科學(xué)與大數(shù)據(jù)分析緊密關(guān)聯(lián),是統(tǒng)計、數(shù)據(jù)挖掘、機器學(xué)習(xí)領(lǐng)域的一個超級集合,其中數(shù)據(jù)挖掘不僅需要數(shù)學(xué)和統(tǒng)計技能,還需要對相關(guān)領(lǐng)域知識的理解。作為一個多學(xué)科交叉的專業(yè),在培養(yǎng)專業(yè)人才的過程中,如何更好地體現(xiàn)專業(yè)特征,應(yīng)根據(jù)不同培養(yǎng)目標(biāo)構(gòu)建更科學(xué)且切實可行的人才培養(yǎng)方案。國內(nèi)外很多學(xué)者對此進行了深入的研究。EDISON數(shù)據(jù)科學(xué)框架對NIST提出的數(shù)據(jù)科學(xué)能力進行了擴展,將數(shù)據(jù)科學(xué)能力(CF-DS)分為5種,每個能力有與之配套的知識體系和模型課程,用于指導(dǎo)數(shù)據(jù)科學(xué)專業(yè)教育和培養(yǎng)框架設(shè)計[2-3]。LI XIN等針對應(yīng)用型大學(xué)數(shù)據(jù)科學(xué)專業(yè)本科學(xué)生的培養(yǎng)目標(biāo)設(shè)計了人才培養(yǎng)方案[4]。王國仁等提出面向基礎(chǔ)、面向能力、面向領(lǐng)域、問題驅(qū)動、國際化的大數(shù)據(jù)專業(yè)課程體系[5]。朝樂門等從特色課程的視角提出了數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)這一新專業(yè)應(yīng)重視的10門特色課程[6]。石兵等以培養(yǎng)具有行業(yè)特色和可持續(xù)競爭力的大數(shù)據(jù)卓越人才為建設(shè)目標(biāo),提出構(gòu)建多層次、多類型、健全的卓越人才培養(yǎng)體系[7]。
雖然眾多文獻對大數(shù)據(jù)人才培養(yǎng)和專業(yè)建設(shè)進行了研究和實踐,但從課程框架設(shè)計角度研究數(shù)據(jù)科學(xué)專業(yè)人才培養(yǎng)路徑的文獻相對比較少。本文將從數(shù)據(jù)科學(xué)專業(yè)學(xué)生數(shù)據(jù)敏銳能力培養(yǎng)角度,來探討通用的數(shù)據(jù)科學(xué)專業(yè)課程框架設(shè)計和培養(yǎng)路徑。
一、數(shù)據(jù)科學(xué)關(guān)鍵概念領(lǐng)域與數(shù)據(jù)敏銳
美國國家科學(xué)院在一份數(shù)據(jù)科學(xué)本科教育的研究報告將數(shù)學(xué)基礎(chǔ)、計算基礎(chǔ)、統(tǒng)計基礎(chǔ)、數(shù)據(jù)管理和處理、數(shù)據(jù)可視化等納入數(shù)據(jù)科學(xué)關(guān)鍵概念領(lǐng)域[8],指出數(shù)據(jù)科學(xué)專業(yè)畢業(yè)生必須擁有一定的數(shù)據(jù)敏銳能力。基于此,我們提出數(shù)據(jù)科學(xué)關(guān)鍵概念領(lǐng)域的集合DASKCA(Data Science’s Key Concept Areas)和數(shù)據(jù)敏銳+集合DACUP(Data Acumen Plus),其中DASKCA={數(shù)學(xué)基礎(chǔ),統(tǒng)計基礎(chǔ),計算基礎(chǔ),數(shù)據(jù)知識與技術(shù)},用于表示數(shù)據(jù)科學(xué)的專業(yè)特征,DACUP={獲取數(shù)據(jù)的能力,理解數(shù)據(jù)的能力,數(shù)據(jù)組織和管理能力,數(shù)據(jù)分析能力,基于數(shù)據(jù)做出判斷和決策的能力}[9]。合格的數(shù)據(jù)科學(xué)專業(yè)畢業(yè)生應(yīng)該擁有DACUP中表述的能力。
盡管各個大學(xué)設(shè)置的課程不盡相同,但培養(yǎng)數(shù)據(jù)敏銳必然包含一些最基本的、不可或缺的課程,這些課程構(gòu)成了數(shù)據(jù)科學(xué)專業(yè)的極小課程集。為了從DASKCA中析出極小課程集,使其可以支撐學(xué)生專業(yè)能力的培養(yǎng),需要分析DACUP中的數(shù)據(jù)敏銳能力與DASKCA中各個關(guān)鍵概念領(lǐng)域元素之間的支撐關(guān)系,最終確定相關(guān)概念領(lǐng)域的課程,實現(xiàn)對能力培養(yǎng)的支撐。
下面將根據(jù)DACUP中定義的每種數(shù)據(jù)敏銳能力要求,在DASKCA中確定可以支撐的關(guān)鍵概念領(lǐng)域和相關(guān)的課程集。
1.與獲取數(shù)據(jù)相關(guān)的課程。數(shù)據(jù)是數(shù)據(jù)科學(xué)的靈魂,是一切操作的基礎(chǔ),高質(zhì)量數(shù)據(jù)的生成有助于提高處理效率和結(jié)果的正確性。大數(shù)據(jù)采集主要包括系統(tǒng)日志采集、網(wǎng)絡(luò)數(shù)據(jù)采集以及特定接口數(shù)據(jù)采集等,通過分布式日志收集系統(tǒng)或網(wǎng)絡(luò)爬蟲技術(shù),可以從系統(tǒng)日志或網(wǎng)站上抓取需要的數(shù)據(jù),并對數(shù)據(jù)進行清洗、轉(zhuǎn)換等預(yù)處理,為后續(xù)數(shù)據(jù)分析提供真實完整可靠的數(shù)據(jù)。培養(yǎng)學(xué)生獲取高質(zhì)量數(shù)據(jù)能力的主要課程包括在DASKCA的“數(shù)據(jù)知識與技術(shù)”“計算基礎(chǔ)”和其他領(lǐng)域知識之中。具體課程包括系統(tǒng)日志采集、流數(shù)據(jù)采集、網(wǎng)絡(luò)數(shù)據(jù)采集、數(shù)據(jù)清洗以及數(shù)據(jù)轉(zhuǎn)換等。
2.與數(shù)據(jù)組織和管理相關(guān)的課程。采集處理后的數(shù)據(jù)一般都是以數(shù)據(jù)庫方式保存在計算機中,可能是本地數(shù)據(jù)庫,也可能是分布式數(shù)據(jù)庫,數(shù)據(jù)庫可以是傳統(tǒng)的關(guān)系數(shù)據(jù)庫,也可以是新型的NoSQL數(shù)據(jù)庫。根據(jù)不同的應(yīng)用場景和需求,可能對數(shù)據(jù)進行傳統(tǒng)的OLTP
(On-Line Transaction Processing)處理,也可能需要利用ETL(Extract-Transform-Load)工具對數(shù)據(jù)倉庫進行操作,完成更高層次的OLAP(On-Line Analytic Processing)操作。為了培養(yǎng)學(xué)生組織和管理數(shù)據(jù)的能力,需要DASKCA集合中的“數(shù)據(jù)知識與技術(shù)”和其他領(lǐng)域的知識,可能涉及的課程包括數(shù)據(jù)庫技術(shù)、數(shù)據(jù)存儲與檢索、高級數(shù)據(jù)庫、數(shù)據(jù)倉庫、海量數(shù)據(jù)存儲、可擴展的數(shù)據(jù)系統(tǒng)、Hive等。
3.與數(shù)據(jù)分析相關(guān)的課程。對數(shù)據(jù)進行分析以獲得知識是數(shù)據(jù)的價值所在。統(tǒng)計學(xué)是對大數(shù)據(jù)進行搜索、比較、歸納等方面的應(yīng)用基礎(chǔ),利用各類統(tǒng)計分析模型分析數(shù)據(jù),得到具有說服力的結(jié)論。數(shù)據(jù)知識與技術(shù)中的統(tǒng)計分析工具對高效率的完成數(shù)據(jù)分析提供了幫助,學(xué)生需要熟練掌握。在數(shù)據(jù)分析中,包含于計算基礎(chǔ)的人工智能,特別是機器學(xué)習(xí)相關(guān)算法,已成為判斷、決策和從大數(shù)據(jù)中挖掘有價值模式的主要工具,可見計算技術(shù)在數(shù)據(jù)分析的過程中發(fā)揮了非常重要的工具作用。另外,由于處理數(shù)據(jù)時往往計算量巨大,傳統(tǒng)串行算法已難以滿足操作的性能要求,因此需要高性能的云計算和并行處理技術(shù)。這些技術(shù)涉及到統(tǒng)計基礎(chǔ)、計算基礎(chǔ)、數(shù)據(jù)知識與技術(shù)和其他領(lǐng)域的知識,可能涉及的課程包括程序設(shè)計語言、數(shù)據(jù)結(jié)構(gòu)、機器學(xué)習(xí)、人工智能、分布式處理與并行計算、大數(shù)據(jù)分析、R語言、數(shù)據(jù)可視化、概率論與數(shù)理統(tǒng)計以及應(yīng)用多元統(tǒng)計分析等。
4.與判斷和決策相關(guān)的課程。擁有較強的數(shù)據(jù)判斷和決策能力對數(shù)據(jù)科學(xué)專業(yè)人才的培養(yǎng)至關(guān)重要,集合DASKCA中的數(shù)學(xué)基礎(chǔ)和統(tǒng)計基礎(chǔ)可使學(xué)生能應(yīng)用推理、建模和數(shù)據(jù)分析等基本概念檢驗假設(shè),了解隨機試驗和非隨機研究的方法,建立和評估數(shù)據(jù)模型,從大量紛繁復(fù)雜的數(shù)據(jù)中找出規(guī)律,給出決策建議,提升決策者的效率和水平。可能涉及的相關(guān)課程包括高等數(shù)學(xué)、線性代數(shù)、離散數(shù)學(xué)、數(shù)學(xué)建模、優(yōu)化算法、統(tǒng)計學(xué)、統(tǒng)計推理與建模等。
5.與理解數(shù)據(jù)相關(guān)的課程。大數(shù)據(jù)來源復(fù)雜多樣,如何正確理解來自不同行業(yè)領(lǐng)域和不同類型的數(shù)據(jù)?數(shù)據(jù)科學(xué)畢業(yè)生在處理和分析不同領(lǐng)域大數(shù)據(jù)時需要具備行業(yè)相關(guān)的背景知識。數(shù)據(jù)的歸屬和使用有什么約束?虛假的數(shù)據(jù)會給人類社會帶來什么樣的危害?如何確保數(shù)據(jù)安全,保護用戶隱私?數(shù)據(jù)科學(xué)專業(yè)的畢業(yè)生應(yīng)具備與數(shù)據(jù)相關(guān)的法律、道德、經(jīng)濟、哲學(xué)等方面的深刻認(rèn)知,具備大數(shù)據(jù)時代基本的數(shù)據(jù)倫理、數(shù)據(jù)素養(yǎng)和社會責(zé)任感,必須認(rèn)識到數(shù)據(jù)歸屬、隱私、安全等的重要性和對其不重視可能帶來的嚴(yán)重后果,比如為了從數(shù)據(jù)分析中得到正確的結(jié)果或有效的結(jié)論,必須采用真實數(shù)據(jù),故意采用假數(shù)據(jù)是不可原諒的道德問題;數(shù)據(jù)隱私、數(shù)據(jù)安全涉及法律,這些應(yīng)是數(shù)據(jù)科學(xué)專業(yè)畢業(yè)生謹(jǐn)記的底線。需要特別說明的是,DASKCA集合中并沒有這部分能力直接對應(yīng)的關(guān)鍵概念領(lǐng)域,其培養(yǎng)是貫穿在其他能力培養(yǎng)的學(xué)習(xí)和活動中,數(shù)據(jù)的獲取、存儲、組織管理和分析、建模等,每一個環(huán)節(jié)無不要求學(xué)生正確理解數(shù)據(jù),恪守數(shù)據(jù)操作規(guī)范和職業(yè)道德約束。理解數(shù)據(jù)的能力培養(yǎng)需要相關(guān)的領(lǐng)域知識和數(shù)據(jù)倫理、職業(yè)道德規(guī)范等課程的支持??赡苌婕暗恼n程包括數(shù)據(jù)科學(xué)道德、大數(shù)據(jù)中的人與價值、數(shù)據(jù)倫理與隱私以及大數(shù)據(jù)應(yīng)用的相關(guān)領(lǐng)域知識等。
綜上,數(shù)據(jù)敏銳能力DACUP的能力培養(yǎng)必須有DASKCA中相關(guān)課程和活動的支撐,與此同時,還需要行業(yè)領(lǐng)域知識、職業(yè)道德規(guī)范等其他領(lǐng)域知識的支持。
二、數(shù)據(jù)敏銳極小課程集
數(shù)據(jù)科學(xué)專業(yè)課程涉及數(shù)學(xué)、統(tǒng)計學(xué)和計算機科學(xué)等多個知識領(lǐng)域,盡管各個大學(xué)設(shè)置的課程不盡相同,但培養(yǎng)數(shù)據(jù)敏銳必然包含一些最基本的、不可或缺的課程,這些課程構(gòu)成了數(shù)據(jù)科學(xué)專業(yè)的極小課程集?;跇O小課程集的特性,我們構(gòu)建的數(shù)據(jù)敏銳極小課程集由7門課程組成,具體課程及其目標(biāo)如下。
1.“數(shù)理邏輯”。邏輯學(xué)是研究推理的學(xué)問,判斷與決策離不開推理。其課程目標(biāo)是培養(yǎng)學(xué)生的思維能力,也為學(xué)習(xí)有關(guān)計算、數(shù)據(jù)的課程打下基礎(chǔ)。
2.“統(tǒng)計學(xué)”。根據(jù)第四范式,統(tǒng)計方法是處理大數(shù)據(jù)的基本手段。該課程目標(biāo)是使學(xué)生理解其基本理論,掌握基本方法,為數(shù)據(jù)分析技術(shù)的學(xué)習(xí)建立基礎(chǔ)。
3.“程序設(shè)計與數(shù)據(jù)結(jié)構(gòu)”和“計算機原理與應(yīng)用技術(shù)”。處理數(shù)據(jù)離不開計算機和程序。前者的課程目標(biāo)是使學(xué)生能熟練地掌握一種高級語言,并能建立適當(dāng)?shù)乃惴ㄋ枷?。后者的課程目標(biāo)是使學(xué)生具有概念性的計算機基本知識,并了解基于網(wǎng)絡(luò)的計算機應(yīng)用。這里強調(diào),教學(xué)內(nèi)容應(yīng)符合“數(shù)據(jù)科學(xué)”專業(yè)的特征,避開專業(yè)所不需要的、復(fù)雜的硬件。
4.“數(shù)據(jù)科學(xué)導(dǎo)引”。該課程向?qū)W生講解什么是數(shù)據(jù)以及處理數(shù)據(jù)的基本理論和方法,其課程目標(biāo)是使學(xué)生對數(shù)據(jù)科學(xué)有較全面的了解,并引發(fā)學(xué)生的專業(yè)興趣。
5.“數(shù)據(jù)庫技術(shù)”和“數(shù)據(jù)挖掘”?!皵?shù)據(jù)庫技術(shù)”是傳統(tǒng)課程,課程目標(biāo)是使學(xué)生具有應(yīng)用數(shù)據(jù)庫的基本技能,并了解現(xiàn)代數(shù)據(jù)庫技術(shù)的內(nèi)容。“數(shù)據(jù)挖掘”介紹從數(shù)據(jù)中尋找有效模式的理論與技術(shù),課程目標(biāo)是使學(xué)生理解、掌握分析數(shù)據(jù)的基本方法。
極小課程集中的課程是各關(guān)鍵概念領(lǐng)域的基礎(chǔ)課程和必修課程,以確保數(shù)據(jù)科學(xué)專業(yè)學(xué)生必須擁有的基本專業(yè)特征。
三、基于數(shù)據(jù)敏銳的課程體系設(shè)計
極小課程集為學(xué)生數(shù)據(jù)敏銳基本能力的培養(yǎng)奠定了基礎(chǔ),將這種能力提升為具有數(shù)據(jù)敏銳競爭力的能力,還需要DASKCA中的眾多專業(yè)課程、其他領(lǐng)域的課程以及實踐課程的支持。按照課程的先后關(guān)系以及可能的培養(yǎng)路徑,設(shè)計基于數(shù)據(jù)敏銳能力培養(yǎng)的數(shù)據(jù)科學(xué)專業(yè)課程體系,如圖1所示。
圖1中最底層的“數(shù)據(jù)科學(xué)”表示專業(yè)的名稱而不是課程,最右邊虛線橢圓框中的數(shù)學(xué)基礎(chǔ)類課程代指左側(cè)的高等數(shù)學(xué)、線性代數(shù)等課程以簡化設(shè)計。圖中的每個節(jié)點(子節(jié)點)都得到位于其下節(jié)點(父節(jié)點)的支撐,即子節(jié)點是父節(jié)點的應(yīng)用,父節(jié)點是子節(jié)點的基礎(chǔ);實線方框表示的節(jié)點均為極小課程集中的課程,是規(guī)定的必修課;實線橢圓框表示專業(yè)自選課程;虛線方框表示綜合實驗課程,它們結(jié)合行業(yè)課程開設(shè);點線方框表示實訓(xùn)課程和實習(xí)課程,這些課程應(yīng)有企業(yè)教師參與。在完成一門課程的學(xué)習(xí)后,學(xué)生可以根據(jù)興趣上下求索,從該節(jié)點向上選擇應(yīng)用型課程,或向下選擇基礎(chǔ)型課程。
圖1給出的是一個通用的數(shù)據(jù)科學(xué)專業(yè)課程體系框架,各個學(xué)校可以在極小課程集的課程基礎(chǔ)上,根據(jù)自己的人才培養(yǎng)目標(biāo),自由選擇不同的課程以構(gòu)建體現(xiàn)學(xué)校自身特色的人才培養(yǎng)方案。由于極小課程集中的課程是必不可少的,所以以此為基礎(chǔ)構(gòu)建的課程體系可以保證學(xué)生擁有基本的專業(yè)特征和數(shù)據(jù)敏銳能力。依據(jù)課程關(guān)系圖,學(xué)生能憑興趣和發(fā)展意愿自主選課。他們既可以由淺入深,逐步提高;又可以自上往下,追蹤溯源;還可以縱橫交叉,廣識博學(xué),在知識海洋中自由遨游。例如,受極小課程集中“數(shù)據(jù)庫技術(shù)”的啟發(fā),如果某學(xué)生希望了解鐵路訂票、衛(wèi)星導(dǎo)航是如何實現(xiàn)的,那么他就可以選修含有“分布式數(shù)據(jù)庫”和“空間數(shù)據(jù)庫內(nèi)容”的“高級數(shù)據(jù)庫技術(shù)”。在相關(guān)課程的誘導(dǎo)下,他有可能逐步釋放數(shù)據(jù)工程師的潛質(zhì);如果某學(xué)生對數(shù)據(jù)庫中有關(guān)“關(guān)系”的理論感興趣,那么他可以選修“集合論”,并根據(jù)興趣由此向上選修數(shù)學(xué)類課程和統(tǒng)計學(xué)類課程,向著數(shù)據(jù)科學(xué)家的理想邁進。
需要特別注意的是,由于數(shù)據(jù)科學(xué)是一個新專業(yè),課程的設(shè)置正在探索中,隨著技術(shù)的發(fā)展,課程體系中的很多課程也需要與時俱進。此外,也許有些較重要的課程未列入本文,特別是課程體系中極可能缺少未來研究生入學(xué)應(yīng)考的未知課程,因為我國目前還沒有在“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)招收研究生,但這些問題都可以通過后期課程的調(diào)整或增設(shè)來解決。
四、數(shù)據(jù)敏銳能力培養(yǎng)的基本路徑
數(shù)據(jù)科學(xué)專業(yè)課程體系給出了專業(yè)完整的課程框架,在實施過程中如何保證學(xué)生基本的數(shù)據(jù)科學(xué)專業(yè)特征,如何更好地培養(yǎng)學(xué)生的數(shù)據(jù)敏銳能力,使其較好地滿足社會對數(shù)據(jù)科學(xué)人才的需求?本文從課程實施角度給出幾條基本的培養(yǎng)路徑。
(一)強化極小課程集課程的教學(xué),保證扎實的專業(yè)基礎(chǔ)
雖然數(shù)據(jù)敏銳極小課程集的教學(xué)內(nèi)容保證了學(xué)生的基本專業(yè)特征,但只有使學(xué)生充分掌握它們才可能使這些內(nèi)容轉(zhuǎn)化為他們的能力,如何順利地實現(xiàn)這種轉(zhuǎn)化呢?
采用強化教學(xué)實現(xiàn)這種轉(zhuǎn)化。所謂強化教學(xué)就是對基礎(chǔ)課程和核心課程給予更充足的學(xué)時[10],通過細(xì)致、系統(tǒng)地講授課程的主體內(nèi)容,使學(xué)生較好地掌握理論,為后續(xù)課程和實踐打下堅實的基礎(chǔ)。基于此,筆者建議極小課程集中課程的學(xué)時如表1所示。
在計算機專業(yè)中,“程序設(shè)計”和“數(shù)據(jù)結(jié)構(gòu)”是兩門課程,一般需要120學(xué)時。在數(shù)據(jù)科學(xué)專業(yè)課程體系中將他們合并為“程序設(shè)計與數(shù)據(jù)結(jié)構(gòu)”一門課程,并
分配充足的學(xué)時,為后續(xù)課程的學(xué)習(xí)及應(yīng)用打下扎實的基礎(chǔ)。這里“程序設(shè)計與數(shù)據(jù)結(jié)構(gòu)”課程中的計算機語言建議采用C或C++。作為程序設(shè)計語言的基礎(chǔ),如果學(xué)生能很好地掌握這門語言,那么后續(xù)其他程序設(shè)計語言的學(xué)習(xí),比如數(shù)據(jù)科學(xué)領(lǐng)域廣泛使用的Python、R語言等,學(xué)生完全可以通過自學(xué)很好地掌握,所以在圖1所示的課程體系中未專門列出具體的程序設(shè)計語言課程。
此外,在計算機專業(yè)中計算機原理主要由“計算機組成”和“操作系統(tǒng)”兩門課組成,每門課一般是56學(xué)時。與其相比,表1中的“計算機原理與應(yīng)用技術(shù)”課時則相對較少,該課程只包含上述兩門課程的基本內(nèi)容和相關(guān)的應(yīng)用,以使學(xué)生了解計算機的基本原理,且避免不必要的硬件知識和系統(tǒng)軟件的細(xì)節(jié)。
通過強化極小課程集中課程的教學(xué),讓學(xué)生有足夠的學(xué)習(xí)和實踐時間,確保數(shù)據(jù)科學(xué)專業(yè)學(xué)生具有基本的專業(yè)特征,可以讓學(xué)生未來有更多選擇的可能,在專業(yè)的道路上按照自身的發(fā)展愿望走得更好更遠(yuǎn)。
(二)建設(shè)大數(shù)據(jù)實訓(xùn)平臺,強化課程實踐教學(xué)
數(shù)據(jù)科學(xué)是一個實踐性要求很強的專業(yè),雖然不同高校數(shù)據(jù)科學(xué)專業(yè)人才培養(yǎng)的層次各不相同,所有大數(shù)據(jù)人才都必須重視實踐和應(yīng)用能力的培養(yǎng),因此數(shù)據(jù)科學(xué)課程的開設(shè)也需要采用新的模式,即理論課和實踐課相結(jié)合的模式,加大課程實踐環(huán)節(jié)的建設(shè)力度。
實踐課程包含課程實驗和綜合實驗。課程實驗是使學(xué)生深刻理解已學(xué)課程的理論,并提高技能的手段之一。數(shù)據(jù)敏銳極小課程集中的“統(tǒng)計學(xué)”“程序設(shè)計與數(shù)據(jù)結(jié)構(gòu)”“數(shù)據(jù)庫技術(shù)”和“數(shù)據(jù)挖掘”等課程都安排了實驗,并對需要較高技能的課程安排了較多的實驗學(xué)時。除此之外,對DASKCA中能進行實驗的其他課程也安排一定的實驗。綜合實驗是培養(yǎng)學(xué)生數(shù)據(jù)敏銳能力的重要組成部分,它讓學(xué)生有機會親身體驗數(shù)據(jù)的獲取、處理、分析以及可視化全過程,以達到融會貫通多門課程的內(nèi)容、提高綜合技能的效果。例如,“大數(shù)據(jù)技術(shù)的并行程序設(shè)計”實驗課程能使學(xué)生在具有刀片、GPU等設(shè)備的云環(huán)境平臺下,以多維視野綜合理解、應(yīng)用“數(shù)據(jù)挖掘”“分布式處理與并行計算”“Intel多核程序設(shè)計”“Hadoop編程”和行業(yè)課程集中的課程等內(nèi)容。
大數(shù)據(jù)相關(guān)的實踐教學(xué)需要環(huán)境和工具的支持,數(shù)據(jù)科學(xué)專業(yè)必須完成大數(shù)據(jù)實訓(xùn)平臺的建設(shè),課程教學(xué)可以在有限的學(xué)時中,依托大數(shù)據(jù)實訓(xùn)平臺,以數(shù)據(jù)為基礎(chǔ),理論聯(lián)系實際,通過大數(shù)據(jù)行業(yè)應(yīng)用的實際案例強化學(xué)生對知識的理解和應(yīng)用,提高數(shù)據(jù)敏銳能力。
(三)針對行業(yè)需求,加強專業(yè)和不同領(lǐng)域不同學(xué)科之間的合作
產(chǎn)業(yè)界匯聚了最新的技術(shù)和大量的行業(yè)數(shù)據(jù)。和其他專業(yè)培養(yǎng)相比,數(shù)據(jù)科學(xué)專業(yè)尤其需要開展和不同行業(yè)的合作,依托企業(yè)平臺和資源,由教師聯(lián)合企業(yè)經(jīng)驗豐富的工程師,從大量實踐案例出發(fā),結(jié)合企業(yè)實際需求,帶領(lǐng)學(xué)生開展課程教學(xué),讓學(xué)生熟悉企業(yè)需求,了解相關(guān)行業(yè)領(lǐng)域知識,在項目的實踐和討論中不斷積累經(jīng)驗。良好的實踐訓(xùn)練不但可以使學(xué)生產(chǎn)生職業(yè)榮譽感和社會責(zé)任感,還能使他們增強團隊合作意識和專業(yè)自信。
在基于數(shù)據(jù)敏銳的課程框架設(shè)計中,建議高校加強與地方有大數(shù)據(jù)應(yīng)用需求的行業(yè)合作,開發(fā)面向具體行業(yè)應(yīng)用的大數(shù)據(jù)實踐課程,給學(xué)生提供真實的大數(shù)據(jù)實踐環(huán)境,提高學(xué)生解決實際問題的能力。結(jié)合自己學(xué)校的優(yōu)勢學(xué)科設(shè)置跨專業(yè)課程是一種睿智的做法,不僅利于培養(yǎng)學(xué)生解決實際問題的能力,還可以推進跨學(xué)科研究的發(fā)展。例如,斯坦福大學(xué)結(jié)合自己在醫(yī)學(xué)、生物學(xué)和商務(wù)智能上的優(yōu)勢,開設(shè)了“數(shù)據(jù)驅(qū)動型醫(yī)
學(xué)”“基于大數(shù)據(jù)的商務(wù)智能”等課程。作為多學(xué)科交叉專業(yè),數(shù)據(jù)科學(xué)很多專業(yè)課程需要和其他學(xué)科聯(lián)合開設(shè),加強不同學(xué)科之間的合作也同樣重要。
五、結(jié)語
數(shù)據(jù)科學(xué)專業(yè)領(lǐng)域涉及數(shù)學(xué)、統(tǒng)計學(xué)、計算機科學(xué)以及行業(yè)領(lǐng)域等多學(xué)科的知識,如何培養(yǎng)具有基本專業(yè)特征和數(shù)據(jù)敏銳能力的合格的數(shù)據(jù)科學(xué)人才?本文在分析數(shù)據(jù)科學(xué)專業(yè)各個關(guān)鍵概念領(lǐng)域知識與數(shù)據(jù)敏銳能力培養(yǎng)之間的支撐關(guān)系后,設(shè)計了數(shù)據(jù)科學(xué)專業(yè)的極小課程集,以保證學(xué)生具有基本的數(shù)據(jù)科學(xué)專業(yè)特征,并在此基礎(chǔ)上,設(shè)計了一個基于數(shù)據(jù)敏銳愿景的數(shù)據(jù)科學(xué)專業(yè)課程體系框架,為各個學(xué)校構(gòu)建體現(xiàn)學(xué)校自身特色的人才培養(yǎng)方案提供了指導(dǎo)。為更好地培養(yǎng)學(xué)生的數(shù)據(jù)敏銳能力,本文從課程實施角度提出了三條有效的培養(yǎng)路徑,通過強化極小課程集中的課程教學(xué)來夯實專業(yè)基礎(chǔ)、建設(shè)大數(shù)據(jù)實訓(xùn)平臺來強化實踐教學(xué)以及加強與不同行業(yè)不同學(xué)科之間的合作來培養(yǎng)學(xué)生行業(yè)領(lǐng)域應(yīng)用能力,以更好地滿足社會對數(shù)據(jù)科學(xué)人才的需求。
參考文獻:
[1]? NIST SP 1500-1.NIST Big Data Interoperability Frame-work:Volume 1,Definitions[EB/OL].(2015-09-16)[2022-01-05].https://nvlpubs.nist.gov/nistpubs/SpecialPublica?tions/NIST.SP.1500-1.pdf.
[2]? WIKTORSKI? T,DEMCHENK? Y,BELLOUM? A.Model?Curricula for Data Science EDISON Data Science Frame-work[C]//2017 IEEE International Conference on CloudComputing Technology and Science(CloudCom).IEEE,2017:369-374.
[3]? DEMCHENKO? Y,BELLOUM? A,LOS W,et al.EDISONData Science Framework:A Foundation for Building DataScience Profession for Research and Industry[C]//2016IEEE International Conference on Cloud Computing Te-chnology and Science(CloudCom).IEEE,2016:620-626.
[4]? LIXIN,F(xiàn)ANXIAOPING,QUXILONG,et al. CurriculumReform in Big Data Education at Applied Technical Dollegesand Universities in China[J].IEEE Access,2019(7).
[5]? 王國仁,金福生,劉馳,等.面向國際化的數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)課程體系建設(shè)[J].中國大學(xué)教學(xué),2018(12).
[6]? 朝樂門,邢春曉,王雨晴.數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)特色課程研究[J].計算機科學(xué),2018(3).
[7]? 石兵,熊盛武,饒文碧,等.數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)建設(shè)研究與實踐[J].計算機教育,2021(4).
[8]? National Academies of Sciences,Engineering,and Medicine.Data Science for Undergraduates:Opportunities and Options[M].Washington,DC:National Academies Press,2018:22.
[9]? 周蕾,王留洋,洪龍.數(shù)據(jù)敏銳愿景下的數(shù)據(jù)科學(xué)課程框架[J].計算機教育,2020(5).
[10]? 李未.變革中的大學(xué)——李未教育文存[M].北京:高等? 教育出版社,2012:139.