劉漢興,田緒紅,孫微微
(華南農(nóng)業(yè)大學(xué)數(shù)學(xué)與信息學(xué)院,廣州 510642)
2016 年以來,為適應(yīng)新時期科技革命的發(fā)展和經(jīng)濟(jì)增長復(fù)蘇期的需要,我國積極推進(jìn)高校新工科建設(shè),期待培養(yǎng)出新產(chǎn)業(yè)新技術(shù)新業(yè)態(tài)急需的應(yīng)用和工程技術(shù)人才,其中以智能化與信息化為特征的IT 人才需求量巨大。伴隨國產(chǎn)技術(shù)安全可控的要求,大數(shù)據(jù)技術(shù)研究與應(yīng)用服務(wù)重要性日漸凸顯,如果能在這一新興技術(shù)領(lǐng)域搶占先機(jī),將在大數(shù)據(jù)領(lǐng)域突破國外技術(shù)壟斷和形成國際競爭優(yōu)勢。
目前,全國已有近五百所高校開設(shè)“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè),一些雙一流高校和地方高校前期已嘗試對大數(shù)據(jù)人才的培養(yǎng)方案和培養(yǎng)模式作出探索和實踐,各高校的大數(shù)據(jù)專業(yè)基本是依托自身的優(yōu)勢學(xué)科和行業(yè)領(lǐng)域,實現(xiàn)多學(xué)科融合,培養(yǎng)具有行業(yè)特色的大數(shù)據(jù)人才[1]。目前來看,我國高校設(shè)置的大數(shù)據(jù)專業(yè)以計算機(jī)學(xué)科或者數(shù)學(xué)學(xué)科為基礎(chǔ)學(xué)科,其中基于計算機(jī)學(xué)科開設(shè)的院校更多更普遍,大數(shù)據(jù)行業(yè)領(lǐng)域主要涉及金融、商業(yè)、電信、醫(yī)學(xué)、交通、生產(chǎn)、農(nóng)業(yè)等方面。這種以行業(yè)問題為核心,以大數(shù)據(jù)技術(shù)為工具,實現(xiàn)多元化、跨學(xué)科、產(chǎn)學(xué)融合的培養(yǎng)模式恰好契合了新工科專業(yè)課程建設(shè)的要求,也滿足了不同行業(yè)亟需大數(shù)據(jù)技術(shù)助力生產(chǎn)和發(fā)展的實際要求。因此,大數(shù)據(jù)專業(yè)的開設(shè)和人才培養(yǎng)順應(yīng)時代需求,正逢其時。
在新工科背景下,大數(shù)據(jù)人才主要有以下兩種分類:一類是偏向理論的大數(shù)據(jù)研發(fā)類,側(cè)重于對數(shù)據(jù)科學(xué)的數(shù)學(xué)模型和算法的理解與設(shè)計,未來就業(yè)以大數(shù)據(jù)系統(tǒng)研發(fā)、算法分析、系統(tǒng)架構(gòu)等方向為主,學(xué)歷要求以碩士博士為主;一類是偏向?qū)嵺`的大數(shù)據(jù)應(yīng)用類,側(cè)重于以大數(shù)據(jù)技術(shù)為工具,解決實際的行業(yè)應(yīng)用問題,未來就業(yè)以大數(shù)據(jù)分析、大型數(shù)據(jù)庫運(yùn)行維護(hù)、數(shù)據(jù)挖掘及可視化等方向為主,學(xué)歷要求以本科為主。顯然,不同類型的人才在需具備的素質(zhì)能力方面也會有不同要求,在課程設(shè)置時也應(yīng)有各自的側(cè)重。
從產(chǎn)業(yè)需求和市場調(diào)研總體來看,近半數(shù)大數(shù)據(jù)人才需求集中在軟件和信息服務(wù)業(yè)(如計算機(jī)軟件、硬件、網(wǎng)絡(luò)等相關(guān)企業(yè)),其次是電信、廣播電視、商業(yè)服務(wù)、文化藝術(shù)、教育等行業(yè),說明大數(shù)據(jù)專業(yè)人才的就業(yè)領(lǐng)域廣泛;超六成的大數(shù)據(jù)人才需求企業(yè)規(guī)模較大,且位于北上廣深杭等經(jīng)濟(jì)發(fā)達(dá)城市;應(yīng)用型的大數(shù)據(jù)開發(fā)和分析崗位數(shù)量占人才總需求量的九成,而理論型的算法研發(fā)崗位數(shù)量較少;除學(xué)歷等硬性要求以外,用人企業(yè)也看重團(tuán)隊溝通合作等軟性能力[2]。以國外高校的大數(shù)據(jù)人才培養(yǎng)模式來看,未來應(yīng)以培養(yǎng)能夠結(jié)合行業(yè)領(lǐng)域并綜合運(yùn)用大數(shù)據(jù)方法,解決行業(yè)問題的應(yīng)用型人才為主要方向[2]。
就本院校實際而言,學(xué)生多以本科畢業(yè)后直接就業(yè)為主,因此,確定以“能力導(dǎo)向的大數(shù)據(jù)應(yīng)用型人才”為本科階段的培養(yǎng)目標(biāo)。怎樣讓大數(shù)據(jù)方向?qū)W生具有“計算機(jī)科學(xué)+大數(shù)據(jù)”的知識結(jié)構(gòu),同時提升學(xué)生的實踐能力、應(yīng)變能力和團(tuán)隊合作能力,使之具有就業(yè)選擇多樣性和競爭力,是本院校在設(shè)置理論課程和實踐課程時探索和努力的方向。
從針對國外高校的大數(shù)據(jù)專業(yè)課程設(shè)置的調(diào)研結(jié)果看,雖然多所國外高校的行業(yè)領(lǐng)域和側(cè)重點不同,但基本都看重培養(yǎng)學(xué)生在數(shù)據(jù)采集、預(yù)處理與清洗、存儲與管理、數(shù)據(jù)挖掘與分析、可視化、大數(shù)據(jù)應(yīng)用與實務(wù)等方面的能力[3]。在設(shè)置課程體系時,涵蓋數(shù)學(xué)∕統(tǒng)計學(xué)、計算機(jī)科學(xué)、模型分析、數(shù)據(jù)系統(tǒng)管理、數(shù)據(jù)可視化、行業(yè)領(lǐng)域應(yīng)用、綜合訓(xùn)練、倫理與知識產(chǎn)權(quán)保護(hù)等幾類課程[4]。
在能力導(dǎo)向的大數(shù)據(jù)應(yīng)用型人才的培養(yǎng)過程中,可分為三個階段,各階段著重培養(yǎng)的知識、能力和核心課程如下[5]。
初級階段是專業(yè)基礎(chǔ)知識學(xué)習(xí)階段,需學(xué)習(xí)數(shù)學(xué)∕統(tǒng)計學(xué)基礎(chǔ)知識,計算機(jī)系統(tǒng)基礎(chǔ)知識(如計算機(jī)體系結(jié)構(gòu)、操作系統(tǒng)、計算機(jī)網(wǎng)絡(luò)等),以及訓(xùn)練編程能力(如數(shù)據(jù)結(jié)構(gòu)、面向?qū)ο蟪绦蛟O(shè)計、C∕Python 語言、R 語言等);
中級階段是專業(yè)核心知識學(xué)習(xí)與實踐訓(xùn)練階段,需要培養(yǎng):數(shù)據(jù)處理能力(如數(shù)據(jù)庫原理、數(shù)據(jù)采集與清洗技術(shù)等),大數(shù)據(jù)平臺管理與開發(fā)能力(如虛擬機(jī)與容器、分布式計算框架、分布式數(shù)據(jù)庫、分布式文件系統(tǒng)、數(shù)據(jù)遷移等技術(shù)),以及大數(shù)據(jù)分析及展示能力(如深度學(xué)習(xí)∕機(jī)器學(xué)習(xí)、數(shù)據(jù)倉庫∕數(shù)據(jù)挖掘Hive、數(shù)據(jù)可視化等工具);
高級階段是綜合運(yùn)用專業(yè)知識解決實際應(yīng)用問題階段,需要培養(yǎng):大數(shù)據(jù)系統(tǒng)綜合應(yīng)用能力(包括分布式服務(wù)器與應(yīng)用、搜索引擎技術(shù)與應(yīng)用、實時流處理技術(shù)等),以及項目開發(fā)與實施能力(包括大數(shù)據(jù)項目綜合實訓(xùn)、行業(yè)大數(shù)據(jù)案例復(fù)現(xiàn)與分析等)。
在設(shè)置大數(shù)據(jù)應(yīng)用型本科人才的培養(yǎng)方案時,應(yīng)該以各階段的素質(zhì)能力需求為基本框架,以能力為導(dǎo)向設(shè)置理論與實踐課程體系,使學(xué)生既有理論學(xué)習(xí)能力又有實踐操作能力,具備良好的就業(yè)前景和可深造潛力。
考慮到自身學(xué)科特色、專業(yè)培養(yǎng)目標(biāo)和產(chǎn)業(yè)需求等因素,本院校的大數(shù)據(jù)專業(yè)培養(yǎng)以計算機(jī)科學(xué)與技術(shù)為主干學(xué)科,在專業(yè)方向培養(yǎng)時以大數(shù)據(jù)分析與處理、云計算、人工智能等知識為拓展。
除了通識教育課程、學(xué)術(shù)道德規(guī)范教育、形勢與政策等本科基本課程之外,根據(jù)大數(shù)據(jù)應(yīng)用型人才的培養(yǎng)目標(biāo),分解得到以下人才能力構(gòu)成以及培養(yǎng)順序,并為之設(shè)置相關(guān)專業(yè)課程和選修課程。
其中,專業(yè)核心課程有數(shù)據(jù)結(jié)構(gòu)、操作系統(tǒng)、計算機(jī)系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、大數(shù)據(jù)技術(shù)原理、分布式數(shù)據(jù)庫、分布式計算框架、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘、大數(shù)據(jù)可視化技術(shù)等。
除了理論課程的學(xué)習(xí)之外,實踐操作能力也是應(yīng)用型人才培養(yǎng)模式中不可或缺的部分。在培養(yǎng)工程應(yīng)用與實踐能力方面,要求學(xué)生掌握大數(shù)據(jù)處理語言與相關(guān)工具如Python、Hadoop、Spark 等,掌握完整的大數(shù)據(jù)處理流程,能夠運(yùn)用專業(yè)知識對相關(guān)應(yīng)用問題進(jìn)行分析,并提出及主導(dǎo)實施解決方案,能夠?qū)⒋髷?shù)據(jù)處理技術(shù)轉(zhuǎn)化為商業(yè)價值。為實現(xiàn)實踐能力預(yù)設(shè)的培養(yǎng)目標(biāo),建立了多層次的實踐教學(xué)方式,包括課程實驗、課程實習(xí)、課賽結(jié)合、雙導(dǎo)師制項目訓(xùn)練和企業(yè)實訓(xùn)等。
大數(shù)據(jù)技術(shù)相關(guān)的課程實驗主要是在大數(shù)據(jù)技術(shù)實踐教學(xué)云平臺上完成,采用虛擬機(jī)和容器Docker 技術(shù)為每位學(xué)生提供實驗環(huán)境[6]。以《大數(shù)據(jù)技術(shù)原理》課程實驗為例,包括Hadoop 集群偽分布式安裝、分布式文件系統(tǒng)HDFS 的使用、分布式計算MapReduce 編程、Hive 數(shù)據(jù)倉庫統(tǒng)計分析、HBase 分布式數(shù)據(jù)庫操作、高可用集群的搭建和Hadoop 生態(tài)系統(tǒng)應(yīng)用等幾項實驗內(nèi)容。
圖1 大數(shù)據(jù)應(yīng)用型人才的能力構(gòu)成及培養(yǎng)順序
為訓(xùn)練團(tuán)隊合作和溝通能力,課程實習(xí)多采用若干個學(xué)生組成小組形式,采用案例教學(xué)和項目驅(qū)動方式,要求綜合運(yùn)用(多門)課程知識,系統(tǒng)性地實現(xiàn)一個完整的項目實踐,是培養(yǎng)學(xué)生實踐能力的重要形式。以高年級的“大數(shù)據(jù)處理綜合實習(xí)”為例,可分為數(shù)據(jù)爬取、數(shù)據(jù)分析、數(shù)據(jù)可視化和數(shù)據(jù)挖掘四個模塊,由學(xué)生分工合作完成。涉及知識包括數(shù)據(jù)采集(爬蟲、Flume)、Hadoop 生態(tài)(MapReduce 編程、Sqoop 數(shù)據(jù)遷移、分布式數(shù)據(jù)庫 HBase、Hive 交互分析)、Flink∕Spark∕Strom 實時計算、Python 數(shù)據(jù)可視化、Mahout 大數(shù)據(jù)分析等方面。例如“外賣店選址”案例:首先爬取已有外賣網(wǎng)站數(shù)據(jù),并對爬取到的外賣數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗(提取商家類型、品種、銷量等數(shù)據(jù))得到原始數(shù)據(jù);將外賣店原始數(shù)據(jù)上傳到HDFS 中,利用Hive 統(tǒng)計分析并將統(tǒng)計結(jié)果寫入到MySQL 數(shù)據(jù)庫;對原始數(shù)據(jù)和統(tǒng)計數(shù)據(jù)返回前端頁面進(jìn)行數(shù)據(jù)可視化展示;最后對統(tǒng)計數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分析,如為新開外賣店提出地址、營業(yè)時間、品種、價位等建議。
課程實驗和實習(xí)可以培養(yǎng)和鞏固大多數(shù)學(xué)生的實踐技能。對于學(xué)有余力的優(yōu)秀學(xué)生,選拔并推薦其參加大數(shù)據(jù)競賽,以賽促學(xué),以賽促教,課賽結(jié)合,通過競賽認(rèn)識到與其他高校的差距,彌補(bǔ)不足[7]。已派學(xué)生參加“聯(lián)想杯”等大數(shù)據(jù)技能競賽并獲得個人賽和團(tuán)體賽獎項,學(xué)生反映在短時間內(nèi)完成環(huán)環(huán)相扣的多道題目,不僅鍛煉了合作溝通能力、應(yīng)變反應(yīng)能力和獨立解決問題能力,更重要的是提升了自信和學(xué)習(xí)興趣,明確了將來深造方向和職業(yè)方向。
高校教師優(yōu)勢在于理論教學(xué)和科研能力強(qiáng),但大多缺乏實操項目的經(jīng)歷,因此在實習(xí)實訓(xùn)項目中引入有豐富行業(yè)實踐經(jīng)驗的企業(yè)導(dǎo)師,與學(xué)校導(dǎo)師共同培養(yǎng)學(xué)生,學(xué)生參與行業(yè)真實案例的復(fù)現(xiàn)過程;同時利用本院校與廣東溫氏等農(nóng)業(yè)龍頭企業(yè)的合作關(guān)系,依托橫向項目和行業(yè)真實數(shù)據(jù),引導(dǎo)學(xué)生運(yùn)用大數(shù)據(jù)和數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)諸如飼料成分價格、能繁母豬數(shù)量、生豬銷量、豬肉價格等波動相關(guān)性,為企業(yè)調(diào)整生產(chǎn)策略提供預(yù)測依據(jù)。這些校企合作協(xié)同育人的實訓(xùn)項目實現(xiàn)了雙方的優(yōu)勢互補(bǔ),縮短了學(xué)生適應(yīng)企業(yè)要求的磨合期,提高了學(xué)生的就業(yè)競爭力。
我國大數(shù)據(jù)與數(shù)據(jù)科學(xué)專業(yè)開辦不久,雙一流高校和地方高校對培養(yǎng)理論型和應(yīng)用型人才培養(yǎng)模式都在探索。著眼于應(yīng)用型人才的培養(yǎng),剖析了其所應(yīng)具有的培養(yǎng)階段和素質(zhì)能力,針對性地設(shè)置理論課程和實踐實訓(xùn)課程,期待培養(yǎng)出基于計算機(jī)學(xué)科的“即插即用”大數(shù)據(jù)應(yīng)用型人才,盡量縮小院校培養(yǎng)和社會需求之間的偏差。大數(shù)據(jù)技術(shù)發(fā)展日新月異,培養(yǎng)方案也應(yīng)與時俱進(jìn),緊跟行業(yè)發(fā)展動態(tài),適時作出調(diào)整,實現(xiàn)新工科所期望的前瞻性和不斷創(chuàng)新。在學(xué)科實踐中如何學(xué)習(xí)其他先進(jìn)院校的培養(yǎng)措施,縮短與先進(jìn)院校的差距,也是本院校不斷探索和實踐的方向。