吳賀俊?饒洋輝
摘 要:當(dāng)前,傳統(tǒng)信息技術(shù)類專業(yè)教育的發(fā)展面臨重大挑戰(zhàn),新技術(shù)層出不窮,企業(yè)新技術(shù)高校不教,教學(xué)慣性形成阻力。新工科建設(shè)就是要解決工科專業(yè)教育滯后于新經(jīng)濟(jì)新技術(shù)發(fā)展的深層次問題。本文以大數(shù)據(jù)專業(yè)方向課程建設(shè)為具體實(shí)踐基礎(chǔ),提出將專業(yè)建設(shè)中新科目和基礎(chǔ)科目的有機(jī)融合,避免“因循守舊”和“沙上建塔”兩個(gè)極端,從而主動(dòng)適應(yīng)并引領(lǐng)新工科的建設(shè)過程。
關(guān)鍵詞:大數(shù)據(jù);新工科;課程建設(shè);教學(xué)內(nèi)容;能力培養(yǎng)
我國高校都在面向未來布局新工科建設(shè),積極探索更多樣化和個(gè)性化的人才培養(yǎng)模式,培養(yǎng)具有創(chuàng)新能力和跨界整合能力的系統(tǒng)工程科技人才。以大數(shù)據(jù)專業(yè)方向課程建設(shè)為具體實(shí)踐基礎(chǔ),本文提出將新科目和基礎(chǔ)科目的有機(jī)融合,科學(xué)選擇安排教學(xué)內(nèi)容,既重視多年來計(jì)算機(jī)科學(xué)專業(yè)積累的理論基礎(chǔ)教學(xué),又要開放引入新的教學(xué)內(nèi)容。
具體來說,新科目新內(nèi)容怎么安排呢?新工科建設(shè)“天大行動(dòng)”和“北京指南”提出的新工科三“新”就給出了方向[1-2]:(1)新理念——要應(yīng)對變化,塑造未來;(2)新要求——要培養(yǎng)多元化、創(chuàng)新型卓越工程人才;(3)新途徑——要繼承與創(chuàng)新、交叉與融合、協(xié)調(diào)與共享。
根據(jù)以上原則,面向新工科的專業(yè)課程建設(shè)應(yīng)有以下三點(diǎn)體現(xiàn):一要體現(xiàn)未來發(fā)展趨勢;二要體現(xiàn)卓越人才培養(yǎng)的高要求;三要體現(xiàn)產(chǎn)學(xué)、科教融合,學(xué)科交叉,共享共建的新
模式。
大數(shù)據(jù)專業(yè)方向?qū)儆凇靶屡d工科方向”。大數(shù)據(jù)技術(shù)是專門應(yīng)對大規(guī)模超復(fù)雜關(guān)聯(lián)數(shù)據(jù)的分析處理挑戰(zhàn)的一門新型信息技術(shù),其重點(diǎn)關(guān)注如何對數(shù)據(jù)進(jìn)行智能加工處理,篩選出有用信息,通過對數(shù)據(jù)的加工進(jìn)一步挖掘數(shù)據(jù)的價(jià)值。據(jù)IDC(國際數(shù)據(jù)公司)預(yù)測:到2019年,大數(shù)據(jù)技術(shù)與服務(wù)市場復(fù)合年均增長率將達(dá)23.1%,而來自大數(shù)據(jù)分析的年度全球收入將達(dá)1870億美元。
大數(shù)據(jù)技術(shù)中的數(shù)據(jù)源來自于各個(gè)行業(yè)的方方面面:工業(yè)制造、供銷物流、農(nóng)業(yè)生產(chǎn)、交通運(yùn)輸、生物、醫(yī)療、金融、氣象、海洋、航空、航天、軍事等。設(shè)計(jì)高效的統(tǒng)計(jì)分析及機(jī)器學(xué)習(xí)算法,采用高性能的分布式并行計(jì)算資源,對這些海量非結(jié)構(gòu)化復(fù)雜關(guān)聯(lián)的數(shù)據(jù)進(jìn)行處理,這些是大數(shù)據(jù)技術(shù)的核心任務(wù)。這需要信息計(jì)算科學(xué)中幾乎所有方向科研人員合作,也需要不同科學(xué)領(lǐng)域人員協(xié)同配合[3]。
信息技術(shù)類專業(yè)新工科建設(shè)中的重點(diǎn)應(yīng)該放在新工科方向上,促進(jìn)這些新工科在計(jì)算科學(xué)上繼續(xù)創(chuàng)新、交叉融合。學(xué)院以新經(jīng)濟(jì)發(fā)展為導(dǎo)向,創(chuàng)新性卓越工程人才培養(yǎng)為主線,循序漸進(jìn),在原有專業(yè)基礎(chǔ)上,提出了新專業(yè)課程建設(shè)中新科目和基礎(chǔ)科目的繼承融合發(fā)展,逐步開展大數(shù)據(jù)專業(yè)課程建設(shè)。
一、信息技術(shù)類專業(yè)現(xiàn)狀和大數(shù)據(jù)專業(yè)迫切需求
當(dāng)前,很多高校的工科課程體系多年來變化不大,從當(dāng)前畢業(yè)生和用人單位反饋來看,很多課程體系已經(jīng)不適合當(dāng)前經(jīng)濟(jì)社會(huì)發(fā)展的需要。尤其是新經(jīng)濟(jì)發(fā)展帶來以信息技術(shù)為核心的革命性的產(chǎn)業(yè)變革,由此,我們急需建設(shè)新的交叉型信息課程體系。當(dāng)前高校的計(jì)算機(jī)科學(xué)專業(yè)課程尤其是較高年級的課程體系設(shè)置過于單一,未考慮實(shí)際應(yīng)用,范圍狹窄,與新經(jīng)濟(jì)新技術(shù)發(fā)展相脫節(jié),需要引入新專業(yè)方向課程以跟上新技術(shù)的發(fā)展[4-5]。
當(dāng)前,無論是互聯(lián)網(wǎng)行業(yè)、金融業(yè),還是服務(wù)業(yè)都需要大量的大數(shù)據(jù)人才;各大企業(yè)也迫切需要大數(shù)據(jù)人才來合理利用大數(shù)據(jù)技術(shù)為自身服務(wù)。各類單位也越來越重視大數(shù)據(jù)及相關(guān)技術(shù),投入經(jīng)費(fèi)逐步增加。我國的綜合性行業(yè)巨頭,如華為、百度、騰訊、阿里巴巴、京東等企業(yè),為了應(yīng)對大數(shù)據(jù)挑戰(zhàn),均招納了非常多的大數(shù)據(jù)人才和數(shù)據(jù)分析人才,并且京東、騰訊、阿里巴巴公司近幾年對大數(shù)據(jù)人才的招納力度大幅度上漲。由此可見當(dāng)今時(shí)代大數(shù)據(jù)人才的稀少以及珍貴。根據(jù)中國通信研究院的預(yù)測,5年內(nèi)國內(nèi)大數(shù)據(jù)相關(guān)專業(yè)人才的缺口將高達(dá)130萬左右。
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)畢業(yè)生的就業(yè)面要比計(jì)算機(jī)或者純數(shù)學(xué)廣泛很多。一方面,大批畢業(yè)生可進(jìn)入IT行業(yè)從事大數(shù)據(jù)的工作,如國外的Facebook和Amazon等,中國的京東、淘寶等公司也急需數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)相關(guān)人才;另一方面,隨著很多傳統(tǒng)行業(yè)數(shù)據(jù)的急劇增長,如信用卡刷卡記錄、顧客消費(fèi)數(shù)據(jù)、實(shí)時(shí)監(jiān)控錄像數(shù)據(jù)等,傳統(tǒng)行業(yè)對數(shù)據(jù)分析方向的人才也呈現(xiàn)出了大量需求。
二、大數(shù)據(jù)專業(yè)準(zhǔn)備工作
作為數(shù)據(jù)科學(xué)的學(xué)院,在新工科建設(shè)中,我們較早地開始關(guān)注、研究并逐步深度探索大數(shù)據(jù)這一新興方向。我們認(rèn)為,新的專業(yè)或方向建設(shè)應(yīng)該做好充足的準(zhǔn)備工作。前沿方向尤其應(yīng)該“科研先行、產(chǎn)業(yè)結(jié)合、前沿教學(xué)、教研相長、產(chǎn)學(xué)共建”。
2015年開始,學(xué)院開展了多個(gè)關(guān)于大數(shù)據(jù)方向的科研課題,以人工智能、數(shù)據(jù)庫等研究領(lǐng)域的教師和科研人員為主導(dǎo),形成以大數(shù)據(jù)為核心,涵蓋人工智能、數(shù)據(jù)庫、高性能計(jì)算、云計(jì)算、網(wǎng)絡(luò)安全、生物醫(yī)藥信息等相關(guān)領(lǐng)域的研究團(tuán)隊(duì)。
本學(xué)院建立了一個(gè)以“天河二號”超級計(jì)算機(jī)為依托,涵蓋高層次人才培養(yǎng)、軟件技術(shù)研發(fā)和支撐、面向產(chǎn)業(yè)和科研的高水平應(yīng)用服務(wù)“三位一體”的新型管理運(yùn)行機(jī)制。學(xué)院籌建了“大數(shù)據(jù)科學(xué)研究中心”,與“廣州超算中心”形成了“一院兩中心”的發(fā)展格局,互相支撐、共同發(fā)展。學(xué)術(shù)研究上形成了“數(shù)據(jù)、智能、計(jì)算”的三角結(jié)構(gòu),三者互為依托,協(xié)同發(fā)展。
但是,學(xué)院在人工智能和交叉領(lǐng)域方向上還相對薄弱,尤其是在專業(yè)數(shù)據(jù)挖掘、統(tǒng)計(jì)分析、深度學(xué)習(xí)方向上只有人數(shù)較少的團(tuán)隊(duì)從事研究。然而,大數(shù)據(jù)技術(shù)中關(guān)鍵一環(huán)是人工智能與傳統(tǒng)工程產(chǎn)業(yè)結(jié)合、交叉應(yīng)用:首先利用人工智能方法采集過濾清洗數(shù)據(jù),其次采用高級統(tǒng)計(jì)分析方法或者機(jī)器學(xué)習(xí)方法進(jìn)行關(guān)聯(lián)分析、分類或者檢測識別。以上都需要人工智能算法在理解該數(shù)據(jù)所屬工程產(chǎn)業(yè)的基礎(chǔ)上才能做到高準(zhǔn)確率的分析識別。
學(xué)院在三個(gè)方面做了準(zhǔn)備工作:(1)引進(jìn)人才。學(xué)院從海外引進(jìn)了生物信息、人工智能等專業(yè)人才。(2)成長培養(yǎng)。學(xué)院通過科研項(xiàng)目、教育部高校人工智能教師培訓(xùn)等方式,培養(yǎng)現(xiàn)有教師團(tuán)隊(duì),跟進(jìn)前沿技術(shù)發(fā)展。(3)結(jié)合產(chǎn)業(yè)。通過產(chǎn)學(xué)研合作,讓工科的科研能夠結(jié)合實(shí)際,尤其是非基礎(chǔ)理論的應(yīng)用類工科的研究,需要接地氣,解決實(shí)際問題。產(chǎn)業(yè)界擁有很多數(shù)據(jù)資源但欠缺前沿技術(shù),而高??蒲袡C(jī)構(gòu)缺乏豐富的數(shù)據(jù)資源但在前沿技術(shù)領(lǐng)域積累了大量研究成果,所以二者合作是共贏的。同時(shí),由于大數(shù)據(jù)領(lǐng)域是前沿研究,所以不存在產(chǎn)業(yè)浪費(fèi)學(xué)術(shù)時(shí)間的問題。
經(jīng)過科研項(xiàng)目和工程實(shí)踐的積累,下一步就是小范圍開展前沿教學(xué)。本學(xué)院在計(jì)算機(jī)科學(xué)專業(yè)中分設(shè)了不同方向,包括人工智能與大數(shù)據(jù)方向、超級計(jì)算方向等,每個(gè)方向以40人為上限。在課程設(shè)置上,也從計(jì)算機(jī)科學(xué)專業(yè)延續(xù)而來,循序漸進(jìn),注重繼承與創(chuàng)新的統(tǒng)一。
三、大數(shù)據(jù)專業(yè)課程建設(shè)探索
大數(shù)據(jù)專業(yè)方向的培養(yǎng)目標(biāo)是讓學(xué)生能夠系統(tǒng)掌握數(shù)據(jù)科學(xué)以及統(tǒng)計(jì)學(xué)、人工智能等基礎(chǔ)理論、基礎(chǔ)知識和基本技能與方法,使得學(xué)生在課程學(xué)習(xí)和實(shí)踐后具有較好的數(shù)據(jù)工程實(shí)踐能力、較強(qiáng)的學(xué)習(xí)能力和很強(qiáng)的數(shù)據(jù)科學(xué)研究素質(zhì)。學(xué)生畢業(yè)后將能從事大規(guī)模數(shù)據(jù)庫的開發(fā)維護(hù)、各類數(shù)據(jù)的挖掘與分析、商業(yè)分析與預(yù)測、工農(nóng)業(yè)產(chǎn)品的品質(zhì)提升等相關(guān)大數(shù)據(jù)工程應(yīng)用,成為數(shù)據(jù)計(jì)算、人工智能及其相關(guān)技術(shù)領(lǐng)域的系統(tǒng)設(shè)計(jì)研發(fā)、算法研發(fā)、數(shù)據(jù)科學(xué)研究與教學(xué)的復(fù)合型人才。
大數(shù)據(jù)專業(yè)系統(tǒng)能力培養(yǎng)要求則分為兩個(gè)層面:
(1)掌握大數(shù)據(jù)科學(xué)相關(guān)的基礎(chǔ)知識,掌握大規(guī)模、異構(gòu)、多源、多維度、分布式、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)存儲技術(shù)以及網(wǎng)絡(luò)數(shù)據(jù)搜集及分布式存儲技術(shù),掌握格式化數(shù)據(jù)分析挖掘的基本方法,具備數(shù)據(jù)建模能力和數(shù)據(jù)可視化展現(xiàn)能力。
(2)對超級計(jì)算機(jī)、高性能計(jì)算、數(shù)據(jù)中心等基礎(chǔ)設(shè)施有較好的了解,具有比較系統(tǒng)的大數(shù)據(jù)工程實(shí)踐經(jīng)驗(yàn);具有較強(qiáng)的利用機(jī)器學(xué)習(xí)方法和運(yùn)用高級統(tǒng)計(jì)學(xué)進(jìn)行數(shù)據(jù)分析統(tǒng)計(jì)的能力,能夠綜合高效應(yīng)用并行算法和計(jì)算資源如GPU集群、FPGA板等解決實(shí)際大數(shù)據(jù)工程問題。
根據(jù)以上培養(yǎng)目標(biāo)和專業(yè)基礎(chǔ)培養(yǎng)要求,我們可以看出該專業(yè)方向與計(jì)算機(jī)科學(xué)專業(yè)的重合以及區(qū)別。
首先,重合部分主要是在專業(yè)基礎(chǔ)部分。包括:數(shù)學(xué)分析、概率論與數(shù)理統(tǒng)計(jì)、高等代數(shù)、回歸分析、數(shù)值計(jì)算、程序設(shè)計(jì)、數(shù)據(jù)結(jié)構(gòu)與算法(含實(shí)驗(yàn))、算法分析與設(shè)計(jì)、機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘(計(jì)算機(jī)科學(xué)專業(yè)選修課程)、數(shù)據(jù)庫系統(tǒng)原理及其實(shí)驗(yàn)課程、人工智能(計(jì)算機(jī)科學(xué)專業(yè)學(xué)習(xí)人工智能導(dǎo)論)。
其次,需要在繼承計(jì)算機(jī)科學(xué)專業(yè)課程的基礎(chǔ)上,繼續(xù)發(fā)展大數(shù)據(jù)專業(yè)方向的四大系統(tǒng)課程,即:操作系統(tǒng)、編譯原理、計(jì)算機(jī)組成原理和計(jì)算機(jī)體系結(jié)構(gòu)。由于大數(shù)據(jù)專業(yè)方向后續(xù)還有很多分布式系統(tǒng)、并行體系結(jié)構(gòu)、超級計(jì)算機(jī)原理等高級的系統(tǒng)基礎(chǔ)課,并且,如果完全重合計(jì)算機(jī)系統(tǒng)類課程會(huì)導(dǎo)致學(xué)時(shí)不夠用,學(xué)習(xí)內(nèi)容過多等問題,因此我們這里把四大計(jì)算機(jī)系統(tǒng)類課程整合成一門課程——計(jì)算機(jī)系統(tǒng)。該課程結(jié)合后續(xù)實(shí)踐課程,高效地培養(yǎng)學(xué)生計(jì)算機(jī)系統(tǒng)能力。
再次,與計(jì)算機(jī)科學(xué)專業(yè)課程不同,大數(shù)據(jù)專業(yè)核心課程主要包括:分布式與并行計(jì)算、高級人工智能原理、大數(shù)據(jù)處理(包含高等統(tǒng)計(jì)學(xué)、貝葉斯統(tǒng)計(jì)、多變量分析、并行機(jī)器學(xué)習(xí)算法、大規(guī)模數(shù)據(jù)并行處理)、高性能計(jì)算程序設(shè)計(jì)基礎(chǔ)、超級計(jì)算機(jī)原理與操作、多核程序設(shè)計(jì)、圖論及其應(yīng)用、算法設(shè)計(jì)與應(yīng)用基礎(chǔ)、高級編程技術(shù)、智能算法及應(yīng)用、機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘、云計(jì)算概論、優(yōu)化理論、生物信息學(xué)引論等。
最后,大數(shù)據(jù)專業(yè)方向的主要實(shí)踐性教學(xué)環(huán)節(jié)和主要專業(yè)實(shí)驗(yàn)包括:程序設(shè)計(jì)實(shí)驗(yàn)、數(shù)據(jù)結(jié)構(gòu)與算法實(shí)驗(yàn)、操作系統(tǒng)原理實(shí)驗(yàn)、高性能計(jì)算程序設(shè)計(jì)基礎(chǔ)實(shí)驗(yàn)、計(jì)算機(jī)組成與原理實(shí)驗(yàn)、并行機(jī)器學(xué)習(xí)算法實(shí)驗(yàn)、大數(shù)據(jù)應(yīng)用實(shí)踐、程序設(shè)計(jì)與數(shù)據(jù)結(jié)構(gòu)綜合實(shí)踐、高級數(shù)據(jù)庫技術(shù)及實(shí)踐、多核程序設(shè)計(jì)與實(shí)踐、數(shù)據(jù)分析實(shí)踐、云計(jì)算項(xiàng)目實(shí)踐、超級計(jì)算實(shí)踐、專業(yè)技術(shù)綜合實(shí)踐等。
基于以上課程分析,我們探索針對性地建設(shè)教研相長、產(chǎn)學(xué)共建的共享共建開放實(shí)踐教學(xué)平臺。該平臺的系統(tǒng)架構(gòu)如下圖所示。該平臺的基礎(chǔ)是一個(gè)遠(yuǎn)程網(wǎng)絡(luò)虛擬實(shí)驗(yàn)室,通過虛擬現(xiàn)實(shí)設(shè)備和仿真節(jié)點(diǎn),學(xué)生可以遠(yuǎn)程實(shí)驗(yàn)及硬件交互,例如遠(yuǎn)程運(yùn)行超級計(jì)算程序和測試算法等。
該平臺將在使用中持續(xù)開展產(chǎn)學(xué)共享共建,支持其他學(xué)院和其他經(jīng)過學(xué)院認(rèn)證的科研及企業(yè)機(jī)構(gòu)上傳題目、標(biāo)準(zhǔn)答案、評價(jià)標(biāo)準(zhǔn),經(jīng)審批后擴(kuò)充教學(xué)平臺題庫等。平臺建設(shè)采用通用框架,按照平臺定義的協(xié)議由教學(xué)助理導(dǎo)入課程庫、實(shí)驗(yàn)庫、題目庫和考核庫,第三方機(jī)構(gòu)提供的課題由管理員審批后擴(kuò)充題目庫??蚣軈f(xié)議由平臺的內(nèi)核系統(tǒng)通過各種模塊支撐。
參考文獻(xiàn):
[1] “新工科”建設(shè)行動(dòng)路線:“天大行動(dòng)”[J]. 高等工程教育研究,2017(2):24-25.
[2] “新工科” 建設(shè)指南:“北京指南”[J]. 高等工程教育研究,2017(4):20-12.
[3] 何海地. 美國大數(shù)據(jù)專業(yè)碩士研究生教育的背景、現(xiàn)狀、特色與啟示[J]. 圖書與情報(bào),2014(2):48-56.
[4] 鄭慶華. 以創(chuàng)新創(chuàng)業(yè)教育引領(lǐng)創(chuàng)建新工科教育模式[J]. 中國大學(xué)教學(xué),2017(12):8-12.
[5] 馮亞青,楊光. 理工融合:新工科教育改革的新探索[J]. 中國大學(xué)教學(xué),2017(9):16-20.