李志杰
(湖南理工學院 信息科學與工程學院,湖南 岳陽 414006)
大數(shù)據(jù)是信息化發(fā)展的新階段。對于大學工科專業(yè),無論是培養(yǎng)科研后備力量,還是為工業(yè)界輸送技術人才,都應該拓展大數(shù)據(jù)相關理論方法與應用的教學[1]。據(jù)報道,中國大數(shù)據(jù)與人工智能人才缺口超過500 萬人,大數(shù)據(jù)已上升到國家戰(zhàn)略的高度。
2017 年2 月以來,教育部積極推進新工科建設,大數(shù)據(jù)教育是重要內(nèi)容,我國一些高校陸續(xù)新開設了大數(shù)據(jù)專業(yè)。教育部分別于2016 年2 月、2017 年3 月、2018 年3 月公布了第一批、第二批、第三批新增數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的高校名單,獲批高校的數(shù)量分別為3、32、250所,呈井噴狀態(tài)增加。同時,高校已辦的許多信息類相關專業(yè)(范圍涵蓋理科、工科,甚至是文科),為了使培養(yǎng)的學生適應新形勢的需要,在原有專業(yè)課程培養(yǎng)體系內(nèi),也開始增設一些大數(shù)據(jù)相關課程,如大數(shù)據(jù)基礎、云計算與大數(shù)據(jù)、數(shù)據(jù)分析等。
不過,大數(shù)據(jù)教育越是大熱門,越需要冷思考。目前,國內(nèi)高校的大數(shù)據(jù)教育處于起步階段,數(shù)據(jù)人才需求巨大、師資力量薄弱、教育體系不足、教學方法陳舊……這些現(xiàn)象都有不同程度的表現(xiàn)。在彌補高達500 萬的大數(shù)據(jù)和人工智能人才缺口之前,中國的大數(shù)據(jù)與人工智能教育必須先跨過這些門檻,才有可能進入世界的第一梯隊[2-3]。
新工科建設需要新的教育理念和新的教學方法作為支撐。數(shù)據(jù)人才培養(yǎng)是一項系統(tǒng)工程,為了培養(yǎng)出合格的數(shù)據(jù)科學人才,必須創(chuàng)新數(shù)據(jù)人才培養(yǎng)模式。
1)部分高校未開設專門的大數(shù)據(jù)教學模塊。
國內(nèi)還有部分高校,至今尚未開設專門的大數(shù)據(jù)教學模塊。就本科教學而言,這些高校數(shù)據(jù)統(tǒng)計分析與挖掘的教學,主要放在大學三年級的數(shù)據(jù)基礎模塊,代表性課程為概率論,開課教師多為理學院教師,帶有通識性教育的特點。這些基礎教學模塊并沒有對大數(shù)據(jù)及相關的理論分析與應用技術做充分的強調(diào)與訓練[4]。
2)已開設的大數(shù)據(jù)類課程教學,實驗平臺建設面臨不少挑戰(zhàn)[5]。
大數(shù)據(jù)類課程實驗教學面臨的挑戰(zhàn)主要如下:①實際案例太少;②沒有完善的平臺支持(如平臺搭建、實驗環(huán)境等);③師資力量不強,任課教師的知識結構需更新;④大數(shù)據(jù)實驗門檻太高(對計算資源需求大);⑤學生只靠十幾個實驗學時是無法真正提高技能的;⑥學生能隨時隨地做大數(shù)據(jù)的實驗;⑦課件和案例需要更新;⑧學校網(wǎng)絡環(huán)境不好,需要離線實驗;⑨機房教師工作負擔過重、壓力大,效率低。
美國數(shù)據(jù)分析科學家Derek Wang 博士認為,“企業(yè)數(shù)據(jù)分析,中美在理念方面相差2~3 年,而在實際執(zhí)行層面或許有5 年左右的差距?!?~5年的差距,在瞬息萬變的信息社會,是一道不小的鴻溝。那么這道鴻溝,到底是怎么造成的呢?
美國在數(shù)據(jù)分析方面的教育上,就在努力轉型實踐“T”字形理念:科研項目不再是由計算機系、商學院或者統(tǒng)計專業(yè)的學生單獨進行,而是多個專業(yè)融合起來,形成整體戰(zhàn)略方向,也就是“T”的那一“橫”。這種前沿的教育理念,即使在美國,也才出現(xiàn)不到三四年,但它取得的效果是根本性的:正是在這樣的教育方式下,美國培養(yǎng)出了第一批數(shù)據(jù)科學家,引導了企業(yè)的數(shù)據(jù)革命。
中國受到傳統(tǒng)教育體制的限制,更重視縱深的專業(yè)技能,也就是“T”的那一“豎”,缺少跨學科和專業(yè)的綜合性體制建立。這樣培養(yǎng)出來的人才,無法主動引導企業(yè)建立和完善數(shù)據(jù)分析機制,讓企業(yè)可以在短時間內(nèi)就從“數(shù)據(jù)分析”中受益。這也反映出中美人才梯隊和培養(yǎng)機制的巨大區(qū)別[6-8]。在Derek Wang 博士看來,數(shù)據(jù)人才培養(yǎng)上的差異,是造成中美大數(shù)據(jù)產(chǎn)業(yè)“五年鴻溝”的根本原因。
針對國內(nèi)高校大數(shù)據(jù)教學現(xiàn)狀,比較中美兩國數(shù)據(jù)人才培養(yǎng)上的差異,本文探討新形勢下的數(shù)據(jù)人才培養(yǎng)模式。這種數(shù)據(jù)人才培養(yǎng)模式主要圍繞彌補教育體系不足、轉型數(shù)據(jù)人才培養(yǎng)觀、產(chǎn)學研融合、大數(shù)據(jù)項目案例驅(qū)動教學改革等方面展開,如圖1 所示。
近年來的諸多實踐證明,想培養(yǎng)真正合格的大數(shù)據(jù)人才,產(chǎn)學研融合是一條可行之路,也是必由之路。甚至可以說,大數(shù)據(jù)產(chǎn)業(yè)的高速發(fā)展正在倒逼高校大數(shù)據(jù)與人工智能學科的建設。這也是為什么中國像百度、騰訊、華為、阿里巴巴、科大訊飛等互聯(lián)網(wǎng)企業(yè)如此重視與高校的合作,或推出一站式開發(fā)平臺,或向高校輸送企業(yè)導師,或與教育主管部門合作舉辦師資培訓班并進行教材編纂……雖然這些舉措對于企業(yè)來說顯得有些“不務正業(yè)”,但從某種程度上來說,這些企業(yè)的眼光才是真的長遠[9]。
眾所周知,學界和業(yè)界應該教學相長,這個教學相長也是雙贏的過程。高校可以從企業(yè)界得到最前沿的資源和數(shù)據(jù);企業(yè)則可通過一系列的措施進行人才儲備、產(chǎn)業(yè)布局、技術迭代等,從而占得發(fā)展先機。
在大數(shù)據(jù)蓬勃發(fā)展的今天,無論是高校還是企業(yè),如果能更好地抓住產(chǎn)學研融合的機遇,勢必能贏得先機和主動,獲得長足的發(fā)展。中國的大數(shù)據(jù)教育最終會在高校和企業(yè)不懈地努力與深入合作之下,開花結果,培養(yǎng)出真正合格的數(shù)據(jù)人才。這是中國高校大數(shù)據(jù)教育的必由之路。
建設在線學習與實驗平臺,給學生創(chuàng)造隨時隨地學習的實驗環(huán)境。一臺筆記本就可以開始實驗,有網(wǎng)絡時用網(wǎng)絡上的大平臺實驗(如百度的AIStudio 在線平臺),無網(wǎng)絡時用我們開發(fā)的實驗系統(tǒng)也能實驗。學生可以隨時隨地沉浸式學習。例如,開課用的實驗平臺采用多種平臺集成VMWare+Ubuntu+Spark+PaddlePaddle 等。該平臺對硬件平臺的要求低,I5CPU+4G 內(nèi)存的普通PC 能在2 個小時的上機時間內(nèi)完成多個大數(shù)據(jù)實驗,一站式解決大數(shù)據(jù)上機難的問題。該方案適合解決學校短期內(nèi)大數(shù)據(jù)平臺建設尚未完善、經(jīng)費不足而急需開課的問題[9-10]。
大數(shù)據(jù)理論教學必須與工科專業(yè)結合,以相關案例驅(qū)動大數(shù)據(jù)教學過程。
在理論教學中,以案例應用為載體,采用以點帶面的思路進行教學內(nèi)容的組織,細化教學目標并編寫講義。例如,在大數(shù)據(jù)教育體系中,“大數(shù)據(jù)基礎”課程是一門必修基礎課程。該課程基于分布式架構實現(xiàn)技術,技術內(nèi)容豐富,涵蓋數(shù)據(jù)采集、預處理、存儲、管理、數(shù)據(jù)分析與可視化等。通過分析該課程的定位、教學內(nèi)容與教材現(xiàn)狀,我們細化教學目標,確立了以相關案例驅(qū)動大數(shù)據(jù)教學過程的思路,并組織編寫教材用于實際教學,取得了良好的教學效果。
實驗教學,以知識應用與實踐技能培養(yǎng)為重點內(nèi)容。在大數(shù)據(jù)實驗實訓環(huán)節(jié),以案例應用為載體,設計實際應用場景,學生組隊(3~5 人一組)完成項目案例實驗。同時,適度引入大數(shù)據(jù)最新技術以保證課程內(nèi)容先進性。以“大數(shù)據(jù)基礎”課程為例,該課程需要系統(tǒng)講述大數(shù)據(jù)典型軟件的安裝、使用和基礎編程方法,使學生系統(tǒng)地掌握操作系統(tǒng)(Linux 和Windows)、開發(fā)工具(Eclipse)以及大數(shù)據(jù)相關軟件(Kafka、Hadoop、HDFS、MapReduce、HBase、Hive、Spark、數(shù)據(jù)可視化工具)。為了達到教學目標,我們在編寫教材時,精心設計了15 個實驗案例,基本覆蓋了課程的主要知識點,“大數(shù)據(jù)基礎”課程教學全過程由大數(shù)據(jù)實際項目案例驅(qū)動。
針對大數(shù)據(jù)處理需要復雜度更低的可行算法,甚至在有些情況下需要設計并行算法,安排專門環(huán)節(jié)教授并行計算相關內(nèi)容,設計實踐導向的課程項目,訓練學生的自主編程能力。由于基于分布式架構實現(xiàn)技術,相對于傳統(tǒng)課程,“大數(shù)據(jù)基礎”課程的教師教學與學生學習難度更大。對于分布式并行環(huán)境下的機器學習與數(shù)據(jù)挖掘主要算法,如MapReduce 編程、PageRank 算法、深度學習應用案例等,我們都安排專門環(huán)節(jié)教授相關內(nèi)容并設計實驗案例,確保學生并行計算自主編程能力達到教學目標要求。
實踐表明,以在線學習與實驗平臺為基礎,通過案例問題導向的方式更容易激發(fā)學生的學習興趣和對理論的理解。另外,在具體案例分析過程中,多采用以點帶面的內(nèi)容安排技巧,從一點出發(fā)逐步擴展,可以更好地幫助學生獲得課程理論的清晰脈絡。
大數(shù)據(jù)教育對教師提出了更高的要求。教師既要對計算機等信息類學科有較深的認識和理解,又要熟悉大數(shù)據(jù)應用技術,特別是要有大數(shù)據(jù)實際系統(tǒng)開發(fā)經(jīng)驗[9]。
目前,相當多的高校盡管已開設了大數(shù)據(jù)相關專業(yè)或課程,卻存在師資嚴重缺乏的現(xiàn)象。由于數(shù)據(jù)科學人才需求旺盛,愿意進入高校從事大數(shù)據(jù)教育的人才非常多,但現(xiàn)有的師資大多來源于計算機等與大數(shù)據(jù)相近的學科,多數(shù)教師并無大數(shù)據(jù)項目經(jīng)驗。此外,由于時間緊迫以及經(jīng)費不足等原因,教師培訓機會也不多。
合格的師資哪里來?①大數(shù)據(jù)教學不是單純的課堂理論教學,它的實踐性要求由項目案例驅(qū)動教學。教師需要科學研究的積累,才能設計出好的大數(shù)據(jù)項目案例,教師要想盡辦法多申請或參與大數(shù)據(jù)方面的課題;②加強與企業(yè)的交流與合作,參與大公司的實際項目。大數(shù)據(jù)教育工作者最缺乏的就是易于理解與操作的實例,而這些實例恰恰不在高校,在企業(yè)中;③有計劃地選派教師參加大數(shù)據(jù)師資培訓,由于大數(shù)據(jù)與行業(yè)結合緊密,培訓最好結合企業(yè)實際案例,切實提高教師對應用層面項目的實戰(zhàn)教學能力;④鼓勵教師積極采用現(xiàn)代教育技術,建設大數(shù)據(jù)精品課程,在項目案例驅(qū)動的大數(shù)據(jù)教學改革中,引入工業(yè)界廣泛應用的框架和項目案例,開發(fā)實驗系統(tǒng)平臺、編寫實驗指導書、開放在線學習與交流平臺,全方位地提高教師教學能力與水平。
相對于傳統(tǒng)課程,無論教師教學還是學生學習,大數(shù)據(jù)課程的難度更大。為了取得良好的教學效果,實現(xiàn)課程教學的目標,教學方式的改革很有必要。
在大數(shù)據(jù)課程教學實踐中,以學生為主體,根據(jù)學生志趣與課程特點,在理論與實驗教學過程中,設計以案例驅(qū)動教學、以問題提升教學、以“鼓勵”提升教學3 種先進教學方法。同時,積極使用現(xiàn)代教學技術與手段,如申報慕課、借鑒翻轉課堂手段等。
在課程考核方面,采用平時、理論與實踐相結合的多樣化考核方法。考核內(nèi)容強調(diào)實踐操作能力與應用技能考核,加大實踐考核的比例。比如,在總分100 分中,平時成績(包括考勤、作業(yè)、課堂提問等)占20%,理論考核(期末)占30%,實踐技能考核占50%。
大數(shù)據(jù)課程考核的成績評定由平時、理論、實踐相結合綜合評定,考核方法向多元化、全程化、科學化、綜合化轉變,通過課程考核的引領作用來激勵學生的積極性,切實提高教學質(zhì)量。
“以學生為中心”,以多種方式充分激發(fā)學生的主動性與創(chuàng)造性。
1)完成課程設計。
只靠十幾個課程實驗學時,只能完成實驗環(huán)境及基本技能訓練,還要通過工程實訓與課后學習等環(huán)節(jié)完成課程設計。
2)參加技術競賽。
數(shù)據(jù)科學人才僅僅在課堂上的培養(yǎng)是遠遠不夠的,需要通過實操的方式來學習知識。技術競賽是最好的實操,考驗著參與者全方位的技能,也能在短期內(nèi)最大限度地激發(fā)人的潛力[10]。
3)鞏固與分享知識。
學生通過查閱大數(shù)據(jù)慕課教師課堂總結、完成工程實訓課程設計、參加技術競賽等方式,將課堂教學獲得的知識得到鞏固、內(nèi)化與提升。通過慕課小組論壇,學生也可以分享學習體會和學習經(jīng)驗。
現(xiàn)階段大數(shù)據(jù)教學存在的主要問題,一方面是重視不夠,不少高校還沒有開設專門的大數(shù)據(jù)教學模塊;另一方面,已開設的大數(shù)據(jù)相關課程,常常存在專業(yè)案例教學弱化,忽視自主編程能力培養(yǎng)等現(xiàn)象。這些現(xiàn)象與問題,是與國家大力提倡的新工科的要求相悖的,需要引起足夠重視。
新工科背景下,大數(shù)據(jù)課程教學改革與實踐,其目標是通過交叉融合、共享、創(chuàng)新等主要途徑培養(yǎng)多元化、創(chuàng)新型數(shù)據(jù)人才。要以社會需求與企業(yè)需求為導向,計算機科學與技術、統(tǒng)計學、智能科學等相關專業(yè)進行交叉融合,重構人才知識體系。創(chuàng)新教學方式與技術、精選教學內(nèi)容、強化實踐創(chuàng)新創(chuàng)業(yè)能力,加強產(chǎn)學研融合、切實做好大數(shù)據(jù)課程建設工作,為金融、商業(yè)、電信等領域數(shù)據(jù)科學工作提供合格的高級工程技術創(chuàng)新人才。