国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)技術(shù)原理與應(yīng)用課程建設(shè)經(jīng)驗分享

2019-01-10 05:59:24林子雨
大數(shù)據(jù) 2018年6期
關(guān)鍵詞:分布式課程體系教材

林子雨

廈門大學(xué)信息科學(xué)與技術(shù)學(xué)院, 福建 廈門 361005

1 引言

大數(shù)據(jù)帶來了信息技術(shù)的巨大變革,對社會生產(chǎn)和人們生活的各個領(lǐng)域都產(chǎn)生著深刻的影響[1-4],所到之處,或是顛覆,或是提升,讓人們深切感受到了大數(shù)據(jù)實實在在的威力。對于一個國家而言,能否緊緊抓住大數(shù)據(jù)發(fā)展機遇,快速形成核心技術(shù)和應(yīng)用并參與新一輪的全球化競爭,將直接決定未來若干年世界范圍內(nèi)各國科技力量博弈的格局。大數(shù)據(jù)專業(yè)人才的培養(yǎng)是新一輪科技較量的基礎(chǔ),高等院校承擔(dān)著大數(shù)據(jù)人才培養(yǎng)的重任,因此,各高等院校非常重視大數(shù)據(jù)課程的開設(shè),大數(shù)據(jù)課程已經(jīng)成為信息相關(guān)專業(yè)的重要核心課程。北京大學(xué)、廈門大學(xué)、中國人民大學(xué)等一批高校在國內(nèi)率先開設(shè)大數(shù)據(jù)課程。2016年,北京大學(xué)、中南大學(xué)、對外經(jīng)貿(mào)大學(xué)3所高校成為國內(nèi)首批獲得教育部批準(zhǔn)設(shè)立“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)的本科院校,此后,教育部又于2017年和2018年分別批準(zhǔn)32所和248所本科院校設(shè)立數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)。與此同時,根據(jù)教育部公布的“大數(shù)據(jù)技術(shù)與應(yīng)用”專業(yè)備案和審批結(jié)果顯示,截至目前,已經(jīng)有累計208所職業(yè)院校獲批“大數(shù)據(jù)技術(shù)與應(yīng)用”專業(yè)?!皵?shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)和“大數(shù)據(jù)技術(shù)與應(yīng)用”專業(yè)一般被統(tǒng)稱為“大數(shù)據(jù)專業(yè)”。隨著大數(shù)據(jù)專業(yè)在國內(nèi)眾多高校中開設(shè),大數(shù)據(jù)專業(yè)人才的培養(yǎng)邁入了全新的階段。

大數(shù)據(jù)專業(yè)作為典型的“新工科”專業(yè),在課程體系建設(shè)方面還處于摸索階段[5],沒有太多可供借鑒的現(xiàn)成經(jīng)驗,需要一大批熱愛教學(xué)的高校教師積極投身課程體系和教材的建設(shè)工作中,共同推動全國高校大數(shù)據(jù)教學(xué)工作不斷向前發(fā)展。廈門大學(xué)數(shù)據(jù)庫實驗室作為國內(nèi)高校較早從事大數(shù)據(jù)教學(xué)資源建設(shè)的團隊,從2013年開始,在大數(shù)據(jù)課程建設(shè)方面開展了很多有意義的嘗試和探索,本文將分享筆者團隊在這些方面的工作成果和經(jīng)驗做法。

2 大數(shù)據(jù)課程建設(shè)的難點

大數(shù)據(jù)專業(yè)課程涵蓋范圍較廣,從學(xué)科角度而言,包括了數(shù)學(xué)(高等數(shù)學(xué)、線性代數(shù)、離散數(shù)學(xué)、數(shù)學(xué)建模等)、計算機(算法、數(shù)據(jù)結(jié)構(gòu)、程序設(shè)計、數(shù)據(jù)庫、操作系統(tǒng)、數(shù)據(jù)挖掘等)、統(tǒng)計(概率論與數(shù)理統(tǒng)計、多元統(tǒng)計分析等)等多學(xué)科知識。從數(shù)據(jù)分析流程角度而言,大數(shù)據(jù)專業(yè)課程包含了數(shù)據(jù)分析全流程的各種技術(shù),包括數(shù)據(jù)采集、數(shù)據(jù)存儲與管理、數(shù)據(jù)處理與分析、數(shù)據(jù)可視化等各個環(huán)節(jié)的技術(shù)。

本文探討的大數(shù)據(jù)課程是指數(shù)據(jù)分析全流程涉及的大數(shù)據(jù)技術(shù)類課程。需要強調(diào)指出的是,在這些大數(shù)據(jù)技術(shù)類課程中,并非所有課程都是大數(shù)據(jù)時代新生的課程,比如,數(shù)據(jù)采集課程主要講解網(wǎng)絡(luò)爬蟲技術(shù),這些技術(shù)在大數(shù)據(jù)時代到來之前就已經(jīng)存在很多年了,并非到了大數(shù)據(jù)時代才誕生。同理,數(shù)據(jù)可視化也是經(jīng)歷了多年發(fā)展的“老課程”,知識內(nèi)容并沒有因為大數(shù)據(jù)的出現(xiàn)而發(fā)生本質(zhì)的變化。實際上,大數(shù)據(jù)技術(shù)之所以受到熱捧,主要在于以Hadoop和Spark為代表的分布式框架解決了以較低的成本實現(xiàn)海量數(shù)據(jù)的存儲和計算的問題。因此,本文探討的大數(shù)據(jù)課程主要聚焦分布式存儲和分布式處理這兩個層面的大數(shù)據(jù)技術(shù),這也是大數(shù)據(jù)課程區(qū)別于傳統(tǒng)的計算機專業(yè)課程的一個重要方面。

經(jīng)過上述聚焦以后,大數(shù)據(jù)課程建設(shè)的難點主要表現(xiàn)在以下幾個方面。

(1)缺少大數(shù)據(jù)課程體系

雖然本文把大數(shù)據(jù)課程聚焦到分布式存儲和分布式處理這兩個層面的大數(shù)據(jù)技術(shù),但是,依然涵蓋了大量新的知識內(nèi)容。大數(shù)據(jù)技術(shù)體系非常龐雜,在分布式存儲層面,涉及NoSQL數(shù)據(jù)庫、分布式文件系統(tǒng)等內(nèi)容;在分布式計算層面,涉及批處理、流計算和圖計算等內(nèi)容。如果要深入學(xué)習(xí),每種技術(shù)都可以成為一門獨立的課程。因此,如何系統(tǒng)歸納整理相關(guān)大數(shù)據(jù)技術(shù),并且按照高校教學(xué)計劃循序漸進地展開,是一個棘手的問題。此外,如何做好不同課程之間的知識布局,也具有較高的難度。因為在課程體系的建設(shè)上,需要做到課程與課程之間的“知識分割不重復(fù)”和“知識傳承不斷層”,讓教師教課有綱可循,讓學(xué)生學(xué)習(xí)脈絡(luò)清晰。

(2)缺少大數(shù)據(jù)課程教材

一門課程的順利開設(shè),離不開高質(zhì)量的教材。作為新興的專業(yè),教材缺乏是一個正常的現(xiàn)象,也是必須面對和解決的問題。市場上已有的很多大數(shù)據(jù)書籍[6-11]屬于工具類數(shù)據(jù),不適合作為高校教材。

(3)缺少大數(shù)據(jù)教學(xué)資源

教材只能滿足開課的基本需求,如果要獲得較好的教學(xué)效果,就必須建設(shè)大量配套的教學(xué)資源,比如PPT、MOOC、實驗手冊等,而在專業(yè)建設(shè)的初始時期,這些資源都是相對比較欠缺的。

(4)缺少大數(shù)據(jù)課程師資

一門課程開設(shè)質(zhì)量的高低取決于師資水平。若要教出合格的學(xué)生,就必須要求教師具備一定的大數(shù)據(jù)知識儲備和編程實踐能力。大數(shù)據(jù)課程需要教師具備大數(shù)據(jù)實驗環(huán)境構(gòu)建能力,掌握系統(tǒng)的大數(shù)據(jù)知識,具備開展編程實踐的能力。而對于承擔(dān)計算機類課程教學(xué)任務(wù)的很多教師而言,如果沒有系統(tǒng)學(xué)習(xí)大數(shù)據(jù)知識,顯然不具備這方面的能力。

(5)大數(shù)據(jù)環(huán)境搭建復(fù)雜

大數(shù)據(jù)實驗環(huán)境的搭建涉及Linux系統(tǒng)、虛擬機軟件、JDK、Hadoop、Spark、HBase、Hive等多種開源軟件的安裝,安裝過程涉及大量配置,需要具有一定的計算機操作功底,才能夠順利完成實驗環(huán)境的搭建。而且有時候同樣的操作方法,在某臺計算機上可以成功,在另一臺計算機上卻會失敗。這些給任課教師和學(xué)生帶來了很大的挑戰(zhàn)。

(6)大數(shù)據(jù)學(xué)習(xí)門檻高

大數(shù)據(jù)知識體系的龐雜、大數(shù)據(jù)實驗環(huán)境搭建的復(fù)雜性以及分布式編程的新知識都會成為大數(shù)據(jù)學(xué)習(xí)者很難跨越的“門檻”。如何有效降低大數(shù)據(jù)學(xué)習(xí)門檻,提高學(xué)習(xí)效率和效果,是開設(shè)大數(shù)據(jù)課程必須要解決的難題。

(7)不同高校的差異化需求給教材建設(shè)帶來了挑戰(zhàn)

重點本科院校、普通本科院校和高職院校對人才培養(yǎng)的目標(biāo)和方向都不盡相同,這種差異會在課程內(nèi)容方面得到體現(xiàn)。因此,有些高校會更加側(cè)重理論知識的講解,而有些高校則會更注重學(xué)生技術(shù)應(yīng)用能力的培養(yǎng)。這就要求課程教材和課程內(nèi)容在知識點的布局和課時安排方面有不同的側(cè)重點。如何根據(jù)現(xiàn)有的教材進行教學(xué)內(nèi)容的個性化定制,是實際教學(xué)環(huán)節(jié)普遍遭遇的難題。

3 廈門大學(xué)建設(shè)的大數(shù)據(jù)課程體系

從2013年開始,經(jīng)過為期5年的建設(shè),廈門大學(xué)已經(jīng)建成了涵蓋入門課程、進階課程和實訓(xùn)課程在內(nèi)的大數(shù)據(jù)課程體系(如圖1所示),已經(jīng)可以提供包括教材、講義PPT、習(xí)題、案例、視頻、師資培訓(xùn)等全方位的大數(shù)據(jù)課程服務(wù)。

圖1 廈門大學(xué)建設(shè)的大數(shù)據(jù)課程體系

在大數(shù)據(jù)專業(yè)課程體系中,數(shù)學(xué)、編程、算法、數(shù)據(jù)結(jié)構(gòu)、操作系統(tǒng)、數(shù)據(jù)庫、數(shù)據(jù)挖掘等課程屬于歷史已有課程,已經(jīng)存在大量教材和配套資源,而分布式存儲和計算框架則屬于進入大數(shù)據(jù)時代以后的較新的課程,相關(guān)教學(xué)資源較為缺乏,因此,筆者單位選擇大數(shù)據(jù)課程作為教學(xué)資源建設(shè)重點,投入大量人力、物力、財力,建設(shè)了全套的大數(shù)據(jù)課程資源。其中,“大數(shù)據(jù)技術(shù)原理與應(yīng)用”屬于大數(shù)據(jù)導(dǎo)論課程,旨在引導(dǎo)學(xué)生進入大數(shù)據(jù)世界,由單機環(huán)境進入分布式環(huán)境,面對和處理大數(shù)據(jù)問題[12-13]?!癝park編程基礎(chǔ)”屬于進階級大數(shù)據(jù)課程,旨在幫助學(xué)生系統(tǒng)掌握當(dāng)前流行的分布式并行編程框架Spark的編程方法[14]?!按髷?shù)據(jù)實訓(xùn)”課程旨在滿足高校開設(shè)綜合實訓(xùn)課程的教學(xué)需求,案例涵蓋數(shù)據(jù)預(yù)處理、存儲、處理、分析、可視化等數(shù)據(jù)處理全流程涉及的各種典型操作和大數(shù)據(jù)軟件,可以全面訓(xùn)練學(xué)生的大數(shù)據(jù)分析全流程的能力。

4 “大數(shù)據(jù)技術(shù)原理與應(yīng)用”課程建設(shè)

“大數(shù)據(jù)技術(shù)原理與應(yīng)用”課程是廈門大學(xué)數(shù)據(jù)庫實驗室建設(shè)的較為成熟的大數(shù)據(jù)課程,不僅在廈門大學(xué)受到學(xué)生的歡迎,而且已經(jīng)推廣到了國內(nèi)很多高校。因此,本節(jié)內(nèi)容將介紹這門課程的建設(shè)情況,包括課程定位、培養(yǎng)目標(biāo)、預(yù)備知識、大數(shù)據(jù)與云計算課程之間的知識切割、課程內(nèi)容與學(xué)時安排、課程教材、實驗環(huán)境搭建、配套資源建設(shè)、在線服務(wù)平臺、線下培訓(xùn)與交流等。

4.1 課程定位

該課程定位為入門級大數(shù)據(jù)技術(shù)課程,為學(xué)生搭建起通向“大數(shù)據(jù)知識空間”的橋梁和紐帶。課程系統(tǒng)地梳理總結(jié)大數(shù)據(jù)相關(guān)技術(shù),介紹大數(shù)據(jù)技術(shù)的基本原理和大數(shù)據(jù)主要應(yīng)用,幫助學(xué)生形成對大數(shù)據(jù)知識體系及其應(yīng)用領(lǐng)域的輪廓性認識,為學(xué)生在大數(shù)據(jù)領(lǐng)域“深耕細作”奠定基礎(chǔ)、指明方向。在本課程學(xué)習(xí)的基礎(chǔ)上,感興趣的學(xué)生還可以通過其他工具書(如《Hadoop權(quán)威指南》等)繼續(xù)深入學(xué)習(xí)和實踐大數(shù)據(jù)相關(guān)技術(shù)。

4.2 培養(yǎng)目標(biāo)

“大數(shù)據(jù)技術(shù)原理與應(yīng)用”課程的預(yù)期目標(biāo)如下。

● 能夠建立對大數(shù)據(jù)知識體系的輪廓性認識,了解大數(shù)據(jù)發(fā)展歷程、基本概念、主要影響、應(yīng)用領(lǐng)域、關(guān)鍵技術(shù)、計算模式和產(chǎn)業(yè)發(fā)展,了解云計算、物聯(lián)網(wǎng)的概念及其與大數(shù)據(jù)之間的緊密關(guān)系。

● 能夠了解Hadoop的發(fā)展歷史、重要特性、應(yīng)用現(xiàn)狀、Hadoop項目結(jié)構(gòu)及其各個組件,并熟練掌握Hadoop平臺的安裝和使用方法。

● 能夠了解分布式文件系統(tǒng)的基本概念、結(jié)構(gòu)和設(shè)計需求,掌握Hadoop分布式文件系統(tǒng)(HDFS)的重要概念、體系結(jié)構(gòu)、存儲原理和讀寫過程,熟練掌握HDFS的使用方法。

● 能夠了解分布式數(shù)據(jù)庫HBase的訪問接口、數(shù)據(jù)模型、實現(xiàn)原理和運行機制,并熟練掌握HBase的使用方法。

● 能夠了解NoSQL數(shù)據(jù)庫與傳統(tǒng)的關(guān)系數(shù)據(jù)庫的差異、NoSQL數(shù)據(jù)庫的四大類型以及NoSQL數(shù)據(jù)庫的三大基石;基本掌握Redis、MongoDB等NoSQL數(shù)據(jù)庫的使用方法。

● 能夠了解云數(shù)據(jù)庫的概念、基本原理和代表性產(chǎn)品的使用方法。

● 能夠熟練掌握分布式編程框架MapReduce的基本原理和編程方法。

● 能夠了解大數(shù)據(jù)處理架構(gòu)Spark的基本原理和編程方法。

● 能夠了解大數(shù)據(jù)在互聯(lián)網(wǎng)等領(lǐng)域的典型應(yīng)用。

4.3 預(yù)備知識

“大數(shù)據(jù)技術(shù)原理與應(yīng)用”屬于大數(shù)據(jù)導(dǎo)論課程,引導(dǎo)學(xué)生進入大數(shù)據(jù)世界。因此,在學(xué)習(xí)該課程之前,需要學(xué)生已經(jīng)學(xué)習(xí)過算法、數(shù)據(jù)結(jié)構(gòu)、程序設(shè)計、數(shù)據(jù)庫、操作系統(tǒng)等計算機類課程。

4.4 大數(shù)據(jù)課程與云計算課程之間的知識切割

目前,很多高校已經(jīng)開設(shè)了大數(shù)據(jù)課程和云計算課程。由于大數(shù)據(jù)課程與云計算課程有著千絲萬縷的聯(lián)系,因此,如果不能對這兩門課程的知識點進行合理切割,就會給實際教學(xué)環(huán)節(jié)造成很大的困擾,不僅會影響教師的教學(xué),也會導(dǎo)致學(xué)生的重復(fù)學(xué)習(xí)。

云計算和大數(shù)據(jù)二者具有深厚的淵源。云計算的普及早于大數(shù)據(jù),2006年亞馬遜公司就推出了云計算產(chǎn)品Amazon AWS,而大數(shù)據(jù)概念被大眾所熟知是在2010年左右。在大數(shù)據(jù)概念被廣泛使用之前,以Hadoop為代表的大數(shù)據(jù)技術(shù)都被列為云計算技術(shù),因此2010年之前出版的許多云計算教材[15]通常有大量的篇幅介紹Hadoop等大數(shù)據(jù)技術(shù),這類教材可以被稱為復(fù)合型云計算教材。但是,2010年以后,以Hadoop為代表的分布式存儲技術(shù)和分布式處理技術(shù)都被單獨剝離出來,成為大數(shù)據(jù)技術(shù)。從這個角度來說,可以認為云計算為大數(shù)據(jù)提供了技術(shù)支撐。現(xiàn)在大家談到云計算,主要是指為人類提供IT資源的一種全新商業(yè)模式及其背后涉及的相關(guān)技術(shù)。作為一種全新的商業(yè)模式,云計算徹底顛覆了人類獲得IT資源的方式,云計算服務(wù)商可以通過網(wǎng)絡(luò)、以服務(wù)的方式提供非常廉價的IT資源。

云計算和大數(shù)據(jù)存在如此緊密的關(guān)系,導(dǎo)致部分高校開設(shè)的云計算課程和大數(shù)據(jù)課程存在高度的知識重合,也就是說,兩門課程都有大量的篇幅介紹Hadoop等大數(shù)據(jù)技術(shù)。為了解決這個尷尬的問題,就需要改變兩門課程選擇的教材,因為教材內(nèi)容往往決定了課程的內(nèi)容。云計算課程選擇的教材應(yīng)該盡量避免采用包含了大量大數(shù)據(jù)知識的復(fù)合型云計算教材,而應(yīng)該采用單一型云計算教材。在單一型云計算教材中[16],Hadoop等屬于大數(shù)據(jù)課程的內(nèi)容不會作為核心內(nèi)容,只會用一個章節(jié)簡要介紹Hadoop等大數(shù)據(jù)技術(shù)。

采用單一型云計算教材以后,云計算和大數(shù)據(jù)兩門課程的知識重點就有了明顯的區(qū)分,不會重合,具體如下[17]。

(1)云計算課程的教學(xué)重點

云計算課程內(nèi)容主要包括:云計算概念、云計算體系架構(gòu)、數(shù)據(jù)中心、虛擬化技術(shù)(平臺虛擬化、資源虛擬化、虛擬機的動態(tài)遷移、云操作系統(tǒng))、SOA架構(gòu)及開發(fā)技術(shù)、云數(shù)據(jù)中心設(shè)計與測試、云數(shù)據(jù)中心維護與管理、云安全架構(gòu)、桌面云、PaaS應(yīng)用開發(fā)平臺、開源的云計算管理平臺Openstack、Docker容器、大數(shù)據(jù)存儲與管理(最多2個學(xué)時)。

(2)大數(shù)據(jù)的教學(xué)重點

大數(shù)據(jù)課程內(nèi)容主要包括:大數(shù)據(jù)的基本概念、Hadoop、HDFS、HBase、NoSQL數(shù)據(jù)庫、云數(shù)據(jù)庫、MapReduce、Spark、流計算、圖計算、數(shù)據(jù)可視化以及大數(shù)據(jù)在互聯(lián)網(wǎng)、生物醫(yī)學(xué)和物流等各個領(lǐng)域的應(yīng)用。

4.5 課程內(nèi)容與學(xué)時安排

該課程在Hadoop、HDFS、HBase、MapReduce、Spark等重要章節(jié)安排了入門級的實踐操作,讓學(xué)生更好地學(xué)習(xí)和掌握大數(shù)據(jù)關(guān)鍵技術(shù)。具體學(xué)時安排見表1。

需要指出的是,在具體開展這門課程的教學(xué)時,各個高??梢愿鶕?jù)自身的實際情況和特點,對課程內(nèi)容進行適當(dāng)調(diào)整。如果對理論層面內(nèi)容比較注重,則可以適當(dāng)?shù)厣钊胫v解理論內(nèi)容,減少實驗編程學(xué)時(比如可以把一些編程上機操作留作學(xué)生課后作業(yè));如果更加注重實踐操作層面,則可以減少理論內(nèi)容的講解,補充一些編程案例到課堂教學(xué)中。

4.6 課程教材

該課程將筆者編著的《大數(shù)據(jù)技術(shù)原理與應(yīng)用(第2版)》作為課程教材[12]。該教材共分四大部分,包括大數(shù)據(jù)基礎(chǔ)篇、大數(shù)據(jù)存儲篇、大數(shù)據(jù)處理與分析篇和大數(shù)據(jù)應(yīng)用篇。在大數(shù)據(jù)基礎(chǔ)篇中,介紹了大數(shù)據(jù)的基本概念和應(yīng)用領(lǐng)域,闡述了大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)的相互關(guān)系,并重點介紹了大數(shù)據(jù)處理架構(gòu)Hadoop。由于Hadoop已經(jīng)成為應(yīng)用最為廣泛的大數(shù)據(jù)技術(shù),因此,該書的大數(shù)據(jù)相關(guān)技術(shù)主要圍繞Hadoop展開,包括Hadoop MapReduce、HDFS和HBase。在大數(shù)據(jù)存儲篇中,分別介紹了大數(shù)據(jù)存儲相關(guān)技術(shù)的概念與原理,包括HDFS、HBase、NoSQL數(shù)據(jù)庫和云數(shù)據(jù)庫。在大數(shù)據(jù)處理與分析篇,介紹了大數(shù)據(jù)處理和分析的核心技術(shù)——MapReduce,然后,介紹了大數(shù)據(jù)時代兩種新興的數(shù)據(jù)分析技術(shù)——流計算和圖計算,最后簡單介紹了可視化技術(shù)。在大數(shù)據(jù)應(yīng)用篇,介紹了大數(shù)據(jù)在互聯(lián)網(wǎng)、生物醫(yī)學(xué)和物流等各個領(lǐng)域的典型應(yīng)用。

《大數(shù)據(jù)技術(shù)原理與應(yīng)用(第2版)》屬于入門級教材,它和進階級大數(shù)據(jù)教材《Spark編程基礎(chǔ)(Scala版)》[14]以及大數(shù)據(jù)實訓(xùn)案例系列教材一起構(gòu)成了可以滿足高校教學(xué)需求的大數(shù)據(jù)教材體系。

4.7 實驗環(huán)境搭建

在高校大數(shù)據(jù)教學(xué)過程中,實踐是很重要的環(huán)節(jié)。因此,很多高校在開設(shè)大數(shù)據(jù)課程時,不僅要選擇好的教材,同時也要選擇好的大數(shù)據(jù)實驗平臺??傮w而言,當(dāng)前國內(nèi)有以下幾種大數(shù)據(jù)實驗平臺方案。

(1)建設(shè)統(tǒng)一的大數(shù)據(jù)實驗機房

條件較好的高??梢越ㄔO(shè)統(tǒng)一的大數(shù)據(jù)機房,為師生提供大數(shù)據(jù)上機環(huán)境。機房建設(shè)的方案也各有不同,部分高校采用“云桌面”解決方案,還有一部分高校采用“小集群”解決方案。在“云桌面”解決方案中,需要在機房部署一個中央服務(wù)器,通過虛擬化技術(shù)可以構(gòu)建出多個虛擬化主機,學(xué)生在終端機(相當(dāng)于云桌面)上通過網(wǎng)絡(luò)連接到中央服務(wù)器,中央服務(wù)器會為其分配一個虛擬機,學(xué)生在虛擬機上完成各種實驗操作。在“小集群”解決方案中,可以為每個學(xué)生分配一臺物理計算機,然后,由3~5個學(xué)生組成一個小組,讓每個小組內(nèi)部的多臺計算機組建一個物理的集群,學(xué)生在集群中開展各種實驗。

(2)單機構(gòu)建實驗環(huán)境

單機構(gòu)建實驗環(huán)境主要是為了滿足教師和學(xué)生課后學(xué)習(xí)實踐大數(shù)據(jù)時的需求。因為機房統(tǒng)一上機的時間相對有限,大數(shù)據(jù)的學(xué)習(xí)還需要學(xué)生課后在自己的計算機上開展上機實踐。單機構(gòu)建大數(shù)據(jù)實驗環(huán)境可以采用“虛擬機”和“雙系統(tǒng)”兩種方式。在“虛擬機”方式中,需要啟動進入Windows系統(tǒng),在系統(tǒng)中安裝虛擬機軟件,比如VMWare或者VirtualBox,然后,在虛擬機軟件上安裝Linux操作系統(tǒng),再在Linux操作系統(tǒng)上安裝Hadoop等大數(shù)據(jù)相關(guān)軟件。若采用“雙系統(tǒng)”的方式,在開機啟動時,可以直接選擇進入Linux系統(tǒng),開展大數(shù)據(jù)實驗。

(3)實驗室多機構(gòu)建分布式環(huán)境

如果實驗室有多臺計算機可用,則可以利用這些機器構(gòu)建一個集群,實現(xiàn)真正的分布式環(huán)境,從而完成一些科研數(shù)據(jù)的處理分析。通過多機的分布式計算,可以大大提高科研數(shù)據(jù)分析的效率。

4.8 配套資源建設(shè)

課程配套資源的建設(shè)是打造一門優(yōu)質(zhì)課程的重要環(huán)節(jié)。為了方便高校教師開設(shè)大數(shù)據(jù)課程,提高學(xué)生的課程學(xué)習(xí)效果,筆者團隊制作了豐富的課程配套資源,包括講義PPT、習(xí)題、實驗手冊、技術(shù)博客和課程視頻等,并通過MOOC平臺發(fā)布。

表1 “大數(shù)據(jù)技術(shù)原理與應(yīng)用”課程內(nèi)容與學(xué)時安排

4.9 在線服務(wù)平臺

豐富的課程配套資源必須通過方便快捷的方式傳播給大數(shù)據(jù)學(xué)習(xí)者,只有這樣才能充分發(fā)揮配套學(xué)習(xí)資源的價值。為此,筆者團隊專門為課程配套建設(shè)了高校大數(shù)據(jù)課程公共服務(wù)平臺,旨在促進國內(nèi)高校大數(shù)據(jù)課程體系建設(shè),提高大數(shù)據(jù)課程教學(xué)水平,降低大數(shù)據(jù)課程學(xué)習(xí)門檻,提升學(xué)生課程學(xué)習(xí)效果。該平臺為全國高校教師和學(xué)生提供大數(shù)據(jù)教學(xué)資源一站式“免費”在線服務(wù),包括課程教材、講義PPT、課程習(xí)題、實驗指南、學(xué)習(xí)指南、備課指南、授課視頻和技術(shù)資料等。

4.10 線下培訓(xùn)和交流

具備合格的師資力量是各個高校開設(shè)大數(shù)據(jù)課程的前提條件。由于大數(shù)據(jù)知識體系較新,很多高校不具備大數(shù)據(jù)師資儲備。因此,筆者團隊通過“公益”師資培訓(xùn)、大型研討會、大數(shù)據(jù)公開課全國高校巡講等活動,向全國高校傳播大數(shù)據(jù)教學(xué)、普及大數(shù)據(jù)知識體系的同時,使不同高校教師互相分享教學(xué)理念和教學(xué)方法,共同推進中國高校大數(shù)據(jù)專業(yè)教學(xué)的發(fā)展。

5 結(jié)束語

大數(shù)據(jù)時代已經(jīng)全面開啟,高校大數(shù)據(jù)課程體系建設(shè)正在加速推進。目前,一些尚未開設(shè)大數(shù)據(jù)專業(yè)的高校已經(jīng)在計算機和軟件工程等專業(yè)中開設(shè)了大數(shù)據(jù)課程,以達到拓展學(xué)生知識結(jié)構(gòu)、增強人才核心競爭力的目的。而對于已經(jīng)開設(shè)了大數(shù)據(jù)專業(yè)的高校而言,更是把大數(shù)據(jù)課程作為核心課程進行重點建設(shè),一方面通過參加師資培訓(xùn)鍛煉教師隊伍,另一方面建設(shè)高水平的大數(shù)據(jù)實訓(xùn)實驗室,滿足大數(shù)據(jù)課程對實驗環(huán)境的要求。各所高校都在為如何做好大數(shù)據(jù)專業(yè)做出有益的嘗試和探索。筆者相信,未來的3~5年內(nèi),在全國高校大數(shù)據(jù)教育工作者和企業(yè)界的共同努力下,高校大數(shù)據(jù)課程體系會逐漸走向完善,高校大數(shù)據(jù)教學(xué)水平會不斷邁上新的臺階。

猜你喜歡
分布式課程體系教材
教材精讀
教材精讀
教材精讀
教材精讀
分布式光伏熱錢洶涌
能源(2017年10期)2017-12-20 05:54:07
以創(chuàng)新課程體系引領(lǐng)學(xué)生發(fā)展
分布式光伏:爆發(fā)還是徘徊
能源(2017年5期)2017-07-06 09:25:54
民法課程體系的改進和完善思路*——以中國政法大學(xué)的民法課程體系為例
基于DDS的分布式三維協(xié)同仿真研究
雷達與對抗(2015年3期)2015-12-09 02:38:50
加強青少年中醫(yī)傳統(tǒng)文化教育的必要性及其課程體系構(gòu)建
綦江县| 枣阳市| 张北县| 新巴尔虎左旗| 社旗县| 蒲江县| 钦州市| 东海县| 巩留县| 安岳县| 满城县| 淮安市| 获嘉县| 化州市| 北流市| 益阳市| 慈利县| 汶上县| 肇东市| 尖扎县| 大理市| 墨竹工卡县| 昭苏县| 洛隆县| 日土县| 烟台市| 孙吴县| 安顺市| 济阳县| 云林县| 江陵县| 普洱| 宁化县| 普定县| 济阳县| 错那县| 泰宁县| 上杭县| 德化县| 达拉特旗| 启东市|