張 華
大數(shù)據(jù)背景下獨(dú)立學(xué)院數(shù)據(jù)庫課程體系建設(shè)構(gòu)想
張 華
通過分析大數(shù)據(jù)時(shí)代數(shù)據(jù)庫新技術(shù)的特點(diǎn)和企業(yè)對新型數(shù)據(jù)庫人才的迫切需求,指出以關(guān)系型數(shù)據(jù)庫教學(xué)為主的數(shù)據(jù)庫課程體系已不能滿足大數(shù)據(jù)時(shí)代的人才培養(yǎng)需求。提出了針對獨(dú)立學(xué)院人才培養(yǎng)目標(biāo)的大數(shù)據(jù)時(shí)代數(shù)據(jù)庫課程體系建設(shè)新方案,指出了課程體系改革實(shí)施的保障條件,為大數(shù)據(jù)時(shí)代獨(dú)立學(xué)院數(shù)據(jù)庫課程體系改革提供了可行的思路和建議。
大數(shù)據(jù);數(shù)據(jù)庫課程;獨(dú)立學(xué)院
隨著信息技術(shù)的高速發(fā)展,人類已進(jìn)入大數(shù)據(jù)時(shí)代。大數(shù)據(jù)是指常規(guī)軟件工具難以捕捉、管理和分析的大容量數(shù)據(jù),由于缺少有效的分析工具和方法,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫已難以應(yīng)付以非結(jié)構(gòu)化數(shù)據(jù)為主的大數(shù)據(jù)。通過對海量數(shù)據(jù)的分析,發(fā)現(xiàn)新知識、創(chuàng)造新價(jià)值是研究大數(shù)據(jù)的意義所在?,F(xiàn)代企業(yè)的市場競爭日趨激烈,所面對的用戶數(shù)量和業(yè)務(wù)數(shù)據(jù)量與日激增,其業(yè)務(wù)系統(tǒng)日并發(fā)訪問管理、海量數(shù)據(jù)的存儲、復(fù)雜的系統(tǒng)架構(gòu)等問題給企業(yè)帶來了巨大的管理壓力[1]。如何使用計(jì)算機(jī)技術(shù)和軟件技術(shù),可靠地管理和存儲并高效地處理和分析海量數(shù)據(jù),實(shí)現(xiàn)云計(jì)算、企業(yè)計(jì)算等新的應(yīng)用,成為大數(shù)據(jù)時(shí)代數(shù)據(jù)庫人才需要解決的問題。以關(guān)系數(shù)據(jù)庫為主的獨(dú)立學(xué)院數(shù)據(jù)庫課程傳統(tǒng)教學(xué)體系已經(jīng)不能適應(yīng)新時(shí)代的人才要求。因此,針對大數(shù)據(jù)時(shí)代獨(dú)立學(xué)院軟件人才的培養(yǎng)目標(biāo),提出了數(shù)據(jù)庫課程體系建設(shè)新方案,指出了實(shí)施課程體系的保障條件。
目前,國外針對不同學(xué)院開展了不同方向的大數(shù)據(jù)課程體系建設(shè),如面向商學(xué)院、管理學(xué)院、財(cái)經(jīng)學(xué)院的大數(shù)據(jù)分析方向,面向計(jì)算機(jī)學(xué)院與軟件學(xué)院的大數(shù)據(jù)平臺方向,面向理學(xué)院的深度計(jì)算分析方向。本研究重點(diǎn)關(guān)注面向計(jì)算機(jī)學(xué)院與軟件學(xué)院的大數(shù)據(jù)平臺方向,包含信息結(jié)構(gòu)、定量方法、數(shù)據(jù)庫設(shè)計(jì)、信息系統(tǒng)設(shè)計(jì)與分析、IT戰(zhàn)略與管理、數(shù)據(jù)治理與安全、IT安全策略和步驟、商業(yè)智能中的數(shù)據(jù)挖掘設(shè)計(jì)和實(shí)現(xiàn)數(shù)據(jù)倉庫等課程內(nèi)容。目前,國內(nèi)大數(shù)據(jù)專業(yè)已在北京航空航天大學(xué)、西安電子科技大學(xué)軟件學(xué)院、西安交通大學(xué)軟件學(xué)院等院校展開了試點(diǎn)建設(shè)[2]。大數(shù)據(jù)專業(yè)主要從大數(shù)據(jù)應(yīng)用的3個(gè)主要層面(即大數(shù)據(jù)平臺架構(gòu)及搭建、海量數(shù)據(jù)分析與挖掘、數(shù)據(jù)應(yīng)用)整理核心技術(shù)以及大數(shù)據(jù)應(yīng)用中的各種典型問題。如分布式Hadoop集群和分布式Hbase集群的搭建和基準(zhǔn)測試、分布式文件存儲和分布式數(shù)據(jù)處理能力、大規(guī)模數(shù)據(jù)存儲、實(shí)時(shí)計(jì)算系統(tǒng)的規(guī)劃設(shè)計(jì)、實(shí)現(xiàn)一個(gè)基于Mapreduce的并行算法、部署Hive并實(shí)現(xiàn)一個(gè)數(shù)據(jù)庫的操作等,使學(xué)生具備大數(shù)據(jù)平臺架構(gòu)和高級分析能力,以及解決企業(yè)實(shí)際問題的能力。
傳統(tǒng)的數(shù)據(jù)庫課程體系以關(guān)系數(shù)據(jù)庫理論、設(shè)計(jì)和操作為主線[3],包括關(guān)系理論、關(guān)系代數(shù)、規(guī)范化設(shè)計(jì)、SQL應(yīng)用、儲存過程、函數(shù)、觸發(fā)器、事務(wù)與并發(fā)性、安全性及高級語言的開發(fā)等,主要針對結(jié)構(gòu)化數(shù)據(jù)存儲、實(shí)現(xiàn)數(shù)據(jù)共享、保障數(shù)據(jù)安全、高效檢索數(shù)據(jù)和處理數(shù)據(jù)。隨著云計(jì)算、大數(shù)據(jù)的興起,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫已難以應(yīng)對爆發(fā)式增長的以圖像、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)為主的海量數(shù)據(jù)。因此,在大數(shù)據(jù)背景下,數(shù)據(jù)庫課程教學(xué)必須引入非關(guān)系型數(shù)據(jù)庫的教學(xué)內(nèi)容,這是當(dāng)今用戶業(yè)務(wù)系統(tǒng)的迫切需求和云計(jì)算技術(shù)發(fā)展對信息化人才大量需求的必然結(jié)果[4]。
獨(dú)立學(xué)院的培養(yǎng)目標(biāo)是培養(yǎng)應(yīng)用型人才。大數(shù)據(jù)背景下,大數(shù)據(jù)課程體系將關(guān)系型數(shù)據(jù)庫技術(shù)與非關(guān)系型數(shù)據(jù)庫技術(shù)相結(jié)合,從大數(shù)據(jù)應(yīng)用的3個(gè)主要層面和大數(shù)據(jù)學(xué)習(xí)的4個(gè)階段進(jìn)行構(gòu)建[5]。
第1階段:大數(shù)據(jù)基礎(chǔ)階段。介紹大數(shù)據(jù)基礎(chǔ)知識、Linux系統(tǒng)基礎(chǔ)和Hadoop基礎(chǔ),其中,Hadoop基礎(chǔ)主要內(nèi)容包括Hadoop集群模式大數(shù)據(jù)搭建、分布式文件系統(tǒng)HDFS、Mapreduce思想。第2階段:大數(shù)據(jù)導(dǎo)入與存儲階段。介紹Sqoop、Hive、Hbase,其中,Sqoop作為關(guān)系型數(shù)據(jù)庫與Hadoop之間的橋梁,批量傳輸數(shù)據(jù),從關(guān)系型數(shù)據(jù)庫自然過渡到Hadoop平臺,在關(guān)系型數(shù)據(jù)庫與Hadoop之間游刃有余地進(jìn)行數(shù)據(jù)導(dǎo)入導(dǎo)出。Hive是基于Hadoop大數(shù)據(jù)平臺的數(shù)據(jù)倉庫,可以實(shí)現(xiàn)傳統(tǒng)數(shù)據(jù)倉庫中的絕大部分?jǐn)?shù)據(jù)處理、統(tǒng)計(jì)分析。Hbase列式存儲數(shù)據(jù)庫,提供了快速的查詢方式。第3階段:大數(shù)據(jù)實(shí)時(shí)計(jì)算與分析階段。介紹Spark,Spark是基于內(nèi)存計(jì)算的大數(shù)據(jù)計(jì)算引擎,內(nèi)容包括Spark配置和Spark大數(shù)據(jù)分析原理。第4階段:實(shí)戰(zhàn)案例應(yīng)用階段。
第3學(xué)期:操作系統(tǒng)基礎(chǔ)、數(shù)據(jù)庫系統(tǒng)原理課程。操作系統(tǒng)基礎(chǔ)課程介紹操作系統(tǒng)基本知識,為后續(xù)Linux課程奠定基礎(chǔ);數(shù)據(jù)庫系統(tǒng)原理課程介紹關(guān)系型數(shù)據(jù)庫基本知識,包括關(guān)系理論、關(guān)系代數(shù)、關(guān)系查詢SQL、函數(shù)依賴和關(guān)系的規(guī)范化、數(shù)據(jù)庫設(shè)計(jì)、函數(shù)、儲存過程、觸發(fā)器、事務(wù)與并發(fā)性、安全性及高級語言的開發(fā)等。第4學(xué)期:Linux操作系統(tǒng)、大數(shù)據(jù)管理技術(shù)課程。Linux操作系統(tǒng)課程介紹Linux操作系統(tǒng)基本原理、虛擬機(jī)使用與Linux搭建、文件命令、Shell腳本編程、Linux權(quán)限管理等基本的Linux使用知識;大數(shù)據(jù)管理技術(shù)課程包括大數(shù)據(jù)技術(shù)原理和思想、Hadoop 集群、HDFS、Mapreduce、Sqoop、Hbase、Hive。第5學(xué)期:Spark技術(shù)、數(shù)據(jù)挖掘算法課程。Spark技術(shù)課程介紹Spark配置及使用場景和Spark大數(shù)據(jù)分析原理;數(shù)據(jù)挖掘算法課程介紹海量數(shù)據(jù)挖掘常用算法(分類、聚類、相關(guān)規(guī)則、回歸等)。第6學(xué)期:實(shí)戰(zhàn)案例應(yīng)用課程。實(shí)戰(zhàn)案例應(yīng)用課程包括實(shí)際案例深入解析及綜合案例實(shí)踐操作。
除了以上課程體系內(nèi)容之外,還應(yīng)輔以相應(yīng)的前沿知識講座作為課程的有益補(bǔ)充。眾所周知,大數(shù)據(jù)技術(shù)是以Web搜索、電子商務(wù)、個(gè)性化信息服務(wù)、社交網(wǎng)絡(luò)為代表的新型網(wǎng)絡(luò)應(yīng)用的技術(shù)支撐,應(yīng)用的快速發(fā)展促使技術(shù)不斷創(chuàng)新[6]。在課程體系中加入大數(shù)據(jù)技術(shù)的最新研究趨勢和方向,有助于學(xué)生更好地理解所學(xué)知識體系以及進(jìn)行自我發(fā)展方向定位,為今后的學(xué)習(xí)和就業(yè)奠定堅(jiān)實(shí)的基礎(chǔ)。
大數(shù)據(jù)前沿知識講座應(yīng)根據(jù)課程體系的不同階段設(shè)置不同的講座內(nèi)容。如在第4學(xué)期學(xué)生真正接觸大數(shù)據(jù)時(shí),可以邀請數(shù)據(jù)分析的資深專家舉辦講座,從數(shù)據(jù)分析行業(yè)需要的專業(yè)素養(yǎng)和知識等方面介紹數(shù)據(jù)分析工作,使學(xué)生了解大數(shù)據(jù)技術(shù)的研究范圍和應(yīng)用方向。在第5學(xué)期學(xué)生掌握了一定的大數(shù)據(jù)技術(shù)后,結(jié)合Spark技術(shù)、數(shù)據(jù)挖掘算法課程,邀請專家、學(xué)者講授大數(shù)據(jù)時(shí)代面向各類應(yīng)用的海量數(shù)據(jù)管理與分析的前沿技術(shù)專題,使學(xué)生及時(shí)了解大數(shù)據(jù)庫技術(shù)在實(shí)際工作中的應(yīng)用,將所學(xué)知識與實(shí)際應(yīng)用結(jié)合,擴(kuò)展視野,開拓思路,增加學(xué)習(xí)的興趣和動(dòng)力。
數(shù)據(jù)庫課程體系改革根據(jù)大數(shù)據(jù)時(shí)代以數(shù)據(jù)為中心的新型應(yīng)用的新需求,增加了以解決集群環(huán)境下海量數(shù)據(jù)的設(shè)計(jì)、存儲和查詢?yōu)槟康牡姆顷P(guān)系型數(shù)據(jù)庫教學(xué)內(nèi)容,以及和實(shí)際應(yīng)用緊密相關(guān)的前沿知識講座。大數(shù)據(jù)背景下,數(shù)據(jù)庫課程體系改革針對獨(dú)立學(xué)院“面向應(yīng)用”的培養(yǎng)目標(biāo),對軟件專業(yè)本科生的數(shù)據(jù)庫課程教學(xué)進(jìn)行系統(tǒng)規(guī)劃。為了達(dá)到數(shù)據(jù)庫課程體系的改革目標(biāo),對人才培養(yǎng)方案的規(guī)劃、師資隊(duì)伍的專業(yè)素質(zhì)和硬件設(shè)備的升級改善提出了更高的要求。
第一,為保證課程體系改革的順利實(shí)施,對現(xiàn)有的人才培養(yǎng)方案進(jìn)行全局優(yōu)化。正確定位獨(dú)立學(xué)院軟件專業(yè)人才培養(yǎng)目標(biāo),并在此基礎(chǔ)上明確大數(shù)據(jù)時(shí)代數(shù)據(jù)庫課程的教學(xué)目標(biāo)。針對獨(dú)立學(xué)院培養(yǎng)應(yīng)用技術(shù)型人才的需要,從企業(yè)需求出發(fā),以滿足學(xué)生今后實(shí)際工作為目的,制定新的人才培養(yǎng)方案。教師要全面考慮所有專業(yè)課程設(shè)置,尤其要對數(shù)據(jù)庫課程群給予充分的重視。根據(jù)大數(shù)據(jù)課程體系,合理安排基礎(chǔ)課、專業(yè)課、先修課、后續(xù)課、實(shí)踐環(huán)節(jié)、前沿講座的教學(xué)時(shí)數(shù)和開課學(xué)期。
第二,課程體系改革對任課教師的大數(shù)據(jù)專業(yè)知識和實(shí)踐能力提出了更高的要求。長期以來,關(guān)系型數(shù)據(jù)庫在數(shù)據(jù)庫課程教學(xué)中占主導(dǎo)和統(tǒng)治地位,忽略了對其他類型數(shù)據(jù)庫的研究。課程體系改革增加了非關(guān)系型數(shù)據(jù)庫理論和實(shí)踐教學(xué)內(nèi)容,教師必須進(jìn)一步充實(shí)自己的業(yè)務(wù)素質(zhì),熟悉并掌握非關(guān)系型數(shù)據(jù)庫等新技術(shù),巧妙過渡和融合關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫技術(shù)。教師可以通過參與公司項(xiàng)目培訓(xùn)和自主學(xué)習(xí)相結(jié)合的方式來提升自身素質(zhì)。學(xué)校可以從企業(yè)聘請有經(jīng)驗(yàn)的從業(yè)人員來補(bǔ)充實(shí)踐教學(xué)和前沿講座部分的師資隊(duì)伍,提高新課程體系下的理論和實(shí)踐教學(xué)水平。
第三,實(shí)驗(yàn)教學(xué)是大數(shù)據(jù)時(shí)代數(shù)據(jù)庫人才培養(yǎng)的重要環(huán)節(jié),大數(shù)據(jù)實(shí)驗(yàn)教學(xué)需要可供部署海量數(shù)據(jù)管理平臺的分布式集群以及相應(yīng)的軟件配置。目前,大部分學(xué)校實(shí)驗(yàn)室的軟、硬件條件只能滿足關(guān)系型數(shù)據(jù)庫的教學(xué)需要,大數(shù)據(jù)實(shí)驗(yàn)室除了包含學(xué)生PC客戶端,還應(yīng)具備虛擬實(shí)驗(yàn)環(huán)境、Hadoop服務(wù)器集群、實(shí)驗(yàn)數(shù)據(jù)存儲、數(shù)據(jù)挖掘算法和大數(shù)據(jù)分析執(zhí)行環(huán)境等[7]。因此,學(xué)校應(yīng)不斷完善實(shí)驗(yàn)教學(xué)設(shè)備,為課程體系改革的順利實(shí)施提供相應(yīng)的軟、硬件平臺,為學(xué)生創(chuàng)造優(yōu)越的實(shí)驗(yàn)環(huán)境。
大數(shù)據(jù)時(shí)代的變革影響著社會(huì)的各個(gè)行業(yè),進(jìn)而也影響了為各行業(yè)輸送人才的高校專業(yè)課程教學(xué),尤其是軟件專業(yè)的數(shù)據(jù)庫課程。為了適應(yīng)大數(shù)據(jù)時(shí)代企業(yè)對數(shù)據(jù)庫人才的新需求,分析了數(shù)據(jù)庫課程體系改革的必要性,為獨(dú)立學(xué)院軟件專業(yè)本科生的大數(shù)據(jù)課程體系建設(shè)提出了構(gòu)想。大數(shù)據(jù)課程體系改革的順利實(shí)施需要系統(tǒng)合理的人才培養(yǎng)方案、具有大數(shù)據(jù)認(rèn)知能力的高素質(zhì)專業(yè)教師隊(duì)伍、完善的實(shí)驗(yàn)教學(xué)平臺的保駕護(hù)航,更需要教師在實(shí)際教學(xué)中不斷摸索、總結(jié)、完善課程體系內(nèi)容。
[1]邱勝海,高成沖,王云霞,等.大數(shù)據(jù)時(shí)代非關(guān)系型數(shù)據(jù)庫教學(xué)與實(shí)驗(yàn)改革探索[J].電腦知識與技術(shù)(學(xué)術(shù)交流),2013(11).
[2]張曉芳,王芬,黃曉濤.國內(nèi)外大數(shù)據(jù)課程體系與專業(yè)建設(shè)調(diào)查研究[C].Shanghai:2nd international conference on education,management and social science,2014:409-412.
[3]岳昆,陳紅梅,王麗珍.大數(shù)據(jù)時(shí)代本科數(shù)據(jù)庫課程體系改革設(shè)想[J].計(jì)算機(jī)教育,2015(11).
[4]李戰(zhàn)懷,王國仁,周傲英.從數(shù)據(jù)庫視角解讀大數(shù)據(jù)的研究進(jìn)展與趨勢[J].計(jì)算機(jī)工程與科學(xué),2013(10).
[5]周民,王建業(yè),楊超峰.大數(shù)據(jù)背景下數(shù)據(jù)庫技術(shù)類課程體系及教學(xué)模式改革研究與實(shí)踐[J].電腦知識與技術(shù)(學(xué)術(shù)交流),2015(7).
[6]尹志宇,張林偉,解春燕.“數(shù)據(jù)庫”課程的問題驅(qū)動(dòng)和項(xiàng)目驅(qū)動(dòng)教學(xué)法[J].教育教學(xué)論壇,2013(3).
[7]吳明念.基于應(yīng)用型本科院校的大數(shù)據(jù)實(shí)驗(yàn)室建設(shè)探究[J].電腦知識與技術(shù),2015(16).
G642
A
1673-1999(2017)12-0125-03
張華(1980—),女,碩士,吉林建筑大學(xué)城建學(xué)院講師,研究方向?yàn)榇髷?shù)據(jù)和數(shù)據(jù)挖掘。
2017-09-24
吉林省教育科學(xué)“十三五”規(guī)劃2017年度一般規(guī)劃課題“大數(shù)據(jù)背景下獨(dú)立學(xué)院數(shù)據(jù)庫類課程體系建設(shè)及教學(xué)改革研究”(GH170938)。
(編輯:劉姝)