楊文 董國芃
哈爾濱職業(yè)技術(shù)學(xué)院
?
高職院校為例大數(shù)據(jù)應(yīng)用研究
楊文董國芃
哈爾濱職業(yè)技術(shù)學(xué)院
摘要:大數(shù)據(jù)時(shí)代已經(jīng)來臨,它并不是一本書中的某種概念。它是切實(shí)存在于人們的工作與生活當(dāng)中的。通過對(duì)大數(shù)據(jù)的搜集、整理、科學(xué)管理與開發(fā)能夠讓大數(shù)據(jù)在各個(gè)行業(yè)綻放光彩。大數(shù)據(jù)離不開計(jì)算機(jī)技術(shù)。在云計(jì)算的幫助下,大數(shù)據(jù)才能夠更好的發(fā)揮作用。高職院校也一樣可以在大數(shù)據(jù)的幫助下,對(duì)高職院校的發(fā)展,高職院校的教學(xué)等等多個(gè)方面進(jìn)行決策。本文就大數(shù)據(jù)對(duì)于高職院校發(fā)展進(jìn)行了相關(guān)的闡述。
大數(shù)據(jù)一詞,最早出現(xiàn)在一本小說當(dāng)中。但是今天人們所說的大數(shù)據(jù),并不等同于小說中的臆測。大數(shù)據(jù)概念深入淺出的說,突出在大上,范圍廣、數(shù)據(jù)多。也因此使得要很好的使用大數(shù)據(jù)需要不同的分析和處理模式。然后發(fā)現(xiàn)數(shù)據(jù)的特性。從而讓數(shù)據(jù)的應(yīng)用高效科學(xué),產(chǎn)生信息價(jià)值。并不是說,掌握的數(shù)據(jù)量大,就掌握了大數(shù)據(jù)的精髓。而是把大量數(shù)據(jù)進(jìn)行深入的處理,找出數(shù)據(jù)的規(guī)律、密度、類型等特性。才能讓大數(shù)據(jù)產(chǎn)生相應(yīng)的價(jià)值。從技術(shù)角度而言,大數(shù)據(jù)依附于計(jì)算機(jī)技術(shù)?;蛘呤崭右栏接谛碌摹霸朴?jì)算”能力。這些大的數(shù)據(jù)不是通過單一的客戶端分析形成的,而應(yīng)該是通過網(wǎng)絡(luò)服務(wù)器。多臺(tái)服務(wù)器對(duì)數(shù)據(jù)進(jìn)行處理。從而實(shí)現(xiàn)價(jià)值的挖掘。在大數(shù)據(jù)的處理過程中,數(shù)據(jù)庫技術(shù)、數(shù)據(jù)挖掘、分布式網(wǎng)絡(luò)常常被應(yīng)用到。同時(shí)數(shù)據(jù)萬挖掘還可以應(yīng)用于各個(gè)領(lǐng)域。在高職院校發(fā)展中也是如此。
2.1高職院校數(shù)據(jù)信息應(yīng)用狀態(tài)
高職院校每年在校生都達(dá)到數(shù)千名。學(xué)生的在校生活、畢業(yè)走向、個(gè)人信息等都形成了海量的數(shù)據(jù)信息。而這些信息卻并沒有被高效的科學(xué)的應(yīng)用。高職院校只是簡單的保存各個(gè)學(xué)生和教師的基本信息,在固定的畢業(yè)和職稱評(píng)定環(huán)節(jié)才拿出信息進(jìn)行比對(duì)。所以,數(shù)據(jù)信息雖然在高職院校中也以網(wǎng)絡(luò)或者計(jì)算機(jī)的形式得到保存,卻只能說是靜態(tài)的存儲(chǔ)。無法體現(xiàn)大數(shù)據(jù)的作用。
2.2大數(shù)據(jù)在高職院校的具體應(yīng)用領(lǐng)域
其實(shí),在高職院校當(dāng)中,大數(shù)據(jù)發(fā)揮重要作用。一些院校招生情況不理想??赡苁且?yàn)閷I(yè)設(shè)置不合理、知名度不響、學(xué)生就業(yè)狀況差造成的。而學(xué)生在畢業(yè)時(shí),學(xué)校只是簡單的統(tǒng)計(jì)畢業(yè)率,哪些專業(yè)就業(yè)率高。來幫助分析專業(yè)的設(shè)置和預(yù)測招生情況。其實(shí)學(xué)校可以進(jìn)行大數(shù)據(jù)管理,分類細(xì)化。不同系別的不同專業(yè)畢業(yè)走向如何、就業(yè)率高的專業(yè)的學(xué)生特點(diǎn)、就業(yè)同學(xué)的共同屬性。甚至社會(huì)調(diào)研中企業(yè)對(duì)學(xué)生性格、職業(yè)基本素質(zhì)的要求等等。都是高職院校提高就業(yè)率,打響知名度的有效手段。
2.3從高職管理方面,大數(shù)據(jù)也能發(fā)揮重要作用
高職學(xué)生管理涉及各個(gè)方面,這里以幾個(gè)重要方面為例進(jìn)行介紹。圖書館、電子閱覽室是學(xué)生們獲取知識(shí)的一個(gè)主要渠道。但很多時(shí)候會(huì)出現(xiàn)學(xué)生想借閱的書籍長期不足,其它書籍無人問津的狀況。這可以利用數(shù)據(jù)分析,來對(duì)熱門書籍特性進(jìn)行統(tǒng)計(jì)。購買相關(guān)數(shù)據(jù)特性符合的數(shù)據(jù)。更改不同數(shù)據(jù)的借閱時(shí)間。形成高效的數(shù)據(jù)利用率。其次,從教師教學(xué)角度來分析。不同教師采用的教學(xué)手段與學(xué)生成績水平、技能掌握的相關(guān)關(guān)聯(lián)規(guī)則分析,可以幫助教師合理的采用教學(xué)方法。控制數(shù)量和使用科目范疇,得到最佳的教學(xué)效果。
首先,數(shù)據(jù)抽取和集成要解決的主要問題就是收集各種碎片化的數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行清洗,保證數(shù)據(jù)質(zhì)量,同時(shí)根據(jù)時(shí)間演進(jìn)不斷更新數(shù)據(jù)模式,確定數(shù)據(jù)實(shí)體及其之間的關(guān)系,最終將數(shù)據(jù)按照統(tǒng)一的格式進(jìn)行存儲(chǔ),以便提供給上層用來進(jìn)行數(shù)據(jù)分析。目前高職已經(jīng)基本建立了完備的管理信息系統(tǒng)、學(xué)習(xí)管理系統(tǒng)等,在統(tǒng)一數(shù)據(jù)中心中積累了大量的結(jié)構(gòu)化數(shù)據(jù);同時(shí)各類系統(tǒng)中還散布著大量的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)經(jīng)過一定處理后,可以轉(zhuǎn)化為更容易分析使用的結(jié)構(gòu)化數(shù)據(jù)。其次,數(shù)據(jù)分析經(jīng)過抽取和集成得到的數(shù)據(jù),需要經(jīng)過分析挖掘其潛在的價(jià)值。傳統(tǒng)的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等方法仍然可以用來對(duì)數(shù)據(jù)進(jìn)行分析,只是需要根據(jù)大數(shù)據(jù)的特征進(jìn)行調(diào)整。首先,為了實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的分析,需要依Map/Reduce 模型,將數(shù)據(jù)拆分處理,然后再將結(jié)果匯總,一個(gè)完整的分析可能會(huì)經(jīng)過多層類似的處理過程;最后,數(shù)據(jù)展示。數(shù)據(jù)分析得到的分析結(jié)果,需要以直觀可理解的方式呈獻(xiàn)給最終用戶,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)分析產(chǎn)生的結(jié)果有可能也是非常大量的,且結(jié)果之間的關(guān)聯(lián)關(guān)系復(fù)雜、數(shù)據(jù)維度更多,數(shù)據(jù)可視化技術(shù)通過更加適合人類思維的圖形化的方式展示數(shù)據(jù)分析結(jié)果,已經(jīng)被證明是展示數(shù)據(jù)分析結(jié)果非常有效的方法。高職院校大數(shù)據(jù)應(yīng)用脫離不開數(shù)據(jù)的采集、分析和歸類總結(jié)過程。
總之,大數(shù)據(jù)時(shí)代來臨,數(shù)據(jù)通過云計(jì)算和相關(guān)技術(shù)的幫助,產(chǎn)生了信息的價(jià)值。利用好這些價(jià)值無論實(shí)在商業(yè)經(jīng)營和科學(xué)管理方面都有重要作用。高職院校計(jì)算機(jī)專業(yè)應(yīng)重視大數(shù)據(jù)作用。讓大數(shù)據(jù)為高職發(fā)展發(fā)揮作用。
參考文獻(xiàn)
[1]涂新莉,劉波,林偉偉.大數(shù)據(jù)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2014(06)
[2]顧濤.基于大數(shù)據(jù)的競爭情報(bào)協(xié)作分析研究[J].情報(bào)科學(xué),2013(12)
關(guān)鍵字:大數(shù)據(jù) 云計(jì)算 數(shù)據(jù)分析 學(xué)生成績 就業(yè)競爭