李燕萍
(泉州工藝美術(shù)職業(yè)學(xué)院,福建 德化 362500)
?
大數(shù)據(jù)背景下高校信息化建設(shè)的思考
李燕萍
(泉州工藝美術(shù)職業(yè)學(xué)院,福建 德化 362500)
摘要:以近年來快速發(fā)展的大數(shù)據(jù)為背景,介紹大數(shù)據(jù)的內(nèi)涵及關(guān)鍵技術(shù),結(jié)合高校對數(shù)據(jù)資源、信息化建設(shè)的需求,就未來高校信息化、數(shù)據(jù)化發(fā)展趨勢,分析高校建立大數(shù)據(jù)和基于大數(shù)據(jù)面向全校師生提供在線教學(xué)、科學(xué)化管理、個(gè)性化服務(wù)的綜合服務(wù)平臺(tái)遇到的問題、挑戰(zhàn)和機(jī)遇。并結(jié)合大數(shù)據(jù)技術(shù)、云技術(shù)、物聯(lián)網(wǎng)等對高校信息化建設(shè)的影響提出初步探討。
關(guān)鍵詞:大數(shù)據(jù);高校信息化;數(shù)據(jù)化
近年來,隨著以微論壇、微博、微信、微社區(qū)為代表的新媒體不斷涌現(xiàn),特別是大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算等新興技術(shù)的相續(xù)出現(xiàn) ,引發(fā)了數(shù)據(jù)規(guī)模的爆炸式增長,形成數(shù)據(jù)海嘯,致使各行各業(yè)都陸續(xù)開始關(guān)注大數(shù)據(jù)問題。最早提出“大數(shù)據(jù)”時(shí)代到來的是全球知名咨詢公司麥肯錫,麥肯錫認(rèn)為“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。”[1]我國教育部在《現(xiàn)代職業(yè)教育體系建設(shè)規(guī)劃(2014—2020年)》中明確指出:加強(qiáng)職業(yè)教育數(shù)字化資源平臺(tái)建設(shè)……到2020年,數(shù)字化資源覆蓋所有專業(yè)。建立全國職業(yè)教育數(shù)字資源共建共享聯(lián)盟……推動(dòng)建設(shè)面向全社會(huì)的優(yōu)質(zhì)數(shù)字化教學(xué)資源庫。
大數(shù)據(jù)科學(xué)家JohnRauser提到一個(gè)簡單的定義:大數(shù)據(jù)就是任何超過了一臺(tái)計(jì)算機(jī)處理能力的龐大數(shù)據(jù)量[2]。大數(shù)據(jù)(Big Data)是指所采集、存儲(chǔ)、管理的海量數(shù)據(jù)極大超出了常用數(shù)據(jù)庫或其他軟件在其運(yùn)行時(shí)間內(nèi)能夠存儲(chǔ)、管理和處理能力的數(shù)據(jù)集,是指通過新信息技術(shù)分析處理能夠挖掘數(shù)據(jù)內(nèi)涵價(jià)值,可作為決策提供數(shù)據(jù)支撐信息資產(chǎn)。
(一)大數(shù)據(jù)(Big Data)的六個(gè)(5V1C)主要特征
1.海量數(shù)據(jù)(Volumes)。從TB級別,躍升到PB(1PB=1024TB)級別,甚至EB(EB=1024PB)或ZB (ZB=1024EB)或YB(YB=1024ZB)或BB(BB=1024YB)的規(guī)模[3]。
2.數(shù)據(jù)類型繁多(Variety)。是數(shù)據(jù)來自多種數(shù)據(jù)源,囊括了半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)類型和格式越來越多,包括電子郵件、文檔、網(wǎng)頁、視頻、語音、圖像、地理位置、交易數(shù)據(jù)及傳感器、智能設(shè)備等。
3.速度與時(shí)效(Velocity)。新聞是數(shù)據(jù)源之一,新聞具有時(shí)效性,有它產(chǎn)生的時(shí)間和“年齡”,所有的數(shù)據(jù)源都跟新聞?lì)愃?,有它產(chǎn)生的時(shí)間及“年齡”,不同的時(shí)間點(diǎn)數(shù)據(jù)源的價(jià)值取向不同。有些數(shù)據(jù)高速產(chǎn)生,但幾秒后就失去意義。大數(shù)據(jù)要求在非常短的時(shí)間內(nèi)對大量的數(shù)據(jù)實(shí)時(shí)高速分析處理。
4.真實(shí)性(Veracity)。真實(shí)數(shù)據(jù)來源,是分析挖掘數(shù)據(jù)價(jià)值的基礎(chǔ),是獲取真實(shí)有效知識(shí)和思維的重要因素之一,是制定有效決策或策略重要保障。
5.價(jià)值(Value)。大數(shù)據(jù)最核心、最重要的特性是價(jià)值。海量數(shù)據(jù)僅存放在存儲(chǔ)介質(zhì)里,數(shù)據(jù)沒有任何價(jià)值,只有對海量數(shù)據(jù)進(jìn)行數(shù)據(jù)分析、數(shù)據(jù)挖掘,才能發(fā)現(xiàn)海量數(shù)據(jù)中蘊(yùn)含的價(jià)值,數(shù)據(jù)的價(jià)值密度較低。
6.數(shù)據(jù)的復(fù)雜性(Complexity)。海量的數(shù)據(jù),來源渠道多種多樣,數(shù)據(jù)的來源有互聯(lián)網(wǎng)數(shù)據(jù)、即時(shí)通信數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)、機(jī)器數(shù)據(jù)、傳感器數(shù)據(jù)、可穿戴設(shè)備數(shù)據(jù)、個(gè)性化數(shù)據(jù)等。
(二)大數(shù)據(jù)的核心技術(shù)
由于大數(shù)據(jù)具有大規(guī)模、異構(gòu)、多源等特點(diǎn),大數(shù)據(jù)技術(shù)與傳統(tǒng)的數(shù)據(jù)處理技術(shù)有所不同,大數(shù)據(jù)技術(shù)通過高效、實(shí)時(shí)的采集多種多樣的數(shù)據(jù)源并存儲(chǔ)于存儲(chǔ)介質(zhì)中、通過對采集的海量數(shù)據(jù)實(shí)時(shí)的分析、挖掘、提煉數(shù)據(jù)中蘊(yùn)含的價(jià)值及潛在信息。在大數(shù)據(jù)處理的每一個(gè)環(huán)節(jié),都出現(xiàn)了許多針對大數(shù)據(jù)獨(dú)特需求的新興技術(shù)。
1.數(shù)據(jù)采集。通過各類信息化或智能化系統(tǒng)數(shù)據(jù)、用戶個(gè)性數(shù)據(jù)、社交網(wǎng)絡(luò)交互數(shù)據(jù)、各類日志數(shù)據(jù)、各種傳感器數(shù)據(jù)、射頻數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)及移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)等采集的各種類型的結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化的海量數(shù)據(jù)[4]。
2.數(shù)據(jù)預(yù)處理。主要完成對已采集數(shù)據(jù)的辨析、分類、抽取、清洗等操作。
3.數(shù)據(jù)存儲(chǔ)。把采集到的數(shù)據(jù)存儲(chǔ)起來,建立相應(yīng)的數(shù)據(jù)庫,使用分布式文件系統(tǒng)并進(jìn)行管理和調(diào)用。
4.數(shù)據(jù)分析。對海量數(shù)據(jù)源進(jìn)行實(shí)時(shí)高效的數(shù)據(jù)分析、挖掘、發(fā)現(xiàn)數(shù)據(jù)源背后蘊(yùn)含的信息源,再對信息源提煉出知識(shí),進(jìn)而研究事物發(fā)展的規(guī)律和趨勢,可創(chuàng)造出巨大的商業(yè)價(jià)值和社會(huì)價(jià)值。
5.數(shù)據(jù)挖掘。從大量數(shù)據(jù)中通過各種算法自動(dòng)抽取模式、關(guān)聯(lián)、變化、異常和有意義的結(jié)構(gòu),尋找其規(guī)律的技術(shù),是數(shù)據(jù)庫技術(shù)、統(tǒng)計(jì)學(xué)、人工智能技術(shù)的綜合。
校園網(wǎng)和校園辦公系統(tǒng)已成高?;ヂ?lián)網(wǎng)公共服務(wù)體系的最為重要的組成部分。隨著互聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)的不斷發(fā)展及技術(shù)的成熟,大數(shù)據(jù)時(shí)代已經(jīng)來臨,高校擁有自己的大數(shù)據(jù)逐漸成為現(xiàn)實(shí),高校信息化的建設(shè)也越來越重要,通過信息化促進(jìn)高校管理和服務(wù)的升級,實(shí)現(xiàn)高校信息化、數(shù)字化,搭建高校互聯(lián)網(wǎng)信息服務(wù)平臺(tái)。
(一)對高校信息化保障機(jī)制及人才的挑戰(zhàn)
在大數(shù)據(jù)時(shí)代前高校信息化追求系統(tǒng)的易用性、穩(wěn)定性、獨(dú)立性,孤立的以單一部門業(yè)務(wù)需求規(guī)劃建設(shè)系統(tǒng),使軟件、硬件、數(shù)據(jù)庫、信息系統(tǒng)等相分離,獨(dú)立支撐各業(yè)務(wù)系統(tǒng),信息化的建設(shè)缺乏統(tǒng)一規(guī)劃,缺乏頂層設(shè)計(jì)、政策性保障措施、信息化部門、專業(yè)人才和資金的投入。
(二)對校園新舊系統(tǒng)系統(tǒng)集成和數(shù)據(jù)集成的挑戰(zhàn)
大數(shù)據(jù)時(shí)代,數(shù)據(jù)即是資產(chǎn),高校匯聚著大量數(shù)據(jù),高校從海量數(shù)據(jù)中提取價(jià)值水平高低直接反映一個(gè)高校的信息化水平高低。由于之前高校信息化中缺乏統(tǒng)一規(guī)劃,雖建立了校園網(wǎng)站、圖書館管理系統(tǒng)、教務(wù)系統(tǒng)、一卡通系統(tǒng)等眾多的業(yè)務(wù)系統(tǒng),但各系統(tǒng)間數(shù)據(jù)沒有統(tǒng)一規(guī)范、各系統(tǒng)軟硬件都獨(dú)立運(yùn)行,數(shù)據(jù)無法匯聚,形成了信息孤島。高校信息化要求信息化系統(tǒng)與校內(nèi)現(xiàn)有應(yīng)用系統(tǒng)無痕互聯(lián)互通,數(shù)據(jù)共享,獲取記錄更多的數(shù)據(jù)源,為高校大數(shù)據(jù)提供真實(shí)有效的數(shù)據(jù)源。
(三)對校園數(shù)據(jù)采集和數(shù)據(jù)挖掘的挑戰(zhàn)
高校通過各種應(yīng)用系統(tǒng)、傳感器、感應(yīng)器等工具采集各類數(shù)據(jù),并逐步將信息數(shù)字化。而在數(shù)據(jù)采集的中需要確保數(shù)據(jù)的真實(shí)性、時(shí)效性,預(yù)防人為對數(shù)據(jù)的篡改及破壞。另一方面采集的海量數(shù)據(jù)可以直接用的有價(jià)值的信息較少,而且數(shù)據(jù)結(jié)構(gòu)類型繁多,需要將預(yù)先非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),在數(shù)據(jù)格式轉(zhuǎn)化的過程中會(huì)丟失部分源數(shù)據(jù)蘊(yùn)含的信息或關(guān)系,對數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性有所影響,會(huì)削弱數(shù)據(jù)的價(jià)值。所以對大數(shù)據(jù)的分析、挖掘要盡可能從數(shù)據(jù)源中分析提取信息,避免數(shù)據(jù)分析加工挖掘過程中的失真。高校信息化部門要強(qiáng)化數(shù)據(jù)分析和數(shù)據(jù)挖掘的能力。
(四)對校園信息安全帶來的挑戰(zhàn)
在校園信息化采集的海量數(shù)據(jù)中包含隱私數(shù)據(jù)、機(jī)密數(shù)據(jù)、敏感數(shù)據(jù)等,數(shù)據(jù)是高校的重要資產(chǎn)。大數(shù)據(jù)時(shí)期,若數(shù)據(jù)被篡改或破壞,將直接影響到數(shù)據(jù)的真實(shí)性,影響數(shù)據(jù)分析挖掘結(jié)果的可用性及是否有價(jià)值,將會(huì)給高校的決策帶來巨大的影響。若數(shù)據(jù)泄露,將會(huì)給高校及師生帶來極大的隱患或損失。所以,高校信息化如何確保數(shù)據(jù)信息的安全,是信息化建設(shè)中必須解決的一個(gè)難題,涉及到網(wǎng)絡(luò)安全、加密技術(shù)、權(quán)限管理、用戶使用習(xí)慣等方面。
隨著云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)的發(fā)展和高校服務(wù)意識(shí)的提升,建設(shè)一個(gè)基于“一體化戰(zhàn)略”,以高校業(yè)務(wù)流暢性為基礎(chǔ),建立共享數(shù)據(jù)之上,融合硬件、軟件、服務(wù)、數(shù)據(jù)為一體,面向全校師生提供在線學(xué)習(xí)、科學(xué)化管理和個(gè)性化服務(wù)的高校信息化服務(wù)平臺(tái),是高校信息發(fā)展的趨勢。
(一)整體規(guī)劃、統(tǒng)一部署、分級把關(guān)
高校信息化需要成立信息化領(lǐng)導(dǎo)小組及信息化部門,為校園信息化一體化戰(zhàn)略提供保障,由領(lǐng)導(dǎo)小組進(jìn)行頂層設(shè)計(jì)、統(tǒng)一規(guī)劃、統(tǒng)一部署,制定政策性保障措施;由信息化部門落實(shí)信息化的方案和詳細(xì)實(shí)施步驟;由各部門按照信息化部的要求按照規(guī)范整理各類有效數(shù)據(jù)、檔案、師生信息等,為校園信息化初始數(shù)據(jù)的獲得與導(dǎo)入提供基礎(chǔ)保障;解決好信息化系統(tǒng)與原有系統(tǒng)的互聯(lián)互通和數(shù)據(jù)共享,消滅信息孤島。
(二)加快“數(shù)字化”向“數(shù)據(jù)化”轉(zhuǎn)變,建立基于云技術(shù)的數(shù)據(jù)中心
由于早期高校缺乏信息化的意識(shí),缺乏頂層設(shè)計(jì),缺乏統(tǒng)一規(guī)劃部署,數(shù)據(jù)缺乏規(guī)范,各業(yè)務(wù)系統(tǒng)獨(dú)立運(yùn)行,關(guān)聯(lián)度極差。通過建立基于云技術(shù)之上的大數(shù)據(jù)存儲(chǔ)中心,在校園網(wǎng)絡(luò)基礎(chǔ)上與物聯(lián)網(wǎng)結(jié)合,在全校范圍部署各類數(shù)據(jù)采集器(如傳感器、感應(yīng)器等)實(shí)時(shí)采集人員、設(shè)備、購物、餐飲、學(xué)習(xí)、交通等各種信息,將信息化系統(tǒng)與原有系統(tǒng)互聯(lián)互通,共享數(shù)據(jù),并獲取導(dǎo)入各系統(tǒng)積累的數(shù)據(jù)及其他可批量初始化的數(shù)據(jù)到數(shù)據(jù)中心,完成“數(shù)字化”向“數(shù)據(jù)化”的轉(zhuǎn)變,建立面向全校師生提供在線教學(xué)、在線課程、科學(xué)化管理和個(gè)性化服務(wù)的高校信息化服務(wù)平臺(tái)。
(三)建立基于大數(shù)據(jù)的信息安全體系
在大數(shù)據(jù)時(shí)代,海量數(shù)據(jù)包含隱私數(shù)據(jù)、機(jī)密數(shù)據(jù)、敏感數(shù)據(jù)等,數(shù)據(jù)安全變得至關(guān)重要。信息安全涉及到網(wǎng)絡(luò)安全、加密技術(shù)、數(shù)據(jù)識(shí)別技術(shù)、管理制度、權(quán)限管理、用戶認(rèn)證等方方面面。在校園信息化的過程中,需要建立基于大數(shù)據(jù)的信息安全預(yù)防體系。
首先是建立數(shù)據(jù)采集設(shè)備或軟件的監(jiān)測體系,對所有的采集設(shè)備和軟件進(jìn)行唯一標(biāo)識(shí)及身份認(rèn)證,確保采集設(shè)備或軟件的安全性,并對采集設(shè)備或軟件的各項(xiàng)安全指標(biāo)進(jìn)行實(shí)時(shí)監(jiān)測分析,確保設(shè)備或軟件的正常運(yùn)行,確保數(shù)據(jù)源的真實(shí)性、準(zhǔn)確性;其次是建立校園網(wǎng)的用戶和設(shè)備的監(jiān)測體系,加強(qiáng)校園網(wǎng)用戶登錄的認(rèn)證體系,對校園網(wǎng)用戶或終端的異常數(shù)據(jù)、異常行為進(jìn)行監(jiān)測分析,避免或及時(shí)發(fā)現(xiàn)校園網(wǎng)內(nèi)的不安全用戶及網(wǎng)絡(luò)病毒;再次,加強(qiáng)校園網(wǎng)內(nèi)部監(jiān)控,完善網(wǎng)絡(luò)管理、應(yīng)急、數(shù)據(jù)備份等制度,避免校內(nèi)管理制度的不完善而存在的安全隱患。信息安全體系的防護(hù)需要不斷的改進(jìn),不斷的完善,實(shí)現(xiàn)基于互聯(lián)網(wǎng)思維的信息安全體系建設(shè)思路。
(四)加快培養(yǎng)高校信息化團(tuán)隊(duì)及專業(yè)人才
在大數(shù)據(jù)時(shí)代,高校的信息化建設(shè)需要依托專業(yè)的第三方服務(wù)機(jī)構(gòu),信息化系統(tǒng)的運(yùn)營管理、數(shù)據(jù)分析等需要依托校內(nèi)信息化部門及信息化專業(yè)人才。第三服務(wù)機(jī)構(gòu)需要對高校信息化團(tuán)隊(duì)進(jìn)行循序漸進(jìn)的培訓(xùn),確保信息化團(tuán)隊(duì)全面了解信息化系統(tǒng)并掌握系統(tǒng)各模塊的使用,同時(shí)高校需要挑選兩至三人全面深入地參與信息化系統(tǒng)的建設(shè)、部署、實(shí)施以便全面掌握信息化系統(tǒng)。專業(yè)技術(shù)人才的短缺制約著校園信息化的進(jìn)度,因此適當(dāng)?shù)囊雽I(yè)技術(shù)型人才,培養(yǎng)對高校海量數(shù)據(jù)的管理、分析、挖掘等方面的信息化專業(yè)人才,對高校的信息化、智慧化建設(shè)具有非常重要意義。
高校信息化、智慧化是一把手工程,是全面系統(tǒng)工程,涉及到高校的各個(gè)部門、全體師生。高校信息化的建設(shè)離不開全體師生、各職能部門的參與。必須在信息化領(lǐng)導(dǎo)小組帶領(lǐng)下,以信息化部門為主導(dǎo),各部門全面參與、積極配合下才能有效地完成高校的信息化。隨著高校信息化進(jìn)程的推進(jìn),它將改變著高校師生生活方式、思維模式,引領(lǐng)校園生活新變化,極速提高高校教學(xué)、管理、服務(wù)等效率和水平。
參考文獻(xiàn):
[1]若英.如何理解“大數(shù)據(jù)時(shí)代”[J].紅旗期刊,2013(02):88-89.
[2]張心源.大數(shù)據(jù)的概念、技術(shù)及應(yīng)用[J].創(chuàng)新科技,2013(18):76-77.
[3]宗威.大數(shù)據(jù)時(shí)代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J].西安交通大學(xué)學(xué)報(bào),2013(10):101-102.
[4]秦曉珠.大數(shù)據(jù)知識(shí)服務(wù)的為涵、典型特征及概念模型[J].情報(bào)資料期刊,2013(03):56-57.
(責(zé)任編輯:馬圳煒)
Thoughts on the construction of university informatization under the background of big data
LI Yan-ping
(Dangzhengban of Arts and Crafts of Quanzhou Career Academy,Dehua 362500,China)
Abstract:Take the rapid development of large data in recent years as the background,Introduce the connotation and key technology of big data,Combined with the demand of data resources and information construction,the future development trend of university informatization and data-orienting,Analyze the problem、challenges and opportunities that building the Big data and providing online teaching,scientific management Based on big data for teachers and students,personalized service integrated service platform.Combined with the impact of the construction of university informatization that dued to big data technology,cloud technology, Internet of things and other information.
Key words:big data;information construction;digitization
中圖分類號:TP39
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號:1673-1417(2016)02-0085-04
doi:10.13908/j.cnki.issn1673-1417.2016.02.0017
收稿日期:2016-04-25
作者簡介:李燕萍(1985—),女,福建龍巖人,助理實(shí)驗(yàn)師,研究方向:計(jì)算機(jī)。
漳州職業(yè)技術(shù)學(xué)院學(xué)報(bào)2016年2期