邵美科
摘 要:隨著大數(shù)據(jù)時(shí)代的到來(lái),高校的數(shù)據(jù)資源呈幾何級(jí)數(shù)的增長(zhǎng),在此背景下,基于大數(shù)據(jù)的高校數(shù)據(jù)整合模式研究,尤其是消除高校的“信息孤島”,提高對(duì)數(shù)據(jù)資源的利用效率,對(duì)原本利用率低下且分散的數(shù)據(jù)資源進(jìn)行更深層次的共享和挖掘,為高校的發(fā)展提供有效的決策支持逐步成為很多高校關(guān)注的重點(diǎn)。
關(guān)鍵詞:數(shù)據(jù)整合;高校大數(shù)據(jù);數(shù)據(jù)共享平臺(tái);數(shù)據(jù)集成
隨著信息化發(fā)展的日益加快,具有相應(yīng)業(yè)務(wù)功能的信息系統(tǒng)越來(lái)越廣泛地應(yīng)用于高等院校的科研、教學(xué)、管理等各個(gè)方面,依賴于便利有效的信息系統(tǒng),高校信息化與數(shù)字化水平得到很大提高。但由于高校數(shù)據(jù)集成還處在建設(shè)初期,信息化建設(shè)前期缺乏長(zhǎng)期整體規(guī)劃,信息資源獨(dú)立分散,標(biāo)準(zhǔn)不統(tǒng)一,數(shù)據(jù)冗余,信息化程度不同,信息孤島現(xiàn)象嚴(yán)重,難以進(jìn)行基礎(chǔ)數(shù)據(jù)綜合查詢分析或決策支持。信息資源的難以整合,不但不利于高校資源的統(tǒng)籌應(yīng)用,也不利于信息資源使用效率的提高。因此基于大數(shù)據(jù)的高校數(shù)據(jù)整合模式研究,提高數(shù)據(jù)資源的利用率,對(duì)原利用率低而又分散的教育資源進(jìn)行更深層次的數(shù)據(jù)挖掘,進(jìn)而為高校的發(fā)展戰(zhàn)略提供科學(xué)依據(jù),對(duì)于支持高校信息化全面發(fā)展具有重大意義。
一、現(xiàn)狀分析
近年來(lái),我國(guó)對(duì)信息化教育十分重視,2000年前后,國(guó)家挑選了部分重點(diǎn)大學(xué)進(jìn)行信息化試點(diǎn),但在數(shù)字化校園建設(shè)的早期,各學(xué)校對(duì)學(xué)校大數(shù)據(jù)整合的規(guī)劃較少,高校雖完成了多套應(yīng)用系統(tǒng)的建設(shè),但各系統(tǒng)在使用過(guò)程中積累了越來(lái)越多基礎(chǔ)數(shù)據(jù)。至“十一五”規(guī)劃期間,最先開(kāi)始建設(shè)數(shù)字化校園的一批高校紛紛進(jìn)行了數(shù)字化校園架構(gòu)的調(diào)整,開(kāi)始著眼于基礎(chǔ)平臺(tái)的建設(shè),同時(shí)加強(qiáng)信息標(biāo)準(zhǔn)的制定和執(zhí)行,提出了面向服務(wù)的建設(shè)思想。
按照信息化發(fā)展階段性要求,三大基礎(chǔ)應(yīng)用平臺(tái)的建設(shè)符合預(yù)期規(guī)劃,統(tǒng)一身份認(rèn)證平臺(tái)和信息門(mén)戶平臺(tái)實(shí)現(xiàn)了一站式服務(wù),極大程度加大了用戶對(duì)于各業(yè)務(wù)系統(tǒng)的訪問(wèn)便利度。為了充分利用學(xué)校的數(shù)據(jù)資源,提高現(xiàn)有應(yīng)用系統(tǒng)數(shù)據(jù)資源的使用效率,對(duì)于數(shù)據(jù)整合模式的研究逐漸成為各高校研究的重點(diǎn)。
二、需求研究
完成對(duì)高校內(nèi)大數(shù)據(jù)有機(jī)的整合和繼承管理,掌握學(xué)校各項(xiàng)活動(dòng)中發(fā)生的龐大、海量數(shù)據(jù),并利用大數(shù)據(jù)處理技術(shù)對(duì)這些信息資源進(jìn)行挖掘、整理、分析,為學(xué)校發(fā)展提供決策支持,是下一階段高校信息化發(fā)展的重要任務(wù)。
(1)數(shù)據(jù)資產(chǎn)意識(shí)薄弱。
數(shù)據(jù)資源建設(shè)的意識(shí)相對(duì)薄弱,很多高校沒(méi)有充分認(rèn)識(shí)到數(shù)據(jù)也會(huì)對(duì)學(xué)校的教學(xué)科研管理起到重要作用,現(xiàn)有業(yè)務(wù)系統(tǒng)繁多,業(yè)務(wù)系統(tǒng)之間相互獨(dú)立,數(shù)據(jù)無(wú)法共享,而且沒(méi)有全校性的數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)質(zhì)量堪憂,數(shù)據(jù)資產(chǎn)不能發(fā)揮有效價(jià)值。
(2)數(shù)據(jù)管理缺乏規(guī)范性。
高校內(nèi)部建設(shè)了多個(gè)業(yè)務(wù)系統(tǒng),依據(jù)各部門(mén)的業(yè)務(wù)需求,其分別設(shè)計(jì)了信息系統(tǒng)建設(shè)標(biāo)準(zhǔn)和數(shù)據(jù)標(biāo)準(zhǔn)并采用了不同的架構(gòu)和開(kāi)發(fā)技術(shù)。但這些系統(tǒng)在應(yīng)用及數(shù)據(jù)層面上彼此分離,導(dǎo)致各單位數(shù)據(jù)標(biāo)準(zhǔn)不一致,在數(shù)據(jù)共享平臺(tái)的建設(shè)過(guò)程中,不能有效分析數(shù)據(jù)庫(kù)表結(jié)構(gòu),在共享過(guò)程中時(shí)常出現(xiàn)匹配錯(cuò)誤等現(xiàn)象。
(3)存在信息孤島。
在數(shù)據(jù)管理維護(hù)工作方面缺少高屋建瓴的規(guī)劃,各部門(mén)采用不同的業(yè)務(wù)系統(tǒng),所有數(shù)據(jù)信息分別存儲(chǔ)在不同地域不同數(shù)據(jù)庫(kù)中,數(shù)據(jù)存儲(chǔ)具有分布性和異構(gòu)性特點(diǎn),且彼此之間不具備一致有效的數(shù)據(jù)格式和交換接口,形成了許多“信息孤島”。
(4)信息隊(duì)伍建設(shè)不足。
在信息化隊(duì)伍的建設(shè)方面仍面臨著許多問(wèn)題。在高校建設(shè)方面,學(xué)校的投入主要在于對(duì)傳統(tǒng)業(yè)務(wù)部門(mén)的建設(shè),而對(duì)于信息化的建設(shè)相對(duì)較少;在人才隊(duì)伍的建設(shè)方面,業(yè)務(wù)部門(mén)大多并沒(méi)有設(shè)立信息化管理人員,因此建設(shè)和維護(hù)能力相對(duì)薄弱。
三、模式研究
各高校的數(shù)據(jù)整合建設(shè)任務(wù)主要集中于數(shù)據(jù)庫(kù)管理和數(shù)據(jù)分析兩個(gè)方面。而對(duì)于高校數(shù)據(jù)中心的具體建設(shè)思路主要有以下三種不同的模式:
(1)數(shù)據(jù)集中模式。
數(shù)據(jù)集中模式需全面丟棄原有的系統(tǒng),對(duì)于新數(shù)據(jù)中心要求統(tǒng)一制定新的信息標(biāo)準(zhǔn),并開(kāi)發(fā)統(tǒng)一應(yīng)用平臺(tái),建立的統(tǒng)一的數(shù)據(jù)庫(kù)用于存儲(chǔ)全校數(shù)據(jù),位于架構(gòu)中的各個(gè)應(yīng)用子系統(tǒng)也需重新開(kāi)發(fā),各業(yè)務(wù)部門(mén)并沒(méi)有獨(dú)立的數(shù)據(jù)庫(kù)。
這種模式的優(yōu)勢(shì)在于系統(tǒng)之間的耦合度較高,數(shù)據(jù)中心與子系統(tǒng)間易于實(shí)現(xiàn)無(wú)縫連接,因?yàn)闊o(wú)需第三方系統(tǒng)的接入,降低了建設(shè)和實(shí)施的難度。但這種模式開(kāi)發(fā)周期相對(duì)較長(zhǎng),設(shè)計(jì)者需要充分掌握各業(yè)務(wù)部門(mén)不同的需求,后續(xù)的應(yīng)用開(kāi)發(fā)也完全依賴于同一家開(kāi)發(fā)商,綜合成本較高。[3]
(2)數(shù)據(jù)共享中心。
大部分高校的應(yīng)用系統(tǒng)功能完善,完全舍棄會(huì)造成資源的浪費(fèi),數(shù)據(jù)共享中心并不改變?cè)械膽?yīng)用系統(tǒng)的架構(gòu),而是通過(guò)提取系統(tǒng)中具有共享價(jià)值的數(shù)據(jù)信息實(shí)施系統(tǒng)的搭建。各部門(mén)仍在原有的業(yè)務(wù)系統(tǒng)中完成讀寫(xiě)工作,而當(dāng)部分?jǐn)?shù)據(jù)的操作與共享數(shù)據(jù)相關(guān)時(shí),應(yīng)用系統(tǒng)將會(huì)通過(guò)前期的部署工作完成共享數(shù)據(jù)的錄入,達(dá)到數(shù)據(jù)層面上的互聯(lián)。數(shù)據(jù)共享中心的優(yōu)勢(shì)在于,各部門(mén)可充分保留原有資源建設(shè),后續(xù)應(yīng)用只需明確其與共享數(shù)據(jù)庫(kù)的關(guān)系便可向數(shù)據(jù)中心提供新的數(shù)據(jù)子集,但此種模式要求對(duì)各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)標(biāo)準(zhǔn)要求較高。
(3)分布式資源整合。
分布式資源整合有兩種主要工作模式:a.業(yè)務(wù)部門(mén)在本地系統(tǒng)中操作數(shù)據(jù),應(yīng)用系統(tǒng)則只會(huì)訪問(wèn)本地?cái)?shù)據(jù);b.業(yè)務(wù)部門(mén)請(qǐng)求訪問(wèn)其他部門(mén)的數(shù)據(jù),應(yīng)用系統(tǒng)則與數(shù)據(jù)中心進(jìn)行互聯(lián),通過(guò)數(shù)據(jù)中心達(dá)到對(duì)于其他部門(mén)數(shù)據(jù)資源的訪問(wèn)。分布式資源整合模式搭建了一個(gè)資源索引庫(kù),索引庫(kù)中存放收錄了各部門(mén)的共享數(shù)據(jù),并明確了數(shù)據(jù)在網(wǎng)絡(luò)中所處的實(shí)際方位,原始數(shù)據(jù)仍位于各部門(mén)。當(dāng)有用戶要求對(duì)共享數(shù)據(jù)進(jìn)行訪問(wèn)時(shí),工作站將視圖框架傳至數(shù)據(jù)中心,數(shù)據(jù)中心準(zhǔn)確地對(duì)所需數(shù)據(jù)的位置進(jìn)行精確定位,將這些信息填入用戶請(qǐng)求的框架后返回給用戶。此類模式要求各個(gè)部門(mén)的數(shù)據(jù)庫(kù)架構(gòu)設(shè)計(jì)、網(wǎng)絡(luò)運(yùn)行狀態(tài)具有較高水平,對(duì)數(shù)據(jù)中心硬件要求最低,需結(jié)合多個(gè)不同的應(yīng)用系統(tǒng)進(jìn)行操作才可完成決策支持,對(duì)原系統(tǒng)會(huì)造成一定的性能影響,后續(xù)建設(shè)問(wèn)題較多。
四、結(jié)論展望
隨著信息技術(shù)發(fā)展的不斷成熟,高校信息化發(fā)展迎來(lái)了空前的機(jī)遇。在信息化建設(shè)的過(guò)程中,基于大數(shù)據(jù)的數(shù)據(jù)整合工作雖任務(wù)繁雜但卻是最不可缺失的重要環(huán)節(jié)。有效的數(shù)據(jù)整合可以大大加快各部門(mén)的數(shù)據(jù)融合度,實(shí)現(xiàn)教學(xué)活動(dòng)在時(shí)間空間上的擴(kuò)展,教學(xué)模式上的創(chuàng)新,為提高科研工作水平,實(shí)現(xiàn)學(xué)校管理的現(xiàn)代化打下良好基礎(chǔ)。
參考文獻(xiàn):
[1]戚麗,等.校園數(shù)據(jù)中心建設(shè)與管理方法的探索[J].教育信息化,2002.7.
[2]唐蓉君,熊忠陽(yáng).高校數(shù)據(jù)中心建設(shè)探索與實(shí)踐[J].中山大學(xué)學(xué)報(bào),2009.3.
[3]吳士杰.數(shù)據(jù)整合技術(shù)在高校應(yīng)用系統(tǒng)中的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)光盤(pán)軟件與應(yīng)用,2014.12.