国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

對外經(jīng)貿(mào)大學(xué):高校數(shù)據(jù)整合實(shí)施策略

2014-03-14 02:54方丹丹王義韓芹韓霖
中國教育網(wǎng)絡(luò) 2014年5期
關(guān)鍵詞:數(shù)據(jù)庫標(biāo)準(zhǔn)信息化

文/方丹丹 王義 韓芹 韓霖

對外經(jīng)貿(mào)大學(xué):高校數(shù)據(jù)整合實(shí)施策略

文/方丹丹 王義 韓芹 韓霖

通過建設(shè)數(shù)據(jù)標(biāo)準(zhǔn)、集成中心數(shù)據(jù)庫平臺、公共數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)綜合應(yīng)用,來實(shí)現(xiàn)各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)整合,推進(jìn)高校教學(xué)和管理工作的信息化、規(guī)范化和科學(xué)化。

經(jīng)過二十多年的發(fā)展,我國各高校信息化建設(shè)已經(jīng)開展并取得較為突出的成果,大部分高校實(shí)現(xiàn)了網(wǎng)絡(luò)課程建設(shè)、數(shù)字圖書館建設(shè)、虛擬實(shí)驗(yàn)室建設(shè)以及教學(xué)、科研、財(cái)務(wù)、人事、后勤等相關(guān)的管理系統(tǒng)建設(shè)。但在發(fā)展過程中,也出現(xiàn)了諸多問題,如信息化建設(shè)前期缺乏整體的、長期的規(guī)劃,各部門的信息化程度不一致,信息系統(tǒng)所使用的開發(fā)語言和數(shù)據(jù)庫各異,導(dǎo)致數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,數(shù)據(jù)共享程度低,信息孤島現(xiàn)象嚴(yán)重,不但增加了管理難度, 降低了工作效率,而且制約了學(xué)校的發(fā)展和信息化水平的提高。因此消除信息孤島、建立信息規(guī)范、整合數(shù)據(jù)與應(yīng)用,是目前高校信息化建設(shè)普遍提出的重點(diǎn)建設(shè)目標(biāo),在原有信息化建設(shè)基礎(chǔ)之上,通過完善信息標(biāo)準(zhǔn)和接口規(guī)范,實(shí)現(xiàn)智能化的數(shù)據(jù)整合, 以促進(jìn)與完善各部門管理工作的數(shù)字化、規(guī)范化和科學(xué)化, 推動高校信息化的全面建設(shè)。

數(shù)據(jù)整合需求

經(jīng)過對高校信息化建設(shè)情況的調(diào)研,我們發(fā)現(xiàn),各高校的信息化基礎(chǔ)建設(shè)已經(jīng)開展并取得較為突出的成果,已經(jīng)建成了以“人、財(cái)、物”為管理核心的業(yè)務(wù)系統(tǒng)。但由于歷史原因和教育行業(yè)特殊性,導(dǎo)致各業(yè)務(wù)系統(tǒng)是在不同時間、不同環(huán)境、不同廠商甚至是不同的開發(fā)語言以及后臺數(shù)據(jù)庫的情況下逐步完成,數(shù)據(jù)分散、重復(fù)、孤立、來源不清是目前各高校的數(shù)據(jù)現(xiàn)狀,而高校業(yè)務(wù)的開展對數(shù)據(jù)卻有越來越多的需求和依賴。

各業(yè)務(wù)系統(tǒng)數(shù)據(jù)共享和交換的需求突出

隨著高校IT應(yīng)用的迅速發(fā)展,各種業(yè)務(wù)系統(tǒng)和數(shù)據(jù)的不斷增加,系統(tǒng)間數(shù)據(jù)共享和交換的需求愈見突出,如科研、資產(chǎn)、教務(wù)、財(cái)務(wù)等系統(tǒng)都需要人事系統(tǒng)里的教職工基本信息;教務(wù)、檔案、戶籍需要學(xué)生一體化系統(tǒng)里的學(xué)生信息;人事、資產(chǎn)需要科研系統(tǒng)里的科研相關(guān)信息。目前各系統(tǒng)之間交換數(shù)據(jù)依靠傳統(tǒng)的excel表導(dǎo)入導(dǎo)出,不僅操作麻煩且數(shù)據(jù)準(zhǔn)確性、一致性不能保證。

表1以對外經(jīng)濟(jì)貿(mào)易大學(xué)為例,分析了各主要業(yè)務(wù)系統(tǒng)之間的數(shù)據(jù)流向。

表1數(shù)據(jù)顯示,對外經(jīng)濟(jì)貿(mào)易大學(xué)的各信息系統(tǒng)間100%的存在數(shù)據(jù)流動關(guān)系,但目前實(shí)現(xiàn)數(shù)據(jù)交互方式90%的是手動數(shù)據(jù)導(dǎo)入。

基于數(shù)據(jù)的統(tǒng)計(jì)分析和決策支持的需求增多

基于數(shù)據(jù)的統(tǒng)計(jì)分析和決策支持的需求日益增多,目前的信息化現(xiàn)狀,不能滿足這些需求,如:要統(tǒng)計(jì)全校教師的整體情況,包括基本信息、本科教學(xué)課時量按年度統(tǒng)計(jì)、本科生教學(xué)評價按年度和課程統(tǒng)計(jì)、研究生教學(xué)課時量按年度統(tǒng)計(jì)、研究生教學(xué)評價按年度和課程統(tǒng)計(jì)、參與的項(xiàng)目、課題、論文、著作等的分類統(tǒng)計(jì)。目前要得到這些統(tǒng)計(jì)數(shù)據(jù),需要從多個系統(tǒng)中查數(shù)據(jù)后手工統(tǒng)計(jì),其中,基本信息來源于人事系統(tǒng),本科教學(xué)課時量和本科生教學(xué)評價來源于本科生綜合教務(wù)系統(tǒng),研究生教學(xué)課時量和研究生教學(xué)評價來源于研究生綜合教務(wù)系統(tǒng),科研項(xiàng)目、課題、論文和著作等來源于科研系統(tǒng),而且這些系統(tǒng)的有些數(shù)據(jù)甚至無法準(zhǔn)確統(tǒng)計(jì)。縱觀我校業(yè)務(wù)系統(tǒng),跨系統(tǒng)的綜合數(shù)據(jù)分析是信息化應(yīng)用的高端,也是難點(diǎn)所在。

表1 各系統(tǒng)的數(shù)據(jù)流向

數(shù)據(jù)整合中遇到的問題

數(shù)據(jù)整合的界定

數(shù)據(jù)整合不是把學(xué)校所有數(shù)據(jù)都整合到一起,首先要確定的就是哪些數(shù)據(jù)需要整合,除了考慮目前的業(yè)務(wù)需求之外,還需要考慮未來的業(yè)務(wù)需求變化、未來的數(shù)據(jù)應(yīng)用的趨勢。充分并深度了解學(xué)校各業(yè)務(wù)部門的數(shù)據(jù)需求、深刻理解高校信息化建設(shè)現(xiàn)狀和趨勢,才能夠做到比較準(zhǔn)確地界定整合數(shù)據(jù)。

數(shù)據(jù)來源千差萬別

各業(yè)務(wù)系統(tǒng)是在不同開發(fā)環(huán)境和不同的后臺數(shù)據(jù)庫下建成的,不僅存在于各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)依賴的操作系統(tǒng)、應(yīng)用系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)不同,而且數(shù)據(jù)表結(jié)構(gòu)、數(shù)據(jù)類型、存儲模式都不同。這些差異帶來了數(shù)據(jù)整合的首要問題,必須打破異構(gòu)性,實(shí)現(xiàn)數(shù)據(jù)間的流通。

數(shù)據(jù)的不完整性

數(shù)據(jù)的不完整性是指各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)缺失,或者數(shù)據(jù)的屬性值缺失,造成這一現(xiàn)象的原因,一方面是由于系統(tǒng)本身的設(shè)計(jì)缺陷,另外一方面可能是使用過程中人為造成的數(shù)據(jù)丟失。

數(shù)據(jù)的準(zhǔn)確性

由于業(yè)務(wù)系統(tǒng)的設(shè)計(jì)局限,沒有對數(shù)據(jù)的準(zhǔn)確性進(jìn)行審核,造成某些數(shù)據(jù)不準(zhǔn)確,比如人事系統(tǒng)的職工手機(jī)號碼,由于沒有讓職工更新維護(hù)的功能,手機(jī)號碼數(shù)據(jù)是職工入職時填寫的,導(dǎo)致該數(shù)據(jù)不準(zhǔn)確。

數(shù)據(jù)的不一致

有些數(shù)據(jù)存在于不同的業(yè)務(wù)系統(tǒng)中,對數(shù)據(jù)屬性的定義不一致,或者數(shù)據(jù)的值不一致,比如學(xué)校部門的名稱,可能在一個系統(tǒng)里,定義的字段類型是char,而另外一個系統(tǒng)里的字段類型是varchar2。而數(shù)據(jù)值有的是部門全稱,有的是部門簡稱,部門名稱變更后,有的進(jìn)行了更新,有的依然用的是舊的名稱。

經(jīng)費(fèi)的安排和計(jì)劃

每一個業(yè)務(wù)系統(tǒng)都應(yīng)該制定數(shù)據(jù)集成的計(jì)劃,預(yù)留數(shù)據(jù)集成經(jīng)費(fèi),但目前很少有系統(tǒng)會考慮到這部分的安排。尤其是一些使用了很多年的系統(tǒng),即使是有經(jīng)費(fèi)也找不到系統(tǒng)維護(hù)人員,給數(shù)據(jù)整合帶來很大的困難。

數(shù)據(jù)整合方案

數(shù)據(jù)整合架構(gòu)設(shè)計(jì)

數(shù)據(jù)整合架構(gòu)以數(shù)據(jù)集成中心庫為中心節(jié)點(diǎn),各業(yè)務(wù)系統(tǒng)圍繞中心節(jié)點(diǎn)接入,在業(yè)務(wù)系統(tǒng)數(shù)據(jù)到數(shù)據(jù)集成中心庫的集成過程中經(jīng)過數(shù)據(jù)集成工具的處理,最后數(shù)據(jù)集成中心庫的數(shù)據(jù)下發(fā)到公共數(shù)據(jù)庫中為全局應(yīng)用所用。

統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)

數(shù)據(jù)標(biāo)準(zhǔn)的建設(shè)是高校數(shù)字化校園建設(shè)的重要內(nèi)容。有了統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),高校在數(shù)據(jù)建模、信息采集、加工處理、數(shù)據(jù)交換的過程中有統(tǒng)一的規(guī)范,最大限度地實(shí)現(xiàn)信息優(yōu)化管理和資源共享,幫助使用者方便、快捷、規(guī)范地建立應(yīng)用系統(tǒng)的數(shù)據(jù)結(jié)構(gòu),滿足信息化建設(shè)需求。

數(shù)據(jù)標(biāo)準(zhǔn)是高校管理信息所涉及的業(yè)務(wù)數(shù)據(jù)管理標(biāo)準(zhǔn),數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范了業(yè)務(wù)數(shù)據(jù)模式的設(shè)計(jì),可以說為高校業(yè)務(wù)數(shù)據(jù)“如何存、存什么、存哪兒”提供了詳細(xì)的規(guī)范。具體的建設(shè)內(nèi)容將包括數(shù)據(jù)的UC(創(chuàng)建/使用)規(guī)則、共享數(shù)據(jù)模型設(shè)計(jì)、數(shù)據(jù)共享和交換的標(biāo)準(zhǔn)、數(shù)據(jù)中心存儲的標(biāo)準(zhǔn)、業(yè)務(wù)系統(tǒng)數(shù)據(jù)模式的標(biāo)準(zhǔn)等。

建設(shè)統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)不僅需要完整的設(shè)計(jì)思想,也需要具備完善管理能力的工具作支撐,為高校信息標(biāo)準(zhǔn)的建設(shè)提供管理保障。數(shù)據(jù)標(biāo)準(zhǔn)管理系統(tǒng)即用以幫助高校輕松實(shí)現(xiàn)對標(biāo)準(zhǔn)的制定、維護(hù)、理解、分享、集成,使得標(biāo)準(zhǔn)具備一定的可管理性。

公共數(shù)據(jù)庫建設(shè)

公共數(shù)據(jù)庫即指高校當(dāng)前各類需整合數(shù)據(jù)的聚合,是高校公共數(shù)據(jù)共享云服務(wù)平臺的核心內(nèi)容,主要包括:國標(biāo)以及教育部、信產(chǎn)部等行業(yè)標(biāo)準(zhǔn)在內(nèi)的參照標(biāo)準(zhǔn)模型及數(shù)據(jù)初始化;公共標(biāo)準(zhǔn)以及滿足教學(xué)等管理需要的校執(zhí)行標(biāo)準(zhǔn)模型及數(shù)據(jù)收集;教職工對象、學(xué)生對象、以及領(lǐng)導(dǎo)體制、師資隊(duì)伍、管理制度、培養(yǎng)體系等相關(guān)活動在內(nèi)的全局?jǐn)?shù)據(jù)集模型。

公共數(shù)據(jù)庫建設(shè)中,將以人為主題建設(shè)公共數(shù)據(jù)集。定義依據(jù):教育部《教育管理信息化標(biāo)準(zhǔn)》中的涉及的信息、學(xué)校業(yè)務(wù)系統(tǒng)中實(shí)際收集到的數(shù)據(jù)。主要內(nèi)容包括:教職工數(shù)據(jù)集 、本專科生數(shù)據(jù)集、研究生數(shù)據(jù)集、教學(xué)活動-開課課程數(shù)據(jù)集、教學(xué)活動-選課數(shù)據(jù)集、教學(xué)活動-學(xué)位申請數(shù)據(jù)集、科研活動數(shù)據(jù)集等。

數(shù)據(jù)集成平臺建設(shè)

數(shù)據(jù)集成平臺是數(shù)字化校園核心技術(shù)支撐平臺的重要組成部分,是整個系統(tǒng)的信息傳輸、信息交換總線。通過數(shù)據(jù)集成平臺將各業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫中需交換的數(shù)據(jù)自動上傳到數(shù)據(jù)集成中心庫中,并按各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)需求將數(shù)據(jù)集成中心庫的數(shù)據(jù)分發(fā)到各業(yè)務(wù)系統(tǒng),從而實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一集成和標(biāo)準(zhǔn)化,為提供數(shù)據(jù)的綜合查詢、統(tǒng)計(jì)分析奠定數(shù)據(jù)基礎(chǔ)。同時,保留各業(yè)務(wù)系統(tǒng)的原有數(shù)據(jù)庫,又確保了各業(yè)務(wù)系統(tǒng)的完整性。

數(shù)據(jù)倉庫建設(shè)

數(shù)據(jù)倉庫事實(shí)上也是一種數(shù)據(jù)集成技術(shù),建立數(shù)據(jù)倉庫的目的是為了更好的數(shù)據(jù)利用,它的特長是在數(shù)據(jù)的檢索、統(tǒng)計(jì)、分析、預(yù)測等方面。其特性是數(shù)據(jù)單向流動,不支持更新,適合于僅需綜合查詢、統(tǒng)計(jì)報(bào)表、數(shù)據(jù)分析等的應(yīng)用場合,不能支持各數(shù)據(jù)源之間的數(shù)據(jù)互操作的需求。我校通過對業(yè)務(wù)系統(tǒng)的應(yīng)用,積累了大量業(yè)務(wù)數(shù)據(jù),通過數(shù)據(jù)倉庫的集成,作為歷史信息的歸檔和備份。在此之上,可以構(gòu)建高層的BI分析模型,解決用戶對于歷史數(shù)據(jù)回溯的要求,保存時間、變更記錄等相關(guān)信息,并提供復(fù)雜報(bào)表、關(guān)聯(lián)查詢、切片、鉆取的多角色、多角度數(shù)據(jù)展現(xiàn)體系和決策支持服務(wù)。

數(shù)據(jù)綜合應(yīng)用

基于數(shù)據(jù)中心中的公共數(shù)據(jù)庫、歷史數(shù)據(jù)庫與數(shù)據(jù)倉庫,按照學(xué)校實(shí)際業(yè)務(wù)需求建設(shè)相應(yīng)的數(shù)據(jù)綜合查詢、統(tǒng)計(jì)分析、決策支持功能,為學(xué)校各類用戶提供數(shù)據(jù)綜合應(yīng)用服務(wù):為師生個人用戶提供查詢自身相關(guān)基本情況;為學(xué)院、部門工作人員展示本部門現(xiàn)狀信息;為院系領(lǐng)導(dǎo)、校領(lǐng)導(dǎo)決策提供數(shù)據(jù)決策支持。使學(xué)校各類用戶都可以對于自身相關(guān)的信息情況有一個全面了解,通過其掌握學(xué)校整體宏觀情況。

數(shù)據(jù)綜合應(yīng)用服務(wù)概況起來主要包括以下兩個方面:

1.綜合查詢類服務(wù)

該項(xiàng)應(yīng)用為教職工、學(xué)生和領(lǐng)導(dǎo)的提供針對個人用戶的綜合信息查詢服務(wù),服務(wù)內(nèi)容包括個人信息中心數(shù)字檔案、個人填表服務(wù),進(jìn)一步為師生提供豐富的數(shù)據(jù)服務(wù);

2.統(tǒng)計(jì)分析類服務(wù)

該項(xiàng)應(yīng)用實(shí)現(xiàn)學(xué)校的學(xué)生、教師、教學(xué)、資產(chǎn)、財(cái)務(wù)等各業(yè)務(wù)數(shù)據(jù)的綜合分析,核心內(nèi)容是提供學(xué)校基礎(chǔ)情況數(shù)據(jù)統(tǒng)計(jì),歷史數(shù)據(jù)對比,關(guān)鍵指標(biāo)項(xiàng)的分析功能。并通過引入其他高校的數(shù)據(jù)進(jìn)行數(shù)據(jù)的橫向比較,了解我校所處的位置和排名,以及自身的不足和優(yōu)勢,為學(xué)校的戰(zhàn)略調(diào)整和規(guī)劃提供有力的數(shù)據(jù)支撐。

數(shù)據(jù)整合關(guān)鍵技術(shù)

數(shù)據(jù)整合包括數(shù)據(jù)清洗和數(shù)據(jù)同步兩個主要方面,其中數(shù)據(jù)清洗可以根據(jù)情況在數(shù)據(jù)中心端或者業(yè)務(wù)系統(tǒng)端進(jìn)行,數(shù)據(jù)同步實(shí)現(xiàn)了業(yè)務(wù)系統(tǒng)與數(shù)據(jù)中心數(shù)據(jù)的獲取和推送,兩者保證了數(shù)據(jù)的標(biāo)準(zhǔn)性、可用性、完整性和時效性。

數(shù)據(jù)清洗

圖1 數(shù)據(jù)清洗方法分類

在集成多個數(shù)據(jù)源的過程中,首先要消解模式?jīng)_突、相似重復(fù)記錄等問題,解決這些問題的過程稱為數(shù)據(jù)清洗過程。數(shù)據(jù)清洗(Data Cleaning,Data Dleansing 或者Data Scrubbing)的目的是檢測數(shù)據(jù)中存在的錯誤和不一致,剔除或者改正它們,提高數(shù)據(jù)的質(zhì)量。

不完整的、錯誤的和重復(fù)的數(shù)據(jù)都是數(shù)據(jù)清洗的對象。其中不完整數(shù)據(jù)是應(yīng)有信息的缺失。錯誤數(shù)據(jù)的產(chǎn)生可能有多種原因,例如:業(yè)務(wù)系統(tǒng)不夠完善,在用戶輸入后不對數(shù)據(jù)判斷而直接存入數(shù)據(jù)庫,以及數(shù)據(jù)庫存在設(shè)計(jì)缺陷,對特定數(shù)據(jù)的存儲類型不正確等。重復(fù)數(shù)據(jù)是指對于同一實(shí)體,存在多條不同記錄,由于這些數(shù)據(jù)庫差異,導(dǎo)致不能正確識別該數(shù)據(jù)項(xiàng)。

數(shù)據(jù)清洗的重點(diǎn)是要保證數(shù)據(jù)的完整性和標(biāo)準(zhǔn)性,所以在算法的設(shè)計(jì)和使用過程中,對于數(shù)據(jù)的識別和處理尤為重要,不僅要有識別和處理,還要具有可查可回溯可修復(fù)的附加算法和功能模塊,便于在使用中進(jìn)行微調(diào)。

數(shù)據(jù)清洗方法分類如圖1所示。

數(shù)據(jù)同步

在相對獨(dú)立的信息服務(wù)和管理系統(tǒng)中,以及不同的數(shù)據(jù)庫系統(tǒng)中,有不少數(shù)據(jù)是相關(guān)聯(lián)的甚至是相同的實(shí)體存在不同的記錄。為了給數(shù)據(jù)中心提供可靠的數(shù)據(jù),在數(shù)據(jù)清洗的同時,數(shù)據(jù)同步也是非常重要的部分。穩(wěn)定、快速、安全的數(shù)據(jù)同步策略,能夠增強(qiáng)數(shù)據(jù)中心的可擴(kuò)展性,提高數(shù)據(jù)中心與各個業(yè)務(wù)系統(tǒng)數(shù)據(jù)同步的準(zhǔn)確率、安全性和效率。

有多種主流工具可為數(shù)據(jù)同步提供支持。Oracle的同步產(chǎn)品ODI和Golden Gate工具,支持所有主流數(shù)據(jù)庫操作系統(tǒng)的一對多、多對一、一對一場景,在性能方面也非常卓越,在效率上也能實(shí)現(xiàn)亞秒級同步。DB2對于異構(gòu)復(fù)制采用CCD(Consistent Change Data)來實(shí)現(xiàn),其強(qiáng)項(xiàng)是跨系統(tǒng)平臺的兼容性以及模式轉(zhuǎn)換,不足之處是CCD表創(chuàng)建和維護(hù)比較難,在處理壓力大時性能下降。SQL Server的出版者-預(yù)訂者方案也能支持一對一、一對多和多對一同步,但是實(shí)現(xiàn)起來比較復(fù)雜,且跨平臺能力差,受Windows系統(tǒng)限制。

數(shù)據(jù)同步主要考慮的是性能,同步策略的設(shè)計(jì)要針對業(yè)務(wù)量的變化,使其性能隨著業(yè)務(wù)量的增加不會迅速降低,尤其是在處理多個業(yè)務(wù)系統(tǒng)與中心庫的大量數(shù)據(jù)時,單位同步過程用時要在指定標(biāo)準(zhǔn)時間范圍內(nèi)。在捕獲同步數(shù)據(jù)的過程中,由于不同數(shù)據(jù)庫中捕獲方式各不相同,對其各自單獨(dú)設(shè)計(jì)捕獲方法勢必影響系統(tǒng)的通用性,影響數(shù)據(jù)同步的性能,所以要充分考慮捕獲方式的系統(tǒng)通用性。

3.清洗和同步的結(jié)合

數(shù)據(jù)清洗和數(shù)據(jù)同步的結(jié)合是在數(shù)據(jù)整合過程中的必然趨勢。由于清洗過后的干凈數(shù)據(jù)依然不是按照相同的標(biāo)準(zhǔn)來記錄,所以在不同的業(yè)務(wù)系統(tǒng)與數(shù)據(jù)中心進(jìn)行同步時,會產(chǎn)生統(tǒng)一字段的不一致,這種沖突會導(dǎo)致數(shù)據(jù)中心的庫中數(shù)據(jù)變?yōu)椤芭K數(shù)據(jù)”,此時則需要進(jìn)行再次清洗,而更好的辦法則是將數(shù)據(jù)清洗方法應(yīng)用到數(shù)據(jù)同步過程中,對不同的業(yè)務(wù)系統(tǒng)定制特殊的數(shù)據(jù)清洗和數(shù)據(jù)同步組合。

對于包含有差異數(shù)據(jù)的各個業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫,其數(shù)據(jù)在到達(dá)數(shù)據(jù)中心數(shù)據(jù)庫是已經(jīng)變?yōu)榉蠘?biāo)準(zhǔn)的“干凈數(shù)據(jù)”,對于新加入的業(yè)務(wù)系統(tǒng),既可以直接按照數(shù)據(jù)標(biāo)準(zhǔn)來建庫,也可以針對建庫情況定制數(shù)據(jù)清洗同步策略。如此,整個數(shù)據(jù)整合過程變得清晰可控,易于進(jìn)行調(diào)整和擴(kuò)展。

上述數(shù)據(jù)整合架構(gòu)設(shè)計(jì)模型,通過建設(shè)數(shù)據(jù)標(biāo)準(zhǔn)、集成中心數(shù)據(jù)庫平臺、公共數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)綜合應(yīng)用,來實(shí)現(xiàn)各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)整合。經(jīng)過集成平臺的處理,各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進(jìn)入到公共數(shù)據(jù)庫,在公共數(shù)據(jù)庫的基礎(chǔ)上,開發(fā)各類數(shù)據(jù)應(yīng)用,通過歷史數(shù)據(jù)庫和數(shù)據(jù)倉庫的建設(shè),實(shí)現(xiàn)歷史數(shù)據(jù)的歸檔、備份,并利用積累的數(shù)據(jù)進(jìn)行檢索、統(tǒng)計(jì)、分析、預(yù)測。該模型可以實(shí)現(xiàn)高校各信息系統(tǒng)的數(shù)據(jù)整合,推進(jìn)高校教學(xué)和管理工作的信息化、規(guī)范化和科學(xué)化,提高高校數(shù)字化校園建設(shè)的水平。

(作者單位為對外經(jīng)貿(mào)大學(xué))

猜你喜歡
數(shù)據(jù)庫標(biāo)準(zhǔn)信息化
2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
月“睹”教育信息化
月“睹”教育信息化
幼兒教育信息化策略初探
忠誠的標(biāo)準(zhǔn)
美還是丑?
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
一家之言:新標(biāo)準(zhǔn)將解決快遞業(yè)“成長中的煩惱”