鮑劍洋,項馨立
(南京中醫(yī)藥大學(xué) 網(wǎng)絡(luò)中心,江蘇 南京210046)
在數(shù)字校園的建設(shè)中,隨著技術(shù)的發(fā)展,應(yīng)用系統(tǒng)集成要求能夠無縫集成來自多個異構(gòu)數(shù)據(jù)源的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),而且必須很好地支持標(biāo)準(zhǔn)元數(shù)據(jù)交換、模式映射并且支持標(biāo)準(zhǔn)數(shù)據(jù)傳輸格式。這就對信息集成解決方案提出了更高的要求,實現(xiàn)應(yīng)用系統(tǒng)集成主要有以下的兩種模式:
(1)數(shù)據(jù)倉儲模式:這種模式首先從一個或多個數(shù)據(jù)源中抽取數(shù)據(jù),并對數(shù)據(jù)進(jìn)行必要的處理,最終將數(shù)據(jù)存儲到目標(biāo)數(shù)據(jù)倉庫中,建立一個全校共享的數(shù)據(jù)中心。各個部門所需要的數(shù)據(jù)都在數(shù)據(jù)中心中提取。最終操作將針對目標(biāo)數(shù)據(jù)倉庫中數(shù)據(jù)進(jìn)行。
(2)數(shù)據(jù)聯(lián)邦模式:在各個應(yīng)用系統(tǒng)中只提取統(tǒng)計分析時所需要的數(shù)據(jù),它將分布式異構(gòu)數(shù)據(jù)集成到一個虛擬表中,而不用建立共享數(shù)據(jù)中心。用戶或應(yīng)用程序可以通過該虛擬表對數(shù)據(jù)進(jìn)行實時操作。
目前大多數(shù)高校都采用的是第一種解決方案,第一種解決方案有它自身的優(yōu)點,但是在共享數(shù)據(jù)中心的投入與維護(hù)運行費用巨大,共享數(shù)據(jù)中心基本需要小型機或大型服務(wù)器支持,巨大,為了安全起見,還要建立小型機集群以保證系統(tǒng)的安全性。
因此我們在應(yīng)用系統(tǒng)集成采用第二種解決方案,使用IBM公司的解決方案,在各個應(yīng)用系統(tǒng)中只提取統(tǒng)計分析時所需要的數(shù)據(jù),而不用建立共享數(shù)據(jù)中心。使用IBM的Cognos軟件成功地將學(xué)校有關(guān)的幾個應(yīng)用系統(tǒng)進(jìn)行整合,不但可以進(jìn)行相關(guān)的查詢統(tǒng)計工作,還可以進(jìn)行更深層次的分析工作,較好的達(dá)到了我們的目標(biāo)。
商業(yè)智能(BI)是由數(shù)據(jù)倉庫、聯(lián)機分析處理OLAP和數(shù)據(jù)挖掘等技術(shù)的綜合運用。商業(yè)智能的關(guān)鍵是從許多來自不同的應(yīng)用系統(tǒng)的數(shù)據(jù)中提取出有用的數(shù)據(jù)并進(jìn)行清理,以保證數(shù)據(jù)的正確性,然后經(jīng)過抽?。‥xtraction)、轉(zhuǎn)換(Transformation)和裝載(Load),合并到一個企業(yè)級的數(shù)據(jù)倉庫里,從而得到學(xué)校數(shù)據(jù)的一個全局視圖,在此基礎(chǔ)上利用合適的查詢和分析工具、數(shù)據(jù)挖掘工具、OLAP工具等對其進(jìn)行分析和處理 (這時信息變?yōu)檩o助決策的知識),最后將知識呈現(xiàn)給管理者,為管理者的決策過程提供支持。
南京中醫(yī)藥大學(xué)數(shù)字化校園的數(shù)據(jù)集成平臺的結(jié)構(gòu)如圖1。
圖1 南京中醫(yī)藥大學(xué)數(shù)字化校園的數(shù)據(jù)集成平臺系統(tǒng)結(jié)構(gòu)圖
Cognos結(jié)構(gòu)在邏輯上可以分為瀏覽器層、Web Server層、應(yīng)用服務(wù)層和數(shù)據(jù)源與內(nèi)容庫層(如圖2)。Cognos提供了強大的OLAP多維分析、查詢、報表、地圖、儀表板、門戶等多種前沿展現(xiàn)手段,對數(shù)據(jù)進(jìn)行多維分析并定制生成報表。
圖2 Cognos的體系結(jié)構(gòu)圖
Cognos具有強大的OLAP數(shù)據(jù)引擎,能產(chǎn)生多維數(shù)據(jù)分析的立方體Cubes。多維數(shù)據(jù)立方體是由各維度數(shù)據(jù)組成的數(shù)據(jù)集市,保證只占用很少的存儲空間就能處理大量數(shù)據(jù),能夠使用戶以更多的角度分析更多的指標(biāo)。
Cognos數(shù)據(jù)源可以是 Oracle、SQL Server、DB2、Sybase等大型關(guān)系型數(shù)據(jù)庫,也可以是Access、dBase等桌面型數(shù)據(jù)庫;可以是未經(jīng)處理的業(yè)務(wù)數(shù)據(jù)庫,也可以是經(jīng)處理后的數(shù)據(jù)集市。
Cognos統(tǒng)一了Web應(yīng)用架構(gòu)與元數(shù)據(jù),通過抽取各數(shù)據(jù)源中所需數(shù)據(jù)存入數(shù)據(jù)立方體的方法訪問企業(yè)的所需信息,為用戶提供了基于純?yōu)g覽器的全面的BI功能。
南京中醫(yī)藥大學(xué)數(shù)字化校園的數(shù)據(jù)集成平臺主要功能與應(yīng)用集成的過程如下:
(1)采用了聯(lián)邦數(shù)據(jù)庫模式,以IBM Cognos為基礎(chǔ)的應(yīng)用集成平臺。
(2)采用數(shù)據(jù)聯(lián)邦技術(shù)的建設(shè)模式,原始數(shù)據(jù)分布在各自應(yīng)用系統(tǒng)中,用戶直接在全局模式的基礎(chǔ)上提交調(diào)用各個數(shù)據(jù)源中數(shù)據(jù)的請求,由Cognos轉(zhuǎn)換成各個數(shù)據(jù)源在本地數(shù)據(jù)視圖基礎(chǔ)上能夠執(zhí)行的請求。
(3)以國家《教育管理信息化標(biāo)準(zhǔn)》規(guī)范為基礎(chǔ),建立南京中醫(yī)藥大學(xué)數(shù)字化校園的信息化建設(shè)規(guī)范。
(4)IBM Cognos為用戶提供透明的數(shù)據(jù)訪問方法,對所要集成的不同應(yīng)用系統(tǒng)中的數(shù)據(jù)信息進(jìn)行抽取,將原來異構(gòu)的數(shù)據(jù)模式作適當(dāng)?shù)霓D(zhuǎn)換,建立數(shù)據(jù)Cube。
(5)在抽取的過程中,根據(jù)南京中醫(yī)藥大學(xué)數(shù)字化校園的信息化建設(shè)規(guī)范,對不同系統(tǒng)的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,使得數(shù)據(jù)統(tǒng)一規(guī)范。
(6)完成了數(shù)據(jù)抽取與匯總之后,根據(jù)學(xué)校對具體應(yīng)用的需求,建立相應(yīng)的數(shù)據(jù)模型與腳本,運用Cognos報表制作功能就能實現(xiàn)數(shù)據(jù)集成的過程。對數(shù)據(jù)Cube進(jìn)行數(shù)據(jù)挖掘,得出所需的信息,并通過前端展現(xiàn)設(shè)計進(jìn)行展示。
圖3 數(shù)據(jù)集成平臺主要功能結(jié)構(gòu)圖
在高校學(xué)生教育管理工作中,學(xué)生的評優(yōu)工作是一項重要而復(fù)雜的工作。獎勵種類多,涉及的金額高,參與的學(xué)生眾多。每種獎勵都有相應(yīng)的評定條件,學(xué)生要獲得某種獎勵就必須要滿足該項目的最低條件。
評綜合獎只需要成績數(shù)據(jù)因此只涉及教務(wù)管理一個數(shù)據(jù)源,但評院優(yōu)干不僅需要成績數(shù)據(jù)還需要學(xué)工數(shù)據(jù),因此涉及教務(wù)管理和學(xué)工管理這兩個異構(gòu)數(shù)據(jù)源。教務(wù)管理數(shù)據(jù)庫為Oracle數(shù)據(jù)庫,而學(xué)工數(shù)據(jù)庫為SQL數(shù)據(jù)庫,這兩種數(shù)據(jù)庫在數(shù)據(jù)格式、標(biāo)準(zhǔn)和訪問接口方面都有著重大區(qū)別。如何將這兩個數(shù)據(jù)庫中的數(shù)據(jù)集成直接影響到評優(yōu)過程的開展。
評優(yōu)過程的實現(xiàn)步驟如下:
首先,在數(shù)據(jù)源中選擇教務(wù)數(shù)據(jù)庫中的表和表中需要的字段,并建立表之間的連接。然后用同樣的方法再選操作學(xué)生工作數(shù)據(jù)庫,并建立兩個數(shù)據(jù)庫之間表的連接(如圖4)。
圖4 兩個異構(gòu)數(shù)據(jù)源的連接
接著在將需要的數(shù)據(jù)過濾出來并打包發(fā)布,新建一張空白報表,運用列表工具,將運行后要顯示的字段拖入。
接下來過濾出精確數(shù)據(jù),要在數(shù)據(jù)項中寫表達(dá)式,將2007-2008學(xué)年的成績和學(xué)生工作數(shù)據(jù)過濾出來。如“院優(yōu)干”這一數(shù)據(jù)項的表達(dá)式的意思應(yīng)為在2007-2008學(xué)年擔(dān)任過班級以上干部并且單科成績不低于60分(如圖5)。
圖5 數(shù)據(jù)過濾
按上述操作后運行,得出評優(yōu)結(jié)果(如圖6),該結(jié)果與2007-2008年度院優(yōu)干入圍學(xué)生名單相符。由上可以看出:采用Cognos系統(tǒng)實現(xiàn)評優(yōu)過程是真實可行的,而且有效的。
圖6 評選優(yōu)秀干部的結(jié)果
經(jīng)過對南京中醫(yī)藥大學(xué)應(yīng)用系統(tǒng)集成的應(yīng)用,證明了采用數(shù)據(jù)聯(lián)邦模式和商業(yè)智能平臺能夠在建立數(shù)字化校園系統(tǒng)的時候,對應(yīng)用系統(tǒng)能夠進(jìn)行較好的集成,并且很好的實現(xiàn)了系統(tǒng)的可擴展性和兼容性,大大降低了系統(tǒng)集成的復(fù)雜性和集成成本。相對于目前許多高校采用的大型數(shù)據(jù)倉庫技術(shù)進(jìn)行應(yīng)用集成,具有投入少、實現(xiàn)快的優(yōu)點,并可利用平臺所具備數(shù)據(jù)挖掘與分析技術(shù),快速建立決策分析平臺,是進(jìn)行校園應(yīng)用集成與應(yīng)用系統(tǒng)建設(shè)的一條新的快速途徑,是一些高校進(jìn)行數(shù)字化校園建設(shè)可采用的有效技術(shù)。
[1]萬里鵬,陳雅,鄭建明.中國高校數(shù)字化校園建設(shè)與思考[J].情報科學(xué),2004(3):122.
[2]李海峰,韋東杰,李濤.兩種常用信息集成模式比較[EB/OL].http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0903lihf/index.html.
[3]漢端科技有限公司.IBM Cognos商業(yè)智能軟件整體簡介[J].2008,12(1):1-17.