袁國民
摘要:本文討論了數(shù)據(jù)倉庫技術(shù)在企業(yè)管理工作中的應(yīng)用及其潛在價值,并提出了在企業(yè)中構(gòu)建數(shù)據(jù)倉庫及其應(yīng)用的方法和建議,認為數(shù)據(jù)倉庫技術(shù)必將在企業(yè)管理工作中起到積極有效的作用。
關(guān)鍵詞:數(shù)據(jù)倉庫管理信息化資源整合
中圖分類號:TP3-4
一、引言
隨著信息技術(shù)的發(fā)展,互聯(lián)網(wǎng)已成為人們進行信息共享的最有效的工具之一。伴隨著數(shù)字化建設(shè)的深入,相繼建設(shè)了眾多的資源管理系統(tǒng)和企業(yè)管理平臺,對網(wǎng)絡(luò)的依賴日趨增加,越來越多的管理信息通過數(shù)字化進入網(wǎng)絡(luò)環(huán)境,以文件、數(shù)據(jù)庫等多種形式出現(xiàn)在網(wǎng)絡(luò)上,并像滾雪球般在迅速堆積。信息的增長在給人們帶來方便的同時也給我們提出了一個重要的課題:能否從紛繁復(fù)雜的信息堆中及時挖掘出有價值的內(nèi)容,為人們提供有效的服務(wù),從而充分發(fā)揮網(wǎng)絡(luò)化系統(tǒng)的卓絕優(yōu)勢。
數(shù)據(jù)倉庫正是解決上述問題的最好工具,它是在企業(yè)管理和決策中面向主題的、集成的、與時間相關(guān)的、不可修改的數(shù)據(jù)集合,可以用于不同粒度的多維數(shù)據(jù)分析,通過數(shù)據(jù)挖掘提取有用的信息,其建立在公正的、全面而完善的歷史信息基礎(chǔ)之上的分析結(jié)果,可以為企業(yè)高層決策提供足夠有效的依據(jù),最大限度地發(fā)揮信息技術(shù)的特點。
二、數(shù)據(jù)倉庫的實現(xiàn)方式
建立數(shù)據(jù)倉庫并不是要取代關(guān)系數(shù)據(jù)庫,與關(guān)系數(shù)據(jù)庫不同,數(shù)據(jù)倉庫并沒有嚴格的數(shù)學(xué)理論基礎(chǔ),它更偏向于工程。數(shù)據(jù)倉庫建立在一個歷史“信息基”上的應(yīng)用,用于支持決策分析,而事務(wù)處理數(shù)據(jù)庫承擔(dān)的是日?;A(chǔ)業(yè)務(wù)的處理。數(shù)據(jù)倉庫是數(shù)據(jù)庫技術(shù)的一種應(yīng)用,大部分依賴于關(guān)系數(shù)據(jù)庫管理系統(tǒng)來管理其中的數(shù)據(jù)。因而在技術(shù)上將建立數(shù)據(jù)倉庫的過程分為:數(shù)據(jù)的抽取、存儲和管理、數(shù)據(jù)的表現(xiàn)。系統(tǒng)架構(gòu)主要由數(shù)據(jù)源、數(shù)據(jù)倉庫的后臺工具、數(shù)據(jù)倉庫服務(wù)器、0LAP(聯(lián)機分析處理)服務(wù)器和前臺分析查詢工具等幾部分組成。
本系統(tǒng)采用了Microsoft數(shù)據(jù)倉庫解決方案,使用SQLServer 2003進行數(shù)據(jù)倉庫的創(chuàng)建。Microsoft將OLAP(聯(lián)機分析處理)的功能集成到SOL Server中,提供可擴充的基于COM的OLAP接口,Microsoft Office 2003套件中的Excel可以作為數(shù)據(jù)展現(xiàn)工具,SQL Server本身也支持第三方數(shù)據(jù)展現(xiàn)工具。本數(shù)據(jù)倉庫的設(shè)計規(guī)范化,采用總線結(jié)構(gòu),建立統(tǒng)一的事實表和維度表,使用雪花型的數(shù)據(jù)結(jié)構(gòu)。
把企業(yè)員工信息系統(tǒng)、員工績效信息系統(tǒng)、企業(yè)財務(wù)信息系統(tǒng)等中的相關(guān)數(shù)據(jù)利用SOLServer 2003中的DTS(數(shù)據(jù)轉(zhuǎn)換工具),經(jīng)過抽取、轉(zhuǎn)換、清洗和裝載等過程,導(dǎo)入數(shù)據(jù)倉庫中,其系統(tǒng)組成如圖1所示:
必須注意到的是在將各種異構(gòu)的數(shù)據(jù)源導(dǎo)入時要進行整合處理。數(shù)據(jù)準(zhǔn)備好之后,就可以利用SOL Server 2003中安裝的分析服務(wù)器和其他工具軟件進行數(shù)據(jù)分析、數(shù)據(jù)挖掘和管理決策。
三、數(shù)據(jù)倉庫在企業(yè)管理中的應(yīng)用
對企業(yè)管理來說,建立數(shù)據(jù)倉庫的數(shù)據(jù)可能來自本企業(yè)各級職能部門和企業(yè)外部等,所有這些數(shù)據(jù)從結(jié)構(gòu)上看,是相對獨立的,按通常的經(jīng)驗來說,企業(yè)管理者是沒有辦法進行全面分析和利用的。根據(jù)數(shù)據(jù)倉庫建立的要求,就必須把分散的、無法統(tǒng)一訪問的數(shù)據(jù)從各種信息系統(tǒng)中分離,經(jīng)過抽取、凈化、轉(zhuǎn)換、遷移為統(tǒng)一、隨時可用的數(shù)據(jù),通過進一步的加工把信息轉(zhuǎn)換成不同大小、各式各樣的數(shù)據(jù)集市以利于企業(yè)管理部門作為專題性分析和輔助決策之用。同時還要考慮采集、入庫以及刷新的自動處理,并為今后的擴展預(yù)留外部接口??傊瑪?shù)據(jù)倉庫就是要把分散的、難以訪問的日常營運數(shù)據(jù)轉(zhuǎn)化為集中統(tǒng)一、隨時可用的信息。
通常要先分析原有業(yè)務(wù)數(shù)據(jù)庫,確定待建的數(shù)據(jù)倉庫主題。再根據(jù)用戶的需求來確定各個級別數(shù)據(jù)倉庫的存儲主題。這里我們選取員工銷售業(yè)績分析為例。首先我們要搜集所有和員工銷售業(yè)績有關(guān)的數(shù)據(jù),這可能來自于多個部門的多個數(shù)據(jù)庫,為了保證數(shù)據(jù)的準(zhǔn)確一致以及數(shù)據(jù)格式的統(tǒng)一,我們需要對原始數(shù)據(jù)進行數(shù)據(jù)預(yù)處理,一般經(jīng)過數(shù)據(jù)清理、數(shù)據(jù)集成和數(shù)據(jù)變換三個步驟。例如,有的員工業(yè)績采用百分制,有的采用等級制,那我們要統(tǒng)一轉(zhuǎn)換成百分制來保證一致性。
經(jīng)過數(shù)據(jù)預(yù)處理之后,便可確定數(shù)據(jù)倉庫的模型。在員工績效分析系統(tǒng)中,我們選取“員工銷售業(yè)績表”為基本事實表,選取“員工信息表”、“產(chǎn)品信息表”、“銷售區(qū)域信息表”、“客戶信息表”和“客戶投訴表”五個維度表。我們建立“雪花”模型,即該數(shù)據(jù)倉庫以員工銷售業(yè)績事實表為核心,員工信息表、產(chǎn)品信息表、銷售區(qū)域信息表、客戶信息表以及客戶投訴表五個表從邏輯上圍繞在核心表的周圍,構(gòu)成雪花結(jié)構(gòu)。
有了事實數(shù)據(jù)與維度數(shù)據(jù),也設(shè)計了數(shù)據(jù)的雪花結(jié)構(gòu),就可以利用數(shù)據(jù)挖掘技術(shù),實現(xiàn)對企業(yè)信息數(shù)據(jù)的查詢和應(yīng)用,從中找出對企業(yè)生存和發(fā)展的有用信息,提供決策依據(jù)。數(shù)據(jù)挖掘支持知識發(fā)現(xiàn),可以找出隱藏的模式和關(guān)聯(lián),構(gòu)造分析模型,進行分類和預(yù)測。
OLAP是數(shù)據(jù)匯總/聚焦工具,用于簡化數(shù)據(jù)分析過程。OLAP系統(tǒng)可以提供數(shù)據(jù)的一般描述,通過上卷、下鉆、旋轉(zhuǎn)、切片、切塊和其他操作實現(xiàn)數(shù)據(jù)匯總和比較??梢越⒁躁P(guān)系型聯(lián)機分析處理(ROLAP)方式存儲的銷售業(yè)績分析多維數(shù)據(jù)集(以時間維、員工維、產(chǎn)品維、客戶維為維度,業(yè)績?yōu)槎攘恐担⑵骄N售業(yè)績分析多維數(shù)據(jù)集(以時間維、員工維、客戶維為維度,平均業(yè)績?yōu)槎攘恐担┑鹊仍S多個不同的多維數(shù)據(jù)立方體。從多種角度來分析銷售業(yè)績數(shù)據(jù)中蘊藏的規(guī)律。
四、結(jié)語
隨著產(chǎn)品類型的逐年增加以及客戶對產(chǎn)品質(zhì)量期望值的一再提高,我們不能因循守舊的把企業(yè)的信息化建設(shè)簡單地理解為將企業(yè)的信息數(shù)字化,而是要充分利用海量歷史數(shù)據(jù)輔助我們的企業(yè)管理以及相關(guān)決策。這樣就必須建立數(shù)據(jù)倉庫并去發(fā)掘其隱藏的規(guī)律或模式,為企業(yè)管理提供有效的支持。雖然數(shù)據(jù)倉庫只是一種工具,它不能替代企事業(yè)管理者,但是它可以為企業(yè)管理者的決策提供科學(xué)的依據(jù),為企業(yè)發(fā)展提供有力的支持。
參考文獻:
[1]李雄飛、李軍,《數(shù)據(jù)挖掘與知識發(fā)現(xiàn)》高等教育出版社,2003.
[2]Imnon,W. H.,Building the Data Warehouse [M].John Wiley and Sons,1996.
[3]劉翔.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].上海:上海交通大學(xué)出版社,2005.
[4]馬國俊.基于OLAP的企業(yè)數(shù)據(jù)倉庫規(guī)劃與建設(shè).制造業(yè)自動化,2011(12).