朱姝
摘要:隨著信息時(shí)代的到來(lái),社會(huì)必然會(huì)引起一場(chǎng)知識(shí)大爆炸,從數(shù)據(jù)倉(cāng)庫(kù)中獲取相應(yīng)的知識(shí)和數(shù)據(jù)挖掘必然會(huì)成為信息時(shí)代的重要技術(shù)之一。自從ERP普及之后,怎樣才能從海量的數(shù)據(jù)信息中查找到對(duì)企業(yè)有價(jià)值的信息已成為企業(yè)優(yōu)勝劣汰的關(guān)鍵。因此,在ERP建立過(guò)程中數(shù)據(jù)倉(cāng)庫(kù)的建立又顯得格外重要。
關(guān)鍵詞:數(shù)據(jù);數(shù)據(jù)倉(cāng)庫(kù);ERP;信息;數(shù)據(jù)庫(kù)
中圖分類號(hào):TP392文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)05-1004-02
Analysis of ERP System in Data Warehouse
ZHU Shu
(Xuzhou Economic and Trade Higher Vocational School, Xuzhou 221004, China)
Abstract: With the advent of the information age, the society will inevitably cause a big explosion of knowledge, from the data warehouse to obtain the corresponding knowledge and data mining will become one of the most important technology in information times. Since the popularization of ERP, how ability from massive data information to find valuable information for an enterprise has become the key to en? terprise survival of the fittest. Therefore, the ERP in the process of establishing data warehouse establishment has become more important.
Key words: data; data warehouse; ERP; information; data mining
隨著信息時(shí)代的到來(lái)市場(chǎng)經(jīng)濟(jì)的變化,企業(yè)之間的競(jìng)爭(zhēng)愈演愈烈,企業(yè)要想獲得生存,就必須對(duì)自身進(jìn)行信息資源的優(yōu)化和整合,以便于企業(yè)增強(qiáng)自身的管理水平和任務(wù)分工的細(xì)化。但是,在某種程度上企業(yè)并沒有完全實(shí)現(xiàn)著一種高效的管理方式,例如:1)一些部門之間計(jì)算機(jī)使用著不同的操作系統(tǒng),那么在數(shù)據(jù)傳輸?shù)倪^(guò)程中就會(huì)出現(xiàn)不兼容現(xiàn)象,從而導(dǎo)致信息難以共享。2)有些部門的某些環(huán)節(jié)還在采用人工處理的方式,那么就會(huì)使整個(gè)生產(chǎn)環(huán)節(jié)的工作效率低下。因此,ERP系統(tǒng)就應(yīng)運(yùn)而生。同時(shí),為了滿足企業(yè)不斷提高的信息化程度,數(shù)據(jù)集成則顯得格外重要,故大多數(shù)企業(yè)都選擇了數(shù)據(jù)倉(cāng)庫(kù)以避免數(shù)據(jù)信息孤島現(xiàn)象的出現(xiàn),從而使得ERP真正實(shí)現(xiàn)了內(nèi)部聯(lián)系和信息共享。下面我們就從五個(gè)方面來(lái)了解ERP中的數(shù)據(jù)倉(cāng)庫(kù)。
1什么是數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù)是決策支持系統(tǒng)(dss)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉(cāng)庫(kù)通常都有四個(gè)組成部分:1)數(shù)據(jù)源:數(shù)據(jù)源既是系統(tǒng)的數(shù)據(jù)源泉又是數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ),它既可以包含整個(gè)企業(yè)的內(nèi)部信息(各種文檔數(shù)據(jù)信息和業(yè)務(wù)處理數(shù)據(jù)等)又可以包含企業(yè)的外部信息(競(jìng)爭(zhēng)對(duì)手的信息、法律法規(guī)和市場(chǎng)綜合信息等)。2)數(shù)據(jù)的存儲(chǔ)與管理:數(shù)據(jù)倉(cāng)庫(kù)的核心點(diǎn)在于對(duì)數(shù)據(jù)信息的存儲(chǔ)與管理,它的組織與管理方式的優(yōu)化程度決定了系統(tǒng)的效率,并且不同的方式也決定著不同的數(shù)據(jù)表示方式,至于最終采用什么樣的技術(shù)和產(chǎn)品來(lái)建立數(shù)據(jù)倉(cāng)庫(kù),則需要根據(jù)不同數(shù)據(jù)倉(cāng)庫(kù)技術(shù)特點(diǎn)進(jìn)行具體分析。數(shù)據(jù)倉(cāng)庫(kù)在組織與管理方面還有一個(gè)較大的優(yōu)勢(shì),它可以把整個(gè)系統(tǒng)中的不同數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)綜合、歸納、抽取和清理,并按照一定的主題進(jìn)行優(yōu)化組織。因此,數(shù)據(jù)倉(cāng)庫(kù)就有了等級(jí)之分,例如部門級(jí)數(shù)據(jù)倉(cāng)庫(kù)、企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)等。3)OLAP(聯(lián)機(jī)分析處理)服務(wù)器:OLAP服務(wù)器可以對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行多角度和多層次的總結(jié)和分析,并歸納出相應(yīng)的發(fā)展態(tài)勢(shì),這種功能的實(shí)現(xiàn)主要有三個(gè)方面:HOLAP(混合型線上分析處理)、ROLAP(關(guān)系型在線分析處理)和MOLAP(多維在線分析處理)。4)前端工具:它多趨向于輔助工具,例如查詢工具、數(shù)據(jù)挖掘工具、報(bào)表工具、數(shù)據(jù)分析工具和應(yīng)用開發(fā)工具等。
2 ERP中數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)庫(kù)的區(qū)別
在ERP的設(shè)計(jì)中總是會(huì)帶有各種各樣的數(shù)據(jù)庫(kù),那么我們?yōu)槭裁催€要設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)呢?
下面就從以下幾個(gè)方面來(lái)了解數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)庫(kù)的區(qū)別。
1)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)庫(kù)的出發(fā)點(diǎn)不同。數(shù)據(jù)倉(cāng)庫(kù)的主要面向點(diǎn)是主題而數(shù)據(jù)庫(kù)的主要面向點(diǎn)是事務(wù)。數(shù)據(jù)倉(cāng)庫(kù)不僅可以處理各種不同的事務(wù)任務(wù)而且可以使不同的業(yè)務(wù)系統(tǒng)之間相對(duì)獨(dú)立。數(shù)據(jù)倉(cāng)庫(kù)總是將數(shù)據(jù)按照不同的主題進(jìn)行相應(yīng)的劃分并把其組織在一起,雖然主題和數(shù)據(jù)庫(kù)的面向應(yīng)用相對(duì)應(yīng),但是主題是整個(gè)企業(yè)在一定層次上對(duì)數(shù)據(jù)進(jìn)行的綜合、歸類和分析的抽象概念,它帶有一定宏觀領(lǐng)域的分析性。數(shù)據(jù)倉(cāng)庫(kù)還可以把對(duì)決策性無(wú)用的數(shù)據(jù)進(jìn)行相應(yīng)的排除,并把其結(jié)果顯示在一些簡(jiǎn)單易懂的視圖上。
2)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)庫(kù)記錄的數(shù)據(jù)方式不同。數(shù)據(jù)倉(cāng)庫(kù)在存儲(chǔ)數(shù)據(jù)時(shí)總是會(huì)將其相應(yīng)的歷史信息記錄在案,例如:數(shù)據(jù)倉(cāng)庫(kù)可以記錄企業(yè)在不同的發(fā)展階段所有的歷史信息,企業(yè)可以通過(guò)這些信息對(duì)過(guò)去進(jìn)行總結(jié)和分析,對(duì)未來(lái)進(jìn)行決策,而數(shù)據(jù)庫(kù)在這方面卻顯得尤為不足。
3)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)庫(kù)對(duì)冗余的處理方式不同。數(shù)據(jù)倉(cāng)庫(kù)既然要記錄所有階段的歷史信息,那么它就會(huì)積極的引入冗余,在設(shè)計(jì)時(shí)一般會(huì)采用反范式的方式。而數(shù)據(jù)庫(kù)則會(huì)積極的去避免冗余,在設(shè)計(jì)時(shí)通常采用范式的方式對(duì)數(shù)據(jù)進(jìn)行規(guī)范化。
從以上的對(duì)比可以看出數(shù)據(jù)倉(cāng)庫(kù)是為了分析數(shù)據(jù)而產(chǎn)生的,而數(shù)據(jù)庫(kù)僅是一種數(shù)據(jù)的輔助設(shè)計(jì)。
3數(shù)據(jù)倉(cāng)庫(kù)彌補(bǔ)ERP的缺陷
面向事務(wù)在處理數(shù)據(jù)時(shí)一般面對(duì)的都是及時(shí)數(shù)據(jù)和細(xì)節(jié)數(shù)據(jù),要求能夠高速的處理這些數(shù)據(jù),并能夠完成快速查詢和統(tǒng)計(jì)的功能。而面向分析則是要求能夠?qū)v史數(shù)據(jù)信息、抽樣數(shù)據(jù)信息、匯總數(shù)據(jù)信息等進(jìn)行歸納、總結(jié)和分析,這些信息可能是幾個(gè)月的數(shù)據(jù)信息也可能是幾年的數(shù)據(jù)信息,可能是局部的數(shù)據(jù)信息也可能是整個(gè)企業(yè)的數(shù)據(jù)信息,數(shù)據(jù)量之大是難以想象的。對(duì)于一個(gè)ERP系統(tǒng)來(lái)說(shuō)面向事務(wù)和面向分析具有同樣重要的作用,只有將兩者更好的結(jié)合起來(lái),才能夠使ERP系統(tǒng)更好的管理企業(yè)的日常運(yùn)作,通過(guò)對(duì)數(shù)據(jù)的匯總和歸納企業(yè)才能夠?qū)ξ磥?lái)發(fā)展做出決策性的分析。而數(shù)據(jù)倉(cāng)庫(kù)在決策性分析中一直充當(dāng)著領(lǐng)頭羊的作用,它可以對(duì)所有分散的數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行整體數(shù)據(jù)抽取和數(shù)據(jù)清理,然后再通過(guò)歸納、匯總和分析消除不一致的數(shù)據(jù),最后存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)中,以保證全局信息的一致性。除此之外,它還能提供較高的穩(wěn)定性,當(dāng)數(shù)據(jù)被數(shù)據(jù)倉(cāng)庫(kù)收錄后,此數(shù)據(jù)將被長(zhǎng)期保留下來(lái),以便于為企業(yè)做決策性分析提供基礎(chǔ)數(shù)據(jù)。因此,一個(gè)好的數(shù)據(jù)倉(cāng)庫(kù)可以彌補(bǔ)ERP系統(tǒng)在面向分析方面的缺陷。
4在ERP中創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù)的建立是以解決問(wèn)題的主題為基礎(chǔ),而問(wèn)題主題的產(chǎn)生是以用戶決策性問(wèn)題為基礎(chǔ),故在建立數(shù)據(jù)倉(cāng)庫(kù)時(shí)會(huì)從決策性問(wèn)題入手。一般情況下,數(shù)據(jù)倉(cāng)庫(kù)的建立有以下幾個(gè)步驟:
1)收集并分析終端客戶的需求,為數(shù)據(jù)倉(cāng)庫(kù)選擇合適的主題并以主題為中心為其存儲(chǔ)數(shù)據(jù)建立數(shù)據(jù)模型。該數(shù)據(jù)模型要求能夠完整清晰的看到整個(gè)企業(yè)的信息描述。
2)剖析數(shù)據(jù)源,以終端客戶的需求和重點(diǎn)主題為基礎(chǔ),設(shè)計(jì)數(shù)據(jù)結(jié)構(gòu)的維表和事實(shí)表,以完成數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的物理存儲(chǔ)結(jié)構(gòu)。
3)設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)模型和數(shù)據(jù)源之間的轉(zhuǎn)化/綜合邏輯,主要包括:①哪些數(shù)據(jù)需要轉(zhuǎn)化/綜合。②轉(zhuǎn)化/綜合數(shù)據(jù)量的大小。③轉(zhuǎn)化/綜合數(shù)據(jù)的頻率。
4)生成相應(yīng)的元數(shù)據(jù),以便于描述數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)模型和數(shù)據(jù)轉(zhuǎn)化/綜合邏輯。
5)獲取各種源系統(tǒng)中數(shù)據(jù)并加載到數(shù)據(jù)倉(cāng)庫(kù)中。
5數(shù)據(jù)倉(cāng)庫(kù)在ERP系統(tǒng)中的實(shí)例
ERP系統(tǒng)多種多樣,在ERP系統(tǒng)中的數(shù)據(jù)倉(cāng)庫(kù)也層出不窮,下面通過(guò)一個(gè)機(jī)械制造企業(yè)的進(jìn)銷存系統(tǒng)來(lái)進(jìn)一步了解ERP系統(tǒng)中的數(shù)據(jù)倉(cāng)庫(kù)。
進(jìn)銷存系統(tǒng)是以傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)為基礎(chǔ),在數(shù)據(jù)庫(kù)系統(tǒng)中所包含的重要表有:客戶基本信息表、銷售廠商表、零件供貨商表、庫(kù)存表和產(chǎn)品信息表等,這些表的存在有利的解決了面向交易的處理系統(tǒng),與此同時(shí)也給聯(lián)機(jī)分析處理系統(tǒng)提供了基礎(chǔ)數(shù)據(jù),例如零件供應(yīng)商查詢、客戶信息查詢、產(chǎn)品信息查詢等,但是這些信息卻不能夠?qū)ζ髽I(yè)制定長(zhǎng)遠(yuǎn)發(fā)展計(jì)劃提供更多的幫助,因此建立適用的數(shù)據(jù)倉(cāng)庫(kù)對(duì)原有的數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行過(guò)濾、歸納和分析得出綜合的結(jié)論,這樣才能夠更好的服務(wù)于企業(yè)的長(zhǎng)期發(fā)展。
在整個(gè)數(shù)據(jù)倉(cāng)庫(kù)建立的過(guò)程中,首先要做的是對(duì)原有的數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行透徹的分析,然后將數(shù)據(jù)庫(kù)中的分散數(shù)據(jù)進(jìn)行清洗、抽取和分類,在這里我們將它分成以下幾類:零件供應(yīng)商類(包含原數(shù)據(jù)庫(kù)中供應(yīng)商所有的信息)、進(jìn)銷存賬目類(包含原數(shù)據(jù)庫(kù)中進(jìn)貨、銷貨和存貨的所有賬目明細(xì))、客戶信息類(包含原數(shù)據(jù)庫(kù)中所有的客戶基本信息和客戶與企業(yè)之間的來(lái)往賬目明細(xì))等,重新劃分原數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以把原數(shù)據(jù)庫(kù)中的分散數(shù)據(jù)有效的結(jié)合在一起,可以使聯(lián)機(jī)分析處理系統(tǒng)發(fā)揮更好的效能,而且還可以為系統(tǒng)的二次開發(fā)提供良好的基礎(chǔ),避免了牽一發(fā)而動(dòng)全身的惡果。其次是數(shù)據(jù)倉(cāng)庫(kù)中物理結(jié)構(gòu)和數(shù)據(jù)模型的設(shè)計(jì),在目前有很多公司都已經(jīng)推出了有自身特色的數(shù)據(jù)倉(cāng)庫(kù)解決方案,例如:Microsoft、IBM、BO等,由于在數(shù)據(jù)層本系統(tǒng)采用的是SQL Server 2000,因此在此進(jìn)銷存系統(tǒng)中主要選擇了Microsoft的SQL Server 2005來(lái)進(jìn)行數(shù)據(jù)倉(cāng)庫(kù)的建立,這樣可以更好的實(shí)現(xiàn)數(shù)據(jù)源與數(shù)據(jù)倉(cāng)庫(kù)之間的數(shù)據(jù)轉(zhuǎn)換/綜合。最后將轉(zhuǎn)換/綜合的數(shù)據(jù)信息加載到數(shù)據(jù)倉(cāng)庫(kù)中,并采用DOT NET平臺(tái)開發(fā)相應(yīng)的應(yīng)用程序來(lái)輔助聯(lián)機(jī)分析處理系統(tǒng)。這樣整個(gè)ERP中的數(shù)據(jù)倉(cāng)庫(kù)也就建立完成了。
6結(jié)束語(yǔ)
數(shù)據(jù)倉(cāng)庫(kù)在整個(gè)ERP系統(tǒng)中已經(jīng)占據(jù)了十分重要的地位,只有更加優(yōu)化的數(shù)據(jù)倉(cāng)庫(kù)才能使ERP系統(tǒng)的作用更加突顯,才能給企業(yè)制定好的戰(zhàn)略方針提供更加真實(shí)有效的信息。
參考文獻(xiàn):
[1]王珊.數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與聯(lián)機(jī)分析處理[M].北京:科學(xué)出版社,1998.
[2]陳文偉.智能決策支持技術(shù)[M].北京:電子工業(yè)出版社,1998.
[3]李書濤.決策支持系統(tǒng)原理與技術(shù)[M].北京:北京理工大學(xué)出版社,1996.
[4]吳峨,即建軍.財(cái)務(wù)管理決策支持系統(tǒng)的研究[J].信息系統(tǒng)工程,1995(1).
[5]李海剛.基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘及其在決策系統(tǒng)中的應(yīng)用[J].現(xiàn)代計(jì)算機(jī),2001(3).
[6]李靜,宋瀚濤.創(chuàng)建企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)的關(guān)鍵技術(shù)[J].計(jì)算機(jī)應(yīng)用研究,2001(5).