李 瓊
[摘 要]隨著信息持續(xù)爆炸式的增長及業(yè)務(wù)決策制訂的不斷加快,企業(yè)競爭不僅在實物資源空間進行,而且在信息資源空間中進行。以數(shù)據(jù)挖掘為核心技術(shù)的商業(yè)智能在管理決策支持方面開始扮演著日益重要的角色。本文利用輕型架構(gòu)設(shè)計,構(gòu)建了企業(yè)商業(yè)智能系統(tǒng),希望可以借此助力企業(yè)的信息化進程,提高企業(yè)的決策水平。
[關(guān)鍵詞]商業(yè)智能;體系結(jié)構(gòu);決策支持
[中圖分類號]F270.7
[文獻標識碼]A
[文章編號]1673-0194(2009)05-0066-03
1 前 言
在當前的信息經(jīng)濟大潮中,信息在經(jīng)濟活動中占據(jù)著越來越重要的地位。企業(yè)要想在競爭中立于不敗之地,必須能夠縱觀歷史與未來趨勢,快速作出決策,快速決策來自于對市場、客戶、企業(yè)營銷狀況等方面的信息進行正確充分的分析。然而,原有的運營支撐系統(tǒng)作為一種管理系統(tǒng)并未從根本上真正實現(xiàn)商業(yè)經(jīng)營管理調(diào)度的優(yōu)化,因而無法很好地適應(yīng)當前商務(wù)活動的發(fā)展。
以數(shù)據(jù)倉庫(Data Warehouse)為基礎(chǔ)的商業(yè)智能(Business Intelligence)的引入,給企業(yè)帶來了新的希望。商業(yè)智能技術(shù)能夠提供使企業(yè)迅速分析數(shù)據(jù)的技術(shù)和方法,幫助企業(yè)從日常運作的數(shù)據(jù)中開發(fā)出結(jié)論性的、基于事實的和具有可實施性的信息,使企業(yè)能夠更快更容易地作出更好的商業(yè)決策;使企業(yè)管理者和決策者以一種更清晰的角度看待業(yè)務(wù)數(shù)據(jù),提高企業(yè)運轉(zhuǎn)效率、增加利潤并建立良好的客戶關(guān)系,使企業(yè)以最短的時間發(fā)現(xiàn)和把握商業(yè)機會。
全球企業(yè)級數(shù)據(jù)倉庫解決方案領(lǐng)導廠商Teradata近日宣布,知名市場研究機構(gòu)發(fā)布的標志性研究報告表明,許多企業(yè)的業(yè)務(wù)決策制訂模式正處在一個關(guān)鍵的十字路口,而商業(yè)智能技術(shù)現(xiàn)已成為導致領(lǐng)先企業(yè)與普通企業(yè)差異化的重要因素。
2 商業(yè)智能
商業(yè)智能(Business Intelligence)這一術(shù)語在1989年由Gartner Group首次提出,它描述了一系列的概念和方法,通過應(yīng)用基于事實的支持系統(tǒng)來輔助商業(yè)決策的制訂。商業(yè)智能是一種綜合運用數(shù)據(jù)倉庫、聯(lián)機分析和數(shù)據(jù)挖掘來處理和分析數(shù)據(jù)的嶄新技術(shù)。
商業(yè)智能的核心內(nèi)容是從許多來自企業(yè)不同的業(yè)務(wù)處理系統(tǒng)的數(shù)據(jù)中,提取出有用的數(shù)據(jù),進行清理以保證數(shù)據(jù)的正確性,然后經(jīng)過抽取(Extract)、轉(zhuǎn)換(Transform)和裝載(Load),即ETL過程,整合到一個企業(yè)級的數(shù)據(jù)倉庫里,從而得到企業(yè)信息的一個全局視圖,利用合適的查詢和分析工具、數(shù)據(jù)挖掘工具等對數(shù)據(jù)倉庫里的數(shù)據(jù)進行分析和處理,形成信息,從中提煉出輔助決策的知識,最后把知識呈現(xiàn)給管理者,為管理者的決策過程提供支持。
商業(yè)智能系統(tǒng)可以說是一個智能決策支持系統(tǒng),它不是一種產(chǎn)品或服務(wù),從某種意義上講,商業(yè)智能是一種概念或者說是一種商業(yè)理念,它是在企業(yè)數(shù)據(jù)倉庫的基礎(chǔ)上,利用數(shù)據(jù)挖掘和信息挖掘工具獲取商業(yè)信息,以輔助和支持商業(yè)決策的全過程。通過商業(yè)智能技術(shù),用戶可以更充分地了解他們的產(chǎn)品、服務(wù)、客戶以及銷售趨勢。
3 電子商務(wù)商業(yè)智能系統(tǒng)的體系結(jié)構(gòu)
在網(wǎng)絡(luò)時代,商務(wù)活動具有活動過程電子化、數(shù)據(jù)來源多樣性、信息要求快捷等特征,為滿足相應(yīng)要求,本文構(gòu)建了企業(yè)商業(yè)智能系統(tǒng),其體系結(jié)構(gòu)如圖1所示。
3.1 數(shù)據(jù)源
在當前的企業(yè)商務(wù)活動過程中,數(shù)據(jù)來自于多種數(shù)據(jù)源,除利用OLTP進行日常交易處理的訂單信息、顧客信息和產(chǎn)品信息外,還包括從電子商務(wù)網(wǎng)站中獲取的用戶訪問和點擊信息,以及其他相關(guān)外部數(shù)據(jù),如從賬務(wù)系統(tǒng)中獲得賬務(wù)信息,從市場部門獲得市場信息等。
3.2 ETL(Extract,Transform,Load)
ETL(Extract,Transform,Load)就是抽取、轉(zhuǎn)換、裝載。首先是“抽取”,將數(shù)據(jù)從上述多種數(shù)據(jù)源中讀取出來,這是所有工作的前提;其次是“轉(zhuǎn)換”,由于目前商務(wù)活動中數(shù)據(jù)源的多樣性,導致系統(tǒng)中有諸如XML、HTML、關(guān)聯(lián)數(shù)據(jù)等多種數(shù)據(jù)類型。由于關(guān)系數(shù)據(jù)庫技術(shù)已經(jīng)十分成熟,而現(xiàn)有較成熟的數(shù)據(jù)挖掘算法(如關(guān)聯(lián)規(guī)則挖掘)多是基于關(guān)系數(shù)據(jù)庫的,所以,在本系統(tǒng)中,將上述異構(gòu)的HTML、XML等多種數(shù)據(jù)經(jīng)清洗、過濾、轉(zhuǎn)換為關(guān)系型數(shù)據(jù),屏蔽掉其異構(gòu)性,使本來異構(gòu)的數(shù)據(jù)格式能統(tǒng)一起來;最后是“裝載”,將轉(zhuǎn)換完的數(shù)據(jù)按計劃增量或全部的導入到ODS中。
3.3 數(shù)據(jù)存儲
運營數(shù)據(jù)存儲(Operational Data Store,ODS)是為了彌補業(yè)務(wù)系統(tǒng)和數(shù)據(jù)倉庫之間的差距而提出的,其最大特點是數(shù)據(jù)是可更新的,甚至可以由前端操作通過觸發(fā)器直接更新。因此,ODS是業(yè)務(wù)系統(tǒng)和數(shù)據(jù)倉庫(Data Warehouse,DW)之間更偏向業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫表。由于企業(yè)的數(shù)據(jù)源數(shù)據(jù)量大,負荷重,且有些數(shù)據(jù)可能并不穩(wěn)定,另外更重要的是由于要求系統(tǒng)能夠?qū)跀?shù)據(jù)進行分析和處理,所以需要構(gòu)建ODS層,而且應(yīng)當構(gòu)建在分析型數(shù)據(jù)存儲系統(tǒng)中,這樣可以快速批量地從原操作型應(yīng)用系統(tǒng)中抽取數(shù)據(jù),減小事務(wù)系統(tǒng)的壓力。
本系統(tǒng)中利用輕型架構(gòu)設(shè)計,將ODS層與數(shù)據(jù)倉庫合在同一個存儲系統(tǒng)之中,這樣可大大減少工作量和維護量,并大大減少了從ODS到數(shù)據(jù)倉庫的第二次ETL的工作量??梢岳脭?shù)據(jù)庫服務(wù)器中的表空間劃分和實視圖技術(shù),實現(xiàn)ODS/DW和多維立方體。在數(shù)據(jù)庫中設(shè)置一些專用表空間分別存儲臨時數(shù)據(jù)、ODS數(shù)據(jù)、倉庫型數(shù)據(jù)等。將從數(shù)據(jù)源中抽取的原始數(shù)據(jù)放入臨時區(qū),對臨時區(qū)中的數(shù)據(jù)進行再次清洗,將清洗好的數(shù)據(jù)裝入ODS區(qū)中,進行老化,ODS區(qū)中的數(shù)據(jù)也可以作為近期數(shù)據(jù)為分析應(yīng)用提供數(shù)據(jù)服務(wù)。對經(jīng)過老化、沉淀的數(shù)據(jù),可根據(jù)不同的粒度需求進行輕型匯總、中型匯總和高度匯總后裝載至倉庫區(qū)中成為倉庫型數(shù)據(jù),它可以為長期趨勢分析和數(shù)據(jù)挖掘提供有效的數(shù)據(jù)服務(wù)。
3.4 數(shù)據(jù)集市
數(shù)據(jù)集市也可叫做“小數(shù)據(jù)倉庫”。如果說數(shù)據(jù)倉庫是建立在企業(yè)級的數(shù)據(jù)模型之上的話,那么數(shù)據(jù)集市就是企業(yè)級數(shù)據(jù)倉庫的一個子集,它主要面向部門級業(yè)務(wù),并且只面向某個特定的主題。
3.5 數(shù)據(jù)挖掘及展現(xiàn)
在本系統(tǒng)最后一層,利用交互式信息分析、挖掘工具、數(shù)據(jù)分析軟件、商業(yè)智能工具與商業(yè)運營規(guī)則相結(jié)合對數(shù)據(jù)的模式和趨勢進行分析,以查詢、分析結(jié)果或報表等形式向用戶提供方方面面的詳細信息,以輔助商務(wù)活動決策。
4 企業(yè)商業(yè)智能系統(tǒng)的應(yīng)用
在傳統(tǒng)的商務(wù)活動中無法直接得到用戶對商品的興趣信息所表征的興趣知識,更無法利用它們?nèi)ミM行決策支持。而現(xiàn)在,可以利用商業(yè)智能系統(tǒng)方便快捷地收集到客戶的行為、興趣、需求及訪問時間的一系列信息,然后,在本系統(tǒng)中將異構(gòu)的客戶訪問信息轉(zhuǎn)換為關(guān)系型數(shù)據(jù),再從關(guān)系數(shù)據(jù)庫中抽取數(shù)據(jù)并轉(zhuǎn)化為以“事務(wù)”為單位的對象,然后利用已有的關(guān)聯(lián)規(guī)則挖掘方法挖掘出一些有意義的規(guī)則模式。
通過上述操作,可以發(fā)現(xiàn)客戶的主要興趣,了解和獲取顧客的預(yù)期行為,為客戶提供個性化服務(wù),提高顧客滿意度。
在此基礎(chǔ)上,企業(yè)還可以對數(shù)據(jù)集市內(nèi)的清潔數(shù)據(jù)進行相應(yīng)的經(jīng)營指標分析、業(yè)績分析和財務(wù)分析等。通過分析,企業(yè)可以及時掌握資金的使用情況、自身的發(fā)展和經(jīng)營情況,為及時調(diào)整和降低企業(yè)成本提供了數(shù)據(jù)依據(jù),更有利于企業(yè)從公司、業(yè)務(wù)及職能角度出發(fā)及時調(diào)整自身經(jīng)營戰(zhàn)略,化解經(jīng)營風險。同時,企業(yè)還可以及時發(fā)現(xiàn)顧客乃至市場的異常情況,快速采取措施,降低企業(yè)風險,提高企業(yè)收益。
5 總 結(jié)
傳統(tǒng)的企業(yè)信息系統(tǒng)幾乎都是基于用戶提出的決策支持要求而創(chuàng)建的,且多以反映企業(yè)歷史狀況的交易型數(shù)據(jù)為基礎(chǔ),因而無法適應(yīng)當前在線交易等形式的靈活性、多變性和實時性,無法提供客戶預(yù)期的購買行為。本文針對目前商務(wù)活動的特點,構(gòu)建了企業(yè)商業(yè)智能系統(tǒng)。通過這一系統(tǒng),可以對歷史數(shù)據(jù)及正在進行的交互信息進行分析,并將一些成熟的數(shù)據(jù)挖掘算法在系統(tǒng)中進行擴展應(yīng)用,由此發(fā)現(xiàn)更多對企業(yè)經(jīng)營管理十分有價值的商業(yè)智能信息,幫助企業(yè)決策,促進企業(yè)發(fā)展。
主要參考文獻
[1]王兆紅.企業(yè)商業(yè)智能系統(tǒng)的架構(gòu)及實施研究[J].中國管理信息化:綜合版,2007(6).
[2]謝壹.商業(yè)智能在互聯(lián)網(wǎng)業(yè)務(wù)分析中的研究與應(yīng)用[J].微計算機信息,2006(12).
[3]鄭洪源,周良.商業(yè)智能解決方案的研究與應(yīng)用[J].計算機應(yīng)用研究,2005(9).
[4]初佃輝,丁建睿,戰(zhàn)德臣.面向中小企業(yè)的智能數(shù)據(jù)處理工具的研究與設(shè)計[J].計算機應(yīng)用研究,2005(7).
[5]王茁.三位一體的商務(wù)智能(BI):管理、技術(shù)與應(yīng)用[M].北京:電子工業(yè)出版社,2004.
[6]王實,高文,郎金文,等.在線零售站點的自適應(yīng)和商業(yè)智能的發(fā)現(xiàn)[J].計算機科學,2002(1).