王 晟 趙壁芳
(1.富國(guó)銀行,美國(guó); 2.ASDI公司,美國(guó))
面向企業(yè)的ERP數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)
王 晟1趙壁芳2
(1.富國(guó)銀行,美國(guó); 2.ASDI公司,美國(guó))
設(shè)計(jì)面向ERP數(shù)據(jù)挖掘的一般結(jié)構(gòu)框架。將ERP原理與數(shù)據(jù)挖掘技術(shù)相結(jié)合應(yīng)用到企業(yè)ERP中銷售、客戶和產(chǎn)品這三個(gè)模塊,提出企業(yè)ERP數(shù)據(jù)挖掘的實(shí)現(xiàn)方法,分析銷售、客戶和產(chǎn)品數(shù)據(jù)挖掘的系統(tǒng)框架,完成概念模型、邏輯模型和物理模型的設(shè)計(jì)工作。并用SQL和JAVA語(yǔ)言發(fā)展為面向ERP數(shù)據(jù)挖掘系統(tǒng)。該系統(tǒng)在實(shí)際應(yīng)用中,將企業(yè)的實(shí)際情況與測(cè)試數(shù)據(jù)相結(jié)合,取得了較好的效果。
數(shù)據(jù)挖掘;決策系統(tǒng);企業(yè)管理系統(tǒng);ERP數(shù)據(jù)挖掘系統(tǒng)
作為一種企業(yè)管理系統(tǒng)的ERP,可以將孤立的、零碎的信息整合成一個(gè)比較完整的、有組織的信息系統(tǒng),不僅能將信息存放的“冗余”問題解決,還能將信息的效能大大地提高。但ERP只能對(duì)在管理者對(duì)信息作表面上的組織和管理上提供很好的幫助,而不能將信息的內(nèi)在規(guī)律更深刻地挖掘出來為決策服務(wù)。ERP雖然也嘗試將決策支持功能包含進(jìn)來,但是因?yàn)楦鞣N各樣的原因,這一目標(biāo)始終沒有很好地完成。而數(shù)據(jù)挖掘技術(shù)能夠?yàn)閺拇罅繑?shù)據(jù)中發(fā)現(xiàn)所存在的特定規(guī)律提供幫助,這就使數(shù)據(jù)挖掘與ERP得到自然的結(jié)合[1-2]。ERP在實(shí)際應(yīng)用中沒有被充分利用已經(jīng)積累了大量蘊(yùn)涵有用的信息的數(shù)據(jù),數(shù)據(jù)挖掘技術(shù)的應(yīng)用將這一現(xiàn)狀徹底改變,它在進(jìn)行自動(dòng)、半自動(dòng)分析大量數(shù)據(jù)時(shí),獲得有價(jià)值的知識(shí),以支持管理決策[3]。
目前 ERP(Enterprise Resource Planning)研究的熱點(diǎn)就是挖掘ERP大量數(shù)據(jù)中蘊(yùn)涵的知識(shí)[4]。數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)中的應(yīng)用是信息決策、經(jīng)濟(jì)管理等領(lǐng)域的前沿研究方向之一[5]。本文設(shè)計(jì)了面向ERP數(shù)據(jù)挖掘的一般結(jié)構(gòu)框架。將ERP原理與數(shù)據(jù)挖掘技術(shù)相結(jié)合應(yīng)用到企業(yè)ERP中銷售、客戶和產(chǎn)品這三個(gè)模塊,提出了企業(yè)ERP數(shù)據(jù)挖掘的實(shí)現(xiàn)方法,分析了銷售、客戶和產(chǎn)品數(shù)據(jù)挖掘的系統(tǒng)框架,完成了概念模型、邏輯模型和物理模型的設(shè)計(jì)工作。并用SQL和JAVA語(yǔ)言發(fā)展為面向ERP數(shù)據(jù)挖掘系統(tǒng)。與企業(yè)的實(shí)際情況和測(cè)試數(shù)據(jù)相結(jié)合,在實(shí)際中應(yīng)用該系統(tǒng),獲得了較好的效果,為ERP和數(shù)據(jù)挖掘的結(jié)合提供了方向。
數(shù)據(jù)挖掘(Data Mining)就是從大量的、模糊的、隨機(jī)的、有噪聲的數(shù)據(jù)中提取人們感興趣的那些隱含的、事先未知的、潛在有用的信息的知識(shí)。這些知識(shí)表現(xiàn)的形式為規(guī)則、規(guī)律、概念、模式等。傳統(tǒng)的查詢和報(bào)表處理并沒有深入研究事件發(fā)生的原因而只是得到事件發(fā)生的結(jié)果,而數(shù)據(jù)挖掘則主要對(duì)事件發(fā)生的原因進(jìn)行了解,并以一定的置信度預(yù)測(cè)未來,為決策行為提供有利的支持[6]。
ERP是指以信息技術(shù)為基礎(chǔ),為員工和企業(yè)決策層提供決策運(yùn)行手段的管理平臺(tái)。ERP的定義:
(1)是對(duì)應(yīng)用關(guān)系數(shù)據(jù)庫(kù)結(jié)構(gòu)、客戶機(jī)/服務(wù)器體系、圖形用戶界面、第四代語(yǔ)言、面向?qū)ο蠹夹g(shù)等信息產(chǎn)業(yè)成果進(jìn)行綜合;
(2)是對(duì)企業(yè)管理理念、基礎(chǔ)數(shù)據(jù)、人力物力、業(yè)務(wù)流程、計(jì)算機(jī)硬件和軟件整合于一體的企業(yè)資源運(yùn)營(yíng)系統(tǒng)。
面向ERP數(shù)據(jù)挖掘就是在生成面向ERP的數(shù)據(jù)倉(cāng)庫(kù)/數(shù)據(jù)集市的基礎(chǔ)上,通過數(shù)據(jù)清洗、集成選擇和變換原有的數(shù)據(jù),得到特定的數(shù)據(jù)集,通過使用數(shù)據(jù)挖掘算法將隱含在其中的但是又有潛在的有用知識(shí)提取出來的過程,其基本原理如圖1所示[7]。
圖1 ERP數(shù)據(jù)挖掘過程
可將ERP數(shù)據(jù)挖掘的過程分為[8-9]:數(shù)據(jù)準(zhǔn)備,數(shù)據(jù)挖掘,結(jié)果評(píng)價(jià)和表達(dá)。
將數(shù)據(jù)準(zhǔn)備分為3個(gè)子步驟:數(shù)據(jù)選取、數(shù)據(jù)預(yù)處理和數(shù)據(jù)變換。
(1)數(shù)據(jù)選取:在原始數(shù)據(jù)庫(kù)中根據(jù)用戶的需求抽取一組目標(biāo)數(shù)據(jù)。
(2)數(shù)據(jù)預(yù)處理:包括對(duì)數(shù)據(jù)降維、消除噪聲、推導(dǎo)計(jì)算缺值數(shù)據(jù)等。
(3)數(shù)據(jù)變換:為了減少數(shù)據(jù)挖掘需要考慮的特征或變量個(gè)數(shù),在初始特征中找出真正有用的特征。
先對(duì)數(shù)據(jù)挖掘的目標(biāo)和挖掘的知識(shí)類型進(jìn)行確定;在挖掘任務(wù)確定后,按照挖掘的知識(shí)類型選擇合適的挖掘算法;然后對(duì)數(shù)據(jù)挖掘?qū)嵤┎僮?,從?shù)據(jù)庫(kù)中用選定的挖掘算法抽取出所需的知識(shí)。
具體步驟細(xì)分為:評(píng)估、解釋模式模型、鞏固、運(yùn)用知識(shí)。不斷地反復(fù)整個(gè)數(shù)據(jù)挖掘過程,使所挖掘出來的知識(shí)能不斷求精和深化,最終使用戶得到滿意的結(jié)果。
此系統(tǒng)結(jié)合石化企業(yè)、大型超市數(shù)據(jù)以及網(wǎng)上獲得的測(cè)試數(shù)據(jù)為基礎(chǔ),將數(shù)據(jù)挖掘技術(shù)和企業(yè)ERP系統(tǒng)結(jié)合起來,為企業(yè)提供智能決策和協(xié)同管理[10]。企業(yè)ERP數(shù)據(jù)挖掘系統(tǒng)開發(fā)的環(huán)境是將大量的數(shù)據(jù)來源作為預(yù)處理數(shù)據(jù),這些數(shù)據(jù)來自石化企業(yè)ERP運(yùn)行后產(chǎn)生的有用數(shù)據(jù)、大型超市后臺(tái)數(shù)據(jù)庫(kù)產(chǎn)生的有用數(shù)據(jù)以及來自互聯(lián)網(wǎng)上作為測(cè)試用的可靠數(shù)據(jù),在此基礎(chǔ)上,通過PC機(jī)針對(duì)這些已經(jīng)明確的數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)該系統(tǒng)。本系統(tǒng)通過主流的JAVA開發(fā)工具eclipse,通過JAVA開發(fā)語(yǔ)言結(jié)合已經(jīng)實(shí)現(xiàn)的數(shù)據(jù)挖掘算法開發(fā)而成。采用JAVA開發(fā)語(yǔ)言,大大提高了本系統(tǒng)的移植功能,JAVA的跨平臺(tái)性有利于把系統(tǒng)移植到不同的操作系統(tǒng)平臺(tái)上。
總體功能框架圖見圖2,銷售模塊功能框架圖見圖3,產(chǎn)品模塊功能框架圖見圖4,客戶模塊功能框架圖見圖5。
圖2 總體功能框架圖
圖3 銷售模塊功能框架圖
圖4 產(chǎn)品模塊功能框架圖
圖5 客戶模塊功能框架圖
數(shù)據(jù)流模型圖見圖6。
圖6 數(shù)據(jù)流模型圖
數(shù)據(jù)庫(kù)的概念結(jié)構(gòu)設(shè)計(jì)完畢后,現(xiàn)在可以將上面的數(shù)據(jù)庫(kù)概念結(jié)構(gòu)轉(zhuǎn)化為某種數(shù)據(jù)庫(kù)系統(tǒng)所支持的實(shí)際數(shù)據(jù)模型,也就是數(shù)據(jù)庫(kù)的邏輯結(jié)構(gòu)。產(chǎn)品預(yù)測(cè)表見表1,產(chǎn)品預(yù)警表見表2,價(jià)格預(yù)測(cè)表見表3,客戶購(gòu)買習(xí)慣表見表4,年銷量利潤(rùn)表見表5,銷量利潤(rùn)預(yù)測(cè)表見表6。
表1 產(chǎn)品預(yù)測(cè)表
表2 產(chǎn)品預(yù)警表
表3 價(jià)格預(yù)測(cè)表
表 客戶購(gòu)買習(xí)慣表
表5 年銷量利潤(rùn)表
表6 銷量利潤(rùn)預(yù)測(cè)表
(1)銷售模塊相關(guān)界面
“銷售利潤(rùn)趨勢(shì)分析”界面如圖7所示,“銷售產(chǎn)品關(guān)聯(lián)分析”界面如圖8所示。
圖7 “銷售利潤(rùn)趨勢(shì)分析”界面
圖8 “銷售產(chǎn)品關(guān)聯(lián)分析”界面圖
(2)客戶模塊相關(guān)界面?!翱蛻糍?gòu)買周期分析”界面如圖9所示。
圖9 “客戶購(gòu)買周期分析”界面圖
(3)產(chǎn)品模塊相關(guān)界面。 “產(chǎn)品生產(chǎn)周期分析”界面如圖10所示。
圖10 “產(chǎn)品生產(chǎn)周期分析”界面圖
本文將ERP原理與數(shù)據(jù)挖掘技術(shù)相結(jié)合應(yīng)用到企業(yè)ERP中的銷售、客戶和產(chǎn)品這三個(gè)模塊,在實(shí)現(xiàn)過程中充分運(yùn)用了數(shù)據(jù)挖掘算法,提出了企業(yè)ERP數(shù)據(jù)挖掘的實(shí)現(xiàn)方法,分析了銷售、客戶和產(chǎn)品數(shù)據(jù)挖掘的系統(tǒng)框架,完成了概念模型、邏輯模型和物理模型的設(shè)計(jì)工作。并將SQL和JAVA語(yǔ)言發(fā)展為面向ERP數(shù)據(jù)挖掘系統(tǒng)。與企業(yè)的實(shí)際情況和測(cè)試數(shù)據(jù)相結(jié)合,在實(shí)際中應(yīng)用該系統(tǒng),獲得較好的效果,為ERP和數(shù)據(jù)挖掘的結(jié)合提供了方向。
[1]Forrest S,Perelson A S,Allen L,et al.Self-nonself Discrimination in a Computer[C]//Proc IEEE Symposium on Research in Security and Privacy.Okaland,CA,1994:202-212.
[2]Dasgupta D,Attoh-Okine N.Immunity-based Systems:A Survey.In:Proc 1997 IEEE Int Confon Systems,Man and Cybernetics,Orlando,F(xiàn)L,USA,1997(1):869-874.
[3]DasguptaD,F(xiàn)orrestS.ArtificialImmuneSystemsinIndustrial Applications[C]//the Proc.of the IPMM’99,1999:257-267.
[4]鄭稱德,王全勝,陳曦.我國(guó)企業(yè)ERP系統(tǒng)實(shí)施的業(yè)務(wù)流程績(jī)效實(shí)證研究[J].情報(bào)雜志,2010,1(2):68-72.
[5]宋旭東,張通學(xué),劉曉冰.面向領(lǐng)域的數(shù)據(jù)挖掘系統(tǒng)研究[J].計(jì)算機(jī)應(yīng)用研究,2008,25(5):1432-1433.
[6]涂建東,陳崇成,黃洪宇,等.基于J2EE的空間數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用,2005,25(3):710-712.
[7]邢國(guó)春,翟云波.基于J2EE的Web數(shù)據(jù)挖掘系統(tǒng)框架評(píng)價(jià)體系研究[J].情報(bào)科學(xué),2007,25(7):1066-1068.
[8]陳睛光.用數(shù)據(jù)挖掘優(yōu)化汽車ERP系統(tǒng)功能的策略與實(shí)踐[J].計(jì)算機(jī)工程與應(yīng)用,2005,41(10):219-222.
[9]唐林燕.數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)在ERP中的應(yīng)用[J].計(jì)算機(jī)工程,2002,28(6):205-207.
[10]顏安.我國(guó)石油企業(yè)ERP系統(tǒng)應(yīng)用的成功因素探討[J].鉆采工藝,2009,32(6):124-126.
Abstract:This paper is designed for the general structure of ERP data mining framework.ERP principles are integrated with data mining techniques and applied to the corporate ERP in such three modules as sales,customer and product.The paper proposes the way to get the ERP data mining system and analyze the framework of sales,customer and product data mining system.The concept model,logical model and physical model are designed.With SQL and JAVA language,the ERP data mining system is developed.In the practice,the system has been obtained good results.
Key words:data mining;decision-making system;enterprise management system;ERP data mining system
The Design and Development of ERP Data Mining System
WANG Cheng1ZHAO Bi-fang2
(1.Wells Fargo Bank,USA;2.ASDI Inc,USA)
TE122
A
1673-1980(2011)06-0176-04
2011-07-21
王晟(1972-),男,河南內(nèi)黃人,碩士,美國(guó)富國(guó)銀行和Mastech軟件公司高級(jí)軟件工程師,研究方向?yàn)橛?jì)算機(jī)大型數(shù)據(jù)庫(kù)開發(fā)。