林雯
【摘 要】文章闡述了DM和CRM技術,分析了數(shù)據(jù)挖掘關聯(lián)規(guī)則Apriori算法,從數(shù)據(jù)倉庫設計、ETL設計和多維數(shù)據(jù)模型設計等多方面對電子商務企業(yè)CRM系統(tǒng)進行數(shù)據(jù)倉庫設計,進而對基于DM技術的電子商務CRM系統(tǒng)進行了總體設計和數(shù)據(jù)表設計,該系統(tǒng)能有效地提升企業(yè)的盈利能力和市場競爭力。
【關鍵詞】DM;電子商務;CRM系統(tǒng)
【中圖分類號】TP393.09;F724.6【文獻標識碼】A【文章編號】1674-0688(2016)08-0026-03
0 引言
隨著網絡信息時代的高速發(fā)展,電子商務市場迅速成長和壯大,給企業(yè)帶來前所未有的挑戰(zhàn)。電子商務企業(yè)之間的競爭日益激烈,競爭早已由“以產品為中心”轉向“以客戶為中心”,客戶資源已經成為企業(yè)之間競爭的最重要的資源之一。電子商務企業(yè)如何為客戶帶來優(yōu)質的產品和優(yōu)質的服務?如何為客戶制定個性化的服務?已經成為影響企業(yè)發(fā)展和壯大的重要因素。但是,隨著企業(yè)規(guī)模的不斷擴大,電子商務企業(yè)面臨客戶業(yè)務量大、客戶數(shù)據(jù)復雜多樣等特點,電子商務企業(yè)既要保留當前的數(shù)據(jù)信息,也要保留歷史性的數(shù)據(jù)信息,同時也要對這些數(shù)據(jù)進行有效的管理,更為重要的是要對客戶數(shù)據(jù)進行剖析,從大量的客戶數(shù)據(jù)中挖掘出有效的、有價值的數(shù)據(jù)信息。
1 數(shù)據(jù)挖掘和CRM
數(shù)據(jù)挖掘(Data Mining)就是從海量的、繁雜的、有噪聲的、不完全的、模糊的數(shù)據(jù)庫或數(shù)據(jù)倉庫中,發(fā)現(xiàn)并提取隱藏在其中的、不為人們事先知道但又具有一定價值的信息和知識的發(fā)現(xiàn)過程。
CRM(Customer Relationship Management)為電子商務企業(yè)提供整理、收集、分析客戶信息的系統(tǒng),為現(xiàn)代化電子商務企業(yè)提供全新的商業(yè)管理戰(zhàn)略,其目的在于幫助企業(yè)充分合理地利用客戶資源信息,開拓新的業(yè)務市場和渠道,優(yōu)化企業(yè)的盈利能力和提升客戶滿意度,促進電子商務企業(yè)在激烈的市場競爭中立足和發(fā)展。
客戶關系管理(Customer Relationship Management,CRM)的產生不僅為企業(yè)提供了一個收集、分析、利用客戶信息的系統(tǒng),更為現(xiàn)代企業(yè)提供了一種全新的商業(yè)管理戰(zhàn)略,幫助企業(yè)充分利用其客戶關系資源,擴展新的市場和業(yè)務渠道,提高客戶的滿意度和企業(yè)的贏利能力,使其在空前激烈的競爭中更好地立足和發(fā)展。電子商務企業(yè)CRM作為一個完整的系統(tǒng),主要能實現(xiàn)數(shù)據(jù)倉庫、客戶互動管理、運營管理、策略決策、后端系統(tǒng)整合和分析層次CRM等功能。
2 關聯(lián)規(guī)則算法研究
常用的數(shù)據(jù)挖掘算法主要有關聯(lián)規(guī)則、分類、聚類等,本系統(tǒng)采用DM技術中的改進的關聯(lián)規(guī)則(Association Rules)經典挖掘算法-頻集算法(Apriori算法),Apriori算法是從數(shù)據(jù)倉庫或數(shù)據(jù)集市中挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關聯(lián),其算法是Support和Conf idence分別滿足用戶給定閥值的規(guī)則,即
Support(X?圯Y)=P(X∪Y)
Conf idence(X?圯Y)=P(Y/X)
Apriori算法基本思想是找出事務數(shù)據(jù)庫中所有大于或等于用戶指定最小支持度的頻繁項集,由頻繁項集生成滿足用戶指定的最小信任度閥值的關聯(lián)規(guī)則。Apriori算法采用了逐層搜索的迭代的方法,算法簡單明了,沒有復雜的理論推導,也易于實現(xiàn),但是也存在對數(shù)據(jù)倉庫掃描次數(shù)頻繁和產生大量的中間項集等問題。
網絡通信技術飛速發(fā)展、市場變化莫測、企業(yè)之間的協(xié)同合作,電子商務企業(yè)面臨客戶數(shù)據(jù)量大、數(shù)據(jù)繁雜多樣等問題。電子商務企業(yè)客戶的銷售數(shù)據(jù)表明,電子商務企業(yè)客戶銷售數(shù)據(jù)主要面臨時間和空間2個維度,不同時間維度和不同空間維度的客戶銷售數(shù)據(jù)具有不用的意義和價值。
本文針對電子商務企業(yè)的特點和實際情況,為了使電子商務企業(yè)快速、準確、高效地分析客戶數(shù)據(jù)和獲得有價值的信息,進而提升電子商務企業(yè)的決策和管理能力,采用一種加權、分段的Apriori算法,該算法既減少了I/O代價,又加快了挖掘處理速度,提高了執(zhí)行效率。其主要思想如下。
加權:重新定義Support和Conf idence,將客戶數(shù)據(jù)的權重考慮在內。
Support(A?圯B)=■
Conf idence(A?圯B)=■
分段:將從電子商務企業(yè)數(shù)據(jù)倉庫中所提取的客戶數(shù)據(jù)信息分為若干適合內存處理的子數(shù)據(jù)庫,然后利用Apriori算法對子數(shù)據(jù)進行分析處理,接著歸并子數(shù)據(jù)庫所挖掘出的結果,再次掃描數(shù)據(jù)庫,最終篩選出有價值的關聯(lián)規(guī)則。
3 電子商務企業(yè)CRM系統(tǒng)數(shù)據(jù)倉庫設計
電子商務企業(yè)CRM系統(tǒng)數(shù)據(jù)倉庫的建設,是以企業(yè)客戶數(shù)據(jù)業(yè)務量大為基礎,將客戶數(shù)據(jù)信進行時整理、歸納和重組,及時提供給企業(yè)決策層。電子商務企業(yè)數(shù)據(jù)倉庫系統(tǒng)結構主要包括數(shù)據(jù)源、數(shù)據(jù)存儲和管理、OLAP(Online Analysis Process)和前端工具等。
3.1 數(shù)據(jù)倉庫系統(tǒng)分析和設計過程
數(shù)據(jù)倉庫中的數(shù)據(jù)具有面向主體的、集成的、不可更新的、隨時變化的特征,一個完整的電子商務企業(yè)數(shù)據(jù)倉庫應包括數(shù)據(jù)查詢、數(shù)據(jù)管理、忠誠客戶識別、客戶購買行為、客戶流失警示、客戶數(shù)據(jù)信息共享等基本功能。在電子商務企業(yè)應用的領域中,數(shù)據(jù)倉庫最重要的是具有網絡化、實時性和可擴展性等特點,本文針對三層B/S結構和兩層C/S結構的不足,采用一種滿足網絡化、實時性強和易于維護的跨平臺的五層B/S模式,該模式基于Windows環(huán)境下具有利用JAVA、JBuilder 2013和數(shù)據(jù)連接池技術,構建客戶層、表示邏輯層、商業(yè)邏輯層、數(shù)據(jù)連接管理層和數(shù)據(jù)庫層的五層B/S模式。
結合電子商務企業(yè)CRM系統(tǒng)的特點,設計數(shù)據(jù)倉庫的步驟如下:選取待建模的事務處理—選取事務處理的粒度—選取事實表的維度—選取實事表的度量。
3.2 數(shù)據(jù)倉庫ETL設計和多維數(shù)據(jù)模型設計
電子商務企業(yè)CRM系統(tǒng)中,后臺數(shù)據(jù)庫采用Microsoft SQL Server 2012,Microsoft DTS(Data Transmission System)設計器具有編程效率高、擴展性好、易用等特點,因此采用DTS設計器來實現(xiàn)數(shù)據(jù)倉庫ETL過程。以客戶銷售分析為例,從Customer(客戶)表抽取數(shù)據(jù)的SQL語句描述如下:
SELECT
CustomerID,CustomerName,City,Province,County,PostalCode,Phone,F(xiàn)ax,EmployeeNu-
mber,YearlyIncome,CrateDate,AccountCard,CustomerAsset From Customer
執(zhí)行DTS,完成數(shù)據(jù)的加載工作。同時,DTS還有一定的調度功能。
Microsoft SQL Server 2012提供MDX(Multi-dimensional Express)支持多維數(shù)據(jù)集操作,Microsoft SQL Server Analysis Services提供DSO(Decision Support Object)用于編寫程序訪問多個維度,在多維數(shù)據(jù)分析模塊中,利用ADO/MD對象模型和PivotTable Semite構造MDX查詢語句進行多維數(shù)據(jù)查詢分析,Cellset對象存儲多維查詢分析結果,供電子商務企業(yè)查看數(shù)據(jù)。
利用Server對象的MDStores集合上調用Add-
New方法創(chuàng)建分析服務數(shù)據(jù)庫,語法為DSOServe.MDStores. AddNew數(shù)據(jù)庫名。
在DataBase.MDStores集合上可創(chuàng)建多維數(shù)據(jù)集,如:創(chuàng)建一個多維數(shù)據(jù)集合名:Set DSOCube=DSODb.
MDStores.AddNew=;設置多維數(shù)據(jù)集的數(shù)據(jù)源:DSOCube.DataSources.AddNew DSODb.DataSou-
rces(數(shù)據(jù)源名).Name。
利用SQL Server 2012的Analysis Services組件建立電子商務企業(yè)銷售決策支持的OLAP數(shù)據(jù)庫,例如利用MDX查詢南寧某地銷售處的銷售情況:Select[Measures].[Sales] ON COLUMNS [Time].[Monday] ON ROWS FROM Sales Cube WHERE [Region].[Guangxi].[NanNing].AND [Product].[Bag].[Q320]。
4 基于DM技術的電子商務CRM系統(tǒng)的設計
4.1 系統(tǒng)總體設計
基于DM技術的CRM系統(tǒng)設計結合電子商務企業(yè)的特點,能夠實現(xiàn)企業(yè)對市場、銷售、客戶、支持和服務的全面管理,有效地解決企業(yè)分布在不同地理位置和不同網絡環(huán)境下的網絡化管理。電子商務企業(yè)CRM系統(tǒng)主要功能模塊如圖1所示。
電子商務企業(yè)CRM系統(tǒng)主要實現(xiàn)的目標:分析客戶信息、分析客戶計劃、分析客戶購買行為、分析客戶投訴滿意度、分析客戶反饋滿意度、分析產品銷售情況和產品查詢統(tǒng)計。
4.2 系統(tǒng)主要數(shù)據(jù)表的設計
電子商務企業(yè)CRM系統(tǒng)數(shù)據(jù)表主要包括區(qū)域表(Client_QYXX)、客戶級別表(Client_KHJB)、客戶信息表(KHXX)、客戶滿意程表(Client_KHMYD)、客戶銷售表(Client_KHXS)和客戶反饋信息表(Client_KHFK)等。以區(qū)域表(Client_QYXX)為例,其結構見表1。
5 結語
本文詳細分析和研究了數(shù)據(jù)挖掘關聯(lián)規(guī)則頻集算法(Apriori算法),同時從數(shù)據(jù)倉庫系統(tǒng)分析、數(shù)據(jù)倉庫設計過程、數(shù)據(jù)倉庫ETL設計和多維數(shù)據(jù)模型設計等方面對電子商務企業(yè)CRM系統(tǒng)進行數(shù)據(jù)倉庫設計,并對基于DM技術的電子商務CRM系統(tǒng)進行了總體設計和數(shù)據(jù)表設計?;贒M技術的電子商務CRM系統(tǒng)能夠從海量的客戶信息數(shù)據(jù)中提取或發(fā)現(xiàn)有價值的商業(yè)信息或規(guī)則,為企業(yè)決策層提供正確、合理的決策支持,進而提升企業(yè)的盈利能力和市場競爭力。
參 考 文 獻
[1]梁保恩.基于DM技術的電子商務CRM系統(tǒng)的研究[J].輕工科技,2016(5).
[2]王崢.面向電子商務的CRM系統(tǒng)分析與設計[D].北京:北京郵電大學,2012.
[3]肖婧.電子商務環(huán)境下咨詢企業(yè)的CRM系統(tǒng)應用研究[D].成都:西南交通大學,2015.
[責任編輯:鐘聲賢]