張曦征 安徽省體育彩票管理中心 230001
數(shù)據(jù)倉(cāng)庫(kù)在體育彩票行業(yè)網(wǎng)點(diǎn)運(yùn)營(yíng)管理中的應(yīng)用
張曦征 安徽省體育彩票管理中心 230001
隨著我國(guó)體育彩票事業(yè)的飛速發(fā)展,彩票銷(xiāo)售數(shù)據(jù)不斷攀升,銷(xiāo)售網(wǎng)點(diǎn)急劇增長(zhǎng),如何對(duì)這些急劇增長(zhǎng)的銷(xiāo)售網(wǎng)點(diǎn)進(jìn)行科學(xué)有效地管理成為了體彩中心一個(gè)迫切需要解決的問(wèn)題。本文作者通過(guò)對(duì)體育彩票業(yè)務(wù)進(jìn)行需求分析,基于數(shù)據(jù)倉(cāng)庫(kù)和OLAP分析技術(shù),構(gòu)建了以體育彩票銷(xiāo)售為主題的數(shù)據(jù)倉(cāng)庫(kù)并進(jìn)行多維數(shù)據(jù)分析。
體育彩票;網(wǎng)點(diǎn)管理;數(shù)據(jù)倉(cāng)庫(kù);OLAP
Sports Lottery;Outlets Management;Data Warehouse;OLAP
隨著我國(guó)改革開(kāi)放的深入以及社會(huì)主義市場(chǎng)經(jīng)濟(jì)的建立,體育彩票業(yè)經(jīng)過(guò)近十幾年的發(fā)展,從無(wú)到有,至今已經(jīng)取得了令人矚目的成績(jī),并逐步發(fā)展成為我國(guó)體育經(jīng)濟(jì)的支柱性產(chǎn)業(yè)。根據(jù)安徽省體彩中心數(shù)據(jù),從2000年到2011年的11年間,安徽體彩的年銷(xiāo)量翻了近5番,增長(zhǎng)了近30倍,銷(xiāo)售網(wǎng)點(diǎn)從最初的400個(gè)拓展到了目前的5600余個(gè)。如何對(duì)這些急劇增長(zhǎng)的銷(xiāo)售網(wǎng)點(diǎn)進(jìn)行科學(xué)有效地管理成為了體彩中心一個(gè)迫切需要解決的問(wèn)題。
體育彩票在計(jì)算機(jī)系統(tǒng)中儲(chǔ)存著大量的數(shù)據(jù),記錄著歷年的網(wǎng)點(diǎn)、分中心、銷(xiāo)售值等相當(dāng)豐富的數(shù)據(jù)信息。通過(guò)使用數(shù)據(jù)倉(cāng)庫(kù)技術(shù),將大量的、分散的數(shù)據(jù)進(jìn)行有效集成,使得信息更加容易存取并更具使用價(jià)值,并為制定有效的網(wǎng)點(diǎn)分布管理調(diào)整策略提供幫助。
1.1 數(shù)據(jù)倉(cāng)庫(kù)
隨著數(shù)據(jù)日益劇增,人們不再只滿足于數(shù)據(jù)庫(kù)提供的查詢功能,提出了更深層次的問(wèn)題:即能不能從大量的數(shù)據(jù)中提取出蘊(yùn)藏于其中的知識(shí)來(lái)為決策提供服務(wù)。數(shù)據(jù)倉(cāng)庫(kù)正是在這種情況下應(yīng)運(yùn)而生。
著名學(xué)者W.H.Inmon對(duì)數(shù)據(jù)倉(cāng)庫(kù)所下的定義是:“數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)的集合,用于支持管理決策過(guò)程”。從所給的定義可以看出,數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)綜合的解決方案,主要用來(lái)幫助企業(yè)相關(guān)主管部門(mén)和業(yè)務(wù)人員做出更符合企業(yè)業(yè)務(wù)發(fā)展規(guī)律的決策[1]。
根據(jù)W.H.Inmon給出的定義,數(shù)據(jù)倉(cāng)庫(kù)具有以下四個(gè)基本特征[2]:面向主題(Subject Oriented)性、數(shù)據(jù)的集成(Integrated)性、數(shù)據(jù)的時(shí)變(Time Variant)性和數(shù)據(jù)的非易失(Nonvolatile)性。
數(shù)據(jù)倉(cāng)庫(kù)處理包括許多方面的內(nèi)容,主要可分為數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)展現(xiàn)兩大部分:
(1)數(shù)據(jù)準(zhǔn)備:
充分了解決策需求;
根據(jù)數(shù)據(jù)倉(cāng)庫(kù)方法設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu);
將業(yè)務(wù)系統(tǒng)數(shù)據(jù)向數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)進(jìn)行移動(dòng)(包括復(fù)制、抽取、清洗…);
將數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)向小規(guī)模數(shù)據(jù)集市的數(shù)據(jù)進(jìn)行復(fù)制和分布。
(2)數(shù)據(jù)展現(xiàn):
面向高層決策者的主管信息系統(tǒng)(EIS);
面向決策分析者的聯(lián)機(jī)分析系統(tǒng)(OLAP);
為各層決策者提供服務(wù)的即席查詢系統(tǒng)(Ad Hoc);
為報(bào)表提供服務(wù)的靈活報(bào)表系統(tǒng)(Reporting);
采用多種靈活的方式進(jìn)行數(shù)據(jù)展現(xiàn),比如采用客戶/服務(wù)器模式或?yàn)g覽器模式等。
1.2 聯(lián)機(jī)分析處理
聯(lián)機(jī)分析處理 (OLAP) 的概念由關(guān)系數(shù)據(jù)庫(kù)之父E.F.Codd在1993年最早提出。OLAP委員會(huì)作了如下定義:OLAP是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對(duì)從原始數(shù)據(jù)中轉(zhuǎn)化出來(lái)的、能夠真正為用戶所理解的、并真實(shí)反映企業(yè)維特性的信息進(jìn)行快速、一致、交互地存取,從而獲得對(duì)數(shù)據(jù)的更深入了解的一類(lèi)軟件技術(shù)。
OLAP的目標(biāo)是滿足決策支持或者滿足在多維環(huán)境下特定的查詢和報(bào)表需求,它的技術(shù)核心是“維”(dimension)這個(gè)概念[3]。因此,OLAP也可以說(shuō)是多維數(shù)據(jù)分析工具的集合。
“維”是人們觀察客觀世界的某個(gè)角度,是一種高層次的類(lèi)型劃分?!熬S”一般包含層次關(guān)系,而這種層次關(guān)系有時(shí)會(huì)極其復(fù)雜。通過(guò)把一個(gè)實(shí)體中多項(xiàng)重要的屬性定義成多個(gè)維,使用戶能將定義好的這些不同的維上的數(shù)據(jù)進(jìn)行比較[4]。
“維”的幾個(gè)基本概念:
(1)維:“維”是人們觀察問(wèn)題的特定角度,例如:時(shí)間維、產(chǎn)品維、地理維。
(2)維層次:人們?cè)谟^察數(shù)據(jù)的某個(gè)特定角度(即某個(gè)維)可以根據(jù)細(xì)節(jié)程度分為多個(gè)描述方面,這多個(gè)描述方面就稱(chēng)為維的層次。
(3)維成員:在維上的一個(gè)取值就是該維的一個(gè)維成員。如果維已經(jīng)分成了多層次的,則維成員就是不同維層次取值的組合。
(4)多維數(shù)據(jù)集:數(shù)據(jù)立方體或超立方多維數(shù)據(jù)集是指用三維或更多的維數(shù)來(lái)描述一個(gè)對(duì)象,多維數(shù)據(jù)集既是決策支持的支柱,也是OLAP的核心。另外,多維數(shù)據(jù)集可用一個(gè)多維數(shù)組來(lái)表示。
1.3 數(shù)據(jù)倉(cāng)庫(kù)與OLAP的關(guān)系
在數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)倉(cāng)庫(kù)和OLAP密不可分,但是兩者概念不同。
數(shù)據(jù)倉(cāng)庫(kù)是包含企業(yè)歷史數(shù)據(jù)的大規(guī)模數(shù)據(jù)庫(kù),而這些歷史數(shù)據(jù)是用來(lái)提供企業(yè)的經(jīng)營(yíng)分析和決策支持的。
OLAP則以多維分析為基礎(chǔ),重點(diǎn)在管理和決策過(guò)程中對(duì)數(shù)據(jù)進(jìn)行多層面和多角度的分析處理。由于需要從不同角度分析數(shù)據(jù)來(lái)進(jìn)行決策,因此以多維數(shù)據(jù)為核心的多維數(shù)據(jù)分析自然就成為了決策的主要內(nèi)容。OLAP雖然先于數(shù)據(jù)倉(cāng)庫(kù)提出,由于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)很難提供按多維方式組織數(shù)據(jù)的環(huán)境,而數(shù)據(jù)倉(cāng)庫(kù)的組織形式則為0LAP提供了理想的數(shù)據(jù)環(huán)境,所以數(shù)據(jù)倉(cāng)庫(kù)一出現(xiàn),兩者便迅速結(jié)合在一起。
圖1展現(xiàn)了數(shù)據(jù)倉(cāng)庫(kù)與 OLAP 的關(guān)系,從圖中可以看出,OLAP 技術(shù)利用數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行聯(lián)機(jī)分析,再將復(fù)雜的分析查詢結(jié)果迅速返回給用戶。OLAP利用多維數(shù)據(jù)集和數(shù)據(jù)聚集技術(shù)對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)分別進(jìn)行組織和匯總,再采用聯(lián)機(jī)分析和可視化工具對(duì)這些數(shù)據(jù)進(jìn)行分析評(píng)價(jià),有效地提高了用戶復(fù)雜查詢的要求,因此數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu)直接影響了立方體的設(shè)計(jì)和構(gòu)造,也影響了 OLAP 的工作效率。
圖1 數(shù)據(jù)倉(cāng)庫(kù)與OLAP的關(guān)系
數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)是一個(gè)復(fù)雜的過(guò)程,它包括以下一些主要工作和活動(dòng)[5]:
定義數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu),進(jìn)行容量規(guī)劃,選擇合適的存儲(chǔ)服務(wù)器、數(shù)據(jù)庫(kù)、OLAP服務(wù)器以及其他工具;
將服務(wù)器、存儲(chǔ)和客戶端工具進(jìn)行集成;
設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)的模型和視圖;
定義物理的數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)、數(shù)據(jù)的存放、分區(qū)以及訪問(wèn)方法;
連接數(shù)據(jù)源,可使用數(shù)據(jù)網(wǎng)關(guān)、ODBC驅(qū)動(dòng)程序或其他封裝器;
設(shè)計(jì)腳本程序,用來(lái)實(shí)現(xiàn)數(shù)據(jù)的抽取、清洗、轉(zhuǎn)換、裝載和刷新;
將數(shù)據(jù)庫(kù)的模式、視圖定義、腳本以及其他的元數(shù)據(jù)裝入數(shù)據(jù)倉(cāng)庫(kù);
設(shè)計(jì)并實(shí)現(xiàn)終端用戶的應(yīng)用程序;
將數(shù)據(jù)倉(cāng)庫(kù)和基于它的應(yīng)用投入使用。
2.1 數(shù)據(jù)倉(cāng)庫(kù)概念模型設(shè)計(jì)
2.1.1 主題確定
對(duì)于彩票業(yè)的決策者和管理者來(lái)說(shuō),最關(guān)心的是體育彩票的市場(chǎng)銷(xiāo)售情況。具體到對(duì)各體彩銷(xiāo)售網(wǎng)點(diǎn)的管理,希望通過(guò)了解和掌握各網(wǎng)點(diǎn)的銷(xiāo)售情況,各網(wǎng)點(diǎn)的銷(xiāo)售排名,各網(wǎng)點(diǎn)銷(xiāo)售數(shù)據(jù)與往年的對(duì)比等,為安徽省體彩中心制定有效的網(wǎng)點(diǎn)分布管理調(diào)整策略提供幫助。
因此,數(shù)據(jù)倉(cāng)庫(kù)確定主題為體育彩票銷(xiāo)售信息,相應(yīng)的數(shù)據(jù)源包括:體彩網(wǎng)點(diǎn)銷(xiāo)售數(shù)據(jù)、網(wǎng)點(diǎn)信息數(shù)據(jù)、彩種信息數(shù)據(jù)、福彩銷(xiāo)售數(shù)據(jù)。
2.1.2 維度確定
重點(diǎn)考慮銷(xiāo)售、網(wǎng)點(diǎn)及彩種的密切關(guān)系,所以數(shù)據(jù)倉(cāng)庫(kù)的維度包括時(shí)間、地區(qū)、彩種三個(gè)維度:
(1)時(shí)間維度:時(shí)間是統(tǒng)計(jì)信息中最常用的元素,包括年、季度、月、周、日等統(tǒng)計(jì)信息;
(2)地區(qū)維度:包括省、市、縣等,記錄各個(gè)地區(qū)的名稱(chēng)、代碼等基本信息;
(3)彩種維度:包括體育彩票的彩種和彩種類(lèi)別等屬性。
2.1.3 粒度確定
粒度是指數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級(jí)別[6][7]。在數(shù)據(jù)倉(cāng)庫(kù)中確定粒度時(shí),需要考慮以下幾個(gè)因素:要接受的分析類(lèi)型,可接受的數(shù)據(jù)最低粒度,能夠存儲(chǔ)的數(shù)據(jù)量等[8]。實(shí)際上,數(shù)據(jù)粒度的確定是業(yè)務(wù)分析、軟件、硬件和數(shù)據(jù)倉(cāng)庫(kù)使用方法的一個(gè)折中,并不是細(xì)節(jié)程度越高越好,過(guò)低的粒度會(huì)造成很大的數(shù)據(jù)規(guī)模,在分析過(guò)程中給系統(tǒng)增加過(guò)大的負(fù)擔(dān)而降低系統(tǒng)效率。因此,需要很好地權(quán)衡數(shù)據(jù)粒度級(jí)別。
體育彩票屬于數(shù)據(jù)密集型行業(yè),每天都會(huì)產(chǎn)生大量的數(shù)據(jù),由于本系統(tǒng)的產(chǎn)品用戶為安徽省中心工作管理人員、市中心管理工作人員、彩票中心直屬管理單位、網(wǎng)點(diǎn)業(yè)主和彩民,需要非常細(xì)致真實(shí)的數(shù)據(jù),因此,本項(xiàng)目主題的粒度級(jí)別是要是做到低粒度的,如下所示:
(1)時(shí)間粒度線:年→季度→月→周→彩期→日;
(2)地區(qū)粒度線:安徽省→市→縣→單一網(wǎng)點(diǎn);
(3)彩種粒度線:彩票類(lèi)別→具體彩種。
2.1.4 度量值確定
度量值是管理者和決策者最關(guān)心的數(shù)據(jù),也是用戶瀏覽時(shí)重點(diǎn)查看的數(shù)據(jù)。選取的度量值通常取決于最終用戶所請(qǐng)示的信息類(lèi)型。本項(xiàng)目選擇體育彩票銷(xiāo)售量為度量值。
2.2 數(shù)據(jù)倉(cāng)庫(kù)邏輯模型設(shè)計(jì)
邏輯模型是讓數(shù)據(jù)信息從現(xiàn)實(shí)世界轉(zhuǎn)化到物理存儲(chǔ)的中間媒介。最常見(jiàn)的數(shù)據(jù)倉(cāng)庫(kù)模型有星型模型和雪花模型[9]。
星型結(jié)構(gòu)是以事實(shí)表為核心,其他的維度表圍繞這個(gè)核心表呈星型分布。
雪花模型是對(duì)星型模型的擴(kuò)展,增加了用戶必須處理的表數(shù)量,增加了某些查詢的復(fù)雜性,但這種方式可以使系統(tǒng)進(jìn)一步專(zhuān)業(yè)化和實(shí)用化,通過(guò)最大限度地減少數(shù)據(jù)存儲(chǔ)量以及聯(lián)合較小的維表來(lái)改善查詢性能。
本系統(tǒng)采用雪花模型,如圖2所示。
圖2 體彩銷(xiāo)售主題的雪花模型
2.3 數(shù)據(jù)倉(cāng)庫(kù)物理模型設(shè)計(jì)
物理模型表示數(shù)據(jù)在硬件環(huán)境中的存儲(chǔ)細(xì)節(jié)。由于數(shù)據(jù)倉(cāng)庫(kù)中,事實(shí)表的數(shù)據(jù)量非常巨大,占用存儲(chǔ)空間較多,需要采用分區(qū)來(lái)將事實(shí)表分割成有利于管理的更小的單元。根據(jù)年份進(jìn)行分區(qū),將每一年的數(shù)據(jù)存儲(chǔ)成單獨(dú)的一個(gè)文件。另外,通過(guò)手動(dòng)添加索引,進(jìn)行查詢優(yōu)化。
2.4 數(shù)據(jù)倉(cāng)庫(kù)的ETL過(guò)程
ETL即數(shù)據(jù)抽取、轉(zhuǎn)換和加載,是數(shù)據(jù)倉(cāng)庫(kù)實(shí)現(xiàn)過(guò)程中,將數(shù)據(jù)由數(shù)據(jù)源系統(tǒng)向數(shù)據(jù)倉(cāng)庫(kù)建立加載的主要方法。
2.4.1 數(shù)據(jù)抽取
數(shù)據(jù)抽取即從數(shù)據(jù)源系統(tǒng)中抽取數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)所需的數(shù)據(jù)。數(shù)據(jù)抽取既要能夠充分滿足決策系統(tǒng)的需要,又要保證不影響業(yè)務(wù)系統(tǒng)的性能,所以在數(shù)據(jù)抽取時(shí)要制定相應(yīng)的策略。一般來(lái)說(shuō),數(shù)據(jù)抽取策略大體分可分同步實(shí)時(shí)抽取和異步數(shù)據(jù)抽取兩大類(lèi)。
在本系統(tǒng)中,源數(shù)據(jù)包括體彩網(wǎng)點(diǎn)銷(xiāo)售數(shù)據(jù)、網(wǎng)點(diǎn)信息數(shù)據(jù)、彩種信息數(shù)據(jù)、福彩銷(xiāo)售數(shù)據(jù)。這些源數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)量特別大,屬于流水型增長(zhǎng)的數(shù)據(jù),因此,選用異步數(shù)據(jù)抽取的方法。對(duì)于體彩網(wǎng)點(diǎn)銷(xiāo)售數(shù)據(jù),抽取時(shí)機(jī)選擇在各彩種的彩期銷(xiāo)售截止后15分鐘;抽取周期為各彩種的彩期。對(duì)于網(wǎng)點(diǎn)信息數(shù)據(jù)和彩種信息數(shù)據(jù),抽取時(shí)機(jī)選擇在凌晨12點(diǎn),避免業(yè)務(wù)系統(tǒng)的使用高峰期;抽取周期為天。對(duì)于福彩銷(xiāo)售數(shù)據(jù),與體彩銷(xiāo)售系統(tǒng)是獨(dú)立的,由用戶根據(jù)需要手工執(zhí)行福彩數(shù)據(jù)抓取將數(shù)據(jù)導(dǎo)入至數(shù)據(jù)倉(cāng)庫(kù)。
2.4.2 數(shù)據(jù)轉(zhuǎn)換
數(shù)據(jù)轉(zhuǎn)換是對(duì)抽取的源數(shù)據(jù)根據(jù)數(shù)據(jù)倉(cāng)庫(kù)模型的要求,進(jìn)行數(shù)據(jù)的轉(zhuǎn)換、清洗、拆分和匯總等處理,保證來(lái)自不同系統(tǒng)、不同格式的數(shù)據(jù)具有一致性和完整性,再根據(jù)要求裝入數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)轉(zhuǎn)換工作一般會(huì)在以下幾個(gè)環(huán)節(jié)中進(jìn)行具體實(shí)現(xiàn):
在抽取過(guò)程中進(jìn)行數(shù)據(jù)處理;
以文件方式處理,使用異步數(shù)據(jù)加載;
在數(shù)據(jù)加載過(guò)程中進(jìn)行數(shù)據(jù)處理;
進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后再進(jìn)行數(shù)據(jù)處理。
在本系統(tǒng)中,源數(shù)據(jù)類(lèi)別屬于流水型增長(zhǎng)數(shù)據(jù),數(shù)據(jù)抽取選用的是異步數(shù)據(jù)抽取,而且轉(zhuǎn)換效率和安全性要求比較高,選用以文件方式處理的數(shù)據(jù)轉(zhuǎn)換方法。
2.4.3 數(shù)據(jù)加載
數(shù)據(jù)加載是將轉(zhuǎn)換后的數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中,可以采用數(shù)據(jù)加載工具,也可以采用API編程進(jìn)行數(shù)據(jù)加載。數(shù)據(jù)加載周期要綜合考慮經(jīng)營(yíng)分析需求和系統(tǒng)加載的代價(jià),對(duì)不同業(yè)務(wù)系統(tǒng)的數(shù)據(jù)采用不同的加載周期,但必須保證同一時(shí)間業(yè)務(wù)數(shù)據(jù)的一致性和完整性。數(shù)據(jù)的追加策略根據(jù)數(shù)據(jù)抽取策略和業(yè)務(wù)規(guī)則確定,一般分為直接追加、全部覆蓋和更新追加三種類(lèi)型。根據(jù)追加類(lèi)型的適用范圍,采用直接追加的方式。
具體的處理流程如圖3所示。
OLAP的基本多維分析操作包括鉆?。╮oll up和drill down)、切片(slice)和切塊(dice)以及旋轉(zhuǎn)(pivot)等[10]。
鉆取是通過(guò)改變維的層次來(lái)變換分析的粒度。它包括向上鉆?。╮oll up)和向下鉆?。╠rill down)。向上鉆取是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維數(shù);而向下鉆取則正好相反,它將匯總數(shù)據(jù)深入到更細(xì)節(jié)的數(shù)據(jù)進(jìn)行觀察,或者增加新維。
切片和切塊是在一部分維上選定值后,關(guān)心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有兩個(gè),則是切片;如果有三個(gè)或以上剩余的維,則是切塊。
旋轉(zhuǎn)是變換維的方向,即將表格中維的位置重新安排(例如行列互換)。
通過(guò)OLAP的基本操作進(jìn)行切片、切塊、鉆取等進(jìn)行數(shù)據(jù)分析,下面給出部分系統(tǒng)展示結(jié)果,如圖4所示。
圖3 ELT處理流程
圖4 部分系統(tǒng)OLAP展示圖
本文通過(guò)開(kāi)發(fā)網(wǎng)點(diǎn)數(shù)據(jù)倉(cāng)庫(kù),將體育彩票的各項(xiàng)業(yè)務(wù)數(shù)據(jù)進(jìn)行有效組織管理,將原來(lái)的分級(jí)管理模式轉(zhuǎn)變成現(xiàn)在的統(tǒng)一管理的增強(qiáng)型模式,極大提高了工作效率和質(zhì)量,并為制定有效的網(wǎng)點(diǎn)分布管理調(diào)整策略提供了科學(xué)幫助。本項(xiàng)目已經(jīng)實(shí)施成功,在實(shí)際應(yīng)用中效果良好。
[1]王麗珍,周麗華,陳紅梅,肖清. 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘原理及應(yīng)用. 科學(xué)出版社. 2009.9
[2]W.H.Inmon著,王志海等譯. 數(shù)據(jù)倉(cāng)庫(kù). 機(jī)械工業(yè)出版社,2000
[3]楊雪南. 數(shù)據(jù)倉(cāng)庫(kù)和知識(shí)發(fā)現(xiàn)技術(shù). 中國(guó)計(jì)算機(jī)報(bào), 1999.8,總847期
[4]宋曉宇,王永金等. 數(shù)據(jù)集成與應(yīng)用集成.水利水電出版社,2008.7
[5]段云峰,吳唯寧,李劍威,韓潔. 數(shù)據(jù)倉(cāng)庫(kù)及其在電信領(lǐng)域中的應(yīng)用. 電子工業(yè)出版社,2003.10
[6]李靜. 數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)粒度確定原則. 計(jì)算機(jī)與現(xiàn)代化, 2007,2
[7]夏秀峰,周大海,張雅茜等. 數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)中低粒度數(shù)據(jù)的分割策略研究. 計(jì)算機(jī)工程,2006,32
[8]呂海燕,車(chē)曉偉. 數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)粒度的劃分. 計(jì)算機(jī)工程與設(shè)計(jì),2009,30(9)
[9]Ralph Kimball. The Data Warehouse Lifecycle Toolkit: Expert Methods for Designing, Developing and Deploying Data Warehouse. Wiley Computer Publishing. 1998
[10]Micheline Kanber著,范明,孟小峰等譯. 數(shù)據(jù)挖掘概念與技術(shù). 機(jī)械工業(yè)出版社, 2001
Applied Research Based on Software Configuration Management Patterns and Anti-patterns
Zhang Xi-zheng
With the rapid development of the sports lottery industry, lottery sales data and the sales outlets is increasing very fast. How to effectively manage the rapid growth of sales outlets has become an urgent problem to be solved. Accroding to the the demand analysis, this paper builds the data warehouse and OLAP on it by choosing the most representative sports lottery sales subject.
10.3969/j.issn.1001-8972.2012.08.072