国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電信行業(yè)多維分析模型的構(gòu)建研究

2013-10-27 01:31:58陳立勇殷秀葉
關(guān)鍵詞:窗格字段數(shù)據(jù)源

陳立勇,殷秀葉

(周口師范學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,河南 周口 466001)

隨著我國(guó)電信行業(yè)的快速發(fā)展,各電信運(yùn)營(yíng)商的數(shù)據(jù)日趨龐大。我國(guó)的電信企業(yè)要想在國(guó)際競(jìng)爭(zhēng)中立于不敗之地,必須要依靠多維分析技術(shù),對(duì)企業(yè)龐大的數(shù)據(jù)進(jìn)行分析,從而為企業(yè)制定出準(zhǔn)確及時(shí)高效的決策,引領(lǐng)企業(yè)朝著正確的方向發(fā)展。

1 多維分析技術(shù)

當(dāng)前的數(shù)據(jù)存儲(chǔ)類型大致可分為三種方式:基于多維數(shù)據(jù)庫(kù)的MOLAP、基于關(guān)系數(shù)據(jù)庫(kù)的ROLAP以及兩者相結(jié)合的HOLAP。MOLAP是以多維的方式組織和存儲(chǔ)數(shù)據(jù),ROLAP則利用現(xiàn)有的關(guān)系數(shù)據(jù)庫(kù)技術(shù)來模擬多維數(shù)據(jù)。

關(guān)系型聯(lián)機(jī)分析處理(即ROLAP)以關(guān)系型結(jié)構(gòu)進(jìn)行多維數(shù)據(jù)的表示和存儲(chǔ),將多維結(jié)構(gòu)劃分為用來存儲(chǔ)事實(shí)數(shù)據(jù)的事實(shí)表和用來存儲(chǔ)維度數(shù)據(jù)的維度表。關(guān)系型聯(lián)機(jī)分析處理的特點(diǎn)是占用的空間小,能夠節(jié)省一定的系統(tǒng)空間,但是用戶分析查詢的速度會(huì)比較慢[1]。

多維聯(lián)機(jī)分析處理(即MOLAP)采用多維數(shù)組的方式存儲(chǔ)數(shù)據(jù)。這種處理方式的特點(diǎn)是不需要將多維數(shù)據(jù)模型中的維度、層次,類別和立方體的概念轉(zhuǎn)換成其他的物理模型,能夠提高用戶分析查詢的速度,但是缺點(diǎn)是加大了系統(tǒng)的存儲(chǔ)空間,產(chǎn)生了稀疏矩陣等問題。

通過對(duì)比我們發(fā)現(xiàn),本系統(tǒng)如果采用ROLAP的方式,則系統(tǒng)的分析查詢速度會(huì)達(dá)不到設(shè)計(jì)的要求,如果采用MOLAP的方式,系統(tǒng)的存儲(chǔ)空間將會(huì)受到很大的制約,所以,系統(tǒng)采用兩者相結(jié)合的方式,存儲(chǔ)細(xì)節(jié)數(shù)據(jù)使用ROLAP的方式,存儲(chǔ)匯總數(shù)據(jù)使用MOLAP的方式,即采用HOLAP的方式實(shí)現(xiàn)[2]。

2 系統(tǒng)多維模型的構(gòu)建

本系統(tǒng)采用Cognos的Powerplay組件進(jìn)行多維分析的構(gòu)建,然后使用Analysis Studio進(jìn)行多維分析的查看,并使用高級(jí)報(bào)表工具Report Studio制作高級(jí)管理報(bào)表,為網(wǎng)通管理人員提供決策支持。

2.1 定義數(shù)據(jù)源

系統(tǒng)主要使用iqd的文件類型作為數(shù)據(jù)源文件。使用iqd文件作為數(shù)據(jù)源文件能夠提高系統(tǒng)性能,并能夠直接在Transformer就能完成更新數(shù)據(jù)源的操作,且iqd文件只包含結(jié)構(gòu)信息,占用的空間小,減少了文件傳輸?shù)囊?guī)模。

本系統(tǒng)中的iqd文件是通過Cognos Impromptu Administrator生成,部分使用手工的方式生成。使用手工方式生成iqd文件時(shí),維表iqd文件中的SQL語句都有Order by字句按照ID字段進(jìn)行排序,且iqd字段的描述使用中文表示,雖然描述部分用戶最終并不使用,但是這樣能夠簡(jiǎn)化構(gòu)建者對(duì)信息的理解,降低出錯(cuò)的可能性;維表中每個(gè)維層次都有兩個(gè)字段,一為ID字段,一為Desc字段,在命名上,ID字段直接使用描述,Desc字段的描述加Desc,例如“月份”和“月份 Desc”。

2.2 創(chuàng)建多維模型

創(chuàng)建好數(shù)據(jù)源后,使用 Transformer創(chuàng)建模型,在Transformer中有維度圖、數(shù)據(jù)源、度量和PowerCubes四個(gè)窗格,可以利用這四個(gè)窗格創(chuàng)建多維模型[3]。

(1)集成數(shù)據(jù)源數(shù)據(jù)

在第一個(gè)步驟中我們已經(jīng)生成了iqd文件,在創(chuàng)建多維模型時(shí),首先通過 Transformer中的數(shù)據(jù)源(Data Sources)窗格將數(shù)據(jù)集成到模型中來。添加的iqd文件通??梢苑譃榫S表iqd和事實(shí)表iqd兩種。維表iqd實(shí)際上就是用來建立多維模型的維度;事實(shí)表iqd是用來建立模型的度量。系統(tǒng)中的每個(gè)數(shù)據(jù)源來自于一個(gè)數(shù)據(jù)源文件,每個(gè)數(shù)據(jù)源都有自己的數(shù)據(jù)源名,每個(gè)數(shù)據(jù)源由構(gòu)成它的若干列(Columns)組成。在Transformer有三種類型的數(shù)據(jù),分別是日期型、文本型和數(shù)值型。日期型主要存儲(chǔ)時(shí)間維度的數(shù)據(jù),文本型主要存儲(chǔ)結(jié)構(gòu)和類別數(shù)據(jù),數(shù)值型主要用于定義度量值。

系統(tǒng)還有一部分?jǐn)?shù)據(jù)源是以excel表格的形式集成到Transformer中的,所以本系統(tǒng)采用多數(shù)據(jù)源的方式。系統(tǒng)中的數(shù)據(jù)源分為兩種,分別是事務(wù)數(shù)據(jù)源和結(jié)構(gòu)數(shù)據(jù)源。事務(wù)數(shù)據(jù)源主要包含那些代表度量的事務(wù)數(shù)據(jù)(數(shù)值型數(shù)據(jù))和各個(gè)維度最底層的文本型數(shù)據(jù)。而結(jié)構(gòu)數(shù)據(jù)源主要是那些包含維度和層次信息的數(shù)據(jù),以文本型數(shù)據(jù)為主。

學(xué)院自創(chuàng)辦以來,已向社會(huì)輸送畢業(yè)生4000余名,近五年來畢業(yè)生就業(yè)率平均達(dá)95%以上。目前下設(shè)美術(shù)系、音樂系、環(huán)境設(shè)計(jì)系、視覺傳達(dá)設(shè)計(jì)系、數(shù)碼媒體藝術(shù)設(shè)計(jì)系、服裝與服飾設(shè)計(jì)系。現(xiàn)有少數(shù)民族藝術(shù)和文藝學(xué)博士點(diǎn)導(dǎo)師2位,擁有一級(jí)學(xué)科碩士學(xué)位授權(quán)(藝術(shù)學(xué)理論、美術(shù)學(xué))2個(gè)、藝術(shù)專業(yè)碩士1個(gè)(涵蓋美術(shù)、音樂和設(shè)計(jì)方向)、二級(jí)學(xué)科碩士學(xué)位授權(quán)(中國(guó)少數(shù)民族藝術(shù))1個(gè)、本科專業(yè)6個(gè)(美術(shù)學(xué)、音樂學(xué)、繪畫、環(huán)境設(shè)計(jì)、視覺傳達(dá)設(shè)計(jì)、服裝與服飾設(shè)計(jì))。在校本科生、研究生1000余人。

在創(chuàng)建多數(shù)據(jù)源時(shí),對(duì)于不同數(shù)據(jù)源中的相同列,必須使用相同的名稱,各結(jié)構(gòu)數(shù)據(jù)源中的層次必須唯一,這樣在對(duì)結(jié)構(gòu)數(shù)據(jù)源和事務(wù)數(shù)據(jù)源進(jìn)行關(guān)聯(lián)時(shí)能夠降低出錯(cuò)的幾率[4]。且對(duì)于事務(wù)數(shù)據(jù)源不能全是各個(gè)維度最底層的文本型數(shù)據(jù),必須至少有一個(gè)度量數(shù)據(jù),如圖1中的銷售收入、銷售成本和銷售數(shù)量。

圖1 Transformer窗格

(2)定義模型需要的度量

系統(tǒng)中的度量分為三種類型,分別是標(biāo)準(zhǔn)度量、計(jì)算度量、類別計(jì)數(shù)。標(biāo)準(zhǔn)度量是指由數(shù)據(jù)源中的列直接定義的度量;計(jì)算度量是指需要在標(biāo)準(zhǔn)度量的基礎(chǔ)上進(jìn)行計(jì)算才能夠得到的度量。計(jì)算度量的創(chuàng)建過程中主要運(yùn)用的計(jì)算方法有:計(jì)數(shù)、求和、最小值、最大值、平均值,詳細(xì)情況如圖2所示。

圖2 度量的計(jì)算方法

類別計(jì)數(shù)是指具有唯一屬性的維度的一層。類別計(jì)數(shù)是計(jì)算類別數(shù)的一種度量類型,它用于為選定的維度和層計(jì)算唯一值和非零值,例如,在統(tǒng)計(jì)某天購(gòu)買某種產(chǎn)品的客戶數(shù)量時(shí),可能一個(gè)客戶在同一天購(gòu)買了幾次某種產(chǎn)品,但統(tǒng)計(jì)時(shí)只能計(jì)為一個(gè)客戶,所以,客戶計(jì)數(shù)只能計(jì)算一次[5]。

度量的定義是在度量窗格中(Measures)完成。度量與維度的最底一層關(guān)聯(lián),每個(gè)標(biāo)準(zhǔn)度量要在數(shù)據(jù)源中對(duì)應(yīng)有一個(gè)列(計(jì)算度量除外)。

本系統(tǒng)的度量主要有銷售收入、銷售成本、銷售利潤(rùn)、銷售數(shù)量以及與流程有關(guān)的一些業(yè)務(wù)數(shù)據(jù)等。

(3)建立維度圖

多維數(shù)據(jù)是按著直觀和貼近業(yè)務(wù)規(guī)則的方式組織起來的數(shù)據(jù)。被組合的數(shù)據(jù)能夠回答與業(yè)務(wù)有關(guān)的問題。通過從多個(gè)角度觀察數(shù)據(jù),能確切地發(fā)現(xiàn)其內(nèi)部的某種趨勢(shì)和某種信息。Transformer將我們分析業(yè)務(wù)的角度構(gòu)造成維度,將我們分析數(shù)據(jù)的粒度構(gòu)造成維度上的層次,將維度的取值構(gòu)造成類別,以此來實(shí)現(xiàn)多維數(shù)據(jù)的組織。為了反映業(yè)務(wù)的組織結(jié)構(gòu),多維數(shù)據(jù)是按級(jí)分層(Levels)構(gòu)成維度,而每一層則是由類別(Categories)組成,最高層是對(duì)數(shù)據(jù)的概括性說明,以下的各層依次表示比其上一層更詳細(xì)的數(shù)據(jù)。系統(tǒng)維度、層次和類別的關(guān)系如圖3所示。

圖3 維度、層次、類別關(guān)系圖

Cognos通過維度圖窗格(Dimension Map)創(chuàng)建多維結(jié)構(gòu)的維度和層次,并生成類別。由于系統(tǒng)中的時(shí)間維度是到日層次的,而Transformer默認(rèn)的標(biāo)準(zhǔn)日期維度的層是年、季度和月,所以我們還需要定義日維度層次,Transformer日維度層次的是通過日期函數(shù)Date Function來完成的,只需要把銷售日期從數(shù)據(jù)源窗格拖到維度圖窗格日期的最下端作為一個(gè)新層,并加以創(chuàng)建即可完成維度層次日的定義,之后再生成日層次上的類別。

生成類別并不意味著生成立方體,此時(shí)在維度圖示中雖然能夠看到類別,但它們還沒有和度量關(guān)聯(lián)起來[6]。所以確定完維度和層次,還需要將維度和度量關(guān)聯(lián)起來,關(guān)聯(lián)完成后便可以生成數(shù)據(jù)立方體了。

2.3 生成多維立方體

維度和度量準(zhǔn)確的創(chuàng)建后,即可生成多維立方體了,系統(tǒng)需要為Cube進(jìn)行權(quán)限的設(shè)置,通過劃分用戶的類別來控制用戶的權(quán)限,創(chuàng)建用戶類的工作完成后,就可以為Cube指定可以訪問的用戶類和數(shù)據(jù)分配的權(quán)限了。將可以訪問Cube的用戶添加到Cube中,然后對(duì)每個(gè)用戶類可以訪問的數(shù)據(jù)進(jìn)行分配,系統(tǒng)按照地市維度來進(jìn)行權(quán)限分配。權(quán)限分配好以后,模型的生成便徹底完成了,系統(tǒng)統(tǒng)一使用.mdl格式存儲(chǔ)多維模型[7]。

2.4 發(fā)布模型

系統(tǒng)通過Framework Manager發(fā)布CUBE模型。選擇Cognos Powercube類型的數(shù)據(jù)源。輸入CUBE立方體文件的存放路徑及訪問密碼。然后進(jìn)行測(cè)試,測(cè)試成功后即可將模型打包發(fā)布[8]。

3 結(jié)論

本文結(jié)合多維分析技術(shù)的特點(diǎn),以網(wǎng)通決策支持系統(tǒng)為基礎(chǔ),研究了電信行業(yè)多維分析模型的構(gòu)建過程。在競(jìng)爭(zhēng)日趨激烈的今天,如何幫助企業(yè)節(jié)約成本,提高決策的效率和準(zhǔn)確性,關(guān)乎到企業(yè)發(fā)展的命運(yùn),因此,企業(yè)的決策支持系統(tǒng)至關(guān)重要,而一個(gè)良好的企業(yè)決策支持系統(tǒng)的是建立在科學(xué)合理的多維分析模型的基礎(chǔ)之上,所以,多維分析模型的構(gòu)建研究對(duì)于企業(yè)的發(fā)展起著非常重要的作用。

[1]趙博,葉曉俊.OLAP性能測(cè)試方法研究與實(shí)現(xiàn)[J].計(jì)算機(jī)研究與發(fā)展,2011,48(10).

[2]孫平,李光亞.養(yǎng)老保險(xiǎn)分析決策系統(tǒng)中數(shù)據(jù)多維分析的設(shè)計(jì)[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(9).

[3]陳啟買,賀超渡,劉海.基于OLAP的高校教學(xué)協(xié)同決策[J].計(jì)算機(jī)應(yīng)用,2009(1).

[4]高翔,劉峰,張殿東.商業(yè)銀行數(shù)據(jù)倉(cāng)庫(kù)建模研究與設(shè)計(jì)[J].計(jì)算機(jī)與數(shù)字工程,2010,38(8).

[5]徐琴,彭宇揚(yáng),彭自成.電子商城的數(shù)據(jù)倉(cāng)庫(kù)建模研究[J].計(jì)算機(jī)與現(xiàn)代化,2010(7).

[6]林向陽,高展.數(shù)據(jù)建模在數(shù)據(jù)倉(cāng)庫(kù)建設(shè)中的應(yīng)用[J].微計(jì)算機(jī)信息,2010,26(2 -3).

[7]陳磊,孫四明,董碧丹.基于Cube的數(shù)據(jù)展現(xiàn)結(jié)構(gòu)的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(9).

[8]Report Portal 3.0,from XMLA consulting[EB/OL].http://www.reportportal.com,2010.

猜你喜歡
窗格字段數(shù)據(jù)源
圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
古典藝術(shù)審美——閩南古厝特色窗格
Windows 10三大隱含窗格應(yīng)用
Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評(píng)價(jià)研究
基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評(píng)價(jià)算法
CNMARC304字段和314字段責(zé)任附注方式解析
無正題名文獻(xiàn)著錄方法評(píng)述
關(guān)于CNMARC的3--字段改革的必要性與可行性研究
分布式異構(gòu)數(shù)據(jù)源標(biāo)準(zhǔn)化查詢?cè)O(shè)計(jì)與實(shí)現(xiàn)
崇左市| 宣威市| 垣曲县| 茌平县| 诏安县| 涟源市| 台湾省| 同江市| 萨迦县| 明溪县| 特克斯县| 时尚| 漳州市| 阿克| 射洪县| 青铜峡市| 十堰市| 日土县| 越西县| 六枝特区| 肥城市| 隆子县| 泸西县| 昭平县| 上思县| 黄浦区| 武功县| 大足县| 宁安市| 专栏| 道孚县| 吉水县| 观塘区| 惠安县| 西乡县| 长丰县| 庆阳市| 武平县| 镇江市| 阳春市| 古丈县|