国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

經(jīng)濟統(tǒng)計工作中數(shù)據(jù)挖掘技術(shù)的應(yīng)用分析

2014-04-29 00:44張振普
中國電子商情 2014年11期
關(guān)鍵詞:決策樹數(shù)據(jù)挖掘決策

張振普

引言:斗轉(zhuǎn)星移,歷史變遷。經(jīng)濟不斷進步中,我國經(jīng)濟統(tǒng)計數(shù)據(jù)中一些問題凸顯,如果沿用舊的的經(jīng)濟統(tǒng)計數(shù)據(jù)方式,對經(jīng)濟發(fā)展探索和決策極為不利。不能深層次開展統(tǒng)計數(shù)據(jù)的分,使得經(jīng)濟數(shù)據(jù)中的潛在關(guān)系,沒有辦法發(fā)掘。所以,在傳統(tǒng)的統(tǒng)計數(shù)據(jù)中下使得處理方式不斷更新,實現(xiàn)經(jīng)濟的決策促進,有著重要意義。本文主要對數(shù)據(jù)挖掘技術(shù)概念和產(chǎn)生進行了闡述,并且對在經(jīng)濟統(tǒng)計方面的應(yīng)用展開了詳細的分析。

經(jīng)濟統(tǒng)計工作雖然一直在進行,但是其中存在著多反面的問題。在經(jīng)濟統(tǒng)計分析方面有著數(shù)字匯總簡單羅列的問題,非常不利于統(tǒng)計部門依照統(tǒng)計結(jié)果做出科學(xué)的決策。這就要求新形勢下的經(jīng)濟統(tǒng)計工作進行深度的數(shù)據(jù)挖掘,不斷適應(yīng)新的經(jīng)濟統(tǒng)計分析需要。

一、數(shù)據(jù)挖掘技術(shù)內(nèi)涵

經(jīng)濟社會的發(fā)展,使得經(jīng)濟工作中,需要分析的經(jīng)濟數(shù)據(jù)增多。在對經(jīng)濟分析需求增大的條件下,數(shù)據(jù)挖掘技術(shù)營運而生。經(jīng)濟統(tǒng)計工作中的數(shù)據(jù)挖掘技術(shù),是一種在不全面的、

模糊的、隨機經(jīng)濟數(shù)據(jù)中,分析得到潛在信息,接著對獲取的數(shù)據(jù)展開分析和轉(zhuǎn)換。這些數(shù)據(jù)在經(jīng)過專門處理之后,應(yīng)用于企業(yè)和者政府相關(guān)的決策。這種經(jīng)濟統(tǒng)計扥西方法,適應(yīng)了社會中采集的數(shù)據(jù)量變大,處理信息量變大的現(xiàn)實。數(shù)據(jù)挖掘,實質(zhì)是研究交叉的、比較復(fù)雜的學(xué)科。數(shù)據(jù)挖掘包括:知識獲取、統(tǒng)計學(xué)、知識庫系統(tǒng)、數(shù)據(jù)庫技術(shù)、模式識別等。數(shù)據(jù)挖掘技術(shù)在發(fā)展方面經(jīng)過了一個長時間的過程::數(shù)理統(tǒng)計階段、人工智能階段、機器學(xué)習(xí)階段。

在社會發(fā)展過程中,經(jīng)濟統(tǒng)計數(shù)據(jù)規(guī)模越來越大,人們、企業(yè)以及政府由于對經(jīng)濟發(fā)展的需要,所以對其質(zhì)量要求比較高。但是傳統(tǒng)的經(jīng)濟分析方法存在著明顯的弊端。由于傳統(tǒng)的數(shù)據(jù)統(tǒng)計方法里,數(shù)據(jù)之間之間的潛在關(guān)系沒有涉及分析,所以無法為企業(yè)和政府經(jīng)濟決策實現(xiàn)關(guān)鍵有效決策提供關(guān)鍵信息。因為傳統(tǒng)的統(tǒng)計分析方法中,使用的是效率比較低的計算方法,無法滿足社會發(fā)展中的需要,并且分析的質(zhì)量也沒有辦法得到保證?,F(xiàn)實中存在的問題,也沒有辦法得到有效解決,數(shù)據(jù)挖掘的方式通過信息技術(shù)的分析,可以發(fā)現(xiàn)數(shù)據(jù)中的潛在關(guān)系,分析出人們無法單憑感官不能實現(xiàn)的數(shù)據(jù)和信息之間的關(guān)系。實現(xiàn)了傳統(tǒng)數(shù)據(jù)分析中的問題解決,數(shù)字挖掘技術(shù)正是為了克服上述問題而產(chǎn)生并發(fā)展的,利于政府和企業(yè)進行經(jīng)濟的決策。并且在信息技術(shù)不斷發(fā)展的今天,數(shù)據(jù)挖掘技術(shù)水平也在不斷提高和發(fā)展。

二、數(shù)據(jù)挖掘技術(shù)的應(yīng)用

1、預(yù)處理

實際工作中,數(shù)據(jù)可能在收集的過程中有缺漏,關(guān)鍵信息不完整。所以在進行挖掘分析之前,對數(shù)據(jù)進行有效地預(yù)處理,對于減少分析的偏差有著重要作用。總的來說,數(shù)據(jù)的預(yù)處理有四個部分。

1.1數(shù)據(jù)的完善

數(shù)據(jù)的完善,主要是把數(shù)據(jù)中存在不一致、缺損和噪聲清除掉,目的是提升數(shù)據(jù)在整體有效性方面的質(zhì)量。通常使用的方法是——預(yù)測法、平滑法、均值法等統(tǒng)計法,主要根據(jù)實際情況中的差異,來抉擇使用的方法。預(yù)測法,使用在推斷噪聲的數(shù)據(jù)和空值中,能夠得到最有效的統(tǒng)計數(shù)據(jù),目的是處理數(shù)據(jù)缺損。平滑法講究將n個數(shù)據(jù),在經(jīng)過加權(quán)平均后得到的數(shù)值,作為替換數(shù)據(jù)。均值法是將n個不為空的數(shù)據(jù),在經(jīng)過數(shù)值的平均計算后的平均值,作為最終數(shù)據(jù)。平滑法和均值法也作為數(shù)據(jù)的降噪使用[1]。

1.2數(shù)據(jù)集合

數(shù)據(jù)的集合就是數(shù)據(jù)集成過程。一般的數(shù)據(jù)在收集的時候,主要是由地方統(tǒng)計局收集通過各種途徑收集,在收集之后要對這些多重多樣的數(shù)據(jù)進行集成。因為這些數(shù)據(jù)挖掘的范圍不同,需要通過一定的手段,使其成為一個有效地整體。在數(shù)據(jù)集合的過程中,會產(chǎn)生一些問題。例如,不同數(shù)據(jù)源數(shù)據(jù)中的互相匹配問題,也就是數(shù)據(jù)的模式集成問題。除此之外,不同數(shù)據(jù)之間還會產(chǎn)生一些差異導(dǎo)致的互相排斥,這些數(shù)據(jù)中的沖突需要消除。還有數(shù)據(jù)的

冗余問題,也就是假使一部分的屬性可以被其他數(shù)據(jù)庫中數(shù)據(jù)屬性推斷的得到,數(shù)據(jù)集成中就出現(xiàn)了冗余的問題。

1.3數(shù)據(jù)的變換

數(shù)據(jù)的變化,主要是采用一定方式,把數(shù)據(jù)變換成和其相當,并且將適合信息挖掘出來的形式。具體變換有兩種,一種是規(guī)范化,一種是泛化[2]。規(guī)范化,主要構(gòu)成是零均值的規(guī)范化、最大最小情況的規(guī)范。泛化,就是把數(shù)據(jù)層和層次使用較高層次概念將其替代。

1.4數(shù)據(jù)的概念分層

現(xiàn)實中的數(shù)據(jù)有著一些明顯的特點,連續(xù)性就是其一。但是在愛實際已經(jīng)應(yīng)用的算法中,能后對連續(xù)性數(shù)據(jù)處理的還較少數(shù)據(jù)的離散化,也就是采用區(qū)間的劃分,來代替某一些實際數(shù)據(jù),得到真實的連續(xù)數(shù)據(jù)。概念分層的意思主要是使用有效的高層概念來代替一些收集量較少的數(shù)據(jù)[3]。

2、關(guān)聯(lián)規(guī)則和決策

2.1關(guān)聯(lián)規(guī)則

在實際的數(shù)據(jù)挖掘領(lǐng)域中,整個過程采用對集合里的關(guān)聯(lián)、頻繁模式和因果結(jié)構(gòu)開展查找,目的是找到那些不被注意,或與人們?nèi)粘UJ知習(xí)慣背離的事件。在經(jīng)濟統(tǒng)計中,數(shù)據(jù)關(guān)聯(lián)的挖掘,可以分析出一個大概的范圍(例如,國家范圍、省范圍、市范圍)關(guān)系比較密切一些行業(yè)。在進行數(shù)據(jù)分析的過程中,不少的屬性之間實際的關(guān)系被人們所知曉。這些屬性被稱作平凡規(guī)則。例如,工業(yè)總產(chǎn)值的提升,帶來了生產(chǎn)總值的提升。利用關(guān)聯(lián)性原則,可以使不同屬性的數(shù)據(jù),通過分析之后,得到相關(guān)聯(lián)系屬性。

2.2決策

數(shù)據(jù)分類構(gòu)成是兩個步驟:第一,決策樹模型的形成,也就是采用訓(xùn)練集來得到一棵決策樹,來實現(xiàn)經(jīng)濟統(tǒng)計數(shù)據(jù)決策的構(gòu)建和精化。第二,把輸入的數(shù)據(jù)在決策樹的指導(dǎo)下,開展分類的處理。在數(shù)據(jù)輸入決策樹的時候,數(shù)據(jù)會由根節(jié)點,在屬性值依次開展測試。最后到達葉子終端的節(jié)點,來達到尋找記錄所在類的類別[4]??偟膩頃?,決策樹算法基本是遞歸過程的一種,數(shù)據(jù)的分類一直可以延續(xù)到終止條件結(jié)束。

結(jié)語

經(jīng)濟的快速發(fā)展,使得經(jīng)濟統(tǒng)計工作各部分之間關(guān)系密切,使得經(jīng)濟統(tǒng)計分析的難度加大,數(shù)據(jù)挖掘能夠分析出事物內(nèi)部之間的聯(lián)系,并且揭示出隱含的、未知信息。數(shù)據(jù)挖掘統(tǒng)計分析在使得經(jīng)濟統(tǒng)計工作更加科學(xué)和有效,獲得不斷的進步,為我國社會經(jīng)濟發(fā)展,以及國家財富積累發(fā)揮積極作用。技術(shù)就是通過發(fā)覺而使得經(jīng)濟統(tǒng)計工作能夠得以有效運行。

參考文獻

[1]崔丹.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用探索[J].財經(jīng)界,2014,(5).

[2]畢春杰.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用探究[J].經(jīng)濟視野,2013,(24).

[3]韓秀榮.試論數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用[J].商品與質(zhì)量·學(xué)術(shù)觀察,2013,(12).

[4]王康.關(guān)于數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應(yīng)用[J].財經(jīng)界,2011,(10).

(作者單位:河北唐山市燃氣集團有限公司)

猜你喜歡
決策樹數(shù)據(jù)挖掘決策
為可持續(xù)決策提供依據(jù)
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
決策為什么失誤了
決策樹和隨機森林方法在管理決策中的應(yīng)用
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
基于決策樹的出租車乘客出行目的識別
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究