国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于小樣本時間序列的數(shù)據(jù)挖掘技術(shù)研究

2014-07-24 19:01:06湯震劉珂
微型電腦應用 2014年12期
關(guān)鍵詞:灰色數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡

湯震,劉珂

基于小樣本時間序列的數(shù)據(jù)挖掘技術(shù)研究

湯震,劉珂

時間序列數(shù)據(jù)是一類典型的關(guān)系型數(shù)據(jù),尤其是小樣本時間序列數(shù)據(jù)。針對其樣本少、部分信息未知的特點,提出將灰色系統(tǒng)和神經(jīng)網(wǎng)絡相融合,構(gòu)建灰色神經(jīng)網(wǎng)絡,充分利用兩種方法的優(yōu)勢對小樣本時間序列數(shù)據(jù)進行有效挖掘。實驗表明:構(gòu)建的這種網(wǎng)絡具有較高的預測精度,非常適用于小樣本時間序列數(shù)據(jù)的挖掘。

灰色模型;時間序列;數(shù)據(jù)挖掘;神經(jīng)網(wǎng)絡

0 引言

隨著計算機和網(wǎng)絡的應用普及,人類進入了一個信息爆炸的時代,每天都會直接或間接接觸大量的數(shù)據(jù)信息。但并不是所有的信息都是人們用得著和感興趣的,如何根據(jù)某種規(guī)則或是某種關(guān)聯(lián)性從海量數(shù)據(jù)中提取出有用的信息成為研究的熱點。要實現(xiàn)對其進行數(shù)據(jù)信息的挖掘,目前所使用的算法有多種[1]。其中對時間序列數(shù)據(jù)的挖掘,已經(jīng)成為數(shù)據(jù)挖掘研究的一個重要分支,在時間序列數(shù)據(jù)中,不僅數(shù)據(jù)相互之間存在一定的時間相關(guān)性,而且數(shù)量少、部分信息未知。對于這類數(shù)據(jù),由于其本身數(shù)據(jù)量較小,而且部分信息未知,所以數(shù)據(jù)挖掘的難度較大。為了解決這一問題,本文結(jié)合灰色系統(tǒng)理論處理小樣本數(shù)據(jù)的能力,以及神經(jīng)網(wǎng)絡強大的數(shù)據(jù)分類能力,提出建立灰色神經(jīng)網(wǎng)絡模型,來實現(xiàn)對于小樣本時間序列數(shù)據(jù)的挖掘。通過仿真實驗,結(jié)果表明本文提出的這種方法對于小樣本時間序列數(shù)據(jù)具有較好的分類能力。

1 時間序列數(shù)據(jù)基本定義

時間序列數(shù)據(jù)是一系列跟時間有關(guān)的數(shù)據(jù)[2-3],用t代表時間,d代表數(shù)據(jù),因此可以將每一個單獨的數(shù)據(jù)看作為一個二元組(t,d),它可以有多種意義,比如股票的價格、庫區(qū)的水深、某種商品的價格等。那么,我們可以作如下定義:

如果集合R{(t1,d1),(t2,d2),…,(tn,dn)}是一個有限的時間序列集,并且滿足條件ti

2 灰色神經(jīng)網(wǎng)絡

灰色理論善于處理小樣本、貧信息問題,而神經(jīng)網(wǎng)絡則對復雜非線性映射問題比較有優(yōu)勢,將這兩種方法結(jié)合起來,構(gòu)建一個灰色神經(jīng)網(wǎng)絡,可以很好地對小樣本時間序列數(shù)據(jù)進行分類挖掘,同時這兩種方法可以互相彌補各自的缺陷[4-5]。

n個參數(shù)的灰色神經(jīng)網(wǎng)絡模型的微分方程表達式為公式(1):

其中,為方程系數(shù),為網(wǎng)絡輸入?yún)?shù),為網(wǎng)絡輸出參數(shù)。

式(1)的時間響應式為公式(2):

令公式(3):

則公式(3)可變?yōu)楣剑?):

經(jīng)過變換,將(4)式映射到一個擴展的 BP神經(jīng)網(wǎng)絡中,可以得到n個輸入?yún)?shù)和1個輸出參數(shù)的灰色神經(jīng)網(wǎng)絡,其拓撲結(jié)構(gòu)如圖1所示:

圖1 灰色神經(jīng)網(wǎng)絡拓撲結(jié)構(gòu)

依據(jù)上述分析,灰色神經(jīng)網(wǎng)絡的學習過程可以歸納如下:

步驟 1:確定網(wǎng)絡結(jié)構(gòu),初始化網(wǎng)絡,計算 a、b、u 參數(shù);

步驟 2:計算網(wǎng)絡權(quán)值;

步驟 3:按照下式計算各層輸出:

步驟 4:按照下式計算網(wǎng)絡輸出誤差,如果誤差滿足要求,訓練停止;否則

轉(zhuǎn)到步驟 5;

LC 層誤差:

LB 層誤差:

步驟 5:根據(jù)誤差調(diào)整網(wǎng)絡權(quán)值和閾值

調(diào)整閾值:

步驟 6:判斷是否達到最大訓練次數(shù),如果是,訓練停止;否則轉(zhuǎn)到步驟3。

3 仿真試驗和結(jié)果分析

本實驗完成的是對某品牌空調(diào)銷售訂單的預測。對于空調(diào)的銷售情況,有很多因素會對其銷量產(chǎn)生影響。例如:品牌認知度、成本、售后服務、價格、性價比、競爭對手、宣傳力度、產(chǎn)品結(jié)構(gòu)、產(chǎn)品生命周期等。為了能夠比較客觀的完成該實驗,同時檢驗本文所提方法的有效性,本文選取了該品牌空調(diào)近3年的銷售訂單數(shù)據(jù),其中前30個月的數(shù)據(jù)用于訓練網(wǎng)絡,后6個月的數(shù)據(jù)用來評價所構(gòu)建網(wǎng)絡的預測性能。

首先,我們要對網(wǎng)絡進行初始化,確定網(wǎng)絡各層節(jié)點的數(shù)量。對于灰色神經(jīng)網(wǎng)絡模型來說,LA層只有一個節(jié)點,輸入的是時間序列;LB層只是對LA層輸入的變換因此也只有一個節(jié)點;確定LC層節(jié)點個數(shù)時需要綜合考慮,本文選取對空調(diào)銷售影響較大的5個因素,即價格、性價比、品牌認知度、售后以及市場份額,因此,LC層共有6個節(jié)點;LD層輸出的為空調(diào)的預測銷售訂單,所以,也只有一個節(jié)點。根據(jù)以上分析,最終確定網(wǎng)絡結(jié)構(gòu)為1×1×6×1。

下面進行數(shù)據(jù)預處理以及權(quán)值/閾值初始化。數(shù)據(jù)預處理主要是LC層數(shù)據(jù)的預處理,由于各個節(jié)點輸入的量綱不同,因此這里只需要做歸一化處理即可。對于網(wǎng)絡的初始權(quán)值,令則網(wǎng)絡初始權(quán)值可表示為公式(5):

LD層中輸出節(jié)點的閾值為公式(6):

將所有訓練數(shù)據(jù)處理完成以后,將值輸入到網(wǎng)絡中,然后進行訓練,網(wǎng)絡進化次數(shù)設定為100,其網(wǎng)絡訓練結(jié)果如圖2所示:

圖2 灰色神經(jīng)網(wǎng)絡訓練過程

僅考慮數(shù)據(jù)域:如果數(shù)據(jù)域使用浮點數(shù)進行表示,則為了表示傾斜角和方位角,共需要 12+12=24位二進制。Huffman編碼壓縮后平均長度也才是15.5,明顯小于用浮點數(shù)表示時的長度24。

從圖2可以明顯看出網(wǎng)絡的訓練效果很好,很短的時間內(nèi)就進化達到誤差的要求。

首先,把已訓練好的網(wǎng)絡保存,然后將用于測試的后6個月的數(shù)據(jù)輸入網(wǎng)絡,同時將預測結(jié)果與實際的訂單數(shù)進行比對,比對結(jié)果如圖3所示:

圖3 灰色神經(jīng)網(wǎng)絡預測結(jié)果對比

圖3實驗結(jié)果表明,本文建立的灰色神經(jīng)網(wǎng)絡的預測結(jié)果較好,與實際訂單之間的平均誤差僅為 8.9%,說明該網(wǎng)絡對于小樣本、貧信息的時間序列數(shù)據(jù)具有較好的挖掘性能。

4 總結(jié)

時間序列數(shù)據(jù)一直是數(shù)據(jù)挖掘中研究的一個熱點,尤其是小樣本、貧信息的時間序列數(shù)據(jù)。本文根據(jù)這類數(shù)據(jù)的特點,充分利用灰色理論處理小樣本數(shù)據(jù)和神經(jīng)網(wǎng)絡強大的數(shù)據(jù)分類能力,將灰色系統(tǒng)理論與神經(jīng)網(wǎng)絡相融合,來構(gòu)建灰色神經(jīng)網(wǎng)絡模型,通過仿真實驗也充分反映出,對于小樣本的時間序列數(shù)據(jù),本文的灰色神經(jīng)網(wǎng)絡具有較好的挖掘能力,為這類數(shù)據(jù)的挖掘處理提供了一條新的思路。

[1] 羅芳瓊,吳春梅.時間序列分析的理論與應用綜述[J].柳州師專學報, 2009,24(03):113-117

[2] 陳湘濤,李明亮,陳玉娟.基于時間序列相似性聚類的應用研究綜述[J].計算機工程與設計, 2010,31(3):577-581.

[3] 何典,梁英.金融時間序列數(shù)據(jù)挖掘的研究與應用[J].世界科技研究與發(fā)展, 2008,30(1):104-106.

[4] 李愛國,覃征.在線分割時間序列數(shù)據(jù)[J].軟件學報,2004,15(11):1672-1679

[5] 李斌,譚立湘,章勁松等.面向數(shù)據(jù)挖掘的時間序列符號化方法研究[J].電路與系統(tǒng)學報,2000,5(2):9-14.

Research on Mining Technology for Small Sample Time Series Data

Tang Zhen, Liu Ke
(School of Information Engineering, Huanghuai University, Zhumadian 463000, China)

Time-series data is a kind of typical relational data, especially the small sample time-series data. According to the limited samples and part of unknown information, this paper integrates the gray system with neural network and build gray neural network. It makes full use of the advantages of these two methods to exavate small sample time series data mining effectively. Experiments show that the network has higher prediction accuracy. It is quite fit for small sample time-series data mining.

Gray Model; Time Series; Data Mining; Neural Networks

TP311.13

A

2014.09.08)

1007-757X(2014)12-0018-02

河南省教育廳科技攻關(guān)計劃資助項目(14B520036)

湯震(1983-),男,漢,黃淮學院信息工程學院,講師,碩士,研究方向:計算機網(wǎng)絡,數(shù)據(jù)挖掘等,駐馬店,463000

劉珂(1980-),男,漢,黃淮學院信息工程學院,講師,碩士,研究方向:計算機網(wǎng)絡,駐馬店,463000

猜你喜歡
灰色數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
淺灰色的小豬
神經(jīng)網(wǎng)絡抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
灰色時代
Coco薇(2017年2期)2017-04-25 17:59:38
她、它的灰色時髦觀
Coco薇(2017年2期)2017-04-25 17:57:49
感覺
基于神經(jīng)網(wǎng)絡的拉矯機控制模型建立
重型機械(2016年1期)2016-03-01 03:42:04
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
復數(shù)神經(jīng)網(wǎng)絡在基于WiFi的室內(nèi)LBS應用
武宁县| 柳州市| 花莲县| 平顺县| 南宫市| 名山县| 资阳市| 安新县| 衡东县| 洛川县| 长泰县| 永仁县| 紫云| 浑源县| 武宣县| 隆德县| 孙吴县| 三门峡市| 仁寿县| 什邡市| 德阳市| 吐鲁番市| 荥经县| 武穴市| 肥西县| 汤原县| 廊坊市| 镇巴县| 南宁市| 沭阳县| 镇沅| 泾阳县| 蒙阴县| 甘肃省| 肇州县| 嘉峪关市| 禹州市| 宜君县| 横山县| 吉隆县| 会宁县|