国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)學(xué)建模中的數(shù)據(jù)處理
——以大型百貨商場(chǎng)會(huì)員畫(huà)像描繪為例

2020-02-11 04:13姜曉明
科學(xué)咨詢(xún) 2020年1期
關(guān)鍵詞:本店附件金額

姜曉明

遼寧機(jī)電職業(yè)技術(shù)學(xué)院 遼寧丹東 118000

數(shù)學(xué)建模是聯(lián)系數(shù)學(xué)與應(yīng)用的重要橋梁,是數(shù)學(xué)走向應(yīng)用的必經(jīng)之路。從實(shí)際問(wèn)題出發(fā),采取問(wèn)題驅(qū)動(dòng)的教學(xué)模式,可以引導(dǎo)學(xué)生思維,激發(fā)學(xué)生主動(dòng)學(xué)習(xí)的潛質(zhì)。數(shù)學(xué)建模首先要進(jìn)行數(shù)據(jù)處理。以2018年全國(guó)大學(xué)生數(shù)學(xué)建模大賽C題為例,用Excel進(jìn)行數(shù)據(jù)分析。

一、Excel對(duì)數(shù)據(jù)的處理

根據(jù)附件5數(shù)據(jù)字典將附件1~4首行改寫(xiě)如下形式,并進(jìn)行首行凍解。

圖1

(一)數(shù)據(jù)清洗

1.首先刪除重復(fù)項(xiàng)

將給定的附件2、附件3中的重復(fù)項(xiàng)刪除。

2.在附件3中使用VLOOKUP函數(shù)=VLOOKUP(A2,D:數(shù)學(xué)建模數(shù)學(xué)建模賽題2018-C-Chinese[附件1-會(huì)員信息表.xlsx]附件1-會(huì)員信息表!$A:$D,4,F(xiàn)ALSE)得到附件1中的會(huì)員登記時(shí)間,設(shè)置單元格格式為日期,不是本店會(huì)員的登記時(shí)間信息顯示#N/A,以會(huì)員登記時(shí)間按升序排序,刪除不是本店會(huì)員的消費(fèi)信息,得到本店會(huì)員消費(fèi)信息520508條記錄。[1]

(二)數(shù)據(jù)篩選

將附件2和附件3的數(shù)據(jù)按消費(fèi)產(chǎn)生的時(shí)間進(jìn)行排序,附件2的消費(fèi)流水時(shí)間從2016/1/1 10:43至2017/9/23 20:05,附件3記錄的會(huì)員消費(fèi)時(shí)間從2015/1/1 0:06至2015/8/30 21:44;2015/12/17 10:46至2015/12/19 20:33;2016/1/9 10:10至2016/1/11 17:14;2016/3/11 10:17至2018/1/3 21:38;取共同的時(shí)間段2016年1月,2016年3月至2017年9月30日一共20個(gè)月的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。

在附件2中進(jìn)行數(shù)據(jù)統(tǒng)計(jì)得到2016年1月,2016年3月至2017年9月30日一共20個(gè)月會(huì)員的商場(chǎng)流水消費(fèi)金額為1138194437元,單次最大消費(fèi)金額為1342515元,消費(fèi)次數(shù)933381條記錄,平均消費(fèi)金額為1219.431761元。對(duì)附件3會(huì)員消費(fèi)記錄在相同的時(shí)間區(qū)間中進(jìn)行數(shù)據(jù)統(tǒng)計(jì)得到會(huì)員消費(fèi)金額為438397407.2600元,單次消費(fèi)最大金額為1342515.00元,消費(fèi)次數(shù)325867條記錄,平均每次消費(fèi)1345.3262元,會(huì)員的消費(fèi)金額占商場(chǎng)總流水金額的38.5169%;非會(huì)員消費(fèi)金額為699797029.7400元,占消費(fèi)流水金額的61.4831%。如圖2圖3所示。

圖2

圖3

(三)數(shù)據(jù)挖掘

1.針對(duì)附件3中的數(shù)據(jù)建立數(shù)據(jù)透視表,獲得每位會(huì)員在統(tǒng)計(jì)時(shí)間內(nèi)的消費(fèi)總金額、消費(fèi)次數(shù)、會(huì)員積分總和、會(huì)員會(huì)令、單次消費(fèi)的最大金額等數(shù)據(jù)。

圖4

2.數(shù)據(jù)標(biāo)準(zhǔn)化處理

對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析之前,由于各變量的量綱和數(shù)量級(jí)不同,當(dāng)各指標(biāo)間的水平相差很大時(shí),如果直接用原始指標(biāo)值進(jìn)行分析,就會(huì)突出數(shù)值較高的指標(biāo)在綜合分析中的作用,相對(duì)削弱數(shù)值水平較低指標(biāo)的作用。因此,為了保證結(jié)果的可靠性,需要對(duì)原始指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。

用Excel進(jìn)行z-score標(biāo)準(zhǔn)化的方法:這種方法基于原始數(shù)據(jù)的均值(mean)和標(biāo)準(zhǔn)差(standard deviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化處理。

新數(shù)據(jù)=(原數(shù)據(jù)-均值)/標(biāo)準(zhǔn)差,Excel進(jìn)行z-score標(biāo)準(zhǔn)化的方法沒(méi)有現(xiàn)成的函數(shù),需要自己分步計(jì)算:

二、Matlab導(dǎo)入數(shù)據(jù)多元回歸分析模型

本題要求針對(duì)會(huì)員的消費(fèi)情況建立能夠刻畫(huà)每一位會(huì)員購(gòu)買(mǎi)力的數(shù)學(xué)模型,以便能夠?qū)γ總€(gè)會(huì)員的價(jià)值進(jìn)行識(shí)別。

1.導(dǎo)入EXCEL數(shù)據(jù)

將標(biāo)準(zhǔn)化處理的數(shù)據(jù)導(dǎo)入Matlab。

A=xlsread(D:數(shù)學(xué)建模數(shù)學(xué)建模賽題2018-C-Chinese附件3-會(huì)員消費(fèi)明細(xì)表處理.xlsx,數(shù)據(jù)處理最終表,$I2:$M39041);

2.畫(huà)散點(diǎn)圖如下所示

采用plot語(yǔ)句畫(huà)出每個(gè)自變量與消費(fèi)總金額的散點(diǎn)圖。

3.多元函數(shù)線(xiàn)性回歸模型

針對(duì)步驟1讀取的數(shù)據(jù)進(jìn)行回歸分析

Y=A(:,5);X=[ones(39040,1),A(:,2),A(:,3),A(:,4)];

[b,bint,r,rint,stats]=regress(Y,X)

運(yùn)行得到

三、結(jié)束語(yǔ)

本文希望盡可能用簡(jiǎn)單的EXCEL、Matlab操作方法揭示數(shù)學(xué)建模中對(duì)數(shù)據(jù)的分析處理方法。高職院校學(xué)生數(shù)學(xué)基礎(chǔ)相對(duì)薄弱,采取實(shí)踐中邊做邊練,用具體實(shí)例對(duì)學(xué)生進(jìn)行訓(xùn)練,在實(shí)戰(zhàn)中加深對(duì)數(shù)學(xué)方法的理解和領(lǐng)悟,有助于學(xué)生對(duì)數(shù)學(xué)建模的熱愛(ài)和探索。

猜你喜歡
本店附件金額
大型外浮頂儲(chǔ)罐安全附件常見(jiàn)問(wèn)題
附件三:擬制定的標(biāo)準(zhǔn)匯總表
難纏的顧客
脫單攻略
新型武器及附件展呈
德國(guó)軍隊(duì)使用的手槍套及其附件
立案
一律兩塊錢(qián)
成交金額前10名營(yíng)業(yè)部買(mǎi)入的前3只個(gè)股
一周資金凈流出金額前20名個(gè)股