姜曉明
遼寧機(jī)電職業(yè)技術(shù)學(xué)院 遼寧丹東 118000
數(shù)學(xué)建模是聯(lián)系數(shù)學(xué)與應(yīng)用的重要橋梁,是數(shù)學(xué)走向應(yīng)用的必經(jīng)之路。從實(shí)際問(wèn)題出發(fā),采取問(wèn)題驅(qū)動(dòng)的教學(xué)模式,可以引導(dǎo)學(xué)生思維,激發(fā)學(xué)生主動(dòng)學(xué)習(xí)的潛質(zhì)。數(shù)學(xué)建模首先要進(jìn)行數(shù)據(jù)處理。以2018年全國(guó)大學(xué)生數(shù)學(xué)建模大賽C題為例,用Excel進(jìn)行數(shù)據(jù)分析。
根據(jù)附件5數(shù)據(jù)字典將附件1~4首行改寫(xiě)如下形式,并進(jìn)行首行凍解。
圖1
1.首先刪除重復(fù)項(xiàng)
將給定的附件2、附件3中的重復(fù)項(xiàng)刪除。
2.在附件3中使用VLOOKUP函數(shù)=VLOOKUP(A2,D:數(shù)學(xué)建模數(shù)學(xué)建模賽題2018-C-Chinese[附件1-會(huì)員信息表.xlsx]附件1-會(huì)員信息表!$A:$D,4,F(xiàn)ALSE)得到附件1中的會(huì)員登記時(shí)間,設(shè)置單元格格式為日期,不是本店會(huì)員的登記時(shí)間信息顯示#N/A,以會(huì)員登記時(shí)間按升序排序,刪除不是本店會(huì)員的消費(fèi)信息,得到本店會(huì)員消費(fèi)信息520508條記錄。[1]
將附件2和附件3的數(shù)據(jù)按消費(fèi)產(chǎn)生的時(shí)間進(jìn)行排序,附件2的消費(fèi)流水時(shí)間從2016/1/1 10:43至2017/9/23 20:05,附件3記錄的會(huì)員消費(fèi)時(shí)間從2015/1/1 0:06至2015/8/30 21:44;2015/12/17 10:46至2015/12/19 20:33;2016/1/9 10:10至2016/1/11 17:14;2016/3/11 10:17至2018/1/3 21:38;取共同的時(shí)間段2016年1月,2016年3月至2017年9月30日一共20個(gè)月的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。
在附件2中進(jìn)行數(shù)據(jù)統(tǒng)計(jì)得到2016年1月,2016年3月至2017年9月30日一共20個(gè)月會(huì)員的商場(chǎng)流水消費(fèi)金額為1138194437元,單次最大消費(fèi)金額為1342515元,消費(fèi)次數(shù)933381條記錄,平均消費(fèi)金額為1219.431761元。對(duì)附件3會(huì)員消費(fèi)記錄在相同的時(shí)間區(qū)間中進(jìn)行數(shù)據(jù)統(tǒng)計(jì)得到會(huì)員消費(fèi)金額為438397407.2600元,單次消費(fèi)最大金額為1342515.00元,消費(fèi)次數(shù)325867條記錄,平均每次消費(fèi)1345.3262元,會(huì)員的消費(fèi)金額占商場(chǎng)總流水金額的38.5169%;非會(huì)員消費(fèi)金額為699797029.7400元,占消費(fèi)流水金額的61.4831%。如圖2圖3所示。
圖2
圖3
1.針對(duì)附件3中的數(shù)據(jù)建立數(shù)據(jù)透視表,獲得每位會(huì)員在統(tǒng)計(jì)時(shí)間內(nèi)的消費(fèi)總金額、消費(fèi)次數(shù)、會(huì)員積分總和、會(huì)員會(huì)令、單次消費(fèi)的最大金額等數(shù)據(jù)。
圖4
2.數(shù)據(jù)標(biāo)準(zhǔn)化處理
對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析之前,由于各變量的量綱和數(shù)量級(jí)不同,當(dāng)各指標(biāo)間的水平相差很大時(shí),如果直接用原始指標(biāo)值進(jìn)行分析,就會(huì)突出數(shù)值較高的指標(biāo)在綜合分析中的作用,相對(duì)削弱數(shù)值水平較低指標(biāo)的作用。因此,為了保證結(jié)果的可靠性,需要對(duì)原始指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
用Excel進(jìn)行z-score標(biāo)準(zhǔn)化的方法:這種方法基于原始數(shù)據(jù)的均值(mean)和標(biāo)準(zhǔn)差(standard deviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化處理。
新數(shù)據(jù)=(原數(shù)據(jù)-均值)/標(biāo)準(zhǔn)差,Excel進(jìn)行z-score標(biāo)準(zhǔn)化的方法沒(méi)有現(xiàn)成的函數(shù),需要自己分步計(jì)算:
本題要求針對(duì)會(huì)員的消費(fèi)情況建立能夠刻畫(huà)每一位會(huì)員購(gòu)買(mǎi)力的數(shù)學(xué)模型,以便能夠?qū)γ總€(gè)會(huì)員的價(jià)值進(jìn)行識(shí)別。
1.導(dǎo)入EXCEL數(shù)據(jù)
將標(biāo)準(zhǔn)化處理的數(shù)據(jù)導(dǎo)入Matlab。
A=xlsread(D:數(shù)學(xué)建模數(shù)學(xué)建模賽題2018-C-Chinese附件3-會(huì)員消費(fèi)明細(xì)表處理.xlsx,數(shù)據(jù)處理最終表,$I2:$M39041);
2.畫(huà)散點(diǎn)圖如下所示
采用plot語(yǔ)句畫(huà)出每個(gè)自變量與消費(fèi)總金額的散點(diǎn)圖。
3.多元函數(shù)線(xiàn)性回歸模型
針對(duì)步驟1讀取的數(shù)據(jù)進(jìn)行回歸分析
Y=A(:,5);X=[ones(39040,1),A(:,2),A(:,3),A(:,4)];
[b,bint,r,rint,stats]=regress(Y,X)
運(yùn)行得到
本文希望盡可能用簡(jiǎn)單的EXCEL、Matlab操作方法揭示數(shù)學(xué)建模中對(duì)數(shù)據(jù)的分析處理方法。高職院校學(xué)生數(shù)學(xué)基礎(chǔ)相對(duì)薄弱,采取實(shí)踐中邊做邊練,用具體實(shí)例對(duì)學(xué)生進(jìn)行訓(xùn)練,在實(shí)戰(zhàn)中加深對(duì)數(shù)學(xué)方法的理解和領(lǐng)悟,有助于學(xué)生對(duì)數(shù)學(xué)建模的熱愛(ài)和探索。