国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)處理方法在數(shù)學建模競賽中的應用

2015-03-02 12:52王增波等
軟件導刊 2015年1期
關鍵詞:數(shù)學建模數(shù)據(jù)處理

王增波等

摘要:在歸納數(shù)學建模競賽歷年試題求解方法的基礎上,從數(shù)據(jù)分析、插值與擬合、數(shù)據(jù)仿真和回歸分析4個方面總結(jié)了數(shù)據(jù)處理方法和數(shù)學軟件在數(shù)據(jù)建模競賽中的應用,可為數(shù)學建模中合理選擇數(shù)據(jù)處理方法提供參考借鑒。

關鍵詞:數(shù)學建模; 數(shù)據(jù)處理; 數(shù)學軟件; Matlab; SPSS

DOIDOI:10.11907/rjdk.143753

中圖分類號:TP434

文獻標識碼:A 文章編號文章編號:16727800(2015)001020002

0 引言

數(shù)學建模通過數(shù)學語言對實際問題進行簡化、抽象和描述,建立一個可以求解的數(shù)學模型,利用計算機軟件對該數(shù)學模型進行分析和求解,并對求解出的結(jié)果進行分析和檢驗,最終找到解決實際問題的方案。在數(shù)學建模過程中,大量實驗數(shù)據(jù)需要處理,需要利用計算機軟件來輔助快速整理和分析,這一過程即為數(shù)據(jù)建模中的數(shù)據(jù)處理。必須利用一定處理方法從實驗數(shù)據(jù)中提煉出其內(nèi)在規(guī)律,甚至可以把表面上看起來毫無關聯(lián)的數(shù)據(jù)聯(lián)系在一起。

在模型建立初期,通過一定數(shù)據(jù)處理方法可以分析出問題所描述的模型變量之間的關系,形成初步計劃。部分模型可以利用統(tǒng)計方法從大量的實驗數(shù)據(jù)中直接建立,例如回歸分析法和時序分析法等。實際建模中,亦可直接利用實驗數(shù)據(jù)估計出模型參數(shù)值,或利用數(shù)據(jù)進行模型檢驗,用所建立模型計算理論值與實際數(shù)據(jù)之間的誤差。數(shù)據(jù)處理是建模的關鍵,直接影響數(shù)學建模的效率和結(jié)果。本文著重介紹常用數(shù)據(jù)處理方法及數(shù)學軟件在數(shù)學建模競賽中的具體應用。

1 數(shù)據(jù)分析

一般來說,數(shù)據(jù)建模收集和提供的原始數(shù)據(jù)絕大多數(shù)都是以Excel文件的形式保存,Excel軟件具有數(shù)據(jù)排序、篩選、有效性、分類匯總、內(nèi)部函數(shù)計算等諸多功能,可用來對數(shù)據(jù)進行初步處理,如按關鍵字排序、按值或范圍篩選數(shù)據(jù),按類匯總,計算最大值、最小值、頻數(shù)、方差等,還可以利用其強大的繪圖功能繪制散點圖、曲線圖、直方圖,對數(shù)據(jù)的發(fā)展趨勢進行觀察分析。

2 插值與擬合方法

在建模競賽中進行數(shù)據(jù)處理時經(jīng)常會用到數(shù)據(jù)插值和數(shù)據(jù)擬合方法。如1998年美國賽A題中的生物組織切片用到三維插值方法;1994年國賽A題在計算山體海拔高度時也用到了數(shù)據(jù)插值方法;2001年國賽中血管三維重建問題用到了數(shù)據(jù)插值和數(shù)據(jù)擬合方法;2003年國賽“非典”問題用到數(shù)據(jù)擬合方法觀察數(shù)據(jù)走向并進行處理;2004年國賽飲酒駕車也是一個擬合問題;2005年國賽雨量預報的評價用到了插值計算;2006年國賽B題艾滋病療法的評價及療效的預測問題也用到了數(shù)據(jù)擬合方法;2011年國賽中的城市表層土壤重金屬污染問題也用到插值與擬合方法。

擬合問題通過實驗數(shù)據(jù)確定某已知函數(shù)的參數(shù)或?qū)で竽硞€近似函數(shù),使所得到的近似函數(shù)與已知數(shù)據(jù)有較高的擬合度。如果在確認數(shù)據(jù)有誤差的前提下不要求近似函數(shù)通過所有的數(shù)據(jù)點,只要求得出一定程度上反映數(shù)據(jù)變化規(guī)律的近似函數(shù)即稱為數(shù)據(jù)擬合。數(shù)據(jù)插值是根據(jù)已知數(shù)據(jù)點的實驗數(shù)據(jù)按照某種插值方法確定未知數(shù)據(jù)點的數(shù)據(jù)。

(1)數(shù)據(jù)插值。當受實驗條件限制以及實驗數(shù)據(jù)量不足,且已有數(shù)據(jù)可信時,通常利用函數(shù)插值方法可插值出兩數(shù)據(jù)點之間的一系列數(shù)據(jù)點,所繪制的數(shù)據(jù)曲線會嚴格地經(jīng)過每一個實驗數(shù)據(jù)點。所選用插值函數(shù)的類型不同,逼近的效果和光滑程度也有所不同。常用的插值方法有: lagrange插值、分段線性插值、Hermite插值和三次樣插值等,這些插值都是分段插值。Matlab中提供的功能函數(shù)可實現(xiàn)分段插值而不需要編制函數(shù)程序,如:interp1(一維插值)、interp2(二維)、interp3(三維)、intern(n維) ,其中一維和二維插值用得最多。一維插值函數(shù)的格式為:yi=interp1(x,y,xi,'method'),其中(x,y)為插值節(jié)點,xi為被插值點,yi為在xi處的插值結(jié)果,默認情況下插值方法為分段線性插值,nearest為最鄰近插值,linear為線性插值,spline為三次樣條插值,cubic為立方插值。值得注意的是,所有插值方法中要求x必須是單調(diào)的,并且xi不能超過x的取值范圍。二維插值函數(shù)的格式為:z=interp2(x0,y0,z0,x,y,method)。

(2)數(shù)據(jù)擬合。對于較復雜的問題,可以直接使用實驗數(shù)據(jù)進行建模,找出因果變量之間的數(shù)量關系,從而對未知情形進行預測,所組建的模型稱為擬合模型。通過擬合模型主要將實驗數(shù)據(jù)誤差控制在一定范圍內(nèi),使用數(shù)學表達式從數(shù)量上近似表達因果變量之間的關系。組建擬合模型需要通過對有關變量的實驗數(shù)據(jù)進行觀察、分析,選擇恰當?shù)臄M合函數(shù)。擬合模型大致可分為線性擬合、多項式擬合和曲線擬合。在Matlab中可通過函數(shù)polyval()和lsqcurvefit()來實現(xiàn),在spss中通過菜單和對話框操作可同時選用多種模型實現(xiàn)擬合度對比。為確定合適擬合模型,一般先做散點圖觀察數(shù)據(jù)的分布情況再確定模型的選取。

3 數(shù)據(jù)仿真

數(shù)學建模中離不開計算機仿真,其中隨機性模擬是常用算法之一。數(shù)學建模中的數(shù)據(jù)仿真主要有數(shù)學仿真和計算機仿真。數(shù)學仿真以數(shù)學方程式為基礎,在一定假設條件下用數(shù)學式來模擬被仿真對象。利用計算機對系統(tǒng)的數(shù)學模型進行試驗,稱計算機仿真。通過計算機仿真方法可改變被仿真系統(tǒng)的結(jié)構(gòu)和參數(shù),方便實現(xiàn)對模型的分析。計算機仿真方法中蒙特卡羅算法較常用,該算法又稱隨機性模擬算法。

首先利用隨機函數(shù)對所研究的實際問題生成隨機抽樣產(chǎn)生樣本,再對樣本值進行觀察、統(tǒng)計分析,最后求出所研究問題的參數(shù)。例如全國大學生數(shù)學建模競賽1997年A 題“零件參數(shù)設計”問題,題目中每個零件都有不同的標定值和容差等級,要求解零件的最優(yōu)組合方案。如利用一個復雜的公式,從108 種容差中選取方案,得到問題的解非常困難,只能通過計算機仿真方法求解。其中的一種方法就是通過隨機性模擬搜索最優(yōu)方案,在每個零件的可行區(qū)間按照正態(tài)分布隨機選取一個標定值和一個容差值,通過蒙特卡羅算法仿真出大量的方案,并從中選取一個最佳方案。

4 回歸分析

回歸分析在數(shù)學建模競賽中用得較多,例如國賽2005年A題“長江水質(zhì)的評價和預測”、2006年的“Hiv病毒問題”、2008年的“大學學費問題”和2011年A題“城市表層土壤重金屬污染分析”中都用到回歸分析。回歸分析是研究一個因變量與一個或多個自變量之間線性或非線性關系的一種統(tǒng)計分析方法?;貧w分析通過規(guī)定因變量和自變量來確定變量之間的因果關系,建立回歸模型,并根據(jù)實測數(shù)據(jù)來估計模型各參數(shù),然后評價回歸模型能否很好地擬合實測數(shù)據(jù),并根據(jù)自變量作進一步預測。

回歸分析方法理論基礎成熟,它根據(jù)采樣數(shù)據(jù)來確定變量與變量之間的定量關系,反映出統(tǒng)計變量之間的數(shù)據(jù)變化規(guī)律,并建立出變量間定量關系的數(shù)學模型,進行數(shù)據(jù)變化趨勢預測。它是一種準確把握自變量對因變量的影響方向和影響程度的有效方法,在經(jīng)濟、金融、醫(yī)學、自然科學和社會科學等領域有廣泛應用,在數(shù)據(jù)建模競賽中也常用到。回歸分析主要有線性回歸、曲線回歸、Logistic回歸、非線性回歸等??梢宰骰貧w分析的軟件有Excel、Matlab、SPSS、Eviews、Sas、Systat等,其中使用得最多且最容易掌握的軟件當屬SPSS。

5 結(jié)語

數(shù)據(jù)處理在數(shù)學建模競賽中發(fā)揮非常關鍵的作用,合理選擇數(shù)據(jù)處理方法能提高數(shù)據(jù)分析的準確性。借助相關數(shù)學軟件實施數(shù)據(jù)處理可大大提高數(shù)學建模效率。

參考文獻:

[1] 王庚,王敏生.現(xiàn)代數(shù)學建模方法[M].北京:科學出版社,2006.

[2] 姜啟源,謝金星,葉俊.數(shù)學模型[M].第三版.北京:高等教育出版社,2003.

[3] 陳勝可. SPSS統(tǒng)計分析從入門到精通 [M].第二版.北京:清華大學出版社,2013.

[4] 胡良劍,孫曉君. MATLAB數(shù)學實驗[M].北京:高等教育出版社,2006.

猜你喜歡
數(shù)學建模數(shù)據(jù)處理
認知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補與極大似然估計法*
ILWT-EEMD數(shù)據(jù)處理的ELM滾動軸承故障診斷
數(shù)學建模中創(chuàng)造性思維的培養(yǎng)
基于希爾伯特- 黃變換的去噪法在外測數(shù)據(jù)處理中的應用
基于POS AV610與PPP的車輛導航數(shù)據(jù)處理
房山区| 赤壁市| 岳阳市| 枣阳市| 太谷县| 阿图什市| 平南县| 天气| 龙海市| 商水县| 镇雄县| 东光县| 临泉县| 湘潭市| 江陵县| 梓潼县| 合山市| 阳春市| 茌平县| 包头市| 太保市| 凤庆县| 合山市| 万载县| 新民市| 介休市| 花莲市| 公安县| 鄂尔多斯市| 达拉特旗| 古浪县| 商城县| 专栏| 山阴县| 金乡县| 蒙自县| 察隅县| 同心县| 朝阳区| 长宁县| 新津县|