国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

試論大數(shù)據(jù)統(tǒng)計的新思維

2015-04-02 18:07:51柴世琿
中國高新技術(shù)企業(yè) 2015年9期
關(guān)鍵詞:數(shù)據(jù)分析大數(shù)據(jù)統(tǒng)計學(xué)

摘要:大數(shù)據(jù)給互聯(lián)網(wǎng)帶來的是前所未有的信息大爆炸,不僅改變了從前互聯(lián)網(wǎng)的數(shù)據(jù)應(yīng)用模式,還影響了人們的生活方式。處于大數(shù)據(jù)時代的人們認(rèn)識到了大數(shù)據(jù)已經(jīng)將數(shù)據(jù)分析從向后分析轉(zhuǎn)變成向前分析,從而改變了人們的思維方式,但同時也提出了一些挑戰(zhàn),在解決問題的同時也意味著大數(shù)據(jù)開始向縱深方向發(fā)展。

關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計學(xué);統(tǒng)計思維;數(shù)據(jù)應(yīng)用模式;數(shù)據(jù)分析 文獻(xiàn)標(biāo)識碼:A

中圖分類號:C829 文章編號:1009-2374(2015)09-0048-02 DOI:10.13535/j.cnki.11-4406/n.2015.0779

1 對大數(shù)據(jù)的初步認(rèn)識

首先我們需要知道什么是大數(shù)據(jù),它在不同的科學(xué)領(lǐng)域、不同的行業(yè)都有不同的解釋。相對于傳統(tǒng)意義上的數(shù)據(jù),大數(shù)據(jù)這里的含義有新的解釋,不只是字面本身的意思,更為重要的是數(shù)據(jù)的內(nèi)涵,可能“大”與“數(shù)據(jù)”的含義本就不能分開理解,只有把“大數(shù)據(jù)”這三個字放在一起才能更有意義。從統(tǒng)計學(xué)的角度出發(fā)我們應(yīng)該怎樣來理解大數(shù)據(jù)呢?它是在現(xiàn)代信息技術(shù)、工具的基礎(chǔ)上運(yùn)用可自動記錄、儲存能力的所有類型的數(shù)據(jù)。簡單地說,大數(shù)據(jù)就是所有的可記錄信息的集合??梢赃@樣來理解,把以前的統(tǒng)計研究數(shù)據(jù)比做是根據(jù)一定條件收集在一起的結(jié)構(gòu)化的樣本,那大數(shù)據(jù)就是所有可以記錄、存儲、超大容量的各種各樣類型的數(shù)據(jù)總集合。從統(tǒng)計學(xué)的角度出發(fā),傳統(tǒng)的樣本數(shù)據(jù)與現(xiàn)今的大數(shù)據(jù)的區(qū)別在哪呢?區(qū)別就在于傳統(tǒng)的樣本數(shù)據(jù)是按特定的條件所產(chǎn)生的格式化數(shù)據(jù),樣本的數(shù)量是有限的,而且如果說統(tǒng)計設(shè)計過程偏離了方案,數(shù)據(jù)就失去意義。一般都不可能同時滿足各方面統(tǒng)計需求,如果出現(xiàn)了其事先未考慮到的情況,數(shù)據(jù)的不能擴(kuò)展性就會導(dǎo)致數(shù)據(jù)的失效,那統(tǒng)計方案也就失效了。而大數(shù)據(jù)是所有可能通過現(xiàn)代信息科技手段可獲得的數(shù)據(jù),其數(shù)據(jù)量巨大,并且不會受到一些條件的限制。因此,大數(shù)據(jù)最大的優(yōu)勢就是非常寬的數(shù)據(jù)選擇性,可進(jìn)行多維度、多角度的數(shù)據(jù)分析方案。更為重要的是因為大數(shù)據(jù)的樣本選擇面寬,樣本如果不夠說明情況還可以從大數(shù)據(jù)中選擇擴(kuò)大;樣本中不能夠發(fā)現(xiàn)的某些細(xì)小信息,在大數(shù)據(jù)也可以獲得。

2 統(tǒng)計思維的新變化

在大數(shù)據(jù)時代要想做好統(tǒng)計工作,需要改變統(tǒng)計思維,否則,統(tǒng)計工作很難發(fā)展,至少會被邊緣化。統(tǒng)計思維的變化應(yīng)該從對數(shù)據(jù)的掌握與分析開始,下一步是揭示事物的本質(zhì)與相互聯(lián)系,直至揭示事物的發(fā)展規(guī)律。也可以說統(tǒng)計工作的目的就是要還原事物的本來面目,從而達(dá)到還原真相的效果。

2.1 認(rèn)識數(shù)據(jù)的思維要變化

與傳統(tǒng)樣本數(shù)據(jù)相比,大數(shù)據(jù)不僅數(shù)量多和選擇多,而且其來源和數(shù)據(jù)類型都發(fā)生了根本性的變化,數(shù)據(jù)既雜亂又多樣。首先,從根源來講,傳統(tǒng)的樣本數(shù)據(jù)的收集對象較特定,所以數(shù)據(jù)的特征都非常明顯并可以識別,還可以進(jìn)行事后的核對檢驗。但大數(shù)據(jù)則不同,它們來源于網(wǎng)絡(luò),其數(shù)據(jù)并不是為了特定事物收集而產(chǎn)生的,而是一切可記錄的數(shù)據(jù),所以說大數(shù)據(jù)的來源是沒有針對性的。其次,從類型來看,傳統(tǒng)樣本數(shù)據(jù)一般都是結(jié)構(gòu)型數(shù)據(jù),有一定格式標(biāo)準(zhǔn),可以運(yùn)用常規(guī)統(tǒng)計指標(biāo)或者統(tǒng)計圖表來表示。而大數(shù)據(jù)大多是非結(jié)構(gòu)型且無任何針對性的數(shù)據(jù),既包括可記錄的和可存儲的信號,又沒有標(biāo)準(zhǔn)、多樣化,過去的統(tǒng)計指標(biāo)或圖表來表現(xiàn)比較困難。最后,從運(yùn)用方式上看,傳統(tǒng)樣本數(shù)據(jù)的處理有一整套方法可行,其結(jié)果可以直接使用。但是大數(shù)據(jù)中的數(shù)據(jù)怎樣與結(jié)構(gòu)化數(shù)據(jù)對接則是一個嶄新的問題。

2.2 收集數(shù)據(jù)的思維要變化

以往收集統(tǒng)計數(shù)據(jù)的方法是先確定統(tǒng)計研究目的,再根據(jù)統(tǒng)計目的收集數(shù)據(jù),因此設(shè)計調(diào)查方案及設(shè)計統(tǒng)計流程就顯得十分必要,有時投入的人力物力較大而產(chǎn)出數(shù)據(jù)十分有限?,F(xiàn)在則不同了,在大數(shù)據(jù)時代,有大量的可選擇數(shù)據(jù),需要做的環(huán)節(jié)就是加以比較與篩選,我們需要考慮的應(yīng)該是怎樣利用大數(shù)據(jù)的優(yōu)勢,在大數(shù)據(jù)源中找到我們需要東西。當(dāng)然,也不是所有數(shù)據(jù)都可以從互聯(lián)網(wǎng)中找到,中間存在一個再加工或成本比較的問題。所以,有時運(yùn)用大數(shù)據(jù)的同時也需要采用一些傳統(tǒng)的統(tǒng)計方法來收集特殊的數(shù)據(jù),再利用互聯(lián)網(wǎng)信息技術(shù)的強(qiáng)大功能去收集一些相關(guān)的數(shù)據(jù)進(jìn)行過濾、選擇。

2.3 對數(shù)據(jù)的分析思維要有新變化

針對上述兩方面內(nèi)容發(fā)生的變化,對統(tǒng)計數(shù)據(jù)分析的思維必然要做出調(diào)整,這就需要我們盡可能地利用信息技術(shù)或先進(jìn)的技術(shù)方法從大數(shù)據(jù)中找出對我們有價值的信息,并在這個過程中豐富統(tǒng)計科學(xué)的方法。主要體現(xiàn)在以下三點:

首先,過去的統(tǒng)計分析方法是先定性,再定量,最后定性。它的意義是為了找準(zhǔn)統(tǒng)計方向和目標(biāo),運(yùn)用的是以往經(jīng)驗的判斷,這些在以前統(tǒng)計數(shù)據(jù)分析手段方法較落后的情況下是很重要的。而在信息時代,我們只需要在大數(shù)據(jù)中找出相應(yīng)的資料,直接依靠數(shù)據(jù)分析方法做出統(tǒng)計判斷,這種方法在存儲能力無限增大、統(tǒng)計分析方法和實現(xiàn)速度大大改善的現(xiàn)在,已經(jīng)變得可以實現(xiàn)了,因此我們更需要做的就是直接從中找出真正需要的數(shù)據(jù),就可得出我們所需要的內(nèi)容,因此統(tǒng)計分析的整個流程可直接簡化為先定量、后定性。

其次,過去的統(tǒng)計樣本實證分析,都需要先依據(jù)統(tǒng)計目的提出設(shè)定,再通過數(shù)據(jù)收集與分析來證明是否成立,但是這種驗證過程往往受到局限,特別是一旦假設(shè)不科學(xué)、不符合實際情況,那么分析的結(jié)論就沒有意義甚至歪曲事實。許多例子分析目的就是為了湊合假設(shè)。反之,在大數(shù)據(jù)時代,可以先不考慮任何條件和限制去尋找關(guān)系和發(fā)現(xiàn)規(guī)律之后再加以總結(jié)并做出結(jié)論。統(tǒng)計分析的思路則是發(fā)現(xiàn)、總結(jié)。這樣一來,就豐富了統(tǒng)計分析的資源和空間,有利于發(fā)現(xiàn)其他更有益的數(shù)據(jù)。

最后,統(tǒng)計推斷分析理論,是基于分布理論原理,以數(shù)學(xué)中的概率做基礎(chǔ),再根據(jù)樣本的特征推斷出總體特征。其邏輯關(guān)系為先分布理論,然后是概率考證。標(biāo)準(zhǔn)雖然與樣本無關(guān),但是推斷的是否正確卻是決定于樣本的質(zhì)量。在大數(shù)據(jù)條件下,總體特征就不再需要根據(jù)分布理論來進(jìn)行推斷了,如果需要的話進(jìn)行計數(shù)即可根據(jù)所有數(shù)據(jù)以及實際分布的情況來推斷其中某些可能,那么其邏輯就變成了實際分布情況、總體特征和概率推斷。

3 結(jié)語

大數(shù)據(jù)時代對人類社會政治、經(jīng)濟(jì)、文化產(chǎn)生著深遠(yuǎn)的影響,特別是對國民經(jīng)濟(jì)統(tǒng)計科學(xué)的變革產(chǎn)生著直接的影響。我國統(tǒng)計機(jī)構(gòu)和統(tǒng)計人員如果忽視或者回避這種影響,就很難適應(yīng)時代的發(fā)展,也就不能良好地完成統(tǒng)計工作。大數(shù)據(jù)時代已經(jīng)到來,我國統(tǒng)計機(jī)構(gòu)要端正態(tài)度、放眼未來,率先在統(tǒng)計制度和方法上做出改變,才能使統(tǒng)計科學(xué)的意義得到保證。

參考文獻(xiàn)

[1] 涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2013.

[2] 郭曉科.大數(shù)據(jù)[M].北京:清華大學(xué)出版社,2013.

[3] 李金昌.統(tǒng)計思想研究[M].北京:中國統(tǒng)計出版社,2009.

作者簡介:柴世琿(1980-),男,甘肅蘭州人,供職于甘肅省郵政公司。

(責(zé)任編輯:秦遜玉)

猜你喜歡
數(shù)據(jù)分析大數(shù)據(jù)統(tǒng)計學(xué)
關(guān)于投稿的統(tǒng)計學(xué)要求
統(tǒng)計學(xué)符號使用的說明
統(tǒng)計學(xué)符號使用的說明
本刊對來稿中統(tǒng)計學(xué)處理的有關(guān)要求
Excel電子表格在財務(wù)日常工作中的應(yīng)用
淺析大數(shù)據(jù)時代背景下的市場營銷策略
新常態(tài)下集團(tuán)公司內(nèi)部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
沭阳县| 横山县| 陆良县| 张北县| 晋宁县| 凯里市| 咸宁市| 贵德县| 福泉市| 邻水| 濉溪县| 尼勒克县| 永宁县| 奉化市| 海丰县| 青神县| 西青区| 扬州市| 长垣县| 巩义市| 博罗县| 栾川县| 缙云县| 固安县| 克拉玛依市| 宁河县| 安西县| 伊吾县| 青田县| 阜新| 三门县| 鞍山市| 陆良县| 泗洪县| 沂南县| 新晃| 姜堰市| 谷城县| 重庆市| 会宁县| 家居|