符一平
(海南大學(xué) 信息科學(xué)技術(shù)學(xué)院,???570228)
淺談統(tǒng)計(jì)學(xué)在大數(shù)據(jù)
時(shí)代面臨的機(jī)遇、挑戰(zhàn)及其發(fā)展趨勢(shì)
符一平
(海南大學(xué) 信息科學(xué)技術(shù)學(xué)院,海口 570228)
由于科技進(jìn)步,大型網(wǎng)絡(luò)電商不斷興起,博客、微博、微信等社交平臺(tái)逐漸建立,龐大的數(shù)據(jù)量隨之出現(xiàn),大數(shù)據(jù)時(shí)代到來(lái)的信號(hào)已經(jīng)發(fā)出。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,統(tǒng)計(jì)學(xué)受到了重大的沖擊。因?yàn)閭鹘y(tǒng)的統(tǒng)計(jì)學(xué)教育主要應(yīng)用抽樣技術(shù),即在總體中隨機(jī)抽取部分?jǐn)?shù)據(jù)樣本進(jìn)行處理、分析。然而,隨著大數(shù)據(jù)的興起,數(shù)據(jù)量不斷增多,數(shù)據(jù)的總體性不斷強(qiáng)化,對(duì)統(tǒng)計(jì)學(xué)人才的要求也越來(lái)越高。所以,在大數(shù)據(jù)時(shí)代下,統(tǒng)計(jì)學(xué)的發(fā)展受到了制約。但另一方面,大數(shù)據(jù)也給統(tǒng)計(jì)學(xué)的發(fā)展提供了一些機(jī)遇,促進(jìn)統(tǒng)計(jì)學(xué)的改革創(chuàng)新。為了促進(jìn)統(tǒng)計(jì)學(xué)的發(fā)展,培養(yǎng)出更多適應(yīng)大數(shù)據(jù)時(shí)代的新型統(tǒng)計(jì)人才,本文對(duì)統(tǒng)計(jì)學(xué)在大數(shù)據(jù)時(shí)代面臨的機(jī)遇、挑戰(zhàn)和發(fā)展趨勢(shì)進(jìn)行了系統(tǒng)的研究。
統(tǒng)計(jì)學(xué);大數(shù)據(jù);機(jī)遇;挑戰(zhàn);發(fā)展趨勢(shì)
統(tǒng)計(jì)學(xué)是指通過(guò)應(yīng)用數(shù)學(xué)以及其他學(xué)科的專業(yè)知識(shí),來(lái)搜索、整理、分析、評(píng)估數(shù)據(jù),從而達(dá)到推斷、預(yù)測(cè)所研究對(duì)象的未來(lái)發(fā)展情況的一門(mén)綜合性學(xué)科。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,全球的數(shù)據(jù)量急速增長(zhǎng),這使在短期內(nèi)完成收集、整理、分析數(shù)據(jù)的任務(wù),變得十分困難,同時(shí)也影響到了統(tǒng)計(jì)學(xué)的正常教學(xué)。但是,大數(shù)據(jù)時(shí)代也為統(tǒng)計(jì)學(xué)提供了眾多的數(shù)據(jù)研究對(duì)象,為統(tǒng)計(jì)學(xué)的發(fā)展提供了一個(gè)良好的平臺(tái)。在這個(gè)平臺(tái)上,統(tǒng)計(jì)學(xué)遇到了許多機(jī)遇,比如:統(tǒng)計(jì)學(xué)科體系得到延伸。在大數(shù)據(jù)時(shí)代下,只要相關(guān)人員把握住這些機(jī)遇,順應(yīng)大數(shù)據(jù)的脈絡(luò)走向,那么統(tǒng)計(jì)學(xué)的發(fā)展趨勢(shì)必將趨于良好。
1.1統(tǒng)計(jì)學(xué)應(yīng)用范圍的增大
以往傳統(tǒng)的統(tǒng)計(jì)是根據(jù)所要研究的問(wèn)題而去收集相關(guān)數(shù)據(jù),再進(jìn)行整理、分析、最后得出結(jié)論。這種統(tǒng)計(jì),一方面,無(wú)法保證收集到的數(shù)據(jù)即是所需要的數(shù)據(jù),也就是說(shuō)數(shù)據(jù)的時(shí)效性得不到保證;另一方面,在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)量巨大,欲收集到某一方面的代表性數(shù)據(jù)或者全部數(shù)據(jù)是十分困難的一件事,這就導(dǎo)致相關(guān)人員的工作量巨增,工作壓力增大。然而,在大數(shù)據(jù)時(shí)代下,統(tǒng)計(jì)學(xué)不僅僅根據(jù)問(wèn)題研究數(shù)據(jù),還根據(jù)數(shù)據(jù)挖掘其背后的信息。這一研究方向的轉(zhuǎn)變意味著大數(shù)據(jù)帶給統(tǒng)計(jì)學(xué)新的機(jī)遇。隨著社會(huì)的發(fā)展,許多新型產(chǎn)業(yè)應(yīng)運(yùn)而生,但是多數(shù)人不了解這些產(chǎn)業(yè)的運(yùn)營(yíng)情況以及促進(jìn)這些產(chǎn)業(yè)發(fā)展的奧秘。在大數(shù)據(jù)背景下,通過(guò)分析、研究新型數(shù)據(jù)往往可以解開(kāi)一個(gè)產(chǎn)業(yè)的“秘密”,或者是將數(shù)據(jù)涉及的信息全面地展現(xiàn)出來(lái),從而促進(jìn)相關(guān)產(chǎn)業(yè)的發(fā)展。因此,統(tǒng)計(jì)學(xué)應(yīng)用范圍的增大對(duì)產(chǎn)業(yè)的發(fā)展具有重大意義。
1.2統(tǒng)計(jì)效率的提高
傳統(tǒng)的統(tǒng)計(jì)在收集數(shù)據(jù)方面,常常會(huì)出現(xiàn)數(shù)據(jù)滯后、失效等情況,而在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)量大,數(shù)據(jù)的更新速度快,因此,收集到的數(shù)據(jù)的質(zhì)量得到了大幅度提升。不僅如此,在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)及時(shí)性的特點(diǎn),給數(shù)據(jù)收集提供了極大的便利,比如:相關(guān)人員可以定期進(jìn)行數(shù)據(jù)收集,這樣不僅能減少工作量,還能確保數(shù)據(jù)的時(shí)效性和準(zhǔn)確性。另外,在統(tǒng)計(jì)的過(guò)程中,數(shù)據(jù)多樣性的特點(diǎn),給數(shù)據(jù)分析提供了極大的便利,比如:大數(shù)據(jù)可以被反復(fù)應(yīng)用在不同方面的研究中。因?yàn)椋瑪?shù)據(jù)的多樣性就決定了數(shù)據(jù)應(yīng)用范圍的廣泛性,特別是在數(shù)據(jù)的統(tǒng)計(jì)方面。因此,統(tǒng)計(jì)數(shù)據(jù)時(shí)就不該將數(shù)據(jù)局限于一種用途,而應(yīng)該深度挖掘數(shù)據(jù)的應(yīng)用價(jià)值,將數(shù)據(jù)應(yīng)用于各類相關(guān)的研究方面,從而達(dá)到降低相關(guān)人士的工作量、控制統(tǒng)計(jì)成本、提高統(tǒng)計(jì)效率的目的。
1.3統(tǒng)計(jì)學(xué)科體系的延伸
在統(tǒng)計(jì)學(xué)中引入大數(shù)據(jù),雖然會(huì)給統(tǒng)計(jì)學(xué)帶來(lái)一些挑戰(zhàn),但是同時(shí)也會(huì)給統(tǒng)計(jì)學(xué)帶來(lái)機(jī)遇。現(xiàn)今,大數(shù)據(jù)逐漸進(jìn)入統(tǒng)計(jì)學(xué)科,數(shù)據(jù)的龐大性使樣本統(tǒng)計(jì)中的樣本選取和標(biāo)準(zhǔn)確定受到了極大的影響。再加上,在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)具備總體的特征,簡(jiǎn)單的抽樣調(diào)查無(wú)法滿足新時(shí)代對(duì)統(tǒng)計(jì)的要求。因此,傳統(tǒng)統(tǒng)計(jì)中的樣本統(tǒng)計(jì)會(huì)朝著總體統(tǒng)計(jì)的方向發(fā)展,統(tǒng)計(jì)學(xué)科體系將會(huì)成為樣本統(tǒng)計(jì)與總體統(tǒng)計(jì)齊發(fā)展的體系,以此掩蓋樣本統(tǒng)計(jì)中的不足,保證統(tǒng)計(jì)的有效性。
2.1樣本選取及其標(biāo)準(zhǔn)確定的難度增大
樣本統(tǒng)計(jì)是現(xiàn)今統(tǒng)計(jì)學(xué)中最重要的統(tǒng)計(jì)方法,統(tǒng)計(jì)學(xué)正是通過(guò)運(yùn)用該方法對(duì)客觀事物的數(shù)據(jù)展開(kāi)數(shù)量特點(diǎn)及數(shù)量間關(guān)系的研究。樣本的選取和其標(biāo)準(zhǔn)的確定,是考察樣本統(tǒng)計(jì)是否具備價(jià)值的重要依據(jù)。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,樣本選取和其標(biāo)準(zhǔn)的確定,變得越來(lái)越困難。一方面,大數(shù)據(jù)意味著數(shù)據(jù)量不僅十分巨大,甚至大到超乎想象,而且數(shù)據(jù)還有分散性和多樣性的特點(diǎn)。這使在選取樣本的過(guò)程時(shí),收集數(shù)據(jù)的難度系數(shù)將變高,標(biāo)準(zhǔn)將很難界定,工作量將加大;另一方面,在大數(shù)據(jù)背景下,人們面對(duì)海量數(shù)據(jù),不會(huì)只想知道出現(xiàn)這些數(shù)據(jù)的原因,還會(huì)想了解這些數(shù)據(jù)代表的涵義。這不僅改變了傳統(tǒng)統(tǒng)計(jì)對(duì)數(shù)據(jù)的訴求,還迫使統(tǒng)計(jì)學(xué)進(jìn)行改革、創(chuàng)新。另外,隨著眾多電商和社交網(wǎng)絡(luò)的興起,互聯(lián)網(wǎng)上的數(shù)據(jù)量不斷增多,其研究?jī)r(jià)值也越來(lái)越高。但是,網(wǎng)絡(luò)數(shù)據(jù)大都屬于非結(jié)構(gòu)化數(shù)據(jù),而統(tǒng)計(jì)學(xué)研究的是結(jié)構(gòu)化數(shù)據(jù)。因此,在運(yùn)用樣本選取方法的過(guò)程中,難免會(huì)錯(cuò)失很多有價(jià)值的數(shù)據(jù),使樣本選取不夠全面??傊?,大數(shù)據(jù)時(shí)代給統(tǒng)計(jì)學(xué)帶來(lái)了挑戰(zhàn)。具體的挑戰(zhàn)體現(xiàn)在:能否將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)和是否能找到準(zhǔn)確分析非結(jié)構(gòu)化數(shù)據(jù)的方法。
2.2統(tǒng)計(jì)軟件及統(tǒng)計(jì)方法欠缺
統(tǒng)計(jì)軟件是基于計(jì)算機(jī)運(yùn)算環(huán)境下,信息計(jì)算機(jī)技術(shù)迅速發(fā)展而研制出來(lái)的。它主要用于提升統(tǒng)計(jì)學(xué)的數(shù)據(jù)分析和處理的效率,提高一般性的統(tǒng)計(jì)實(shí)踐操作質(zhì)量,并通過(guò)設(shè)置統(tǒng)計(jì)模型來(lái)簡(jiǎn)化統(tǒng)計(jì)的復(fù)雜操作。在大數(shù)據(jù)時(shí)代,常見(jiàn)的統(tǒng)計(jì)軟件有Eviews、SPSS、SAS、Stata等,但是這些軟件要運(yùn)用于大數(shù)據(jù),在存儲(chǔ)、傳輸方面還有欠缺,它們還需要得到進(jìn)一步的完善和升級(jí)??墒?,完成升級(jí)、完善統(tǒng)計(jì)軟件的任務(wù)相對(duì)困難,并且無(wú)法與互聯(lián)網(wǎng)、電子商務(wù)等公司相提并論。另外,在大數(shù)據(jù)背景下,數(shù)據(jù)不僅具備海量化,多樣化的特點(diǎn),而且其獲取途徑眾多,因此,分析、研究數(shù)據(jù)變得困難,再加上,我國(guó)的統(tǒng)計(jì)方法相對(duì)欠缺,所以,統(tǒng)計(jì)學(xué)在大數(shù)據(jù)時(shí)代下面臨著挑戰(zhàn)。
3.1加大應(yīng)用型統(tǒng)計(jì)教學(xué)力度
統(tǒng)計(jì)學(xué)和其他理論型學(xué)科不同,它是一門(mén)實(shí)用性極強(qiáng)的學(xué)科,無(wú)論是非統(tǒng)計(jì)學(xué)人士,還是統(tǒng)計(jì)人員,或多或少的都需要掌握統(tǒng)計(jì)學(xué)的應(yīng)用方法和技巧。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)具有多樣性、總體性、分散性及海量性等特點(diǎn),因此,欲從數(shù)據(jù)背后得到精確結(jié)論,必須對(duì)所研究數(shù)據(jù)進(jìn)行全面且精準(zhǔn)的統(tǒng)計(jì)分析。另外,根據(jù)大數(shù)據(jù)的這些特點(diǎn),不難看出,新時(shí)代對(duì)統(tǒng)計(jì)人才的要求越來(lái)越嚴(yán),對(duì)統(tǒng)計(jì)學(xué)教育也更加重視,因此,在統(tǒng)計(jì)學(xué)教學(xué)過(guò)程中,加大應(yīng)用型統(tǒng)計(jì)的教學(xué)力度必不可少。應(yīng)用型統(tǒng)計(jì)是指輕理論、重實(shí)踐的統(tǒng)計(jì)教學(xué)。這種教學(xué)類型,在提高學(xué)生的實(shí)踐操作能力,幫助積累實(shí)踐經(jīng)驗(yàn),掌握統(tǒng)計(jì)技巧方面,具有重大意義。教師加大應(yīng)用型統(tǒng)計(jì)學(xué)的教學(xué)力度,主要從三方面入手。第一,加大數(shù)據(jù)收集的教學(xué)力度。收集數(shù)據(jù)是統(tǒng)計(jì)的基礎(chǔ)步驟,也是初步判斷統(tǒng)計(jì)結(jié)論是否有效的參考因素。就某種意義而言,只有加強(qiáng)對(duì)數(shù)據(jù)收集的教學(xué)力度,才能保證學(xué)生在大數(shù)據(jù)時(shí)代下,能收集到保質(zhì)保量的數(shù)據(jù)。第二,加強(qiáng)數(shù)據(jù)整理的教學(xué)力度。由于,在大數(shù)據(jù)背景下,收集到的數(shù)據(jù)具有多樣化、海量化的特點(diǎn),所以如何高效地整理這些數(shù)據(jù)成為一大難題。正因?yàn)槿绱?,才在高校中呼吁教師加大?duì)數(shù)據(jù)整理的教學(xué)力度。第三,加大數(shù)據(jù)透視的教學(xué)力度。數(shù)據(jù)的透視是指通過(guò)數(shù)據(jù)透視化技術(shù),來(lái)使非結(jié)構(gòu)化數(shù)據(jù)直觀化的一項(xiàng)教學(xué)內(nèi)容。因?yàn)樵诖髷?shù)據(jù)時(shí)代下,會(huì)出現(xiàn)許多非結(jié)構(gòu)化數(shù)據(jù),而傳統(tǒng)的統(tǒng)計(jì)方法只能統(tǒng)計(jì)結(jié)構(gòu)化數(shù)據(jù),所以,加強(qiáng)數(shù)據(jù)透視的教學(xué)力度,有助于提高統(tǒng)計(jì)的高效性,幫助培養(yǎng)統(tǒng)計(jì)人才。
3.2提高大數(shù)據(jù)統(tǒng)計(jì)思維
無(wú)論是在傳統(tǒng)的統(tǒng)計(jì)學(xué)教育中,還是在大數(shù)據(jù)時(shí)代下,統(tǒng)計(jì)思維一直都是教師著重培養(yǎng)的一方面。良好的統(tǒng)計(jì)思維,不僅能提高學(xué)生收集、整理數(shù)據(jù)的能力,還是將理論有效地付諸實(shí)踐的重要保證。從另一角度看,如果統(tǒng)計(jì)人員不具備統(tǒng)計(jì)思維,那么在海量的大數(shù)據(jù)下,就無(wú)法準(zhǔn)確分辨出所需的數(shù)據(jù),也就無(wú)法高效地完成工作。傳統(tǒng)的統(tǒng)計(jì)思維包括平均思維、變異思維、普遍聯(lián)系思維、動(dòng)態(tài)思維等,面對(duì)大數(shù)據(jù)時(shí)代下,數(shù)據(jù)的混雜性和總體性,提高統(tǒng)計(jì)思維還需注重培養(yǎng)學(xué)生的大數(shù)據(jù)統(tǒng)計(jì)思維。大數(shù)據(jù)思維不僅具備容錯(cuò)性和復(fù)雜性,其還強(qiáng)調(diào)數(shù)據(jù)之間聯(lián)系和注重相關(guān)數(shù)據(jù)間的分析。
3.3加強(qiáng)基礎(chǔ)性統(tǒng)計(jì)知識(shí)教學(xué)力度
現(xiàn)今,統(tǒng)計(jì)學(xué)教學(xué)現(xiàn)狀不容樂(lè)觀,學(xué)生在學(xué)習(xí)統(tǒng)計(jì)學(xué)時(shí),普遍會(huì)出現(xiàn)基礎(chǔ)知識(shí)薄弱,畏難情緒較嚴(yán)重的現(xiàn)象。為了改善統(tǒng)計(jì)學(xué)教學(xué)現(xiàn)狀,緩解大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)學(xué)的危機(jī),教師應(yīng)加大基礎(chǔ)性統(tǒng)計(jì)知識(shí)的教學(xué)力度,確保每位學(xué)生都能掌握良好的統(tǒng)計(jì)學(xué)知識(shí),從而促進(jìn)統(tǒng)計(jì)學(xué)的發(fā)展。由于統(tǒng)計(jì)學(xué)中的概念、公式較多,而且較抽象,學(xué)生不易理解,所以,教師要盡量做到深入淺出,保證學(xué)生準(zhǔn)確掌握相關(guān)知識(shí)。但是,不是所有教學(xué)內(nèi)容都可以做到深入淺出,所以,教師應(yīng)重視基礎(chǔ)知識(shí)的教學(xué)。只有在學(xué)生對(duì)統(tǒng)計(jì)學(xué)的基礎(chǔ)概念、公式、原理等都充分了解的情況下,才能為后續(xù)的學(xué)習(xí)打下堅(jiān)實(shí)的基礎(chǔ),才能提高后續(xù)教學(xué)的效率。大數(shù)據(jù)時(shí)代的到來(lái),促使統(tǒng)計(jì)學(xué)進(jìn)行改革。在改革后,統(tǒng)計(jì)學(xué)的教學(xué)要求更嚴(yán),教學(xué)內(nèi)容更深,所以,不具備良好的統(tǒng)計(jì)學(xué)基礎(chǔ)是無(wú)法完成學(xué)業(yè)的,更無(wú)法促進(jìn)統(tǒng)計(jì)學(xué)的發(fā)展,培養(yǎng)出新型統(tǒng)計(jì)學(xué)人才。
3.4重視復(fù)合型人才培養(yǎng)
統(tǒng)計(jì)學(xué)不僅能為數(shù)學(xué)、物理等學(xué)科提供數(shù)據(jù)分析方法,還在生活、經(jīng)濟(jì)等領(lǐng)域具備重大意義。以前,數(shù)據(jù)簡(jiǎn)單化,來(lái)源較單一,所以對(duì)統(tǒng)計(jì)人才的要求并不高。然而,隨著大數(shù)據(jù)時(shí)代的來(lái)臨,統(tǒng)計(jì)人才不再是單純具備良好統(tǒng)計(jì)知識(shí)的人,而是復(fù)合型人才。在大數(shù)據(jù)時(shí)代下,許多數(shù)據(jù)比較混亂、龐雜,只有具備良好的編程技能、統(tǒng)計(jì)能力的人,才能將其收集、整理為有價(jià)值的數(shù)據(jù)。在大數(shù)據(jù)時(shí)代下,行業(yè)間競(jìng)爭(zhēng)十分激烈,數(shù)據(jù)的統(tǒng)計(jì)工作也變得十分艱辛,只有具備大數(shù)據(jù)專業(yè)知識(shí),超強(qiáng)的數(shù)據(jù)分析、處理能力的人,才能在這個(gè)時(shí)代具備強(qiáng)大的競(jìng)爭(zhēng)力。在大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)不是單純的加減運(yùn)算,只有具備統(tǒng)計(jì)思維、數(shù)據(jù)甄別能力、計(jì)算機(jī)專業(yè)技術(shù)的復(fù)合人才,才能高效地進(jìn)行統(tǒng)計(jì)工作。因此,在大數(shù)據(jù)背景下,培養(yǎng)復(fù)合型人才十分必要。
統(tǒng)計(jì)學(xué)作為教育階段最重要的學(xué)科之一,不僅能促進(jìn)物理、數(shù)學(xué)等學(xué)科的發(fā)展,在推動(dòng)政府的情報(bào)決策、工商業(yè)的發(fā)展方面也具有重大意義。地方政府在進(jìn)行市場(chǎng)經(jīng)濟(jì)的宏觀調(diào)控、指導(dǎo)、規(guī)劃等方面離不開(kāi)統(tǒng)計(jì),也只有對(duì)數(shù)據(jù)開(kāi)展精細(xì)的分析、統(tǒng)計(jì)工作,才能得到更具說(shuō)服力、更具價(jià)值的結(jié)論,實(shí)踐于生活中才更有利。而且,在人口普查、環(huán)境評(píng)估等方面也會(huì)經(jīng)常運(yùn)用到統(tǒng)計(jì)學(xué)。由此可見(jiàn),統(tǒng)計(jì)學(xué)十分重要。雖然,我國(guó)的統(tǒng)計(jì)學(xué)教學(xué)現(xiàn)狀不容樂(lè)觀,在大數(shù)據(jù)背景下,統(tǒng)計(jì)學(xué)還面臨眾多挑戰(zhàn),但是,相關(guān)人員更應(yīng)看見(jiàn)其中的機(jī)遇,把握好時(shí)機(jī),共同努力,攜手推進(jìn)統(tǒng)計(jì)學(xué)的發(fā)展。
主要參考文獻(xiàn)
[1]田茂再.大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)重構(gòu)研究中的幾個(gè)熱點(diǎn)問(wèn)題[J].統(tǒng)計(jì)研究,2015(5).
[2]崔路云.基于大數(shù)據(jù)時(shí)代背景對(duì)統(tǒng)計(jì)學(xué)教育的幾點(diǎn)思考[D].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),2014.
[3]朱懷慶.大數(shù)據(jù)時(shí)代對(duì)本科經(jīng)管類統(tǒng)計(jì)學(xué)教學(xué)的影響及對(duì)策[J].高等教育研究(成都),2014(3).
10.3969/j.issn.1673 - 0194.2016.14.178
C81
A
1673-0194(2016)14-0245-02
2016-06-02
海南省自然科學(xué)基金(20151002)。