李曉莉
摘 要:大數(shù)據(jù)時代的來臨不僅改變了社會的發(fā)展趨勢,對學(xué)科的影響也是巨大的。尤其從統(tǒng)計學(xué)層面來說,傳統(tǒng)的統(tǒng)計學(xué)學(xué)科在沒有受到大數(shù)據(jù)影響之前,只能用案例數(shù)據(jù)來進(jìn)行統(tǒng)計學(xué)計算,但有了大數(shù)據(jù)作為分析基礎(chǔ)之后,統(tǒng)計學(xué)的發(fā)展方向也面臨著前所未有的機遇和挑戰(zhàn)。如何在大數(shù)據(jù)背景下明確統(tǒng)計學(xué)的發(fā)展方向,深入探討大數(shù)據(jù)與統(tǒng)計學(xué)之間的密切關(guān)聯(lián),是學(xué)術(shù)界乃至整個社會需要關(guān)注的重點內(nèi)容。介紹大數(shù)據(jù)時代的特點、內(nèi)涵和目的,分析闡述大數(shù)據(jù)背景給統(tǒng)計學(xué)發(fā)展方向帶來的轉(zhuǎn)變,最后為統(tǒng)計學(xué)找尋發(fā)展方向?qū)崿F(xiàn)改革提出一些可行性的策略建議。
關(guān)鍵詞:大數(shù)據(jù)背景;統(tǒng)計學(xué);發(fā)展方向;研究分析
中圖分類號:C8 ? ? ? ?文獻(xiàn)標(biāo)志碼:A ? ? ?文章編號:1673-291X(2019)15-0003-02
信息化技術(shù)的發(fā)展催生了當(dāng)前的大數(shù)據(jù)背景,在信息化技術(shù)、定位系統(tǒng)、傳感器的作用下,解決了許多從前遇到的數(shù)據(jù)收集難題,云計算功能更實現(xiàn)了大規(guī)模的數(shù)據(jù)處理。在某種程度上可以說,大數(shù)據(jù)時代給統(tǒng)計學(xué)的發(fā)展帶來了巨大的改變,為統(tǒng)計學(xué)的發(fā)展開拓出一個新的視角。本文從大數(shù)據(jù)的研究方向、研究內(nèi)容和研究目的入手,并以大數(shù)據(jù)的處理、抽樣與分析為切入點,指出大數(shù)據(jù)時代給統(tǒng)計學(xué)帶來的巨大變革。最終提出,統(tǒng)計學(xué)要適應(yīng)大數(shù)據(jù)時代,不僅需要健全統(tǒng)計學(xué)總體、個體以及樣本的定義,還要拓寬統(tǒng)計學(xué)研究體系、研發(fā)新的分類和梳理方法,并將傳統(tǒng)的統(tǒng)計學(xué)方法和新的統(tǒng)計學(xué)方法相融合等具體策略。
一、大數(shù)據(jù)的內(nèi)涵和作用
第一,大數(shù)據(jù)的內(nèi)涵。近年來,國內(nèi)外對于大數(shù)據(jù)的研究方向基本達(dá)到了統(tǒng)一,從總體上來看,發(fā)達(dá)國家對于大數(shù)據(jù)的研究和實踐先進(jìn)水平較高,我國目前大數(shù)據(jù)的發(fā)展相較于發(fā)達(dá)國家還有一段距離。從研究方向上來看,美國科學(xué)院召開的全國研究理事會中曾明確指出,大數(shù)據(jù)所具備的功能不僅需要能夠追蹤數(shù)據(jù)樣本,還要能夠?qū)嵤┱_的算法對分布的資源進(jìn)行處理。對數(shù)據(jù)類型的包容量要足夠廣泛,給決策者和研究者提供足夠的、準(zhǔn)確可靠的數(shù)據(jù)依據(jù)。我國在香山研究大會上也明確指出大數(shù)據(jù)發(fā)展的重要性和大數(shù)據(jù)項目建設(shè)的必要性,但大數(shù)據(jù)的整體研究過程涉及的學(xué)科知識面比較廣泛,其本質(zhì)即各個領(lǐng)域數(shù)據(jù)的集合,但往往要了解某個領(lǐng)域的真實情況,大數(shù)據(jù)就需要針對這個領(lǐng)域及其相關(guān)領(lǐng)域的數(shù)據(jù)展開分析,通過對數(shù)據(jù)來源和數(shù)據(jù)庫中的內(nèi)容進(jìn)行挑選,才能完成這一任務(wù)。因此,在實際操作時還需要將計算機中的數(shù)據(jù)資源和決策有效融合,才能讓大數(shù)據(jù)在各行各業(yè)中發(fā)揮作用[1]。
第二,大數(shù)據(jù)的作用。大數(shù)據(jù)使眾多高維變量與數(shù)據(jù)完成了整合,統(tǒng)計學(xué)作為數(shù)據(jù)分析的一門重要學(xué)科,常采用的計算方法是抽樣調(diào)查法。采用抽樣調(diào)查法的主要原因,是由于統(tǒng)計學(xué)無法將所有的數(shù)據(jù)樣本作為參考依據(jù)進(jìn)行計算,這樣不僅工作量巨大,耗費的時間也十分長。而大數(shù)據(jù)的出現(xiàn),則解決了這一難題,其能夠?qū)⑸鐣⒔?jīng)濟(jì)、人文、網(wǎng)絡(luò)等多個領(lǐng)域的數(shù)據(jù)進(jìn)行整合,實現(xiàn)各個領(lǐng)域之間的互通和融合。無論是信息的儲存還是轉(zhuǎn)化,其都有較為先進(jìn)的處理機制,這也就意味著,它不僅能夠解決當(dāng)下需要解決的大多數(shù)與數(shù)據(jù)相關(guān)的問題,還能夠?qū)⒛壳盁o法解決的問題的信息數(shù)據(jù)保存,作為日后的發(fā)展使用需要儲備。
二、大數(shù)據(jù)時代給統(tǒng)計學(xué)帶來的變革
(一)大數(shù)據(jù)的處理、抽樣與分析對統(tǒng)計學(xué)產(chǎn)生的影響
1.數(shù)據(jù)預(yù)處理。在對集眾數(shù)據(jù)進(jìn)行處理時,首先要進(jìn)行數(shù)據(jù)的清洗、糾正和填補,以便完成數(shù)據(jù)的預(yù)處理。在檢查數(shù)據(jù)是否預(yù)處理完成時,可以采取抽樣調(diào)查的方法,判斷是否還存在需要糾正的數(shù)據(jù)。大數(shù)據(jù)采集信息時具備的缺點是:花費的時間長、數(shù)據(jù)信號單一,更新緩慢,且在對眾多數(shù)據(jù)進(jìn)行整合時,目前仍舊存在不可規(guī)避的數(shù)據(jù)偏倚問題。但大數(shù)據(jù)的優(yōu)點是,能夠盡可能地對錯誤信息進(jìn)行糾偏,統(tǒng)籌整合所有數(shù)據(jù)信息資源,實現(xiàn)決策者的統(tǒng)計目標(biāo)[2]。
2.大數(shù)據(jù)抽樣。大數(shù)據(jù)抽樣與統(tǒng)計學(xué)抽樣不同的是,統(tǒng)計學(xué)抽樣是在設(shè)定條件下,從眾多的數(shù)據(jù)中隨機挑選某些數(shù)據(jù)進(jìn)行統(tǒng)計學(xué)的分析和計算,大數(shù)據(jù)抽樣則是從眾多流動的數(shù)據(jù)中,挑選典型信息進(jìn)行分析計算,以獲得更加精確的計算結(jié)果。大數(shù)據(jù)抽樣不僅能夠計算出某項內(nèi)容的內(nèi)在聯(lián)系,還十分有利于研究數(shù)據(jù)的適應(yīng)性、連貫性和動態(tài)關(guān)系。傳統(tǒng)統(tǒng)計學(xué)中靠人工篩選典型數(shù)據(jù)的方法有很大的局限性,而大數(shù)據(jù)抽樣不斷采集樣本,累積數(shù)據(jù)信息的方式則能得到更加真實、可靠的結(jié)果。
3.大數(shù)據(jù)分析。傳統(tǒng)統(tǒng)計學(xué)分析中整合各個相關(guān)但不直接聯(lián)系的變量關(guān)系的工作十分煩瑣,不僅要挑選某一項中的樣本數(shù)據(jù),還要判斷各個變量之間的正作用關(guān)系和副作用關(guān)系。大數(shù)據(jù)分析時,其包容力大、分析力強的數(shù)據(jù)統(tǒng)籌能力不僅能將不同環(huán)境中的數(shù)據(jù)資源完美整合,還能在多源、多條件下進(jìn)行數(shù)據(jù)分析并得到一個較為正確的數(shù)據(jù)統(tǒng)計結(jié)果,減少了中間變量的參與過程,這一分析法也叫作薈萃分析法。
4.網(wǎng)絡(luò)圖模型構(gòu)建。大數(shù)據(jù)時代的另一大特征就是網(wǎng)絡(luò)平臺的發(fā)展和建設(shè),傳統(tǒng)統(tǒng)計學(xué)的應(yīng)用僅限于線下的統(tǒng)計計算,采集數(shù)據(jù)的方式通常也在線下進(jìn)行,常見的有調(diào)查問卷、學(xué)校課題研究、任務(wù)布置等途徑。大數(shù)據(jù)網(wǎng)絡(luò)平臺搭建之后,可以從多方面搜集數(shù)據(jù),用戶的每一個上網(wǎng)任務(wù)和點擊任務(wù)都可以作為基礎(chǔ)數(shù)據(jù)依據(jù)。隨著信息化的不斷發(fā)展,數(shù)據(jù)處理模型系統(tǒng)軟件也被不斷開發(fā)出來,目前常用的就有MIM、BN、MSBN等高維數(shù)據(jù)處理工具,不僅能夠計算事件概率,還能夠構(gòu)建數(shù)據(jù)因果關(guān)系圖,十分有利于信息的傳播和流轉(zhuǎn)。
(二)大數(shù)據(jù)時代給統(tǒng)計學(xué)帶來的發(fā)展方向的轉(zhuǎn)變
大數(shù)據(jù)時代的特征從宏觀方向上來看,其讓原來細(xì)分化的工作實現(xiàn)了統(tǒng)一化,運用豐富的軟件和龐大的數(shù)據(jù)信息庫,可以分析統(tǒng)計出多個領(lǐng)域的任務(wù)。相較于傳統(tǒng)單一的專家,大數(shù)據(jù)好似一個綜合性的專家,能同時進(jìn)行和完成多個領(lǐng)域的工作和任務(wù)。從微觀角度來看,大數(shù)據(jù)時代更傾向于從數(shù)據(jù)中發(fā)展問題、解決問題,將數(shù)據(jù)分析與決策掛鉤,著重體現(xiàn)數(shù)據(jù)信息的重要性[3]。基于這些特征,大數(shù)據(jù)時代給統(tǒng)計學(xué)帶來的變革主要有兩點:一是弱化傳統(tǒng)數(shù)據(jù)統(tǒng)計職能,在傳統(tǒng)統(tǒng)計學(xué)中,需要專門的部門對數(shù)據(jù)進(jìn)行統(tǒng)計和計算,而大數(shù)據(jù)的發(fā)展則可直接依賴計算機和統(tǒng)計軟件計算出更加準(zhǔn)確的結(jié)果,而后直接應(yīng)用到?jīng)Q策和生產(chǎn)工作中。二是對統(tǒng)計學(xué)專業(yè)部門的工作方式造成了沖擊,傳統(tǒng)的統(tǒng)計學(xué)工作需要大量的紙質(zhì)資料,且數(shù)據(jù)記錄和資源整理都需要通過紙質(zhì)辦公的方式進(jìn)行。大數(shù)據(jù)發(fā)展后,統(tǒng)計部門的工作方式大多利用計算機進(jìn)行,不僅能夠隨時共享資源和信息,同時數(shù)據(jù)的采集渠道變廣,傳播速度變快,分析結(jié)果也更加精確。
三、適應(yīng)大數(shù)據(jù)時代統(tǒng)計學(xué)發(fā)展的方向和發(fā)展策略
第一,健全統(tǒng)計學(xué)總體、個體以及樣本的定義。傳統(tǒng)統(tǒng)計學(xué)在進(jìn)行分析時,首先要搜集數(shù)據(jù),然后從搜集到的總體數(shù)據(jù)中抽取樣本,再通過分析樣本的性質(zhì)來確定所調(diào)查的總體的特點。也就是說,在篩選數(shù)據(jù)的時候,傳統(tǒng)統(tǒng)計學(xué)是先確定總體,再抽取數(shù)據(jù)樣本進(jìn)行分析[4]。而大數(shù)據(jù)環(huán)境下的統(tǒng)計方式則截然不同,大數(shù)據(jù)首先通過搜集個體數(shù)據(jù)樣板,最終再來確定總體,最后只需要按照對應(yīng)的要求來篩選相關(guān)數(shù)據(jù),最終分析計算出的結(jié)果是基于總體得到的結(jié)果,更科學(xué)也更具說服力。在當(dāng)今時代的發(fā)展中,大多數(shù)的數(shù)據(jù)以數(shù)據(jù)流的形式出現(xiàn),即數(shù)據(jù)樣本是流動的、不斷積累的,傳統(tǒng)統(tǒng)計學(xué)的分析具有一定的滯后性,其分析計算出的結(jié)果很有可能不具備與時俱進(jìn)的要求。大數(shù)據(jù)統(tǒng)計則能夠?qū)?shù)據(jù)進(jìn)行一個動態(tài)的搜集和監(jiān)控,對已經(jīng)確定的數(shù)據(jù)沒有過高的依賴性,計算時段與下個時段的差距也更小,分析計算得出的結(jié)果更具實際意義。傳統(tǒng)統(tǒng)計學(xué)中對總體、個體、樣本的定義顯然已經(jīng)不符合大數(shù)據(jù)時代的發(fā)展要求,從符號定義的角度來看,統(tǒng)計學(xué)要想發(fā)揮符合現(xiàn)代需求的實際意義,就需要對其所包含的專業(yè)的符號和稱謂進(jìn)行重新定義。健全定義的內(nèi)容才是完善統(tǒng)計學(xué)內(nèi)容的本質(zhì),例如總體是即時總體還是過時總體、個體的范疇與個體對相關(guān)內(nèi)容造成的正影響或副作用說明、樣本是從總體中抽取的樣本還是調(diào)查過程中隨機保留的樣本等內(nèi)容,都需要統(tǒng)計學(xué)在今后的發(fā)展過程中突破傳統(tǒng),重新定義,以為統(tǒng)計學(xué)未來的發(fā)展奠定良好的基礎(chǔ)。
第二,拓寬統(tǒng)計學(xué)研究體系。無論是社會的進(jìn)步還是學(xué)科的進(jìn)步,可持續(xù)發(fā)展永遠(yuǎn)是不變的宗旨,在這個困難與機遇并存、超越與淘汰只在一念之間的迅速發(fā)展的時代,更需要用辯證和發(fā)展的眼光來看待統(tǒng)計學(xué)的發(fā)展。大數(shù)據(jù)目前所處的位置是一個統(tǒng)一性強、框架體系巨大的綜合性內(nèi)容,統(tǒng)計學(xué)作為其中的一個分支,有必要將大數(shù)據(jù)的思想和內(nèi)涵融入到該學(xué)科未來的發(fā)展規(guī)劃中[5]。傳統(tǒng)的統(tǒng)計學(xué)分析計算有很大的局限性,為了保證計算結(jié)果的公平和公正性,只能隨機從統(tǒng)計總體數(shù)據(jù)中挑選數(shù)據(jù)樣本進(jìn)行相關(guān)計算,主張“以小見大”的分析統(tǒng)計方式。大數(shù)據(jù)時代的來臨則解決了統(tǒng)計數(shù)據(jù)內(nèi)容過大、數(shù)據(jù)整理過程復(fù)雜這一難題,所有的數(shù)據(jù)都能夠作為數(shù)據(jù)樣本進(jìn)行統(tǒng)一的分析和計算。傳統(tǒng)的統(tǒng)計學(xué)計算方式可能存在許多結(jié)果并存的情況,因此只能通過簡化數(shù)據(jù)信息內(nèi)容,得到一個相對準(zhǔn)確的結(jié)果的方式展開計算,但大數(shù)據(jù)則不需要刪減數(shù)據(jù)的過程,反而是充分搜集相關(guān)數(shù)據(jù),最終得到一個結(jié)果,減少了誤差存在的可能性。由此可見,大數(shù)據(jù)的發(fā)展方式是統(tǒng)計學(xué)中幾乎沒有出現(xiàn)過的,但這種統(tǒng)計方式顯然更符合時代的發(fā)展需求。因此,統(tǒng)計學(xué)在發(fā)展過程中積極拓寬研究體系,建立更多的分析研究方式是適應(yīng)大數(shù)據(jù)時代發(fā)展的必然趨勢。
第三,研發(fā)新的分類和梳理方法。傳統(tǒng)統(tǒng)計學(xué)的數(shù)據(jù)分類方式都是先進(jìn)行分類的定義和區(qū)分,然后按照其所定義的“便簽”去有針對性地找尋搜集相關(guān)數(shù)據(jù),在進(jìn)行數(shù)據(jù)統(tǒng)計時會發(fā)現(xiàn),這些信息往往都被囊括到一個確定的結(jié)構(gòu)中,梳理過程比較單一。眾所周知,分類和梳理是數(shù)據(jù)預(yù)處理過程中的兩個關(guān)鍵環(huán)節(jié),分類和梳理的科學(xué)性會直接影響到分析計算的統(tǒng)計結(jié)果。但在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的來源和形式是完全開放的,只要設(shè)定好所需要的信息的類型,按照分類標(biāo)識以及關(guān)系判斷分類,就能從各種不相關(guān)的數(shù)據(jù)中篩選到統(tǒng)計所需要的數(shù)據(jù)內(nèi)容。一個任務(wù)中所需要數(shù)據(jù)的條件往往不是單一的,數(shù)據(jù)的來源和形式多種多樣,因此按照一個統(tǒng)一的標(biāo)準(zhǔn)來設(shè)定數(shù)據(jù)要求幾乎是不可能的。但大數(shù)據(jù)的優(yōu)點是,其能通過數(shù)據(jù)預(yù)處理過程篩選出有效數(shù)據(jù),然后再在計算時根據(jù)自身要求來展開樣本分析計算工作。從數(shù)據(jù)分類和梳理方法上來看,大數(shù)據(jù)環(huán)境下的選擇方式更多,分析條件更加多元化。傳統(tǒng)統(tǒng)計學(xué)古板的分類方法和單一的梳理方法,顯然不符合大數(shù)據(jù)的發(fā)展應(yīng)用要求。因此,統(tǒng)計學(xué)在保留過去分類和梳理方法優(yōu)點的基礎(chǔ)上,積極開發(fā)和研究新的分類、梳理方法,才是其在未來進(jìn)程中立足于大數(shù)據(jù)時代的重點內(nèi)容。
第四,重新整合統(tǒng)計學(xué)方法。融合性和包容性是大數(shù)據(jù)時代的重要特征,因此傳統(tǒng)統(tǒng)計學(xué)中單一的研究方法只會讓其自身的發(fā)展陷入一個死胡同。大數(shù)據(jù)的先進(jìn)之處在于,它不僅能夠通過對數(shù)據(jù)的總結(jié)、分析和統(tǒng)計來判斷總體過去和當(dāng)前的狀態(tài)與形式,還能夠通過對數(shù)據(jù)的變化規(guī)律進(jìn)行分析,推斷出該總體未來的發(fā)展趨勢和發(fā)展方向,這樣就能給決策者提供更多的結(jié)論信息,幫助其做出更具前瞻性的決策[6]。實際上,傳統(tǒng)統(tǒng)計學(xué)中也有針對這兩項內(nèi)容的計算方法,其中對數(shù)據(jù)信息進(jìn)行分析來總結(jié)該項總體過去和當(dāng)前的發(fā)展?fàn)顟B(tài)的方法為歸納推斷法,它是一種通過運用具體數(shù)據(jù)信息對總體的特征進(jìn)行總結(jié)和推斷的方法,但已存的數(shù)據(jù)中其實很難發(fā)掘數(shù)據(jù)的動態(tài)發(fā)展過程,因此從個體信息中能夠獲取的有效知識比較有限。但傳統(tǒng)統(tǒng)計學(xué)中還有一種演繹推理法,即通過深挖數(shù)據(jù)內(nèi)容中的相關(guān)內(nèi)在聯(lián)系,深入分析事物的變化過程和動態(tài)趨勢,經(jīng)過經(jīng)驗總結(jié),來推斷事物的未來發(fā)展進(jìn)程。演繹推理法所推理出來的未來發(fā)展趨勢相對來說更具參考價值,排除了事件出現(xiàn)的偶然性,將變化過程中細(xì)小的變化和關(guān)鍵的變化都放在了考慮范圍內(nèi)。重新整合統(tǒng)計學(xué)方法的含義是,將幾種單一的統(tǒng)計學(xué)方法結(jié)合起來,集中去解決需要面對的同一個問題,從而全面提升統(tǒng)計學(xué)對于數(shù)據(jù)信息的駕馭水平。
四、結(jié)語
從上面的總結(jié)中不難看出,雖然大數(shù)據(jù)時代的來臨在統(tǒng)計學(xué)的發(fā)展過程中掀起了一場不小的波瀾,但只要找到正確的方法和路徑,統(tǒng)計學(xué)也能夠乘風(fēng)破浪,抓住其中的機遇,順應(yīng)時代的發(fā)展。統(tǒng)計學(xué)這門學(xué)科在現(xiàn)當(dāng)代社會的教育和發(fā)展過程中是無法替代的,但只有其本身能夠與時俱進(jìn),不斷補充,才能在時代的不斷變更中發(fā)揮其自身的作用,從而促進(jìn)和推動我國經(jīng)濟(jì)學(xué)和社會統(tǒng)計領(lǐng)域的不斷進(jìn)步。
參考文獻(xiàn):
[1] ?李政,趙彥云.適應(yīng)大數(shù)據(jù)時代的美國統(tǒng)計學(xué)大學(xué)教育:下[J].中國統(tǒng)計,2015,(4):24-25.
[2] ?周茂袁.大數(shù)據(jù)時代統(tǒng)計學(xué)專業(yè)教學(xué)改革的初步探索[J].教育教學(xué)論壇,2015,(35):105-106.
[3] ?薛艷.大數(shù)據(jù)時代統(tǒng)計學(xué)專業(yè)教學(xué)體系的改革[J].教育教學(xué)論壇,2015,(4):110-111.
[4] ?郭海兵.大數(shù)據(jù)背景下統(tǒng)計學(xué)專業(yè)教學(xué)改革的思考[J].現(xiàn)代職業(yè)教育,2016,(31):184-185.
[5] ?胡凌云.大數(shù)據(jù)背景下統(tǒng)計學(xué)專業(yè)教學(xué)改革思考[J].課程教育研究,2017,(21):6-7.
[6] ?楊文幫.大數(shù)據(jù)時代背景下統(tǒng)計學(xué)專業(yè)發(fā)展前景分析[J].考試周刊,2017,(81):393-394.
[責(zé)任編輯 劉嬌嬌]