葉祥鳳 黃秋亞
作者簡介:葉祥鳳(1969-),女,成都信息工程學院統(tǒng)計學院教師,教授,研究方向:調查與咨詢。
黃秋亞(1990-),女,成都信息工程學院統(tǒng)計學專業(yè)學生。
摘要:大數(shù)據(jù)是伴隨著社交網(wǎng)絡等新技術的發(fā)展產生的數(shù)據(jù)形態(tài),本質上是數(shù)據(jù)生產、傳輸和應用的社會化。政府統(tǒng)計改革要研究分析大數(shù)據(jù)之下有利統(tǒng)計條件,以此為基礎進行優(yōu)化統(tǒng)計機構設置、提高統(tǒng)計業(yè)務數(shù)據(jù)化及數(shù)據(jù)挖掘分析能力,完善統(tǒng)計數(shù)據(jù)發(fā)布渠道等改革。
關鍵詞:大數(shù)據(jù);政府統(tǒng)計;統(tǒng)計改革
一、研究背景與目的
大數(shù)據(jù)是商業(yè)智能化的一個新的發(fā)展階段。這一概念早在20世紀50年代由IBM公司提出,主要指那些能幫助企業(yè)提高決策能力和運營能力的概念、方法、過程及軟件的集合,其主要目標是將企業(yè)所掌握的信息轉換為知識,需要錄用數(shù)據(jù)倉庫、聯(lián)機分析處理工具盒數(shù)據(jù)挖掘等技術。大數(shù)據(jù)是一種“以數(shù)據(jù)為大”的方法論,它通過對個體行為的數(shù)據(jù)挖掘,使用關系分析、文本挖掘、社會計算、情感分析、時間線預測以及社會網(wǎng)絡分析等方法來尋找有價值的信息,從而幫助人們更好地認識用戶需求,尋找市場。
大數(shù)據(jù)時代的三個轉變:一是在大數(shù)據(jù)時代,可分析更多的數(shù)據(jù),有時候甚至可以處理與某個特別現(xiàn)象相關的所有數(shù)據(jù),而不再依賴于隨機采樣,可以追求總體數(shù)據(jù)而不是隨機樣本。二是研究數(shù)據(jù)種類繁多、數(shù)據(jù)海量,以至于可以不再熱衷于追求精確度,三是由前兩個轉變而形成的結果,即可以不再熱衷于尋找因果關系。
政府統(tǒng)計主要由政府對社會經濟發(fā)展數(shù)量與質量方面的內容(數(shù)量的多少、現(xiàn)象之間的數(shù)量關系、質量互變的數(shù)量界限等)進行分析研究工作。常規(guī)統(tǒng)計工作需通過對數(shù)據(jù)的專門收集、規(guī)范統(tǒng)一整理、保存數(shù)據(jù)、分析處理數(shù)據(jù),之后還需印制、定稿、傳輸發(fā)布等。而大數(shù)據(jù)會對政府統(tǒng)計帶來何種影響,本文著重就變革方向展開思考。
二、大數(shù)據(jù)對政府統(tǒng)計工作的影響
(一)對統(tǒng)計理念的沖擊
一是大數(shù)據(jù)改變了數(shù)據(jù)的需求層次。傳統(tǒng)統(tǒng)計技術幫助人們通過觀察小部分的樣本情況從而描述與推測總體情況,以更好地了解中觀和宏觀數(shù)據(jù)。但受統(tǒng)計方法和數(shù)據(jù)質量的限制,使得人們對社會的認識還不夠全面和客觀。而統(tǒng)計數(shù)據(jù)反映的是總體趨勢,是無法對應到具體的個體情況的,也就難以獲得更加有價值的信息。在數(shù)據(jù)采集技術進步的條件下,人們掌握的數(shù)據(jù)便是可知全局的宏觀數(shù)據(jù),可分解到中觀層面、甚至微觀層面。
二是大數(shù)據(jù)改變了統(tǒng)計實證的研究范式。大數(shù)據(jù)采用的是自下而上的數(shù)據(jù)挖掘范式,不需要預先設定研究目的或方法。以數(shù)據(jù)為先導,從大量實際產生數(shù)據(jù)中通過數(shù)據(jù)挖掘技術找到數(shù)據(jù)之間的關系并建立模型,以至于形成理論和新的認知。而傳統(tǒng)統(tǒng)計的實證研究范式,是先從經濟理論或社會經驗出發(fā),根據(jù)理論設定指標,最后利用統(tǒng)計數(shù)據(jù)進行的實證分析。
(二)大數(shù)據(jù)對統(tǒng)計生產流程的沖擊
一是制度設計可以多樣化。依據(jù)統(tǒng)計研究的目的和研究對象的特點,來設定統(tǒng)計指標、統(tǒng)計報表以及調查、匯總方法等制度,通過調查、訪問將生產行為轉化為可量化的數(shù)據(jù)是常規(guī)的統(tǒng)計設計?!按髷?shù)據(jù)”下的制度設計需要面對的是已經存在的或通過一定手段可以獲取的大量數(shù)據(jù),并且弄清楚是通過什么方式產生的這些已經存在的相關數(shù)據(jù),這些數(shù)據(jù)是又從哪些領域產生的,并且會對研究目的產生什么影響,進而確定采用什么樣的數(shù)據(jù)來反映統(tǒng)計目標。大數(shù)據(jù)的抽樣對象可能是某一數(shù)據(jù)庫,抽樣方式更加靈活,抽樣效果更具針對性,不但降低了調查成本,并且也可在一定程度上免除調查過程中的人為因素干擾。
二是數(shù)據(jù)采集智能化。常規(guī)統(tǒng)計是通過結構化的報表和統(tǒng)一的計量方式將被調查對象的行為轉化為可用的數(shù)據(jù),這其中需要被調查者的參與。然而一旦調查對象不予配合,或者采用撒謊(虛報、瞞報、亂報)的方式消極配合,統(tǒng)計數(shù)據(jù)的質量就難以控制,會造成調查誤差較大,并且矯正這些調查誤差的成本將會很高。大數(shù)據(jù)信息來源于信息技術記錄下的原始數(shù)據(jù),這些數(shù)據(jù)的參與僅僅依賴于測量方法(如GPS 定位測量、超市收銀管理系統(tǒng)、ETC 電子收費系統(tǒng)),而不需要調查對象長期、認真的配合,數(shù)據(jù)質量會大大提高。
三是數(shù)據(jù)分析專業(yè)化及統(tǒng)計發(fā)布的透明化。常規(guī)統(tǒng)計分析是根據(jù)統(tǒng)計制度設計的要求以及對研究對象的認知,對采集的結構化統(tǒng)計數(shù)據(jù)進行計算分析,重點描述已經發(fā)生的變化,對未來的發(fā)展情況進行統(tǒng)計意義上的預測。大數(shù)據(jù)分析面臨的是大量存儲于各處(包括“云端”)的非結構化或半結構化數(shù)據(jù)環(huán)境,從數(shù)據(jù)中分析其內在關系,尋找更多有價值的信息。大數(shù)據(jù)背景下的數(shù)據(jù)獲取分析是全社會共享的,因此統(tǒng)計數(shù)據(jù)發(fā)布的公開透明程度會很高,沒有公開詳細、公允計算方法的數(shù)據(jù)將會被其他數(shù)據(jù)替代。
(三)大數(shù)據(jù)對政府統(tǒng)計職能的沖擊
從我國經濟發(fā)展與政府統(tǒng)計的關系上看,統(tǒng)計的重要性與傳統(tǒng)的經濟模式連接在一起。在各級政府管理經濟的體制下,經濟管理者需通過了解社會的需求、供給,規(guī)劃安排未來的生產計劃,實現(xiàn)社會總需求與總供給的平衡。統(tǒng)計數(shù)據(jù)為經濟管理者提供了決策依據(jù)。價格信號反饋市場主體需求與供給的狀況,從而在微觀層面上實現(xiàn)資源配置。經濟發(fā)展的主導力量由宏觀逐漸走向了微觀,統(tǒng)計數(shù)據(jù)的價值就發(fā)生了變化。從現(xiàn)已發(fā)生的變革上來看,隨著物聯(lián)網(wǎng)等網(wǎng)絡經濟的發(fā)展,使得工業(yè)生產、運輸物流、最終消費、服務等各種交易生成直接可用的數(shù)據(jù),有些方面的數(shù)據(jù)無需經過專門的統(tǒng)計調查采集而產生。因此,大數(shù)據(jù)背景下政府統(tǒng)計的地位和職能受到一定挑戰(zhàn)。
三、大數(shù)據(jù)之下進行政府統(tǒng)計改革的方向
(一)流程再造
大數(shù)據(jù)是一種新型的統(tǒng)計理念,通過對社會工作中自然產生的大量數(shù)據(jù),進行收集、整理、挖掘分析從而得出結論。常規(guī)統(tǒng)計工作是指定統(tǒng)計目標、設計方案、統(tǒng)計調查再進行歸納、整理、分析。而大數(shù)據(jù)下的統(tǒng)計運作流程則是:自然產生數(shù)據(jù)→數(shù)據(jù)整理→數(shù)據(jù)甄別→數(shù)據(jù)分析→得出結論→對應數(shù)據(jù)產生的意義→數(shù)據(jù)體現(xiàn)的統(tǒng)計意義。
(二)尋找可供挖掘分析的數(shù)據(jù)來源
根據(jù)國家統(tǒng)計局網(wǎng)站數(shù)據(jù)顯示,淘寶網(wǎng)和天貓2013年的銷售額占全年社會消費品零售總額的比重是7%,而2013年的社會消費品零售總額23060億元,同比名義增長13.6%;2013年上半年,淘寶占據(jù)整個C2C市場的95.1%份額,天貓占據(jù)中國B2C網(wǎng)絡零售市場的52.1%份額。淘寶、天貓等電商數(shù)據(jù),是對居民消費很重要的一個數(shù)據(jù)反映。所以說,尋找政府統(tǒng)計的數(shù)據(jù)來源,再經過研究、比對界定,網(wǎng)絡大數(shù)據(jù)將會更快捷高效地呈現(xiàn)結果,服務于各級政府部門的決策。
(三)優(yōu)化統(tǒng)計機構設置
大數(shù)據(jù)背景要求統(tǒng)計機構的各項工作要走專業(yè)化道路,制度設計部門要研究數(shù)據(jù)獲取來源、可信度、成本等項目,按照用戶的需求設置指標;數(shù)據(jù)采集部門需要開拓更多可用的數(shù)據(jù)來源,并對數(shù)據(jù)流進行實時監(jiān)測,保證數(shù)據(jù)流的通暢和清潔;數(shù)據(jù)分析部門則通過專業(yè)化的分析手段進行科學分析,而后由專業(yè)化的營銷部門將數(shù)據(jù)產品傳遞給社會用戶。只有按照統(tǒng)計數(shù)據(jù)生產流程設定機構,并進行網(wǎng)絡化管理才能保證數(shù)據(jù)生產的科學性。今年推行的“聯(lián)網(wǎng)直報”等四大工程顯示,網(wǎng)絡技術對人工的替代促進地方統(tǒng)計機構職能做出相應的調整,由以前的催報、加工匯總、審核等職能轉化為質量控制,而其他職能均由技術實現(xiàn)。那么,可以預見,在大數(shù)據(jù)背景下,國家與地方統(tǒng)計機構關系及設置也將面臨調整。
(四)推進統(tǒng)計業(yè)務數(shù)據(jù)化
對傳統(tǒng)統(tǒng)計來說,與大數(shù)據(jù)時代的最大差距在于“數(shù)據(jù)化”。具體來講包括調查對象行為的數(shù)據(jù)化及調查業(yè)務的數(shù)據(jù)化。需加快推進物聯(lián)網(wǎng)進程,幫助社會形成生產、物流、交易等環(huán)節(jié)的數(shù)據(jù)化,并將這些數(shù)據(jù)通過互聯(lián)網(wǎng)系統(tǒng)搜集、存儲起來。如在超市收銀機上加裝統(tǒng)計采集裝置,以保證每一筆交易的數(shù)據(jù)及時傳送到統(tǒng)計數(shù)據(jù)平臺,以提供給社會消費、價格調查等指標使用,加快行政數(shù)據(jù)的共享。投資、房地產、服務業(yè)統(tǒng)計等數(shù)據(jù)可從稅務、工商、銀行等部門的行政記錄中獲取,實現(xiàn)多部門數(shù)據(jù)的交叉驗證,保證數(shù)據(jù)的準確與真實。住戶調查方面,改變依賴調查對象記賬的采集方式,如可使用住戶的銀行卡交易數(shù)據(jù)替代記賬中的收入和支出,一些居民用電、水、氣等消費記錄也有助于控制數(shù)據(jù)質量。目前“聯(lián)網(wǎng)直報”采取IP 定位控制、修改痕跡保留等方式就是這一理念的現(xiàn)實應用。為了保證每個采價員按照“三定原則”進行采價,可對每臺采價器進行數(shù)字化定位,其采價的時間、地點、數(shù)據(jù)情況可以即時傳到服務器,即可進行監(jiān)測。在數(shù)據(jù)處理分析方面,我們要面對大量、復雜的行政記錄、商業(yè)交易數(shù)據(jù),從這些數(shù)據(jù)中提取隱含的關系、模式和趨勢等信息和知識供統(tǒng)計使用,數(shù)據(jù)挖掘等現(xiàn)代分析技術與能力是關鍵。
(五)完善統(tǒng)計數(shù)據(jù)發(fā)布
目前政府發(fā)布的統(tǒng)計數(shù)據(jù)主要是為服務于黨政領導的決策需求為主,以社會需求為輔。這種模式對統(tǒng)計而言有一定局限性,容易自我封閉。在大數(shù)據(jù)的生產模式下,生產哪些數(shù)據(jù)、調查發(fā)布哪些數(shù)據(jù)不是由“上級部門”指派或依照傳統(tǒng)慣例,而是根據(jù)用戶的真實需求來決定。在發(fā)布數(shù)據(jù)的形式上,以文字、表格的方式發(fā)布統(tǒng)計數(shù)據(jù)已經跟不上用戶的數(shù)據(jù)需求,有必要加大創(chuàng)新力度,完善各種發(fā)布渠道,充分發(fā)揮數(shù)據(jù)的價值。
總之,在大數(shù)據(jù)背景之下,政府統(tǒng)計著力改革,將會產生數(shù)據(jù)來源更加真實可信、信息公開度高、統(tǒng)計成本低廉、運作流程與步驟簡便等實效。(作者單位:成都信息工程學院)