張 蓮(山東省濟寧市泗水縣統(tǒng)計局)
我國政府統(tǒng)計部門傳統(tǒng)的數(shù)據(jù)收集方法。
我國三大普查:每隔10年進行一次的農(nóng)業(yè)普查、人口普查,根據(jù)經(jīng)濟發(fā)展周期每隔5年進行一次的經(jīng)濟普查,是由統(tǒng)計部門組織,用來調(diào)查一定時點或時期內(nèi)的社會經(jīng)濟現(xiàn)象總量,對調(diào)查對象全覆蓋、大規(guī)模的全面調(diào)查。
除去三大普查,我國統(tǒng)計數(shù)據(jù)的直接來源還有抽樣調(diào)查、重點調(diào)查、典型調(diào)查以及一些常規(guī)統(tǒng)計報表。常用的數(shù)據(jù)采集方式有聯(lián)網(wǎng)直報、城鄉(xiāng)一體化調(diào)查、價格調(diào)查、地塊調(diào)查、糧食抽樣等方式。
普查與抽樣調(diào)查及其他非全面調(diào)查方式的缺點:
三大普查,是對我國國情國力的全面調(diào)查,涉及面廣,指標(biāo)多,工作量大,時間性強,對集中領(lǐng)導(dǎo)和統(tǒng)一行動的要求質(zhì)量高,需要較多的人力、物力和財力,且調(diào)查周期長。
筆者從2005年進入統(tǒng)計站開始統(tǒng)計工作,親身歷經(jīng)了2006年、2016年的兩次農(nóng)業(yè)普查,2008年、2013年和2018年的三次經(jīng)濟普查,2010年和還沒有結(jié)束的2020年的兩次人口普查。從開始的紙質(zhì)調(diào)查表入戶登記、人工匯總指標(biāo)、抄寫正式表、光電掃描數(shù)據(jù)錄入上傳至國家數(shù)據(jù)庫,到2013年第三次經(jīng)濟普查第一次使用電子數(shù)據(jù)采集終端PDA進行入戶登記、現(xiàn)場采集數(shù)據(jù)、上傳到國家普查數(shù)據(jù)采集平臺,統(tǒng)計數(shù)據(jù)收集方式越來越先進,越來越智能化,但缺點也顯而易見。
統(tǒng)計數(shù)據(jù)的間接來源方式主要是與企業(yè)生產(chǎn)經(jīng)營活動有關(guān)的各種資料,各級政府行政部門為履行其職能,如辦證、登記、檢查、保險、稅收等,而收集、記錄、和保存在文件、檔案中個人或單位的資料記錄。統(tǒng)計部門把這些收集來的數(shù)據(jù)再經(jīng)過篩選、比對、匯總等加工方式,得到符合需要的數(shù)據(jù)。
這些間接的數(shù)據(jù)采集方式,有著共同的優(yōu)點:
第一,可降低統(tǒng)計成本。從公共管理部門處取得行政記錄,是一種方便、快捷、簡單易行的調(diào)查內(nèi)容,成本極低,能節(jié)約大量人力、物力、財力。對調(diào)查對象來說,使用行政記錄也可以減輕調(diào)查對象的負擔(dān)。第二,可提高統(tǒng)計部門的數(shù)據(jù)準(zhǔn)確性。行政性檔案是為了本部門的管理和控制而建立的,因此,行政檔案能夠真實地反映社會、經(jīng)濟現(xiàn)象的運動、變化過程,大部分行政檔案反映的是公民自愿的主動行為,不易弄虛作假。即使罰款等行政記錄反映的是非自愿行為,其記錄也往往是強制性的,一旦發(fā)生情況,則必須予以記錄備案,以保存最客觀的證據(jù)。第三,可驗證統(tǒng)計分析結(jié)論的正確性。使用這些行政記錄進行數(shù)據(jù)間的匹配性分析,加強相關(guān)性、邏輯性研究,來評估驗證數(shù)據(jù)質(zhì)量,驗證統(tǒng)計分析結(jié)論的正確性。
但也有著共同的缺點:
第一,和統(tǒng)計上的指標(biāo)分類標(biāo)準(zhǔn)不一樣。有些企業(yè)的報表、財務(wù)數(shù)據(jù)或部門的行政記錄數(shù)據(jù)有著自身填報或記錄目的,有著自己一套嚴密的方法體系,這就和我們統(tǒng)計部門的統(tǒng)計指標(biāo)體系有著很多的差異。第二,兩者覆蓋范圍也不一樣,企業(yè)的報表、財務(wù)數(shù)據(jù)或部門數(shù)據(jù)僅僅是本單位或本部門管理范圍內(nèi)的數(shù)據(jù),無法保證其完整的代表性。第三,時間記錄規(guī)則不一致。統(tǒng)計一般分為時點指標(biāo)或時期指標(biāo),一般按照日歷年限核算,但有些部門的數(shù)據(jù)出于行政管理的需要,會調(diào)整不同的時期,例如對于出生人口這一指標(biāo),公安部門規(guī)定只有新生兒到公安部門登記戶口才能算作出生人口,但我們統(tǒng)計則按實際發(fā)生的時間點來統(tǒng)計出生或者死亡。第四,單位或部門數(shù)據(jù)的保密性與隱私性。有些部門或單位出于對本部門信息的保密或?qū)耠[私的保護,無法提供或者根本不愿意提供。隨著我國經(jīng)濟日新月異的發(fā)展,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)技術(shù)突飛猛進,海量的信息、各種類型的數(shù)據(jù)潮水般地涌進人們的生活、工作中,這些數(shù)量大、速度快、多樣性、時效性強的大數(shù)據(jù)強烈地沖擊著我們的統(tǒng)計工作,傳統(tǒng)數(shù)據(jù)的收集方法已經(jīng)越來越不適應(yīng)新時代賦予我們統(tǒng)計工作的新職能,急需我們探索新的方式方法。
數(shù)據(jù)規(guī)模大。國務(wù)院發(fā)展研究中心信息中心研究處處長李廣乾說過:“大數(shù)據(jù)的市場規(guī)模沒有天花板”,我國經(jīng)濟發(fā)展飛速,產(chǎn)生數(shù)據(jù)的終端增多,每天各行各業(yè)的數(shù)據(jù)信息如潮水般涌來。信息流轉(zhuǎn)快。信息時代,人作為網(wǎng)絡(luò)的核心,每天都在制造爆炸式數(shù)據(jù),這些數(shù)據(jù)再被相應(yīng)的電商、企業(yè)、政府、銀行等部門收集、處理、運用,從而使數(shù)據(jù)快速流動起來。數(shù)據(jù)類型多。大數(shù)據(jù)的來源,包括交通運輸,互聯(lián)網(wǎng)文件處理、制作互聯(lián)網(wǎng)搜索引擎索引、通信記錄明細、金融大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、社交網(wǎng)絡(luò)、照片圖像、大規(guī)模的電子商務(wù)等各行各業(yè),從而造成各種各樣的類型,包括數(shù)字、文字、視頻、圖片、聲音等。價值密度低。爆炸式海量的數(shù)據(jù),覆蓋面廣,信息雜,包含的模糊信息多,從而價值密度就低。
目前我們的統(tǒng)計調(diào)查手段,雖然已是現(xiàn)代化,但不等于統(tǒng)計調(diào)查體系的現(xiàn)代化,我國當(dāng)前統(tǒng)計調(diào)查體系的主要問題是各種調(diào)查方式、調(diào)查力量和數(shù)據(jù)來源的有效整合不夠,各種統(tǒng)計調(diào)查制度、方式方法不能很好地銜接,數(shù)據(jù)孤島現(xiàn)象十分突出。
許多大數(shù)據(jù),例如社交媒體數(shù)據(jù),微信、QQ、淘寶等網(wǎng)上產(chǎn)品的價格信息,多是由觀察數(shù)據(jù)組成,因此沒有明確定義目標(biāo)人群、結(jié)構(gòu)和質(zhì)量。這使得基于采樣理論的傳統(tǒng)統(tǒng)計方法難以應(yīng)用許多大數(shù)據(jù)源的非結(jié)構(gòu)化性質(zhì),使得提取有意義的統(tǒng)計信息變得更加困難。大數(shù)據(jù)時代對數(shù)據(jù)的收集分為三步,第一步數(shù)據(jù)預(yù)處理,包括識別與整理。第二步數(shù)據(jù)分析,提煉有價值信息。第三步數(shù)據(jù)存儲。
1.建立智能數(shù)據(jù)系統(tǒng)
在基于原來聯(lián)網(wǎng)直報、常規(guī)統(tǒng)計報表、周期性普查、抽樣調(diào)查的基礎(chǔ)上,引入大數(shù)據(jù)共享平臺,開發(fā)新的針對大數(shù)據(jù)特征的指標(biāo)體系和指標(biāo)解釋方法,把來源于各個網(wǎng)絡(luò)終端的數(shù)據(jù),快速的收集、整合、去雜、存儲,建立新的智能數(shù)據(jù)系統(tǒng)。
2.整合傳統(tǒng)統(tǒng)計數(shù)據(jù)
整合各類普查、常規(guī)調(diào)查和專項調(diào)查等數(shù)據(jù),打破專業(yè)壁壘和信息孤島,實現(xiàn)數(shù)據(jù)共享和深度開發(fā)。
3.完善統(tǒng)計業(yè)務(wù)流程
統(tǒng)計數(shù)據(jù)收集、整理、分析和儲存的科學(xué)化生產(chǎn)流程,通過技術(shù)創(chuàng)新,改變了傳統(tǒng)的統(tǒng)計工作方式,進一步提高了統(tǒng)計工作的質(zhì)量、效率和水平。
4.加快大數(shù)據(jù)應(yīng)用創(chuàng)新
推動統(tǒng)計數(shù)據(jù)采集方式的變革,充分利用電子行政記錄、企業(yè)生產(chǎn)經(jīng)營記錄、大數(shù)據(jù)等,完善數(shù)據(jù)解讀機制和方法。推動大數(shù)據(jù)統(tǒng)計研究,充分利用國內(nèi)統(tǒng)計學(xué)界在大數(shù)據(jù)領(lǐng)域的研究力量,開展大數(shù)據(jù)應(yīng)用研究,與大數(shù)據(jù)企業(yè)、高校及科研機構(gòu)開展廣泛合作。
海量大數(shù)據(jù)的采集與加工整理,對統(tǒng)計機構(gòu)特別是基層統(tǒng)計機構(gòu)的轉(zhuǎn)型是個不小的挑戰(zhàn),傳統(tǒng)統(tǒng)計工作方式必須做出相應(yīng)的轉(zhuǎn)型,由以往的催報、審核、匯總,轉(zhuǎn)型為挖掘、分析、快速加工整理,建立專業(yè)的、相適應(yīng)的、新的數(shù)據(jù)存儲平臺,對瞬息萬變的大數(shù)據(jù)信息做出及時有效的挖掘整理,提煉出我們需要的數(shù)據(jù),由以往的數(shù)據(jù)傳輸功能轉(zhuǎn)型為信息反應(yīng)與預(yù)警服務(wù)功能,以提升和豐富統(tǒng)計機構(gòu)的基本服務(wù)職能。
1.加強統(tǒng)計人員業(yè)務(wù)能力培養(yǎng)
加強統(tǒng)計人員,特別是基層統(tǒng)計人員對大數(shù)據(jù)信息的挖掘、整理、甄別技術(shù)能力的培養(yǎng);讓統(tǒng)計人員熟練掌握先進的數(shù)據(jù)挖掘、分析整理工具與軟件,提高每個人的專業(yè)技術(shù)能力;加強相應(yīng)專業(yè)技術(shù)人才的引進與培養(yǎng),夯實適應(yīng)新技術(shù)、新業(yè)務(wù)的統(tǒng)計人才基礎(chǔ)。
2.改變傳統(tǒng)思維方式
打破原來固有的數(shù)據(jù)“收集、匯總、上報”傳統(tǒng)的統(tǒng)計思維方式,向智能化數(shù)據(jù)收集、分析、加工、整理方式轉(zhuǎn)變,以適應(yīng)現(xiàn)代化的大數(shù)據(jù)采集方式。
3.提供政府統(tǒng)計分析思路
政府應(yīng)推進大數(shù)據(jù)統(tǒng)計研究,為更好地開展大數(shù)據(jù)應(yīng)用提供理論支撐,同時關(guān)注國外大數(shù)據(jù)統(tǒng)計應(yīng)用動態(tài),及時分析成果,推動數(shù)據(jù)共享,讓更多的人使用更多的數(shù)據(jù),在使用過程中對數(shù)據(jù)進行進一步加工,使數(shù)據(jù)賦予更多的信息。
綜上所述,大數(shù)據(jù)時代,面對海量數(shù)據(jù)信息的爆炸式增長,傳統(tǒng)的數(shù)據(jù)采集方式已很難適應(yīng)。統(tǒng)計處和統(tǒng)計員應(yīng)充分利用大數(shù)據(jù),豐富統(tǒng)計資料的來源,優(yōu)化統(tǒng)計方法,對現(xiàn)有統(tǒng)計資料進行統(tǒng)計分析。審計工作中也在積極探索,進行了一系列有益的嘗試,推動大數(shù)據(jù)真正成為推動政府統(tǒng)計工作發(fā)展的強大動力,為政府部門和社會各界提供高質(zhì)量的統(tǒng)計服務(wù)。