林崇責(zé)+杜偉杰
基于浙江省經(jīng)濟(jì)信息中心大數(shù)據(jù)的實踐探索
“忽如一夜春風(fēng)來,千‘?dāng)?shù)萬‘?dāng)?shù)梨花開”。信息技術(shù)與經(jīng)濟(jì)社會的滲透融合引發(fā)了數(shù)據(jù)量爆發(fā)式增長,運(yùn)用大數(shù)據(jù)推動經(jīng)濟(jì)轉(zhuǎn)型升級、社會治理創(chuàng)新、政府監(jiān)管和民生服務(wù)能力提升成為“大趨勢”。筆者以浙江省發(fā)改委直屬的省經(jīng)濟(jì)信息中心為例,探討政務(wù)大數(shù)據(jù)應(yīng)用“五大趨勢”和 “三大形態(tài)”,提出深化政務(wù)大數(shù)據(jù)開發(fā)應(yīng)用的對策建議。
政務(wù)大數(shù)據(jù)應(yīng)用加快呈現(xiàn)“五大趨勢”
大數(shù)據(jù)通過對多源異構(gòu)、跨域關(guān)聯(lián)的海量數(shù)據(jù)進(jìn)行處理分析,能有效總結(jié)經(jīng)驗、揭示規(guī)律、預(yù)測趨勢,為經(jīng)濟(jì)社會創(chuàng)新發(fā)展提供新思維和新方法。隨著信息技術(shù)發(fā)展,政務(wù)大數(shù)據(jù)應(yīng)用加快呈現(xiàn)“五大趨勢”:
政務(wù)和互聯(lián)網(wǎng)大數(shù)據(jù)加速融合?;ヂ?lián)網(wǎng)網(wǎng)民行為數(shù)據(jù)、交易數(shù)據(jù)、日志數(shù)據(jù)、意愿數(shù)據(jù)等海量數(shù)據(jù),蘊(yùn)藏著無限的可挖掘的價值。在“互聯(lián)網(wǎng)+”時代,互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)已經(jīng)成為民眾獲取信息的最主要渠道,也成為政府采集民眾、意愿需求等數(shù)據(jù)的有效來源。研究表明,到2020年全球數(shù)據(jù)量將將激增到40ZB,這其中文本、圖片、音視頻、時空位置等非結(jié)構(gòu)化數(shù)據(jù)占比將達(dá)到75%,而絕大多數(shù)數(shù)據(jù)是由互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及各類智能終端產(chǎn)生或掌握,政務(wù)數(shù)據(jù)規(guī)模比重將逐步下降。因此,政務(wù)數(shù)據(jù)與互聯(lián)網(wǎng)數(shù)據(jù)之間的融合應(yīng)用,是深化政務(wù)大數(shù)據(jù)應(yīng)用的必然趨勢。
政務(wù)“大數(shù)據(jù)”和“小數(shù)據(jù)”取長補(bǔ)短?!按髷?shù)據(jù)”數(shù)據(jù)規(guī)模大,數(shù)據(jù)價值密度低,潛在價值相對不明顯,多以文本、圖像、音視頻以及位置等非結(jié)構(gòu)化形態(tài)保存,對計算能力和數(shù)據(jù)處理能力要求極高。而“小數(shù)據(jù)”則相反,為數(shù)據(jù)總量較小、價值導(dǎo)向明顯的傳統(tǒng)統(tǒng)計分析數(shù)據(jù),多以二維表格等結(jié)構(gòu)化形態(tài)保存,對計算能力和數(shù)據(jù)處理相對較低。在政務(wù)數(shù)據(jù)開發(fā)應(yīng)用中,政務(wù)“大數(shù)據(jù)”和“小數(shù)據(jù)”取長補(bǔ)短、互相支撐,已經(jīng)成為政務(wù)大數(shù)據(jù)應(yīng)用的重要方向?!靶?shù)據(jù)”的價值導(dǎo)向為“大數(shù)據(jù)”的開發(fā)應(yīng)用提供了基本參考和方向指引,而“大數(shù)據(jù)”則為充實和細(xì)化“小數(shù)據(jù)”提供了基礎(chǔ)支撐。
政務(wù)大數(shù)據(jù)的外部性作用日益發(fā)揮。大數(shù)據(jù)時代,人類關(guān)注重心將從因果關(guān)系更多轉(zhuǎn)向相互關(guān)系,因果關(guān)系也可以理解為一種關(guān)聯(lián)性更強(qiáng)的相互關(guān)系?!坝嘘P(guān)”和“無關(guān)”的界限已經(jīng)被打破。一方面,要充分利用與外部數(shù)據(jù)來解決業(yè)務(wù)中遇到的問題;另一方面,要求把政府自身業(yè)務(wù)產(chǎn)生中的數(shù)據(jù)拿出去,解決外面和本業(yè)務(wù)無關(guān)的問題,在更廣闊的空間發(fā)揮大數(shù)據(jù)的價值。實踐表明,應(yīng)用機(jī)器學(xué)習(xí)等大數(shù)據(jù)算法,充分發(fā)揮數(shù)據(jù)外部性作用,是大數(shù)據(jù)應(yīng)用中最神奇的利器。
應(yīng)用拉動和技術(shù)推動互為強(qiáng)化。當(dāng)前時期正處于經(jīng)濟(jì)社會大轉(zhuǎn)型時代,在推進(jìn)社會治理能力和治理體系建設(shè)的大環(huán)境下,政府需要準(zhǔn)確及時地分析處理復(fù)雜的經(jīng)濟(jì)問題和把握潛在的社會矛盾,這對大數(shù)據(jù)提出了迫切的應(yīng)用需求。同時,以人工智能、大數(shù)據(jù)、云計算、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)為代表的新一代信息技術(shù)快速發(fā)展,大大提高了對各類數(shù)據(jù)的處理能力,為解決各類政府業(yè)務(wù)中存在的痛點提供了技術(shù)條件。
政務(wù)數(shù)據(jù)共享開放成為必要前提。相比于社會領(lǐng)域大數(shù)據(jù),由于行政體制分割,政務(wù)大數(shù)據(jù)一般分散在各個部門、條線,數(shù)據(jù)源很大程度存在著“三宮六院”和“衙門林立”等情況,極大地降低了政務(wù)數(shù)據(jù)應(yīng)用價值。再大的數(shù)據(jù)規(guī)模,再豐富的數(shù)據(jù)形態(tài),若未形成與其他跨域數(shù)據(jù)交換共享的“流通”機(jī)制,就難以形成大數(shù)據(jù)。因此,打破數(shù)據(jù)壁壘和孤島,促進(jìn)跨層級、跨部門、跨領(lǐng)域系統(tǒng)互聯(lián)互通,推動數(shù)據(jù)從“隔水相望”到“阡陌交通”,已經(jīng)成為深化政務(wù)大數(shù)據(jù)應(yīng)用的必要前提。
政務(wù)大數(shù)據(jù)應(yīng)用產(chǎn)品呈現(xiàn)“三大形態(tài)”
結(jié)合浙江省經(jīng)濟(jì)信息中心前期實踐探索的經(jīng)驗,政務(wù)大數(shù)據(jù)開發(fā)要堅持以部門自有數(shù)據(jù)、統(tǒng)計數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)等各類數(shù)據(jù)深度融合為主線。數(shù)據(jù)產(chǎn)品一般可以分為:指數(shù)化類、可視化類、咨詢報告類等三大應(yīng)用形態(tài):
指數(shù)化類應(yīng)用,是圍繞某一專題,對部門政務(wù)數(shù)據(jù)、統(tǒng)計數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)等各類數(shù)據(jù)統(tǒng)計分析、深入挖掘,形成的評估、監(jiān)測、預(yù)測類等量化指數(shù)產(chǎn)品。目前,指數(shù)化應(yīng)用已經(jīng)成為各類政務(wù)大數(shù)據(jù)開發(fā)應(yīng)用的核心,如北京大學(xué)國家發(fā)展研究院“新經(jīng)濟(jì)指數(shù)”、國家工商總局“企業(yè)發(fā)展工商指數(shù)”、國家信息中心“雙創(chuàng)指數(shù)”等產(chǎn)品。例如,省經(jīng)濟(jì)信息中心已經(jīng)初步形成了信息社會指數(shù)、信息經(jīng)濟(jì)指數(shù)和浙江指數(shù)等多項指數(shù)產(chǎn)品。
可視化類應(yīng)用,是數(shù)據(jù)產(chǎn)品的展示類應(yīng)用。為了使數(shù)據(jù)挖掘分析結(jié)果、數(shù)據(jù)產(chǎn)品等內(nèi)容一目了然,通過數(shù)據(jù)大屏等直觀形式,將相關(guān)內(nèi)容以圖形化和圖表化形式對外展示。在當(dāng)前互聯(lián)網(wǎng)高度普及和“讀圖時代”的大背景下,可視化類應(yīng)用已經(jīng)成為大數(shù)據(jù)應(yīng)用的重要形式,成為政務(wù)大數(shù)據(jù)應(yīng)用的必要形態(tài)。例如,省經(jīng)濟(jì)信息中心完成了“數(shù)據(jù)云圖”:將省發(fā)改委各類政務(wù)數(shù)據(jù)清洗、比對、建模后,以“一張屏”的方式全景化、直觀化地展示便于各級領(lǐng)導(dǎo)隨時掌握經(jīng)濟(jì)社會發(fā)展?fàn)顩r,輔助政府領(lǐng)導(dǎo)決策支持。
咨詢報告類應(yīng)用,是指對政務(wù)數(shù)據(jù)產(chǎn)品的深度加工,圍繞某一政務(wù)主題,立足為省委省政府、省級部門提供有價值的咨詢建議,而形成的咨詢報告。比如,省經(jīng)濟(jì)信息中心已形成了兩類咨詢報告產(chǎn)品。一方面,基于輿情數(shù)據(jù),初步形成了互聯(lián)網(wǎng)輿情大數(shù)據(jù)分析系列產(chǎn)品,截至目前共完成特色小鎮(zhèn)、失信黑名單新聞發(fā)布會、數(shù)據(jù)強(qiáng)省等專題互聯(lián)網(wǎng)大數(shù)據(jù)分析報告,定期供稿省政府辦公廳、省發(fā)改委等單位部門。另一方面,基于政務(wù)數(shù)據(jù)挖掘應(yīng)用的課題研究,利用投資項目等業(yè)務(wù)數(shù)據(jù),定期編寫省專項建設(shè)基金項目建設(shè)情況季度監(jiān)測分析報告,獲得各級領(lǐng)導(dǎo)好評。
政務(wù)大數(shù)據(jù)應(yīng)用仍處于起步階段
政府部門在推進(jìn)大數(shù)據(jù)開發(fā)利用中普遍存在基礎(chǔ)不夠完善、技術(shù)實力不夠扎實、產(chǎn)品開發(fā)不足、人才隊伍能力不足等問題,政務(wù)大數(shù)據(jù)開發(fā)應(yīng)用仍處于起步階段。
大數(shù)據(jù)基礎(chǔ)不夠完善。各政府部門數(shù)據(jù)規(guī)模雖然增長巨大,但離真正大數(shù)據(jù)仍有一定差距。在數(shù)據(jù)形態(tài)上,仍以結(jié)構(gòu)化的基礎(chǔ)數(shù)據(jù)為主,數(shù)據(jù)更新頻率較慢,離大數(shù)據(jù)在線化、實時化、高頻率等要求差距不小。在數(shù)據(jù)采集上,仍主要依賴于傳統(tǒng)的人工填報方式,利用互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等智能終端自動采集數(shù)據(jù)未成體系。在數(shù)據(jù)安全上,部分政務(wù)數(shù)據(jù)保密性要求較高,也在一定程度上限制了深度的開發(fā)應(yīng)用。
大數(shù)據(jù)技術(shù)實力仍處于1.0階段。目前,政府部門信息化技術(shù)仍以傳統(tǒng)技術(shù)為主,對大數(shù)據(jù)智能提取、機(jī)器學(xué)習(xí)等前言技術(shù)掌握仍相對較弱,特別是互聯(lián)網(wǎng)大數(shù)據(jù)的運(yùn)用基本處于初級階段,仍然處于大數(shù)據(jù)應(yīng)用的1.0版本(統(tǒng)計分析)、2.0版本(關(guān)聯(lián)分析),距離大數(shù)據(jù)應(yīng)用3.0版本(機(jī)器學(xué)習(xí))仍有較大差距。
優(yōu)秀的大數(shù)據(jù)產(chǎn)品屈指可數(shù)。數(shù)據(jù)產(chǎn)品是是大數(shù)據(jù)建設(shè)應(yīng)用的核心。對標(biāo)互聯(lián)網(wǎng)大數(shù)據(jù)應(yīng)用水平,政務(wù)大數(shù)據(jù)數(shù)據(jù)產(chǎn)品普遍呈現(xiàn)層次不深、應(yīng)用不廣、效益不夠等情況。
大數(shù)據(jù)專業(yè)人才隊伍能力明顯不足。人才是大數(shù)據(jù)開發(fā)應(yīng)用的根本保障。大數(shù)據(jù)是典型“應(yīng)用拉動、技術(shù)推動”的發(fā)展范式,優(yōu)秀的大數(shù)據(jù)人才必須兼具大數(shù)據(jù)思維、業(yè)務(wù)敏感性和數(shù)據(jù)挖掘分析能力,政府部門大數(shù)據(jù)專業(yè)隊伍能力明顯不足。
深化中心政務(wù)大數(shù)據(jù)開發(fā)應(yīng)用的對策建議
“數(shù)據(jù)的價值產(chǎn)生于使用”。堅持應(yīng)用領(lǐng)先,基于各類數(shù)據(jù)共享的融合應(yīng)用,仍是政務(wù)大數(shù)據(jù)發(fā)展的重要趨勢。政務(wù)大數(shù)據(jù)開發(fā)應(yīng)用應(yīng)在培育提倡大數(shù)據(jù)思維文化、完善大數(shù)據(jù)基礎(chǔ)配套建設(shè)、梯度建設(shè)數(shù)據(jù)產(chǎn)品、培養(yǎng)數(shù)據(jù)分析師等四個方面加大推進(jìn)力度。
培育提倡大數(shù)據(jù)思維文化。建立數(shù)據(jù)資產(chǎn)理念,按照“一切業(yè)務(wù)數(shù)據(jù)化”要求,及時采集、沉淀、存儲業(yè)務(wù)過程中形成的數(shù)據(jù)。建立“利用數(shù)據(jù)說話”數(shù)據(jù)意識,在業(yè)務(wù)研究和日常管理中加強(qiáng)定量分析,實現(xiàn)數(shù)據(jù)驅(qū)動創(chuàng)新、數(shù)據(jù)驅(qū)動管理。建立共享開放理念,強(qiáng)化數(shù)據(jù)文化意識轉(zhuǎn)變,創(chuàng)新共享共贏的合作方式,加強(qiáng)與互聯(lián)網(wǎng)先進(jìn)公司、浙江大學(xué)以及高端智庫等機(jī)構(gòu)交流,在業(yè)務(wù)研究、數(shù)據(jù)分析方面形成深層次合作關(guān)系。
完善大數(shù)據(jù)基礎(chǔ)配套建設(shè)。堅持政務(wù)和互聯(lián)網(wǎng)大數(shù)據(jù)“兩手抓”,進(jìn)一步完善數(shù)據(jù)質(zhì)量,探索開展一手?jǐn)?shù)據(jù)采集,形成多渠道的數(shù)據(jù)采集渠道,整理數(shù)據(jù)資源,建立數(shù)據(jù)標(biāo)準(zhǔn),形成全面、權(quán)威、及時的政務(wù)數(shù)據(jù)庫。建設(shè)數(shù)據(jù)智能分析系統(tǒng),建立智能化大數(shù)據(jù)分析平臺。研發(fā)政務(wù)與互聯(lián)網(wǎng)大數(shù)據(jù)相互融合,提高非機(jī)構(gòu)化數(shù)據(jù)的分析處理、神經(jīng)網(wǎng)絡(luò)等機(jī)器算法研究和應(yīng)用能力,持續(xù)提升大數(shù)據(jù)技術(shù)。進(jìn)一步加大政務(wù)數(shù)據(jù)整合關(guān)聯(lián)力度,建立管理規(guī)范,出臺政務(wù)數(shù)據(jù)開發(fā)共享管理辦法。
梯度推進(jìn)大數(shù)據(jù)研發(fā)。堅持應(yīng)用導(dǎo)向,以服務(wù)好部門核心業(yè)務(wù)為主攻方向,按類別整理形成政務(wù)大數(shù)據(jù)服務(wù)目錄清單。遵照大數(shù)據(jù)方法論,鼓勵政府內(nèi)部跨部門、跨領(lǐng)域合作,積極探索信息技術(shù)和軟課題研究融合突破口,遵從大數(shù)據(jù)統(tǒng)計分析、關(guān)聯(lián)分析以及機(jī)器學(xué)習(xí)演進(jìn)路徑,梯度化形成一批高質(zhì)量、有影響的大數(shù)據(jù)產(chǎn)品。
加快培養(yǎng)數(shù)據(jù)分析師。大數(shù)據(jù)時代最需要的是能夠具備敏銳的業(yè)務(wù)視角、熟練數(shù)據(jù)模型,并對大數(shù)據(jù)特征和模型選擇有豐富選擇經(jīng)驗的復(fù)合型人才。政府部門要通過外引內(nèi)育,建立健全大數(shù)據(jù)人才培養(yǎng)體系,將數(shù)據(jù)分析師培養(yǎng)納入單位人才培養(yǎng)計劃,加快培養(yǎng)一批既懂?dāng)?shù)理統(tǒng)計分析、數(shù)據(jù)挖掘分析技術(shù),又熟悉政府部門業(yè)務(wù)的大數(shù)據(jù)分析師。
(作者單位:浙江省經(jīng)濟(jì)信息中心信息化研究處)