劉燕 閆利華 張繼來 等
摘要:針對赤峰市居民在生活困難或遇到惡性事件、災(zāi)情等突發(fā)性事件時,辦理低保申請、臨時救助和“救急難”等業(yè)務(wù)時的頻繁、重復(fù)的材料遞交現(xiàn)狀和民政部門在核查、審批中遇到的問題,運用大數(shù)據(jù)、在線簽批、面部與指紋識別等技術(shù),為百姓提供多渠道、快捷的申請服務(wù),打造精準(zhǔn)、陽光、高效、法制化的審批環(huán)境,探索大數(shù)據(jù)技術(shù)在公共服務(wù)平臺開發(fā)過程中的應(yīng)用.
關(guān)鍵詞:民生服務(wù);大數(shù)據(jù);數(shù)據(jù)挖掘
中圖分類號:TP391.9? 文獻(xiàn)標(biāo)識碼:A? 文章編號:1673-260X(2019)02-0001-04
2015年,在國務(wù)院印發(fā)的《國務(wù)院關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》和《國務(wù)院關(guān)于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知》中分別提道:“充分發(fā)揮互聯(lián)網(wǎng)的高效、便捷優(yōu)勢,提高資源利用效率,降低服務(wù)消費成本.創(chuàng)新政府服務(wù)模式,提升政府科學(xué)決策能力和管理水平.”[1]“深入發(fā)掘公共服務(wù)數(shù)據(jù),在社會救助、養(yǎng)老服務(wù)等領(lǐng)域開展大數(shù)據(jù)應(yīng)用示范,推動傳統(tǒng)公共服務(wù)數(shù)據(jù)與互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、可穿戴設(shè)備等數(shù)據(jù)的匯聚整合.”[2]
2017年12月8日,習(xí)近平總書記在中共中央政治局第二次集體學(xué)習(xí)時強調(diào):“要運用大數(shù)據(jù)促進保障和改善民生.要堅持以人民為中心的發(fā)展思想,推進“互聯(lián)網(wǎng)+教育”“互聯(lián)網(wǎng)+醫(yī)療”“互聯(lián)網(wǎng)+文化”等,讓百姓少跑腿、數(shù)據(jù)多跑路,不斷提升公共服務(wù)均等化、普惠化、便捷化水平”[3].同年,內(nèi)蒙古自治區(qū)人民政府在《內(nèi)蒙古自治區(qū)大數(shù)據(jù)發(fā)展總體規(guī)劃(2017-2020年)》中也提出,“加快政務(wù)數(shù)據(jù)資源整合、開放共享、創(chuàng)新應(yīng)用,推動政府決策科學(xué)化、社會治理精準(zhǔn)化、公共服務(wù)高效化,運用大數(shù)據(jù)促進政府管理和社會治理模式創(chuàng)新、促進保障和改善民生”[4].本課題正是在這一歷史背景下,深入分析傳統(tǒng)的民生信息管理系統(tǒng)在使用過程中存在的不足,積極探索基于大數(shù)據(jù)開發(fā)技術(shù)的實時數(shù)據(jù)采集、數(shù)據(jù)傳輸、數(shù)據(jù)存儲、數(shù)據(jù)標(biāo)識、數(shù)據(jù)處理技術(shù),開發(fā)動態(tài)的大數(shù)據(jù)應(yīng)用服務(wù)平臺.項目的實施可為居民提供多渠道、快捷的民政救助申請渠道,使特殊群體能夠及時享受到政府的惠民政策,體會到社會主義的優(yōu)越性.
1 目前赤峰市民生服務(wù)平臺存在的問題
1.1 重業(yè)務(wù),輕服務(wù)
大部分民政信息平臺的功能是對服務(wù)對象信息的錄入和存儲,現(xiàn)場數(shù)據(jù)采集方式陳舊,信息傳輸渠道單一,對于一些特殊的群體(比如長期抱病臥床的病人)非常不方便,沒有與服務(wù)對象真正建立安全、有效、實時的信息交流渠道.
1.2 民生政策信息邏輯性不強,關(guān)聯(lián)度不高
民政信息化平臺在實際運作的過程中,發(fā)布的部分信息缺乏嚴(yán)格的邏輯性和嚴(yán)謹(jǐn)性,信息的內(nèi)容、質(zhì)量、數(shù)據(jù)呈現(xiàn)出離散無序的狀態(tài),信息內(nèi)容與服務(wù)對象的關(guān)聯(lián)度不高.
1.3 存在信息孤島
系統(tǒng)的數(shù)據(jù)來源于多個部門,存在多個信息孤島,來自不同部門的數(shù)據(jù)由于各種原因會出現(xiàn)數(shù)據(jù)結(jié)構(gòu)或數(shù)據(jù)值不一致的現(xiàn)象,需要利用互聯(lián)網(wǎng)+大數(shù)據(jù)信息化技術(shù)及時整合與維護,確保數(shù)據(jù)的一致性、正確性、有效性和安全性.
2 民生服務(wù)平臺系統(tǒng)簡介
2.1 民生服務(wù)平臺的設(shè)計目標(biāo)
基于“互聯(lián)網(wǎng)+”大數(shù)據(jù)的民生服務(wù)平臺按照統(tǒng)一入口、集中辦理、數(shù)據(jù)跑路的總體思路,實現(xiàn)無紙化“一號受理、一窗申請、一網(wǎng)通辦”的辦公目標(biāo),利用“不見面審批”模式,通過對民政局、醫(yī)保局、稅務(wù)局、財政局、衛(wèi)計局、慈善總會等多家單位的數(shù)據(jù)共享和審批流程的標(biāo)準(zhǔn)化,打造可復(fù)制推廣的“互聯(lián)網(wǎng)+”大數(shù)據(jù)民生服務(wù)平臺,切實為百姓提供方便、快捷、有效的社會救助申請途徑.
2.2 民生服務(wù)平臺的系統(tǒng)設(shè)計
民生服務(wù)平臺整體由用戶申報APP端、臨時救助審批系統(tǒng)、生存狀態(tài)核查系統(tǒng),低保無紙化審批系統(tǒng)、低保測算系統(tǒng)、移動審批APP、統(tǒng)計系統(tǒng)等組成.將運用大數(shù)據(jù)分析、在線簽批、數(shù)據(jù)比對、面部與聲紋識別、工作流等技術(shù)實現(xiàn)民政對于社會救助相關(guān)業(yè)務(wù)的無紙化辦公需求.
2.2.1 用戶申報APP:社會救助申報入口,申請人除在APP端進行政策等資訊閱讀外,同時可以進行臨時救助申請、低保申請、人員簽到,并將申請?zhí)峤恢梁笈_審批系統(tǒng),實現(xiàn)一站式的申辦服務(wù).
2.2.2 臨時救助審批系統(tǒng):包括臨時救助業(yè)務(wù)全流程的審批和流程流轉(zhuǎn),主要分為申請、材料審核、信息核查、簽批流轉(zhuǎn)、資金發(fā)放和提醒預(yù)警幾個部分,各部分根據(jù)具體要求進行流程細(xì)化并開發(fā)相應(yīng)的功能.
2.2.3 低保無紙化審批系統(tǒng):以規(guī)范化、法制化、無紙化為核心,實現(xiàn)低保申請審批業(yè)務(wù)的線上全流程審批工作.包括申請、材料審核、自動測算、信息核查、公示、二次核查、兩級簽批等幾部分.
2.2.4 移動審批APP:為民政系統(tǒng)的無紙化辦公提供移動端的服務(wù)支撐,包括用戶管理、權(quán)限管理、電子簽批相關(guān)設(shè)備對接、數(shù)據(jù)接口通信、流程管理、統(tǒng)計系統(tǒng)及展示等主要功能.
2.2.5 生存狀態(tài)核查系統(tǒng):為需要固定簽到人群提供核心支撐,同時在申請人申報APP、PC端提供簽到入口,并配置相關(guān)功能,如簽到業(yè)務(wù)管理、簽到人員管理、簽到配置管理、簽到數(shù)據(jù)統(tǒng)計等相關(guān)功能.
2.2.6 統(tǒng)計系統(tǒng):根據(jù)具體需要對民政業(yè)務(wù)總體開展情況、平臺相關(guān)信息等進行多維度的統(tǒng)計展示.
2.2.7 民政大數(shù)據(jù)庫:為所有民政業(yè)務(wù)提供基礎(chǔ)數(shù)據(jù)支撐,主要包括基礎(chǔ)數(shù)據(jù)管理(導(dǎo)入、更新、修改)、信息比對核查、接口管理平臺等.
民生服務(wù)平臺總體架構(gòu)如圖2-1所示.
3 基于大數(shù)據(jù)的民生服務(wù)平臺主要實現(xiàn)技術(shù)的研究
大數(shù)據(jù)服務(wù)平臺在數(shù)據(jù)獲取、集成和存儲管理以及數(shù)據(jù)處理方式上都區(qū)別于傳統(tǒng)的信息管理系統(tǒng),主要表現(xiàn)在以下三個方面:第一、大數(shù)據(jù)讓人們脫離了對算法和模型的依賴,數(shù)據(jù)本身可以讓用戶了解事實的真相,所以數(shù)據(jù)的準(zhǔn)確性和有效性非常重要.第二、與傳統(tǒng)的數(shù)據(jù)庫相關(guān)技術(shù)相比,大數(shù)據(jù)可以處理不同數(shù)據(jù)結(jié)構(gòu)和不同數(shù)據(jù)類型的數(shù)據(jù),這使計算機能夠分析的數(shù)據(jù)范圍迅速擴大.第三、大數(shù)據(jù)弱化了因果關(guān)系,大數(shù)據(jù)分析可以輕松的挖掘出不同要素之間的相關(guān)關(guān)系,這將大大提高數(shù)據(jù)應(yīng)用的效率,使用戶快速獲得有價值信息.大數(shù)據(jù)應(yīng)用的主要任務(wù)包括準(zhǔn)備數(shù)據(jù)源;進行數(shù)據(jù)采集;數(shù)據(jù)預(yù)處理與集成;數(shù)據(jù)分析;數(shù)據(jù)解釋;用戶支持等[5].
3.1 數(shù)據(jù)源
基于“互聯(lián)網(wǎng)+”大數(shù)據(jù)的民生服務(wù)平臺將從多個社會救助相關(guān)部門的多個系統(tǒng)獲得數(shù)據(jù),如民政救助多項相關(guān)數(shù)據(jù)、財務(wù)供養(yǎng)人員數(shù)據(jù)、稅務(wù)繳納數(shù)據(jù)、死亡數(shù)據(jù)、醫(yī)保報銷數(shù)據(jù)等,多系統(tǒng)數(shù)據(jù)獲取不可避免會存在多源異構(gòu)的問題,如何進行多源異構(gòu)數(shù)據(jù)有效存儲和利用,是本系統(tǒng)要解決的主要技術(shù)問題.同時,不同來源的數(shù)據(jù),其組織形式可分為結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)三種[6],結(jié)構(gòu)化數(shù)據(jù)使用關(guān)系數(shù)據(jù)庫方式存儲,非結(jié)構(gòu)化數(shù)據(jù)多使用文件方式存儲.而隨著計算機處理數(shù)據(jù)類型的豐富,非結(jié)構(gòu)化數(shù)據(jù)的占比越來越大,已經(jīng)成為數(shù)據(jù)科學(xué)研究的主要內(nèi)容.數(shù)據(jù)本身不僅存在巨大的使用價值,經(jīng)過處理之后還會生成信息、知識與智慧,可以使其反應(yīng)的事實更為直觀.在大數(shù)據(jù)的驅(qū)動下,數(shù)據(jù)處理的流程如圖3-1所示.
3.2 大數(shù)據(jù)特征的4V[7]
3.2.1 Volume(數(shù)據(jù)量大):當(dāng)數(shù)據(jù)量達(dá)到PB級以上一般稱為大數(shù)據(jù).
3.2.2 Variety(類型多):大數(shù)據(jù)系統(tǒng)存在多種數(shù)據(jù)類型,同時存在結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù).
3.2.3 Value(價值密度低):非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)的價值密度低,有價值的數(shù)據(jù)往往被淹沒在海量無用數(shù)據(jù)之中.
3.2.4 Velocity(速度快):速度包括數(shù)據(jù)增長速度和處理速度,一是源于數(shù)據(jù)獲取方式的進步,二是由于計算機處理能力的提高,數(shù)據(jù)實時分析成為研究熱點.
3.3 數(shù)據(jù)的獲取
3.3.1 傳統(tǒng)的數(shù)據(jù)獲取方法:該方法是通過手工的方式,從各種文檔、模版、業(yè)務(wù)流程,模型等獲取數(shù)據(jù),并將數(shù)據(jù)輸入到計算機中.
3.3.2 利用工具獲取數(shù)據(jù):一是從各種監(jiān)測的設(shè)備上直接獲取數(shù)據(jù);二是使用軟件工具在網(wǎng)上獲取數(shù)據(jù).
3.3.3 利用數(shù)據(jù)獲取數(shù)據(jù):在大數(shù)據(jù)時代,可以通過對已有數(shù)據(jù)的處理獲得新的數(shù)據(jù),這種方式比較簡單方便.
3.4 數(shù)據(jù)預(yù)處理
3.4.1 數(shù)據(jù)清洗[8]
數(shù)據(jù)清洗是在對數(shù)據(jù)審計活動的基礎(chǔ)上發(fā)現(xiàn)的問題數(shù)據(jù)如錯誤數(shù)據(jù)、虛假數(shù)據(jù)、無效數(shù)據(jù)、數(shù)據(jù)缺失和重復(fù)數(shù)據(jù)等進行刪除、更正、插值處理.有下面幾種方式.
①識別缺失值:分析缺失數(shù)據(jù)的特征,估計后續(xù)對數(shù)據(jù)分析的影響.
②缺失數(shù)據(jù)的處理:根據(jù)缺失數(shù)據(jù)對分析結(jié)果的影響及導(dǎo)致數(shù)據(jù)缺失的影響因素,選擇具體的缺失數(shù)據(jù)處理策略,如忽略、刪除或插值.比如在低保和臨時救助的資金發(fā)放中,發(fā)現(xiàn)未提供某申請人的“銀行賬號.”
③異常數(shù)據(jù)校驗:異常數(shù)據(jù)校驗,例如在低保和臨時救助申請人信息中,某申請人的“出生年份”為“0000”;申請人手機號碼數(shù)據(jù)位數(shù)不夠,需要合法性校驗等.填寫數(shù)據(jù)時輸入了特殊字符“~!@#$a%*&()”或其他特殊字符組合,需要給出輸入錯誤提示等.
3.4.2 數(shù)據(jù)變換
數(shù)據(jù)變換主要用于處理數(shù)據(jù)中存在類型、計量單位不一致等問題,例如數(shù)據(jù)需要從字符串型轉(zhuǎn)換為數(shù)值型.數(shù)據(jù)變換主要用于合并處理多個原始數(shù)據(jù)的內(nèi)容,例如將多個關(guān)系表的內(nèi)容合并入同一個關(guān)系表.
3.5 數(shù)據(jù)集成
數(shù)據(jù)集成是指常常需要對于來自不同數(shù)據(jù)源的數(shù)據(jù)進行整合,并在合成后得到的數(shù)據(jù)集之上進行數(shù)據(jù)處理.數(shù)據(jù)集成的基本方法有兩種:
3.5.1 同構(gòu)數(shù)據(jù)的內(nèi)容集成
內(nèi)容集成是指當(dāng)目標(biāo)數(shù)據(jù)集的結(jié)構(gòu)與來源數(shù)據(jù)集的結(jié)構(gòu)相同時,集成過程是對來源數(shù)據(jù)集中的內(nèi)容進行合并,數(shù)據(jù)的結(jié)構(gòu)不變.
3.5.2 異構(gòu)數(shù)據(jù)的結(jié)構(gòu)集成
結(jié)構(gòu)集成是指當(dāng)目標(biāo)數(shù)據(jù)集的結(jié)構(gòu)與來源數(shù)據(jù)集的結(jié)構(gòu)不同時,集成過程是目標(biāo)數(shù)據(jù)集的結(jié)構(gòu)為對所有來源數(shù)據(jù)集的結(jié)構(gòu)進行合并處理后的結(jié)果.目標(biāo)表的結(jié)構(gòu)是對來源表的結(jié)構(gòu)進行了自然連接操作后得到的結(jié)果.
數(shù)據(jù)集成涉及的主要問題有:如何使來自多個數(shù)據(jù)源的現(xiàn)實世界的實體相互匹配.例如如何確定兩個名字均為“張三”的記錄是否代表同一個實體.其次是數(shù)據(jù)冗余,是指屬性值可以從其他屬性中推演出來,那么這個屬性就是冗余屬性,比如“平均月收入”屬性.第三就是沖突檢測與消除,對于一個客觀世界的實體來講,可能存在來自不同數(shù)據(jù)源的屬性值不同.比如“職業(yè)”屬性,一個數(shù)據(jù)源為“其它”,另外一個數(shù)據(jù)源可能為“自由職業(yè)人”.如何解決這些問題是大數(shù)據(jù)應(yīng)用首要研究任務(wù).
3.6 大數(shù)據(jù)分析[9]
大數(shù)據(jù)統(tǒng)計分析是大數(shù)據(jù)應(yīng)用的重要組成部分,也是數(shù)據(jù)簡單加工的重要手段,其方法分為描述統(tǒng)計和推斷統(tǒng)計.其中描述統(tǒng)計主要是采用圖表或者數(shù)學(xué)方法描述數(shù)據(jù)的特征;推斷統(tǒng)計主要是通過分析樣本數(shù)據(jù)推斷總體.主要的大數(shù)據(jù)統(tǒng)計分析方法有:
3.6.1 概率分布:概率分布用于描述性統(tǒng)計,可以幫助我們理解數(shù)據(jù)的分布特征及選擇恰當(dāng)數(shù)據(jù)處理方法.實現(xiàn)概率分布的主要方法有正態(tài)分布、卡方分布、t分布,F(xiàn)分布.
3.6.2 參數(shù)估計:該方法可以實現(xiàn)推斷統(tǒng)計.常用的推斷方法有兩種,即參數(shù)估計和假設(shè)驗證.其中參數(shù)估計是根據(jù)樣本的統(tǒng)計量來估計總體的參數(shù).例如利用樣本均值估計總體的均值;假設(shè)驗證是指先對總體的某個參數(shù)進行假設(shè),然后利用樣本統(tǒng)計量去檢驗這個假設(shè)是否成立.
3.6.3 大數(shù)據(jù)挖掘:隨著數(shù)據(jù)科學(xué)的發(fā)展,傳統(tǒng)的數(shù)據(jù)統(tǒng)計方法已經(jīng)逐漸與現(xiàn)代的數(shù)據(jù)挖掘[10]技術(shù)相互融合,主要的應(yīng)用有回歸分析、方差分析、分類分析、聚類分析、序列模式分析等.數(shù)據(jù)經(jīng)過上述方法的處理后,其生成的結(jié)果將由簡單的信息變?yōu)橄嗷リP(guān)聯(lián)的應(yīng)用模式,能夠解釋數(shù)據(jù)之間的隱藏規(guī)律,幫助用戶洞見數(shù)據(jù)的發(fā)展走向,做出智慧合理的決策.在本項目中,將重點探索民生大數(shù)據(jù)系統(tǒng)中離散數(shù)據(jù)的關(guān)聯(lián)分析,為相關(guān)的使用部門提供數(shù)據(jù)支持.
4 結(jié)束語
在本項目建設(shè)過程中,一方面將摒棄傳統(tǒng)的信息平臺開發(fā)技術(shù),針對民生政策信息屬于非結(jié)構(gòu)化信息,邏輯性不強,數(shù)據(jù)內(nèi)容離散、無序的特點,探索各類信息整合、共享的實現(xiàn)技術(shù)與方法,包括查找相關(guān)信息、提取和標(biāo)識結(jié)構(gòu)化信息、組合和重用信息等,基于新一代人工智能關(guān)鍵技術(shù)問題,優(yōu)化知識計算引擎與知識服務(wù)技術(shù),重點突破數(shù)據(jù)加工的深度搜索和可視交互核心技術(shù),實現(xiàn)對知識持續(xù)增量的自動獲取,最終能夠得到直接的和可操作的知識性信息,供決策者使用,實現(xiàn)從信息服務(wù)到知識服務(wù)的躍遷.同時運用大數(shù)據(jù)應(yīng)用技術(shù)有效提升政府管理與服務(wù)水平,促進保障和改善民生服務(wù).另一方面,將依托赤峰學(xué)院和蒙東云計算中心共建的產(chǎn)學(xué)研示范基地,通過校企聯(lián)合研發(fā)大數(shù)據(jù)應(yīng)用技術(shù),推動蒙東地區(qū)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展,最終帶動蒙東地區(qū)大數(shù)據(jù)產(chǎn)業(yè)快速發(fā)展.
參考文獻(xiàn):
〔1〕國務(wù)院.國務(wù)院關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見.2015-07-04.
〔2〕國務(wù)院.國務(wù)院關(guān)于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知.2015-08-31.
〔3〕張顯龍.運用大數(shù)據(jù)保障和改善民生.光明網(wǎng),2017-12-15.
〔4〕內(nèi)蒙古自治區(qū)人民政府辦公廳.內(nèi)蒙古自治區(qū)大數(shù)據(jù)發(fā)展總體規(guī)劃(2017-2020年).2017-12-28.
〔5〕〔7〕朝樂蒙.數(shù)據(jù)科學(xué)[M].北京:清華大學(xué)出版社,2016.16-25.
〔6〕王曉波.非結(jié)構(gòu)化數(shù)據(jù)采集和檢索技術(shù)的研究與實現(xiàn)[J].中國內(nèi)部審計,2014(7):73-75.
〔8〕譚暉,廖振松,周小翠,賀凡.大數(shù)據(jù)的數(shù)據(jù)清洗方法研究[J].信息通信,2017(1):238-239.
〔9〕高志鵬,牛琨,劉杰.面向大數(shù)據(jù)的分析技術(shù)[J].北京郵電大學(xué)學(xué)報,2015,38(3):1-12.
〔10〕范明,孟曉峰.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械工業(yè)出版社,2001.