趙茁
摘要:該文主要研究如何利用大數(shù)據(jù)技術(shù)促進(jìn)機(jī)構(gòu)編制管理水平提升,研究主要分為大數(shù)據(jù)應(yīng)用技術(shù)架構(gòu)和大數(shù)據(jù)應(yīng)用場景兩個(gè)方面。大數(shù)據(jù)應(yīng)用架構(gòu)主要包括數(shù)據(jù)采集、數(shù)據(jù)治理、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用四個(gè)方面。數(shù)據(jù)采集研究利用系統(tǒng)生成、系統(tǒng)對接、網(wǎng)頁抓取和傳感器等技術(shù)進(jìn)行采集;數(shù)據(jù)治理研究構(gòu)建七層治理體系;數(shù)據(jù)分析研究各類聚類、關(guān)聯(lián)分析等大數(shù)據(jù)分析方法的利用;數(shù)據(jù)應(yīng)用研究如何利用平臺提供數(shù)據(jù)服務(wù)。大數(shù)據(jù)應(yīng)用場景主要研究大數(shù)據(jù)技術(shù)在開展精準(zhǔn)化管理、進(jìn)行機(jī)構(gòu)職能動(dòng)態(tài)分析和統(tǒng)籌和優(yōu)化編制資源中的應(yīng)用。
關(guān)鍵詞:大數(shù)據(jù);機(jī)構(gòu)編制;應(yīng)用場景
中圖分類號:TP391? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2022)35-0067-03
1概述
近年來,大數(shù)據(jù)技術(shù)發(fā)展迅猛,對人民群眾的生活、生產(chǎn)等各個(gè)方面均產(chǎn)生了深遠(yuǎn)的影響,在機(jī)構(gòu)編制政務(wù)領(lǐng)域,大數(shù)據(jù)技術(shù)可以有效促進(jìn)機(jī)構(gòu)編制管理水平提升,有利于服務(wù)經(jīng)濟(jì)社會(huì)發(fā)展,實(shí)現(xiàn)機(jī)構(gòu)編制管理的科學(xué)化、精細(xì)化、規(guī)范化。在大數(shù)據(jù)背景下,用戶對于編辦提供數(shù)據(jù)服務(wù)的需求也在日益提高,主要包括三個(gè)方面:第一,各地市編辦、各類企業(yè)和公民等用戶都希望能夠提供更加個(gè)性化、多樣化的高質(zhì)量服務(wù);第二,在數(shù)據(jù)共享和交換中要更加注重安全問題,能有效保障國家和社會(huì)信息安全、保障個(gè)人隱私;第三,提供的數(shù)據(jù)服務(wù)應(yīng)盡量全面、綜合、準(zhǔn)確、規(guī)范、穩(wěn)定和高效[1]。
基于此,本文主要研究大數(shù)據(jù)在機(jī)構(gòu)編制工作中的架構(gòu)及應(yīng)用場景,進(jìn)而為推動(dòng)互聯(lián)網(wǎng)與機(jī)構(gòu)編制工作的深度融合,提升機(jī)構(gòu)編制管理的水平提供借鑒。
2大數(shù)據(jù)應(yīng)用架構(gòu)研究
大數(shù)據(jù)分析處理可以概括分為數(shù)據(jù)采集、數(shù)據(jù)治理、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用四個(gè)層次。數(shù)據(jù)采集,主要指通過一些采集技術(shù)從外界海量數(shù)據(jù)當(dāng)中獲取有用的數(shù)據(jù);數(shù)據(jù)治理指解決數(shù)據(jù)的不一致、數(shù)據(jù)重復(fù)、無效數(shù)據(jù)和異常數(shù)據(jù)等問題。數(shù)據(jù)分析指使用回歸分析、聚類分析、語義分析等技術(shù)進(jìn)行大數(shù)據(jù)分析。數(shù)據(jù)應(yīng)用指在分析結(jié)果基礎(chǔ)上預(yù)測分析具體業(yè)務(wù)趨勢和現(xiàn)象。據(jù)此,大數(shù)據(jù)應(yīng)用架構(gòu)設(shè)計(jì)如圖1所示。
2.1數(shù)據(jù)采集
大數(shù)據(jù),包括三層含義:一是指數(shù)量巨大,二是指數(shù)據(jù)來源眾多,三是數(shù)據(jù)類型多種多樣。其中數(shù)據(jù)類型可以劃分為三類:結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)通常是指傳統(tǒng)關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),包括機(jī)構(gòu)編制各業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫和其他政務(wù)部門共享的數(shù)據(jù);半結(jié)構(gòu)化數(shù)據(jù)指除傳統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)以外的有特定規(guī)律的數(shù)據(jù),例如XML文檔、HTML文檔、系統(tǒng)日志、報(bào)表等;非結(jié)構(gòu)化數(shù)據(jù)包括各類不同格式文檔、音頻、視頻、圖片等信息,包括法律法規(guī)、政策文件等。
數(shù)據(jù)采集方式可以包括系統(tǒng)生成、數(shù)據(jù)對接、網(wǎng)頁抓取、傳感器等方式。
1)系統(tǒng)生成
系統(tǒng)生成包括兩部分:一是人工填報(bào),二是實(shí)時(shí)采集。人工填報(bào)是指在業(yè)務(wù)系統(tǒng)中或文件系統(tǒng)中錄入數(shù)據(jù)的過程,是最常見的數(shù)據(jù)采集方式。填報(bào)的數(shù)據(jù)類型包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)主要從各個(gè)業(yè)務(wù)系統(tǒng)中進(jìn)行錄入或者導(dǎo)入。非結(jié)構(gòu)化數(shù)據(jù)可以利用手工或者大數(shù)據(jù)采集工具進(jìn)行錄入。實(shí)時(shí)采集指由各個(gè)業(yè)務(wù)系統(tǒng)處理后生成的結(jié)果數(shù)據(jù)、系統(tǒng)用戶的各種級別較高的操作日志,系統(tǒng)記錄的用戶訪問行為軌跡和習(xí)慣等。
2)數(shù)據(jù)對接
數(shù)據(jù)對接指系統(tǒng)間的數(shù)據(jù)通過接口訪問或授權(quán)訪問的形式進(jìn)行數(shù)據(jù)集成,對接的數(shù)據(jù)類型以結(jié)構(gòu)化數(shù)據(jù)為主,數(shù)據(jù)庫類型包括MySql、Oracle、Db2、SQL Server等各類產(chǎn)品,對接一般是對各個(gè)單位內(nèi)部的各系統(tǒng)進(jìn)行數(shù)據(jù)匯集,或者從省數(shù)據(jù)共享平臺、中央編辦共享平臺或其他省平臺獲取相關(guān)數(shù)據(jù)[2]。數(shù)據(jù)對接的方式包括數(shù)據(jù)庫獲取、接口讀取和實(shí)時(shí)采集,一般采用數(shù)據(jù)交換平臺來實(shí)現(xiàn)。編辦的數(shù)據(jù)交換平臺可以采集匯聚省內(nèi)各地市信息、其他省編辦共享信息、本省內(nèi)工商、稅務(wù)、勞社、衛(wèi)生、醫(yī)藥、公安、民政、人口、企業(yè)法人、空間地理、宏觀經(jīng)濟(jì)等信息,形成跨部門、跨地區(qū)、跨行業(yè)的融合數(shù)據(jù),并實(shí)現(xiàn)整個(gè)編辦系統(tǒng)的數(shù)據(jù)共享[3]。數(shù)據(jù)交換平臺具體架構(gòu)圖如圖1所示。
3)網(wǎng)頁抓取
網(wǎng)頁抓取,從官方網(wǎng)站公開的大量信息中抓取數(shù)據(jù),對抓取的網(wǎng)頁數(shù)據(jù)進(jìn)行內(nèi)容和格式處理加工,從而獲得有用的內(nèi)容。網(wǎng)頁抓取主要指網(wǎng)絡(luò)爬蟲,是采用程序或腳本,按照某種特定規(guī)則抓取互聯(lián)網(wǎng)上網(wǎng)頁信息的技術(shù)。網(wǎng)頁抓取獲取的數(shù)據(jù)類型可以包括數(shù)字?jǐn)?shù)據(jù)、文本數(shù)據(jù)、音頻和視頻數(shù)據(jù)或社交網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)等非結(jié)構(gòu)化數(shù)據(jù)。
4)傳感器
傳感器數(shù)據(jù)采集主要是通過傳感網(wǎng)進(jìn)行。傳感網(wǎng)是由眾多傳感器、數(shù)據(jù)處理器和通信器組成無線網(wǎng)絡(luò)。在政務(wù)領(lǐng)域,可以利用傳感器偵測人員密集度和流動(dòng)情況,并據(jù)此分析機(jī)構(gòu)分布、審批事項(xiàng)集中度等。
2.2數(shù)據(jù)治理
數(shù)據(jù)質(zhì)量是影響大數(shù)據(jù)應(yīng)用開發(fā)的效率、成效的重要因素之一。由于數(shù)據(jù)來源多樣繁雜、標(biāo)準(zhǔn)不一等原因,采集匯聚后的原始數(shù)據(jù)往往存在很多質(zhì)量問題,數(shù)據(jù)治理即是為解決數(shù)據(jù)質(zhì)量問題而提出的解決方案。
數(shù)據(jù)質(zhì)量問題包括完整性、唯一性、一致性、準(zhǔn)確性、有效性、及時(shí)性等六個(gè)方面。數(shù)據(jù)完整性的典型問題包括唯一性約束或主鍵設(shè)置不完整、數(shù)據(jù)丟失、數(shù)據(jù)無效、數(shù)據(jù)屬性不完整(例如某個(gè)屬性不應(yīng)空的時(shí)候?yàn)榭罩担?。?shù)據(jù)唯一性的典型問題主要是某項(xiàng)數(shù)據(jù)出現(xiàn)重復(fù),包括同一數(shù)據(jù)的源數(shù)據(jù)重復(fù),如某些事項(xiàng)在申報(bào)時(shí)由于誤操作導(dǎo)致多次申報(bào),或者系統(tǒng)處理中出現(xiàn)問題導(dǎo)致數(shù)據(jù)重復(fù)等。數(shù)據(jù)一致性包括同一數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)不一致、約束規(guī)則不一致、數(shù)據(jù)編碼不一致,數(shù)據(jù)名稱不一致,所屬機(jī)構(gòu)不一致,例如在人事系統(tǒng)和科研系統(tǒng)中所學(xué)專業(yè)分類不一致,人口基礎(chǔ)庫中聯(lián)系方式和其他系統(tǒng)不一致等。數(shù)據(jù)準(zhǔn)確性指數(shù)據(jù)要符合業(yè)務(wù)相關(guān)定義,例如電話或郵箱的格式要求等。數(shù)據(jù)及時(shí)性指數(shù)據(jù)是否能按照特定要求及時(shí)進(jìn)行生成和處理。
2.3數(shù)據(jù)分析處理
數(shù)據(jù)分析處理首先需要對數(shù)據(jù)進(jìn)行計(jì)算處理。對于大量數(shù)據(jù)的處理,可以利用Hadoop、Hive等框架實(shí)現(xiàn)離線批處理,這些框架都比較成熟,可以實(shí)現(xiàn)分鐘級響應(yīng),對于少量數(shù)據(jù)的處理,如果要實(shí)現(xiàn)交互式查詢或流式處理計(jì)算,可以采用Spark、HBase;而針對全量數(shù)據(jù)的全文檢索查詢,可采用的框架包括Solr、lasticSearch來實(shí)現(xiàn)的查詢響應(yīng)在毫秒級。數(shù)據(jù)分析處理時(shí),可以在大數(shù)據(jù)分析方法等方法基礎(chǔ)上,設(shè)計(jì)算法模型,并采用機(jī)器學(xué)習(xí)的方式進(jìn)行機(jī)構(gòu)編制管理情況的預(yù)測分析,形成各類算法模型庫,為業(yè)務(wù)和決策提供服務(wù)和支撐。數(shù)據(jù)分析處理中用到的典型大數(shù)據(jù)分析方法包括聚類分析、分類分析、關(guān)聯(lián)分析、文本分析等。
2.4數(shù)據(jù)應(yīng)用
大數(shù)據(jù)應(yīng)用是指數(shù)據(jù)如何在各類業(yè)務(wù)中進(jìn)行使用,為業(yè)務(wù)決策和處理提供良好支持。從技術(shù)層面來講,可以設(shè)計(jì)大數(shù)據(jù)應(yīng)用平臺,將匯聚治理以及進(jìn)行初步底層的大數(shù)據(jù)分析后的數(shù)據(jù)結(jié)果,結(jié)合各類業(yè)務(wù)主題設(shè)計(jì)應(yīng)用模型,進(jìn)行專題挖掘分析研究,得出可以有明確趨勢或決策支撐信息的結(jié)果,最終面向各類用戶提供多維度、可視化數(shù)據(jù)服務(wù)。具體來說,大數(shù)據(jù)應(yīng)用平臺是以數(shù)據(jù)處理后中心庫為基礎(chǔ),面向省編辦、地市編辦、企業(yè)、其他政務(wù)部門和公眾提供數(shù)據(jù)服務(wù)的平臺,通過編制大數(shù)據(jù)的分析應(yīng)用,例如對政府職能、權(quán)責(zé)事項(xiàng)、辦事流程、審批要件等數(shù)據(jù)等的綜合分析,助力“放管服”改革,挖掘分析職能交叉或缺位、流程不合理等問題,提高政府治理能力和履職能力,為各級編辦領(lǐng)導(dǎo)提供決策支持,為公眾提供透明性信息。
3大數(shù)據(jù)在編制管理中的應(yīng)用場景研究
3.1 利用大數(shù)據(jù)挖掘技術(shù)開展精準(zhǔn)化管理
數(shù)據(jù)挖掘就是對特定范圍內(nèi)真實(shí)產(chǎn)生的、大量的、可能有噪聲的、不明確的數(shù)據(jù)進(jìn)行檢測、識別和分類,并通過各類算法提取隱含在數(shù)據(jù)中未被發(fā)現(xiàn)的規(guī)律和聯(lián)系的過程。
以編辦采集的業(yè)務(wù)數(shù)據(jù)集為基礎(chǔ),利用大數(shù)據(jù)挖掘技術(shù),可以針對目前編制管理中的難點(diǎn)開展政府職能事項(xiàng)、履職情況、用編情況等主題挖掘分析。一是抓取大數(shù)據(jù)中與政府職能、辦事流程、發(fā)文審批以及群眾反映較多的情況等相關(guān)的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),利用挖掘技術(shù)結(jié)合文本分析技術(shù)[4]可以單位之間職能交叉、流程不合理情況等,推動(dòng)政府職能轉(zhuǎn)變和簡政放權(quán),提高政府治理能力。二是對權(quán)責(zé)清單、日常政策實(shí)施、辦事流程記錄、編制人員、監(jiān)督系統(tǒng)等數(shù)據(jù)進(jìn)行挖掘,分析某單位或部門制定的權(quán)責(zé)清單完善情況、履職情況、越權(quán)情況、違規(guī)情況等,從而增強(qiáng)監(jiān)督能力,督促工作人員正確規(guī)范履行職能、提高履職能力[5-6]。三是對編制人數(shù)、工作流程和內(nèi)容、編制實(shí)名信息等數(shù)據(jù)進(jìn)行挖掘,可以分析出各單位各部門是否超編、用編是否規(guī)范等信息,進(jìn)一步推動(dòng)合理用編工作。
3.2 利用時(shí)間軸技術(shù)進(jìn)行機(jī)構(gòu)職能動(dòng)態(tài)分析
時(shí)間軸技術(shù)主要是結(jié)合知識發(fā)現(xiàn)中時(shí)間序列分析,利用互聯(lián)網(wǎng)和可視化技術(shù),把各類事件串聯(lián)起來,構(gòu)成以時(shí)間為X軸的記錄體系,從中分析出事物隨時(shí)間變化的趨勢。時(shí)間軸技術(shù)可以廣泛運(yùn)用于各個(gè)領(lǐng)域,其最大作用是將事物發(fā)展過程系統(tǒng)化。
政府的具體職能除了體現(xiàn)在權(quán)責(zé)清單中,還體現(xiàn)在各類報(bào)表、方案、政策發(fā)文、行政審批事項(xiàng)、年度報(bào)告、新聞報(bào)道中,更體現(xiàn)在日常政治、經(jīng)濟(jì)、社會(huì)等領(lǐng)域的管理活動(dòng)中,這些管理活動(dòng)通過各個(gè)領(lǐng)域的不同機(jī)構(gòu)之間關(guān)聯(lián)、銜接來實(shí)現(xiàn)。同時(shí),各地GDP、常住人口、土地面積、財(cái)政收入、醫(yī)院、企業(yè)、執(zhí)法等數(shù)據(jù)也能間接體現(xiàn)各地機(jī)構(gòu)職能的異同。因此,機(jī)構(gòu)職能的分析需要從多維度進(jìn)行。同時(shí),政策文本,尤其涉及取消、下放、轉(zhuǎn)移、調(diào)整等不同方式的行政審批事項(xiàng)的變化,本身帶有時(shí)間屬性,從時(shí)間維度縱觀轉(zhuǎn)變進(jìn)程和路徑,更加有助于政府職能的分析。
在此基礎(chǔ)上,運(yùn)用知識發(fā)現(xiàn)和時(shí)間軸的方法,從各環(huán)節(jié)的職能信息中提取出知識,并以這些知識為中心,構(gòu)建起帶有時(shí)間屬性的知識圖譜,就可以對機(jī)構(gòu)職能進(jìn)行時(shí)間序列的動(dòng)態(tài)分析,發(fā)現(xiàn)存在職能交叉、職能重疊、職能缺位等環(huán)節(jié)的情況,進(jìn)而推動(dòng)政府更好地履行職能[7]。
3.3 利用地理信息技術(shù)統(tǒng)籌和優(yōu)化編制資源
地理信息技術(shù)是一類應(yīng)用地理空間信息技術(shù)的總稱,主要包括空間信息獲取、空間信息管理、空間信息的分析和應(yīng)用。
編制工作面臨的主要挑戰(zhàn)之一是如何統(tǒng)籌和優(yōu)化編制資源,解決不同地區(qū)、不同部門、不同層級間的編制資源分布不均衡、不合理的現(xiàn)象。解決這個(gè)問題,首先需要在各類非結(jié)構(gòu)化數(shù)據(jù)的基礎(chǔ)上,結(jié)合各單位權(quán)責(zé)清單數(shù)據(jù)、工作飽和度量化指標(biāo),人員編制類型、身份、財(cái)政供養(yǎng)類型、技術(shù)職稱類別、崗位職責(zé)、法定職責(zé)、工作日志、年齡、性別等,利用知識發(fā)現(xiàn)技術(shù)對編制資源進(jìn)行跨部門、跨層級的分析,明確問題的主要因素和次要因素,客觀分析個(gè)人履職情況,科學(xué)確定整個(gè)單位的履職情況和工作飽和度,以適當(dāng)調(diào)整用編[8]。
行政機(jī)關(guān)、事業(yè)單位的地理位置可以作為核定某個(gè)地區(qū)編制統(tǒng)籌動(dòng)態(tài)分配的重要指標(biāo)。將空間數(shù)據(jù)與單位或部門的屬性數(shù)據(jù)結(jié)合起來,運(yùn)用地理信息技術(shù),通過對空間信息、地域、學(xué)歷、機(jī)構(gòu)、編制類別、職稱、社交關(guān)系、職能、編制、人員等不同屬性進(jìn)行交叉研究,從不同維度分析其在地理空間的分布,同時(shí)可以分析不同區(qū)域不同類型編制人員的占比情況[7]。如在空間分析基礎(chǔ)上疊加時(shí)間序列分析,統(tǒng)籌考慮當(dāng)?shù)刎?cái)政收入、人口面積、社會(huì)發(fā)展?fàn)顩r等,則可以深入分析區(qū)域用編變化趨勢、編制結(jié)構(gòu)變化趨勢、人口經(jīng)濟(jì)與機(jī)構(gòu)的分布規(guī)律等,在分析結(jié)果基礎(chǔ)上可以分層次分標(biāo)準(zhǔn)建立機(jī)構(gòu)編制量化模型,為精準(zhǔn)化統(tǒng)籌動(dòng)態(tài)用編提供數(shù)據(jù)支撐。
4結(jié)論
隨著經(jīng)濟(jì)發(fā)展進(jìn)入新常態(tài),機(jī)構(gòu)編制工作已然進(jìn)入全面深化改革的攻堅(jiān)期、機(jī)構(gòu)編制管理的換擋期、工作方式方法的轉(zhuǎn)換期“三期疊加”的新階段,探索利用大數(shù)據(jù)等新技術(shù)機(jī)構(gòu)在編制工作中的創(chuàng)新應(yīng)用,對于促進(jìn)機(jī)構(gòu)編制管理模式和方式創(chuàng)新,支撐新常態(tài)下機(jī)構(gòu)編制管理工作科學(xué)規(guī)范運(yùn)行具有非常重要的意義。
參考文獻(xiàn):
[1] 潘享清.機(jī)構(gòu)編制與國家治理現(xiàn)代化需要重點(diǎn)研究的若干問題[J].中國機(jī)構(gòu)改革與管理,2020(2):6-8.
[2] 張素珍,劉樹軍,許志坤.機(jī)構(gòu)編制一體化省級大數(shù)據(jù)中心架構(gòu)研究[J].電腦知識與技術(shù),2020,16(3):18-20.
[3] 李軍,喬立民,王加強(qiáng),等.智慧政務(wù)框架下大數(shù)據(jù)共享的實(shí)現(xiàn)與應(yīng)用研究[J].電子政務(wù),2019(2):34-44.
[4] 張山杉,張昱城,徐姍.新游戲,新規(guī)則:大數(shù)據(jù)在組織管理研究中的應(yīng)用[J].中國人力資源開發(fā),2021,38(11):41-57.
[5] 秦偉平,王聰穎,熊陽鈺,等.互聯(lián)網(wǎng)+機(jī)構(gòu)編制管理面臨的挑戰(zhàn)與應(yīng)對策略[J].泰州職業(yè)技術(shù)學(xué)院學(xué)報(bào),2022,22(1):35-38.
[6] 李強(qiáng),王娜.大數(shù)據(jù)+互聯(lián)網(wǎng)與機(jī)構(gòu)編制管理創(chuàng)新研究[J].行政科學(xué)論壇,2020,7(12):14-18.
[7] 閆冬冬,肖俊,關(guān)欣,等.機(jī)構(gòu)編制管理大數(shù)據(jù)應(yīng)用及關(guān)鍵技術(shù)研究[J].電子政務(wù),2018(2):97-105.
[8] 朱建華.數(shù)據(jù)賦能 分類統(tǒng)籌 更高效益配置編制資源[J].中國機(jī)構(gòu)改革與管理,2021(12):27-28.
【通聯(lián)編輯:朱寶貴】