□ 賈悅 王超
大數(shù)據(jù)是一場管理革命。利用政務(wù)云平臺(tái)的各種軟硬件和大數(shù)據(jù)技術(shù),為公共信用信息系統(tǒng)和公共信用信息平臺(tái)提供更先進(jìn)的數(shù)據(jù)采集、處理、分析等基礎(chǔ)支撐技術(shù),為信用評級機(jī)構(gòu)、征信機(jī)構(gòu)等第三方應(yīng)用平臺(tái)進(jìn)行信用信息資源增值開發(fā)提供應(yīng)用支撐技術(shù),已成為社會(huì)信用體系建設(shè)的發(fā)展趨勢。
2008年,經(jīng)杭州市委、市政府同意,杭州市發(fā)改委(市信用辦)牽頭,杭州市信息中心(市信用中心)具體負(fù)責(zé),啟動(dòng)了杭州市聯(lián)合征信系統(tǒng)項(xiàng)目建設(shè),2013年起項(xiàng)目名稱正式更名為杭州市公共信用信息平臺(tái)。杭州市公共信用信息平臺(tái)經(jīng)過前幾期的建設(shè),已形成一定規(guī)模,增加了歸集數(shù)據(jù)、拓寬了業(yè)務(wù)范圍、拓展了用信方式,信用數(shù)據(jù)不僅來源于政府部門、事業(yè)單位,還有互聯(lián)網(wǎng)公共信息的搜索抓取、移動(dòng)應(yīng)用采集等多種渠道。
杭州市公共信用信息平臺(tái)的數(shù)據(jù)處理主要包含以下幾個(gè)步驟:一是數(shù)據(jù)準(zhǔn)備,即各業(yè)務(wù)部門將相關(guān)數(shù)據(jù)匯集到電子政務(wù)辦,電子政務(wù)辦將數(shù)據(jù)匯總到統(tǒng)一電子政務(wù)交換云平臺(tái)。二是數(shù)據(jù)采集,即通過網(wǎng)間交換,將統(tǒng)一電子政務(wù)交換云平臺(tái)中的增量數(shù)據(jù)采集到杭州市公共信用信息平臺(tái)的歸集庫。三是數(shù)據(jù)歸集,即杭州市公共信用信息平臺(tái)通過程序處理,將歸集庫中的數(shù)據(jù)轉(zhuǎn)換成資源目錄對應(yīng)的數(shù)據(jù)結(jié)構(gòu),并存儲(chǔ)到中心庫。該步驟同時(shí)包含清洗、比對、去重等數(shù)據(jù)處理內(nèi)容。四是數(shù)據(jù)計(jì)算(指標(biāo)生成),即杭州市公共信用信息平臺(tái)根據(jù)指標(biāo)配置的規(guī)則,進(jìn)行指標(biāo)結(jié)果的計(jì)算,并輸出到固化表中。目前該環(huán)節(jié)需要人工干預(yù)處理。由數(shù)據(jù)運(yùn)維人員對數(shù)據(jù)歸集的情況進(jìn)行分析判斷,確認(rèn)當(dāng)前系統(tǒng)的壓力度,以及是否能進(jìn)行固化。
截至2017年5月,杭州市公共信用信息平臺(tái)已形成1300余萬份自然人信用記錄和120余萬份法人信用記錄,完全覆蓋了全市常住人口、流動(dòng)人口及注冊法人,實(shí)現(xiàn)政府信用信息的全量歸集,涵蓋全市55家市級行政機(jī)關(guān),水、電、公交等9家公用事業(yè)單位,13個(gè)區(qū)、縣(市),共338類2947項(xiàng)1.4億多條信用信息。
引入大數(shù)據(jù)技術(shù),對杭州市公共信用信息平臺(tái)進(jìn)行升級改造,利用技術(shù)的創(chuàng)新推進(jìn)信用應(yīng)用場景的創(chuàng)新和信用服務(wù)模式的創(chuàng)新,延伸信用信息服務(wù)的廣度和深度,是杭州市推動(dòng)和加快社會(huì)信用體系建設(shè)的一個(gè)具有里程碑意義的創(chuàng)新舉措。
大數(shù)據(jù)技術(shù)的運(yùn)用,使當(dāng)前政府信用數(shù)據(jù)的來源不再局限于傳統(tǒng)的組織登記、市場監(jiān)管、審批審核等傳統(tǒng)領(lǐng)域和組織內(nèi)數(shù)據(jù),而是擴(kuò)展到電子商務(wù)、社交數(shù)據(jù)、網(wǎng)絡(luò)行為等領(lǐng)域,大大拓展了數(shù)據(jù)的來源渠道,擴(kuò)大了數(shù)據(jù)歸集的范圍。
公共信用信息平臺(tái)大數(shù)據(jù)改造后,支持結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),涵蓋包括文件、靜態(tài)圖片、指紋、視音頻等更多種類,實(shí)現(xiàn)歸集的信用數(shù)據(jù)類型更全面、更完整。
公共信用信息大數(shù)據(jù)應(yīng)用支撐平臺(tái)利用分布式存儲(chǔ)和并行計(jì)算框架,結(jié)合多種分布式計(jì)算引擎,大大提高了數(shù)據(jù)處理的時(shí)效性和精確度;通過采用BI技術(shù),包括大數(shù)據(jù)倉庫建模、ETL、OLAP分析、可視化等技術(shù),可實(shí)現(xiàn)對信用數(shù)據(jù)不同主題的多維度分析;平臺(tái)通過采用數(shù)據(jù)標(biāo)簽化、聚類、判別模型、群像分析等一系列大數(shù)據(jù)技術(shù),利用不斷積累的數(shù)據(jù)資源,通過機(jī)器學(xué)習(xí)算法,對信用模型進(jìn)行矯正與進(jìn)化,可實(shí)現(xiàn)信用大數(shù)據(jù)主題應(yīng)用的深入分析。
大數(shù)據(jù)的價(jià)值不在于擁有,更重要的是應(yīng)用,這不僅需要持久的關(guān)注研究和大量的研發(fā)投入,更需要和政府監(jiān)管要求、征信商業(yè)模式以及社會(huì)需求緊密結(jié)合,對數(shù)據(jù)進(jìn)行深入的理解和分析,充分發(fā)掘數(shù)據(jù)價(jià)值。大數(shù)據(jù)技術(shù)的應(yīng)用是一個(gè)綜合性的過程,是從數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)分析挖掘到數(shù)據(jù)服務(wù)的一體化過程。通過運(yùn)用大數(shù)據(jù)技術(shù),不僅促進(jìn)了信用產(chǎn)品及信用創(chuàng)新型應(yīng)用的開發(fā)和推廣、推動(dòng)了信用服務(wù)產(chǎn)業(yè)的深入發(fā)展,同時(shí)為政府監(jiān)管決策精細(xì)化、前置化提供了輔助和支撐,降低了行政執(zhí)法成本,提升了政府公信力。