王偉玲
當(dāng)前,以人工智能、區(qū)塊鏈等為代表的數(shù)字技術(shù)不斷涌現(xiàn),快速向經(jīng)濟社會各領(lǐng)域融合滲透,以數(shù)據(jù)為核心的數(shù)字化轉(zhuǎn)型已是大勢所趨。各行各業(yè)在生產(chǎn)經(jīng)營過程中積累了海量的數(shù)據(jù)資源,只有做好數(shù)據(jù)治理,才能更快、更好地推進(jìn)數(shù)字化轉(zhuǎn)型。
當(dāng)前,新一代信息技術(shù)蓬勃發(fā)展,我國正處于以科技賦能實現(xiàn)大發(fā)展、大變革的關(guān)鍵時期。以人工智能、區(qū)塊鏈等為代表的數(shù)字技術(shù)不斷涌現(xiàn),快速向經(jīng)濟社會各領(lǐng)域融合滲透,以數(shù)據(jù)為核心的數(shù)字化轉(zhuǎn)型已是大勢所趨。要深刻認(rèn)識數(shù)據(jù)資源對數(shù)字化轉(zhuǎn)型的重要意義,切實把數(shù)據(jù)規(guī)劃好、管理好、保護(hù)好、應(yīng)用好,深挖數(shù)據(jù)價值,釋放數(shù)據(jù)潛能,推動經(jīng)濟社會實現(xiàn)高質(zhì)量發(fā)展。各行各業(yè)在生產(chǎn)經(jīng)營過程中積累了海量的數(shù)據(jù)資源,只有做好數(shù)據(jù)治理,才能更快、更好地推進(jìn)數(shù)字化轉(zhuǎn)型。
一、數(shù)據(jù)治理之“困”
(一)數(shù)據(jù)底數(shù)不清
“數(shù)據(jù)要素市場”的提出,讓更多人意識到數(shù)據(jù)的重要性,有望加速數(shù)據(jù)資產(chǎn)化進(jìn)程。任何組織推動數(shù)據(jù)變成資產(chǎn)前,都需要先摸清數(shù)據(jù)家底,否則數(shù)據(jù)資產(chǎn)化將無從談起。放眼望去,數(shù)據(jù)底數(shù)不清卻是目前我國數(shù)據(jù)要素市場面臨的普遍問題。究其原因,以往系統(tǒng)建設(shè)規(guī)劃往往只針對特定業(yè)務(wù)需求設(shè)計,缺乏對全局?jǐn)?shù)據(jù)的通盤考慮。對于一些大型的組織來講,數(shù)據(jù)涉及的系統(tǒng)數(shù)量往往達(dá)數(shù)百個,支撐的數(shù)據(jù)庫達(dá)上千個。隨著系統(tǒng)使用時間的增加,龐雜的數(shù)據(jù)無序地分散在不同系統(tǒng)中,對于數(shù)據(jù)價值的釋放帶來極大困難。開展數(shù)據(jù)分類分級治理,建立數(shù)據(jù)臺賬,摸清數(shù)據(jù)底數(shù),是數(shù)據(jù)資產(chǎn)化的前提,更是數(shù)據(jù)要素市場發(fā)展的第一要務(wù)。
(二)數(shù)據(jù)安全防護(hù)水平有待提升
數(shù)據(jù)安全是關(guān)乎組織生死存亡的核心要素。數(shù)據(jù)要素市場發(fā)展伴隨著海量數(shù)據(jù)的匯聚、流通和使用,如果沒有可靠的數(shù)據(jù)安全防護(hù),很容易受到不法分子的攻擊和竊取。我們從近年來不斷上演的數(shù)據(jù)泄密事件中即可窺見一斑。威瑞森《數(shù)據(jù)泄露調(diào)查報告》顯示,2019年全球86個國家共發(fā)生41686起安全事件和2013起數(shù)據(jù)泄露事件,使得相關(guān)機構(gòu)蒙受巨大損失。IBM《2019年全球數(shù)據(jù)泄露成本報告》顯示,近5年來數(shù)據(jù)泄露的年平均成本已達(dá)392萬美元。開展數(shù)據(jù)安全治理,平衡數(shù)據(jù)流通使用與個人信息保護(hù)及數(shù)據(jù)安全之間的關(guān)系,加大數(shù)據(jù)安全保護(hù)力度,確保數(shù)據(jù)要素市場得以有效運行。
(三)數(shù)據(jù)質(zhì)量不高
數(shù)據(jù)質(zhì)量的高低將對數(shù)據(jù)結(jié)果有效性具有決定性影響。數(shù)據(jù)質(zhì)量不高,不僅會使分析結(jié)果與實際產(chǎn)生很大偏差,甚至有可能引發(fā)災(zāi)難性后果,可謂“失之毫厘,謬以千里”。例如病患的病史和健康數(shù)據(jù)不準(zhǔn)確,為患者提供的藥物建議就可能出現(xiàn)嚴(yán)重錯誤。同樣,如果支撐企業(yè)決策的數(shù)據(jù)不準(zhǔn)確,將導(dǎo)致企業(yè)經(jīng)營管理偏離預(yù)期戰(zhàn)略目標(biāo)。
如果將數(shù)據(jù)比喻成水,有效的數(shù)據(jù)就是飲用水,為生命提供源動力;無效的數(shù)據(jù)就好比臟水,給人體健康帶來傷害,嚴(yán)重時甚至危及人的生命。開展數(shù)據(jù)質(zhì)量管理,對數(shù)據(jù)產(chǎn)生、采集、存儲、流通、應(yīng)用和銷毀的全生命周期進(jìn)行質(zhì)量管控,提高數(shù)據(jù)質(zhì)量,是保障數(shù)據(jù)價值實現(xiàn)的現(xiàn)實需要,也是推動數(shù)據(jù)要素市場發(fā)展的必由之路。
二、數(shù)據(jù)治理之“道”
面對上述困難和挑戰(zhàn),如何解困破局、實現(xiàn)數(shù)據(jù)有序治理和高效利用,是需要共同探討的重點議題。因此,數(shù)據(jù)治理應(yīng)遵循四大基本原則。
首先,依法合規(guī),保障安全。
數(shù)據(jù)作為重要的生產(chǎn)要素,確保數(shù)據(jù)安全應(yīng)是始終恪守的底線。尤其是對信息安全高度敏感的行業(yè),應(yīng)建立健全數(shù)據(jù)安全管理長效機制和防護(hù)措施,嚴(yán)防數(shù)據(jù)泄露、篡改、損毀與不當(dāng)使用,依法依規(guī)保護(hù)數(shù)據(jù)主體隱私權(quán)在數(shù)據(jù)治理過程中不受侵害,不能因開展跨部門數(shù)據(jù)融合應(yīng)用而突破現(xiàn)有法律法規(guī)與監(jiān)管規(guī)則。
其次,物理分散,邏輯集中。
由于歷史原因,很多機構(gòu)往往存在“N”個數(shù)據(jù)中心(數(shù)據(jù)源),呈現(xiàn)出多個業(yè)務(wù)數(shù)據(jù)分散存儲、分散運行的局面,若采用“推倒重來”的方式顯然成本太高、阻力太大。因此,應(yīng)在保持現(xiàn)有數(shù)據(jù)中心職能不變的前提下,維持當(dāng)前數(shù)據(jù)物理存放位置和運行主體不變,充分利用各數(shù)據(jù)中心IT設(shè)施和人才資源,構(gòu)建“1個數(shù)據(jù)交換管理平臺+N個數(shù)據(jù)中心(數(shù)據(jù)源)”的數(shù)據(jù)架構(gòu)格局。在此基礎(chǔ)上,制定實施統(tǒng)一的數(shù)據(jù)管理規(guī)則,實現(xiàn)數(shù)據(jù)的集中管理。
再次,最小夠用,用而不存。
數(shù)據(jù)治理的一大難點就是如何在保障數(shù)據(jù)所有權(quán)基礎(chǔ)上實現(xiàn)數(shù)據(jù)的融合應(yīng)用。應(yīng)消除數(shù)據(jù)所有方因信息“控制權(quán)讓渡”造成“事權(quán)轉(zhuǎn)移”的顧慮,規(guī)范數(shù)據(jù)使用行為,嚴(yán)控數(shù)據(jù)獲取和應(yīng)用范圍,確保數(shù)據(jù)專事專用、最小夠用、未經(jīng)許可不得留存,杜絕數(shù)據(jù)被誤用、濫用。在滿足各方合理需求的前提下,最大限度保障數(shù)據(jù)所有方權(quán)益,確保數(shù)據(jù)使用合規(guī)、范圍可控。
最后,一數(shù)一源,一源多用。
當(dāng)前,無論是教育行業(yè)還是工業(yè)企業(yè),各業(yè)務(wù)線數(shù)據(jù)分散現(xiàn)象或多或少存在,數(shù)據(jù)多頭收集時有發(fā)生。這不但增加信息報送、采集、存儲成本,也導(dǎo)致數(shù)據(jù)責(zé)任主體不明,數(shù)據(jù)安全、數(shù)據(jù)質(zhì)量難以保障。應(yīng)明確源數(shù)據(jù)管理的唯一主體,保障數(shù)據(jù)完整性、準(zhǔn)確性和一致性,減少重復(fù)收集造成的資源浪費和數(shù)據(jù)冗余。同時,建立數(shù)據(jù)規(guī)范共享機制,提升數(shù)據(jù)利用效率和應(yīng)用水平,實現(xiàn)數(shù)據(jù)多向賦能。
三、數(shù)據(jù)治理之“術(shù)”
就如何做好數(shù)據(jù)治理工作,提出如下四點意見。
其一,以頂層設(shè)計為契機點,推動數(shù)據(jù)規(guī)劃從“美好藍(lán)圖”走向“生動現(xiàn)實”。
數(shù)據(jù)治理是一項長期、復(fù)雜的系統(tǒng)工程,要在組織、機制和標(biāo)準(zhǔn)等方面加強統(tǒng)籌謀劃。一是優(yōu)化組織架構(gòu)。充分認(rèn)識數(shù)據(jù)的重要戰(zhàn)略意義,將數(shù)據(jù)治理納入企業(yè)中長期發(fā)展規(guī)劃,及時調(diào)整組織架構(gòu),明確內(nèi)部數(shù)據(jù)管理職責(zé),理清數(shù)據(jù)權(quán)屬關(guān)系,自上而下推動數(shù)據(jù)治理工作。二是完善應(yīng)用機制。在保障各方數(shù)據(jù)所有權(quán)不變前提下,統(tǒng)籌規(guī)劃全局?jǐn)?shù)據(jù)架構(gòu),完善跨機構(gòu)、跨領(lǐng)域數(shù)據(jù)融合應(yīng)用機制,實現(xiàn)數(shù)據(jù)規(guī)范共享和高效應(yīng)用。三是構(gòu)建標(biāo)準(zhǔn)體系。建立涵蓋數(shù)據(jù)采集、處理、使用等全流程的標(biāo)準(zhǔn)體系,打造數(shù)據(jù)的“通用語言”,提升數(shù)據(jù)質(zhì)量,為數(shù)據(jù)互通、信息共享和業(yè)務(wù)協(xié)同奠定堅實基礎(chǔ)。
其二,以數(shù)據(jù)管理為著力點,推動數(shù)據(jù)要素從“雜亂無章”跨越到“綱舉目張”。
一是做好數(shù)據(jù)資產(chǎn)管理。根據(jù)統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)體系,建立全局?jǐn)?shù)據(jù)模型和科學(xué)合理的數(shù)據(jù)架構(gòu)。在此基礎(chǔ)上,管理維護(hù)全局?jǐn)?shù)據(jù)資產(chǎn)目錄,實現(xiàn)對數(shù)據(jù)資產(chǎn)的全面梳理和有效管控,解決數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)利用不足等問題。二是做好數(shù)據(jù)分級管理。綜合國家安全、公眾權(quán)益、個人隱私和企業(yè)合法利益等因素,制定數(shù)據(jù)分級標(biāo)準(zhǔn),基于全局?jǐn)?shù)據(jù)資產(chǎn)目錄將數(shù)據(jù)進(jìn)行分級。針對不同等級數(shù)據(jù)采取差異化的控制措施,實現(xiàn)數(shù)據(jù)精細(xì)化管理。三是做好數(shù)據(jù)共享管理。規(guī)范數(shù)據(jù)共享流程,確保數(shù)據(jù)使用方在依法合規(guī)、保障安全前提下,根據(jù)業(yè)務(wù)需要申請使用數(shù)據(jù)。數(shù)據(jù)所有方按規(guī)則審核確定數(shù)據(jù)使用范圍、共享方式等,通過數(shù)據(jù)交換機制實現(xiàn)數(shù)據(jù)有序流轉(zhuǎn)和安全應(yīng)用。
其三,以數(shù)據(jù)安全為關(guān)鍵點,推動數(shù)據(jù)安全從“被動防御”跨越到“攻防兼?zhèn)洹薄?/p>
要遵循“用戶授權(quán)、最小夠用、全程防護(hù)”原則,充分評估潛在風(fēng)險,把好安全關(guān)口,加強數(shù)據(jù)全生命周期安全管理,嚴(yán)防用戶數(shù)據(jù)的泄露、篡改和濫用。在采集環(huán)節(jié),要向被采集用戶進(jìn)行明示,明確告知數(shù)據(jù)采集和使用的目的、方式以及范圍,在獲取用戶授權(quán)后方可采集。在存儲環(huán)節(jié),通過特征提取、標(biāo)記化等技術(shù)將原始信息進(jìn)行脫敏,并與關(guān)聯(lián)性較高的敏感信息進(jìn)行安全隔離、分散存儲,嚴(yán)控訪問權(quán)限,降低數(shù)據(jù)泄露風(fēng)險。在使用環(huán)節(jié),借助模型運算、多方安全計算等技術(shù),在不歸集、不共享原始數(shù)據(jù)前提下,僅向外提供脫敏后的計算結(jié)果。
其四,以數(shù)據(jù)應(yīng)用為切入點,推動數(shù)據(jù)要素從“明珠蒙塵”跨越到“連城之璧”。
數(shù)據(jù)治理的核心環(huán)節(jié)是數(shù)據(jù)應(yīng)用,要從算力、算法、存儲、網(wǎng)絡(luò)等維度加強技術(shù)支撐,切實增強數(shù)據(jù)應(yīng)用能力。在算力方面,加快分布式架構(gòu)轉(zhuǎn)型,充分發(fā)揮云計算等技術(shù)高性能、低成本、可擴展的優(yōu)勢,滿足海量數(shù)據(jù)分析處理對計算資源的巨大需求。在算法方面,基于深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等技術(shù)設(shè)計數(shù)據(jù)模型和分析算法,提升數(shù)據(jù)洞察能力和基于場景的數(shù)據(jù)挖掘能力,為數(shù)據(jù)插上翅膀,讓數(shù)據(jù)在經(jīng)濟社會各領(lǐng)域展翼翱翔。在存儲方面,探索與互聯(lián)網(wǎng)特征相適應(yīng)、與信息安全要求相匹配的數(shù)據(jù)存儲方案,穩(wěn)步推動分布式數(shù)據(jù)庫應(yīng)用,實現(xiàn)數(shù)據(jù)高效存儲和彈性擴展。在網(wǎng)絡(luò)方面,運用物聯(lián)網(wǎng)技術(shù)豐富數(shù)據(jù)采集維度,利用5G技術(shù)高帶寬、速度快、延時低等優(yōu)勢提升數(shù)據(jù)流轉(zhuǎn)效率,打造數(shù)據(jù)“高速公路”。
當(dāng)前,新一代信息技術(shù)蓬勃發(fā)展,我國正處于以科技賦能實現(xiàn)大發(fā)展、大變革的關(guān)鍵時期。要深刻認(rèn)識數(shù)據(jù)資源對數(shù)字化轉(zhuǎn)型的重要意義,切實把數(shù)據(jù)規(guī)劃好、管理好、保護(hù)好、應(yīng)用好,深挖數(shù)據(jù)價值,釋放數(shù)據(jù)潛能,推動經(jīng)濟社會實現(xiàn)高質(zhì)量發(fā)展。