□鄭銀巧 王 璇 王 蕾
數(shù)據(jù)作為新型生產(chǎn)要素,是鋼鐵企業(yè)數(shù)智化深入發(fā)展的新引擎。2020年4月《中共中央國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》正式發(fā)布,提出了土地、勞動(dòng)力、資本、技術(shù)、數(shù)據(jù)5個(gè)要素領(lǐng)域改革的方向,明確了完善要素市場(chǎng)化配置的具體舉措[1]。數(shù)據(jù)作為一種新型生產(chǎn)要素被寫(xiě)入正式文件,充分突出了數(shù)據(jù)的資源價(jià)值,也為鋼鐵企業(yè)的數(shù)智化轉(zhuǎn)型提供了方向。
近年來(lái),鋼鐵企業(yè)逐步認(rèn)識(shí)到數(shù)據(jù)資產(chǎn)的重要性,如何發(fā)揮企業(yè)數(shù)據(jù)價(jià)值,成為鋼鐵企業(yè)智改數(shù)轉(zhuǎn)的重要目標(biāo)。數(shù)據(jù)治理是充分發(fā)揮鋼鐵企業(yè)數(shù)據(jù)價(jià)值的必由之路,是助力鋼鐵企業(yè)轉(zhuǎn)型升級(jí)的有力保障。鋼鐵企業(yè)可利用體系化方法實(shí)現(xiàn)企業(yè)數(shù)據(jù)的可得、可信、可用、好用,解決企業(yè)數(shù)智化轉(zhuǎn)型的諸多數(shù)據(jù)問(wèn)題。在數(shù)據(jù)治理的基礎(chǔ)上,鋼鐵企業(yè)沉睡的數(shù)據(jù)得以被喚醒,數(shù)據(jù)價(jià)值得以充分釋放。
第一,數(shù)據(jù)多源異構(gòu)使數(shù)據(jù)集成共享存在壁壘。由于鋼鐵企業(yè)的信息化大多是隨著技術(shù)發(fā)展、業(yè)務(wù)需要逐步實(shí)施完善的,所以企業(yè)內(nèi)部通常擁有多種業(yè)務(wù)系統(tǒng)和數(shù)據(jù)庫(kù),并且由于使用場(chǎng)景和創(chuàng)建時(shí)期不同,計(jì)算環(huán)境和系統(tǒng)平臺(tái)各有差異,現(xiàn)有的數(shù)據(jù)庫(kù)和系統(tǒng)組成了一個(gè)龐大、異構(gòu)的信息源,數(shù)據(jù)傳輸和共享受到制約。
第二,數(shù)據(jù)質(zhì)量難以滿(mǎn)足企業(yè)需要。鋼鐵企業(yè)內(nèi)部多系統(tǒng)并存,服務(wù)各自的主管部門(mén)。同樣的數(shù)據(jù)在不同的信息系統(tǒng)中重復(fù)錄入,甚至不同信息系統(tǒng)中同一數(shù)據(jù)的值卻不一致等情況均有發(fā)生。此外,因缺乏問(wèn)責(zé)機(jī)制,各系統(tǒng)之間甚至同系統(tǒng)內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,“一物多碼”問(wèn)題十分嚴(yán)重,對(duì)企業(yè)上下游之間的數(shù)據(jù)協(xié)同、業(yè)務(wù)協(xié)同造成了較大影響。
第三,鋼鐵企業(yè)數(shù)據(jù)文化建設(shè)薄弱。目前,鋼鐵企業(yè)數(shù)據(jù)戰(zhàn)略目標(biāo)不明確,缺乏對(duì)企業(yè)級(jí)數(shù)據(jù)綜合治理體系的指導(dǎo)。數(shù)據(jù)作為一種新的生產(chǎn)要素,在企業(yè)中應(yīng)作為一種戰(zhàn)略資產(chǎn)進(jìn)行管理。數(shù)據(jù)從業(yè)務(wù)中產(chǎn)生,要對(duì)數(shù)據(jù)進(jìn)行有效治理,需要業(yè)務(wù)充分參與,但是由于業(yè)務(wù)部門(mén)認(rèn)識(shí)不足,或信息化部門(mén)協(xié)同能力不足,導(dǎo)致數(shù)據(jù)治理脫離了業(yè)務(wù)。此外,企業(yè)數(shù)據(jù)治理缺少體系支撐,導(dǎo)致管理責(zé)任不清、原則和依據(jù)不明、流程和操作不規(guī)范,同時(shí),人才、組織、預(yù)算保障未能到位,數(shù)據(jù)治理相關(guān)工作難以開(kāi)展。
綜上,樹(shù)立正確的企業(yè)數(shù)據(jù)建設(shè)工作思路有助于成功實(shí)現(xiàn)企業(yè)數(shù)據(jù)治理。鋼鐵企業(yè)作為非數(shù)字原生企業(yè),數(shù)字化轉(zhuǎn)型的關(guān)鍵要素之一是在現(xiàn)實(shí)世界的基礎(chǔ)上構(gòu)建一個(gè)跨越孤立系統(tǒng)承載業(yè)務(wù)的數(shù)字世界。通過(guò)在數(shù)字世界匯聚、聯(lián)接與分析數(shù)據(jù),并對(duì)其進(jìn)行描述、診斷和預(yù)測(cè),最終指導(dǎo)業(yè)務(wù)改進(jìn)。在實(shí)現(xiàn)策略上,企業(yè)需要構(gòu)建以云為基礎(chǔ)、以數(shù)據(jù)為驅(qū)動(dòng)的新型信息架構(gòu)。一是要充分利用鋼鐵企業(yè)現(xiàn)有各類(lèi)型信息系統(tǒng)產(chǎn)生的數(shù)據(jù)資產(chǎn),二是構(gòu)建一條從企業(yè)各業(yè)務(wù)過(guò)程感知、采集、匯總數(shù)據(jù)的通道,不斷完善企業(yè)生產(chǎn)經(jīng)營(yíng)過(guò)程的數(shù)字化和規(guī)范化,實(shí)現(xiàn)企業(yè)數(shù)據(jù)可視、可控、可用和可信。
近年來(lái),隨著對(duì)數(shù)據(jù)治理研究的深入,出現(xiàn)了多種治理模型。2019年,吳信東等人在《數(shù)據(jù)治理技術(shù)》一文中提出了大數(shù)據(jù) HAO治理模型[2],模型架構(gòu)見(jiàn)圖1。
圖1 HAO治理模型架構(gòu)
HAO治理模型以人類(lèi)智能(Human Intelligence)、人工智能(Artificial Intelligence)和組織智能(Organizational Intelligence)三者協(xié)同為目標(biāo),主要目的:一是建立一種全面、動(dòng)態(tài)、可配置的數(shù)據(jù)接入機(jī)制,實(shí)現(xiàn)數(shù)據(jù)采集、匯聚、任務(wù)配置、調(diào)度、數(shù)據(jù)加密和斷點(diǎn)續(xù)傳等功能;二是實(shí)現(xiàn)數(shù)據(jù)處理流程的規(guī)范化和標(biāo)準(zhǔn)化,對(duì)數(shù)據(jù)進(jìn)行規(guī)范化處理、清洗、關(guān)聯(lián)、比對(duì)等,以便組織的數(shù)據(jù)融合和建庫(kù);三是建立多元融合的數(shù)據(jù)組織模式,按照業(yè)務(wù)類(lèi)型、數(shù)據(jù)敏感度等內(nèi)容對(duì)不同數(shù)據(jù)分級(jí)分類(lèi)建庫(kù)、管理,并通過(guò)數(shù)據(jù)標(biāo)簽等方式將數(shù)據(jù)關(guān)聯(lián)融合;四是按照組織的業(yè)務(wù)內(nèi)容構(gòu)建知識(shí)圖譜,對(duì)數(shù)據(jù)進(jìn)行全方位、多維度管理,數(shù)據(jù)使用者可依托知識(shí)圖譜進(jìn)行簡(jiǎn)單的查詢(xún)檢索和對(duì)比排序等,專(zhuān)業(yè)人員可進(jìn)行數(shù)據(jù)挖掘、建模等數(shù)據(jù)處理;五是通過(guò)知識(shí)圖譜,實(shí)現(xiàn)人類(lèi)智能、人工智能和組織智能協(xié)同交互,利用治理過(guò)的融合數(shù)據(jù),通過(guò)數(shù)據(jù)模型、云計(jì)算、霧計(jì)算等處理機(jī)制,實(shí)現(xiàn)數(shù)據(jù)深層次應(yīng)用。
在HAO治理模型的基礎(chǔ)上,結(jié)合鋼鐵企業(yè)的業(yè)務(wù)特點(diǎn),圍繞企業(yè)數(shù)據(jù)來(lái)源、數(shù)據(jù)處理、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)服務(wù)4個(gè)層次,設(shè)計(jì)鋼鐵企業(yè)數(shù)據(jù)治理架構(gòu),如圖2所示。
圖2 鋼鐵企業(yè)數(shù)據(jù)治理架構(gòu)
鋼鐵企業(yè)數(shù)據(jù)來(lái)源包括各類(lèi)現(xiàn)存信息系統(tǒng),如過(guò)程控制系統(tǒng)(PCS)、基礎(chǔ)自動(dòng)化系統(tǒng)(PLC/DCS)、生產(chǎn)制造執(zhí)行系統(tǒng)(MES)、企業(yè)資源計(jì)劃(ERP)、設(shè)備管理系統(tǒng)、能源管理系統(tǒng)等;還包括各類(lèi)結(jié)構(gòu)化文本、非結(jié)構(gòu)化文本、視頻等。其中,對(duì)有數(shù)據(jù)庫(kù)的可開(kāi)發(fā)接口直接進(jìn)行數(shù)據(jù)抓??;對(duì)于非結(jié)構(gòu)化文本、視頻等,可利用深度學(xué)習(xí)技術(shù),如語(yǔ)音識(shí)別、圖像識(shí)別、視頻處理等進(jìn)行數(shù)據(jù)提取。
(1)數(shù)據(jù)預(yù)處理
數(shù)據(jù)采集后,要達(dá)到可使用,首先要按照鋼鐵企業(yè)業(yè)務(wù)特點(diǎn)制定數(shù)據(jù)規(guī)則,并根據(jù)規(guī)則對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)規(guī)則要提前定義好并存放在數(shù)據(jù)規(guī)則庫(kù)中。數(shù)據(jù)預(yù)處理主要分2步:第一步,對(duì)當(dāng)次采集的數(shù)據(jù)進(jìn)行質(zhì)量評(píng)估,包括數(shù)據(jù)空值率計(jì)算、數(shù)據(jù)可信度分析、數(shù)據(jù)完整性分析等,判斷數(shù)據(jù)是否有深層次處理應(yīng)用價(jià)值,若判斷此次采集數(shù)據(jù)質(zhì)量太低,或因個(gè)別底層業(yè)務(wù)系統(tǒng)數(shù)據(jù)處理未能滿(mǎn)足要求,設(shè)置重新采集機(jī)制;第二步,根據(jù)元數(shù)據(jù)庫(kù)、基礎(chǔ)數(shù)據(jù)庫(kù)信息,對(duì)各業(yè)務(wù)系統(tǒng)采集數(shù)據(jù)進(jìn)行統(tǒng)一編碼轉(zhuǎn)換,過(guò)濾掉臟、亂、差數(shù)據(jù),保留需要治理的數(shù)據(jù)內(nèi)容。
(2)數(shù)據(jù)規(guī)范化
數(shù)據(jù)規(guī)范化是對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)統(tǒng)一的過(guò)程,鋼鐵企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)來(lái)源為國(guó)標(biāo)、省部級(jí)標(biāo)準(zhǔn)及行業(yè)標(biāo)準(zhǔn)等,應(yīng)提前建立好數(shù)據(jù)標(biāo)準(zhǔn)知識(shí)庫(kù),對(duì)數(shù)據(jù)的名稱(chēng)、字段、單位等設(shè)定標(biāo)準(zhǔn)化要求。經(jīng)數(shù)據(jù)預(yù)處理后,按標(biāo)準(zhǔn)庫(kù)的相關(guān)要求,對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一處理,提高數(shù)據(jù)的共享性和復(fù)用性。
(3)數(shù)據(jù)清洗
數(shù)據(jù)清洗是將前面處理過(guò)的數(shù)據(jù)進(jìn)行篩選,將重復(fù)、多余的數(shù)據(jù)清除,將缺失的數(shù)據(jù)補(bǔ)充完整,對(duì)錯(cuò)誤的數(shù)據(jù)進(jìn)行糾正,最后整理成為可以進(jìn)一步加工、使用的數(shù)據(jù)。
(4)數(shù)據(jù)標(biāo)簽化
數(shù)據(jù)標(biāo)簽主要分技術(shù)標(biāo)簽和業(yè)務(wù)標(biāo)簽。技術(shù)標(biāo)簽主要是基于數(shù)據(jù)表和字段設(shè)計(jì)的技術(shù)元數(shù)據(jù),記錄數(shù)據(jù)的技術(shù)內(nèi)容,包括數(shù)據(jù)條目數(shù)、更新時(shí)間、更新頻次、數(shù)據(jù)格式、數(shù)據(jù)類(lèi)型、訪(fǎng)問(wèn)頻率、空間占用等。業(yè)務(wù)標(biāo)簽是基于表、字段的業(yè)務(wù)定義,描述其具體代表的內(nèi)容,包括數(shù)據(jù)來(lái)源、數(shù)據(jù)種類(lèi)(如客戶(hù)、供應(yīng)商等)和數(shù)據(jù)內(nèi)容(如客戶(hù)名稱(chēng)、客戶(hù)編碼、客戶(hù)聯(lián)系人姓名、客戶(hù)聯(lián)系人電話(huà)、客戶(hù)銀行賬號(hào)等)。
(5)數(shù)據(jù)主題化
按照鋼鐵企業(yè)業(yè)務(wù)特色和數(shù)據(jù)特點(diǎn),將數(shù)據(jù)按照業(yè)務(wù)類(lèi)型進(jìn)行主題劃分,包括生產(chǎn)、銷(xiāo)售、采購(gòu)、成本、財(cái)務(wù)、設(shè)備、物流、安全、環(huán)保、人力等。各主題覆蓋全業(yè)務(wù)范圍的最細(xì)顆粒度數(shù)據(jù),便于滿(mǎn)足后期各種統(tǒng)計(jì)形式需要。
(6)知識(shí)圖譜構(gòu)建
知識(shí)圖譜的構(gòu)建主要依賴(lài)于知識(shí)圖譜模型庫(kù),模型包含3個(gè)要素,即關(guān)系、實(shí)體和事件[3],通過(guò)這3個(gè)要素將鋼鐵企業(yè)各類(lèi)型數(shù)據(jù)進(jìn)行抽象化的內(nèi)在聯(lián)系,以可視化的形式有效表現(xiàn)出來(lái),便于實(shí)現(xiàn)關(guān)系的檢索、推理、計(jì)算和分析。鋼鐵企業(yè)的實(shí)體指鋼鐵行業(yè)涵蓋的各種對(duì)象,包括人、財(cái)、物料、庫(kù)房、廠(chǎng)區(qū)、裝備、部門(mén)等。圖3是一個(gè)簡(jiǎn)單的廢鋼關(guān)系圖譜,以廢鋼為中心,建立廢鋼與公司部門(mén)、廢鋼與供應(yīng)商、廢鋼與倉(cāng)庫(kù)存儲(chǔ)、廢鋼與轉(zhuǎn)爐投料、廢鋼與軋鋼廠(chǎng)的關(guān)系等。
圖3 廢鋼關(guān)系知識(shí)圖譜
數(shù)據(jù)存儲(chǔ)的內(nèi)容主要有4種:一是數(shù)據(jù)知識(shí)庫(kù),主要是數(shù)據(jù)處理的規(guī)則、標(biāo)準(zhǔn)、數(shù)據(jù)標(biāo)簽、主題分類(lèi)、專(zhuān)題分類(lèi)、知識(shí)圖譜模型等,作為數(shù)據(jù)處理的依據(jù);二是標(biāo)準(zhǔn)庫(kù),包括元數(shù)據(jù)、主數(shù)據(jù)等,實(shí)現(xiàn)數(shù)出同源,統(tǒng)一標(biāo)準(zhǔn);三是主題庫(kù),主要是各個(gè)業(yè)務(wù)主題的各類(lèi)型最細(xì)顆粒度數(shù)據(jù);四是專(zhuān)題庫(kù),是為了解決某些特定業(yè)務(wù),對(duì)主題庫(kù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、挖掘、分析后形成的數(shù)據(jù)。
考慮到鋼鐵企業(yè)數(shù)據(jù)量大、數(shù)據(jù)更新頻次快,數(shù)據(jù)存儲(chǔ)需要一定的擴(kuò)展能力,建議將數(shù)據(jù)布置到分布式的大數(shù)據(jù)平臺(tái)上,以便應(yīng)對(duì)企業(yè)越來(lái)越多的數(shù)據(jù)積累和越來(lái)越嚴(yán)苛的算力要求。
對(duì)處理后的主題庫(kù)數(shù)據(jù),設(shè)計(jì)算法模型,對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析、關(guān)聯(lián)分析、對(duì)比碰撞、深度挖掘等,深度總結(jié)業(yè)務(wù)經(jīng)驗(yàn)、分析業(yè)務(wù)現(xiàn)狀、預(yù)測(cè)未來(lái)趨勢(shì),為鋼鐵企業(yè)各專(zhuān)業(yè)部門(mén)提供定制化的數(shù)據(jù)服務(wù)。
一是提高數(shù)據(jù)治理戰(zhàn)略高度,從思想上深刻認(rèn)識(shí)數(shù)據(jù)治理對(duì)企業(yè)數(shù)據(jù)價(jià)值釋放的重要性。數(shù)據(jù)治理基本涵蓋了鋼鐵企業(yè)的全域數(shù)據(jù),單純從業(yè)務(wù)層面或某個(gè)部門(mén)出發(fā),是做不好數(shù)據(jù)治理工作的,只有企業(yè)高層高度重視,將數(shù)據(jù)治理提升到戰(zhàn)略高度,才會(huì)統(tǒng)籌全局資源力量,實(shí)現(xiàn)數(shù)據(jù)治理,將數(shù)據(jù)變?yōu)橘Y產(chǎn)。
二是建立完善的工作制度,為數(shù)據(jù)治理過(guò)程提供保障。鋼鐵企業(yè)底層數(shù)據(jù)來(lái)源繁雜,數(shù)據(jù)周期、粒度也不盡相同,必須建立一套完善的數(shù)據(jù)治理工作制度,統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),實(shí)施責(zé)任制管理,才能驅(qū)動(dòng)鋼鐵企業(yè)數(shù)據(jù)的有效治理。
三是要明確數(shù)據(jù)治理是一個(gè)長(zhǎng)期、系統(tǒng)的工程。數(shù)據(jù)治理需要長(zhǎng)期循序漸進(jìn)地總結(jié)、復(fù)盤(pán)、優(yōu)化,其終極目標(biāo)絕不僅是單純業(yè)務(wù)數(shù)據(jù)的治理,而是通過(guò)數(shù)據(jù)治理驅(qū)動(dòng)業(yè)務(wù)優(yōu)化,只有通過(guò)持續(xù)和動(dòng)態(tài)的全生命周期數(shù)據(jù)治理過(guò)程,數(shù)據(jù)才能持續(xù)釋放價(jià)值。○