李瑞華,馮治東,郭紅波
(榆林學(xué)院信息工程學(xué)院 陜西 榆林 719000)
經(jīng)濟(jì)社會和信息技術(shù)的融合引發(fā)了數(shù)據(jù)的急劇增長,數(shù)據(jù)已經(jīng)成為衡量一個國家基礎(chǔ)戰(zhàn)略的必備資源。數(shù)據(jù)產(chǎn)業(yè)化已經(jīng)對全球生產(chǎn)、流通、消費(fèi)、分配產(chǎn)生重要的影響,在這樣一個全新的社會形態(tài)下,國家治理模式逐漸轉(zhuǎn)移到以數(shù)據(jù)治理為基礎(chǔ)的治理模式,如何對數(shù)據(jù)實(shí)施規(guī)劃、存儲、管理、挖掘、應(yīng)用,從而使得數(shù)據(jù)潛在的價值得以釋放,進(jìn)一步推動社會經(jīng)濟(jì)的增值,是實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型的重要內(nèi)容[1]。
榆林礦產(chǎn)資源豐富,能化工業(yè)的起步較晚,眾多企業(yè)在原材料準(zhǔn)備、生產(chǎn)設(shè)備、生產(chǎn)流程、廢物處理、銷售業(yè)務(wù)、經(jīng)營管理中基本都已實(shí)現(xiàn)了信息化,其信息系統(tǒng)中的海量數(shù)據(jù)為企業(yè)的生產(chǎn)運(yùn)營提供了大量的數(shù)據(jù)支撐,但是面對新信息時代的智能化發(fā)展要求,如何挖掘元數(shù)據(jù)之間的存在關(guān)系,探索數(shù)據(jù)礦藏中蘊(yùn)含的“知識黃金”是企業(yè)未來生存和發(fā)展的必然途徑[2]。改變原有資產(chǎn)的管理模式和意識形態(tài),注重?cái)?shù)據(jù)資產(chǎn)的保護(hù)和挖掘,是當(dāng)前能化工業(yè)亟待解決的問題。
榆林作為能化工業(yè)的發(fā)展城市,關(guān)于數(shù)據(jù)治理存在以下幾方面的問題。
傳統(tǒng)的能化工企業(yè)只注重有形資產(chǎn)的管理與實(shí)際業(yè)績的提升,“數(shù)據(jù)治理”的理解較為狹義,忽略企業(yè)在生產(chǎn)過程中各項(xiàng)數(shù)據(jù)的有效利用與數(shù)據(jù)分析,如有數(shù)據(jù)管理往往也只停留在財(cái)務(wù)報(bào)表的范圍之內(nèi),沒有真正實(shí)現(xiàn)數(shù)據(jù)資源資產(chǎn)化的管理。
榆林地區(qū)煤化工企業(yè)較多,很多企業(yè)的數(shù)據(jù)質(zhì)量意識淡薄,數(shù)據(jù)管理職能缺失,數(shù)據(jù)操作不規(guī)范,數(shù)據(jù)質(zhì)量問題嚴(yán)重。各企業(yè)對數(shù)據(jù)的存儲沒有統(tǒng)一的量化標(biāo)準(zhǔn)、存儲標(biāo)準(zhǔn),造成數(shù)據(jù)不一致、不完整和不正確[3]。沒有統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)導(dǎo)致數(shù)據(jù)難以集成和統(tǒng)一,沒有質(zhì)量控制導(dǎo)致海量數(shù)據(jù)因質(zhì)量過低而難以被利用,沒有能有效管理整個大數(shù)據(jù)平臺的管理流程。
能化工業(yè)的數(shù)據(jù)管理一般根據(jù)行業(yè)的生產(chǎn)步驟與環(huán)節(jié)分散存儲在不同的系統(tǒng)平臺,各平臺數(shù)據(jù)存儲相互獨(dú)立,信息數(shù)據(jù)無法共享,形成信息孤島,因此無法獲得對產(chǎn)業(yè)生產(chǎn)過程的多因素的實(shí)時分析檢測與管控,從而造成數(shù)據(jù)不可知與不可取。
能化工業(yè)的智能化建設(shè)是基于大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等信息化技術(shù),其數(shù)據(jù)治理必須解決數(shù)據(jù)標(biāo)準(zhǔn)化、元數(shù)據(jù)和主數(shù)據(jù)的管理工作;加強(qiáng)生產(chǎn)現(xiàn)場、服務(wù)過程等動態(tài)數(shù)據(jù)的采集、傳輸和匯集體系;加快大數(shù)據(jù)平臺建設(shè),創(chuàng)新數(shù)據(jù)融合分析和共享交換機(jī)制[4];強(qiáng)化業(yè)務(wù)場景的數(shù)據(jù)建模、挖掘數(shù)據(jù)價值、提升數(shù)據(jù)洞察力,從而將知識化后的數(shù)據(jù)轉(zhuǎn)換為企業(yè)的資產(chǎn),因此提出基于技術(shù)架構(gòu)的能化工業(yè)智能化建設(shè)中數(shù)據(jù)治理的基本框架,本框架包括三種形態(tài)。
第一種形態(tài)為治理的對象。這些對象是原始數(shù)據(jù),它只是對生產(chǎn)過程、交易過程的原始記錄,不能體現(xiàn)數(shù)據(jù)存儲的實(shí)際價值,其內(nèi)容也是晦澀難懂,且能化工業(yè)的信息系統(tǒng)中海量元數(shù)據(jù)存在不一致、冗余、離散等問題,需要建立一個集成平臺,將分散數(shù)據(jù)集中存儲。
第二種形態(tài)為規(guī)范化。根據(jù)行業(yè)規(guī)范要求制定權(quán)威的數(shù)據(jù)標(biāo)準(zhǔn),統(tǒng)一能化工業(yè)生產(chǎn)初期、成產(chǎn)過程、廢料排放、產(chǎn)品銷售等不同階段的數(shù)據(jù)標(biāo)準(zhǔn),統(tǒng)一業(yè)務(wù)語境,這需要能化工業(yè)統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)以及業(yè)務(wù)語境,同時協(xié)同IT人員收集業(yè)務(wù)數(shù)據(jù)并根據(jù)標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)遷移、集成,進(jìn)一步數(shù)據(jù)挖掘,變離散數(shù)據(jù)為有效知識[5]。
第三種形態(tài)為知識。基于規(guī)范化的數(shù)據(jù)資源目錄發(fā)掘數(shù)據(jù)業(yè)務(wù)畫像,進(jìn)一步挖據(jù)數(shù)據(jù)價值,得到可靠、可信、可懂的企業(yè)數(shù)據(jù)資產(chǎn),挖掘數(shù)據(jù)中的紅利,使得數(shù)據(jù)從無形的、不可知到有規(guī)律可尋、便于決策的知識,可實(shí)現(xiàn)數(shù)據(jù)治理的有效性、可用性。
基本框架制定了數(shù)據(jù)治理的過程,具體的數(shù)據(jù)治理的實(shí)施方案內(nèi)容包括但不局限于:集成數(shù)據(jù)資源元數(shù)據(jù)、抽取數(shù)據(jù)產(chǎn)生數(shù)據(jù)聚合平臺、數(shù)據(jù)資源資產(chǎn)化,數(shù)據(jù)資產(chǎn)的應(yīng)用。
數(shù)據(jù)聚合:能化工業(yè)由于在生產(chǎn)過程中,各種機(jī)器設(shè)備的運(yùn)行狀態(tài)、掘進(jìn)過程、各項(xiàng)數(shù)據(jù)指標(biāo)的采集、化學(xué)反應(yīng)過程、廢料指標(biāo)等根據(jù)行業(yè)功能不同分別在不同的機(jī)器設(shè)備以及不同的數(shù)據(jù)庫中存儲,數(shù)據(jù)不統(tǒng)一、不集中。需要通過能化工行業(yè)業(yè)務(wù)人員和計(jì)算機(jī)技術(shù)人員,將不同系統(tǒng)的生產(chǎn)元數(shù)據(jù)通過數(shù)據(jù)預(yù)處理,結(jié)合行業(yè)標(biāo)準(zhǔn)抽取有意義的數(shù)據(jù),聚合在一個平臺,形成一個有標(biāo)準(zhǔn)、可控的、集成的數(shù)據(jù)平臺[6]。
數(shù)據(jù)資源資產(chǎn)化:能化工業(yè)的信息化系統(tǒng)中存儲的數(shù)據(jù)是電子化的元數(shù)據(jù)記錄,元數(shù)據(jù)本身不具有資產(chǎn)屬性[7]。通過聚合平臺提取有效地原始數(shù)據(jù),并通過數(shù)據(jù)挖掘工具分析元數(shù)據(jù)之間的關(guān)系,使其挖掘結(jié)果能夠生成便于企業(yè)進(jìn)行生產(chǎn)管理、業(yè)務(wù)決策、生產(chǎn)預(yù)警等的先驗(yàn)知識和規(guī)則。從而形成企業(yè)的有效數(shù)據(jù)資產(chǎn)。
數(shù)據(jù)產(chǎn)權(quán)與安全:數(shù)據(jù)一旦成為資產(chǎn),就一定有產(chǎn)權(quán)方和實(shí)際控制人。數(shù)據(jù)實(shí)際控制人一般是數(shù)據(jù)庫的管理人員,但是煤化工企業(yè)是數(shù)據(jù)的產(chǎn)權(quán)方,數(shù)據(jù)資產(chǎn)產(chǎn)權(quán)的確定涉及法律層面,應(yīng)對數(shù)據(jù)實(shí)際控制者的行為嚴(yán)加管束,做到合法、合規(guī)[8]。數(shù)據(jù)資產(chǎn)的使用場景與使用手段需明確,即使是數(shù)據(jù)資產(chǎn)的擁有者,在使用數(shù)據(jù)資產(chǎn)時必須明確任何數(shù)據(jù)都有隱私與敏感屬性,同時注重?cái)?shù)據(jù)的安全性[9]。保證數(shù)據(jù)使用中的存儲管理、用戶管理、訪問控制權(quán)限等,數(shù)據(jù)資產(chǎn)的所有權(quán)和安全性是數(shù)據(jù)治理的重中之重。
數(shù)據(jù)資產(chǎn)的應(yīng)用:數(shù)據(jù)資產(chǎn)具有資產(chǎn)的效力,通過歷史數(shù)據(jù)的分析獲得先驗(yàn)知識可以提升企業(yè)智能化生產(chǎn)和管理的能力,便于企業(yè)決策、制定未來的發(fā)展規(guī)劃、財(cái)務(wù)智能預(yù)算等各方面的智能化發(fā)展,同時數(shù)據(jù)資產(chǎn)可以對于企業(yè)的安全生產(chǎn)提供預(yù)測,便于企業(yè)開展發(fā)展規(guī)劃。
數(shù)據(jù)作為能化工業(yè)智能化的核心資源,其獲取與利用對于工業(yè)智能化的發(fā)展具有重要的作用,能化工業(yè)的數(shù)據(jù)治理是為了實(shí)現(xiàn)能化工業(yè)數(shù)據(jù)資產(chǎn)化而進(jìn)行的數(shù)據(jù)決策分配的活動過程,是一項(xiàng)復(fù)雜的系統(tǒng)工程,本文主要在數(shù)據(jù)治理的技術(shù)層面對能化工業(yè)的數(shù)據(jù)治理提出理論探索,給出了基本的治理框架,僅供能化工業(yè)的智能化建設(shè)過程參考。