任增朋
(中國(guó)核能電力股份有限公司,北京 100097)
黨中央、國(guó)務(wù)院高度重視大數(shù)據(jù)產(chǎn)業(yè)發(fā)展,推動(dòng)實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略。習(xí)近平總書記在黨的十九大報(bào)告上提出,要推動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實(shí)體經(jīng)濟(jì)的深度融合?!吨腥A人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》圍繞“打造數(shù)字經(jīng)濟(jì)新優(yōu)勢(shì)”,做出了培育壯大大數(shù)據(jù)等新興數(shù)字產(chǎn)業(yè)的明確部署。工業(yè)和信息化部制定出臺(tái)了《“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》,作為未來五年大數(shù)據(jù)產(chǎn)業(yè)發(fā)展工作的行動(dòng)綱領(lǐng)。
隨著核電企業(yè)對(duì)于數(shù)據(jù)處理需求的不斷發(fā)展,常規(guī)的數(shù)據(jù)架構(gòu)已經(jīng)難以滿足需求。核電企業(yè)的關(guān)注重點(diǎn)已轉(zhuǎn)移到以數(shù)據(jù)管理平臺(tái)為基礎(chǔ),將不同的業(yè)務(wù)種類劃分成多個(gè)數(shù)據(jù)區(qū)域來存放企業(yè)所有類型數(shù)據(jù)。這些數(shù)據(jù)將包括企業(yè)通過原始積累、外部合作等,以及從自己內(nèi)部、外部所有渠道獲取到的結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。大數(shù)據(jù)給企業(yè)帶來價(jià)值的同時(shí)也給企業(yè)帶來了前所未有的挑戰(zhàn),作為系統(tǒng)工程,需要戰(zhàn)略、管理、業(yè)務(wù)、技術(shù)幾方面形成合力,才能發(fā)揮大數(shù)據(jù)最大效用。
參照大數(shù)據(jù)應(yīng)用發(fā)展演進(jìn)趨勢(shì),核電大數(shù)據(jù)應(yīng)用以應(yīng)用需求為驅(qū)動(dòng),以數(shù)據(jù)準(zhǔn)備為基礎(chǔ),并依賴于技術(shù)平臺(tái)而實(shí)現(xiàn),核電站大數(shù)據(jù)應(yīng)用發(fā)展劃分為如圖1所示的四個(gè)階段。
圖1 核電大數(shù)據(jù)應(yīng)用演進(jìn)階段模型
核電數(shù)據(jù)管理工作自2013年啟動(dòng),以主數(shù)據(jù)管理為抓手,參照核電站生命周期特征打通主數(shù)據(jù)全生命周期管理,實(shí)現(xiàn)了數(shù)據(jù)產(chǎn)生源頭、采集過程與使用過程的質(zhì)量控制。建立了包括標(biāo)準(zhǔn)、運(yùn)維、質(zhì)量、安全、系統(tǒng)平臺(tái)、程序體系等多維度主數(shù)據(jù)在內(nèi)的管理體系,形成了基于數(shù)字化建設(shè)的全生命周期主數(shù)據(jù)管理。主數(shù)據(jù)管理全生命周期管理理念模型如圖2所示。
圖2 核電主數(shù)據(jù)全生命周期管理概念模型
3.1.1 主數(shù)據(jù)
主數(shù)據(jù)(Master Data)是指用來描述企業(yè)核心業(yè)務(wù)實(shí)體的數(shù)據(jù),是跨越各個(gè)業(yè)務(wù)部門和系統(tǒng)的高價(jià)值的基礎(chǔ)數(shù)據(jù)。主數(shù)據(jù)具有在業(yè)務(wù)活動(dòng)中相對(duì)穩(wěn)定、在業(yè)務(wù)系統(tǒng)中交互共享、是業(yè)務(wù)數(shù)據(jù)的派生源頭(母體數(shù)據(jù))等特征。主數(shù)據(jù)管理的數(shù)據(jù)包括功能位置、設(shè)備、物資等。
3.1.2 業(yè)務(wù)數(shù)據(jù)
業(yè)務(wù)數(shù)據(jù)是用于記錄業(yè)務(wù)事件的數(shù)據(jù),用來描述某一時(shí)間點(diǎn)在業(yè)務(wù)系統(tǒng)上發(fā)生的行為數(shù)據(jù)。如設(shè)備檢修報(bào)告、采購訂單、工作申請(qǐng)、物資出入庫等業(yè)務(wù)活動(dòng)的行為記錄。
3.1.3 實(shí)時(shí)數(shù)據(jù)
實(shí)時(shí)數(shù)據(jù)是指機(jī)組運(yùn)行過程中產(chǎn)生的用于真實(shí)反映系統(tǒng)及設(shè)備瞬時(shí)運(yùn)行狀態(tài)的數(shù)據(jù)。
3.1.4 主數(shù)據(jù)結(jié)構(gòu)關(guān)系
主數(shù)據(jù)結(jié)構(gòu)是參照電站實(shí)體SSCs結(jié)構(gòu)而構(gòu)建的數(shù)據(jù)SSCs結(jié)構(gòu)關(guān)系。核電主數(shù)據(jù)SSCs結(jié)構(gòu)關(guān)系如圖3所示。
圖3 主數(shù)據(jù)SSCs結(jié)構(gòu)關(guān)系圖
核電信息化建設(shè)較為完備,具備了較好的大數(shù)據(jù)應(yīng)用數(shù)據(jù)基礎(chǔ),但全范圍的數(shù)據(jù)管理仍處于起步階段,仍面臨巨大的困難與挑戰(zhàn),具體表現(xiàn)在:
(1)核電領(lǐng)域沒有體系化的數(shù)據(jù)管理與價(jià)值挖掘利用案例,缺少參考經(jīng)驗(yàn)。核電行業(yè)缺少可參考的成功經(jīng)驗(yàn),需要結(jié)合核電特點(diǎn)參其他域數(shù)據(jù)管理與應(yīng)用經(jīng)驗(yàn),探索實(shí)踐核電數(shù)據(jù)管理之路,每前進(jìn)一步都存在巨大的困難與挑戰(zhàn)。
(2)公司范圍內(nèi)數(shù)據(jù)資源關(guān)聯(lián)與共享程度低,數(shù)據(jù)質(zhì)量不高,數(shù)據(jù)資源流通不暢。主數(shù)據(jù)間仍未進(jìn)行有效的關(guān)聯(lián),難以支持業(yè)務(wù)貫通,業(yè)務(wù)數(shù)據(jù)的管理仍處于起步階段,數(shù)據(jù)生成與存儲(chǔ)缺少有效的管理與規(guī)范,存在數(shù)據(jù)信息孤島,數(shù)據(jù)共享與信息資源不暢通,數(shù)據(jù)價(jià)值難以被有效挖掘利用。
(3)數(shù)據(jù)管理與應(yīng)用價(jià)值不易顯性展示,業(yè)務(wù)管理投入和需求少。數(shù)據(jù)本身是應(yīng)用系統(tǒng)的基礎(chǔ)資源,不易顯現(xiàn)直接價(jià)值,從而重應(yīng)用輕數(shù)據(jù);數(shù)據(jù)價(jià)值的挖掘與再利用,需要一定的技術(shù)條件與數(shù)據(jù)知識(shí)儲(chǔ)備,認(rèn)知需要一個(gè)過程,造成業(yè)務(wù)領(lǐng)域無法明確提出應(yīng)用需求,大數(shù)據(jù)應(yīng)用難以深入。
(4)專業(yè)數(shù)據(jù)管理人員短缺,數(shù)據(jù)管理人才培養(yǎng)困難。當(dāng)前數(shù)據(jù)管理與大數(shù)據(jù)應(yīng)用學(xué)說百家爭(zhēng)鳴、百花齊放,學(xué)說理論層出不窮,但經(jīng)過實(shí)踐檢驗(yàn)的用于電力生產(chǎn)的卻少之又少,缺乏有關(guān)數(shù)據(jù)管理與應(yīng)用的服務(wù)、培訓(xùn)、人才。
通過核電內(nèi)部業(yè)務(wù)部門訪談,數(shù)據(jù)應(yīng)用需求及要求主要包括:
(1)主數(shù)據(jù)質(zhì)量應(yīng)能充分滿足應(yīng)用系統(tǒng)基本業(yè)務(wù)功能的實(shí)現(xiàn)。
(2)主數(shù)據(jù)間能夠相互關(guān)聯(lián)調(diào)用,能夠有效支持業(yè)務(wù)功能互聯(lián)貫通。
(3)在應(yīng)用系統(tǒng)上完成的業(yè)務(wù)活動(dòng)能夠得到規(guī)范的數(shù)據(jù)選擇應(yīng)用,既減少人工錄入量,也減少歧義產(chǎn)生,規(guī)避風(fēng)險(xiǎn),提高工作效率。
(4)在應(yīng)用系統(tǒng)上做業(yè)務(wù)活動(dòng)分析總結(jié)時(shí),有規(guī)范的風(fēng)險(xiǎn)防控及問題解決措施數(shù)據(jù),既可輔助決策,也減少人工錄入量,提高效率。
(5)通過大數(shù)據(jù)應(yīng)用技術(shù)手段發(fā)現(xiàn)問題、預(yù)測(cè)趨勢(shì),實(shí)現(xiàn)利用數(shù)據(jù)對(duì)事件進(jìn)行狀態(tài)監(jiān)測(cè)、趨勢(shì)分析、診斷與預(yù)測(cè)。
(6)簡(jiǎn)單便捷的獲取業(yè)務(wù)工作中需要且直觀可視化的數(shù)據(jù)統(tǒng)計(jì)與報(bào)表,能夠在三維模型中實(shí)現(xiàn)數(shù)據(jù)可視化。
總體思路:基于數(shù)字化與智能化核電建設(shè)目標(biāo),立足于公司業(yè)務(wù)管控能力的提升,按照基礎(chǔ)數(shù)據(jù)治理與管理和頂層智能應(yīng)用兼顧協(xié)同發(fā)展的原則,實(shí)現(xiàn)數(shù)據(jù)分析與利用,并可視化展示數(shù)據(jù)價(jià)值。
實(shí)施路線為:數(shù)據(jù)資源的獲取與積累—數(shù)據(jù)資源的治理與管理—數(shù)據(jù)價(jià)值分析與利用—數(shù)據(jù)價(jià)值可視化,從而實(shí)現(xiàn)公司信息化建設(shè)按照電子化—數(shù)字化—智能化等階段路線穩(wěn)步推進(jìn)。
大數(shù)據(jù)應(yīng)用平臺(tái)的建設(shè)是基礎(chǔ)技術(shù)條件,通過構(gòu)建集采集、存儲(chǔ)、管控、監(jiān)控能力為一體的大數(shù)據(jù)應(yīng)用平臺(tái),實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)管理、質(zhì)量管理、安全管理、架構(gòu)管理等方面全方位管控,提高數(shù)據(jù)綜合利用效率,打通數(shù)據(jù)壁壘,實(shí)現(xiàn)與提升大數(shù)據(jù)的分析與預(yù)測(cè)能力。平臺(tái)也將對(duì)在各個(gè)業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)整合、清洗,有助于企業(yè)整體數(shù)據(jù)質(zhì)量的改善,提高的數(shù)據(jù)的實(shí)用性。
數(shù)據(jù)資源是大數(shù)據(jù)應(yīng)用的基礎(chǔ)要素與前提條件,要進(jìn)一步推進(jìn)信息系統(tǒng)對(duì)業(yè)務(wù)覆蓋度,多渠道全流程采集、獲取與積累全要素?cái)?shù)據(jù)資源,為進(jìn)一步的應(yīng)用積累數(shù)據(jù)資源。
主要包括主數(shù)據(jù)質(zhì)量持續(xù)改進(jìn)、主數(shù)據(jù)關(guān)聯(lián)關(guān)系搭建與數(shù)字資源整合、業(yè)務(wù)數(shù)據(jù)標(biāo)準(zhǔn)化。
(1)持續(xù)改進(jìn)主數(shù)據(jù)質(zhì)量,支持業(yè)務(wù)活動(dòng)開展與系統(tǒng)運(yùn)行。
(2)搭建主數(shù)據(jù)結(jié)構(gòu)關(guān)系,整合數(shù)據(jù)資源,支持業(yè)務(wù)貫通。
(3)標(biāo)準(zhǔn)化業(yè)務(wù)數(shù)據(jù),為數(shù)據(jù)建模積累規(guī)范數(shù)據(jù)。
數(shù)據(jù)模型是大數(shù)據(jù)應(yīng)用的基礎(chǔ),是實(shí)現(xiàn)預(yù)測(cè)與分析的必要條件。依據(jù)業(yè)務(wù)大數(shù)據(jù)應(yīng)用需求與方向,分領(lǐng)域按功能在標(biāo)準(zhǔn)化數(shù)據(jù)基礎(chǔ)上逐步建立與豐富數(shù)據(jù)模型,并持續(xù)維護(hù)、優(yōu)化與完善,實(shí)現(xiàn)與提高計(jì)算、診斷、分析與預(yù)測(cè)能力,主動(dòng)提供決策支持,數(shù)據(jù)驅(qū)動(dòng)管理創(chuàng)新。
實(shí)現(xiàn)數(shù)據(jù)可視化能夠有效提高用戶對(duì)數(shù)據(jù)感知體驗(yàn),也是實(shí)現(xiàn)數(shù)據(jù)價(jià)值的重要體現(xiàn)與途徑。通過便捷而直觀展現(xiàn)數(shù)據(jù)分析結(jié)果,顯性展示數(shù)據(jù)價(jià)值,支持大數(shù)據(jù)應(yīng)用個(gè)性化信息展示,能夠?yàn)橛脩籼峁└行У臄?shù)據(jù)洞察手段,更直觀地的表達(dá)數(shù)據(jù)的意義與價(jià)值。
大數(shù)據(jù)應(yīng)用的實(shí)現(xiàn)依賴于技術(shù)平臺(tái),實(shí)現(xiàn)公司高速接入和采集終端生成的各類數(shù)據(jù)、海量結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)與管理、高效處理與分析各類數(shù)據(jù)、構(gòu)建數(shù)據(jù)共享中心等需求。打通數(shù)據(jù)采集、集成、共享、發(fā)現(xiàn)、驗(yàn)證與應(yīng)用等各個(gè)環(huán)節(jié),為大數(shù)據(jù)應(yīng)用奠定技術(shù)基礎(chǔ)。
根據(jù)規(guī)劃推動(dòng)了一批大數(shù)據(jù)應(yīng)用,通過統(tǒng)計(jì)、計(jì)算與分析,以數(shù)據(jù)為驅(qū)動(dòng)改善原有管理模式,通過增值數(shù)據(jù)價(jià)值提升管理水平。
應(yīng)用場(chǎng)景介紹:在核電企業(yè),信函是指在項(xiàng)目建設(shè)和運(yùn)營(yíng)中與其他單位來往用于商洽、詢問、答復(fù)、請(qǐng)求和報(bào)送等活動(dòng)中形成的文件。具有數(shù)量大、內(nèi)容雜、時(shí)效強(qiáng)等特點(diǎn)。傳統(tǒng)人工分發(fā)方式,對(duì)分發(fā)負(fù)責(zé)人知識(shí)和技能要求較高,分發(fā)工作量大、效率低、易出錯(cuò)。
解決方案:為了解決核電信函分發(fā)存在的上述問題,設(shè)計(jì)開發(fā)智能分發(fā)功能,第一匹配來源采用固定性分發(fā)規(guī)則,輔助建議采用機(jī)器學(xué)習(xí)。系統(tǒng)采用自然語言處理技術(shù)進(jìn)行語義分析,將函件的標(biāo)題和內(nèi)容進(jìn)行分詞。在特征匹配階段,由系統(tǒng)根據(jù)分詞結(jié)果,與分發(fā)矩陣進(jìn)行匹配,將信函自動(dòng)分發(fā)出去。如果不能找到規(guī)則匹配,采用機(jī)器學(xué)習(xí)依據(jù)歷史分發(fā)記錄計(jì)算給出分發(fā)建議,人工確認(rèn)。無論何種分發(fā)結(jié)果最終都會(huì)記錄到信函庫中,成為機(jī)器學(xué)習(xí)的訓(xùn)練集。
應(yīng)用成效:系統(tǒng)應(yīng)用后,近80%的核電信函可以智能化批分,其中50%可以實(shí)現(xiàn)分發(fā)規(guī)則唯一確定匹配,即全自動(dòng)批分,機(jī)器學(xué)習(xí)推薦的正確率達(dá)到75%。每年預(yù)計(jì)節(jié)超過2 000個(gè)工時(shí),人員節(jié)省40%,效率、準(zhǔn)確性、規(guī)范性大幅提高。
應(yīng)用場(chǎng)景介紹:設(shè)備是核電企業(yè)的重要核心資產(chǎn),對(duì)設(shè)備進(jìn)行管理從而提升設(shè)備的運(yùn)作效率對(duì)于核電企業(yè)安全高效發(fā)展有重要意義。目前,核電設(shè)備管理相關(guān)的信息系統(tǒng)在不同時(shí)期建設(shè),缺乏一個(gè)統(tǒng)一、高效、上下游貫通的管理平臺(tái),不能完整、實(shí)時(shí)進(jìn)行信息展示。
解決方案:業(yè)務(wù)上對(duì)設(shè)備采用簡(jiǎn)化的RCM(SRCM)進(jìn)行分析,利用設(shè)備FEMA和FTA分析數(shù)據(jù),并利用數(shù)學(xué)模型進(jìn)行輔助分析,減少分析工作量,提升維修決策效率。技術(shù)上,平臺(tái)數(shù)據(jù)ETL使用KETTLE工具,從多種不同數(shù)據(jù)源抽取原始數(shù)據(jù),同時(shí)在數(shù)據(jù)流動(dòng)過程中利用KETTLE的各種工具二次加工處理數(shù)據(jù),最后將分析數(shù)據(jù)存儲(chǔ)到大數(shù)據(jù)存儲(chǔ)平臺(tái)。前端基于Echarts的展示開發(fā)提升展示效果和用戶友好度。不同組件之間通過控制器實(shí)現(xiàn)動(dòng)態(tài)的多重條件查詢,也可設(shè)置動(dòng)態(tài)數(shù)據(jù)聯(lián)動(dòng)功能,支持基于分析維度的下鉆。
應(yīng)用成效:系統(tǒng)上線后,CC1管理簡(jiǎn)報(bào)有效提升設(shè)備管理人員的工作效率,無須再登錄多個(gè)業(yè)務(wù)系統(tǒng),由系統(tǒng)自動(dòng)推送相關(guān)信息,同時(shí)解決歷史跟蹤缺陷需要從郵件與歷史文檔中搜索多處查找的問題,如圖4所示。CC1設(shè)備績(jī)效指標(biāo)功能,可以直觀展示商運(yùn)機(jī)組績(jī)效指標(biāo),及時(shí)發(fā)現(xiàn)設(shè)備管理短板,助力CC1設(shè)備管理提升。實(shí)現(xiàn)關(guān)鍵敏感設(shè)備缺陷故障的動(dòng)態(tài)跟蹤管理,統(tǒng)一存儲(chǔ)設(shè)備的全生命周期數(shù)據(jù);建立設(shè)備數(shù)據(jù)績(jī)效管理指標(biāo)體系,從多個(gè)評(píng)估維度對(duì)指標(biāo)體系進(jìn)行打分評(píng)價(jià),形成一站式的設(shè)備績(jī)效數(shù)據(jù)看板。
圖4 CC1管理簡(jiǎn)報(bào)
大數(shù)據(jù)應(yīng)用是一個(gè)長(zhǎng)期的循序漸進(jìn)的過程,既要堅(jiān)持總體規(guī)劃,又要促進(jìn)IT和業(yè)務(wù)不斷融合聯(lián)合創(chuàng)新,既要充滿信心持續(xù)推進(jìn),又要清醒地認(rèn)識(shí)到大數(shù)據(jù)應(yīng)用不能跨越信息化的建設(shè)階段,堅(jiān)定不移的推進(jìn)信息化建設(shè)數(shù)字化轉(zhuǎn)型。