王金策,馮文奐
(山西能源學(xué)院,晉中030600)
能源行業(yè)包括石油、天然氣、太陽能、電池制造、節(jié)電器等行業(yè),傳統(tǒng)能源的產(chǎn)銷形式過于單一,例如石油,開采-統(tǒng)銷或自銷,銷售推廣模式采用訂單式、零售市場(chǎng)等被動(dòng)形式,難以捕捉市場(chǎng)信息。能源網(wǎng)絡(luò)作為復(fù)雜系統(tǒng)存在較大慣性,具有很強(qiáng)的路徑鎖定性,因此戴家權(quán)等人[1]對(duì)長(zhǎng)期能源戰(zhàn)略的思考及戰(zhàn)略的制定給出了數(shù)據(jù)化的參考,助力國(guó)家能源系統(tǒng)的健康發(fā)展。尤其強(qiáng)調(diào)了探索能源發(fā)展規(guī)律的重要性。摸清能源發(fā)展規(guī)律的傳統(tǒng)方法通常是根據(jù)統(tǒng)計(jì)指標(biāo)做出分析決策,但是局限于數(shù)據(jù)處理類型單一,例如上海市能源經(jīng)濟(jì)相關(guān)信息[4],各個(gè)行業(yè)的增長(zhǎng)率、萬元產(chǎn)值能耗等經(jīng)濟(jì)指標(biāo),數(shù)據(jù)清晰明確,但只是靜態(tài)數(shù)據(jù),無法體現(xiàn)數(shù)據(jù)背后的經(jīng)濟(jì)形式、行業(yè)趨勢(shì),存在行業(yè)間數(shù)據(jù)無體現(xiàn),難以描述宏觀規(guī)律。
由于數(shù)據(jù)分析在企業(yè)決策中扮演越來越重要的作用,能源市場(chǎng)瞬息萬變,唯以常規(guī)理論決策輔以數(shù)據(jù)驅(qū)動(dòng)才有一定抗風(fēng)險(xiǎn)能力,進(jìn)而實(shí)現(xiàn)跨越式發(fā)展。大數(shù)據(jù)應(yīng)用成效已成為衡量現(xiàn)代企業(yè)國(guó)際競(jìng)爭(zhēng)力和綜合實(shí)力的重要評(píng)價(jià)標(biāo)準(zhǔn)之一[2]。在能源行業(yè)同樣不例外,近年來各大能源企業(yè)積極建立大數(shù)據(jù)平臺(tái),例如,趙少東等人[5]開發(fā)了基于異構(gòu)計(jì)算與實(shí)施可視化技術(shù)的綜合能源大數(shù)據(jù)平臺(tái),打破了“信息孤島”,實(shí)現(xiàn)了數(shù)據(jù)存儲(chǔ)。沈躍棟等人[3]利用大數(shù)據(jù)分析方法分析產(chǎn)業(yè)發(fā)展動(dòng)態(tài),通過聚合網(wǎng)絡(luò)媒體關(guān)鍵詞頻率,參照“百度搜索指數(shù)”得出結(jié)論,此類方法沒有真正利用多維度,海量的行業(yè)內(nèi)、行業(yè)間大數(shù)據(jù)。能源大數(shù)據(jù)平臺(tái)的已有應(yīng)用,重點(diǎn)在數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、靜態(tài)指標(biāo)分析等方面,對(duì)于動(dòng)態(tài)數(shù)據(jù),以及行業(yè)間數(shù)據(jù)的內(nèi)在信息傳播沒有有效利用。
基于以上介紹,傳統(tǒng)數(shù)據(jù)分析的片面性、行業(yè)間數(shù)據(jù)耦合性低等問題,在局部大數(shù)據(jù)平臺(tái)支撐下的靜態(tài)數(shù)據(jù)分析,亦無法完全體現(xiàn)大數(shù)據(jù)決策的優(yōu)勢(shì)。本文基于系統(tǒng)化的能源大數(shù)據(jù)計(jì)算平臺(tái)構(gòu)建動(dòng)態(tài)能源知識(shí)圖譜,實(shí)現(xiàn)計(jì)算能源,路線如下:
(1)構(gòu)建能源行業(yè)數(shù)據(jù)平臺(tái)、包括石油、煤炭、風(fēng)能等能源行業(yè)數(shù)據(jù)平臺(tái);
(2)構(gòu)建子行業(yè)數(shù)據(jù)知識(shí)圖譜;
(3)行業(yè)間數(shù)據(jù)耦合,探索行業(yè)間信息傳播過程;
(4)實(shí)現(xiàn)能源行業(yè)內(nèi)的可視化數(shù)據(jù)傳送平臺(tái)。
計(jì)算能源:區(qū)別于傳統(tǒng)管理方法在統(tǒng)計(jì)數(shù)據(jù)、政策導(dǎo)向、行業(yè)趨勢(shì)判斷的基礎(chǔ)上做出商業(yè)或生產(chǎn)決策,利用機(jī)器學(xué)習(xí)分析方法,依托行業(yè)內(nèi)外所有數(shù)據(jù),挖掘行業(yè)實(shí)體間內(nèi)在聯(lián)系和信息傳導(dǎo)規(guī)律,實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的管理,稱之為計(jì)算能源。
實(shí)現(xiàn)計(jì)算能源的基礎(chǔ)為數(shù)據(jù)平臺(tái)、機(jī)器學(xué)習(xí)算法。其中機(jī)器學(xué)習(xí)核心算法為體現(xiàn)復(fù)雜系統(tǒng)本質(zhì)的動(dòng)態(tài)信息傳播圖的分析,即能源知識(shí)圖譜動(dòng)態(tài)分析。
構(gòu)建能源行業(yè)大數(shù)據(jù)平臺(tái),便于統(tǒng)籌數(shù)據(jù),更大程度的大數(shù)據(jù)分析。數(shù)據(jù)平臺(tái)為了最大程度降低系統(tǒng)耦合度,根據(jù)功能分為數(shù)據(jù)采集服務(wù)、數(shù)據(jù)存儲(chǔ)服務(wù)、數(shù)據(jù)集成服務(wù)、計(jì)算服務(wù)、應(yīng)用,平臺(tái)框架如圖1。
數(shù)據(jù)采集服務(wù):數(shù)據(jù)采集模塊采用開放式接口,便于以不同方式采集不同類型數(shù)據(jù),分別為傳感器采集、生產(chǎn)系統(tǒng)數(shù)據(jù)以及新聞媒體數(shù)據(jù)、宏觀政策等其他數(shù)據(jù)。數(shù)據(jù)采集模塊封裝為服務(wù),將采集到的數(shù)據(jù)以服務(wù)形式對(duì)外提供。
數(shù)據(jù)存儲(chǔ)服務(wù):數(shù)據(jù)存儲(chǔ)模塊首先獲取數(shù)據(jù)采集服務(wù)提供的數(shù)據(jù)。為使存儲(chǔ)服務(wù)更具擴(kuò)展性,服務(wù)分為結(jié)構(gòu)化存儲(chǔ)模塊和非結(jié)構(gòu)化存儲(chǔ)模塊,結(jié)構(gòu)化數(shù)據(jù)采用分布式關(guān)系型數(shù)據(jù)庫,如Cluster MySQL,非結(jié)構(gòu)化數(shù)據(jù)采用分布式存儲(chǔ)系統(tǒng),如HDFS、MongoDB 等Key-Value 式存儲(chǔ)結(jié)構(gòu)。每個(gè)模塊分別填充垂類數(shù)據(jù),例如石油業(yè)、煤炭業(yè)等各個(gè)能源子行業(yè)數(shù)據(jù)。
數(shù)據(jù)集成服務(wù):在數(shù)據(jù)存儲(chǔ)服務(wù)的基礎(chǔ)上,構(gòu)建所有數(shù)據(jù)的索引,為多源、異構(gòu)的能源數(shù)據(jù)構(gòu)建統(tǒng)一視圖的查詢接口。
計(jì)算模塊:利用數(shù)據(jù)服務(wù)中的海量數(shù)據(jù)分析進(jìn)行數(shù)據(jù)挖掘。計(jì)算模塊內(nèi)部同樣以可擴(kuò)展性為前提,設(shè)計(jì)多個(gè)可計(jì)算單元:子行業(yè)內(nèi)知識(shí)圖譜、子行業(yè)間知識(shí)圖譜、信息傳播模式研究、能源網(wǎng)絡(luò)節(jié)點(diǎn)表示等算法模塊。
應(yīng)用:利用計(jì)算中算法為輔助決策,例如,查詢未來一段時(shí)間內(nèi)石油價(jià)格和影響價(jià)格的關(guān)鍵節(jié)點(diǎn)、價(jià)格傳導(dǎo)過程。
圖1 平臺(tái)框架圖
能源行業(yè)包括石油、天然氣、太陽能、節(jié)能設(shè)備研發(fā)等多個(gè)垂直行業(yè),每個(gè)行業(yè)包括上下游的生產(chǎn)、運(yùn)輸、銷售等環(huán)節(jié)。各個(gè)子領(lǐng)域?qū)φ麄€(gè)能源行業(yè)結(jié)構(gòu)存在潛在影響[6],同時(shí),子領(lǐng)域間存在相關(guān)性,例如天然氣價(jià)格與原油價(jià)格長(zhǎng)期正相關(guān),原油、天然氣和煤炭?jī)r(jià)格三者之間存在著長(zhǎng)期均衡關(guān)系[7]。目前海量能源數(shù)據(jù),利用率低、高冗余、低結(jié)構(gòu)化。隨著知識(shí)圖譜的發(fā)展,可以從復(fù)雜海量數(shù)據(jù)中抽取具有語義關(guān)系的有機(jī)圖,進(jìn)而為上層應(yīng)用提供數(shù)據(jù)支持。因此,實(shí)現(xiàn)計(jì)算能源的第一步是發(fā)現(xiàn)和構(gòu)建全行業(yè)的知識(shí)圖譜,解決數(shù)據(jù)稀疏問題的同時(shí)給出數(shù)據(jù)推斷的合理性,并以此針對(duì)特定任務(wù)建模。
圖2 煤炭生產(chǎn)關(guān)系圖譜
設(shè)定能源類行業(yè)有N 類,每一類有知識(shí)圖譜G,則有N 個(gè)知識(shí)圖譜構(gòu)成的集合:G = {Gi| 1 ≤i ≤N, G =(V;R;E)},其中V 表示圖譜中節(jié)點(diǎn)集合,E 表示邊的結(jié)合,R 表示關(guān)系的集合。設(shè)G1為煤炭領(lǐng)域的知識(shí)圖譜,根據(jù)平臺(tái)提供的煤炭領(lǐng)域數(shù)據(jù)接口獲取本體數(shù)據(jù),依托知識(shí)圖譜構(gòu)建技術(shù)[9-10]抽取實(shí)體、屬性、關(guān)系等元素,實(shí)現(xiàn)煤礦領(lǐng)域核心知識(shí)圖譜的構(gòu)建。煤炭生產(chǎn)圖譜實(shí)例,如圖2 所示。煤炭產(chǎn)量與煤炭開采技術(shù)、煤炭?jī)r(jià)格、需求等多個(gè)實(shí)體因素有關(guān),各個(gè)實(shí)體之間存在相關(guān)性,針對(duì)特殊應(yīng)用定量計(jì)算實(shí)體間高階關(guān)系。
每個(gè)子領(lǐng)域都存在類似圖2 的知識(shí)圖,構(gòu)建每個(gè)子領(lǐng)域的圖譜對(duì)指導(dǎo)生產(chǎn)有重要意義。將每個(gè)領(lǐng)域圖譜看作一個(gè)實(shí)體,則N 個(gè)G 之間存在高階關(guān)系,如圖3所示,石油價(jià)格實(shí)體屬于石油領(lǐng)域?qū)嶓w,石油價(jià)格與煤炭?jī)r(jià)格由于共有工業(yè)產(chǎn)品原料和能源屬性,存在內(nèi)生傳導(dǎo)關(guān)系。因此構(gòu)建如圖4 所示的高階知識(shí)圖譜是計(jì)算能源的一個(gè)關(guān)鍵,其中,1 ≤i,j,k ≤N,高階圖譜用GF表示。
圖3 煤炭與石油關(guān)系
圖4 GF:高階圖譜
任何行業(yè)領(lǐng)域都是隨時(shí)間動(dòng)態(tài)發(fā)展,能源行業(yè)作為一切社會(huì)活動(dòng)的基礎(chǔ)性行業(yè),其變化對(duì)社會(huì)生產(chǎn)活動(dòng)有重要指示性作用,作為能源領(lǐng)域的知識(shí)圖譜其變化是必然的,研究能源圖譜中實(shí)體變化對(duì)整個(gè)行業(yè)的影響和信息在能源圖中的傳播規(guī)律至關(guān)重要。
空域動(dòng)態(tài)性:空域動(dòng)態(tài)性表現(xiàn)在領(lǐng)域的擴(kuò)充,例如新能源的誕生,由煤炭、石油、天然氣等傳統(tǒng)能源枯竭危機(jī)下催生的太陽能、風(fēng)能、潮汐能等新能源領(lǐng)域視為空域的動(dòng)態(tài)變化,隨著時(shí)間發(fā)展傳統(tǒng)能源退出能源供應(yīng),新舊能源領(lǐng)域的交替更換,體現(xiàn)了能源知識(shí)圖譜的空域動(dòng)態(tài)性。
圖5 能源圖譜中信息傳播
本文首提計(jì)算能源概念,計(jì)算能源涵蓋能源數(shù)據(jù)平臺(tái),包含數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)等服務(wù)模塊,模塊間高度解耦合,可擴(kuò)展性強(qiáng)。在數(shù)據(jù)能源基礎(chǔ)平臺(tái)上抽取能源實(shí)體、關(guān)系、建立動(dòng)態(tài)知識(shí)圖譜,最終提供上層應(yīng)用。計(jì)算能源的本質(zhì)是人與數(shù)據(jù)驅(qū)動(dòng)相結(jié)合的管理模式、摒棄原有拍腦袋式和小樣本統(tǒng)計(jì)決策的管理,避免由于信息不對(duì)稱造成的錯(cuò)誤決策。云計(jì)算和5G 等計(jì)算通信計(jì)算技術(shù)的廣泛應(yīng)用,為數(shù)據(jù)平臺(tái)的搭建提供了軟硬件支持,海量的數(shù)據(jù)和人工智能技術(shù)的快速發(fā)展是計(jì)算能源的便利條件。實(shí)施數(shù)據(jù)驅(qū)動(dòng)提升各領(lǐng)域的生產(chǎn)效率,促進(jìn)能源與生態(tài)安全健康平衡發(fā)展,計(jì)算能源是一種有效的解決方案。