侯士超(昆侖數(shù)智科技有限責(zé)任公司,北京 102206)
在大數(shù)據(jù)時(shí)代背景中,數(shù)字化正在改變著流程工業(yè)對(duì)業(yè)務(wù)和技術(shù)的傳統(tǒng)認(rèn)知,數(shù)據(jù)即資產(chǎn)。基于大數(shù)據(jù)在工業(yè)裝置上的應(yīng)用是石化企業(yè)未來(lái)生存和發(fā)展的根基,一切生產(chǎn)活動(dòng)都將依賴于數(shù)據(jù)應(yīng)用和服務(wù)。未來(lái)誰(shuí)能做到“有據(jù)可依”“智能分析”,掌握“數(shù)據(jù)變現(xiàn)”,才能真正實(shí)現(xiàn)工業(yè)應(yīng)用的智能分析?;跀?shù)據(jù)的智慧分析應(yīng)用將是發(fā)展實(shí)現(xiàn)“數(shù)據(jù)變現(xiàn)”的有力手段。
利用不同的大數(shù)據(jù)分析方法,應(yīng)用到實(shí)際生產(chǎn)中去,通過(guò)數(shù)據(jù)挖掘與探索分析,發(fā)現(xiàn)數(shù)據(jù)特征及規(guī)律,作為數(shù)據(jù)建模輸入的依據(jù)。常見(jiàn)的數(shù)據(jù)特征分析方法有數(shù)據(jù)特征描述、相關(guān)性分析、主成分分析等。數(shù)據(jù)首先要轉(zhuǎn)換成適合于挖掘的形式,即統(tǒng)一數(shù)據(jù)的量綱及數(shù)量級(jí),稱為數(shù)據(jù)標(biāo)準(zhǔn)化。常用的方法有數(shù)據(jù)泛化、標(biāo)準(zhǔn)化、屬性構(gòu)造等。
數(shù)據(jù)轉(zhuǎn)換主要包括以下幾種方法:
(1)基期標(biāo)準(zhǔn)化法
選擇數(shù)據(jù)系列的第一個(gè)時(shí)期作為參照,各期標(biāo)準(zhǔn)化數(shù)據(jù)=各期數(shù)據(jù)/基期數(shù)據(jù)。
(2)直線法
①極值法:
②z-score法:
(3)折線法
(4)曲線法
①Log函數(shù)法:x′=log(xi)/log(max(xi));
②Arctan函數(shù)法:x′=arctan(xi)×2/π。
綜上所述,在起搏器間歇性感知功能字符異常的臨床診斷中采用動(dòng)態(tài)心電圖檢測(cè)展示良好效果,存在比較高的檢出幾率,檢出準(zhǔn)確性比較好。
通過(guò)以上幾種方法進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化轉(zhuǎn)換,實(shí)現(xiàn)數(shù)據(jù)分析的基礎(chǔ)。下一步進(jìn)行數(shù)據(jù)分析,建立分析模型,形成解決工業(yè)裝置實(shí)際問(wèn)題的方案,在分析中主要有以下幾種方法:
(1)回歸分析(趨勢(shì)研判)
進(jìn)行回歸分析之前有兩個(gè)準(zhǔn)備工作,第一確定變量的數(shù)量。第二確定自變量和因變量。只有一個(gè)變量X與因變量Y有關(guān),使用一元回歸;分析多個(gè)變量與因變量Y的關(guān)系,使用多元回歸。
(2)聚類分析(發(fā)生概率)
K-Means聚類算法。主要思想是:首先將各個(gè)聚類子集內(nèi)的所有數(shù)據(jù)樣本的均值作為該聚類的代表點(diǎn),然后把每個(gè)數(shù)據(jù)點(diǎn)劃分到最近的類別中,使得評(píng)價(jià)聚類性能的準(zhǔn)則函數(shù)達(dá)到最優(yōu),從而使同一個(gè)類中的對(duì)象相似度較高,而不同類之間的對(duì)象的相似度較小[1]。
(3) EM算法(關(guān)聯(lián)關(guān)系)
通過(guò)EM算法建立關(guān)鍵性參數(shù)與大量操作數(shù)據(jù)、原料性質(zhì)數(shù)據(jù)、裝置數(shù)據(jù)等工業(yè)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系網(wǎng)。最大期望算法經(jīng)過(guò)兩個(gè)步驟交替進(jìn)行計(jì)算,第一步是計(jì)算期望(E);第二步是最大化(M)。M步上找到的參數(shù)估計(jì)值被用于下一個(gè)E步計(jì)算中,這個(gè)過(guò)程不斷交替進(jìn)行,也就是迭代使用EM步驟,直至收斂。
本文通過(guò)嘗試,各方法都有缺點(diǎn),在方法選擇中根據(jù)數(shù)據(jù)特征確定分析方法,如:聚類分析、關(guān)聯(lián)分析等常用直線法;而綜合評(píng)價(jià)則折線和曲線方法用得較多。
在分析方法的選擇上,本文主要用到的算法如表1所示。
表1 大數(shù)據(jù)分析算法
催化裂化裝置作為煉油廠生產(chǎn)汽、柴油的主要裝置,其加工工藝最復(fù)雜、操作控制難度大,在各類主裝置非計(jì)劃停工中占比最高[2]。目前,大部分煉化企業(yè)裝置運(yùn)行周期只有3年,裝置運(yùn)行周期還有很大的提升空間。在大多數(shù)煉廠中,催化裝置主要存在以下三個(gè)問(wèn)題:一是報(bào)警占比高,運(yùn)行不平穩(wěn)等;二是催化裝置非計(jì)劃停工占停工總數(shù)的大部分,其中結(jié)焦是主要原因,結(jié)焦問(wèn)題表現(xiàn)在結(jié)焦量難以預(yù)測(cè);三是運(yùn)行工況的不同造成汽油收率高低差異較大[3]。因此,催化裂化裝置生產(chǎn)中出現(xiàn)的問(wèn)題需要重點(diǎn)解決。本文是基于海量的運(yùn)行數(shù)據(jù)和分析化驗(yàn)數(shù)據(jù),通過(guò)對(duì)催化裂化裝置進(jìn)行大數(shù)據(jù)分析研究,嘗試對(duì)報(bào)警、結(jié)焦和收率建立算法模型,提出提高裝置運(yùn)行的“安穩(wěn)長(zhǎng)滿優(yōu)”、優(yōu)化產(chǎn)品結(jié)構(gòu)、提升裝置經(jīng)濟(jì)效益的建議方案。
造成非計(jì)劃停車經(jīng)過(guò)統(tǒng)計(jì),催化裝置報(bào)警占比高,運(yùn)行不平穩(wěn)。通過(guò)大數(shù)據(jù)分析得到的關(guān)鍵報(bào)警位點(diǎn)的根原因,與專家經(jīng)驗(yàn)分析的結(jié)果存在很大程度的重合性,表明大數(shù)據(jù)分析結(jié)果可信度高。發(fā)現(xiàn)新的報(bào)警根原因,以再生滑閥壓降為例,如圖1所示,利用大數(shù)據(jù)分析發(fā)現(xiàn)了其根原因“待生斜管滑閥閥位”。經(jīng)過(guò)工業(yè)驗(yàn)證,證明待生斜管滑閥閥位對(duì)再生滑閥壓降存在反向影響,分析結(jié)果正確,這是僅憑以往經(jīng)驗(yàn)發(fā)現(xiàn)不了的。
圖1 大數(shù)據(jù)報(bào)警原因分析
通過(guò)分析挖掘催化裂化裝置報(bào)警規(guī)律,基于大量歷史數(shù)據(jù)計(jì)算各位點(diǎn)間的相關(guān)性,形成因果鏈路圖,暴露引發(fā)報(bào)警的源頭,進(jìn)行重點(diǎn)監(jiān)測(cè)和控制,以因果鏈路知識(shí)庫(kù)為基礎(chǔ),建立預(yù)警模型,形成對(duì)關(guān)鍵報(bào)警位點(diǎn)的預(yù)警機(jī)制,以輔助操作人員及時(shí)做出判斷和調(diào)整。從實(shí)際案例分析,如圖2所示,曲線為過(guò)程數(shù)據(jù),黑粗線為預(yù)測(cè)值,生產(chǎn)過(guò)程中利用大數(shù)據(jù)分析建立預(yù)警算法,在報(bào)警發(fā)生前提前預(yù)警,預(yù)警模型判斷2 min后“二再密相溫度”將出現(xiàn)報(bào)警,預(yù)警發(fā)出時(shí),技術(shù)人員可以收到反饋,及時(shí)采取工藝調(diào)整等措施,為裝置非停爭(zhēng)取到寶貴時(shí)間。
圖2 大數(shù)據(jù)報(bào)警預(yù)測(cè)
基于大數(shù)據(jù)分析回歸方法,建設(shè)生焦率的預(yù)測(cè)模型,采集有效樣本數(shù)萬(wàn)組,測(cè)算了催化長(zhǎng)時(shí)間的結(jié)焦量,并進(jìn)行了現(xiàn)場(chǎng)的工業(yè)驗(yàn)證。模型的預(yù)測(cè)值較為準(zhǔn)確,解決了結(jié)焦這個(gè)不可測(cè)變量的定量化問(wèn)題。每天估算沉降器內(nèi)的結(jié)焦總量,為操作提供參考,為催化裝置的長(zhǎng)周期運(yùn)行提供支持。如圖3所示,每天估算沉降器中關(guān)鍵部位的結(jié)焦量。
圖3 結(jié)焦累計(jì)分析
依據(jù)相關(guān)性分析篩選出來(lái)的影響因素,從大量生產(chǎn)數(shù)據(jù)中分析對(duì)汽油收率影響較大的工藝因素。如圖4所示,結(jié)合裝置現(xiàn)場(chǎng)條件確定可調(diào)操作變量,并以汽油收率最大化為目標(biāo)尋優(yōu)可調(diào)操作變量。建立大數(shù)據(jù)分析模型,采用神經(jīng)網(wǎng)絡(luò)技術(shù)建立的汽油收率模型,從而實(shí)現(xiàn)實(shí)時(shí)提供汽油收率最大化的生產(chǎn)操作方案。
圖4 汽油收率最大優(yōu)化方案
隨著本次大數(shù)據(jù)應(yīng)用的研究,可以得出:通過(guò)大數(shù)據(jù)分析報(bào)警應(yīng)用,可有效減少裝置報(bào)警次數(shù),提高裝置平穩(wěn)運(yùn)行率;通過(guò)本次研究可以有效減少報(bào)警次數(shù)50%以上;通過(guò)對(duì)催化裝置結(jié)焦大數(shù)據(jù)分析應(yīng)用,有效延緩裝置結(jié)焦,提高裝置運(yùn)行周期,實(shí)現(xiàn)催化裝置結(jié)焦?fàn)顩r的即時(shí)評(píng)估,減少催化裝置因結(jié)焦造成的非計(jì)劃停工次數(shù);通過(guò)裝置汽油收率研究,有效提高催化裝置目的產(chǎn)品收率,催化裝置汽油收率提升1個(gè)百分點(diǎn)左右。
對(duì)于煉化企業(yè)來(lái)說(shuō),以真實(shí)的運(yùn)行數(shù)據(jù)預(yù)測(cè)未來(lái)趨勢(shì),以便做出正確的生產(chǎn)或經(jīng)營(yíng)決策,如何對(duì)生產(chǎn)運(yùn)行安全性預(yù)測(cè)預(yù)警落實(shí)到裝置粒度等,生產(chǎn)及經(jīng)營(yíng)數(shù)據(jù)如何有效關(guān)聯(lián)和挖掘,提升認(rèn)知,深化應(yīng)用,成為企業(yè)迫切需求。因此,對(duì)數(shù)據(jù)的分析方向在流程工業(yè)的應(yīng)用,應(yīng)該以信息化和智能化手段,通過(guò)大數(shù)據(jù)分析技術(shù),從統(tǒng)計(jì)分析向預(yù)測(cè)分析轉(zhuǎn)變,從被動(dòng)分析向主動(dòng)分析轉(zhuǎn)變,真正解決企業(yè)業(yè)務(wù)痛點(diǎn),為企業(yè)創(chuàng)造經(jīng)濟(jì)效益。