王奎清
(淮陰工學(xué)院計算機(jī)與軟件工程學(xué)院,江蘇淮安 223003)
近年來鹽化工產(chǎn)業(yè)突飛猛進(jìn),我國已成為全球重要的鹽化工生產(chǎn)大國。隨著我國實(shí)施的新能源戰(zhàn)略和大力發(fā)展循環(huán)經(jīng)濟(jì)的政策,提倡綠色化工和低碳生活,鹽化工產(chǎn)業(yè)也將步入一個新的調(diào)整和發(fā)展期。課題以江蘇井神4號生產(chǎn)線的控制系統(tǒng)(DCS)和人工采集的日常實(shí)踐數(shù)據(jù)為研究數(shù)據(jù)來源。通過實(shí)際調(diào)研得知該生產(chǎn)線真空蒸發(fā)制鹽產(chǎn)工藝流程是通過采集原鹵進(jìn)行蒸發(fā)、結(jié)晶、洗滌最終獲取氯化鈉和一定濃度的制鹽母液。固液比是影響鹽的質(zhì)量關(guān)鍵要素,蒸發(fā)罐中固液比達(dá)標(biāo)才可下料進(jìn)入干燥床烘干包裝。影響固液比的因素很多,如蒸發(fā)罐溫度和壓力、循環(huán)泵電流和鹽腿實(shí)際值排出量等。怎樣更加準(zhǔn)確地預(yù)測鹽鹵在液蒸發(fā)罐中固液比的變化,對提高其生產(chǎn)線產(chǎn)量與質(zhì)量從而提高企業(yè)效益有重要作用。
當(dāng)前,在鹽化工生產(chǎn)中固液比預(yù)測方面主流的預(yù)測法為定量預(yù)測法,主要分為兩類:時間序列分析預(yù)測法、因果分析預(yù)測法。時間序列分析預(yù)測法如支持向量機(jī)與指數(shù)平滑法等,靳培飛和周莉等人[1]綜合考慮支持向量機(jī)在檢測行人時表現(xiàn)出的特點(diǎn),提出一種基于支持向量機(jī)提取感興趣區(qū)域的行人檢測算法。利用支持向量機(jī)對圖像進(jìn)行初檢并提取出置信度較高的檢測框,先后在水平和豎直方向統(tǒng)計這些檢測框的置信度疊加并根據(jù)統(tǒng)計結(jié)果提取出行人感興趣區(qū)域,在提取的感興趣區(qū)域內(nèi)進(jìn)行行人的檢測[1]。該類方法主要根據(jù)上期歷史數(shù)據(jù)的固液比實(shí)際數(shù)來預(yù)測當(dāng)前節(jié)點(diǎn)的固液比,由于只考慮時間因素不考慮外界因素(當(dāng)生產(chǎn)線突然斷電、機(jī)器調(diào)試、人為干擾和天氣溫濕度等)對預(yù)測對象的影響,所以有時預(yù)測結(jié)果偏差很大。因果預(yù)測分析法如神經(jīng)網(wǎng)絡(luò)、如多元回歸分析法和神經(jīng)網(wǎng)絡(luò)。謝家智和車四方等人[2]考慮到地震災(zāi)害損失的評估和預(yù)測是地震風(fēng)險管理的重要環(huán)節(jié)。利用隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)(NNRW)對我國地震災(zāi)害直接經(jīng)濟(jì)損失進(jìn)行了評估和預(yù)測,并將其與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行了比較。研究結(jié)果表明,在訓(xùn)練時間、訓(xùn)練精度和預(yù)測精度上隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)都優(yōu)于BP神經(jīng)網(wǎng)絡(luò),并且隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)不易發(fā)生過擬合現(xiàn)象。因此,隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)為地震災(zāi)害直接經(jīng)濟(jì)損失的快速而精準(zhǔn)評估和預(yù)測提供了一種新方法[2]。此類分析預(yù)測方法通過系統(tǒng)分析鹽化工生產(chǎn)線各節(jié)點(diǎn),揭示因果關(guān)系和相互作用,從而預(yù)測固液比的走勢。時間序列分析法需求對鹽化工生產(chǎn)線各節(jié)點(diǎn)有完整的歷史數(shù)據(jù)(如蒸發(fā)罐固液比、蒸汽壓力、蒸汽溫度、循環(huán)泵電流和鹽腿實(shí)際值排出量),因果分析預(yù)測法則需要分析綜合各個影響因素,都不適合某一特定時刻的對蒸發(fā)罐內(nèi)固液比預(yù)測。
貝葉斯網(wǎng)絡(luò)優(yōu)點(diǎn)在于處理事件之間不確定關(guān)系且有因果關(guān)系的問題。2018年李寒霜和趙忠蓋等人發(fā)現(xiàn)實(shí)際工業(yè)生產(chǎn)過程存在各種干擾因素,會導(dǎo)致被建模系統(tǒng)呈現(xiàn)隨機(jī)性及模型參數(shù)的不確定性。該算法首先給定參數(shù)相應(yīng)的先驗分布,通過最大化目標(biāo)函數(shù)的下界,從而估計得到參數(shù)的后驗分布。不僅可實(shí)現(xiàn)對參數(shù)的點(diǎn)估計,同時可以量化了估計值的不確定性[3]。佘玉軒等人[4]發(fā)現(xiàn)目前的多數(shù)故事線挖掘研究側(cè)重新聞文獻(xiàn)和事件的相似性分析,忽略了故事線的結(jié)構(gòu)化表述及新聞具有的延時性,無法直觀地從模型結(jié)果看出不同新聞話題的發(fā)展過程。為此,提出一種基于貝葉斯網(wǎng)絡(luò)的無監(jiān)督故事線挖掘算法。將故事線看成日期、時間、機(jī)構(gòu)、人物、地點(diǎn)、主題和關(guān)鍵詞的聯(lián)合概率分布,并考慮新聞時效性。在多個新聞數(shù)據(jù)集上進(jìn)行的實(shí)驗和評估結(jié)果表明,與K-means、LSA等算法相比,該算法模型具有較高的故事線挖掘能力[4]。以江蘇井神鹽化股份有限公司4號生產(chǎn)線蒸發(fā)罐固液比預(yù)測為研究對象,再經(jīng)過系統(tǒng)分析影響罐內(nèi)固液比因數(shù)的基礎(chǔ)上,描述鹽化工生產(chǎn)中固液比預(yù)測的貝葉斯網(wǎng)絡(luò)建模過程,結(jié)合調(diào)研過程中收集的數(shù)據(jù)利用pycharm結(jié)合scikit-learn 建模,將貝葉斯網(wǎng)絡(luò)、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)三種預(yù)測模型進(jìn)行實(shí)驗對比。
鹽化工生產(chǎn)中固液比預(yù)測貝葉斯模型構(gòu)建包括分析涉及相關(guān)變量因素,模型推理。從該企業(yè)獲得的生產(chǎn)實(shí)踐數(shù)據(jù)進(jìn)行清洗,在此過程中指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識別的錯誤,包括檢查數(shù)據(jù)一致性,處理無效值和缺失值等。由于這些數(shù)據(jù)從多個業(yè)務(wù)系統(tǒng)中抽取而來而且包含歷史數(shù)據(jù),這樣就避免不了有的數(shù)據(jù)是錯誤數(shù)據(jù),有的數(shù)據(jù)相互之間有沖突,這些錯誤的或有沖突的數(shù)據(jù)視為“臟數(shù)據(jù)”。再經(jīng)過屬性分析即從眾多屬性中理解各參數(shù)的含義以及其功能,從中挑選對固液比影響可控的關(guān)鍵參數(shù)進(jìn)行分析研究之間的聯(lián)系研究其分布狀況。利用對樣本的數(shù)據(jù)集訓(xùn)練,調(diào)整相關(guān)參數(shù),確定影響蒸發(fā)罐中固液比參數(shù)之間的條件獨(dú)立關(guān)系。研究路線見圖1。
圖1 研究路線圖Fig.1 Roadmap of research
模型搭建:(1)確立在貝葉斯網(wǎng)絡(luò)預(yù)測模型中影響因素。假設(shè)t時刻下的生產(chǎn)線蒸發(fā)罐中固液比(控制變量)與t-1、t-2和t-3時刻的蒸發(fā)罐中固液比(條件變量)有關(guān)聯(lián)。為了分析其他因素對當(dāng)前固液比是否有影響,同時考慮在t時刻下蒸發(fā)罐固液比(gybt)與對應(yīng)的t時刻蒸汽壓力(pet)、溫度(tet)、循環(huán)泵電流(mpt)和鹽腿實(shí)際值排出量(fict)之間的關(guān)聯(lián)性。
(2)算法訓(xùn)練和網(wǎng)絡(luò)構(gòu)建。建立一個控制變量和7個條件變量建立條件概率如公式(1)。假設(shè)存在某子集∏i?{ptt,tet,mpt,fict,gybt-1,gybt-2,gybt-3}使gybt與{ptt,tet,mpt,fict,gybt-1,gybt-2,gybt-3}是條件獨(dú)立的,對于任何x都有f(gybt|ptt,tet,mpt,fict,gybt-1,gybt-2,gybt-3)。
(1)
(3)模型推測。在相關(guān)條件因素處于離散狀態(tài)下,相關(guān)因素各個狀態(tài)都需要一個圖譜分布(圖2~圖4)。通過確立的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行推測,通過系統(tǒng)分析,結(jié)合調(diào)研實(shí)際最后進(jìn)行條件概率估計(圖5)。
圖2 蒸汽溫度分布圖Fig.2 Distribution map of steam temperature
圖3 蒸汽罐電流分布圖Fig.3 Distribution map of steam tank current
圖4 蒸汽壓力分布圖Fig.4 Distribution map of steam pressure
圖5 固液比Fig.5 Solid-liquid ratio
以江蘇井神鹽化股份有限公司4號生產(chǎn)線蒸發(fā)罐固液比預(yù)測為研究對象,利用pycharm結(jié)合scikit-learn 建模。如表1通過三種模型進(jìn)行對比三種模型的平均絕對差、平均平方差和方均根差。發(fā)現(xiàn)基于貝葉斯網(wǎng)絡(luò)建立的固液比預(yù)測模型效果最佳,橫型性能對比圖見圖6。
表1 模型回歸預(yù)測評估Tab.1 Regression prediction and evaluation of model
圖6 模型性能對比圖Fig.6 Contrast diagram of model performance
通過pycharm軟件結(jié)合scikit-learn分別利用貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)建模對鹽化工生產(chǎn)線的固液比進(jìn)行預(yù)測對比,發(fā)現(xiàn)貝葉斯網(wǎng)絡(luò)模型更適合對該企業(yè)鹽化工生產(chǎn)線固液比的預(yù)測。