吳 杰,華 馳
(1.江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無錫 214122;2.江蘇省宜興中等專業(yè)學(xué)校 就業(yè)指導(dǎo)處,江蘇 宜興 214206;3.江蘇信息職業(yè)技術(shù)學(xué)院 物聯(lián)網(wǎng)工程系,江蘇 無錫 214122)
(1.Internet of Things Engineering College,the IOT College of Southern Yangtze University,Wuxi 214122,China;2.Department of Career Guidance,Yirshing Trade School,Yixin 214206,China;3.Department of Internet of Things Engineering College,Institute of Information Technology,Wuxi 214122,China)
基于SIS系統(tǒng)的數(shù)據(jù)采集及過程數(shù)據(jù)挖掘
吳 杰1,2,華 馳3
(1.江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無錫 214122;2.江蘇省宜興中等專業(yè)學(xué)校 就業(yè)指導(dǎo)處,江蘇 宜興 214206;3.江蘇信息職業(yè)技術(shù)學(xué)院 物聯(lián)網(wǎng)工程系,江蘇 無錫 214122)
通過對基于SIS系統(tǒng)的數(shù)據(jù)采集及工廠過程控制數(shù)據(jù)挖掘的研究,提出面向電廠SIS系統(tǒng)數(shù)據(jù)倉庫進(jìn)行數(shù)據(jù)采集以及過程控制數(shù)據(jù)挖掘的解決方案.針對生產(chǎn)過程中性能優(yōu)化、經(jīng)濟(jì)分析、故障診斷等方面的應(yīng)用,以鍋爐結(jié)焦原因?yàn)槔?,進(jìn)行分析與研究,取得了較好的效果.
SIS系統(tǒng);數(shù)據(jù)挖掘;性能優(yōu)化;故障診斷
隨著國民經(jīng)濟(jì)的發(fā)展,越來越多的趨于大容量、高參數(shù)的發(fā)電機(jī)組投入了運(yùn)行,這對電廠自動化水平提出了更高的要求;而數(shù)據(jù)挖掘技術(shù)給生產(chǎn)運(yùn)行過程中產(chǎn)生大量駁雜數(shù)據(jù)的電廠性能計算,故障診斷、經(jīng)濟(jì)分析、性能優(yōu)化方面的利用帶來了實(shí)際應(yīng)用的可能.
電廠的控制系統(tǒng)很多,如DCS系統(tǒng)(分散控制系統(tǒng))、PLC控制等;還有獨(dú)立控制的如BMS(燃燒器管理系統(tǒng))、DEH系統(tǒng)(電液控制系統(tǒng))等,如此繁多的系統(tǒng)對數(shù)據(jù)采集是個很大的挑戰(zhàn).本文研究如何將現(xiàn)場數(shù)據(jù)進(jìn)行整合,并且把整合后的數(shù)據(jù)針對生產(chǎn)過程中性能優(yōu)化、經(jīng)濟(jì)分析、故障診斷等方面的問題,提煉挖掘成有用的規(guī)則信息.
隨著信息技術(shù)和控制技術(shù)的飛速發(fā)展,電子研究學(xué)者提出一種新的電廠應(yīng)用信息系統(tǒng)——廠級監(jiān)控信息系統(tǒng)(supervisory information system,SIS)被電力研究學(xué)者提出.SIS屬于廠級生產(chǎn)過程自動化范疇,實(shí)現(xiàn)電廠管理信息系統(tǒng)與各種分散控制系統(tǒng)之間數(shù)據(jù)交換的橋梁[1].廠級實(shí)時監(jiān)控信息系統(tǒng)以分散控制系統(tǒng)為基礎(chǔ),以經(jīng)濟(jì)運(yùn)行和提高發(fā)電企業(yè)整體效益為目的,采用先進(jìn)、適用、有效的專業(yè)計算方法,實(shí)現(xiàn)整個電廠范圍內(nèi)信息共享,廠級生產(chǎn)過程的實(shí)時信息監(jiān)控和調(diào)度,同時又提高了機(jī)組運(yùn)行的可靠性.為電廠管理層的決策提供真實(shí)、可靠的實(shí)時運(yùn)行數(shù)據(jù),為市場運(yùn)作下的企業(yè)提供科學(xué)、準(zhǔn)確的經(jīng)濟(jì)性指標(biāo).
在整個SIS中,處于基礎(chǔ)和核心的子系統(tǒng)是實(shí)時數(shù)據(jù)庫,實(shí)時數(shù)據(jù)庫系統(tǒng)能用于生產(chǎn)數(shù)據(jù)的自動采集、存貯和監(jiān)控.系統(tǒng)可在線存貯每個工藝過程點(diǎn)的多年數(shù)據(jù);用戶既可瀏覽電廠當(dāng)前的生產(chǎn)情況,也可回顧過去的生產(chǎn)情況;由于電廠生產(chǎn)數(shù)據(jù)存放在統(tǒng)一的數(shù)據(jù)倉庫中,企業(yè)中的所有人無論在什么地方都可以看到和分析相同的信息.
從圖1中可以看出,SIS中的實(shí)時/歷史數(shù)據(jù)庫可以長期記錄下DCS(主系統(tǒng))、網(wǎng)控、程控、化水、除灰等系統(tǒng)運(yùn)行中的過程點(diǎn)及重要中間點(diǎn)的數(shù)據(jù).通過這種全廠范圍內(nèi)的實(shí)時數(shù)據(jù)記錄,可從全局的角度下分析問題.
數(shù)據(jù)挖掘技術(shù)是一種利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系的過程,這些關(guān)系和模型可以用來做出預(yù)測.自20世紀(jì)末提出至今,它匯集了機(jī)器學(xué)習(xí)、模式識別、數(shù)據(jù)庫、統(tǒng)計學(xué)、人工智能以及管理信息系統(tǒng)等多學(xué)科的成果.海量數(shù)據(jù)的背后往往蘊(yùn)涵著許多知識,但由于這些數(shù)據(jù)本身的多元性、動態(tài)性與交連性,又給人工分析和處理帶來困難.而數(shù)據(jù)挖掘與知識發(fā)現(xiàn)技術(shù)作為一門新興學(xué)科,有效地解決了這方面的問題,它能夠在很少人工干預(yù)情況下,處理復(fù)雜的數(shù)據(jù)信息,提取有關(guān)知識規(guī)則.
隨著信息技術(shù)的進(jìn)步及其計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,工業(yè)生產(chǎn)過程中采集的數(shù)據(jù)可以方便地被收集和存儲在各種數(shù)據(jù)庫中,采用傳統(tǒng)的數(shù)據(jù)分析方法對這些巨量的數(shù)據(jù)進(jìn)行分析不僅費(fèi)時且難以有效地挖掘出隱含的知識.另一方面,盡管專家系統(tǒng)、智能診斷等方法在生產(chǎn)過程中得到廣泛應(yīng)用,但專家系統(tǒng)的知識瓶頸和智能診斷方法所帶來的推理過程困難等問題仍未得到很好的解決,數(shù)據(jù)挖掘卻可以有效地解決這些問題,因此將數(shù)據(jù)挖掘技術(shù)應(yīng)用于生產(chǎn)過程中是必然的也是可行的.
圖1 SIS的系統(tǒng)結(jié)構(gòu)
電廠在生產(chǎn)過程中使用的數(shù)據(jù)有數(shù)據(jù)來源多、數(shù)據(jù)量大、數(shù)據(jù)種類混雜等特點(diǎn).例如主控系統(tǒng)使用的是DCS系統(tǒng),其網(wǎng)絡(luò)通訊各項(xiàng)指標(biāo):速率為100 MB/s;容量為20萬實(shí)時點(diǎn)/s;節(jié)點(diǎn)為1 000個;網(wǎng)絡(luò)拓?fù)?,雙環(huán)冗余,故障點(diǎn)環(huán)繞等.DCS系統(tǒng)產(chǎn)生海量的數(shù)據(jù)信息,這些數(shù)據(jù)信息存放在數(shù)據(jù)服務(wù)器上;而輸煤、化水等系統(tǒng)使用的是PLC控制,使得數(shù)據(jù)的采集和存儲產(chǎn)生了大量問題,如:不同公司對某個設(shè)備或控制過程點(diǎn)本體的定義描述不同;大量的數(shù)據(jù)只能在數(shù)據(jù)服務(wù)器保存幾個月就會磁盤報警;數(shù)據(jù)在數(shù)據(jù)服務(wù)器存儲的格式不同;數(shù)據(jù)只能使用同一公司的數(shù)據(jù)分析報表軟件,無法直接導(dǎo)出再處理等,制約了電廠數(shù)據(jù)倉庫的建立.
使用SIS系統(tǒng)是一個比較好的解決手段.SIS系統(tǒng)總體包括3大部分:實(shí)時數(shù)據(jù)采集,實(shí)時/歷史數(shù)據(jù)庫以及建立在數(shù)據(jù)庫基礎(chǔ)上的數(shù)據(jù)分析挖掘.
實(shí)時/歷史數(shù)據(jù)庫是整個系統(tǒng)的核心,是電廠生產(chǎn)運(yùn)行的“黑匣子”,其存儲容量和存儲效率直接關(guān)系到數(shù)據(jù)采集的范圍和精度.由于電廠生產(chǎn)過程數(shù)據(jù)海量、無序、精度要求高、帶有時標(biāo),常見的關(guān)系型數(shù)據(jù)庫不能很好地滿足要求,因此使用美國OSI Software公司的PI實(shí)時/歷史數(shù)據(jù)庫.它主要提供3種接口方式:世界多數(shù)著名DCS系統(tǒng)廠家專用接口,基于OPC標(biāo)準(zhǔn)的通用接口,基于API開發(fā)的特殊接口.大量的各種數(shù)據(jù)通過PI數(shù)據(jù)庫的通信接口,讀取到PI數(shù)據(jù)庫內(nèi),通過統(tǒng)一的格式進(jìn)行定義使用,為下一步數(shù)據(jù)挖掘提供了基礎(chǔ),而且PI數(shù)據(jù)庫使用Swing Door壓縮算法,每個采集點(diǎn)的數(shù)據(jù)壓縮率可自行設(shè)置;在保證數(shù)據(jù)精度要求的條件下優(yōu)化了系統(tǒng)的運(yùn)行效率,使調(diào)用數(shù)據(jù)速度極快,可以滿足應(yīng)用的需求[2].
數(shù)據(jù)挖掘過程可以大略地分為數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘及使用等5個過程.基于SIS系統(tǒng),在強(qiáng)大的PI數(shù)據(jù)庫中已經(jīng)能很好處理長達(dá)多年并且?guī)兹f點(diǎn)的數(shù)據(jù)量,同時可以在此數(shù)據(jù)倉庫的基礎(chǔ)上,根據(jù)需要選取相關(guān)數(shù)據(jù)進(jìn)行預(yù)處理及數(shù)據(jù)轉(zhuǎn)換工作,因此SIS系統(tǒng)所進(jìn)行的數(shù)據(jù)收集過程是非常重要的.
根據(jù)挖掘任務(wù)的不同,對數(shù)據(jù)倉庫進(jìn)行規(guī)則分析、關(guān)聯(lián)分析、分類分析、聚類分析、預(yù)測分析、趨勢分析、偏差分析等.應(yīng)用于電廠發(fā)電行業(yè),目前所作的研究主要集中于通過關(guān)聯(lián)規(guī)則分析的運(yùn)用,從歷史/實(shí)時數(shù)據(jù)庫中發(fā)現(xiàn)未知的、未被應(yīng)用的數(shù)據(jù)相關(guān)關(guān)系,如通過挖掘分析導(dǎo)致管壁超溫現(xiàn)象的原因;通過回歸分析,對某些重要參數(shù)進(jìn)行預(yù)測擬合,對事故的發(fā)生進(jìn)行預(yù)判等,如預(yù)測凝汽真空、用電調(diào)度等;根據(jù)已知數(shù)據(jù)通過應(yīng)用BP神經(jīng)網(wǎng)絡(luò)估算未知數(shù)據(jù),例如可以通過BP神經(jīng)網(wǎng)絡(luò),采集與鍋爐管壁某段有關(guān)的易于測量的幾個點(diǎn)的測量值,預(yù)測鍋爐管壁上不易于測量管壁點(diǎn)的溫度或者壓力等.因此數(shù)據(jù)挖掘在電廠應(yīng)用前景非常廣闊,應(yīng)用多種數(shù)據(jù)挖掘技術(shù),可以從數(shù)據(jù)倉庫中挖掘出對發(fā)電機(jī)組安全性與經(jīng)濟(jì)性的規(guī)律和信息,形成一定的知識儲備,可以幫助運(yùn)行人員操作指導(dǎo),為提高機(jī)組的經(jīng)濟(jì)安全運(yùn)行提供了科學(xué)依據(jù).
某電廠350 MW機(jī)組投產(chǎn)至今多次發(fā)生由于管壁超溫而引起的鍋爐結(jié)焦泄漏事故,在煤粉鍋爐運(yùn)行過程中,結(jié)焦不僅降低鍋爐的熱效率,而且對鍋爐設(shè)備造成損害,嚴(yán)重影響安全經(jīng)濟(jì)運(yùn)行,尤其是因結(jié)焦嚴(yán)重而停爐處理,其經(jīng)濟(jì)損失更大.以350 MW機(jī)組配套設(shè)備為例,如果因?yàn)榻Y(jié)焦停爐10 h,電價按0.3 元kW/h計算,則損失達(dá)百萬元以上.鍋爐結(jié)焦過程十分復(fù)雜,大部分前期癥狀體現(xiàn)在鍋爐管壁超溫上,而鍋爐管壁超溫的原因由于鍋爐內(nèi)燃燒模型復(fù)雜,各種因素相關(guān)關(guān)系錯綜,無法用一個完整的數(shù)學(xué)模型直接分析[3],因此對管壁超溫現(xiàn)象用數(shù)據(jù)挖掘的方法進(jìn)行關(guān)聯(lián)規(guī)則的分析是非常必要的.對特定的機(jī)組分析管壁超溫,排除由于煤質(zhì)問題、鍋爐本體設(shè)計問題等無法干預(yù)的可能,從運(yùn)行優(yōu)化的角度,本例將以改進(jìn)的Apriori算法研究電廠鍋爐管壁超溫故障與機(jī)組其他運(yùn)行參數(shù)之間的關(guān)聯(lián)規(guī)則.
Apriori算法是一種較有效的頻繁項(xiàng)集挖掘算法[4].該算法使用一種稱為逐層搜索的迭代方法,k項(xiàng)集用于探索(k+1)項(xiàng)集.首先,通過掃描數(shù)據(jù)庫,累積每個項(xiàng)的計數(shù),并收集滿足最小支持度得項(xiàng),找出頻繁1項(xiàng)集,記作L1,L1用于探索頻繁2項(xiàng)集的集合L2,而L2用于找L3,如此下去,直到不能找到頻繁k項(xiàng)集.找每個Lk需要一次數(shù)據(jù)庫掃描.一旦從數(shù)據(jù)庫的事務(wù)D中找出頻繁項(xiàng)集,就可以根據(jù)最小置信度直接產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則.
Apriori算法選取的數(shù)據(jù)對時間參量沒有嚴(yán)格的離散值[5],電廠生產(chǎn)過程是連續(xù)的、不間斷的,而且單位時間內(nèi)數(shù)據(jù)量非常大,實(shí)時性要求也比較高.根據(jù)電廠本身的關(guān)聯(lián)特性和生產(chǎn)難以解決Apriori的適應(yīng)性問題[6].因此本文將算法改進(jìn)分為3部分:
1) 從SIS系統(tǒng)的PI數(shù)據(jù)庫內(nèi)提取電廠所有相關(guān)歷史數(shù)據(jù).在這一過程中,根據(jù)專家意見,排除大部分不可能的數(shù)據(jù),如本次研究的是鍋爐超溫時間,則關(guān)于發(fā)電機(jī)部分的所有數(shù)字量和模擬量均可不在采集范圍內(nèi).對數(shù)據(jù)進(jìn)行初步的聚類分析可以有效地減少計算量和駁雜數(shù)據(jù)對結(jié)果的影響.
2) 按照工業(yè)生產(chǎn)的規(guī)律性分段.通過數(shù)據(jù)劃分技術(shù)來挖掘頻繁項(xiàng)集;只需掃描整個數(shù)據(jù)庫2次.其包含2個主要處理階段.第一階段,算法將數(shù)據(jù)庫按照生產(chǎn)規(guī)律分為N個互不相交的部分,若數(shù)據(jù)庫D中的最小支持閾值為min_sup,那么每個部分所對應(yīng)的最小支持頻度閾值為:min_sup乘以number_of_partition.對于每個劃分(部分),挖掘其中所有的頻繁項(xiàng)集,它們被稱為是局部頻繁項(xiàng)集.就整個數(shù)據(jù)庫D而言,一個局部頻繁項(xiàng)集不一定就是全局頻繁項(xiàng)集,但是任何全局頻繁項(xiàng)集一定會出現(xiàn)從所有劃分所獲得的這些局部頻繁項(xiàng)集中,這一點(diǎn)很容易反證獲得.因此可以將從N個劃分中所挖掘出的局部頻繁項(xiàng)集作為整個數(shù)據(jù)庫D中頻繁項(xiàng)集的候選項(xiàng)集.第二階段再次掃描整個數(shù)據(jù)庫以獲得所有候選項(xiàng)集的支持頻度,以便最終確定全局頻繁的項(xiàng)集.根據(jù)數(shù)據(jù)劃分技術(shù)及挖掘的目的可以將事件項(xiàng)目以字母順序排列,編號用<x,Te>來標(biāo)識,這里Te表示超溫測點(diǎn)編號,x表示一些連續(xù)數(shù)值型數(shù)據(jù),如負(fù)荷、給水溫度等和一些離散數(shù)值型數(shù)據(jù);并對模擬量數(shù)據(jù)進(jìn)行離散化處理,如,負(fù)荷M的值在0 ~360 MW之間變化,可先將它分成18段.M1為<20 MW,M2為20~40 MW,…,M18為>340 MW等.
3) 利用Apriori算法產(chǎn)生期望的規(guī)則.
改進(jìn)后的Apriori算法流程如圖2所示.
通過設(shè)定不同的最小置信度及最小支持度,可以分析各種因素在鍋爐管壁超溫現(xiàn)象中的隸屬度,從而得出有利于運(yùn)行優(yōu)化方案的科學(xué)根據(jù).在實(shí)際計算中,筆者以再熱器管壁溫度第6排第1點(diǎn)為基準(zhǔn)超溫點(diǎn),采集一年內(nèi)超過605 ℃時的數(shù)據(jù)點(diǎn)3 253組,經(jīng)過專家驗(yàn)證,排除重復(fù)項(xiàng)、采樣測點(diǎn)故障異常項(xiàng)等干擾項(xiàng)后得到數(shù)據(jù)1 165組.選取最小支持度為min_sup=25%,最小置信度為min_conf=60%,得出當(dāng)此溫度點(diǎn)超溫時與再熱器擋板前左側(cè)溫度值的上升與#1OFA閥門開度相關(guān)的結(jié)論,以此可以提醒在下次發(fā)生再熱器擋板前左側(cè)溫度值的異常上升時,關(guān)注再熱器管壁超溫結(jié)焦現(xiàn)象,并且可以通過對#1OFA閥門開度的測定,確定實(shí)際配風(fēng)量,以達(dá)到防止超溫的目的.
基于改進(jìn)后的Apriori算法完成管壁超溫現(xiàn)象中各類數(shù)據(jù)關(guān)聯(lián)規(guī)則的分析,可以大大降低由于管壁超溫而引起的鍋爐結(jié)焦泄漏事故,從而在煤粉鍋爐運(yùn)行過程中,降低結(jié)焦率,減少經(jīng)濟(jì)損失.
除了此類改進(jìn)的Apriori算法,其他諸如C4.5,k-Means,SVM,EM,PageRank等數(shù)據(jù)挖掘算法在SIS系統(tǒng)中應(yīng)用也都比較常見,其對數(shù)據(jù)的相關(guān)性分析可以應(yīng)用在電廠的各個方面,比如,汽輪機(jī)振動故障性能分析,凝器真空下降原因分析,空預(yù)器漏風(fēng)分析等,本文就不一一詳述.
圖2 改進(jìn)后的Apriori算法流程圖
隨著大容量火力發(fā)電機(jī)組的投產(chǎn),再加上日益緊迫的能源與環(huán)境問題,作為耗能大戶的熱電廠需要有效的手段提高運(yùn)行效率、降低排污.從基于SIS系統(tǒng)的數(shù)據(jù)采集和數(shù)據(jù)挖掘手段著手,對機(jī)組的安全、優(yōu)質(zhì)、穩(wěn)定運(yùn)行提出了一種新的分析思路,將各種隱藏的知識用挖掘的手段展現(xiàn)出來,并且能得到很好的實(shí)際效果.因此,能否從熱力系統(tǒng)自身的運(yùn)行數(shù)據(jù)中找到改善系統(tǒng)運(yùn)行的知識和手段,是一個很有現(xiàn)實(shí)意義和研究價值的課題.
[1]侯子良. 再論火電廠廠級監(jiān)控信息系統(tǒng)[J]. 電力系統(tǒng)自動化,2002,26(15):1-3.
[2]彭春華,林中達(dá). PI實(shí)時數(shù)據(jù)庫及其在電廠SIS 系統(tǒng)中的應(yīng)用[J]. 工業(yè)控制計算機(jī),2003,16(6):28-33.
[3]周校平,張曉男. 燃燒理論基礎(chǔ)[M]. 上海:上海交通大學(xué)出版社,2001.
[4]王偉勤,鄭海. Apriori算法的進(jìn)一步改進(jìn)[ J]. 計算機(jī)與數(shù)字工程,2009,37 (4 ):20-23.
[5]徐章艷,劉美玲,張師超,等. Apriori算法的三種優(yōu)化方法[ J ]. 計算機(jī)工程與應(yīng)用,2004,40( 36):190-192.
[6]陳應(yīng)霞,陳艷. 關(guān)聯(lián)規(guī)則中的Apriori挖掘算法改進(jìn)[ J]. 長江大學(xué)學(xué)報:自然科學(xué)版,2008,5 (4):341-343.
SIS-based Data Collection and Process Control Data Mining
WU Jie1,2,HUA Chi3
Based on the Supervisory Information System(SIS)-based data collection and the plant process control data mining research,this paper proposes a solution of data collection and analysis targeting at the power plant SIS data warehouse. Using the methods to optimize performance,economic analysis,fault diagnosis,such as the application to the boiler coking reason,the study achieves good results.
supervisory information system(SIS);data mining;performance optimization;fault diagnosis
TP311
A
1008-5475(2012)04-0013-04
2012-09-15;
2012-10-10
江蘇省十二五規(guī)劃建設(shè)2011課題;江蘇省教育科學(xué)研究院2011現(xiàn)代教育技術(shù)研究立項(xiàng)課題(18959)
吳杰(1980-),男,江蘇宜興人,講師,碩士研究生,主要從事計算機(jī)信息管理研究.
(1.Internet of Things Engineering College,the IOT College of Southern Yangtze University,Wuxi 214122,China;2.Department of Career Guidance,Yirshing Trade School,Yixin 214206,China;3.Department of Internet of Things Engineering College,Institute of Information Technology,Wuxi 214122,China)
(責(zé)任編輯:李 華)