張玉濤 王海清 陳國明
1.中國石油大學(xué)(華東)機(jī)電工程學(xué)院 2.中海油能源發(fā)展股份有限公司安全環(huán)保分公司
基于過程數(shù)據(jù)的關(guān)聯(lián)報警分組和抑制策略
張玉濤1,2王海清1陳國明1
1.中國石油大學(xué)(華東)機(jī)電工程學(xué)院 2.中海油能源發(fā)展股份有限公司安全環(huán)保分公司
針對目前流程工業(yè)報警系統(tǒng)中普遍存在的報警系統(tǒng)效率低、連鎖報警多的現(xiàn)象,提出一種基于過程數(shù)據(jù)的關(guān)聯(lián)報警分組和抑制策略。該策略采用離差平方和法對過程數(shù)據(jù)進(jìn)行聚類分析,根據(jù)距離系數(shù)把關(guān)聯(lián)的報警變量分組;并利用報警優(yōu)先級量化規(guī)則,從響應(yīng)時間和后果嚴(yán)重度兩方面計算報警的優(yōu)先級分值,以此確定報警小組中需要及時響應(yīng)和抑制的報警。該策略有助于控制員理解報警間的關(guān)聯(lián)關(guān)系、提高對連鎖報警的響應(yīng)效率。最后在TE模型中運(yùn)行測試,驗證了該策略的有效性和實用性。
關(guān)聯(lián)報警 報警抑制 聚類分析 報警優(yōu)先級 TE模型
在現(xiàn)代工業(yè)中,報警系統(tǒng)作為一個獨立的保護(hù)層起著很重要的作用[1],Stephen Gill[2]在最新論文中指出,如果一些重要信息得到相應(yīng)的重視,便可能阻止事故發(fā)生,被忽略的原因是提供過多不必要信息,或重要信息的可視化不明顯。隨著DCS、PLC、FCS等自動化系統(tǒng)的廣泛應(yīng)用[3],報警的設(shè)計變得容易。因此,同一故障或運(yùn)行異常會同時引發(fā)多個報警。大量的報警出現(xiàn)將提供過多無用信息,干擾控制員準(zhǔn)確診斷故障,致使報警系統(tǒng)失去保護(hù)作用。
關(guān)聯(lián)報警分析是提高報警系統(tǒng)性能的有效手段,基本方法有兩種:第一種基于工藝流程分析,比如層次分析法、有向圖(SDG)法、因果關(guān)系(C-E)模型等定性物理模型;第二種基于過程數(shù)據(jù)和報警日志,依靠統(tǒng)計分析方法來尋找報警間的關(guān)聯(lián)關(guān)系。T.Kourti[4]提出利用回歸分析、主成分分析等統(tǒng)計方法來處理多變量報警問題;Jiandong Wang[5]提出了一種新型關(guān)聯(lián)報警識別方法,基于二進(jìn)制數(shù)據(jù)的相似系數(shù);F.Yang[6]等對報警數(shù)據(jù)的關(guān)聯(lián)分析方法和可視化做了改進(jìn);H.A.Gabbar[7-8]等人通過過程數(shù)據(jù)分析揭示關(guān)聯(lián)報警中的可能起因,并利用XML模型開發(fā)了某工廠的關(guān)聯(lián)矩陣;Markus Schleburg[9]利用報警參數(shù)對相關(guān)報警進(jìn)行分組,從而減少呈現(xiàn)給操作員的報警數(shù),其分組原則是以共因報警為基礎(chǔ);T.Bergquist[10]則利用計算機(jī)工具的估計方法分組報警。
本文以尋找關(guān)聯(lián)報警,減少報警數(shù)量為目的,利用系統(tǒng)聚類法分析過程數(shù)據(jù),對報警變量進(jìn)行分組;進(jìn)而對組內(nèi)各報警的響應(yīng)時間和后果嚴(yán)重度進(jìn)行評估,以分值量化的方法計算優(yōu)先級評分,決定報警小組中優(yōu)先響應(yīng)和抑制的報警,減少不必要的信息干擾。最后在TE模型中運(yùn)行測試,從工藝流程和控制回路上驗證該策略的有效性和實用性。
1.1 報警分組原則
對工廠報警分組可以凸顯重要報警信息,更加直觀地提醒控制員發(fā)生故障或偏離的設(shè)備或單元,報警分組基于報警之間的普遍聯(lián)系,比如同一工藝單元、同一區(qū)域、同一設(shè)備的報警[11]。Markus Schleburgad[9]等提出共因報警分組的一系列規(guī)則,包括報警類型、時間窗口和報警狀態(tài)。文獻(xiàn)[12]則認(rèn)為單純依靠屬性和時間窗口的報警分組會切斷不同類型、狀態(tài)之間的聯(lián)系,提出在因果關(guān)系模型的基礎(chǔ)上進(jìn)行分組更易劃分關(guān)聯(lián)報警。本文提出的分組方法以報警變量的過程數(shù)據(jù)為基礎(chǔ),利用系統(tǒng)聚類法找到關(guān)聯(lián)報警并分組。因此,設(shè)備故障報警不在該方法的研究范圍,如放空率和壓縮機(jī)功率報警。
1.2 系統(tǒng)聚類法
系統(tǒng)聚類法是最常用的一種聚類方法,已廣泛應(yīng)用到氣象預(yù)報、農(nóng)業(yè)、林業(yè)、土地規(guī)劃等領(lǐng)域,近年來多有與事故風(fēng)險結(jié)合的研究。其基本思想是將樣品各看成一類,然后定義類與類之間的距離,將距離最短的兩類合并為一個新類,再計算新類與其他類之間的距離,如此下去,直到合并為一個大類為止[13]。采用不同的距離標(biāo)準(zhǔn)聚類,有不同的聚類方法:最短距離法、最長距離法、重心法、類平均法和離差平方和法,各種方法各有優(yōu)缺點,本文選用離差平方和法聚類[14]。
類似的有:
另外,離差平方和法的新類距離遞推公式為新類計算提供便利,為:
系統(tǒng)聚類方法最終會把所有變量聚為一類,但把所有報警歸為一組是不現(xiàn)實的。根據(jù)公式(6),本文選取最大距離的60%作為聚類指數(shù),距離大于該指數(shù)時停止聚類,得到最終分組,但報警管理是一個長期動態(tài)的過程,聚類指數(shù)需要在實踐中不斷修正,分類多少也可能隨之改變。
2.1 設(shè)定報警優(yōu)先級目的和方法
在響應(yīng)報警時,優(yōu)先級作為一個重要參數(shù)被長期忽視,根據(jù)EEMUA-191:2007《報警系統(tǒng):一個對設(shè)計、管理和采購的指導(dǎo)》規(guī)定[15],報警必須有明確的優(yōu)先級(3~5級),并以清晰的方式呈現(xiàn)給控制員,即不同優(yōu)先級要配置不同的、容易區(qū)分的聲音和顏色,方便控制員做出響應(yīng)判斷。目前,國內(nèi)外對報警優(yōu)先級的研究較少,有國內(nèi)學(xué)者用物元分析方法建立報警參數(shù)和級別之間的關(guān)聯(lián)函數(shù),把報警等級當(dāng)做優(yōu)先級[16-17]。
優(yōu)先級的主要影響因素為報警最大響應(yīng)時間和后果嚴(yán)重度,等級設(shè)定也由此而來。API-1167:2010《管道SCADA系統(tǒng)報警管理》[18]為管道行業(yè)制定了一個優(yōu)先級評定矩陣,把響應(yīng)時間分為四級,后果嚴(yán)重分為三級,見表1。顯然,該方法過于簡單粗糙,把專家意見模糊化,且3個等級不能有效地反映報警的緊急順序。本文在該矩陣基礎(chǔ)上,引入平均響應(yīng)時間因子,并對后果嚴(yán)重度做了細(xì)致的評分規(guī)定,以實現(xiàn)報警優(yōu)先級的量化。
表1 報警優(yōu)先級評定表Table 1 List of alarm priority determination
2.2 優(yōu)先級分值的確定方法
一個報警的最大響應(yīng)時間是從報警發(fā)生到不可接受后果出現(xiàn)之間的時間,反映了報警的緊急程度,包括控制員動作(判斷、命令和執(zhí)行)和操作員動作(命令接受和執(zhí)行)。對4個階段的響應(yīng)時間賦以不同的系數(shù),即平均響應(yīng)時間因子(Mean Time to Response,MTTR),從而把時間因素量化,見表2。
報警預(yù)示著不愿見到的事故,事故的嚴(yán)重程度是風(fēng)險評估的重點。本文把后果進(jìn)行了更細(xì)致的分類,包括人員安全、公眾影響、環(huán)境影響、設(shè)備損失、財產(chǎn)損失和停工期6大影響類別,嚴(yán)重度分為無、輕微、重大、嚴(yán)重4個等級,對應(yīng)有不同權(quán)重,見表3。
表2 響應(yīng)時間與對應(yīng)的MTTR因子表Table 2 Respond time and corresponding MTTR factors
表3 后果嚴(yán)重度分類權(quán)重表Table 3 Severity of consequences and its weights
最后,用公式(7)計算最終的優(yōu)先級分值,找到優(yōu)先順序。
本文提出的報警分組和抑制策略基于過程數(shù)據(jù)對報警變量聚類分組,然后根據(jù)報警優(yōu)先級的分值對報警小組內(nèi)的報警排序,選出分值最高的報警作為小組代表通報給控制員,抑制其他報警。具體流程見圖1。
TE過程(Tennessee Eastman Process)是由Downs等[19]根據(jù)Eastman化學(xué)公司的實際工藝流程作少許修改后于1993年提出的,近年來廣泛應(yīng)用于廠級控制、過程故障檢測與診斷、過程優(yōu)化等自動化研究領(lǐng)域。TE過程主要由5個操作單元組成,4種反應(yīng)物生成2種產(chǎn)物,共有12個操作變量,41個測量變量(22個連續(xù)測量變量和19個成分變量),其中22個連續(xù)測量變量是設(shè)置報警的基礎(chǔ)。本方法排除故障報警,應(yīng)除去其中的循環(huán)流量(F5)、放空率(Pr10)和壓縮機(jī)功率(C20),則剩余的為報警變量:F1-A物料流量、F2-D物料流量、F3-E物料流量、F4-AC混合物料流量、F6-反應(yīng)釜進(jìn)料率、P7-反應(yīng)釜壓力、L8-反應(yīng)釜液位、T9-反應(yīng)釜溫度、T11-氣液分離塔溫度、L12-氣液分離塔液位、P13-氣液分離塔壓力、F14-氣液分離塔出口流量、L15-汽提塔液位、P16-汽提塔壓力、F17-汽提塔出口流量、T18-汽提塔溫度、F19-汽提塔蒸汽流量、T21-反應(yīng)釜冷卻水出口溫度、T22-分離塔冷卻水出口溫度。其工藝流程見圖2。
4.1 關(guān)聯(lián)報警分組及優(yōu)先顯示分析
根據(jù)TE過程的模擬過程數(shù)據(jù)進(jìn)行聚類分析,分析在SPSS17.0軟件中完成。所得19個報警變量的聚類圖見圖3。
聚類分析的最大距離為25,由此得到聚類指數(shù)L聚=25×60%=15。由聚類圖可知報警變量共分為3組,第一組包括P7、P13、P16;第二組包括F4、F6、F3、L8、F1、F14、F17、T21、L12、L15;第三組包括T18、F19、T11、T22、F2、T9。分別對19個報警變量進(jìn)行風(fēng)險評估,確定其MTTR因子和后果嚴(yán)重度權(quán)重,算出最后的優(yōu)先級分值,見表4。
表4 報警變量優(yōu)先級分值表Table 4 Priority scores of alarm variables
每組報警按照該分值排序,第一組:P7>P13=P16;第二組:L8>L12=L15>F6>T21>F1=F3=F4>F14>F17;第三組:T9>T11>T18>T22>F2> F19。在每組報警中選取優(yōu)先級分值最高的報警最為優(yōu)先通報報警,即P7-反應(yīng)釜壓力、L8-反應(yīng)釜液位和T9-反應(yīng)釜溫度,如果沒有出現(xiàn)這3種報警,則依次選擇分值最高的報警。
4.2 運(yùn)行測試
TE模型提供的擾動1為流量4中的物料A/C比率階躍變化、物料B恒定,在該擾動下運(yùn)行共觸發(fā)10個報警變量,造成報警泛濫。經(jīng)過上述程序,最終可確定優(yōu)先通報3個重要報警:P7-反應(yīng)釜壓力(第一組)、L8-反應(yīng)釜液位(第二組)和T11-氣液分離塔溫度(第三組),抑制其他報警。
從工藝角度分析該報警抑制策略的合理性:反應(yīng)釜的壓力可以由其中的冷卻水流率、吹洗(排空)的流率,以及進(jìn)料流率FC進(jìn)行控制;反應(yīng)釜的液位可由進(jìn)料流率FD和FE、分離塔溫度設(shè)定值、回流閥開度,以及進(jìn)料流率FC控制;分離塔的溫度可由冷凝器溫度和回流壓縮機(jī)功率控制,并直接影響回流到反應(yīng)釜的尾氣的組分比率(輕組分A和C,以及組分B)。這3條包含重要報警的控制回路可以最大程度調(diào)節(jié)流量4中的A/C比率,說明基于系統(tǒng)聚類的報警分組和抑制方法在理論上可行。同時,用EEMUA-191:2007[13]推薦的關(guān)鍵性能指標(biāo)評估(Key Performance Indictor,KPIs)對TE案例進(jìn)行系統(tǒng)性能評估對比,結(jié)果見表5。由表5可以看出,應(yīng)用本策略前后的3個指標(biāo)平均報警率、峰值報警率和峰值報警時間百分比都有明顯下降,而且達(dá)到了EEMUA-191:2007的可接受標(biāo)準(zhǔn),從而證明該關(guān)聯(lián)報警分組和抑制策略的有效性。
表5 報警系統(tǒng)KPIs效果對比Table 5 Comparison of the KPIs before and after the application of the strategy
(1)首次利用系統(tǒng)聚類的數(shù)學(xué)思想分析多報警變量的關(guān)系,進(jìn)行報警分組,一定程度上反應(yīng)了工藝流程中報警變量之間的關(guān)聯(lián)關(guān)系。
(2)利用報警優(yōu)先級量化細(xì)則,把最大響應(yīng)時間和后果嚴(yán)重度轉(zhuǎn)化成優(yōu)先級分值,更直觀地展示報警的緊急程度,為報警抑制提供依據(jù);與聚類分析結(jié)合的報警分組和抑制策略可以幫助控制員在報警泛濫中快速做出合理響應(yīng)并控制異常狀況回歸。
(3)TE模型的運(yùn)行測試證明該方法的合理性,其應(yīng)用可以提高報警系統(tǒng)效率,同時為關(guān)聯(lián)報警分析和報警系統(tǒng)優(yōu)化提供了新思路。
(4)該分組方法基于過程變量數(shù)據(jù),研究對象未包含設(shè)備故障報警,可以綜合定性分析方法,修正報警分組。
[1]DOWELL III A M.Layer of protection analysis for determining safety integrity level[J].Isa Transactions,1998,37(3):155-165.
[2]GILL S.Management of critical alarms:Connecting the dots[J].Process Safety Progress,2013,32(1):66-71.
[3]高進(jìn),鄭民,袁樹海,等.DCS/ESD在天然氣凈化廠的設(shè)計優(yōu)化[J].石油與天然氣化工,2011,40(5):539-542.
[4]KOURTI T.Process analysis and abnormal situation detection:from theory to practice[J].IEEE Control Systems Magazine,2002(22):10-25.
[5]YANG Z,WANG J,CHEN T.Detection of correlated alarms based on similarity coefficients of binary data[J].Automation Science and Engineering,IEEE Transactions on,2013(99):1-12.
[6]YANG F,SHAH S L,XIAO D,et al.Improved correlation analysis and visualization of industrial alarm data[J].ISA transactions,2012,51(4):499-506.
[7]THAMBIRAJAH J,BENABBAS L,BAUER M,et al.Cause-and-effect analysis in chemical processes utilizing XML,plant connectivity and quantitative process history[J].Computers and Chemical Engineering,2009(33):503-512.
[8]International Electrotechnical Commission.IEC 62424Representation of Process Control Engineering-Requests in P&I-Diagrams and Data Exchange Between P&ID Tools and PCE-CAE Tools[S].2008.
[9]SCHLEBURG M,CHRISTIANSEN L,THORNHILL N F,et al.A combined analysis of plant connectivity and alarm logs to reduce the number of alerts in an automation system[J].Journal of Process Control,2013,23(6):839-851.
[10]T BERGQUIST,AHNLUND J,LARSSON J E.Alarm reduction in industrial process control[C].IEEE Conference on Emerging Technologies and Factory Automation,2003(2):58-65.
[11]ANSI/ISA-18.2Management of alarm systems for the process industries[S].International Society of Automation(ISA),2009.
[12]張玉濤,王海清,李秋娟,等.基于報警分組和C-E模型的關(guān)聯(lián)報警分析[C].第五屆全國石油和化工生產(chǎn)安全與控制技術(shù)交流會,2014.
[13]常兆光,王清河,杜彩鳳.應(yīng)用統(tǒng)計方法[M].石油工業(yè)出版社,2009.
[14]胡雷芳.五種常用系統(tǒng)聚類分析方法及其比較[J].浙江統(tǒng)計,2007(4):11-13.
[15]EEMUA-191Alarm system-aguide to design,management and procurement[S].Engineering Equipment and Materials Users’Association(EEMUA),2007.
[16]XU Y,ZHU Q X.Application of extension theory in process industry[J].Control Engineering of China,2008,15(3):283-286.
[17]XU Y,ZHU Q X.Alarm optimization for process industry based on matter-element analysis[J].Journal of Chemical Industry and Engineering(China),2008,59(7):1609-1614.
[18]American Petroleum Institute.API-1167-2010Recommended practice for pipeline SCADA alarm management[S].2010.
[19]DOWNS D,VOGEL E.A plant-wide industrial process control problem[J].Computers &Chemical Engineering,1993(17):245-255.
A grouping and suppression strategy for correlated alarms based on process data
Zhang Yutao1,2,Wang Haiqing1,Chen Guoming1
(1.China University of Petroleum(East China),College of Mechanical and Electronic Engineering,Qingdao 266580,China;2.CNOOC Energy Technology &Services-Safty &Envrionmental Protection Co.,Tianjin300456,China)
To solve the common problems of the alarm system in the process industry,such as low efficiency and frequent interlocking alarm,this paper proposes a grouping and suppression strategy for correlated alarms based on process data.The Ward Method was used in this strategy for cluster analysis of the process data,and distance coefficient was the consideration to group the alarm variables that may related.Quantization regulations of alarm priority were introduced to identify the alarms needing response or suppression in an alarm group via analyzing the accurate priority score from both response time and severity of consequences.It is helpful for controllers to recognize the correlation among alarms,and improve the response efficiency.The strategy yields an effective alarm management that can help plant owners and operators to comply with the standards for alarm management such as ANSI/ISA 18.2(2009)and EEMUA 191(2007)which set limits on the number of alarms per unit time for an operator.The effectiveness of the approach is illustrated by successful application in TE process model where a significant reduction of alarms has been achieved.
correlated alarms,alarm suppression,cluster analysis,alarm priority,TE process
王海清教授,從事安全儀表系統(tǒng),HAZOP/LOPA,報警管理和可靠性RAM分析等研究。E-mail:wanghaiqing@upc.edu.cn
TP13
A
10.3969/j.issn.1007-3426.2015.05.021
山東省自然科學(xué)基金“復(fù)雜石化裝置安全聯(lián)鎖系統(tǒng)的保護(hù)層數(shù)值分析研究”(ZR2013EEM030),中國石油大學(xué)(華東)拔尖人才工程項目資助(SD2013211153)。
張玉濤(1989-),男,中國石油大學(xué)(華東)安全科學(xué)與工程專業(yè)在讀碩士研究生,主要從事管道報警管理方面的研究。E-mail:zhangyutao2009@163.com
2015-01-06;
2015-03-20;編輯:鐘國利