李霓,齊琦,王凱華*
(1.海南師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,海南海口571158;2.海南大學(xué)信息科學(xué)技術(shù)學(xué)院,海南???70228)
基于改進(jìn)型經(jīng)驗(yàn)法則的工藝偏差統(tǒng)計(jì)
李霓1,齊琦2,王凱華1*
(1.海南師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,海南???71158;2.海南大學(xué)信息科學(xué)技術(shù)學(xué)院,海南???70228)
文章在改進(jìn)經(jīng)驗(yàn)法則的基礎(chǔ)上,對工藝參數(shù)的偏差進(jìn)行了統(tǒng)計(jì)分析.首先由切比雪夫不等式引入基于正態(tài)分布的經(jīng)驗(yàn)法則,然后利用后驗(yàn)概率密度最大值點(diǎn)替代經(jīng)驗(yàn)法則式中的均值點(diǎn),對經(jīng)驗(yàn)法則進(jìn)行了改進(jìn),并應(yīng)用改進(jìn)型經(jīng)驗(yàn)法則尋找實(shí)際工藝參數(shù)數(shù)據(jù)的局部偏差,進(jìn)而對工藝參數(shù)進(jìn)行趨勢分析,得到了工藝參數(shù)偏離趨勢的判定結(jié)果.該方法比經(jīng)驗(yàn)法則更有效,可推廣到某些特定的與均值有關(guān)的分布法則中去,用于分析工業(yè)生產(chǎn)領(lǐng)域中有偏離群的數(shù)據(jù),具有一定的普適性和應(yīng)用價(jià)值.
切比雪夫不等式;經(jīng)驗(yàn)法則;后驗(yàn)概率密度;工藝偏差
工藝參數(shù)是指在工藝流程中影響生產(chǎn)過程的關(guān)鍵變量,是工藝條件的量化指標(biāo).常見的工藝參數(shù)有溫度、壓力、水碳比和物料比等.由于設(shè)備、工藝條件、環(huán)境、物料構(gòu)成等因素的限制,或者生產(chǎn)流程中沒有正常地履行操作規(guī)程的要求,時(shí)常存在工藝指標(biāo)發(fā)生偏離的情況.在該種情況下,工藝參數(shù)并非精確地符合額定值,而是與額定值之間存在著一定的偏差,這種差異即定義為工藝偏差.工藝偏差的產(chǎn)生往往不是偶然的,而是預(yù)示著生產(chǎn)流程中出現(xiàn)了某種失誤,嚴(yán)重到一定程度甚至?xí)l(fā)生重大安全事故,所以應(yīng)根據(jù)具體的生產(chǎn)條件和工藝偏差的特點(diǎn),定期查找導(dǎo)致工藝偏差的成因,并采取適當(dāng)措施以防止工藝偏差對工業(yè)生產(chǎn)造成的不利影響.為了能夠加強(qiáng)工藝指標(biāo)的監(jiān)控,必須將工藝指標(biāo)偏離的情況標(biāo)注出來,從而可以采取一定的手段對該偏離進(jìn)行重點(diǎn)監(jiān)控.除了工藝參數(shù)的局部偏離以外,還可能存在工藝參數(shù)緩慢地向上或者向下偏離的趨勢,并且這種趨勢長期存在,在短期內(nèi)很難迅速察覺.在生產(chǎn)過程中,對工藝參數(shù)大多進(jìn)行了自動控制,通常在設(shè)定點(diǎn)附近保持微小的振蕩,但是受多種因素影響還是會有長期偏離的情況發(fā)生.這種工藝參數(shù)緩慢演變的長期趨勢對于生產(chǎn)過程所產(chǎn)生的不利影響可能是相當(dāng)嚴(yán)重的,為了保持平穩(wěn)運(yùn)行和生產(chǎn)成本,必須及早發(fā)現(xiàn)并避免這種情況的發(fā)生.因此,通過算法尋找出工藝參數(shù)偏離的長期趨勢,對于維護(hù)工藝流程的穩(wěn)定性和可控性具有很強(qiáng)的指導(dǎo)意義.
1.1經(jīng)驗(yàn)法則
對于一個隨機(jī)分布的變量而言,方差作為其離散程度的度量,反映了該隨機(jī)變量離開數(shù)學(xué)期望的平均偏離程度.如果隨機(jī)變量記為ξ,方差為Dξ,那么對任意大于零的常數(shù)ε,隨機(jī)變量偏離期望不小于ε的概率滿足著名的切比雪夫不等式[1].
定理(切比雪夫不等式)對任意的隨機(jī)變量ξ,若Eξ=μ,且Dξ存在,則對?ε>0,有
在切比雪夫不等式中,只需要知道分布的期望和方差這兩個數(shù)字特征,因此使用起來比較方便,但由于沒有充分利用隨機(jī)分布的密度函數(shù)等信息,導(dǎo)致它給出的估計(jì)比較粗糙.為了給出更加精細(xì)的結(jié)果,通常對待研究的變量施以某種分布假定,在此基礎(chǔ)上再進(jìn)行推斷.不妨假定研究變量服從正態(tài)分布N(μ,σ2),則有
上式表明,正態(tài)分布的隨機(jī)變量偏離其期望不超過σ的概率略大于,不超過2σ的概率在0.95以上,而超過3σ的概率則只約0.003,即在實(shí)際問題通常認(rèn)為是不會發(fā)生的.也就是說,對服從N(μ,σ2)的隨機(jī)變量而言,基本上可以認(rèn)為有,該式通常被稱為經(jīng)驗(yàn)法則.
若使用切比雪夫不等式,則可得
不如經(jīng)驗(yàn)法則的結(jié)果精細(xì),因此在實(shí)際工作中,經(jīng)驗(yàn)法則往往比切比雪夫不等式更加常用.
1.2工藝偏差統(tǒng)計(jì)模型
由于位號的實(shí)際觀測值可以看成是工藝參數(shù)的設(shè)計(jì)值加上隨機(jī)擾動項(xiàng),因此對于工藝偏差有如下的統(tǒng)計(jì)模型:
其中,Xt為位號觀測值,μ為工藝參數(shù)設(shè)計(jì)值.從以上模型可以看出,工藝偏差εt的統(tǒng)計(jì)可以通過統(tǒng)計(jì)Xt來實(shí)現(xiàn).對工藝參數(shù)歷史數(shù)據(jù)初步核算后發(fā)現(xiàn),大部分工藝位號具有正態(tài)的隨機(jī)擾動,因此可以對Xt應(yīng)用經(jīng)驗(yàn)法則.另外,由于工藝參數(shù)的均值受少數(shù)異常值如停車數(shù)據(jù)的擾動極大,可將μ用眾數(shù)[2](后驗(yàn)概率密度最大值點(diǎn))而非均值來估計(jì).
1.3趨勢估計(jì)模型
工藝參數(shù)除了具有局部偏差,從長期來看,還會具有向上偏離或者向下偏離的趨勢.對于工藝參數(shù)的長期趨勢,可以用如下的統(tǒng)計(jì)模型來刻畫:
對此模型在相當(dāng)長的一段時(shí)間內(nèi)進(jìn)行擬合,如果斜率β1>0,則認(rèn)為工藝參數(shù)具有向上偏離的趨勢;若β1<0,則認(rèn)為工藝參數(shù)具有向下偏離的趨勢;若β1=0,則認(rèn)為工藝參數(shù)在該時(shí)期內(nèi)不具有偏離趨勢.該模型不應(yīng)該建立在過于短的時(shí)期內(nèi),因?yàn)樵诤芏痰臅r(shí)間內(nèi),工藝參數(shù)觀測值時(shí)而上升時(shí)而降低是很正常的,實(shí)時(shí)計(jì)算并判斷β1的符號會顯得過于頻繁而且沒有意義.
在收集到工藝參數(shù)的時(shí)間序列數(shù)據(jù)后,直接對原始數(shù)據(jù)進(jìn)行趨勢項(xiàng)的擬合,發(fā)現(xiàn)異常值對擬合結(jié)果的干擾較大,嚴(yán)重影響了對整體趨勢的正確判斷.比如通過對工藝參數(shù)位號AMM2.VI2500.PV的分析[3]發(fā)現(xiàn)存在顯著向上的偏離趨勢,但是在排除最后5日的觀測值之后再重新分析,向上偏離的趨勢變得不再顯著(見圖1),即認(rèn)為總體不存在偏離趨勢.同理,對工藝參數(shù)位號AMM2.TI2504.PV和AMM2. FN1001.PV的總體趨勢的判斷也受到了停車階段(2012年3月31日0:00至2012年5月7日0:00,對應(yīng)圖1中橫坐標(biāo)60—97)和異常波動期(2012年7月5日0:00至2012年7月18日,對應(yīng)圖1中橫坐標(biāo)156—169)這兩段下凹數(shù)據(jù)的干擾.因此要先剔除工藝參數(shù)數(shù)據(jù)中存在的異常值,再進(jìn)行整體趨勢的擬合.
工藝參數(shù)的后驗(yàn)概率密度在眾數(shù)處達(dá)到最大,故以其為中點(diǎn),上下各擴(kuò)展一定的百分比(不妨取為40%)作為正常值范圍的上下限,從而允許一定的相對誤差.由于工藝參數(shù)均值受到了較多來自停車階段和異常波動階段的異常值干擾,因此不再適合作為工藝參數(shù)正常值的參照標(biāo)準(zhǔn).假定現(xiàn)實(shí)生產(chǎn)過程中工藝參數(shù)的取值在絕大部分時(shí)段都屬正常,眾數(shù)作為后驗(yàn)分布中具有明顯集中趨勢點(diǎn)的數(shù)值,代表了數(shù)據(jù)點(diǎn)出現(xiàn)頻率最高的值,將其作為正常值范圍的中心是合理的[4-7].接下來,計(jì)算所有介于當(dāng)前上下限之間的工藝參數(shù)的均值和標(biāo)準(zhǔn)差,并根據(jù)經(jīng)驗(yàn)法則來界定新的上下限,從而得到了排除局部偏差的工藝參數(shù)正常值范圍.基于最小二乘法的線性回歸分析方法[8-9],對該范圍之內(nèi)的工藝參數(shù)時(shí)間序列作趨勢分析,并根據(jù)時(shí)間項(xiàng)系數(shù)估計(jì)的顯著性和正負(fù)性來判斷工藝參數(shù)過程有無整體趨勢以及趨勢的方向:若斜率項(xiàng)P值小于預(yù)先指定的顯著性水平,則認(rèn)為有整體偏離趨勢,反之,則認(rèn)為整體趨勢平穩(wěn);若斜率項(xiàng)估計(jì)為正,則有整體上升趨勢,若斜率項(xiàng)估計(jì)為負(fù),則有整體下降趨勢.
圖1 異常值干擾趨勢分析結(jié)果Fig.1The results of outliers disturb trend analysis
采用基于改進(jìn)型經(jīng)驗(yàn)法則的工藝偏差統(tǒng)計(jì)方法,對中海石油化學(xué)股份有限公司于2012年1月1日0:00至12月31日23:59期間采集到的500個典型工藝參數(shù)的8784個整點(diǎn)數(shù)據(jù)進(jìn)行偏差和趨勢分析,在顯著性水平0.05下,篩選出了85個具有向上偏離趨勢的工藝參數(shù),以及43個具有向下偏離趨勢的工藝參數(shù).最具有代表性的工藝參數(shù)偏離趨勢如圖2-5所示.這些結(jié)果的獲取,對于工業(yè)生產(chǎn)過程的質(zhì)量控制和管理具有極大的指導(dǎo)意義.事實(shí)上,在工藝偏差統(tǒng)計(jì)結(jié)果的指導(dǎo)下,通過采取相應(yīng)的措施,2013-2015年的非計(jì)劃停車次數(shù)從以往年份的1-2次降到了0次.在對工藝偏差進(jìn)行統(tǒng)計(jì)分析的過程中,我們選取眾數(shù)而非均值作為工藝參數(shù)的正常值,有效避免了異常值對工藝參數(shù)統(tǒng)計(jì)的干擾.在相對百分?jǐn)?shù)誤差限的基礎(chǔ)上,應(yīng)用經(jīng)驗(yàn)法則進(jìn)一步改良了上下限.在整體趨勢分析中,我們應(yīng)用了時(shí)間序列分析中對時(shí)間趨勢進(jìn)行擬合的常規(guī)方法,對工藝參數(shù)依不同的時(shí)間間隔進(jìn)行聚合處理,并據(jù)此計(jì)算平均顯著性,從而避免了時(shí)間跨度過大、數(shù)據(jù)集過于稠密對趨勢項(xiàng)顯著性的影響,得到了更有信度的結(jié)論.
圖2 具有向上偏離趨勢的工藝參數(shù)AMM2.LT2031.PV(液位位號)Fig.2The process parameter of AMM2.LT2031.PV with a trend of going up
圖3 具有向上偏離趨勢的工藝參數(shù)AMM2.TI1397.PV(溫度位號)Fig.3The process parameter of AMM2.TI1397.PV with a trend of going up
圖4 具有向下偏離趨勢的工藝參數(shù)AMM2.AI1008D.PV(天然氣組分位號)Fig.4The process parameter of AMM2.AI1008D.PV with a trend of going down
圖5 具有向下偏離趨勢的工藝參數(shù)AMM2.LT2012A.PV(液位位號)Fig.5The process parameter of AMM2.LT2012A.PV with a trend of going down
[1]茆詩松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)(第二版)[M].北京:高等教育出版社,2011.
[2]Basu S,Anirban D.The mean,median,and mode of uni?modal distributions:a characterization[J].Theory of Proba?bility and Its Applications,1997,41(2):210-223.
[3]Becker R A,ChambersJ M,Wilks A R.The New S Lan?guage[M].Wadsworth&Brooks/Cole,1988.
[4]Scott D W.Multivariate Density Estimation.Theory,Prac?tice and Visualization[M].New York:Wiley,1992.
[5]Sheather S J,Jones M C.A reliable data-based bandwidth se?lection method for kernel density estimation[J].J Roy Stat?ist Soc B,1991,53(3):683-690.
[6]Silverman B W.Density Estimation[M].London:Chapman and Hall,1986.
[7]Venables W N,Ripley B D.Modern Applied Statistics withS[M].New York:Springer,2002.
[8]Chambers J M.Linear models.Chapter 4 of Statistical Mod?els in S eds J.M.Chambers and T.J.Hastie[M].Wadsworth &Brooks/Cole,1992.
[9]Wilkinson G N,Rogers C E.Symbolic descriptions of facto?rial models for analysis of variance[J].Applied Statistics, 1973,22(3):392-399.
責(zé)任編輯:劉紅
Deviation Analysis of Process Parameter Based on Improved Empirical Rule
LI Ni1,QI Qi2,WANG Kaihua1*
(1.School of Mathematics and Statistics,Hainan Normal,Haikou 571158,China;2.School of Information Science and Technology,Hainan University,Haikou 570228,China)
Empirical rule is frequently used for analyzing variables which follow a normal distribution.It can be improved via replacing the empirical mean by the mode and the value which maximizes the empirical density function of the continu?ous variable.This improved empirical rule can then be applied to analyze adataset of process parameter and the results illus?trate that it works well.Furthermore,the improved empirical rule can also be generalized to more circumstances where mean-related distribution rules apply.
Chebyshev inequality;empirical rule;posteriori probability density;deviation
O 212.2
A
1674-4942(2016)01-0022-04
2015-11-21
國家自然科學(xué)基金項(xiàng)目(11401146,11361022);海南省自然科學(xué)基金項(xiàng)目(20151006,20151010,20156243);海南省高等學(xué)校教育教學(xué)改革研究項(xiàng)目(HNJG2014-22)