申 創(chuàng) 姚 毅 王勁柏 羅 毅
(1.四川理工學(xué)院自動化與電氣工程學(xué)院,西川 自貢 643000;2.成都海蘭天澄科技有限公司,成都 610000)
隨著我國工業(yè)化程度的提高和產(chǎn)業(yè)結(jié)構(gòu)的轉(zhuǎn)型,對環(huán)保的監(jiān)控越來越嚴(yán)格,許多在線監(jiān)測儀器得到推廣和應(yīng)用。然而,此類儀器受到環(huán)境變量和自身耦合變量的雙重干擾,再加上在線類監(jiān)測儀器工程上涉及到技術(shù)集成、操作性、安全冗余及成本控制等限制,該類儀器(如化學(xué)需氧量、氨氮、煙氣、乳酸及微生物等在線監(jiān)測設(shè)備)在控制精度和故障排查上不甚理想。對儀器的故障診斷,多憑借工程經(jīng)驗(yàn)。因此,對儀器設(shè)備開發(fā)的工程經(jīng)驗(yàn)、質(zhì)量控制、開發(fā)效率以及工程優(yōu)化問題的研究將更有迫切性和現(xiàn)實(shí)需要,其中,數(shù)據(jù)特征挖掘?qū)|(zhì)量控制和設(shè)備開發(fā)效率的提高意義重大。
采用特征選擇和過濾匹配的方法快速分析儀器的故障原因[1],先要建立變量的初始特征集,這樣就必須明確可能引起故障的輸入變量對應(yīng)的節(jié)點(diǎn)或分類節(jié)點(diǎn),再用COD在線監(jiān)測儀進(jìn)行的故障診斷研究來引出,其分析思路也可用于其他儀器系統(tǒng)。
COD在線監(jiān)測儀是眾多環(huán)保監(jiān)控儀器中的一種,其核心測試方法有重鉻酸鹽法、高錳酸鉀法、庫侖法、臭氧法、電極法及羥基法等[2],其中重鉻酸鹽和高錳酸鉀法是國標(biāo)方法[3],用得較為普遍。
圖1是某公司的COD在線監(jiān)測儀后側(cè)圖。整個(gè)測試過程按采樣、定容、消解、比色的過程串聯(lián)進(jìn)行,工作前有試管清洗、系統(tǒng)復(fù)位及光度計(jì)調(diào)零等操作,采用重鉻酸鹽法消解,光度計(jì)法比色。監(jiān)測儀的主要構(gòu)件包括試劑瓶、導(dǎo)管、繼電器、蠕動泵、消解池、加熱棒、比色池、光度計(jì)、PLC、嵌入式顯示和控制組件。
圖1 COD在線監(jiān)測儀后側(cè)圖
任何影響儀器工況的因素都可以作為輸入變量特征集的元素,但是,為了降低特征子集之間的相關(guān)性,理清故障因素是關(guān)鍵。該儀器的測試范圍是5~1 000mg/L,而數(shù)據(jù)多分布在200mg/L以內(nèi),因此可以說,任何節(jié)點(diǎn)的故障振動或漂移都可能影響測試結(jié)果的穩(wěn)定性,這給逐點(diǎn)排查儀器故障帶來了麻煩。假設(shè)樣本數(shù)據(jù)不存在大量干擾(如Cl-),可從3個(gè)主要過程來分析故障因素。
定容階段。主要是借助于蠕動泵的兩次固定時(shí)間內(nèi)的正反轉(zhuǎn)抽取樣本到消解池中。蠕動泵的不穩(wěn)定,可能導(dǎo)致無法準(zhǔn)確定容,影響實(shí)驗(yàn)結(jié)果,此類故障可以通過肉眼觀察發(fā)現(xiàn);放置在試管中的吸管由于端子不規(guī)則,或電磁閥的吸附,都會造成不確定的殘留試劑。
消解階段。從消解條件考慮,即催化劑和溫度。難點(diǎn)在于溫度的控制,主要是加熱器和溫控儀部分是可能的故障點(diǎn),數(shù)據(jù)所反映出的明顯特征就是測試結(jié)果普遍偏低。
采樣階段。涉及到光度計(jì)部分、比色皿部分和硬件電路部分,如光源的“單色性”太差、檢測器漂移及比色皿中有大量氣泡或不均勻等。從朗伯比爾定律的前提條件入手去分析采樣階段的可能故障點(diǎn)是完備的。
根據(jù)評價(jià)準(zhǔn)則,特征選擇可以分為過濾器、封裝器和嵌入式3類基本模型[4],在此按過濾器模型進(jìn)行特征選擇,需要首先對初始特征集進(jìn)行定義。
按照儀器的動作過程逐級分類,可以使特征間的分類間距最大化,減少無效特征或冗余特征,并且由于是按流程操作的,所以在發(fā)生故障的條件下,采樣、定容、消解、比色之間引起故障的相關(guān)系數(shù)為零。圖2所示為雙特征變量的匹配流程,首先要理清所有引起儀器故障的外部變量和內(nèi)部變量,并注意變量之間是否存在關(guān)聯(lián)性,隨后把變量屬性符號化得到特征子集,然后可以用矩陣的形式表示出特征。對于數(shù)據(jù)特征的挖掘,除了常見的統(tǒng)計(jì)特征,還應(yīng)結(jié)合儀器的自身特點(diǎn)挖掘出與之對應(yīng)的數(shù)據(jù)特性,如數(shù)據(jù)穩(wěn)定的滯后效應(yīng)、數(shù)據(jù)偏離均值的正負(fù)值及最值分散度等。
圖2 雙特征變量的匹配流程
儀器故障的完備事件容易找到,如溫度、濕度、光度計(jì)電源及加熱棒等。若隨意劃分特征子集,將不利于故障的快速映射。如將溫度看成是一個(gè)特征元素或集合,而溫度對多個(gè)構(gòu)件和環(huán)節(jié)都會產(chǎn)生影響,和數(shù)據(jù)特征進(jìn)行匹配時(shí),無法建立有說服力的聯(lián)系。因此,特征集合的搜索和分類很關(guān)鍵。
圖3 系統(tǒng)的故障樹
有效提高特征選擇算法穩(wěn)定性的方法主要有基于經(jīng)典特征選擇算法的集成特征選擇、基于樣本加權(quán)的算法[5]和特征組群的方法。數(shù)據(jù)特征這部分包括如何進(jìn)行選擇數(shù)據(jù)和對數(shù)據(jù)的特征挖掘。從圖4所示的測試數(shù)據(jù)可以看出,50mg/L的標(biāo)樣測試數(shù)據(jù)表明該儀器工作不正常,但并不一定用此組數(shù)據(jù)更有利于反映儀器固有的問題,因?yàn)橛锌赡苁枪收宵c(diǎn)的次生干擾和故障本身干擾的結(jié)果。因此,在儀器穩(wěn)定運(yùn)行的情況下,需要選擇合適的測試數(shù)據(jù)作為評估的原始特征集。假設(shè)關(guān)注以下幾類數(shù)據(jù)特征:均值、方差、數(shù)據(jù)穩(wěn)定的滯后效應(yīng)、數(shù)據(jù)偏離均值的正負(fù)值、最值分散度。理論上5個(gè)特征有31種數(shù)據(jù)組合。接下來就要采用各種手段建立數(shù)據(jù)特征集合與變量特征集的聯(lián)系。
圖4 故障儀器的測試數(shù)據(jù)(50mg/L標(biāo)樣)
對同一儀器的數(shù)天數(shù)據(jù)進(jìn)行采樣分析,低(50mg/L)、高(200mg/L)濃度標(biāo)樣測試值的分布分別如圖5、6所示。低濃度測試結(jié)果表明,均值偏離大,且測試穩(wěn)定性較差。高濃度的測試結(jié)果均值接近標(biāo)樣,但少數(shù)采樣值漂移比較大,這說明儀器不存在原理性故障,系統(tǒng)整體運(yùn)行比較穩(wěn)定,受環(huán)境的干擾或穩(wěn)定運(yùn)行的條件不足。在做進(jìn)一步的數(shù)據(jù)特征挖掘時(shí),需要盡可能排除誤差因素的干擾,突顯故障因素對數(shù)據(jù)的作用,因此選擇高濃度采樣數(shù)據(jù)進(jìn)一步分析。
圖5 低濃度標(biāo)樣測試值的分布
圖6 高濃度標(biāo)樣測試值的分布
圖7是溫度基本恒定或變化趨勢相同的條件下,同一儀器對不同標(biāo)樣的測試結(jié)果,可以斷定:幾乎首次采樣的結(jié)果都會比標(biāo)樣值低??梢酝ㄟ^此特征和相關(guān)經(jīng)驗(yàn),鎖定幾種可能故障,優(yōu)先用其他數(shù)據(jù)特征驗(yàn)證這些故障。圖8是溫度基本恒定(8℃),不同儀器對同一標(biāo)樣的測試結(jié)果,依然有首次測量低于標(biāo)樣值的特征。
圖7 同一儀器不同標(biāo)樣的測試值
圖8 不同儀器對同一標(biāo)樣的測試
表1是200mg/L(高濃度)的標(biāo)樣測試結(jié)果,其均值和方差分別為199.87和39.07,均值接近200mg/L,方差較大,說明數(shù)據(jù)波動較明顯。圖9為測試數(shù)據(jù)的波動和均值特質(zhì),可以看出,測試數(shù)據(jù)幾乎是負(fù)波動,即在中心線(CL)以下波動,且數(shù)據(jù)存在偶發(fā)的不穩(wěn)定現(xiàn)象。綜上所述,可以得出如下結(jié)論:
a. 系統(tǒng)不存在原理性故障,一天內(nèi)測量儀器穩(wěn)定性較差;
b. 儀器魯棒性能較差;
c. 儀器系統(tǒng)并沒有完全得到響應(yīng);
d. 系統(tǒng)穩(wěn)定運(yùn)行前需要1~3個(gè)測試周期。
表1 200mg/L標(biāo)樣的測試值
圖9 測試數(shù)據(jù)的波動和均值特征
按照構(gòu)建模型的思路去分析和排查,很快就找到了該儀器的故障原因,即加熱棒沒能完全包裹整個(gè)液位面(圖10),由于熱傳遞和熱損耗的影響,使消解池的上液位面的液體不能持續(xù)10min保持175℃,從而導(dǎo)致消解不完全。
圖10 消解池和加熱裝置(故障點(diǎn))
4.1原始數(shù)據(jù)選取根據(jù)經(jīng)驗(yàn)和特征選擇的要求,才能盡可能減少誤差因素,突顯故障因素,對于該儀器而言,選擇高濃度的標(biāo)樣更有利于儀器分析。
4.2按儀器操作流程對故障特征變量進(jìn)行劃分,有利于增大類別距離,減少特征冗余;數(shù)據(jù)特征和故障變量的匹配可以根據(jù)經(jīng)驗(yàn)來減少算法。
4.3雖然該儀器的采樣周期為30min,若將整天的測試看成一次集中采樣,仍然可以從系統(tǒng)的快速響應(yīng)性、穩(wěn)定性和魯棒性的角度分析,并得到比較滿意的結(jié)果。