張 云,馬霄騰,曾亞恒
(南京國(guó)電南自自動(dòng)化有限公司研發(fā)中心,南京 210007)
隨著電力系統(tǒng)安全自動(dòng)裝置的產(chǎn)量越來越大,大批量裝置生產(chǎn)過程中的質(zhì)量保證和生產(chǎn)過程效率優(yōu)化環(huán)節(jié)被提到更重要的位置。裝置從生產(chǎn)線上下來后,由于剛剛生產(chǎn)和生產(chǎn)過程本身的原因,可能會(huì)出現(xiàn)少量漏焊、虛焊、松動(dòng)和器件損毀等硬件缺陷,另外在軟件和配置文件下載灌裝過程中,有可能出現(xiàn)版本不一致,配置錯(cuò)誤等軟件缺陷。需要及早在出廠前暴露,并且硬件器件性能也需要運(yùn)行一段時(shí)間來穩(wěn)定。
因此需要在生產(chǎn)制造流程中增加一道72 h裝置高溫老化的工序,將裝置放在高溫老化車間中帶電運(yùn)行72 h,盡快暴露軟硬件隱患和缺陷,作為其中加速裝置硬件具有一致性和穩(wěn)定性,提前暴露裝置軟硬件缺陷,是保證裝置長(zhǎng)期可靠運(yùn)行的不可或缺的重要一環(huán)。
對(duì)大批量裝置生產(chǎn)高溫老化后的異常結(jié)果進(jìn)行快速分析和定位,是很有價(jià)值的工作。目前每臺(tái)裝置高溫老化后的異常分析和判定工作,都是通過人工檢查來進(jìn)行,不僅效率低,而且對(duì)工人技術(shù)要求極高,并且準(zhǔn)確度不高。隨著裝置類型和數(shù)量的大幅增加,導(dǎo)致該流程時(shí)間成本和人工成本更加高昂,需要立即優(yōu)化和提升。
針對(duì)該生產(chǎn)需求,提出了一種針對(duì)安全自動(dòng)裝置的集群式高溫老化異常監(jiān)視方法,并相應(yīng)開發(fā)了1套針對(duì)大批量裝置高溫老化異常的監(jiān)視軟件,用來進(jìn)行異?,F(xiàn)象監(jiān)視。
集群式裝置高溫老化監(jiān)視層級(jí)結(jié)構(gòu)如圖1所示。為了實(shí)現(xiàn)同時(shí)批量監(jiān)視裝置高溫老化異常,建立了2層結(jié)構(gòu),每輛通電車包括20臺(tái)裝置,通過1臺(tái)交換機(jī)進(jìn)行級(jí)聯(lián),然后10輛通電車的交換機(jī)再級(jí)聯(lián)到集群式高溫老化監(jiān)視軟件所在的交換機(jī)。
圖1 集群式裝置高溫老化監(jiān)視層級(jí)結(jié)構(gòu)
為了簡(jiǎn)化管理和配置,每輛通電車的所有裝置都是同類型裝置。高溫老化軟件通過2級(jí)對(duì)裝置高溫老化進(jìn)行異常監(jiān)視管理。
集群式裝置老化異常監(jiān)視的主要流程如圖2所示。流程的絕大部分步驟都由以前的人工操作改成由專門開發(fā)的集群式高溫老化監(jiān)視軟件來替代。步驟的詳細(xì)細(xì)節(jié)在后續(xù)章節(jié)中進(jìn)行說明。
圖2 集群式裝置老化異常監(jiān)視流程
本方法和軟件實(shí)現(xiàn)的詳細(xì)方案如下。
由于生產(chǎn)裝置很多,需要提高高溫老化效率,可以批量進(jìn)行高溫老化。高溫老化異常監(jiān)視軟件提供集群式批量分層老化異常監(jiān)視功能。老化監(jiān)視軟件同時(shí)最多管理10輛通電車,將每輛通電車作為1個(gè)通電管理和異常監(jiān)視單元,每輛通電車單元最多管理20輛同類型裝置。
每輛通電車單元提供以下幾種主要功能。
“啟用”:該輛通電車納入了通電老化異常監(jiān)視管理。
“禁用”:該輛通電車退出了通電老化異常監(jiān)視管理。
“開始通電”:該輛通電車開始啟動(dòng)一輪通電老化。
“結(jié)束通電”:該輛通電車結(jié)束當(dāng)前通電老化。
“通信檢查”:對(duì)該輛通電車的所有裝置進(jìn)行裝置通電老化前和監(jiān)視軟件的通信完好性檢查。
“異常關(guān)鍵字設(shè)置”:對(duì)該輛通電車所有同類型裝置進(jìn)行裝置通電老化前的日志異常記錄關(guān)鍵字選擇和設(shè)置。
“異常記錄分析”:通電過程中,輪詢監(jiān)測(cè)并上傳保存的裝置通電日志異常記錄供查閱。
3.2.1 通信穩(wěn)定性檢查
在裝置高溫老化前,老化監(jiān)視軟件以每臺(tái)通電車為單位和該通電車的每臺(tái)老化裝置之間進(jìn)行通信穩(wěn)定性檢查,通過巡檢報(bào)文的正常應(yīng)答,確認(rèn)通信正常,防止通信連接不正常,導(dǎo)致高溫老化時(shí)無法進(jìn)行日志異常記錄輪詢。
3.2.2 日志異常關(guān)鍵字設(shè)置
在裝置高溫老化前,老化監(jiān)視軟件預(yù)先匹配設(shè)置的日志異常關(guān)鍵字,來檢索裝置日志記錄中是否存在異常日志記錄。
為了既有操作簡(jiǎn)便性,又有適應(yīng)未來的靈活性,裝置老化監(jiān)視軟件內(nèi)置了不同平臺(tái)類型的日志異常記錄關(guān)鍵字表供匹配選擇。但同時(shí)為了適應(yīng)將來新裝置平臺(tái)和裝置類型,裝置老化監(jiān)視軟件提供可編輯調(diào)整日志異常記錄關(guān)鍵字表功能。
典型的日志異常記錄關(guān)鍵字,如上電,復(fù)位,CRC(循環(huán)冗余校核)不一致,閉鎖,看門狗,通信中斷等。
當(dāng)確認(rèn)通信完好并且設(shè)置日志異常關(guān)鍵字后,就可以進(jìn)行72 h高溫老化。
當(dāng)通電車進(jìn)入高溫車間,老化監(jiān)視軟件點(diǎn)擊該通電車單元的“開始通電”按鈕,則開始72 h高溫老化過程。同時(shí)通電車上所有裝置的通電老化開始時(shí)間就是按下該按鈕的時(shí)間。裝置記錄下該時(shí)間,作為后續(xù)分析該裝置高溫老化時(shí)的異常日志記錄的開始時(shí)刻。
當(dāng)通電車準(zhǔn)備退出通電老化實(shí)驗(yàn)時(shí),老化監(jiān)視軟件點(diǎn)擊該通電車單元的“結(jié)束通電”按鈕,則結(jié)束通電車單元此輪高溫老化過程。通電車上所有裝置的通電老化結(jié)束時(shí)間就是按下該按鈕的時(shí)間。裝置記錄下該時(shí)間,作為后續(xù)分析該裝置的異常日志記錄的截止時(shí)刻。
注意:高溫老化異常監(jiān)視是一個(gè)動(dòng)態(tài)過程,以每輛通電車為單位,可單獨(dú)進(jìn)行高溫老化投退,而不是集齊所有通電車的所有裝置才進(jìn)行高溫老化,這樣適應(yīng)制造中心流水線的流程。
3.4.1 運(yùn)行狀態(tài)日志記錄方法和格式
裝置高溫老化過程中,運(yùn)行軟件內(nèi)置運(yùn)行狀態(tài)日志記錄功能,用于運(yùn)行狀態(tài)記錄便于進(jìn)行后續(xù)問題分析。示例見表1。
表1 日志記錄格式示例
(1)日志結(jié)構(gòu):日志所有內(nèi)容按文本格式記錄。
日志每條信息分行記錄,以換行符“ ”結(jié)束。
最大日志條目數(shù)有限。
日志結(jié)構(gòu)分為2個(gè)區(qū)域:日志頭部區(qū)域和日志具體條目區(qū)域。
(2)日志頭部區(qū)域記錄如下信息:日志格式版本,日志總條目數(shù),日志當(dāng)前有效條目數(shù),最新日志寫入位置。
(3)每條日志條目記錄如下信息:記錄時(shí)間,記錄詳細(xì)信息。
(4)日志順序循環(huán)覆蓋。最新日志覆蓋最舊的日志。
3.4.2 周期輪詢和分析日志異常記錄
在72 h高溫老化過程中,老化監(jiān)視軟件每隔2 h輪詢,按通電車單元→裝置的層級(jí)調(diào)閱每臺(tái)裝置的日志記錄并進(jìn)行詳細(xì)分析。日志輪詢和異常分析流程如圖3所示。
圖3 日志記錄輪詢和異常分析詳細(xì)流程
3.4.3 老化異常日志記錄詳細(xì)信息顯示
老化監(jiān)視軟件的告警界面上裝置分板卡列表詳細(xì)顯示本裝置老化期間檢測(cè)到的所有異常日志記錄,并按事件先后次序排列。
為了便于對(duì)裝置高溫老化發(fā)現(xiàn)的異?,F(xiàn)象與該裝置生產(chǎn)環(huán)節(jié)的其他信息建立關(guān)聯(lián),進(jìn)行后續(xù)跟蹤和異?,F(xiàn)象綜合分析。裝置高溫老化監(jiān)視軟件掃描裝置序列號(hào),將裝置序列號(hào)和高溫老化異常日志記錄信息自動(dòng)上傳到MES系統(tǒng)(生產(chǎn)管理系統(tǒng))的數(shù)據(jù)庫。
裝置高溫老化異常記錄上傳和建立關(guān)聯(lián)方法如下。
(1)在MES生產(chǎn)管理系統(tǒng)的數(shù)據(jù)庫上建立新的老化異常信息表。
信息表主要條目:裝置序列號(hào),異常板卡來源,記錄時(shí)間,異常關(guān)鍵字,記錄詳細(xì)信息。
(2)用序列號(hào)掃描槍掃描裝置序列號(hào)。
(3)高溫老化監(jiān)視軟件網(wǎng)絡(luò)連接MES系統(tǒng)的數(shù)據(jù)庫。
(4)上傳裝置序列號(hào)和老化異常記錄信息數(shù)據(jù)到數(shù)據(jù)庫。
(5)MES系統(tǒng)通過裝置序列號(hào)來關(guān)聯(lián)裝置生產(chǎn)過程中的其他信息。
當(dāng)發(fā)現(xiàn)裝置高溫老化過程中出現(xiàn)異常日志記錄后,需要對(duì)裝置高溫老化異常原因進(jìn)行離線深度分析,便于改進(jìn)。方法如下。
(1)生產(chǎn)制造專業(yè)技術(shù)人員分析裝置高溫老化出現(xiàn)的異常記錄現(xiàn)象與MES系統(tǒng)中記錄的該裝置生產(chǎn)制造其他環(huán)節(jié)發(fā)現(xiàn)的異?,F(xiàn)象是否有相關(guān)性和一致性,比如單板測(cè)試環(huán)節(jié),裝置聯(lián)調(diào)環(huán)節(jié)。
若有相類似的現(xiàn)象,則分析這些現(xiàn)象是否為同一原因產(chǎn)生的。
(2)在MES生產(chǎn)管理系統(tǒng)的數(shù)據(jù)庫中統(tǒng)計(jì)分析同類裝置中出現(xiàn)類似老化異常記錄的概率分布情況。
分析該異常記錄現(xiàn)象是偶發(fā)性還是大面積異?,F(xiàn)象。
若是出現(xiàn)大面積異?,F(xiàn)象,則要徹底搞清原因,不然會(huì)出現(xiàn)批次質(zhì)量問題。
(3)結(jié)合異常日志記錄和后續(xù)聯(lián)調(diào)測(cè)試記錄,由專業(yè)技術(shù)人員繼續(xù)分析,必要時(shí),需要進(jìn)一步實(shí)驗(yàn)和測(cè)試。比如硬件系列分析與測(cè)試:金相分析,掃描電子顯微鏡及能譜分析,X射線無損分析,熱變形測(cè)試,振動(dòng)測(cè)試等。比如軟件系列分析與測(cè)試:缺陷復(fù)現(xiàn),外部壓力測(cè)試,邏輯分析等。
最終分析清楚哪個(gè)環(huán)節(jié)導(dǎo)致的原因:硬件設(shè)計(jì)、硬件制造、軟件配置、軟件設(shè)計(jì)、版本匹配和使用不當(dāng)。
(4)根據(jù)分析定位的異常原因,進(jìn)行后續(xù)改進(jìn)和優(yōu)化,比如:替換器件,保證器件質(zhì)量一致性,提升制造工藝,優(yōu)化生產(chǎn)流程;硬件參數(shù)容量冗余設(shè)計(jì),修正軟件缺陷,更改配置,增加調(diào)試項(xiàng)目清單等。
本文介紹了一種電力系統(tǒng)安全自動(dòng)裝置的集群式高溫老化異常監(jiān)視方法和軟件。通過在生產(chǎn)制造中心大規(guī)模推廣該方法和軟件,取得了明顯的經(jīng)濟(jì)效益。顯著降低了對(duì)一線工人的技術(shù)要求,由以前熟練掌握裝置內(nèi)部功能細(xì)節(jié)的技術(shù)工人,降低為僅僅會(huì)操作電腦即可的簡(jiǎn)單技術(shù)工人。大幅節(jié)省大批量裝置高溫老化流程環(huán)節(jié)的工時(shí),工時(shí)縮短70%。并提高裝置高溫老化異?,F(xiàn)象人工檢查時(shí)的正確檢出率。為公司產(chǎn)品質(zhì)量缺陷及早暴露提供了更好的手段,從而提升了公司的自動(dòng)化產(chǎn)品出廠質(zhì)量。