胡天南
【摘 要】集成電路是DCS系統(tǒng)的主要組成部分,在長期運(yùn)行過程中會(huì)受到溫度、電磁、濕度、粉塵、氧化、電源干擾等不利因素的影響,會(huì)使DCS系統(tǒng)各個(gè)部件發(fā)生老化以及失靈的現(xiàn)象,會(huì)對整個(gè)系統(tǒng)造成影響。所以為了確保系統(tǒng)穩(wěn)定運(yùn)行,必須要加強(qiáng)DCS系統(tǒng)管理。因此,本文主要介紹DCS系統(tǒng)管理的重點(diǎn)環(huán)節(jié)和部件,并提出DCS系統(tǒng)的管理與實(shí)踐,旨在保證DCS系統(tǒng)健康穩(wěn)定運(yùn)行。
【關(guān)鍵詞】DCS系統(tǒng);系統(tǒng)管理;管理與實(shí)踐;穩(wěn)定運(yùn)行
中圖分類號: TP273 文獻(xiàn)標(biāo)識碼: A 文章編號: 2095-2457(2019)03-0235-002
DOI:10.19694/j.cnki.issn2095-2457.2019.03.098
0 引言
集散式控制系統(tǒng)(DCS系統(tǒng))主要以現(xiàn)代計(jì)算機(jī)技術(shù)為基礎(chǔ),運(yùn)用相關(guān)算法以及高新技術(shù),對生產(chǎn)過程進(jìn)行集中管理與操作,并且對關(guān)鍵部件實(shí)現(xiàn)分散控制。從DCS系統(tǒng)結(jié)構(gòu)來說,該系統(tǒng)是一個(gè)基于多層信息網(wǎng)絡(luò)的縱橫分散控制系統(tǒng),雖然全長規(guī)模以及控制部件眾多,但是DCS系統(tǒng)能夠把這些系統(tǒng)連接起來,并進(jìn)行數(shù)據(jù)采集與傳輸,讓不同的信息經(jīng)過轉(zhuǎn)換后能夠共建共享,完成管理、控制和決策。在系統(tǒng)運(yùn)行過程中,不可避免地會(huì)受到一些不利因素的影響,因此對DCS系統(tǒng)進(jìn)行管理與實(shí)踐顯得至關(guān)重要,并且具有現(xiàn)實(shí)意義。
1 DCS系統(tǒng)管理
1.1 硬件管理
1.1.1 過程通道
I/O模塊在過程通道中是容易發(fā)生故障的模塊。當(dāng)I/O模塊發(fā)生故障時(shí),一般系統(tǒng)經(jīng)過自我診斷就能進(jìn)行故障排查,當(dāng)發(fā)生這類問題是相關(guān)技術(shù)人員通過更換配套模塊即可解決。對于工廠的工作人員來說,很難判斷模塊中的哪些故障導(dǎo)致了模塊的異常工作。原則上,當(dāng)I/O模塊發(fā)生損壞,該企業(yè)應(yīng)該第一時(shí)間通知生產(chǎn)制造商或者經(jīng)銷商,讓其配備專門人員進(jìn)行售后服務(wù),因?yàn)槠髽I(yè)維修人員對這樣高精密的儀器技術(shù)水平可能達(dá)不到相關(guān)要求。再者來說,生產(chǎn)商為了保密該項(xiàng)技術(shù),I/O模塊一般不能進(jìn)行直接拆卸,是與其他模塊一體的。通常I/O模塊在調(diào)試和運(yùn)行的初期,由于設(shè)備本身的質(zhì)量問題和人員操作的問題,會(huì)產(chǎn)生許多異常情況。一般來說,經(jīng)過一段時(shí)間的系統(tǒng)運(yùn)行,設(shè)備的運(yùn)行狀態(tài)將逐漸穩(wěn)定。
1.1.2 就地設(shè)備
當(dāng)就地設(shè)備發(fā)生故障時(shí),一般按企業(yè)內(nèi)常規(guī)故障處理方式進(jìn)行處理。由于圖像不能完全顯示,因此當(dāng)控制設(shè)備發(fā)生故障時(shí),操作人員很難及時(shí)檢測到,只有當(dāng)設(shè)備出現(xiàn)異?;虬l(fā)出警報(bào)時(shí)才會(huì)發(fā)現(xiàn),這對企業(yè)運(yùn)營管理人員的工作經(jīng)驗(yàn)和技術(shù)水平提出了更高的要求。因此,操作人員應(yīng)細(xì)心分析設(shè)備發(fā)生故障前后的基本狀態(tài),以便能夠準(zhǔn)確、快速地處理故障。目前,雖然DCS系統(tǒng)基本實(shí)現(xiàn)各個(gè)部件的熱插拔,但是在系統(tǒng)運(yùn)行過程中,不在緊急情況下不要進(jìn)行熱插拔。在進(jìn)行系統(tǒng)管理與維護(hù)過程中,操作人員必須穿戴勞保用品,對就地設(shè)備進(jìn)行維護(hù)與管理。
1.1.3 操作員站設(shè)備
設(shè)備在運(yùn)行過程中由于受不可知因素影響,有可能會(huì)出現(xiàn)設(shè)備失靈及死機(jī)現(xiàn)象,此現(xiàn)象出現(xiàn)與系統(tǒng)無關(guān),因此首先要檢查相關(guān)硬件設(shè)施設(shè)備。導(dǎo)致設(shè)備失靈的原因很多,如內(nèi)存條松動(dòng)、硬盤有壞道、冷卻風(fēng)扇運(yùn)轉(zhuǎn)失常等,當(dāng)然有時(shí)也會(huì)發(fā)生人為事故。通常在修改邏輯控制、重新啟動(dòng)系統(tǒng)或下載軟件時(shí),容易發(fā)生操作故障,從而導(dǎo)致設(shè)備的異常操作或設(shè)備系統(tǒng)的癱瘓。因此,工作人員應(yīng)認(rèn)真規(guī)范操作,相關(guān)系統(tǒng)管理人員要不斷進(jìn)行規(guī)章制度的教育工作,將相關(guān)工作落實(shí)到位。
1.1.4 鼠標(biāo)及鍵盤
由于鼠標(biāo)的發(fā)明和使用的普及性,大多數(shù)操作都是通過鼠標(biāo)完成的。鼠標(biāo)發(fā)生磨損的可能性較大,并且高頻次的經(jīng)常性使用,會(huì)加快鼠標(biāo)的損壞,所以必須有幾只鼠標(biāo)備用。當(dāng)鼠標(biāo)指針失靈時(shí),應(yīng)及時(shí)重新啟動(dòng)計(jì)算機(jī),如果鼠標(biāo)指針仍然失靈,應(yīng)立即停止使用并更換新鼠標(biāo)。鍵盤故障主要是由于鍵盤觸點(diǎn)、連接線以及接口問題,用新的鍵盤替換舊的鍵盤可以很容易地處理它。鼠標(biāo)鍵盤硬件的管理較為簡單,但是也不容忽視其重要程度。
1.1.5 電源
隨著科學(xué)技術(shù)的不斷發(fā)展,電源技術(shù)也是更新?lián)Q代較為頻繁,DCS系統(tǒng)發(fā)生該故障越來越少,可能出現(xiàn)的主要問題是插頭與插座接觸不良。因此為了徹底杜絕此類現(xiàn)象的發(fā)生,盡量使用空氣開關(guān),并定期對空氣開關(guān)進(jìn)行檢查。電源硬件發(fā)生故障的頻率最低,但是一旦發(fā)生斷電會(huì)對整個(gè)系統(tǒng)造成重大影響,所以要對電源就行重點(diǎn)管理。
1.2 軟件管理
(1)電子設(shè)備受環(huán)境溫度、電磁、濕度、振動(dòng)、氧化的影響很大。因此,要保證DCS主控室的環(huán)境條件不會(huì)對設(shè)備及系統(tǒng)產(chǎn)生硬性,這樣可以讓其發(fā)揮較長的使用壽命,有效保證了系統(tǒng)的安全運(yùn)行。相比之下,就地設(shè)備的工作環(huán)境相對較差,采取有效措施改善就地設(shè)備的運(yùn)行環(huán)境,同樣對提高系統(tǒng)和設(shè)備的使用壽命具有重要的現(xiàn)實(shí)意義。
(2)嚴(yán)格執(zhí)行工作票制度。在維護(hù)和修理某個(gè)運(yùn)行設(shè)備時(shí),要有規(guī)范的隔離和保護(hù)措施,防止在維修過程中發(fā)生人員傷亡的事故。
(3)應(yīng)用軟件以及系統(tǒng)收集的數(shù)據(jù)要進(jìn)行及時(shí)備份。如果數(shù)據(jù)庫被修改,為了確保數(shù)據(jù)的安全性,要將相關(guān)重要數(shù)據(jù)拷貝出計(jì)算機(jī),以防丟失。
(4)功能測試和軟件檢查。為了認(rèn)真測試軟件的功能,按照設(shè)備說明逐級檢查各層的權(quán)限,對DCS系統(tǒng)軟件和應(yīng)用軟件要進(jìn)行規(guī)范化管理,必須按照審批授權(quán)制度進(jìn)行軟件的更新和升級。責(zé)任人。在系統(tǒng)軟件或者應(yīng)用軟件更新和升級之前,要備份后才能進(jìn)行此項(xiàng)工作。禁止在DCS系統(tǒng)上下載不安全軟件以及其他與系統(tǒng)無關(guān)的軟件。要經(jīng)過相關(guān)人員準(zhǔn)許后才能插入移動(dòng)磁盤,并且系統(tǒng)要裝載防毒軟件,防止系統(tǒng)被惡意入侵。
(5)當(dāng)操作站發(fā)生故障時(shí),應(yīng)及時(shí)調(diào)度運(yùn)行正常的操作站進(jìn)行階梯,并可以快速地對系統(tǒng)故障進(jìn)行分析和現(xiàn)場處理。如果不能排除異常,應(yīng)根據(jù)現(xiàn)場實(shí)際情況果斷處理。當(dāng)同一故障發(fā)生在系統(tǒng)的各個(gè)監(jiān)測站時(shí),要及時(shí)向上級部門報(bào)告并且關(guān)閉設(shè)備,并要求廠家到事故現(xiàn)場及時(shí)檢查和修理。
1.3 人員管理
1.3.1 人員培訓(xùn)
規(guī)范相關(guān)人員的培訓(xùn)和學(xué)習(xí)。維護(hù)人員要對系統(tǒng)的硬件和軟件組成有清楚地了解,并且熟悉網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)以及相關(guān)系統(tǒng)軟件和應(yīng)用軟件的使用方法,熟練掌握各種儀表布線方式,現(xiàn)場儀表發(fā)生故障時(shí)能夠及時(shí)排查診斷;操作人員要熟悉DCS系統(tǒng)的操作界面,熟悉記憶各類生產(chǎn)控制指標(biāo),熟記歷史趨勢曲線存取,對工藝及設(shè)備各項(xiàng)指標(biāo)超限時(shí)能夠及時(shí)反應(yīng)并進(jìn)行處理。
1.3.2 巡回檢查
要求每天至少檢查一次計(jì)算機(jī)房。巡視檢查工作主要包括:詢問操作員是否有警報(bào),各項(xiàng)指標(biāo)是否在正常范圍內(nèi),系統(tǒng)操作是否無卡頓現(xiàn)象;計(jì)算機(jī)房是否有氣味和噪聲;觀察系統(tǒng)的操作歷史和報(bào)警記錄;測試機(jī)房溫度是否正常;檢查滅火器擺放及使用是否正常;檢測空氣開關(guān)處溫度是否在正常范圍內(nèi);觀察機(jī)房墻體密封是否完整等。將檢查檢測結(jié)果一一記錄,并及時(shí)向上級匯報(bào)檢查情況。
1.4 停機(jī)管理
(1)檢查并擰緊各個(gè)連接段。經(jīng)過調(diào)查有因?yàn)镈P總線接頭沒有擰緊導(dǎo)致模塊離線的現(xiàn)象。
(2)檢查接地線。擰緊各種接頭和螺絲螺母。
(3)除塵。包括系統(tǒng)控制柜、主機(jī)和操作站等主要部件,一般使用空氣將灰塵吹出。
(4)數(shù)據(jù)庫修改和下載。
(5)系統(tǒng)備份。要對系統(tǒng)的組態(tài)文件進(jìn)行備份,將其數(shù)據(jù)拷貝到移動(dòng)硬盤當(dāng)中,并要妥善保管備份數(shù)據(jù)。
(6)UPS充放電試驗(yàn)、空調(diào)濾網(wǎng)灰塵清理。如果條件允許,可以清潔外空調(diào)機(jī)組。
(7)查殺病毒木馬。通常DCS系統(tǒng)要使用微軟的MSE殺毒軟件,眼睛使用其他品牌的殺毒軟件,雖然在電腦操作系統(tǒng)中會(huì)經(jīng)常用到各種各樣的殺毒軟件,但其安全性以及可靠性得不到保障。
(8)通道點(diǎn)檢。通常,所有信號模塊的所有通道都不可能全部測試,所以要隨機(jī)采樣,并用高精度標(biāo)準(zhǔn)儀器將信號輸入通道,上位機(jī)應(yīng)該是正常狀態(tài)下指示參數(shù),并按照規(guī)范認(rèn)真填寫DCS確認(rèn)表。
(9)冗余切換測試。其中包括電源、控制器、服務(wù)器、網(wǎng)絡(luò)的冗余切換。我們通常用來模擬最壞的情況,如電源故障和硬件損壞,以便測試:對于電源系統(tǒng),UPS電源和工廠電源開關(guān)分別被切斷時(shí)的狀況。在開關(guān)測試時(shí),應(yīng)仔細(xì)觀察系統(tǒng)電源、系統(tǒng)控制柜、系統(tǒng)網(wǎng)絡(luò)、互供電源、服務(wù)器在不同狀態(tài)下的運(yùn)行情況,檢查監(jiān)控?cái)?shù)據(jù)能否正常刷新,檢查操作指令的發(fā)送以及執(zhí)行是否正常,并對上述檢查結(jié)果進(jìn)行詳細(xì)記錄。
2 DCS系統(tǒng)管理常見問題及解決辦法
2.1 無故監(jiān)控畫面退出
造成這一問題的主要原因是硬件和軟件的兼容性差,物理內(nèi)存和虛擬內(nèi)存在長時(shí)間運(yùn)行條件下導(dǎo)致空間的減少或不足,最終使系統(tǒng)自動(dòng)退出;還有一種可能是系統(tǒng)硬盤碎片較多,導(dǎo)致空間不足,在讀取文件時(shí)需要耗費(fèi)大量時(shí)間進(jìn)行搜索;此外還有就是人為因素導(dǎo)致,操作人員操作不規(guī)范致使監(jiān)控系統(tǒng)自動(dòng)退出。針對以上監(jiān)控畫面無故推出的產(chǎn)生原因,我們要及時(shí)清理空間內(nèi)存,及時(shí)刪除系統(tǒng)運(yùn)行產(chǎn)生的垃圾文件,嚴(yán)格規(guī)范操作人員的操作規(guī)程,減少人為不可知因素。
2.2 組態(tài)文件丟失
主要原因是系統(tǒng)長時(shí)間運(yùn)行,備用鋰電池已經(jīng)沒有充放電功能,電池失效,配置數(shù)據(jù)可能丟失。為解決這一問題,要定期檢查電池使用壽命,并進(jìn)行及時(shí)更換。
2.3 通信故障
主要原因是系統(tǒng)是基于以太網(wǎng),當(dāng)使用用戶增多時(shí),分配到每個(gè)用戶的可用寬帶流量減少,導(dǎo)致網(wǎng)絡(luò)負(fù)荷量較大,會(huì)發(fā)生信息傳輸?shù)臎_突和堵塞,對系統(tǒng)運(yùn)行產(chǎn)生嚴(yán)重影響。為了解決這個(gè)問題,需要對DPU硬件通信卡進(jìn)行升級,優(yōu)化通信協(xié)議和網(wǎng)絡(luò)交換機(jī)。
3 結(jié)語
沒有DCS系統(tǒng)總是安全穩(wěn)定的,同樣也沒有解決方案是完美一勞永逸,對DCS系統(tǒng)出現(xiàn)的各種情況要及時(shí)做出反應(yīng),在日常工作中要重視DCS系統(tǒng)的管理工作以及維護(hù)工作。時(shí)刻保持清醒頭腦,保持積極地工作熱情。一時(shí)的疏忽和運(yùn)氣往往導(dǎo)致災(zāi)難。善于思考,善于總結(jié),提高安全意識,提高業(yè)務(wù)能力,保證管理工作有條不紊進(jìn)行,進(jìn)而使DCS系統(tǒng)健康穩(wěn)定運(yùn)行。
【參考文獻(xiàn)】
[1]祁春念.DCS系統(tǒng)在PVC裝置自動(dòng)化控制中的應(yīng)用[J].自動(dòng)化應(yīng)用,2018(06):31-32.
[2]楊敏,李惠歡.百萬億次高性能計(jì)算系統(tǒng)管理和應(yīng)用的實(shí)踐[J].軟件工程,2018,21(02):24-26+17.
[3]施大陽.太倉電廠DCS系統(tǒng)升級方案選擇及實(shí)施效果研究[D].華北電力大學(xué),2016.
[4]馬瀟.論DCS系統(tǒng)運(yùn)維管理風(fēng)險(xiǎn)及防范對策[J].南方農(nóng)機(jī),2015(01):79-80.
[5]孫勇.DCS系統(tǒng)過程控制功能的設(shè)計(jì)與實(shí)現(xiàn)[D].廈門大學(xué),2013.