田文亮
(內蒙古華伊卓資熱電有限公司,內蒙古 烏蘭察布 012300)
華伊卓資熱電有限公司1#~4#機組為200MW燃煤發(fā)電機組,DCS系統(tǒng)采用國電南自公司生產的TCS3000分散控制系統(tǒng),PCS3000系統(tǒng)的核心控制器采用MOXoc開放標準式控制系統(tǒng)。控制器可以通過工業(yè)以太網TCP/IP、MODBUS以及其他現(xiàn)場總線提供良好的通訊能力,網絡結構為環(huán)型雙網結構。
1#、2#機組屬于兩機一控的控制方式,1#、2#機組獨立監(jiān)控操作;公用控制系統(tǒng)納入#1機組監(jiān)控操作,DCS網絡拓撲結構如圖1所示。
圖1
從圖中可以看出,上層網絡為監(jiān)控層,通訊速率100Mbps,負責5臺操作員站、歷史站的通訊;下層網絡為控制層,通訊速率10/100Mbps自適應,負責1#機組15對控制器及公用控制系統(tǒng)3對控制器的通訊;且SIS系統(tǒng)通訊的OPC服務器與下層網絡直接相連。
2018年11月6日開始,1#機組DCS多次出現(xiàn)了多個控制器無規(guī)律的反復脫網的情況, 下午并出現(xiàn)與集團網絡中斷現(xiàn)象。熱工維護人員檢查了供電電源等方面,未發(fā)現(xiàn)問題,后將OPC電腦退出運行,控制器脫線的情況有了緩解,于11月6日下午控制器全部恢復上網。11月14日將OPC服務器由原來與下層網絡連接改為與上層網絡連接,至今為止,沒有再出現(xiàn)控制器脫網現(xiàn)象。
根據(jù)此次1#機組DCS控制器長時間的頻繁脫網的發(fā)生過程,根據(jù)檢查及分析網絡的高負荷的因素如下,需要進行完善和防范。
能夠致使1#機組DCS控制網絡負荷高的因素有如下幾個方面。
(1)由于控制網絡負荷較高,網絡的穩(wěn)定性差,某個控制器出錯或通訊端口有接觸不良時,也會發(fā)生誤碼,丟包現(xiàn)象明顯,導致信息重復發(fā)送,致使網絡負荷增大。
(2)當某個控制器出現(xiàn)瞬間高負荷而導致網絡堵塞時,其他控制器就會發(fā)生連鎖反應,從加劇網絡堵塞的嚴重程度,從測試報告中:單個控制器網口負荷的最小為2.1%,最大為3.3%。通過這個測試結果來分析,控制網絡主干負荷會是很高的。
(3)控制網絡(下層網)配置過于緊湊,控制網絡有兩臺Cisco Catalyst 2960 24端
口網管型交換機組成,交換機的24端口全部被使用,使每個端口的使用帶寬相對變窄,在瞬間負荷較大時,可能出現(xiàn)擁堵現(xiàn)象,致使控制器脫網并發(fā)生切換。一般來說,24端口的交換機使用18個端口為宜。
OPC站接入控制網絡(下層網)上,致使控制網絡負荷增大,我廠1#機組DCS的數(shù)
據(jù)流向如圖2所示。
圖2
從圖中OPC站直接接入控制網絡(下層網),它的位置級別等同于服務器,和服務器一樣的速度讀取各控制器的所有數(shù)據(jù),原本控制器向監(jiān)控網絡傳輸數(shù)據(jù)的對象只有A、B服務器,然而增加一個OPC站,致使控制網絡負荷比原來增大50%,這顯然是控制網絡及控制器額外的負擔。
DCS控制網絡通訊速率為10/100Mbps自適應,也就是說一個控制器上網可以享受每秒最大通訊數(shù)據(jù)量為100Mbit,再把控制器的數(shù)據(jù)、服務器向操作員發(fā)送控制器的指令數(shù)據(jù)都加起來是非常大的數(shù)據(jù)量,如果端口流量控制不加以限制,足以造成網絡癱瘓。
OPC站是向SIS傳輸數(shù)據(jù),因為SIS沒有參與控制的功能,所以不需要與操作員站一樣的實時等級的數(shù)據(jù),一般來說只要分鐘級的實時程度。
(1)每臺機組DCS控制網絡增加一對交換機。每臺機組DCS的控制網絡增加一對Cisco24端口網管型交換機,使控制器通訊端口分配在3對交換機上,緩解交換機過于緊湊的配置,以增加控制器使用的相對帶寬,緩解網絡擁堵現(xiàn)象。
(2)1#~4#機組OPC的網線也改接為監(jiān)控層網絡。把1#~4#機組的OPC由原來掛在控制網絡上,也改為分別掛各自在監(jiān)控層網絡(上層網)上,這樣減少控制網絡負荷,優(yōu)化后1#~4#機組DCS的數(shù)據(jù)流向如圖3所示。
圖3
(3)DCS控制網絡的交換機端口加流量控制。DCS的每個控制器對外周期的數(shù)據(jù)量是固定的;還有一些隨機數(shù)據(jù)量,例如:I/O報警信號的數(shù)據(jù)量,但是可估計的,考慮到估計的誤差和允許網絡有丟包重發(fā)的情況,因此再留有一些裕量,把它們的數(shù)據(jù)量加起來,就是這個控制器網絡數(shù)據(jù)流量,以此為依據(jù)做交換機端口流量限制。
(4)降低OPC數(shù)據(jù)傳輸率。OPC電腦是向SIS傳輸數(shù)據(jù),因為SIS沒有參與控制的功能,也不需要有分析事故的數(shù)據(jù),所以,不需要與操作員站一樣的實時等級的數(shù)據(jù),一般來說只要分鐘級的實時程度為宜。
(5)在檢修時進行一次DCS網絡負荷測試。這次事件后,OPC電腦改為從服務器讀取數(shù)據(jù),又對OPC去SIS的數(shù)據(jù)進行了流量限制,控制網絡的負荷應該有一些改善,從而需要進行一次DCS網絡負荷測試,以檢驗效果;但因為機組在運行時,考慮到機組的運行安全,不推薦在線測量網絡負荷,但可在機組檢修時進行測量;推薦在測量單個控制器網口負荷的基礎上,還要測量網絡主干的平均負荷及最大負荷,這樣的數(shù)據(jù)更有參考價值。
熱工維護人員要求對DCS系統(tǒng)的故障判斷及處理方法應熟練掌握。要對DCS系統(tǒng)和SIS系統(tǒng)的組成結構有所了解,且要求掌握對通信、網絡、計算機技術等相應的知識。在日常的維護過程中,應加強對系統(tǒng)的管理及對維護人員的系統(tǒng)培訓工作,提高系統(tǒng)安全可靠的運行。