高正明 張慶軍 包偉華
(上海自動(dòng)化儀表股份有限公司,上海 200072)
工業(yè)以太網(wǎng)MRP協(xié)議及多主機(jī)制的研究
高正明 張慶軍 包偉華
(上海自動(dòng)化儀表股份有限公司,上海 200072)
針對工業(yè)通信網(wǎng)絡(luò)高可用性的要求,采用MRP協(xié)議組建的環(huán)型冗余網(wǎng)絡(luò),在故障發(fā)生時(shí)能夠迅速建立起新的網(wǎng)絡(luò)拓?fù)鋪砘謴?fù)網(wǎng)絡(luò)通信。通過研究MRP協(xié)議給出的環(huán)型拓?fù)湟蕴W(wǎng)網(wǎng)絡(luò)冗余的解決方案,在介紹MRP協(xié)議工作原理的基礎(chǔ)上,研究了MRP協(xié)議的多主站連接時(shí)的協(xié)議機(jī)制。采用多主協(xié)議能夠提高環(huán)網(wǎng)的可靠性,便于網(wǎng)絡(luò)的管理和維護(hù)。
工業(yè)通信網(wǎng)絡(luò) 高可用性 環(huán)網(wǎng)冗余 MRP協(xié)議 多主站
媒體冗余協(xié)議(media redundancy protocol,MRP),是基于環(huán)型拓?fù)涞木W(wǎng)絡(luò)恢復(fù)協(xié)議,采用網(wǎng)絡(luò)冗余的方法提高網(wǎng)絡(luò)的可用性。當(dāng)環(huán)型網(wǎng)絡(luò)中的交換機(jī)或交換機(jī)內(nèi)部的鏈路發(fā)生一個(gè)單一故障時(shí),MRP協(xié)議能夠在一定的時(shí)間內(nèi)確定性地恢復(fù)網(wǎng)絡(luò)的功能,滿足工業(yè)網(wǎng)絡(luò)的可用性要求。隨著技術(shù)和應(yīng)用需要的不斷提高,MRP協(xié)議還定義了單環(huán)下的多個(gè)主站協(xié)議和機(jī)制,并向IEC(國際電工委員會(huì))/SC65C/WG15工作組進(jìn)行了提交。本文的主要內(nèi)容就是簡要介紹及研究MRP的技術(shù)。
媒體冗余協(xié)議(MRP),是基于環(huán)型拓?fù)涞木W(wǎng)絡(luò)恢復(fù)協(xié)議,典型的MRP協(xié)議的冗余網(wǎng)絡(luò)拓樸圖如圖1[1]所示。環(huán)中的MRP兼容節(jié)點(diǎn)可以是MRP兼容交換機(jī),也可以是MRP兼容終端節(jié)點(diǎn),且必須有兩個(gè)環(huán)端口。每個(gè)MRP兼容節(jié)點(diǎn)都能夠檢測或恢復(fù)交換機(jī)內(nèi)部的鏈路故障,也能夠檢測或恢復(fù)相鄰節(jié)點(diǎn)的故障。環(huán)中的MRP兼容節(jié)點(diǎn)有兩種角色:媒體冗余管理者(media redundancy manager,MRM)、媒體冗余客戶(media redundancy client,MRC)。MRM和MRC的角色可以互相調(diào)換,但運(yùn)行的網(wǎng)絡(luò)中只允許一臺(tái)交換機(jī)處于MRM工作狀態(tài)。
MRP協(xié)議組成的環(huán)網(wǎng)在物理上連接成環(huán),在邏輯上實(shí)際處于鏈狀結(jié)構(gòu),并且要避免形成環(huán)路。為了確保鏈路故障恢復(fù)時(shí)網(wǎng)絡(luò)在邏輯上不成環(huán),當(dāng)網(wǎng)絡(luò)上鏈路發(fā)生中斷時(shí),與該鏈路連接的兩個(gè)MRC環(huán)端口設(shè)為阻塞狀態(tài),以中止正常業(yè)務(wù)報(bào)文的轉(zhuǎn)發(fā)。并且,MRM將原處于阻塞狀態(tài)的環(huán)端口設(shè)為轉(zhuǎn)發(fā)狀態(tài),使得通信鏈路恢復(fù),實(shí)現(xiàn)冗余功能。當(dāng)網(wǎng)絡(luò)上鏈路故障恢復(fù)時(shí),MRM在檢測到環(huán)閉的情況下將一環(huán)端口設(shè)為阻塞狀態(tài),此時(shí),MRC再將原處于阻塞狀態(tài)的環(huán)端口設(shè)為轉(zhuǎn)發(fā)狀態(tài)。
為了提高協(xié)議魯棒性,避免在鏈路接觸不良時(shí)導(dǎo)致協(xié)議時(shí)序的不確定性,在MRC中設(shè)置兩個(gè)暫態(tài),單連接暫態(tài)(DE)和雙連接暫態(tài)(PT),即對應(yīng)于只有一個(gè)環(huán)端口連接時(shí)的暫態(tài)和對應(yīng)于兩個(gè)環(huán)端口都連接時(shí)的暫態(tài)。當(dāng)MRC只有一個(gè)環(huán)端口連接,并檢測到另一環(huán)端口剛連接時(shí),先進(jìn)入雙連接暫態(tài),啟動(dòng)連接定時(shí)器,在連接定時(shí)器超時(shí)或者從站收到拓?fù)涓淖儓?bào)文(TopologyChange)后再達(dá)到雙連接穩(wěn)態(tài)(PT_IDLE)。當(dāng)MRC兩個(gè)環(huán)端口都已連接,并檢測到一環(huán)端口剛斷開時(shí),先進(jìn)入單連接暫態(tài),啟動(dòng)斷開定時(shí)器,在斷開定時(shí)器超時(shí)或者從站收到拓?fù)涓淖儓?bào)文(TopologyChange)后再達(dá)到單連接穩(wěn)態(tài)(DE_IDLE)。
MRM和MRC兩個(gè)環(huán)端口具有下列3種狀態(tài)。
(1)Disabled:所有的幀都被阻塞。
(2)Blocked:除了以下測試幀,其他幀都被阻塞。
①來自MRM的MRP_TopologyChange幀和MRP_ Test幀。
②來自MRC的MRP_LinkChange幀。
③ IEEE 802.1D中定義的其他協(xié)議的幀,如LLDP、PTP。
(3)Forwarding:根據(jù)IEEE 802.1D的轉(zhuǎn)發(fā)行為轉(zhuǎn)發(fā)所有的幀。
MRM通過以下步驟控制環(huán)的狀態(tài)。
①按照預(yù)先配置的時(shí)間周期,通過兩個(gè)環(huán)端口向環(huán)的兩個(gè)方向發(fā)送MRP_Test幀。
② 將一個(gè)環(huán)端口設(shè)置為 Forwarding狀態(tài),如果MRM接收到它自己發(fā)出的MRP_Test幀,這意味著整個(gè)環(huán)是閉合的(見圖1),則將另一個(gè)環(huán)端口設(shè)置為Blocked狀態(tài)。
③如果MRM在配置的時(shí)間內(nèi)不能收到它自己發(fā)出的MRP_Test幀,這意味著環(huán)是斷開的[1],則將兩個(gè)環(huán)端口都設(shè)置為Forwarding狀態(tài)。
MRM不會(huì)將MRP_Test幀、MRP_TopologyChange幀和MRP_LinkChange幀轉(zhuǎn)發(fā)到非環(huán)端口,并且也不會(huì)在其自身的兩個(gè)環(huán)端口間轉(zhuǎn)發(fā)這3種幀,以避免無限循環(huán)。
MRM通過MRP_TopologyChange幀向環(huán)中的MRC指示環(huán)狀態(tài)的改變。
MRC在環(huán)中的行為如下。
①每個(gè)MRC將一個(gè)端口收到的MRP_Test幀轉(zhuǎn)發(fā)到另一個(gè)環(huán)端口,反之亦然。
②如果MRC檢測到一個(gè)環(huán)端口鏈路的故障或恢復(fù),MRC可以通過其環(huán)端口發(fā)送MRP_LinkChange幀通知這個(gè)鏈路的改變。每個(gè)MRC將一個(gè)端口收到的MRP_LinkChange幀轉(zhuǎn)發(fā)到另一個(gè)環(huán)端口,反之亦然。
③ 每個(gè) MRC將一個(gè)端口收到的 MRP_ TopologyChange幀轉(zhuǎn)發(fā)到另一個(gè)環(huán)端口,反之亦然。同時(shí),每個(gè)MRC都需要處理這種幀,并清空其過濾數(shù)據(jù)庫(filtering data base,F(xiàn)DB)。
如果MRM收到了MRP_LinkChange幀(MRP_ LinkUp和MRP_LinkDown),MRM將減小測試間隔時(shí)間,加速發(fā)送MRP_Test幀檢測環(huán)是否斷開。
MRM發(fā)送給MRC的MRP_TopologyChange幀是帶延時(shí)的,在這個(gè)時(shí)間以后環(huán)的拓?fù)洳疟桓淖?。表示這個(gè)延時(shí)的參數(shù)被稱為MRP_Interval。只有這個(gè)時(shí)間耗盡以后,所有的MRC才清空FDB。
圖2 MRM在一個(gè)斷開的環(huán)中的狀態(tài)Fig.2 The state of MRM in an opened ring
MRM在一個(gè)斷開的環(huán)中的狀態(tài)如圖2所示。
在環(huán)網(wǎng)中有多個(gè)MRM(MRP主站)的情況下,由于MRM會(huì)阻塞環(huán)端口,多個(gè)MRM會(huì)將環(huán)分割成多段,導(dǎo)致環(huán)網(wǎng)不能正常工作。所以,環(huán)網(wǎng)中只能有一個(gè)是處于工作狀態(tài)的MRM??墒牵诃h(huán)網(wǎng)中如果只有一個(gè)MRM,當(dāng)MRM出現(xiàn)故障時(shí),整個(gè)網(wǎng)絡(luò)的狀況將處于未知的狀況,這又會(huì)影響系統(tǒng)的可靠性。
針對上述問題,MRP協(xié)議引入了多主站的機(jī)制。具體來說,就是開始支持多主站的媒體冗余自動(dòng)管理者(media redundancy automanager,MRA)競選機(jī)制。對于具備MRM能力的設(shè)備,出廠時(shí)其缺省模式可以配置成MRA模式,這樣在設(shè)備啟動(dòng)后進(jìn)行自動(dòng)競選,直到產(chǎn)生一個(gè)唯一的MRM,其他的作為MRC。
啟動(dòng)時(shí)MRP環(huán)網(wǎng)中的各個(gè)角色如圖3所示[3]。圖3的MRP環(huán)網(wǎng)中有2個(gè)處于MRA角色的設(shè)備。競選的主要原理就是每個(gè)MRA定義了一個(gè)優(yōu)先級的參數(shù),當(dāng)兩個(gè)設(shè)備優(yōu)先級的參數(shù)相同時(shí),比較設(shè)備的MAC地址,MAC地址越小,設(shè)備的優(yōu)先級越高。MRA通過優(yōu)先級參數(shù)和MAC地址的組合保證了優(yōu)先級的唯一性。
圖3 啟動(dòng)時(shí)MRP環(huán)網(wǎng)中的各個(gè)角色Fig.3 Each role of MRP ring at network startup
設(shè)備啟動(dòng)后,MRA會(huì)將優(yōu)先級參數(shù)放在MRP_Test報(bào)文中進(jìn)行發(fā)送,其他的MRA在收到報(bào)文后,會(huì)將報(bào)文中的優(yōu)先級與自身的進(jìn)行比較,如果比自己高,就放棄MRA的角色,進(jìn)入MRC的角色。競選后MRP環(huán)網(wǎng)中的各個(gè)角色如圖4所示[2]。圖4中,具有最高優(yōu)先級的設(shè)備的角色由MRA轉(zhuǎn)為MRM,并開始管理環(huán)網(wǎng)。
圖4 競選后MRP環(huán)網(wǎng)中的各個(gè)角色Fig.4 Each role in MRP ring after the election
競選機(jī)制的好處是,如果選出的MRM不在網(wǎng)絡(luò)中或者出現(xiàn)故障時(shí),網(wǎng)絡(luò)中會(huì)自動(dòng)進(jìn)行重新競選,上次選舉中第二優(yōu)先級的設(shè)備會(huì)成為MRM。當(dāng)新的MRA設(shè)備加入到網(wǎng)絡(luò)中時(shí),也會(huì)進(jìn)行重新競選。如果一個(gè)不支持MRA的MRM加入到網(wǎng)絡(luò)中,所有的MRA將退回到MRC角色,競選取消,保證環(huán)網(wǎng)中MRM的唯一性。
MRM主站競選的過程如圖5所示[1]。圖5中共有4個(gè)MRA的設(shè)備,在設(shè)備上電時(shí)將競選MRM。首先4個(gè)MRA都將向2個(gè)環(huán)端口發(fā)送包含自己優(yōu)先級信息的MRP_Test報(bào)文,收到MRP_Test報(bào)文后不再轉(zhuǎn)發(fā)而進(jìn)行優(yōu)先級比較。如果接收到的優(yōu)先級低于自己的優(yōu)先級,則發(fā)送負(fù)響應(yīng)報(bào)文MRP_TestMgrNAck。圖5中,MRA3和MRA4低于MRA1和MRA2,因此MRA3和MRA4將收到相鄰的MRA1、MRA2的負(fù)響應(yīng)報(bào)文。
MRA收到負(fù)響應(yīng)報(bào)文后,將記錄高優(yōu)先級MRA的MAC地址和優(yōu)先級,并將角色轉(zhuǎn)換為MRC;同時(shí),通過2個(gè)環(huán)端口向高優(yōu)先級MRA發(fā)送MRP_TestPropagate報(bào)文。圖5中,MRA3和MRA4由于優(yōu)先級低,將進(jìn)入MRC角色,同時(shí)開始正常轉(zhuǎn)發(fā)MRP_Test報(bào)文。
這時(shí)轉(zhuǎn)換為MRC的MRA設(shè)備需要根據(jù)轉(zhuǎn)發(fā)并接收到的MRP_Test監(jiān)視并記錄高優(yōu)先級設(shè)備的生存狀態(tài)。同時(shí),也需要根據(jù)MRP_TestPropagate來更新網(wǎng)絡(luò)中高優(yōu)先級的設(shè)備。這樣做的目的是監(jiān)視高優(yōu)先級的設(shè)備的生存狀態(tài)。當(dāng)它發(fā)現(xiàn)高優(yōu)先設(shè)備發(fā)送的MRP_ Test報(bào)文超時(shí)時(shí),它會(huì)重新進(jìn)入MRA角色,并發(fā)動(dòng)新的MRM競選,實(shí)現(xiàn)了多主備份和冗余管理。
圖5中的MRA3和MRA4進(jìn)入到MRC角色后,MRA1和MRA2將可以看到相互的MRP_Test報(bào)文,MRA1和MRA2將進(jìn)行競選,MRA1最終成為唯一的MRM。
圖5 主站競選的過程Fig.5 Election process of the MRM
使用負(fù)響應(yīng)報(bào)文進(jìn)行握手的目的主要是保證高優(yōu)先級的MRA在環(huán)內(nèi),因?yàn)橛锌赡苡械慕粨Q機(jī)通過環(huán)端口連接到環(huán)網(wǎng)中的非環(huán)端口。如果環(huán)網(wǎng)中交換機(jī)的非環(huán)端口沒有進(jìn)行報(bào)文過濾,環(huán)網(wǎng)外部的MRP_Test報(bào)文將會(huì)被引入到環(huán)網(wǎng)中。
環(huán)網(wǎng)外的MRA如圖6所示[1]。
圖6 環(huán)網(wǎng)外的MRAFig.6 The MRA located outside MRP ring
圖6中,實(shí)線箭頭表示MRP_Testframe:T1、T2,虛線箭頭表示MRP_TestMgrNAck:NA1。圖6中MRA2就是在環(huán)網(wǎng)外部的設(shè)備。MRA2的環(huán)端口接入到MRP環(huán)的非環(huán)端口上,如果MRA1的優(yōu)先級低于MRA2的優(yōu)先級,MRA1將會(huì)收到MRA2的MRP_Test報(bào)文;但是MRA2收不到MRA1的MRP_Test報(bào)文,MRA2就不會(huì)發(fā)送負(fù)響應(yīng)報(bào)文,這樣MRA1就可以保持在MRM狀態(tài)。如果MRA1的優(yōu)先級高于MRA2,由于MRA2收不到負(fù)響應(yīng)報(bào)文,因此就不會(huì)影響網(wǎng)絡(luò)的正常競選。
需要注意的是,在MRM競選時(shí),為了避免環(huán)路,MRA設(shè)備需要將第二個(gè)環(huán)端口設(shè)置為阻塞狀態(tài)。MRP_TestPropagate報(bào)文主要用來防止轉(zhuǎn)化為MRC的MRA所監(jiān)視的高優(yōu)先級設(shè)備轉(zhuǎn)化為MRC后,停止發(fā)送MRP_Test報(bào)文,再重新競選,導(dǎo)致網(wǎng)絡(luò)出現(xiàn)迭代現(xiàn)象。
MRA多主協(xié)議的實(shí)施,給設(shè)備和維護(hù)也提供了便利,不一定再需要手工維護(hù)和配置每臺(tái)設(shè)備的信息,設(shè)備的添加和移除也可以大大減少網(wǎng)絡(luò)維護(hù)的工作量。
MRP協(xié)議實(shí)現(xiàn)環(huán)形網(wǎng)絡(luò)的冗余,與傳統(tǒng)的生成樹協(xié)議(spanning tree protocol,STP)和快速生成樹協(xié)議(rapid spanning tree protocol,RSTP)相比,網(wǎng)絡(luò)恢復(fù)時(shí)間提高了一個(gè)數(shù)量級,實(shí)現(xiàn)了快速的網(wǎng)絡(luò)恢復(fù),能夠滿足工業(yè)控制系通過與通信網(wǎng)絡(luò)的高可用性的要求。MRP尤其支持多主站,實(shí)現(xiàn)了通信鏈路的冗余與通信設(shè)備冗余的結(jié)合,也極大地方便了設(shè)備的管理和維護(hù)。
[1]IEC 62439 Industrial communication networks-high availability automation networks Part2:media redundancy protocol(MRP)[S].2010.
[2] Hansen K.Redundancy Ethernet in industrial automation[C]//Proceedings of 10th IEEE International Conference on Emerging Technologies and Factory Automation ETFA 2005,2005:941-947.
[3]SeifertR,Edwards J.The all-new Switch book:the complete guide to LAN switching technology[M].New Jersey:John Wiley&Sons,Inc,2000.
[4]Tanenbaum A S.計(jì)算機(jī)網(wǎng)絡(luò)[M].熊桂喜,王小虎,譯.3版.北京:清華大學(xué)出版社,2003.
[5]Cena G,Valenzano A,Vitturi S.Hybrid wired/wireless networks for real-time communications[J].Industrial Electronics Magazine,IEEE,2008,2(1):8-20.
[6]Kirrmann H,Hansson M,Muri P.IEC 62439 PRP:Bumpless recovery for highly available,hard real-time industrial networks[C]//IEEE Conference on Emerging Technologies&Factory Automation,ETFA,2007:1396-1399.
[7]程曉琳,徐用愚.現(xiàn)場總線控制網(wǎng)絡(luò)模型與網(wǎng)絡(luò)集成[J].測控技術(shù),2000,19(10):35-37.
[8]夏鋒,孫優(yōu)賢.基于交換式以太網(wǎng)實(shí)現(xiàn)多現(xiàn)場總線集成[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2003,15(4):58-62.
[9]楊清宇.現(xiàn)場總線實(shí)時(shí)分布式控制網(wǎng)絡(luò)技術(shù)研究[D].西安:西安交通大學(xué),2003.
[10]Prytz G.Redundancy in industrial Ethernet networks[C]//Proceedings of 6th IEEE InternationalWorkshop on Factory Communication Systems WFCS,2006:380-385.
[11]陸愛林,馮冬芹,榮岡,等.工業(yè)以太網(wǎng)的發(fā)展趨勢[J].自動(dòng)化儀表,2004,25(2):1-4.
[12]郭俊能.寬帶傳輸網(wǎng)絡(luò)生存性及自愈技術(shù)研究[D].重慶:重慶大學(xué),2000.
Study on Media Redundancy Protocol and Multiple Media Redundancy Manager
In accordance with the requirementof high availability for industrial communication network,by adopting the redundant ring network based on media redundancy protocol(MRP);when any failure occurs,the communication can be recovered quickly via establishing a new network topology.Through studying the solution of ring topological Ethernet redundancy given by MRP,on the basis of introduction of the working principle ofMRP,themechanism ofmultiple MRM is studied.Withmultiple MRM,the reliability of the ring can be improved,and the management and maintenance of the network may bemore convenient.
Industrial communication network High availability Ring redundancy Media redundancy protocol(MRP) Multiple media redundancy manager(MRM)
TP29
A
修改稿收到日期:2014-06-26。
高正明(1959-),男,1983年畢業(yè)于上海市業(yè)余工業(yè)大學(xué)輕工分校自動(dòng)控制專業(yè),獲學(xué)士學(xué)位,高級工程師;主要從事智能儀表及自動(dòng)控制系統(tǒng)的研究。