梅 靖 中國鐵路上海局集團有限公司上海通信段
GSM-R是基于目前已經(jīng)成熟、通用的公共無線通信系統(tǒng)GSM平臺發(fā)展而來的,專門為滿足鐵路應(yīng)用而開發(fā)的數(shù)字移動通信系統(tǒng)。本文對上海局將鄭徐線BSC從諾基亞MSC割接至上海華為MSC之后,鄭徐高鐵線陸續(xù)發(fā)生列車CTCS-3(以下簡稱C3)降級[1-4]運行的問題,通過截取E接口、A接口信令,對列車降級原因進行分析定位,分析局間切換流程、后續(xù)切換流程、MSC局間消息傳遞流程進行故障定位,對今后的日常維護工作具有一定的指導意義。
2018年8月10日上海通信段完成了鄭徐高鐵(上海局管段)BSC接入新設(shè)MSC,隨即發(fā)現(xiàn)列車運行在徐州東站至銅山線路所區(qū)間內(nèi),上下行均多次發(fā)生列車CTCS-3降級運行。
2018年8月10日凌晨,上海局將鄭徐高鐵線XZBSC1從諾基亞MSC割接至上海華為MSC之后,部分列車在上海局與濟南局交界處發(fā)生C3降級。
(1)徐州東往鄭州方向:徐州東(上海諾基亞MSC)切換ZZ-XZD19(濟南 MSC)成功,ZZ-XZD19切換 ZZ-XZD18 成功,ZZ-XZD18(濟南 MSC)切換 TSXLS01A(上海華為 MSC)失敗后C3降級。
(2)鄭州往徐州東方向:TSXLS01A(上海華為MSC)切換ZZ-XZD18(濟南 MSC)成功,ZZ-XZD18切換 ZZ-XZD19 成功,ZZ-XZD19(濟南 MSC)切換 XuZhouDong(上海華為 MSC)失敗后C3降級。
由此可見,列車降級時主要涉及諾基亞MSC、濟南MSC、華為MSC之間的跨MSC切換,主要涉及后續(xù)切換信令流程。
根據(jù)接入新設(shè)的MSC后5天內(nèi)降級車次比例進行分析,降級車次數(shù)量占總車次數(shù)量30%到48%不等,從降級次數(shù)、降級時間上看無明顯規(guī)律,如表1所示。
表1 降級車次數(shù)量占比分析
因列車降級涉及到上海諾基亞MSC、上海華為MSC、濟南MSC、武漢STP、北京STP,為保證分析數(shù)據(jù)的完整性,多家單位配合共同定位故障點。在濟南局MSC的E接口、A接口和BSC的Abis接口上掛信令儀。在上海局對MSC21和MSC22、XZBSC1、njBSC1的 E接口、A 接口和 Abis接口掛接信令儀,各掛接位置跟濟南局MSC掛接一致。
經(jīng)過對降級車次數(shù)據(jù)進行綜合分析,判斷降級區(qū)段集中在shMSC2、濟南MSC與shMSC1跨局切換區(qū)域,為進一步定位故障原因,通過對A口、E口掛表截取信令。
通過在上海MSC和北京武漢STP之間追蹤到一個切換失敗的記錄進行分析。從信令流程中可見,切換未完成就收到華為的發(fā)REL消息,后面的切換流程中斷。由于A->B->C跨局切換失敗涉及到的三個局的A口和E口消息,僅僅從C局的E口消息無法判斷具體的故障點,需要整個流程完整的信令消息才可用進行更進一步的分析定位。
3.2.1 上行列車(鄭州往上海)E接口信令分析
以2018年8月11日G1914次列車為例對E接口信令分析。上海局華為MSC在10:22:55收到濟南局MSC的后續(xù)切換請求消息,攜帶目的小區(qū)LAC 0X410b以及目的MSC號碼8614900411(上海諾西MSC)。華為MSC向上海諾西MSC發(fā)起切換消息,上海諾西MSC返回切換響應(yīng)消息。局間連接建立完成后,10:22:57上海華為MSC給濟南MSC回后續(xù)切換響應(yīng)消息,此時上海華為MSC進入等待切換檢測消息狀態(tài)。7 s后上海華為MSC未收到上海諾西MSC發(fā)送的切換檢測消息,定時器超時,主動發(fā)出ABORT消息,拆除呼叫。
3.2.2 下行列車(上海往鄭州)E接口信令分析
以2018年8月12日G1879次列車為例對E接口信令分析。08:39:48上海華為MSC接收到來自上海諾西MSC的切換請求消息,上海華為MSC回切換響應(yīng)消息給上海諾西MSC,華為MSC處理機制正常。
3.2.3 A接口信令分析
08:39:48上海華為MSC收到上海諾西MSC發(fā)送的切換請求消息后,上海華為MSC 08:39:48向上海BSC發(fā)送HO_Request,上海BSC返回HO_Request_ack給上海華為MSC。上海華為MSC回切換響應(yīng)消息給上海諾西MSC。但是之后未收到上海鄭徐線BSC發(fā)送的切換檢測消息HO_DETECT消息。08:39:56上海華為MSC發(fā)clear_command消息拆除呼叫。
3.2.4 至武漢STP信令分析
08:39:49上海諾西MSC給上海華為發(fā)IAM消息,進行局間連接建立。08:39:49上海華為MSC給上海諾西MSC回ACM消息,但是由于上海鄭徐線BSC未發(fā)送切換檢測消息給華為MSC,導致上海華為MSC未發(fā)切換檢測消息給上海諾西MSC,約7 s后08:39:56上海華為MSC等待切換檢測定時器超時,華為MSC向上海諾西MSC發(fā)REL(拆線)消息,同時收到了上海諾西MSC發(fā)送的REL消息,拆除呼叫。
3.2.5 原因分析綜述
上海諾西MSC沒有發(fā)送切換檢測消息(HO_DETECT)給上海華為MSC,最終導致上海華為MSC等待切換檢測消息(HO_DETECT)定時器超時,呼叫被釋放,后列車發(fā)生C3降級。
通過濟南局C3三接口檢測A接口和Abis接口數(shù)據(jù)分析發(fā)現(xiàn)濟南的MSC給BSC下發(fā)了HandOverCommand(切換命令),但是BSC收到該消息后并沒有將該消息發(fā)給BTS。
當車載MT設(shè)備在上海諾基亞MSC下起呼鄭徐RBC后,首先切換至濟南MSC,后切換至上海華為MSC下,類似涉及3個MSC的跨局切換稱為“后續(xù)切換”,“后續(xù)切換流程”如圖1所示,MSC-A代表諾基亞MSC,2G-MSC-B代表濟南MSC,2G-MSC-B'代表華為MSC。移動用戶從MSC-A(諾基亞MSC)起呼,切換至2G-MSC-B(濟南MSC),后續(xù)切換至2G-MSC-B'(華為MSC)。
圖1 后續(xù)切換流程圖
(1)BSC-B向2G-MSC-B發(fā)送切換請求消息HANDOVER REQUIRED,該消息中含有切換類型、原因、源位置信息、目標位置區(qū)小區(qū)信息等切換必須的信元。
(2)接收到切換請求消息后,2G-MSC-B根據(jù)查詢所得到的目的位置區(qū)小區(qū)的位置,確定本次切換是局間切換,向2G-MSC-A發(fā)送后續(xù)切換請求MAP_PREPARE_SUBSEQUENT_HANDOVER_REQ消息,該消息中包含了目標MSC的ID、目的位置區(qū)小區(qū)等信息,2G-MSC-A收到消息后,查詢消息中所攜帶的目的位置區(qū)小區(qū)的位置。
(3)2G-MSC-A根據(jù)目的MSC的ID判斷本次切換是后續(xù)切回還是后續(xù)切換到第三方。通過查表確定本次切換為后續(xù)切換到第三方,發(fā)送MAP_PREPARE_HANDOVER_REQ消息,示意2G-MSC-B'進行切換前準備工作,在該消息中帶有HANDOVER REQUIRED消息的所有信息。
(4)2G-MSC-B'請求VLR-B為本次切換分配切換號碼。2G-MSC-B'根據(jù)位置區(qū)小區(qū)號查詢目的位置區(qū)小區(qū)的位置,確定該小區(qū)屬于本局,然后構(gòu)造切換請求消息HANDOVER REQUEST,發(fā)送給目標BSC-B',請求為本次切換分配無線資源。2G-MSC-B'向BSC-B請求無線資源和向VLR-B'請求切換號碼是并行的,2G-MSC-B'只有在收到這兩個請求的回復后,才會向2G-MSC-A回復消息。
(5)BSC-B'分配好無線資源,對2G-MSC-B'回復HANDOVER REQUEST ACKNOWLEDGE消息。
(6)VLR-B'分配好切換號碼后,2G-MSC-B'向2G-MSC-A發(fā)送MAP_PREPARE_HANDOVER_RSP消息,通知2GMSC-A切換準備完成。該消息中含有切換號碼,2G-MSC-A可以通過該號碼實現(xiàn)到2G-MSC-B'的話路路由。
(7)2G-MSC-A對切換號碼做分析,進行出局選路,選路成功后,則發(fā)送IAM消息到2G-MSC-B'。
(8)2G-MSC-B'對IAM消息中攜帶的號碼進行被叫號碼分析,確認是切換號碼,則通知VLR-B'釋放切換號碼。該消息可以在2G-MSC-B'收到IAM消息后的任何時間發(fā)送。同時2G-MSC-B'對2G-MSC-A返回ACM(Address Complete Message)消息。
(9)2G-MSC-A 發(fā)送 MAP_PREPARE_SUBSEQUENT_HANDOVER_RSP消息,通知2G-MSC-B后續(xù)切換準備完成。
(10)2G-MSC-B發(fā)送HANDOVER COMMAND消息給BSC-B,通知MS可以發(fā)送切換了。
(11)BSC-B'檢測到正確的MS后,向2G-MSC-B'發(fā)送HANDOVER DETECT消息。此時MS已經(jīng)檢測到新的無線信道,并且具備接入的條件,但尚未真正切入,對于語音切換,必須要建立話路。
(12)2G-MSC-B'通過 MAP_PROCESS_ACCESS_SIGNALLING消息將HANDOVER DETECT消息透傳給2GMSC-A,2G-MSC-A收到該消息后,請求在MGW-A的上下文中改變端點間的流方向,并進行內(nèi)部接網(wǎng)。
(13)新的話路已經(jīng)建立,用戶繼續(xù)通話或進行其他業(yè)務(wù),BSC-B'向2G-MSC-B'發(fā)送HANDOVER COMPLETE消息上報切換完成。
(14)2G-MSC-B'通過MAP_SEND_END_SIGNAL_REQ消息將HANDOVER COMPLETE消息透傳給2G-MSC-A,通知2G-MSC-A切換已經(jīng)完成。
(15)2G-MSC-B'向 2G-MSC-A 發(fā)送 ANM(Answer Message)消息,切換完成。該消息沒有實際意義,其目的是為了和局間中繼信令保持一致。
(16)2G-MSC-A 向 2G-MSC-B 發(fā)送 REL(Release)消息,通知釋放局間切換時建立的局間電路。
(17)2G-MSC-A向 2G-MSC-B發(fā)送 MAP_SEND_END_SIGNAL_RSP消息,釋放局間切換時占用的MAP(Mobile Application Part)資源。
(18)2G-MSC-B對BSC-B發(fā)送CLEAR COMMAND消息,通知其釋放資源。
(19)BSC-B釋放完地面資源和無線資源后,對2G-MSCB回復CLEAR COMPLETE消息。
(20)通話結(jié)束,2G-MSC-A向2G-MSC-B'發(fā)送REL消息,釋放呼叫以及局間電路。
(21)2G-MSC-A 向 2G-MSC-B'發(fā)送 MAP_SEND_END_SIGNAL_RSP消息,釋放局間MAP資源。
3.5.1 信令分析
綜合信令儀測試手機的數(shù)據(jù)分析,得出以下結(jié)論:
(1)華為MSC作為主控MSC時,沒有收到上海諾基亞MSC發(fā)送的切換檢測消息(HO_DETECT);
(2)諾基亞MSC作為主控MSC時,也沒有收到上海華為MSC發(fā)送的切換檢測消息(HO_DETECT),而華為MSC沒有發(fā)該消息,是因為沒有收到鄭徐BSC發(fā)送的切換檢測消息HO_DETECT消息;
(3)從三接口檢測數(shù)據(jù)看,濟南BSC沒有發(fā)HandOver Command給BTS,因此可以很自然的推測出:濟南收到上?;氐摹扒袚Q響應(yīng)”消息后,BSC沒有將“切換命令”下發(fā)給ATP,導致ATP沒有在上海的小區(qū)下發(fā)送“HO ACCESS”消息,上海側(cè)網(wǎng)元等待消息超時,拆除切換流程,切換失敗。
因此,定位問題的關(guān)鍵節(jié)點在濟南MSC和BSS之間。
3.5.2 故障定位
對接入新MSC后4天內(nèi)所有C3降級車次的信令進行逐一分析,發(fā)現(xiàn)華為MSC從收到濟南切換請求,到往濟南方向發(fā)出切換響應(yīng)消息,至少需要1.4 s以上(不含到武漢到濟南的回程傳輸時間以及武漢STP和濟南MSC的消息處理時間),同時降級車次的切換響應(yīng)時長基本在1.5 s以上,如表2所示。
根據(jù)切換成功與失敗的相應(yīng)時間對比,初步判斷列車跨局切換降級的原因為濟南京滬高BSC的T7計時器配置[5-7]存在問題,并結(jié)合接口檢測看到的切換執(zhí)行時長數(shù)據(jù)中,切換失敗的時長都大于2 s,可能導致濟南局京滬高BSC T7計時器超時。
3.5.3 BSC T7定時器參數(shù)說明
T7計時器在流程中的起止位置:出BSC切換時,BSC上報切換請求消息后,T7定時器啟動;在T7定時器超時前,如果BSC收到切換請求應(yīng)答消息,T7定時器停止;T7定時器超時后,BSC進行出BSC切換失敗處理。其位置如圖2所示。
該定時器設(shè)置過長,可能會浪費信道資源,造成擁塞;該定時器設(shè)置過短,可能會影響切換成功率。根據(jù)不同設(shè)備廠家提供的產(chǎn)品手冊顯示,華為BSC,T7定時器默認值為10 s,無需修改。而諾西BSC設(shè)備其產(chǎn)品手冊中有如下描述,“特別在MSC之間切換時,等待HO CMD消息的時間可能超過3 s”,因此跨MSC切換時建議該值設(shè)置不低于3 s,具體值看實際情況。
表2 切換響應(yīng)時間對比
因為濟南局核心網(wǎng)京滬高BSC T7定時器的設(shè)置為2 s,在總公司通信中心指導下,濟南局將濟南京滬高BSC T7定時器設(shè)定為3.5 s后,經(jīng)過5天的驗證,鄭徐高鐵線跨MSC切換時未再發(fā)生C3降級。
本次故障的定位主要通過截取E口、A口信令,深入分析局間切換流程、后續(xù)切換流程、MSC局間消息傳遞流程以及信令中的異常環(huán)節(jié),最終定位列車C3故障原因為濟南局BSC的T7計時器設(shè)置過短導致。同時通過對此次故障處置,發(fā)現(xiàn)對于跨3個不同廠家的MSC切換場景,如果BSC T7定時器設(shè)定為2 s過短,會導致一部分車次由于T7定時器超時,BSC即使收到了切換命令(HandOver Command)也將其丟棄而不處理,導致后續(xù)的切換流程無法繼續(xù)執(zhí)行,從而導致切換失敗。通過對此類故障的排查流程,以及處置措施,對今后的日常維護工作具有一定的指導意義。
圖2 T7計時器在流程中的起止位置