桓汗晶 北京中創(chuàng)信測(cè)信息技術(shù)有限公司監(jiān)測(cè)系統(tǒng)產(chǎn)品部產(chǎn)品經(jīng)理
中創(chuàng)信測(cè)技術(shù)專欄
移動(dòng)TCP成功率提升專項(xiàng)分析報(bào)告
桓汗晶 北京中創(chuàng)信測(cè)信息技術(shù)有限公司監(jiān)測(cè)系統(tǒng)產(chǎn)品部產(chǎn)品經(jīng)理
編者按:移動(dòng)用戶上網(wǎng)過程中的關(guān)鍵流程有很多,其中TCP建立涉及到服務(wù)器和無線網(wǎng)絡(luò)之間的配合,任何一步的失敗都會(huì)導(dǎo)致后續(xù)業(yè)務(wù)資源無法獲得,因此顯得尤為重要。北京中創(chuàng)信測(cè)信息技術(shù)有限公司檢測(cè)系統(tǒng)產(chǎn)品部桓汗晶撰寫了《移動(dòng)TCP成功率提升專項(xiàng)分析報(bào)告》一文,該文依托中創(chuàng)信令監(jiān)測(cè)系統(tǒng),通過統(tǒng)計(jì)移動(dòng)某地的TCP建立成功率,從多維度進(jìn)行分析,定位了TCP建立指標(biāo)存在的問題,并通過各種優(yōu)化措施進(jìn)行提升,有效地提升了用戶上網(wǎng)感知,可供相關(guān)技術(shù)人員學(xué)習(xí)參考。
TCP建立是移動(dòng)用戶上網(wǎng)過程當(dāng)中的關(guān)鍵流程,由于TCP建立涉及到服務(wù)器和無線網(wǎng)絡(luò)之間的配合,任何一步的失敗都會(huì)導(dǎo)致后續(xù)的業(yè)務(wù)資源無法獲得。本文依托中創(chuàng)信令監(jiān)測(cè)系統(tǒng),通過對(duì)移動(dòng)某地TCP建立成功率進(jìn)行統(tǒng)計(jì),從SGSN、TCP目的服務(wù)器和用戶IP段多維度進(jìn)行分析,定位了某地TCP建立指標(biāo)存在的問題,通過各種優(yōu)化措施,提升了某地TCP的建立成功率指標(biāo),有效地提升了用戶上網(wǎng)感知。
信令監(jiān)測(cè) TCP 用戶 IP緩存服務(wù)器
TCP_LINK_SETUP(TCP三握手)指用戶終端與訪問網(wǎng)址的TCP傳輸鏈路的連接過程,是用戶在業(yè)務(wù)下載或上傳前的重要流程。TCP三握手的成功率和時(shí)延的好壞會(huì)直接影響用戶的上網(wǎng)感知,本報(bào)告將對(duì)TCP三握手的性能進(jìn)行多維度的評(píng)估,重點(diǎn)分析SP和核心網(wǎng)側(cè)問題影響TCP性能的情況。
為了更好地分析TCP三握手性能,將TCP三握手性能分為網(wǎng)絡(luò)側(cè)和無線側(cè)性能兩部分。其中,網(wǎng)絡(luò)側(cè)性能真實(shí)反映網(wǎng)絡(luò)側(cè)IP的響應(yīng)性能情況,無線側(cè)性能則與終端和無線環(huán)境關(guān)系密切。TCP建立詳細(xì)流程如圖1所示。
統(tǒng)計(jì)2015年4月21—5月3日某地全網(wǎng)TCP三握手成功率指標(biāo)情況,具體如圖2所示。
從圖2可以看到,對(duì)比跟蹤多天TCP三握手成功率指標(biāo)發(fā)現(xiàn),某地全網(wǎng)TCP三握手成功率較低,在70%左右,其中無線側(cè)成功率保持在91%~93%之間,核心網(wǎng)側(cè)成功率較低,在72%~78%之間。由于核心網(wǎng)側(cè)TCP三握手成功率較低,從而導(dǎo)致某地全網(wǎng)TCP三握手成功率較低。
圖1 TCP三握手流程
從前文可知,目前某地的整體TCP建立成功率僅為70%,其中核心網(wǎng)側(cè)的TCP建立成功率較低,下文主要從3個(gè)維度對(duì)TCP建立失敗率較高進(jìn)行分析。
3.1 SGSN維度分析
從SGSN維度分析,統(tǒng)計(jì)各個(gè)SGSNIP的TCP建立成功率指標(biāo),具體如圖3所示??梢?,除112.59.129.134和112.59.129.149的核心網(wǎng)側(cè)響應(yīng)成功率較低外,其余SGSN級(jí)分布指標(biāo)正常,未發(fā)現(xiàn)明顯異常。需核實(shí)112.59.129.134和112.59.129.149核心網(wǎng)TCP三握手響應(yīng)成功率的低問題。
無線側(cè)三握手成功率中SGSN_IP地址為112.159開頭地址三握手成功率高于IP地址為10.174開頭的地址成功率,表明3G無線網(wǎng)絡(luò)質(zhì)量明顯高于2G網(wǎng)絡(luò)。3G的112.59.129.134地址無線側(cè)響應(yīng)成功率較其余地址明顯下降,需進(jìn)行重點(diǎn)分析。
3.2 訪問目標(biāo)IP維度分析
針對(duì)某地全網(wǎng)訪問目的服務(wù)器進(jìn)行分析,發(fā)現(xiàn)多個(gè)訪問量很大的目的服務(wù)器,其TCP三握手成功率很低,主要為核心網(wǎng)側(cè)響應(yīng)成功率低導(dǎo)致(見表1)。
從表1可以看到,IP歸屬為某省移動(dòng),具體是IP地址為120.203.214.139、120.203.214.143、120.203.214.152、120.203.214.156、120.203.214.161、120.203.214.184、120.203.215.2、120.203.215.3和120.203.215.4的TCP三握手次數(shù)較多,但其成功率均很低,需重點(diǎn)進(jìn)行關(guān)注。
關(guān)于失敗情況較高的網(wǎng)絡(luò)側(cè)IP歸屬情況及網(wǎng)站分布情況較為復(fù)雜,總體可分為以下幾類:
●IP歸屬移動(dòng)網(wǎng)內(nèi)的,建議對(duì)該些IP地址服務(wù)器性能及網(wǎng)絡(luò)連接情況進(jìn)行檢查。
圖2 某地TCP建立成功率指標(biāo)
圖3 SGSN維度TCP三握手成功率
表1 某地TCP目的服務(wù)器TCP指標(biāo)
●IP歸屬于聯(lián)通、電信、北京世紀(jì)互聯(lián)以及國(guó)外,建議對(duì)其路由情況進(jìn)行檢查。
●IP歸屬節(jié)點(diǎn)為高業(yè)務(wù)SP服務(wù)器的,由于該類業(yè)務(wù)訪問量巨大造成整體TCP性能成功率低,建議協(xié)調(diào)SP進(jìn)行優(yōu)化。
3.3 用戶IP段維度分析
通過從用戶IP維度進(jìn)行分析,統(tǒng)計(jì)用戶數(shù)TOP50的用戶IP段TCP性能分布情況,具體如圖4所示。
由圖4看出,TOP50用戶IP地址段的TCP三握手性能相對(duì)穩(wěn)定,未出現(xiàn)明顯異常IP段。
圖4 用戶IP段TCP建立成功率
但對(duì)某地全網(wǎng)用戶IP段進(jìn)行分析發(fā)現(xiàn),定位某地存在多個(gè)用戶IP地址段TCP三握手成功率為0,且訪問用戶數(shù)較多,需排查是否為欠費(fèi)IP地址段造成。統(tǒng)計(jì)TOP15問題IP地址段,具體如表2所示。
表2 TCP15問題用戶IP段
從表2可以看到,存在多個(gè)IP地址段發(fā)起TCP三握手請(qǐng)求次數(shù)用戶較多,但用戶無法正常進(jìn)行TCP連接,TCP成功率幾乎為0,其中172.20~172.29、10.135、10.136、10.227和10.228涉及用戶10000戶左右,10.180涉及用戶數(shù)較少為440左右。統(tǒng)計(jì)這些地址段24h的嘗試次數(shù),具體如圖5所示。
從圖5可以看到,10.135、10.136、10.227和10.228地址段的TCP三握手次數(shù)明顯和業(yè)務(wù)量存在關(guān)聯(lián),在凌晨時(shí)段,TCP三握手嘗試次數(shù)基本為0,但在5點(diǎn)后隨著業(yè)務(wù)量上升,TCP嘗試次數(shù)明顯增加。但172.20~172.29地址段全天基本保持穩(wěn)定。
4.1 TCP問題定位
●確認(rèn)用戶IP段172.20~172.29為停復(fù)機(jī)用戶IP段,對(duì)用戶感知無影響。
●經(jīng)確認(rèn)用戶IP段10.135、10.136、10.227和10.228為諾西GGSN兩塊板卡存在故障,已進(jìn)行排障處理。
●經(jīng)確認(rèn),地址120.203.214.139、120.203.214.143、120.203.214.152、120.203.214.156、120.203.214.161、120.203.214.184、120.203.215.2、120.203.215.3和 120.203.215.4確認(rèn)為某省藍(lán)汛Webcache服務(wù)器,定位為藍(lán)汛Cache加速采用在本省DNS上通過泛域名轉(zhuǎn)發(fā)至藍(lán)汛DNS解析,最終由Cache提供服務(wù),存在部分非HTTP業(yè)務(wù)的精細(xì)域名解析至藍(lán)汛的Cache平臺(tái),而Cache卻并未對(duì)這些業(yè)務(wù)提供服務(wù),結(jié)果Cache服務(wù)器發(fā)送大量TCPReset報(bào)文至用戶端,從而影響TCP三握手連接成功率。
圖5 問題用戶IP段TCP申請(qǐng)數(shù)24h趨勢(shì)
4.2 TCP問題優(yōu)化
●問題用戶IP段優(yōu)化效果
經(jīng)確認(rèn)用戶IP段10.135、10.136、10.227和10.228為諾西GGSN兩塊板卡存在故障,有關(guān)單位已于2015年5月9日18點(diǎn)對(duì)其進(jìn)行了相關(guān)關(guān)閉操作,以避免用戶由于占用問題用戶IP段導(dǎo)致TCP三握手失敗的用戶投訴,這可以有效減少TCP無效請(qǐng)求約500萬次左右,并可減少某地市5萬戶左右的上網(wǎng)故障,有效提升用戶感知,具體優(yōu)化效果如圖6所示。
從圖6可以看到,2015年5月9日進(jìn)行相關(guān)操做之前,這4個(gè)用戶IP段的日SYN嘗試次數(shù)為100萬次左右,而在進(jìn)行相關(guān)操作后,這4個(gè)用戶IP段的日SYN次數(shù)基本為0。
●藍(lán)汛緩存服務(wù)器處理效果
經(jīng)確認(rèn),地址120.203.214.139、120.203.214.143、120.203.214.152、120.203.214.156、120.203.214.161、120.203.214.184、120.203.215.2、120.203.215.3和120.203.215.4確認(rèn)為藍(lán)汛Webcache服務(wù)器,由于這部分服務(wù)器IP訪問量較大,對(duì)全網(wǎng)TCP成功率影響較大,若能提升這部分服務(wù)器IP的TCP成功率,某地全網(wǎng)TCP成功率能夠提升10%左右。對(duì)藍(lán)汛緩存服務(wù)器的TCP業(yè)務(wù)量情況進(jìn)行跟蹤,詳情見圖7。從圖7可以看到,經(jīng)過不斷調(diào)整,藍(lán)汛緩存服務(wù)器的TCP嘗試次數(shù)呈現(xiàn)下降趨勢(shì)。
圖6 問題用戶IP段優(yōu)化效果
對(duì)藍(lán)汛各個(gè)服務(wù)器IP的TCP成功率進(jìn)行跟蹤,詳情見圖8,從圖8可以看到,分3批次對(duì)各個(gè)服務(wù)器IP進(jìn)行優(yōu)化操作后,藍(lán)汛緩存服務(wù)器的TCP成功率提升明顯。
——在2015年5月14日對(duì)120.203.215.2和120.203.215.4進(jìn)行優(yōu)化后,其成功率分別由10%提升至90%左右,并在后期保持穩(wěn)定。
——在2015年5月15日對(duì)120.203.214.156進(jìn)行優(yōu)化后,其TCP成功率由10%左右提升至85%以上,并在后期保持穩(wěn)定。
——在2015年5月16日對(duì)120.203.214.139、120.203.214.143、120.203.214.152和120.203.215.3進(jìn)行優(yōu)化,其TCP成功率均得到明顯提升,并保持穩(wěn)定。
4.3 全網(wǎng)TCP成功率優(yōu)化效果
在對(duì)問題用戶IP和藍(lán)汛緩存服務(wù)器進(jìn)行處理后,對(duì)某地全網(wǎng)整體的TCP成功率變化進(jìn)行跟蹤,具體如圖9所示。
圖7 藍(lán)訊緩存服務(wù)器TCP建立次數(shù)趨勢(shì)
圖8 藍(lán)訊緩存服務(wù)器TCP建立成功率跟蹤
圖9 某地全網(wǎng)TCP建立成功率趨勢(shì)
●從對(duì)TCP整體成功率進(jìn)行跟蹤的情況來看,2015年5月9日對(duì)問題用戶IP進(jìn)行處理后,TCP成功率由68%提升為70%左右,提升2%左右。在2015年5月14日對(duì)藍(lán)汛緩存服務(wù)器進(jìn)行優(yōu)化后,TCP成功率由72%提升為77%左右,提升5%左右。
●從對(duì)網(wǎng)絡(luò)側(cè)成功率進(jìn)行跟蹤的情況來看,處理問題用戶IP后,由于問題用戶IP的TCP嘗試次數(shù)占全網(wǎng)次數(shù)較少,網(wǎng)絡(luò)側(cè)成功率基本維持在75%左右。從2015年5月14日起,分3批次對(duì)藍(lán)汛緩存服務(wù)器進(jìn)行優(yōu)化后,網(wǎng)絡(luò)側(cè)成功率逐步由77%左右提升為83%左右,提升6%。
阿爾卡特朗訊優(yōu)化英吉利海底隧道鐵路通信服務(wù)
阿爾卡特朗訊近日宣布為歐洲隧道公司部署其敏捷光網(wǎng)絡(luò)技術(shù),助其將所有運(yùn)營(yíng)通信服務(wù)與應(yīng)用融合于一體化的數(shù)據(jù)網(wǎng)絡(luò)。
阿爾卡特朗訊久經(jīng)考驗(yàn)的環(huán)保光網(wǎng)絡(luò)技術(shù)將被部署在南北向的隧道上,確保在惡劣環(huán)境中保持性能穩(wěn)定高效。根據(jù)雙方簽署的為期超過五年的合同,阿爾卡特朗訊還將提供培訓(xùn)、網(wǎng)絡(luò)維護(hù)及系統(tǒng)支持服務(wù)。
為歐洲隧道公司部署敏捷光網(wǎng)絡(luò)技術(shù)提供了一個(gè)極佳的例證:展示了鐵路運(yùn)輸行業(yè)是如何向波分復(fù)用(WDM)光及IP技術(shù)遷移,以滿足多樣化業(yè)務(wù)需求的。此外,與歐洲隧道公司的協(xié)議也進(jìn)一步凸顯了,除傳統(tǒng)電信運(yùn)營(yíng)商領(lǐng)域外,阿爾卡特朗訊在業(yè)務(wù)多樣化方面的努力。
Mobile TCP Success Rate Improvement Analytical Report
TCP setup is a critical process of mobile users accessing Internet.Because TCP setup refers to the cooperation between the server and wireless networks,any-step failure will lead to the subsequent service resources unavailable. This article relies on ZCTT signaling monitoring system,by the statistics of GSM network TCP setup success rate, makes multi-dimensional analysis,including SGSN,TCP destination server and user IP segment,and positions Fuzhou TCP setup indicators problems.Also by various optimization measures,enhance the indicators of Fuzhou TCP setup success rate,and effectively improve the Internet users’perception.
signaling monitoring,TCP users IP,cache server