提升運(yùn)維質(zhì)量,降低運(yùn)維成本
聯(lián)想集團(tuán),《財富》世界500強(qiáng)202位,我們引以為豪的中國品牌之一,其16/17財年?duì)I業(yè)額430億美元,業(yè)務(wù)規(guī)模遍布全球160多個國家和地區(qū),全球員工5.2萬人。而在為業(yè)務(wù)運(yùn)營提供技術(shù)支撐的IT基礎(chǔ)設(shè)施方面,聯(lián)想則擁有多個數(shù)據(jù)中心,200個分支機(jī)構(gòu),近百條MPLS線路,以及近萬臺網(wǎng)絡(luò)設(shè)備的龐大規(guī)模。那么,聯(lián)想集團(tuán)的相關(guān)職能部門是通過何種方式,借助哪些工具對分布式環(huán)境進(jìn)行有效管理的呢?在統(tǒng)一通信應(yīng)用日益普及的今天,聯(lián)想集團(tuán)企業(yè)通信方式已全面過渡到嶄新階段,現(xiàn)已全面部署了微軟Lync企業(yè)級即時通訊+視頻會議系統(tǒng),并分為4個集群,覆蓋全球5萬用戶,9萬終端,Lync通話及會議通訊次數(shù)更高達(dá)每日數(shù)萬次之多。如此大規(guī)模的UC應(yīng)用,聯(lián)想集團(tuán)又是如何管理的?使用中是如何監(jiān)控,發(fā)現(xiàn)故障又是如何排查并快速解決問題的呢?
聯(lián)想集團(tuán)IT監(jiān)控經(jīng)理胡永介紹,聯(lián)想IT監(jiān)控中心主要負(fù)責(zé)IT系統(tǒng)端到端的監(jiān)控方案設(shè)計、部署、運(yùn)營及優(yōu)化,監(jiān)控范圍涵蓋APM、業(yè)務(wù)流程監(jiān)控、應(yīng)用平臺、數(shù)據(jù)庫、中間件、服務(wù)器、網(wǎng)絡(luò)、存儲、數(shù)據(jù)中心設(shè)施等,同時提供7×24小時的監(jiān)控服務(wù)。監(jiān)控超過百個應(yīng)用系統(tǒng),監(jiān)控服務(wù)器、網(wǎng)絡(luò)設(shè)備數(shù)量更高達(dá)萬臺以上。
胡永表示,兩年前,聯(lián)想IT監(jiān)控中心在運(yùn)維方面面臨一些問題與挑戰(zhàn),一是雖然實(shí)現(xiàn)APM、DEM以及ITIM監(jiān)控,但是缺少NPMD方案;二是網(wǎng)絡(luò)規(guī)模、復(fù)雜度與日俱增,通過網(wǎng)絡(luò)交付的關(guān)鍵應(yīng)用出現(xiàn)問題時,難于快速定位,影響用戶感受;三是傳統(tǒng)網(wǎng)絡(luò)監(jiān)控方案專注于網(wǎng)絡(luò)設(shè)備,缺少對網(wǎng)絡(luò)流量的提取與分析,無法主動獲得應(yīng)用在網(wǎng)絡(luò)上運(yùn)行的狀態(tài)以及用戶的真實(shí)體驗(yàn);四是網(wǎng)絡(luò)信息廣泛而離散,缺乏統(tǒng)一的、定制化的展現(xiàn)與智能化的關(guān)聯(lián)分析。因此,聯(lián)想需要建立完整的網(wǎng)絡(luò)流量采集、監(jiān)控分析平臺;實(shí)現(xiàn)網(wǎng)絡(luò)流量及網(wǎng)絡(luò)性能的分析與可視化;實(shí)現(xiàn)網(wǎng)絡(luò)流量原始數(shù)據(jù)的歷史數(shù)據(jù)回溯分析;協(xié)助運(yùn)維團(tuán)隊(duì)加快網(wǎng)絡(luò)性能故障的分析定位。總之,在提升運(yùn)維質(zhì)量的同時,降低運(yùn)維成本。
胡 永
主動性能管理與快速故障定位是Riverbed SteelCentral UCExpert與NPM解決方案的最大特點(diǎn),也是聯(lián)想IT監(jiān)控平臺急需的功能。胡永告訴記者,聯(lián)想采用Riverbed SteelCentral UCExpert與NPM解決方案,結(jié)合自己的運(yùn)維實(shí)踐經(jīng)驗(yàn),分別對前端的客戶體驗(yàn)、后端的應(yīng)用性能,進(jìn)行了廣泛而細(xì)致的實(shí)時追蹤,極大地提升了監(jiān)控水平與問題定位能力。監(jiān)控可視化平臺實(shí)現(xiàn)了對應(yīng)用系統(tǒng)狀態(tài)以及性能數(shù)據(jù)的統(tǒng)一展示,并打破了IT技術(shù)邊界,以業(yè)務(wù)系統(tǒng)為核心,實(shí)現(xiàn)客戶端、網(wǎng)絡(luò)、應(yīng)用端到端的綜合監(jiān)控能力。
關(guān)于為何選擇Riverbed方案,胡永表示,聯(lián)想和Riverbed有很深入的合作,之前就采用了Riverbed出色的廣域網(wǎng)優(yōu)化產(chǎn)品SteelHead。此外,Riverbed NPM方案在Gartner魔力象限中連續(xù)保持領(lǐng)導(dǎo)者地位。同時,經(jīng)過我們的調(diào)研,其產(chǎn)品很好的滿足我們的需求。
對于IT來說,應(yīng)用性能是其工作業(yè)績的最顯著指標(biāo),因此,全球的組織機(jī)構(gòu)均通過Riverbed SteelCentral系列產(chǎn)品開展性能管理與分析,以便提供始終一流的用戶體驗(yàn)。Riverbed亞太區(qū)技術(shù)方案架構(gòu)師李耀宗介紹說,采用SteelCentral,用戶可以通過一種集中的動態(tài)視圖監(jiān)測應(yīng)用交付鏈上的每一個重要環(huán)節(jié),并將其中的任何問題消滅在萌芽狀態(tài),預(yù)防其產(chǎn)生不利影響。無論是推出新的應(yīng)用、整合或虛擬化數(shù)據(jù)中心、向云遷移、支持移動設(shè)備用戶,還是只是需要一種故障排除與可視化解決方案,SteelCentral產(chǎn)品都能夠讓用戶全面了解自己的環(huán)境。
在談到Riverbed方案給他的監(jiān)控團(tuán)隊(duì)帶來哪些變化時,胡永最后表示:我們最早建立監(jiān)控團(tuán)隊(duì)?wèi)?yīng)該是10年前,最初監(jiān)控大部分都是手工操作,工程師要
李耀宗
去各個系統(tǒng)里面點(diǎn)看問題,后來一步步地實(shí)現(xiàn)了自動化,現(xiàn)在96%以上的實(shí)現(xiàn)了自動化監(jiān)控?,F(xiàn)在我們職責(zé)越來越豐富,從簡單的查問題、反饋問題。擴(kuò)展到幫忙其他運(yùn)維團(tuán)隊(duì),分析問題,定位問題,以及發(fā)現(xiàn)系統(tǒng)的潛在風(fēng)險。監(jiān)控的價值得到了進(jìn)一步提升。
另一方面,雖然隨著IT 系統(tǒng)建設(shè),監(jiān)控的范圍越來越廣,越來越細(xì)。比如開始是一兩千臺服務(wù)器,現(xiàn)在上萬臺。由于我們不斷的提升監(jiān)控自動化,監(jiān)控的人員反而減少了。團(tuán)隊(duì)的效率得到了持續(xù)提升。
(本刊記者/宋京)