AP
最終用戶數(shù)量的增長(zhǎng)使現(xiàn)代企業(yè)面臨越來(lái)越大的網(wǎng)絡(luò)中斷風(fēng)險(xiǎn)一再加上有越來(lái)越多的業(yè)務(wù)在線上完成,因此這個(gè)問(wèn)題的嚴(yán)重性達(dá)到前所未有的高度。
網(wǎng)絡(luò)中斷可能導(dǎo)致單位損失巨額資金和嚴(yán)重?fù)p害他們的名聲。西南航空和達(dá)美航空2016年夏天遇到的重大網(wǎng)絡(luò)中斷事故,就是很好的例子。西南航空的網(wǎng)絡(luò)中斷造成的公司損失達(dá)到5400萬(wàn)美元,而達(dá)美航空則因?yàn)橥k娛鹿矢冻隽?.5億美元的代價(jià)。
行業(yè)專家指出,這兩家航空公司—直在努力向他們的客戶交付更加先進(jìn)的技術(shù)服務(wù),這使他們面臨網(wǎng)絡(luò)問(wèn)題帶來(lái)的風(fēng)險(xiǎn)。所有航線的旅客都會(huì)在線預(yù)計(jì)機(jī)票,然后希望通過(guò)手機(jī)接收他們的機(jī)票,這給訂票和出票系統(tǒng)及企業(yè)網(wǎng)絡(luò)帶來(lái)很大的壓力。
雖然這兩家航空公司所遇到的事件較為引人關(guān)注,但是網(wǎng)絡(luò)中斷并不是唯一可能遇到的問(wèn)題。大多數(shù)其他行業(yè)的應(yīng)用也一樣會(huì)面臨網(wǎng)絡(luò)壓力,而中斷問(wèn)題可能并確實(shí)發(fā)生在許多類型的組織中—大銀行、電信運(yùn)營(yíng)商、云提供商和大學(xué)等。
網(wǎng)絡(luò)分析師指出,采用以下的標(biāo)準(zhǔn)最佳實(shí)踐方法,可以幫助組織降低網(wǎng)絡(luò)中斷的壓力。負(fù)責(zé)Enterprise Strategy Group網(wǎng)絡(luò)技術(shù)的分析師Dan Conde說(shuō):“在西南航空的案例中,有一臺(tái)路由器宕機(jī)了,這實(shí)際上是不應(yīng)該發(fā)生的問(wèn)題?!盋onde指出,公司需要考慮核心基礎(chǔ)架構(gòu)3至5年的更新周期,并且關(guān)注內(nèi)置冗余性。
此外,他們應(yīng)該利用支持網(wǎng)絡(luò)可見性的現(xiàn)代網(wǎng)絡(luò)管理工具。德克薩斯州奧斯丁的圣愛德華大學(xué)數(shù)字基礎(chǔ)架構(gòu)副主管Roberto Dovalina指出,這正是他們團(tuán)隊(duì)所做的事情。他和同事一起負(fù)責(zé)支持大約5,500名學(xué)生和1,200職員和員工。Dovalina說(shuō),他們?cè)谑鄣氯A大學(xué)的數(shù)據(jù)中心部署了冗余核心路由器、防火墻和服務(wù)器機(jī)架,他們每隔3至5年就會(huì)更換一次設(shè)備。他們每隔5至7年會(huì)更換支持校園建筑的12臺(tái)路由器。通過(guò)部署冗余基礎(chǔ)架構(gòu),圣愛德華大學(xué)可以周期性將一些設(shè)備關(guān)閉半天,然后進(jìn)行網(wǎng)絡(luò)測(cè)試。他們還在系統(tǒng)中開發(fā)了情報(bào)邏輯和腳本,這樣當(dāng)核心路由器宕機(jī)時(shí),他們就可以啟用1臺(tái)或2臺(tái)備用路由器,從而保證所有程序都不受到宕機(jī)的影響。
下面是ESG的Dan Conde提出的防止網(wǎng)絡(luò)中斷的9個(gè)步驟:
1)端到端地遵從這些最佳實(shí)踐。網(wǎng)絡(luò)最薄弱環(huán)節(jié)決定了網(wǎng)絡(luò)的強(qiáng)度。
2)從基礎(chǔ)做起。維護(hù)硬件,避開舊系統(tǒng),運(yùn)行診斷程序,配置合適電源和備用電源,運(yùn)行電源系統(tǒng)壓力測(cè)試。
3)測(cè)試整個(gè)系統(tǒng)。切斷一些鏈路,測(cè)試故障恢復(fù)是否正確執(zhí)行。如果沒有,則可能有配置問(wèn)題。
4)盡可能使用路由器備用協(xié)議?!ㄒ诓煌酚善鲗哟沃g配置冗余鏈路——并且使用虛擬路由冗余協(xié)議(virtual Router Redundancy Protocol)或熱備路由協(xié)議(Hot Standby Router Protocol)等協(xié)議,從而使備用路由器能夠在主路由器出現(xiàn)問(wèn)題時(shí)接管負(fù)載。
5)與ISP使用。部署來(lái)自網(wǎng)絡(luò)運(yùn)營(yíng)商的替代路徑。此外,購(gòu)買足夠多的帶寬,從而保證備用路徑用完時(shí),它們?cè)斐杉?jí)聯(lián)故障。
6)使用更新的網(wǎng)絡(luò)管理工具。一直使用正確的網(wǎng)絡(luò)可見性和監(jiān)控工具,包括分析和應(yīng)用部署測(cè)試時(shí)期。這個(gè)部分至關(guān)重要,也是服務(wù)保證的關(guān)鍵——如果不發(fā)現(xiàn)問(wèn)題,就不知道如何解決問(wèn)題。
7)考慮應(yīng)用層。要設(shè)計(jì)整個(gè)架構(gòu),使基礎(chǔ)架構(gòu)與應(yīng)用程序協(xié)調(diào)工作。不要強(qiáng)迫應(yīng)用去適應(yīng)已有的基礎(chǔ)架構(gòu)—要先設(shè)計(jì)應(yīng)用的架構(gòu),然后再設(shè)計(jì)基礎(chǔ)架構(gòu),使之符合應(yīng)用需求。要整體地看待這兩個(gè)部分。
8)全面檢查。要檢查鏈路故障和設(shè)備故障。不要只關(guān)注成本,而忽視其他方面。
9)保持跟蹤。如果遇到故障,無(wú)論是在真實(shí)環(huán)境或是測(cè)試環(huán)境中,都要執(zhí)行全面的事后分析。
Dovalina解釋說(shuō):“在網(wǎng)絡(luò)中斷之后修復(fù)網(wǎng)絡(luò)是很簡(jiǎn)單且不需要花費(fèi)很多的時(shí)間。但是將應(yīng)用程序恢復(fù)回中斷之前的狀態(tài)則最耗費(fèi)時(shí)間。因此,使用情報(bào)邏輯和腳本將應(yīng)用程序自動(dòng)恢復(fù)回之前狀態(tài),我們就可以非??焖俚貙⑾到y(tǒng)恢復(fù)回正常狀態(tài)。在一些設(shè)備宕機(jī)時(shí),用戶幾乎感覺不到斷網(wǎng)的情況?!?/p>
根據(jù)Dimension Data的2016 Network Barometer報(bào)告,有37%的網(wǎng)絡(luò)服務(wù)意外事件都?xì)w咎于人為錯(cuò)誤,而其中有許多都與配置錯(cuò)誤相關(guān)。組織正在采取措施糾正配置錯(cuò)誤。Dovalina指出,在圣愛德華大學(xué)中,工程師需要審批所有的網(wǎng)絡(luò)配置變更。
企業(yè)網(wǎng)絡(luò)工程師Robert Lumsden指出,F(xiàn)idelityInformation Services在這個(gè)概念上做得更深人_步,它的每一個(gè)變更工單都需要經(jīng)過(guò)全面同行審議。而且,在變更之前,工程師、內(nèi)部客戶及其他干系人(如來(lái)自審計(jì)或銷售部門的員工)需要一起開始,這樣工程師才能完全解釋清楚變更內(nèi)容,并且解答一些疑問(wèn)。Lumsden說(shuō):“我們想要做的是評(píng)估出現(xiàn)瓿之后的風(fēng)險(xiǎn)。我們的格言中‘不能破壞任何東西?!?/p>
有一些可編程網(wǎng)絡(luò)技術(shù)的提倡者認(rèn)為,它可以減少手工配置及人為引起錯(cuò)誤可能性,從而可以將網(wǎng)絡(luò)中斷的風(fēng)險(xiǎn)降到最低。
思科企業(yè)網(wǎng)絡(luò)高級(jí)副總裁Jeff Reed說(shuō):“在過(guò)去20年,管理網(wǎng)絡(luò)—直沒有太大的變化。客戶告訴我們,他們的網(wǎng)絡(luò)工程師將80%的時(shí)間都投入到保持網(wǎng)絡(luò)的正常運(yùn)行。許多的流程都基于人工的任務(wù),而這些任務(wù)嚴(yán)重拖累頂級(jí)技術(shù)人員,使它們無(wú)法專注于支撐業(yè)務(wù)的關(guān)鍵應(yīng)用程序?!?/p>
Reed指出,思科一直專注于在交換機(jī)使用更高效的設(shè)計(jì),它可以幫助網(wǎng)絡(luò)工程師減少配置時(shí)間。Brocade通信系統(tǒng)公司、Pluribus Networks和BarefootNetworks等供應(yīng)商也有可編程網(wǎng)絡(luò)技術(shù)。
Reed解釋說(shuō):“我們正在嘗試在交換機(jī)中加入更多的智能,從而使網(wǎng)絡(luò)工程師只需要處理高級(jí)策略。網(wǎng)絡(luò)工程師應(yīng)該更關(guān)注于他們優(yōu)先處理哪一些應(yīng)用程序流量,而不是那些一成不變的網(wǎng)絡(luò)設(shè)計(jì)。”
當(dāng)然,雖然更好更高效的交換機(jī)和路由器可以將網(wǎng)絡(luò)中斷的風(fēng)險(xiǎn)降到最低,但是網(wǎng)絡(luò)組織仍然需要注意Dovalina和Lumsden所推薦的最佳實(shí)踐。這種新型交換機(jī)可能流行更長(zhǎng)時(shí)間并且能夠減少過(guò)載,但是網(wǎng)絡(luò)組織仍然需要刷新策略。而且,即使將大多數(shù)配置實(shí)現(xiàn)自動(dòng)化,但是在出現(xiàn)異常情況時(shí)仍然需要監(jiān)控它們。
最后,網(wǎng)絡(luò)組織仍將需要審視環(huán)境和選擇最適合未來(lái)發(fā)展趨勢(shì)的網(wǎng)絡(luò)伙伴。一些組織仍然部署內(nèi)部數(shù)據(jù)中心,并目仍然堅(jiān)持使用自己熟悉的技術(shù)和策略。但是,經(jīng)濟(jì)因素可能促使許多企業(yè)至少將一部分?jǐn)?shù)據(jù)中心遷移去云供應(yīng)端環(huán)境,如亞馬遜Web服務(wù)和微軟Azure,這種方式要求有創(chuàng)新思考方式和開放網(wǎng)絡(luò)等新技術(shù)。