在實際管理和使用VMWare vSphere虛擬平臺時,可能會遇到和網(wǎng)絡(luò)配置相關(guān)的故障。例如,某臺ESXi主機出現(xiàn)網(wǎng)絡(luò)連接異常,包括網(wǎng)絡(luò)通訊時斷時續(xù)或者瞬間中斷等。解決方法是,進入ESXi主機的DCUI接口下執(zhí)行“ping xxx.xxx.xxx.xxx”命令,其中的“xxx.xxx.xxx.xxx”為別的ESXi主機的IP,來檢測網(wǎng)絡(luò)的連通性。如果Ping探測成功,說明在物理層面沒有明顯的問題。因為在執(zhí)行Ping探測時,實際上是從虛擬交換機的VMkernel端口發(fā)送出去的,數(shù)據(jù)包經(jīng)過物理網(wǎng)卡,再到達外部的物理交換機上。Ping檢測成功,說明這些環(huán)節(jié)沒有問題。
如果探測失敗,并且經(jīng)檢測硬件并不存在故障的話,就需要按照特定的流程進行逐級的排查。既然是EXSi主機出現(xiàn)網(wǎng)絡(luò)故障,就必須先從ESXi主機配置入手檢測。例如,檢測EXSi主機的管理網(wǎng)絡(luò)是否存在配置錯誤,物理網(wǎng)卡的雙工速率和物理交換機不匹配,網(wǎng)卡到交換機之間網(wǎng)線存在斷路,NIC Teaming(多網(wǎng)卡綁定實現(xiàn)負載均衡)的策略存在問題(例如將其負載均衡策略設(shè)置為IPHash,但是上行交換機沒有配置與之對應(yīng)的端口組聚合等)等情況時,都可能出現(xiàn)網(wǎng)絡(luò)連接不通暢的問題。
當(dāng)排除了ESXi主機可能潛在的問題后,接下來就需要對物理網(wǎng)絡(luò)進行檢測,例如網(wǎng)卡是否存在兼容性問題、網(wǎng)絡(luò)設(shè)備是否存在硬件故障,網(wǎng)絡(luò)性能是否穩(wěn)定等。一般來說,EXSi主機自身配置的問題,導(dǎo)致網(wǎng)絡(luò)連接異常的概率較大。
在其本機命令行界面中執(zhí) 行“exxcfg-vswitch –l”命令,來檢測標(biāo)準網(wǎng)絡(luò)交換機、網(wǎng)卡和端口組的配置信息,據(jù)此可以檢測其是否存在問題。執(zhí)行“esxcli network vswitch standard portgroup list”命令,對標(biāo)準虛擬交換機端口組的VLAN ID的配置信息進行查看和檢測。執(zhí)行“esxcfg-nics -l”命令,來檢查網(wǎng)卡的速率和雙工模式,以及網(wǎng)絡(luò)連接狀態(tài)信息。如果其處于“Down”狀態(tài),說明鏈路層存在問題。
根據(jù)檢測到的故障點,可以有針對性地執(zhí)行對應(yīng)的修正命令,來處理不同的故障問題。
當(dāng)檢測到vSS虛擬交換機存在問題,可以執(zhí)行“esxcfg-vswitch -a xxx”命令,來添加新的虛擬交換機,其中的“xxx”為其名稱(以下與之相同)。
當(dāng)檢測到端口組出現(xiàn)問題,可以執(zhí)行“esxcfgvswitch -A zzz xxx”命令,在目標(biāo)交換機上來添加名為“zzz”的端口組。
如果是上行鏈路的問題,可以執(zhí)行“esxcfg -vswitch-L vmnicx xxx”命令,來添加名為“vmnicx”的網(wǎng)卡編號,來創(chuàng)建新的上行鏈路。
如果是端口組的VLAN存在問題,可以執(zhí)行“esxcli network vswitch standard portgroup set -p zzz –v vlanid”命令,修改標(biāo)準虛擬交換機上指定端口組的VLAN ID,其中的“vlanid”參數(shù)為具體的ID編號。
如果網(wǎng)卡的速率或雙工模式異常,可以執(zhí)行“esxcfg-nics -d duplex -s speed vmnicx”命令,來對特定的網(wǎng)卡設(shè)定合適的速率和雙工模式,其中的“speed”參數(shù)為速率值,“duplex”參數(shù)為雙工模式。
如果是網(wǎng)絡(luò)連接狀態(tài)處于“Down”狀態(tài),就需要檢測網(wǎng)卡連接情況,將其調(diào)整到物理交換機的合適端口上。如果可以Ping通別的EXSi主機,而且網(wǎng)絡(luò)連接配置都不存在問題,就要考慮到可能是NIC Teaming策略配置存在問題。
在端口組屬性編輯窗口左側(cè)選擇“Teaming and failover”項,在 右 側(cè) 的“Load balancing”列表中查看選擇的策略項目。如果選擇的是“Route based on IP hash”項,但是物理交換機機沒有配置與之對應(yīng)的端口組聚合,就會導(dǎo)致問題的發(fā)生??梢赃x擇“Route based on originating virtual port”項,進行策略的調(diào)整。如果排除了虛擬層面的問題,那就需要確定網(wǎng)絡(luò)故障是否由硬件故障導(dǎo)致的。
執(zhí)行“esxcfg-nics -l”命令,來查看網(wǎng)卡的型號等信息。之后登錄到VMWare的官網(wǎng)上查看HCL列表信息,來確定其兼容性是否符合要求。執(zhí)行“l(fā)spci -p”命令,在返回信息中會顯示相關(guān)的網(wǎng)卡是否處于異常狀態(tài),來檢測是否因為硬件導(dǎo)致的故障。如果ESXi主機出現(xiàn)網(wǎng)絡(luò)連接時斷時續(xù)等情況,有可能是因為網(wǎng)絡(luò)堵塞等問題造成其性能過低引發(fā)的。執(zhí)行“esxtop”命令,打開網(wǎng)絡(luò)信息查看界面,可以查看和管理網(wǎng)絡(luò),物理網(wǎng)卡,虛擬機對應(yīng)的網(wǎng)絡(luò)連接情況,包括網(wǎng)絡(luò)傳輸和接收速率等。如果對域高速局域網(wǎng)來說,實際的傳輸速率很低的話,就說明網(wǎng)絡(luò)性能較低,需要深入檢測并排除相關(guān)問題,恢復(fù)網(wǎng)絡(luò)的正常性能。此外,使用“resxtop”命令也可以查看網(wǎng)絡(luò)運行信息。