嚴立忠
容器的使用正在迅速增長。Cloud Foundry和ClearPath Strategies在2016年6月進行的一項調(diào)查顯示,64%的受訪者表示計劃在明年將容器的使用主流化。隨著容器使用量的不斷增加,解決監(jiān)控問題以提高容器的性能、使用和故障排除能力至關(guān)重要。然而,有效的監(jiān)控需要一種由分析驅(qū)動的方法,不僅能通知開發(fā)人員和運維部門正在發(fā)生的情況,還能夠幫助這些團隊挖掘其容器使用情況和性能數(shù)據(jù),從而獲得可行的洞察力。
當出現(xiàn)錯誤時會發(fā)生什么?出現(xiàn)問題時,快速了解事件的具體細節(jié)至關(guān)重要。在容器中運行的應用發(fā)生錯誤是容器問題最常見的來源,但并非唯一來源。容器問題也可能由操作系統(tǒng)、存儲、網(wǎng)絡(luò)、數(shù)據(jù)庫或其它部件等底層基礎(chǔ)架構(gòu)的問題引起。因此,容器監(jiān)控解決方案必須具有可見性和分析能力,幫助用戶確認問題的根源。如果不能快速準確地做到這一點,可能會引發(fā)更長的停機時間,從而給組織造成重大成本和風險。
容器具有獨特的特征,將對組織應選擇的監(jiān)控解決方案產(chǎn)生影響。比如,容器是短暫的,可以在幾秒鐘內(nèi)啟動和停止這一事實。這需要一個監(jiān)控解決方案,可以利用日志記錄和度量值界面,并在該容器不再運行后保留相關(guān)信息。此外,容器監(jiān)控解決方案不僅要具備分析容器的能力,而且還要能夠提供對應用堆棧其他組件可用性、性能和使用情況的洞察力。
對于有效和高效的容器監(jiān)控來說,最重要的要求也許就是擁有一個源于容器的解決方案。日志記錄驅(qū)動程序是有關(guān)容器的關(guān)鍵信息來源,可以通過簡單配置容器定義或運行方式來實現(xiàn)。使用嵌入式解決方案可以獲得更好的性能,因為監(jiān)控工具不會與其他程序爭奪資源。
有效解決方案的最后一個組成部分是基于分析的方法,可以更輕松地對監(jiān)控解決方案所顯示的信息進行評估并采取行動。儀表板通常會成為修復容器中出現(xiàn)問題的起始點。此外,儀表板還必須支持深入了解日志和指標的能力,以獲取有效修復所需的詳細信息。
Splunk Enterprise或Splunk Cloud可以為容器監(jiān)控提供起點。通過為Docker使用Splunk Logging Driver,機器數(shù)據(jù)可以輕松地從容器傳送到Splunk軟件。使用該驅(qū)動程序,可以從容器中檢索Docker容器信息并對日志進行無縫監(jiān)控。這個任務很簡單,因為Splunk的Docker驅(qū)動程序被內(nèi)置到了Docker中。為了實現(xiàn)最佳的容器監(jiān)控,分析容器中的所有數(shù)據(jù)源至關(guān)重要,這些數(shù)據(jù)源包括容器/微服務日志、容器度量/事件、容器集群、節(jié)點和應用、應用日志和線路數(shù)據(jù)。使用上述Splunk產(chǎn)品后,可以將容器數(shù)據(jù)與來自其他層的數(shù)據(jù)相關(guān)聯(lián),從而描繪出環(huán)境的全貌。
其結(jié)果就是為容器監(jiān)控提供一個全面的解決方案,可以輕松部署和快速實現(xiàn)價值,并且可以與企業(yè)正在使用Splunk軟件處理的其他數(shù)據(jù)源相關(guān)聯(lián),從而為企業(yè)提供端到端的視角。