李榮
如今,規(guī)劃運營有效的云運維(CloudOps)計劃很復(fù)雜,但有2件事可能很少考慮。
云運維的重點應(yīng)該是創(chuàng)建流程、方法和工具堆棧,使企業(yè)能夠長期運行基于云計算的系統(tǒng)而不會出現(xiàn)中斷,并提高業(yè)務(wù)滿意度。企業(yè)提高業(yè)務(wù)的能力應(yīng)該是其首要目標。
以一家名列全球2 000強的大型公司為例,該公司已將1 000多個工作負載遷移到云平臺上。使用容器處理大約25 %的工作負載,并將其余部分負載重構(gòu)成為云原生的負載。
現(xiàn)在,該公司正在將其全部負載轉(zhuǎn)移到新的CloudOps組織。經(jīng)過數(shù)月的時間來規(guī)劃需要完成的工作,所需的工具以及通過培訓(xùn)或招聘所需的技能,似乎都很齊全,但這種看法是錯誤的。
以下是行業(yè)專家在企業(yè)CloudOps規(guī)劃中發(fā)現(xiàn)的2個常見問題:
首先,企業(yè)很少考慮CloudOps的可擴展性。常見的錯誤是利用太多的本地監(jiān)控和管理工具。實際上,CloudOps組織都喜歡采用更多的工具,例如使用一個工具來管理和監(jiān)控AWS云平臺,采用另一個工具用于Microsoft Azure,采用第3個工具用于谷歌云,最后企業(yè)會發(fā)現(xiàn)這種方法既復(fù)雜又低效。當企業(yè)添加更多公共云和更多云服務(wù)(如計算、存儲和數(shù)據(jù)庫)時,事情變得復(fù)雜,以至于如果沒有更多的資源,CloudOps團隊將無法擴展,也無法更好地規(guī)劃公共管理層和通用工具。
第二,企業(yè)缺乏安全運營或者完全沒有規(guī)劃。常見的錯誤是沒有包括運營中的安全性,并且在運行安全系統(tǒng)和核心運營之間有更大的差距。
實際上,驅(qū)動身份管理的公共目錄服務(wù)需要被建立和維護,這涵蓋了核心安全以及管理和監(jiān)控等其他業(yè)務(wù)活動。
安全性通常被認為是一個不同的任務(wù)、團隊和工具,但云運維和安全運維(SecOps)中的最佳實踐是保持這些團隊、工具和服務(wù)緊密耦合。