云運營(CloudOps) 是管理在云環境中運行的工作負載和 IT 服務的交付、調整、優化和性能的實踐,包括多云、混合、數據中心和邊緣。CloudOps 為基于云的操作流程編寫程序和最佳實踐,就像DevOps為應用程序開發和交付流程編寫相同的程序一樣。
云運營嚴重依賴分析來增強云環境元素的可見性,提供控制資源和有效運行服務所需的洞察力。對于一些組織來說,隨著 IT 運營從本地轉移到基于云的基礎架構,CloudOps 已經取代了網絡運營中心 (NOC)。正如 NOC 監控和管理數據中心一樣,CloudOps 監控、檢測和管理在云中運行的虛擬機、容器和工作負載。開發人員、IT 運營和安全都使用 CloudOps 原則進行協作,以實現業務和技術目標。
云運營的好處
CloudOps 為組織提供了一長串好處,包括:
加速自動化。CloudOps 工具可以簡化廣泛的日常任務的自動化,包括配置服務器和存儲、應用程序測試、監控和報告、應用程序構建和安全事件修復。
增強的安全性。主要的超大規模云提供商利用業界最佳的物理安全性并持續監控其基礎設施,以幫助防止網絡犯罪或數據泄露。幾乎每個組織在遷移到云時都意識到了安全性改進,請記住,云安全對組織的影響與對云提供商的影響一樣多。
改進的 RPO/RTO。備份和數據恢復是公共云的最初用例,并且繼續成為云遷移的強大驅動力。備份和復制策略可以將恢復點目標 (RPO) 和恢復時間目標 (RTO) 降低到接近于零,有助于確保為日益全球化的用戶和客戶群提供全天候的可用性。
總體 IT 節省。由于云服務是現收現付的,因此無需購買服務合同并不斷升級數據中心硬件以滿足不斷變化的用戶需求,從而消除了大筆資本支出。此外,消除數據中心基礎設施可以節省設施成本,例如電力、冷卻甚至房地產。
按需可擴展性。季節性或增長需求可以通過即時容量增加來滿足,通常是通過自助服務門戶。配置新的虛擬機、物理服務器、存儲,甚至網絡帶寬都可以通過按一下按鈕來完成,使組織能夠更加靈活并在出現需求時直接滿足需求。
隨時隨地訪問。組織可以隨時隨地使用幾乎任何設備訪問云應用程序和資源,只要有互聯網連接即可。
無中斷升級。基礎設施和軟件都可以無縫升級或更新,而不會中斷服務,從而能夠在正常業務運營繼續進行的同時應用修復或添加新功能。
DevOps 和 CloudOps 有什么區別?
DevOps 和 CloudOps 都基于組織中不同組之間的協作關系。DevOps 實踐持續改進流程,增強協作,從而提高整個軟件交付生命周期 (SDLC) 的可見性,并有助于減少可能中斷 IT 運營或影響開發計劃的事件。
DevOps 改進可以在整個組織中冒泡,有助于更快地實現更可靠的軟件應用程序,從而提高整個組織的性能。最終,DevOps 有助于改善員工和客戶的用戶體驗。CloudOps 包含云平臺工程原則,結合云架構、IT 運營、應用程序開發、安全性和法規遵從性等要素,使組織能夠管理基于云的應用程序和服務。
這使組織能夠:
- 確保云平臺(包括混合和邊緣組件)作為單一平臺運行
- 無論訪問設備如何,都可以為分散的員工優化應用程序性能
- 確保可靠性并滿足 SLA
- 為災難恢復和業務連續性維護備份
- 自動化重復服務和配置管理
- 確保數據和應用程序的端到端安全
云運營的最佳實踐是什么?
希望建立 CloudOps 功能的組織應考慮以下做法:
制定遷移策略。每個工作負載都有自己的要求,采用容器化應用程序和微服務可能會對特定解決方案的架構方式施加額外的限制。例如,基于微服務的應用程序可能需要訪問多個云上的服務,從而導致無論是否需要多云方法。其他工作負載可能會訪問必須保留在私有云中以執行監管或治理任務的敏感數據,而其他應用程序可能需要使用特定的云提供商來維護特定地理位置的數據或利用特定提供商的功能.
包括所有利益相關者。云遷移是變化,許多組織和部門都厭惡變化。從用戶到高級管理人員的每個利益相關者都應該參與遷移計劃,以幫助確保關鍵業務流程在遷移過程中不會落空。灌輸采用 CloudOps 方法的重要性,并強調它如何與現有的 DevOps 策略保持一致。
強調安全。雖然云提供了許多好處,但它也為網絡犯罪分子和其他不良行為者提供了一個新的攻擊面或多個攻擊面,以試圖滲透組織的防御。首先采用零信任的安全方法、端到端加密以及自動化安全監控和修復,以幫助確保小問題永遠不會有機會成為代價高昂的數據泄露。
自動加速。采用敏捷的云工作流程和無中斷的自動化工具,包括盡可能多的自助服務功能,包括配置和密碼重置。請記住,云遷移不是一次性的交易。隨著數周和數月的過去,CloudOps 將發現流程、基礎架構和連接性方面的改進領域,這些領域可能對運營和每月云支出產生重大影響。
將培訓納入計劃。云管理可能需要與本地數據中心截然不同的技能。物理設備維護的需求消失了,取而代之的是新的故障排除、配置和部署技能。在勞動力市場緊張的情況下,在遷移發生之前為現有團隊成員提供培訓可能是有益的,以幫助確保在需要時可以使用所有適當的技能。
從小處著手。找到一個要遷移的應用程序,它可以為運營和用戶團隊提供概念驗證,并且可以向所有利益相關者展示大規模云遷移的可行性。
開發將配置數據(例如服務器定義)存儲在基礎架構中作為代碼模型的做法,以幫助快速擴展和部署新實例,并根據需要按需擴展。確保遷移的第一個和每個應用程序都明確定義成功操作所需的工具、服務和數據,因為這將擴展為所有操作的依賴關系的操作圖。
為什么云操作很重要?
組織正在穩步增加對公共云的使用,以獲取不斷增長的應用程序和服務列表。隨著工作負載從數據中心遷移到云提供商,對 CloudOps 的需求將同步增長。DevOps 和 CloudOps 團隊可以共存并共享最佳實踐,因為它們都促進:
- 提高云資源的效率和利用率
- 云工作負載的敏捷工作環境的增長
- 自動化安全和可用性流程以支持 24/7 運營
- 改善客戶的用戶體驗
- 降低交付云服務的總體成本
- 提高使用遷移應用程序的團隊的工作效率