深度了解混合云監控

      如今,監控非常重要。這是為什么?因為應用程序變得越來越復雜。但不僅是應用程序——基礎設施也變得復雜。一些公司正在遷移到云端;其他人正在構建混合基礎設施。如果某些基礎設施在云中,而其他基礎設施在本地,那么如何獲得整個基礎設施的概覽就會更加模糊。在這篇文章中,您將學習如何很好地監控混合云基礎架構。

      深度了解混合云監控-南華中天

      什么是混合云監控?

      首先,讓我們澄清一下混合云監控與傳統監控的不同之處。最大的不同是我們有兩個非常不同的基礎設施需要監控。用于本地監控的傳統工具在云環境中表現不佳,反之亦然。因此,要么您需要做出妥協并使用兩種不同的監控解決方案,要么您需要找到一種同時適用于本地和云基礎設施的解決方案。因此,讓我們討論一下您通常如何監控這兩者,然后我們將了解如何創建良好的混合云監控。

      監控本地基礎設施

      當您必須處理裸機服務器和您自己的網絡設備時,您將專注于與在云中不同的事情。您必須查看所有低級指標,例如 CPU 溫度、硬盤運行狀況、負載平衡器飽和度等。即使您在裸機之上有一些抽象層(例如,虛擬化或容器編排) ),您仍然需要監控底層機器。您甚至可能需要監控冷卻風扇速度和UPS狀態等內容。

      您的本地監控目標也將與您在云中進行的監控略有不同。擴展和容量規劃在本地是不同的。因此,在監控本地機器的使用情況時,您會更經常地查看長期使用模式。由于擴展數據中心通常需要數周時間,因此您必須更早地預測增加容量的需求。

      您通常用于本地監控的實際工具也不同于您用于監控云的工具。傳統上,這些工具要求您在基礎架構中的某處安裝和管理監控服務器。這意味著您還需要關心諸如容量監控和工具本身升級之類的事情。

      云監控

      即使監控的總體思路保持不變,但如果您的應用程序在云中運行,您的監控重點將有所不同。對于初學者來說,您不會關心(甚至無法訪問)溫度和風扇速度之類的東西。通常,與本地不同,您只會監控機器上的一兩層。例如,如果您的應用程序在虛擬機中運行,那么在云中,您只需擔心該虛擬機的 CPU 和內存使用情況。但是,在本地,您不僅要監控該虛擬機,還要監控底層的裸機服務器。

      深度了解混合云監控-南華中天

      另一件事是云為您提供了很大的靈活性和快速擴展。這意味著您的監控需要對資源消耗的峰值做出快速反應,以便有效地使用自動縮放功能。說到自動縮放,在云中您肯定要監控的是成本。與您的成本是靜態的本地部署不同,在云中,您(通常)按使用付費。因此,您不僅要監控整體增長的成本,還需要找到過度使用(甚至未使用)的資源,以便縮減(或關閉)資源以節省成本。

      談到工具,那些旨在監控云的工具通常以軟件即服務 (SaaS) 的形式出現。您無需安裝和管理實際的監控工具。您只需要將所有指標發送給它。

      如何監控混合云基礎設施

      正如我們之前提到的,您有兩個選擇。一種解決方案是使用兩種不同的工具(一種更適合本地,一種更適合云)。令人驚訝的是,這是一種非常常見的方法,但出于錯誤的原因。公司不會從頭開始構建混合基礎架構。當他們想要將本地部署緩慢遷移到云時,他們最終會使用混合基礎架構。這意味著,通常,他們已經設計了一個本地監控系統,并且已經運行了很多年。這就是為什么當他們在云中邁出第一步時,他們通常會為云創建一個新的監控系統。這是因為通常會組建一個全新的團隊來管理云環境。但是分別監控這兩種環境會帶來很多缺點。

      在混合云中,系統的一部分在本地運行,一部分在云中。但歸根結底,它是同一個系統。他們一起工作。因此,用一種工具監控其中的一部分,用另一種工具監控部分會使您處于“錯過大局”的危險境地。一些公司意識到了這一點,那么他們會怎么做呢?他們將本地監控擴展到監控云的某些部分,并嘗試使用云監控工具來監控部分本地。這部分解決了對整個系統進行概覽的問題,但產生了一個新問題?,F在您監視相同的系統兩次。那效率不高。

      統一監控

      那么解決方案是什么?統一監控!不要將混合云視為兩個獨立的環境。將它們視為同一系統的兩個部分,因為事實上它們是。使用可以很好地監控本地和云系統的工具。

      深度了解混合云監控-南華中天

      即使您有單獨的團隊管理雙方,您仍然可以從統一監控中受益。您的本地團隊將從監控工具本身的管理任務中解脫出來。同時,您的云團隊將對基礎架構的本地部分有很好的了解。在混合環境中,客戶的請求通常需要訪問本地和云中的一些系統才能完成請求并發送響應。

      在這兩個系統中沒有可見性的情況下,云團隊只能猜測“如果這些錯誤不是來自我們,那么它一定是本地端出了問題?!?同樣的猜測也會發生在本地端。這會導致調試過程很長,這也意味著如果發生真正的災難,您的恢復時間會更長。統一監控,無需猜測。

      將來自所有來源的所有數據組合到一個監控系統中帶來了另一個優勢:能夠關聯來自不同來源的數據。云中 CPU 使用率的增加并不一定意味著云中發生了某些事情。這可能意味著本地系統對云請求的響應速度較慢;因此,云系統需要付出額外的努力來滿足需求(更多的 CPU 用于緩存或更多的 CPU I/O 等待時間)。統一監控可幫助您輕松發現此類情況。

      概括

      監控混合云的總體思路很簡單。您需要了解本地和云環境發生了什么。在實踐中,這通常是通過擁有兩個獨立的監控解決方案來實現的。雖然這并非完全錯誤,但在這篇文章中,我們試圖向您展示不同方法的好處。

      使用一種監控工具監控您的混合云會更好。它不僅有助于減少本地和云團隊的調試時間,還允許您關聯來自系統不同部分的數據。最重要的是,如果您將應用程序監控添加到同一解決方案中,您會發現自己對系統的任何部分都有很好的可見性。