在我們進入新的一年之際,正是反思2022年數據中心管理趨勢和挑戰并計劃 2023年需要做些什么以提高正常運行時間、提高效率和生產力的最佳時機。通過創建您可以在 2023 年完成的事情列表來開始新的一年,以優化您的數據中心站點。然后,隨著您改進數據中心管理的各個方面(從電源監控到容量規劃再到資產管理),隨著時間的推移查看結果。
以下是您應該列在清單上的 10 大新年決心:
一、查找所有機架的擱淺電源
數據中心經理經常為準確規劃和管理電源容量的復雜性而苦惱。傳統的功率預算方法——將銘牌值降低到 60% 或 70% 左右——是手動的、估計的,在很大程度上是不準確的,并且浪費金錢。幸運的是,有一條新的前進道路。您現在可以通過利用計算功率預算配置文件的機器學習算法,實現功率容量規劃自動化并將機架功率利用率提高多達 40%根據它們在您的環境中的使用方式為您的每個設備實例。尋找免費電源并自信地將其部署到您現有的機柜中,以推遲構建不需要的容量,每個機柜的成本在 15,000 到 20,000 美元之間。
二、查找并關閉您的幽靈服務器
您是否知道不符合能源之星標準的舊服務器在閑置時會消耗 175 瓦,浪費空間和金錢?需要識別和整合這些幽靈服務器,以充分利用您當前的電力、空間和冷卻能力。如果您沒有合適的工具,這可能需要一個繁瑣的手動過程來查找存儲資產信息的 Excel 文件、前往數據中心審核和驗證信息、部署驗證利用率的工作負載工具、尋找設備所有者等。相反,利用數據中心管理軟件輕松運行幽靈服務器報告. 然后,使用相同的軟件通過了解哪些資產和連接將受到影響、哪些額外容量將被釋放以及自動化工作流程來管理退役過程。
三、清理布線鼠窩
數據中心電纜管理通常被認為是網絡工程師的一項工作,但整個企業可能會受到不良布線實踐的影響,這些做法會導致不必要的設備安裝困難、氣流受阻導致設備過熱和損壞,以及故障排除和維護時間延長。遵循電纜管理最佳實踐,例如直觀記錄您的連接、在安裝前精確測量電纜長度、自動驗證連接以及使用報告和儀表板跟蹤連接容量。
四、獲取所有庫存的清晰文檔
現代數據中心環境極其復雜,需要監控大量 IT 資產,而 Excel 和 Visio 等傳統管理工具已無法完成工作。通過利用數據中心 CMDB準確跟蹤所有 IT 設備(服務器、網絡、存儲設備)和支持基礎設施資產(機架、機架 PDU、配線架、結構化布線、跳線、UPS、母線、分支電路)。用于完整的資產管理, 請務必跟蹤資產的詳細物理位置(例如,站點位置、機柜位置和確切的U 位置)、尺寸、重量和物理數據/電源端口信息、物理關系和連接性、基礎設施資源的利用率和容量(例如,電源、空間和冷卻),并能夠在機架立面視圖中遠程可視化您的資產,并疊加實時電源和溫度傳感器讀數。通過跟蹤和監控備件(例如硬盤驅動器、卡、內存模塊、電源、跳線和任何其他組件,甚至是螺絲盒),盡可能詳細地了解您的庫存文檔。
五、獲取所有電源和/或網絡連接的清晰文檔
跟蹤您的連接和端口容量已成為成功管理數據中心的關鍵。當您考慮到一個擁有 100 個機架的數據中心涉及一個包含70,000 多個端口和布線組件的復雜系統時,很明顯您無法承受糟糕的文檔。遵循最佳實踐并獲得清晰的連接文檔,以便輕松進行影響分析,找到部署新設備的理想位置,了解實時可用端口和空間容量,記錄布線安裝,并了解您的連接是否兼容。
六、實施用于旁路氣流的索環
使用高架地板索環消除旁路氣流可提高冷卻能力并提高能效。如果您還沒有這樣做,請考慮在高架地板上安裝索環。標準索環是一個矩形切口,距離邊緣 4 英寸,位于面板中央。將索環放置在機架下方的正確位置,可以輕松部署和升級設備,而無需更換面板。
七、實施冷通道或熱通道遏制
數據中心遏制戰略提供了許多好處,包括降低能耗、增加冷卻能力、為 IT 設備提供穩定的供應溫度、為 IT 設備提供更多的電力容量、增加正常運行時間以及延長 IT 資產的生命周期。您可以實施熱通道封閉,封閉 IT 設備排出的熱廢氣并將其返回冷卻設備,或實施冷通道封閉,封閉輸送冷送風的通道,讓數據中心的其余部分成為熱空氣返回全會。這兩種遏制方法都具有獨特的優勢,您可以從中受益。
八、部署環境傳感器
環境監測對于確保數據中心站點的整體健康狀況、減輕停機威脅和提高效率是必不可少的。在您的數據中心部署的最關鍵的傳感器是:
- 溫度。監控溫度可幫助您識別可能損壞設備并導致停機的熱點,或者了解您是否過冷和能源成本超支。遵循ASHRAE 指南以確保正確放置傳感器并確保您的設備處于推薦的溫度范圍內。
- 濕度。如果您的環境太干燥,靜電就會積聚。太潮濕,設備會腐蝕。在任一方向,極端濕度水平都會損壞設備,因此您應該根據 ASHRAE 指南監測濕度。
- 空氣流動。監控氣流以幫助避免熱點并保持穩定的環境溫度。
- 壓力。監測氣壓差異,以幫助識別可能導致冷卻效率低下和熱點的空氣泄漏。
- 振動。隨著時間的推移,數據中心的振動可能會損壞磁盤驅動器并導致停機。因此,他們應該受到監控。
- 水。及早檢測數據中心的水可以讓您有足夠的時間來防止因空調泄漏、冷凝、管道爆裂或局部管道故障而導致的潛在災難和停機。
九、實行電能計量
功率計提供關鍵數據和對配電基礎設施利用率的洞察力,以幫助確保安全、高效和可靠的運行。來自電表的數據可以幫助您增加正常運行時間、改進容量規劃、管理現有容量、報告電源使用效率 (PUE)、降低能源消耗和成本,并根據消耗量對內部或外部客戶進行計費。計量電源基礎設施可以包括:
1.智能機架 PDU。智能 PDU有多種類型的計量選項,可將機柜內的電力分配給 IT 設備。
- 入口計量。PDU 入口處的計量有助于確定機架的電源使用情況和可用容量。
- 出口計量。PDU 出口處的計量提供與入口計量 PDU 相同的優勢,而且您可以深入了解設備級別的功耗。
- 斷路器計量。知道斷路器何時跳閘,以便您可以快速重置它。
- 出口控制。從任何位置遠程打開、關閉和重新啟動各個插座。
2.母線下車和母線末端饋電。架空配電系統可以提供靈活性和易用性。根據您的母線槽系統的型號,功率計可能位于機架上方的母線分支處或一排的末端饋線處。出料箱流量計測量出口處的負載,末端進料流量計測量末端進料入口處的負載。
3.遠程電源面板 (RPP)。RPP 將來自地板 PDU 或其他電源的安全可靠的電力直接分配到服務器機柜。
4.樓層 PDU。落地式 PDU 是大型落地式裝置,可將原始電源轉換和分配為較低容量的電源。
5.不間斷電源 (UPS)。UPS是一種備用電池,可確保在公用電源出現故障時不會發生電源中斷。
6.建筑米。公用事業儀表提供設施總用電量的測量值。
十、部署現代 DCIM 工具
由于在家工作的員工和與隔離相關的數據中心訪問限制,遠程數據中心管理工具不再是可選的。數據中心基礎設施管理 (DCIM) 軟件在任何數據中心管理工具包中都是必不可少的,它可以跨組織孤島連接信息,并允許您在單一管理平臺中集中管理所有資源和容量,以保持正常運行時間、提高容量利用效率,以及提高人們的生產力。請務必選擇現代的第二代 DCIM工具,該工具提供:
- 零配置分析。開箱即用的預構建儀表板、報告和交互式可視化分析,無需任何繁瑣的配置工作。
- 數據共享和協作。鼓勵信息共享和協作以打破組織孤島的共享儀表板和團隊視圖。
- 通過集成實現自動化。開箱即用的 ITSM 連接器在不同的數據庫之間共享數據,以節省時間并消除多次手動數據輸入。
- 多供應商兼容性。基于標準的插件允許您管理所有第三方設備,而不必局限于特定供應商。
- 超快速部署。只需很少的資源和精力即可輕松部署,可提供即時的投資回報。
- 可擴展性。您的解決方案應提供企業級的可擴展性,無需額外的軟件許可和服務器實例即可擴展以處理數百萬資產和每天輪詢數十億個數據點的傳感器。
- 能力的完整性。全方位功能,包括資產、容量、變化、能源、電力、環境、安全、連接、可視化以及商業智能和分析。
從這些改善數據中心站點管理的解決方案入手,到明年,您將擁有更高效的容量利用率、更健康的環境和設備以及更高的人員生產力。