數(shù)據(jù)中心容量規(guī)劃是當今數(shù)據(jù)中心專業(yè)人員面臨的最大挑戰(zhàn)之一。根據(jù)Sunbird Software 最近的一項調(diào)查,72% 的受訪者表示容量規(guī)劃是他們的首要目標之一。適當?shù)娜萘恳?guī)劃會導致數(shù)據(jù)中心規(guī)模合適、資源得到有效利用并降低成本,但說起來容易做起來難。現(xiàn)實情況是,許多數(shù)據(jù)中心專業(yè)人士難以準確規(guī)劃容量,反而擁有大量的閑置容量。
什么是擱淺容量?
擱淺容量是指未知可用的數(shù)據(jù)中心資源。大多數(shù)時候,您甚至不知道自己是否有閑置產(chǎn)能以及有多少閑置產(chǎn)能。電源、空間、冷卻和數(shù)據(jù)/電源端口是數(shù)據(jù)中心的主要容量參數(shù)。當資源不平衡時,就會出現(xiàn)擱淺的能力。為了準確了解容量,必須將所有資源視為相互關(guān)聯(lián)和相互依存,以了解當前的平衡。
為什么擱淺容量很重要?
擱淺的容量是資源和金錢的浪費。它會降低數(shù)據(jù)中心的效率,導致更高的運營成本和不必要的新擴建。部署一個服務器就緒機柜的成本約為 15,000 美元。如果您可以將閑置容量用于新部署而不是配置新資源,則可以節(jié)省大量資金。想象一下,通過利用現(xiàn)有資源并推遲對新機柜甚至新數(shù)據(jù)中心的需求,您可以節(jié)省多少成本。
試試我們的機架供電成本是多少?計算器,看看通過恢復閑置的電力容量而不是建造新機架可以節(jié)省多少錢。同樣,冷卻數(shù)據(jù)中心的成本很高,充分利用現(xiàn)有的冷卻能力可以節(jié)省大量資金。
是什么導致擱淺的容量?
數(shù)據(jù)中心中可能導致容量擱淺的常見做法和錯誤包括:
- 數(shù)據(jù)中心容量的過度配置。當組織設計他們的數(shù)據(jù)中心時,他們通常會包含超出他們需要的大量容量。為未來的增長和不可預見的情況做好準備是明智的,但過多的過度配置是浪費。
- 傳統(tǒng)規(guī)劃方法。在預算功率和確定機柜中可以部署多少臺服務器時,數(shù)據(jù)中心經(jīng)理通常會將服務器的銘牌值降低到 60-70% 左右。由此產(chǎn)生的預算數(shù)字只是假設,可能非常不準確。
- 缺乏工具和信息。基于假設和手動計算而不是可靠的商業(yè)智能和分析來規(guī)劃容量會留下太多錯誤空間,從而導致容量受限。Excel 和 Visio 等舊版工具容易出現(xiàn)人為錯誤、耗時且版本控制不佳。
- 幽靈服務器。數(shù)據(jù)中心中多達 30% 的服務器可能是幽靈服務器(或僵尸服務器),它們在物理上運行但不執(zhí)行任何有用的功能。幽靈服務器消耗空間、電力、冷卻和布線資源,卻沒有提供任何好處。
- 高密度部署。高密度工作負載涉及機柜中的一些耗電設備。機柜中可能有可用空間,但無法使用,因為部署任何額外的設備都會產(chǎn)生比傳統(tǒng)冷卻方法所能容納的更多的熱量。
- 氣流效率低下。如果錯誤放置的穿孔瓷磚、未密封的電纜開口、機柜內(nèi)部和周圍的縫隙,冷空氣就會逸出。該絞線的冷卻能力是因為冷空氣被浪費并且不再可用于冷卻設備。同樣,不使用熱通道/冷通道遏制策略會使冷空氣與熱空氣混合,從而降低冷卻能力。
- 過冷。平均數(shù)據(jù)中心的冷卻能力是 IT 負載所需的3.9 倍。過度冷卻會浪費能源和金錢,并導致不必要地購買更多的冷卻裝置。
- 相對濕度高。在潮濕的數(shù)??據(jù)中心,冷卻裝置盤管上會形成冷凝水。這會散發(fā)出使用一定百分比冷卻能力的熱量。
查找擱淺容量的 7 個最佳實踐
- 使用現(xiàn)代數(shù)據(jù)中心管理工具。你無法管理你無法衡量的東西。使用智能機架 PDU 和其他計量電源基礎設施和環(huán)境傳感器(即溫度、濕度、壓力)對您的數(shù)據(jù)中心進行測量。然后,使用數(shù)據(jù)中心管理軟件自動收集、存儲和趨勢數(shù)據(jù)。現(xiàn)代DCIM 軟件將以零配置圖表、報告和可視化分析的形式將該數(shù)據(jù)轉(zhuǎn)化為可操作的洞察力,例如您擁有多少擱淺容量以及擱置在何處。
- 自動化設備功率預算。利用具有自動功率預算功能的 DCIM,該功能可以根據(jù)運行應用程序的環(huán)境中該設備的實際測量負載自動計算每個設備實例的準確功率預算數(shù)字。您只需設置一次策略,機器學習算法每周都會更新您的功率預算數(shù)字。借助此功能, Comcast的電力和設施資源利用率提高了 40% ,而eBay 部署項目的機柜減少了 33%。
- 尋找幽靈服務器。退役幽靈服務器可以釋放閑置設備上浪費的電力、空間和冷卻能力。使用 DCIM 軟件,您可以輕松地運行報告來識別潛在的幽靈服務器。然后您可以調(diào)查并確認它們可以退役。
- 執(zhí)行假設分析。假設分析可幫助您在每個項目的基礎上確定數(shù)據(jù)中心的添加和停用對您的空間和電力容量的影響。有了這些信息,您就可以知道是否可以將現(xiàn)有資源用于未來的項目以延遲購買更多容量。
- 智能搜索容量。借助DCIM軟件的智能容量搜索功能,您可以在幾秒鐘內(nèi)找到新設備的容量。只需選擇您要部署的型號,該軟件就會向您顯示具有該特定設備可用容量的每個機柜位置。
- 確保最佳氣流。確保氣流盡可能高效將減少數(shù)據(jù)中心閑置的冷卻容量。遵循數(shù)據(jù)中心氣流管理最佳實踐,例如實施熱通道/冷通道氣流遏制以及在未使用的空間安裝盲板。
- 提高溫度。冷卻裝置制造商通常根據(jù) 75°F 的回風溫度對其設備進行評級。然而,數(shù)據(jù)中心經(jīng)理通常會過度冷卻設備,導致無法充分利用額定冷卻能力。提高溫度設定點,同時監(jiān)控設備是否超出制造商或行業(yè)指南可以節(jié)省資金并減少擱置的冷卻能力。
匯集一切
擱淺的容量會浪費資源,必須盡量減少。正面應對擱淺容量的挑戰(zhàn)可以提高運營效率并顯著節(jié)省成本。借助現(xiàn)代數(shù)據(jù)中心容量管理解決方案,您可以做出更明智的決策,從而改進容量規(guī)劃并提高現(xiàn)有資源的利用率。