上一期文章中我們以小型數據中心(40kW)為例探討了一種創新的空間和功率密度設定方法。本期我們將以大型數據中心(2MW)為例,進一步探討不同的成長計劃、模塊化設計下如何設定功率密度。
一、大型數據中心功率設定流程
以2MW的數據中心為例,數據中心采用以下層級結構:
制定大型數據中心規格有兩種基本方法:
1. 從機柜或IT區域層面開始制定規格,再上升至設施規格
2. 從設施層面開始制定規格,再分解為機房,然后是IT區域,再是機柜規格
理想情況下,應使用第一種方法。然而,大多數情況下,第一種方法并不現實,因為設施層面的限制條件起初就已經界定,比如可用的主要電源或建筑的物理尺寸。在設施功率要求已知的情況下,規格參數必須分解為機房和IT區域,然后再整合到設施層面,流程如下:
1. 確定設施的機房數量,設定機房功率
2. 確定每個機房內的IT區域數量,設定IT區域功率
3. 確定每個IT區域中的機柜數量,設定機柜功率
4. 設定設施、IT區域和機房空間使用參數
5. 確定剩余的功率密度參數
6. 整合總體規格,對照設計約束進行驗證
7. 不斷調整、重復計算直至設計滿足要求
為簡化起見,該范例假設所有機房的規格參數均相同,所有的IT區域都一樣,且變化僅存在于機柜層面。這種假設對許多情況而言均是恰當的設計假設。下圖所示為用于該范例2MW規格設定的工作表。
該工作表簡明扼要,包含了大量的設計信息。工作表分為三個輸入列:左列表示設施的機房組成方式,中列表示機房的IT區域組成方式,右列表示IT區域的機柜組成方式。工作表定義了2MW數據中心范例的各種屬性,具體如下:
- 一個IT區域由12個IT機柜和4個預留機柜位置組成,旨在提供配電和行級制冷,IT區域占地面積為6m x 4m。
- 只要所有12個機柜的IT區域功率不超過50kW,則任一機柜的容許峰值功率為12.5kW。
- 如果采用IT機房層面的W/㎡常規單位表示,則該數據中心的功率密度為1,206W/㎡。
- 每個IT區域內均提供2個預留機柜位置,如果已部署的平均功率低于規定的5kW每機柜,則可充分利用IT區域供電和制冷。
- 每個機房均預留2個IT區域位置,一個是為了在不中斷現有IT區域的前提下對新IT區域進行暫存,另一個是在已部署的平均功率低于5kW每機柜時充分利用機房供電和制冷。
相比于先前介紹的單一機房范例,該工作表更為復雜,因為它明確記錄了為應對功率密度不確定性而預留的空間。由于已在單個機柜的IT層面預見并考慮不確定性,用戶不需要進入IT區域或機房層面;這些層面都是由較低層面累加而成。然而,在設計中,用戶可預留空間,以應對不同層面上的不確定性。用戶可通過在IT區域中預留額外的機柜位置,或通過在機房中預留更多IT區域位置,或通過在設施中預留額外的機房空間,或通過三種方式的組合,為應對功率密度不確定性預留空間。哪種預留空間方式最受青睞通常取決于機房的幾何形狀或其他因素。該工作表記錄了整體空間要求,使用戶能夠使用額外機柜、IT區域或機房的任一組合預留空間。
二、將該方法擴展至配備不同IT區域和機房的數據中心
理想情況下,設施應具備整齊劃一的IT區域和機房設計。這種統一設計具有不少設計優勢,包括:
然而,統一設計并非總是適合或可行,原因如下:
- 已知將要部署的是不同類型的IT設備,且要求大不相同
- 不同區域具有不同的可用性要求,這些要求將影響冗余的供電和制冷設備所占據的空間
我們為此推薦的最佳實踐是,確定最小合集 的標準機柜、標準IT區域以及(在大型數據中心中)標準機房。例如,大型數據中心可以界定三個不同標準的IT區域,占地面積相同,用于低功率密度、高功率密度和存儲。按照IT區域的預期組合,進行數據中心設計,但也應保持靈活性,以便在長期部署過程中調整組合情況。
上圖所示的工作表使用了統計學上的一般機柜,部署在標準IT區域內,安裝在標準機房里。如IT區域和機房的類型組合實際上已確定,要采用這種方法則需要完善這個工作表。
三、選擇功率密度參數值
既然功率密度參數能大幅拉動成本,該章節將為數值選擇提供指南。遵循此處的建議,是為任何類型設施制定功率密度規格的良好開端。這些建議值可原樣照搬,或酌情調整以滿足特殊要求。
單元數量
對于簡單的小型機房,“單元”數量即機房內的IT機柜數量。對于大型數據中心,即為三個數值:IT區域中的IT機柜數量、機房中的IT區域數量以及設施機房數量。這三個數值在大多數情況下取決于設施約束。然而,一個關鍵設計值是IT區域中的機柜數量,這個值影響著設計的許多方面。這就帶來了問題,即IT區域的機柜數量是否具有推薦的選用值?
按照定義,IT區域通常包括配電和制冷系統,因此,部署低于20 kW(取決于具體功率密度,相當于2至6個機柜)的IT區域通常不切實際。IT區域通常視作相鄰機柜的組合,而且IT區域周圍按照法規要求應設置人員通道,因此,機柜最大數量應約為24,即相當于75至500 kW(取決于具體功率密度)。確定IT區域尺寸的一個最佳實踐是,按該IT區域進行不斷的IT區域翻新和更換(而不是按機柜進行翻新)。較小的IT區域尺寸允許較小規模的翻新。一個500 kW的IT區域大致相當于1000臺服務器,只適合大型云服務提供商使用。對于多數客戶,介于50-100 kW范圍的IT區域,相當于100至200個服務器,更加實際。
IT區域中IT機柜推薦數量為8至24個。具體而言,大型數據中心和低功率密度建議配備較多IT機柜,而小型數據中心和高功率密度建議配備較少IT機柜。
每單元設計目標平均功率
每機柜設計目標平均功率的選擇令人困惑,且飽受爭議。這對數據中心設計和成本有著非常大的影響,而且一直以來有關這方面的建議并未達成一致。首先,重要的是要注意,一直以來的大多數討論沒有正確區分不確定性和峰值這兩個概念,而這兩個概念對功率密度規格的制定至關重要。
回想一下,設計目標平均值是所有機柜平均得出的目標平均(額定)機柜功率。如果規定了5 kW的設計目標平均機柜功率,只要峰值功率參數容許,仍然可以使用20 kW的機柜。數據中心一般傾向于設定較大的每機柜設計目標平均功率,以容納未來的IT設備(普遍認為未來IT設備有著更高的功率需求)或提供充足的安全余量。因此,選擇較高數值似乎是謹慎穩妥。然而,正如專題(一)所討論的,情況并非如此。事實上,若設定的規格比實際最終部署更大,將導致極度浪費和低效。不少設定較高設計目標平均機柜功率值的數據中心運營商都深陷這一困境,而他們原以為自己設計的數據中心能滿足未來需求。更好的方式是,為數據中心選擇一個總功率 (kW),然后再選擇一個預期機柜功率的最佳估算值。要應對不同于設計值的未來功率密度需求,可采用下面所介紹的基于不確定性和峰值參數的方法。
現今,實際數據中心的每機柜功率密度范圍在每機柜2 kW至30 kW之間。然而,平均值超過12 kW的非常稀少,且主要存在于高性能計算(HPC)或高功率密度云計算應用中。企業單位內絕大多數混合用途的數據中心,其平均值在每機柜4 kW至8 kW范圍內。然而,一般而言,數據中心的現有平均值并不能準確預測其未來值。整合、標準化、新服務器技術和虛擬化正在推高每機柜功率密度。一般來說,專為混合IT用途而設計的新數據中心,其設計目標平均機柜功率應至少比企業單位現在運行的功率高50%。
單元功率不確定性
行之有效的功率密度規格通常都設置了應對單元功率不穩定性的非零值。唯一例外可能存在于HTP應用中,在HTP應用中,存在明確的標準IT部署,IT設備的功率要求也是已知的,因而可基于這些已知信息構建設施。
務必謹記,不確定值是用來描述已部署的所有機柜平均功率密度如何偏離設計目標平均值,以合理應對突發需求。該值不是用來處理獨立單元之間(機柜、機房之間等)的差異情況。
例如,如果提前知道IT負載的組成為:4 kW機柜占80%,20 kW機柜占20%,那么我們就能確切地知道設計目標平均功率為7.2 kW/機柜(加權平均數)。即使本例中混合使用了功率范圍為4 kW至20 kW的機柜,這組機柜的單元功率不確定性仍為零。如果4 kW機柜的比例不是確切的80%,而是70%至90%之間,且其余機柜的功率均為20 kW,那么單元功率不確定性則變為+/-1.6 kW,即22%。
為確定單元功率不確定性,假設數據中心已被設備占滿,分別取得導致每機柜最低平均功率和每機柜最高平均功率的IT部署假設數據,然后取兩者差值的中間數。因為設計不確定性將產生成本,不推薦采用極高或極低的功率密度值這種最壞情況下的絕對假設,而是應考慮可建立80%信心值的功率密度范圍假設。
每單元峰值功率
幾乎每個數據中心的機柜之間都有功率變化。機柜的運行功率在50瓦特(帶接線板的網絡交換機)至30 kW(全負載高性能刀片式服務器)再尋常不過,這實際上表示60:1的能耗比。
如果要求數據中心能應對機柜之間的功率變化,那么配電和氣流分配系統必須能支持單個機柜的峰值功率值。因此,配電和氣流分配系統必須大于設計目標平均機柜功率預期可提供的性能。設計目標平均機柜功率決定了大容量電力和制冷裝置的額定值,但峰值機柜功率則要求更高性能的配電和氣流分配系統。配電和氣流分配系統的過度規劃可導致成本浪費,但卻能應對機柜間的功率變化問題。峰值機柜功率和設計目標平均機柜功率的比值為3X或更多時,通過減小該比值來管理成本不失為可取的方法。優化峰值與設計目標平均功率比值的兩個技巧介紹如下:
1. 將功率相似的機柜組合到一個IT區域內,并為IT區域定義不同功率密度。IT區域之間的每機柜設計目標平均功率將會不同,但單個IT區域峰值與設計目標平均值的比值將會下降。
2. 通過策略控制每機柜最大功率。比如,在一定的機柜功率密度之上進行IT部署時,要拆分機柜間設備。通過限制峰值功率,可不必配備極端供電或氣流分配設備。這點在數據中心有一小部分刀片式服務器機柜時非常有效。
管理功率比
得益于現代IT系統的功率管理功能,隨時間推移消耗的平均功率往往低于全計算負荷下的數值。出于容量考慮,供電和制冷系統的設計必須面向全計算負荷下的IT功率。然而,要確定電能效率,平均功率是更重要的數字,因為平均功率決定供電和制冷系統的平均預期運行功率水平。
功率比越小,就越需要供電和制冷系統在輕負荷條件下運行,而輕負荷條件下一般會降低能效。現今,典型數據中心的管理功率比約為95%,但未來幾年內,不少應用的管理功率會降至40%和80%之間。
請注意,管理功率比不會具體改變數據中心面積,或大容量電力和制冷系統的額定值,或配電和氣流分配系統的性能。然而,管理功率比會對效率或數據中心的PUE產生影響,從而對系統架構的選擇造成影響。較低的管理功率比建議數據中心應采用模塊化、可擴展的設計,或即使在輕負載下能效也出色,最終可幫助節約生命周期的能源成本。在沒有考慮管理功率比的情況下建模或計算的預期數據中心能源效率,將會導致對結果過度樂觀,其計算結果本身也值得懷疑。
四、IT 功率密度策略
在許多情況下,數據中心運營人員對機柜功率密度掌握定奪權。例如,當部署機架式服務器時,僅需在機柜中留出空白區,即可限制機柜功率密度。此外,運營人員也可自行決定單個設備的部署,還可以在機柜內組合搭配高低功率密度設備,從而控制每機柜的功率。這些決策取決于數據中心運營人員,或由用戶或其他方左右。
每個數據中心應該制定相應的功率密度策略。峰值機柜功率不應該通過對最糟情況下未來IT設備最大功率的揣測進行設定,而是應該設計合理的限制,并強制將部署維持在該限制內。機柜運行功率范圍寬廣的數據中心受益于以下舉措:由IT區域設定機柜功率限制,針對高低功率密度設定特定的IT區域,以及根據IT區域類型制定策略。
許多現有數據中心存在的一個通病是,部分或大多數IT部署處于平均或峰值功率密度時,超出了數據中心容量。這種情況會由于配電或供冷能力緊張而導致過載和過熱,最終耗盡設施的供電容量或制冷容量。這種問題顯而易見。然而,正如我們先前所指出,低容量部署也是一個問題,因為隨著數據中心逐漸由單元占據,低容量部署可能會導致供電和制冷容量擱淺。機柜中U空間利用不佳本可避免,也是導致低容量的普遍因素。因此,應該監測最小和最大機柜部署功率,且根據策略進行部署。
五、結論
當數據中心的功率密度由單一數據確定時,如W/㎡,許多重要的性能特點未能說明。 這樣一來,為規格制定、設計和調試過程帶來大量困惑,也限制了運營人員對數據中心容量的全面理解。
制定數據中心規格的方式,應該考慮到關鍵的設計制約因素,同時還要為設計具體細節的工程師和承包商提供明確指導。規格應該明確提供必要的信息,幫助數據中心運營人員制定運行策略和流程,使他們對數據中心可預測的性能抱有信心。
即便數據中心的信息不完整,計劃不確定,也可以使用本專題介紹的方法。為幫助嘗試自行制定功率密度規格的用戶,我們提供了典型的設計值供參考選用。標準化、預定制、模塊化的IT區域、機房和設施也可使用本專題介紹的方法制定功率密度規格,從而簡化數據中心設計。
專題(一)至專題(三)介紹了一種簡單快速、符合邏輯的方法,幫助記錄數據中心空間和功率密度需求,為確保性能可預測和避免偶然事故提供了充足的細節信息。采用該方法為數據中心制定規格,相比于歷史方法而言,能對數據中心具體化設計提供更加全面清晰的指導。那么數據中心功率密度的真實變化趨勢到底是怎么樣呢?敬請關注下一期:施耐德數據中心論壇 | 功率密度專題(四)數據中心功率密度的真實變化趨勢。
文章摘自施耐德電氣信息技術
歡迎聯系寶通集團咨詢施耐德產品信息
寶通集團聯系方式
咨詢熱線:400-830-0107
寶通官網:m.btibt.com
客戶垂詢郵箱:Customer@ex-channel.com
客戶垂詢QQ:1305742380
地址:深圳市福田區深南大道1006號國際創新中心C座11樓
郵編:518026
?