在高密度部署中实施智能电源管理的注意事项

随着数据中心越来越多的部署虚拟化和整合设备,以实现更高效的计算,平均机架功率密度也在不断上升。仅仅几年前的3 – 4 kW的一个平均机柜支持,到了今天,这一功率负载已经被视为低密度环境了。现如今,机柜容量为9 – 15 kW的情况早已经并不罕见,甚至在某些情况下会更高。

表1:数据中心密度定义:AFCOM的数据中心研究所理事会文档。

随着在每台机柜中所处理的工作负载量的持续增加,数据中心管理人员需要高度关注机柜配电策略,以便能够以最小的管理开销实现最高水平的可用性和效率。

为了确保IT设备的高可用性功率,功率链上的所有功率组件都需要具备监控功能。

机架电源分配单元(PDU)代表了功率链的最后一站。因此,企业组织为高密度部署选择具有监控功能的机架PDU是至关重要的。事实上,根据最近的研究表明,机架式PDU市场正在由更高的功率额定值、更多的智能产品需求、更富智能化和安全性功能特点的需求、功率配置供应的需求、容量规划和远程控制所推动。本文中,我们将与广大读者诸君共同讨论关于在这种高密度操作运营环境下,实现有效的机柜级电源管理所涉及到的相关电气、物理和管理因素。文中列出了在高密度机柜中部署智能PDU时所亟待考虑的六大关键性因素,同时还涵盖了与部署智能PDU相关的成本和安全性的管理问题。

为高密度机柜选择智能机架PDU时的六大关键性注意事项:

适当的输入电路 以处理所需的容量

充足的插座类型和密度 以插入所有设备

分支过量电流保护类型 最大限度减少跳闸和停机中断所带来的干扰

高环境温度等级 确保在热通道内的可靠运行

适当的功能级别 在机架或设备级别进行监控

持续的监控 主动通知即将发生的问题

适当的输入电路

从公用供电服务机构输入数据中心内的功率通常都是三相的。允许三相电源进入数据中心,能够以较低的电流强度传输所需的功率容量,因此具有较低的损耗量。企业组织可以选择为机柜提供三相或单相电源。在高密度机柜环境中,将三相电源供应给机柜带来了与为数据中心供应三相输入电源相同的优势。下表展示了在北美和国际其他地区最常见的一相和三相电路可以处理的最大容量。

如上表所示,对于北美地区的超过4.9 kW的机架密度,以及国际其他地区的为7.3 kW的机架密度,最有意义的是以三相电源供应给机柜。供应给机架的适当的三相电路由总的机架容量所需确定。通常,两个电源供应被用于每个机柜以支持冗余,并且每款PDU应能够支持机柜的全部负载。例如,如果机柜具有5 kW(5 VA)的负载,则每款PDU和支持电路的规模将调整为10 kW(10 VA)。

机柜级的三相电源不仅有助于最大限度地减少损耗,而且简化了进入数据中心的所有三相输入功率的负载平衡。平衡负载通过保持中性电流和低谐波,带来了上游电气基础设施的最佳利用。

对于绿色环保数据中心领域的机会,数据中心还可以选择提供给机柜中设备的电压。大多数现代IT设备可以处理100 – 250V范围内的电压。为IT设备选择较高的电压可降低电流消耗,从而降低损耗。这就是为什么北美地区的许多新建的数据中心均设置为240 / 415V的三相电源机柜供应,而不是典型的208V甚至120V的电源机柜供应的原因所在了。

充足的插座类型和密度

在大多数数据中心,高密度机柜由以下配置组成:

在较高的机柜中装满1U / 2U服务器的机架 这些机柜通常有大量较低电流强度的服务器,通过IEC 320 C14连接器供电。对于这些部署,适当的机架PDU应提供大量的IEC 320 C13插座。今天,仅仅只有少数的智能PDU提供商在其标准形式的因素内具有多达60个C13插座,以支持45U或更高的机柜。

机架装有少数刀片机箱或数据中心级模块化网络交换机 这些机柜通常具有较少的设备,所有设备都通过多个电源供电,每款设备使用一个或多个C20连接器。对于这些部署,需要具有大量C19插座的智能机架PDU。

在理想的情况下,关于在智能PDU上用于支持的插座类型和密度的决定应当在选择了企业组织所要部署的IT设备之后进行。然而,如果必须较早地做出关于PDU的决定,则建议选择能够提供C13和C19插座良好混合的智能PDU。选择插座数量更多的C19将总是更好的,因为这些类型的插座可以为具备C14或C20连接器的设备供电。另一方面,一款C13插座不能用于为具有较高电流强度的C20连接器供电。同样,较小的机架安装设备(如1U / 2U服务器)中的电源通常使用C14 / C13连接,较大的刀片和模块化交换机设备中的电源通常使用具有较高电流强度的C19 / C20连接。

当您不知道将在机柜中放置什么设备时,请选择具有C13和C19混合插座的PDU。

选择具有锁定插座,并能够与标准电源线配合使用的智能PDU。

无论插座类型是C13、C19还是两者的混合,插座都应提供锁定功能,防止IT设备的意外断开。为了节省整个解决方案整体的前期成本,锁定插座应能够支持标准电源线。如果您企业选择使用专用电源线的型号,则需要为每款被供电的设备提供专用电源线的额外费用。

支路过量电流保护

所有的智能PDU大于20A的电流,通常有两个或两个以上的分支电路保护,由过量电流保护保险丝熔断器或断路器提供。强烈建议在保险丝断路器上选择断路器。当出现跳闸时,断路器可以很容易地复位时,而保险丝则必须更换,并电源保持在外面,直到保险丝被替换。替换过程中,需要关闭整个PDU,以 及许可电工的干预执行,最终带来更高的平均故障修复时间。

断路器类型则是另一个重要的考虑因素。断路器可以是热的,磁性的或磁性的液压系统。磁液压断路器是最不容易受到热变化的影响,并能够最大限度地减少跳闸,使其成为了高密度部署的最佳选择。为了处理轻微的过载情况,选择具有100%额定值的磁液压断路器。分支过载电流保护其他相关的重要功能包括:

A、超薄型断路器,以确保空气流的最小干扰

B、安全可靠的UL 489认证目录(UL-listed)断路器

C、能够不断地监控断路器或熔断器的状态,而不管所选择的PDU是何类型

半高(low-profile)、UL 489认证目录、磁性液压断路器可处理更高的温度,防止误跳闸,并且不阻塞通过机柜的空气流。

更高的环境温度额定值

为了保持高水平的效率并降低能耗成本,高密度部署具有更高的服务器入口温度,最终将转化为更高的服务器排气温度。一些数据中心还部署了遏制解决方案,以提高效率。所有这些措施使得热通道中的温度较高,而大多数垂直PDU安装此处。

为了确保PDU在这种温度上升的趋势下能够继续可靠地工作,请务必考虑具有高温度等级的PDU。为了具有最高的可用性,PDU还必须支持额定温度下的满载容量。因此,企业客户选择能够提供具有高温度等级的PDU的制造商,以满足当前和未来的业务实践的需要无疑是至关重要的。

PDU都暴露在最高环境空气温度下。故而企业客户应尽可能的选择一款具有最高温度评级的PDU。

智能PDU适当的功能级别

智能PDU具有不同级别的功能。每种功能在高密度部署情况下的相关益处描述如下:

分支电路和相位级监控

这些参数的持续监控以及通过通知设置阈值的能力,确保了连接的负载始终处于容量范围内。相位级别的监控还确保负载保持平衡,以实现效率和最佳利用率。

电源插座的测量

提供有关单个IT设备的能耗的信息,最终实现退款报告和更高的问责制。此外,还有助于为单个设备设置基准能耗,这在选择要添加到机柜的新设备时非常有用。

电源插座的开关

通过为管理员提供什么设备从PDU获得供电的能力控制,确保合适的配置。作为最佳实践方案,所有未使用的插座应保持在 关闭 状态,直到管理员允许其连接到新设备。这种功能还提供了在初始启动时按顺序打开设备以及识别未充分利用的设备的能力,或者在停电后将高浪涌电流最小化的能力。其还为悬挂的IT设备提供了远程循环供电的能力。

综合的环境监测

通过集成或连接到机架PDU的传感器,持续的监控机柜级的环境温度和湿度参数,通过提供对任何即将发生的问题发出早期的通知确保IT设备的可用性。

持续的监控

对于高密度的环境,智能PDU具备随时提供断路器状态的能力是至关重要的。对于所有被监控的电气参数,PDU需要提供设置阈值的能力。当超过警告或临界阈值时,PDU应该具备发出警报的功能。您企业所选择的智能PDU应具备提供通知的灵活性。例如,一些优先的通知方式包括发送电子邮件、SNMP陷阱或Syslog。出于故障排除和审计的目的,智能PDU应为每个记录的条目提供一个带有时间和日期戳的可导出的事件日志。

其他注意事项 处理与智能PDU部署相关的挑战:

除了上面所提到的关键性的注意事项之外,还有几项涉及到智能PDU如何集成到您企业的网络有关的重要部署注意事项。

最小化所有PDU的网络连接成本

确保高水平的网络安全性

对所有PDU的综合管理

借助安全阵列IP整合技术(Secure Array IP Consolidation Technology)最小化所有PDU的网络连接成本

智能PDU的网络连接通常需要安装从每款PDU的后面安装附加网络交换机和电缆以连接到交换机。对于每个联网的PDU而言,这种网络基础设施的成本可以高达500美元。 安全阵列IP整合技术通过在一个IP地址和物理网络连接中整合并多达32个PDU来最大限度地降低网络连接的成本。

这减少了所使用的IP端口的总数,最终转化为部署较少的网络交换机。总安装时间和以太网电缆长度也明显减少。下表则提供了一家企业组织在一个安全阵列下部署智能PDU,较之使用一个单独的网络连接到每个单元,可以期望带来的总的成本节约的一个估计值。

注意:成本是基于每个网络连接的网络成本为500美元的估计值。

如下图所示,安全阵列还允许将阵列中的另一个PDU设置为网络冗余的 首要备用替代 。这确保了跨阵列的连续通信,即使在登记之一的PDU丢失其网络连接或其智能被破坏的情况下。安全阵列的其他优点包括大规模配置所有PDU的功能,以及整个阵列内所有PDU和插座的分组。

确保高水平的安全性

由于具备打开和关闭插座,并远程设置阈值的功能,故而当考虑智能PDU时,网络安全性是至关重要的。而确保高水平的安全性所需考虑的关键项目包括:

A、确保所有可用于监控和管理PDU的接口都内置了安全功能:

① Web界面应支持HTTPS协议

② SNMP兼容性应包括v3支持,已内置了SHA和DES加密

③ 命令行界面(如果支持的话)应包括SSH功能

B、智能PDU应该支持远程认证协议,诸如LDAP和RADIUS之类,以最小化在每个单独的PDU处维护密码和用户登录的需要。

C、所有接口应在用户和管理员级别提供单独的权限。

D、本地接口的功能应尽可能多的限制仅仅只能用于监控项目。可以改变设置和插座控制的能力,不应该通过本地接口实现。

所有PDU的综合管理

典型的数据中心在每个机柜内具有两个PDU。随着任何中型到大型数据中心的机柜数量逐步从几十台增加到几百台,单独管理每款PDU可能会是一个非常繁琐的任务。一款全面的软件解决方案通过提供访问,管理和审计功能的单一界面,简化了数据中心或多个站点内的所有PDU的管理。综合软件解决方案的关键管理功能包括但不限于:

所有PDU的健康运行状况映射状态视图

整合事件日志和报警/通知功能

具有报告功能的嵌入式数据库,可帮助数据中心管理员采取措施以降低能源消耗,利用滞留容量,并更好地规划未来的容量需求

对所有PDU和插座进行分组,以便进行能耗报告,功率控制和设置许可

对所有PDU的配置实施更改

管理PDU的软件解决方案应该能够自动发现所有支持的设备。动态插件功能允许快速开发对新设备的支持是一大优势,因为其真正使之成为了一款供应商无关的软件。开源的数据库和Web API配置允许数据中心操作人员根据自己的需要定制软件解决方案。软件解决方案还应该与PDU本身不断同步,以确保公共数据模型中的一致性。

结论

在机柜级别的智能电源管理对于成功的高密度部署是至关重要的,并同时需要适当的规划。第一步是要查看所有可用的电气输入选项,并选择一款兼容所需的机柜密度的电源输入选项。下一步是选择支持高密度环​​境所需的适当类型和数量的插座。应当适当注意确保所选的PDU能够支持高密度部署的特性,例如较高的机架温度和分支电路电流。

智能PDU部署为数据中心提供了显著的优势,但同时也带来了一些挑战。利用具有安全阵列技术和安全接口的PDU解决了有关网络连接和成本的问题。部署集中式管理软件使得所有PDU实现了无缝管理,并使企业客户的智能PDU的投资真正变得有价值。

现代数据中心需要的智能产品不仅要满足最低的市场要求,而且还要能够满足数据中心运营商们的高可靠性,高性能和高质量的期望。这就是为什么选择一家能够提供包含了本文所介绍的所有特性和功能的PDU制造商是如此重要的原因所在了。

关于作者

本文作者Ashish Moondra是国际知名厂商Chatsworth Product, Inc公司资深的电力、电子和软件产品经理。 他在开发、销售和管理机架配电、不间断电源、能量存储和DCIM解决方案方面拥有长达20年的经验。Ashish以前曾先后供职于美国电力转换公司(American Power Conversion)、艾默生网络能源公司和Active Power公司。