Eliminar la alimentación infrautilizada.
Eliminar la alimentación infrautilizada por medio de ajustar los clústeres de IA con los bloques de capacidad del centro de datos.
El suministro eléctrico hacia un centro de datos se divide en bloques de capacidad —generalmente de 1 a 3 MW— y se determina según el tamaño estándar de la industria de disyuntores o generadores.
La IA se implementa en clústeres, los cuales pronto superarán los 100 kW/rack y seguirán aumentando.
Ajustar los clústeres con los bloques de capacidad permite garantizar la utilización de cada kW disponible.
Equilibrar el costo, la redundancia y el riesgo.
El valor del hardware de IA —aproximadamente de 1 a 4 millones de dólares por rack— y el procesamiento que soporta están impulsando una mayor consideración de la redundancia en los diseños de alimentación y enfriamiento, especialmente para las aplicaciones de inferencia.
El valor del hardware de IA —aproximadamente de 1 a 4 millones de dólares por rack— y el procesamiento que soporta están impulsando una mayor consideración de la redundancia en los diseños de alimentación y enfriamiento, especialmente para las aplicaciones de inferencia.
Los diseños que favorecen el costo total de propiedad utilizan menos componentes de mayor tamaño, a menudo con redundancia para reducir la posibilidad de pérdidas de un segmento de capacidad.
Incluir el enfriamiento líquido y por aire.
El suministro eléctrico hacia el centro de datos es igual al calor expulsado.
Las temperaturas y los flujos del enfriamiento líquido y por aire deben permanecer dentro del entorno operativo tanto de los servidores de IA como del equipo de eliminación del calor del centro de datos.
Diseñar para el futuro.
Planifique ahora para adaptarse al crecimiento futuro y a la demanda de alta densidad.
Por lo general, la vida útil de un centro de datos es de casi veinte años. Planifique ahora para adaptarse al crecimiento futuro y a la demanda de alta densidad.
Diseñar la alimentación y el enfriamiento juntos.
Optimizar la infraestructura de IA por medio de garantizar que la tecnología de alimentación y enfriamiento sea fabricada e implementada para funcionar en conjunto.
El hardware de alimentación, enfriamiento y IA compiten por espacio y energía limitados.
Se necesita un enfoque integral del diseño de alimentación y enfriamiento para maximizar el espacio y la energía dedicados al procesamiento de IA.
Vertiv Design
Principles
Explore how implementing
these principles can optimize
the strategic deployment of
AI workloads.
Gestionar los picos de las cargas de trabajo de IA.
Planifique la variación que las cargas de trabajo de IA pueden necesitar con controles a nivel de sistema, como búferes de alimentación y enfriamiento.
El entrenamiento de la IA suele hacer actuar en conjunto a un gran número de procesadores, lo cual genera consumos energéticos máximos masivos que pueden repetirse y degradar el rendimiento y la vida útil de la infraestructura de alimentación y enfriamiento.
Los diseños de mitigación incluyen controles a nivel de sistema con respuesta rápida, además de búferes en capacidad de alimentación y enfriamiento de acceso inmediato.