Eliminieren Sie Leistungseinbußen.
Eliminieren Sie Leistungseinbußen durch die Anordnung von KI-Clustern zu Kapazitätsblöcken für Rechenzentren.
Die Leistung in einem Rechenzentrum ist in Kapazitätsblöcke unterteilt, die in der Regel 1–3 MW betragen und durch die branchenübliche Dimensionierung von Leistungsschaltern oder Generatoren bestimmt werden.
KI wird in Clustern eingesetzt, die bald bei über 100 kW/Rack üblich sein werden, mit steigender Tendenz.
Die Ausrichtung von Clustern an Kapazitätsblöcken kann sicherstellen, dass alle verfügbaren kW genutzt werden können.
Kosten, Redundanz und Risiko abwägen.
Der Wert von KI-Hardware, die 1 bis 4 Millionen US-Dollar pro Rack übersteigt und die von ihr unterstützte Verarbeitung, führt dazu, dass bei der Strom- und Kühlungsplanung verstärkt auf Redundanz geachtet wird, insbesondere bei Inferenzanwendungen.
Designs, die den Explosionsradius oder die Auswirkungen des Verlusts eines einzelnen Kapazitätssegments (Server, Rack, Reihe) begrenzen, neigen dazu, eine höhere Anzahl kleinerer Komponenten zu verwenden, was sich möglicherweise negativ auf die Gesamtbetriebskosten auswirkt.
Designs, die die Gesamtbetriebskosten begünstigen, verwenden tendenziell niedrigere Anzahlen größerer Komponenten, oft mit Redundanz, um die Möglichkeit eines Verlusts eines Kapazitätssegments zu reduzieren.
Beziehen Sie Flüssigkeits- und Luftkühlung ein.
Die Leistung im Rechenzentrum entspricht
der abgeleiteten Wärme.
Die Temperaturen und Durchflussmengen der Luft- und Flüssigkeitskühlung müssen innerhalb des Betriebsbereichs sowohl der KI-Server als auch der Wärmeabfuhrgeräte des Rechenzentrums bleiben.
Planen Sie für die Zukunft.
Plan today to accommodate future growth and high-density demand.
Die typische Lebensdauer von Rechenzentren beträgt fast zwei Jahrzehnte. Der KI-Chip-Designzyklus beträgt weniger als zwei Jahre.
Entwerfen Sie Strom und Kühlung gemeinsam.
Optimieren Sie die KI-Infrastruktur, indem Sie sicherstellen, dass die Stromversorgungs-und Kühltechnologien so gebaut und eingesetzt werden, dass sie aufeinander abgestimmt sind.
Strom-, Kühlungs- und KI-Hardware konkurrieren um begrenzten Platz und Energie.
Ein ganzheitlicher Ansatz für die Stromversorgung und Kühlung ist erforderlich um den Anteil an Platz und Energie zu maximieren, der für KI-Verarbeitung benötigt wird.
Vertiv Design
Principles
Explore how implementing
these principles can optimize
the strategic deployment of
AI workloads.
Verwalten Sie KI-Arbeitslastspitzen.
Planen Sie die Varianz, die KI-Arbeitslasten mit Kontrollen auf Systemebene, einschließlich Strom- und Kühlpuffern, erfordern können.
KI-„Training“ führt dazu, dass eine große Anzahl von Prozessoren im Gleichtakt arbeiten, was zu massiven Stromverbrauchsspitzen führt, die sich wiederholen und sowohl die Leistung als auch die Lebensdauer der Strom- und Kühlungsinfrastruktur beeinträchtigen können.
Zu den Konzepten zur Schadensbegrenzung gehören Steuerungen auf Systemebene mit schneller Reaktion sowie sofort verfügbare Reserven bei der Strom- und Kühlkapazität.