Von Shahar Belkin, Chief Evangelist in Zutacore
Die von AI und HPC benötigte Berechnung beträgt und treibt einen globalen Übergang von 10 bis 15 Megawatt-Rechenzentren auf 50-100 Megawatt- und sogar Gigawatt-AI-Fabriken an. Mit den AI -Superchips der nächsten Era, die bei 2.800 Watt und darüber hinaus arbeitet, ist die Menge an Wärme, die von einem einzelnen Rechenzentrum erzeugt wird, aus den Diagrammen.
Zustand des Kühlmarktes – Luft gegen Flüssigkeit oder beides?
Ein Rechenzentrum, das nur Luftkühlung mit 1 Watt Kühlung für jedes Watt Computing verwendet. Das bedeutet, dass 50 Prozent ihrer Kraft die Kühlung werden! Bei der Flüssigkühlung unterstützt jede Kühlung 10 Watt Laptop. Und in Bezug auf die Wirksamkeit der Stromverbrauch (PUE), während die Kühlung auf Luftbasis einen PUE von ungefähr 1,5 liefert, kann flüssiges Gurfen auf 1,1 und 1,04 oder niedriger senken. Eine Verschiebung von 1,5 auf 1,1 ist enorme Einsparungen. Anders ausgedrückt, dass der gleiche Stromverbrauch mit der direkten Kühlung von Flüssigkeiten auf dem Chip 75 Prozent mehr Berechnung unterstützt.
Aus diesem Grund schätzen Analysten, dass der Markt für Liquid Cooling von 5,65 Milliarden US -Greenback in 2024 auf 48,42 Milliarden US -Greenback bis 2034 wachsen wird.
Flüssigkühlung 101: Direkt zu Chip vs. Immersion
Es gibt verschiedene Arten von Flüssigkühlungstechnologien, die unter zwei Kategorien fallen: Eintauchen und direkter Chip.

Direkt-zu-Chip wird üblicherweise als Kühlplatte als „Kaltplatte“ bezeichnet, da Kaltplatten auf der GPU oder CPU sitzen, im Vergleich zu Immersionskühlung, die die Server, Chips und andere Geräte in Flüssigkeitstanks untermauert.
Mit Einphaseneintauchen werden Server und andere IT-Geräte in eine ölige Flüssigkeit in einem Tank eingetaucht, und während sich die CPU oder die GPU erwärmt, absorbiert die Flüssigkeit die Wärme. Diese erhitzte Flüssigkeit steigt auf die Oberseite des Tanks und wird dann zu einer Wärmeaustauscheinheit gepumpt, die die Flüssigkeit abkühlt und wie unten gezeigt zum Tank zurückschickt:
Der Vorteil ist, dass es 100 Prozent der Wärme vom Server abnehmen kann. Es ist jedoch darauf beschränkt, dass die Kühlung niedrigerer Leistungschips (500 Watt und niedriger) kühlt, da das Öl nur langsam auf die Oberseite des Tanks steigt, um zum Abkühlen gepumpt zu werden. Darüber hinaus ist das Öl bei hohen Temperaturen potenziell brennbar, und da es alle Komponenten berührt, kann es die Lebensdauer der Geräte verringern. Und es erfordert eine starke Wartung.
Zwei-Phasen-Eintauchen untertreibt auch Server und IT-Geräte in Tanks. Im Vergleich zur Einzelphasen besteht die Differenz darin, dass es niedrige Siedetemperatur und dielektrische Flüssigkeit anstelle von Öl verwendet. Während sich die Komponente auf der Platine erwärmt, kocht sie die Flüssigkeit, wodurch Dampf entsteht, das von der Flüssigkeit bis zur Oberseite des Tanks steigt, wo ein Netzwerk von Wannen fließend Wasser ist. Der Dampf aus dem Tank, der die kalten Wannen berührt, kondensiert und tropft zurück in den Tank.
Beim Einphasen-Eintauchen werden Server und IT-Geräte in große AKKs in Flüssigkeit eingetaucht.
Der Vorteil besteht darin, dass die Dielektrizfluid die Komponenten und Server wie Wasser nicht abkammern. Der Nachteil ist, dass eine erhebliche Infrastrukturinvestition von Rechenzentren erforderlich ist, da große und schwere Panzer erforderlich sind, um die Ausrüstung unterzubringen.
Darüber hinaus, damit die Geräte in den Tank eintauchen, alle Komponenten
S muss mit der dielektrischen Flüssigkeit kompatibel sein, sodass sie nicht durch die Flüssigkeit selbst beschädigt wird. Dies erfordert spezielle Geräte oder eine Änderung an Servern. Die Wartung ist auch ein Downside, da zweiphasige häufig lange Ablaufzeiten mit der Verwendung von Kranichen zur Verfügung stehen, um die Server aus den Tanks zu nehmen.
Wie ein Phasen-Eintauchen kann ein Zweiphaseneintauchen auch 100 Prozent der Wärme entfernen. Bei diesem Vorgang werden jedoch die dielektrische Flüssigkeit in den Tanks kochen, die auch alle Serverausrüstung beherbergen. Infolgedessen wird Materials aus dem Motherboard und anderer Ausrüstung routinemäßig abgekocht. Dies kann sich nachteilig auf die Lebensdauer der Ausrüstung auswirken, und wenn das Materials ausgeht, muss es kontinuierlich gefiltert werden, wodurch große und teure Filter und regelmäßige Wartung erforderlich sind.
Direkte Flüssigkühlung
Die direkte Kühlung der Chip-Kühlung bringt die Kühlflüssigkeit auf eine Kaltplatte, die direkt auf den Komponenten mit hohem Wärmefluss wie CPUs und GPUs liegt. Diese Flüssigkeit entfernt Wärme aus den Komponenten und ist in der Kaltplatte enthalten und kommt nicht mit den Chips oder anderen Serverkomponenten in Kontakt.
Es gibt zwei Arten von direkter Flüssigkeitskühlung: Einphasen- und zwei Phasen. Beide Methoden verwenden Kaltplatten – die das Server- und Rack -Design nicht ändern. Es besteht nur das Ersetzen des Kühlkörpers auf Luftbasis für eine Kaltplatte auf der CPU oder GPU.
Bei zweiphasiger Eintauchen steigt der Dampf von der Flüssigkeit bis zur Oberseite des Tanks.
Ein-Phasen-Direkt-Chip-Kühlung verwendet Wasser- oder Wasserglykolmischung als Kühlmittel in der Kaltplatte. Wasser bleibt in einem flüssigen Zustand und die Fähigkeit, mit dieser Methode Wärme wegzunehmen, hängt vom Wasserfluss ab. Je höher die Leistung des Chips, der abgekühlt werden muss, desto mehr Wasserfluss ist erforderlich. Dies erfordert die Investition größerer Rohre, Wannen und Anschlüsse sowie leistungsstärkere Pumpen, um das Wasser kontinuierlich durch das System zu tragen.
Die Herausforderung bei diesem Ansatz ist das Risiko von Wasserleckage und Korrosion. Da sich Server der Reichweite von 300.000 US -Greenback nähern, kann ein einzelnes Leck katastrophal sein, ganz zu schweigen von den Kosten eines abverragten Anlagenbetriebs. Darüber hinaus ist Wasser im Laufe der Zeit ätzend und kann auch zu Schimmel, Rückstand und anderen biologischen Wachstum führen. Das Wasser muss kontinuierlich filtriert, aufrechterhalten und getestet werden, um sicherzustellen, dass es ausgeglichen ist, und die Wartungskosten erhöht.
Eine Einschränkung mit einer einphasigen direkten Flüssigkeitskühlung ist, dass die Wärme entfernt vom Wasserfluss abhängt. Je heißer die Chips, desto mehr Wasser ist erforderlich. Mit diesem Ansatz für einen 1000-Watt-Chip müsste ein Rechenzentrum 1,2-1,5 Liter professional Minute fließen. Mit dem neuesten GPUs im Bereich von 1,5 Kilowatt, was bedeutet, dass der Wasserfluss in jeder kalten Platte zwei Liter professional Minute betragen müsste. Wenn die GPU-Stromversorgung an der 2.000-Watt-Schwelle übergeht, wird in der kalten Platte eine Gallone professional Minute erforderlich. Wenn wir uns den Gigawatt -Rechenzentren nähern, macht der Anforderungen für so viel Wasserfluss diesen Ansatz weniger effektiv und erfordert hohen Druck in den flexiblen Wannen, die zu Wasserlecks auf den Servern führen können.
Im Gegensatz zu Direct-to-Chip-Phasen-Phasen benötigt zweiphasige Direkt-zu-Chip den Flüssigkeitsfluss nicht und verwendet tatsächlich kein Wasser in der Kaltplatte. Auf dem Server und der Kaltplatte befindet sich eine Wärmeübertragungsflüssigkeit, die zu 100 Prozent sicher für IT -Geräte ist. Die Wärme von GPUs und CPUs kocht die Wärmeübertragungsflüssigkeit bei niedriger Temperatur und absorbiert die Wärme, eine effiziente Phasenänderung physikalische Phänomene hält den Chip bei einer konstanten Temperatur.
Dies ähnelt der Artwork und Weise, wie das kochende Wasser den Boden eines Topfes bei 100 ° C nur in diesem Fall mit der Wärmeübertragungsflüssigkeit bei einer niedrigeren Temperatur hält. Wenn die Flüssigkeit in der kalten Platte kocht, verläuft die Flüssigkeit in der kalten Platte niemals die kochende Temperatur, selbst wenn die Wärme um 3x steigt (z. B. mit GPUs mit höherer Leistung und CPUs). Dies macht diese Technik sehr skalierbar, um höhere Energy -Chips der Zukunft abzukühlen. Um zu verstehen, wie dieser „Pool -Kocher“ -Ansatz funktioniert, siehe dieses Anleitungsvideo.
Zwei-Phasen-Direkt-zu-Chip-Flüssigkühlung erfordert nur geringe bis gar keine Änderungen der Rechenzentrumsinfrastruktur, nur ein einfacher Installationsprozess. Es ist auch ziemlich geringer Wartung, da die dielektrische Flüssigkeit nicht gefiltert, ausgeglichen oder ersetzt werden muss. Und im Gegensatz zum Eintauchen wird es während der Server- und Rack -Wartung nicht in die Atmosphäre freigesetzt.
Heißere Chips kommen – sind Sie bereit?
Während Chips von über 2.500 Watt erst Ende 2025 erwartet werden, bereiten sich Rechenzentren und KI -Fabriken auf ihre Ankunft vor. Viele Hyperscaller scheuen sich vor Wasser, weil es zu viel Risiko darstellt. Sogar Versicherungsunternehmen machen ihre Bedenken bekannt, weil die Versicherung eines Wasserlecks eine enorme Kosten sein könnte. Abgesehen davon besteht auch der Druck, die Infrastruktur skalierbar zu machen, sodass sie mit heißeren Chips umgehen kann, wenn sie verfügbar sind, und gleichzeitig nachhaltig, energieeffizient und langfristig.
Ist Ihr Rechenzentrum bereit?
Shahar Belkin ist der Chef -Rvangelist bei Zutacoreein Unternehmen für direkte Flüssigkeitskühlungslösungen.
