Refroidissement liquide des data centers

L’essor des technologies de l’information a entraîné une augmentation exponentielle de la densité de puissance des équipements dans les data centers, posant des défis croissants en matière de refroidissement. Face aux limitations des systèmes traditionnels de refroidissement par air, le refroidissement liquide émerge comme une solution prometteuse.
Cette note vise à présenter les principes, avantages, inconvénients et applications du refroidissement liquide, en s’appuyant sur des études et des données techniques.
Historique du refroidissement liquide
Le refroidissement liquide n’est pas une technologie récente. Il a été utilisé dès les années 1960 pour refroidir les supercalculateurs et les équipements industriels. Toutefois, son adoption dans les data centers reste limitée en raison des coûts et de la complexité perçue, bien que les avancées technologiques récentes aient permis son essor.
Les principes du refroidissement liquide
Le refroidissement liquide repose sur l’utilisation de liquides caloporteurs pour déplacer la charge thermique vers le système de rejet de chaleur. Comparé à l’air, les liquides offrent une capacité thermique supérieure, permettant un transfert de chaleur plus efficace. Les systèmes de refroidissement liquide se divisent en trois catégories principales :
Refroidissement à l’arrière de la baie (Rear Door Heat Exchanger)
Un échangeur thermique est placé à l’arrière de la baie. L’air chaud expulsé par les équipements traverse cet échangeur, où la chaleur est absorbée par un liquide circulant dans un circuit fermé. Cette technologie est compatible avec des baies classiques et requiert peu de modifications.
Refroidissement direct sur puce (Direct-to-Chip Cooling)
Le liquide circule à travers des microcanaux directement en contact avec les puces électroniques. Ce système réduit les pertes thermiques, mais nécessite des adaptateurs spécifiques pour chaque type de processeur.
Refroidissement par immersion
Les équipements sont immergés dans un liquide de refroidissement non conducteur (diélectrique). La chaleur est directement transmise au liquide, réduisant ainsi les besoins en composants auxiliaires nécessaires dans le cas d’une solution « Direct to Chip Cooling ».
Les avantages du refroidissement liquide
Efficacité thermique : les liquides permettent une dissipation de chaleur jusqu’à 1000 fois plus efficace que l’air. Cette efficacité réduit les échauffements locaux, améliorant la fiabilité des équipements. Avec les nouvelles technologies des puces, les régimes de température de l’eau de refroidissement augmentent et permettent ainsi un potentiel d’amélioration de l’efficacité énergétique. Cette tendance est un atout pour optimiser les performances.
Réduction de la consommation énergétique : en minimisant le recours à la climatisation traditionnelle, le refroidissement liquide contribue à une baisse significative du PUE (Power Usage Effectiveness). Le PUE diminue grâce à la réduction des besoins en ventilateurs et systèmes de refroidissement par air énergivores, ainsi qu’à la possibilité de réutiliser la chaleur excédentaire dans d’autres applications (chauffage de bâtiments, réseaux de chaleur, etc.).
Adaptabilité aux hautes densités de puissance : pour les baies excédant 20 kW, le refroidissement liquide offre une solution viable là où le refroidissement par air atteint ses limites.
Réduction du bruit : l’élimination partielle ou totale des ventilateurs diminue le niveau sonore, améliorant ainsi les conditions de travail dans les data centers.
Impact sur la consommation globale d’eau : le refroidissement liquide peut également réduire la consommation d’eau d’un data center lorsqu’il est conçu pour utiliser des circuits fermés ou des systèmes d’échange thermique optimisés, par rapport aux systèmes par air qui nécessitent souvent un refroidissement par évaporation d’eau dans l’atmosphère.
Les inconvénients du refroidissement liquide
Coûts initiaux élevés : l’installation de systèmes de refroidissement liquide nécessite un investissement initial important, lié aux équipements spécifiques et à la mise en place des circuits hydrauliques.
Complexité de l’infrastructure : la gestion des liquides impose des contraintes techniques, notamment en termes de maintenance, de surveillance et de prévention des fuites.
Compatibilité limitée : certains équipements informatiques ne sont pas conçus pour le refroidissement liquide, exigeant des adaptations coûteuses ou une refonte de l’architecture.
Risques de coûts échoués : la croissance rapide de l’IA introduit des incertitudes concernant l’évolution des architectures matérielles. Investir massivement dans des infrastructures spécifiques au refroidissement liquide pourrait s’avérer coûteux si les besoins technologiques venaient à changer brusquement.
Applications concrètes et études de cas
Data centers hyperscales : les grandes entreprises technologiques utilisent déjà le refroidissement liquide pour répondre à leurs besoins en densité de puissance et en efficacité énergétique.
Supercalculateurs : les infrastructures de calcul intensif (HPC) adoptent le refroidissement liquide pour maintenir les performances de leurs systèmes sous contrôle.
Environnements industriels et défensifs : les applications critiques, telles que les systèmes embarqués ou militaires, bénéficient de la robustesse et de l’efficacité du refroidissement liquide.
Considérations pour la mise en œuvre
- Analyse des besoins : identifier les zones critiques et la densité de puissance par baie
- Coûts globaux : calculer le TCO (Total Cost of Ownership), incluant les économies d’énergie
- Maintenance :évaluer les exigences en termes de surveillance et d’entretien
- Formation du personnel : former les opérateurs à la manipulation et à la gestion des systèmes de refroidissement liquide
Perspectives de croissance du refroidissement liquide
Le marché du refroidissement liquide dans les data centers connaît une croissance rapide. En 2023, sa part de marché était estimée à 2,5 milliards de dollars, avec une croissance annuelle composée prévue de 15 % jusqu’en 2030. Cette progression est stimulée par la montée en puissance des technologies liées à l’intelligence artificielle (IA) – cf. figure ci-dessous, source OMDIA – et à l’apprentissage automatique, qui augmentent la densité de puissance des baies.
Les systèmes d’IA, en particulier les modèles d’apprentissage profond, nécessitent des processeurs graphiques (GPU) et des équipements spécialisés avec des besoins thermiques accrus. Le refroidissement liquide est une solution clé pour maintenir les performances de ces infrastructures critiques. Cependant, l’évolution rapide de l’IA et des exigences matérielles associées génère des incertitudes, nécessitant une approche prudente dans les investissements.
Conclusion
Le refroidissement liquide représente une évolution majeure pour les data centers, combinant efficacité thermique, économies énergétiques et adaptabilité aux infrastructures à haute densité. Toutefois, son adoption nécessite une évaluation rigoureuse des coûts, des infrastructures et des objectifs à long terme. Une stratégie bien définie permet de maximiser les avantages tout en minimisant les inconvénients.