Au vu de la façon dont le marché parle du refroidissement, on pourrait penser que le choix est simple : le refroidissement par air est un héritage, le refroidissement par liquide est l'avenir, et tous ceux qui utilisent encore des unités CRAC à grande échelle sont à la traîne.
C'est une erreur et cela coûte de l'argent aux gens.
Le refroidissement par liquide offre de réels gains d'efficacité et permet des densités de rack que l'air ne peut tout simplement pas atteindre. Il introduit également des engagements en matière d'infrastructure, des dépendances à l'égard des installations et une complexité de mise hors service qui n'apparaissent pas dans les présentations des vendeurs.
La bonne architecture dépend de ce qui se trouve dans vos racks.
Pour la plupart des environnements d'entreprise, la réponse n'est pas le liquide partout. Il faut du liquide là où la charge thermique le justifie, et de l'air partout ailleurs.
Refroidissement par air : Toujours la solution par défaut, mais avec des limites réelles
Le refroidissement par air reste l'architecture dominante dans la plupart des centres de données d'entreprise. Et pour la plupart des charges de travail non liées à l'IA, il reste tout à fait adéquat. Les climatiseurs de salles d'ordinateurs (CRAC) et les unités de traitement de l'air des salles d'ordinateurs (CRAH) font circuler de l'air réfrigéré dans des plénums de sol surélevés ou des alimentations aériennes.
L'air frais transporte la chaleur des portes arrière du serveur. Les systèmes de refroidissement gèrent la température ambiante à l'intérieur d'une enveloppe thermique définie.
Cette infrastructure est bien comprise, les compétences en matière de maintenance sont largement disponibles et l'écosystème des équipements (serveurs, commutateurs, stockage) est conçu et optimisé autour d'elle.
La limite est physique.
La capacité thermique de l'air est environ 800 fois inférieure à celle de l'eau en volume. En déplacer suffisamment pour gérer la densité thermique d'une grappe de GPU moderne nécessite des ventilateurs fonctionnant à des vitesses qui consomment beaucoup d'énergie et génèrent du bruit. Sans oublier que les unités CRAC elles-mêmes consomment beaucoup d'énergie.
Selon l'Association for Computer Operations Management, la densité des racks est passée de 7 kW par rack en 2021 à 16 kW par rack en 2025, la croissance la plus forte étant observée dans les déploiements de l'IA et de l'hyperscale. À des densités de rack supérieures à 30 ou 40 kilowatts, le refroidissement par air devient une proposition de plus en plus coûteuse. Au-delà de 60 kilowatts, il n'est plus possible de l'utiliser sous une forme conventionnelle.
Pour les environnements d'entreprise exécutant des charges de travail mixtes (clusters d'inférence d'IA avec calcul, stockage et mise en réseau traditionnels), les exigences se compliquent. Les rangées de stockage et le matériel de mise en réseau restent bien à l'intérieur de la plage de refroidissement par air. Ce n'est pas le cas des nœuds GPU.
Mise hors service du matériel refroidi par air
La mise hors service d'une architecture refroidie par air est simple. Elle sort du rack de la même manière qu'elle y est entrée : Pas de résidus, pas de manipulation de fluides, pas de problèmes de contamination. Les serveurs, les disques et les composants sont prêts à être testés, évalués, revendus ou recyclés de manière responsable dès qu'ils sont mis hors tension et retirés.
Pour les besoins de l'ITAD, le matériel refroidi à l'air est le scénario le plus simple.
Refroidissement par liquide directement sur la puce : Le point d'entrée pragmatique
Le refroidissement direct de la puce (D2C) (parfois appelé refroidissement par plaques froides) fournit un liquide de refroidissement à travers des plaques métalliques montées directement sur les composants à haute température : CPU, GPU et accélérateurs.
Une boucle fermée fait circuler le liquide de refroidissement depuis une unité de distribution du liquide de refroidissement (CDU) à travers la tuyauterie au niveau du rack jusqu'aux plaques froides et vice-versa, transférant la chaleur à une boucle de bâtiment secondaire ou à un échangeur de chaleur. L'air d'échappement du serveur contient encore une certaine chaleur résiduelle, généralement gérée par un système d'air supplémentaire plus petit, mais ~70-90% de la charge thermique est capturée directement au niveau de la puce.
Le D2C occupe actuellement la majeure partie du marché du refroidissement liquide. L'avantage de son adoption est qu'il ne nécessite pas la reconstruction ou l'immersion des serveursLes facteurs de forme des serveurs standard peuvent être adaptés ou achetés prêts pour le refroidissement liquide auprès de Dell, HPE, Lenovo et d'autres. NVIDIA recommande explicitement le refroidissement direct de la puce pour ses systèmes DGX et HGX H100. L'infrastructure CDU nécessite des modifications de la plomberie des installations et des systèmes de détection des fuites, mais la transition est nettement moins perturbante que le refroidissement par immersion - une autre méthode de refroidissement liquide éprouvée.
Mise hors service du matériel de refroidissement liquide directement sur la puce
Au stade du déclassement, le D2C introduit une complication spécifique que le refroidissement par air n'a pas : la fixation de la plaque froide. Les plaques froides sont mécaniquement fixé à l'unité centrale et les boîtiers de GPU, généralement avec un matériau d'interface thermique (TIM) entre la plaque froide et le boîtier de la puce.
Pour retirer une plaque froide sans endommager le processeur, il faut comprendre les spécifications de couple et les procédures de retrait. Si les techniciens traitent les serveurs D2C comme des serveurs refroidis par air, ils endommageront les composants. Ils sont susceptibles d'être endommagés au niveau de la plaque froide, de la couche TIM, du processeur ou des trois. Endommager un H100 utilisable revient à mettre le feu à des milliers de dollars.
Le liquide de refroidissement résiduel dans la boucle côté rack doit être correctement drainé et éliminé avant le retrait du matériel. Il ne s'agit pas d'une situation complexe de matières dangereuses ; les mélanges eau-glycol sont bien connus. Mais elle nécessite une procédure de vidange bien définie.
Votre partenaire ITAD doit savoir qu'il faut poser des questions à ce sujet avant l'arrivée de l'équipe de démantèlement.
Refroidissement par immersion : Densité maximale, complexité maximale de la transition
Le refroidissement par immersion plonge des serveurs entiers dans un fluide diélectrique : un liquide non conducteur qui absorbe simultanément la chaleur de chaque composant.
Dans l'immersion monophasique, le fluide circule dans le réservoir et dans un échangeur de chaleur externe, restant liquide tout au long du cycle. Dans l'immersion en deux phases, un fluide à point d'ébullition bas se vaporise en absorbant de la chaleur, se condense dans un échangeur de chaleur situé au-dessus du réservoir et revient sous forme liquide. Cela permet d'obtenir une efficacité de transfert de chaleur nettement supérieure.
Les chiffres relatifs à la densité sont considérables. L'immersion monophasée permet de gérer des densités de 100 à 120 kilowatts. Les systèmes biphasés vont plus loin. Un centre de données bien géré et refroidi à l'air atteint généralement une efficacité d'utilisation de l'énergie (PUE) de 1,4 à 1,6 selon l'AKCP. Cela signifie que pour chaque unité d'énergie utilisée pour le calcul, 0,4 à 0,6 unité d'énergie est utilisée pour le refroidissement. Les centres de refroidissement par liquide obtiennent ce chiffre beaucoup plus bas, à 1,1 ou moins.
La contrepartie est l'engagement en matière d'infrastructure.
L'immersion nécessite des réservoirs, des boîtiers étanches conçus sur mesure et dimensionnés pour des configurations de serveurs spécifiques, des CDU conçus pour l'immersion, une plomberie modifiée et des systèmes de gestion des fluides diélectriques.
Les serveurs standard peuvent nécessiter des modifications matérielles avant l'immersion : les ventilateurs sont généralement retirés et la compatibilité des composants avec la chimie diélectrique spécifique utilisée doit être confirmée. Intel a officiellement certifié des fluides diélectriques spécifiques pour ses gammes de processeurs Xeon. GPU à architecture Blackwell de NVIDIA sont conçus pour être refroidis par des liquides, y compris par immersion, en tant qu'approche de gestion thermique prévue.
Mise hors service du matériel de refroidissement par immersion
La mise hors service du matériel refroidi par immersion est la plus compliquée de ces trois architectures de refroidissement. Chaque serveur qui sort de la cuve est recouvert de résidus de fluide diélectrique. Ces résidus doivent être nettoyés avant que le matériel puisse être testé avec précision, évalué ou revendu. Le processus de nettoyage nécessite des solvants ou des agents de nettoyage compatibles avec la chimie diélectrique spécifique utilisée (fluides à base de fluorocarbone, fluides à base d'hydrocarbure et esters synthétiques), chacun ayant des exigences différentes en matière de nettoyage et des considérations différentes en matière de manipulation environnementale.
Les fluides diélectriques à base de fluorocarbures comprennent des composés classés comme PFAS : des substances per- et polyfluoroalkyles, parfois appelées "forever chemicals". La réglementation sur les PFAS est de plus en plus stricte aux États-Unis et dans l'Union européenne. Un fournisseur ITAD qui n'a jamais manipulé de matériel refroidi par immersion à partir d'un système de fluides PFAS peut ne pas disposer de la filière d'élimination, des connaissances réglementaires ou des certifications d'installation nécessaires pour gérer correctement ce flux.
Il ne s'agit pas d'un cas isolé. Il s'agit d'un risque réglementaire et environnemental actif qui devient votre problème au moment du déclassement si vous n'avez pas interrogé votre partenaire ITAD à ce sujet avant le début du projet.
Le modèle hybride : Comment l'air et les liquides fonctionnent ensemble
La grande majorité des centres de données d'entreprise dotés d'un système de refroidissement liquide ne se convertissent pas entièrement. En d'autres termes, l'architecture de refroidissement liquide est presque synonyme de modèle hybride qui utilise à la fois le refroidissement par air et par liquide.
La logique fonctionnelle d'un modèle hybride est le zonage thermique. Les grappes de calcul IA à haute densité (nœuds GPU, réseaux d'accélérateurs, infrastructure HPC) sont isolées dans des zones refroidies par liquide, soit par D2C, soit par immersion. La densité de puissance thermique la plus élevée le justifie.
L'infrastructure standard de calcul, de stockage, de mise en réseau et de gestion reste dans les zones refroidies par air, où la charge thermique ne justifie pas l'investissement dans l'infrastructure ou la complexité opérationnelle du liquide.
Note : La gamme NVIDIA Rubin n'est pas encore sortie à l'heure où ce blog est publié, mais ses estimations de kW par rack vont de
| Type d'infrastructure | Densité de rack typique | Refroidissement recommandé | Complexité du démantèlement |
| Grappes de calcul AI/GPU (H100, B200, MI300X) | 80-140+ kW par rack | Directement sur la puce ou par immersion | Moyennement élevé : retrait des plaques froides, drainage des fluides, nettoyage du diélectrique |
| Calculs polyvalents / virtualisation | 5-25 kW par rack | Refroidissement par air | Faible : enlèvement standard, pas de résidus ni de manipulation de fluides |
| Baies de stockage d'entreprise | 5-15 kW par baie | Refroidissement par air | Faible-moyen : suppression standard, évaluation simple. La complexité dépend des exigences de conformité. |
| Réseau central / commutation au sommet du rack | 2-8 kW par rack | Refroidissement par air | Faible : enlèvement standard, marché secondaire bien compris |
| Serveurs optimisés pour l'inférence (GPUs moins sollicités) | 25-50 kW par rack | Refroidissement par air ou échangeur de chaleur de la porte arrière | Faible-moyen : dépose de la porte arrière HX, pas de contact avec les fluides au niveau des composants |
L'échangeur de chaleur à l'arrière de la porte (RDHx) est une technologie intermédiaire qui s'intègre naturellement dans les conceptions hybrides. Un panneau refroidi par liquide installé à l'arrière d'une baie de serveurs standard absorbe la chaleur de l'air évacué avant qu'il ne pénètre à nouveau dans la salle de données.
RDHx ne nécessite pas de plaques froides ni de modifications des serveurs (les serveurs existants refroidis par air fonctionnent sans modification), mais il réduit la charge sur l'infrastructure de refroidissement au niveau de l'installation et étend la plage de densité viable des rangées refroidies par air. Lors de la mise hors service, le matériel RDHx est retiré au niveau du rack et ne nécessite pas de manipulation des fluides au niveau des composants.
Le défi opérationnel d'une installation hybride réside dans le fait que les différentes zones requièrent des procédures de déclassement, une expertise ITAD et une documentation différentes.
Un fournisseur ITAD qui peut gérer efficacement du matériel refroidi par air peut ne pas avoir les connaissances en matière de plaques froides, les capacités de manipulation des fluides diélectriques ou les autorisations environnementales nécessaires pour gérer correctement les zones refroidies par liquide. Discutez de l'architecture de refroidissement dès le début de la planification d'une mise hors service, sinon vous serez obligé de régler la question de la logistique en cours d'opération.
Les aspects économiques de la mise hors service d'un centre de données refroidi par liquide
Le matériel refroidi par air sort proprement du rack, est testé, évalué et acheminé vers le marché secondaire ou le recyclage responsable dans un délai relativement prévisible. Le processus ITAD est bien compris par l'ensemble du secteur, et la valeur de récupération est facile à estimer.
Le matériel directement intégré à la puce ajoute à la complexité de la main-d'œuvre au niveau des composants. Le retrait des plaques froides nécessite des techniciens qualifiés qui connaissent les spécifications de couple et la procédure de retrait pour chaque configuration matérielle. Les plaques froides mal retirées endommagent les processeurs et réduisent ou éliminent la valeur de revente.
Un partenaire ITAD qui a déjà traité des systèmes DGX et HGX apporte cette connaissance. Un partenaire qui ne l'a pas fait sera enclin à commettre des erreurs.
Le matériel refroidi par immersion ajoute la complexité de la manipulation des fluides au travail effectué au niveau des composants. Chaque serveur doit être nettoyé avant de pouvoir être inspecté ou testé avec précision. La chimie du fluide diélectrique détermine l'approche du nettoyage et les exigences en matière d'élimination des déchets dans l'environnement.
Si l'installation a utilisé des fluides à base de fluorocarbone, le flux de déchets est soumis aux réglementations sur les PFAS qui évoluent activement aux États-Unis et dans l'Union européenne. Le fournisseur d'ITAD a besoin d'une filière d'élimination documentée pour ce flux, et non d'un engagement à trouver une solution à terme.
Aucune de ces complexités ne fait du refroidissement liquide un mauvais choix.
Les exigences en matière de performances thermiques, en particulier pour les composants matériels de l'IA, conviennent parfaitement au refroidissement par liquide. Mais le refroidissement liquide entraîne des coûts, et les équipes de votre centre de données doivent y penser dès le départ. Prévoyez le déclassement supplémentaire lorsque vous installez l'architecture de refroidissement, et non pas lorsque le cycle de rafraîchissement arrive.