Votre feuille de calcul contient un poste avec 64 H100 et un devis datant de 4 mois.
Combien valent-ils aujourd'hui ?
La plupart des équipes financières évaluent le matériel d'IA en termes simples : coût d'acquisition moins dépréciation au fil du temps. La valeur des GPU n'évolue pas de la même manière. Au lieu d'une lente pente descendante, il s'agit d'un graphique de prix avec des chutes soudaines entre les périodes de stabilité.
L'annonce de Blackwell par NVIDIA a provoqué l'une de ces chutes soudaines. Vous devez savoir ce que cette annonce change et ce qu'elle ne change pas avant de conclure un marché pour vos GPU d'occasion.
Le marché n'est pas en train de réajuster les prix d'un GPU
Il est facile de tomber dans le piège de parler d'une flotte de H100 comme s'il s'agissait d'un seul et même bien.
Un DGX H100 à huit GPU n'est pas la même chose qu'une pile de cartes PCIe. Le marché évalue le matériel en fonction de la vitesse de déploiement de l'acheteur, de la topologie validée et de l'empreinte mémoire utilisable.
En 2024, NVIDIA a annoncé l'architecture Blackwell comme successeur de Hopper (modèles H100 et H200), un bond en avant en matière d'efficacité. Selon la documentation de l'entreprise, Blackwell permet de diviser par 25 le coût de l'inférence des modèles de grandes langues par rapport à Hopper.
Moins de 12 mois plus tard, Google Cloud présentait déjà des instances A4 basées sur NVIDIA HGX B200. Les propres article de blog indique que chaque GPU B200 offre 2,25 fois plus de puissance de calcul et 2,25 fois plus de capacité HBM que la plateforme A3 High H100 de la génération précédente.
| Vitesse de déploiement | Topologie validée | Empreinte mémoire utilisable |
|---|---|---|
| Les acheteurs paient pour du matériel prêt à fonctionner. Ils ne s'intéressent pas au silicium qui nécessite un travail d'intégration avant d'obtenir son premier appel de déduction. | Une nomenclature connue et documentée de la structure du réseau et de l'hôte est un atout majeur. | La capacité de mémoire et la bande passante déterminent les charges de travail qu'un système peut réellement exécuter, et la manière dont il rivalise avec les alternatives de classe Blackwell. |
Les données expliquent la compression de la valeur du H100
Ce tableau montre la véritable raison pour laquelle la valeur du H100 a chuté si rapidement.
| Plate-forme | Signal officiel actuel | Ce que cela signifie pour la revente |
| H100 | NVIDIA positionne toujours le H100 comme un GPU de centre de données pour la formation, l'inférence et les charges de travail évolutives. | Le silicium n'est pas obsolète simplement parce qu'il n'est plus le badge le plus récent |
| H200 | NVIDIA annonce que le H200 offre 141 Go de HBM3e à 4,8 To/s, soit près du double de la capacité du H100 avec une bande passante mémoire 1,4 fois supérieure. | Le H100 est d'abord mis sous pression pour les charges de travail d'inférence et de contexte plus vastes, qui nécessitent beaucoup de mémoire. |
| Google A3 H100 | Google documente encore les instances A3 Mega, A3 High et A3 Edge H100 pour le pré-entraînement, le réglage fin et l'inférence de service. | Le H100 reste commercialement utile dans les catalogues de nuages actuels |
| Google A4 B200 | Google affirme que l'A4 B200 offre une capacité de calcul et une capacité HBM par GPU multipliées par 2,25 par rapport à l'A3 High H100. | Les acheteurs disposent désormais d'une alternative next-gen beaucoup plus solide lorsqu'ils comparent les achats de systèmes complets. |
| DGX H100 | Le NVIDIA DGX H100 est équipé de 8 GPU H100, d'une mémoire GPU totale de 640 Go et d'une bande passante d'interconnexion GPU agrégée de 7,2 To/s. | Un DGX H100 complet est toujours un système réel, et pas seulement un lot de composants. |
| DGX B200 | NVIDIA annonce que le DGX B200 offre des performances d'entraînement 3x DGX H100 et des performances d'inférence 15x DGX H100, avec une mémoire GPU totale de 1 440 Go et une bande passante NVLink agrégée de 14,4 To/s. | La prime pour une ancienne boîte d'IA clé en main se comprime rapidement une fois que la nouvelle boîte clé en main existe. |
Votre H100 n'est plus le GPU par défaut, mais il a toujours un marché défini avec des cas d'utilisation en entreprise. Plus votre évaluation dépend de la rareté du “haut de la pile”, plus vite elle sera réévaluée. Il vaut comparaison entre l'A100 et le H100 avant de prendre toute décision.
Quel matériel se déprécie en premier ?
La première chose à perdre de la valeur n'est pas nécessairement l'unité H100 intacte. Les systèmes incomplets sont sanctionnés avant tout le reste.
| 01 Systèmes incomplets | 02 Prime clé en main sur les anciens systèmes intégrés | 03 Inventaire difficile à soutenir |
|---|---|---|
| Si vous séparez un nœud HGX H100 en plusieurs parties, si vous perdez le contexte de la structure du réseau, si vous séparez les plateaux de l'hôte ou si vous obligez le prochain acheteur à faire de la rétro-ingénierie pour savoir exactement ce qu'il obtient, vous avez déjà échangé un atout de déploiement contre un problème de pièces détachées. Une fois que les alternatives de classe Blackwell sont sur le marché, les acheteurs deviennent moins patients avec les problèmes de pièces. | Les chiffres de la DGX de NVIDIA rendent cette situation inévitable. Le DGX B200 ne se contente pas de dépasser le DGX H100. NVIDIA le commercialise comme une classe de performances matériellement différente, avec beaucoup plus de mémoire et de bande passante d'interconnexion. Cela signifie qu'un acheteur qui envisage d'acquérir une boîte complète n'est plus en train de décider entre “acheter le H100 ou attendre”. Il doit décider de la réduction dont il a besoin avant d'opter pour l'ancien boîtier plutôt que pour le nouveau standard. | Un DGX H100 propre avec une configuration documentée, un inventaire complet, un état de santé connu et un état de service est un marché. Un lot mixte d'accélérateurs de l'ère H100 dont la provenance est faible, la mise en réseau manquante ou l'historique d'exécution incertain en est un autre. Lorsque le marché dispose de plus d'options, le prix de l'incertitude augmente plus rapidement que celui de la performance. |
Ce qui conserve sa valeur plus longtemps qu'on ne le pense
Les propriétaires de H100 ne doivent pas paniquer. Le marché n'a pas cessé de l'utiliser.
La machine actuelle de Google optimisée pour les accélérateurs la documentation La liste des systèmes A3 Mega, A3 High et A3 Edge basés sur la version H100 est toujours disponible, de même que les offres A3 Ultra basées sur la version H200 et A4 basées sur la version B200. Ces systèmes sont toujours en production, ils seront donc intéressants pour les clients qui souhaitent des performances élevées sans avoir à payer le prix fort de la nouvelle génération.
Les systèmes H100 complets et déployables sont toujours d'actualité. Vous pouvez vendre des serveurs Nvidia DGX et des GPU d'IA comme des systèmes complets et de récupérer beaucoup plus que si on les séparait.
| Ce qui a le plus de valeur 1. Systèmes DGX H100 complets avec une configuration intacte et une provenance propre 2. Nœuds HGX H100 complets avec le contexte réseau et hôte dont les acheteurs ont réellement besoin 3. Inventaire H100 déjà qualifié pour des charges de travail réelles d'inférence ou de formation 4. Lots suffisamment importants pour résoudre le problème de capacité de l'acheteur en une seule transaction | Ce qui a le moins de valeur Ce qui a le moins de valeur, c'est tout ce qui incite le prochain propriétaire à passer sous le capot. Si votre matériel oblige l'acheteur à comprendre les détails manquants de la nomenclature, l'état incertain du micrologiciel, la topologie incertaine ou si le lot est vraiment complet, vous ne vendez plus une infrastructure d'IA. Vous vendez un projet qui ne vaut peut-être pas la peine qu'on y consacre du temps. |
Atteindre ses objectifs financiers est une question de temps
Les chefs d'entreprise veulent généralement un chiffre unique pour tous leurs actifs. La meilleure façon de voir les choses est d'établir une courbe de prix basée sur le calendrier de diffusion.
Une fois qu'une nouvelle génération comme Blackwell devient visible dans les aperçus des nuages, les documents sur les plates-formes actuelles et les catalogues de systèmes intégrés, le rabais pour l'attente se retourne contre vous.
C'est particulièrement vrai si votre flotte actuelle se situe au milieu.
| L'extrémité supérieure Ce mouvement se poursuit parce que les acheteurs veulent des capacités déployables rapidement. Les systèmes complets, bien documentés et dont la provenance est claire continuent d'attirer les offres des acheteurs qui ont besoin de capacité maintenant et qui ne peuvent pas attendre la disponibilité de Blackwell. | Le milieu Il est le premier à être pressé. C'est là que l'acheteur commence à se demander s'il ne devrait pas plutôt opter pour le H200 ou le B200. Le milieu est l'endroit le plus dangereux lorsqu'une nouvelle génération devient le point de référence. | L'extrémité inférieure La situation est toujours claire car les clients veulent des pièces et il existe des cas d'utilisation de niveau inférieur. Mais le plancher est plus bas qu'il ne l'était, et la décote pour incertitude s'accroît plus rapidement à mesure que l'offre de la classe Blackwell augmente. |
Si vous détenez des stocks de H100, HGX H100 ou DGX H100, le fait de retarder la vente peut réduire votre rendement.
Comment adapter votre plan de rafraîchissement en conséquence
Si votre équipe prévoit de mettre au rebut du matériel datant de l'époque H100, l'objectif n'est pas de prédire un chiffre de revente magique à partir d'une feuille de calcul.
L'objectif est de préserver la partie de l'actif que l'acheteur continuera à payer.
| 1. Le document en tant que système | 2. Inventaire séparé des primes | 3. Enregistrer la configuration complète | 4. Paquet pour le marché |
Vous devrez documenter le matériel en tant que système avant qu'il ne soit démantelé. Séparez l'inventaire des primes de l'inventaire de la queue avant que le démantèlement ne transforme tout en un lot mélangé. Enregistrez exactement ce que vous avez : Nombre de GPU, Il s'agit d'informations sur les caractéristiques de l'ordinateur, le facteur de forme, la plate-forme hôte, le réseau, le stockage, le contexte de refroidissement et tous les détails relatifs au déploiement. Ces détails feront de vous un meilleur partenaire pour votre acheteur, qui veut savoir si le lot est immédiatement utile.
Cela signifie également qu'il faut être honnête sur ce que l'on vend.
Si la flotte est en réalité un ensemble de systèmes DGX H100 complets, vendez-la comme une flotte DGX H100 complète.
S'il s'agit de planches détachées et de restes de nœuds, il faut s'assurer que tout le monde le comprenne. L'acheteur et le vendeur doivent tous deux savoir exactement ce qui change de mains.
Les entreprises qui récupèrent le plus de valeur du matériel d'IA ont besoin de plus qu'un modèle de feuille de calcul détaillé. Les entreprises qui concluent des accords avant que le projet ne devienne désordonné et qui présentent l'actif sous la forme encore souhaitée par le marché connaîtront un succès constant.