Nvidia aurait annulé le développement du GPU GB200 72 double rack – un analyste affirme que la société a l'intention de se concentrer sur les offres à rack unique

Nvidia arrête le développement de son NVL36×2 à double rack 72 voies basé sur GB200, pour se concentrer sur les NVL72 et NVL36 à rack unique, selon l'analyste Ming-Chi Kuo chez Medium. C'est un analyste réputé et il semble détenir des informations privilégiées sur le sujet. Les machines NVL36 et NVL72 à rack unique arriveront sur le marché comme prévu, la décision étant motivée par des ressources limitées et les préférences des clients. Cependant, des rapports précédents indiquaient que le NVL36×2 à double rack serait le choix le plus populaire parmi les clients de Nvidia.

La société prévoyait initialement de développer trois modèles GB200 basés sur des GPU Blackwell pour les charges de travail IA et HPC : NVL36, NVL72 et NVL36×2. Cependant, la gestion des trois projets est devenue un défi, surtout compte tenu de la complexité de travailler simultanément sur deux versions différentes de 72 GPU (NVL72 et NVL36×2). En conséquence, Nvidia se concentre désormais uniquement sur NVL72 et NVL36.

Le rack GB200 NVL72 de Nvidia contient 18 plateaux de calcul et neuf plateaux NVSwitch (18 ASIC NVSwitch), chacun contenant deux cartes Bianca avec un processeur Grace et deux GPU Blackwell par carte. Il s'agit de l'offre la plus puissante de Nvidia, mais c'est aussi la solution la plus gourmande en énergie puisqu'elle consomme environ 120 kW.

Semi-Analyse s'attend à ce que cette configuration soit utilisée de manière limitée en raison de ses exigences extrêmes en matière de puissance et de densité (la puissance typique d'un rack est de 12 kW, tandis qu'un rack basé sur H100 consomme environ 40 kW), ce que la plupart des centres de données ne peuvent pas prendre en charge. Cependant, un client majeur prévoit un déploiement à grande échelle, et Ming-Chi Kuo affirme que Microsoft a montré une nette préférence pour le NVL72 par rapport au NVL36×2.

Le GB200 NVL36×2 devait être composé de deux racks interconnectés et devait initialement être la configuration la plus couramment adoptée. Chaque rack dispose de 18 processeurs Grace et de 36 GPU Blackwell, maintenant une connectivité complète sur les 72 GPU. Cependant, il aurait besoin de 36 ASIC NVSwitch, consommant ainsi plus d'énergie qu'un NVL72 et offrant des performances légèrement inférieures. Un GB200 NVL36×2 devait consommer 66 kW par rack (132 kW au total), soit légèrement plus que le NVL72, bien que sa taille plus grande soit plus compatible avec les centres de données existants.

Le GB200 NVL72 est bien plus économe en espace que le GB200 NVL36×2. Cependant, la plupart des clients Nvidia ne peuvent pas prendre en charge les exigences de densité d'alimentation et de refroidissement du NVL72. En outre, ces complexités pourraient retarder les livraisons du GB200 NVL72 au second semestre 2025, selon Ming-Chi Kuo. Cependant, des rapports précédents indiquaient que certaines machines NVL72 seraient livrées en décembre, vraisemblablement à Microsoft.

“Ma dernière enquête sur la chaîne d'approvisionnement indique que la production de masse du NVL72 pourrait être retardée jusqu'au 2S25 (contre l'objectif optimiste de Nvidia de 1S25)”, a écrit Ming-Chi Kuo.

Plus tôt cette année, Nvidia a rencontré des problèmes de rendement avec le packaging de ses GPU B100 et B200 pour l'IA et le HPC, ce qui l'a incité à produire du matériel Blackwell à faible rendement pour répondre à la demande et affiner la conception de ces processeurs. Les GPU raffinés ne devraient entrer en production de masse qu’à partir de fin octobre, ils seront donc prêts à être utilisés fin janvier. Dans ce contexte, se concentrer sur une conception NVL72 basée sur le GB200 destinée aux clients les plus exigeants à la recherche de performances maximales est tout à fait logique pour Nvidia.

Il convient également de noter que les serveurs x86 équipés de processeurs Blackwell ne sont attendus qu'en 2025. À ce stade, les facteurs de forme de ces machines restent inconnus, les rapports préliminaires pointant vers les machines NVL72 et NVL36×2. Il est probable que ce soit désormais d'abord les racks NVL72 et NVL36, avec des solutions tierces personnalisées qui arriveront plus tard.

Laisser un commentaire