Le supercalculateur Stampede3 de TACC utilise Xeon Max d’Intel avec HBM2E et Ponte Vecchio

Le Texas Advanced Computing Center (TACC) a dévoilé son dernier Débandade supercalculateur pour les projets de recherche en science ouverte, Stampede3. TACC prévoit que Stampede3 sera mis en ligne cet automne et fournira ses pleines performances au début de 2024. Le supercalculateur sera un élément crucial de l’écosystème de supercalcul scientifique ACCESS de la National Science Foundation (NSF) des États-Unis, et il devrait servir la communauté scientifique ouverte de 2024 à 2029.

Le cluster Stampede de troisième génération, qui sera construit par Dell, comprendra 560 nœuds équipés de processeurs Intel Xeon CPU Max de génération Sapphire Rapids, chacun offrant 56 cœurs de processeur et 64 Go de mémoire HBM2E intégrée. Étonnamment, TACC va exploiter ces nœuds en mode HBM uniquement, donc aucune DRAM supplémentaire ne sera attachée aux nœuds CPU – toute leur mémoire proviendra des piles HBM sur puce.

Avec ces spécifications, Stampede3 devrait avoir une performance maximale d’environ 4 FP64 PetaFLOPS, tout en offrant près de 63 000 cœurs à usage général. En outre, TACC prévoit également d’installer 10 serveurs Dell PowerEdge XE9640 avec 40 GPU de calcul Intel Data Center GPU Max pour les charges de travail d’intelligence artificielle et d’apprentissage automatique.

Compte tenu de cette disposition, la majeure partie des performances de calcul de Stampede3 sera fournie par les processeurs. Cela rend Stampede3 un peu rare de nos jours, car la plupart des systèmes hautes performances sont pilotés par GPU, laissant Stampede3 comme l’un des derniers supercalculateurs qui repose presque uniquement sur des processeurs à usage général.

Et tandis que le cluster actuel est principalement axé sur les performances du processeur, TACC va également utiliser les GPU Intel dans la dernière refonte de Stampede pour étudier comment incorporer un plus grand nombre de GPU dans les futures versions du système. Pour l’instant, la plupart des tâches d’IA de TACC sont exécutées sur ses systèmes Lone Star, qui sont alimentés par des centaines de GPU de calcul Nvidia A100. L’objectif de l’organisation est donc d’explorer si une partie de cette charge de travail peut être transférée au Ponte Vecchio d’Intel.

Nous allons mettre en place un petit système avec une capacité exploratoire utilisant Intel Ponte Vecchio », a déclaré Dan Stanzione, directeur exécutif de TACC. « Nous négocions toujours la quantité exacte de cela, mais je dirais un minimum de 40 nœuds et un maximum d’une centaine. […] Nous mettons juste quelques racks de Ponte Vecchio là-bas pour voir comment les gens travaillent avec.”

Stampede3 tirera parti de la technologie Omni-Path Fabric de 400 Gb/s qui permettra une bande passante de fond de panier de 24 To/s. Cette configuration permettra à la machine d’évoluer efficacement et de minimiser les latences, ce qui la rendra bien adaptée à diverses applications nécessitant des simulations.

TACC prévoit également de réintégrer les nœuds de la version précédente, Stampede2, qui étaient basés sur des processeurs Xeon Scalable d’ancienne génération. Cette intégration améliorera la capacité de Stampede3 pour les applications à haute mémoire, le calcul à haut débit, les charges de travail interactives et d’autres applications de la génération précédente. Au total, le nouveau système de superordinateur comprendra 1 858 nœuds de calcul avec plus de 140 000 cœurs, plus de 330 To de RAM, une nouvelle capacité de stockage de 13 Po et des performances de pointe proches de 10 PetaFLOPS.

Sources : TACC, HPCWire

Laisser un commentaire