Intel lance ses toutes nouvelles puces Xeon CPU MAX “Sapphire Rapids HBM” et Xeon GPU MAX “Ponte Vecchio” pour les centres de données et les segments d’entreprise.
Intel devient fou avec les puces MAX CPU et GPU : Xeon CPU MAX “Sapphire Rapids HBM” et Xeon GPU MAX “Ponte Vecchio” pour les serveurs
Aujourd’hui, Intel entre enfin dans le segment des centres de données et des entreprises avec ses propres produits multi-tuiles aka chiplet nommés Xeon MAX. Les deux premiers produits de cette toute nouvelle famille sont la série Xeon CPU MAX qui sont des processeurs Sapphire Rapids avec la technologie HBM tandis que l’autre produit est la série Xeon GPU MAX basée sur la conception Ponte Vecchio qui devient folle avec l’architecture de l’ère des puces.
La série Xeon CPU Max est le premier et le seul processeur basé sur x86 avec une mémoire à large bande passante, accélérant de nombreuses charges de travail HPC sans avoir besoin de modifier le code. La série Intel Data Center GPU Max est le processeur à plus haute densité d’Intel et sera disponible dans plusieurs facteurs de forme qui répondent aux différents besoins des clients.
La série Xeon CPU Max offre 64 gigaoctets de mémoire à large bande passante (HBM2e) sur le package, augmentant considérablement le débit de données pour les charges de travail HPC et AI. Par rapport aux processeurs évolutifs Intel Xeon de 3e génération haut de gamme, la série Xeon CPU Max offre jusqu’à 3,7 fois10 plus de performances sur une gamme d’applications du monde réel telles que la modélisation des systèmes énergétiques et terrestres.
De plus, la série Data Center GPU Max regroupe plus de 100 milliards de transistors dans un boîtier de 47 tuiles, apportant de nouveaux niveaux de débit à des charges de travail difficiles comme la physique, les services financiers et les sciences de la vie. Lorsqu’elle est associée à la série Xeon CPU Max, la plate-forme combinée atteint des performances jusqu’à 12,8 fois supérieures à celles de la génération précédente lors de l’exécution du simulateur de dynamique moléculaire LAMMPS.
par Intel
Processeurs Intel Xeon MAX “Sapphire Rapids avec HBM”
À partir de la série Intel Xeon CPU MAX, la série Xeon CPU MAX hébergera jusqu’à quatre packages HBM, tous offrant une bande passante DRAM nettement plus élevée par rapport à un processeur Sapphire Rapids-SP Xeon de base avec mémoire DDR5 à 8 canaux. Cela va permettre à Intel de proposer une puce avec à la fois une capacité et une bande passante accrues pour les clients qui en font la demande. Les références HBM peuvent être utilisées dans deux modes, un mode plat HBM et un mode de mise en cache HBM.
La puce Sapphire Rapids-SP Xeon standard comportera 10 interconnexions EMIB et l’ensemble du boîtier mesurera à un puissant 4446 mm2. En passant à la variante HBM, nous obtenons un nombre accru d’interconnexions qui se situent à 14 et sont nécessaires pour interconnecter la mémoire HBM2E aux cœurs.
Les quatre packages de mémoire HBM2E comprendront des piles 8-Hi, Intel opte donc pour au moins 16 Go de mémoire HBM2E par pile pour un total de 64 Go sur le package Sapphire Rapids-SP. En parlant de l’ensemble, la variante HBM mesurera 5700 mm2 ou 28 % de plus que la variante standard. Par rapport aux chiffres EPYC Genoa récemment divulgués, le package HBM2E pour Sapphire Rapids-SP finirait par être 5% plus grand tandis que le package standard serait 22% plus petit.
- Intel Sapphire Rapids-SP Xeon (paquet standard) – 4446mm2
- Intel Sapphire Rapids-SP Xeon (paquet HBM2E) – 5700mm2
- AMD EPYC Genoa (paquet 12 CCD) – 5428mm2
Il est également mentionné que les processeurs Intel Sapphire Rapids Xeon Max comprendront jusqu’à 80 voies PCIe Gen 5.0 / 4.0, la prise en charge de la mémoire DDR5-4800 à 8 canaux, jusqu’à 4 voies UPI et 16 GT et une interface x8 DMI PCIe 3.0. Il y a au moins cinq SKU lancées aujourd’hui, dont :
- Xeon Platinum 9480 – 56 cœurs (1,9 / 2,6 GHz) – 12 980 $ US
- Xeon Platinum 9470 – 52 cœurs (2,0 / 2,7 GHz) – 11590 $ US
- Xeon Platinum 9468 – 48 cœurs (2,1 / 2,6 GHz) – 9 900 $ US
- Xeon Platinum 9460 – 40 cœurs (2,2 / 2,7 GHz) – 8750 $ US
- Xeon Platinum 9462 – 32 cœurs (2,7 / 3,1 GHz) – 7995 $ US
Processeurs Intel série Sapphire Rapids Xeon Max de 4e génération
UGS | Configuration de matrice | Noyaux / Fils | Cache | Horloge de base / Horloge Boost | All-Core Boost | Vitesse de la mémoire DDR5 | PDT | Évolutivité | Prix (RCP) |
---|---|---|---|---|---|---|---|---|---|
9480 | XCC | 56 / 112 | 112,5 Mo | 1,9 / 3,5 GHz | 2,6 GHz | DDR5-4800 | 350W | 2S | $12980 |
9470 | XCC | 52 / 104 | 105 Mo | 2,0 / 3,5 GHz | 2,7 GHz | DDR5-4800 | 350W | 2S | $11590 |
9468 | XCC | 48 / 96 | 105 Mo | 2,1 / 3,5 GHz | 2,6 GHz | DDR5-4800 | 350W | 2S | 9900 $ |
9460 | XCC | 40 / 80 | 97,5 Mo | 2,2 / 3,5 GHz | 2,7 GHz | DDR5-4800 | 350W | 2S | $8750 |
9462 | XCC | 32 / 64 | 75 Mo | 2,7 / 3,5 GHz | 3,1 GHz | DDR5-4800 | 350W | 2S | 7995 $ |
GPU Intel Xeon MAX “Ponte Vecchio” dans diverses configurations
Le GPU Intel ‘Ponte Vecchio’ ou la ‘Intel Data Center GPU Max Series’ comme l’entreprise aime maintenant l’appeler, est un produit majeur qui a 128 cœurs Xe, 128 cœurs RT (ce qui en fait le seul GPU HPC/AI qui a un cœur de lancer de rayons natif), jusqu’à 64 Mo de cache L1 et jusqu’à 408 Mo de cache L2. 128 Go de HBM2e ont également été utilisés et l’IO connectera jusqu’à 8 matrices discrètes.
PCIe Gen 5 est utilisé avec Xe Link pour fournir une énorme puissance de traitement. Il est créé à l’aide d’un mélange d’Intel 7, TSMC N5 et TSMC N7 emballés via les approches EMIB et Foveros.
Les GPU de la série Max seront disponibles dans plusieurs facteurs de forme pour répondre aux différents besoins des clients :
- Processeur graphique Max Series 1100 : Une carte PCIe double largeur de 300 watts avec 56 cœurs Xe et 48 Go de HBM2e
Mémoire. Plusieurs cartes peuvent être connectées via des ponts Intel Xe Link. - Processeur graphique Max Series 1350 : Un module OAM de 450 watts avec 112 cœurs Xe et 96 Go de HBM.
- Processeur graphique Max Series 1550 : Module OAM de 600 watts aux performances maximales d’Intel avec 128 Xe
cœurs et 128 Go de HBM.
Intel dit que l’architecture permettra de connecter jusqu’à 8 OAM pour des performances absolues en mode bête et sur la base des chiffres qu’ils ont donnés pour 4 OAM, nous pouvons calculer ce qui suit :
- 1 OAM : 128 Go HBM2e, 128 cœurs Xe, 600 W TDP, 52 TFLOP, 3,2 To/bande passante mémoire
- 2 OAM : 256 Go HBM2e, 256 cœurs Xe, TDP 1 200 W, 104 TFLOPS, bande passante mémoire de 6,4 To/s
- 4 OAM : 512 Go HBM2e, 512 cœurs Xe, 2 400 W TDP, 208 TFLOPS, bande passante mémoire de 12,8 To/s
Spécifications du processeur graphique Intel Xeon MAX
UGS | Architecture | Moteurs Xe-Cores / XMX | Unités de lancer de rayons | Horloge de base/maximale | Configuration de la mémoire | Bande passante mémoire | Protocole PCIe | PDT |
---|---|---|---|---|---|---|---|---|
GPU Max 1550 | Véhicule-HPC | 128 / 1024 | 128 | 900 / 1600MHz | 128 Go HBM2e (1024 bits) | 3200 Go/s | PCI Gen5 x16 | 600W |
GPU Max 1350 | Véhicule-HPC | 112 / 896 | 112 | 750 / 1550MHz | 96 Go HBM2e (1024 bits) | 2400 Go/s | PCI Gen5 x16 | 450W |
GPU Max 1100 | Véhicule-HPC | 56 / 448 | 56 | 1000 / 1550MHz | 48 Go HBM2e (1024 bits) | 1200 Go/s | PCI Gen5 x16 | 300W |
Parlons maintenant des performances. Les GPU de la série Max d’Intel offrent jusqu’à 128 cœurs Xe-HPC, la nouvelle architecture de base ciblée sur les charges de travail informatiques les plus exigeantes.
Intel affirme que chaque OAM est 2 fois plus rapide qu’un NVIDIA 100 dans OpenMC et miniBUDE. Intel déclare que la série Intel Data Center GPU Max a une avance de performance globale de 1,5x dans les charges de travail de simulation de réacteur nucléaire virtuel ExaSMR – NekRS comme AdvSub, FDM (FP32), AxHelm (FP32) et AxHelm (FP64). Enfin, ils revendiquent également la couronne de performance (par rapport au NVIDIA A100) sur les charges de travail financières comme Riskfuel qui sont utilisées pour entraîner les options de crédit et les modèles de tarification.