Les processeurs Intel Sapphire Rapids Xeon affichent des résultats surprenants par rapport à AMD EPYC Genoa dans AVX-512

La famille Xeon de 4e génération d’Intel, Sapphire Rapids, a présenté des résultats surprenants par rapport à la gamme EPYC Genoa d’AMD dans les charges de travail AVX-512.

Tests de performance AVX-512 réalisés sur les processeurs AMD Genoa, Intel Sapphire Rapids et Ice Lake

La semaine dernière, Intel a lancé les processeurs Xeon Scalable de quatrième génération, également connus sous le nom de Sapphire Rapids, promettant des performances accrues pour les processeurs basés sur serveur. Ils ont introduit un tout nouvel ISA, Advanced Matrix Extensions, et plus encore pour aider à étendre l’amélioration de l’intelligence artificielle et de l’apprentissage automatique.

Cependant, avec l’ensemble d’extension AVX-512, qui est également utilisé dans l’IA, le HPC et le ML, il fallait plus d’informations au lancement sur les gains d’amélioration des processeurs évolutifs. Michael Larabel, analyste Linux et éditeur du site Web de matériel Linux Phoronix, a soumis le nouveau processeur à de nombreux tests de performance. Ils l’ont opposé à son prédécesseur Ice Lake et aux nouveaux processeurs Genoa d’AMD et les résultats parlent d’eux-mêmes.

Larabel a lancé plusieurs tests via Phoronix Test Suite, Phoromatic et le site Web OpenBenchmarking, dans lequel il est le développeur principal de tous les projets. Les tests effectués sur les trois processeurs étaient tous basés sur le test des performances AVX dans des charges de travail telles que :

  • Magie neurale DeepSparse – Un temps d’exécution CPU qui utilise la parcimonie trouvée dans les réseaux de neurones conduit à un sous-produit de la diminution de l’informatique.
  • LCzéro – Également connu sous le nom de Leela Chess Zero, ce logiciel d’échecs implémente le protocole UCI, nécessitant une interface graphique d’échecs similaire à Arena Chess GUI, BanksiaGUI, Cutechess, Nibbler et Chessbase.
  • Embrée – Créé par Intel, Embree est un ensemble de noyaux de lancer de rayons pour aider les ingénieurs d’applications graphiques à améliorer les performances des applications de rendu photoréalistes.
  • OuvrirVKL – également créé par Intel, Open VKL est conçu avec un logiciel open source qui comprend les données stockées avec Open VDB et peut y accéder sans conversion.
  • Ouvrir l’image Denoise – Intel Open Image Denoise s’appuie sur la bibliothèque Intel oneAPI Deep Neural Network, également connue sous le nom de oneDNN. En temps réel, il exploite des ensembles d’instructions modernes comme Intel SSE4, AVX2 et AVX-512. Ceci est fait pour que l’exploitation atteigne des performances de débruitage élevées.
  • OSPRay (Studio) – OSPRay Studio d’Intel est un programme open-source et interactif de traçage de rayons et de visualisation.
  • unDNN – La bibliothèque Intel oneAPI Deep Neural Network Library (ou oneDNN) offre des performances de bloc de construction d’apprentissage en profondeur optimisées.
  • Cpuminer-op – Cpuminer-opt est un logiciel d’extraction de CPU divisé en deux versions distinctes – Cpuminer-opt et Cpuminer-gr, qui est utilisé pour la crypto-monnaie Raptoreum.
  • OpenVINO – L’Open Visual Inference and Neural Network Optimization est une boîte à outils gratuite qui aide à optimiser les modèles d’apprentissage en profondeur à partir d’un cadre unique et à les déployer à l’aide d’un moteur d’inférence sur le matériel Intel, Intel étant la société qui a créé la boîte à outils.
  • miniBUDE- un calcul de base du moteur d’amarrage de l’Université de Bristol trouvé dans d’autres modèles de programmation HPC.
  • SMHasher – SMHasher est “une suite de tests conçue pour tester les propriétés de distribution, de collision et de performance des fonctions de hachage non cryptographiques”.

Les extensions AVX-512 actives dans la plupart des tests ont montré de bons gains pour tous les processeurs, cependant, les processeurs Sapphire Rapids Xeon ont enregistré le gain le plus important avec AVX-512 allant jusqu’à 44 %, tandis qu’EPYC Genoa a enregistré un gain de 21 %.

Étonnamment, Intel a non seulement fourni un gain de performances plus important, mais a également fourni la meilleure efficacité avec AVX-512, ce qui est bien étant donné qu’AMD a mis l’accent sur la commercialisation d’AVX-512 pour les puces EPYC Genoa alors qu’Intel n’a pas beaucoup parlé d’AVX-512 sur son Sapphire Puces rapides. Avec l’AVX-512 activé, les processeurs Intel Sapphire Rapids ont pu égaler ou surpasser les pièces Genoa et ce n’est qu’avec l’AVX-512 que les puces EPYC ont pu fournir le boost uplift. Voici ce que Phoronix avait à dire sur leurs découvertes :

La moyenne géométrique montre également à quel point AVX-512 est important pour le succès de la 4e génération EPYC Genoa en étant compétitif par rapport à la 4e génération Xeon Scalable pour les charges de travail HPC. Si Zen 4 n’avait pas ajouté AVX-512, les résultats EPYC 9654 2P AVX-512 désactivés sont sortis juste derrière le Xeon Platinum 8490H 2P avec AVX-512 activé. Un processeur de serveur Zen 4 sans AVX-512 aurait été une course au coude à coude entre Sapphire Rapids et Genoa dans plus de charges de travail. Mais à la place, l’EPYC 9654 2P avec AVX-512 est sorti 19% plus rapide que les processeurs Xeon Platinum 8490H dans cet ensemble de benchmarks.

Je suis plutôt surpris qu’Intel n’ait pas plus particulièrement promu ses améliorations AVX-512 avec 4th Gen Xeon Scalable au lancement, mais en tout cas c’est bien de voir AVX-512 fournir une plus grande amélioration tout en n’ayant pas l’impact significatif sur la consommation d’énergie cela a été vu avec les générations précédentes de processeurs AVX-512. Cela peut immédiatement profiter à de nombreux logiciels existants par rapport à la nécessité de s’adapter pour utiliser AMX et les nouveaux accélérateurs. Espérons que cet AVX-512 plus efficace avec Sapphire Rapids associé à des processeurs AMD Zen 4 dotés désormais d’AVX-512 conduira davantage de développeurs de logiciels à envisager des optimisations AVX-512 pour leurs logiciels.

par Phoronix

Larabel prévoit que les développeurs continueront à utiliser le logiciel compatible AVX-512 déjà sur le marché et réduiront la contrainte d’adaptation au nouvel ensemble d’extensions AMX, où les accélérateurs plus récents auraient besoin d’un apprentissage et d’une compréhension supplémentaires de la part des équipes de développement.

Partagez cette histoire

Facebook

Twitter