Microsoft Azure dévoile des machines virtuelles alimentées par GPU NVIDIA H100 destinées à accélérer l’IA générative, y compris ChatGPT

Microsoft Azure a annoncé ses toutes nouvelles machines virtuelles alimentées par les GPU H100 haut de gamme de NVIDIA pour accélérer l’IA générative telle que ChatGPT.

Les GPU H100 de NVIDIA alimentent les dernières machines virtuelles Microsoft Azure alimentant le contenu IA génératif, y compris ChatGPT

Communiqué de presse: Tenir la promesse d’une IA avancée pour nos clients nécessite une infrastructure, des services et une expertise de super-informatique pour faire face à la taille et à la complexité exponentiellement croissantes des derniers modèles.

Chez Microsoft, nous relevons ce défi en appliquant une décennie d’expérience dans le supercalcul et en prenant en charge les plus grandes charges de travail de formation en IA pour créer une infrastructure d’IA capable de performances massives à grande échelle. Le cloud Microsoft Azure, et plus particulièrement nos machines virtuelles accélérées par unité de traitement graphique (GPU), constituent la base de nombreuses avancées de l’IA générative de Microsoft et de nos clients.

La co-conception de supercalculateurs avec Azure a été cruciale pour faire évoluer nos besoins exigeants en matière de formation en IA, rendant possible notre travail de recherche et d’alignement sur des systèmes comme ChatGPT.”—Greg Brockman, président et co-fondateur d’OpenAI.

La série de machines virtuelles IA la plus puissante et la plus évolutive d’Azure

Aujourd’hui, Microsoft présente la machine virtuelle ND H100 v5 qui permet à la demande des tailles allant de huit à des milliers de GPU NVIDIA H100 interconnectés par le réseau NVIDIA Quantum-2 InfiniBand. Les clients verront des performances nettement plus rapides pour les modèles d’IA par rapport à nos machines virtuelles ND A100 v4 de dernière génération avec des technologies innovantes telles que :

  • 8x GPU NVIDIA H100 Tensor Core interconnectés via NVSwitch nouvelle génération et NVLink 4.0
  • 400 Gb/s NVIDIA Quantum-2 CX7 InfiniBand par GPU avec 3,2 Tb/s par VM dans un réseau fat-tree non bloquant
  • NVSwitch et NVLink 4.0 avec une bande passante bisectionnelle de 3,6 To/s entre 8 GPU locaux au sein de chaque VM
  • Processeurs évolutifs Intel Xeon de 4e génération
  • Interconnexion entre l’hôte PCIE Gen5 et le GPU avec une bande passante de 64 Go/s par GPU
  • 16 canaux de modules DIMM DDR5 4800 MHz

Fournir des supercalculateurs d’IA exascale dans le cloud

Les applications d’IA générative évoluent rapidement et ajoutent une valeur unique dans presque tous les secteurs. De la réinvention de la recherche avec un nouveau Microsoft Bing et Edge alimentés par l’IA à l’assistance alimentée par l’IA dans Microsoft Dynamics 365, l’IA devient rapidement un composant omniprésent du logiciel et de la façon dont nous interagissons avec lui, et notre infrastructure d’IA sera là pour ouvrir la voie .

Grâce à notre expérience dans la fourniture de supercalculateurs ExaOP multiples aux clients Azure du monde entier, les clients peuvent être sûrs qu’ils peuvent obtenir de véritables performances de supercalculateur avec notre infrastructure. Pour Microsoft et des organisations comme Inflection, NVIDIA et OpenAI qui se sont engagées dans des déploiements à grande échelle, cette offre permettra une nouvelle classe de modèles d’IA à grande échelle.

Notre concentration sur l’IA conversationnelle nous oblige à développer et à former certains des grands modèles de langage les plus complexes. L’infrastructure d’IA d’Azure nous fournit les performances nécessaires pour traiter efficacement ces modèles de manière fiable à grande échelle. Nous sommes ravis des nouvelles machines virtuelles sur Azure et des performances accrues qu’elles apporteront à nos efforts de développement d’IA.”—Mustafa Suleyman, PDG, Inflection.

L’IA à grande échelle est intégrée à l’ADN d’Azure. Nos investissements initiaux dans la recherche de grands modèles de langage, comme Turing, et des jalons d’ingénierie tels que la construction du premier supercalculateur d’IA dans le cloud nous ont préparés pour le moment où l’intelligence artificielle générative est devenue possible.

Les services Azure comme Azure Machine Learning rendent notre supercalculateur d’IA accessible aux clients pour la formation de modèles et Azure OpenAI Service permet aux clients d’exploiter la puissance des modèles d’IA génératifs à grande échelle. L’échelle a toujours été notre étoile nord pour optimiser Azure pour l’IA. Nous apportons désormais des capacités de supercalcul aux startups et aux entreprises de toutes tailles, sans nécessiter de capital pour des investissements matériels ou logiciels massifs.

NVIDIA et Microsoft Azure ont collaboré sur plusieurs générations de produits pour apporter des innovations de pointe en IA aux entreprises du monde entier. Les machines virtuelles NDv5 H100 contribueront à propulser une nouvelle ère d’applications et de services d’IA générative.”—Ian Buck, vice-président de l’informatique hyperscale et haute performance chez NVIDIA.

Aujourd’hui, nous annonçons que ND H100 v5 est disponible en préversion et deviendra une offre standard dans le portefeuille Azure, permettant à quiconque de libérer le potentiel de l’IA à grande échelle dans le cloud. Inscrivez-vous pour demander l’accès aux nouvelles VM.

Partagez cette histoire

Facebook

Twitter

Laisser un commentaire