Accueil » Actualité » Accélérateurs AMD Instinct Series MI200 : jusqu’à 95,7 TFLOPS FP64

Accélérateurs AMD Instinct Series MI200 : jusqu’à 95,7 TFLOPS FP64

L’AMD Instinct MI250x possède 220 unités de calcul, 14 080 processeurs de flux.

Dans le cadre de l’Accelerated Data Center Premiere, outre les processeurs EPYC Milan-X équipés de 3D V-Cache, AMD a présenté ses accélérateurs AMD Instinct Series MI200. Il y a bien deux modèles, les MI250 et MI250x ; ils succèdent à l’Instinct M100 lancé l’année dernière. Ces accélérateurs s’appuient sur la nouvelle architecture AMD CDNA 2 ; ce sont également les premiers GPU multi-die à prendre en charge 128 Go de mémoire HBM2e.

Image 1 : Accélérateurs AMD Instinct Series MI200 : jusqu'à 95,7 TFLOPS FP64

Selon AMD, l’Instinct MI250X « offre des performances jusqu’à 4,9 fois supérieures à celles des accélérateurs concurrents pour les calculs HPC à double précision (FP64) et dépasse les 380 téraflops de puissance de calcul en demi-précision théorique (FP16) pour les charges de travail d’IA. Cela permet des approches disruptives pour notamment accélérer davantage la recherche axée sur les données ».

Image 2 : Accélérateurs AMD Instinct Series MI200 : jusqu'à 95,7 TFLOPS FP64

Spécifications Instinct MI200 et Instinct MI250X

ModèleUnités de calculProcesseurs de streamFP64-FP32 Vector (Peak) FP64-FP32 Matrix (Peak)FP16-bf16 (Peak)INT4-INT8 (Peak)HBM2e ECC MémoireBande passante mémoireFormat
AMD Instinct MI250x22014 080Jusqu’à 47,9 TFLOPSJusqu’à 95,7 TFLOPSJusqu’à 383,0 TFLOPSJusqu’à 383,0 TOPS128 Go3,2 To/sec OCP Accelerator Module
AMD Instinct MI25020813 312Jusqu’à 45,3 TFLOPSJusqu’à 90,5 TFLOPSJusqu’à 362,1 TFLOPSJusqu’à 362,1 TOPS128 Go3,2 To/secOCP Accelerator Module

Principales capacités et fonctionnalités des accélérateurs de la série AMD Instinct MI200

Afin de promouvoir sa série AMD Instinct MI200, la société expose les trois caractéristiques clefs ci-dessous.

La première est l’architecture CDNA 2, dont les « Matrix Cores de seconde génération accélèrent les opérations matricielles FP64 et FP32 pour des performances théoriques maximales en FP64 jusqu’à 4 fois supérieures aux GPU AMD de la génération précédente ».

La seconde est une « technologie de packaging de pointe – La première conception de GPU multi-die du secteur avec la technologie 2.5D Elevated Fanout Bridge (EFB) offre 1,8 fois plus de cœurs et une bande passante mémoire 2,7 fois plus élevée que les GPU AMD de génération précédente. Il en résulte la meilleure bande passante mémoire théorique agrégée de l’industrie à 3,2 téraoctets par seconde en pointe ».

Enfin, le dernier argument est la troisième génération de la technologie AMD Infinity Fabric, laquelle autorise « jusqu’à 8 liens Infinity Fabric pour connecter les AMD Instinct MI200 aux processeurs EPYC de troisième génération et à d’autres processeurs graphiques présent dans le nœud ».

Supercalculateur Frontier

Les processeurs AMD EPYC de troisième génération et les accélérateurs AMD Instinct MI250X équiperont notamment le supercalculateur Frontier, conçu par AMD en collaboration avec le département américain de l’énergie, le laboratoire national d’Oak Ridge et HPE. Ce dernier « proposera plus de 1,5 exaflops de puissance de calcul maximale ».

Plateforme logicielle

Pour ses accélérateurs, AMD soutient la plateforme logicielle open-source AMD ROCm. Celle-ci « est fondée sur une portabilité ouverte ce qui autorise la prise en charge des environnements de plusieurs fournisseurs d’accélérateurs et leurs architectures. Avec ROCm 5.0, AMD étend la plateforme en propulsant les meilleures applications HPC et IA avec les accélérateurs de la série AMD Instinct MI200 […] ».

Par ailleurs, « grâce à l’AMD Infinity Hub, les chercheurs, les data scientists et les utilisateurs finaux peuvent facilement trouver, télécharger et installer des applications HPC conteneurisées et des frameworks ML optimisés et pris en charge sur les accélérateurs AMD Instinct et ROCm. Le hub propose actuellement une gamme de conteneurs prenant en charge les accélérateurs Radeon Instinct MI50, AMD Instinct MI100 ou AMD Instinct MI200, ainsi que plusieurs applications telles que Chroma, CP2k, LAMMPS, NAMD, OpenMM et les frameworks ML populaires TensorFlow et PyTorch. De nouveaux conteneurs sont continuellement ajoutés au hub ».

Disponibilité

Les AMD Instinct MI250X et AMD Instinct MI250 sont disponibles au format open-hardware OAM (OCP Accelerator Module). L’AMD Instinct MI210 sera disponible sous forme de carte PCIe dans les serveurs OEM.

L’accélérateur AMD MI250X est actuellement disponible auprès de HPE dans le supercalculateur HPE Cray EX, et les accélérateurs de la série AMD Instinct MI200 sont attendus dans les systèmes des principaux partenaires OEM et ODM sur les marchés de l’entreprise au premier trimestre 2022, dont notamment ASUS, ATOS, Dell Technologies, Gigabyte, Hewlett Packard Enterprise (HPE), Lenovo, Penguin Computing et Supermicro.