Un temps évoqué pour 2021, l’accélérateur Instinct MI200 d’AMD, nom de code Aldebaran, qui succédera à l’Instinct MI100, se fait plutôt discret depuis quelques mois. Néanmoins, comme souvent avec les GPU d’AMD, des informations filtrent à travers des correctifs Linux. Celles du jour suggèrent un sous-système de mémoire supportant jusqu’à 128 Go de mémoire HBM2E.

Il semble en effet que chaque die possède 4 contrôleurs de mémoire unifiée (UMC). Chacun de ces UMC gère huit canaux de mémoire, avec une capacité maximale de 2 Go de HMB2 par canal. Par conséquent, l’Instinct MI200 prendrait en charge jusqu’à 64 Go de mémoire par die, soit 128 Go, Aldebaran possédant 2 dies. La bande passante n’est pas mentionnée. Toutefois, selon Tom’s Hardware US, en se basant sur la mémoire HBM2 à 3,6 Gbit/s de SK Hynix, la bande passante totale serait de 3,64 To/s.

Architecture GPU CNDA2

Le correctif décrit le sous-système en ces termes :

Aldebaran a 2 dies (énumérés comme MCx, x= 8 ~ 15)

Chaque die a 4 UMCs (énumérés comme csrowx, x=0~3)

Chaque die a 2 ports racine, avec 4 ports divers pour chaque racine.

Chaque UMC gère 8 canaux UMC connectés chacun à 2 Go de mémoire HBM.

Toutefois, notez qu’une partie de la mémoire et de la bande passante de ces GPU servent au CCE (Code de Correction d’Erreurs). Par conséquent, les applications ne bénéficieront pas de l’intégralité des 128 Go.

Hormis ces détails, nous avons assez peu de données concernant l’Instinct MI200 pour le moment. Il est très probable qu’il hérite d’une architecture GPU CDNA2 et d’une conception MCM (Multi Chip Module). L’actuel MI100 d’AMD, présenté par l’entreprise comme « le plus puissant accélérateur HPC au monde », possède 32 Go de mémoire HBM2. Il offre 11,5 TFLOPS de performance FP64 en pointe.

