MLCommons a confronté plusieurs GPU de calcul, dont le NVIDIA H100 et le Biren BR104. Le premier est le successeur de l’A100. C’est un GPU gravé en 4 nm par TSMC et qui bénéficie de l’architecture ADA. Le second est un GPGPU de la société chinoise basé sur l’architecture BiLiren. MLCommons a comparé les résultats avec d’autres solutions : A100 de NVIDIA, AI 100 de Qualcomm, Sapeon X220 et Intel Sapphire Rapids (sans l’aide d’un cGPU).

Crédit : NVIDIA

Précisons que MLCommons est un groupe industriel spécialisé dans l’évaluation des performances d’apprentissage automatique. Ses équipes ont mis les solutions susmentionnées à l’épreuve de son protocole MLPerf Inference version 2.1 : une série de charges de travail ResNet 50 v1.5 (classification d’images), BERT Large (traitement du langage naturel), RNN-T (reconnaissance vocale), RetinaNet (détection d’objets), 3D U-Net (imagerie médicale) et DLRM (deep learning recommendation model) ; ce, en mode serveur, c’est-à-dire avec des requêtes soumises successivement, et en mode hors ligne, avec toutes les requêtes fournies en une seule fois. Enfin, les tests ont été effectués dans le cadre de catégories dites fermée et ouverte : dans le premier cas, les tests sont standards, sans optimisation du matériel possible de la part des fabricants.

Et face aux GPU Ponte Vecchio / AMD Instinct ?

NVIDIA a compilé les données brutes de MLCommons sous forme de diagrammes. Ses solutions H100 dominent largement la concurrence et offrent une belle avancée par rapport aux A100.

Crédit : NVIDIA

C’est plutôt flatteur pour l’entreprise, mais les véritables concurrents du H100 seront plutôt le GPU de calcul Ponte Vecchio d’Intel, lequel est 2,5 plus performant que l’A100 selon la firme, et les accélérateurs Instinct MI200 d’AMD, absents de ces tests.

Sources : IEEE Spectrum, MLCommons