Accueil » Actualité » Tesla V100 PCIe : 640 coeurs Tensor à 1370 MHz, TDP de 250 W

Tesla V100 PCIe : 640 coeurs Tensor à 1370 MHz, TDP de 250 W

Le Tesla V100 qui fera de l’ombre aux Radeon Vega Frontier Edition.

Image 1 : Tesla V100 PCIe : 640 coeurs Tensor à 1370 MHz, TDP de 250 WLa Tesla V100NVIDIA a profité de l’International Supercomputing Conference (SIC) pour annoncer la version PCI Express de sa puce Volta V100. Très proche du modèle annoncé en mai utilisant l’interface SXM2, elle se distingue par un TDP de seulement 250 W, des fréquences légèrement inférieures, et l’absence du NVLink, le système d’interconnexion entre GPU.

À lire aussi :
Comparatif : les cartes graphiques du moment au banc d’essai

Volta vs Vega

L’annonce arrive quelques jours après l’apparition des premières Radeon Vega Frontier Edition sur la Toile, et une semaine avant le lancement officiel de l’architecture. La concurrence entre les deux est acharnée puisque AMD et NVIDIA visent aujourd’hui les systèmes destinés à l’apprentissage automatique.

Coeur Tensor : l’arme de NVIDIA

Si AMD offre une approche plus traditionnelle avec une architecture optimisée pour les calculs FP16, les Volta font appel à de nouveaux coeurs Tensor. Ces unités optimisent la multiplication de deux matrices FP16 de 4×4 puis l’addition de ce produit à une matrice FP16 ou FP32 de 4×4. Le but est ainsi de grandement améliorer les rendements des serveurs.

Caractéristiques des Tesla V100 (SXM2) V100 (PCIe) P100 (SXM2) P100 (PCIe)
Coeurs CUDA 5120 5120 3584 3584
Coeurs Tensor 640 640 N/A N/A
Fréquence standard ? ? 1328MHz ?
Fréquence Boost 1455 MHz ~1370 MHz 1480 MHz 1300 MHz
Fréquence mémoire 1,75 Gbit/s HBM2 1,75 Gbit/s HBM2 1,4 Gbit/s HBM2 1,4 Gbit/s HBM2
Bus mémoire 4096 bits 4096 bits 4096 bits 4096 bits
Bande passante mémoire 900 Go/s 900 Go/s 720 Go/s 720 Go/s
VRAM 16 Go 16 Go 16 Go 16 Go
Cache L2 6 Mo 6 Mo 4 Mo 4 Mo
Puissance théorique FP16 30 TFLOPS 28 TFLOPS 21,2 TFLOPS 18,7 TFLOPS
Puissance théorique FP32 15 TFLOPS 14 TFLOPS 10,6 TFLOPS 9,3 TFLOPS
Puissance théorique FP64 7,5 TFLOPS 7 TFLOPS 5,3 TFLOPS 4,7 TFLOPS
Puissance théorique Tensor
(apprentissage automatique)
120 TFLOPS 112 TFLOPS N/A N/A
GPU GV100 (815 mm2) GV100 (815 mm2) GP100 (610 mm2) GP100 (610 mm2)
Transistors 21 milliards 21 milliards 15,3 milliards 15,3 milliards
TDP 300 W 250 W 300 W 250 W
Finesse de gravure TSMC 12 nm FFN TSMC 12 nm FFN TSMC 16 nm FinFET TSMC 16 nm FinFET
Architecture Volta Volta Pascal Pascal