NVIDIA Turing : une ray-volution ?
Voici donc les derniers nés de l’histoire des GPU NVIDIA, une saga qui dure depuis le tout premier NV1 lancé il y a… 23 ans ! Après la génération Pascal, voici la génération Turing, l’architecture Volta ne s’adressant pas aux joueurs. NVIDIA présente Turing comme une petite révolution pour le rendu 3D en temps réel des jeux vidéo : c’est le premier GPU du genre à intégrer des coeurs dédiés à l’intelligence artificielle (Tensor) et surtout au ray tracing (RT). De quoi améliorer considérablement la qualité du rendu 3D en assistant les traditionnels coeurs CUDA.
« La plus grande avancée depuis 10 ans »
Selon NVIDIA, il s’agit du plus grand bond en avant technique depuis une dizaine d’années. Le géant du GPU explique d’ailleurs que les coeurs RT sont le résultat de 10 ans de recherche, depuis l’ambition du ray tracing en temps réel avancée par NVIDIA en 2008.
Pour l’instant, il est impossible d’en dire plus sur les performances pratiques de ces cartes. Nos testeurs viennent tout juste de recevoir les cartes et les pilotes adaptés. Notez d’ailleurs que les premiers tests des GeForce RTX 2080 Ti et 2080, publiés le 19 septembre, ne montreront pas les performances avec les technos RTX et l’assistance des coeurs Tensor, faute de jeu pour l’exploiter. On en saura toutefois plus sur les capacités de ces cartes dans un rendu classique par rastérisation.
Pour l’instant donc, voici tout ce qu’il faut savoir sur l’architecture Turing : fonctionnement, apports, promesses, et caractéristiques précises. Notez que nous avons déjà parlé de Ansel RTX, et de toutes les démos vidéo à voir à l’annonce des cartes.
Caractéristiques complètes des cartes :
Modèle | Quadro RTX 6000 | GeForce RTX 2080 Ti Founders Edition | Quadro RTX 5000 | GeForce RTX 2080 Founders Edition | GeForce RTX 2070 Founders Edition |
---|---|---|---|---|---|
Architecture GPU | Turing TU102 | Turing TU102 | Turing TU104 | Turing TU104 | Turing TU106 |
GPCs | 6 | 6 | 6 | 6 | 3 |
TPCs | 36 | 34 | 24 | 23 | 18 |
SMs | 72 | 68 | 48 | 46 | 36 |
Coeurs CUDA par SM | 164 | 64 | 64 | 64 | 64 |
Coeurs CUDA par GPU | 4608 | 4352 | 3072 | 2944 | 2304 |
Coeurs Tensor par SM | 8 | 8 | 8 | 8 | 8 |
Coeurs Tensor par GPU | 576 | 544 | 384 | 368 | 288 |
Coeurs RT | 72 | 68 | 48 | 46 | 36 |
Fréquence GPU Base (Boost) | 1455 MHz 1770 MHz | 1350 MHz 1635 MHz | 1620 MHz 1815 MHz | 1515 MHz 1800 MHz | 1410 MHz 1710 MHz |
RTX-OPS (Tera-OPS) | 84 | 78 | 62 | 60 | 45 |
Rays Cast (Giga Rays/s) | 10 | 10 | 8 | 8 | 6 |
FP32 TFLOPS | 16,3 | 14,2 | 11,2 | 10,6 | 7,9 |
INT32 TIPS | 16,3 | 14,2 | 11,2 | 10,6 | 7,9 |
FP16 TFLOPS | 32,6 | 28,5 | 22,3 | 21,2 | 15,8 |
FP16 Tensor TFLOPS avec FP16 Accumulate | 130,5 | 113,8 | 89,2 | 84,8 | 63 |
FP16 Tensor TFLOPS avec FP32 Accumulate | 130,5 | 56,9 | 89,2 | 42,4 | 31,5 |
INT8 Tensor TOPS | 261 | 227,7 | 178,4 | 169,6 | 126 |
INT4 Tensor TOPS | 522 | 455,4 | 356,8 | 339,1 | 252,1 |
Mémoire | 24576 Mo GDDR6 | 11264 Mo GDDR6 | 16384 Mo GDDR6 | 8192 Mo GDDR6 | 8192 Mo GDDR6 |
Interface Mémoire | 384-bit | 352-bit | 256-bit | 256-bit | 256-bit |
Vitesse de transfert | 14 Gb/s | 14 Gb/s | 14 Gb/s | 14 Gb/s | 14 Gb/s |
Bande Passante VRAM | 672 Go/s | 616 Go/s | 448 Go/s | 448 Go/s | 448 Go/s |
ROPs | 96 | 88 | 64 | 64 | 64 |
Unités de texture | 288 | 272 | 192 | 184 | 144 |
Texel Fill-rate (Gigatexels/s) | 510 | 444,7 | 348 | 331,2 | 246,2 |
Cache L2 | 6144 Ko | 5632 Ko | 4096 Ko | 4096 Ko | 4096 Ko |
Total Bancs de registres par SM | 256 Ko | 256 Ko | 256 Ko | 256 Ko | 256 Ko |
Total Bancs de registres par GPU | 18432 Ko | 17408 Ko | 12288 Ko | 11776 Ko | 9216 Ko |
TDP | 260 W | 260 W | 230 W | 225 W | 185 W |
Transistors | 18,6 milliards | 18,6 milliards | 13,6 milliards | 13,6 milliards | 10,8 milliards |
Taille du die | 754 mm² | 754 mm² | 545 mm² | 545 mm² | 445 mm² |
Finesse de gravure | 12 nm FFN | 12 nm FFN | 12 nm FFN | 12 nm FFN | 12 nm FFN |
Sommaire :
- NVIDIA Turing : une ray-volution ?
- Les GPU TU102, TU104 et TU106 en détail
- Le SM Turing en détail
- L'IA au service du rendu 3D
- Le RayTracing hybride expliqué
- Un shading plus intelligent
- La notion de RTX OPS : quel calcul ?
- NVLink : le renouveau du SLI ?
- Du 8K en 60 Hz, VirtualLink pour la VR
- Meilleur encodeur vidéo hardware
- Rénovation pour les cartes Founders Edition
- NVIDIA scanner : overclocking automatique !