Accueil » Dossier » GeForce RTX : toutes les nouveautés de l’architecture Turing » Page 3

GeForce RTX : toutes les nouveautés de l’architecture Turing

1 : NVIDIA Turing : une ray-volution ? 2 : Les GPU TU102, TU104 et TU106 en détail 4 : L'IA au service du rendu 3D 5 : Le RayTracing hybride expliqué 6 : Un shading plus intelligent 7 : La notion de RTX OPS : quel calcul ? 8 : NVLink : le renouveau du SLI ? 9 : Du 8K en 60 Hz, VirtualLink pour la VR 10 : Meilleur encodeur vidéo hardware 11 : Rénovation pour les cartes Founders Edition 12 : NVIDIA scanner : overclocking automatique !

Le SM Turing en détail

Image 1 : GeForce RTX : toutes les nouveautés de l'architecture Turing

Le Streaming Multiprocessor de Turing est totalement différent du précédent SM de Pascal et ses 128 coeurs CUDA. Il n’embarque plus que 64 coeurs CUDA, mais s’arme de huit coeurs Tensor et d’un coeur RT. Héritage de l’architecture Volta : les Coeurs CUDA ont cette fois la possibilité d’exécuter simultanément des opérations FP32 à virgule flottante et INT32 en nombres entiers, ce qui va profiter grandement aux performances de rendu des jeux classiques en rastérisation, selon NVIDIA.

Le gain potentiel serait assez important pour certain jeux comme Battlefield 1, qui exécute 50 opérations INT32 pour 100 opérations FP32 dans son code de rendu. D’autres jeux sont moins demandeurs en opération INT32, mais NVIDIA affirme qu’environ 36 % des opérations sont du INT32 qui retardent le pipeline FP32, réduisant ainsi les performances si le GPU n’est pas capable de les traiter en parallèle. NVIDIA parlent toujours de 64 coeurs CUDA pour simplifier, mais il y a en fait 64 unités FP32 et 64 unités INT32 dans le SM, pour être exact.

Image 2 : GeForce RTX : toutes les nouveautés de l'architecture Turing

Les SM du précédent GPU Pascal peuvent sembler plus complexes et avancés, mais Turing en embarque deux fois plus, ce qui permet de contenir beaucoup plus de coeurs CUDA, sans compter l’interface mémoire beaucoup plus avancée. S’y ajoutent les capacités d’accélération du coeur RT, que nous allons détailler dans les pages suivantes, et l’assistance des coeurs Tensor. Pour l’instant, NVIDIA ne semble avoir qu’une seule application claire de cette IA : le DLSS, dont nous allons aussi parler dans les pages suivantes.

Image 3 : GeForce RTX : toutes les nouveautés de l'architecture Turing

Turing augmente sa mémoire et améliore sa hiérarchie d’utilisation. Pascal utilisait un cache L1 pour chacun de ses quatre blocs, et une mémoire partagée entre tous les blocs. Les nouveaux SM optent pour un cache L1 unifié et partagé entre leurs quatre blocs. Cette unification permet de stocker toute les tâches dans un cache, quelque soit leur destination (cache L1 ou mémoire partagée dans Pascal), sans ralentir les unités d’exécution.

Ce cache L1 profite aussi d’un bus de donnée bien plus large, doublant sa bande passante (128 octets par cycle d’horloge contre 64 octets chez Pascal). Ce cache peut aussi être configuré en 64 Ko de L1 et 32 Ko de mémoire partagée (ou l’inverse), ce qui rappelle l’architecture Kepler. Le cache L2 du GPU est aussi doublé par rapport au GP102 Pascal, avec une bande passante annoncée « significativement plus importante ».

50 % plus rapide ?

Image 4 : GeForce RTX : toutes les nouveautés de l'architecture Turing

Toutes ces améliorations combinées permettent à NVIDIA d’annoncer 50 % de performance en plus par coeur CUDA, par rapport à Pascal. Et au niveau de la mémoire vidéo, NVIDIA affirme avoir encore perfectionné sont système de compression lancé avec Pascal sur de la RAM GDDR6 plus rapide. La bande passante mémoire est donc nettement supérieure, d’environ 50 % si on cumule les gains de la fréquence mémoire et de la compression.

Image 5 : GeForce RTX : toutes les nouveautés de l'architecture Turing

Sommaire :

  1. NVIDIA Turing : une ray-volution ?
  2. Les GPU TU102, TU104 et TU106 en détail
  3. Le SM Turing en détail
  4. L'IA au service du rendu 3D
  5. Le RayTracing hybride expliqué
  6. Un shading plus intelligent
  7. La notion de RTX OPS : quel calcul ?
  8. NVLink : le renouveau du SLI ?
  9. Du 8K en 60 Hz, VirtualLink pour la VR
  10. Meilleur encodeur vidéo hardware
  11. Rénovation pour les cartes Founders Edition
  12. NVIDIA scanner : overclocking automatique !