Accueil » Actualité » Le grand test de la GeForce GTX 1080 : la nouvelle reine

Le grand test de la GeForce GTX 1080 : la nouvelle reine

1 : GeForce GTX 1080 8 Go : architecture du GP104 2 : Démontage de la GTX 1080 Founders Edition 4 : Display Pipeline et SLI 5 : Méthode de test 6 : Résultats : Ashes, Battlefield et GTAV 7 : Résultats : Hitman, CARS et Rise of the Tomb Raider 8 : Résultats : The Division et The Witcher 3 9 : Résultats : applications professionnelles 10 : Résultats : consommation 11 : Résultats : température et bruit 12 : Conclusion

Simultaneous Multi-Projection et Async Compute

Simultaneous Multi-Projection

Pascal offre quelques fonctionnalités qu’il n’est pas possible de démontrer dans les jeux commercialisés aujourd’hui, mais qui ont un avenir prometteur. L’une d’entre elles est le Simultaneous Multi-Projection Engine qui est rendu possible grâce à l’ajout d’un bloc dans l’unité PolyMorph. Ce bloc est un circuit qui prend les données géométriques et les traite en simulant 16 projections depuis un point de vue. Le bloc peut aussi remplacer le point de vue d’applications stéréo, reproduisant matériellement la géométrie jusqu’à 32 fois, sans coût important sur les performances.

Image 1 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Image 2 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Image 3 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Dans un système à trois écrans, avec les deux écrans de côtés tournés vers le joueur, un jeu affiché sur les trois moniteurs va avoir des coins déformés. Une table située au coin de l’écran de droite aura l’air déformée, par exemple. Pour corriger cela, il faudrait avoir une projection normal pour l’écran en face de l’utilisateur, une projection orientée vers la gauche pour l’écran de gauche et une projection orientée vers la droite pour l’écran de droite. Il n’y aurait ainsi plus de déformation et le champ de vision serait aussi plus vaste. Le problème est que la scène a besoin d’être calculée. Le Simultaneous Multi-Projection évite de calculer la même scène trois fois d’affilée en économisant les ressources grâce à l’utilisation de ce nouveau bloc dans le moteur PolyMorph.

Image 4 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Le problème est que les développeurs doivent prendre en charge la technologie de champ de vision large dans les paramètres et utiliser des API spéciales. Nous ne savons s’il y aura un réel désir d’accommoder les quelques joueurs utilisant plusieurs écrans, mais ce genre d’applications pourra être utilisé sur plusieurs types d’applications.

Par exemple, la réalité virtuelle demande une projection pour chaque oeil. Aujourd’hui, les jeux sont obligés d’avoir un rendu différent pour chaque écran, ce qui est très inefficace. Le Simultaneous Multi-Projection permettrait d’économiser des ressources pour rendre les deux images en une seule passe, ce que NVIDIA appelle le Single Pass Stereo. Le GPU s’occuperait de calculer les polygones et le Simultaneous Multi-Projection (SMP) produirait une projection pour chaque oeil.

Image 5 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Le SMP peut aussi être utilisé pour faire du Lens Matched Shading, une technique qui consiste à produire une image déjà déformée pour être correctement perçue au travers des lentilles du casque de réalité virtuelle. Ainsi, au lieu de rendre d’abord une image droite qui sera ensuite déformée, ce qui est un gâche beaucoup de ressources, le Lens Matched Shading crée une approximation déjà déformée. La différence avec une image droite ensuite déformée pour être ajustée à la lentille est souvent imperceptible

Image 6 : Le grand test de la GeForce GTX 1080 : la nouvelle reineImage 7 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Combiner Single Pass Stereo et Lens Matched Shading permettent d’accroître les performances par deux comparativement à un GPU sans Simultaneous Multi-Projection, selon NVIDIA. En effet, utiliser le Lens Matched Shading pour éviter de calculer des bouts d’informations qui seront de toute façon abandonnés permet de réduite la charge de travail de 4,2 mégapixels/s sur un Oculus Rift à 2,8 mégapixels/s. Le Single Pass Stereo permet ensuite de calculer les images pour les deux yeux en une seule passe au lieu de faire une passe par oeil.

Asynchronous Compute

Sous Maxwell, NVIDIA avait introduit un système de partition statique qui permettait de dédier une partie du GPU aux calculs graphiques et une partie aux calculs généralistes. C’était une bonne façon d’optimiser les ressources, à condition que les partitions soient correctement utilisées. Si par exemple 75 % du processeur était utilisé pour les graphismes, le système devait attendre que les calculs généralistes soient terminés sans pouvoir utiliser le reste de la puce qui n’avait plus rien à traiter. Pascal tente de résoudre ce problème en offrant une gestion dynamique des ressources. Il est donc toujours possible de partager les ressources de son GPU entre calculs graphiques et calculs généralistes, mais si l’une des partitions est sous-utilisée, les pilotes pourront allouer plus de ressources à l’autre partition.

Image 8 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Pascal améliore aussi son système de préemption qui permet d’interrompre une tâche pour traiter une charge de travail urgent tout en maintenant une latence assez faible. Les architectures graphiques sont extrêmement parallèles et disposent de gros caches qui permettent d’optimiser l’utilisation des ressources. C’est pour cela que les pilotes auront tendance à aligner les calculs de shaders pour continuer à alimenter les pipelines. Néanmoins, certains calculs sont moins urgents que d’autres.

Image 9 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Image 10 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

L’exemple parfait est celui de l’Asynchronous TimeWarp (ATW) de l’Oculus Rift. Dans les cas où la carte graphique ne peut pas rendre une image toutes les 11 ms sur un écran de de 90 Hz, l’ATW peut générer une image intermédiaire en utilisant les travaux les plus récents de la carte tout en corrigeant pour la position de la tête. Le problème est que la carte doit pouvoir créer cette image, mais les anciennes architectures ont du mal avec la préemption. Par exemple, Fermi, Kepler et Maxwell ne tolèrent qu’une préemption lorsqu’il est temps de rendre l’image, ce qui pourrait retarder le moment où l’ATW est possible.

Image 11 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Il faut que les requêtes obligeant le GPU d’arrêter ce qu’il fait pour traiter l’ATW soient acceptées assez tôt pour que le GPU ait le temps de rendre l’image avant que l’écran ne se rafraichisse. Pour arriver à cette fin, Pascal propose un système de préemption au niveau du pixel. Le GP104 peut donc arrêter le traitement du pixel, sauvegarder l’état du pipeline dans une mémoire hors die, et passer à une autre tâche. Concrètement, cela signifie que les préemptions ne demandent plus qu’une centaine de microsecondes au lieu de plusieurs millisecondes. Les pilotes ne sont pas encore compatibles avec cette fonctionnalité, mais NVIDIA devrait bientôt les mettre à jour.

Image 12 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Sommaire :

  1. GeForce GTX 1080 8 Go : architecture du GP104
  2. Démontage de la GTX 1080 Founders Edition
  3. Simultaneous Multi-Projection et Async Compute
  4. Display Pipeline et SLI
  5. Méthode de test
  6. Résultats : Ashes, Battlefield et GTAV
  7. Résultats : Hitman, CARS et Rise of the Tomb Raider
  8. Résultats : The Division et The Witcher 3
  9. Résultats : applications professionnelles
  10. Résultats : consommation
  11. Résultats : température et bruit
  12. Conclusion