Accueil » Dossier » GeForce GTX 580 : la carte que nous attendions il y a 8 mois

GeForce GTX 580 : la carte que nous attendions il y a 8 mois

1 : Introduction 3 : GeForce GTX 580 : nouveau design 4 : Configuration de test et benchmarks 5 : 3DMark Vantage 6 : Metro 2033 (DX11) 7 : Lost Planet 2 (DX11) 8 : Aliens vs. Predator (DX11) 9 : Battlefield: Bad Company 2 (DX11) 10 : Civilization V (DX11) 11 : DiRT 2 (DX11) 12 : Just Cause 2 (DX11) 13 : Adobe Premiere Pro CS5 14 : Performances en SLI/CrossFire 15 : Consommation, température et bruit 16 : Conclusion

GF110 : le Fermi relifté

Le GF110 est plus une évolution qu’une révolution ; Nvidia n’étant pas vraiment retourné à la planche à dessin, ce processeur se base fortement sur le GF100 (voir notre analyse détaillée) et les différences avec celui-ci sont minimes. Globalement, cela reste une puce gravée en 40 nm et composée d’environ trois milliards de transistors.

Dans les grandes lignes, le GPU proprement dit est identique. Contrairement au GF104, qui faisait l’impasse sur quelques shaders pour se concentrer sur le traitement des textures à un prix plus serré, le GF110 fait la part belle au traitement pur et dur, ce qui se traduit en pratique par deux changements : le filtrage FP16 à pleine vitesse et une amélioration de l’efficacité du z-culling (traitement de la profondeur).

Image 1 : GeForce GTX 580 : la carte que nous attendions il y a 8 mois

Le GF110 peut filtrer les textures FP16 en un cycle (comme le GF104) alors que le GF100 en avait besoin de deux. Dans les applications où les textures sont le facteur limitant, cela peut se traduire par un gain de performances. L’amélioration du z-culling, quant à elle, donne au GF110 un avantage dans les titres souffrant beaucoup d’overdraw, car elle permet de maximiser la bande passante disponible. D’après Nvidia, à fréquence égale, ces aménagements ont une incidence positive d’environ 14 % sur les performances.


GeForce GTX 580
GeForce GTX 480
GeForce GTX 470
Graphics Processing Clusters (GPC)
4
4
4
Streaming Multiprocessors (SM)
16
15
14
Cores CUDA
512
480
448
Unités de textures
64
60
56
Unités ROP
48
48
40
Fréquence GPU
772 MHz
700 MHz
607 MHz
Fréquence shaders
1544 MHz
1401 MHz
1215 MHz
Fréquence mémoire (débit)
1002 MHz (4008 MT/s)
924 MHz (3696 MT/s)
837 MHz (3348 MT/s)
Capacité mémoire
1,5 Go de GDDR5
1,5 Go de GDDR51,5 Go de GDDR5
Bus mémoire
384 bits
384 bits
320 bits
Bande passante mémoire
192,4 Go/s
177,4 Go/s
133,9 Go/s
Fillrate
49,4 GTexels/s
42,0 GTexels/s
34,0 GTexels/s
Finesse de gravure
40 nm TSMC
40 nm TSMC
40 nm TSMC
Format
Deux emplacements
Deux emplacementsDeux emplacements
Sorties vidéo
2 x DL-DVI, 1 x mini-HDMI2 x DL-DVI, 1 x mini-HDMI
2 x DL-DVI, 1 x mini-HDMI


Le passage du GF100 au GF110 implique également un remaniement de la puce. Pour concevoir un circuit intégré, il est possible d’utiliser différents types de transistors selon les propriétés que l’on désire obtenir au final. Les ingénieurs de Nvidia ont modifié l’architecture du GF100 en faisant appel à des transistors plus lents mais occasionnant moins de fuites sur les chemins où le timing est moins essentiel et des transistors plus rapides sur les autres.

Cette modification induit une baisse de consommation appréciable permettant non seulement d’activer le 16e Shader Multiprocessor (désactivé sur le GF100 et ajoutant 32 cœurs CUDA, 4 unités de texture et un moteur de géométrie PolyMorph), mais également d’augmenter les fréquences : alors que la GeForce GTX 480 affichait des fréquences core/shaders/mémoire de 700/1401/924 MHz respectivement, la GTX 580 est dotée d’une fréquence de 772 MHz sur le core, de 1544 MHz sur les shaders et de 1002 MHz sur la mémoire (ce qui se traduit par un débit de 4008 MT/s). Les spécifications techniques du GF110 sont donc plus proches de ce que nous attendions en mars : 512 cores CUDA fonctionnels, 64 unités de textures et 16 moteurs PolyMorph.

Les portions indépendantes, quant à elles, semblent inchangées d’après le diagramme fourni par Nvidia, à l’exception de la fréquence plus élevée : nous avons donc toujours six partitions ROP associées à des bus de 64 bits (pour un total de 384 bits) et capables de générer huit pixels de 32 bits, ce qui donne un total de 48 pixels par cycle.

Tesselation

La géométrie semble connaître un soudain regain d’intérêt. Lorsque Nvidia nous a présenté son architecture Fermi et ce qu’elle allait apporter dans les jeux, deux éléments n’ont cessé de revenir : DirectX 11 et la tesselation. Le fait que la firme au caméléon ait intégré un de ses moteurs PolyMorph dans chacun de ses Shader Multiprocessors (donc 16 au total sur la GF110) était supposé faire une énorme différence dans les titres faisant un usage abondant de la tesselation en vue d’accroître leur réalisme. Le problème, bien entendu, était qu’il n’existait à l’époque aucun jeu capable de démontrer cette affirmation. Certes, il y avait bien DiRT 2 et Aliens vs. Predator, mais ces deux jeux DX11 de première génération ne font qu’un usage extrêmement limité de la géométrie et ne sont jamais parvenus à soutenir la thèse de Nvidia : « la géométrie est l’avenir du jeu ».

Image 2 : GeForce GTX 580 : la carte que nous attendions il y a 8 mois

Depuis, il y a HAWX 2. Enfin, disons plutôt « il y aura » : le jeu n’est toujours pas sorti. Nous en avons toutefois reçu une copie il y a quelques jours, et nous avons l’intention de l’intégrer à notre batterie de test, où il remplacera HAWX premier du nom. Ce titre fait clairement controverse, dans la mesure où AMD estime qu’il emploie un facteur de tesselation nettement trop élevé et non optimisé, ce qui handicape ses cartes graphiques (plus que celles du caméléon). Le fabricant a déclaré faire pression sur l’éditeur pour que celui-ci sorte un correctif qui permettrait de régler le niveau d’utilisation de la géométrie. Quoi qu’il en soit, lorsque le jeu sortira, avec ou sans correctif, l’expérience de jeu sera ce qu’elle sera ; nous en ferons état sans prendre partie.

Pour l’instant, nous mesurons les performances en géométrie de chaque architecture à l’aide d’Unigine.

Tesselation désactivéeImage 3 : GeForce GTX 580 : la carte que nous attendions il y a 8 mois

Tesselation normale

Image 4 : GeForce GTX 580 : la carte que nous attendions il y a 8 mois

Tesselation extrême

Image 5 : GeForce GTX 580 : la carte que nous attendions il y a 8 mois

Comme on le voit, bien qu’AMD affirme que son approche de la tesselation soit la bonne, il apparaît assez clairement que lorsque la complexité augmente, celle de Nvidia parvient mieux à maintenir les performances. Les SM supplémentaires de la GeForce GTX 580, couplés à ses moteurs PolyMorph et à ses fréquences plus élevées, semblent lui donner un avantage assez net par rapport à la GTX 480 en mode « Extreme » ; à titre de comparaison, la Radeon HD 5870 n’arrive même pas au niveau de la GeForce GTX 470 dès que la complexité atteint un certain niveau.

Il est également intéressant de noter que la Radeon HD 6870 fait mieux dans ce test que la HD 5870, pourtant mieux équipée techniquement. AMD a déclaré avoir travaillé sur les performances en tesselation pour ses GPU Barts ; de fait, malgré son manque de shaders, la nouvelle carte fait mieux que l’ancienne (et bénéficie en outre d’un framerate minimal plus élevé).

Sommaire :

  1. Introduction
  2. GF110 : le Fermi relifté
  3. GeForce GTX 580 : nouveau design
  4. Configuration de test et benchmarks
  5. 3DMark Vantage
  6. Metro 2033 (DX11)
  7. Lost Planet 2 (DX11)
  8. Aliens vs. Predator (DX11)
  9. Battlefield: Bad Company 2 (DX11)
  10. Civilization V (DX11)
  11. DiRT 2 (DX11)
  12. Just Cause 2 (DX11)
  13. Adobe Premiere Pro CS5
  14. Performances en SLI/CrossFire
  15. Consommation, température et bruit
  16. Conclusion