Accueil » Dossier » Radeon HD 6970 et 6950 VS GeForce GTX 570 et 470

Radeon HD 6970 et 6950 VS GeForce GTX 570 et 470

1 : Introduction 2 : Un nouveau GPU basé sur l'existant 4 : AMD reconnaît l’importance de la géométrie 5 : Antialiasing, Eyefinity et accélération vidéo 6 : PowerTune : plus qu'un nouvel overclocking 7 : Les cartes 8 : Configuration de test et benchmarks 9 : 3DMark Vantage 10 : Metro 2033 11 : Lost Planet 2 12 : Aliens vs Predator 13 : Battlefield: Bad Company 2 14 : DiRT 2 15 : Just Cause 2 16 : CrossFire/SLI : 3DMark Vantage 17 : CrossFire/SLI : Metro 2033 18 : CrossFire/SLI : AvP 19 : CrossFire/SLI : Battlefield: Bad Company 2 20 : CrossFire/SLI : DiRT 2 21 : CrossFire/SLI : Just Cause 2 22 : Consommation et bruit 23 : Conclusion

Cayman : un Cypress amélioré

AMD, selon ses propres dires, avait quatre objectifs lors de la création des Cayman : améliorer le rendement, améliorer les performances en géométrie, apporter de nouvelles fonctionnalités en matière de qualité d’image et améliorer la gestion de l’alimentation.

Reprenons ces objectifs un à un. Le premier était de créer une architecture graphique et processeur plus efficace, ce qui se comprend tout-à-fait quand on sait que les cartes AMD obtenaient un taux d’utilisation VLIW d’environ 3,4 dans les jeux, c’est-à-dire qu’elles exécutaient en moyenne 3,4 instructions simultanées. Inutile dans ce cas d’avoir cinq ALU par processeur de thread : en supprimant l’unité chargée du traitement des fonctions spéciales et en redistribuant ses fonctionnalités sur les quatre unités restantes, la firme optimise l’utilisation de son die sans diminuer les performances ; il est évidemment toujours possible que celles-ci en prennent un coup si le taux d’utilisation dépasse 4, mais le fondeur estime que ce scénario est peu probable.

Notons toutefois qu’AMD se devait de créer une architecture plus efficace : coincé par le processus de gravure en 40 nm de TSMC, la société n’avait pas d’autre choix que d’améliorer les performances par millimètre carré de die ; le matériel constituant un facteur limitatif, impossible de se concentrer sur les performances absolues. En passant de cinq à quatre unités ALU par processeur de threads pour son architecture VLIW, AMD peut graver un plus grand nombre de SIMD sur la même superficie et ainsi augmenter de 10 % le rapport performances/surface de ses puces.

Image 1 : Radeon HD 6970 et 6950 VS GeForce GTX 570 et 470

Image 2 : Radeon HD 6970 et 6950 VS GeForce GTX 570 et 470

Plus légère, cette architecture n’en est pas pour autant moins puissante : les quatre ALU (processeurs de flux) restantes ont les mêmes capacités que les cinq de la génération précédente. Chaque processeur de flux de l’architecture VLIW4 est donc maintenant capable d’effectuer :

  • Quatre opérations FMA, MAD, MUL ou ADD 32 bits en virgule flottante par cycle
  • Deux opérations ADD 64 bits en virgule flottante par cycle
  • Une opération FMA ou MUL 64 bits en virgule flottante par cycle
  • Une fonction spéciale en virgule flottante par cycle
  • Quatre opérations MAD, MUL ou ADD 24 bits sur entiers par cycle
  • Quatre opérations sur les bits ou ADD 32 bits sur entiers par cycle
  • Une opération MAD ou MUL 32 bits sur entiers par cycle
  • Une opération ADD 64 bits sur entiers par cycle

Voilà pour les shaders ; les cœurs de rendu, quant à eux, sont capables de traiter les opérations sur entiers en 16 bits deux fois plus rapidement, et les opérations en virgule flottante en 32 bits deux à quatre fois plus rapidement. Selon AMD, le gain de performances se remarque particulièrement en matière d’antialiasing.

Augmentation des performances GPGPU

Bien que les aspirations d’AMD en matière de calcul GPGPU soient généralement prises avec moins de sérieux que celle de Nvidia (avec son CUDA), il semblerait qu’il s’agisse d’un domaine dans lequel les Cayman ont assez bien avancé. Ainsi, alors que les Radeon HD 58xx effectuent les calculs en double précision cinq fois moins rapidement que ceux en simple précision, les Cayman les effectuent quatre fois moins rapidement. Bien que la vitesse de pointe affichée par la Radeon HD 6970 en simple précision soit un rien moins élevée que celle de la Radeon HD 5870 (2,7 TFLOPS contre 2,72 TFLOPS), nous nous retrouvons donc avec 675 GFLOPS en double précision sur la Radeon HD 6970 contre 544 GFLOPS sur la HD 5870.

Notons en passant que les GPU Barts font complètement l’impasse sur le calcul en double précision, préférant se concentrer sur les performances dans les jeux plutôt que sur le calcul GPGPU.

Image 3 : Radeon HD 6970 et 6950 VS GeForce GTX 570 et 470

Les Cayman sont également équipés de deux moteurs DMA bidirectionnels, qui doivent idéalement accélérer la communication (lecture et écriture) avec la mémoire système via le bus PCI Express.

Enfin, AMD a doté ses nouveaux GPU de la capacité de gérer les applications indépendamment ; à titre de comparaison, l’architecture Fermi de Nvidia peut gérer plusieurs kernels, mais ceux-ci doivent être générés par le même thread CPU. Il est intéressant de noter que cette fonction n’est pas prise en charge par DirectX 11, raison pour laquelle AMD va la proposer à l’avenir via OpenCL.

Mémoire cache

À côté de ces quelques adaptations fonctionnelles, les Cayman conservent la structure des Cypress en matière de cache : chaque SIMD possède 8 Ko de cache L1 pour le traitement, 16 Ko de cache L1 pour les textures et 32 Ko de cache pour le partage local des données.Quatre caches L2 de 128 Ko viennent compléter le tableau, auquel s’ajoute un cache global de 64 Ko partagé par tous les SIMD.

Sommaire :

  1. Introduction
  2. Un nouveau GPU basé sur l'existant
  3. Cayman : un Cypress amélioré
  4. AMD reconnaît l’importance de la géométrie
  5. Antialiasing, Eyefinity et accélération vidéo
  6. PowerTune : plus qu'un nouvel overclocking
  7. Les cartes
  8. Configuration de test et benchmarks
  9. 3DMark Vantage
  10. Metro 2033
  11. Lost Planet 2
  12. Aliens vs Predator
  13. Battlefield: Bad Company 2
  14. DiRT 2
  15. Just Cause 2
  16. CrossFire/SLI : 3DMark Vantage
  17. CrossFire/SLI : Metro 2033
  18. CrossFire/SLI : AvP
  19. CrossFire/SLI : Battlefield: Bad Company 2
  20. CrossFire/SLI : DiRT 2
  21. CrossFire/SLI : Just Cause 2
  22. Consommation et bruit
  23. Conclusion