Se connecter avec
S'enregistrer | Connectez-vous

GF100 : une vue d'ensemble

GeForce GTX 480 et 470 : révélation ou déception ?
Par , Chris Angelini

Un simple coup d'oeil au diagramme du GF100 permet de mesurer l'ampleur de modifications apportées par rapport au GT200.
  

 
Sur le diagramme du GT200 on observe ainsi d'une part un ensemble de fonctions partagées par tout le GPU comme notamment le setup engine et d'autre part un ensemble d'unités de calculs : le Streaming Processors Array. A l'inverse sur le GF100 on peut distinguer 4 gros blocs : les Graphics Processing Cluster (GPC), et chaque GPC est largement indépendant.


Autre point remarquable la présence d'une large mémoire cache de niveau 2 partagée par l'ensemble du GPU. Intéressons nous maintenant aux caractéristiques des deux nouvelles cartes proposées par NVIDIA :


GeForce GTX 480 GeForce GTX 470
Fréquence GPU 700 MHz
607 MHz
Fréquence ALU 1401 MHz
1215 MHz
Fréquence RAM 924 MHz
837 MHz
ALU 480
448
Unités de textures 60
56
ROP (Raster OPeration unit) 48
40
Contrôleur mémoire 384 bits (6 x 64 bits)
320 bits (5 x 64 bits)
Type de RAM GDDR5
GDDR5

Première mauvaise surprise : le nombre d'ALU. Alors qu'au mois d'octobre, lors de la première présentation de l'architecture Fermi, NVIDIA nous parlait de 512 "cuda cores" il faudra au final se contenter de 480 unités sur le nouveau haut de gamme de la famille GeForce, la GTX 480. NVIDIA avait pris ses précautions, précisant que Fermi était une architecture et en aucun cas la description d'une implémentation spécifique, de plus les documents précisaient bien jusqu'à 512 cores. Enfin en décembre dernier les premiers détails sur les cartes Tesla dérivées de l'architecture Fermi nous avaient là aussi préparé à voir des unités désactivées, mais malgré tout beaucoup seront déçus. On pouvait en effet s'attendre à ce que NVIDIA ait pris des marges conservatrices sur sa gamme Fermi mais soit plus ambitieux avec le marché graphique où la concurrence est rude.

Si l'on prends en compte la fréquence finale de ces cores on obtient donc une puissance de calculs de 1,344 TFlops dans le cas de l'utilisation de FMA (Fused Multiply-Add) contre 2,72 TFlops pour le Cypress. Il faut toutefois relativiser ce résultat en rappelant que la puissance de calculs ne fait pas tout dans un GPU : ce n'est qu'un facteur parmi de nombreux autres. Le GT200 était déjà plus faible à ce niveau que le RV770 ce qui ne l'empêchait pas de dominer ce dernier dans la plupart des jeux. L'architecture d'AMD est en effet moins flexible que celle de NVIDIA dans sa façon de traiter les instructions en parallèle, elle repose sur des unités VLIW qui nécessitent un compilateur performant pour extraire le parallélisme. En contrepartie AMD est en mesure de proposer un nombre d'unités de calculs très important.

Concernant la fréquence des ALU là aussi petite déception : celle-ci est revue à la baisse par rapport à la GTX 285, avec 1401 MHz contre 1476 MHz pour le précédent haut de gamme de NVIDIA. En revanche la fréquence GPU a augmentée passant de 648MHz à 700MHz. Si nous avons largement critiqué à plusieurs reprises AMD pour ses augmentations trop modestes du nombre d’unités de texture et de ROP nous n'avions jusqu'ici jamais eu à nous plaindre de NVIDIA. Pourtant avec le GF100, pour la première fois un nouveau GPU de NVIDIA se retrouve avec moins d'unités de textures que le précédent : 60 contre 80. En pratique toutefois ces unités ont été remaniées notamment au niveau du sous-système mémoire et elles sont également cadencées plus rapidement. Mais malgré tout dans certains tests spécifiques cette différence devrait avoir un impact notable. Vérifions le par exemple via un simple test de quad texturing :

Ici l’écart entre la GeForce GTX 480 et la GeForce GTX 280 atteint -11 %, ce qui confirme la théorie. Sur ce test très simple, la Radeon HD 5870 s’avère également 67 % plus puissante que la nouvelle carte NVIDIA. Nous allons toutefois revenir sur ce point plus loin.

Pas de mauvaise surprise au niveau des ROP en revanche, si l'utilisation d'un bus 384 bits contre 512 bits sur le GT200 laissait craindre là encore une diminution du nombre d'unités, NVIDIA a plus que compensé le problème en doublant le nombre de ROP par partition. Ainsi le GT200 disposait de 8 partitions de 4 ROP chacune, alors que désormais le GF100 se voit équipé de 6 partitions de 8 ROP chacune pour un total de 48 ROP donc, ce qui permet à NVIDIA de reprendre l'avantage sur AMD qui venait tout juste de le rattraper à ce niveau avec le Cypress.