Se connecter avec
S'enregistrer | Connectez-vous

GeForce GTX 460 : le Fermi que nous attendions

GeForce GTX 460 : le Fermi que nous attendions
Par

Après des GeForce GTX 480 et GTX 470 qui nous avaient laissé un avis mitigé, la GTX 465 sortie fin mai a franchement déçu tout simplement parce que le rapport performances/prix n’était pas bon. Pourquoi mettre 280 euros dans une carte légèrement supérieure à une HD 5830 sachant qu’on trouve une HD 5850 plus performante pour moins que cela ?

La GTX 460 est là pour changer la donne, puisqu’il s’agit enfin du premier dérivé du GF104. NVIDIA aurait pu se contenter de diviser un GF100 par deux ce qui aurait abouti à 256 shader cores, 32 unités de texturing et un bus mémoire 192 bits, mais ceci l’aurait positionnée nettement en dessous de la GTX 465 (352 shader cores, 32 unités de texturing et bus 256 bits). Pire encore, une telle carte aurait tout juste été en mesure de rivaliser avec une HD 5770 tout en affichant une consommation significativement plus élevée.

Fort heureusement, NVIDIA a choisi de remanier l’architecture Fermi en réorganisant les ressources pour réduire sa complexité d’un tiers : on arrive ainsi à un GPU plus compact, émettant moins de chaleur et offrant plus de fonctionnalités (le GF104 marque le support des pistes Dolby TrueHD et DTS-HD Master Audio en bitstream). Si la GTX 465 était de toute façon trop chère pour rivaliser avec la HD 5830, la GTX 460 est plus que bien armée pour cela.

Le GF104

Comme on le verra au fil des benchmarks, la GTX 460 est plus performante que la GTX 465 dans la majorité des tests. Comment est-ce possible vu que la GTX 460 compte moins de shader cores et a été conçue pour un public bien plus large que le GF100 et ses trois milliards de transistors ?

La réponse tient au réagencement des ressources. Au niveau macro, le GF104 se focalise toujours sur le concept des Graphics Processing Clusters (GPC) qui contiennent chacun quatre Streaming Multiprocessors (SM).

C’est au sein des SM que l’on voit l’évolution : là où le GF100 embarquait 32 CUDA cores par SM, le GF104 en compte 48. Vu leur complexité accrue de 50 %, il fallait un débit d’instructions plus important et c’est là que l’on voit une seconde amélioration puisque les unités d’allocation de ressources (dispatch units) sont doublées. En outre, chaque SM voit son nombre d’unités de texturing passer de 4 à 8.

Un GF104 complet embarque 2 GPC et donc 8 SM. Sachant qu’il y a 48 CUDA cores par SM, le GF104 peut donc embarquer jusqu’à 384 shader cores, 64 unités de texturing et 8 PolyMorph engines dédiés aux opérations géométriques.

Le back-end du GPU a lui aussi évolué. Un GF100 complet contient 6 partitions de ROP indépendants des GPC, chacun capable de débiter 8 pixels 32 bits entiers par cycle (soit 48 au total). Ces 6 partitions sont également associées à 6 contrôleurs mémoire 64 bits qui constituent au final un bus de 384 bits. Le GF104 a quant à lui un maximum de quatre partitions, capables de 32 pixels par cycle ainsi qu’un bus 256 bits.

C’est assez impressionnant pour une puce qui est encore gravée en 40 nm et compte tout de même 1,95 milliard de transistors, mais peut être pas autant que le Cypress chez AMD et ses deux milliards de transistors … place aux benchmarks pour en avoir le cœur net.